CN108198551A - 回声消除延时的处理方法及装置 - Google Patents
回声消除延时的处理方法及装置 Download PDFInfo
- Publication number
- CN108198551A CN108198551A CN201810036944.2A CN201810036944A CN108198551A CN 108198551 A CN108198551 A CN 108198551A CN 201810036944 A CN201810036944 A CN 201810036944A CN 108198551 A CN108198551 A CN 108198551A
- Authority
- CN
- China
- Prior art keywords
- audio data
- delay
- microphone
- module
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 17
- 238000012545 processing Methods 0.000 title claims description 21
- 238000000034 method Methods 0.000 claims abstract description 9
- 238000012546 transfer Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 5
- 230000000694 effects Effects 0.000 abstract description 5
- 238000000926 separation method Methods 0.000 abstract description 4
- 230000001360 synchronised effect Effects 0.000 abstract description 2
- 238000004891 communication Methods 0.000 description 15
- 238000012360 testing method Methods 0.000 description 12
- 239000000470 constituent Substances 0.000 description 11
- 230000006872 improvement Effects 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 241000209140 Triticum Species 0.000 description 3
- 235000021307 Triticum Nutrition 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000005056 compaction Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
- G10L21/01—Correction of time axis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明提供了一种回声消除延时的处理方法,用于智能设备和麦克风模块,麦克风模块可插拔的连接在智能设备上,麦克风模块包括麦克风单元和音频输入端口,该方法包括:响应触发信号播放预设的音频文件;接收来自所述麦克风单元采集的音频数据和来自所述音频输入端口传送的音频数据;记录所述接收两路音频数据的时间及计算所述两路音频数据的延时值;存储所述延时值以作为后续所述智能设备利用所述麦克风模块实现语音识别控制的校正值。该方法可以使麦克风单元采集的语音和语音输入接口采集的语音完全同步,语音分离识别效果好,语音遥控效果佳,用户体验好。
Description
技术领域
本发明属于语音识别遥控技术领域,具体涉及回声消除延时的处理方法及装置。
背景技术
目前对于不具备语音遥控功能的智能电视可以通过在智能电视USB接口上安插一USB麦克风并在智能电视上安装运行相关的语音识别控制软件实现语音遥控功能。USB麦克风设置有一麦克风单元和一语音输入接口;语音输入接口连接智能电视的音频输出口,麦克风单元采集人声和智能电视扬声器播放的声音;USB麦克风将麦克风单元采集的一路语音和语音输入接口采集的另一路语音输入到智能电视的主控单元进行语音分离识别实现语音控制。由于麦克风单元采集的语音和语音输入接口采集的语音不同步,存在一定程度的延时,并且不同的智能电视延时各不相同,因此智能电视要通过音频算法消除回声,如AEC(Acoustic Echo Chancellor,回声消除器)算法、降噪算法,然而某些情况下延时会超出降噪算法的最大所能接受范围,导致语音分离识别效果不好,语音遥控效果不佳,用户体验差。
发明内容
本发明的目的在于针对现有技术的不足,提供一种回声消除延时的处理方法及装置,用于克服现有技术中的缺点。
具体的,本发明提出了以下具体的实施例:
本发明实施例提供了一种回声消除延时的处理方法,应用于智能设备和麦克风模块,所述麦克风模块可插拔的连接在所述智能设备上,所述麦克风模块包括麦克风单元和音频输入端口,所述回声消除延时的处理方法包括:
响应触发信号播放预设的音频文件;
接收来自所述麦克风单元采集的音频数据和来自所述音频输入端口传送的音频数据;
记录所述接收两路音频数据的时间及计算所述两路音频数据的延时值;
存储所述延时值以作为后续所述智能设备利用所述麦克风模块实现语音识别控制的校正值。
作为上述技术方案的进一步改进,所述两路音频数据存储于所述智能设备的左右声道,其中一个声道传输所述麦克风单元采集的音频数据,另一个声道传输所述音频输入端口传送的音频数据。
作为上述技术方案的进一步改进,所述麦克风模块通过USB接口和音频接口可插拔的连接在所述智能设备上。
作为上述技术方案的进一步改进,所述延时值的范围为10-500ms。
作为上述技术方案的进一步改进,还包括:
当接收到语音识别控制指令时,获取该延时值;
接收来自所述麦克风单元采集的音频数据和来自所述音频输入端口传送的音频数据;
根据所述两路音频数据和该延时值进行回声消除处理以实现语音识别控制。
本发明实施例提供了一种回声消除延时的处理装置,应用于智能设备和麦克风模块,所述麦克风模块可插拔的连接在所述智能设备上,所述麦克风模块包括麦克风单元和音频输入端口,所述回声消除延时的处理装置包括:
触发模块,用于响应触发信号播放预设的音频文件;
接收模块,用于接收来自所述麦克风单元采集的音频数据和来自所述音频输入端口传送的音频数据;
计算模块,用于记录所述接收两路音频数据的时间及计算所述两路音频数据的延时值;
存储模块,存储所述延时值以作为后续所述回声消除延时的处理装置利用所述麦克风模块实现语音识别控制的校正值。
作为上述技术方案的进一步改进,所述两路音频数据存储于所述智能设备的左右声道,其中一个声道传输所述麦克风单元采集的音频数据,另一个声道传输所述音频输入端口传送的音频数据。
作为上述技术方案的进一步改进,所述麦克风模块通过USB接口和音频接口可插拔的连接在所述智能设备上。
作为上述技术方案的进一步改进,所述延时值的范围为10-500ms。
作为上述技术方案的进一步改进,还包括:获取模块和控制模块;所述获取模块用于当接收到语音识别控制指令时,获取该延时值;所述接收模块接收来自所述麦克风单元采集的音频数据和来自所述音频输入端口传送的音频数据;所述控制模块用于根据所述两路音频数据和该延时值进行回声消除处理以实现语音识别控制。
采用本发明提供的技术方案,与已有的公知技术相比,至少具有如下有益效果:通过该回声消除延时的处理方法,智能设备计算麦克风单元和音频输入端口采集的两路音频数据的延时值并保存;智能设备利用USB麦克风实现语音识别控制时利用该延时值对麦克风单元采集的语音和语音输入接口采集的语音进行回声消除延时的处理校正。回声消除延时的处理校正后,麦克风单元采集的语音和语音输入接口采集的语音完全同步,语音分离识别效果好,语音遥控效果佳,用户体验好。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为麦克风模块与智能设备的连接示意图。
图2为本发明实施例提出的一种回声消除延时的处理方法的流程示意图。
图3为本发明实施例提出的一种回声消除延时的处理装置的模块结构示意图。
主要元件符号说明:
图中:10-智能设备;20-麦克风模块;11-音频输出端口;12、23-通信端口;21-音频输入端口;22-麦克风单元;100-触发模块;200-接收模块;300-计算模块;400-存储模块。
具体实施方式
在下文中,将更全面地描述本公开的各种实施例。本公开可具有各种实施例,并且可在其中做出调整和改变。然而,应理解:不存在将本公开保护范围限于在此公开的特定实施例的意图,而是应将本公开理解为涵盖落入本公开的各种实施例的精神和范围内的所有调整、等同物和/或可选方案。
在下文中,可在本公开的各种实施例中使用的术语“包括”或“可包括”指示所公开的功能、操作或元件的存在,并且不限制一个或更多个功能、操作或元件的增加。此外,如在本公开的各种实施例中所使用,术语“包括”、“具有”及其同源词仅意在表示特定特征、数字、步骤、操作、元件、组件或前述项的组合,并且不应被理解为首先排除一个或更多个其它特征、数字、步骤、操作、元件、组件或前述项的组合的存在或增加一个或更多个特征、数字、步骤、操作、元件、组件或前述项的组合的可能性。
在本公开的各种实施例中使用的表述(诸如“第一”、“第二”等)可修饰在各种实施例中的各种组成元件,不过可不限制相应组成元件。例如,以上表述并不限制所述元件的顺序和/或重要性。以上表述仅用于将一个元件与其它元件区别开的目的。例如,第一用户设备和第二用户设备指示不同用户设备,尽管二者都是用户设备。例如,在不脱离本公开的各种实施例的范围的情况下,第一元件可被称为第二元件,同样地,第二元件也可被称为第一元件。
应注意到:如果描述将一个组成元件“连接”到另一组成元件,则可将第一组成元件直接连接到第二组成元件,并且可在第一组成元件和第二组成元件之间“连接”第三组成元件。相反地,当将一个组成元件“直接连接”到另一组成元件时,可理解为在第一组成元件和第二组成元件之间不存在第三组成元件。
在本公开的各种实施例中使用的术语仅用于描述特定实施例的目的并且并非意在限制本公开的各种实施例。除非另有限定,否则在这里使用的所有术语(包括技术术语和科学术语)具有与本公开的各种实施例所属领域普通技术人员通常理解的含义相同的含义。所述术语(诸如在一般使用的词典中限定的术语)将被解释为具有与在相关技术领域中的语境含义相同的含义并且将不被解释为具有理想化的含义或过于正式的含义,除非在本公开的各种实施例中被清楚地限定。
实施例1
如图1所示,为麦克风模块与智能设备的连接示意图。本发明实施例提供的一种回声消除延时的处理方法,应用于智能设备10和麦克风模块20。麦克风模块20可插拔的连接在智能设备10上。智能设备10包括:音频输出端口11和通信端口12。智能设备10可以是智能电视、电视盒子、智能投影等娱乐影音设备。麦克风模块20包括:麦克风单元22、音频输入端口21和通信端口23。通信端口23和通信端口12可以均为USB端口,亦可为其他通讯接口。音频输入端口21直接接收智能设备10通过音频输出端口11输出的音频信号。音频输入端口21可以为AV音频接口或3.5mm耳机音频接口等。麦克风单元22可以为一个或者多个麦克风。
如图2所示,回声消除延时的处理方法包括:
S101、响应触发信号播放预设的音频文件。
用户通过手动触发运行智能设备10上安装的测试app软件发起请求。具体地,用户可以通过红外遥控器以及鼠标键盘等操作运行该测试app软件,发起触发请求。该测试app软件支持安卓,IOS,windows、linux等系统,具体由智能设备10的操作系统决定。该测试app软件可以是一个独立的app测试小程序,也可以集成在语音识别控制软件上。智能设备10接收到触发请求后,播放预设的音频文件供麦克风模块20的麦克风单元22和音频输入端口21采集音频数据。
播放预设的音频文件优选WAV文件格式。WAV为微软公司开发的一种声音文件格式,该格式支持多种压缩运算法,支持多种音频数字,取样频率和声道,WAV是最接近无损的音乐格式。
S102、接收来自所述麦克风单元采集的音频数据和来自所述音频输入端口传送的音频数据。
当智能设备10播放预设的音频文件时,麦克风单元22采集到的音频数据包括人声、环境噪声和智能设备10播放的音频文件的音频数据。同时智能设备10通过音频输出端口11和音频输入端口21传送音频文件的音频数据。麦克风模块20通过通信端口23把两路音频数据传输到智能设备10。
S103、记录所述接收两路音频数据的时间及计算所述两路音频数据的延时值。
在本实施例中,麦克风模块20的麦克风单元22和音频输入端口21采集的两路音频数据存储于智能设备10的左右声道,其中一个声道传输麦克风单元22采集的音频数据,另一个声道传输音频输入端口21传送的音频数据。
由于通过智能设备10的音频输出端口11提供给麦克风模块20的音频输入端口21的音频数据要比麦克风模块20的麦克风单元22采集到扬声器播放的音频数据要快一些,需要将这个快慢的程度进行量化,以便后续进行语音识别控制时能够采用获取到的延时值进行修正。智能设备10记录所述接收两路音频数据的时间及计算所述两路音频数据的延时值。在本实施例中,该延时值的范围为10-500ms。
S104、存储所述延时值以作为后续所述智能设备利用所述麦克风模块实现语音识别控制的校正值。
智能设备10可以先判断获取的延时值是否在预设的范围内,当延时值不在预设的范围内时,提示用户重新发起获取延时值的请求,获取的延时值不在预设的范围内可能是进行测试时,环境噪声干扰太大,导致两路音频数据不仅存在时间上的相位差,还存在很大的幅值差异;为了确保测试时能够顺利获取到延时值,测试时需要保持安静的环境。当智能设备10判断获取的延时值在预设的范围内时,智能设备10保存该延时值后,后续用户通过语音识别控制软件和麦克风模块20实现语音识别控制。
例如:麦克风模块20将采集的数据传输给智能设备10时,左声道传输麦克风单元22采集的音频数据,右声道传输音频输入端口21采集的音频数据。当智能设备10获取到延时值为100ms,也就是麦克风模块20的麦克风单元22采集的音频数据要延后音频输入端口21采集的音频数据100ms,即左声道的音频数据在相位上落后右声道色音频数据100ms,这个是固有存在的。当智能设备10后台运行语音识别控制程序。智能设备10将接收麦克风模块20通过通信端口23发送的数字音频信号;由于左声道的音频数据在相位上落后右声道色音频数据100ms。智能设备10将右声道的音频数据延后100ms,使右声道的音频数据与左声道的音频回声消除延时的处理,保证两者不存在相位差。由于左声道采集的是人声和智能设备10播放节目的声音,右声道采集的是智能设备10播放节目的声音,由于左右声道数据已经对齐,就可以将左声道音频数据和右声道音频数据做差处理分离出人声信息;根据人声信息识别生成对应的遥控指令。
语音识别控制软件运行后,会查找智能设备10本地是否存储有延时值,当智能设备10本地没有存储延时值时会提示用户手动运行测试app软件来获取延时值,以便后续语音识别控制能够高效工作。
实施例2
如图1所示,为麦克风模块与智能设备的连接示意图。本发明实施例提供的一种回声消除延时的处理装置,应用于智能设备10和麦克风模块20。麦克风模块20可插拔的连接在智能设备10上。智能设备10包括:音频输出端口11和通信端口12。智能设备10可以是智能电视、电视盒子、智能投影等娱乐影音设备。麦克风模块20包括:麦克风单元22、音频输入端口21和通信端口23。通信端口23和通信端口12可以均为USB端口,亦可为其他通讯接口。音频输入端口21直接接收智能设备10通过音频输出端口11输出的音频信号。麦克风单元22可以为一个或者多个麦克风。
如图3所示,回声消除延时的处理装置,包括:触发模块100、接收模块200、计算模块300和存储模块400。
触发模块100,用于响应触发信号播放预设的音频文件。
用户通过手动触发运行智能设备10上安装的测试app软件发起请求。具体地,用户可以通过红外遥控器以及鼠标键盘等操作运行该测试app软件,发起触发请求。智能设备10接收到触发请求后,播放预设的音频文件供麦克风模块20的麦克风单元22和音频输入端口21采集音频数据。
播放预设的音频文件优选WAV文件格式。WAV为微软公司开发的一种声音文件格式,该格式支持多种压缩运算法,支持多种音频数字,取样频率和声道,WAV是最接近无损的音乐格式。
接收模块200,用于接收来自麦克风单元22采集的音频数据和来自音频输入端口21传送的音频数据。
当智能设备10播放预设的音频文件时,麦克风单元22采集到的音频数据包括人声、环境噪声和智能设备10播放的音频文件的音频数据。同时智能设备10通过音频输出端口11和音频输入端口21传送音频文件的音频数据。麦克风模块20通过通信端口23把两路音频数据传输到智能设备10。
计算模块300,用于记录所述接收两路音频数据的时间及计算所述两路音频数据的延时值。
在本实施例中,麦克风模块20的麦克风单元22和音频输入端口21采集的两路音频数据存储于智能设备10的左右声道,其中一个声道传输麦克风单元22采集的音频数据,另一个声道传输音频输入端口21传送的音频数据。
由于通过智能设备10的音频输出端口11提供给麦克风模块20的音频输入端口21的音频数据要比麦克风模块20的麦克风单元22采集到扬声器播放的音频数据要快一些,需要将这个快慢的程度进行量化,以便后续进行语音识别控制时能够采用获取到的延时值进行修正。智能设备10记录所述接收两路音频数据的时间及计算所述两路音频数据的延时值。在本实施例中,该延时值的范围为10-500ms。
存储模块400,存储所述延时值以作为后续所述回声消除延时的处理装置利用麦克风模块20实现语音识别控制的校正值。
在本实施例中,麦克风模块20通过USB接口和音频接口可插拔的连接在智能设备10上,音频接口可以为AV音频接口或3.5mm耳机音频接口等。
所述回声消除延时的处理装置还包括:获取模块和控制模块;所述获取模块用于当接收到语音识别控制指令时,获取该延时值;接收模块200接收来自麦克风单元22采集的音频数据和来自音频输入端口21传送的音频数据;所述控制模块用于根据所述两路音频数据和该延时值进行回声消除处理以实现语音识别控制。
智能设备10的语音控制通过增加一个硬件设备麦克风模块20安插在智能设备10的某一通信接口,比如USB接口上,同时将智能设备10的音频输出端口11与麦克风模块20上的音频输入端口21连接以及智能设备10上安装运行测试app软件来获取延时值以及语音识别控制软件利用延时值来做回声消除使麦克风单元22采集的音频数据和音频输入端口21传送的音频数据对齐从而更好实现语音识别从而实现智能设备10的语音遥控。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本领域技术人员可以理解实施场景中的设备中的模块可以按照实施场景描述进行分布于实施场景的设备中,也可以进行相应变化位于不同于本实施场景的一个或多个设备中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本发明序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本发明的几个具体实施场景,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。
Claims (10)
1.一种回声消除延时的处理方法,应用于智能设备和麦克风模块,所述麦克风模块可插拔的连接在所述智能设备上,所述麦克风模块包括麦克风单元和音频输入端口,其特征在于,所述回声消除延时的处理方法包括:
响应触发信号播放预设的音频文件;
接收来自所述麦克风单元采集的音频数据和来自所述音频输入端口传送的音频数据;
记录所述接收两路音频数据的时间及计算所述两路音频数据的延时值;
存储所述延时值以作为后续所述智能设备利用所述麦克风模块实现语音识别控制的校正值。
2.根据权利要求1所述的回声消除延时的处理方法,其特征在于,所述两路音频数据存储于所述智能设备的左右声道,其中一个声道传输所述麦克风单元采集的音频数据,另一个声道传输所述音频输入端口传送的音频数据。
3.根据权利要求1所述的回声消除延时的处理方法,其特征在于,所述麦克风模块通过USB接口和音频接口可插拔的连接在所述智能设备上。
4.根据权利要求1所述的回声消除延时的处理方法,其特征在于,所述延时值的范围为10-500ms。
5.根据权利要求1所述的回声消除延时的处理方法,其特征在于,还包括:
当接收到语音识别控制指令时,获取该延时值;
接收来自所述麦克风单元采集的音频数据和来自所述音频输入端口传送的音频数据;
根据所述两路音频数据和该延时值进行回声消除处理以实现语音识别控制。
6.一种回声消除延时的处理装置,应用于智能设备和麦克风模块,所述麦克风模块可插拔的连接在所述智能设备上,所述麦克风模块包括麦克风单元和音频输入端口,其特征在于,所述回声消除延时的处理装置包括:
触发模块,用于响应触发信号播放预设的音频文件;
接收模块,用于接收来自所述麦克风单元采集的音频数据和来自所述音频输入端口传送的音频数据;
计算模块,用于记录所述接收两路音频数据的时间及计算所述两路音频数据的延时值;
存储模块,存储所述延时值以作为后续所述回声消除延时的处理装置利用所述麦克风模块实现语音识别控制的校正值。
7.根据权利要求6所述的回声消除延时的处理装置,其特征在于,所述两路音频数据存储于所述智能设备的左右声道,其中一个声道传输所述麦克风单元采集的音频数据,另一个声道传输所述音频输入端口传送的音频数据。
8.根据权利要求6所述的回声消除延时的处理装置,其特征在于,所述麦克风模块通过USB接口和音频接口可插拔的连接在所述智能设备上。
9.根据权利要求6所述的回声消除延时的处理装置,其特征在于,所述延时值的范围为10-500ms。
10.根据权利要求6所述的回声消除延时的处理装置,其特征在于,还包括:获取模块和控制模块;所述获取模块用于当接收到语音识别控制指令时,获取该延时值;所述接收模块接收来自所述麦克风单元采集的音频数据和来自所述音频输入端口传送的音频数据;所述控制模块用于根据所述两路音频数据和该延时值进行回声消除处理以实现语音识别控制。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810036944.2A CN108198551A (zh) | 2018-01-15 | 2018-01-15 | 回声消除延时的处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810036944.2A CN108198551A (zh) | 2018-01-15 | 2018-01-15 | 回声消除延时的处理方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108198551A true CN108198551A (zh) | 2018-06-22 |
Family
ID=62589603
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810036944.2A Pending CN108198551A (zh) | 2018-01-15 | 2018-01-15 | 回声消除延时的处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108198551A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106209491A (zh) * | 2016-06-16 | 2016-12-07 | 苏州科达科技股份有限公司 | 一种时延检测方法及装置 |
CN109087660A (zh) * | 2018-09-29 | 2018-12-25 | 百度在线网络技术(北京)有限公司 | 用于回声消除的方法、装置、设备以及计算机可读存储介质 |
CN109640141A (zh) * | 2018-12-19 | 2019-04-16 | 深圳银澎云计算有限公司 | 一种音频时间戳的校正方法、校正装置及音视频终端 |
CN109817209A (zh) * | 2019-01-16 | 2019-05-28 | 深圳市友杰智新科技有限公司 | 一种基于双麦克风阵列的智能语音交互系统 |
CN111179970A (zh) * | 2019-08-02 | 2020-05-19 | 腾讯科技(深圳)有限公司 | 音视频处理方法、合成方法、装置、电子设备及存储介质 |
CN112331204A (zh) * | 2020-11-24 | 2021-02-05 | 珠海市杰理科技股份有限公司 | 智能语音识别方法及设备、装置和存储介质 |
CN113555029A (zh) * | 2021-07-21 | 2021-10-26 | 歌尔科技有限公司 | 一种语音设备控制方法、系统、介质及语音设备 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102044253A (zh) * | 2010-10-29 | 2011-05-04 | 深圳创维-Rgb电子有限公司 | 一种回声信号处理方法、系统及电视机 |
CN103700374A (zh) * | 2013-12-25 | 2014-04-02 | 宁波菊风系统软件有限公司 | 确定声学回声消除中系统延时的方法及声学回声消除方法 |
US20140112467A1 (en) * | 2012-10-23 | 2014-04-24 | Interactive Intelligence, Inc. | System and Method for Acoustic Echo Cancellation |
CN104778950A (zh) * | 2014-01-15 | 2015-07-15 | 华平信息技术股份有限公司 | 一种基于回声消除的麦克风信号延时补偿控制方法 |
CN104796692A (zh) * | 2014-01-20 | 2015-07-22 | 宁波舜宇光电信息有限公司 | 一种电视机音频采集装置的回声消除测试方法及其系统 |
CN105304093A (zh) * | 2015-11-10 | 2016-02-03 | 百度在线网络技术(北京)有限公司 | 用于语音识别的信号前端处理方法及装置 |
CN105472191A (zh) * | 2015-11-18 | 2016-04-06 | 百度在线网络技术(北京)有限公司 | 一种跟踪回声时延的方法和装置 |
CN105516859A (zh) * | 2015-11-27 | 2016-04-20 | 深圳Tcl数字技术有限公司 | 消除回声的方法和系统 |
US20160171988A1 (en) * | 2014-12-15 | 2016-06-16 | Wire Swiss Gmbh | Delay estimation for echo cancellation using ultrasonic markers |
CN106231145A (zh) * | 2016-08-31 | 2016-12-14 | 广州市百果园网络科技有限公司 | 一种回声延时处理方法及回声延时处理装置 |
CN106297815A (zh) * | 2016-07-27 | 2017-01-04 | 武汉诚迈科技有限公司 | 一种语音识别场景中回音消除的方法 |
CN106791244A (zh) * | 2016-12-13 | 2017-05-31 | 青岛微众在线网络科技有限公司 | 回声消除方法、装置以及通话设备 |
-
2018
- 2018-01-15 CN CN201810036944.2A patent/CN108198551A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102044253A (zh) * | 2010-10-29 | 2011-05-04 | 深圳创维-Rgb电子有限公司 | 一种回声信号处理方法、系统及电视机 |
US20140112467A1 (en) * | 2012-10-23 | 2014-04-24 | Interactive Intelligence, Inc. | System and Method for Acoustic Echo Cancellation |
CN103700374A (zh) * | 2013-12-25 | 2014-04-02 | 宁波菊风系统软件有限公司 | 确定声学回声消除中系统延时的方法及声学回声消除方法 |
CN104778950A (zh) * | 2014-01-15 | 2015-07-15 | 华平信息技术股份有限公司 | 一种基于回声消除的麦克风信号延时补偿控制方法 |
CN104796692A (zh) * | 2014-01-20 | 2015-07-22 | 宁波舜宇光电信息有限公司 | 一种电视机音频采集装置的回声消除测试方法及其系统 |
US20160171988A1 (en) * | 2014-12-15 | 2016-06-16 | Wire Swiss Gmbh | Delay estimation for echo cancellation using ultrasonic markers |
CN105304093A (zh) * | 2015-11-10 | 2016-02-03 | 百度在线网络技术(北京)有限公司 | 用于语音识别的信号前端处理方法及装置 |
CN105472191A (zh) * | 2015-11-18 | 2016-04-06 | 百度在线网络技术(北京)有限公司 | 一种跟踪回声时延的方法和装置 |
CN105516859A (zh) * | 2015-11-27 | 2016-04-20 | 深圳Tcl数字技术有限公司 | 消除回声的方法和系统 |
CN106297815A (zh) * | 2016-07-27 | 2017-01-04 | 武汉诚迈科技有限公司 | 一种语音识别场景中回音消除的方法 |
CN106231145A (zh) * | 2016-08-31 | 2016-12-14 | 广州市百果园网络科技有限公司 | 一种回声延时处理方法及回声延时处理装置 |
CN106791244A (zh) * | 2016-12-13 | 2017-05-31 | 青岛微众在线网络科技有限公司 | 回声消除方法、装置以及通话设备 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106209491A (zh) * | 2016-06-16 | 2016-12-07 | 苏州科达科技股份有限公司 | 一种时延检测方法及装置 |
CN106209491B (zh) * | 2016-06-16 | 2019-07-02 | 苏州科达科技股份有限公司 | 一种时延检测方法及装置 |
CN109087660A (zh) * | 2018-09-29 | 2018-12-25 | 百度在线网络技术(北京)有限公司 | 用于回声消除的方法、装置、设备以及计算机可读存储介质 |
CN109640141A (zh) * | 2018-12-19 | 2019-04-16 | 深圳银澎云计算有限公司 | 一种音频时间戳的校正方法、校正装置及音视频终端 |
CN109817209A (zh) * | 2019-01-16 | 2019-05-28 | 深圳市友杰智新科技有限公司 | 一种基于双麦克风阵列的智能语音交互系统 |
CN111179970A (zh) * | 2019-08-02 | 2020-05-19 | 腾讯科技(深圳)有限公司 | 音视频处理方法、合成方法、装置、电子设备及存储介质 |
CN111179970B (zh) * | 2019-08-02 | 2023-10-20 | 腾讯科技(深圳)有限公司 | 音视频处理方法、合成方法、装置、电子设备及存储介质 |
CN112331204A (zh) * | 2020-11-24 | 2021-02-05 | 珠海市杰理科技股份有限公司 | 智能语音识别方法及设备、装置和存储介质 |
CN112331204B (zh) * | 2020-11-24 | 2024-02-20 | 珠海市杰理科技股份有限公司 | 智能语音识别方法及设备、装置和存储介质 |
CN113555029A (zh) * | 2021-07-21 | 2021-10-26 | 歌尔科技有限公司 | 一种语音设备控制方法、系统、介质及语音设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108198551A (zh) | 回声消除延时的处理方法及装置 | |
US10359991B2 (en) | Apparatus, systems and methods for audio content diagnostics | |
US10178345B2 (en) | Apparatus, systems and methods for synchronization of multiple headsets | |
US10360923B2 (en) | Method and system for eliminating an echo | |
US8126161B2 (en) | Acoustic echo canceller system | |
US8810728B2 (en) | Method and apparatus for synchronizing audio and video streams | |
KR101970731B1 (ko) | 인공지능 스피커 및 이의 제어 방법 | |
KR102393798B1 (ko) | 오디오 신호 처리 방법 및 장치 | |
US10481859B2 (en) | Audio synchronization and delay estimation | |
US8913189B1 (en) | Audio and video processing associated with visual events | |
WO2022106654A3 (en) | Methods and systems for video translation | |
JP2007533189A (ja) | ビデオ・オーディオ同期 | |
CN108260051A (zh) | 语音遥控系统、便携式传输设备及智能设备 | |
CN109379613A (zh) | 音视频同步调整方法、电视、计算机可读存储介质及系统 | |
CN109168059A (zh) | 一种在不同设备上分别播放音频与视频的唇音同步方法 | |
US20180343520A1 (en) | Packet based delivery of multi-channel audio over wireless links | |
US12052556B2 (en) | Terminal, audio cooperative reproduction system, and content display apparatus | |
CN112188342B (zh) | 均衡参数确定方法、装置、电子设备和存储介质 | |
CN111883158A (zh) | 一种回声消除方法和装置 | |
US10764631B2 (en) | Synchronizing audio of a secondary-language audio track | |
KR20010018572A (ko) | 오디오/비디오 신호 동기 장치 및 그 방법 | |
CN115802087A (zh) | 音画同步处理方法及其相关设备 | |
WO2015131591A1 (zh) | 音频信号输出方法、装置、终端及系统 | |
CN116529716A (zh) | 虚拟通用串行总线接口 | |
US10666838B2 (en) | Control method of operation apparatus configured to control a plurality of content reproduction apparatus to set a preset synchronous state, control method of command processing apparatus, and control method of content reproduction system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Unit 1403, floor 14, building a, No.1 Gangle Road, Tangjiawan Town, hi tech Zone, Zhuhai City, Guangdong Province Applicant after: Zhuhai black whale Software Co., Ltd. Address before: 518000 Guangdong city of Shenzhen province Qianhai Shenzhen Hong Kong cooperation zone before Bay Road No. 1 building 201 room A Applicant before: Shenzhen Qianhai blackfish Technology Co. Ltd. |
|
CB02 | Change of applicant information | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180622 |
|
RJ01 | Rejection of invention patent application after publication |