CN115273877A - 智能传感器、回音消除方法、服务设备和回音消除系统 - Google Patents
智能传感器、回音消除方法、服务设备和回音消除系统 Download PDFInfo
- Publication number
- CN115273877A CN115273877A CN202110472195.XA CN202110472195A CN115273877A CN 115273877 A CN115273877 A CN 115273877A CN 202110472195 A CN202110472195 A CN 202110472195A CN 115273877 A CN115273877 A CN 115273877A
- Authority
- CN
- China
- Prior art keywords
- signal
- path
- audio
- microphone
- time delay
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 230000005236 sound signal Effects 0.000 claims abstract description 93
- 238000012545 processing Methods 0.000 claims abstract description 27
- 238000007781 pre-processing Methods 0.000 claims description 6
- 230000003139 buffering effect Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 2
- 230000005540 biological transmission Effects 0.000 abstract description 12
- 210000004556 brain Anatomy 0.000 description 16
- 230000000007 visual effect Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 11
- 230000001934 delay Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000002592 echocardiography Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 102100026436 Regulator of MON1-CCZ1 complex Human genes 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 101000893549 Homo sapiens Growth/differentiation factor 15 Proteins 0.000 description 1
- 101000692878 Homo sapiens Regulator of MON1-CCZ1 complex Proteins 0.000 description 1
- 101710180672 Regulator of MON1-CCZ1 complex Proteins 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02165—Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
Abstract
本申请公开了一种智能传感器、回音消除方法、服务设备和回音消除系统,用于解决相关技术中。在本申请实施例中在音频信号传输链路又长又复杂的情况下,基于整机的回音消除方案不再适用的问题。本申请中能够基于服务设备将一路信号分成两路信号,得到的第一路信号通过有线传输方式传输给智能传感器,得到的第二路信号用于输出给智能终端播放,播放的信号可被智能传感器采集到。智能传感器可对采集得到的两路信号进行回音消除处理,由此实现复杂链路的回音消除处理。
Description
技术领域
本申请涉及信号处理技术领域,特别涉及一种智能传感器、回音消除方法、服务设备和回音消除系统。
背景技术
远程通话的两端需要进行回音消除处理以净化通话想音频信号。消除的回音可分为电路回音和声学回音。以声学回音为例,对回音消除的必要性进行说明。
如图1所示,为一种典型的需要回音消除处理的场景。远端讲话者的声音被远端麦克风采集并传入通信设备,经过无线或有线传输之后达到近端的通信设备,并通过近端扬声器播放。扬声器播放的声音又会被近端麦克风拾取至其通信设备形成声学回声,经传输又返回到远端的通信设备,并通过远端通信设备的扬声器播放出来,从而远端讲话者就会听到自己的回声。
相关技术中通常在通信设备内部实现回声消除。然而,随着智能设备的不断更新,通话音频从采集到播放之间的路径可能又长又复杂,故此,在音频信号传输链路又长又复杂的情况下,基于整机的回音消除方案不再适用。
发明内容
本申请的目的是提供一种智能传感器、回音消除方法、服务设备和回音消除系统。用于解决现有技术中,在音频信号传输链路又长又复杂的情况下,基于整机的回音消除方案不再适用的问题。
第一方面,本申请提供一种智能传感器,包括:第一麦克风、第二麦克风和数字信号处理器,其中:
所述第一麦克风用于采集周围环境的第一音频信号;
所述第二麦克风,与服务设备的音频输入接口通过信号线连接,用于获取所述音频输入接口输出的第二音频信号;其中,所述服务设备用将远端信号分为两路信号,第一路信号为所述第二音频信号,第二路信号用于输出给智能终端播放;
所述数字信号处理器,分别连接所述第一麦克风和所述第二麦克风,被配置为:
获取所述第一麦克风输入的所述第一音频信号,并获取所述第二麦克风输入的所述第二音频信号;
基于所述第一音频信号和所述第二音频信号进行回声消除处理,得到待传输音频信号。
可选的,所述数字信号处理器还被配置为:将所述待传输音频信号输出给所述服务设备,以使所述服务设备对所述待传输音频信号进行编码处理后发送给远端设备。
第二方面,本申请提供一种回音消除方法,所述方法包括:
获取远端设备发送的远端信号;
对所述远端信号进行解码处理,得到解码信号;
对所述解码信号进行预处理后得到待播放信号;
将所述待播放信号分为两路信号,其中,第一路信号通过音频输入接口传输给智能传感器,第二路信号输出给智能终端进行播放;
其中,所述两路信号用于供所述智能传感器对采集的音频信号进行回声消除处理。
可选的,所述方法还包括:
通过缓存所述两路信号中的一路信号的方式,调整所述两路信号传输到所述智能传感器的时延差。
可选的,所述通过缓存所述两路信号中的一路信号的方式,调整所述两路信号传输到所述智能传感器的时延差,包括:
若需要增加所述第一路信号的时延,则基于缓存空间容量与时延成正比的关系,采用第一预设缓存空间容量缓存所述第一路信号后,发送给所述音频输入接口;或者,
若需要增加所述第二路信号的时延,基于缓存空间容量与时延成正比的关系,采用第二预设缓存空间容量缓存所述第二路信号后,发送给所述智能终端设备。
可选的,所述方法还包括:
若所述第一路信号到达所述智能传感器的时延大于所述第二路信号到达所述智能传感器的时延,且所述第一路信号与所述第二路信号的所述时延差大于时延上限,则确定需要增加所述第二路信号的时延;
若所述第一路信号到达所述智能传感器的时延小于所述第二路信号到达所述智能传感器的时延,且所述第一路信号与所述第二路信号的所述时延差大于时延上限,则确定需要增加所述第一路信号的时延。
可选的,所述方法还包括:
接收所述智能传感器发送的经过回音消除处理后的待传输信号;
对所述待传输信号进行编码后发送给远端设备。
第三方面,本申请提供一种服务设备,包括音频输入接口、处理器和存储器,
所述音频输入接口,与智能传感器通过信号线连接;
所述存储器,用于存储可被所述控制器执行的计算机程序;
所述控制器,分别连接所述扬声器和所述存储器,被配置为执行如第二方面中任一所述的方法。
第四方面,本申请提供一种回音消除系统,所述系统包括智能传感器、智能终端和服务设备,其中:
所述智能传感器,包括第一麦克风、第二麦克风和数字信号处理器,其中:
所述第一麦克风用于采集周围环境的第一音频信号;
所述第二麦克风,与服务设备的音频输入接口通过信号线连接,用于获取所述音频输入接口输出的第二音频信号;
所述数字信号处理器,分别连接所述第一麦克风和所述第二麦克风,被配置为:获取所述第一麦克风输入的所述第一音频信号,并获取所述第二麦克风输入的所述第二音频信号;基于所述第一音频信号和所述第二音频信号进行回声消除处理,得到待传输音频信号;
所述服务设备,用于对所述待传输音频信号进行编码后发送给远端设备;还用于接收所述远端设备发送的远端信号,并将所述远端信号分为两路信号,其中,第一路信号为所述第二音频信号,第二路信号用于输出给智能终端播放。
可选的,所述服务设备还用于通过缓存所述两路信号中的一路信号的方式,调整所述两路信号传输到所述智能传感器的时延差。
本申请中能够基于服务设备将一路信号分成两路信号,得到的第一路信号通过有线传输方式传输给智能传感器,得到的第二路信号用于输出给智能终端播放,播放的信号可被智能传感器采集到。智能传感器可对采集得到的两路信号进行回音消除处理,由此实现复杂链路的回音消除处理。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,显而易见地,下面所介绍的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一些实施例提供的一种声学回声产生原理示意图;
图2A为本申请一些实施例提供的一种回音消除方法的应用场景图;
图2B为本申请一些实施例提供的图2A中智能传感器100的硬件配置框图;
图2C为本申请一些实施例提供的图2A中服务设备300的结构图;
图3为本申请一些实施例提供的回音消除方法的流程示意图;
图4为本申请一些实施例提供的一种回音消除系统的结构示意图;
图5为本申请一些实施例提供的回音延时的示意图;
图6为本申请一些实施例提供的一种回音消除方法的另一流程示意图;
图7为本申请一些实施例提供的一种回音消除系统的结构示意图。
具体实施方式
为使本申请的目的和实施方式更加清楚,下面将结合本申请示例性实施例中的附图,对本申请示例性实施方式进行清楚、完整地描述,显然,描述的示例性实施例仅是本申请一部分实施例,而不是全部的实施例。
需要说明的是,本申请中对于术语的简要说明,仅是为了方便理解接下来描述的实施方式,而不是意图限定本申请的实施方式。除非另有说明,这些术语应当按照其普通和通常的含义理解。
本申请中说明书和权利要求书及上述附图中的术语″第一″、″第二″、″第三″等是用于区别类似或同类的对象或实体,而不必然意味着限定特定的顺序或先后次序,除非另外注明。应该理解这样使用的用语在适当情况下可以互换。
术语″包括″和″具有″以及他们的任何变形,意图在于覆盖但不排他的包含,例如,包含了一系列组件的产品或设备不必限于清楚地列出的所有组件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。
术语″模块″是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合,能够执行与该元件相关的功能。
参见图2A,为本申请一些实施例提供的一回音消除的应用场景图。如图2A所示,智能传感器100,用于采集音多媒体数据并传输给服务设备300、服务设备300对智能传感器100采集的多媒体数据进行编码后发送给远端设备(图中未示出)、服务设备300将远端设备发送的多媒体数据进行处理后发送给智能电视200输出。
智能传感器100和服务设备300之间可以有线或无线方式进行通信。智能传感器例如为监控摄像头、音视频传感器等。
智能传感器100的结构框图如图2B所示,包括数字信号处理器110、存储器120、通信器130、用户输入接口140、供电电源150。
数字信号处理器110用于基于参考信号进行回音消除。
存储器120,用于在数字信号处理器110的控制下存储驱动和控制智能传感器100的各种运行程序、数据和应用。存储器120,可以存储用户输入的各类控制信号指令。例如监控摄像头的监控范围。
通信器130在数字信号处理器110的控制下,实现与服务设备300之间控制信号和数据信号的通信。如:智能传感器100经由通信器130将多媒体信号发送至服务设备300,智能传感器100可经由通信器130采集由智能电视200扬声器发出的音频信号。通信器130可以包括红外信号接口131和射频信号接口132。例如:红外信号接口时,需要将用户输入指令按照红外控制协议转化为红外控制信号,经红外发送模块进行发送至服务设备300。再如:射频信号接口时,需将用户输入指令转化为数字信号,然后按照射频控制信号调制协议进行调制后,由射频发送端子发送至服务设备300。
用户输入接口140,可包括麦克风141、还可以包括按键142等。
供电电源160,用于在为智能传感器100各元件提供运行电力支持。形式可以为电池及相关控制电路。
智能电视200与服务设备300通过多种通信方式进行数据通信。这里可允许智能电视200通过局域网(LAN)、无线局域网(WLAN)和其他网络进行通信连接。服务设备300可以向智能电视200提供各种内容和互动。示例的,智能电视200可以发送和接收信息,例如:接收电子节目指南(EPG)数据、接收软件程序更新、或访问远程储存的数字媒体库。服务设备300可实现为家庭大脑服务器。
图2C中示例性示出了服务设备300的硬件配置框图。如图2C所示,服务设备300的组件可以包括但不限于:至少一个处理器31、至少一个存储器32、连接不同系统组件(包括存储器32和处理器31)的总线33。
总线33表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。
存储器32可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)321和/或高速缓存存储器322,还可以进一步包括只读存储器(ROM)323。
存储器32还可以包括具有一组(至少一个)程序模块324的程序/实用工具325,这样的程序模块324包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
服务设备300也可以与一个或多个外部设备34(例如键盘、指向设备等)通信,还可与一个或者多个使得用户能与服务设备300交互的设备通信,和/或与使得该服务设备300能与一个或多个其它电子设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口35进行。并且,服务设备300还可以通过网络适配器36与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器36通过总线33与用于服务设备300的其它模块通信。应当理解,尽管图中未示出,可以结合服务设备300使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
在一些实施例中,处理器31可以包括两块底板,一块底板用于对音视频数据进行编解码,另一块底板可以对解码后的音视频数据进行预处理,得到可播放的图像和音频。
在一些实施方式中,本申请提供的一种回音消除方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在计算机设备上运行时,程序代码用于使计算机设备执行本申请各种示例性实施方式的任一种回音消除方法中的步骤。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本申请的实施方式的用于回音消除的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在电子设备上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
下面结合图2A所示的场景,对本申请实施例提供的回音消除方法进行说明。需要说明的是,本申请实例中可以任何智能终端设备代替图2A中的智能电视实现对音视频的播放。该智能终端如电话手表、移动终端、台式电脑等。
如图3所示,为本申请实施例提供的回音消除方法的流程示意图,包括:
在步骤301中,服务设备获取远端设备的远端信号。
在步骤302中,服务设备首先对远端信息进行解码处理,得到解码信号。
例如,远端信号中包括音视频信号,则服务设备可以对音视频信号进行解封装得到音频流和视频流,然后按照音频信号的解码方式得到解码后的音频信号,按照视频信号的解码方式对视频流进行解码得到解码后的视频信号。实施时,可以由一块底板执行步骤302,然后由另一块底板执行步骤303,以完成对音频信号的预处理和视频信号的预处理。
在步骤303中,服务设备对解码信号进行预处理,得到待播放信号。
该预处理,例如可包括音视频信号的同步处理。例如,音频帧首帧时间戳和视频帧首帧时间戳不一致时,为了实现音视频同步,可以调整音频帧和视频帧同步输出。例如,以音频帧时间戳为基准,同步控制视频帧的播放时间与音频帧一致。该种方案中,同步处理时若视频帧的首帧播放时间晚于首帧音频帧,则可以延迟播放首帧视频帧,若同步处理时,首帧视频帧的播放时间早于首帧音频帧,则可以过滤掉早于首帧音频帧的视频帧。
在步骤304中,服务设备将待播放信号分为两路信号,其中,第一路信号通过服务设备的音频输入接口传输给智能传感器,第二路信号输出给智能终端进行播放。
在步骤305中,智能设备播放第二路信号。
如智能电视通过扬声器播放音频信号。
在步骤306中,智能传感器通过第一麦克风采集周围唤醒的第一音频信号。由此,智能设备通过扬声器播放的音频信号以及环境信号都可被第一麦克风采集到。智能传感器通过第二麦克风采集到有线传输方式传输的第二音频信号,即服务设备分出来的第一路信号。
在步骤307中,智能传感器的数字信号处理器基于第一音频信号和第二音频信号进行回音消除处理,得到待传输音频信号。并由智能传感器将待传输音频信号发送给服务设备。
当然,如果智能传感器还采集了画面信息,则同步将画面信息传输给服务设备。
在步骤308中,服务设备将智能传感器传输的待传输音频信号进行编码,然后发送给远端设备播放。
其中,当智能传感器还采集了画面信息,则由服务设备对音频信号和画面信息进行编码后一同发送给远端设备。
由此,本申请实施例中,用于回音消除的参考信号包括两路信号,一路为服务设备通过音频输入接口传输给智能传感器的第二麦克风的第二音频信号,另一路为智能终端播放的第一音频信号。由此,可以由智能传感器对本端采集的音频信号进行回音消除处理。由此,本申请实施例中,可在传输链路又长又复杂的情况下实现消除回音。
参见图4为本申请实施例中以视觉智感器、家庭大脑服务器和智能电视为例对本申请实施例中提供的回音消除系统框架进行说明。
如图4所示,本申请实施例中的视觉智感器包括第一麦克风MIC1、第二麦克风MIC0。第一麦克风能够采集到智能电视播放的远端信号作为第一音频信号,第二麦克风和家庭大脑服务器的AUX口连接,能够采集AUX口输出的远端信号作为第二音频信号。
视觉智感器的数字信号处理器DSP基于获取的第一音频信号和第二音频信号进行回音消除处理后,可将音频信号通过RI45接口发送给家庭大脑服务器。视觉智感器采集的视频信号通过HDMI口发送给家庭大脑服务器。家庭大脑服务器将视觉智感器采集的视频信号和音频信号进行编码处理后发送给远端设备。在图4中,视觉智感器通过HDMI口将YUV(即视频流)传输给家庭大脑服务器,视觉智感器通过RJ45接口将G711a/pcm(即音频信号)传输给家庭大脑服务器。家庭大脑服务器可以基于RJ45接口进行控制信令的交互。该控制信令例如可以包括控制类消息,例如将控制类消息发送给视觉智感器,视觉智感器解析该消息之后执行相应的操作。
对应远端设备发送来的远端信号,家庭大脑服务器可以对该远端信号进行解码操作得到解码信号。该解码信号中可包括视频信号和音频信号。解码信号经过家庭大脑服务器进一步经过预处理之后,音频信号可拆解为两路信号,视频信号和其中第一路音频信号,通过HDMI口传输给智能电视,由智能电视显示视频信息并通过扬声器播放音频信号。播放的音频信号会成为回音信号被视觉智感器的第一麦克风采集到作为第一音频信号。另一路音频信号通过服务设备的AUX接口经由传输线传输给第二麦克风,由此视觉智感器会采集大第二音频信号,然后经由回音消除处理后交由家庭大脑服务器传输给远端设备播放。由此,本申请实施例实现了对于像图4所示多设备路径情况下的回音消除方案。应当说明的是,本申请实施例涉及的回音可以为电路回音、声学回音,还可以包括这两种回音。视觉智感器中的DSP的回音消除策略可以根据消除的回音进行配置,本申请对此不作限定。
继续以图4所示的框架为例,包括的时延如图5所示:
1)、从家庭大脑服务器的HDMI接口传输给TV端的HDMI接口的时延为T1。
2)、TV端处理音频,再送给扬声器的时延为T2。
3)、TV端扬声器播放音频被视觉智感器的mic1采集到的时延为T3。
4)、从家庭大脑服务器的AUX接口传输给视觉智感器的音频信号的时延为T4。
则第一音频信号和第二音频信号的时延差ΔT=T1+T2+T3-T4。由于视觉智感器的DSP能够处理的时延差具有时延上限。也即,若第一音频信号和第二音频信号的时延差超过该时延上限,DSP将无法很好的消除回音。
由于不同的智能终端所使用的机芯方案不同,其处理音频信号的时延是有差异的,而不同的HDMI线材等传输的时延也是有差异的,那么,以上回音消除的方案对视觉智感器端所选用的DSP模块的回音消除性能要求就非常高。
故此,本申请实施例中,为了能够保证DSP能够很好的消除回音,在家庭大脑服务器(即服务设备)将两路信号分别传输给智能电视和AUX口之间均增设了信号缓存机制。通过信号缓存机制能够调整两路信号到达智能传感器的时延。如图6所示,为本申请实施例中服务设备通过缓存机制调整两路信号的时延的流程图,包括以下步骤:
在步骤601中,服务设备将待播放信号分为两路信号。
如前文所述,两路信号中的第一路信号用于传输给智能传感器的第二麦克风,第二路信号用于传输给智能终端播放。
若两路信号到达智能传感器的时延差大于时延上限,则智能传感器的DSP无法有效消除回音。故此,服务设备可通过缓存所述两路信号中的一路信号的方式,调整所述两路信号传输到所述智能传感器的时延差。
这样,通过缓存其中一路信号,可以增高该路信号到达智能传感器的时延,从而实现对两路信号的时延差的调整。以此可以使得整个回音消除系统能够适应任意时延差的回音消除。
例如,在步骤602中,若需要增加第一路信号的时延,服务设备则基于缓存空间容量与时延成正比的关系,采用第一预设缓存空间容量缓存第一路信号后,发送给音频输入接口;或者,若需要增加第二路信号的时延,服务设备基于缓存空间容量与时延成正比的关系,采用第二预设缓存空间容量缓存第二路信号后,发送给智能终端设备。
由此,服务设备可以根据实际需求调整两路信号到达智能传感器的时延差。
当然,实施时,由于智能电视不同,AUX传输线的差异也会带来时延差的差别,本申请实施例中可以通过实验测定的方式,测量不同型号设备构成回音消除系统时,服务设备对第一路信号和/或第二路信号的延迟时长,进而由服务设备在使用时,根据智能终端和传输线的不同采用合理的延时方案。
例如,本申请实施例提供了缓存单元,每个缓存单元可缓存固定容量的数据,该固定容量可以根据实际情况进行设置,本申请对此不作限定。由此,可以根据实验测定结果,定义不同智能电视和传输线适配的缓存单元。例如,若需要增加的时延较长可以通过增加缓存单元来实现,若需要较低的时延则可以采用较少数量或不采用缓存单元。
实施时,若所述第一路信号到达所述智能传感器的时延大于所述第二路信号到达所述智能传感器的时延,且所述第一路信号与所述第二路信号的所述时延差大于时延上限,服务设备则确定需要增加所述第二路信号的时延;
若所述第一路信号到达所述智能传感器的时延小于所述第二路信号到达所述智能传感器的时延,且所述第一路信号与所述第二路信号的所述时延差大于时延上限,服务设备则确定需要增加所述第一路信号的时延。
由此,服务设备可以根据实际的情况确定对哪路信号增加时延。
继续以图4所示的回音消除系统框架为例,通过缓存机制对图4所示系统改进后的结构框图如图7所示。在家庭大脑服务器端将同一路音频信号分别推送给HDMI和AUX接口。在推送给HDMI接口之前经过一个时延缓存单元B1。类似的,在推送给AUX接口之前经过一个时延缓存单元B2。
B1和B2都是可调节的时延缓存单元,其缓存的音频数据大小以Δt(例如,25ms)为步长进行缓存。
改进后的ΔT的时延范围可根据实际情况进行调控,优化至最合适的回音消除的时延范围内。例如,若ΔT超出DSP的回音消除最大时延范围,那么,可以通过增加B2中缓存数据的大小来增大T4部分的时延,从而减小ΔT。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
为了方便解释,已经结合具体的实施方式进行了上述说明。但是,上述示例性的讨论不是意图穷尽或者将实施方式限定到上述公开的具体形式。根据上述的教导,可以得到多种修改和变形。上述实施方式的选择和描述是为了更好的解释原理以及实际的应用,从而使得本领域技术人员更好的使用所述实施方式以及适于具体使用考虑的各种不同的变形的实施方式。
Claims (10)
1.一种智能传感器,其特征在于,包括:第一麦克风、第二麦克风和数字信号处理器,其中:
所述第一麦克风用于采集周围环境的第一音频信号;
所述第二麦克风,与服务设备的音频输入接口通过信号线连接,用于获取所述音频输入接口输出的第二音频信号;其中,所述服务设备用将远端信号分为两路信号,第一路信号为所述第二音频信号,第二路信号用于输出给智能终端播放;
所述数字信号处理器,分别连接所述第一麦克风和所述第二麦克风,被配置为:
获取所述第一麦克风输入的所述第一音频信号,并获取所述第二麦克风输入的所述第二音频信号;
基于所述第一音频信号和所述第二音频信号进行回声消除处理,得到待传输音频信号。
2.根据权利要求1所述的智能传感器,其特征在于,所述数字信号处理器还被配置为:将所述待传输音频信号输出给所述服务设备,以使所述服务设备对所述待传输音频信号进行编码处理后发送给远端设备。
3.一种回音消除方法,其特征在于,所述方法包括:
获取远端设备发送的远端信号;
对所述远端信号进行解码处理,得到解码信号;
对所述解码信号进行预处理后得到待播放信号;
将所述待播放信号分为两路信号,其中,第一路信号通过音频输入接口传输给智能传感器,第二路信号输出给智能终端进行播放;
其中,所述两路信号用于供所述智能传感器对采集的音频信号进行回声消除处理。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
通过缓存所述两路信号中的一路信号的方式,调整所述两路信号传输到所述智能传感器的时延差。
5.根据权利要求4所述的方法,其特征在于,所述通过缓存所述两路信号中的一路信号的方式,调整所述两路信号传输到所述智能传感器的时延差,包括:
若需要增加所述第一路信号的时延,则基于缓存空间容量与时延成正比的关系,采用第一预设缓存空间容量缓存所述第一路信号后,发送给所述音频输入接口;或者,
若需要增加所述第二路信号的时延,基于缓存空间容量与时延成正比的关系,采用第二预设缓存空间容量缓存所述第二路信号后,发送给所述智能终端设备。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
若所述第一路信号到达所述智能传感器的时延大于所述第二路信号到达所述智能传感器的时延,且所述第一路信号与所述第二路信号的所述时延差大于时延上限,则确定需要增加所述第二路信号的时延;
若所述第一路信号到达所述智能传感器的时延小于所述第二路信号到达所述智能传感器的时延,且所述第一路信号与所述第二路信号的所述时延差大于时延上限,则确定需要增加所述第一路信号的时延。
7.根据权利要求3-6中任一所述的方法,其特征在于,所述方法还包括:
接收所述智能传感器发送的经过回音消除处理后的待传输信号;
对所述待传输信号进行编码后发送给远端设备。
8.一种服务设备,其特征在于,包括音频输入接口、处理器和存储器,
所述音频输入接口,与智能传感器通过信号线连接;
所述存储器,用于存储可被所述控制器执行的计算机程序;
所述控制器,分别连接所述扬声器和所述存储器,被配置为执行如权利要求3-7中任一所述的方法。
9.一种回音消除系统,其特征在于,所述系统包括智能传感器、智能终端和服务设备,其中:
所述智能传感器,包括第一麦克风、第二麦克风和数字信号处理器,其中:
所述第一麦克风用于采集周围环境的第一音频信号;
所述第二麦克风,与服务设备的音频输入接口通过信号线连接,用于获取所述音频输入接口输出的第二音频信号;
所述数字信号处理器,分别连接所述第一麦克风和所述第二麦克风,被配置为:获取所述第一麦克风输入的所述第一音频信号,并获取所述第二麦克风输入的所述第二音频信号;基于所述第一音频信号和所述第二音频信号进行回声消除处理,得到待传输音频信号;
所述服务设备,用于对所述待传输音频信号进行编码后发送给远端设备;还用于接收所述远端设备发送的远端信号,并将所述远端信号分为两路信号,其中,第一路信号为所述第二音频信号,第二路信号用于输出给智能终端播放。
10.根据权利要求9所述的系统,其特征在于,所述服务设备还用于通过缓存所述两路信号中的一路信号的方式,调整所述两路信号传输到所述智能传感器的时延差。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110472195.XA CN115273877A (zh) | 2021-04-29 | 2021-04-29 | 智能传感器、回音消除方法、服务设备和回音消除系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110472195.XA CN115273877A (zh) | 2021-04-29 | 2021-04-29 | 智能传感器、回音消除方法、服务设备和回音消除系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115273877A true CN115273877A (zh) | 2022-11-01 |
Family
ID=83744830
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110472195.XA Pending CN115273877A (zh) | 2021-04-29 | 2021-04-29 | 智能传感器、回音消除方法、服务设备和回音消除系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115273877A (zh) |
-
2021
- 2021-04-29 CN CN202110472195.XA patent/CN115273877A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102510541B (zh) | 多屏互动的音视频内容切换方法及媒体播放器 | |
CN101594528B (zh) | 信息处理系统、信息处理设备及信息处理方法 | |
CN110662114B (zh) | 视频处理方法、装置、电子设备及存储介质 | |
CN102143382A (zh) | 用于提供终端中的广播流的暂停功能的装置和方法 | |
CN106227492B (zh) | 拼接墙与移动智能终端互联方法和装置 | |
CN101883097A (zh) | 服务器设备共享客户端设备屏幕的实现方法及装置 | |
JP3823044B2 (ja) | タイムスタンプ値制御装置 | |
CN107770600A (zh) | 流媒体数据的传输方法、装置、设备和存储介质 | |
JP2014512716A (ja) | 遠隔制御スタジオ・カメラ・システム | |
CN112261633B (zh) | 一种用于智能耳机的音频录音及转换方法 | |
KR20060090508A (ko) | 복수개의 데이터 처리 장치를 이용한 데이터 처리 장치 및그 방법과, 이를 구현하기 위한 프로그램이 기록된 기록매체 | |
US20060002682A1 (en) | Recording apparatus and recording control method | |
CN112272281B (zh) | 一种区域分布式视频会议系统 | |
CA2719183C (en) | Systems, methods and apparatus for transmitting data over a voice channel of a wireless telephone network | |
EP1090506B1 (en) | A method for transmitting video images, a data transmission system and a multimedia terminal | |
CN1929647B (zh) | 执行视频通信业务的方法及使用该方法的移动通信终端 | |
CN115273877A (zh) | 智能传感器、回音消除方法、服务设备和回音消除系统 | |
EP4117294A1 (en) | Method and device for adjusting bit rate during live streaming | |
CN116261001A (zh) | 一种手术录播方法及系统 | |
CN115802087A (zh) | 音画同步处理方法及其相关设备 | |
JP2002010265A (ja) | 送信装置およびその方法と受信装置およびその方法 | |
CN114079534A (zh) | 编码、解码方法、装置、介质和电子设备 | |
CN110704340B (zh) | 数据传输设备、系统和方法 | |
CN213126228U (zh) | 一种区域分布式视频会议装置 | |
US11855775B2 (en) | Transcoding method and apparatus, medium, and electronic device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |