CN110290468B - 虚拟隔音通信方法、装置、系统、电子设备、存储介质 - Google Patents
虚拟隔音通信方法、装置、系统、电子设备、存储介质 Download PDFInfo
- Publication number
- CN110290468B CN110290468B CN201910607790.2A CN201910607790A CN110290468B CN 110290468 B CN110290468 B CN 110290468B CN 201910607790 A CN201910607790 A CN 201910607790A CN 110290468 B CN110290468 B CN 110290468B
- Authority
- CN
- China
- Prior art keywords
- voice data
- sound source
- light source
- area
- communication
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004891 communication Methods 0.000 title claims abstract description 191
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000009413 insulation Methods 0.000 title claims abstract description 33
- 230000003287 optical effect Effects 0.000 claims abstract description 96
- 238000001914 filtration Methods 0.000 claims abstract description 34
- 238000000926 separation method Methods 0.000 claims description 17
- 238000000638 solvent extraction Methods 0.000 claims description 14
- 238000005286 illumination Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 5
- 230000000007 visual effect Effects 0.000 claims description 4
- 230000007613 environmental effect Effects 0.000 claims description 3
- 238000002955 isolation Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 description 23
- 238000005192 partition Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 4
- 238000003491 array Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B10/00—Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
- H04B10/11—Arrangements specific to free-space transmission, i.e. transmission through air or vacuum
- H04B10/114—Indoor or close-range type systems
- H04B10/116—Visible light communication
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B10/00—Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
- H04B10/11—Arrangements specific to free-space transmission, i.e. transmission through air or vacuum
- H04B10/114—Indoor or close-range type systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02087—Noise filtering the noise being separate speech, e.g. cocktail party
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/021—Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Electromagnetism (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Optical Communication System (AREA)
Abstract
本发明提供一种虚拟隔音通信方法、装置、系统、电子设备、存储介质。基于光通信的虚拟隔音通信方法包括:基于光通信确定由光分隔而成的公共区域及私密区域;采集第一语音数据;自所述第一语音数据分离一个或多个声源的声源语音数据;根据所述声源语音数据确定该声源语音数据的声源位置;自所述第一语音数据中过滤声源位置位于所述私密区域的声源语音数据;以及利用过滤后的第一语音数据进行语音通信。本发明实现音频通话和/或视频通话中的智能隔音。
Description
技术领域
本发明涉及通信应用技术领域,尤其涉及一种虚拟隔音通信方法、装置、系统、电子设备、存储介质。
背景技术
在当前多方通信的系统中,无论是音频通话还是视频通话,考虑到本地端的环境噪音或其它未参与通话人员的声音会通过音频通话或视频通话而被发送,通常会在音频通话或视频通话中设置手动静音键,然而,手动静音键会将本地的所有音频全部屏蔽,使得通话产生影响。此外,手动静音键操作不便,容易被遗忘,从而导致私密的谈话也被传输。从而使得现有的多方通信系统中无法实现智能隔音。
在一些现有技术中,如公布号为CN107148782A的申请,其公开了一种具有可配置区的音频系统,其基于用户、音频源和/或扬声器阵列的定位,可被配置为向独立区中输出表示针对一条或多条声音节目内容的信道的音频的波束。该申请尽快提出了通过可配置区以对音频进行控制的方案,从而可以通过音频播放端的可配置区来部分解决上述技术问题。但,一方面,其主要用于音频的区域播放而并非区域音频的采集传输,音频的区域播放和区域音频的采集传输基于构思和硬件实现完全不同。另一方面,其并未限定收听区和独立区基于何种因素进行划分,难以进行智能隔区。因此,该现有技术无法从音频采集端解决上述技术问题,且仍有可能存在环境音或私密音频被传输的问题。
发明内容
本发明为了克服上述现有技术存在的缺陷,提供一种虚拟隔音通信方法、装置、系统、电子设备、存储介质,可以实现音频通话和/或视频通话中的智能隔音。
根据本发明的一个方面,提供一种基于光通信的虚拟隔音通信方法,包括:
基于光通信确定由光分隔而成的公共区域及私密区域;
采集第一语音数据;
自所述第一语音数据分离一个或多个声源的声源语音数据;
根据所述声源语音数据确定该声源语音数据的声源位置;
自所述第一语音数据中过滤声源位置位于所述私密区域的声源语音数据;以及
利用过滤后的第一语音数据进行语音通信。
可选地,所述基于光通信确定由光分隔而成的公共区域及私密区域包括:
接收通过光源闪烁发送的光源参数;
基于所述光源参数确定所述光源分隔而成的公共区域及私密区域。
可选地,所述基于所述光源参数确定所述光源分隔而成的公共区域及私密区域包括:
基于所述光源参数确定所述光源覆盖空间,并基于所述光源参数确定所述光源分隔而成的公共区域及私密区域;或者
基于所述光源参数确定所述光源围绕而成的空间,并基于所述光源参数确定所述光源分隔而成的公共区域及私密区域。
可选地,所述光源固定照射区域形成所述光源覆盖空间或者所述光源围绕而成的空间
可选地,基于光源实现不同形状、不同大小的区域配置设定所述光源固定照射区域。
可选地,所述基于所述光源参数确定所述光源分隔而成的公共区域及私密区域包括:
基于多个光源,确定多个光源的光源参数对应分隔的公共区域及私密区域。
可选地,多个所述光源设定有优先级,当对应分隔不同区域的光源重叠时,对于重叠区域按优先级高的光源确定该重叠区域的分隔。
可选地,所述自所述第一语音数据分离一个或多个声源的声源语音数据包括:
通过声纹特征自所述第一语音数据分离一个或多个人声声源的声源语音数据及环境语音数据;
将所述环境语音数据自所述第一语音数据中过滤。
可选地,所述根据所述声源语音数据确定该声源语音数据的声源位置之后,且所述利用过滤后的第一语音数据进行语音通信之前还包括:
在声源位置位于所述公共区域的声源语音数据中,过滤声源的音频强度小于等于第一强度阈值且声源位置与采集该声源的采集模块的距离大于等于距离阈值的声源语音数据。
可选地,所述根据所述声源语音数据确定该声源语音数据的声源位置之后,且所述利用过滤后的第一语音数据进行语音通信之前还包括:
在声源位置位于所述公共区域的声源语音数据中,过滤声源的音频强度小于等于第二强度阈值且声源位置与采集该声源的采集模块的距离小于距离阈值的声源语音数据。
可选地,所述利用过滤后的第一语音数据进行语音通信之前还包括:
采集第一视频数据;
所述根据所述声源语音数据确定该声源语音数据的声源位置之后,且所述利用过滤后的第一语音数据进行语音通信之前还包括:
根据所述第一视频数据与所述第一语音数据,匹配所述公共区域内的发言对象与声源语音数据;
基于所述第一视频数据,将面部相对的发言对象对应声源语音数据确定为私密语音数据;
在声源位置位于所述公共区域的声源语音数据中,过滤所述私密语音数据。
根据本发明的又一方面,还提供一种基于光通信的虚拟隔音通信装置,包括:
分区模块,用于基于光通信确定由光分隔而成的公共区域及私密区域;
语音采集模块,用于采集第一语音数据;
分离模块,用于自所述第一语音数据分离一个或多个声源的声源语音数据;
定位模块,用于根据所述声源语音数据确定该声源语音数据的声源位置;
过滤模块,用于自所述第一语音数据中过滤声源位置位于所述私密区域的声源语音数据;以及
通信模块,用于利用过滤后的第一语音数据进行语音通信。
可选地,还包括:
光通信模块,用于接收光源闪烁发送的光源参数,以供所述分区模块基于所述光源参数确定所述光源分隔而成的公共区域及私密区域。
可选地,还包括:
声纹识别模块,用于通过声纹特征自所述第一语音数据分离一个或多个人声声源的声源语音数据及环境语音数据,
其中,所述过滤模块还将所述环境语音数据自所述第一语音数据中过滤。
可选地,还包括:
视频采集模块,用于采集第一视频数据;
视觉处理模块,用于根据所述第一视频数据与所述第一语音数据,匹配所述公共区域内的发言对象与声源语音数据,基于所述第一视频数据,将面部相对的发言对象对应声源语音数据确定为私密语音数据;
其中,所述过滤模块还在声源位置位于所述公共区域的声源语音数据中,过滤所述私密语音数据。
根据本发明的又一方面,还提供一种基于光通信的虚拟隔音通信系统,包括:
如上所述的基于光通信的虚拟隔音通信装置;以及
光源,用于进行光通信。
可选地,所述光源为固定照射光源或移动照射光源。
根据本发明的又一方面,还提供一种电子设备,所述电子设备包括:处理器;存储介质,其上存储有计算机程序,所述计算机程序被所述处理器运行时执行如上所述的步骤。
根据本发明的又一方面,还提供一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上所述的步骤。
相比现有技术,本发明提供的方法和装置具有如下优势:
1)通过光通信技术确定由光分隔而成的公共区域及私密区域,以发送公共区域的声源语音数据,而过滤私密区域的声源语音数据,从而进行智能隔音,解决手动静音键的完全隔音和不便操作的问题;
2)由于光源已在各个区域布置,从而利用已布置的光源,经由光通信技术确定由光分隔而成的公共区域及私密区域,无需增加硬件设备,节省硬件成本且便于普及;
3)通过光通信技术确定由光分隔而成的公共区域及私密区域算法简单,相比通过声纹身份识别等,减少算法复杂度,加快数据处理速度,提高系统性能;
4)通过光通信技术确定由光分隔而成的公共区域及私密区域算法简单以直观地进行区域分隔,解决手动配置区域时,难以将分区位置转换为信号的技术问题。
附图说明
通过参照附图详细描述其示例实施方式,本发明的上述和其它特征及优点将变得更加明显。
图1示出了根据本发明实施例的基于光通信的虚拟隔音通信方法的流程图。
图2示出了根据本发明具体实施例的基于光通信的虚拟隔音通信方法的采集空间的示意图。
图3示出了根据本发明实施例的光源分隔区域重叠的示意图。
图4至6示出了根据本发明实施例的光源分隔区域的示意图。
图7示出了根据本发明具体实施例的基于光通信的虚拟隔音通信方法的公共区域内的俯视图。
图8示出了根据本发明具体实施例的基于光通信的虚拟隔音通信方法的公共区域内的各类型声源的波形图。
图9示出了根据本发明具体实施例的基于光通信的虚拟隔音通信方法的示意图。
图10示出了根据本发明具体实施例的基于光通信的虚拟隔音通信方法的流程图。
图11示出了根据本发明实施例的基于光通信的虚拟隔音通信装置的模块图。
图12示出了根据本发明实施例的基于光通信的虚拟隔音通信系统的模块图。
图13示意性示出本公开示例性实施例中一种计算机可读存储介质示意图。
图14示意性示出本公开示例性实施例中一种电子设备示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
为了解决现有技术的缺陷,本发明提供一种虚拟隔音通信方法、装置、系统、电子设备、存储介质,可以实现音频通话和/或视频通话中的智能隔音。
首先参见图1,图1示出了根据本发明实施例的基于光通信的虚拟隔音通信方法的流程图。
图1共示出六个步骤:
步骤S110:基于光通信确定由光分隔而成的公共区域及私密区域;
步骤S120:采集第一语音数据;
步骤S130:自所述第一语音数据分离一个或多个声源的声源语音数据;
步骤S140:根据所述声源语音数据确定该声源语音数据的声源位置;
步骤S150:自所述第一语音数据中过滤声源位置位于所述私密区域的声源语音数据;以及
步骤S160:利用过滤后的第一语音数据进行语音通信。
在本发明提供的基于光通信的虚拟隔音通信方法中,一方面,通过光通信技术确定由光分隔而成的公共区域及私密区域,以发送公共区域的声源语音数据,而过滤私密区域的声源语音数据,从而进行智能隔音,解决手动静音键的完全隔音和不便操作的问题;另一方面,由于光源已在各个区域布置,从而利用已布置的光源,经由光通信技术确定由光分隔而成的公共区域及私密区域,无需增加硬件设备,节省硬件成本且便于普及;再一方面,通过光通信技术确定由光分隔而成的公共区域及私密区域算法简单,相比通过声纹身份识别等,减少算法复杂度,加快数据处理速度,提高系统性能;又一方面,通过光通信技术确定由光分隔而成的公共区域及私密区域算法简单以直观地进行区域分隔,解决手动配置区域时,难以将分区位置转换为信号的技术问题。
下面分别结合图2至图10进一步描述本发明提供的基于光通信的虚拟隔音通信方法。
参见图2,图2示出了根据本发明具体实施例的基于光通信的虚拟隔音通信方法的采集空间的示意图。
在该具体实施例中,由光将空间分隔为公共区域101和私密区域104。公共区域101的发言将通过具有语音采集模块的多方通话装置102向外发送以进行语音通信。私密区域104的发言将直接被过滤而不会被多方通话装置102向外发送。
具体而言,通过可见光通信技术发送的光源参数,以计算确定光源照射分隔而成的公共区域101及私密区域104。可见光通信技术(Visible Light Communication,VLC),又称“光保真技术(LightFidelity,LiFi)”,通过给普通的LED灯泡加装微晶片,使灯泡以频率每秒数百万次闪烁传递信号。利用光通信技术进行空间分隔具有如下优势:1)绿色安全无辐射;2)室内定位精度高;3)通信速度快(通信速度为Wifi通信对的100倍);4)资源丰富(随处可与照明同步实施)。所述的光源参数可以是光源照射的角度、光源移动的路径等等,本发明并非以此为限。基于光源照射的角度或光源移动的路径即可确定光源照射的范围,从而可以根据光源照射的范围进行区域的划分。
在一些具体实施例中,可以基于所述光源参数确定所述光源覆盖空间,并基于所述光源参数确定所述光源分隔而成的公共区域及私密区域。如图4,光源240照射将覆盖部分空间241,从而可以将被光源240照射覆盖的部分空间241作为公共区域,将未被光源240照射覆盖的部分空间241作为私密区域。或者可以将被光源240照射覆盖的部分空间作为私密区域,将未被光源240照射覆盖的部分空间作为公共区域。
在另一些具体实施例中,可以基于所述光源参数确定所述光源围绕而成的空间,并基于所述光源参数确定所述光源分隔而成的公共区域及私密区域。如图5和图6所示,光源250形成光带,基于光带围绕而成的空间251进行空间分隔。例如,将被光源250照射形成的光带围绕的空间251作为公共区域,将未被光源250照射形成的光带围绕的空间251作为私密区域。或者可以将被光源250照射形成的光带围绕的空间251作为私密区域,将未被光源250照射形成的光带围绕的空间251作为公共区域。类似地,光源260形成光带,可以基于光带围绕而成的空间261进行空间分隔。
在上述实施例中,可以由所述光源固定照射区域形成所述光源覆盖空间或者所述光源围绕而成的空间,从而所述光源参数可以包括光源位置、光源照射覆盖角度、光源照射角度等等。在上述实施例中,也可以由所述光源固定照射区域形成所述光源覆盖空间或者所述光源围绕而成的空间,从而所述光源参数可以包括光源移动路径、光源照射覆盖角度、光源移动过程中的光源照射角度等等。根据光源参数即可计算获得光源覆盖空间或者光源围绕形成的空间,以进行空间分隔。
在上述各实施例中,参见图3,空间内可以设置多个光源210、220、230,从而可以基于多个光源,确定多个光源对应分隔的公共区域及私密区域。例如,光源210、220覆盖的空间作为公共区域,未被光源210、220覆盖的空间及被光源230覆盖的空间作为私密区域,其中光源230的优先级高于光源210、220的优先级,以当光源230覆盖的空间与光源210、220覆盖的空间重叠时,按光源230来确定重叠区域为私密区域。
在上述各实施例中,可以基于光源实现不同形状、不同大小的区域配置设定所述光源固定照射区域。例如,可以使得光源照射发言人座位,从而仅该发言人的语音数据可以通过多方通话装置102向外发送以进行语音通信。又例如,可以使得光源按会议桌103的形状进行照射,从而仅会议桌附近的发言人的语音数据可以通过多方通话装置102向外发送以进行语音通信。本发明可以通过光源实现不同形状、不同大小的区域的分隔,且光源可以进行移动以调整对区域的分隔进行调整。
继续回到图2,当光源将区域分隔为公共区域101和私密区域104后,多方通话装置102的语音采集模块将采集空间内的第一语音数据,通过声纹可以将第一语音数据内的各个发言人的语音数据进行分离从而获得多个发言人的声源语音数据。同时,在分离声源语音数据的过程中,还可以将非人声的环境语音数据自所述第一语音数据中过滤。
获得多个发言人的声源语音数据后,可以根据声源语音数据进行声源(发言人)的定位,从而获得声源位置。具体而言,声源的定位可以通过在多方通话装置102设置麦克风阵列来实现。通过不同麦克风接收到声源的语音数据的时间即可获得声源与该麦克风的距离,基于麦克风阵列中不同麦克风的位置关系,即可确定声源位置。
根据声源位置可以确定发言人位于公共区域101或私密区域104。例如,在图2中,根据发言人106和发言人105的声源位置,发言人106皆位于公共空间101,发言人105皆位于私密空间104,从而可以将位于私密空间104的发言人105的声源语音数据自第一语音数据中过滤,从而使得仅公共区域101的发言通过具有语音采集模块的多方通话装置102向外发送以进行语音通信。
考虑到公共空间内的发言人之间存在不需要进行通信传输的对话的情况,本发明在前述实施例的前提下,提供一个具体的解决方案,如图7所示。图7示出了根据本发明具体实施例的基于光通信的虚拟隔音通信方法的公共区域内的俯视图。
在图7中,光源的光带310将空间分隔为公共区域311和私密区域312。在公共区域311中,各发言人通过视频通话装置320进行视频会议。在公共区域311中,发言人332及发言人331朝向所述视频通话装置320以通过视频通话装置320进行视频会议。发言人333及发言人334尽管位于公共区域311中,但发言人333及发言人334相互面对,从而发言人333及发言人334实际上在相互对话,该对话无需被视频通话装置320发送至远端。为了解决该技术问题,本实施例通过视频通话装置320采集空间内的第一视频数据,基于人脸识别技术可以识别第一视频数据中各发言人,从而可以根据各发言人在第一视频数据的图像中的位置,从而可以确定各发言人相对于视频通话装置320的位置。且根据前述的实施例,可以根据分离的声源语音数据确定各声源相对于视频通话装置320的位置。由此,可以根据位置信息的匹配将同一位置的发言人与声源语音数据进行关联。继续根据第一视频数据,基于人脸识别技术可以识别各发言人的脸部朝向,从而可以将面部相对的发言人对应声源语音数据确定为私密语音数据。在声源位置位于所述公共区域的声源语音数据中,过滤所述私密语音数据。在图7的实施例中,通过前述的步骤可以将发言人333及发言人334的声源语音数据确定为私密语音数据,从而可以将私密语音数据自公共区域的声源语音数据中进行过滤,以避免公共区域311的私密语音数据被传输。
在又一些实施例中,还可以通过声源的音频强度及声源的位置来对公共区域的语音进行进一步地过滤。参考图8,图8示出了根据本发明具体实施例的基于光通信的虚拟隔音通信方法的公共区域内的各类型声源的波形图。
如图8所示,音频强度变化幅度较大且持续时间较短的曲线为环境音,其余曲线中,实线表示声源位置与采集该声源的采集模块的距离大于等于距离阈值,虚线表示声源位置与采集该声源的采集模块的距离小于距离阈值。
当声源的音频强度大于第一强度阈值且声源位置与采集该声源的采集模块的距离小于距离阈值时,该声源可以被认为是公共区域内的正常发言;当声源的音频强度大于第二强度阈值且声源位置与采集该声源的采集模块的距离大于等于距离阈值时,该声源可以被认为是公共区域内的远距离高音发言;当声源的音频强度小于等于第一强度阈值时,该声源可以被认为是公共区域内的私密讨论。通过在声源位置位于所述公共区域的声源语音数据中,过滤声源的音频强度小于等于第一强度阈值且声源位置与采集该声源的采集模块的距离大于等于距离阈值的声源语音数据;和/或过滤声源的音频强度小于等于第二强度阈值且声源位置与采集该声源的采集模块的距离小于等于距离阈值的声源语音数据,以保留正常发言和/或远距离高音发言进行传输。其中,第一强度阈值可以为40分贝;第二强度阈值可以为60分贝;距离阈值可以为0.5-2米。在各实施例中,第一强度阈值和第二强度阈值可以进行调整,例如可以在40-60分贝的范围内进行调整。
以上示意性地描述本发明的多个实施方式,该多个实施方式可以单独或组合来实现,本发明并非以此为限制。
下面参见图9,图9示出了根据本发明具体实施例的基于光通信的虚拟隔音通信方法的示意图。在本实施例中,本发明可以提供由光源划分的区域,不同的区域可以采用不同的参数进行语音数据的过滤。例如,区域410中具有发言人411,区域420中具有发言人421及发言人422,区域430中具有发言人431。
多个被划分区域内的发言人的发言经由语音输入441,通过声纹识别分离声源442。然后,通过声源的空间特征识别以定位声源位置443。根据光源450划分的区域,确定各声源位于哪些区域内,并根据不同区域的隔音配置参数过滤声源444。例如,区域410的发言人411的声源语音数据无需被过滤,区域420的发言人421和422的声源语音数据将进过音频强度和位置数据的参数进行判断是否需要被过滤,区域430的发言人431的声源语音数据将被过滤。通过过滤的语音数据经由语音通信输出445,从而实现本实施例。
下面参见图10,图10示出了根据本发明具体实施例的基于光通信的虚拟隔音通信方法的流程图。
步骤S510:接收空间内的混合语音数据。
步骤S520包括四个步骤:
步骤S521:分区配置。在此步骤中可以根据实际需求(如覆盖某一座位)对光源的照射进行设置(如覆盖某一座位、某一区域等)。该步骤还可以接收声音信号的设备特征,比如设备空间位置等。
步骤S522:基于光通信获得分区特征。在此步骤中,相当于基于光通信获得由光源分隔的多个分区的位置参数。
步骤S523:获得分区内隔音配置参数。在此步骤中,确定各个分区的过滤方式(如通过音频强度、位置等进行判断从而进行过滤)。
步骤S524:获得声源特征。在此步骤中,相当于获得人声的声纹特征。
步骤S530:基于声纹分离声源的语音数据。从而获得多个发言人的声源语音数据。
步骤S540:确定各个声源的声源位置。
步骤S550:判断声源是否位于公共区域。
若步骤S550判断为是,则执行步骤S560,根据步骤S523的隔音配置参数过滤语音数据。
若步骤S550判断为否,即声源是否位于私密区域,则执行步骤S570,直接过滤该语音数据。
步骤S580,判断分区是否改变,若改变,则回到步骤S520,若未改变,则执行步骤S530。
以上仅仅是本发明的一个具体实现方式,本发明并非以此为限制。
本发明还提供一种基于光通信的虚拟隔音通信装置。下面参见图11,图11示出了根据本发明一实施例的基于光通信的虚拟隔音通信装置的模块图。基于光通信的虚拟隔音通信装置600包括分区模块610、语音采集模块620、分离模块630、定位模块640、过滤模块650及通信模块660。
分区模块610用于基于光通信确定由光分隔而成的公共区域及私密区域。
语音采集模块620用于采集第一语音数据。
分离模块630用于自所述第一语音数据分离一个或多个声源的声源语音数据。
定位模块640用于根据所述声源语音数据确定该声源语音数据的声源位置。
过滤模块650用于自所述第一语音数据中过滤声源位置位于所述私密区域的声源语音数据。
通信模块660用于利用过滤后的第一语音数据进行语音通信。
在本发明提供的基于光通信的虚拟隔音通信装置中,一方面,通过光通信技术确定由光分隔而成的公共区域及私密区域,以发送公共区域的声源语音数据,而过滤私密区域的声源语音数据,从而进行智能隔音,解决手动静音键的完全隔音和不便操作的问题;另一方面,由于光源已在各个区域布置,从而利用已布置的光源,经由光通信技术确定由光分隔而成的公共区域及私密区域,无需增加硬件设备,节省硬件成本且便于普及;再一方面,通过光通信技术确定由光分隔而成的公共区域及私密区域算法简单,相比通过声纹身份识别等,减少算法复杂度,加快数据处理速度,提高系统性能;又一方面,通过光通信技术确定由光分隔而成的公共区域及私密区域算法简单以直观地进行区域分隔,解决手动配置区域时,难以将分区位置转换为信号的技术问题。
图11仅仅是示意性的示出本发明提供的基于光通信的虚拟隔音通信装置的模块图,在不违背本发明构思的前提下,模块的拆分、合并、增加都在本发明的保护范围之内。各模块可以由硬件、软件、固件或他们的任意组合来实现。
在本发明的一个具体实施例中,基于光通信的虚拟隔音通信装置还包括光通信模块。光通信模块用于接收光源闪烁发送的光源参数,以供所述分区模块基于所述光源参数确定所述光源分隔而成的公共区域及私密区域。
在本发明的一个具体实施例中,所述分区模块610包括区隔覆盖分区或移动分区,并基于所述光源参数确定所述光源分隔而成的公共区域及私密区域。覆盖分区是基于所述光源参数确定所述光源覆盖空间,而移动分区是基于所述光源参数确定所述光源围绕而成的空间。
在本发明的一个具体实施例中,基于光通信的虚拟隔音通信装置还包括声纹识别模块。声纹识别模块用于通过声纹特征自所述第一语音数据分离一个或多个人声声源的声源语音数据及环境语音数据,其中,所述过滤模块还将所述环境语音数据自所述第一语音数据中过滤。
在本发明的一个具体实施例中,基于光通信的虚拟隔音通信装置还包括视频采集模块及视觉处理模块。视频采集模块用于采集第一视频数据;视觉处理模块用于根据所述第一视频数据与所述第一语音数据,匹配所述公共区域内的发言对象与声源语音数据,基于所述第一视频数据,将面部相对的发言对象对应声源语音数据确定为私密语音数据;其中,所述过滤模块还在声源位置位于所述公共区域的声源语音数据中,过滤所述私密语音数据。
以上示意性地描述本发明的多个实施方式,该多个实施方式可以单独或组合来实现,本发明并非以此为限制。
本发明提供了一种基于光通信的虚拟隔音通信系统。参见图12。图12示出了根据本发明实施例的基于光通信的虚拟隔音通信系统的模块图。
基于光通信的虚拟隔音通信系统包括如图11所示的基于光通信的虚拟隔音通信装置以及光源。光源用于进行光通信。所述光源可以为固定照射光源或移动照射光源。
在本发明提供的基于光通信的虚拟隔音通信系统中,一方面,通过光通信技术确定由光分隔而成的公共区域及私密区域,以发送公共区域的声源语音数据,而过滤私密区域的声源语音数据,从而进行智能隔音,解决手动静音键的完全隔音和不便操作的问题;另一方面,由于光源已在各个区域布置,从而利用已布置的光源,经由光通信技术确定由光分隔而成的公共区域及私密区域,无需增加硬件设备,节省硬件成本且便于普及;再一方面,通过光通信技术确定由光分隔而成的公共区域及私密区域算法简单,相比通过声纹身份识别等,减少算法复杂度,加快数据处理速度,提高系统性能;又一方面,通过光通信技术确定由光分隔而成的公共区域及私密区域算法简单以直观地进行区域分隔,解决手动配置区域时,难以将分区位置转换为信号的技术问题。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被例如处理器执行时可以实现上述任意一个实施例中所述基于光通信的虚拟隔音通信方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述基于光通信的虚拟隔音通信方法部分中描述的根据本发明各种示例性实施方式的步骤。
参考图13,描述了根据本发明的实施方式的用于实现上述方法的程序产品900,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在租户计算设备上执行、部分地在租户设备上执行、作为一个独立的软件包执行、部分在租户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到租户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
在本公开的示例性实施例中,还提供一种电子设备,该电子设备可以包括处理器,以及用于存储所述处理器的可执行指令的存储器。其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一个实施例中所述基于光通信的虚拟隔音通信方法的步骤。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图14述根据本发明的这种实施方式的电子设备1000。图14的电子设备1000仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图14,电子设备1000以通用计算设备的形式表现。电子设备1000的组件可以包括但不限于:至少一个处理单元1010、至少一个存储单元1020、连接不同系统组件(包括存储单元1020和处理单元1010)的总线1030、显示单元1040等。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元1010执行,使得所述处理单元1010执行本说明书上述基于光通信的虚拟隔音通信方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元1010可以执行如图1或图10中所示的步骤。
所述存储单元1020可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)10201和/或高速缓存存储单元10202,还可以进一步包括只读存储单元(ROM)10203。
所述存储单元1020还可以包括具有一组(至少一个)程序模块10205的程序/实用工具10204,这样的程序模块10205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线1030可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备1000也可以与一个或多个外部设备1100(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得租户能与该电子设备1000交互的设备通信,和/或与使得该电子设备1000能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1050进行。并且,电子设备1000还可以通过网络适配器1060与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器1060可以通过总线1030与电子设备1000的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备1000使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本公开实施方式的上述基于光通信的虚拟隔音通信方法。
相比现有技术,本发明提供的方法和装置具有如下优势:
1)通过光通信技术确定由光分隔而成的公共区域及私密区域,以发送公共区域的声源语音数据,而过滤私密区域的声源语音数据,从而进行智能隔音,解决手动静音键的完全隔音和不便操作的问题;
2)由于光源已在各个区域布置,从而利用已布置的光源,经由光通信技术确定由光分隔而成的公共区域及私密区域,无需增加硬件设备,节省硬件成本且便于普及;
3)通过光通信技术确定由光分隔而成的公共区域及私密区域算法简单,相比通过声纹身份识别等,减少算法复杂度,加快数据处理速度,提高系统性能;
4)通过光通信技术确定由光分隔而成的公共区域及私密区域算法简单以直观地进行区域分隔,解决手动配置区域时,难以将分区位置转换为信号的技术问题。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。
Claims (19)
1.一种基于光通信的虚拟隔音通信方法,其特征在于,包括:
基于光通信确定由光分隔而成的公共区域及私密区域;
采集第一语音数据;
自所述第一语音数据分离一个或多个声源的声源语音数据;
根据所述声源语音数据确定该声源语音数据的声源位置;
自所述第一语音数据中过滤声源位置位于所述私密区域的声源语音数据;以及
利用过滤后的第一语音数据进行语音通信。
2.如权利要求1所述的基于光通信的虚拟隔音通信方法,其特征在于,所述基于光通信确定由光分隔而成的公共区域及私密区域包括:
接收通过光源闪烁发送的光源参数;
基于所述光源参数确定所述光源分隔而成的公共区域及私密区域。
3.如权利要求2所述的基于光通信的虚拟隔音通信方法,其特征在于,所述基于所述光源参数确定所述光源分隔而成的公共区域及私密区域包括:
基于所述光源参数确定所述光源覆盖的空间,并基于所述光源参数确定所述光源分隔而成的公共区域及私密区域;或者
基于所述光源参数确定所述光源围绕而成的空间,并基于所述光源参数确定所述光源分隔而成的公共区域及私密区域。
4.如权利要求3所述的基于光通信的虚拟隔音通信方法,其特征在于,
所述光源固定照射的区域形成所述光源覆盖的空间或者所述光源围绕而成的空间。
5.如权利要求4所述的基于光通信的虚拟隔音通信方法,其特征在于,基于光源实现不同形状、不同大小的区域配置设定所述光源固定照射的区域。
6.如权利要求2所述的基于光通信的虚拟隔音通信方法,其特征在于,所述基于所述光源参数确定所述光源分隔而成的公共区域及私密区域包括:
基于多个光源的光源参数,确定多个光源对应分隔的公共区域及私密区域。
7.如权利要求6所述的基于光通信的虚拟隔音通信方法,其特征在于,多个所述光源设定有优先级,当对应分隔不同区域的光源重叠时,对于重叠区域按优先级高的光源确定该重叠区域的分隔。
8.如权利要求1所述的基于光通信的虚拟隔音通信方法,其特征在于,所述自所述第一语音数据分离一个或多个声源的声源语音数据包括:
通过声纹特征自所述第一语音数据分离一个或多个人声声源的声源语音数据及环境语音数据;
将所述环境语音数据自所述第一语音数据中过滤。
9.如权利要求1所述的基于光通信的虚拟隔音通信方法,其特征在于,所述根据所述声源语音数据确定该声源语音数据的声源位置之后,且所述利用过滤后的第一语音数据进行语音通信之前还包括:
在声源位置位于所述公共区域的声源语音数据中,过滤声源的音频强度小于等于第一强度阈值且声源位置与采集该声源的采集模块的距离大于等于距离阈值的声源语音数据。
10.如权利要求1所述的基于光通信的虚拟隔音通信方法,其特征在于,所述根据所述声源语音数据确定该声源语音数据的声源位置之后,且所述利用过滤后的第一语音数据进行语音通信之前还包括:
在声源位置位于所述公共区域的声源语音数据中,过滤声源的音频强度小于等于第二强度阈值且声源位置与采集该声源的采集模块的距离小于距离阈值的声源语音数据。
11.如权利要求1所述的基于光通信的虚拟隔音通信方法,其特征在于,所述利用过滤后的第一语音数据进行语音通信之前还包括:
采集第一视频数据;
所述根据所述声源语音数据确定该声源语音数据的声源位置之后,且所述利用过滤后的第一语音数据进行语音通信之前还包括:
根据所述第一视频数据与所述第一语音数据,匹配所述公共区域内的发言对象与声源语音数据;
基于所述第一视频数据,将面部相对的发言对象对应声源语音数据确定为私密语音数据;
在声源位置位于所述公共区域的声源语音数据中,过滤所述私密语音数据。
12.一种基于光通信的虚拟隔音通信装置,其特征在于,包括:
分区模块,用于基于光通信确定由光分隔而成的公共区域及私密区域;
语音采集模块,用于采集第一语音数据;
分离模块,用于自所述第一语音数据分离一个或多个声源的声源语音数据;
定位模块,用于根据所述声源语音数据确定该声源语音数据的声源位置;
过滤模块,用于自所述第一语音数据中过滤声源位置位于所述私密区域的声源语音数据;以及
通信模块,用于利用过滤后的第一语音数据进行语音通信。
13.如权利要求12所述的基于光通信的虚拟隔音通信装置,其特征在于,还包括:
光通信模块,用于接收光源闪烁发送的光源参数,以供所述分区模块基于所述光源参数确定所述光源分隔而成的公共区域及私密区域。
14.如权利要求12中所述的基于光通信的虚拟隔音通信装置,其特征在于,还包括:
声纹识别模块,用于通过声纹特征自所述第一语音数据分离一个或多个人声声源的声源语音数据及环境语音数据,
其中,所述过滤模块还将所述环境语音数据自所述第一语音数据中过滤。
15.如权利要求12所述的基于光通信的虚拟隔音通信装置,其特征在于,还包括:
视频采集模块,用于采集第一视频数据;
视觉处理模块,用于根据所述第一视频数据与所述第一语音数据,匹配所述公共区域内的发言对象与声源语音数据,基于所述第一视频数据,将面部相对的发言对象对应声源语音数据确定为私密语音数据;
其中,所述过滤模块还在声源位置位于所述公共区域的声源语音数据中,过滤所述私密语音数据。
16.一种基于光通信的虚拟隔音通信系统,其特征在于,包括:
如权利要求12至15中任意一项所述的基于光通信的虚拟隔音通信装置;以及
光源,用于进行光通信。
17.如权利要求16所述的基于光通信的虚拟隔音通信系统,其特征在于,所述光源为固定照射光源或移动照射光源。
18.一种电子设备,其特征在于,所述电子设备包括:
处理器;
存储介质,其上存储有计算机程序,所述计算机程序被所述处理器运行时执行如权利要求1至11任一项所述的基于光通信的虚拟隔音通信方法。
19.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至11任一项所述的基于光通信的虚拟隔音通信方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910607790.2A CN110290468B (zh) | 2019-07-04 | 2019-07-04 | 虚拟隔音通信方法、装置、系统、电子设备、存储介质 |
TW108141196A TWI725617B (zh) | 2019-07-04 | 2019-11-13 | 虛擬隔音通訊方法及通訊裝置、通訊系統、電子設備及其儲存介質 |
US16/917,980 US11450333B2 (en) | 2019-07-04 | 2020-07-01 | Sound insulation method and device and system thereof based on LiFi optical communication |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910607790.2A CN110290468B (zh) | 2019-07-04 | 2019-07-04 | 虚拟隔音通信方法、装置、系统、电子设备、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110290468A CN110290468A (zh) | 2019-09-27 |
CN110290468B true CN110290468B (zh) | 2020-09-22 |
Family
ID=68020893
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910607790.2A Active CN110290468B (zh) | 2019-07-04 | 2019-07-04 | 虚拟隔音通信方法、装置、系统、电子设备、存储介质 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11450333B2 (zh) |
CN (1) | CN110290468B (zh) |
TW (1) | TWI725617B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110290468B (zh) * | 2019-07-04 | 2020-09-22 | 英华达(上海)科技有限公司 | 虚拟隔音通信方法、装置、系统、电子设备、存储介质 |
CN112151062B (zh) * | 2020-09-27 | 2021-12-24 | 梅州国威电子有限公司 | 一种隔音通讯方法 |
CN114512141B (zh) * | 2022-02-09 | 2024-09-13 | 腾讯科技(深圳)有限公司 | 音频分离的方法、装置、设备、存储介质和程序产品 |
US20230410828A1 (en) * | 2022-06-21 | 2023-12-21 | Apple Inc. | Systems and methods for echo mitigation |
US20240036654A1 (en) * | 2022-07-28 | 2024-02-01 | Dell Products L.P. | Information handling system keyboard microphone array for audio capture and quality presentation |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102074236A (zh) * | 2010-11-29 | 2011-05-25 | 清华大学 | 一种分布式麦克风的说话人聚类方法 |
CN102508204A (zh) * | 2011-11-24 | 2012-06-20 | 上海交通大学 | 基于波束形成和传递路径分析的室内噪声源定位方法 |
CN102687536A (zh) * | 2009-10-05 | 2012-09-19 | 哈曼国际工业有限公司 | 用于音频信号的空间提取的系统 |
CN108418968A (zh) * | 2018-03-12 | 2018-08-17 | 广东欧珀移动通信有限公司 | 语音通话数据处理方法、装置、存储介质及移动终端 |
CN108962264A (zh) * | 2018-08-29 | 2018-12-07 | 深圳市旭发智能科技有限公司 | 一种无人机及存储介质 |
Family Cites Families (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009133505A1 (en) * | 2008-04-29 | 2009-11-05 | Philips Intellectual Property & Standards Gmbh | Illumination unit responsive to objects |
US8300869B2 (en) * | 2009-04-02 | 2012-10-30 | Mitek Corp., Inc. | Lighting and audio communication system |
KR101621095B1 (ko) * | 2009-09-16 | 2016-05-16 | 삼성전자주식회사 | 디스플레이를 통한 부가 정보 제공 방법 및 장치 |
JP2012028015A (ja) * | 2010-07-20 | 2012-02-09 | Toshiba Corp | 照明制御システムおよび照明制御方法 |
GB2496379A (en) * | 2011-11-04 | 2013-05-15 | Univ Edinburgh | A freespace optical communication system which exploits the rolling shutter mechanism of a CMOS camera |
US8547036B2 (en) * | 2011-11-20 | 2013-10-01 | Available For Licensing | Solid state light system with broadband optical communication capability |
US11049344B2 (en) * | 2012-07-26 | 2021-06-29 | John C. S. Koo | Dual-mode commercial messaging systems |
US10395290B1 (en) * | 2015-11-10 | 2019-08-27 | John C. S. Koo | Location-based remote customer service |
US9763097B2 (en) * | 2013-03-13 | 2017-09-12 | Lookout, Inc. | Method for performing device security corrective actions based on loss of proximity to another device |
GB201321262D0 (en) * | 2013-12-02 | 2014-01-15 | Univ Edinburgh | Receiver for communications stytems |
CN104036787B (zh) * | 2014-03-05 | 2017-12-01 | 佛山科学技术学院 | 一种语音监听方法和设备,以及激光反射声源定位方法 |
US9226114B2 (en) * | 2014-03-14 | 2015-12-29 | Hong Kong Applied Science And Technology Research Institute Co., Ltd. | Method and system of incorporating passive-based proximity data for position determination |
CN103945062B (zh) * | 2014-04-16 | 2017-01-18 | 华为技术有限公司 | 一种用户终端的音量调节方法、装置及终端 |
FR3034270A1 (fr) * | 2015-03-27 | 2016-09-30 | Orange | Dispositif d'eclairage et de communication optique combine |
KR101865448B1 (ko) * | 2015-05-14 | 2018-06-07 | 염석환 | 스마트 단말기의 후레쉬를 이용한 인증시스템 및 방법 |
WO2017004241A1 (en) * | 2015-07-02 | 2017-01-05 | Krush Technologies, Llc | Facial gesture recognition and video analysis tool |
EP4124178A1 (en) * | 2015-08-05 | 2023-01-25 | Lutron Technology Company LLC | Commissioning and controlling load control devices |
FR3043517A1 (fr) * | 2015-11-09 | 2017-05-12 | Orange | Procede et dispositif de gestion d'une prise de parole depuis un terminal mobile. |
FI126916B (en) * | 2016-03-24 | 2017-08-15 | Guardianx Tech Oy | Procedure and apparatus for controlling emergency communication |
EP3465948A4 (en) * | 2016-06-02 | 2019-11-27 | Eaton Intelligent Power Limited | MONITORING ASSETS USING VISIBLE LIGHT COMMUNICATION |
FR3053648B1 (fr) * | 2016-07-06 | 2018-07-20 | Peugeot Citroen Automobiles Sa | Procede de conduite autonome pour vehicule |
CN106231047A (zh) * | 2016-08-05 | 2016-12-14 | 惠州Tcl移动通信有限公司 | 一种基于智能终端的音频采集方法、系统及智能终端 |
WO2018050974A1 (fr) * | 2016-09-13 | 2018-03-22 | Lucibel | Luminaire connectable à un réseau de télécommunication. |
US10187146B2 (en) * | 2016-09-19 | 2019-01-22 | DISH Technologies L.L.C. | Light converting device |
US9924286B1 (en) * | 2016-10-20 | 2018-03-20 | Sony Corporation | Networked speaker system with LED-based wireless communication and personal identifier |
US10153837B2 (en) * | 2016-10-28 | 2018-12-11 | Wipro Limited | Controller and associated method for selecting visible light communication personal area network coordinator (VPANC) |
FR3059500A1 (fr) * | 2016-11-29 | 2018-06-01 | Orange | Dispositif d'eclairage et de communication optique combines a visualisation du champ de communication |
WO2018102922A1 (en) * | 2016-12-06 | 2018-06-14 | Lensvector Inc. | Liquid crystal beam control |
KR20180085931A (ko) * | 2017-01-20 | 2018-07-30 | 삼성전자주식회사 | 음성 입력 처리 방법 및 이를 지원하는 전자 장치 |
US10535360B1 (en) * | 2017-05-25 | 2020-01-14 | Tp Lab, Inc. | Phone stand using a plurality of directional speakers |
WO2019016024A1 (en) * | 2017-07-19 | 2019-01-24 | Philips Lighting Holding B.V. | DATA COMMUNICATION LIGHTING SYSTEM |
FR3069401B1 (fr) * | 2017-07-21 | 2019-08-30 | Commissariat A L'energie Atomique Et Aux Energies Alternatives | Methode d'ordonnancement pour voies montante et descendante d'un systeme de transmission optique |
KR102371212B1 (ko) * | 2017-09-29 | 2022-03-07 | 삼성전자주식회사 | 전자 장치 및 그의 지오펜스 관리 방법 |
US10354655B1 (en) * | 2018-01-10 | 2019-07-16 | Abl Ip Holding Llc | Occupancy counting by sound |
KR102513297B1 (ko) * | 2018-02-09 | 2023-03-24 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 기능 실행 방법 |
CN111869135B (zh) * | 2018-03-19 | 2024-04-30 | 昕诺飞控股有限公司 | 用于具有多个协调器的无线网络的干扰处理 |
US11477516B2 (en) * | 2018-04-13 | 2022-10-18 | Koji Yoden | Services over wireless communication with high flexibility and efficiency |
US10193627B1 (en) * | 2018-05-31 | 2019-01-29 | Ford Global Technologies, Llc | Detection of visible light communication sources over a high dynamic range |
US20200145824A1 (en) * | 2018-11-05 | 2020-05-07 | Comcast Cable Communications, Llc | Localized Multi-Factor Network Authentication |
US10429051B1 (en) * | 2018-12-02 | 2019-10-01 | Bao Tran | Lifi communication system |
US12021864B2 (en) * | 2019-01-08 | 2024-06-25 | Fidelity Information Services, Llc. | Systems and methods for contactless authentication using voice recognition |
US11884202B2 (en) * | 2019-01-18 | 2024-01-30 | Kyocera Sld Laser, Inc. | Laser-based fiber-coupled white light system |
US11017675B2 (en) * | 2019-01-29 | 2021-05-25 | Here Global B.V. | Method and apparatus for providing mobility insight data for points of interest |
US11395390B2 (en) * | 2019-02-21 | 2022-07-19 | Dialight Corporation | LED lighting assembly with integrated power conversion and digital transceiver |
US11128376B1 (en) * | 2019-02-22 | 2021-09-21 | Securus Technologies, Llc | Data communication with light in controlled environment facilities |
US10681522B1 (en) * | 2019-04-01 | 2020-06-09 | Sony Corporation | Emergency alert setting control based on location change |
CN110290468B (zh) * | 2019-07-04 | 2020-09-22 | 英华达(上海)科技有限公司 | 虚拟隔音通信方法、装置、系统、电子设备、存储介质 |
US11367252B2 (en) * | 2020-10-01 | 2022-06-21 | Here Global B.V. | System and method for generating line-of-sight information using imagery |
-
2019
- 2019-07-04 CN CN201910607790.2A patent/CN110290468B/zh active Active
- 2019-11-13 TW TW108141196A patent/TWI725617B/zh active
-
2020
- 2020-07-01 US US16/917,980 patent/US11450333B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102687536A (zh) * | 2009-10-05 | 2012-09-19 | 哈曼国际工业有限公司 | 用于音频信号的空间提取的系统 |
CN102074236A (zh) * | 2010-11-29 | 2011-05-25 | 清华大学 | 一种分布式麦克风的说话人聚类方法 |
CN102508204A (zh) * | 2011-11-24 | 2012-06-20 | 上海交通大学 | 基于波束形成和传递路径分析的室内噪声源定位方法 |
CN108418968A (zh) * | 2018-03-12 | 2018-08-17 | 广东欧珀移动通信有限公司 | 语音通话数据处理方法、装置、存储介质及移动终端 |
CN108962264A (zh) * | 2018-08-29 | 2018-12-07 | 深圳市旭发智能科技有限公司 | 一种无人机及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110290468A (zh) | 2019-09-27 |
TW202103463A (zh) | 2021-01-16 |
TWI725617B (zh) | 2021-04-21 |
US11450333B2 (en) | 2022-09-20 |
US20210005214A1 (en) | 2021-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110290468B (zh) | 虚拟隔音通信方法、装置、系统、电子设备、存储介质 | |
US10554826B2 (en) | Method and apparatus for adjusting volume of user terminal, and terminal | |
EP3474557B1 (en) | Image processing device, operation method of image processing device, and computer-readable recording medium | |
CN110366156B (zh) | 通讯处理方法、装置、设备、存储介质及音频管理系统 | |
US9253303B2 (en) | Signal processing apparatus and storage medium | |
EP2828850B1 (en) | Audio processing method and audio processing apparatus | |
CN114079746A (zh) | 视频会议中的错误音频设置的智能检测和自动纠正 | |
CN106067996B (zh) | 语音再现方法、语音对话装置 | |
CN108429963A (zh) | 一种耳机及降噪方法 | |
US20160065895A1 (en) | Method, apparatus, and system for presenting communication information in video communication | |
CN110198375A (zh) | 录音方法、终端及计算机可读存储介质 | |
CN103685783A (zh) | 信息处理系统和存储介质 | |
KR20120018686A (ko) | 주변 소리 정보를 이용하여 다양한 사용자 인터페이스를 제공하는 단말기 및 그 제어방법 | |
JP6201279B2 (ja) | サーバ、サーバの制御方法および制御プログラム、情報処理システム、情報処理方法、携帯端末、携帯端末の制御方法および制御プログラム | |
CN115482830A (zh) | 语音增强方法及相关设备 | |
CN110176231B (zh) | 音响输出系统、音响输出方法及存储介质 | |
US9558730B2 (en) | Audio signal processing system | |
US10580410B2 (en) | Transcription of communications | |
CN115051991B (zh) | 音频处理方法、装置、存储介质与电子设备 | |
US20220415340A1 (en) | Selective fine-tuning of speech | |
CN117641191A (zh) | 声音处理方法、拾音系统及电子设备 | |
CN104301487A (zh) | 一种带特征识别的智能会议电话机 | |
JP2015219316A (ja) | 装置、方法およびプログラム | |
CN118588067A (zh) | 车载语音翻译系统、方法和车辆 | |
CN118394296A (zh) | 声道模式切换方法、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |