CN115766950A - 语音会议创建方法、语音会议方法、装置、设备及介质 - Google Patents
语音会议创建方法、语音会议方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN115766950A CN115766950A CN202211415054.5A CN202211415054A CN115766950A CN 115766950 A CN115766950 A CN 115766950A CN 202211415054 A CN202211415054 A CN 202211415054A CN 115766950 A CN115766950 A CN 115766950A
- Authority
- CN
- China
- Prior art keywords
- virtual
- voice
- conference
- virtual space
- participants
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本公开涉及一种语音会议创建方法、语音会议方法、装置、设备及介质,本公开通过在接收到语音会议的创建请求后,基于创建请求中的参会人数配置用于模拟会议室音频环境的虚拟空间,然后为参会用户分配虚拟空间中的虚拟位置,并将每个参会用户的虚拟位置的坐标信息发送给AR耳机,以使AR耳机基于坐标信息来确定后续会议过程中发言语音的虚拟声源位置,从而让AR耳机可以模拟由该虚拟声源位置将发言语音播放给佩戴AR耳机的参会用户,由此实现在语音会议中模拟现实世界会议室的音频环境来进行会议,增加参会用户的临场感,提高参会用户进行语音会议的体验。
Description
技术领域
本公开涉及通信技术领域,具体涉及一种语音会议创建方法、语音会议方法、装置、设备及介质。
背景技术
现实生活和工作中,听觉的感受对我们来说也十分重要,声音是我们日常交流、传递信息和互相通信必不可少的一部分。语音通话是其中一个很重要的体现,常见的有手机通话、网络的语音聊天等。
人类的听觉系统对声音的感知不仅包括响度、音调和音色等主观属性,还包含声音的空间属性等。例如在语音会议中,参会的各个用户使用语音通话进行交流时,用户们可以清晰的感觉到对面通话的人在遥远的另一端,声音是从扬声器里发出来的,这样的通话体验令语音通话各方都有种距离感,无法给参会的各个用户带来更好的临场感。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种语音会议创建方法、语音会议方法、装置、设备及介质。
第一方面,本公开提供了一种语音会议创建方法,包括:
接收语音会议的创建请求,所述创建请求包括参会人数的信息;
基于所述参会人数配置所述语音会议的虚拟空间,所述虚拟空间用于模拟会议室的音频环境,且包括不少于所述参会人数的虚拟位置;
为参会用户分配所述虚拟空间中的虚拟位置,每个虚拟位置具有对应的坐标信息;
将每个参会用户分配得到的虚拟位置的坐标信息,发送给AR耳机,以使所述AR耳机基于所述坐标信息确定发言语音的虚拟声源位置。
可选的,所述为参会用户分配所述虚拟空间中的虚拟位置,包括:
获取参会用户的职位信息;
基于所述职位信息为参会用户分配所述虚拟空间中的虚拟位置。
可选的,所述基于所述参会人数配置所述语音会议的虚拟空间之前,还包括:
收集多个会议室的视频图像,每个会议室中的可用位置数量不相同;
基于所述视频图像对所述多个会议室进行三维重建,得到多个会议室环境模型,每个会议室环境模型中具有与对应会议室的可用位置数量相等的虚拟位置;
将每个会议室环境模型作为一个备选虚拟空间,得到虚拟空间库;
所述基于所述参会人数配置所述语音会议的虚拟空间,包括:
从所述虚拟空间库中,选取虚拟位置的数量与所述参会人数相匹配的会议室环境模型,作为所述语音会议的虚拟空间。
第二方面,本公开提供了一种语音会议方法,适用于AR耳机,包括:
进入语音会议后,接收服务器发送的每个参会用户的坐标信息,所述坐标信息是所述服务器为每个参会用户分配得到的虚拟位置的坐标信息,所述虚拟位置处于所述语音会议的虚拟空间中;
接收第一参会用户的发言语音;
基于所述第一参会用户的第一坐标信息以及自身的第二坐标信息,确定所述发言语音对应的虚拟声源位置;
模拟由所述虚拟声源位置播放所述发言语音。
可选的,所述模拟由所述虚拟声源位置播放所述发言语音之前,包括:
对所述发言语音进行串声消除处理,得到串声消除后的发言语音;
所述模拟由所述虚拟声源位置播放所述发言语音,包括:
模拟由所述虚拟声源位置播放所述串声消除后的发言语音。
可选的,所述模拟由所述虚拟声源位置播放所述发言语音之前,包括:
确定所述发言语音的声音强度;
若所述声音强度低于预设阈值,则对所述发言语音进行增强处理,得到增强后的发言语音;
所述模拟由所述虚拟声源位置播放所述发言语音,包括:
模拟由所述虚拟声源位置播放所述增强后的发言语音。
可选的,所述模拟由所述虚拟声源位置播放所述发言语音之前,包括:
扫描获取自身佩戴者的头部参数;
基于所述头部参数从标准化的HRTF数据集中匹配得到目标HRTF;
所述模拟由所述虚拟声源位置播放所述发言语音,包括:
基于所述目标HRTF和所述虚拟声源位置处理所述发言语音对应的音频信号,得到双耳音频信号;
播放所述双耳音频信号对应的音频。
第三方面,本公开提供了一种语音会议创建装置,包括:
接收模块,用于接收语音会议的创建请求,所述创建请求包括参会人数的信息;
配置模块,用于基于所述参会人数配置所述语音会议的虚拟空间,所述虚拟空间用于模拟会议室的音频环境,且包括不少于所述参会人数的虚拟位置;
分配模块,用于为参会用户分配所述虚拟空间中的虚拟位置,每个虚拟位置具有对应的坐标信息;
发送模块,用于将每个参会用户分配得到的虚拟位置的坐标信息,发送给AR耳机,以使所述AR耳机基于所述坐标信息确定发言语音的虚拟声源位置。
可选的,所述分配模块在为参会用户分配所述虚拟空间中的虚拟位置时,具体用于获取参会用户的职位信息;基于所述职位信息为参会用户分配所述虚拟空间中的虚拟位置。
可选的,所述配置模块在基于所述参会人数配置所述语音会议的虚拟空间之前,还用于收集多个会议室的视频图像,每个会议室中的可用位置数量不相同;基于所述视频图像对所述多个会议室进行三维重建,得到多个会议室环境模型,每个会议室环境模型中具有与对应会议室的可用位置数量相等的虚拟位置;将每个会议室环境模型作为一个备选虚拟空间,得到虚拟空间库;
所述配置模块在基于所述参会人数配置所述语音会议的虚拟空间时,具体用于从所述虚拟空间库中,选取虚拟位置的数量与所述参会人数相匹配的会议室环境模型,作为所述语音会议的虚拟空间。
第四方面,本公开提供了一种电子设备,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如第一方面所述的方法。
第五方面,本公开提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的方法。
本公开提供的技术方案与现有技术相比具有如下优点:
本公开通过在接收到语音会议的创建请求后,基于创建请求中的参会人数配置用于模拟会议室音频环境的虚拟空间,然后为参会用户分配虚拟空间中的虚拟位置,并将每个参会用户的虚拟位置的坐标信息发送给AR耳机,以使AR耳机基于坐标信息来确定后续会议过程中发言语音的虚拟声源位置,从而让AR耳机可以模拟由该虚拟声源位置将发言语音播放给佩戴AR耳机的参会用户,由此实现在语音会议中模拟现实世界会议室的音频环境来进行会议,增加参会用户的临场感,提高参会用户进行语音会议的体验。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的语音会议创建方法流程图;
图2为本公开实施例提供的语音会议方法流程图;
图3为本公开实施例提供的语音会议创建装置的结构示意图;
图4为本公开实施例提供的电子设备的结构示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
AR技术是一种将真实世界信息和虚拟世界信息结合进行展示的技术,AR耳机通过对声音进行虚拟定位,使听者可以感知到空间中特定位置的虚拟声像,增强临场感。
图1为本公开实施例提供的语音会议创建方法流程图。该语音会议创建方法可以由语音会议创建装置执行,语音会议创建装置可以采用软件和/或硬件的方式实现,该语音会议创建装置可配置于服务器中。该语音会议创建方法包括如下步骤:
S101、接收语音会议的创建请求,创建请求包括参会人数的信息。
示例性的,用户可以直接通过AR耳机向服务器发送AR语音会议的创建请求,服务器在接收到创建请求后对其进行解析,创建请求包含参会人数的信息,之后服务器执行步骤来创建可以容纳该参会人数的语音会议。
S102、基于参会人数配置语音会议的虚拟空间,虚拟空间用于模拟会议室的音频环境,且包括不少于参会人数的虚拟位置。
服务器通过配置可以容纳创建请求中参会人数的虚拟空间,来模拟在现实世界会议室中进行会议的音频环境,虚拟空间可以是参照现实世界中会议室的场景进行三维建模搭建而成的,这样可以虚拟空间模拟的语音会议的音频环境更加逼真。虚拟空间中包含预设数量的虚拟位置,类似于现实世界会议室中的座椅,同时虚拟位置不互相重叠且只能分配给一个参会用户。
S103、为参会用户分配虚拟空间中的虚拟位置,每个虚拟位置具有对应的坐标信息。
参会用户加入语音会议的方式可以是通过输入验证码加入,也可以是由服务器直接将参会邀请发送给参会用户的AR耳机,由参会用户确认后加入会议,在此不作具体的限定。
服务器在配置好语音会议的虚拟空间后,为加入该语音会议的用户分配虚拟空间中的虚拟位置,通常情况下可以按照加入语音会议的先后顺序依次将虚拟位置分配给参会用户,此外在一些特定场景中,可以按照参会用户的职位,为主要发言人分配处于虚拟空间中主位的虚拟位置,例如为主要发言人分配位于虚拟空间中心的虚拟位置,分配的模式还可以由发送创建请求的用户自行选择或设置。其中,每个虚拟位置都具有对应的坐标信息,该坐标信息可以标示虚拟位置在虚拟空间中的方位。
S104、将每个参会用户分配得到的虚拟位置的坐标信息,发送给AR耳机,以使AR耳机基于坐标信息确定发言语音的虚拟声源位置。
服务器在分配完虚拟位置后,将每一个参会用户分配得到的虚拟位置对应的坐标信息,发送给参会用户的AR耳机,以使AR耳机在后续进行会议的过程中,基于发言人和该AR耳机佩戴用户双方的虚拟位置的坐标信息,来确定该发言人的发言语音所对应的虚拟声源位置,从而让AR耳机可以模拟由该虚拟声源位置将发言语音播放给佩戴该AR耳机的参会用户。
本公开实施例通过在接收到语音会议的创建请求后,基于创建请求中的参会人数配置用于模拟会议室音频环境的虚拟空间,然后为参会用户分配虚拟空间中的虚拟位置,并将每个参会用户的虚拟位置的坐标信息发送给AR耳机,以使AR耳机基于坐标信息来确定后续会议过程中发言语音的虚拟声源位置,从而让AR耳机可以模拟由该虚拟声源位置将发言语音播放给佩戴AR耳机的参会用户,由此实现在语音会议中模拟现实世界会议室的音频环境来进行会议,增加参会用户的临场感,提高参会用户进行语音会议的体验。
在上述实施例的基础上,为参会用户分配虚拟空间中的虚拟位置,包括:获取参会用户的职位信息;基于职位信息为参会用户分配虚拟空间中的虚拟位置。
服务器在给参会用户分配虚拟位置时,首先可以获取参会用户在语音会议中标识的职位信息,该职位信息可以是直接套用现实世界中的工作职位生成的,也可以是由语音会议的创建者为参会用户设置的。然后利用职位信息来确定应该为参会用户的分配虚拟空间中的哪个虚拟位置。例如进入语音会议中的某位参会用户的职位信息为主要发言人,则可以为作为主要发言人的参会用户分配处于虚拟空间中心的虚拟位置,其它普通参会者则按照进入会议的顺序,为其分配围绕着虚拟空间中心的其它虚拟位置,从而在进行语音会议时,模拟现实会议中主要发言人进行发言时的音频传播效果。
本公开实施例通过获取参会用户的职位信息,并基于职位信息来为分配虚拟位置,以便在语音会议中模拟现实会议的发言效果。
在上述实施例的基础上,基于参会人数配置语音会议的虚拟空间之前,还包括:收集多个会议室的视频图像,每个会议室中的可用位置数量不相同;基于视频图像对多个会议室进行三维重建,得到多个会议室环境模型,每个会议室环境模型中具有与对应会议室的可用位置数量相等的虚拟位置;将每个会议室环境模型作为一个备选虚拟空间,得到虚拟空间库;基于参会人数配置语音会议的虚拟空间,包括:从虚拟空间库中,选取虚拟位置的数量与参会人数相匹配的会议室环境模型,作为语音会议的虚拟空间。
可以通过在服务器中预先建立包含多个备选虚拟空间的虚拟空间库,让服务器在为语音会议配置虚拟空间时,从虚拟空间库中选取一个虚拟位置数量与参会人数匹配的备选虚拟空间作为语音会议的虚拟空间,提高创建语音会议时配置虚拟空间的速度。
建立虚拟空间库可以通过生成多个作为备选虚拟空间的会议室三维模型来实现,具体的,服务器首先收集多个拍摄了不同会议室环境的视频图像,针对每个视频图像使用预设的算法对视频图像中的会议室环境进行三维重建,得到多个对应的会议室环境模型,例如可以使用ElasticFusion算法,该算法适合重建房间大小的场景。因为不同的会议室中安排的座位数量不同,所以会议室环境模型中的虚拟位置的数量也就不同,由此通过收集会议室环境的视频图像来建立虚拟空间库。
本公开实施例通过收集多个会议室的视频图像,然后利用视频图像对会议室的环境进行三维重建,得到多个不同的会议室环境模型,因为每个会议室的可用位置的数量不同,所以会议室环境模型中的虚拟位置的数量也不同,之后再将每个会议室环境模型作为一个备选虚拟空间来生成虚拟空间库,从而使服务器在为语音会议配置虚拟空间时,可以直接从虚拟空间库中选取一个虚拟位置数量与参会人数匹配的备选虚拟空间作为语音会议的虚拟空间,提高创建语音会议时配置虚拟空间的速度。
在服务器创建完具备虚拟空间的语音会议后,参会用户在语音会议中发言的语音,需要由AR耳机模拟虚拟空间中的音频环境来进行重放,从而让佩戴AR耳机的参会用户能体验到与其他参会人员同处一个会议室的临场感。图2为本公开实施例提供的语音会议方法流程图。该语音会议方法可由AR耳机来执行,该语音会议方法包括如下步骤:
S201、进入语音会议后,接收服务器发送的每个参会用户的坐标信息,坐标信息是服务器为每个参会用户分配得到的虚拟位置的坐标信息,虚拟位置处于语音会议的虚拟空间中。
参会用户可以直接利用AR耳机进入语音会议,在进入语音会议后,AR耳机会接收到服务器发送的每个参会用户的坐标信息,在上述实施例中我们已经介绍过,这些坐标信息代表着每个参会用户分配得到的虚拟位置在虚拟空间中的方位。
S202、接收第一参会用户的发言语音。
在语音会议进行过程中,参会用户可能会进行多次发言,AR耳机接收服务器转发的第一参会用户的发言语音,第一参会用户表示当前作为发言人的参会用户。
S203、基于第一参会用户的第一坐标信息以及自身的第二坐标信息,确定发言语音对应的虚拟声源位置。
第一坐标信息表示第一参会用户分配得到的虚拟位置的坐标信息,第二坐标信息表示佩戴该AR耳机的参会用户,分配得到的虚拟位置的坐标信息。
在S201中AR耳机已经接收到了每个参会用户的虚拟位置的坐标信息,AR耳机模拟在虚拟空间的音频环境中将发言语音重放给佩戴自身的参会用户时,首先会基于第一坐标信息和第二坐标信息来确定在虚拟空间中,第一参会用户相对于佩戴自身的参会用户的方位,例如第一坐标信息为(04,05),第二坐标信息为(04,03),单位为米,代表第一参会用户位于自身正前方,且双方之间距离为2m,从而AR耳机可以确定发言语音对应的虚拟声源位置为自身正前方的2m处。
S204、模拟由虚拟声源位置播放发言语音。
AR耳机模拟出由虚拟声源位置发出该发言语言,传播至AR耳机佩戴者的左右双耳中的音频传播过程,来播放发言语音给佩戴自身的参会用户。例如,AR耳机模拟出第一参会用户在自身前方2m处,说出发言语音,传播至佩戴自身的参会用户的耳中来播放发言语音。
本公开实施例通过接收服务器发送的每个参会用户的坐标信息,以便在第一参会用户发言时,基于第一参会用户的坐标信息和自设的第二坐标信息,确定第一参会用户发出发言语音的虚拟音源位置,从而模拟由虚拟音源位置播放发言语音传播给佩戴AR耳机的参会用户,使得在语音会议中,增强参会用户与其他参会人员同处一个会议室的临场感,提高用户体验。
在一些实施例中,模拟由虚拟声源位置播放发言语音之前,包括:对发言语音进行串声消除处理,得到串声消除后的发言语音;模拟由虚拟声源位置播放发言语音,包括:模拟由虚拟声源位置播放串声消除后的发言语音。
在耳机的应用场景中,串声(Crosstalk)指的是当播放某一单声道音源时,会耦合到另一声道的通路上的现象。串声问题极大地干扰听者对空间三维声像的感知,需要增加相应的串声消除(Crosstalk cancellation)系统对音频信号进行预处理,从而让AR耳机在对发言语音进行重放时模拟出声音在虚拟空间的音频环境中传播的空间感。AR耳机通过对发言语音进行串声消除处理,然后播放串声消除后的发言语音,让参会用户在听到AR耳机播放的发言语音时可以更加清晰感受发言语音由虚拟声源位置传播而来。
本公开实施例通过对发言语音进行串声消除处理,然后播放串声消除后的发言语音,从而让参会用户在听到AR耳机播放的发言语音时可以更加清晰感受发言语音由虚拟声源位置传播而来,进而增强语音会议的临场感。
在一些实施例中,模拟由虚拟声源位置播放发言语音之前,包括:确定发言语音的声音强度;若声音强度低于预设阈值,则对发言语音进行增强处理,得到增强后的发言语音;模拟由虚拟声源位置播放发言语音,包括:模拟由虚拟声源位置播放增强后的发言语音。
由于在语音会议的过程中,可能出现第一参会用户发言时声音强度不满足正常交流的音量的问题,因此AR耳机在确定发言语音的声音强度低于预设阈值时,对发言语音进行增强处理,将发言语音的声音强度调节至预设阈值后再播放发言语音,以此保证语音会议中的参会用户正常交流。
本公开实施例通过在确定发言语音的声音强度低于预设阈值时,增强发言语音的声音强度再进行播放,以保证语音会议中的参会用户正常交流。
在一些实施例中,模拟由虚拟声源位置播放发言语音之前,包括:扫描获取自身佩戴者的头部参数;基于头部参数从标准化的HRTF数据集中匹配得到目标HRTF;模拟由虚拟声源位置播放发言语音,包括:基于目标HRTF和虚拟声源位置处理发言语音对应的音频信号,得到双耳音频信号;播放双耳音频信号对应的音频。
HRTF(Head—Related Transfer Function,头相关传输函数)描述了声波从声源到双耳的传输过程。它是人的生理结构(如头、耳廓以及躯干等)对声波进行综合滤波的结果。HRTF包含了有关声源定位的信息,在实际应用中,利用耳机或扬声器重发用HRTF处理过的信号,可以虚拟出各种不同的空间听觉效果。
由于不同人的头部、耳廓、躯干等的尺寸和形状不同,因而严格来说每个人的HRTF是不同的,也就是说HRTF是一个具有个性化特征的物理量。在实际应用过程中,对每一个参会用户进行声学测量以得到其个性化的HRTF所要付出的工作量是十分巨大的,因此通过AR耳机上的摄像机扫描佩戴者的头部,得到头部参数,再从标准化的HRTF数据集中匹配与头部参数近似的目标HRTF,然后利用目标HRTF,以及所要模拟的虚拟空间中的虚拟声源位置,来处理发言语音对应的音频信号,得到可以体现出发言语音从虚拟声源位置传播至AR耳机佩戴者双耳的鼓膜的双耳音频信号,该双耳声信号中包含着声音传播过程的空间声场信息。最后AR耳机将双耳音频信号转换为对应的音频播放给佩戴自身的参会用户,让参会用户可以感受到发言语音在虚拟空间中传播时的三维声像,从而为参会用户提供与发言的第一参会用户同处一个会议室的临场感受。
本公开实施例通过扫描获得佩戴AR耳机的参会用户的头部参数,利用头部参数从标准化的HRTF数据集中匹配得到目标HRTF,然后使用目标HRTF基于虚拟声源位置处理发言语音对应的音频信号,得到对应的双耳音频信号,最后播放双耳音频信号对应的音频,以使佩戴AR耳机的参会用户感受到发言语音在虚拟空间中传播时的三维声像,实现提高用户体验的效果。
图3为本公开实施例提供的语音会议创建装置的结构示意图。该语音会议创建装置可以是如上实施例的服务器中的部件或组件。本公开实施例提供的语音会议创建装置可以执行语音会议创建方法实施例提供的处理流程,如图3所示,该语音会议创建装置300包括:接收模块301,用于接收语音会议的创建请求,创建请求包括参会人数的信息;配置模块302,用于基于参会人数配置语音会议的虚拟空间,虚拟空间用于模拟会议室的音频环境,且包括不少于参会人数的虚拟位置;分配模块303,用于为参会用户分配虚拟空间中的虚拟位置,每个虚拟位置具有对应的坐标信息;发送模块304,用于将每个参会用户分配得到的虚拟位置的坐标信息,发送给AR耳机,以使AR耳机基于坐标信息确定发言语音的虚拟声源位置。
在一些实施例中,分配模块303在为参会用户分配虚拟空间中的虚拟位置时,具体用于获取参会用户的职位信息;基于职位信息为参会用户分配虚拟空间中的虚拟位置。
在一些实施例中,配置模块302在基于参会人数配置语音会议的虚拟空间之前,还用于收集多个会议室的视频图像,每个会议室中的可用位置数量不相同;基于视频图像对多个会议室进行三维重建,得到多个会议室环境模型,每个会议室环境模型中具有与对应会议室的可用位置数量相等的虚拟位置;将每个会议室环境模型作为一个备选虚拟空间,得到虚拟空间库;配置模块302在基于参会人数配置语音会议的虚拟空间时,具体用于从虚拟空间库中,选取虚拟位置的数量与参会人数相匹配的会议室环境模型,作为语音会议的虚拟空间。
图3所示实施例的语音会议创建装置可用于执行上述语音会议创建方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图4为本公开实施例提供的电子设备的结构示意图。该电子设备可以是如上实施例所述的服务器。本公开实施例提供的电子设备可以执行语音会议创建方法实施例提供的处理流程,如图4所示,电子设备400包括:存储器401、处理器402、计算机程序和通讯接口403;其中,计算机程序存储在存储器401中,并被配置为由处理器402执行如上所述的语音会议创建方法。
另外,本公开实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现上述实施例所述的语音会议创建方法。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种语音会议创建方法,其特征在于,包括:
接收语音会议的创建请求,所述创建请求包括参会人数的信息;
基于所述参会人数配置所述语音会议的虚拟空间,所述虚拟空间用于模拟会议室的音频环境,且包括不少于所述参会人数的虚拟位置;
为参会用户分配所述虚拟空间中的虚拟位置,每个虚拟位置具有对应的坐标信息;
将每个参会用户分配得到的虚拟位置的坐标信息,发送给AR耳机,以使所述AR耳机基于所述坐标信息确定发言语音的虚拟声源位置。
2.如权利要求1所述的方法,其特征在于,所述为参会用户分配所述虚拟空间中的虚拟位置,包括:
获取参会用户的职位信息;
基于所述职位信息为参会用户分配所述虚拟空间中的虚拟位置。
3.如权利要求1所述的方法,其特征在于,所述基于所述参会人数配置所述语音会议的虚拟空间之前,还包括:
收集多个会议室的视频图像,每个会议室中的可用位置数量不相同;
基于所述视频图像对所述多个会议室进行三维重建,得到多个会议室环境模型,每个会议室环境模型中具有与对应会议室的可用位置数量相等的虚拟位置;
将每个会议室环境模型作为一个备选虚拟空间,得到虚拟空间库;
所述基于所述参会人数配置所述语音会议的虚拟空间,包括:
从所述虚拟空间库中,选取虚拟位置的数量与所述参会人数相匹配的会议室环境模型,作为所述语音会议的虚拟空间。
4.一种语音会议方法,适用于AR耳机,其特征在于,包括:
进入语音会议后,接收服务器发送的每个参会用户的坐标信息,所述坐标信息是所述服务器为每个参会用户分配得到的虚拟位置的坐标信息,所述虚拟位置处于所述语音会议的虚拟空间中;
接收第一参会用户的发言语音;
基于所述第一参会用户的第一坐标信息以及自身的第二坐标信息,确定所述发言语音对应的虚拟声源位置;
模拟由所述虚拟声源位置播放所述发言语音。
5.如权利要求4所述的方法,其特征在于,所述模拟由所述虚拟声源位置播放所述发言语音之前,包括:
对所述发言语音进行串声消除处理,得到串声消除后的发言语音;
所述模拟由所述虚拟声源位置播放所述发言语音,包括:
模拟由所述虚拟声源位置播放所述串声消除后的发言语音。
6.如权利要求4所述的方法,其特征在于,所述模拟由所述虚拟声源位置播放所述发言语音之前,包括:
确定所述发言语音的声音强度;
若所述声音强度低于预设阈值,则对所述发言语音进行增强处理,得到增强后的发言语音;
所述模拟由所述虚拟声源位置播放所述发言语音,包括:
模拟由所述虚拟声源位置播放所述增强后的发言语音。
7.如权利要求4所述的方法,其特征在于,所述模拟由所述虚拟声源位置播放所述发言语音之前,包括:
扫描获取自身佩戴者的头部参数;
基于所述头部参数从标准化的HRTF数据集中匹配得到目标HRTF;
所述模拟由所述虚拟声源位置播放所述发言语音,包括:
基于所述目标HRTF和所述虚拟声源位置处理所述发言语音对应的音频信号,得到双耳音频信号;
播放所述双耳音频信号对应的音频。
8.一种语音会议创建装置,其特征在于,包括:
接收模块,用于接收语音会议的创建请求,所述创建请求包括参会人数的信息;
配置模块,用于基于所述参会人数配置所述语音会议的虚拟空间,所述虚拟空间用于模拟会议室的音频环境,且包括不少于所述参会人数的虚拟位置;
分配模块,用于为参会用户分配所述虚拟空间中的虚拟位置,每个虚拟位置具有对应的坐标信息;
发送模块,用于将每个参会用户分配得到的虚拟位置的坐标信息,发送给AR耳机,以使所述AR耳机基于所述坐标信息确定发言语音的虚拟声源位置。
9.一种电子设备,其特征在于,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如权利要求1-3中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-3中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211415054.5A CN115766950A (zh) | 2022-11-11 | 2022-11-11 | 语音会议创建方法、语音会议方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211415054.5A CN115766950A (zh) | 2022-11-11 | 2022-11-11 | 语音会议创建方法、语音会议方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115766950A true CN115766950A (zh) | 2023-03-07 |
Family
ID=85369900
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211415054.5A Pending CN115766950A (zh) | 2022-11-11 | 2022-11-11 | 语音会议创建方法、语音会议方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115766950A (zh) |
-
2022
- 2022-11-11 CN CN202211415054.5A patent/CN115766950A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10911882B2 (en) | Methods and systems for generating spatialized audio | |
US10979842B2 (en) | Methods and systems for providing a composite audio stream for an extended reality world | |
EP3039677B1 (en) | Multidimensional virtual learning system and method | |
US20130093837A1 (en) | Method and apparatus for processing audio in video communication | |
US11109177B2 (en) | Methods and systems for simulating acoustics of an extended reality world | |
JP7479352B2 (ja) | オーディオ装置及びオーディオ処理の方法 | |
JP2009043274A (ja) | 対話型立体的オーディオビジュアル・システム | |
US11656839B2 (en) | Audio apparatus, audio distribution system and method of operation therefor | |
Hyder et al. | Placing the participants of a spatial audio conference call | |
EP3313099A1 (en) | Apparatus and method for processing 3d audio signal based on hrtf, and highly realistic multimedia playing system using the same | |
WO2012104297A1 (en) | Generation of user-adapted signal processing parameters | |
CN115766950A (zh) | 语音会议创建方法、语音会议方法、装置、设备及介质 | |
Kang et al. | Realistic audio teleconferencing using binaural and auralization techniques | |
KR101111734B1 (ko) | 복수 개의 음원을 구분하여 음향을 출력하는 방법 및 장치 | |
US20240015466A1 (en) | System and method for generating spatial audio with uniform reverberation in real-time communication | |
KR102036010B1 (ko) | 바이노럴 사운드를 이용한 감성 통화 방법 및 이를 위한 장치 | |
RU2815366C2 (ru) | Аудиоустройство и способ обработки аудио | |
CN117409804A (zh) | 音频信息的处理方法、介质、服务器、客户端及系统 | |
US11218832B2 (en) | System for modelling acoustic transfer functions and reproducing three-dimensional sound | |
O’Dwyer | Sound Source Localization and Virtual Testing of Binaural Audio | |
Rimell | Immersive spatial audio for telepresence applications: system design and implementation | |
CN114745656A (zh) | 多人交流的空间音效的构建方法、系统及计算机可读存储介质 | |
CN115550600A (zh) | 识别音频数据声音来源的方法、存储介质和电子设备 | |
CN114745655A (zh) | 交互式空间音效的构建方法、系统及计算机可读存储介质 | |
Huopaniemi et al. | Virtual acoustics—Applications and technology trends |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |