CN114553845A - 社交互动的定向交流方法、介质、服务端及交流系统 - Google Patents
社交互动的定向交流方法、介质、服务端及交流系统 Download PDFInfo
- Publication number
- CN114553845A CN114553845A CN202011353876.6A CN202011353876A CN114553845A CN 114553845 A CN114553845 A CN 114553845A CN 202011353876 A CN202011353876 A CN 202011353876A CN 114553845 A CN114553845 A CN 114553845A
- Authority
- CN
- China
- Prior art keywords
- directional communication
- mode
- fusion
- social interaction
- voice data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004891 communication Methods 0.000 title claims abstract description 164
- 230000003997 social interaction Effects 0.000 title claims abstract description 73
- 238000000034 method Methods 0.000 title claims abstract description 60
- 230000004927 fusion Effects 0.000 claims abstract description 54
- 239000003999 initiator Substances 0.000 claims abstract description 27
- 238000012545 processing Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 12
- 230000000977 initiatory effect Effects 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000002452 interceptive effect Effects 0.000 claims 2
- 230000005540 biological transmission Effects 0.000 description 24
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/40—Support for services or applications
- H04L65/403—Arrangements for multi-party communication, e.g. for conferences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/1066—Session management
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/1066—Session management
- H04L65/1069—Session establishment or de-establishment
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提供一种社交互动的定向交流方法、介质、服务端及交流系统,社交互动的定向交流方法包括以下步骤:在已经获取至少三个声音数据的情况下,获取模式指令;基于模式指令确定声音数据的融合方式,以根据确定的融合方式进行融合后生成待传输声音数据;融合方式由确定的接收对象决定;将待传输声音数据按照融合方式中对应的接收对象进行传输,以实现模式指令的发起方与接收对象之间的定向交流。本发明可以在社交互动时提供多种交流形式,进而提高社交互动的沟通质量。
Description
技术领域
本发明属于声音处理的技术领域,涉及一种语音定向交流方法,特别是涉及一种社交互动的定向交流方法、介质、服务端及交流系统。
背景技术
随着电子产品功能的不断丰富,用户之间沟通的形式也多种多样,在社交互动时,不仅可以通过文字进行沟通,还可以通过语音或视频进行沟通。尤其在工作中,与传统的电话会议相比,现在的互联网会议则具备更多的交互形式。
然而,在现在大规模的互联网会议中,大部分时候只能一个人说话,其他人想要针对某一想法与他人进行简单交流时总是需要打断当前会议,导致会议效率低下,而且,在多种语言参与且带有翻译的会议中表现的尤为明显。
因此,如何提供一种社交互动的定向交流方法、介质、服务端及交流系统,以解决现有技术无法在社交互动时提供多种交流形式,进而提高社交互动的沟通质量等缺陷,成为本领域技术人员亟待解决的技术问题。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种社交互动的定向交流方法、介质、服务端及交流系统,其优势在于,可以在社交互动时提供多种交流形式,进而提高社交互动的沟通质量。
本发明的另一目的在于提供一种社交互动的定向交流方法、介质、服务端及交流系统,其优势在于,向用户提供全员播放模式和定向沟通模式,以使用户可以根据沟通需要进行灵活选择,使得整个社交互动可以进行多线交流。
本发明的另一目的在于提供一种社交互动的定向交流方法、介质、服务端及交流系统,其优势在于,提供了一种多线交流的互联网会议实现方式,提高了互联网会议的效率。
本发明的另一目的在于提供一种社交互动的定向交流方法、介质、服务端及交流系统,其优势在于,在定向沟通模式下,可以根据确定的目标用户与非目标用户分别传输不同的声音数据。
本发明的另一目的在于提供一种社交互动的定向交流方法、介质、服务端及交流系统,其优势在于,通过混音进行声音融合,实现了声音数据的重定向。
本发明的另一目的在于提供一种社交互动的定向交流方法、介质、服务端及交流系统,其优势在于,可以使用户在远程会议中,保证不切断会议且不打断整个会议进程的情况下实现与他人的单独沟通。
为实现上述目的及其他相关目的,本发明一方面提供一种社交互动的定向交流方法,所述社交互动的定向交流方法包括以下步骤:在已经获取至少三个声音数据的情况下,获取模式指令;基于所述模式指令确定所述声音数据的融合方式,以根据确定的融合方式进行融合后生成待传输声音数据;所述融合方式由确定的接收对象决定;将所述待传输声音数据按照所述融合方式中对应的接收对象进行传输,以实现所述模式指令的发起方与所述接收对象之间的定向交流。
为实现上述目的及其他相关目的,本发明另一方面提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的社交互动的定向交流方法。
为实现上述目的及其他相关目的,本发明另一方面提供一种服务端,包括:处理器及存储器;所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述服务端执行所述的社交互动的定向交流方法。
为实现上述目的及其他相关目的,本发明另一方面提供一种社交互动的定向交流系统,所述社交互动的定向交流系统包括:所述的服务端、发起方和接收方;所述发起方用于发送模式指令;所述服务端用于在已经获取至少三个声音数据的情况下,获取模式指令;基于所述模式指令确定所述声音数据的融合方式,以根据确定的融合方式进行融合后生成待传输声音数据;所述融合方式由确定的接收对象决定;将所述待传输声音数据按照所述融合方式中对应的接收对象进行传输,以实现所述模式指令的发起方与所述接收对象之间的定向交流;所述接收方用于接收所述待传输声音数据。
附图说明
图1显示为本发明的社交互动的定向交流方法于一实施例中的原理流程图。
图2显示为本发明的社交互动的定向交流方法于一实施例中的模式指令示意图。
图3显示为本发明的社交互动的定向交流方法于一实施例中的全员播放流程图。
图4显示为本发明的社交互动的定向交流方法于一实施例中的定向沟通流程图。
图5显示为本发明的服务端于一实施例中的结构连接示意图。
图6显示为本发明的社交互动的定向交流系统于一实施例中的结构原理图。
图7显示为本发明的社交互动的定向交流系统于一实施例中的传输示意图。
图8显示为本发明的社交互动的定向交流系统于一实施例中的功能结构示意图。
元件标号说明
1 服务端
11 服务端通信模块
111 服务端声音传输单元
112 服务端控制传输单元
12 声音融合模块
121 全员声音融合单元
122 定向混音单元
2 发起方
21 客户端控制模块
211 全员播放单元
212 定向沟通单元
22 客户端通信模块
221 客户端声音传输单元
222 客户端控制传输单元
23 音频模块
231 声音采集单元
232 声音播放单元
3 接收方
S11~S13 步骤
S121A~S121B 步骤
S122A~S122C 步骤
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
本发明所述的社交互动的定向交流方法、介质、服务端及交流系统可以在社交互动时提供多种交流形式,进而提高社交互动的沟通质量。
以下将结合图1至图8详细阐述本实施例的一种社交互动的定向交流方法、介质、服务端及交流系统的原理及实施方式,使本领域技术人员不需要创造性劳动即可理解本实施例的社交互动的定向交流方法、介质、服务端及交流系统。
请参阅图1,显示为本发明的社交互动的定向交流方法于一实施例中的原理流程图。如图1所示,所述社交互动的定向交流方法具体包括以下几个步骤:
S11,在已经获取至少三个声音数据的情况下,获取模式指令。
于一实施例中,所述模式指令至少包括:全员播放模式指令和定向沟通模式指令中的一种。
具体地,存在用户a、用户b、用户c和用户d四个人进行语音的社交互动。用户a选定定向沟通模式,且需要与用户c进行单独沟通,用户b、用户c和用户d均选定全员播放模式。
S12,基于所述模式指令确定所述声音数据的融合方式,以根据确定的融合方式进行融合后生成待传输声音数据;所述融合方式由确定的接收对象决定。
具体地,以用户a选定定向沟通模式为例,所述模式指令为定向沟通模式指令,则根据定向沟通模式指令确定出不同的接收对象。若接收对象为目标用户,则目标用户接收的声音数据为全员声音融合后的数据;若接收对象为非目标用户,则非目标用户接收的声音数据为用户a以外的其他用户声音融合后的数据。
请参阅图2,显示为本发明的社交互动的定向交流方法于一实施例中的模式指令示意图。如图2所示,若是全员播放模式指令,则执行步骤S121,基于所述全员播放模式指令,对所有用户的声音数据进行融合;若是定向沟通模式指令,则执行步骤S122,基于所述定向沟通模式指令,针对特定的所述接收对象,对所有用户的声音数据进行特定形式的融合。
请参阅图3,显示为本发明的社交互动的定向交流方法于一实施例中的全员播放流程图。如图3所示,S121包括以下步骤:
S121A,将所有用户的声音数据进行格式转换,统一生成线性语音格式的音频流。
具体地,于声音数据的处理中,数字化声音的过程实际上就是以一定的频率对来自电子设备中连续的模拟音频信号进行模数转换得到音频数据的过程;数字化声音的播放就是将音频数据进行数模转换变成模拟音频信号输出。线性语音格式的音频流是模拟记录的音频,比如磁带,开盘之类,是以模拟数据的方式记录在介质上,没有经过任何的编码压缩,由此音频在每一个时刻都是连续的而非离散的。
S121B,对所有所述线性语音格式的音频流进行混音处理。由此,对线性语音格式的音频流进行混音处理可以最大程度的避免音频数据的失真以及保证音频数据传输至客户端时的音质效果。
需要说明的是,对线性语音格式的音频流进行混音处理的方式不仅适用于全员播放模式的所有用户声音的融合,还适用于去除定向沟通发起方声音后其他用户声音的定向融合。
请参阅图4,显示为本发明的社交互动的定向交流方法于一实施例中的定向沟通流程图。如图4所示,S122包括以下步骤:
S122A,结合所述定向沟通模式指令,于参与社交的所有用户中确定具有定向交流需求的定向发起用户以及根据所述定向交流需求确定目标用户和非目标用户。其中,目标用户在被确认后,所用的客户端也相应切换为定向沟通模式。
具体地,基于上述实例,定向发起用户为用户a,目标用户为用户c,非目标用户为用户b和用户d。且在用户c确认为目标用户之后,用户c所用的客户端也相应切换为定向沟通模式。
S122B,对所有用户的声音数据进行融合后,形成第一待传输声音数据。
具体地,将用户a、用户b、用户c和用户d的声音融合后形成第一待传输声音数据。
于另一实施例中,第一待传输声音数据的形成过程也可以是先去除所述定向发起用户的声音数据,然后再将定向发起用户的声音数据单独发送至目标用户。且发送的时间并不作限制,可以是去除所述定向发起用户的声音数据与定向发起用户的声音数据两者同时发送,也可以是在不影响沟通效果以及保证跟进社交互动进程的前提下两个数据一前一后进行发送,例如,先发送去除所述定向发起用户的声音数据,再发送定向发起用户的声音数据或者先发送定向发起用户的声音数据,再发送去除所述定向发起用户的声音数据。
S122C,对所有用户的声音数据进行融合后,去除所述定向发起用户的声音数据,形成第二待传输声音数据。
于另一实施例中,将所有非目标用户的声音挑选出来,直接进行融合形成所述第二待传输声音数据。
具体地,将用户b、用户c和用户d的声音融合后形成第二待传输声音数据。需要注意的是,此时将用户c的声音融合进去是指用户c在接收到用户a单独沟通的声音数据之前,公开播放的声音。
S13,将所述待传输声音数据按照所述融合方式中对应的接收对象进行传输,以实现所述模式指令的发起方与所述接收对象之间的定向交流。
于一实施例中,将所述目标用户作为第一接收对象,将所述非目标用户作为第二接收对象;将所述第一待传输声音数据传输至所述第一接收对象,将所述第二待传输声音数据传输至所述第二接收对象。
具体地,将用户c作为第一接收对象,并将第一待传输声音数据发送给用户c;将用户b和用户d作为第二接收对象,并将第二待传输声音数据发送给用户b和用户d。
于一实施例中,将所述目标用户接收的第一待传输声音数据划分为定向沟通声音数据和非定向沟通声音数据,其中,定向沟通声音数据是指用户a与用户c之间进行单独沟通时的来往声音数据。分别对所述定向沟通声音数据和非定向沟通声音数据进行信号能量调整,以使所述目标用户接收到的定向沟通声音数据信号强于非定向沟通声音数据。具体地,用户c在接收到第一待传输声音数据后,所听到的用户a发出的声音,即单独沟通内容的声音较高,其他用户在社交互动中沟通的声音较低。此外,经过信号强度调节,使所述目标用户接收到的定向沟通声音数据信号弱于非定向沟通声音数据,也在本发明保护的范围内。
于一实施例中,所述对所有用户的声音数据进行融合还包括以下步骤:对所有用户的声音数据确定的混音路数进行判断;将所述混音路数与预设路数进行比较,若所述混音路数大于所述预设路数,将所有的所述声音数据按照信号能量大小进行排列,并选取与所述预设路数相同的声音数据进行融合;若所述混音路数小于所述预设路数,则对所有的所述声音数据进行融合。
本发明所述的社交互动的定向交流方法的保护范围不限于本实施例列举的步骤执行顺序,凡是根据本发明的原理所做的现有技术的步骤增减、步骤替换所实现的方案都包括在本发明的保护范围内。
本实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述社交互动的定向交流方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的计算机可读存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的计算机存储介质。
请参阅图5,显示为本发明的服务端于一实施例中的结构连接示意图。如图5所示,本实施例提供一种服务端1,包括:处理器及存储器;所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述服务端执行所述社交互动的定向交流方法的各个步骤。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Alication SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field Programmable GateArray,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
上述的存储器可能包含随机存取存储器(Random Access Memory,简称RAM),也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
于实际应用中,所述服务端可以根据功能、负载等多种因素布置在一个或多个实体服务器上,也可以是由分布的或集中的服务器集群构成的云服务器,本实施例不作限定。
请参阅图6,显示为本发明的社交互动的定向交流系统于一实施例中的结构原理图。如图6所示,所述社交互动的定向交流系统包括:服务端1、发起方2和接收方3。
所述服务端1用于在已经获取至少三个声音数据的情况下,获取模式指令;基于所述模式指令确定所述声音数据的融合方式,以根据确定的融合方式进行融合后生成待传输声音数据;所述融合方式由确定的接收对象决定;将所述待传输声音数据按照所述融合方式中对应的接收对象进行传输,以实现所述模式指令的发起方与所述接收对象之间的定向交流。
所述发起方2用于发送模式指令。
所述接收方3用于接收所述待传输声音数据。
请参阅图7,显示为本发明的社交互动的定向交流系统于一实施例中的传输示意图。如图7所示,所述接收方包括目标客户端和非目标客户端。
所述目标客户端用于所述模式指令为定向沟通模式指令时,接收所述发起方的声音数据;
所述非目标客户端用于所述模式指令为定向沟通模式指令时,未接收所述发起方的声音数据。
具体地,如图7所示,参与社交互动的包括四个客户端:客户端a、客户端b、客户端c和客户端d。其中,客户端a作为定向交流的发起方,想与客户端b的用户进行单独沟通,此时,客户端b作为目标客户端,客户端c和客户端d作为非目标客户端。客户端a的用户将模式切换为定向沟通模式后,服务端将客户端a的声音数据提取出来,先将客户端a以外的客户端b、客户端c和客户端d声音数据进行混音,若在此基础上加入客户端a的声音数据,则生成第一待传输声音数据,并发送至客户端b;若并未在此基础上加入客户端a的声音数据,则生成第二待传输声音数据,并发送至客户端c和客户端d。
需要说明的是,当客户端b作为目标客户端后,则客户端b也自动切换为定向沟通模式。此时客户端a与客户端b的用户均能正常收听公开的声音数据,额外的,客户端a与客户端b的用户单独沟通的内容仅在客户端a与客户端b之间进行传输,由此,实现了多线交流。
相对应的,客户端a与客户端b的用户进行单独沟通,当客户端b的用户需要回复客户端a的用户时,则客户端b转换为定向交流的发起方。
请参阅图8,显示为本发明的社交互动的定向交流系统于一实施例中的功能结构示意图。如图8所示,呈现了服务端1与作为发起方的客户端2的功能模块。
服务端1包括服务端通信模块11和声音融合模块12。其中,服务端通信模块11包括服务端声音传输单元111和服务端控制传输单元112,声音融合模块12包括全员声音融合单元121和定向混音单元122。
客户端2包括客户端控制模块21、客户端通信模块22和音频模块23。其中,客户端控制模块21包括全员播放单元211和定向沟通单元212,客户端通信模块22包括客户端声音传输单元221和客户端控制传输单元222,音频模块23包括声音采集单元231和声音播放单元232。需要说明的是,所述客户端是具备网络传输功能与语音功能的电子设备,可以是固定终端,例如台式机电脑、智能电视等;也可以是移动终端,例如笔记型电脑、智能手机或平板电脑等,还可以是智能眼镜、智能手表等智能穿戴设备。
客户端通信模块22与服务端通信模块11可以是4G或5G网络通信模块,也可以是Wifi网络通信模块。全员播放单元211用于检测用户选定全员播放模式时的指令信息,并将指令信息传输至客户端控制传输单元222,定向沟通单元212用于检测用户选定定向沟通模式时的指令信息,并将指令信息传输至客户端控制传输单元222。
需要说明的是,图8中示出的客户端的功能结构既可以表示发起方客户端的功能结构,也可以表示接收方客户端的功能结构,即目标客户端的功能结构和非目标客户端的功能结构。在客户端作为发起方时,用户的声音通过声音采集单元231获取后,经由客户端控制传输单元222、客户端声音传输单元221传输至服务端1中;在客户端作为接收方时,通过客户端声音传输单元221接收服务端1反馈的声音数据,该声音数据通过客户端控制传输单元222传输至声音播放单元232进行播放。
于一实施例中,在多个用户的在线语音会议中,所述社交互动的定向交流系统中各个模块之间的交互过程如下:
客户端2发起方用户在会议过程中切换为定向沟通模式,则客户端2发起方用户的声音通过客户端通信模块22中的客户端声音传输单元221传输至服务端1,服务端1通过服务端通信模块11中的服务端声音传输单元111获取到发起方用户的声音,服务端控制传输单元112通知声音融合模块12,然后将发起方用户的声音从全员声音融合单元121中摘除,并依次通过服务端控制传输单元112、服务端声音传输单元111传输至非目标客户端;而在定向混音单元122中将发起方用户的声音混入,并依次通过服务端控制传输单元112、服务端声音传输单元111传输至目标客户端,达到定向交流的目的。
需要说明的是,应理解图8中的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现,也可以全部以硬件的形式实现,还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如:某一模块可以为单独设立的处理元件,也可以集成在下述系统的某一个芯片中实现。此外,某一模块也可以以程序代码的形式存储于下述系统的存储器中,由下述系统的某一个处理元件调用并执行某一模块的功能。其它模块的实现与之类似。这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
图8中的各个模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),一个或多个数字信号处理器(Digital Signal Processor,简称DSP),一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。当某个模块通过处理元件调用程序代码的形式实现时,该处理元件可以是通用处理器,如中央处理器(Central ProcessingUnit,简称CPU)或其它可以调用程序代码的处理器。这些模块可以集成在一起,以片上系统(System-on-a-chip,简称SOC)的形式实现。
本发明所述的社交互动的定向交流系统可以实现本发明所述的社交互动的定向交流方法,但本发明所述的社交互动的定向交流方法的实现装置包括但不限于本实施例列举的社交互动的定向交流系统的结构,凡是根据本发明的原理所做的现有技术的结构变形和替换,都包括在本发明的保护范围内。
综上所述,本发明所述社交互动的定向交流方法、介质、服务端及交流系统可以在社交互动时提供多种交流形式,进而提高社交互动的沟通质量。向用户提供全员播放模式和定向沟通模式,以使用户可以根据沟通需要进行灵活选择,使得整个社交互动可以进行多线交流。提供了一种多线交流的互联网会议实现方式,提高了互联网会议的效率。在定向沟通模式下,可以根据确定的目标用户与非目标用户分别传输不同的声音数据。通过混音进行声音融合,实现了声音数据的重定向。可以使用户在远程会议中,保证不切断会议且不打断整个会议进程的情况下实现与他人的单独沟通。本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
Claims (11)
1.一种社交互动的定向交流方法,其特征在于,所述社交互动的定向交流方法包括以下步骤:
在已经获取至少三个声音数据的情况下,获取模式指令;
基于所述模式指令确定所述声音数据的融合方式,以根据确定的融合方式进行融合后生成待传输声音数据;所述融合方式由确定的接收对象决定;
将所述待传输声音数据按照所述融合方式中对应的所述接收对象进行传输,以实现所述模式指令的发起方与所述接收对象之间的定向交流。
2.根据权利要求1所述的社交互动的定向交流方法,所述模式指令至少包括:全员播放模式指令和定向沟通模式指令中的一种。
3.根据权利要求2所述的社交互动的定向交流方法,所述基于所述模式指令确定所述声音数据的融合方式,以根据确定的融合方式进行融合后生成待传输声音数据包括以下步骤:
基于所述全员播放模式指令,对所有用户的声音数据进行融合;
基于所述定向沟通模式指令,针对特定的所述接收对象,对所有用户的声音数据进行特定形式的融合。
4.根据权利要求3所述的社交互动的定向交流方法,所述基于所述全员播放模式指令,对所有用户的声音数据进行融合包括以下步骤:
将所有用户的声音数据进行格式转换,统一生成线性语音格式的音频流;
对所有所述线性语音格式的音频流进行混音处理。
5.根据权利要求3所述的社交互动的定向交流方法,所述基于所述定向沟通模式指令,针对所述接收对象的不同,对所有用户的声音数据进行不同形式的融合包括以下步骤:
结合所述定向沟通模式指令,于参与社交的所有用户中确定具有定向交流需求的定向发起用户以及根据所述定向交流需求确定目标用户和非目标用户;
对所有用户的声音数据进行融合后,形成第一待传输声音数据;
对所有用户的声音数据进行融合后,去除所述定向发起用户的声音数据,形成第二待传输声音数据。
6.根据权利要求5所述的社交互动的定向交流方法,所述将所述待传输声音数据传输至所述接收对象包括以下步骤:
将所述目标用户作为第一接收对象,将所述非目标用户作为第二接收对象;
将所述第一待传输声音数据传输至所述第一接收对象,将所述第二待传输声音数据传输至所述第二接收对象。
7.根据权利要求3所述的社交互动的定向交流方法,所述对所有用户的声音数据进行融合还包括以下步骤:
对所有用户的声音数据确定的混音路数进行判断;
将所述混音路数与预设路数进行比较,若所述混音路数大于所述预设路数,将所有的所述声音数据按照信号能量大小进行排列,并选取与所述预设路数相同的声音数据进行融合;若所述混音路数小于所述预设路数,则对所有的所述声音数据进行融合。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7中任一项所述的社交互动的定向交流方法。
9.一种服务端,其特征在于,包括:处理器及存储器;
所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述服务端执行如权利要求1至7中任一项所述的社交互动的定向交流方法。
10.一种社交互动的定向交流系统,其特征在于,所述社交互动的定向交流系统包括:如权利要求9所述的服务端、发起方和接收方;
所述发起方用于发送模式指令;
所述服务端用于在已经获取至少三个声音数据的情况下,获取模式指令;基于所述模式指令确定所述声音数据的融合方式,以根据确定的融合方式进行融合后生成待传输声音数据;所述融合方式由确定的接收对象决定;将所述待传输声音数据按照所述融合方式中对应的接收对象进行传输,以实现所述模式指令的发起方与所述接收对象之间的定向交流;
所述接收方用于接收所述待传输声音数据。
11.根据权利要求10所述的社交互动的定向交流系统,所述接收方包括目标客户端和非目标客户端;
所述目标客户端用于所述模式指令为定向沟通模式指令时,接收所述发起方的声音数据;
所述非目标客户端用于所述模式指令为定向沟通模式指令时,未接收所述发起方的声音数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011353876.6A CN114553845A (zh) | 2020-11-26 | 2020-11-26 | 社交互动的定向交流方法、介质、服务端及交流系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011353876.6A CN114553845A (zh) | 2020-11-26 | 2020-11-26 | 社交互动的定向交流方法、介质、服务端及交流系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114553845A true CN114553845A (zh) | 2022-05-27 |
Family
ID=81667960
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011353876.6A Pending CN114553845A (zh) | 2020-11-26 | 2020-11-26 | 社交互动的定向交流方法、介质、服务端及交流系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114553845A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009231949A (ja) * | 2008-03-19 | 2009-10-08 | Univ Of Aizu | マルチメディア会議システム、アプリケーションサーバ、混合パターン決定方法および混合パターン決定用プログラム |
CN102065264A (zh) * | 2009-11-18 | 2011-05-18 | 深圳市邦彦信息技术有限公司 | 一种无mcu的视频指挥/会议系统及方法 |
CN102833520A (zh) * | 2012-08-16 | 2012-12-19 | 华为技术有限公司 | 一种视频会议信号处理的方法、视频会议服务器及系统 |
CN105704338A (zh) * | 2016-03-21 | 2016-06-22 | 腾讯科技(深圳)有限公司 | 一种混音方法、混音设备及系统 |
CN110324565A (zh) * | 2019-06-06 | 2019-10-11 | 浙江华创视讯科技有限公司 | 音频输出方法、装置、会议主机、存储介质及电子装置 |
CN110730322A (zh) * | 2018-07-16 | 2020-01-24 | 视联动力信息技术股份有限公司 | 一种基于视联网的音频流处理方法及系统 |
CN110910892A (zh) * | 2018-09-17 | 2020-03-24 | 北京京东尚科信息技术有限公司 | 会议系统终端、音频数据处理方法和远程会议系统 |
-
2020
- 2020-11-26 CN CN202011353876.6A patent/CN114553845A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009231949A (ja) * | 2008-03-19 | 2009-10-08 | Univ Of Aizu | マルチメディア会議システム、アプリケーションサーバ、混合パターン決定方法および混合パターン決定用プログラム |
CN102065264A (zh) * | 2009-11-18 | 2011-05-18 | 深圳市邦彦信息技术有限公司 | 一种无mcu的视频指挥/会议系统及方法 |
CN102833520A (zh) * | 2012-08-16 | 2012-12-19 | 华为技术有限公司 | 一种视频会议信号处理的方法、视频会议服务器及系统 |
CN105704338A (zh) * | 2016-03-21 | 2016-06-22 | 腾讯科技(深圳)有限公司 | 一种混音方法、混音设备及系统 |
CN110730322A (zh) * | 2018-07-16 | 2020-01-24 | 视联动力信息技术股份有限公司 | 一种基于视联网的音频流处理方法及系统 |
CN110910892A (zh) * | 2018-09-17 | 2020-03-24 | 北京京东尚科信息技术有限公司 | 会议系统终端、音频数据处理方法和远程会议系统 |
CN110324565A (zh) * | 2019-06-06 | 2019-10-11 | 浙江华创视讯科技有限公司 | 音频输出方法、装置、会议主机、存储介质及电子装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5536756B2 (ja) | オープン・アーキテクチャ・ベースのドメイン依存型リアルタイム多言語通信サービスのための方法、コンピュータ読み取り可能メディア、およびシステム | |
US8630208B1 (en) | Muting of communication session participants | |
US9311920B2 (en) | Voice processing method, apparatus, and system | |
US20150188928A1 (en) | Private-public chat functionality | |
WO2015131709A1 (zh) | 一种电视会议中与会者私聊的方法及装置 | |
CN107301028B (zh) | 一种基于多人远程通话的音频数据处理方法及装置 | |
US20220295014A1 (en) | Multi-group virtual event system | |
CN114500130A (zh) | 音频数据推送方法、装置、系统、电子设备及存储介质 | |
US20140009567A1 (en) | Local Media Rendering | |
US20090299735A1 (en) | Method for Transferring an Audio Stream Between a Plurality of Terminals | |
US11930350B2 (en) | Rendering audio | |
US9350948B2 (en) | Method and system for providing video service | |
WO2016082579A1 (zh) | 语音输出方法及装置 | |
CA3060500C (en) | Systems and methods for providing a multi-channel communication service | |
JP2023516303A (ja) | オーディオ表現および関連するレンダリング | |
CN114553845A (zh) | 社交互动的定向交流方法、介质、服务端及交流系统 | |
CN103905483B (zh) | 音视频共享方法、设备和系统 | |
US11800017B1 (en) | Encoding a subset of audio input for broadcasting conferenced communications | |
CN115662437A (zh) | 一种多话筒同时使用场景下的语音转写方法 | |
CN114979545A (zh) | 多终端的通话方法和存储介质及电子设备 | |
CN113450797A (zh) | 基于在线会议的音频处理方法、设备、存储介质及系统 | |
Aguilera et al. | An immersive multi-party conferencing system for mobile devices using binaural audio | |
CN101009577A (zh) | 实现音频播放的方法与装置 | |
CN109660491A (zh) | 一种多方点对点通话方法及装置、设备、存储介质 | |
US12015655B2 (en) | Method and system for handling a teleconference |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |