CN103151045B - 语音服务器及其语音处理方法 - Google Patents
语音服务器及其语音处理方法 Download PDFInfo
- Publication number
- CN103151045B CN103151045B CN201310055270.8A CN201310055270A CN103151045B CN 103151045 B CN103151045 B CN 103151045B CN 201310055270 A CN201310055270 A CN 201310055270A CN 103151045 B CN103151045 B CN 103151045B
- Authority
- CN
- China
- Prior art keywords
- mode
- transparent transmission
- users
- voice
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本发明公开一种语音服务器及其语音处理方法,以灵活地处理多情况下的语音。该语音处理方法可应用于聊天室的语音服务器侧,包括:将上麦用户数分成至少三个不同的区段,并对应上麦用户数的不同区段设置不同的语音处理方式,语音处理方式至少包括透传、混音和半透传半混音三种方式;根据上麦用户数区段的变化动态切换语音处理方式。本发明公开的语音服务器包括:与透传模块、混音模块和半透传半混音模块建立通信连接的切换模块,用于获取上麦用户数,判断上麦用户数所处的切换语音处理方式的区段,并针对上麦用户数的不同区段的动态变化调用相应的透传模块、混音模块或半透传半混音模块以相应的透传、混音或半透传半混音方式处理语音。
Description
技术领域
本发明涉及网络技术领域,尤其涉及一种语音服务器及其语音处理方法。
背景技术
现有的语音主要有混音和透传两种处理方式,而且在同一语音处理系统中,大多只采用单一的处理方式来处理所有的语音,处理方式固定。由于固定的处理方式大多只针对常见的一般情况进行折中考虑,因此容易导致在某些情况下处理效果的不佳,例如在一个网络聊天室系统中,语音服务器通常采用混音的方式处理混音数据,然而,即使该聊天室中只有固定的一或两个用户聊天时,采用的还是固定的混音方式,对有些可以直接通过透传方式处理的语音还是采用固定的混音的处理机制进行处理,由于混音操作复杂,从而造成某些语音数据传输的时延大,且对服务器增加了不必要的开销。而且当网络聊天室用户的上麦用户在两个以上时,由语音服务器以透传方式处理语音,并由目的客户端进行混音处理,也可以在确保用户体验的前提下优化语音服务器及其客户端的资源配置。
发明内容
本发明的主要目的在于公开一种语音服务器及其语音处理方法,以灵活地处理多情况下的语音。
为达上述目的,本发明公开了一种语音处理方法,应用于聊天室的语音服务器侧,包括以下步骤:
将上麦用户数分成至少三个不同的区段,并对应上麦用户数的不同区段设置不同的语音处理方式,所述语音处理方式至少包括透传、混音和半透传半混音三种方式;
根据所述上麦用户数区段的变化动态切换语音处理方式。
可选的,上述根据所述上麦用户数区段的变化动态切换语音处理方式包括:
设置切换语音处理方式的第一及第二阈值;以及
当所述上麦用户数小于所述第一阈值时,所述语音服务器以透传的方式处理所述聊天室的所有语音数据;
当所述上麦用户数大于或等于所述第一阈值且小于所述第二阈值时,所述语音服务器以半透传半混音的方式处理所述聊天室中的语音数据,即以透传方式处理上麦用户之间的语音数据,并将所有麦上的语音数据混音后发送给聊天室中的其它旁听用户;
当所述上麦用户数大于或等于所述第二阈值时,所述语音服务器以混音的方式处理所述聊天室中的语音数据。
为达上述目的,本发明还公开一种与上述处理方法相对应的语音服务器,包括:
与透传模块、混音模块和半透传半混音模块建立通信连接的切换模块,用于获取上麦用户数,判断上麦用户数所处的切换语音处理方式的区段,并针对上麦用户数的不同区段的动态变化调用相应的透传模块、混音模块或半透传半混音模块以相应的透传、混音或半透传半混音方式处理语音。
可选的,上述切换模块包括:
设置单元,用于设置切换语音处理方式的第一及第二阈值;
切换单元,用于获取当前的上麦用户数,根据上述设置单元设置的第一和第二阈值判断该上麦用户数所处的切换语音处理方式的区段;当所述上麦用户数小于所述第一阈值时,触发所述透传模块以透传的方式处理所述聊天室的所有语音数据;当所述上麦用户数大于或等于所述第一阈值且小于所述第二阈值时,触发所述半透传半混音模块以半透传半混音的方式处理所述聊天室中的语音数据,即以透传方式处理上麦用户之间的语音数据,并将所有麦上的语音数据混音后发送给聊天室中的其它用户;以及当所述上麦用户数大于或等于所述第二阈值时,触发所述混音模块以混音的方式处理所述聊天室中的语音数据。
与现有技术相比,本发明实施例至少具有以下优点:
可以根据上麦用户数区段的变化动态切换语音处理方式,实现了各情况下语音的灵活处理,减少服务器混音操作的开销。
附图说明
图1是本发明实施例公开的语音处理方法的流程图;
图2是本发明实施例公开的语音服务器的功能结构框图。
具体实施方式
下面结合说明书附图对本发明的具体实现方式做一详细描述。
实施例一
本实施例公开一种语音的处理方法,应用于聊天室的语音服务器侧,如图1所示,包括以下步骤:
步骤S1、将上麦用户数分成至少三个不同的区段,并对应上麦用户数的不同区段设置不同的语音处理方式,所述语音处理方式至少包括透传、混音和半透传半混音三种方式。本发明中,所谓上麦用户即指打开麦克风、建立有向语音服务器输送音频数据通道的用户。
在该步骤中,所谓半透传半混音方式是指透传方式处理上麦用户之间的语音数据,并将所有麦上的语音数据混音后发送给聊天室中的其它用户,值得说明的是,该方式中“半”的理解不应狭义的限制在1/2,而应做广义的“一部分”理解,后续不再赘述。
现有语音服务器的混音处理可以是先解码源客户端发送的语音编码数据,解码后的数据统一为PCM格式,然后判断所有源客户端所传送的语音编码数据的采样率和声道是否与标准一致,如果不一致,基于标准采样率对与之不同的源客户端的语音数据进行重新采样,并基于标准声道对与之不同的所有源客户端的语音数据进行扩展或合并;根据时间戳对齐所述采样率和声道统一的语音数据;最后再将对齐后的语音数据进行混音处理后发送给宿客户端。有关混音的处理方法,可以参考本案申请人于2011年5月25日被受理的201110136353.0号专利申请(申请公布日:2011.10.26,公告号:CN102226944A),在此不作赘述。
所谓透传,即是透明传送,也就是语音服务器不管传输的业务如何,只负责将接收的源客户端的语音数据中转到宿客户端,而不对传输的业务进行处理,由此省略了编解码及帧对齐等处理,相比较混音而言,各路数据的传输时延更小。
步骤S2、根据上麦用户数区段的变化动态切换语音处理方式。
本实施例中,可选的,语音服务器设置有切换语音处理方式的第一及第二阈值;当上麦用户数小于第一阈值时,以透传的方式处理聊天室的所有语音数据;当上麦用户数大于或等于第一阈值且小于第二阈值时,以半透传半混音的方式处理聊天室中的语音数据;以及当上麦用户数大于或等于第二阈值时,以混音的方式处理聊天室中的语音数据。
举例说明:在一个简单的网络聊天室系统中,该第一阈值可以设置为2,第二阈值可以设置为3;藉此,则在该网络聊天室中,当一个上麦用户发言时,直接以透传的方式对该用户的语音数据广播给聊天室中的其它旁听用户,当两个上麦用户发言时,两上麦用户之间的语音数据以透传方式进行传输,延时短,而对聊天室中的其它用户,由于这部分用户都是听众,对语音传输的及时性要求不高,则接收的是语音服务器对该两上麦用户混音后的语音数据。
在其他具体的应用场景中,当网络聊天室用户的上麦用户在两个以上时,通过合理设置第一阈值,即由语音服务器以透传方式处理语音,并由目的客户端进行混音处理,也可以在确保用户体验并减少时延的前提下优化语音服务器及其客户端的资源配置。同理,通过第二阈值的合理设置,可以进一步优化语音服务器及其客户端的资源配置,极大地提高了语音服务器处理语音的灵活度。
综上,本实施例公开的语音处理方法,可以根据上麦用户数区段的变化动态切换语音处理方式,实现了各情况下语音的灵活处理,减少服务器混音操作的开销。
实施例二
本实施例公开一种执行上述实施例一所公开方法的语音服务器,如图2所示,包括:
与透传模块1、混音模块2和半透传半混音模块3建立通信连接的切换模块4,用于获取上麦用户数,判断上麦用户数所处的切换语音处理方式的区段,并针对上麦用户数的不同区段的动态变化调用相应的透传模块、混音模块或半透传半混音模块以相应的透传、混音或半透传半混音方式处理语音。
可选的,如图2所示,上述切换模块包括:
设置单元41,用于设置切换语音处理方式的第一及第二阈值;
切换单元42,用于获取当前的上麦用户数,根据上述设置单元设置的第一和第二阈值判断该上麦用户数所处的切换语音处理方式的区段;当上麦用户数小于第一阈值时,触发透传模块以透传的方式处理聊天室的所有语音数据;当上麦用户数大于或等于第一阈值且小于第二阈值时,触发半透传半混音模块以半透传半混音的方式处理聊天室中的语音数据,即以透传方式处理上麦用户之间的语音数据,并将所有麦上的语音数据混音后发送给聊天室中的其它旁听用户;以及当上麦用户数大于或等于第二阈值时,触发混音模块以混音的方式处理聊天室中的语音数据。
举例说明:在一个简单的网络聊天室系统中,该第一阈值可以设置为2,第二阈值可以设置为3;藉此,则在该网络聊天室中,当一个上麦用户发言时,直接以透传的方式对该用户的语音数据广播给聊天室中的其它旁听用户,当两个上麦用户发言时,两上麦用户之间的语音数据以透传方式进行传输,延时短,而对聊天室中的其它用户,由于这部分用户都是听众,对语音传输的及时性要求不高,则接收的是语音服务器对该两上麦用户混音后的语音数据。
在其他具体的应用场景中,当网络聊天室用户的上麦用户在两个以上时,通过合理设置第一阈值,即由语音服务器以透传方式处理语音,并由目的客户端进行混音处理,也可以在确保用户体验并减少时延的前提下优化语音服务器及其客户端的资源配置。同理,通过第二阈值的合理设置,可以进一步优化语音服务器及其客户端的资源配置,极大地提高了语音服务器处理语音的灵活度。
综上,本实施例公开的语音服务器,可以根据上麦用户数区段的变化动态切换语音处理方式,实现了各情况下语音的灵活处理,减少服务器混音操作的开销。
以上公开的仅为本发明的几个具体实施例,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。
Claims (4)
1.一种语音处理方法,应用于聊天室的语音服务器侧,其特征在于,包括以下步骤:
将上麦用户数分成至少三个不同的区段,并对应上麦用户数的不同区段设置不同的语音处理方式,所述语音处理方式至少包括透传、混音和半透传半混音三种方式;
根据所述上麦用户数区段的变化动态切换语音处理方式;
其中,半透传半混音方式是指透传方式处理上麦用户之间的语音数据,并将所有麦上的语音数据混音后发送给聊天室中的其它用户。
2.根据权利要求1所述的语音处理方法,其特征在于,所述根据所述上麦用户数区段的变化动态切换语音处理方式包括:
设置切换语音处理方式的第一及第二阈值;以及
当所述上麦用户数小于所述第一阈值时,所述语音服务器以透传的方式处理所述聊天室的所有语音数据;
当所述上麦用户数大于或等于所述第一阈值且小于所述第二阈值时,所述语音服务器以半透传半混音的方式处理所述聊天室中的语音数据;
当所述上麦用户数大于或等于所述第二阈值时,所述语音服务器以混音的方式处理所述聊天室中的语音数据。
3.一种语音服务器,其特征在于,包括:
与透传模块、混音模块和半透传半混音模块建立通信连接的切换模块,用于获取上麦用户数,判断上麦用户数所处的切换语音处理方式的区段,并针对上麦用户数的不同区段的动态变化调用相应的透传模块、混音模块或半透传半混音模块以相应的透传、混音或半透传半混音方式处理语音;
其中,半透传半混音方式是指透传方式处理上麦用户之间的语音数据,并将所有麦上的语音数据混音后发送给聊天室中的其它用户。
4.根据权利要求3所述的语音服务器,其特征在于,所述切换模块包括:
设置单元,用于设置切换语音处理方式的第一及第二阈值;
切换单元,用于获取当前的上麦用户数,根据上述设置单元设置的第一和第二阈值判断该上麦用户数所处的切换语音处理方式的区段;当所述上麦用户数小于所述第一阈值时,触发所述透传模块以透传的方式处理所述聊天室的所有语音数据;当所述上麦用户数大于或等于所述第一阈值且小于所述第二阈值时,触发所述半透传半混音模块以半透传半混音的方式处理所述聊天室中的语音数据,即以透传方式处理上麦用户之间的语音数据,并将所有麦上的语音数据混音后发送给聊天室中的其它旁听用户;以及当所述上麦用户数大于或等于所述第二阈值时,触发所述混音模块以混音的方式处理所述聊天室中的语音数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310055270.8A CN103151045B (zh) | 2012-10-30 | 2013-02-21 | 语音服务器及其语音处理方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012104262127 | 2012-10-30 | ||
CN201210426212 | 2012-10-30 | ||
CN201210426212.7 | 2012-10-30 | ||
CN201310055270.8A CN103151045B (zh) | 2012-10-30 | 2013-02-21 | 语音服务器及其语音处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103151045A CN103151045A (zh) | 2013-06-12 |
CN103151045B true CN103151045B (zh) | 2015-05-06 |
Family
ID=48549067
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310055270.8A Active CN103151045B (zh) | 2012-10-30 | 2013-02-21 | 语音服务器及其语音处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103151045B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113488019B (zh) * | 2021-08-18 | 2023-09-08 | 百果园技术(新加坡)有限公司 | 基于语音房的混音系统、方法、服务器和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1946029A (zh) * | 2006-10-30 | 2007-04-11 | 北京中星微电子有限公司 | 一种处理音频信号的方法及其系统 |
CN101562667A (zh) * | 2009-05-19 | 2009-10-21 | 中兴通讯股份有限公司 | 软交换架构下的编解码转换控制方法、媒体网关及系统 |
CN201928440U (zh) * | 2010-12-22 | 2011-08-10 | 北京格林思通科技有限公司 | 无线中继装置、移动无线通信终端及无线通信系统 |
CN102226944A (zh) * | 2011-05-25 | 2011-10-26 | 贵阳朗玛信息技术股份有限公司 | 混音方法及设备 |
CN102378137A (zh) * | 2010-08-11 | 2012-03-14 | 中国移动通信集团公司 | 编解码网络透传的方法、设备和系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008081130A2 (fr) * | 2006-12-22 | 2008-07-10 | France Telecom | Pont de conference mixte |
-
2013
- 2013-02-21 CN CN201310055270.8A patent/CN103151045B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1946029A (zh) * | 2006-10-30 | 2007-04-11 | 北京中星微电子有限公司 | 一种处理音频信号的方法及其系统 |
CN101562667A (zh) * | 2009-05-19 | 2009-10-21 | 中兴通讯股份有限公司 | 软交换架构下的编解码转换控制方法、媒体网关及系统 |
CN102378137A (zh) * | 2010-08-11 | 2012-03-14 | 中国移动通信集团公司 | 编解码网络透传的方法、设备和系统 |
CN201928440U (zh) * | 2010-12-22 | 2011-08-10 | 北京格林思通科技有限公司 | 无线中继装置、移动无线通信终端及无线通信系统 |
CN102226944A (zh) * | 2011-05-25 | 2011-10-26 | 贵阳朗玛信息技术股份有限公司 | 混音方法及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN103151045A (zh) | 2013-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
NO20053478D0 (no) | Method for instant scheduling of conference calls | |
US8223673B2 (en) | Method and system for secure conferencing | |
WO2007034303A3 (en) | Mobile terminal allowing impulsive non-language messaging | |
WO2006002076A3 (en) | Methods, systems, and computer program products for content-based screening of messaging service messages | |
BR0206997A (pt) | Método e sistema para a avaliação da qualidade de sinais de voz comutados em pacote | |
WO2007126995A3 (en) | System and method of providing call source information | |
WO2011026336A1 (zh) | 一种实现长短信过滤的系统和方法 | |
CN103259943B (zh) | 一种pstn电话会议混音方法 | |
EP2025096A4 (en) | HIERARCHICAL PROCESSING AND DISTRIBUTION OF PARTIAL FAULTS IN A PACKET NETWORK | |
TW200614747A (en) | Quality of service control for a data transmission | |
CN104580763A (zh) | 一种实现电话会议时私聊的方法及装置 | |
CN101641936A (zh) | 群组通信系统中的媒体流建立 | |
CN103151045B (zh) | 语音服务器及其语音处理方法 | |
CN109981575A (zh) | 虚拟化环境下的语音室 | |
CN100484175C (zh) | 一种会场当前说话者上报的实现方法及系统 | |
CN103151046B (zh) | 语音服务器及其语音处理方法 | |
US8411700B2 (en) | DLP-based wireless docking for WiFi-based endpoints with desktop | |
CN104349499A (zh) | 会话接入、移动终端与呼叫中心通讯的接入系统及方法 | |
CN109698786A (zh) | 客户跨渠道切换与座席会话的方法 | |
CN105682157A (zh) | 通话方法及系统 | |
CN104022941A (zh) | 一种会议即时通讯系统及其实现方法 | |
CN109862305B (zh) | 一种视联网开会时调流的方法和装置 | |
CN107241200A (zh) | 一种网络会议方法及装置 | |
DE602005006993D1 (de) | Verfahren zum senden einer digitalen daten-datei über telekommunikationsnetze | |
CN102348007B (zh) | 用于在分组交换域中实现双向通话录音的方法和移动终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |