CN111432160A - 一种实现多人通话的方法、装置、服务器和存储介质 - Google Patents

一种实现多人通话的方法、装置、服务器和存储介质 Download PDF

Info

Publication number
CN111432160A
CN111432160A CN202010250718.1A CN202010250718A CN111432160A CN 111432160 A CN111432160 A CN 111432160A CN 202010250718 A CN202010250718 A CN 202010250718A CN 111432160 A CN111432160 A CN 111432160A
Authority
CN
China
Prior art keywords
call
microphone
voice
person
room
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010250718.1A
Other languages
English (en)
Inventor
李敬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Baiguoyuan Information Technology Co Ltd
Original Assignee
Guangzhou Baiguoyuan Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Baiguoyuan Information Technology Co Ltd filed Critical Guangzhou Baiguoyuan Information Technology Co Ltd
Priority to CN202010250718.1A priority Critical patent/CN111432160A/zh
Publication of CN111432160A publication Critical patent/CN111432160A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施例公开了一种实现多人通话的方法、装置、服务器和存储介质。其中,该方法包括:对多人通话间内来自同一通话区域的多路通话语音进行综合修正,得到对应的最优通话语音,多路通话语音由处于同一通话区域内的主麦克风和该主麦克风关联的扩展麦克风共同采集;控制处于其他通话区域内的主麦克风播放最优通话语音。本发明实施例提供的技术方案,对多人通话间内接收到的处于同一通话区域内的主麦克风和该主麦克风关联的扩展麦克风共同采集的多路通话语音进行综合修正,得到最优通话语音,进而控制处于其他通话区域内的主麦克风播放该最优通话语音,避免多路通话语音的混杂播放,提高多人通话之间的语音质量。

Description

一种实现多人通话的方法、装置、服务器和存储介质
技术领域
本发明实施例涉及音视频处理技术领域,尤其涉及一种实现多人通话的方法、装置、服务器和存储介质。
背景技术
随着移动互联网的快速发展,多人音视频通话的场景越来越普遍,而对于处于同一区域内多人共同采用同一麦克风采集各个语音信号与其他用户进行通话的情况,例如多人会议通信中,通常是多人在同一会议室内,采用同一音频设备来采集该会议室内各个用户的语音信号,与其他会议室的参会人员进行通信,此时由于每一会议室内配置的音频设备与该会议室各个用户的距离不同,使得所采集不同用户的语音信号存在信噪比高低不一的情况,从而影响多人通话下的语音质量。
针对上述问题,现有的多人通话系统通常会在会议室内额外设置多个扩展麦克风,与原有的主麦克风一起采集不同位置用户的语音,但若处于同一区域内的多人将已经登录通话应用的某一用户的私人移动设备作为主麦克风,来参与多人通话时,该私人移动设备上不支持外接多个扩展麦克风,且降低了多人通话的便利性;或者,同一区域内的每一用户均可以采用自身的移动设备登录通话应用,此时某一用户的语音信号会被该区域内的每一移动设备所采集并共同转发给其他区域内的通话用户,此时由于不同移动设备对同一语音信号的采集和处理存在延时差异,则会造成其他区域的通话用户所播放的语音信号出现播放混杂的现象,极大降低了多人通话之间的语音质量。
发明内容
本发明实施例提供了一种实现多人通话的方法、装置、服务器和存储介质,提高多人通话之间的语音播放质量。
第一方面,本发明实施例提供了一种实现多人通话的方法,该方法包括:
对多人通话间内来自同一通话区域的多路通话语音进行综合修正,得到对应的最优通话语音,所述多路通话语音由处于同一通话区域内的主麦克风和该主麦克风关联的扩展麦克风共同采集;
控制处于其他通话区域内的主麦克风播放所述最优通话语音。
第二方面,本发明实施例提供了一种实现多人通话的装置,该装置包括:
多路语音修正模块,用于对多人通话间内来自同一通话区域的多路通话语音进行综合修正,得到对应的最优通话语音,所述多路通话语音由处于同一通话区域内的主麦克风和该主麦克风关联的扩展麦克风共同采集;
语音播放模块,用于控制处于其他通话区域内的主麦克风播放所述最优通话语音。
第三方面,本发明实施例提供了一种服务器,该服务器包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所述的实现多人通话的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所述的实现多人通话的方法。
本发明实施例提供的一种实现多人通话的方法、装置、服务器和存储介质,对多人通话间内接收到的处于同一通话区域内的主麦克风和该主麦克风关联的扩展麦克风共同采集的多路通话语音进行综合修正,得到最优通话语音,进而控制处于其他通话区域内的主麦克风播放该最优通话语音,避免多路通话语音的混杂播放,提高多人通话之间的语音质量。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1A为本发明实施例一提供的一种实现多人通话的方法的流程图;
图1B为本发明实施例一提供的多人通话实现过程的原理示意图;
图2A为本发明实施例二提供的一种实现多人通话的方法的流程图;
图2B为本发明实施例二提供的方法中确定主麦克风关联的扩展麦克风的原理示意图;
图3A为本发明实施例三提供的一种实现多人通话的方法的流程图;
图3B为本发明实施例三提供的方法中对多路通话语音进行综合修正过程的原理示意图;
图4为本发明实施例四提供的一种实现多人通话的装置的结构示意图;
图5为本发明实施例五提供的一种服务器的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。此外,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例一
图1A为本发明实施例一提供的一种实现多人通话的方法的流程图,本实施例可适用于任一多人通话场景下的某一通话区域内存在多个用户共同参与本次多人通话的情况中。本实施例提供的实现多人通话的方法可以由本发明实施例提供的实现多人通话的装置来执行,该装置可以通过软件和/或硬件的方式来实现,并集成在执行本方法的服务器中,该服务器可以是用于建立多人通话的通话应用对应的后台服务器。
具体的,参考图1A,该方法可以包括如下步骤:
S110,对多人通话间内来自同一通话区域的多路通话语音进行综合修正,得到对应的最优通话语音。
其中,多路通话语音由处于同一通话区域内的主麦克风和该主麦克风关联的扩展麦克风共同采集。
具体的,本实施例主要针对某一通话方所在通话区域内存在多个用户共同参与本次多人通话的多人通话场景下,例如多区域之间的办公会议系统等,此时由于该通话区域内多个用户距离该通话区域所设置的通话设备的位置远近不同,使得该通话设备所采集的不同用户语音也忽大忽小,降低了多人通话的语音质量;因此本实施例中预先设定多人通话场景下任一通话方所在的通话区域内均允许接入多个通话设备,作为该通话区域内采集用户语音的麦克风,从而在该通话区域内存在多个用户共同参与本次多人通话时,避免所采集的不同用户语音忽大忽小的问题,同时同一通话区域内存在多个通话设备时,如果接收到其他通话区域内某一通话方的语音,多个通话设备会共同播放该通话方的语音,则会造成语音杂乱的现象,因此为了避免这种现象,还需要设置同一通话区域内多个通话设备的功能定义,也就是在同一通话区域内接入的多个通话设备中选取其中一个作为本实施例中的主麦克风,其他通话设备作为该主麦克风关联的扩展麦克风。
在本实施例中,在多人通话场景下,服务端首先会针对本次多人通话建立一个对应的多人通话间,并确定该多人通话间的房间号和加入密码,便于各个通话方依次加入该多人通话间参与本次多人通话,此时如果该多人通话间内某几个通话方处于同一通话区域内,如图1B所示,则该通话区域内每一通话方均对应配置一个通话设备,作为采集该通话方所发出语音的麦克风,而该通话区域内的每一通话方采用该通话设备加入多人通话间时,会预先指示该通话方所采用的通话设备是否为该通话区域的主麦克风,从而确定出该通话区域的主麦克风和该主麦克风关联的扩展麦克风,按照上述步骤,在各个通话方加入多人通话间时,即可确定参与本次多人通话的每一通话区域的主麦克风和扩展麦克风。
具体的,如果多人通话间内的某一通话方所在的通话区域内存在多个通话用户共同参与本次多人通话,则该通话区域内会存在多个通话设备,分别作为该通话区域内的主麦克风和该主麦克风关联的扩展麦克风,此时如图1B所示,该通话区域内的主麦克风和该主麦克风关联的扩展麦克风均会共同采集该通话方发出的语音信号,使得每一麦克风生成一路通话语音发送给通话服务端,此时该通话服务端的多人通话间会收到由同一通话区域内的主麦克风和该主麦克风关联的扩展麦克风共同采集的该通话方的多路通话语音,为了保证通话语音在其他通话方的播放质量,本实施例该通话服务端可以按照对播放质量存在影响的语音指标对该多路通话语音进行综合修正,例如择优筛选或者语音融合优化等,从而将多路通话语音转换为一路最优通话语音,该最优通话语音能够保证语音通话质量达到最佳,后续将该最优通话语音发送给该多人通话间的其他通话方进行播放,从而提高多人通话的语音质量。
需要说明的是,为了保证各个通话区域内所接入通话设备的便捷性,本实施例中主麦克风和扩展麦克风可以为多人通话间内加入的通话方的移动设备,例如通话方的手机或智能平板等,该移动设备上会预先配置对应的通话应用,通话方可以通过在该通话应用上输入该多人通话间的房间号和密码来加入该多人通话间,同时在通话应用上加入多人通话间时,还会选择是否将自身的移动设备作为该通话区域内的主麦克风,例如在通话应用的多人通话间的加入界面中自行选择是否作为主麦克风存在;此时,本实施例中直接采用各个通话方私人的移动设备加入多人通话场景,无需额外配置专门的麦克风,从而以低成本、高便捷性的方式,保证多人通话之间的高效通话。
S120,控制处于其他通话区域内的主麦克风播放最优通话语音。
具体的,由于该多人通话间除该最优通话语音所来自的通话区域内的各个通话方外,其它通话方中可能也有某几个共同处于同一其他通话区域内,因此首先确定出该多人通话间内除该最优通话语音所来自的通话区域内的通话方之外的其他通话方所处的其他通话区域,此时该其他通话区域可能只存在一个通话方,也可能存在多个通话方,如果其他通话区域只存在一个通话方,说明该其他通话区域只有一个通话设备,作为该其他通话区域内的主麦克风,而不存在扩展麦克风;此时通话服务端在得到对应的最优通话语音后,仅筛选出处于各个其他通话区域内的主麦克风,控制每一其他通话区域内的主麦克风分别播放该最优通话语音,使得每一其他通话区域内的各个通话方均能听到唯一播放的该最优通话语音,避免其他通话区域内多个麦克风同时播放时造成的语音混杂现象。
示例性的,本实施例控制处于其他通话区域内的主麦克风播放最优通话语音,可以具体包括:向处于其他通话区域内的主麦克风转发最优通话语音,并控制该主麦克风播放最优通话语音。
具体的,通话服务端在得到对应的最优通话语音后,会将该最优通话语音分别转发给处于各个其他通话区域内的主麦克风,进而由该主麦克风播放该最优通话语音。
本实施例提供的技术方案,对多人通话间内接收到的处于同一通话区域内的主麦克风和该主麦克风关联的扩展麦克风共同采集的多路通话语音进行综合修正,得到最优通话语音,进而控制处于其他通话区域内的主麦克风播放该最优通话语音,避免多路通话语音的混杂播放,提高多人通话之间的语音质量。
实施例二
图2A为本发明实施例二提供的一种实现多人通话的方法的流程图,图2B为本发明实施例二提供的方法中确定主麦克风关联的扩展麦克风的原理示意图。本实施例是在上述实施例的基础上进行优化。具体的,如图2A所示,本实施例对于确定处于各个通话区域内的主麦克风关联的扩展麦克风的具体过程进行详细的解释说明。
可选的,如图2A所示,本实施例中可以包括如下步骤:
S210,确定处于各个通话区域内的主麦克风关联的扩展麦克风。
在本实施例中,多人通话间内可能存在多个通话方处于同一通话区域,此时同一通话区域内的每一通话方在通过私人的移动设备上配置的通话应用加入多人通话间时,会在该通话应用的通话加入界面中选择是否需要将自身的移动设备作为该通话区域的主麦克风,使得存在多个通话方的每一通话区域内均存在唯一一个主麦克风。
具体的,在各个通话方通过私人移动设备上的通话应用加入该多人通话间时,通话服务端会识别出每一通话方对应的移动设备是否作为某一通话区域内的主麦克风存在,未作为主麦克风的移动设备均作为对应的扩展麦克风存在,此时需要确定该多人通话间内的主麦克风与各个扩展麦克风之间的关联关系;本实施例中首先确定该多人通话间的每一主麦克风和扩展麦克风所处的通话区域,进而将与每一主麦克风处于同一通话区域内的扩展麦克风作为该主麦克风关联的扩展麦克风。
示例性的,本实施例具体可以采用如下两种方式,来确定处于各个通话区域内的主麦克风关联的扩展麦克风:
1)针对多人通话间内的每一主麦克风,根据该主麦克风和各个扩展麦克风的定位信息,将与该主麦克风处于同一通话区域内的扩展麦克风作为该主麦克风关联的扩展麦克风。
具体的,为了准确判断各个麦克风所处的通话区域,每一通话方在加入多人通话间时,会携带有自身的定位信息发送给通话服务端,通话服务端则根据每一通话方在加入多人通话间时所选择的是否需要将自身的移动设备作为该通话区域的主麦克风的情况,确定该多人通话间内每一主麦克风和每一扩展麦克风的定位信息;进而针对该多人通话间的每一主麦克风,分别采用该主麦克风和各个扩展麦克风的定位信息,判断各个扩展麦克风是否与该主麦克风处于同一通话区域内,将与该主麦克风处于同一通话区域内的扩展麦克风作为该主麦克风关联的扩展麦克风;按照上述步骤,依次确定该多人通话间内每一主麦克风关联的扩展麦克风。
2)针对多人通话间内的每一扩展麦克风,确定该扩展麦克风加入多人通话间时指向的主麦克风,将该扩展麦克风作为所指向的主麦克风关联的扩展麦克风之一。
具体的,每一通话方在加入多人通话间时,除了在该通话方所在的移动设备上配置的通话应用的通话加入界面中选择是否需要将自身的移动设备作为该通话区域的主麦克风之外,还会在选择不作为主麦克风,而作为扩展麦克风加入时,再次选择作为哪一主麦克风的扩展麦克风,进而将指向信息发送给通话服务端,使得通话服务端可以针对多人通话间内的每一扩展麦克风,确定出该扩展麦克风加入多人通话间时指向的主麦克风,进而将该扩展麦克风作为所指向的主麦克风关联的扩展麦克风之一,直至确定出每一扩展麦克风所指向的主麦克风。
S220,对多人通话间内来自同一通话区域的多路通话语音进行综合修正,得到对应的最优通话语音,多路通话语音由处于同一通话区域内的主麦克风和该主麦克风关联的扩展麦克风共同采集。
S230,控制处于其他通话区域内的主麦克风播放最优通话语音。
本实施例提供的技术方案,通过在各个通话区域内将通话方私人的移动设备作为该通话区域内的麦克风,并在加入多人通话间时,确定各个通话区域内的主麦克风关联的扩展麦克风,提高多人通话的便捷性,同时对多人通话间内接收到的处于同一通话区域内的主麦克风和该主麦克风关联的扩展麦克风共同采集的多路通话语音进行综合修正,得到最优通话语音,进而控制处于其他通话区域内的主麦克风播放该最优通话语音,避免多路通话语音的混杂播放,提高多人通话之间的语音质量。
实施例三
图3A为本发明实施例三提供的一种实现多人通话的方法的流程图,图3B为本发明实施例三提供的方法中对多路通话语音进行综合修正过程的原理示意图。本实施例是在上述实施例的基础上进行优化。具体的,如图3B所示,本实施例对于多路通话语音进行综合修正的具体过程进行详细的解释说明。
可选的,如图3A所示,本实施例中可以包括如下步骤:
S310,根据通话发起方的多人通话请求建立对应的多人通话间。
可选的,在进行多人通话之前,任一通话方可以作为通话发起方向通话服务端申请一个通话直播间,以便其他通话方参与,通话服务端接收到通话发起方的多人通话请求时,会主动建立一个多人通话间,并将该多人通话间的房间号与密码反馈给通话发起方,由该通话发起方将该多人通话间的房间号和密码转发给各个通话方,以便每一通话方顺利加入该多人通话间。
S320,根据多人通话间内的通话加入请求,确定当前加入的通话方的麦克风类型。
可选的,每一通话方可以在私人的移动设备上配置的通话应用中填写多人通话间的房间号和密码,并点击对应的加入操作,生成对应的通话加入请求发送给通话服务端,此时该通话加入请求中携带有通话方自行选择的是否需要将自身的移动设备作为所在通话区域的主麦克风的信息,进而通话服务端通过解析各个通话方对该多人通话间的通话加入请求,确定该多人通话间内当前加入的各个通话方的麦克风类型,也就是确定每一通话方的移动设备作为主麦克风还是扩展麦克风存在。
S330,对多人通话间内来自同一通话区域的多路通话语音进行综合修正,得到对应的最优通话语音,多路通话语音由处于同一通话区域内的主麦克风和该主麦克风关联的扩展麦克风共同采集。
示例性的,本实施例可以采用如下两种方式对处于同一通话区域内的主麦克风和该主麦克风关联的扩展麦克风共同采集的多路通话语音进行综合修正,从而得到对应的最优通话语音。
1)采用预设语音比对标准在多人通话间内来自同一通话区域的多路通话语音中筛选出语音质量最优的一路通话语音,作为最优通话语音。
具体的,预设语音比对标准可以为对多路通话语音中的语音信噪比、语音能量和语音延时等语音质量指标中的任意一项进行比对,通话服务端在接收到来自同一通话区域的多路通话语音后,会采用预设语音比对标准对多路通话语音中的各项语音质量指标进行比对,进而筛选出语音质量最优的一路通话语音,作为最优通话语音,以提高多人通话之间的语音质量。
2)采用预设语音融合算法对多人通话间内来自同一通话区域的多路通话语音进行融合,将融合后的通话语音作为最优通话语音。
可选的,通话服务端在接收到来自同一通话区域的多路通话语音后,会采用预设语音融合算法对多路通话语音中的各项语音质量指标进行融合,使得融合后的通话语音的语音质量达到最优,进而将融合后的通话语音作为最优通话语音,提高多人通话之间的语音质量。
需要说明的是,本实施例对于预设语音融合算法不作限定,任意一种能够对多路通话语音进行语音融合的信号处理算法即可。
S340,控制处于其他通话区域内的主麦克风播放最优通话语音。
本实施例提供的技术方案,对多人通话间内接收到的处于同一通话区域内的主麦克风和该主麦克风关联的扩展麦克风共同采集的多路通话语音进行综合修正,得到最优通话语音,进而控制处于其他通话区域内的主麦克风播放该最优通话语音,避免多路通话语音的混杂播放,提高多人通话之间的语音质量。
实施例四
图4为本发明实施例四提供的一种实现多人通话的装置的结构示意图,具体的,如图4所示,该装置可以包括:
多路语音修正模块410,用于对多人通话间内来自同一通话区域的多路通话语音进行综合修正,得到对应的最优通话语音,多路通话语音由处于同一通话区域内的主麦克风和该主麦克风关联的扩展麦克风共同采集;
语音播放模块420,用于控制处于其他通话区域内的主麦克风播放最优通话语音。
本实施例提供的技术方案,对多人通话间内接收到的处于同一通话区域内的主麦克风和该主麦克风关联的扩展麦克风共同采集的多路通话语音进行综合修正,得到最优通话语音,进而控制处于其他通话区域内的主麦克风播放该最优通话语音,避免多路通话语音的混杂播放,提高多人通话之间的语音质量。
本实施例提供的实现多人通话的装置可适用于上述任意实施例提供的实现多人通话的方法,具备相应的功能和有益效果。
实施例五
图5为本发明实施例五提供的一种服务器的结构示意图,如图5所示,该服务器包括处理器50、存储装置51和通信装置52;服务器中处理器50的数量可以是一个或多个,图5中以一个处理器50为例;服务器中的处理器50、存储装置51和通信装置52可以通过总线或其他方式连接,图5中以通过总线连接为例。
存储装置51作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明任意实施例所述的实现多人通话的方法对应的程序指令/模块。处理器50通过运行存储在存储装置51中的软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述实现多人通话的方法。
存储装置51可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储装置51可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储装置51可进一步包括相对于处理器50远程设置的存储器,这些远程存储器可以通过网络连接至服务器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
通信装置52可用于实现客户端与服务器之间的网络连接或者移动数据连接。
本实施例提供的一种服务器可用于执行上述任意实施例提供的实现多人通话的方法,具备相应的功能和有益效果。
实施例六
本发明实施例六还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时可实现上述任意实施例中的实现多人通话的方法。
该方法具体可以包括:
对多人通话间内来自同一通话区域的多路通话语音进行综合修正,得到对应的最优通话语音,多路通话语音由处于同一通话区域内的主麦克风和该主麦克风关联的扩展麦克风共同采集;
控制处于其他通话区域内的主麦克风播放最优通话语音。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的实现多人通话的方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述实现多人通话的装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种实现多人通话的方法,其特征在于,包括:
对多人通话间内来自同一通话区域的多路通话语音进行综合修正,得到对应的最优通话语音,所述多路通话语音由处于同一通话区域内的主麦克风和该主麦克风关联的扩展麦克风共同采集;
控制处于其他通话区域内的主麦克风播放所述最优通话语音。
2.根据权利要求1所述的方法,其特征在于,对多人通话间内来自同一通话区域的多路通话语音进行综合修正,得到对应的最优通话语音,包括:
采用预设语音比对标准在多人通话间内来自同一通话区域的多路通话语音中筛选出语音质量最优的一路通话语音,作为所述最优通话语音。
3.根据权利要求1所述的方法,其特征在于,对多人通话间内来自同一通话区域的多路通话语音进行综合修正,得到对应的最优通话语音,包括:
采用预设语音融合算法对多人通话间内来自同一通话区域的多路通话语音进行融合,将融合后的通话语音作为所述最优通话语音。
4.根据权利要求1所述的方法,其特征在于,在对多人通话间内来自同一通话区域的多路通话语音进行综合修正之前,还包括:
确定处于各个通话区域内的主麦克风关联的扩展麦克风。
5.根据权利要求4所述的方法,其特征在于,所述确定处于各个通话区域内的主麦克风关联的扩展麦克风,包括:
针对所述多人通话间内的每一主麦克风,根据该主麦克风和各个扩展麦克风的定位信息,将与该主麦克风处于同一通话区域内的扩展麦克风作为该主麦克风关联的扩展麦克风。
6.根据权利要求4所述的方法,其特征在于,所述确定处于各个通话区域内的主麦克风关联的扩展麦克风,包括:
针对所述多人通话间内的每一扩展麦克风,确定该扩展麦克风加入所述多人通话间时指向的主麦克风,将该扩展麦克风作为所指向的主麦克风关联的扩展麦克风之一。
7.根据权利要求1-6任一项所述的方法,其特征在于,在对多人通话间内来自同一通话区域的多路通话语音进行综合修正之前,还包括:
根据所述多人通话间内的通话加入请求,确定当前加入的通话方的麦克风类型。
8.根据权利要求1-6任一项所述的方法,其特征在于,在对多人通话间内来自同一通话区域的多路通话语音进行综合修正之前,还包括:
根据通话发起方的多人通话请求建立对应的多人通话间。
9.一种实现多人通话的装置,其特征在于,包括:
多路语音修正模块,用于对多人通话间内来自同一通话区域的多路通话语音进行综合修正,得到对应的最优通话语音,所述多路通话语音由处于同一通话区域内的主麦克风和该主麦克风关联的扩展麦克风共同采集;
语音播放模块,用于控制处于其他通话区域内的主麦克风播放所述最优通话语音。
10.一种服务器,其特征在于,所述服务器包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的实现多人通话的方法。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8中任一所述的实现多人通话的方法。
CN202010250718.1A 2020-04-01 2020-04-01 一种实现多人通话的方法、装置、服务器和存储介质 Pending CN111432160A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010250718.1A CN111432160A (zh) 2020-04-01 2020-04-01 一种实现多人通话的方法、装置、服务器和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010250718.1A CN111432160A (zh) 2020-04-01 2020-04-01 一种实现多人通话的方法、装置、服务器和存储介质

Publications (1)

Publication Number Publication Date
CN111432160A true CN111432160A (zh) 2020-07-17

Family

ID=71550851

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010250718.1A Pending CN111432160A (zh) 2020-04-01 2020-04-01 一种实现多人通话的方法、装置、服务器和存储介质

Country Status (1)

Country Link
CN (1) CN111432160A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111986678A (zh) * 2020-09-03 2020-11-24 北京蓦然认知科技有限公司 一种多路语音识别的语音采集方法、装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1716986A (zh) * 2004-06-30 2006-01-04 宝利通公司 用于电信会议的立体声话筒处理
CN106385489A (zh) * 2016-08-31 2017-02-08 维沃移动通信有限公司 一种确定上行语音数据的方法及移动终端
US9942517B1 (en) * 2016-10-04 2018-04-10 Avaya Inc. Multi-mode video conferencing system
CN108449508A (zh) * 2018-03-12 2018-08-24 广东欧珀移动通信有限公司 语音通话处理方法、装置、存储介质及移动终端
CN108540500A (zh) * 2018-07-11 2018-09-14 Oppo(重庆)智能科技有限公司 多人通话的数据传输方法、装置、设备及存储介质
CN111833899A (zh) * 2020-07-27 2020-10-27 腾讯科技(深圳)有限公司 一种基于多音区的语音检测方法、相关装置及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1716986A (zh) * 2004-06-30 2006-01-04 宝利通公司 用于电信会议的立体声话筒处理
CN106385489A (zh) * 2016-08-31 2017-02-08 维沃移动通信有限公司 一种确定上行语音数据的方法及移动终端
US9942517B1 (en) * 2016-10-04 2018-04-10 Avaya Inc. Multi-mode video conferencing system
CN108449508A (zh) * 2018-03-12 2018-08-24 广东欧珀移动通信有限公司 语音通话处理方法、装置、存储介质及移动终端
CN108540500A (zh) * 2018-07-11 2018-09-14 Oppo(重庆)智能科技有限公司 多人通话的数据传输方法、装置、设备及存储介质
CN111833899A (zh) * 2020-07-27 2020-10-27 腾讯科技(深圳)有限公司 一种基于多音区的语音检测方法、相关装置及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111986678A (zh) * 2020-09-03 2020-11-24 北京蓦然认知科技有限公司 一种多路语音识别的语音采集方法、装置
CN111986678B (zh) * 2020-09-03 2023-12-29 杭州蓦然认知科技有限公司 一种多路语音识别的语音采集方法、装置

Similar Documents

Publication Publication Date Title
US9661270B2 (en) Multiparty communications systems and methods that optimize communications based on mode and available bandwidth
US9509953B2 (en) Media detection and packet distribution in a multipoint conference
CN102893603B (zh) 一种视频会议的处理方法、装置和通信系统
CN105812713A (zh) 多人视频会议服务的参与者扩展方法及mcu网关
AU2016201286B2 (en) Method and apparatus for seamlessly implementing transferring dual-party call into conference
CN113596381B (zh) 一种音频数据的采集方法及装置
WO2021174982A1 (zh) 多媒体会议中音频的控制方法和装置
US20190089754A1 (en) System and method for providing audio conference between heterogenious networks
US8948144B1 (en) System and method for creating a preferential ad-hoc network
CN111432160A (zh) 一种实现多人通话的方法、装置、服务器和存储介质
WO2021012780A1 (zh) 一种视频会议控制方法及装置
CN104883460B (zh) 接入基于ip的电话会议的处理方法及装置
CN104396223B (zh) 中继设备选择设备和传输系统
JP7456162B2 (ja) プログラム、通信方法、通信端末および通信システム
US8730944B2 (en) Method and entities for providing call enrichment of voice calls and semantic combination of several service sessions to a virtual combined service session
CN112019791A (zh) 基于教育考试的多方音视频通话方法及系统
CN114554230B (zh) 连麦状态处理方法、装置、终端、计算机设备及存储介质
CN115695387B (zh) 音视频会议实现方法、音视频会议系统及相关装置
JP7243440B2 (ja) 通信端末、通信システム、通信方法およびプログラム
US20230421620A1 (en) Method and system for handling a teleconference
CN115086280A (zh) 音频传输方法、系统及装置
KR100586530B1 (ko) 컴퓨터 전화 통합을 이용한 다자간 화상회의 개설 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200717