CN105100521A - 远程会议中实现有序发言的方法及服务器 - Google Patents

远程会议中实现有序发言的方法及服务器 Download PDF

Info

Publication number
CN105100521A
CN105100521A CN201410204396.1A CN201410204396A CN105100521A CN 105100521 A CN105100521 A CN 105100521A CN 201410204396 A CN201410204396 A CN 201410204396A CN 105100521 A CN105100521 A CN 105100521A
Authority
CN
China
Prior art keywords
frequency information
audio
speech
spokesman
sample sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410204396.1A
Other languages
English (en)
Inventor
周琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201410204396.1A priority Critical patent/CN105100521A/zh
Priority to PCT/CN2014/083233 priority patent/WO2015172435A1/zh
Publication of CN105100521A publication Critical patent/CN105100521A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/563User guidance or feature selection
    • H04M3/566User guidance or feature selection relating to a participants right to speak
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/16Sequence circuits

Abstract

本发明公开一种远程会议中实现有序发言的方法及服务器;本发明实施例服务器接收终端发送的远程会议发言人对应的音频信息;查找预先存储的声音样本数据库,对所述音频信息进行语音识别,获取所述音频信息对应的发言人的发言优先级;根据所述发言人的发言优先级,将所述发言优先级最高的发言人所对应的音频信息作为优先音频信息发送至终端,以使终端播放接收到的所述优先音频信息;解决了远程会议中多人同时发言声音相互干扰的问题,实现了远程会议有序发言的目的,提高了会议效率和人机的可交互性。

Description

远程会议中实现有序发言的方法及服务器
技术领域
本发明涉及通信领域,尤其涉及一种远程会议中实现有序发言的方法及服务器。
背景技术
随着远程会议(如电话会议和视频会议)系统的广泛应用,对远程会议的会议质量、效率和用户体验有了更高的要求,如何使得远程会议能够达到如真实会议一样的效果和用户体验,成为目前亟待解决的一个问题。
现有的远程会议比如视频会议过程中,如果多人同时发言,则会出现多个发言人之间声音相互干扰的问题,导致其他与会人听不清楚发言人所说的话,特别是在网络性能不佳时,其他与会人听到的几乎是一片噪音,严重影响远程会议的会议质量。
发明内容
鉴于以上内容,有必要提供一种远程会议中实现有序发言的方法及服务器,以解决远程会议中多人同时发言所导致的声音相互干扰的问题。
本发明实施例公开了一种远程会议中实现有序发言的方法,包括以下步骤:
接收终端发送的远程会议发言人对应的音频信息;
查找预先存储的声音样本数据库,对所述音频信息进行语音识别,获取所述音频信息对应的发言人的发言优先级;
根据所述发言人的发言优先级,将所述发言优先级最高的发言人所对应的音频信息作为优先音频信息发送至终端,以使终端播放接收到的所述优先音频信息。
优选地,所述根据所述发言人的发言优先级,将所述发言优先级最高的发言人所对应的音频信息作为优先音频信息发送至终端的步骤包括:
所述音频信息对应的发言人为一个时,将所述音频信息作为优先音频信息发送至终端;
所述音频信息对应的发言人至少为两个时,获取每个所述发言人分别对应的发言优先级,将所述发言优先级最高的发言人所对应的音频信息作为优先音频信息发送至终端。
优选地,所述查找预先存储的声音样本数据库,对所述音频信息进行语音识别,获取所述音频信息对应的发言人数量以及发言人对应的发言优先级的步骤之后还包括:
所述音频信息对应的发言人为陌生人时,禁止将所述音频信息发送至终端,并将所述音频信息映射的声音作为噪音处理;
其中,所述陌生人为:所述声音样本数据库中没有存储的声音样本对应的音频信息所映射的发言人。
优选地,所述接收终端发送的远程会议发言人对应的音频信息的步骤之前还包括:
接收终端发送的发言优先级不同的与会人员分别对应的声音样本,并根据所述声音样本创建所述声音样本数据库。
优选地,所述远程会议中实现有序发言的方法还包括:
接收终端发送的新加入远程会议的与会人员对应的新声音样本,将所述新声音样本添加至所述声音样本数据库;其中,所述新声音样本携带对应的发言优先级。
本发明实施例还公开一种远程会议中实现有序发言的服务器,包括:
信息接收模块,用于接收终端发送的远程会议发言人对应的音频信息;
信息识别模块,用于查找预先存储的声音样本数据库,对所述音频信息进行语音识别,获取所述音频信息对应的发言人的发言优先级;
信息处理模块,用于根据所述发言人的发言优先级,将所述发言优先级最高的发言人所对应的音频信息作为优先音频信息发送至终端,以使终端播放接收到的所述优先音频信息。
优选地,所述信息处理模块还用于:
所述音频信息对应的发言人为一个时,将所述音频信息作为优先音频信息发送至终端;
所述音频信息对应的发言人至少为两个时,获取每个所述发言人分别对应的发言优先级,将所述发言优先级最高的发言人所对应的音频信息作为优先音频信息发送至终端。
优选地,所述信息处理模块还用于:
所述音频信息对应的发言人为陌生人时,禁止将所述音频信息发送至终端,并将所述音频信息映射的声音作为噪音处理;
其中,所述陌生人为:所述声音样本数据库中没有存储的声音样本对应的音频信息所映射的发言人。
优选地,所述远程会议中实现有序发言的服务器还包括:
数据库建立模块,用于接收终端发送的发言优先级不同的与会人员分别对应的声音样本,并根据所述声音样本创建所述声音样本数据库。
优选地,所述数据库建立模块还用于:
接收终端发送的新加入远程会议的与会人员对应的新声音样本,将所述新声音样本添加至所述声音样本数据库;其中,所述新声音样本携带对应的发言优先级。
本发明实施例服务器接收终端发送的远程会议发言人对应的音频信息;查找预先存储的声音样本数据库,对所述音频信息进行语音识别,获取所述音频信息对应的发言人的发言优先级;根据所述发言人的发言优先级,将所述发言优先级最高的发言人所对应的音频信息作为优先音频信息发送至终端,以使终端播放接收到的所述优先音频信息;解决了远程会议中多人同时发言声音相互干扰的问题,实现了远程会议有序发言的目的,提高了会议效率和人机的可交互性。
附图说明
图1是本发明远程会议中实现有序发言的方法及服务器的运行环境一实施例系统架构示意图;
图2是本发明远程会议中实现有序发言的方法第一实施例流程示意图;
图3是本发明远程会议中实现有序发言的方法第二实施例流程示意图;
图4是本发明远程会议中实现有序发言的方法第三实施例流程示意图;
图5是本发明远程会议中实现有序发言的服务器第一实施例功能模块示意图;
图6是本发明远程会议中实现有序发言的服务器第二实施例功能模块示意图。
本发明实施例目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
以下结合说明书附图及具体实施例进一步说明本发明的技术方案。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施本发明远程会议中实现有序发言的方法以及远程会议中实现有序发言的服务器的运行环境中,服务器可以部署为云服务器,与服务器进行交互的终端可以部署为云终端;所述远程会议包括电视会议、电话会议等远程音频会议和远程视频会议。
如图1所示,本发明远程会议中实现有序发言的方法及服务器的运行环境中,服务器100与多个终端200(图1中仅以2个终端示例)进行数据交互,实现不在同一地理位置的各与会人员之间基于服务器100和终端200进行远程会议。本实施例中,终端200与服务器100通过互联网建立通信,构建远程会议的实施环境。当远程会议实施环境部署完毕后,终端200实时检测是否有用户触发了声音采集指令。当终端200检测到用户触发了声音采集指令,比如用户通过终端麦克风发言,则终端200采集发言人的音频信息,并将采集的音频信息发送至服务器100。由于服务器100与多个终端200进行数据交互,因此,在同一时刻服务器100可能接收到多个终端200发送的音频信息。在同时接收到多个终端200发送的音频信息时,服务器100根据接收到的音频信息,查找声音样本数据库,识别所接收的多个终端200分别对应的发言人的发言优先级;将发言优先级最高的发言人对应的音频信息作为本次采集的音频信息中的优先音频信息,并将该优先音频信息下发至各终端200,同时屏蔽接收到的其他音频信息。各终端200接收到服务器100下发的优先音频信息后,播放所接收的上述优先音频信息;从而达到远程会议中有序发言的目的,避免了远程会议中当多个发言人同时发言所带来的声音干扰。
本发明还提供了一种远程会议中实现有序发言的方法第一实施例;基于图1所述实施例的描述,如图2所示,本发明远程会议中实现有序发言的方法包括以下步骤:
步骤S01、接收终端发送的远程会议发言人对应的音频信息;
在远程会议运行环境中,终端实时检测用户触发的操作指令。当终端检测到用户触发了声音采集指令(比如,用户通过麦克风讲话),或者接收到用户发送的声音信息时,终端采集用户对应的音频信息;并将采集的音频信息发送至服务器,服务器接收终端发送的远程会议发言人对应的音频信息。
本发明实施例中,服务器接收的终端发送的上述音频信息也有可能不是本次远程会议对应的与会人员讲话所对应的音频信息,但服务器均将接收到的远程会议终端发送的所有音频信息认为是远程会议与会人员对应的音频信息;并在后续对上述音频信息进行识别时,再判断上述音频信息是否为本次远程会议与会人员所发出的声音对应的音频信息。
步骤S02、查找预先存储的声音样本数据库,对所述音频信息进行语音识别,获取所述音频信息对应的发言人的发言优先级;
服务器接收到终端发送的远程会议发言人对应的音频信息时,查找预先存储的声音样本数据库,识别声音样本数据库中是否存储有上述音频信息所对应的声音样本。本实施例中,所述声音样本数据库中存储了本次远程会议所有与会人员对应的声音样本。服务器对接收到的上述音频信息进行语音识别,从声音样本数据库中找到上述音频信息对应的声音样本,从而根据查找的声音样本,获取上述音频信息对应的发言人的优先等级。比如,服务器每间隔100毫秒对接收到的音频信息与声音样本数据库进行一次比对。
本领域的技术人员可以理解,由于不同的人声音不同,也就是说,可以根据人的音色来区分不同的发言人;因此,服务器在声音样本数据库中找到上述音频信息对应的声音样本时,即可确定该声音样本对应的发言人,进而便可获取上述音频信息对应的发言人的发言优先级。另外,在服务器获取上述音频信息对应的发言人的发言优先级的同时,也能够获取到上述音频信息对应的发言人的数量等其他相关信息。
步骤S03、根据所述发言人的发言优先级,将所述发言优先级最高的发言人所对应的音频信息作为优先音频信息发送至终端,以使终端播放接收到的所述优先音频信息。
服务器根据获取的发言人的发言优先级,找出发言优先级最高的发言人所对应的音频信息,并将发言优先级最高的发言人所对应的音频信息作为优先音频信息;服务器将找出的优先音频信息发送至各个终端,从而由各个终端播放服务器发送的上述优先音频信息,避免了多个发言人同时发言所带来的声音干扰问题。
在本发明一优选实施例中,当服务器识别出接收到的音频信息仅对应一个发言人时,直接将该音频信息发送至终端。当服务器识别出接收到的音频信息对应多个发言人时,再识别出各音频信息对应声音样本的发言优先级,并找出上述发言优先级中优先级最高的发言优先级,将最高发言优先级对应的音频信息发送至终端。
进一步地,为了降低声音播放时噪音干扰、提高终端播放声音的清晰度,服务器将优先音频信息进行过滤噪音等降噪处理后再下发至各终端。
本发明实施例服务器接收终端发送的远程会议发言人对应的音频信息;查找预先存储的声音样本数据库,对所述音频信息进行语音识别,获取所述音频信息对应的发言人的发言优先级;根据所述发言人的发言优先级,将所述发言优先级最高的发言人所对应的音频信息作为优先音频信息发送至终端,以使终端播放接收到的所述优先音频信息;解决了远程会议中多人同时发言声音相互干扰的问题,实现了远程会议有序发言的目的,提高了会议效率和人机的可交互性。
本发明还提供了一种远程会议中实现有序发言的方法第二实施;本实施例与图2所述实施例的区别是,服务器识别终端发送的音频信息对应的声音样本不在声音样本数据库时,所执行的操作。
基于图1、图2所述实施例的描述,如图3所示,本发明远程会议中实现有序发言的方法在图2所述实施例的“步骤S02、查找预先存储的声音样本数据库,对所述音频信息进行语音识别,获取所述音频信息对应的发言人的发言优先级”之后还包括:
步骤S13、所述音频信息对应的发言人为陌生人时,禁止将所述音频信息发送至终端,并将所述音频信息对应的声音作为噪音处理;
本实施例中,服务器对接收到的终端发送的音频信息进行语音识别,查找声音样本数据库,识别是否能够找到上述音频信息对应的声音样本;服务器在声音样本数据库中不能找到上述音频信息对应的声音样本时,服务器识别出上述音频信息对应的发言人为陌生人,即该音频信息对应的发言人的声音样本没有存储在声音样本数据库中。服务器识别出上述音频信息对应的发言人为陌生人时,服务器禁止将上述音频信息发送至终端,并将上述音频信息对应的声音作为噪音进行处理。
本实施例中,所述陌生人可以理解为:所述声音样本数据库中没有存储的声音样本所对应的音频信息映射的发言人;也就是说,所述陌生人对应的音频信息所映射的声音样本不在所述声音样本数据库中。本领域的技术人员可以理解,由于声音样本数据库中存储了本次远程会议所有与会人员对应的声音样本,因此,当服务器在上述声音样本数据库中找不到音频信息对应的声音样本时,便识别出上述音频信息来自于非本次远程会议与会人员的陌生人,则服务器将上述音频信息对应的声音作噪音处理。
本发明实施例服务器识别出接收的音频信息为来自陌生人时,直接将上述音频信息对应的声音进行噪音处理;并自动屏蔽发言优先级低的发言人的声音,降低了远程会议的噪音干扰,避免了声音混杂。
本发明还提供了一种远程会议中实现有序发言的方法第三实施例;本实施例与图2、图3所示实施例的区别是,在远程会议正式开始之前,服务器根据终端发送的声音样本,建立所述声音样本数据库。本实施例以与图2所述实施例的区别为例进行描述。
基于图1、图2和图3所述实施例的描述,如图4所示,本发明远程会议中实现有序发言的方法中,在图2所述实施例的“步骤S01、接收终端发送的远程会议发言人对应的音频信息”的步骤之前还包括:
步骤S11、接收终端发送的发言优先级不同的与会人员分别对应的声音样本,并根据所述声音样本创建所述声音样本数据库。
本实施例中,在组建好远程会议运行的硬件环境之后,在正式开始进行远程会议之前,终端根据用户触发的配置指令,基于不同的发言优先级,分别录制各发言优先级对应的参与本次远程会议的各与会人员的声音样本,并将录制的上述声音样本发送至服务器。服务器将接收终端发送的发言优先级不同的与会人员分别对应的声音样本,根据接收的上述声音样本,服务器建立所述声音样本数据库。其中,终端发送的声音样本中,各声音样本的优先级是对与会人员的身份进行加权得到的。终端根据用户触发的操作指令来确定各与会人员身份权重的高低。通常情况下,与会人员的身份权重越高,其发言的优先级越高。
进一步地,本发明实施例中,在远程会议进行过程中,该远程会议可随时添加与会人员。终端检测到用户触发的配置指令时,响应上述配置指令,录制新加入本次远程会议的与会人员在某一发言优先级所对应的新声音样本,并将录制的新声音样本发送至服务器;其中,录制的新声音样本携带对应的发言优先级。服务器接收终端发送的新加入远程会议的与会人对应的新声音样本,并将所述新声音样本添加至所述声音样本数据库;其中,服务器接收的所述新声音样本在录制时已配置有对应的发言优先级。在本发明一优选实施例中,为了降低服务器的数据存储压力,服务器存储的声音样本仅在本次远程会议中有效,一旦服务器接收到本次远程会议结束的操作指令,则服务器便将本次远程会议对应的所述声音样本数据库删除。
下面以具体的应用场景为例,再次描述本发明远程会议中实现有序发言的方法中,服务器及终端进行数据交互,建立声音样本数据库的实现过程。
服务器根据用户的设置指令,设置远程会议中各个角色对应的发言优先级;比如,默认情况下,服务器对与会人员身份进行加权,权重由高到低依次分为:领导身份、主持人身份、专家身份、普通参与人员身份,则领导身份对应的发言优先级最高,主持人身份对应的发言优先级第二,专家身份对应的发言优先级第三,普通参与人员身份对应的发言优先级;而每种身份里又可以设置多位人员,如领导1、领导2,且发言优先级领导1高于领导2,以此类推等。
服务器接收并存储终端发送的与会人员的声音样本比如声音数据信息,终端对上述声音样本的采集方式包括:由本次远程会议的主持人选择身份定义功能,对应领导、主持人、专家、普通参与人员身份,依次请相关人员向与会人员打招呼,此时通过终端(比如,通过终端麦克风上的声音采集装置)分别采集每个人的声音制作声音样本,用于后续服务器根据上述声音样本建立声音样本数据库,从而进行声音比对并进行身份识别。这样本次远程会议的每个与会人员的发言优先级就定义成功了,便可以正式开始远程音频或者视频会议。
本发明实施例服务器建立对应于不同发言优先级的声音样本数据库,具有提高声音传输清晰度的有益效果。
本发明还提供了一种远程会议中实现有序发言的服务器第一实施例;如图5所示,本发明远程会议中实现有序发言的服务器包括:信息接收模块01、信息识别模块02和信息处理模块03。
信息接收模块01,用于接收终端发送的远程会议发言人对应的音频信息;
在远程会议运行环境中,终端实时检测用户触发的操作指令。当终端检测到用户触发了声音采集指令(比如,用户通过麦克风讲话),或者接收到用户发送的声音信息时,终端采集用户对应的音频信息;并将采集的音频信息发送至服务器,服务器的信息接收模块01接收终端发送的远程会议发言人对应的音频信息。
本发明实施例中,信息接收模块01接收的终端发送的上述音频信息也有可能不是本次远程会议对应的与会人员讲话所对应的音频信息,但信息接收模块01均将接收到的远程会议终端发送的所有音频信息认为是远程会议与会人员对应的音频信息;服务器在后续对上述音频信息进行识别时,再判断上述音频信息是否为本次远程会议与会人员所发出的声音对应的音频信息。
信息识别模块02,用于查找预先存储的声音样本数据库,对所述音频信息进行语音识别,获取所述音频信息对应的发言人的发言优先级;
信息接收模块01接收到终端发送的远程会议发言人对应的音频信息时,信息识别模块02查找预先存储的声音样本数据库,识别声音样本数据库中是否存储有上述音频信息所对应的声音样本。本实施例中,所述声音样本数据库中存储了本次远程会议所有与会人员对应的声音样本。信息识别模块02对信息接收模块01接收到的上述音频信息进行语音识别,从声音样本数据库中找到上述音频信息对应的声音样本,从而根据查找的声音样本,获取上述音频信息对应的发言人的优先等级。比如,信息识别模块02每间隔100毫秒对接收到的音频信息与声音样本数据库进行一次比对。
本领域的技术人员可以理解,由于不同的人声音不同,也就是说,可以根据人的音色来区分不同的发言人;因此,信息识别模块02在声音样本数据库中找到上述音频信息对应的声音样本时,即可确定该声音样本对应的发言人,进而便可获取上述音频信息对应的发言人的发言优先级。另外,在信息识别模块02获取上述音频信息对应的发言人的发言优先级的同时,也能够获取到上述音频信息对应的发言人的数量等其他相关信息。
信息处理模块03,用于根据所述发言人的发言优先级,将所述发言优先级最高的发言人所对应的音频信息作为优先音频信息发送至终端,以使终端播放接收到的所述优先音频信息。
根据信息识别模块02获取的发言人的发言优先级,信息处理模块03找出发言优先级最高的发言人所对应的音频信息,并将发言优先级最高的发言人所对应的音频信息作为优先音频信息;信息处理模块03将找出的优先音频信息发送至各个终端,从而由各个终端播放服务器发送的上述优先音频信息,避免了多个发言人同时发言所带来的声音干扰问题。
在本发明一优选实施例中,当信息识别模块02识别出接收到的音频信息仅对应一个发言人时,信息处理模块03直接将该音频信息发送至终端。当信息识别模块02识别出接收到的音频信息对应多个发言人时,信息处理模块03再识别出各音频信息对应声音样本的发言优先级,并找出上述发言优先级中优先级最高的发言优先级,将最高发言优先级对应的音频信息发送至终端。
进一步地,为了降低声音播放时噪音干扰、提高终端播放声音的清晰度,信息处理模块03将优先音频信息进行过滤噪音等降噪处理后再下发至各终端。
本发明实施例服务器接收终端发送的远程会议发言人对应的音频信息;查找预先存储的声音样本数据库,对所述音频信息进行语音识别,获取所述音频信息对应的发言人的发言优先级;根据所述发言人的发言优先级,将所述发言优先级最高的发言人所对应的音频信息作为优先音频信息发送至终端,以使终端播放接收到的所述优先音频信息;解决了远程会议中多人同时发言声音相互干扰的问题,实现了远程会议有序发言的目的,提高了会议效率和人机的可交互性。
请继续参照图5,本发明远程会议中实现有序发言的服务器中,所述信息处理模块03还用于:
所述音频信息对应的发言人为陌生人时,禁止将所述音频信息发送至终端,并将所述音频信息映射的声音作为噪音处理;其中,所述陌生人为:所述声音样本数据库中没有存储的声音样本对应的音频信息所映射的发言人。
本实施例中,信息识别模块02对信息接收模块01接收到的终端发送的音频信息进行语音识别,查找声音样本数据库,识别是否能够找到上述音频信息对应的声音样本;信息识别模块02在声音样本数据库中不能找到上述音频信息对应的声音样本时,信息识别模块02识别出上述音频信息对应的发言人为陌生人,即该音频信息对应的发言人的声音样本没有存储在声音样本数据库中。信息识别模块02识别出上述音频信息对应的发言人为陌生人时,信息处理模块03禁止将上述音频信息发送至终端,并将上述音频信息对应的声音作为噪音进行处理。
本实施例中,所述陌生人可以理解为:所述声音样本数据库中没有存储的声音样本所对应的音频信息映射的发言人;也就是说,所述陌生人对应的音频信息所映射的声音样本不在所述声音样本数据库中。本领域的技术人员可以理解,由于声音样本数据库中存储了本次远程会议所有与会人员对应的声音样本,因此,当信息识别模块02在上述声音样本数据库中找不到音频信息对应的声音样本时,便识别出上述音频信息来自于非本次远程会议与会人员的陌生人,则信息处理模块03将上述音频信息对应的声音作噪音处理。
本发明实施例服务器识别出接收的音频信息为来自陌生人时,直接将上述音频信息对应的声音进行噪音处理;并自动屏蔽发言优先级低的发言人的声音,降低了远程会议的噪音干扰,避免了声音混杂。
本发明实施例还提供了一种远程会议中实现有序发言的服务器第二实施例;本实施例与图5所示实施例的区别是,在远程会议正式开始之前,服务器根据终端发送的声音样本,建立所述声音样本数据库。
基于图5所述实施例的描述,如图6所示,本发明远程会议中实现有序发言的服务器还包括:
数据库建立模块04,用于接收终端发送的发言优先级不同的与会人员分别对应的声音样本,并根据所述声音样本创建所述声音样本数据库。
本实施例中,在组建好远程会议运行的硬件环境之后,在正式开始进行远程会议之前,终端根据用户触发的配置指令,基于不同的发言优先级,分别录制各发言优先级对应的参与本次远程会议的各与会人员的声音样本,并将录制的上述声音样本发送至服务器。数据库建立模块04将接收终端发送的发言优先级不同的与会人员分别对应的声音样本,根据接收的上述声音样本,服务器建立所述声音样本数据库。其中,终端发送的声音样本中,各声音样本的优先级是对与会人员的身份进行加权得到的。终端根据用户触发的操作指令来确定各与会人员身份权重的高低。通常情况下,与会人员的身份权重越高,其发言的优先级越高。
进一步地,本发明实施例中,在远程会议进行过程中,该远程会议可随时添加与会人员。终端检测到用户触发的配置指令时,响应上述配置指令,录制新加入本次远程会议的与会人员在某一发言优先级所对应的新声音样本,并将录制的新声音样本发送至服务器;其中,录制的新声音样本携带对应的发言优先级。数据库建立模块04接收终端发送的新加入远程会议的与会人对应的新声音样本,并将所述新声音样本添加至所述声音样本数据库;其中,数据库建立模块04接收的所述新声音样本在录制时已配置有对应的发言优先级。在本发明一优选实施例中,为了降低服务器的数据存储压力,数据库建立模块04存储的声音样本仅在本次远程会议中有效,一旦服务器接收到本次远程会议结束的操作指令,则数据库建立模块04便将本次远程会议对应的所述声音样本数据库删除。
下面以具体的应用场景为例,再次描述本发明远程会议中实现有序发言的方法中,服务器及终端进行数据交互,建立声音样本数据库的实现过程。
数据库建立模块04根据用户的设置指令,设置远程会议中各个角色对应的发言优先级;比如,默认情况下,数据库建立模块04对与会人员身份进行加权,权重由高到低依次分为:领导身份、主持人身份、专家身份、普通参与人员身份,则领导身份对应的发言优先级最高,主持人身份对应的发言优先级第二,专家身份对应的发言优先级第三,普通参与人员身份对应的发言优先级;而每种身份里又可以设置多位人员,如领导1、领导2,且发言优先级领导1高于领导2,以此类推等。
数据库建立模块04接收并存储终端发送的与会人员的声音样本比如声音数据信息,终端对上述声音样本的采集方式包括:由本次远程会议的主持人选择身份定义功能,对应领导、主持人、专家、普通参与人员身份,依次请相关人员向与会人员打招呼,此时通过终端(比如,通过终端麦克风上的声音采集装置)分别采集每个人的声音制作声音样本,用于后续服务器的数据库建立模块04根据上述声音样本建立声音样本数据库,从而进行声音比对并进行身份识别。这样本次远程会议的每个与会人员的发言优先级就定义成功了,便可以正式开始远程音频或者视频会议。
本发明实施例服务器建立对应于不同发言优先级的声音样本数据库,具有提高声音传输清晰度的有益效果。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述仅为本发明的优选实施例,并非因此限制其专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种远程会议中实现有序发言的方法,其特征在于,包括以下步骤:
接收终端发送的远程会议发言人对应的音频信息;
查找预先存储的声音样本数据库,对所述音频信息进行语音识别,获取所述音频信息对应的发言人的发言优先级;
根据所述发言人的发言优先级,将所述发言优先级最高的发言人所对应的音频信息作为优先音频信息发送至终端,以使终端播放接收到的所述优先音频信息。
2.如权利要求1所述的方法,其特征在于,所述根据所述发言人的发言优先级,将所述发言优先级最高的发言人所对应的音频信息作为优先音频信息发送至终端的步骤包括:
所述音频信息对应的发言人为一个时,将所述音频信息作为优先音频信息发送至终端;
所述音频信息对应的发言人至少为两个时,获取每个所述发言人分别对应的发言优先级,将所述发言优先级最高的发言人所对应的音频信息作为优先音频信息发送至终端。
3.如权利要求1所述的方法,其特征在于,所述查找预先存储的声音样本数据库,对所述音频信息进行语音识别,获取所述音频信息对应的发言人的发言优先级的步骤之后还包括:
所述音频信息对应的发言人为陌生人时,禁止将所述音频信息发送至终端,并将所述音频信息映射的声音作为噪音处理;
其中,所述陌生人为:所述声音样本数据库中没有存储的声音样本对应的音频信息所映射的发言人。
4.如权利要求1-3任一项所述的方法,其特征在于,所述接收终端发送的远程会议发言人对应的音频信息的步骤之前还包括:
接收终端发送的发言优先级不同的与会人员分别对应的声音样本,并根据所述声音样本创建所述声音样本数据库。
5.如权利要求4所述的方法,其特征在于,还包括:
接收终端发送的新加入远程会议的与会人员对应的新声音样本,将所述新声音样本添加至所述声音样本数据库;其中,所述新声音样本携带对应的发言优先级。
6.一种远程会议中实现有序发言的服务器,其特征在于,包括:
信息接收模块,用于接收终端发送的远程会议发言人对应的音频信息;
信息识别模块,用于查找预先存储的声音样本数据库,对所述音频信息进行语音识别,获取所述音频信息对应的发言人的发言优先级;
信息处理模块,用于根据所述发言人的发言优先级,将所述发言优先级最高的发言人所对应的音频信息作为优先音频信息发送至终端,以使终端播放接收到的所述优先音频信息。
7.如权利要求6所述的服务器,其特征在于,所述信息处理模块还用于:
所述音频信息对应的发言人为一个时,将所述音频信息作为优先音频信息发送至终端;
所述音频信息对应的发言人至少为两个时,获取每个所述发言人分别对应的发言优先级,将所述发言优先级最高的发言人所对应的音频信息作为优先音频信息发送至终端。
8.如权利要求6所述的服务器,其特征在于,所述信息处理模块还用于:
所述音频信息对应的发言人为陌生人时,禁止将所述音频信息发送至终端,并将所述音频信息映射的声音作为噪音处理;
其中,所述陌生人为:所述声音样本数据库中没有存储的声音样本对应的音频信息所映射的发言人。
9.如权利要求6-8任一项所述的服务器,其特征在于,还包括:
数据库建立模块,用于接收终端发送的发言优先级不同的与会人员分别对应的声音样本,并根据所述声音样本创建所述声音样本数据库。
10.如权利要求9所述的服务器,其特征在于,所述数据库建立模块还用于:
接收终端发送的新加入远程会议的与会人员对应的新声音样本,将所述新声音样本添加至所述声音样本数据库;其中,所述新声音样本携带对应的发言优先级。
CN201410204396.1A 2014-05-14 2014-05-14 远程会议中实现有序发言的方法及服务器 Pending CN105100521A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201410204396.1A CN105100521A (zh) 2014-05-14 2014-05-14 远程会议中实现有序发言的方法及服务器
PCT/CN2014/083233 WO2015172435A1 (zh) 2014-05-14 2014-07-29 远程会议中实现有序发言的方法及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410204396.1A CN105100521A (zh) 2014-05-14 2014-05-14 远程会议中实现有序发言的方法及服务器

Publications (1)

Publication Number Publication Date
CN105100521A true CN105100521A (zh) 2015-11-25

Family

ID=54479218

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410204396.1A Pending CN105100521A (zh) 2014-05-14 2014-05-14 远程会议中实现有序发言的方法及服务器

Country Status (2)

Country Link
CN (1) CN105100521A (zh)
WO (1) WO2015172435A1 (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105706442A (zh) * 2016-01-19 2016-06-22 王晓光 一种视频网络会议的麦克控制方法及系统
CN106375283A (zh) * 2016-08-29 2017-02-01 苏州千阙传媒有限公司 一种多会议数据快速定位及选择系统
CN106445654A (zh) * 2016-08-31 2017-02-22 北京康力优蓝机器人科技有限公司 确定响应控制命令优先顺序的方法及装置
CN106878230A (zh) * 2015-12-10 2017-06-20 中国电信股份有限公司 网络电话会议中的音频处理方法、服务器以及系统
CN107360128A (zh) * 2016-05-03 2017-11-17 三星Sds株式会社 会议服务提供方法及其装置
CN107580191A (zh) * 2017-09-06 2018-01-12 合肥庆响网络科技有限公司 远程会议系统
CN107749313A (zh) * 2017-11-23 2018-03-02 郑州大学第附属医院 一种自动转写与生成远程医疗会诊记录的方法
CN108595645A (zh) * 2018-04-26 2018-09-28 深圳市鹰硕技术有限公司 会议发言管理方法以及装置
CN108769568A (zh) * 2016-01-20 2018-11-06 杭州虹晟信息科技有限公司 视频网络会议的人物识别系统
CN109302576A (zh) * 2018-09-05 2019-02-01 视联动力信息技术股份有限公司 会议处理方法和装置
CN110099241A (zh) * 2018-01-31 2019-08-06 北京视联动力国际信息技术有限公司 一种音视频流的传输方法及装置
CN110266996A (zh) * 2019-06-17 2019-09-20 国家电网有限公司 视频会议控制方法、装置及终端设备
CN110324723A (zh) * 2018-03-29 2019-10-11 华为技术有限公司 字幕生成方法及终端
WO2019242726A1 (zh) * 2018-06-22 2019-12-26 中兴通讯股份有限公司 一种会议控制方法及多点控制单元
CN111753769A (zh) * 2020-06-29 2020-10-09 歌尔科技有限公司 终端音频采集控制方法、电子设备及可读存储介质
WO2021031575A1 (zh) * 2019-08-20 2021-02-25 华为技术有限公司 媒体能力动态调整方法及装置
CN112862461A (zh) * 2021-03-03 2021-05-28 游密科技(深圳)有限公司 会议进程控制方法、装置、服务器及存储介质
CN113596381A (zh) * 2021-07-01 2021-11-02 海南视联通信技术有限公司 一种音频数据的采集方法及装置
CN114222031A (zh) * 2021-12-21 2022-03-22 瑞德电子(信丰)有限公司 网络音频插座双向音频数据传输方法
CN116939150A (zh) * 2023-09-14 2023-10-24 北京橙色风暴数字技术有限公司 一种基于机器视觉的多媒体平台监测系统及方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112468760A (zh) * 2020-09-29 2021-03-09 南京熊猫电子股份有限公司 一种高清移动视频设备进行视频会商的调度系统及其方法
CN112468762B (zh) * 2020-11-03 2024-04-02 视联动力信息技术股份有限公司 一种发言方的切换方法、装置、终端设备和存储介质
US11652857B2 (en) * 2020-12-10 2023-05-16 Verizon Patent And Licensing Inc. Computerized system and method for video conferencing priority and allocation using mobile edge computing
CN112950424B (zh) * 2021-03-04 2023-12-19 深圳市鹰硕技术有限公司 在线教育互动方法以及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8971511B2 (en) * 2006-03-31 2015-03-03 Cisco Technology, Inc. Method and apparatus for enhancing speaker selection
US8290134B2 (en) * 2007-07-26 2012-10-16 International Business Machines Corporation Managing conference calls via a talk queue
CN102036166A (zh) * 2009-09-25 2011-04-27 普天信息技术研究院有限公司 一种数字集群通信系统中的话权管理方法
US8929529B2 (en) * 2012-06-29 2015-01-06 International Business Machines Corporation Managing voice collision in multi-party communications

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106878230A (zh) * 2015-12-10 2017-06-20 中国电信股份有限公司 网络电话会议中的音频处理方法、服务器以及系统
CN105706442A (zh) * 2016-01-19 2016-06-22 王晓光 一种视频网络会议的麦克控制方法及系统
CN109299680A (zh) * 2016-01-20 2019-02-01 杭州虹晟信息科技有限公司 视频网络会议的人物识别方法
CN108769568A (zh) * 2016-01-20 2018-11-06 杭州虹晟信息科技有限公司 视频网络会议的人物识别系统
CN107360128A (zh) * 2016-05-03 2017-11-17 三星Sds株式会社 会议服务提供方法及其装置
CN106375283A (zh) * 2016-08-29 2017-02-01 苏州千阙传媒有限公司 一种多会议数据快速定位及选择系统
CN106375283B (zh) * 2016-08-29 2019-10-22 上海倍增智能科技有限公司 一种多会议数据快速定位及选择系统
CN106445654A (zh) * 2016-08-31 2017-02-22 北京康力优蓝机器人科技有限公司 确定响应控制命令优先顺序的方法及装置
CN106445654B (zh) * 2016-08-31 2019-06-11 北京康力优蓝机器人科技有限公司 确定响应控制命令优先顺序的方法及装置
CN107580191A (zh) * 2017-09-06 2018-01-12 合肥庆响网络科技有限公司 远程会议系统
CN107749313A (zh) * 2017-11-23 2018-03-02 郑州大学第附属医院 一种自动转写与生成远程医疗会诊记录的方法
CN107749313B (zh) * 2017-11-23 2019-03-01 郑州大学第一附属医院 一种自动转写与生成远程医疗会诊记录的方法
CN110099241A (zh) * 2018-01-31 2019-08-06 北京视联动力国际信息技术有限公司 一种音视频流的传输方法及装置
CN110324723A (zh) * 2018-03-29 2019-10-11 华为技术有限公司 字幕生成方法及终端
CN108595645A (zh) * 2018-04-26 2018-09-28 深圳市鹰硕技术有限公司 会议发言管理方法以及装置
CN108595645B (zh) * 2018-04-26 2020-10-30 深圳市鹰硕技术有限公司 会议发言管理方法以及装置
WO2019242726A1 (zh) * 2018-06-22 2019-12-26 中兴通讯股份有限公司 一种会议控制方法及多点控制单元
CN109302576A (zh) * 2018-09-05 2019-02-01 视联动力信息技术股份有限公司 会议处理方法和装置
CN109302576B (zh) * 2018-09-05 2020-08-25 视联动力信息技术股份有限公司 会议处理方法和装置
CN110266996A (zh) * 2019-06-17 2019-09-20 国家电网有限公司 视频会议控制方法、装置及终端设备
WO2021031575A1 (zh) * 2019-08-20 2021-02-25 华为技术有限公司 媒体能力动态调整方法及装置
CN111753769A (zh) * 2020-06-29 2020-10-09 歌尔科技有限公司 终端音频采集控制方法、电子设备及可读存储介质
CN112862461A (zh) * 2021-03-03 2021-05-28 游密科技(深圳)有限公司 会议进程控制方法、装置、服务器及存储介质
CN113596381A (zh) * 2021-07-01 2021-11-02 海南视联通信技术有限公司 一种音频数据的采集方法及装置
CN114222031A (zh) * 2021-12-21 2022-03-22 瑞德电子(信丰)有限公司 网络音频插座双向音频数据传输方法
CN116939150A (zh) * 2023-09-14 2023-10-24 北京橙色风暴数字技术有限公司 一种基于机器视觉的多媒体平台监测系统及方法
CN116939150B (zh) * 2023-09-14 2023-11-24 北京橙色风暴数字技术有限公司 一种基于机器视觉的多媒体平台监测系统及方法

Also Published As

Publication number Publication date
WO2015172435A1 (zh) 2015-11-19

Similar Documents

Publication Publication Date Title
CN105100521A (zh) 远程会议中实现有序发言的方法及服务器
EP2991325A1 (en) Remote conference realizing method and apparatus
CN105979197A (zh) 基于啸叫音自动识别的远程会议控制方法及装置
CN102917105A (zh) 呼叫信息处理方法和终端设备
EP2526507A1 (en) Meeting room participant recogniser
CN111683183B (zh) 一种多媒体会议非参会对话屏蔽处理方法及其系统
CN110289016A (zh) 一种基于实时对话的语音质检方法、装置及电子设备
CN111199751B (zh) 一种麦克风的屏蔽方法、装置和电子设备
CN104751848A (zh) 通话声音识别方法及装置
CN105389318A (zh) 一种信息处理方法及电子设备
CN101888601A (zh) 一种彩铃业务系统和彩铃业务的屏蔽方法
CN104618616A (zh) 基于语音特征提取的电话会议与会者身份识别系统及方法
US9812131B2 (en) Identifying and displaying call participants using voice sample
US20230162738A1 (en) Communication transfer between devices
CN204231479U (zh) 一种智能会议电话机
WO2016045446A1 (zh) 语音提醒信息的生成、语音提醒方法及装置
CN103606374A (zh) 一种瘦终端的噪音消除和回声抑制方法及装置
CN105657156A (zh) 一种来电铃声定制的方法及终端
CN105704327A (zh) 一种拒接电话的方法及系统
CN106302950A (zh) 一种通话验证方法、装置及移动终端
US20200184973A1 (en) Transcription of communications
US11783837B2 (en) Transcription generation technique selection
CN104363406A (zh) 移动终端视频通信实现方法及装置
CN112261214A (zh) 网络语音通信自动化测试方法及系统
CN113808592A (zh) 通话录音的转写方法及装置、电子设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20151125

RJ01 Rejection of invention patent application after publication