CN112788280A

CN112788280A - 基于云计算和语音特征分析的智能会议媒体管理云平台

Info

Publication number: CN112788280A
Application number: CN202110066780.XA
Authority: CN
Inventors: 李成隆; 王亮
Original assignee: Individual
Current assignee: Individual
Priority date: 2021-01-19
Filing date: 2021-01-19
Publication date: 2021-05-11

Abstract

本发明公开基于云计算和语音特征分析的智能会议媒体管理云平台，包括信息登录模块、图像采集模块、图像预处理模块、空间体积检测模块、平面坐标划分模块和云平台，通过图像采集模块采集会议室内参会人员的图像信息确定参会人员的总人数，通过空间体积检测模块确定会议室内的空间体积大小，并通过平面坐标划分模块确定参会人员的位置信息，结合云服务器统计会议室内的人口密度和发言者与其他参会人员的距离，进而统计分析出语音调控系数，对发言者的语音音量进行调控，具有智能型高以及可靠性高的特点，大大提高了参会人员的舒适度，并且降低了人力成本，提高了语音调节的效率，大大减少了语音调控的时间。

Description

基于云计算和语音特征分析的智能会议媒体管理云平台

技术领域

本发明属于智能会议技术领域，具体涉及到基于云计算和语音特征分析的智能会议媒体管理云平台。

背景技术

随着科技与社会快速发展，人们在日常生活和工作中接触的信息量越来越大，因此人们之间的信息交流和沟通也就变得越来越频繁、越来越重要，会议室也就成为了信息交流和业务谈判等活动的重要场所，目前简单的会议室已经无法满足客户对高效率会议环境的要求，所以先进的智能会议媒体管理平台是当今各行业会议室的必备平台。语音系统作为会议室的重要组成部分，在会议前需要对会议室的语音系统进行充分的调节，以保证会议的正常进行。

在现有技术中,现有的语音系统的音量调节多为人工进行手动调节,手动调节时的幅度不方便控制,并且手动调节需要消耗时间多,有时距离发言者近的参会人员听到声音过大，距离发言者远的参会人员听到声音又会过小，无法实现对发言者输出声音的智能调节，降低了参会人员的舒适度，并且在会议开展的同时，无法对发言者的语音内容进行实时记录存储。

发明内容

针对上述问题，本发明提出基于云计算和语音特征分析的智能会议媒体管理云平台，通过图像采集模块采集会议室内参会人员的图像信息，以确定参会人员的总人数，并通过空间体积检测模块确定会议室内的空间体积大小，通过平面坐标划分模块确定参会人员的位置信息，结合云服务器统计会议室内的人口密度和发言者距离其他参会人员的距离，进而统计分析出语音调控系数，对发言者的语音进行调控，解决了背景技术中存在的问题。

本发明的目的可以通过以下技术方案来实现：

基于云计算和语音特征分析的智能会议媒体管理云平台，包括信息登录模块、图像采集模块、图像预处理模块、空间体积检测模块、平面坐标划分模块和云平台；

所述图像采集模块与信息登录模块和图像预处理模块连接，平面坐标划分模块与信息登录模块和云平台连接，空间体积检测模块与信息登录模块和云平台连接，云平台与数据预处理模块连接；

所述信息登录模块用于通过无线通信网络进入云平台，进入云平台后需输入管理人员的账户名和登录密码，并将输入的管理人员的账户名和登录密码发送至云平台的平台管理模块，以进行管理人员的身份识别，若身份认证成功，则信息登录模块与云平台进行通信连接，若身份认证失败，则信息登录模块与云平台无法进行通信连接，直至输入的账户名和登录密码正确，信息登录模块与云平台建立通信连接后，信息登录模块分别发送控制指令至图像采集模块、空间体积检测模块和平面坐标划分模块；

所述图像采集模块包括高清摄像头，安装在会议室内，接收信息登录模块发送的控制指令，用于对会议室内的参加会议人员进行人脸图像采集，并将采集到的会议室内参加会议人员的人脸图像发送至图像预处理模块；

所述图像预处理模块接收图像采集模块发送的会议室内参加会议人员的人脸图像，对接收的会议室内参加会议人员的人脸图像进行图像分割，拼接图像分割得到的人脸特征区域，并去除该区域之外的背景图像，将保留的区域图像通过几何归一化处理变化为大小一致且人脸不存在偏角的图像，同时进行灰度变换处理和图像增强处理，得到处理后的各个参加会议人员的人脸目标图像，将处理后的各个参加会议人员的人脸目标图像发送至云平台的云服务器；

所述空间体积检测模块包括三维立体扫描仪，安装在会议室内，接收信息登录模块发送的控制指令，用于对会议室内的空间体积进行检测，并将检测到的会议室内的空间体积发送至云平台的云服务器；

所述平面坐标划分模块接收信息登录模块发送的控制指令，用于对会议室内参加会议人员的位置坐标进行划分，以会议室内入口最左边角落为坐标原点，以坐标原点从左往右的方向为X轴正方向，以坐标原点从下往上的方向为Y轴正方向，将各个参加会议人员的位置信息以坐标形式标记，并将各个参加会议人员的位置坐标发送至云平台的云服务器；

所述云平台包括云服务器、声源采集与输出模块、录音存储模块、数据库和平台管理模块；

所述数据库分别与录音存储模块、平台管理模块和云服务器连接，声源采集与输出模块与云服务器连接；

所述数据库用于存储会议室内标准人员密度，存储各人员密度等级对应的人员密度对比值范围，存储各人员密度等级对应的语音影响系数，存储各个发言者对应的语音音色；

所述云服务器接收图像预处理模块发送的各个参加会议人员的人脸目标图像，根据接收的各个参加会议人员的人脸目标图像，以统计参加会议人员的人数，并按照预设的顺序，将各个参加会议人员人数依次标记为1,2,...,i,...,g,构成参会人员集合A(a1,a2,...,ai,...,ag)，ai表示为第i个参加会议的人员，g表示为参加会议的总人数；

云服务器接收空间体积检测模块发送的该会议室的空间体积，根据接收的该会议室内的空间体积和参加会议的总人数，以统计该会议室内的人员密度，提取数据库中存储的会议室内标准人员密度，将统计的该会议室内的人员密度与数据库中存储的会议室内标准人员密度进行对比，得到该会议室内的人员密度对比值，提取数据库中存储的各人员密度等级对应的人员密度对比值范围，将统计的该会议室内的人员密度对比值与数据库中存储的各人员密度等级对应的人员密度对比值范围进行对比，若统计的该会议室内的人员密度对比值在一级人员密度等级对应的人员密度对比值范围内，则该会议室内人员密度等级为一级人员密度等级，若统计的该会议室内的人员密度对比值在二级人员密度等级对应的人员密度对比值范围内，则该会议室内人员密度等级为二级人员密度等级，若统计的该会议室内的人员密度对比值在三级人员密度等级对应的人员密度对比值范围内，则该会议室内人员密度等级为三级人员密度等级，进而得到该会议室内的人员密度等级，提取数据库中存储的各人员密度等级对应的语音影响系数，获得该会议室内的人员密度等级对应的语音影响系数；

云服务器接收平面坐标划分模块发送的会议室内各个参加会议人员的位置坐标，并将各个参加会议人员的位置坐标，构成参会人员坐标集合B(b1,b2,...,bi,...,bg)，bi表示为第i个参加会议人员的位置坐标，bi＝(x_i,y_i)，云服务器根据参会人员坐标集合以统计发言者与其他各个参加会议人员的位置距离，将标记的发言者与其他参加会议人员的位置距离构成发言者距离集合C_m(c_m1,c_m2,...,c_mi,...,c_mg)，c_mi表示为第m个发言者与第i个参加会议人员的距离；

云服务器根据发言者距离集合和该会议室内的人员密度等级对应的语音影响系数，以统计发言者语音调控系数，并将统计发言者语音调控系数发送至声源采集与输出模块；

所述声源采集与输出模块包括分贝仪和扩音器，用于采集各个发言者的语音分贝大小，按照预设的顺序依次标记为1,2,...,m,...,n,将各个发言者的语音分贝大小构成发言者语音分贝集合D(d1,d2,...,dm,...,dn)，接收云服务器发送的发言者语音调控系数，根据发言者语音分贝集合和发言者语音调控系数，以统计发言者的输出音量，并将发言者的输出音量通过扩音器输出；

所述录音存储模块包括录音器，用于对各个发言者的发言内容进行录音存储，将录音存储的各个发言者的语音音频与数据库中存储的各个发言者的语音音色进行对比，获得该语音音频对应的发言者的人员身份，进而确定各个录音存储的语音音频对应的发言者的人员身份，将各个发言者的人员身份标签在对应的语音音频上；

所述平台管理模块用于接收信息登录模块发送的管理人员输入的账户名和登录密码，将接收的管理人员输入的账户名和登录密码与数据库中存储的管理人员的账户名以及账户名对应的登录密码进行对比，若匹配成功，则管理人员进入云平台，若匹配不成功，则允许该登录账号输入三次登录密码的机会，当第三次输入错误时，拒绝再次输入登录密码，且平台管理模块可进行密码试探拒绝、登录异常记录控制。

进一步地，所述一级人员密度等级对应的人员密度对比值范围上限数值小于二级人员密度等级对应的人员密度对比值范围的下限数值，二级人员密度等级对应的人员密度对比值范围的上限数值小于三级人员密度等级对应的人员密度对比值范围的下限数值。

进一步地，所述各人员密度等级对应的语音影响系数的大小顺序为

进一步地，所述会议室内的人员密度的计算公式为

g表示为参加会议的总人数，v表示为会议室的空间体积。

进一步地，所述发言者与参加会议人员的距离计算公式为

x_m表示为第m个发言者位置的横坐标，y_m表示为第m个发言者位置的纵坐标，x_i表示为第i个参加会议人员的横坐标，y_i表示为第i个参加会议人员的纵坐标。

进一步地，所述发言者语音调控系数的计算公式为

表示为第E个人员密度等级对应的语音影响系数，c_mi表示为第m个发言者与第i个参加会议人员的距离。

进一步地，所述发言者的输出音量的计算公式为β_m＝λ_m*dm，λ_m表示为第m个发言者的语音调控系数，dm表示为第m个发言者的语音分贝大小。

有益效果：

(1)本发明通过图像采集模块采集会议室内参会人员的图像信息，以确定参会人员的总人数，并通过空间体积检测模块确定会议室内的空间体积大小，通过平面坐标划分模块确定参会人员的位置信息，结合云服务器统计会议室内的人口密度和发言者距离其他参会人员的距离，进而统计分析出语音调控系数，对发言者的语音进行调控，具有智能型高以及可靠性高的特点，大大提高了参会人员的舒适度，并且降低了人力成本，提高了语音调节的效率，大大减少了语音调控的时间。

(2)本发明通过图像采集模块、空集体积检测模块和平面坐标划分模块分别采集了参会人员总人数、会议室空间体积和参会人员位置信息，为后期统计语音调控系数提供了可靠的前期数据准备和参考依据，具有真实性高以及数据精度高的特点。

(3)本发明在录音存储模块，通过对各个发言者的语音内容进行录音存储，并通过语音识别确定各个发言者的身份，将各个发言者的身份标签在对应的语音音频上，展现了云平台的多功能性。

附图说明

利用附图对本发明作进一步说明，但附图中的实施例不构成对本发明的任何限制，对于本领域的普通技术人员，在不付出创造性劳动的前提下，还可以根据以下附图获得其它的附图。

图1为本发明的系统流程图。

图2为云平台的系统流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参照图1所示，基于云计算和语音特征分析的智能会议媒体管理云平台，包括信息登录模块、图像采集模块、图像预处理模块、空间体积检测模块、平面坐标划分模块和云平台；

本实施例通过图像采集模块、空集体积检测模块和平面坐标划分模块分别采集了参会人员总人数、会议室空间体积和参会人员位置信息，为后期统计语音调控系数提供了可靠的前期数据准备和参考依据，具有真实性高以及数据精度高的特点。

所述数据库用于存储会议室内标准人员密度，存储各人员密度等级对应的人员密度对比值范围，所述一级人员密度等级对应的人员密度对比值范围上限数值小于二级人员密度等级对应的人员密度对比值范围的下限数值，二级人员密度等级对应的人员密度对比值范围的上限数值小于三级人员密度等级对应的人员密度对比值范围的下限数值，存储各人员密度等级对应的语音影响系数，所述各人员密度等级对应的语音影响系数的大小顺序为

存储各个发言者对应的语音音色；

云服务器接收空间体积检测模块发送的该会议室的空间体积，根据接收的该会议室内的空间体积和参加会议的总人数，以统计该会议室内的人员密度，所述会议室内的人员密度的计算公式为

g表示为参加会议的总人数，v表示为会议室的空间体积，提取数据库中存储的会议室内标准人员密度，将统计的该会议室内的人员密度与数据库中存储的会议室内标准人员密度进行对比，得到该会议室内的人员密度对比值，提取数据库中存储的各人员密度等级对应的人员密度对比值范围，将统计的该会议室内的人员密度对比值与数据库中存储的各人员密度等级对应的人员密度对比值范围进行对比，若统计的该会议室内的人员密度对比值在一级人员密度等级对应的人员密度对比值范围内，则该会议室内人员密度等级为一级人员密度等级，若统计的该会议室内的人员密度对比值在二级人员密度等级对应的人员密度对比值范围内，则该会议室内人员密度等级为二级人员密度等级，若统计的该会议室内的人员密度对比值在三级人员密度等级对应的人员密度对比值范围内，则该会议室内人员密度等级为三级人员密度等级，进而得到该会议室内的人员密度等级，提取数据库中存储的各人员密度等级对应的语音影响系数，获得该会议室内的人员密度等级对应的语音影响系数；

云服务器接收平面坐标划分模块发送的会议室内各个参加会议人员的位置坐标，并将各个参加会议人员的位置坐标，构成参会人员坐标集合B(b1,b2,...,bi,...,bg)，bi表示为第i个参加会议人员的位置坐标，bi＝(x_i,y_i)，云服务器根据参会人员坐标集合以统计发言者与其他各个参加会议人员的位置距离，所述发言者与参加会议人员的距离计算公式为

x_m表示为第m个发言者位置的横坐标，y_m表示为第m个发言者位置的纵坐标，x_i表示为第i个参加会议人员的横坐标，y_i表示为第i个参加会议人员的纵坐标，将标记的发言者与其他参加会议人员的位置距离构成发言者距离集合C_m(c_m1,c_m2,...,c_mi,...,c_mg)，c_mi表示为第m个发言者与第i个参加会议人员的距离；

云服务器根据发言者距离集合和该会议室内的人员密度等级对应的语音影响系数，以统计发言者语音调控系数，所述发言者语音调控系数的计算公式为

表示为第E个人员密度等级对应的语音影响系数，c_mi表示为第m个发言者与第i个参加会议人员的距离，并将统计发言者语音调控系数发送至声源采集与输出模块；

所述声源采集与输出模块包括分贝仪和扩音器，用于采集各个发言者的语音分贝大小，按照预设的顺序依次标记为1,2,...,m,...,n,将各个发言者的语音分贝大小构成发言者语音分贝集合D(d1,d2,...,dm,...,dn)，接收云服务器发送的发言者语音调控系数，根据发言者语音分贝集合和发言者语音调控系数，以统计发言者的输出音量，所述发言者的输出音量的计算公式为β_m＝λ_m*dm，λ_m表示为第m个发言者的语音调控系数，dm表示为第m个发言者的语音分贝大小，并将发言者的输出音量通过扩音器输出；

本实施例通过对各个发言者的语音内容进行录音存储，并通过语音识别确定各个发言者的身份，将各个发言者的身份标签在对应的语音音频上，展现了云平台的多功能性。

本发明通过图像采集模块采集会议室内参会人员的图像信息，以确定参会人员的总人数，并通过空间体积检测模块确定会议室内的空间体积大小，通过平面坐标划分模块确定参会人员的位置信息，结合云服务器统计会议室内的人口密度和发言者距离其他参会人员的距离，进而统计分析出语音调控系数，对发言者的语音进行调控，具有智能型高以及可靠性高的特点，大大提高了参会人员的舒适度，并且降低了人力成本，提高了语音调节的效率，大大减少了语音调控的时间。

以上内容仅仅是对本发明结构所作的举例和说明，所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代，只要不偏离发明的结构或者超越本权利要求书所定义的范围，均应属于本发明的保护范围。

Claims

1.基于云计算和语音特征分析的智能会议媒体管理云平台，其特征在于：包括信息登录模块、图像采集模块、图像预处理模块、空间体积检测模块、平面坐标划分模块和云平台；

2.根据权利要求1所述的基于云计算和语音特征分析的智能会议媒体管理云平台，其特征在于：所述一级人员密度等级对应的人员密度对比值范围上限数值小于二级人员密度等级对应的人员密度对比值范围的下限数值，二级人员密度等级对应的人员密度对比值范围的上限数值小于三级人员密度等级对应的人员密度对比值范围的下限数值。

3.根据权利要求1所述的基于云计算和语音特征分析的智能会议媒体管理云平台，其特征在于：所述各人员密度等级对应的语音影响系数的大小顺序为

4.根据权利要求1所述的基于云计算和语音特征分析的智能会议媒体管理云平台，其特征在于：所述会议室内的人员密度的计算公式为

g表示为参加会议的总人数，v表示为会议室的空间体积。

5.根据权利要求1所述的基于云计算和语音特征分析的智能会议媒体管理云平台，其特征在于：所述发言者与参加会议人员的距离计算公式为

6.根据权利要求1所述的基于云计算和语音特征分析的智能会议媒体管理云平台，其特征在于：所述发言者语音调控系数的计算公式为

7.根据权利要求1所述的基于云计算和语音特征分析的智能会议媒体管理云平台，其特征在于：所述发言者的输出音量的计算公式为β_m＝λ_m*dm，λ_m表示为第m个发言者的语音调控系数，dm表示为第m个发言者的语音分贝大小。