CN112788280A - 基于云计算和语音特征分析的智能会议媒体管理云平台 - Google Patents

基于云计算和语音特征分析的智能会议媒体管理云平台 Download PDF

Info

Publication number
CN112788280A
CN112788280A CN202110066780.XA CN202110066780A CN112788280A CN 112788280 A CN112788280 A CN 112788280A CN 202110066780 A CN202110066780 A CN 202110066780A CN 112788280 A CN112788280 A CN 112788280A
Authority
CN
China
Prior art keywords
module
speaker
conference
voice
conference room
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110066780.XA
Other languages
English (en)
Inventor
李成隆
王亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202110066780.XA priority Critical patent/CN112788280A/zh
Publication of CN112788280A publication Critical patent/CN112788280A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/166Detection; Localisation; Normalisation using acquisition arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C9/00Individual registration on entry or exit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开基于云计算和语音特征分析的智能会议媒体管理云平台,包括信息登录模块、图像采集模块、图像预处理模块、空间体积检测模块、平面坐标划分模块和云平台,通过图像采集模块采集会议室内参会人员的图像信息确定参会人员的总人数,通过空间体积检测模块确定会议室内的空间体积大小,并通过平面坐标划分模块确定参会人员的位置信息,结合云服务器统计会议室内的人口密度和发言者与其他参会人员的距离,进而统计分析出语音调控系数,对发言者的语音音量进行调控,具有智能型高以及可靠性高的特点,大大提高了参会人员的舒适度,并且降低了人力成本,提高了语音调节的效率,大大减少了语音调控的时间。

Description

基于云计算和语音特征分析的智能会议媒体管理云平台
技术领域
本发明属于智能会议技术领域,具体涉及到基于云计算和语音特征分析的智能会议媒体管理云平台。
背景技术
随着科技与社会快速发展,人们在日常生活和工作中接触的信息量越来越大,因此人们之间的信息交流和沟通也就变得越来越频繁、越来越重要,会议室也就成为了信息交流和业务谈判等活动的重要场所,目前简单的会议室已经无法满足客户对高效率会议环境的要求,所以先进的智能会议媒体管理平台是当今各行业会议室的必备平台。语音系统作为会议室的重要组成部分,在会议前需要对会议室的语音系统进行充分的调节,以保证会议的正常进行。
在现有技术中,现有的语音系统的音量调节多为人工进行手动调节,手动调节时的幅度不方便控制,并且手动调节需要消耗时间多,有时距离发言者近的参会人员听到声音过大,距离发言者远的参会人员听到声音又会过小,无法实现对发言者输出声音的智能调节,降低了参会人员的舒适度,并且在会议开展的同时,无法对发言者的语音内容进行实时记录存储。
发明内容
针对上述问题,本发明提出基于云计算和语音特征分析的智能会议媒体管理云平台,通过图像采集模块采集会议室内参会人员的图像信息,以确定参会人员的总人数,并通过空间体积检测模块确定会议室内的空间体积大小,通过平面坐标划分模块确定参会人员的位置信息,结合云服务器统计会议室内的人口密度和发言者距离其他参会人员的距离,进而统计分析出语音调控系数,对发言者的语音进行调控,解决了背景技术中存在的问题。
本发明的目的可以通过以下技术方案来实现:
基于云计算和语音特征分析的智能会议媒体管理云平台,包括信息登录模块、图像采集模块、图像预处理模块、空间体积检测模块、平面坐标划分模块和云平台;
所述图像采集模块与信息登录模块和图像预处理模块连接,平面坐标划分模块与信息登录模块和云平台连接,空间体积检测模块与信息登录模块和云平台连接,云平台与数据预处理模块连接;
所述信息登录模块用于通过无线通信网络进入云平台,进入云平台后需输入管理人员的账户名和登录密码,并将输入的管理人员的账户名和登录密码发送至云平台的平台管理模块,以进行管理人员的身份识别,若身份认证成功,则信息登录模块与云平台进行通信连接,若身份认证失败,则信息登录模块与云平台无法进行通信连接,直至输入的账户名和登录密码正确,信息登录模块与云平台建立通信连接后,信息登录模块分别发送控制指令至图像采集模块、空间体积检测模块和平面坐标划分模块;
所述图像采集模块包括高清摄像头,安装在会议室内,接收信息登录模块发送的控制指令,用于对会议室内的参加会议人员进行人脸图像采集,并将采集到的会议室内参加会议人员的人脸图像发送至图像预处理模块;
所述图像预处理模块接收图像采集模块发送的会议室内参加会议人员的人脸图像,对接收的会议室内参加会议人员的人脸图像进行图像分割,拼接图像分割得到的人脸特征区域,并去除该区域之外的背景图像,将保留的区域图像通过几何归一化处理变化为大小一致且人脸不存在偏角的图像,同时进行灰度变换处理和图像增强处理,得到处理后的各个参加会议人员的人脸目标图像,将处理后的各个参加会议人员的人脸目标图像发送至云平台的云服务器;
所述空间体积检测模块包括三维立体扫描仪,安装在会议室内,接收信息登录模块发送的控制指令,用于对会议室内的空间体积进行检测,并将检测到的会议室内的空间体积发送至云平台的云服务器;
所述平面坐标划分模块接收信息登录模块发送的控制指令,用于对会议室内参加会议人员的位置坐标进行划分,以会议室内入口最左边角落为坐标原点,以坐标原点从左往右的方向为X轴正方向,以坐标原点从下往上的方向为Y轴正方向,将各个参加会议人员的位置信息以坐标形式标记,并将各个参加会议人员的位置坐标发送至云平台的云服务器;
所述云平台包括云服务器、声源采集与输出模块、录音存储模块、数据库和平台管理模块;
所述数据库分别与录音存储模块、平台管理模块和云服务器连接,声源采集与输出模块与云服务器连接;
所述数据库用于存储会议室内标准人员密度,存储各人员密度等级对应的人员密度对比值范围,存储各人员密度等级对应的语音影响系数,存储各个发言者对应的语音音色;
所述云服务器接收图像预处理模块发送的各个参加会议人员的人脸目标图像,根据接收的各个参加会议人员的人脸目标图像,以统计参加会议人员的人数,并按照预设的顺序,将各个参加会议人员人数依次标记为1,2,...,i,...,g,构成参会人员集合A(a1,a2,...,ai,...,ag),ai表示为第i个参加会议的人员,g表示为参加会议的总人数;
云服务器接收空间体积检测模块发送的该会议室的空间体积,根据接收的该会议室内的空间体积和参加会议的总人数,以统计该会议室内的人员密度,提取数据库中存储的会议室内标准人员密度,将统计的该会议室内的人员密度与数据库中存储的会议室内标准人员密度进行对比,得到该会议室内的人员密度对比值,提取数据库中存储的各人员密度等级对应的人员密度对比值范围,将统计的该会议室内的人员密度对比值与数据库中存储的各人员密度等级对应的人员密度对比值范围进行对比,若统计的该会议室内的人员密度对比值在一级人员密度等级对应的人员密度对比值范围内,则该会议室内人员密度等级为一级人员密度等级,若统计的该会议室内的人员密度对比值在二级人员密度等级对应的人员密度对比值范围内,则该会议室内人员密度等级为二级人员密度等级,若统计的该会议室内的人员密度对比值在三级人员密度等级对应的人员密度对比值范围内,则该会议室内人员密度等级为三级人员密度等级,进而得到该会议室内的人员密度等级,提取数据库中存储的各人员密度等级对应的语音影响系数,获得该会议室内的人员密度等级对应的语音影响系数;
云服务器接收平面坐标划分模块发送的会议室内各个参加会议人员的位置坐标,并将各个参加会议人员的位置坐标,构成参会人员坐标集合B(b1,b2,...,bi,...,bg),bi表示为第i个参加会议人员的位置坐标,bi=(xi,yi),云服务器根据参会人员坐标集合以统计发言者与其他各个参加会议人员的位置距离,将标记的发言者与其他参加会议人员的位置距离构成发言者距离集合Cm(cm1,cm2,...,cmi,...,cmg),cmi表示为第m个发言者与第i个参加会议人员的距离;
云服务器根据发言者距离集合和该会议室内的人员密度等级对应的语音影响系数,以统计发言者语音调控系数,并将统计发言者语音调控系数发送至声源采集与输出模块;
所述声源采集与输出模块包括分贝仪和扩音器,用于采集各个发言者的语音分贝大小,按照预设的顺序依次标记为1,2,...,m,...,n,将各个发言者的语音分贝大小构成发言者语音分贝集合D(d1,d2,...,dm,...,dn),接收云服务器发送的发言者语音调控系数,根据发言者语音分贝集合和发言者语音调控系数,以统计发言者的输出音量,并将发言者的输出音量通过扩音器输出;
所述录音存储模块包括录音器,用于对各个发言者的发言内容进行录音存储,将录音存储的各个发言者的语音音频与数据库中存储的各个发言者的语音音色进行对比,获得该语音音频对应的发言者的人员身份,进而确定各个录音存储的语音音频对应的发言者的人员身份,将各个发言者的人员身份标签在对应的语音音频上;
所述平台管理模块用于接收信息登录模块发送的管理人员输入的账户名和登录密码,将接收的管理人员输入的账户名和登录密码与数据库中存储的管理人员的账户名以及账户名对应的登录密码进行对比,若匹配成功,则管理人员进入云平台,若匹配不成功,则允许该登录账号输入三次登录密码的机会,当第三次输入错误时,拒绝再次输入登录密码,且平台管理模块可进行密码试探拒绝、登录异常记录控制。
进一步地,所述一级人员密度等级对应的人员密度对比值范围上限数值小于二级人员密度等级对应的人员密度对比值范围的下限数值,二级人员密度等级对应的人员密度对比值范围的上限数值小于三级人员密度等级对应的人员密度对比值范围的下限数值。
进一步地,所述各人员密度等级对应的语音影响系数的大小顺序为
Figure BDA0002904381490000051
进一步地,所述会议室内的人员密度的计算公式为
Figure BDA0002904381490000052
g表示为参加会议的总人数,v表示为会议室的空间体积。
进一步地,所述发言者与参加会议人员的距离计算公式为
Figure BDA0002904381490000061
xm表示为第m个发言者位置的横坐标,ym表示为第m个发言者位置的纵坐标,xi表示为第i个参加会议人员的横坐标,yi表示为第i个参加会议人员的纵坐标。
进一步地,所述发言者语音调控系数的计算公式为
Figure BDA0002904381490000062
Figure BDA0002904381490000063
表示为第E个人员密度等级对应的语音影响系数,cmi表示为第m个发言者与第i个参加会议人员的距离。
进一步地,所述发言者的输出音量的计算公式为βm=λm*dm,λm表示为第m个发言者的语音调控系数,dm表示为第m个发言者的语音分贝大小。
有益效果:
(1)本发明通过图像采集模块采集会议室内参会人员的图像信息,以确定参会人员的总人数,并通过空间体积检测模块确定会议室内的空间体积大小,通过平面坐标划分模块确定参会人员的位置信息,结合云服务器统计会议室内的人口密度和发言者距离其他参会人员的距离,进而统计分析出语音调控系数,对发言者的语音进行调控,具有智能型高以及可靠性高的特点,大大提高了参会人员的舒适度,并且降低了人力成本,提高了语音调节的效率,大大减少了语音调控的时间。
(2)本发明通过图像采集模块、空集体积检测模块和平面坐标划分模块分别采集了参会人员总人数、会议室空间体积和参会人员位置信息,为后期统计语音调控系数提供了可靠的前期数据准备和参考依据,具有真实性高以及数据精度高的特点。
(3)本发明在录音存储模块,通过对各个发言者的语音内容进行录音存储,并通过语音识别确定各个发言者的身份,将各个发言者的身份标签在对应的语音音频上,展现了云平台的多功能性。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1为本发明的系统流程图。
图2为云平台的系统流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1所示,基于云计算和语音特征分析的智能会议媒体管理云平台,包括信息登录模块、图像采集模块、图像预处理模块、空间体积检测模块、平面坐标划分模块和云平台;
所述图像采集模块与信息登录模块和图像预处理模块连接,平面坐标划分模块与信息登录模块和云平台连接,空间体积检测模块与信息登录模块和云平台连接,云平台与数据预处理模块连接;
所述信息登录模块用于通过无线通信网络进入云平台,进入云平台后需输入管理人员的账户名和登录密码,并将输入的管理人员的账户名和登录密码发送至云平台的平台管理模块,以进行管理人员的身份识别,若身份认证成功,则信息登录模块与云平台进行通信连接,若身份认证失败,则信息登录模块与云平台无法进行通信连接,直至输入的账户名和登录密码正确,信息登录模块与云平台建立通信连接后,信息登录模块分别发送控制指令至图像采集模块、空间体积检测模块和平面坐标划分模块;
所述图像采集模块包括高清摄像头,安装在会议室内,接收信息登录模块发送的控制指令,用于对会议室内的参加会议人员进行人脸图像采集,并将采集到的会议室内参加会议人员的人脸图像发送至图像预处理模块;
所述图像预处理模块接收图像采集模块发送的会议室内参加会议人员的人脸图像,对接收的会议室内参加会议人员的人脸图像进行图像分割,拼接图像分割得到的人脸特征区域,并去除该区域之外的背景图像,将保留的区域图像通过几何归一化处理变化为大小一致且人脸不存在偏角的图像,同时进行灰度变换处理和图像增强处理,得到处理后的各个参加会议人员的人脸目标图像,将处理后的各个参加会议人员的人脸目标图像发送至云平台的云服务器;
所述空间体积检测模块包括三维立体扫描仪,安装在会议室内,接收信息登录模块发送的控制指令,用于对会议室内的空间体积进行检测,并将检测到的会议室内的空间体积发送至云平台的云服务器;
所述平面坐标划分模块接收信息登录模块发送的控制指令,用于对会议室内参加会议人员的位置坐标进行划分,以会议室内入口最左边角落为坐标原点,以坐标原点从左往右的方向为X轴正方向,以坐标原点从下往上的方向为Y轴正方向,将各个参加会议人员的位置信息以坐标形式标记,并将各个参加会议人员的位置坐标发送至云平台的云服务器;
本实施例通过图像采集模块、空集体积检测模块和平面坐标划分模块分别采集了参会人员总人数、会议室空间体积和参会人员位置信息,为后期统计语音调控系数提供了可靠的前期数据准备和参考依据,具有真实性高以及数据精度高的特点。
所述云平台包括云服务器、声源采集与输出模块、录音存储模块、数据库和平台管理模块;
所述数据库分别与录音存储模块、平台管理模块和云服务器连接,声源采集与输出模块与云服务器连接;
所述数据库用于存储会议室内标准人员密度,存储各人员密度等级对应的人员密度对比值范围,所述一级人员密度等级对应的人员密度对比值范围上限数值小于二级人员密度等级对应的人员密度对比值范围的下限数值,二级人员密度等级对应的人员密度对比值范围的上限数值小于三级人员密度等级对应的人员密度对比值范围的下限数值,存储各人员密度等级对应的语音影响系数,所述各人员密度等级对应的语音影响系数的大小顺序为
Figure BDA0002904381490000092
存储各个发言者对应的语音音色;
所述云服务器接收图像预处理模块发送的各个参加会议人员的人脸目标图像,根据接收的各个参加会议人员的人脸目标图像,以统计参加会议人员的人数,并按照预设的顺序,将各个参加会议人员人数依次标记为1,2,...,i,...,g,构成参会人员集合A(a1,a2,...,ai,...,ag),ai表示为第i个参加会议的人员,g表示为参加会议的总人数;
云服务器接收空间体积检测模块发送的该会议室的空间体积,根据接收的该会议室内的空间体积和参加会议的总人数,以统计该会议室内的人员密度,所述会议室内的人员密度的计算公式为
Figure BDA0002904381490000091
g表示为参加会议的总人数,v表示为会议室的空间体积,提取数据库中存储的会议室内标准人员密度,将统计的该会议室内的人员密度与数据库中存储的会议室内标准人员密度进行对比,得到该会议室内的人员密度对比值,提取数据库中存储的各人员密度等级对应的人员密度对比值范围,将统计的该会议室内的人员密度对比值与数据库中存储的各人员密度等级对应的人员密度对比值范围进行对比,若统计的该会议室内的人员密度对比值在一级人员密度等级对应的人员密度对比值范围内,则该会议室内人员密度等级为一级人员密度等级,若统计的该会议室内的人员密度对比值在二级人员密度等级对应的人员密度对比值范围内,则该会议室内人员密度等级为二级人员密度等级,若统计的该会议室内的人员密度对比值在三级人员密度等级对应的人员密度对比值范围内,则该会议室内人员密度等级为三级人员密度等级,进而得到该会议室内的人员密度等级,提取数据库中存储的各人员密度等级对应的语音影响系数,获得该会议室内的人员密度等级对应的语音影响系数;
云服务器接收平面坐标划分模块发送的会议室内各个参加会议人员的位置坐标,并将各个参加会议人员的位置坐标,构成参会人员坐标集合B(b1,b2,...,bi,...,bg),bi表示为第i个参加会议人员的位置坐标,bi=(xi,yi),云服务器根据参会人员坐标集合以统计发言者与其他各个参加会议人员的位置距离,所述发言者与参加会议人员的距离计算公式为
Figure BDA0002904381490000101
xm表示为第m个发言者位置的横坐标,ym表示为第m个发言者位置的纵坐标,xi表示为第i个参加会议人员的横坐标,yi表示为第i个参加会议人员的纵坐标,将标记的发言者与其他参加会议人员的位置距离构成发言者距离集合Cm(cm1,cm2,...,cmi,...,cmg),cmi表示为第m个发言者与第i个参加会议人员的距离;
云服务器根据发言者距离集合和该会议室内的人员密度等级对应的语音影响系数,以统计发言者语音调控系数,所述发言者语音调控系数的计算公式为
Figure BDA0002904381490000102
Figure BDA0002904381490000103
表示为第E个人员密度等级对应的语音影响系数,cmi表示为第m个发言者与第i个参加会议人员的距离,并将统计发言者语音调控系数发送至声源采集与输出模块;
所述声源采集与输出模块包括分贝仪和扩音器,用于采集各个发言者的语音分贝大小,按照预设的顺序依次标记为1,2,...,m,...,n,将各个发言者的语音分贝大小构成发言者语音分贝集合D(d1,d2,...,dm,...,dn),接收云服务器发送的发言者语音调控系数,根据发言者语音分贝集合和发言者语音调控系数,以统计发言者的输出音量,所述发言者的输出音量的计算公式为βm=λm*dm,λm表示为第m个发言者的语音调控系数,dm表示为第m个发言者的语音分贝大小,并将发言者的输出音量通过扩音器输出;
所述录音存储模块包括录音器,用于对各个发言者的发言内容进行录音存储,将录音存储的各个发言者的语音音频与数据库中存储的各个发言者的语音音色进行对比,获得该语音音频对应的发言者的人员身份,进而确定各个录音存储的语音音频对应的发言者的人员身份,将各个发言者的人员身份标签在对应的语音音频上;
本实施例通过对各个发言者的语音内容进行录音存储,并通过语音识别确定各个发言者的身份,将各个发言者的身份标签在对应的语音音频上,展现了云平台的多功能性。
所述平台管理模块用于接收信息登录模块发送的管理人员输入的账户名和登录密码,将接收的管理人员输入的账户名和登录密码与数据库中存储的管理人员的账户名以及账户名对应的登录密码进行对比,若匹配成功,则管理人员进入云平台,若匹配不成功,则允许该登录账号输入三次登录密码的机会,当第三次输入错误时,拒绝再次输入登录密码,且平台管理模块可进行密码试探拒绝、登录异常记录控制。
本发明通过图像采集模块采集会议室内参会人员的图像信息,以确定参会人员的总人数,并通过空间体积检测模块确定会议室内的空间体积大小,通过平面坐标划分模块确定参会人员的位置信息,结合云服务器统计会议室内的人口密度和发言者距离其他参会人员的距离,进而统计分析出语音调控系数,对发言者的语音进行调控,具有智能型高以及可靠性高的特点,大大提高了参会人员的舒适度,并且降低了人力成本,提高了语音调节的效率,大大减少了语音调控的时间。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (7)

1.基于云计算和语音特征分析的智能会议媒体管理云平台,其特征在于:包括信息登录模块、图像采集模块、图像预处理模块、空间体积检测模块、平面坐标划分模块和云平台;
所述图像采集模块与信息登录模块和图像预处理模块连接,平面坐标划分模块与信息登录模块和云平台连接,空间体积检测模块与信息登录模块和云平台连接,云平台与数据预处理模块连接;
所述信息登录模块用于通过无线通信网络进入云平台,进入云平台后需输入管理人员的账户名和登录密码,并将输入的管理人员的账户名和登录密码发送至云平台的平台管理模块,以进行管理人员的身份识别,若身份认证成功,则信息登录模块与云平台进行通信连接,若身份认证失败,则信息登录模块与云平台无法进行通信连接,直至输入的账户名和登录密码正确,信息登录模块与云平台建立通信连接后,信息登录模块分别发送控制指令至图像采集模块、空间体积检测模块和平面坐标划分模块;
所述图像采集模块包括高清摄像头,安装在会议室内,接收信息登录模块发送的控制指令,用于对会议室内的参加会议人员进行人脸图像采集,并将采集到的会议室内参加会议人员的人脸图像发送至图像预处理模块;
所述图像预处理模块接收图像采集模块发送的会议室内参加会议人员的人脸图像,对接收的会议室内参加会议人员的人脸图像进行图像分割,拼接图像分割得到的人脸特征区域,并去除该区域之外的背景图像,将保留的区域图像通过几何归一化处理变化为大小一致且人脸不存在偏角的图像,同时进行灰度变换处理和图像增强处理,得到处理后的各个参加会议人员的人脸目标图像,将处理后的各个参加会议人员的人脸目标图像发送至云平台的云服务器;
所述空间体积检测模块包括三维立体扫描仪,安装在会议室内,接收信息登录模块发送的控制指令,用于对会议室内的空间体积进行检测,并将检测到的会议室内的空间体积发送至云平台的云服务器;
所述平面坐标划分模块接收信息登录模块发送的控制指令,用于对会议室内参加会议人员的位置坐标进行划分,以会议室内入口最左边角落为坐标原点,以坐标原点从左往右的方向为X轴正方向,以坐标原点从下往上的方向为Y轴正方向,将各个参加会议人员的位置信息以坐标形式标记,并将各个参加会议人员的位置坐标发送至云平台的云服务器;
所述云平台包括云服务器、声源采集与输出模块、录音存储模块、数据库和平台管理模块;
所述数据库分别与录音存储模块、平台管理模块和云服务器连接,声源采集与输出模块与云服务器连接;
所述数据库用于存储会议室内标准人员密度,存储各人员密度等级对应的人员密度对比值范围,存储各人员密度等级对应的语音影响系数,存储各个发言者对应的语音音色;
所述云服务器接收图像预处理模块发送的各个参加会议人员的人脸目标图像,根据接收的各个参加会议人员的人脸目标图像,以统计参加会议人员的人数,并按照预设的顺序,将各个参加会议人员人数依次标记为1,2,...,i,...,g,构成参会人员集合A(a1,a2,...,ai,...,ag),ai表示为第i个参加会议的人员,g表示为参加会议的总人数;
云服务器接收空间体积检测模块发送的该会议室的空间体积,根据接收的该会议室内的空间体积和参加会议的总人数,以统计该会议室内的人员密度,提取数据库中存储的会议室内标准人员密度,将统计的该会议室内的人员密度与数据库中存储的会议室内标准人员密度进行对比,得到该会议室内的人员密度对比值,提取数据库中存储的各人员密度等级对应的人员密度对比值范围,将统计的该会议室内的人员密度对比值与数据库中存储的各人员密度等级对应的人员密度对比值范围进行对比,若统计的该会议室内的人员密度对比值在一级人员密度等级对应的人员密度对比值范围内,则该会议室内人员密度等级为一级人员密度等级,若统计的该会议室内的人员密度对比值在二级人员密度等级对应的人员密度对比值范围内,则该会议室内人员密度等级为二级人员密度等级,若统计的该会议室内的人员密度对比值在三级人员密度等级对应的人员密度对比值范围内,则该会议室内人员密度等级为三级人员密度等级,进而得到该会议室内的人员密度等级,提取数据库中存储的各人员密度等级对应的语音影响系数,获得该会议室内的人员密度等级对应的语音影响系数;
云服务器接收平面坐标划分模块发送的会议室内各个参加会议人员的位置坐标,并将各个参加会议人员的位置坐标,构成参会人员坐标集合B(b1,b2,...,bi,...,bg),bi表示为第i个参加会议人员的位置坐标,bi=(xi,yi),云服务器根据参会人员坐标集合以统计发言者与其他各个参加会议人员的位置距离,将标记的发言者与其他参加会议人员的位置距离构成发言者距离集合Cm(cm1,cm2,...,cmi,...,cmg),cmi表示为第m个发言者与第i个参加会议人员的距离;
云服务器根据发言者距离集合和该会议室内的人员密度等级对应的语音影响系数,以统计发言者语音调控系数,并将统计发言者语音调控系数发送至声源采集与输出模块;
所述声源采集与输出模块包括分贝仪和扩音器,用于采集各个发言者的语音分贝大小,按照预设的顺序依次标记为1,2,...,m,...,n,将各个发言者的语音分贝大小构成发言者语音分贝集合D(d1,d2,...,dm,...,dn),接收云服务器发送的发言者语音调控系数,根据发言者语音分贝集合和发言者语音调控系数,以统计发言者的输出音量,并将发言者的输出音量通过扩音器输出;
所述录音存储模块包括录音器,用于对各个发言者的发言内容进行录音存储,将录音存储的各个发言者的语音音频与数据库中存储的各个发言者的语音音色进行对比,获得该语音音频对应的发言者的人员身份,进而确定各个录音存储的语音音频对应的发言者的人员身份,将各个发言者的人员身份标签在对应的语音音频上;
所述平台管理模块用于接收信息登录模块发送的管理人员输入的账户名和登录密码,将接收的管理人员输入的账户名和登录密码与数据库中存储的管理人员的账户名以及账户名对应的登录密码进行对比,若匹配成功,则管理人员进入云平台,若匹配不成功,则允许该登录账号输入三次登录密码的机会,当第三次输入错误时,拒绝再次输入登录密码,且平台管理模块可进行密码试探拒绝、登录异常记录控制。
2.根据权利要求1所述的基于云计算和语音特征分析的智能会议媒体管理云平台,其特征在于:所述一级人员密度等级对应的人员密度对比值范围上限数值小于二级人员密度等级对应的人员密度对比值范围的下限数值,二级人员密度等级对应的人员密度对比值范围的上限数值小于三级人员密度等级对应的人员密度对比值范围的下限数值。
3.根据权利要求1所述的基于云计算和语音特征分析的智能会议媒体管理云平台,其特征在于:所述各人员密度等级对应的语音影响系数的大小顺序为
Figure FDA0002904381480000041
4.根据权利要求1所述的基于云计算和语音特征分析的智能会议媒体管理云平台,其特征在于:所述会议室内的人员密度的计算公式为
Figure FDA0002904381480000042
g表示为参加会议的总人数,v表示为会议室的空间体积。
5.根据权利要求1所述的基于云计算和语音特征分析的智能会议媒体管理云平台,其特征在于:所述发言者与参加会议人员的距离计算公式为
Figure FDA0002904381480000051
xm表示为第m个发言者位置的横坐标,ym表示为第m个发言者位置的纵坐标,xi表示为第i个参加会议人员的横坐标,yi表示为第i个参加会议人员的纵坐标。
6.根据权利要求1所述的基于云计算和语音特征分析的智能会议媒体管理云平台,其特征在于:所述发言者语音调控系数的计算公式为
Figure FDA0002904381480000052
Figure FDA0002904381480000053
表示为第E个人员密度等级对应的语音影响系数,cmi表示为第m个发言者与第i个参加会议人员的距离。
7.根据权利要求1所述的基于云计算和语音特征分析的智能会议媒体管理云平台,其特征在于:所述发言者的输出音量的计算公式为βm=λm*dm,λm表示为第m个发言者的语音调控系数,dm表示为第m个发言者的语音分贝大小。
CN202110066780.XA 2021-01-19 2021-01-19 基于云计算和语音特征分析的智能会议媒体管理云平台 Withdrawn CN112788280A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110066780.XA CN112788280A (zh) 2021-01-19 2021-01-19 基于云计算和语音特征分析的智能会议媒体管理云平台

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110066780.XA CN112788280A (zh) 2021-01-19 2021-01-19 基于云计算和语音特征分析的智能会议媒体管理云平台

Publications (1)

Publication Number Publication Date
CN112788280A true CN112788280A (zh) 2021-05-11

Family

ID=75757521

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110066780.XA Withdrawn CN112788280A (zh) 2021-01-19 2021-01-19 基于云计算和语音特征分析的智能会议媒体管理云平台

Country Status (1)

Country Link
CN (1) CN112788280A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115268820A (zh) * 2022-06-22 2022-11-01 晨雨初听(武汉)文化艺术传播有限公司 一种数字化场景识别的多媒体互动分析方法及云平台
CN117078223A (zh) * 2023-09-28 2023-11-17 广州隽智智能科技有限公司 一种基于人工智能的智能会议管理系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115268820A (zh) * 2022-06-22 2022-11-01 晨雨初听(武汉)文化艺术传播有限公司 一种数字化场景识别的多媒体互动分析方法及云平台
CN115268820B (zh) * 2022-06-22 2023-10-24 广东三鼎智慧信息科技有限公司 一种数字化场景识别的多媒体互动分析方法及云平台
CN117078223A (zh) * 2023-09-28 2023-11-17 广州隽智智能科技有限公司 一种基于人工智能的智能会议管理系统
CN117078223B (zh) * 2023-09-28 2024-02-02 广州隽智智能科技有限公司 一种基于人工智能的智能会议管理系统

Similar Documents

Publication Publication Date Title
CN110853646B (zh) 会议发言角色的区分方法、装置、设备及可读存储介质
US9071895B2 (en) Satellite microphones for improved speaker detection and zoom
CN109657609A (zh) 人脸识别方法及系统
CN112788280A (zh) 基于云计算和语音特征分析的智能会议媒体管理云平台
US20140118472A1 (en) Active Speaker Indicator for Conference Participants
CN110827432B (zh) 一种基于人脸识别的课堂考勤方法及系统
WO2022007559A1 (zh) 掌纹识别方法、特征提取模型训练方法、设备及介质
CN112911385B (zh) 待识别图片的提取方法、装置、设备以及存储介质
CN113746822B (zh) 一种远程会议管理方法及系统
CN109902681B (zh) 用户群体关系确定方法、装置、设备及存储介质
CN110889314B (zh) 图像处理方法、装置、电子设备、服务器及系统
CN108875989B (zh) 基于人脸识别的预定方法、装置、计算机设备及存储介质
CN113114750B (zh) 基于大数据和云计算的多媒体数字化展厅智能调控云平台
CN112449142A (zh) 一种基于数据协同传输处理的远程视频会议系统
US11775834B2 (en) Joint upper-body and face detection using multi-task cascaded convolutional networks
CN111970471B (zh) 基于视频会议的参会人员评分方法、装置、设备及介质
CN118015663B (zh) 员工识别方法、装置及设备
EP4068282A1 (en) Method for processing conference data and related device
WO2024087641A1 (zh) 一种具有无线麦克风智能跟踪功能的音视频控制方法
CN113517002A (zh) 信息处理方法、装置以及系统、会议端、服务器
CN108734144A (zh) 一种基于人脸识别的主讲人身份认证方法
CN108564053A (zh) 基于FaceNet的多摄像头动态人脸识别系统与方法
CN117278895B (zh) 基于数据增强的麦克风信号优化方法及系统
CN110276681A (zh) 一种开展业务的方法及装置
CN114826804B (zh) 一种基于机器学习的远程会议质量监控的方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20210511

WW01 Invention patent application withdrawn after publication