CN108346034B

CN108346034B - 一种会议智能管理方法及系统

Info

Publication number: CN108346034B
Application number: CN201810105174.2A
Authority: CN
Inventors: 刘善果; 李明
Original assignee: Shenzhen Eaglesoul Technology Co Ltd
Current assignee: Shenzhen Eaglesoul Technology Co Ltd
Priority date: 2018-02-02
Filing date: 2018-02-02
Publication date: 2021-10-15
Anticipated expiration: 2038-02-02
Also published as: CN108346034A; WO2019148583A1

Abstract

本发明公开了一种会议智能管理方法及系统，涉及智能管理领域。本发明通过用户角色与用户权限等级的区分，对已经预约的会议室的预约结果进行不同方式的变更，方便会议的管理以及协调突发情况；通过分析发言人在会议中的发言位置、身份信息、个人资料等信息，确定发言人的权重系数，从而根据权重系数来用不同的预设策略获取不同发言人对应的候选关键发言片段，进一步根据发言内容本身的特点，来截取候选关键发言片段集合，再对截取的候选关键发言片段集合进行处理以获取形成语音摘要的音频/视频片段集合，能够针对重要发言提取更多的内容，针对不重要的发言提取相对较少的内容，使最终形成的摘要内容更加合理，为用户提供更有效的帮助。

Description

一种会议智能管理方法及系统

技术领域

本发明涉及一种会议智能管理方法及系统，尤其涉及一种灵活预约并自动合成语音形式的会议摘要的方法及系统。

背景技术

现如今，每天召开的各类会议数不胜数，会议室的预约管理通常采用填表的方式进行预约或者通过会议室管理系统进行会议室的预约登记管理。但是，填表方式预约会议室通常耗时耗力，且容易出错。通过会议室管理系统进行会议室的预约登记，预约成功的会议室不易变更，当发生突发情况时难以变更预约结果，当某些紧急会议需要召开时，组织者也无法与已预约会议室的人员进行沟通协调，不能满足会议室灵活、高效的使用需求。同时，为了记录会议内容，通常使用摄像机或者录音笔等采集工具记录下会议现场的视频或者音频数据，将视频数据或音频数据保存成多媒体文件，通过回放保存的文件，可以随时观看或收听到会议内容，或者事后人工将其转化为记录文本，满足备忘、培训等需求。此外，会议现场通常会安排专门的记录员或者参会者自己通过笔记本电脑或者手写等方式进行记录，记录下召开的会议内容。但是，视频或者音频数据通常较大，保存时要占用大量硬件存储空间，且会议时间较长时回放过程中不容易定位到所需的内容，用户寻找到感兴趣的对象内容需要花费很多时间，用户体验很差。采用人工的方式记录会议内容虽然有助于记录关键内容且查找方便，但对记录人的要求较高，不经过专门训练的人员通常很难跟上会议讲话的进度，容易发生疏漏。

自动摘要提取技术可对输入的文本、语音、视频等信息进行处理，获得输入数据中的摘要内容，将处理后的摘要结果呈现给用户浏览。自动摘要提取技术不仅节约了用户访问信息的时间，而且提高了用户的工作效率。现有技术中存在多种自动生成会议摘要或总结的方式。

专利文献1(CN107409061A)提供了一种语音总结的方法、系统，计算机基于比较参与者的图像与讲话者和非讲话者面部的模板图像判断哪个参与者正在讲话。计算机通过将隐马尔可夫模型应用到参与者声音波形的简要记录确定讲话参与者的声纹，并将确定的声纹与讲话参与者的面部相关联。计算机识别并转录讲话者所做陈述的内容，确定关键点，并在视频会议中参与者的面部上方显示它们。

专利文献2(CN102572356 A)提供了一种记录会议的方法，设置配置文件，定义会议的关键信息(例如举手问问题场景)以及会议摘要的格式，在会议时间线上特定时间点，基于配置文件提取各个会场的关键信息，将各个会场的关键信息组合成关键索引点，所述关键索引点用作与会议摘要进行互动或编辑的索引点；将对应于多个时间点的多个关键索引点结合为会议摘要；根据所述会议摘要中的关键信息与所述会议摘要进行互动或编辑。

但是，无论专利文献1虽然能够识别讲话参与者并将讲话的关键内容与参与者关联起来显示，但是，其对所有参与者提取其讲话信息的方式都是相同的，并不能根据不同参与者的不同情况有选择的提取不同参与者的讲话内容。在实际会议中，不同参与者的重要性通常是不同的，如果对每位参与者使用同样的方式提取其讲话信息，则有可能针对不重要的参与者讲话内容提取的信息过多造成资源浪费，而针对重要的参与者讲话内容提取的信息过少造成信息疏漏。并且专利文献1中识别并转录讲话者所做陈述的内容，确定关键点后是生成文字等信息显示出来供用户观看阅读，丧失了语音文件自身的优势。此外，专利文献1通过比较参与者的图像与讲话者和非讲话者面部的模板图像判断哪个参与者正在讲话，再计算机通过将隐马尔可夫模型应用到参与者声音波形的简要记录确定讲话参与者的声纹，识别参与者的过程比较复杂，效率较低。

对于专利文献2，需要提取会场的关键信息，将会场的关键信息组合成关键索引点，基于多个时间点的多个关键索引点结合为会议摘要，一方面对会场环境数据的采集提出了更高的要求，另一方面容易受外部环境因素影响，其关键索引点并不一定代表会议的重要信息，其形成的会议摘要可能并不准确。

发明内容

基于上述问题，本发明的目的在于提供一种会议智能管理方法及系统，能够灵活预约会议室，并针对会议记录识别不同发言者的关键发言内容，自动合成语音形式的会议摘要。

所述会议的智能管理方法包括：

S1、设置用户角色，录入用户信息，其中，预先设置所述用户角色的类型，针对每种角色类型录入对应的多个所述用户信息并存储，每位用户均拥有唯一的用户名；采集不同用户的声纹特征信息，其中，利用声纹识别技术识别不同用户，采集不同用户的声音数据，识别用户的声纹特征数据并将其与用户名对应存储；

S2、设置不同所述角色类型对应的权限等级，其中，根据多个所述角色类型自身的属性设置多个权限等级，每种所述角色类型对应一个所述权限等级；

S3、用户预约会议室，经预约的会议室，在预约时间段内只有预约用户可以打开所述会议室的门禁系统，其中，用户能够对已经预约的会议室的预约结果提出变更请求，根据用户不同角色类型进行不同方式的变更处理；

S4、验证用户的所述会议室使用权限，确认是否允许所述用户使用所述会议室；

S5、在会议进行期间，采集会议音频/视频数据；

S6、对录制的音频/视频数据进行预处理后存储，其中，记录下该发言人发言的开始时间和结束时间，并获取该发言人的姓名、用户名，将发言人、发言开始时间、发言结束时间与采集的音频/视频数据关联处理并存储；

S7、确定不同发言人的权重系数；

S8、根据发言人获取其对应的候选关键发言片段集合，其中，根据发言人的姓名在存储的音频/视频中检索，找到其对应的具体发言片段，利用预设的策略在发言片段中截取候选的关键发言片段，具有不同权重系数的发言人对应的截取候选关键发言片段的预设策略不同；

S9、对获取的候选关键发言片段集合进行语音识别处理，筛选定位重点发言内容对应的音频/视频片段集合；

S10、对步骤105中筛选出的音频/视频片段集合进行合成，形成语音摘要。

可选地，所述步骤S3中，用户通过网络预约会议室，获取用户的用户名，根据所述用户名获取其对应的角色类型，显示其能够预约的会议室，以及所述会议室允许工作时间段，同时显示该会议室哪些时间段已被其他用户预约成功，哪些时间段空闲，对于已被预约成功的时间段显示为已预约并显示预约用户的角色类型，对于未被预约成功的时间段显示为空闲，用户选择所需的会议室及所需的时间段，提交预约请求，系统确认预约成功后提示用户。

可选地，所述用户选择所需的会议室及所需的时间段，提交预约请求，系统确认预约成功后提示用户进一步包括：

用户选择所需的会议室及所需时间段，提交预约请求，系统判断该会议室的该时间段是否已被其他用户预约，若判断未被其他用户预约，则确认预约成功并提示用户；

若判断已被其他用户预约，则获取已预约用户角色类型对应的权限等级，同时获取当前提交预约请求用户的角色类型对应的权限等级，判断二者权限等级高低，当已预约用户角色类型对应的权限等级低于当前提交预约请求用户的角色类型对应的权限等级时，则取消已预约用户的预约，确认当前提交的预约请求成功并提示用户；当已预约用户角色类型对应的权限等级等于或者高于当前提交预约请求用户的角色类型对应的权限等级时，提示当前用户可向已预约的用户发送预约变更请求，当前用户输入请求变更的理由，向已预约的用户发送预约变更请求，所述预约变更请求包括所述请求变更的理由、请求变更预约的会议室及对应的时间段，已预约的用户确认是否同意预约变更请求并向系统反馈，如果已预约的用户确认同意所述预约变更请求，系统则取消已预约用户的预约，确认当前提交的预约请求成功并提示用户，如果已预约的用户不同意所述预约变更请求，则向当前用户提示预约变更请求失败，提示当前用户选择其他时间段预约。

可选地，所述步骤S4还包括：

S401、利用会议室门禁处设置的语音采集器，采集用户语音数据，获取对应用户的用户名，其中，根据当前采集的语音数据识别其中的声纹特征数据，将识别出的声纹特征数据与预先采集存储的用户声纹特征数据进行匹配，匹配成功后获取当前语音数据对应用户的用户名；

S402、获取当前时间，判断当前时间该会议室是否已被预约，如果未被预约，则允许用户进入并使用该会议室。如果已被预约，则获取预约该会议室的用户名，与S401中获取的用户名比较是否一致，一致则开放该会议室门禁，允许用户进入并使用该会议室；不一致则提示用户该会议室已被预约，当前时间不可用，并结束流程。

可选地，所述步骤S5进一步包括：

由用户手动启动和停止音频/视频数据采集以录制需要的内容；

或者，令录制用麦克风循环检测语音信息，当检测到发言人开始发言的语音信息时，触发录制开始命令，采集发言人的音频/视频数据，记录下发言开始时间，根据采集到的音频/视频数据的属性判断当前发言人的发言在继续还是已经停止，当采集到的音频/视频数据满足预设条件时，触发录制暂停或停止命令，记录下发言结束时间，录制用麦克风继续循环检测语音信息，检测到下一发言人开始发言的语音信息时，触发继续录制命令或者录制开始命令，录制下一位发言人的音频/视频数据。

可选地，所述步骤S6进一步包括：

读取预先存储的会议议程表，会议议程表存储有会议议程，以及会议中各发言人的发言时间段，根据会议议程表获取当前时间对应的发言人，将发言人、发言开始时间、发言结束时间与采集的音频/视频数据关联处理，并存储于存储装置中；

或者，根据当前采集的音频/视频数据识别其中的声纹特征数据，将识别出的声纹特征数据与步骤S1中采集存储的用户声纹特征数据进行匹配，匹配成功后获取当前发言人的姓名、用户名，将发言人、发言开始时间、发言结束时间与采集的音频/视频数据关联处理，并存储于存储装置中。

可选地，所述步骤S7进一步包括：

根据会议议程表存储的会议议程确定发言人的发言位置，根据发言人的发言位置对不同发言人赋予不同的权重系数A；

和/或

根据发言人的用户名获取其对应的权限等级，根据发言人的权限等级对不同发言人赋予不同的权重系数B。

可选地，所述步骤S8进一步包括：

结合该发言人对应发言音频/视频片段的时间轴，截取其特定时间段的音频/视频片段作为候选的关键发言片段，权重系数越高，截取的特定时间段音频/视频片段数量越多和/或长度越长；权重系数越低，截取的特定时间段音频/视频片段数量越少和/或长度越短。

可选地，所述步骤S8进一步包括：

预先设置关键词库，对发言人对应发言音频/视频片段进行语音识别处理，使用预设的关键词库对识别出的语音信息进行匹配，匹配成功后截取识别出的关键词后预设时间段的音频/视频片段作为候选的关键发言片段，不同权重发言人对应的关键词库和/或截取的预设时间段长度不同，权重系数越高，对应的关键词库中关键词数量越多和/或截取的音频/视频片段长度越长，权重系数越低，对应的关键词库中关键词数量越少和/或截取的音频/视频片段长度越短。

可选地，所述步骤S9进一步包括：

结合会议主题确定重点发言内容，对步骤S8中获取的候选关键发言片段进行语音识别处理，将其转化为文本数据，转化后的文本数据具有与音频/视频数据相对应的时间轴，根据文本数据中的内容能够定位到相应时间段的音频/视频数据，利用重点发言内容对应的关键词对转化后的文本数据进行筛选，最终确定重点发言内容对应的音频/视频片段集合。

可选地，所述步骤S10进一步包括：

将步骤S9中筛选出的同一发言人的音频/视频片段集合按时间顺序排序，将排序后的音频/视频片段集合拼接为一段音频/视频，作为该发言人发言内容的语音摘要；根据会议主题、会议议程等信息预先生成摘要的头部信息，并将上述信息生成头部信息语音文件，再根据会议议程等信息生成摘要中承前启后的过渡信息，并将上述过渡信息生成过渡信息语音文件，将头部信息语音文件、过渡信息语音文件、拼接完成的不同发言人的语音摘要按对应关系合成到一起，形成会议的语音摘要。

所述会议的智能管理系统包括：

用户设置模块，用于设置用户角色，录入用户信息，其中，预先设置所述用户角色的类型，针对每种角色类型录入对应的多个所述用户信息并存储，每位用户均拥有唯一的用户名；采集不同用户的声纹特征信息，其中，利用声纹识别技术识别不同用户，采集不同用户的声音数据，识别用户的声纹特征数据并将其与用户名对应存储；

权限等级设置模块，用于设置不同角色类型对应的权限等级，其中，根据角色类型自身的属性设置多个权限等级，每种角色类型对应一个权限等级；

会议室预约模块，用于供用户预约会议室，经预约的会议室，在预约时间段内只有预约用户可以打开所述会议室的门禁系统，其中，用户能够对已经预约的会议室的预约结果提出变更请求，根据用户不同角色类型进行不同方式的变更处理；

会议室使用权限验证模块，用于验证用户会议室使用权限，确认是否允许该用户使用该会议室；

数据采集模块，用于在会议进行期间，采集会议音频/视频数据；

音频/视频数据预处理模块，用于对录制的音频/视频数据进行预处理后存储，其中，记录下该发言人发言的开始时间和结束时间，并获取该发言人的姓名、用户名，将发言人、发言开始时间、发言结束时间与采集的音频/视频数据关联处理，并存储于存储装置中；

发言人权重确定模块，用于确定不同发言人的权重系数；

候选关键发言片段集合获取模块，用于根据发言人获取其对应的候选关键发言片段集合，其中，候选关键发言片段集合获取模块根据发言人的姓名在存储的音频/视频中检索，找到其对应的具体发言片段，利用预设的策略在发言片段中截取候选的关键发言片段，具有不同权重系数的发言人对应的截取候选关键发言片段的预设策略不同；

音频/视频片段集合筛选模块，用于对获取的候选关键发言片段集合进行语音识别处理，筛选定位重点发言内容对应的音频/视频片段集合；

语音摘要合成模块，用于对音频/视频片段集合筛选模块筛选出的音频/视频片段集合进行合成，形成语音摘要。

可选地，所述会议室预约模块进一步包括：

预约请求模块，用户可通过网络预约会议室，预约请求模块获取用户的用户名，根据所述用户名获取其对应的角色类型，根据角色类型显示其能够预约的会议室，同时显示该会议室哪些时间段已被其他用户预约成功，哪些时间段空闲，对于已被预约成功的时间段显示为已预约并显示预约用户的角色类型，对于未被预约成功的时间段显示为空闲，用户通过预约请求模块选择所需的会议室及所需的时间段，提交预约请求，系统确认预约成功后提示用户。

可选地，所述会议室预约模块进一步包括：

预约变更请求模块，用于对已经预约的会议室的预约结果进行变更，用户通过预约请求模块选择所需的会议室及所需的时间段，提交预约请求，系统判断该会议室的该时间段是否已被其他用户预约，若判断未被其他用户预约，则确认预约成功并提示用户；

若判断已被其他用户预约，预约变更请求模块则获取已预约用户角色类型对应的权限等级，同时获取当前提交预约请求用户的角色类型对应的权限等级，判断二者权限等级高低，当已预约用户角色类型对应的权限等级低于当前提交预约请求用户的角色类型对应的权限等级时，则取消已预约用户的预约，确认当前提交的预约请求成功并提示用户，当已预约用户角色类型对应的权限等级等于或者高于当前提交预约请求用户的角色类型对应的权限等级时，提示当前用户可向已预约的用户发送预约变更请求，当前用户输入请求变更的理由，预约变更请求模块向已预约的用户发送预约变更请求，所述预约变更请求包括所述请求变更的理由、请求变更预约的会议室及对应的时间段，已预约的用户确认是否同意预约变更请求并向系统反馈，如果已预约的用户确认同意所述预约变更请求，系统则取消已预约用户的预约，确认当前提交的预约请求成功并提示用户，如果已预约的用户不同意所述预约变更请求，预约变更请求模块向当前用户提示预约变更请求失败，还可提示当前用户选择其他时间段预约。

可选地，所述会议室使用权限验证模块进一步包括：

语音数据采集模块，用于利用会议室门禁处设置的语音采集器，采集用户语音数据，获取对应用户的用户名，根据当前采集的语音数据识别其中的声纹特征数据，将识别出的声纹特征数据与预先采集存储的用户声纹特征数据进行匹配，匹配成功后获取当前语音数据对应用户的用户名；

预约判断模块，用于获取当前时间，判断当前时间该会议室是否已被预约，如果未被预约，则允许用户进入并使用该会议室，如果已被预约，则获取预约该会议室的用户名，与语音数据采集模块获取的用户名比较是否一致，一致则开放该会议室门禁，允许用户进入并使用该会议室；不一致则提示用户该会议室已被预约，当前时间不可用，并结束流程。

可选地，所述数据采集模块进一步用于：

可选地，所述音频/视频数据预处理模块进一步包括：

会议议程处理模块，用于读取预先存储的会议议程表，会议议程表存储有会议议程，以及会议中各发言人的发言时间段。根据会议议程表获取当前时间对应的发言人，将发言人、发言开始时间、发言结束时间与采集的音频/视频数据关联处理，并存储于存储装置中；

声纹识别模块，预先采集与会发言者的声音数据，识别与会发言者的声纹特征数据并将其与与会发言者姓名对应存储，声纹识别模块根据当前采集的音频/视频数据识别其中的声纹特征数据，将识别出的声纹特征数据与用户设置模块采集存储的用户声纹特征数据进行匹配，匹配成功后获取当前发言人的姓名、用户名，将发言人、发言开始时间、发言结束时间与采集的音频/视频数据关联处理，并存储于存储装置中。

可选地，发言人权重确定模块进一步用于：

和/或

通过网络搜索发言人的相关身份信息和/或个人资料，根据获取的身份信息基于预设算法计算该发言人的权重系数B。

可选地，候选关键发言片段集合获取模块进一步包括：

时间段截取模块，用于结合该发言人对应发言音频/视频片段的时间轴，截取其特定时间段的音频/视频片段作为候选的关键发言片段，权重系数越高，截取的特定时间段音频/视频片段数量越多和/或长度越长；权重系数越低，截取的特定时间段音频/视频片段数量越少和/或长度越短。

可选地，候选关键发言片段集合获取模块进一步包括：

关键词截取模块，预先设置关键词库，对发言人对应发言音频/视频片段进行语音识别处理，使用预设的关键词库对识别出的语音信息进行匹配，匹配成功后截取识别出的关键词后预设时间段的音频/视频片段作为候选的关键发言片段，不同权重发言人对应的关键词库和/或截取的预设时间段长度不同，权重系数越高，对应的关键词库中关键词数量越多和/或截取的音频/视频片段长度越长，权重系数越低，对应的关键词库中关键词数量越少和/或截取的音频/视频片段长度越短。

可选地，音频/视频片段集合筛选模块进一步用于，结合会议主题确定重点发言内容，对候选关键发言片段集合获取模块获取的候选关键发言片段进行语音识别处理，将其转化为文本数据，转化后的文本数据具有与音频/视频数据相对应的时间轴，能够根据文本数据中的内容定位到相应时间段的音频/视频数据，利用重点发言内容对应的关键词对转化后的文本数据进行筛选，最终确定重点发言内容对应的音频/视频片段集合。

可选地，语音摘要合成模块进一步包括：

发言人语音摘要合成模块，用于将音频/视频片段集合筛选模块筛选出的同一发言人的音频/视频片段集合按时间顺序排序，将排序后的音频/视频片段集合拼接为一段音频/视频，作为该发言人发言内容的语音摘要；

会议语音摘要合成模块，用于生成整个会议的语音摘要，会议语音摘要合成模块可根据会议主题、会议议程等信息生成摘要的头部信息，并将上述信息生成头部信息语音文件，会议语音摘要合成模块再根据会议议程等信息生成摘要中承前启后的过渡信息，并将上述信息生成过渡信息语音文件，会议语音摘要合成模块将头部信息语音文件、过渡信息语音文件、拼接完成的不同发言人的语音摘要按对应关系合成到一起，形成会议的语音摘要。

根据上述方式，本发明能够根据不同用户角色、等级权限提供多种会议室的预约方式，避免会议室的无序使用。通过用户角色与用户权限等级的区分，可以灵活的提供预约方式，通过对已经预约的会议室的预约结果根据不同用户的权限等级的不同进行不同方式的变更，方便会议的管理以及协调突发情况，并且在已预约用户与后来用户之间建立沟通协调机制，允许后来者与已预约用户之间就会议室的紧急需要进行沟通协调，为用户使用会议室提供了更大的灵活性。会议召开后，识别不同发言者的关键发言内容，并自动合成语音形式的会议摘要。通过检测发言人的语音信息自动化的开启和停止音频/视频录制，有效减少了无效内容的录制，节约了存储资源，并且减少了录制时间的长度，方便用户后续查找定位所需内容。通过分析发言人在会议中的发言位置、身份信息、个人资料等信息，确定发言人的权重系数，从而根据权重系数来用不同的预设策略获取不同发言人对应的候选关键发言片段集合，能够针对重要发言提取更多的内容，针对不重要的发言提取相对较少的内容，使最终形成的摘要内容更加合理，为用户提供更有效的帮助。根据发言内容本身的特点，例如发言的重要内容出现在发言时间轴上的概率较大的位置，或者发言的重要内容所跟的关键转折词、连接词，来截取候选关键发言片段集合，再对截取的候选关键发言片段集合进行处理以获取形成语音摘要的音频/视频片段集合，能够大大提升提取出的内容的有效性，并且提取效率高，不会受到环境等其他因素的影响，进一步使最终形成的摘要内容更加合理。

附图说明

图1为本发明方法流程图。

图2为会议室的预约状态示意图。

图3为会议议程表示意图。

图4为本发明系统结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面结合附图对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本申请一实施例提供的会议的智能管理方法的流程示意图。如图1所示，该方法包括：

S1、设置用户角色，录入用户信息。

首先根据实际情况预先设置用户角色的类型。例如在学校中，角色类型可包括：教师、学生、后勤主管、校长等。在公司中，角色类型可包括：董事长、总经理、部门经理、职员等。针对每种角色类型录入对应的多个用户信息并存储，用户信息包括姓名、联系方式(例如手机号码、邮箱)，将姓名作为用户的用户名，将角色类型与用户名对应存储，存储方式例如为映射表。存在重名的情况下，可为重名用户分配序号进行区分，例如小明1、小明2，将带序号的姓名作为该用户的用户名，每位用户均拥有唯一的用户名。通过上述用户角色等级的区分以及与每位用户的唯一关联，可以灵活针对每位用户设置不同的管理方式，有效提高了会议管理的智能性。

进一步地，采集不同用户的声纹特征信息，利用声纹识别技术识别不同用户。具体地，采集不同用户的声音数据，识别用户的声纹特征数据并将其与用户名对应存储。后续步骤中，根据当前采集的音频数据识别其中的声纹特征数据，将识别出的声纹特征数据与预先采集存储的用户声纹特征数据进行匹配，匹配成功后获取当前语音数据对应用户的用户名。

S2、设置不同角色类型对应的权限等级。

根据角色类型自身的属性设置多个权限等级，每种角色类型对应一个权限等级。例如可设置四个权限等级A、B、C、D，且权限高低次序为A>B>C>D。具体地，在学校中，校长权限最高，权限等级设置为A；后勤主管权限等级设置为B；教师权限等级为C；学生权限等级为D。在公司中，董事长权限最高，权限等级设置为A；总经理权限等级设置为B；部门经理权限等级为C；职员权限等级为D。

S3、用户预约会议室。

为了方便各个会议室的使用，允许用户预约会议室。经预约的会议室，在预约时间段内只有预约用户可以打开该会议室的门禁系统。具体地，用户可通过网络登录智能会议控制系统，系统根据登录用户的用户名获取其对应的角色类型，显示其能够预约的会议室，同时显示该会议室哪些时间段已被其他用户预约成功，哪些时间段空闲，对于已被预约成功的时间段显示为已预约并显示预约用户的角色类型，对于未被预约成功的时间段显示为空闲。参见附图2示出了会议室的预约状态显示。用户选择所需的会议室及所需的时间段，提交预约请求，系统确认预约成功后提示用户，还可在预约成功后通过短信等方式向用户发送预约成功信息，所述预约成功信息包括预约的会议室以及预约时间段。进一步地，为了方便会议的管理以及应付一些突发情况，可以对已经预约的会议室的预约结果进行变更。具体方式如下。用户选择所需的会议室及所需时间段，提交预约请求，系统判断该会议室的该时间段是否已被其他用户预约，若判断未被其他用户预约，则确认预约成功并提示用户，通过短信等方式向用户发送预约成功信息，所述预约成功信息包括预约的会议室以及预约时间段；若判断已被其他用户预约，则获取已预约用户角色类型对应的权限等级，同时获取当前提交预约请求用户的角色类型对应的权限等级，判断二者权限等级高低，当已预约用户角色类型对应的权限等级低于当前提交预约请求用户的角色类型对应的权限等级时，则取消已预约用户的预约，确认当前提交的预约请求成功并提示用户，通过短信等方式向被取消预约的用户发送预约被取消的信息，所述预约被取消的信息包括被预约的会议室以及被取消的预约时间段，同时，通过短信等方式向当前提交的预约请求成功的用户发送预约成功信息，所述预约成功信息包括预约的会议室以及预约时间段。当已预约用户角色类型对应的权限等级等于或者高于当前提交预约请求用户的角色类型对应的权限等级时，提示当前用户可向已预约的用户发送预约变更请求，当前用户输入请求变更的理由，系统通过短信等方式向已预约的用户发送预约变更请求，所述预约变更请求包括所述请求变更的理由、请求变更预约的会议室及对应的时间段，已预约的用户确认是否同意预约变更请求并向系统反馈，如果已预约的用户确认同意所述预约变更请求，系统则取消已预约用户的预约，确认当前提交的预约请求成功并提示用户，通过短信等方式向被取消预约的用户发送预约被取消的信息，所述预约被取消的信息包括被预约的会议室以及被取消的预约时间段，同时，通过短信等方式向当前提交的预约请求成功的用户发送预约成功信息，所述预约成功信息包括预约的会议室以及预约时间段。如果已预约的用户不同意所述预约变更请求，则向当前用户提示预约变更请求失败，还可提示当前用户选择其他时间段预约。

例如会议室A在12月1日上午9：00～10：00已经被教师张三预约成功，后勤主管发现该会议室设备存在问题需要在12月1日上午9：00～10：00时间段进行维修，后勤主管在登录系统后，系统显示其能够预约的会议室以及该会议室的预约情况，其中会议室A在12月1日上午9：00～10：00已经被角色类型为教师的用户预约成功。此时，后勤主管可针对会议室A在12月1日上午9：00～10：00，提交预约请求，系统判断会议室A该时间段已被张三预约，则获取张三对应的权限等级，同时获取后勤主管的权限等级，判断张三的权限等级低于后勤主管的权限等级，则取消张三的预约，确认当前提交的预约请求成功并提示用户，向张三发送消息“您预约的会议室A(12月1日上午9：00～10：00)已被取消，请谅解”，向后勤主管发送消息“您预约的会议室A(12月1日上午9：00～10：00)已预约成功”。

或者会议室A在12月1日上午9：00～10：00已经被教师张三预约成功，学生小明负责的课题需要使用会议室A在12月1日上午9：00～10：00进行答辩，小明在登录系统后，系统显示其能够预约的会议室以及该会议室的与预约情况，其中会议室A在12月1日上午9：00～10：00已经被角色类型为教师的用户预约成功。此时，小明可针对会议室A在12月1日上午9：00～10：00，提交预约请求，系统判断会议室A该时间段已被张三预约，则获取张三对应的权限等级，同时获取小明的权限等级，判断张三的权限等级高于小明的权限等级，则提示小明可向已预约的用户发送预约变更请求，小明输入请求变更的理由，例如“老师好！学生小明于12月1日上午9：00～10：00需要用会议室A进行课题答辩，因外请评审专家时间难以变更，冒昧请求老师能够允许小明12月1日上午9：00～10：00使用会议室A”，系统通过短信等方式向张三发送预约变更请求，张三确认是否同意预约变更请求并向系统反馈，如果张三确认同意所述预约变更请求，系统则取消张三的预约，确认小明提交的预约请求成功并提示用户，向张三发送消息“您预约的会议室A(12月1日上午9：00～10：00)已被取消，请谅解”，向小明发送消息“您预约的会议室A(12月1日上午9：00～10：00)已预约成功”。如果张三不同意所述预约变更请求，则向小明提示预约变更请求失败，还可提示小明选择其他时间段预约。

传统的预约方式单一、固定，预约成功后难以根据情况变化做出适当的调整，通过本发明的预约方式，根据用户角色类型、权限等级，提供不同的预约方式，并针对预约成功的会议室在预约人员之间提供协商机制，既保障了会议室的有序使用，又为各种管理需求以及突发情况的处理提供了智能、灵活的调整方式，为用户使用会议室提供了极大的灵活性。

S4、验证用户会议室使用权限，确认是否允许该用户使用该会议室。

S401、利用会议室门禁处设置的语音采集器，采集用户语音数据，获取对应用户的用户名。

根据当前采集的语音数据识别其中的声纹特征数据，将识别出的声纹特征数据与预先采集存储的用户声纹特征数据进行匹配，匹配成功后获取当前语音数据对应用户的用户名。

S402、获取当前时间，判断当前时间该会议室是否已被预约。如果未被预约，则允许用户进入并使用该会议室。如果已被预约，则获取预约该会议室的用户名，与S401中获取的用户名比较是否一致，一致则开放该会议室门禁，允许用户进入并使用该会议室；不一致则提示用户该会议室已被预约，当前时间不可用，并结束流程。

S5、在会议进行期间，采集会议音频/视频数据。

通常情况下，会议持续时间并不确定，可能进行很长时间，并非在整个会议过程均有发言者的语音数据需要记录，此时若在会议期间全程录制会造成资源浪费，也会进一步增加对象内容的查找难度。具体地，可由用户手动启动、暂停或停止音频/视频数据采集以录制需要的内容。此外，为了避免用户手动操作产生失误，可令录制用麦克风循环检测语音信息，当检测到发言人开始发言的语音信息时，触发录制开始命令，采集发言人的音频/视频数据，记录下发言开始时间。根据采集到的音频/视频数据的属性(例如语音强度大小)判断当前发言人的发言在继续还是已经停止，当采集到的音频/视频数据满足预设条件时，例如发言停止超过一定时间则认为该与会者发言结束，触发录制暂停或停止命令，记录下发言结束时间。录制用麦克风继续循环检测语音信息，检测到下一发言人开始发言的语音信息时，触发继续录制命令或者录制开始命令，录制下一位发言人的音频/视频数据。所述发言人均为步骤S1中已录入用户信息并设置用户角色的用户。

S6、对录制的音频/视频数据进行预处理后存储。

录制暂停后或者结束后记录下该发言人发言的开始时间和结束时间，并获取该发言人的姓名、用户名。

可选的，读取预先存储的会议议程表，会议议程表存储有会议议程，以及会议中各发言人的发言时间段。参见图3，9:00～9:10为开幕式，发言人李明对应的发言时间为9:10～9:30，发言人王伟对应的发言时间为9:30～9:50，阶段性总结发言时间为10:30～11:00，大会总结发言时间为16:30～17:00等，根据会议议程表获取当前时间对应的发言人，将发言人、发言开始时间、发言结束时间与采集的音频/视频数据关联处理，并存储于存储装置中。

或者，利用声纹识别技术识别当前发言的与会者。具体地，根据当前采集的音频/视频数据识别其中的声纹特征数据，将识别出的声纹特征数据与步骤S1中预先采集存储的用户声纹特征数据进行匹配，匹配成功后获取当前发言人的姓名、用户名，将发言人、发言开始时间、发言结束时间与采集的音频/视频数据关联处理，并存储于存储装置中。

S7、确定不同发言人的权重信息。

发言人在会议中的发言位置通常能够反映其在会议中的地位与作用，例如大会的第一位发言人与最后一位发言人通常会占据较重的地位，或者大会开幕式、中场总结发言与终场总结发言也会在会议中占据重要的地位。因此，根据会议议程表存储的会议议程确定发言人的发言位置，根据发言人的发言位置对不同发言人赋予不同的权重系数A。

另外，发言人的权限等级也能够反映该发言人在会议中占据的地位，根据发言人的用户名获取其对应的权限等级，根据发言人的权限等级对不同发言人赋予不同的权重系数B。

综合发言人对应的权重系数A与权重系数B确定该发言人最终的权重系数C。也可仅利用发言人的权重系数A或者权重系数B作为该发言人的最终权重系数。发言人的权重系数越大表示其发言内容重要程度越大。

上述为发言人确定权重系数的方式区别于传统单一的针对所有发言人提取发言内容相同的方式，能够根据权重系数来用不同的预设策略获取不同发言人对应的候选关键发言片段集合，针对重要发言提取更多的内容，针对不重要的发言提取相对较少的内容，使最终形成的摘要内容更加合理，为用户提供更有效的帮助。

S8、根据发言人获取其对应的候选关键发言片段集合。

根据发言人的姓名和/或用户名在存储的音频/视频中检索，找到其对应的具体发言片段，利用预设的策略在发言片段中截取候选的关键发言片段。

其中，具有不同权重系数的发言人对应的截取候选关键发言片段的预设策略不同。权重系数越高，截取的音频/视频片段数量越多和/或长度越长；权重系数越低，截取的音频/视频片段数量越少和/或长度越短。

具体的，根据人们的发言习惯，一般一段发言的重要内容出现在0％～5％，10％～30％及80％～100％之间的概率较大，此时，结合该发言人对应发言音频/视频片段的时间轴，截取其特定时间段(例如0％～5％，10％～30％及80％～100％)的音频/视频片段作为候选的关键发言片段。时间段的选择可以根据实际情况进行设置，不同权重系数发言人截取的音频/视频片段数量及长度不同。权重系数越高，截取的特定时间段音频/视频片段数量越多和/或长度越长；权重系数越低，截取的特定时间段音频/视频片段数量越少和/或长度越短。举例说明，发言人李明权重系数为0.9，发言人王伟权重系数为0.7，也即发言人李明权重系数大于王伟时，则(1)针对李明的发言片段截取时间段如下：0％～5％、10％～20％、50％～60％、80％～100％，针对王伟的发言片段截取时间段如下：0％～5％、10％～20％、80％～100％。或者(2)针对李明的发言片段截取时间段如下：0％～5％、10％～20％、50％～60％、80％～100％，针对王伟的发言片段截取时间段如下：0％～5％、10％～15％、50％～60％、90％～100％。或者(3)针对李明的发言片段截取时间段如下：0％～5％、10％～20％、50％～60％、80％～100％，针对王伟的发言片段截取时间段如下：0％～5％、10％～15％、90％～100％。

或者，一些关键转折词、连接词后通常会引出发言的重要内容，例如“首先、其次、然而、最重要的是、最后”，可预先设置关键词库，对发言人对应发言音频/视频片段进行语音识别处理，使用预设的关键词库对识别出的语音信息进行匹配，匹配成功后截取识别出的关键词后预设时间段的音频/视频片段作为候选的关键发言片段。例如在识别出发言人对应的发言音频/视频片段中包括预先设置的关键词“重要的是”时，截取该关键词后1分钟的音频/视频片段作为候选的关键发言片段。通过设置不同的关键词库可以控制匹配出的关键词数量，通常关键词库中包括的关键词数量越多，使用该关键词库去进行匹配时，识别出的关键词数量相应也会越多。其中预设时间段的长度也可根据实际情况进行调整。因此，不同权重发言人对应的关键词库和/或截取的预设时间段长度不同。权重系数越高，对应的关键词库中关键词数量越多和/或截取的音频/视频片段长度越长；权重系数越低，对应的关键词库中关键词数量越少和/或截取的音频/视频片段长度越短。举例说明，发言人李明权重系数为0.9，发言人王伟权重系数为0.7，也即发言人李明权重系数大于王伟时，关键词库A包括20个关键词，关键词库B包括10个关键词，则(1)使用预设的关键词库A对李明对应的发言音频/视频片段识别出的语音信息进行匹配，匹配成功后截取识别出的关键词后3分钟的音频/视频片段作为候选的关键发言片段；使用预设的关键词库B对李明对应的发言音频/视频片段识别出的语音信息进行匹配，匹配成功后截取识别出的关键词后3分钟的音频/视频片段作为候选的关键发言片段。或者(2)使用预设的关键词库A对李明对应的发言音频/视频片段识别出的语音信息进行匹配，匹配成功后截取识别出的关键词后3分钟的音频/视频片段作为候选的关键发言片段；使用预设的关键词库A对李明对应的发言音频/视频片段识别出的语音信息进行匹配，匹配成功后截取识别出的关键词后1分钟的音频/视频片段作为候选的关键发言片段。或者(3)使用预设的关键词库A对李明对应的发言音频/视频片段识别出的语音信息进行匹配，匹配成功后截取识别出的关键词后3分钟的音频/视频片段作为候选的关键发言片段；使用预设的关键词库B对李明对应的发言音频/视频片段识别出的语音信息进行匹配，匹配成功后截取识别出的关键词后1分钟的音频/视频片段作为候选的关键发言片段。

上述结合该发言人对应发言音频/视频片段的时间轴，截取其特定时间段的音频/视频片段作为候选的关键发言片段的方式，以及对发言人对应发言音频/视频片段进行语音识别处理，使用预设的关键词库对识别出的语音信息进行匹配，匹配成功后截取识别出的关键词后预设时间段的音频/视频片段作为候选的关键发言片段的方式，二者可以选择一种作为截取候选的关键发言片段的方式，也可以综合两种方式来截取候选的关键发言片段，例如先采用第一种方式，后采用第二种方式，截取出候选关键发言片段集合。

上述截取候选的关键发言片段的方式能够根据发言内容本身的特点，例如发言的重要内容出现在发言时间轴上的概率较大的位置，或者发言的重要内容所跟的关键转折词、连接词，来截取候选关键发言片段集合，能够大大提升提取出的内容的有效性，并且提取效率高，不会受到环境等其他因素的影响，进一步使最终形成的摘要内容更加合理

S9、对获取的候选关键发言片段集合进行语音识别处理，筛选定位重点发言内容对应的音频/视频片段集合。

具体地，结合会议主题可确定重点发言内容，所述重点发言内容可以为与会议主题相关的一系列关键词。对步骤S8中获取的候选关键发言片段进行语音识别处理，将其转化为文本数据，转化后的文本数据具有与音频/视频数据相对应的时间轴，可以根据文本数据中的内容定位到相应时间段的音频/视频数据。利用重点发言内容对应的关键词对转化后的文本数据进行筛选，最终确定重点发言内容对应的音频/视频片段集合。

上述结合会议主题可确定重点发言内容进一步提升了提取出的内容的有效性。

S10、对步骤S9中筛选出的音频/视频片段集合进行合成，形成语音摘要。

将步骤S9中筛选出的同一发言人的音频/视频片段集合按时间顺序排序，将排序后的音频/视频片段集合拼接为一段音频/视频，作为该发言人发言内容的语音摘要。进一步地，还可生成整个会议的语音摘要。可根据会议主题、会议议程等信息预先生成摘要的头部信息，例如：“2017年3月30日市场部例会在会议室A举行，与会人员包括：李明、王伟……”，并将上述信息生成头部信息语音文件。再根据会议议程等信息生成摘要中承前启后的过渡信息，例如：“在会议开始张三对当月工作进行总结”，“会议期间，李四、王伟、李明等进行了发言”，“其中王伟发言主要内容为”，“最后，王五对下月工作进行部署，具体内容为”，并将上述信息生成过渡信息语音文件。将头部信息语音文件、过渡信息语音文件、拼接完成的不同发言人的语音摘要按时间序列及对应关系合成到一起，形成会议的语音摘要。例如，生成对应于下列文字的语音摘要文件：2017年3月30日市场部例会在会议室A举行，与会人员包括：李明、王伟……，在会议开始张三对当月工作进行总结，具体内容为“张三发言语音摘要”；会议期间，李四、王伟、李明等进行了发言，其中王伟发言主要内容为“王伟发言语音摘要”，最后，王五对下月工作进行部署，具体内容为“王五发言语音摘要”。

下面结合图4说明根据本发明实施例的会议智能管理系统的结构示意图。

系统400包括如下模块：

用户设置模块401，用于设置用户角色，录入用户信息。

用户设置模块401包括：

输入输出装置4011，接收系统管理员输入的用户角色的类型，例如在学校中，角色类型可包括：教师、学生、后勤主管、校长等。在公司中，角色类型可包括：董事长、总经理、部门经理、职员等。接收每种角色类型对应的多个用户信息，用户信息包括姓名、联系方式(例如手机号码、邮箱)，将姓名作为用户的用户名，存在重名的情况下，可为重名用户分配序号进行区分，例如小明1、小明2，将带序号的姓名作为该用户的用户名，每位用户均拥有唯一的用户名。

存储装置4012，存储用户角色类型，并针对每种角色类型对应的多个用户信息关联存储。将角色类型与用户名对应存储，存储方式例如为映射表。通过上述用户角色等级的区分以及与每位用户的唯一关联，可以灵活针对每位用户设置不同的使用方式，有效提高了会议管理的智能性。

声纹特征信息采集模块4013，采集不同用户的声纹特征信息，利用声纹识别技术识别不同用户。具体地，采集不同用户的声音数据，识别用户的声纹特征数据并将其与用户名对应存储于存储装置4012。

系统400还包括权限等级设置模块402，用于设置不同角色类型对应的权限等级。

根据角色类型自身的属性设置多个权限等级，每种角色类型对应一个权限等级。例如可设置四个权限等级A、B、C、D，且权限高低次序为A>B>C>D。具体地，在学校中，校长权限最高，权限等级设置为A；后勤主管权限等级设置为B；教师权限等级为C；学生权限等级为D。在公司中，董事长权限最高，权限等级设置为A；总经理权限等级设置为B；部门经理权限等级为C；职员权限等级为D。通过上述用户权限等级的区分，可以灵活针对每位用户设置不同的预约方式，有效提高了会议预约的灵活性。

系统400还包括会议室预约模块403，用于供用户预约会议室。

为了方便各个会议室的使用，允许用户预约会议室。经预约的会议室，在预约时间段内只有预约用户可以打开该会议室的门禁系统。

具体地，会议室预约模块403包括预约请求模块4031，用户可通过网络登录智能会议控制系统400，预约请求模块4031根据登录用户的用户名获取其对应的角色类型，显示其能够预约的会议室，同时显示该会议室哪些时间段已被其他用户预约成功，哪些时间段空闲，对于已被预约成功的时间段显示为已预约并显示预约用户的角色类型，对于未被预约成功的时间段显示为空闲。用户通过预约请求模块4031选择所需的会议室及所需的时间段，提交预约请求，系统确认预约成功后提示用户，还可在预约成功后通过短信等方式向用户发送预约成功信息，所述预约成功信息包括预约的会议室以及预约时间段。

进一步地，为了方便会议室的管理以及应付一些突发情况，会议室预约模块403包括预约变更请求模块4032，用于对已经预约的会议室的预约结果进行变更。用户通过预约请求模块4031选择所需的会议室及所需时间段，提交预约请求，系统判断该会议室的该时间段是否已被其他用户预约，若判断未被其他用户预约，则确认预约成功并提示用户，通过短信等方式向用户发送预约成功信息，所述预约成功信息包括预约的会议室以及预约时间段；若判断已被其他用户预约，预约变更请求模块4032则获取已预约用户角色类型对应的权限等级，同时获取当前提交预约请求用户的角色类型对应的权限等级，判断二者权限等级高低，当已预约用户角色类型对应的权限等级低于当前提交预约请求用户的角色类型对应的权限等级时，则取消已预约用户的预约，确认当前提交的预约请求成功并提示用户，通过短信等方式向被取消预约的用户发送预约被取消的信息，所述预约被取消的信息包括被预约的会议室以及被取消的预约时间段，同时，通过短信等方式向当前提交的预约请求成功的用户发送预约成功信息，所述预约成功信息包括预约的会议室以及预约时间段。当已预约用户角色类型对应的权限等级等于或者高于当前提交预约请求用户的角色类型对应的权限等级时，提示当前用户可向已预约的用户发送预约变更请求，当前用户输入请求变更的理由，预约变更请求模块4032通过短信等方式向已预约的用户发送预约变更请求，所述预约变更请求包括所述请求变更的理由、请求变更预约的会议室及对应的时间段，已预约的用户确认是否同意预约变更请求并向系统反馈，如果已预约的用户确认同意所述预约变更请求，系统则取消已预约用户的预约，确认当前提交的预约请求成功并提示用户，通过短信等方式向被取消预约的用户发送预约被取消的信息，所述预约被取消的信息包括被预约的会议室以及被取消的预约时间段，同时，通过短信等方式向当前提交的预约请求成功的用户发送预约成功信息，所述预约成功信息包括预约的会议室以及预约时间段。如果已预约的用户不同意所述预约变更请求，预约变更请求模块4032向当前用户提示预约变更请求失败，还可提示当前用户选择其他时间段预约。

系统400还包括会议室使用权限验证模块404，用于验证用户会议室使用权限，确认是否允许该用户使用该会议室，包括：

语音数据采集模块4041，用于利用会议室门禁处设置的语音采集器，采集用户语音数据，获取对应用户的用户名。

预约判断模块4042，用于获取当前时间，判断当前时间该会议室是否已被预约。如果未被预约，则允许用户进入并使用该会议室。如果已被预约，则获取预约该会议室的用户名，与语音数据采集模块4041获取的用户名比较是否一致，一致则开放该会议室门禁，允许用户进入并使用该会议室；不一致则提示用户该会议室已被预约，当前时间不可用，并结束流程。

系统400还包括数据采集模块405，用于在会议进行期间，采集会议音频/视频数据。

通常情况下，会议持续时间并不确定，可能进行很长时间，并非在整个会议过程均有发言者的语音数据需要记录，此时若在会议期间全程录制会造成资源浪费，也会进一步增加对象内容的查找难度。具体地，可由用户手动启动、暂停或停止音频/视频数据采集以录制需要的内容。此外，为了避免用户手动操作产生失误，可令录制用麦克风循环检测语音信息，当检测到发言人开始发言的语音信息时，触发录制开始命令，采集发言人的音频/视频数据，记录下发言开始时间。根据采集到的音频/视频数据的属性(例如语音强度大小)判断当前发言人的发言在继续还是已经停止，当采集到的音频/视频数据满足预设条件时，例如发言停止超过一定时间则认为该与会者发言结束，触发录制暂停或停止命令，记录下发言结束时间。录制用麦克风继续循环检测语音信息，检测到下一发言人开始发言的语音信息时，触发继续录制命令或者录制开始命令，录制下一位发言人的音频/视频数据。所述发言人均为用户设置模块401中已录入用户信息并设置用户角色的用户。

系统400还包括音频/视频数据预处理模块406，用于对录制的音频/视频数据进行预处理后存储。

数据采集模块405录制暂停后或者结束后由音频/视频数据预处理模块406记录下该发言人发言的开始时间和结束时间，并获取该发言人的姓名、用户名。

可选的，音频/视频数据预处理模块406包括会议议程处理模块4061，用于读取预先存储的会议议程表，会议议程表存储有会议议程，以及会议中各发言人的发言时间段。参见图3，9:00～9:10为开幕式，发言人李明对应的发言时间为9:10～9:30，发言人王伟对应的发言时间为9:30～9:50，阶段性总结发言时间为10:30～11:00，大会总结发言时间为16:30～17:00等，根据会议议程表获取当前时间对应的发言人，将发言人、发言开始时间、发言结束时间与采集的音频/视频数据关联处理，并存储于存储装置中。

可选地，音频/视频数据预处理模块406包括声纹识别模块4062，用于利用声纹识别技术识别当前发言的与会者。声纹识别模块4062根据当前采集的音频/视频数据识别其中的声纹特征数据，将识别出的声纹特征数据与声纹特征信息采集模块4013采集存储的用户声纹特征数据进行匹配，匹配成功后获取当前发言人的姓名，将发言人、发言开始时间、发言结束时间与采集的音频/视频数据关联处理，并存储于存储装置中。

系统400还包括发言人权重确定模块407，用于确定不同发言人的权重系数。

发言人在会议中的发言位置通常能够反映其在会议中的地位与作用，例如大会的第一位发言人与最后一位发言人通常会占据较重的地位，或者大会开幕式、中场总结发言与终场总结发言也会在会议中占据重要的地位。可选地，发言人权重确定模块407根据会议议程表存储的会议议程确定发言人的发言位置，根据发言人的发言位置对不同发言人赋予不同的权重系数A。

另外，发言人的权限等级也能够反映该发言人在会议中占据的地位。可选地，发言人权重确定模块407可根据发言人的用户名获取其对应的权限等级，根据发言人的权限等级对不同发言人赋予不同的权重系数B。

发言人权重确定模块407综合发言人对应的权重系数A与权重系数B确定该发言人最终的权重系数C。发言人权重确定模块407也可仅利用发言人的权重系数A或者权重系数B作为该发言人的最终权重系数。发言人的权重系数越大表示其发言内容重要程度越大。

系统400还包括候选关键发言片段集合获取模块408，用于根据发言人获取其对应的候选关键发言片段集合。

候选关键发言片段集合获取模块408根据发言人的姓名在存储的音频/视频中检索，找到其对应的具体发言片段，利用预设的策略在发言片段中截取候选的关键发言片段。

根据人们的发言习惯，一般一段发言的重要内容出现在0％～5％，10％～30％及80％～100％之间的概率较大，可选地，候选关键发言片段集合获取模块408包括时间段截取模块4081，用于结合该发言人对应发言音频/视频片段的时间轴，截取其特定时间段(例如0％～5％，10％～30％及80％～100％)的音频/视频片段作为候选的关键发言片段。时间段的选择可以根据实际情况进行设置，不同权重系数发言人截取的音频/视频片段数量及长度不同。权重系数越高，截取的特定时间段音频/视频片段数量越多和/或长度越长；权重系数越低，截取的特定时间段音频/视频片段数量越少和/或长度越短。举例说明，发言人李明权重系数为0.9，发言人王伟权重系数为0.7，也即发言人李明权重系数大于王伟时，则(1)针对李明的发言片段截取时间段如下：0％～5％、10％～20％、50％～60％、80％～100％，针对王伟的发言片段截取时间段如下：0％～5％、10％～20％、80％～100％。或者(2)针对李明的发言片段截取时间段如下：0％～5％、10％～20％、50％～60％、80％～100％，针对王伟的发言片段截取时间段如下：0％～5％、10％～15％、50％～60％、90％～100％。或者(3)针对李明的发言片段截取时间段如下：0％～5％、10％～20％、50％～60％、80％～100％，针对王伟的发言片段截取时间段如下：0％～5％、10％～15％、90％～100％。

或者，一些关键转折词、连接词后通常会引出发言的重要内容，例如“首先、其次、然而、最重要的是、最后”，可选地，候选关键发言片段集合获取模块408包括关键词截取模块4082，预先设置关键词库，对发言人对应发言音频/视频片段进行语音识别处理，使用预设的关键词库对识别出的语音信息进行匹配，匹配成功后截取识别出的关键词后预设时间段的音频/视频片段作为候选的关键发言片段。例如在识别出发言人对应的发言音频/视频片段中包括预先设置的关键词“重要的是”时，关键词截取模块4082截取该关键词后1分钟的音频/视频片段作为候选的关键发言片段。通过设置不同的关键词库可以控制匹配出的关键词数量，通常关键词库中包括的关键词数量越多，使用该关键词库去进行匹配时，识别出的关键词数量相应也会越多。其中预设时间段的长度也可根据实际情况进行调整。因此，不同权重发言人对应的关键词库和/或截取的预设时间段长度不同。权重系数越高，对应的关键词库中关键词数量越多和/或截取的音频/视频片段长度越长；权重系数越低，对应的关键词库中关键词数量越少和/或截取的音频/视频片段长度越短。举例说明，发言人李明权重系数为0.9，发言人王伟权重系数为0.7，也即发言人李明权重系数大于王伟时，关键词库A包括20个关键词，关键词库B包括10个关键词，则(1)使用预设的关键词库A对李明对应的发言音频/视频片段识别出的语音信息进行匹配，匹配成功后截取识别出的关键词后3分钟的音频/视频片段作为候选的关键发言片段；使用预设的关键词库B对李明对应的发言音频/视频片段识别出的语音信息进行匹配，匹配成功后截取识别出的关键词后3分钟的音频/视频片段作为候选的关键发言片段。或者(2)使用预设的关键词库A对李明对应的发言音频/视频片段识别出的语音信息进行匹配，匹配成功后截取识别出的关键词后3分钟的音频/视频片段作为候选的关键发言片段；使用预设的关键词库A对李明对应的发言音频/视频片段识别出的语音信息进行匹配，匹配成功后截取识别出的关键词后1分钟的音频/视频片段作为候选的关键发言片段。或者(3)使用预设的关键词库A对李明对应的发言音频/视频片段识别出的语音信息进行匹配，匹配成功后截取识别出的关键词后3分钟的音频/视频片段作为候选的关键发言片段；使用预设的关键词库B对李明对应的发言音频/视频片段识别出的语音信息进行匹配，匹配成功后截取识别出的关键词后1分钟的音频/视频片段作为候选的关键发言片段。

上述时间段截取模块4081，关键词截取模块4082，二者可以单独存在，也可以综合两个模块来截取候选的关键发言片段，例如先采用时间段截取模块4081截取，再采用关键词截取模块4082截取，截取出候选关键发言片段集合。

系统400还包括音频/视频片段集合筛选模块409，用于对获取的候选关键发言片段集合进行语音识别处理，筛选定位重点发言内容对应的音频/视频片段集合。

音频/视频片段集合筛选模块409可结合会议主题确定重点发言内容，所述重点发言内容可以为与会议主题相关的一系列关键词。音频/视频片段集合筛选模块409对候选关键发言片段集合获取模块408获取的候选关键发言片段进行语音识别处理，将其转化为文本数据，转化后的文本数据具有与音频/视频数据相对应的时间轴，能够根据文本数据中的内容定位到相应时间段的音频/视频数据。利用重点发言内容对应的关键词对转化后的文本数据进行筛选，最终确定重点发言内容对应的音频/视频片段集合。

系统400还包括语音摘要合成模块410，用于对音频/视频片段集合筛选模块409筛选出的音频/视频片段集合进行合成，形成语音摘要。

可选地，语音摘要合成模块410包括发言人语音摘要合成模块4101，用于将音频/视频片段集合筛选模块409筛选出的同一发言人的音频/视频片段集合按时间顺序排序，将排序后的音频/视频片段集合拼接为一段音频/视频，作为该发言人发言内容的语音摘要。进一步地，语音摘要合成模块410还包括会议语音摘要合成模块4102，用于生成整个会议的语音摘要。会议语音摘要合成模块4102可根据会议主题、会议议程等信息生成摘要的头部信息，例如：“2017年人工智能大会在上海举行，为期3天，与会人员包括：李明、王伟……”，并将上述信息生成头部信息语音文件。会议语音摘要合成模块4102再根据会议议程等信息生成摘要中承前启后的过渡信息，例如：“在开幕式上张三对会议进行致辞”，“会议期间，李四、王伟、李明等进行了发言”，“其中王伟发言主要内容为”，“最后，王五对会议进行总结，具体内容为”，并将上述信息生成过渡信息语音文件。会议语音摘要合成模块4102将头部信息语音文件、过渡信息语音文件、拼接完成的不同发言人的语音摘要按对应关系合成到一起，形成会议的语音摘要。例如，生成对应于下列文字的语音摘要文件：2017年人工智能大会在上海举行，为期3天，与会人员包括：李明、王伟……，在开幕式上张三对会议进行致辞，具体内容为“张三致辞语音摘要”；会议期间，李四、王伟、李明等进行了发言，其中王伟发言主要内容为“王伟发言语音摘要”，最后，王五对会议进行总结，具体内容为“王五总结语音摘要”。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(RandomAccess Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种会议智能管理方法，其特征在于包括如下步骤：

S4、根据用户语音数据获取对应用户的用户名和声纹特征数据，并据此验证用户的所述会议室使用权限，确认是否允许所述用户使用所述会议室；

S5、在会议进行期间，采集会议音频/视频数据；

S6、对录制的音频/视频数据进行预处理后存储，其中，记录下发言人发言的开始时间和结束时间，并根据音频/视频数据包含的声纹特征数据获取该发言人的姓名、用户名，将发言人、发言开始时间、发言结束时间与采集的音频/视频数据关联处理并存储；

S7、根据发言人的用户名获取其对应的权限等级，根据发言人的权限等级对不同发言人赋予不同发言人的权重系数B；

2.根据权利要求1所述的会议智能管理方法，其特征在于，

所述步骤S3中，用户通过网络预约会议室，获取用户的用户名，根据所述用户名获取其对应的角色类型，显示其能够预约的会议室，以及所述会议室允许工作时间段，同时显示该会议室哪些时间段已被其他用户预约成功，哪些时间段空闲，对于已被预约成功的时间段显示为已预约并显示预约用户的角色类型，对于未被预约成功的时间段显示为空闲，用户选择所需的会议室及所需的时间段，提交预约请求，系统确认预约成功后提示用户。

3.根据权利要求2所述的会议智能管理方法，其特征在于，所述用户选择所需的会议室及所需的时间段，提交预约请求，系统确认预约成功后提示用户进一步包括：

4.根据权利要求1所述的会议智能管理方法，其特征在于，所述步骤S4还包括：

S402、获取当前时间，判断当前时间该会议室是否已被预约，如果未被预约，则允许用户进入并使用该会议室；如果已被预约，则获取预约该会议室的用户名，与S401中获取的用户名比较是否一致，一致则开放该会议室门禁，允许用户进入并使用该会议室；不一致则提示用户该会议室已被预约，当前时间不可用，并结束流程。

5.根据权利要求4所述的会议智能管理方法，其特征在于，所述步骤S5进一步包括：

6.根据权利要求5所述的会议智能管理方法，其特征在于，所述步骤S6进一步包括：

7.根据权利要求6所述的会议智能管理方法，其特征在于，所述步骤S7进一步包括：

根据会议议程表存储的会议议程确定发言人的发言位置，根据发言人的发言位置对不同发言人赋予不同的权重系数A。

8.根据权利要求1所述的会议智能管理方法，其特征在于，所述步骤S8进一步包括：

9.根据权利要求1所述的会议智能管理方法，其特征在于，所述步骤S8进一步包括：

10.根据权利要求1所述的会议智能管理方法，其特征在于，所述步骤S9进一步包括：

11.根据权利要求1所述的会议智能管理方法，其特征在于，所述步骤S10进一步包括：

将步骤S9中筛选出的同一发言人的音频/视频片段集合按时间顺序排序，将排序后的音频/视频片段集合拼接为一段音频/视频，作为该发言人发言内容的语音摘要；根据会议主题、会议议程信息预先生成摘要的头部信息，并将上述头部信息生成头部信息语音文件，再根据会议议程信息生成摘要中承前启后的过渡信息，并将上述过渡信息生成过渡信息语音文件，将头部信息语音文件、过渡信息语音文件、拼接完成的不同发言人的语音摘要按对应关系合成到一起，形成会议的语音摘要。

12.一种会议智能管理系统，其特征在于，包括：

会议室使用权限验证模块，用于根据用户语音数据获取对应用户的用户名和声纹特征数据，并据此验证用户会议室使用权限，确认是否允许该用户使用该会议室；

音频/视频数据预处理模块，用于对录制的音频/视频数据进行预处理后存储，其中，记录下发言人发言的开始时间和结束时间，并根据音频/视频数据包含的声纹特征数据获取该发言人的姓名、用户名，将发言人、发言开始时间、发言结束时间与采集的音频/视频数据关联处理，并存储于存储装置中；

发言人权重确定模块，用于根据发言人的用户名获取其对应的权限等级，根据发言人的权限等级对不同发言人赋予不同发言人的权重系数B；

13.根据权利要求12所述的会议智能管理系统，其特征在于：

所述会议室预约模块进一步包括：

14.根据权利要求12或13所述的会议智能管理系统，其特征在于：

所述会议室预约模块进一步包括：

15.根据权利要求12所述的会议智能管理系统，其特征在于，所述会议室使用权限验证模块进一步包括：语音数据采集模块，用于利用会议室门禁处设置的语音采集器，采集用户语音数据，获取对应用户的用户名，根据当前采集的语音数据识别其中的声纹特征数据，将识别出的声纹特征数据与预先采集存储的用户声纹特征数据进行匹配，匹配成功后获取当前语音数据对应用户的用户名；

16.根据权利要求15所述的会议智能管理系统，其特征在于，所述数据采集模块进一步用于：

17.根据权利要求16所述的会议智能管理系统，其特征在于，所述音频/视频数据预处理模块进一步包括：会议议程处理模块，用于读取预先存储的会议议程表，会议议程表存储有会议议程，以及会议中各发言人的发言时间段；根据会议议程表获取当前时间对应的发言人，将发言人、发言开始时间、发言结束时间与采集的音频/视频数据关联处理，并存储于存储装置中；

18.根据权利要求17所述的会议智能管理系统，其特征在于，发言人权重确定模块进一步用于：

19.根据权利要求12所述的会议智能管理系统，其特征在于，候选关键发言片段集合获取模块进一步包括：时间段截取模块，用于结合该发言人对应发言音频/视频片段的时间轴，截取其特定时间段的音频/视频片段作为候选的关键发言片段，权重系数越高，截取的特定时间段音频/视频片段数量越多和/或长度越长；权重系数越低，截取的特定时间段音频/视频片段数量越少和/或长度越短。

20.根据权利要求12所述的会议智能管理系统，其特征在于，候选关键发言片段集合获取模块进一步包括：关键词截取模块，预先设置关键词库，对发言人对应发言音频/视频片段进行语音识别处理，使用预设的关键词库对识别出的语音信息进行匹配，匹配成功后截取识别出的关键词后预设时间段的音频/视频片段作为候选的关键发言片段，不同权重发言人对应的关键词库和/或截取的预设时间段长度不同，权重系数越高，对应的关键词库中关键词数量越多和/或截取的音频/视频片段长度越长，权重系数越低，对应的关键词库中关键词数量越少和/或截取的音频/视频片段长度越短。

21.根据权利要求12所述的会议智能管理系统，其特征在于，音频/视频片段集合筛选模块进一步用于，结合会议主题确定重点发言内容，对候选关键发言片段集合获取模块获取的候选关键发言片段进行语音识别处理，将其转化为文本数据，转化后的文本数据具有与音频/视频数据相对应的时间轴，能够根据文本数据中的内容定位到相应时间段的音频/视频数据，利用重点发言内容对应的关键词对转化后的文本数据进行筛选，最终确定重点发言内容对应的音频/视频片段集合。

22.根据权利要求12所述的会议智能管理系统，其特征在于，语音摘要合成模块进一步包括：

会议语音摘要合成模块，用于生成整个会议的语音摘要，会议语音摘要合成模块可根据会议主题、会议议程信息生成摘要的头部信息，并将上述头部信息生成头部信息语音文件，会议语音摘要合成模块再根据会议议程信息生成摘要中承前启后的过渡信息，并将上述过渡信息生成过渡信息语音文件，会议语音摘要合成模块将头部信息语音文件、过渡信息语音文件、拼接完成的不同发言人的语音摘要按对应关系合成到一起，形成会议的语音摘要。