WO2019148584A1

WO2019148584A1 - 一种会议的语音摘要形成方法及系统

Info

Publication number: WO2019148584A1
Application number: PCT/CN2018/078528
Authority: WO
Inventors: 李明; 刘胜强
Original assignee: 深圳市鹰硕技术有限公司
Priority date: 2018-02-02
Filing date: 2018-03-09
Publication date: 2019-08-08
Also published as: CN108305632A; CN108305632B

Abstract

本发明公开了一种会议的语音摘要形成方法及系统，涉及语音识别领域。本发明通过分析发言人在会议中的发言位置、身份信息、个人资料等信息，确定发言人的权重系数，从而根据权重系数来用不同的预设策略获取不同发言人对应的候选关键发言片段，进一步根据发言内容本身的特点，例如发言的重要内容出现在发言时间轴上的概率较大的位置，或者发言的重要内容所跟的关键转折词、连接词，来截取候选关键发言片段集合，再对截取的候选关键发言片段集合进行处理以获取形成语音摘要的音频/视频片段集合，能够针对重要发言提取更多的内容，针对不重要的发言提取相对较少的内容，使最终形成的摘要内容更加合理，为用户提供更有效的帮助。

Description

一种会议的语音摘要形成方法及系统

技术领域

本发明涉及一种会议的语音摘要形成方法及系统，尤其涉及一种识别不同发言者的关键发言内容自动合成语音形式的会议摘要的方法及系统。

背景技术

现如今，每天召开的各类会议数不胜数，为了记录会议内容，通常可以使用摄像机或者录音笔等采集工具记录下会议现场的视频或者音频数据，将视频数据或音频数据保存成多媒体文件，通过回放保存的文件，可以随时观看或收听到会议内容，或者事后人工将其转化为记录文本，满足备忘、培训等需求。此外，会议现场通常会安排专门的记录员或者参会者自己通过笔记本电脑或者手写等方式进行记录，记录下召开的会议内容。但是，视频或者音频数据通常较大，保存时要占用大量硬件存储空间，且会议时间较长时回放过程中不容易定位到所需的内容，用户寻找到感兴趣的对象内容需要花费很多时间，用户体验很差。采用人工的方式记录会议内容虽然有助于记录关键内容且查找方便，但对记录人的要求较高，不经过专门训练的人员通常很难跟上会议讲话的进度，容易发生疏漏。

自动摘要提取技术可对输入的文本、语音、视频等信息进行处理，获得输入数据中的摘要内容，将处理后的摘要结果呈现给用户浏览。自动摘要提取技术不仅节约了用户访问信息的时间，而且提高了用户的工作效率。现有技术中存在多种自动生成会议摘要或总结的方式。

专利文献1(CN107409061A)提供了一种语音总结的方法、系统，计算机基于比较参与者的图像与讲话者和非讲话者面部的模板图像判断哪个参与者正在讲话。计算机通过将隐马尔可夫模型应用到参与者声音波形的简要记录确定讲话参与者的声纹，并将确定的声纹与讲话参与者的面部相关联。计算机识别并转录讲话者所做陈述的内容，确定关键点，并在视频会议中参与者的面部上方显示它们。

专利文献2(CN102572356A)提供了一种记录会议的方法，设置配置文件，定义会议的关键信息(例如举手问问题场景)以及会议摘要的格式，在会议时