CN112925945A

CN112925945A - 会议纪要生成方法、装置、设备及存储介质

Info

Publication number: CN112925945A
Application number: CN202110389542.2A
Authority: CN
Inventors: 苏雪琦; 王健宗; 程宁
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2021-04-12
Filing date: 2021-04-12
Publication date: 2021-06-08

Abstract

本申请涉及人工智能技术领域，揭示了一种会议纪要生成方法、装置、设备及存储介质，其中方法包括：获取各个会议客户端发送的文字识别结果，会议客户端通过获取会议语音数据，根据声音数据库和预设语音识别模型对会议语音数据进行文字识别得到文字识别结果；基于预设的排列规则根据文字识别结果进行全量会议生成得到待分析的全量会议记录；获取会议客户端根据待分析的全量会议记录发送的要点标记数据；根据待分析的全量会议记录和要点标记数据进行关键词抽取得到待处理的关键词集合；根据待处理的关键词集合和待分析的全量会议记录进行句子生成得到目标会议纪要。实现了自动化生成会议纪要，减少了人工提炼会议纪要的时间，避免了遗漏重要内容。

Description

会议纪要生成方法、装置、设备及存储介质

技术领域

本申请涉及到人工智能技术领域，特别是涉及到一种会议纪要生成方法、装置、设备及存储介质。

背景技术

会议是职场刚需，会议纪要常常作为复盘会议内容、对齐结论、追踪责任人的关键工具，对会议的落地执行效果至关重要。现有会议首先通过录制语音数据，其次根据语音数据进行文字识别，然后根据文字识别结果生成全量会议记录，最后依靠人工对全量会议记录进行分析提炼形成有价值的会议纪要，导致耗费工作时间、效率低，而且还会出现重要内容提炼不全的现象。

发明内容

本申请的主要目的为提供一种会议纪要生成方法、装置、设备及存储介质，旨在解决现有技术通过录制语音数据生成全量会议记录，然后依靠人工对全量会议记录进行分析提炼形成有价值的会议纪要，导致耗费工作时间、效率低，而且还会出现重要内容提炼不全的技术问题。

为了实现上述发明目的，本申请提出一种会议纪要生成方法，所述方法包括：

获取会议开始请求；

响应所述会议开始请求，获取声音数据库，获取各个会议客户端发送的文字识别结果，其中，所述会议客户端通过获取会议语音数据，根据所述声音数据库和预设语音识别模型对所述会议语音数据进行文字识别，得到所述文字识别结果；

基于预设的排列规则，根据所述文字识别结果进行全量会议生成，得到待分析的全量会议记录；

获取所述会议客户端根据所述待分析的全量会议记录发送的要点标记数据；

获取会议纪要生成请求；

响应所述会议纪要生成请求，根据所述待分析的全量会议记录和所述要点标记数据进行关键词抽取，得到待处理的关键词集合；

根据所述待处理的关键词集合和所述待分析的全量会议记录进行句子生成，得到目标会议纪要。

进一步的，所述获取各个会议客户端发送的文字识别结果，其中，所述会议客户端通过获取会议语音数据，根据所述声音数据库和预设语音识别模型对所述会议语音数据进行文字识别，得到所述文字识别结果的步骤，包括：

获取预设的语音信号采样频率；

将所述预设的语音信号采样频率发送给所述会议客户端；

调用所述会议客户端，根据所述预设的语音信号采样频率采集的所述会议语音数据；

调用所述会议客户端，对所述会议语音数据进行MFCC特征提取，得到待识别的MFCC特征数据；

调用所述会议客户端，根据所述声音数据库和所述预设语音识别模型对所述待识别的MFCC特征数据进行文字识别，得到所述文字识别结果，其中，所述预设语音识别模型是基于隐马尔可夫模型训练得到的模型。

进一步的，所述基于所述声音数据库，分别将每个所述会议语音数据输入预设语音识别模型进行文字识别，得到各个所述会议语音数据各自对应的文字识别结果的步骤之前，还包括：

获取多个训练样本和所述声音数据库，所述多个训练样本中每个训练样本包括：第一语音样本数据和文字识别标定值，所述声音数据库包括：第二语音样本数据和身份标识标定值；

根据所述多个训练样本和所述声音数据库对初始模型进行训练，将训练结束的所述初始模型确定为所述预设语音识别模型，所述初始模型是根据隐马尔可夫模型得到的模型。

进一步的，所述根据所述多个训练样本和所述声音数据库对初始模型进行训练，将训练结束的所述初始模型确定为所述预设语音识别模型的步骤，包括：

采用K-means算法，根据所述多个训练样本和所述声音数据库进行聚类训练，得到所述多个训练样本各自对应的待分析身份标识；

将所述多个训练样本作为所述初始模型的输入，将所述多个训练样本各自对应的所述待分析身份标识作为所述初始模型的输出，对所述初始模型进行训练，将训练结束的所述初始模型确定为所述预设语音识别模型。

进一步的，所述根据所述待分析的全量会议记录和所述要点标记数据进行关键词抽取，得到待处理的关键词集合的步骤，包括：

对所述待分析的全量会议记录进行句子分割，得到待分析的句子集合；

分别对所述待分析的句子集合中每个句子进行分词处理，得到待分析的词语集合；

分别对所述待分析的词语集合中每个词语进行词性标注，得到词性标注后的词语集合；

获取预设的词语过滤规则，采用所述预设的词语过滤规则，对所述词性标注后的词语集合进行词语过滤，得到待评分的关键字集合；

采用TextRank算法，分别对所述待评分的关键字集合中每个待评分的关键字进行评分计算，得到所述待评分的关键字集合中各个所述待评分的关键字各自对应的评分结果；

根据所述评分结果，对所述待评分的关键字集合中的所述待评分的关键字进行排序，得到排序后的关键字集合；

获取预设的关键字数量，采用所述预设的关键字数量，从所述排序后的关键字集合中获取关键字，得到候选关键字集合；

分别将所述候选关键字集合中每个候选关键字在所述待分析的全量会议记录中进行标记，得到标记后的全量会议记录；

根据所述标记后的全量会议记录进行相邻候选关键字合并处理，得到相邻候选关键字合并后的全量会议记录；

从所述相邻候选关键字合并后的全量会议记录中进行关键字提取，得到所述待处理的关键词集合。

进一步的，所述根据所述待处理的关键词集合和所述待分析的全量会议记录进行句子生成，得到目标会议纪要的步骤，包括：

根据所述待处理的关键词集合和所述待分析的全量会议记录进行句子生成，得到待组合的句子集合；

获取预设的会议纪要生成规则，采用所述预设的会议纪要生成规则，根据所述待组合的句子集合进行会议纪要生成，得到所述目标会议纪要。

进一步的，所述根据所述待处理的关键词集合和所述待分析的全量会议记录进行句子生成，得到待组合的句子集合的步骤，包括：

获取预设的句子生成模型，所述预设的句子生成模型是基于MT5模型训练得到的模型；

将所述待处理的关键词集合和所述待分析的全量会议记录输入所述预设的句子生成模型进行句子生成，得到所述待组合的句子集合。

本申请还提出了一种会议纪要生成装置，所述装置包括：

第一请求获取模块，用于获取会议开始请求；

文字识别模块，用于响应所述会议开始请求，获取声音数据库，获取各个会议客户端发送的文字识别结果，其中，所述会议客户端通过获取会议语音数据，根据所述声音数据库和预设语音识别模型对所述会议语音数据进行文字识别，得到所述文字识别结果；

全量会议生成模块，用于基于预设的排列规则，根据所述文字识别结果进行全量会议生成，得到待分析的全量会议记录；

要点标记数据获取模块，用于获取所述会议客户端根据所述待分析的全量会议记录发送的要点标记数据；

第二请求获取模块，用于获取会议纪要生成请求；

关键词抽取模块，用于响应所述会议纪要生成请求，根据所述待分析的全量会议记录和所述要点标记数据进行关键词抽取，得到待处理的关键词集合；

目标会议纪要确定模块，用于根据所述待处理的关键词集合和所述待分析的全量会议记录进行句子生成，得到目标会议纪要。

本申请还提出了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

本申请还提出了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

本申请的会议纪要生成方法、装置、设备及存储介质，通过首先获取各个会议客户端发送的文字识别结果，其中，会议客户端通过获取会议语音数据，根据声音数据库和预设语音识别模型对会议语音数据进行文字识别，得到文字识别结果，基于预设的排列规则，根据文字识别结果进行全量会议生成，得到待分析的全量会议记录，获取会议客户端根据待分析的全量会议记录发送的要点标记数据，其次响应会议纪要生成请求，根据待分析的全量会议记录和要点标记数据进行关键词抽取，得到待处理的关键词集合，然后根据待处理的关键词集合和待分析的全量会议记录进行句子生成，得到目标会议纪要，从而实现了自动化进行文本识别和会议纪要生成，提高了提炼效率，减少了人工提炼会议纪要的时间；通过基于要点标记数据进行关键词抽取后生成句子，避免了遗漏重要内容，从而提升了提炼得到的会议纪要的全面性。

附图说明

图1为本申请一实施例的会议纪要生成方法的流程示意图；

图2为本申请一实施例的会议纪要生成装置的结构示意框图；

图3为本申请一实施例的计算机设备的结构示意框图。

本申请目的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

为了解决现有技术通过录制语音数据生成全量会议记录，然后依靠人工对全量会议记录进行分析提炼形成有价值的会议纪要，导致耗费工作时间、效率低，而且还会出现重要内容提炼不全的技术问题，本申请提出了一种会议纪要生成方法，所述方法应用于人工智能技术领域。所述会议纪要生成方法，通过首先将各个会议客户端发送的语音数据进行文字识别，根据文字识别结果生成全量会议记录，然后根据全量会议记录获取会议客户端发送的要点标记数据，最后根据全量会议记录和要点标记数据进行关键词抽取后和句子生成，从而得到会议纪要，从而实现了自动化进行文本识别和会议纪要生成，提高了提炼效率，减少了人工提炼会议纪要的时间；通过基于要点标记数据进行关键词抽取后生成句子，避免了遗漏重要内容，从而提升了提炼得到的会议纪要的全面性。

参照图1，本申请实施例中提供一种会议纪要生成方法，所述方法包括：

S1：获取会议开始请求；

S2：响应所述会议开始请求，获取声音数据库，获取各个会议客户端发送的文字识别结果，其中，所述会议客户端通过获取会议语音数据，根据所述声音数据库和预设语音识别模型对所述会议语音数据进行文字识别，得到所述文字识别结果；

S3：基于预设的排列规则，根据所述文字识别结果进行全量会议生成，得到待分析的全量会议记录；

S4：获取所述会议客户端根据所述待分析的全量会议记录发送的要点标记数据；

S5：获取会议纪要生成请求；

S6：响应所述会议纪要生成请求，根据所述待分析的全量会议记录和所述要点标记数据进行关键词抽取，得到待处理的关键词集合；

S7：根据所述待处理的关键词集合和所述待分析的全量会议记录进行句子生成，得到目标会议纪要。

本实施例通过首先获取各个会议客户端发送的文字识别结果，其中，会议客户端通过获取会议语音数据，基于声音数据库，将会议语音数据输入预设语音识别模型进行文字识别，得到文字识别结果，基于预设的排列规则，根据文字识别结果进行全量会议生成，得到待分析的全量会议记录，获取会议客户端根据待分析的全量会议记录发送的要点标记数据，其次响应会议纪要生成请求，根据待分析的全量会议记录和要点标记数据进行关键词抽取，得到待处理的关键词集合，然后根据待处理的关键词集合和待分析的全量会议记录进行句子生成，得到目标会议纪要，从而实现了自动化进行文本识别和会议纪要生成，提高了提炼效率，减少了人工提炼会议纪要的时间；通过基于要点标记数据进行关键词抽取后生成句子，避免了遗漏重要内容，从而提升了提炼得到的会议纪要的全面性。

对于S1，可以获取用户通过会议客户端输入的会议开始请求，也可以是实现本申请的应用系统根据预设时间触发的会议开始请求。

可以获取用户输入的声音数据库，也可以从数据库中获取声音数据库，还可以获取第三方应用系统发送的声音数据库。

会议开始请求，是指召开会议的请求。

声音数据库，用于预存了语音数据和语音数据对应的身份标识。所述声音数据库包括：第二语音样本数据和身份标识标定值，每个第二语音样本数据对应一个身份标识标定值。第二语音样本数据也就是语音数据。

身份标识可以是ID、身份证号码等唯一标识一个说话人的标识。

对于S2，所述会议客户端，按预设语音提取规则，根据录制的语音数据生成会议语音数据，然后通过API(应用程序接口)调用预设语音识别模型，根据所述声音数据库和预设语音识别模型对所述会议语音数据进行文字识别，将文字识别得到的数据作为文字识别结果，以用于将语音转换为文本。从而实现了边获取会议语音数据边进行文字识别，有利于快速的在会议客户端呈现文字识别结果，也有利于后续用于基于会议客户端进行要点标记。

可选的，预设语音提取规则采用按预设时间间隔进行语音提取。

可选的，预设语音提取规则采用按段进行语音提取。也就是说，当说话人停顿预设时长时，则将此次停顿作为分段停顿，将两次分段停顿之间的语音数据作为一个会议语音数据。从而实现在说话人说完一段话后，会议客户端再进行文字识别。

比如，所述会议客户端，每隔2秒从缓存中获取没有被提取过的语音数据作为会议语音数据，然后通过API调用预设语音识别模型，根据所述声音数据库和预设语音识别模型对所述会议语音数据进行文字识别，重复每隔2秒获取会议语音数据和进行文字识别的步骤，直至获取到会议纪要生成请求或会议结束请求，在此举例不做具体限定。

会议客户端，也就是可以进行语音电话会议的客户端。

可选的，预设语音识别模型是基于隐马尔可夫模型训练得到的模型。

可以理解的是，文字识别结果携带有所述会议语音数据对应的说话人的身份标识。

对于S3，可以获取用户输入的预设的排列规则，也可以从数据库中获取预设的排列规则，还可以获取第三方应用系统发送的预设的排列规则，还可以将预设的排列规则写入实现本申请的程序文件中。

预设的排列规则包括：按不同的说话开始时间以及不同说话人排序。比如，参会人A说了一段话H1，参会人B说了一段话H2，H1对应的说话开始时间比H2对应的说话开始时间晚，当按不同的说话开始时间以及不同说话人排序时则将根据H1得到的文字识别结果放在根据H2得到的文字识别结果后面，在此举例不做具体限定。

待分析的全量会议记录包括：说话开始时间、身份标识、文字识别结果。

可以理解的是，在获取到会议纪要生成请求或会议结束请求之前的待分析的全量会议记录，都是整个会议的部分会议记录，当获取到会议纪要生成请求或会议结束请求时，将所有的待分析的全量会议记录作为整个会议的全量会议记录。

对于S4，将所述待分析的全量会议记录在各个所述会议客户端进行展示，用户在所述会议客户端中对所述待分析的全量会议记录进行要点标记。

要点标记数据包括：说话开始时间、身份标识、文字识别结果中的开始位置、文字识别结果中的结束位置。

可选的，文字识别结果中的开始位置、文字识别结果中的结束位置，可以采用特殊字符在文字识别结果中标识。比如，文字识别结果中的开始位置采用字符“#”，文字识别结果中的结束位置采用自如“*”，在此举例不做具体限定。

可以理解的是，步骤S2至步骤S4可以同步执行，也就是说，步骤S2至步骤S4采用流水线式作业，从而实现了获取会议语音数据、生成文字识别结果、生成全量会议、获取要点标记数据的流水线式作业，直至获取到会议纪要生成请求或会议结束请求。

对于S5，可以获取用户通过会议客户端输入的会议纪要生成请求。

会议纪要生成请求，就是生成会议纪要的请求。

对于S6，响应所述会议纪要生成请求，基于TextRank算法，根据所述要点标记数据，从所述待分析的全量会议记录中进行关键词抽取，将提取得到的所有关键字作为待处理的关键词集合。

TextRank算法，是基于PageRank，用于为文本生成关键字和摘要。

对于S7，根据所述待处理的关键词集合和所述待分析的全量会议记录进行句子生成，得到待组合的句子集合，根据生成的所有句子进行会议纪要生成，得到目标会议纪要。

在一个实施例中，上述获取各个会议客户端发送的文字识别结果，其中，所述会议客户端通过获取会议语音数据，根据所述声音数据库和预设语音识别模型对所述会议语音数据进行文字识别，得到所述文字识别结果的步骤，包括：

S21：获取预设的语音信号采样频率；

S22：将所述预设的语音信号采样频率发送给所述会议客户端；

S23：调用所述会议客户端，根据所述预设的语音信号采样频率采集的所述会议语音数据；

S24：调用所述会议客户端，对所述会议语音数据进行MFCC特征提取，得到待识别的MFCC特征数据；

S25：调用所述会议客户端，根据所述声音数据库和所述预设语音识别模型对所述待识别的MFCC特征数据进行文字识别，得到所述文字识别结果，其中，所述预设语音识别模型是基于隐马尔可夫模型训练得到的模型。

本实施例实现了通过预设的语音信号采样频率控制会议客户端采集会议语音数据，有利于提高语音数据的清晰度和可懂度；通过对会议语音数据进行MFCC特征提取后再输入预设语音识别模型进行文字识别，因MFCC特征在信噪比降低时仍具有较好的识别性能，从而提高了文字识别的准确性，进一步提高了提炼得到的会议纪要的准确性。

对于S21，可以获取用户输入的预设的语音信号采样频率，也可以从数据库中获取预设的语音信号采样频率，还可以获取第三方应用系统发送的预设的语音信号采样频率，还可以将预设的语音信号采样频率写入实现本申请的程序文件中。

可选的，预设的语音信号采样频率采用44.1KHz。可以理解的是，预设的语音信号采样频率还可以采用其他采样频率，比如，10KHz、16KHz，在此不做具体限定。

对于S22，将所述预设的语音信号采样频率发送给所述会议客户端，从而使会议客户端按所述预设的语音信号采样频率进行语音数据采集。

对于S23，调用所述会议客户端，按所述预设的语音信号采样频率采集语音数据，然后按预设语音提取规则从采集的语音数据中获取所述会议语音数据。

对于S24，调用所述会议客户端，对所述会议语音数据进行MFCC特征提取，将提取得到的MFCC特征作为待识别的MFCC特征数据。

MFCC特征，也就是Mel(梅尔)频率倒谱系数的缩写。

对于S25，调用所述会议客户端，基于所述声音数据库，将所述待识别的MFCC特征数据输入所述预设语音识别模型进行语音转换文字，将转换得到的文字作为所述文字识别结果。

隐马尔可夫模型，又称为HMM模型。

在一个实施例中，上述基于所述声音数据库，分别将每个所述会议语音数据输入预设语音识别模型进行文字识别，得到各个所述会议语音数据各自对应的文字识别结果的步骤之前，还包括：

S021：获取多个训练样本和所述声音数据库，所述多个训练样本中每个训练样本包括：第一语音样本数据和文字识别标定值，所述声音数据库包括：第二语音样本数据和身份标识标定值；

S022：根据所述多个训练样本和所述声音数据库对初始模型进行训练，将训练结束的所述初始模型确定为所述预设语音识别模型，所述初始模型是根据隐马尔可夫模型得到的模型。

本实施例实现了在进行文字识别前根据隐马尔可夫模型得到所述预设语音识别模型，从而使得到的所述预设语音识别模型实现了以概率形式将声学层中的信息和语言学层中已有信息完美结合，为后续进行准确的文字识别和身份标识的识别提供了基础。

对于S021，可以获取用户输入的多个训练样本，也可以从数据库中获取多个训练样本，还可以获取第三方应用系统发送的多个训练样本。

每个训练样本中包括一个第一语音样本数据和一个文字识别标定值。

在同一个训练样本中，文字识别标定值是对第一语音样本数据进行语音转文字得到的准确值。

对于S022，根据所述多个训练样本和所述声音数据库对初始模型进行训练可以采用现有的模型训练方法，在此不做赘述。

在一个实施例中，上述根据所述多个训练样本和所述声音数据库对初始模型进行训练，将训练结束的所述初始模型确定为所述预设语音识别模型的步骤，包括：

S0221：采用K-means算法，根据所述多个训练样本和所述声音数据库进行聚类训练，得到所述多个训练样本各自对应的待分析身份标识；

S0222：将所述多个训练样本作为所述初始模型的输入，将所述多个训练样本各自对应的所述待分析身份标识作为所述初始模型的输出，对所述初始模型进行训练，将训练结束的所述初始模型确定为所述预设语音识别模型。

本实施例实现了采用K-means算法，根据所述多个训练样本和所述声音数据库对初始模型进行模型聚类训练，从而通过反向传播学习出鲁棒的模型，提高了训练得到的预设语音识别模型的鲁棒性。

对于S0221：采用K-means算法，根据所述多个训练样本和所述声音数据库进行聚类训练，将聚类的思想应用于模型的输出空间，并设计出相应的clustering loss(聚类损失)，通过反向传播学习出鲁棒的模型。

K-means算法，也就是K均值聚类算法。

待分析身份标识，也就是所述声音数据库中的身份标识。

可选的，所述采用K-means算法，根据所述多个训练样本和所述声音数据库进行聚类训练，得到所述多个训练样本各自对应的待分析身份标识的步骤，包括：对所述声音数据库中进行语音数据的数量计算，得到聚类中心数量；根据所述声音数据库和所述聚类中心数量设置初始聚类中心，得到初始聚类中心集合；分别计算每个所述训练样本的所述第一语音样本数据与所述初始聚类中心集合中每个所述初始聚类中心之间的距离，得到所述多个训练样本中各个所述第一语音样本数据各自对应的待分析距离集合；分别从每个所述待分析距离集合在找出最小的距离，得到目标距离；分别根据所述目标距离对应的所述初始聚类中心对应的身份标识，得到所述多个训练样本中各个所述第一语音样本数据各自对应的聚类身份标识；分别针对每个所述聚类身份标识，根据所述多个训练样本中各个所述第一语音样本数据进行平均值计算，得到各个所述聚类身份标识各自对应的调整后的聚类中心；对所述初始聚类中心集合进行质心计算，得到所述初始聚类中心集合对应的待分析质心；对各个所述聚类身份标识各自对应的所述调整后的聚类中心进行进行质心计算，得到调整后的质心；将所述调整后的质心与所述待分析质心进行相减计算，得到质心移动距离；获取质心阈值，当所述质心移动距离大于所述质心阈值时，将各个所述聚类身份标识各自对应的调整后的聚类中心作为所述初始聚类中心集合，重复执行所述分别计算每个所述训练样本的所述第一语音样本数据与所述初始聚类中心集合中每个所述初始聚类中心之间的距离，得到所述多个训练样本中各个所述第一语音样本数据各自对应的待分析距离集合的步骤，否则，分别将每个所述聚类身份标识对应的调整后的聚类中心作为一个目标聚类中心；分别根据每个所述训练样本对应的所述目标聚类中心对应的所述聚类身份标识，确定所述多个训练样本各自对应的待分析身份标识。

其中，所述根据所述声音数据库和所述聚类中心数量设置初始聚类中心，得到初始聚类中心集合的步骤，也就是根据所述声音数据库中每个语音数据得到一个初始聚类中心，初始聚类中心的数量与所述聚类中心数量相同，每个初始聚类中心对应所述声音数据库中一个身份标识，所述声音数据库中的身份标识与所述初始聚类中心一一对应。

对于S0222，将所述多个训练样本作为所述初始模型的输入，将所述多个训练样本各自对应的所述待分析身份标识作为所述初始模型的输出，对所述初始模型进行自适应训练和参数更新，将训练结束的所述初始模型确定为所述预设语音识别模型。

将所述多个训练样本作为所述初始模型的输入，将所述多个训练样本各自对应的所述待分析身份标识作为所述初始模型的输出，对所述初始模型进行自适应训练和参数更新的步骤和原理在此不做赘述。

可以理解的是，将所述多个训练样本各自对应的所述待分析身份标识作为所述初始模型的输出，实现了将聚类的思想应用于模型的输出空间，并设计出相应的clusteringloss(聚类损失)，通过反向传播学习出鲁棒的模型。

在一个实施例中，上述根据所述待分析的全量会议记录和所述要点标记数据进行关键词抽取，得到待处理的关键词集合的步骤，包括：

S61：对所述待分析的全量会议记录进行句子分割，得到待分析的句子集合；

S62：分别对所述待分析的句子集合中每个句子进行分词处理，得到待分析的词语集合；

S63：分别对所述待分析的词语集合中每个词语进行词性标注，得到词性标注后的词语集合；

S64：获取预设的词语过滤规则，采用所述预设的词语过滤规则，对所述词性标注后的词语集合进行词语过滤，得到待评分的关键字集合；

S65：采用TextRank算法，分别对所述待评分的关键字集合中每个待评分的关键字进行评分计算，得到所述待评分的关键字集合中各个所述待评分的关键字各自对应的评分结果；

S66：根据所述评分结果，对所述待评分的关键字集合中的所述待评分的关键字进行排序，得到排序后的关键字集合；

S67：获取预设的关键字数量，采用所述预设的关键字数量，从所述排序后的关键字集合中获取关键字，得到候选关键字集合；

S68：分别将所述候选关键字集合中每个候选关键字在所述待分析的全量会议记录中进行标记，得到标记后的全量会议记录；

S69：根据所述标记后的全量会议记录进行相邻候选关键字合并处理，得到相邻候选关键字合并后的全量会议记录；

S610：从所述相邻候选关键字合并后的全量会议记录中进行关键字提取，得到所述待处理的关键词集合。

本实施例通过采用TextRank算法，根据所述待分析的全量会议记录和所述要点标记数据进行关键词抽取，得到待处理的关键词集合，通过所述要点标记数据使提取的关键字符合用户的关注点，通过根据所述待分析的全量会议记录和所述要点标记数据进行关键词抽取，避免了遗漏重要内容，从而提升了提炼得到的会议纪要的全面性。

对于S61，对所述待分析的全量会议记录进行句子分割，将分割的所有句子作为待分析的句子集合。

对于S62，分别对所述待分析的句子集合中每个句子进行分词处理，将分词得到的所有词语作为待分析的词语集合。

对于S63，分别对所述待分析的词语集合中每个词语进行词性标注，根据词性标注得到的数据和所述待分析的词语集合进行组合，得到词性标注后的词语集合。也就是说，词性标注后的词语集合中每个词语携带有词性标注结果。

对于S64，可以获取用户输入的预设的词语过滤规则，也可以从数据库中获取预设的词语过滤规则，还可以获取第三方应用系统发送的预设的词语过滤规则，还可以将预设的词语过滤规则写入实现本申请的程序文件中。

采用所述预设的词语过滤规则，对所述词性标注后的词语集合进行词语过滤，将所述词性标注后的词语集合中剩余的所有词语作为待评分的关键字集合。

可选的，预设的词语过滤规则采用过滤掉语气词、高频出现但没有实际意义的字。高频出现但没有实际意义的字包括但不限于：的。

对于S65，构建所述待评分的关键字集合中待评分的关键字的待评分关键词图；针对待评分关键词图，采用共现关系构造任两个节点(也就是待评分的关键字)之间的边；采用TextRank算法对传播各节点的权重进行迭代，得到每个节点的权重分值，节点的权重分值也就是待评分的关键字的评分结果。

对于S66，根据所述评分结果，对所述待评分的关键字集合中的所述待评分的关键字进行倒序排序，将排序后的所述待评分的关键字集合作为排序后的关键字集合。

对于S67，可以获取用户输入的预设的关键字数量，也可以从数据库中获取预设的关键字数量，还可以获取第三方应用系统发送的预设的关键字数量，还可以将预设的关键字数量写入实现本申请的程序文件中。

采用从头开始获取的方式从所述排序后的关键字集合中获取关键字，获取的关键字的数量与预设的关键字数量相同，将获取的每个关键字作为一个候选关键字，将所有候选关键字作为候选关键字集合。

对于S68，分别将所述候选关键字集合中每个候选关键字，在所述待分析的全量会议记录中进行关键字标记，将关键字标记后的所述待分析的全量会议记录作为标记后的全量会议记录。也就是说，标记后的全量会议记录中带有关键词的标记。

关键词的标记可以采用特殊字符。比如，“【”作为关键词的标记的开始，“】”作为关键词的标记的结尾，标记后的全量会议记录中“【”和“】”之间的文字就是候选关键字，在此举例不做具体限定。

对于S69，从所述标记后的全量会议记录中找出相邻的候选关键字，根据所述标记后的全量会议记录中将相邻的候选关键字对应的标记进行合并，将完成相邻候选关键字合并处理的所述标记后的全量会议记录作为所述相邻候选关键字合并后的全量会议记录。也就是说，将相邻的候选关键字合并成一个候选关键字。

比如，所述标记后的全量会议记录是“今天下雨，我今天要记得带伞”，候选关键字为“今天”、“下雨”、“伞”，然后我们把这几个放回到原文中，发现“今天”和“下雨”为相邻的候选关键字，这时我们就将相邻的候选关键字“今天下雨”来整体考虑，将“今天下雨”作为一个候选关键字，在此举例不做具体限定。

对于S610，根据关键字的标记，从所述相邻候选关键字合并后的全量会议记录中提取出所有的候选关键字，得到待去重的候选关键字集合；对待去重的候选关键字集合进行去重处理，得到所述待处理的关键词集合。

在一个实施例中，上述根据所述待处理的关键词集合和所述待分析的全量会议记录进行句子生成，得到目标会议纪要的步骤，包括：

S71：根据所述待处理的关键词集合和所述待分析的全量会议记录进行句子生成，得到待组合的句子集合；

S72：获取预设的会议纪要生成规则，采用所述预设的会议纪要生成规则，根据所述待组合的句子集合进行会议纪要生成，得到所述目标会议纪要。

本实施例实现了先根据所述待处理的关键词集合和所述待分析的全量会议记录进行句子生成，然后再进行会议纪要生成，避免了遗漏重要内容，从而提升了提炼得到的会议纪要的全面性。

对于S71，根据所述待处理的关键词集合，结合所述待分析的全量会议记录进行句子生成，将生成的所有句子作为待组合的句子集合。

对于S72，可以获取用户输入的预设的会议纪要生成规则，也可以从数据库中获取预设的会议纪要生成规则，还可以获取第三方应用系统发送的预设的会议纪要生成规则，还可以将预设的会议纪要生成规则写入实现本申请的程序文件中。

采用所述预设的会议纪要生成规则，根据所述待组合的句子集合进行会议纪要生成，将生成的会议纪要作为目标会议纪要。

可选的，预设的会议纪要生成规则采用按不同的说话开始时间以及不同说话人的顺序进行会议纪要生成。

在一个实施例中，上述根据所述待处理的关键词集合和所述待分析的全量会议记录进行句子生成，得到待组合的句子集合的步骤，包括：

S711：获取预设的句子生成模型，所述预设的句子生成模型是基于MT5模型训练得到的模型；

S712：将所述待处理的关键词集合和所述待分析的全量会议记录输入所述预设的句子生成模型进行句子生成，得到所述待组合的句子集合。

本实施例实现了基于MT5模型训练得到的预设的句子生成模型进行句子生成，因MT5模型具有良好的上下文语义特征分析能力、文本生成能力，从而提高了生成的句子的准确性。

对于S711，可以从数据库中获取预设的句子生成模型，也可以从第三方应用系统中获取预设的句子生成模型。

所述预设的句子生成模型，是基于MT5模型训练得到的模型。MT5模型，是谷歌提出来的一种新的预训练模型，采用了超大量的数据进行训练，它所使用的Encoder-Decoder基本依照了原来的预训练模型的Transformer的架构，MT5模型与原来的预训练模型的不同之处是根据自注意力机制生成了一个非固定位置的Position Embedding编码，MT5模型具有良好的上下文语义特征分析能力、文本生成能力。

对于S712，采用述预设的句子生成模型对所述待分析的全量会议记录进行上下文语义特征分析；采用述预设的句子生成模型，根据所述待处理的关键词集合中的关键字和上下文语义特征分析结果进行句子生成，将生成的所有句子作为所述待组合的句子集合。

参照图2，本申请还提出了一种会议纪要生成装置，所述装置包括：

第一请求获取模块100，用于获取会议开始请求；

文字识别模块200，用于响应所述会议开始请求，获取声音数据库，获取各个会议客户端发送的文字识别结果，其中，所述会议客户端通过获取会议语音数据，根据所述声音数据库和预设语音识别模型对所述会议语音数据进行文字识别，得到所述文字识别结果；

全量会议生成模块300，用于基于预设的排列规则，根据所述文字识别结果进行全量会议生成，得到待分析的全量会议记录；

要点标记数据获取模块400，用于获取所述会议客户端根据所述待分析的全量会议记录发送的要点标记数据；

第二请求获取模块500，用于获取会议纪要生成请求；

关键词抽取模块600，用于响应所述会议纪要生成请求，根据所述待分析的全量会议记录和所述要点标记数据进行关键词抽取，得到待处理的关键词集合；

目标会议纪要确定模块700，用于根据所述待处理的关键词集合和所述待分析的全量会议记录进行句子生成，得到目标会议纪要。

参照图3，本申请实施例中还提供一种计算机设备，该计算机设备可以是服务器，其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于储存会议纪要生成方法等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种会议纪要生成方法。所述会议纪要生成方法，包括：获取会议开始请求；响应所述会议开始请求，获取声音数据库，获取各个会议客户端发送的文字识别结果，其中，所述会议客户端通过获取会议语音数据，根据所述声音数据库和预设语音识别模型对所述会议语音数据进行文字识别，得到所述文字识别结果；基于预设的排列规则，根据所述文字识别结果进行全量会议生成，得到待分析的全量会议记录；获取所述会议客户端根据所述待分析的全量会议记录发送的要点标记数据；获取会议纪要生成请求；响应所述会议纪要生成请求，根据所述待分析的全量会议记录和所述要点标记数据进行关键词抽取，得到待处理的关键词集合；根据所述待处理的关键词集合和所述待分析的全量会议记录进行句子生成，得到目标会议纪要。

本申请一实施例还提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现一种会议纪要生成方法，包括步骤：获取会议开始请求；响应所述会议开始请求，获取声音数据库，获取各个会议客户端发送的文字识别结果，其中，所述会议客户端通过获取会议语音数据，根据所述声音数据库和预设语音识别模型对所述会议语音数据进行文字识别，得到所述文字识别结果；基于预设的排列规则，根据所述文字识别结果进行全量会议生成，得到待分析的全量会议记录；获取所述会议客户端根据所述待分析的全量会议记录发送的要点标记数据；获取会议纪要生成请求；响应所述会议纪要生成请求，根据所述待分析的全量会议记录和所述要点标记数据进行关键词抽取，得到待处理的关键词集合；根据所述待处理的关键词集合和所述待分析的全量会议记录进行句子生成，得到目标会议纪要。

上述执行的会议纪要生成方法，通过首先获取各个会议客户端发送的文字识别结果，其中，会议客户端通过获取会议语音数据，基于声音数据库，将会议语音数据输入预设语音识别模型进行文字识别，得到文字识别结果，基于预设的排列规则，根据文字识别结果进行全量会议生成，得到待分析的全量会议记录，获取会议客户端根据待分析的全量会议记录发送的要点标记数据，其次响应会议纪要生成请求，根据待分析的全量会议记录和要点标记数据进行关键词抽取，得到待处理的关键词集合，然后根据待处理的关键词集合和待分析的全量会议记录进行句子生成，得到目标会议纪要，从而实现了自动化进行文本识别和会议纪要生成，提高了提炼效率，减少了人工提炼会议纪要的时间；通过基于要点标记数据进行关键词抽取后生成句子，避免了遗漏重要内容，从而提升了提炼得到的会议纪要的全面性。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上所述仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

1.一种会议纪要生成方法，其特征在于，所述方法包括：

获取会议开始请求；

获取会议纪要生成请求；

2.根据权利要求1所述的会议纪要生成方法，其特征在于，所述获取各个会议客户端发送的文字识别结果，其中，所述会议客户端通过获取会议语音数据，根据所述声音数据库和预设语音识别模型对所述会议语音数据进行文字识别，得到所述文字识别结果的步骤，包括：

获取预设的语音信号采样频率；

将所述预设的语音信号采样频率发送给所述会议客户端；

3.根据权利要求1所述的会议纪要生成方法，其特征在于，所述基于所述声音数据库，分别将每个所述会议语音数据输入预设语音识别模型进行文字识别，得到各个所述会议语音数据各自对应的文字识别结果的步骤之前，还包括：

4.根据权利要求3所述的会议纪要生成方法，其特征在于，所述根据所述多个训练样本和所述声音数据库对初始模型进行训练，将训练结束的所述初始模型确定为所述预设语音识别模型的步骤，包括：

5.根据权利要求1所述的会议纪要生成方法，其特征在于，所述根据所述待分析的全量会议记录和所述要点标记数据进行关键词抽取，得到待处理的关键词集合的步骤，包括：

6.根据权利要求1所述的会议纪要生成方法，其特征在于，所述根据所述待处理的关键词集合和所述待分析的全量会议记录进行句子生成，得到目标会议纪要的步骤，包括：

7.根据权利要求6所述的会议纪要生成方法，其特征在于，所述根据所述待处理的关键词集合和所述待分析的全量会议记录进行句子生成，得到待组合的句子集合的步骤，包括：

8.一种会议纪要生成装置，其特征在于，所述装置包括：

第一请求获取模块，用于获取会议开始请求；

第二请求获取模块，用于获取会议纪要生成请求；

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。