CN113849662A

CN113849662A - 基于模型的信息生成方法、装置、计算机设备和存储介质

Info

Publication number: CN113849662A
Application number: CN202111146275.2A
Authority: CN
Inventors: 耿帅
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2021-09-28
Filing date: 2021-09-28
Publication date: 2021-12-28

Abstract

本申请涉及人工智能技术领域，提供一种基于模型的信息生成方法、装置、计算机设备和存储介质，方法包括：当接收到目标用户输入的产品需求文档时，从第一实体提取模型中确定目标实体提取模型；通过目标实体提取模型获取与产品需求文档对应的目标关键实体；基于目标关键实体对预设的知识图谱进行查询处理，从知识图谱中查询出与目标关键实体对应的目标规范标签；基于目标规范标签以及预设的信息模板生成对应的建议信息；展示建议信息。通过本申请能够速准确地生成编写架构文档所对应的目标规范标签，有利于提高架构文档的生成效率。本申请还可以应用于区块链领域，上述目标规范标签等数据可以存储于区块链上。

Description

基于模型的信息生成方法、装置、计算机设备和存储介质

技术领域

本申请涉及人工智能技术领域，具体涉及一种基于模型的信息生成方法、装置、计算机设备和存储介质。

背景技术

目前大规模分布式软件系统复杂度高，变化快，可用性，性能等要求高，需要在架构评审方面有严格的执行制度，比如有明确的架构规范，有架构预审，架构文档编写，架构评审，架构检视等流程。但实际操作过程中，由于开发人员对架构规范的理解不够完整深入，往往需要咨询架构师才能知道编写的架构文档应该覆盖架构规范中的哪些内容项，进而根据得到的咨询信息来编写相应的架构文档。由于开发人员在编写架构文档的过程中需要频繁咨询架构师，使得需要耗费大量的人力时间，从而导致架构文档的生成效率较慢。

发明内容

本申请的主要目的为提供一种基于模型的信息生成方法、装置、计算机设备和存储介质，旨在解决现有由于开发人员在编写架构文档的过程中需要频繁咨询架构师，使得需要耗费大量的人力时间，从而导致架构文档的生成效率较慢的技术问题。

本申请提出一种基于模型的信息生成方法，所述方法包括步骤：

判断是否接收到目标用户输入的产品需求文档；

若是，从预先训练好的预设数量的第一实体提取模型中确定出目标实体提取模型；其中，每一个所述第一实体提取模型分别是基于各自不同的训练样本集进行训练获得的，所述训练样本集的数量等于所述预设数量；

将所述产品需求文档输入至所述目标实体提取模型中，通过所述目标实体提取模型获取与所述产品需求文档对应的目标关键实体；其中，所述目标关键实体的数量包括多个；

基于所述目标关键实体对预设的知识图谱进行查询处理，从所述知识图谱中查询出与所述目标关键实体对应的目标规范标签；

基于所述目标规范标签以及预设的信息模板生成对应的建议信息；

展示所述建议信息。

可选地，所述从预先训练好的预设数量的第一实体提取模型中确定出目标实体提取模型的步骤，包括：

获取预设数量的所述第一实体提取模型；

获取预设的内存信息，并从预设的数量映射表中查询出与所述内存信息对应的指定数量；

判断所述指定数量是否小于所述预设数量；

若是，按照预设规则从所述第一实体提取模型中筛选出与所述指定数量相同的模型，得到所述目标实体提取模型；

所述将所述产品需求文档输入至所述目标实体提取模型中，通过所述目标实体提取模型获取与所述产品需求文档对应的目标关键实体的步骤，包括：

将所述产品需求文档分别输入至各所述目标实体提取模型中，获取各所述目标实体提取模型分别输出的对应的第一关键实体；

对所有所述第一关键实体进行合并处理，得到对应的第二关键实体；

对所述第二关键实体进行去重处理，得到所述目标关键实体。

可选地，所述按照预设规则从所述第一实体提取模型中筛选出与所述指定数量相同的模型，得到所述目标实体提取模型的步骤，包括：

基于预设的第一验证样本集生成各所述第一实体提取模型的第一模型处理时间；

基于所述第一验证样本集获取各所述第一实体提取模型的第一处理准确率；

获取与所述第一模型处理时间对应的第一权重，以及获取与所述第一处理准确率对应的第二权重；

基于各所述第一实体提取模型的第一模型处理时间与第一处理准确率、所述第一权重以及所述第二权重，计算生成各所述第一实体提取模型的处理得分；

按照所述处理得分的数值从大到小的顺序进行排序得到对应的排序结果；

从所述排序结果中排序第一的处理得分开始，依次获取与所述指定数量相同的多个目标处理得分；

从所述第一实体提取模型中筛选出与各所述目标处理得分分别对应的模型，得到所述目标实体提取模型。

获取预设数量的所述第一实体提取模型，并基于预设的第二验证样本集获取各所述第一实体提取模型的第二处理准确率；

从所有所述第一实体提取模型中筛选出第二处理准确率大于预设准确率阈值的第二实体提取模型；

基于所述第二验证样本集生成各所述第二实体提取模型的第二模型处理时间；

从所有所述第二模型处理时间中筛选出数值最小的目标模型处理时间；

从所述第二实体提取模型中筛选出与所述目标模型处理时间对应的模型，得到所述目标实体提取模型。

可选地，所述基于所述第二验证样本集生成各所述第二实体提取模型的第二模型处理时间的步骤，包括：

获取所述第二验证样本集；其中，所述第二验证样本集包括多个验证样本数据；

在第三实体提取模型获取到每一个所述验证样本数据时，分别统计所述第三实体提取模型输出与每一个所述验证样本数据分别对应的关键实体提取结果的处理时间；其中，所述第三实体提取模型为所有所述第二实体提取模型中的任意一个模型；

计算所有所述处理时间的和值；

获取所有所述处理时间的数量；

计算所述和值与所有所述处理时间的数量之间的商值，得到所述第三实体提取模型的第二模型处理时间。

可选地，所述基于所述目标关键实体对预设的知识图谱进行查询处理，从所述知识图谱中查询出与所述目标关键实体对应的目标规范标签的步骤，包括：

调用所述知识图谱；

基于所述知识图谱对所述目标关键实体进行匹配处理，从所述知识图谱中获取与各所述目标关键实体分别匹配的指定实体；

从所述知识图谱中获取与各所述指定实体分别对应的规范标签；

对所有所述规范标签进行去重处理，得到所述目标规范标签。

可选地，所述展示所述建议信息的步骤之后，包括：

判断是否接收到所述目标用户输入的架构文档；

若接收到所述架构文档，对所述架构文档进行关键词提取处理得到对应的关键词；

判断所述关键词中是否包含有与所有所述目标规范标签一一匹配的目标关键词；

若包含有所述目标关键词，生成校验通过的校验结果，否则生成校验未通过的校验结果；

展示所述校验结果。

本申请还提供一种基于模型的信息生成装置，包括：

第一判断模块，用于判断是否接收到目标用户输入的产品需求文档；

确定模块，用于若是，从预先训练好的预设数量的第一实体提取模型中确定出目标实体提取模型；其中，每一个所述第一实体提取模型分别是基于各自不同的训练样本集进行训练获得的，所述训练样本集的数量等于所述预设数量；

获取模块，用于将所述产品需求文档输入至所述目标实体提取模型中，通过所述目标实体提取模型获取与所述产品需求文档对应的目标关键实体；其中，所述目标关键实体的数量包括多个；

查询模块，用于基于所述目标关键实体对预设的知识图谱进行查询处理，从所述知识图谱中查询出与所述目标关键实体对应的目标规范标签；

第一生成模块，用于基于所述目标规范标签以及预设的信息模板生成对应的建议信息；

第一展示模块，用于展示所述建议信息。

本申请还提供一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序时实现上述方法的步骤。

本申请还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述方法的步骤。

本申请中提供的基于模型的信息生成方法、装置、计算机设备和存储介质，具有以下有益效果：

本申请中提供的基于模型的信息生成方法、装置、计算机设备和存储介质，通过使用从预先训练好的预设数量的实体提取模型中确定的目标实体提取模型，来对目标用户输入的产品需求文档进行实体提取处理以得到目标关键实体，进而基于得到的目标关键实体来对预设的知识图谱进行查询处理，以实现快速准确地生成目标用户编写架构文档所需的目标规范标签，并会基于该目标规范标签快速生成相应的与编写架构文档对应的建议信息并展示给目标用户，使得目标用户后续可以按照该建议信息来快捷准确地完成符合规范的架构文档的编写，从而有利于提高生成的架构文档的准确性与规范性，以及提高架构文档的生成效率。

附图说明

图1是本申请一实施例的基于模型的信息生成方法的流程示意图；

图2是本申请一实施例的基于模型的信息生成装置的结构示意图；

图3是本申请一实施例的计算机设备的结构示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用于解释本申请，并不用于限定本申请。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)，具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语，应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样被特定定义，否则不会用理想化或过于正式的含义来解释。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

参照图1，本申请一实施例的基于模型的信息生成方法，包括：

S10：判断是否接收到目标用户输入的产品需求文档；

S20：若是，从预先训练好的预设数量的第一实体提取模型中确定出目标实体提取模型；其中，每一个所述第一实体提取模型分别是基于各自不同的训练样本集进行训练获得的，所述训练样本集的数量等于所述预设数量；

S30：将所述产品需求文档输入至所述目标实体提取模型中，通过所述目标实体提取模型获取与所述产品需求文档对应的目标关键实体；其中，所述目标关键实体的数量包括多个；

S40：基于所述目标关键实体对预设的知识图谱进行查询处理，从所述知识图谱中查询出与所述目标关键实体对应的目标规范标签；

S50：基于所述目标规范标签以及预设的信息模板生成对应的建议信息；

S60：展示所述建议信息。

如上述步骤S10至S60所述，本方法实施例的执行主体为一种基于模型的信息生成装置，简称为装置。在实际应用中，上述基于模型的信息生成装置可以通过虚拟装置，例如软件代码实现，也可以通过写入或集成有相关执行代码的实体装置实现，且可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。本实施例中的基于模型的信息生成装置，能够实现快速准确地生成用户编写架构文档所需的目标规范标签，并会基于该目标规范标签快速生成相应的与编写架构文档对应的建议信息并展示给相关用户，有利于提高架构文档的生成效率与规范性。具体地，首先判断是否接收到目标用户输入的产品需求文档。其中，产品需求文档为编写有产品的需求信息的文档，可以基于对该产品需求文档进行需求评审从而得出后续需要编写的架构文档中的技术方案描述所对应的需要覆盖的架构规范，即在架构文档中要有关于所需覆盖的架构规范的针对性的方案描述。若接收到所述产品需求文档，从预先训练好的预设数量的第一实体提取模型中确定出目标实体提取模型。其中，每一个所述第一实体提取模型分别是基于各自不同的训练样本集进行训练获得的，所述训练样本集的数量等于所述预设数量。另外，对于从预先训练好的预设数量的第一实体提取模型中确定出目标实体提取模型的方式不作限定，例如可根据各第一实体提取模型的模型处理时间以及处理准确率来从第一实体提取模型中筛选出符合相关要求的目标实体提取模型。具体的目标实体提取模型确定过程将在后续的具体实施例中作进一步的描述，在此不予赘述。

然后将所述产品需求文档输入至所述目标实体提取模型中，通过所述目标实体提取模型获取与所述产品需求文档对应的目标关键实体。其中，所述目标关键实体的数量包括多个。另外，所述目标实体抽取模型可包括BERT语言模型、长短期记忆网络LSTM层和条件随机场CRF层。具体的，通过所述目标实体提取模型获取与所述产品需求文档对应的目标关键实体的过程可包括：首先将所述产品需求文档输入至所述BERT语言模型中，获得所述产品需求文档对应的字向量序列；然后将所述产品需求文档对应的字向量序列输入至所述长短期记忆网络LSTM层中进行语义关系提取；最后将所述长短期记忆网络LSTM层的输出结果输入至所述条件随机场CRF层，通过利用标签转移概率来进行句子级别的标签预测，获得所述产品需求文档的实体抽取结果，即所述目标关键实体。其中，实体一般指的是文本中具有特定意义或者指代性强的实体，通常包括人名、地名、组织机构名、日期时间、专有名词等。实体提取模型就是从非结构化的输入文本中抽取出上述实体，并且可以按照业务需求识别出更多类别的实体，比如产品名称、型号、价格等。实体这个概念可以很广，只要是业务需要的特殊文本片段都可以称为实体。

之后基于所述目标关键实体对预设的知识图谱进行查询处理，从所述知识图谱中查询出与所述目标关键实体对应的目标规范标签。其中，所述知识图谱可以是基于实体，以及实体与标签之间的关联关系预先进行构建的，可以利用关系数据库或图数据库存储知识图谱中的实体、实体与标签之间的关联关系。另外，从所述知识图谱中查询出与所述目标关键实体对应的目标规范标签的具体实现过程将在后续的具体实施例中作进一步的描述，在此不予赘述。后续基于所述目标规范标签以及预设的信息模板生成对应的建议信息。其中，可以根据实际需求预先生成信息模板并存储于装置内。所述信息模板的内容可包括：编写的相关架构文档需要遵循以下架构规范：XXX。所述XXX指代目标规范标签，XXX的位置对应目标规范标签的填入位置。通过将所述目标规范标签填入至所述信息模板的相应位置处，从而可以生成所述建议信息。最后展示所述建议信息。其中，对所述建议信息的展示方式不作具体限定，例如可采用短信或语音的方式进行展示。

本实施例通过使用从预先训练好的预设数量的实体提取模型中确定的目标实体提取模型，来对目标用户输入的产品需求文档进行实体提取处理以得到目标关键实体，进而基于得到的目标关键实体来对预设的知识图谱进行查询处理，以实现快速准确地生成目标用户编写架构文档所需的目标规范标签，并会基于该目标规范标签快速生成相应的与编写架构文档对应的建议信息并展示给目标用户，使得目标用户后续可以按照该建议信息来快捷准确地完成符合规范的架构文档的编写，从而有利于提高生成的架构文档的准确性与规范性，以及提高架构文档的生成效率。

进一步地，本申请一实施例中，上述步骤S20，包括：

S200：获取预设数量的所述第一实体提取模型；

S201：获取预设的内存信息，并从预设的数量映射表中查询出与所述内存信息对应的指定数量；

S202：判断所述指定数量是否小于所述预设数量；

S203：若是，按照预设规则从所述第一实体提取模型中筛选出与所述指定数量相同的模型，得到所述目标实体提取模型；

上述步骤S30，包括：

S300：将所述产品需求文档分别输入至各所述目标实体提取模型中，获取各所述目标实体提取模型分别输出的对应的第一关键实体；

S301：对所有所述第一关键实体进行合并处理，得到对应的第二关键实体；

S302：对所述第二关键实体进行去重处理，得到所述目标关键实体。

如上述步骤S200至S302所述，所述从预先训练好的预设数量的第一实体提取模型中确定出目标实体提取模型的步骤，具体可包括：首先获取预设数量的所述第一实体提取模型。其中，对于所述预设数量的取值不作具体限定，可根据实际需求进行设置，例如可设为6。预设数量可指用户希望训练生成的第一实体提取模型的数量。通过基于用户输入的预设数量来生成预设数量的多个第一实体提取模型，能够有效提高用户的使用体验。然后获取预设的内存信息，并从预设的数量映射表中查询出与所述内存信息对应的指定数量。其中，所述内存信息具体可指装置的CPU内核数量，所述数量映射表也可称为内存-模型数量映射表，其为记录有内存信息与模型运作数量的映射关系的数据表，该内存-模型数量映射表可基于实际测试结果、线上问题分析以及专家经验创建得到。另外，基于内存信息从所述数量映射表中选择出对应的指定数量，能够保证装置内部模型的数据处理过程的损耗代价较少，并保证多模型的数据处理均能够处于正常速率且装置不会出现卡顿情况，进而能够有效保障生成目标关键实体的处理效率。之后判断所述指定数量是否小于所述预设数量。若小于所述预设数量，按照预设规则从所述第一实体提取模型中筛选出与所述指定数量相同的多个模型，得到所述目标实体提取模型。所述预设规则可指根据各第一实体提取模型的模型处理时间以及处理准确率来从第一实体提取模型中筛选出符合相关要求的模型作为目标实体提取模型，具体的模型筛选过程将在后续的具体实施例中作进一步的描述，在此不予赘述。进一步地，所述将所述产品需求文档输入至所述目标实体提取模型中，通过所述目标实体提取模型获取与所述产品需求文档对应的目标关键实体的步骤，具体可包括：先将所述产品需求文档分别输入至各所述目标实体提取模型中，获取各所述目标实体提取模型分别输出的对应的第一关键实体。再对所有所述第一关键实体进行合并处理，得到对应的第二关键实体。其中，所述合并处理是指将每一个第二实体提取模型分别输出的所有第一关键实体整合起来得到第二关键实体，该第二关键实体包含所有所述第一关键实体。最后对所述第二关键实体进行去重处理，得到所述目标关键实体。其中，所述去重处理是指针对多次出现的同一个关键实体，会仅保留其中的一个而将剩余关键实体进行删除的处理。本实施例在获取了预先训练好的预设数量的所述第一实体提取模型后，还会进一步基于装置的内存信息以及预设规则从第一实体提取模型中筛选出符合使用要求的多个目标实体提取模型。通过使用该多个目标实体提取模型来对产品需求文档进行实体提取处理，并通过对该多个目标实体提取模型输出的关键实体进行合并及去重处理来得到最终的目标关键实体，有效地保证了生成的目标关键实体的全面性与准确性。以及避免了仅仅使用一个实体提取模型来对产品需求文档进行实体提取处理而导致得到的实体提取结果的误差性较大，且同时也不需要使用训练生成的所有第一实体提取模型进行处理而导致数据处理量过大，有效地提高了对于产品需求文档进行实体提取的准确度，保证了模型进行实体提取的流畅性，提高了生成与所述产品需求文档对应的目标关键实体的处理速率与智能性。

进一步地，可使用BERT-wwm-ext+LSTM+CRF的模型架构来进行第一实体提取模型的训练创建过程。具体的，训练获得所述第一实体提取模型的过程可具体包括：首先利用通用语料样本和所述通用语料样本对应的实体标注对基于BERT语言模型的实体提取模型进行预训练。其中，所述实体抽取模型包括BERT语言模型、长短期记忆网络LSTM层和条件随机场CRF层。由于是中文语境，所述BERT语言模型具体为中文预训练语言模型，即BERT-wwm-ext。然后利用特定实体语料样本和所述特定实体语料样本对应的实体标注对预训练的BERT语言模型进行微调，获得训练好的实体提取模型。其中，对预训练的BERT语言模型进行微调，来实现对文本中的实体相关字向量序列进行提取。通过构建一个底层的BERT基础模型来彻底建模上下文关系，而通过fine-tuning来进一步构造出针对特定中文命名实体识别问题的特定模型，可充分描述字符级、词级、句子级甚至句间关系特征。应用于实体提取模型中的LSTM-CRF模型主要由Embedding层(主要有词向量，字向量以及一些额外特征)，双向LSTM层，以及最后的CRF层构成。在神经网络的输出层接入CRF层，以实现利用标签转移概率来做句子级别的标签预测。其中，由于应用场景是针对公司的产品需求文档的架构评审指导，先把预设时间周期，如近1到3年积累的产品需求文档，质量较好的架构评审文档以及公司内部各个域，各个系统的描述按照实际的业务需求进行人工的实体标注，来生成相应的训练样本集。所述业务需求可包括常规的命名实体，即3大类(实体类，时间类，数字类)实体和7小类(人名、地名、组织机构名、时间、日期、货币、百分比)实体，还可包括特定领域内的实体，如型号、价格、期刊名等。另外，训练生成的多个第一实体提取模型之间具有以下差别：从预设的样本数据集中挑选出的训练样本集不同，因此生成的各个第一实体提取模型的实体提取的准确性与稳定性会有所不同，从而后续步骤可以根据各个第一实体提取模型的实体提取的准确性与稳定性进行考量，进而从所有所述第一实体提取模型筛选出用于对所述产品需求文档进行实体提取处理的一个或多个实体提取模型，以起到有效提高最终生成的与所述产品需求文档对应的目标关键实体的准确性。

进一步地，本申请一实施例中，上述步骤S203，包括：

S2030：基于预设的第一验证样本集生成各所述第一实体提取模型的第一模型处理时间；

S2031：基于所述第一验证样本集获取各所述第一实体提取模型的第一处理准确率；

S2032：获取与所述第一模型处理时间对应的第一权重，以及获取与所述第一处理准确率对应的第二权重；

S2033：基于各所述第一实体提取模型的第一模型处理时间与第一处理准确率、所述第一权重以及所述第二权重，计算生成各所述第一实体提取模型的处理得分；

S2034：按照所述处理得分的数值从大到小的顺序进行排序得到对应的排序结果；

S2035：从所述排序结果中排序第一的处理得分开始，依次获取与所述指定数量相同的多个目标处理得分；

S2036：从所述第一实体提取模型中筛选出与各所述目标处理得分分别对应的模型，得到所述目标实体提取模型。

如上述步骤S2030至S2036所述，所述按照预设规则从所述第一实体提取模型中筛选出与所述指定数量相同的模型，得到所述目标实体提取模型的步骤，具体可包括：首先基于预设的第一验证样本集生成各所述第一实体提取模型的第一模型处理时间。其中，所述第一验证样本集可基于所述训练样本集生成，如可随机从训练样本集中获取预设数值比例的数据作为该第一验证样本集，且该第一预设数值比例可根据实际需求进行设置，例如可设为30％。另外，基于预设的第一验证样本集生成各所述第一实体提取模型的第一模型处理时间的具体实现过程可参考后续实施例中公开的基于预设的第二验证样本集生成各所述第四实体提取模型的第二模型处理时间的实现过程，在此不进行赘述。以及基于所述第一验证样本集获取各所述第一实体提取模型的第一处理准确率。其中，计算各所述第一实体提取模型的处理准确率的方式可采用现有的计算模型的准确率的计算方式。然后获取与所述第一模型处理时间对应的第一权重，以及获取与所述第一处理准确率对应的第二权重。之后基于各所述第一实体提取模型的第一模型处理时间与第一处理准确率、所述第一权重以及所述第二权重，计算生成各所述第一实体提取模型的处理得分。其中，对于所述第一权重与第二权重的取值不作具体限定，可根据实际需求进行设置，优选所述第一权重的取值小于所述第二权重的取值，且第一权重与第二权重之间的和值为1。另外，可基于第一权重与第二权重，对相对应的任意一个第一实体提取模型的第一模型处理时间与第一处理准确率进行加权求和处理，得到的求和值便为该第一实体提取模型的处理得分。在得到所述处理得分后，按照所述处理得分的数值从大到小的顺序进行排序得到对应的排序结果。后续从所述排序结果中排序第一的处理得分开始，依次获取与所述指定数量相同的多个目标处理得分。最后从所述第一实体提取模型中筛选出与各所述目标处理得分分别对应的模型，得到所述目标实体提取模型。本实施例通过对预先训练好的预设数量的第一实体提取模型分别进行模型处理时间与处理准确率的综合考量，从而为每一个第一实体提取模型生成相对应的处理得分，进而从所有第一实体提取模型中筛选出处理得分最高的指定数量的模型来作为最终的目标实体提取模型。由于确定出的目标实体提取模型具有较高的处理准确率与较高的处理效率，故通过使用该多个目标实体提取模型来对产品需求文档进行实体提取处理，并通过对该多个目标实体提取模型输出的关键实体进行合并及去重处理来得到最终的目标关键实体，有效地保证了后续生成的目标关键实体的全面性与准确性。

进一步地，本申请一实施例中，上述步骤S20，包括：

S210：获取预设数量的所述第一实体提取模型，并基于预设的第二验证样本集获取各所述第一实体提取模型的第二处理准确率；

S211：从所有所述第一实体提取模型中筛选出第二处理准确率大于预设准确率阈值的第二实体提取模型；

S212：基于所述第二验证样本集生成各所述第二实体提取模型的第二模型处理时间；

S213：从所有所述第二模型处理时间中筛选出数值最小的目标模型处理时间；

S214：从所述第二实体提取模型中筛选出与所述目标模型处理时间对应的模型，得到所述目标实体提取模型。

如上述步骤S210至S214所述，所述从预先训练好的预设数量的第一实体提取模型中确定出目标实体提取模型的步骤，具体可包括：首先获取预设数量的所述第一实体提取模型，并基于预设的第二验证样本集获取各所述第一实体提取模型的第二处理准确率。其中，计算各所述第一实体提取模型的处理准确率的方式可采用现有的计算模型的准确率的计算方式，在此不作过多阐述。然后从所有所述第一实体提取模型中筛选出第二处理准确率大于预设准确率阈值的第二实体提取模型。其中，对于所述预设准确率阈值的取值不作具体限定，可根据实际需求进行设置。之后基于所述第二验证样本集生成各所述第二实体提取模型的第二模型处理时间。其中，基于所述第二验证样本集生成各所述第二实体提取模型的第二模型处理时间的具体实现过程将在后续的具体实施例中作进一步的描述，在此不予赘述。后续从所有所述第二模型处理时间中筛选出数值最小的目标模型处理时间。最后从所述第二实体提取模型中筛选出与所述目标模型处理时间对应的模型，得到所述目标实体提取模型。本实施例在获得了预先训练好的预设数量的所述第一实体提取模型后，还会对所有所述第一实体提取模型进行模型处理时间与处理准确率的综合考量，在筛选出大于预设准确率阈值的多个第二实体提取模型后，进而会从该多个第二实体提取模型中筛选出模型处理时间最短的模型用作目标实体提取模型。由于得到的目标实体提取模型具有较高的处理准确率与最高的处理效率，使得后续在利用目标实体提取模型对输入的产品需求文档进行实体提取处理时，能够在保证目标实体提取模型输出的目标关键实体的准确性的基础上，有效地提高对产品需求文档的实体提取的处理效率。

进一步地，本申请一实施例中，上述步骤S212，包括：

S2120：获取所述第二验证样本集；其中，所述第二验证样本集包括多个验证样本数据；

S2121：在第三实体提取模型获取到每一个所述验证样本数据时，分别统计所述第三实体提取模型输出与每一个所述验证样本数据分别对应的关键实体提取结果的处理时间；其中，所述第三实体提取模型为所有所述第二实体提取模型中的任意一个模型；

S2122：计算所有所述处理时间的和值；

S2123：获取所有所述处理时间的数量；

S2124：计算所述和值与所有所述处理时间的数量之间的商值，得到所述第三实体提取模型的第二模型处理时间。

如上述步骤S2120至S2124所述，所述基于所述第二验证样本集生成各所述第二实体提取模型的第二模型处理时间的步骤，具体可包括：首先获取所述第二验证样本集。其中，所述第二验证样本集包括多个验证样本数据。另外，所述第二验证样本集可基于所述训练样本集生成，如可随机从训练样本集集中获取预设数值比例的数据作为该第二验证样本集，且该预设数值比例可根据实际需求进行设置。然后在第三实体提取模型获取到每一个所述验证样本数据时，分别统计所述第三实体提取模型输出与每一个所述验证样本数据分别对应的关键实体提取结果的处理时间。其中，所述第三实体提取模型为所有所述第二实体提取模型中的任意一个模型。另外，所述处理时间是指第三实体提取模型在接收到任意一个验证样本数据直到输出与该验证样本数据对应的关键实体提取结果所花费的时间。举例地，假如第三实体提取模型接收到验证样本数据m的时间为T1，第三实体提取模型成功输出验证样本数据m的关键实体提取结果时的时间为T2，则可得到该第三实体提取模型对应于验证样本数据m的处理时间为T＝T2-T1。之后计算所有所述处理时间的和值。以及获取所有所述处理时间的数量。最后计算所述和值与所有所述处理时间的数量之间的商值，得到所述第三实体提取模型的第二模型处理时间。本实施例通过基于第二验证样本集可以快速地计算出每一个第二实体提取模型的处理时间，有利于后续能够基于该处理时间以及各第二实体提取模型的处理准确率来对所有第二实体提取模型进行筛选处理以生成最终的目标实体提取模型，进而可基于目标实体提取模型来准确地对产品需求文档进行实体提取处理并生成相应的目标关键实体。由于基于第二实体提取模型筛选得到的目标实体提取模型具有较高的处理准确率与最高的处理效率，使得后续在利用目标实体提取模型对产品需求文档进行实体提取处理时，能够在保证目标实体提取模型输出的目标关键实体的准确性的基础上，有效地提高对产品需求文档的实体提取的处理效率。

进一步地，本申请一实施例中，上述步骤S40，包括：

S400：调用所述知识图谱；

S401：基于所述知识图谱对所述目标关键实体进行匹配处理，从所述知识图谱中获取与各所述目标关键实体分别匹配的指定实体；

S402：从所述知识图谱中获取与各所述指定实体分别对应的规范标签；

S403：对所有所述规范标签进行去重处理，得到所述目标规范标签。

如上述步骤S400至S403所述，所述基于所述目标关键实体对预设的知识图谱进行查询处理，从所述知识图谱中查询出与所述目标关键实体对应的目标规范标签的步骤，具体可包括：首先调用所述知识图谱。其中，所述知识图谱具体可以是基于实体，以及实体与标签之间的关联关系预先进行构建的，可以利用关系数据库或图数据库存储知识图谱中的实体、实体与标签之间的关联关系。知识图谱中可以包括标签与实体的关联对，实体与标签可以是一对一或者一对多的关联关系。所述标签具体为预设的架构规范的名称标签，架构规范具体可包括应用间依赖，应用间交互，接口设计，批处理job，消息使用，文件处理，缓存使用，业务安全，信息安全，数据库设计，系统监控，业务监控，可测试，可运维，可扩展，高可用，高性能，交易处理，资金处理，资金对账，三方接入，兜底降级等规范。举例地，假如实体为文件处理，则与该实体关联的标签为：件处理规范，批处理规范，信息安全规范，业务监控等。假如实体为外部公司产品接入，则与该实体关联的标签为第三方接入规范，兜底降级规范，系统监控，业务监控等。然后基于所述知识图谱对所述目标关键实体进行匹配处理，从所述知识图谱中获取与各所述目标关键实体分别匹配的指定实体。其中，可通过使用现有的相似度算法来进行所述目标关键实体与所述知识图谱中包含的实体之间的匹配处理，若目标关键实体与知识图谱中某一个实体之间的相似度大于预设的相似度阈值，则可判定该目标关键实体与该实体之间具有匹配关系。另外，对于相似度阈值的取值可根据实际需求进行设置。之后从所述知识图谱中获取与各所述指定实体分别对应的规范标签。最后对所有所述规范标签进行去重处理，得到所述目标规范标签。其中，所述去重处理是指针对多次出现的同一个规范标签，会仅保留其中的一个而将剩余规范标签进行删除的处理。本实施例在获取到由目标实体提取模型输出的目标关键实体后，通过基于知识图谱的使用可以快速智能地查询出与该目标关键实体对应的目标规范标签，有利于后续可以基于该目标规范标签快速生成相应的与编写产品的架构文档对应的建议信息，使得目标用户可以按照该建议信息来快捷准确地完成符合规范的架构文档的编写，从而有利于提高生成的架构文档的准确性与规范性，提高了目标用户的使用体验。

进一步地，本申请一实施例中，上述步骤S60之后，包括：

S600：判断是否接收到所述目标用户输入的架构文档；

S601：若接收到所述架构文档，对所述架构文档进行关键词提取处理得到对应的关键词；

S602：判断所述关键词中是否包含有与所有所述目标规范标签一一匹配的目标关键词；

S603：若包含有所述目标关键词，生成校验通过的校验结果，否则生成校验未通过的校验结果；

S604：展示所述校验结果。

如上述步骤S600至S604所述，在执行完所述展示所述建议信息的步骤之后，还可包括对后续用户输入的架构文档进行校验的过程。具体地，首先判断是否接收到所述目标用户输入的架构文档。其中，所述架构文档可以是目标用户基于得到的建议信息来编写生成的文档。若接收到所述架构文档，对所述架构文档进行关键词提取处理得到对应的关键词。然后判断所述关键词中是否包含有与所有所述目标规范标签一一匹配的目标关键词。其中，判断关键词匹配的方式可采用相似度计算来实现，如果两个关键词之间的相似度大于预设的相似度阈值，则表明该两个关键词为相互匹配的词语。另外，相似度阈值可根据实际需求进行确定。若包含有所述目标关键词，生成校验通过的校验结果，否则生成校验未通过的校验结果。最后展示所述校验结果。本实施例在接收到目标用户输入的架构文档后，还会进一步提取出该架构文档中的关键词，并基于该关键词以及所述知识图谱输出的目标规范标签对所述架构文档进行校验处理，进而生成与该架构文档对应的校验结果并进行展示，以完成对于架构文档的自动化审核，从而可以大大减少审核员的工作量，有效地提高了对于架构文档的处理效率，以及对于架构文档的审核准确性。

本申请实施例中的基于模型的信息生成方法还可以应用于区块链领域，如将上述目标规范标签等数据存储于区块链上。通过使用区块链来对上述目标规范标签进行存储和管理，能够有效地保证上述目标规范标签的安全性与不可篡改性。

上述区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中，用户管理模块负责所有区块链参与者的身份信息管理，包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等，并且在授权的情况下，监管和审计某些真实身份的交易情况，提供风险控制的规则配置(风控审计)；基础服务模块部署在所有区块链节点设备上，用来验证业务请求的有效性，并对有效请求完成共识后记录到存储上，对于一个新的业务请求，基础服务先对接口适配解析和鉴权处理(接口适配)，然后通过共识算法将业务信息加密(共识管理)，在加密之后完整一致的传输至共享账本上(网络通信)，并进行记录存储；智能合约模块负责合约的注册发行以及合约触发和合约执行，开发人员可以通过某种编程语言定义合约逻辑，发布到区块链上(合约注册)，根据合约条款的逻辑，调用密钥或者其它的事件触发执行，完成合约逻辑，同时还提供对合约升级注销的功能；运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出，例如：告警、监控网络情况、监控节点设备健康状态等。

参照图2，本申请一实施例中还提供了一种基于模型的信息生成装置，包括：

第一判断模块1，用于判断是否接收到目标用户输入的产品需求文档；

确定模块2，用于若是，从预先训练好的预设数量的第一实体提取模型中确定出目标实体提取模型；其中，每一个所述第一实体提取模型分别是基于各自不同的训练样本集进行训练获得的，所述训练样本集的数量等于所述预设数量；

获取模块3，用于将所述产品需求文档输入至所述目标实体提取模型中，通过所述目标实体提取模型获取与所述产品需求文档对应的目标关键实体；其中，所述目标关键实体的数量包括多个；

查询模块4，用于基于所述目标关键实体对预设的知识图谱进行查询处理，从所述知识图谱中查询出与所述目标关键实体对应的目标规范标签；

第一生成模块5，用于基于所述目标规范标签以及预设的信息模板生成对应的建议信息；

第一展示模块6，用于展示所述建议信息。

本实施例中，上述模块或单元分别用于执行的操作与前述实施方式的基于模型的信息生成方法的步骤一一对应，在此不再赘述。

进一步地，本申请一实施例中，上述确定模块2，包括：

第一获取单元，用于获取预设数量的所述第一实体提取模型；

查询单元，用于获取预设的内存信息，并从预设的数量映射表中查询出与所述内存信息对应的指定数量；

判断单元，用于判断所述指定数量是否小于所述预设数量；

第一确定单元，用于若是，按照预设规则从所述第一实体提取模型中筛选出与所述指定数量相同的模型，得到所述目标实体提取模型；

上述获取模块3，包括：

第二获取单元，用于将所述产品需求文档分别输入至各所述目标实体提取模型中，获取各所述目标实体提取模型分别输出的对应的第一关键实体；

合并单元，用于对所有所述第一关键实体进行合并处理，得到对应的第二关键实体；

第二确定单元，用于对所述第二关键实体进行去重处理，得到所述目标关键实体。

进一步地，本申请一实施例中，上述第一确定单元，包括：

第一生成子单元，用于基于预设的第一验证样本集生成各所述第一实体提取模型的第一模型处理时间；

第一获取子单元，用于基于所述第一验证样本集获取各所述第一实体提取模型的第一处理准确率；

第二获取子单元，用于获取与所述第一模型处理时间对应的第一权重，以及获取与所述第一处理准确率对应的第二权重；

第二生成子单元，用于基于各所述第一实体提取模型的第一模型处理时间与第一处理准确率、所述第一权重以及所述第二权重，计算生成各所述第一实体提取模型的处理得分；

排序子单元，用于按照所述处理得分的数值从大到小的顺序进行排序得到对应的排序结果；

第三获取子单元，用于从所述排序结果中排序第一的处理得分开始，依次获取与所述指定数量相同的多个目标处理得分；

第一确定子单元，用于从所述第一实体提取模型中筛选出与各所述目标处理得分分别对应的模型，得到所述目标实体提取模型。

进一步地，本申请一实施例中，上述确定模块2，包括：

第三获取单元，用于获取预设数量的所述第一实体提取模型，并基于预设的第二验证样本集获取各所述第一实体提取模型的第二处理准确率；

第一筛选单元，用于从所有所述第一实体提取模型中筛选出第二处理准确率大于预设准确率阈值的第二实体提取模型；

生成单元，用于基于所述第二验证样本集生成各所述第二实体提取模型的第二模型处理时间；

第二筛选单元，用于从所有所述第二模型处理时间中筛选出数值最小的目标模型处理时间；

第三确定单元，用于从所述第二实体提取模型中筛选出与所述目标模型处理时间对应的模型，得到所述目标实体提取模型。

进一步地，本申请一实施例中，上述生成单元，包括：

第四获取子单元，用于获取所述第二验证样本集；其中，所述第二验证样本集包括多个验证样本数据；

统计子单元，用于在第三实体提取模型获取到每一个所述验证样本数据时，分别统计所述第三实体提取模型输出与每一个所述验证样本数据分别对应的关键实体提取结果的处理时间；其中，所述第三实体提取模型为所有所述第二实体提取模型中的任意一个模型；

计算子单元，用于计算所有所述处理时间的和值；

第五获取子单元，用于获取所有所述处理时间的数量；

第二确定子单元，用于计算所述和值与所有所述处理时间的数量之间的商值，得到所述第三实体提取模型的第二模型处理时间。

进一步地，本申请一实施例中，上述查询模块4，包括：

调用单元，用于调用所述知识图谱；

匹配单元，用于基于所述知识图谱对所述目标关键实体进行匹配处理，从所述知识图谱中获取与各所述目标关键实体分别匹配的指定实体；

第四获取单元，用于从所述知识图谱中获取与各所述指定实体分别对应的规范标签；

第四确定单元，用于对所有所述规范标签进行去重处理，得到所述目标规范标签。

进一步地，本申请一实施例中，上述基于模型的信息生成装置，包括：

第二判断模块，用于判断是否接收到所述目标用户输入的架构文档；

提取模块，用于若接收到所述架构文档，对所述架构文档进行关键词提取处理得到对应的关键词；

第三判断模块，用于判断所述关键词中是否包含有与所有所述目标规范标签一一匹配的目标关键词；

第二生成模块，用于若包含有所述目标关键词，生成校验通过的校验结果，否则生成校验未通过的校验结果；

第二展示模块，用于展示所述校验结果。

参照图3，本申请实施例中还提供一种计算机设备，该计算机设备可以是服务器，其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏、输入装置和数据库。其中，该计算机设备设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括存储介质、内存储器。该存储介质存储有操作系统、计算机程序和数据库。该内存储器为存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储产品需求文档、目标实体提取模型、目标关键实体、知识图谱、目标规范标签、信息模板以及建议信息。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机设备的显示屏是计算机中必不可少的一种图文输出设备，用于将数字信号转换为光信号，使文字与图形在显示屏的屏幕上显示出来。该计算机设备的输入装置是计算机与用户或其他设备之间进行信息交换的主要装置，用于把数据、指令及某些标志信息等输送到计算机中去。该计算机程序被处理器执行时以实现一种基于模型的信息生成方法。

上述处理器执行上述基于模型的信息生成方法的步骤：

判断是否接收到目标用户输入的产品需求文档；

展示所述建议信息。

本领域技术人员可以理解，图3中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的装置、计算机设备的限定。

本申请一实施例还提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现一种基于模型的信息生成方法，具体为：

判断是否接收到目标用户输入的产品需求文档；

展示所述建议信息。

综上所述，本申请实施例中提供的基于模型的信息生成方法、装置、计算机设备和存储介质，通过使用从预先训练好的预设数量的实体提取模型中确定的目标实体提取模型，来对目标用户输入的产品需求文档进行实体提取处理以得到目标关键实体，进而基于得到的目标关键实体来对预设的知识图谱进行查询处理，以实现快速准确地生成目标用户编写架构文档所需的目标规范标签，并会基于该目标规范标签快速生成相应的与编写架构文档对应的建议信息并展示给目标用户，使得目标用户后续可以按照该建议信息来快捷准确地完成符合规范的架构文档的编写，从而有利于提高生成的架构文档的准确性与规范性，以及提高架构文档的生成效率。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM通过多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其它要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上所述仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

1.一种基于模型的信息生成方法，其特征在于，包括：

判断是否接收到目标用户输入的产品需求文档；

展示所述建议信息。

2.根据权利要求1所述的基于模型的信息生成方法，其特征在于，所述从预先训练好的预设数量的第一实体提取模型中确定出目标实体提取模型的步骤，包括：

获取预设数量的所述第一实体提取模型；

判断所述指定数量是否小于所述预设数量；

3.根据权利要求2所述的基于模型的信息生成方法，其特征在于，所述按照预设规则从所述第一实体提取模型中筛选出与所述指定数量相同的模型，得到所述目标实体提取模型的步骤，包括：

4.根据权利要求1所述的基于模型的信息生成方法，其特征在于，所述从预先训练好的预设数量的第一实体提取模型中确定出目标实体提取模型的步骤，包括：

5.根据权利要求4所述的基于模型的信息生成方法，其特征在于，所述基于所述第二验证样本集生成各所述第二实体提取模型的第二模型处理时间的步骤，包括：

计算所有所述处理时间的和值；

获取所有所述处理时间的数量；

6.根据权利要求1所述的基于模型的信息生成方法，其特征在于，所述基于所述目标关键实体对预设的知识图谱进行查询处理，从所述知识图谱中查询出与所述目标关键实体对应的目标规范标签的步骤，包括：

调用所述知识图谱；

7.根据权利要求1所述的基于模型的信息生成方法，其特征在于，所述展示所述建议信息的步骤之后，包括：

判断是否接收到所述目标用户输入的架构文档；

展示所述校验结果。

8.一种基于模型的信息生成装置，其特征在于，包括：

第一展示模块，用于展示所述建议信息。

9.一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。