CN116595976B

CN116595976B - 一种科研创新平台控制方法及其系统

Info

Publication number: CN116595976B
Application number: CN202310483389.9A
Authority: CN
Inventors: 徐旭峰; 杨首彰; 龙行; 段新安
Original assignee: Hangzhou Ruishu Technology Co ltd
Current assignee: Hangzhou Ruishu Technology Co ltd
Priority date: 2023-04-26
Filing date: 2023-04-26
Publication date: 2024-05-24
Anticipated expiration: 2043-04-26
Also published as: CN116595976A

Abstract

本申请涉及人工智能领域，其具体地公开了一种科研创新平台控制方法及其系统，其基于深度学习的人工智能技术，以通过包含词嵌入层的基于转换器的上下文编码器对于科研创新平台上各个主体要素的科研进展报告进行深度语义理解，并根据流形正则的思想来挖掘各个主体要素科研进展报告的语义理解信息中所蕴含的差异性和一致性特征，最后基于此来进行科研创新平台科研信息扩散度的分类判别以促进所述科研创新平台各个主体要素之间科研信息的流动和扩散，进而更好地为各个创新主体提供公共创新服务和产业技术支撑。

Description

一种科研创新平台控制方法及其系统

技术领域

本申请涉及人工智能领域，且更为具体地，涉及一种科研创新平台控制方法及其系统。

背景技术

科研创新平台是产学研合作的一种新型组织，其主体要素包括政府、高等学校、科研究所、生产企业、金融机构等，通过吸纳、集聚和整合区域内外知识、信息、技术等相关创新资源，最终为各个创新主体提供公共创新服务和产业技术支撑。

科研创新平台虽然提供了一个收集创新信息、交流与扩散的共享平台，但各个主体要素创新之间资源共享程度依然无法得到保证。因为科研创新平台仅仅作为一个信息发布与获取的渠道，却没有承担起促进它们流动、扩散的责任，这与科研创新平台建立的最初目标是不符合的。

因此，期待一种科研创新平台控制方案。

发明内容

为了解决上述技术问题，提出了本申请。本申请的实施例提供了一种科研创新平台控制方法及其系统，其基于深度学习的人工智能技术，以通过包含词嵌入层的基于转换器的上下文编码器对于科研创新平台上各个主体要素的科研进展报告进行深度语义理解，并根据流形正则的思想来挖掘各个主体要素科研进展报告的语义理解信息中所蕴含的差异性和一致性特征，最后基于此来进行科研创新平台科研信息扩散度的分类判别以促进所述科研创新平台各个主体要素之间科研信息的流动和扩散，进而更好地为各个创新主体提供公共创新服务和产业技术支撑。

根据本申请的一个方面，提供了一种科研创新平台控制方法，其包括：

获取科研创新平台上所有主体要素的科研进展报告；

将所述各个主体要素的科研进展报告分别进行分词处理后输入包含词嵌入层的基于转换器的上下文编码器以得到多个科研进展报告语义理解特征向量，并将所述各个主体要素的多个科研进展报告语义理解特征向量进行二维排列以得到多个科研进展报告语义表达特征矩阵；

将所述多个科研进展报告语义表达特征矩阵沿通道维度聚合为科研进展报告协同输入张量；

将所述科研进展报告协同输入张量通过作为一致性提取器的第一卷积神经网络模型以得到科研一致性特征矩阵；

将所述科研进展报告协同输入张量通过作为差异性提取器的第二卷积神经网络模型以得到科研差异性特征矩阵；

融合所述科研一致性特征矩阵和所述科研差异性特征矩阵以得到科研邻接特征矩阵；以及

将所述科研邻接特征矩阵通过分类器以得到分类结果，所述分类结果用于表示所述科研创新平台的所有主体要素之间的科研信息扩散度是否超过阈值。

在上述科研创新平台控制方法中，将所述各个主体要素的科研进展报告分别进行分词处理后输入包含词嵌入层的基于转换器的上下文编码器以得到多个科研进展报告语义理解特征向量，包括：对所述各个主体要素的科研进展报告分别进行分词处理以获得多个科研进展词；将所述多个科研进展词通过词嵌入层以将所述多个科研进展词中各个科研进展词转化为科研进展词嵌入向量以得到科研进展词嵌入向量的序列，其中，所述词嵌入层使用可学习的嵌入矩阵对所述各个科研进展词进行嵌入编码；将所科研进展词嵌入向量的序列排列为输入向量；将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量；计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵；对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵；将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵；以及，将所述自注意力特征矩阵与以所述科研进展词嵌入向量的序列中各个科研进展词嵌入向量作为值向量分别进行相乘以得到所述多个科研进展报告语义理解特征向量。

在上述科研创新平台控制方法中，将所述科研进展报告协同输入张量通过作为一致性提取器的第一卷积神经网络模型以得到科研一致性特征矩阵，包括：使用所述第一卷积神经网络模型的各层在层的正向传递中分别进行：对输入数据进行卷积处理以得到卷积特征图；对所述卷积特征图进行基于局部特征矩阵的均值池化以得到池化特征图；以及，对所述池化特征图进行非线性激活以得到激活特征图；其中，所述第一卷积神经网络模型的最后一层的输出为所述科研一致性特征矩阵，所述第一卷积神经网络模型的第一层的输入为所述科研进展报告协同输入张量。

在上述科研创新平台控制方法中，将所述科研进展报告协同输入张量通过作为差异性提取器的第二卷积神经网络模型以得到科研差异性特征矩阵，包括：使用所述第二卷积神经网络模型的各层在层的正向传递中分别进行：对输入数据进行卷积处理以得到卷积特征图；对所述卷积特征图进行基于局部特征矩阵的均值池化以得到池化特征图；以及，对所述池化特征图进行非线性激活以得到激活特征图；其中，所述第二卷积神经网络模型的最后一层的输出为所述科研差异性特征矩阵，所述第二卷积神经网络模型的第一层的输入为所述科研进展报告协同输入张量。

在上述科研创新平台控制方法中，融合所述科研一致性特征矩阵和所述科研差异性特征矩阵以得到科研邻接特征矩阵，包括：对所述科研一致性特征矩阵和所述科研差异性特征矩阵进行特征矩阵展开以得到科研一致性特征向量和科研差异性特征向量；计算所述科研一致性特征向量和所述科研差异性特征向量之间的关联-概率密度分布仿射映射因数以得到第一关联-概率密度分布仿射映射因数和第二关联-概率密度分布仿射映射因数；以所述第一关联-概率密度分布仿射映射因数和所述第二关联-概率密度分布仿射映射因数作为权重，分别对所述科研一致性特征矩阵和所述科研差异性特征矩阵进行加权以得到加权后科研一致性特征矩阵和加权后科研差异性特征矩阵；以及，将所述加权后科研一致性特征矩阵和所述加权后科研差异性特征矩阵进行级联以得到所述科研邻接特征矩阵。

在上述科研创新平台控制方法中，对所述科研一致性特征矩阵和所述科研差异性特征矩阵进行特征矩阵展开以得到科研一致性特征向量和科研差异性特征向量，包括：将所述科研一致性特征矩阵和所述科研差异性特征矩阵分别沿着行向量或者列向量进行展开以得到科研一致性特征向量和科研差异性特征向量。

在上述科研创新平台控制方法中，计算所述科研一致性特征向量和所述科研差异性特征向量之间的关联-概率密度分布仿射映射因数以得到第一关联-概率密度分布仿射映射因数和第二关联-概率密度分布仿射映射因数，包括：以如下公式计算所述科研一致性特征向量和所述科研差异性特征向量之间的关联-概率密度分布仿射映射因数以得到第一关联-概率密度分布仿射映射因数和第二关联-概率密度分布仿射映射因数；其中，所述公式为：

其中，V₁和V₂分别表示所述科研一致性特征向量和所述科研差异性特征向量，M为所述科研一致性特征向量和所述科研差异性特征向量之间的逐位置关联得到的关联矩阵，μ和∑是所述科研一致性特征向量和所述科研差异性特征向量构成的高斯密度图的均值向量和协方差矩阵，表示矩阵乘法，exp(·)表示自然指数函数运算，w₁和w₂分别表示所述第一关联-概率密度分布仿射映射因数和所述第二关联-概率密度分布仿射映射因数。

在上述科研创新平台控制方法中，将所述加权后科研一致性特征矩阵和所述加权后科研差异性特征矩阵进行级联以得到所述科研邻接特征矩阵，包括：以如下公式将所述加权后科研一致性特征矩阵和所述加权后科研差异性特征矩阵进行级联以得到所述科研邻接特征矩阵；其中，所述公式为：

X＝Concat[M₁,M₂]

其中，M₁表示所述加权后科研一致性特征矩阵，M₂表示所述加权后科研差异性特征矩阵，Concat[·,·]表示级联函数，X表示所述科研邻接特征矩阵。

在上述科研创新平台控制方法中，将所述科研邻接特征矩阵通过分类器以得到分类结果，所述分类结果用于表示所述科研创新平台的所有主体要素之间的科研信息扩散度是否超过阈值，包括：将所述科研邻接特征矩阵按照行向量或者列向量展开为分类特征向量；将所述分类特征向量输入所述分类器的Softmax分类函数以得到所述分类特征向量归属于各个分类标签的概率值；以及，将最大概率值对应的分类标签确定为所述分类结果。

根据本申请的另一方面，提供了一种科研创新平台控制系统，包括：

报告获取模块，用于获取科研创新平台上所有主体要素的科研进展报告；

科研进展语义分析模块，用于将所述各个主体要素的科研进展报告分别进行分词处理后输入包含词嵌入层的基于转换器的上下文编码器以得到多个科研进展报告语义理解特征向量，并将所述各个主体要素的多个科研进展报告语义理解特征向量进行二维排列以得到多个科研进展报告语义表达特征矩阵；

矩阵聚合模块，用于将所述多个科研进展报告语义表达特征矩阵沿通道维度聚合为科研进展报告协同输入张量；

一致性特征提取模块，用于将所述科研进展报告协同输入张量通过作为一致性提取器的第一卷积神经网络模型以得到科研一致性特征矩阵；

差异性特征提取模块，用于将所述科研进展报告协同输入张量通过作为差异性提取器的第二卷积神经网络模型以得到科研差异性特征矩阵；

融合模块，用于融合所述科研一致性特征矩阵和所述科研差异性特征矩阵以得到科研邻接特征矩阵；以及

扩散度结果生成单元，用于将所述科研邻接特征矩阵通过分类器以得到分类结果，所述分类结果用于表示所述科研创新平台的所有主体要素之间的科研信息扩散度是否超过阈值。

根据本申请的再一方面，提供了一种电子设备，包括：处理器；以及，存储器，在所述存储器中存储有计算机程序指令，所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的科研创新平台控制方法。

根据本申请的又一方面，提供了一种计算机可读介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的科研创新平台控制方法。

与现有技术相比，本申请提供的一种科研创新平台控制方法及其系统，其基于深度学习的人工智能技术，以通过包含词嵌入层的基于转换器的上下文编码器对于科研创新平台上各个主体要素的科研进展报告进行深度语义理解，并根据流形正则的思想来挖掘各个主体要素科研进展报告的语义理解信息中所蕴含的差异性和一致性特征，最后基于此来进行科研创新平台科研信息扩散度的分类判别以促进所述科研创新平台各个主体要素之间科研信息的流动和扩散，进而更好地为各个创新主体提供公共创新服务和产业技术支撑。

附图说明

通过结合附图对本申请实施例进行更详细的描述，本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解，并且构成说明书的一部分，与本申请实施例一起用于解释本申请，并不构成对本申请的限制。在附图中，相同的参考标号通常代表相同部件或步骤。

图1为根据本申请实施例的科研创新平台控制方法的流程图。

图2为根据本申请实施例的科研创新平台控制方法的架构图。

图3为根据本申请实施例的科研创新平台控制方法中将所述各个主体要素的科研进展报告分别进行分词处理后输入包含词嵌入层的基于转换器的上下文编码器以得到多个科研进展报告语义理解特征向量的流程图。

图4为根据本申请实施例的科研创新平台控制方法中融合所述科研一致性特征矩阵和所述科研差异性特征矩阵以得到科研邻接特征矩阵的流程图。

图5为根据本申请实施例的科研创新平台控制系统的框图。

图6为根据本申请实施例的电子设备的框图。

具体实施方式

下面，将参考附图详细地描述根据本申请的示例实施例。显然，所描述的实施例仅仅是本申请的一部分实施例，而不是本申请的全部实施例，应理解，本申请不受这里描述的示例实施例的限制。

申请概述

相应地，由于科研创新平台各个主体要素创新之间资源共享程度依然无法得到保证，因此，在本申请的技术方案中，期待对于所述科研创新平台上各个主体要素的科研进展报告进行深度语义理解，并挖掘各个主体要素科研进展报告的语义理解信息中所蕴含的差异性和一致性特征，并基于此来进行科研创新平台科研信息扩散度的分类判别以促进所述科研创新平台各个主体要素之间科研信息的流动和扩散，进而更好地为各个创新主体提供公共创新服务和产业技术支撑。

近年来，深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。此外，深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域，也展现出了接近甚至超越人类的水平。

深度学习以及神经网络的发展为构建科研创新平台控制方案提供了新的解决思路。

具体地，在本申请的技术方案中，首先，获取科研创新平台上所有主体要素的科研进展报告。

考虑到所述科研进展报告为文本数据，也就是所述科研进展报告并非结构化数据，因此，在本申请的技术方案中，将所述科研创新平台上各个主体要素的科研进展报告分别进行分词处理以避免词序混乱后输入包含词嵌入层的基于转换器的上下文编码器以提取各个主体要素的科研进展报告中所蕴含的高维隐含语义关联特征，从而得到多个科研进展报告语义理解特征向量。其中，所述上下文编码器包括词嵌入层和基于转换器(Transformer)的Bert模型。这里，词嵌入层的作用是将一个词映射为一个词嵌入向量，所述词嵌入层可以基于词袋模型来构建，或者，基于低维语义嵌入模型来构建，例如，Word2Vec等，在此过程中，通过向量化可将所述各个主体要素的科研进展报告中的各个词转化为更便于计算机进行运算的结构化数据，即将所述科研创新平台上各个主体要素的科研进展报告分别进行分词处理以得到多个词嵌入向量的序列。值得注意的是，一个词嵌入向量的序列由一个主体要素的科研进展报告中的各个词转化而来。所述基于转换器的Bert模型的作用为对所述多个词嵌入向量的序列分别进行基于全局的上下文语义编码以得到对应于各个词嵌入向量的序列的多个科研进展报告语义理解特征向量。特别地，通过对所述词嵌入向量的序列进行基于全局的上下文语义编码可提取所述科研进展报告中各个词相对于所述科研进展报告的全局语义特征表示。然后，将所述各个主体要素的多个科研进展报告语义理解特征向量进行二维排列以得到多个科研进展报告语义表达特征矩阵。

继而，将所述多个科研进展报告语义表达特征矩阵沿通道维度聚合为科研进展报告协同输入张量以整合科研创新平台上所有主体要素的科研进展报告所蕴含的高维隐含语义表达特征。

根据流形正则的思想，自适应学习每个科研进展报告语义表达特征矩阵中的权重，自动为每个科研进展报告语义表达特征矩阵的差异信息分配贡献度，再根据自适应权重集成差异信息并融合一致性，获得最终的共识表示有利于提高对于科研创新平台科研信息扩散度的分类精准度。因此，在本申请的技术方案中，首先，将所述科研进展报告协同输入张量通过作为一致性提取器的第一卷积神经网络模型以得到科研一致性特征矩阵，并将所述科研进展报告协同输入张量通过作为差异性提取器的第二卷积神经网络模型以得到科研差异性特征矩阵。这里，所述科研一致性特征矩阵刻画了各个主体要素科研进展报告中的一致性表示信息，而所述科研差异性特征矩阵则刻画了各个主体要素科研进展报告中的差异性表示信息。然后，融合所述科研一致性特征矩阵和所述科研差异性特征矩阵以得到科研邻接特征矩阵，也就是说，所述科研邻接特征矩阵就是将差异性信息与一致性信息进行融合后的共识表示。

在得到所述科研邻接特征矩阵后，将其通过分类器以得到分类结果，所述分类结果用于表示所述科研创新平台的所有主体要素之间的科研信息扩散度是否超过阈值。也就是，在本申请的技术方案中，所述分类器的标签包括科研创新平台的所有主体要素之间的科研信息扩散度超过阈值(第一标签)，以及，科研创新平台的所有主体要素之间的科研信息扩散度没有超过阈值(第二标签)，其中，所述分类器通过软最大值函数来确定所述科研邻接特征矩阵属于哪个分类标签。应可以理解，在本申请的技术方案中，响应于所述分类结果为科研创新平台的所有主体要素之间的科研信息扩散度没有超过阈值，可以生成提示信息，以督促各个主体要素尽快查阅相关内容，以促进所述科研创新平台各个主体要素之间科研信息的流动和扩散，进而更好地为各个创新主体提供公共创新服务和产业技术支撑。

这里，在融合所述科研一致性特征矩阵和所述科研差异性特征矩阵得到所述科研邻接特征矩阵时，由于所述科研一致性特征矩阵和所述科研差异性特征矩阵分别表达科研进展报告语义的一致性和差异性特征，如果能够通过提升所述科研一致性特征矩阵和所述科研差异性特征矩阵在分类器的类概率密度下的关联性来抑制其类概率密度下的差异，则能够提升所述科研邻接特征矩阵的分类结果的准确性。

因此，本申请的申请人首先将所述科研一致性特征矩阵和所述科研差异性特征矩阵展开为科研一致性特征向量，例如记为V₁和科研差异性特征向量，例如记为V₂，再计算所述科研一致性特征向量V₁和所述科研差异性特征向量V₂的关联-概率密度分布仿射映射因数，表示为：

M为所述所述科研一致性特征向量V₁和所述科研差异性特征向量V₂之间的逐位置关联得到的关联矩阵，μ和∑是所述科研一致性特征向量V₁和所述科研差异性特征向量V₂构成的高斯密度图的均值向量和协方差矩阵。

也就是，通过构造所述科研一致性特征向量V₁和所述科研差异性特征向量V₂之间的关联特征空间和由高斯概率密度表示的概率密度空间，可以通过将所述科研一致性特征向量V₁和所述科研差异性特征向量V₂分别映射到关联特征空间和概率密度空间内的仿射单应性子空间中，来提取特征表示在关联特征域和概率密度域内的符合仿射单应性的表示，通过以所述关联-概率密度分布仿射映射因数值w₁和w₂分别对所述科研一致性特征矩阵和所述科研差异性特征矩阵进行加权，就可以提升所述科研一致性特征矩阵和所述科研差异性特征矩阵在进行关联表示的情况下在类概率密度分布上的一致性，从而提升融合得到的所述科研邻接特征矩阵的分类结果的准确性。

在介绍了本申请的基本原理之后，下面将参考附图来具体介绍本申请的各种非限制性实施例。

示例性方法

图1为根据本申请实施例的科研创新平台控制方法的流程图。如图1所示，根据本申请实施例的科研创新平台控制方法，包括：S110，获取科研创新平台上所有主体要素的科研进展报告；S120，将所述各个主体要素的科研进展报告分别进行分词处理后输入包含词嵌入层的基于转换器的上下文编码器以得到多个科研进展报告语义理解特征向量，并将所述各个主体要素的多个科研进展报告语义理解特征向量进行二维排列以得到多个科研进展报告语义表达特征矩阵；S130，将所述多个科研进展报告语义表达特征矩阵沿通道维度聚合为科研进展报告协同输入张量；S140，将所述科研进展报告协同输入张量通过作为一致性提取器的第一卷积神经网络模型以得到科研一致性特征矩阵；S150，将所述科研进展报告协同输入张量通过作为差异性提取器的第二卷积神经网络模型以得到科研差异性特征矩阵；S160，融合所述科研一致性特征矩阵和所述科研差异性特征矩阵以得到科研邻接特征矩阵；以及，S170，将所述科研邻接特征矩阵通过分类器以得到分类结果，所述分类结果用于表示所述科研创新平台的所有主体要素之间的科研信息扩散度是否超过阈值。

图2为根据本申请实施例的科研创新平台控制方法的架构图。如图2所示，在该架构中，首先，获取科研创新平台上所有主体要素的科研进展报告；接着，将所述各个主体要素的科研进展报告分别进行分词处理后输入包含词嵌入层的基于转换器的上下文编码器以得到多个科研进展报告语义理解特征向量，并将所述各个主体要素的多个科研进展报告语义理解特征向量进行二维排列以得到多个科研进展报告语义表达特征矩阵；然后，将所述多个科研进展报告语义表达特征矩阵沿通道维度聚合为科研进展报告协同输入张量；继而，将所述科研进展报告协同输入张量通过作为一致性提取器的第一卷积神经网络模型以得到科研一致性特征矩阵；同时，将所述科研进展报告协同输入张量通过作为差异性提取器的第二卷积神经网络模型以得到科研差异性特征矩阵；随后，融合所述科研一致性特征矩阵和所述科研差异性特征矩阵以得到科研邻接特征矩阵；最终，将所述科研邻接特征矩阵通过分类器以得到分类结果，所述分类结果用于表示所述科研创新平台的所有主体要素之间的科研信息扩散度是否超过阈值。

在步骤S110中，获取科研创新平台上所有主体要素的科研进展报告。

在步骤S120中，将所述各个主体要素的科研进展报告分别进行分词处理后输入包含词嵌入层的基于转换器的上下文编码器以得到多个科研进展报告语义理解特征向量，并将所述各个主体要素的多个科研进展报告语义理解特征向量进行二维排列以得到多个科研进展报告语义表达特征矩阵。考虑到所述科研进展报告为文本数据，也就是所述科研进展报告并非结构化数据，因此，在本申请的技术方案中，将所述科研创新平台上各个主体要素的科研进展报告分别进行分词处理以避免词序混乱后输入包含词嵌入层的基于转换器的上下文编码器以提取各个主体要素的科研进展报告中所蕴含的高维隐含语义关联特征，从而得到多个科研进展报告语义理解特征向量。其中，所述上下文编码器包括词嵌入层和基于转换器(Transformer)的Bert模型。这里，词嵌入层的作用是将一个词映射为一个词嵌入向量，所述词嵌入层可以基于词袋模型来构建，或者，基于低维语义嵌入模型来构建，例如，Word2Vec等，在此过程中，通过向量化可将所述各个主体要素的科研进展报告中的各个词转化为更便于计算机进行运算的结构化数据，即将所述科研创新平台上各个主体要素的科研进展报告分别进行分词处理以得到多个词嵌入向量的序列。值得注意的是，一个词嵌入向量的序列由一个主体要素的科研进展报告中的各个词转化而来。所述基于转换器的Bert模型的作用为对所述多个词嵌入向量的序列分别进行基于全局的上下文语义编码以得到对应于各个词嵌入向量的序列的多个科研进展报告语义理解特征向量。特别地，通过对所述词嵌入向量的序列进行基于全局的上下文语义编码可提取所述科研进展报告中各个词相对于所述科研进展报告的全局语义特征表示。然后，将所述各个主体要素的多个科研进展报告语义理解特征向量进行二维排列以得到多个科研进展报告语义表达特征矩阵。

图3为根据本申请实施例的科研创新平台控制方法中将所述各个主体要素的科研进展报告分别进行分词处理后输入包含词嵌入层的基于转换器的上下文编码器以得到多个科研进展报告语义理解特征向量的流程图。如图3所示，将所述各个主体要素的科研进展报告分别进行分词处理后输入包含词嵌入层的基于转换器的上下文编码器以得到多个科研进展报告语义理解特征向量，包括步骤：S210，对所述各个主体要素的科研进展报告分别进行分词处理以获得多个科研进展词；S220，将所述多个科研进展词通过词嵌入层以将所述多个科研进展词中各个科研进展词转化为科研进展词嵌入向量以得到科研进展词嵌入向量的序列，其中，所述词嵌入层使用可学习的嵌入矩阵对所述各个科研进展词进行嵌入编码；S230，将所科研进展词嵌入向量的序列排列为输入向量；S240，将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量；S250，计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵；S260，对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵；S270，将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵；以及，S280，将所述自注意力特征矩阵与以所述科研进展词嵌入向量的序列中各个科研进展词嵌入向量作为值向量分别进行相乘以得到所述多个科研进展报告语义理解特征向量。

在步骤S130中，将所述多个科研进展报告语义表达特征矩阵沿通道维度聚合为科研进展报告协同输入张量。也就是，整合科研创新平台上所有主体要素的科研进展报告所蕴含的高维隐含语义表达特征。

在步骤S140和步骤S150中，将所述科研进展报告协同输入张量通过作为一致性提取器的第一卷积神经网络模型以得到科研一致性特征矩阵，并将所述科研进展报告协同输入张量通过作为差异性提取器的第二卷积神经网络模型以得到科研差异性特征矩阵。根据流形正则的思想，自适应学习每个科研进展报告语义表达特征矩阵中的权重，自动为每个科研进展报告语义表达特征矩阵的差异信息分配贡献度，再根据自适应权重集成差异信息并融合一致性，获得最终的共识表示有利于提高对于科研创新平台科研信息扩散度的分类精准度。因此，在本申请的技术方案中，首先，将所述科研进展报告协同输入张量通过作为一致性提取器的第一卷积神经网络模型以得到科研一致性特征矩阵，并将所述科研进展报告协同输入张量通过作为差异性提取器的第二卷积神经网络模型以得到科研差异性特征矩阵。这里，所述科研一致性特征矩阵刻画了各个主体要素科研进展报告中的一致性表示信息，而所述科研差异性特征矩阵则刻画了各个主体要素科研进展报告中的差异性表示信息。

具体地，在本申请实施例中，将所述科研进展报告协同输入张量通过作为一致性提取器的第一卷积神经网络模型以得到科研一致性特征矩阵，包括：使用所述第一卷积神经网络模型的各层在层的正向传递中分别进行：对输入数据进行卷积处理以得到卷积特征图；对所述卷积特征图进行基于局部特征矩阵的均值池化以得到池化特征图；以及，对所述池化特征图进行非线性激活以得到激活特征图；其中，所述第一卷积神经网络模型的最后一层的输出为所述科研一致性特征矩阵，所述第一卷积神经网络模型的第一层的输入为所述科研进展报告协同输入张量。

具体地，在本申请实施例中，将所述科研进展报告协同输入张量通过作为差异性提取器的第二卷积神经网络模型以得到科研差异性特征矩阵，包括：使用所述第二卷积神经网络模型的各层在层的正向传递中分别进行：对输入数据进行卷积处理以得到卷积特征图；对所述卷积特征图进行基于局部特征矩阵的均值池化以得到池化特征图；以及，对所述池化特征图进行非线性激活以得到激活特征图；其中，所述第二卷积神经网络模型的最后一层的输出为所述科研差异性特征矩阵，所述第二卷积神经网络模型的第一层的输入为所述科研进展报告协同输入张量。

在步骤S160中，融合所述科研一致性特征矩阵和所述科研差异性特征矩阵以得到科研邻接特征矩阵。也就是说，所述科研邻接特征矩阵就是将差异性信息与一致性信息进行融合后的共识表示。

图4为根据本申请实施例的科研创新平台控制方法中融合所述科研一致性特征矩阵和所述科研差异性特征矩阵以得到科研邻接特征矩阵的流程图。如图4所示，融合所述科研一致性特征矩阵和所述科研差异性特征矩阵以得到科研邻接特征矩阵，包括步骤：S310，对所述科研一致性特征矩阵和所述科研差异性特征矩阵进行特征矩阵展开以得到科研一致性特征向量和科研差异性特征向量；S320，计算所述科研一致性特征向量和所述科研差异性特征向量之间的关联-概率密度分布仿射映射因数以得到第一关联-概率密度分布仿射映射因数和第二关联-概率密度分布仿射映射因数；S330，以所述第一关联-概率密度分布仿射映射因数和所述第二关联-概率密度分布仿射映射因数作为权重，分别对所述科研一致性特征矩阵和所述科研差异性特征矩阵进行加权以得到加权后科研一致性特征矩阵和加权后科研差异性特征矩阵；以及，S340，将所述加权后科研一致性特征矩阵和所述加权后科研差异性特征矩阵进行级联以得到所述科研邻接特征矩阵。

因此，本申请的申请人首先将所述科研一致性特征矩阵和所述科研差异性特征矩阵展开为科研一致性特征向量，例如记为V₁和科研差异性特征向量，例如记为V₂。具体地，在本申请实施例中，将所述科研一致性特征矩阵和所述科研差异性特征矩阵分别沿着行向量或者列向量进行展开以得到科研一致性特征向量和科研差异性特征向量。

再计算所述科研一致性特征向量V₁和所述科研差异性特征向量V₂的关联-概率密度分布仿射映射因数，表示为：

具体地，在本申请实施例中，将所述加权后科研一致性特征矩阵和所述加权后科研差异性特征矩阵进行级联以得到所述科研邻接特征矩阵，包括：以如下公式将所述加权后科研一致性特征矩阵和所述加权后科研差异性特征矩阵进行级联以得到所述科研邻接特征矩阵；其中，所述公式为：

X＝C0ncat[M₁,M₂]

其中，M₁表示所述加权后科研一致性特征矩阵，M₂表示所述加权后科研差异性特征矩阵，Coccat[·,·]表示级联函数，X表示所述科研邻接特征矩阵。

在步骤S170中，将所述科研邻接特征矩阵通过分类器以得到分类结果，所述分类结果用于表示所述科研创新平台的所有主体要素之间的科研信息扩散度是否超过阈值。也就是，在本申请的技术方案中，所述分类器的标签包括科研创新平台的所有主体要素之间的科研信息扩散度超过阈值(第一标签)，以及，科研创新平台的所有主体要素之间的科研信息扩散度没有超过阈值(第二标签)，其中，所述分类器通过软最大值函数来确定所述科研邻接特征矩阵属于哪个分类标签。这里，所述阈值为人为预先设定的值，但值得注意的是，在模型训练过程当中，计算机模型输出的是特征在两个分类标签(第一标签和第二标签)下的概率，即p1和p2之和为一。在分类的过程中，所述科研创新平台的所有主体要素之间的科研信息扩散度是否超过阈值的分类结果实际上用到的是标签的自然概率分布的物理意义。

应可以理解，在本申请的技术方案中，响应于所述分类结果为科研创新平台的所有主体要素之间的科研信息扩散度没有超过阈值，可以生成提示信息，以督促各个主体要素尽快查阅相关内容，以促进所述科研创新平台各个主体要素之间科研信息的流动和扩散，进而更好地为各个创新主体提供公共创新服务和产业技术支撑。

具体地，在本申请实施例中，将所述科研邻接特征矩阵通过分类器以得到分类结果，所述分类结果用于表示所述科研创新平台的所有主体要素之间的科研信息扩散度是否超过阈值的编码过程，包括：首先，将所述科研邻接特征矩阵按照行向量或者列向量展开为分类特征向量；接着，将所述分类特征向量输入所述分类器的Softmax分类函数以得到所述分类特征向量归属于各个分类标签的概率值；然后，将最大概率值对应的分类标签确定为所述分类结果。

综上，基于本申请实施例的科研创新平台控制方法被阐明，其基于深度学习的人工智能技术，以通过包含词嵌入层的基于转换器的上下文编码器对于科研创新平台上各个主体要素的科研进展报告进行深度语义理解，并根据流形正则的思想来挖掘各个主体要素科研进展报告的语义理解信息中所蕴含的差异性和一致性特征，最后基于此来进行科研创新平台科研信息扩散度的分类判别以促进所述科研创新平台各个主体要素之间科研信息的流动和扩散，进而更好地为各个创新主体提供公共创新服务和产业技术支撑。

示例性系统

图5为根据本申请实施例的科研创新平台控制系统的框图。如图5所示，根据本申请实施例的科研创新平台控制系统100，包括：报告获取模块110，用于获取科研创新平台上所有主体要素的科研进展报告；科研进展语义分析模块120，用于将所述各个主体要素的科研进展报告分别进行分词处理后输入包含词嵌入层的基于转换器的上下文编码器以得到多个科研进展报告语义理解特征向量，并将所述各个主体要素的多个科研进展报告语义理解特征向量进行二维排列以得到多个科研进展报告语义表达特征矩阵；矩阵聚合模块130，用于将所述多个科研进展报告语义表达特征矩阵沿通道维度聚合为科研进展报告协同输入张量；一致性特征提取模块140，用于将所述科研进展报告协同输入张量通过作为一致性提取器的第一卷积神经网络模型以得到科研一致性特征矩阵；差异性特征提取模块150，用于将所述科研进展报告协同输入张量通过作为差异性提取器的第二卷积神经网络模型以得到科研差异性特征矩阵；融合模块160，用于融合所述科研一致性特征矩阵和所述科研差异性特征矩阵以得到科研邻接特征矩阵；以及，扩散度结果生成单元170，用于将所述科研邻接特征矩阵通过分类器以得到分类结果，所述分类结果用于表示所述科研创新平台的所有主体要素之间的科研信息扩散度是否超过阈值。

这里，本领域技术人员可以理解，上述科研创新平台控制系统100中的各个单元和模块的具体功能和操作已经在上面参考图1到图4的科研创新平台控制方法的描述中得到了详细介绍，并因此，将省略其重复描述。

如上所述，根据本申请实施例的科研创新平台控制系统100可以实现在各种终端设备中，例如适用于科研创新平台控制的服务器等。在一个示例中，根据本申请实施例的科研创新平台控制系统100可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如，该科研创新平台控制系统100可以是该终端设备的操作系统中的一个软件模块，或者可以是针对于该终端设备所开发的一个应用程序；当然，该科研创新平台控制系统100同样可以是该终端设备的众多硬件模块之一。

替换地，在另一示例中，该科研创新平台控制系统100与该终端设备也可以是分立的设备，并且该科研创新平台控制系统100可以通过有线和/或无线网络连接到该终端设备，并且按照约定的数据格式来传输交互信息。

示例性电子设备

下面，参考图6来描述根据本申请实施例的电子设备。图6为根据本申请实施例的电子设备的框图。如图6所示，电子设备10包括一个或多个处理器11和存储器12。

处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元，并且可以控制电子设备10中的其他组件以执行期望的功能。

存储器12可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器11可以运行所述程序指令，以实现上文所述的本申请的各个实施例的科研创新平台控制方法中的功能以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如科研进展报告等各种内容。

在一个示例中，电子设备10还可以包括：输入装置13和输出装置14，这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。

该输入装置13可以包括例如键盘、鼠标等等。

该输出装置14可以向外部输出各种信息，包括分类结果等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然，为了简化，图6中仅示出了该电子设备10中与本申请有关的组件中的一些，省略了诸如总线、输入/输出接口等等的组件。除此之外，根据具体应用情况，电子设备10还可以包括任何其他适当的组件。

示例性计算机程序产品和计算机可读存储介质

除了上述方法和设备以外，本申请的实施例还可以是计算机程序产品，其包括计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的科研创新平台控制方法中的功能中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码，所述程序设计语言包括面向对象的程序设计语言，诸如Java、C++等，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外，本申请的实施例还可以是计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的科研创新平台控制方法中的功能中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本申请的基本原理，但是，需要指出的是，在本申请中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本申请为必须采用上述具体的细节来实现。

本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

还需要指出的是，在本申请的装置、设备和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此，本申请不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

1.一种科研创新平台控制方法，其特征在于，包括：

获取科研创新平台上所有主体要素的科研进展报告；

将各个主体要素的科研进展报告分别进行分词处理后输入包含词嵌入层的基于转换器的上下文编码器以得到多个科研进展报告语义理解特征向量，并将所述各个主体要素的多个科研进展报告语义理解特征向量进行二维排列以得到多个科研进展报告语义表达特征矩阵；

将所述科研邻接特征矩阵通过分类器以得到分类结果，所述分类结果用于表示所述科研创新平台的所有主体要素之间的科研信息扩散度是否超过阈值；

其中，融合所述科研一致性特征矩阵和所述科研差异性特征矩阵以得到科研邻接特征矩阵，包括：

对所述科研一致性特征矩阵和所述科研差异性特征矩阵进行特征矩阵展开以得到科研一致性特征向量和科研差异性特征向量；

计算所述科研一致性特征向量和所述科研差异性特征向量之间的关联-概率密度分布仿射映射因数以得到第一关联-概率密度分布仿射映射因数和第二关联-概率密度分布仿射映射因数；

以所述第一关联-概率密度分布仿射映射因数和所述第二关联-概率密度分布仿射映射因数作为权重，分别对所述科研一致性特征矩阵和所述科研差异性特征矩阵进行加权以得到加权后科研一致性特征矩阵和加权后科研差异性特征矩阵；以及

将所述加权后科研一致性特征矩阵和所述加权后科研差异性特征矩阵进行级联以得到所述科研邻接特征矩阵；

其中，对所述科研一致性特征矩阵和所述科研差异性特征矩阵进行特征矩阵展开以得到科研一致性特征向量和科研差异性特征向量，包括：

将所述科研一致性特征矩阵和所述科研差异性特征矩阵分别沿着行向量或者列向量进行展开以得到科研一致性特征向量和科研差异性特征向量；

其中，计算所述科研一致性特征向量和所述科研差异性特征向量之间的关联-概率密度分布仿射映射因数以得到第一关联-概率密度分布仿射映射因数和第二关联-概率密度分布仿射映射因数，包括：

以如下公式计算所述科研一致性特征向量和所述科研差异性特征向量之间的关联-概率密度分布仿射映射因数以得到第一关联-概率密度分布仿射映射因数和第二关联-概率密度分布仿射映射因数；

其中，所述公式为：

其中，V₁和V₂分别表示所述科研一致性特征向量和所述科研差异性特征向量，M为所述科研一致性特征向量和所述科研差异性特征向量之间的逐位置关联得到的关联矩阵，μ和∑是所述科研一致性特征向量和所述科研差异性特征向量构成的高斯密度图的均值向量和协方差矩阵，表示矩阵乘法，exp(·)表示自然指数函数运算，w₁和w₂分别表示所述第一关联-概率密度分布仿射映射因数和所述第二关联-概率密度分布仿射映射因数；

其中，将所述加权后科研一致性特征矩阵和所述加权后科研差异性特征矩阵进行级联以得到所述科研邻接特征矩阵，包括：

以如下公式将所述加权后科研一致性特征矩阵和所述加权后科研差异性特征矩阵进行级联以得到所述科研邻接特征矩阵；

其中，所述公式为：

X＝Concat[M₁，M₂]

其中，M₁表示所述加权后科研一致性特征矩阵，M₂表示所述加权后科研差异性特征矩阵，Concat[·，·]表示级联函数，X表示所述科研邻接特征矩阵；

其中，将所述科研邻接特征矩阵通过分类器以得到分类结果，所述分类结果用于表示所述科研创新平台的所有主体要素之间的科研信息扩散度是否超过阈值，包括：

将所述科研邻接特征矩阵按照行向量或者列向量展开为分类特征向量；

将所述分类特征向量输入所述分类器的Softmax分类函数以得到所述分类特征向量归属于各个分类标签的概率值；以及

将最大概率值对应的分类标签确定为所述分类结果。

2.根据权利要求1所述的科研创新平台控制方法，其特征在于，将所述各个主体要素的科研进展报告分别进行分词处理后输入包含词嵌入层的基于转换器的上下文编码器以得到多个科研进展报告语义理解特征向量，包括：

对所述各个主体要素的科研进展报告分别进行分词处理以获得多个科研进展词；

将所述多个科研进展词通过词嵌入层以将所述多个科研进展词中各个科研进展词转化为科研进展词嵌入向量以得到科研进展词嵌入向量的序列，其中，所述词嵌入层使用可学习的嵌入矩阵对所述各个科研进展词进行嵌入编码；

将所科研进展词嵌入向量的序列排列为输入向量；

将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量；

计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵；

对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵；

将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵；以及

将所述自注意力特征矩阵与以所述科研进展词嵌入向量的序列中各个科研进展词嵌入向量作为值向量分别进行相乘以得到所述多个科研进展报告语义理解特征向量。

3.根据权利要求2所述的科研创新平台控制方法，其特征在于，将所述科研进展报告协同输入张量通过作为一致性提取器的第一卷积神经网络模型以得到科研一致性特征矩阵，包括：

使用所述第一卷积神经网络模型的各层在层的正向传递中分别进行：

对输入数据进行卷积处理以得到卷积特征图；

对所述卷积特征图进行基于局部特征矩阵的均值池化以得到池化特征图；以及

对所述池化特征图进行非线性激活以得到激活特征图；

其中，所述第一卷积神经网络模型的最后一层的输出为所述科研一致性特征矩阵，所述第一卷积神经网络模型的第一层的输入为所述科研进展报告协同输入张量。

4.根据权利要求3所述的科研创新平台控制方法，其特征在于，将所述科研进展报告协同输入张量通过作为差异性提取器的第二卷积神经网络模型以得到科研差异性特征矩阵，包括：

使用所述第二卷积神经网络模型的各层在层的正向传递中分别进行：

对输入数据进行卷积处理以得到卷积特征图；

对所述池化特征图进行非线性激活以得到激活特征图；

其中，所述第二卷积神经网络模型的最后一层的输出为所述科研差异性特征矩阵，所述第二卷积神经网络模型的第一层的输入为所述科研进展报告协同输入张量。

5.一种科研创新平台控制系统，其特征在于，包括：

科研进展语义分析模块，用于将各个主体要素的科研进展报告分别进行分词处理后输入包含词嵌入层的基于转换器的上下文编码器以得到多个科研进展报告语义理解特征向量，并将所述各个主体要素的多个科研进展报告语义理解特征向量进行二维排列以得到多个科研进展报告语义表达特征矩阵；

扩散度结果生成单元，用于将所述科研邻接特征矩阵通过分类器以得到分类结果，所述分类结果用于表示所述科研创新平台的所有主体要素之间的科研信息扩散度是否超过阈值；

其中，所述融合模块，包括：

其中，所述公式为：

X＝Concat[M₁，M₂]

其中，所述扩散度结果生成单元，包括：

将最大概率值对应的分类标签确定为所述分类结果。