CN115827856B - 一种基于计算机的军工领域消息的传递方法 - Google Patents

一种基于计算机的军工领域消息的传递方法 Download PDF

Info

Publication number
CN115827856B
CN115827856B CN202210885294.5A CN202210885294A CN115827856B CN 115827856 B CN115827856 B CN 115827856B CN 202210885294 A CN202210885294 A CN 202210885294A CN 115827856 B CN115827856 B CN 115827856B
Authority
CN
China
Prior art keywords
paragraph
semantic feature
semantic
message
paragraphs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210885294.5A
Other languages
English (en)
Other versions
CN115827856A (zh
Inventor
严真旭
张春宇
田林涛
陆平
张峰
张斌
廖大中
赵亿锌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Defense Science And Technology Industry Bureau Military Project Review Center
China Academy of Information and Communications Technology CAICT
Original Assignee
National Defense Science And Technology Industry Bureau Military Project Review Center
China Academy of Information and Communications Technology CAICT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Defense Science And Technology Industry Bureau Military Project Review Center, China Academy of Information and Communications Technology CAICT filed Critical National Defense Science And Technology Industry Bureau Military Project Review Center
Priority to CN202210885294.5A priority Critical patent/CN115827856B/zh
Publication of CN115827856A publication Critical patent/CN115827856A/zh
Application granted granted Critical
Publication of CN115827856B publication Critical patent/CN115827856B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)

Abstract

公开了一种基于计算机的军工领域消息的传递方法,其首先对待传递的军工领域消息的各个段落进行语义编码,再将各个段落的语义特征表示通过双向长短期记忆神经网络以进行段落间高维语义编码,考虑到进行段落间语义提取会忽略了不同段落的词之间的高维语义关联而导致语义识别的精准度的下降,因此,使用文本卷积神经网络来提取不同段落的词之间的高维语义关联特征,然后对上述语义特征向量进行融合以得到分类特征矩阵,并通过分类器得到用于表示待传递的军工领域消息的主题标签的分类结果,最终基于分类结果生成消息传递指示,这样,避免因误传或者错传而导致消息的泄露。

Description

一种基于计算机的军工领域消息的传递方法
技术领域
本申请涉及安全保密技术领域,且更为具体地,涉及一种基于计算机的军工领域消息的传递方法及其传递系统。
背景技术
计算机的出现和通信网络的发展为消息的传递提供了技术支持。相较于常规的消息,军用领域消息具有其特殊性。具体地,在利用计算机进行军工领域消息传递时,考虑到军工领域消息具有一定的机密性,工作人员在数据传输时如果不对待传输消息进行分析与判断则可能会误传或者错传而导致消息的泄露。
因此,期待一种优化的用于军工领域消息的传递方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于计算机的军工领域消息的传递方法及其传递系统,其首先对待传递的军工领域消息的各个段落进行语义编码,再将各个段落的语义特征表示通过双向长短期记忆神经网络以进行段落间高维语义编码,考虑到进行段落间语义提取会忽略了不同段落的词之间的高维语义关联而导致语义识别的精准度的下降,因此,使用文本卷积神经网络来提取不同段落的词之间的高维语义关联特征,然后对上述语义特征向量进行融合以得到分类特征矩阵,并通过分类器得到用于表示待传递的军工领域消息的主题标签的分类结果,最终基于分类结果生成消息传递指示,这样,避免因误传或者错传而导致消息的泄露。
根据本申请的一个方面,提供了一种基于计算机的军工领域消息的传递方法,其包括:获取待传递的军工领域消息;将所述待传递的军工领域消息按照段落进行划分以得到多个段落;将所述多个段落分别通过包含嵌入层的上下文编码器以得到多个段落语义特征向量;将所述多个段落语义特征向量进行二维排列后通过第一卷积神经网络以得到第一语义特征向量;将所述多个段落语义特征向量进行一维排列后通过双向长短期记忆神经网络模型以得到第二语义特征向量;对所述第一语义特征向量和所述第二语义特征向量进行特征向量关联式融合以得到分类特征矩阵;将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果为待传递的军工领域消息的主题标签;以及基于所述分类结果,生成消息传递指示。
根据本申请的另一方面,提供了一种基于计算机的军工领域消息的传递系统,其包括:传递消息获取单元,用于获取待传递的军工领域消息;段落获取单元,用于将所述待传递的军工领域消息按照段落进行划分以得到多个段落;段落语义特征向量获取单元,用于将所述多个段落分别通过包含嵌入层的上下文编码器以得到多个段落语义特征向量;第一语义特征向量获取单元,用于将所述多个段落语义特征向量进行二维排列后通过第一卷积神经网络以得到第一语义特征向量;第二语义特征向量获取单元,用于将所述多个段落语义特征向量进行一维排列后通过双向长短期记忆神经网络模型以得到第二语义特征向量;分类特征矩阵获取单元,用于对所述第一语义特征向量和所述第二语义特征向量进行特征向量关联式融合以得到分类特征矩阵;分类单元,用于将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果为待传递的军工领域消息的主题标签;以及指示生成单元,基于所述分类结果,生成消息传递指示。
根据本申请的再一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的基于计算机的军工领域消息的传递方法。
根据本申请的又一方面,提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的基于计算机的军工领域消息的传递方法。
与现有技术相比,本申请提供的一种基于计算机的军工领域消息的传递方法及其传递系统,其首先对待传递的军工领域消息的各个段落进行语义编码,再将各个段落的语义特征表示通过双向长短期记忆神经网络以进行段落间高维语义编码,考虑到进行段落间语义提取会忽略了不同段落的词之间的高维语义关联而导致语义识别的精准度的下降,因此,使用文本卷积神经网络来提取不同段落的词之间的高维语义关联特征,然后对上述语义特征向量进行融合以得到分类特征矩阵,并通过分类器得到用于表示待传递的军工领域消息的主题标签的分类结果,最终基于分类结果生成消息传递指示,这样,避免因误传或者错传而导致消息的泄露。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1图示了根据本申请实施例的基于计算机的军工领域消息的传递方法的流程图。
图2图示了根据本申请实施例的基于计算机的军工领域消息的传递方法的系统架构的示意图。
图3图示了根据本申请实施例的基于计算机的军工领域消息的传递方法中,将所述多个段落分别通过包含嵌入层的上下文编码器以得到多个段落语义特征向量的流程图。
图4图示了根据本申请实施例的基于计算机的军工领域消息的传递方法中,对所述第一语义特征向量和所述第二语义特征向量进行特征向量关联式融合以得到分类特征矩阵的流程图。
图5图示了根据本申请实施例的基于计算机的军工领域消息的传递系统的框图示意图。
图6图示了根据本申请实施例的基于计算机的军工领域消息的传递系统中段落语义特征向量获取单元的框图。
图7图示了根据本申请实施例的电子设备的框图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
场景概述
如上所述,计算机的出现和通信网络的发展为消息的传递提供了技术支持。相较于常规的消息,军用领域消息具有其特殊性。具体地,在利用计算机进行军工领域消息传递时,考虑到军工领域消息具有一定的机密性,工作人员在数据传输时如果不对待传输消息进行分析与判断则可能会误传或者错传而导致消息的泄露。
因此,期待一种优化的用于军工领域消息的传递方案。
深度学习以及神经网络的发展(尤其是机器视觉技术的发展),为用于军工领域消息传递提供的解决思路和方案。
具体来说,对待传输的军工领域消息进行分析与判断以确定其是否可被传递,这本质上是一个基于文本的主题标注问题,可通过自然语言处理模型来实现。
针对上述技术问题,在本申请的技术方案中,首先对待传递的军工领域消息进行数据清洗以去除所述待传递的军工领域消息中的非文本部分,例如,视频、表情包、音频等。然后,对清洗后的军工领域消息进行按段落划分以得到多个段落。
接着,使用自然语言处理模型对各个所述段落进行上下文语义编码。特别地,在本申请的技术方案中,采用基于转换器的自然语言处理模型对各个所述段落进行上下文语义编码。本领域普通技术人员应知晓,相较于传统的RNN模型,基于转换器的自然语言处理模型能提升段落中各个词的上下文语义依赖的长度。
特别地,在本申请的技术方案中,本申请发明人采用包含嵌入层的上下文编码器对各个所述段落进行基于全局的上下文语义编码。具体地,所述上下文编码器的编码过程,包括首先对所述多个段落中的各个段落进行分词处理以得到对应于各个所述段落的词序列。然后,使用所述上下文编码器的嵌入层将各个所述段落的词序列中的各个词分别转化为词嵌入向量以得到对应于各个所述段落的词嵌入向量的序列。接着,将所述上下文编码器的基于转换器的Bert模型对各个所述段落的词嵌入向量的序列进行上下文语义编码以得到对应于各个所述段落的多个词特征向量。最终,将各个所述段落的多个词特征向量进行级联以得到对应于各个所述段落的段落语义特征向量。
为了提取各个段落的段落语义特征向量之间的关联,即,各个段落的语义表达在高维特征空间之间的关联,将所述多个段落语义特征向量进行一维排列以得到段落语义特征向量的序列,然后使用双向长短期记忆神经网络模型对所述段落语义特征向量的序列进行语义编码以得到段落间语义特征向量(为了便于说明,在本申请实施例中,定义为第二语义特征向量)。应可以理解,所述段落间语义特征向量是以段落为粒度的,也就是,所述段落间语义特征向量忽略了不同段落的词之间的高维语义关联而导致语义识别的精准度的下降。
为此,在本申请的技术方案中,本申请发明人进一步引入文本卷积神经网络来提取所述待传递的军工领域消息中不同段落的词之间的高维语义关联。具体地,首先将所述多个段落语义特征向量二维排列为段落语义特征矩阵,其中,所述段落语义特征矩阵中各个行向量为所述段落语义特征向量。接着,使用卷积神经网络模型对所述段落语义特征矩阵进行显式空间编码以提取所述段落语义特征矩阵的高维局部特征,即,不同段落的词之间的高维语义关联的隐含表达,以得到第一语义特征向量。应可以理解,所述第一语义特征向量是以词为粒度的。
进一步地,融合所述第一语义特征向量和所述第二语义特征向量就可以对所述待传递的军工领域消息进行主题分类。特别地,在融合所述第一语义特征向量与所述第二语义特征向量时,需要保证所述第一语义特征向量与所述第二语义特征向量的尺度一致。但是,由于所述第一语义特征向量是所述多个段落语义特征向量进行二维排列后通过使用基于过滤器的第一卷积神经网络得到的,而所述第二语义特征向量是所述多个段落语义特征向量进行一维排列后通过双向长短期记忆神经模型得到的,其在特征分布的维度上会具有差异。
因此,在对第一语义特征向量
Figure 719462DEST_PATH_IMAGE001
和第二语义特征向量/>
Figure 657331DEST_PATH_IMAGE002
进行融合时,进行基于维度迁移确定性的特征向量关联式融合,表示为:
Figure 748784DEST_PATH_IMAGE003
Figure 645064DEST_PATH_IMAGE004
表示矩阵的Frobenius范数,/>
Figure 445968DEST_PATH_IMAGE005
和/>
Figure 921949DEST_PATH_IMAGE006
均为列向量。
该基于维度迁移确定性的特征向量关联式融合对于特征向量进行关联特征的相对位置嵌入,并进一步以关联矩阵的Frobenius范数进行低秩约束,这能够在特征向量向关联矩阵的维度迁移时,在特征向量所表达的高维特征的各自不一致的维度上保留其对于关联特征的远程依赖性,从而使得所获得的分类矩阵
Figure 867908DEST_PATH_IMAGE007
在维度差异的基础上仍然在一定程度上具有与第一语义特征向量/>
Figure 669511DEST_PATH_IMAGE008
和第二语义特征向量/>
Figure 700921DEST_PATH_IMAGE009
的概率分布一致性,从而提升了分类矩阵/>
Figure 514681DEST_PATH_IMAGE010
对于第一语义特征向量/>
Figure 846305DEST_PATH_IMAGE011
和第二语义特征向量/>
Figure 84388DEST_PATH_IMAGE012
两者的联合表达效果。这样,提高对所述待传递的军工领域消息的主题标注的准确性。
进一步地,在得到所述军工领域消息的主题后,可基于所述主体生成消息传递提示,例如,当所述待传递的军工领域消息的主题标签为包含敏感消息,生成敏感消息提示,对此,并不为本申请所局限。
基于此,本申请提供了一种基于计算机的军工领域消息的传递方法,其包括:获取待传递的军工领域消息;将所述待传递的军工领域消息按照段落进行划分以得到多个段落;将所述多个段落分别通过包含嵌入层的上下文编码器以得到多个段落语义特征向量;将所述多个段落语义特征向量进行二维排列后通过第一卷积神经网络以得到第一语义特征向量;将所述多个段落语义特征向量进行一维排列后通过双向长短期记忆神经网络模型以得到第二语义特征向量;对所述第一语义特征向量和所述第二语义特征向量进行特征向量关联式融合以得到分类特征矩阵;将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果为待传递的军工领域消息的主题标签;以及,基于所述分类结果,生成消息传递指示。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
示例性方法
图1图示了根据本申请实施例的基于计算机的军工领域消息的传递方法的流程图。如图1所示,根据本申请实施例的基于计算机的军工领域消息的传递方法,包括:S110,获取待传递的军工领域消息;S120,将所述待传递的军工领域消息按照段落进行划分以得到多个段落;S130,将所述多个段落分别通过包含嵌入层的上下文编码器以得到多个段落语义特征向量;S140,将所述多个段落语义特征向量进行二维排列后通过第一卷积神经网络以得到第一语义特征向量;S150,将所述多个段落语义特征向量进行一维排列后通过双向长短期记忆神经网络模型以得到第二语义特征向量;S160,对所述第一语义特征向量和所述第二语义特征向量进行特征向量关联式融合以得到分类特征矩阵;S170,将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果为待传递的军工领域消息的主题标签;以及,S180,基于所述分类结果,生成消息传递指示。
图2图示了根据本申请实施例的基于计算机的军工领域消息的传递方法的系统架构的示意图。如图2所示,首先,将获得的待传递的军工领域消息按照段落进行划分以得到多个段落。接着,将所述多个段落分别通过包含嵌入层的上下文编码器以得到多个段落语义特征向量。然后,将所述多个段落语义特征向量进行二维排列后通过第一卷积神经网络以得到第一语义特征向量。同时,将所述多个段落语义特征向量进行二维排列后通过第一卷积神经网络以得到第一语义特征向量。然后,对所述第一语义特征向量和所述第二语义特征向量进行特征向量关联式融合以得到分类特征矩阵。再然后,将所述分类特征矩阵通过分类器以得到分类结果。最后,基于所述分类结果,生成消息传递指示。
在步骤S110中,获取待传递的军工领域消息。如前所述,军工领域消息具有一定的机密性,在进行消息传递时需要十分谨慎,在进行数据传输时要对传输消息进行分析和判断,以防出现因误传或者错传而导致消息泄漏。在本申请的实施例中。通过传递消息捕捉软件获取待传递的军工领域消息,所述待传递的军工领域消息包括但不限于文件、压缩包和文本。
在步骤S120中,将所述待传递的军工领域消息按照段落进行划分以得到多个段落。应可以理解,待传输的军工领域消息进行分析与判断以确定其是否可被传递,这本质上是一个基于文本的主题标注问题,可通过自然语言处理模型来实现。而获取的待传递的军工领域消息包含许多其他格式的数据,如视频、表情包、音频等,而如果不对这些数据予以区分而全部进行分析,那么会极大的增加计算量,使处理的时间大大加长,降低工作效率。同样,一般获取的文本数据都较长,如果直接进行自然语言处理会极大增加处理量,降低处理效率。
针对上述技术问题,在本申请的技术方案中,首先对待传递的军工领域消息进行数据清洗以去除所述待传递的军工领域消息中的非文本部分,例如,视频、表情包、音频等。然后,对清洗后的军工领域消息进行按段落划分以得到多个段落。
具体地,在本申请实施例中,将所述待传递的军工领域消息按照段落进行划分以得到多个段落,包括:去除所述待传递的军工领域消息中的非本文数据以得到纯文本军工领域消息;识别所述纯文本军工领域消息中的断句标识;以及,基于所述断句标识对所述纯文本军工领域消息进行段落划分以得到所述多个段落。
在步骤S130中,将所述多个段落分别通过包含嵌入层的上下文编码器以得到多个段落语义特征向量。应可以理解,考虑到段落中各个词之间存在语义关联,因此,需要使用自然语言处理模型对各个所述段落进行上下文语义编码。也就是使用上下文编码器对所述多个段落进行基于段落的全局特征消息提取,以得到用于表示所述段落整体特征的多个段落语义特征向量。
特别地,在本申请的技术方案中,采用基于转换器的自然语言处理模型对各个所述段落进行上下文语义编码。本领域普通技术人员应知晓,相较于传统的RNN模型,基于转换器的自然语言处理模型能提升段落中各个词的上下文语义依赖的长度。
特别地,在本申请的技术方案中,本申请发明人采用包含嵌入层的上下文编码器对各个所述段落进行基于全局的上下文语义编码。具体地,所述上下文编码器的编码过程,包括首先对所述多个段落中的各个段落进行分词处理以得到对应于各个所述段落的词序列。然后,使用所述上下文编码器的嵌入层将各个所述段落的词序列中的各个词分别转化为词嵌入向量以得到对应于各个所述段落的词嵌入向量的序列。进一步地,在本申请的技术方案中,使用基于转换器的Bert模型对所述段落的词嵌入向量的序列进行上下文语义编码以提取所述段落的词嵌入向量的序列中各个词嵌入向量相对于所述词嵌入向量的序列的全局的高维关联隐含特征以得到对应于各个所述段落的多个词特征向量。并进一步地将各个所述段落的多个词特征向量进行级联以得到对应于各个所述段落的段落语义特征向量,也就是,将所述段落中各个词的高维特征分布表示在高维空间进行级联以得到用于表示所述段落整体的所述段落语义特征向量。
图3图示了根据本申请实施例的基于计算机的军工领域消息的传递方法中,将所述多个段落分别通过包含嵌入层的上下文编码器以得到多个段落语义特征向量的流程图。如图3所示,将所述多个段落分别通过包含嵌入层的上下文编码器以得到多个段落语义特征向量,包括:S210,对所述多个段落中的各个段落进行分词处理以得到对应于各个所述段落的词序列;S220,使用所述上下文编码器的嵌入层将各个所述段落的词序列中的各个词分别转化为词嵌入向量以得到对应于各个所述段落的词嵌入向量的序列;S230,将所述上下文编码器的基于转换器的Bert模型对各个所述段落的词嵌入向量的序列进行上下文语义编码以得到对应于各个所述段落的多个词特征向量;以及,S240,将各个所述段落的多个词特征向量进行级联以得到对应于各个所述段落的段落语义特征向量。
在步骤S140中,将所述多个段落语义特征向量进行二维排列后通过第一卷积神经网络以得到第一语义特征向量。应可以理解,不同段落的词之间具有高维语义关联,为了提高语义识别的精准度,在本申请的技术方案中,本申请发明人引入文本卷积神经网络来提取所述待传递的军工领域消息中不同段落的词之间的高维语义关联。
具体地,首先将所述多个段落语义特征向量二维排列为段落语义特征矩阵,其中,所述段落语义特征矩阵中各个行向量为所述段落语义特征向量。接着,使用卷积神经网络模型对所述段落语义特征矩阵进行显式空间编码以提取所述段落语义特征矩阵的高维局部特征,即,不同段落的词之间的高维语义关联的隐含表达,以得到第一语义特征向量。应可以理解,所述第一语义特征向量是以词为粒度的。
具体地,在本申请实施例中,将所述多个段落语义特征向量进行二维排列后通过第一卷积神经网络以得到第一语义特征向量,包括:将所述多个段落语义特征向量进行二维排列以得到段落语义特征矩阵;使用所述第一卷积神经网络的各层在层的正向传递中对输入数据分别进行卷积处理、基于特征矩阵的均值池化处理和非线性激活处理以由所述第一卷积神经网络的最后一层输出所述第一语义特征向量,其中,所述第一卷积神经网络的输入为所述段落语义特征矩阵。
在步骤S150中,将所述多个段落语义特征向量进行一维排列后通过双向长短期记忆神经网络模型以得到第二语义特征向量。应可以理解,为了提取各个段落的段落语义特征向量之间的关联,即,各个段落的语义表达在高维特征空间之间的关联,将所述多个段落语义特征向量进行一维排列以得到段落语义特征向量的序列,然后使用双向长短期记忆神经网络模型对所述段落语义特征向量的序列进行语义编码以得到段落间语义特征向量(为了便于说明,在本申请实施例中,定义为第二语义特征向量)。
具体地,在本申请实施例中,将所述多个段落语义特征向量进行一维排列后通过双向长短期记忆神经网络模型以得到第二语义特征向量,包括:将所述多个段落语义特征向量进行一维排列以得到段落语义特征向量的序列;以及使用所述双向长短期记忆神经网络模型对所述段落语义特征向量的序列进行上下文语义编码以得到所述第二语义特征向量。
在步骤S160中,对所述第一语义特征向量和所述第二语义特征向量进行特征向量关联式融合以得到分类特征矩阵。应可以理解,融合所述第一语义特征向量和所述第二语义特征向量就可以对所述待传递的军工领域消息进行主题分类。但本申请考虑到,在融合所述第一语义特征向量与所述第二语义特征向量时,需要保证所述第一语义特征向量与所述第二语义特征向量的尺度一致。但是,由于所述第一语义特征向量是所述多个段落语义特征向量进行二维排列后通过使用基于过滤器的第一卷积神经网络得到的,而所述第二语义特征向量是所述多个段落语义特征向量进行一维排列后通过双向长短期记忆神经模型得到的,其在特征分布的维度上会具有差异。
因此,在对第一语义特征向量
Figure 933920DEST_PATH_IMAGE013
和第二语义特征向量/>
Figure 141916DEST_PATH_IMAGE012
进行融合时,进行基于维度迁移确定性的特征向量关联式融合,表示为:
Figure 328047DEST_PATH_IMAGE003
Figure 205873DEST_PATH_IMAGE014
表示矩阵的Frobenius范数,/>
Figure 949226DEST_PATH_IMAGE015
和/>
Figure 836279DEST_PATH_IMAGE016
均为列向量。
该基于维度迁移确定性的特征向量关联式融合对于特征向量进行关联特征的相对位置嵌入,并进一步以关联矩阵的Frobenius范数进行低秩约束,这能够在特征向量向关联矩阵的维度迁移时,在特征向量所表达的高维特征的各自不一致的维度上保留其对于关联特征的远程依赖性,从而使得所获得的分类矩阵
Figure 611337DEST_PATH_IMAGE007
在维度差异的基础上仍然在一定程度上具有与第一语义特征向量/>
Figure 191223DEST_PATH_IMAGE017
和第二语义特征向量/>
Figure 684521DEST_PATH_IMAGE018
的概率分布一致性,从而提升了分类矩阵/>
Figure 671256DEST_PATH_IMAGE010
对于第一语义特征向量/>
Figure 300820DEST_PATH_IMAGE019
和第二语义特征向量/>
Figure 786028DEST_PATH_IMAGE020
两者的联合表达效果。这样,提高对所述待传递的军工领域消息的主题标注的准确性。
图4图示了根据本申请实施例的基于计算机的军工领域消息的传递方法中,对所述第一语义特征向量和所述第二语义特征向量进行特征向量关联式融合以得到分类特征矩阵的流程图。如图4所示,对所述第一语义特征向量和所述第二语义特征向量进行特征向量关联式融合以得到分类特征矩阵,包括:S310,计算所述第一语义特征向量与所述第二语义特征向量的转置向量之间的向量乘积以得到关联特征矩阵;S320,计算所述关联特征矩阵的低秩表示;S330,以所述关联特征矩阵中各个位置的特征值分别除以所述关联特征矩阵的低秩表示以得到低秩约束关联特征矩阵;以及,S340,对所述低秩约束关联特征矩阵进行指数运算以得到指数化低秩约束关联特征矩阵作为所述分类特征矩阵。
在步骤S170中,将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果为待传递的军工领域消息的主题标签。
具体地,在本申请实施例中,将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果为待传递的军工领域消息的主题标签,包括:
使用所述分类器以如下公式对所述分类特征矩阵进行处理以得到所述分类结果,其中,所述公式为:
Figure 766622DEST_PATH_IMAGE021
,其中/>
Figure 261058DEST_PATH_IMAGE022
表示将所述分类特征矩阵投影为向量,/>
Figure 748058DEST_PATH_IMAGE023
至/>
Figure 404168DEST_PATH_IMAGE024
为各层全连接层的权重矩阵,/>
Figure 872058DEST_PATH_IMAGE025
至/>
Figure 701343DEST_PATH_IMAGE026
表示各层全连接层的偏置矩阵。
也就是,所述分类器以至少一个全连接层作为编码器将所述分类特征矩阵投影为一维的特征向量。接着,将所述分类特征向量输入所述Softmax分类函数以计算所述分类特征向量的Softmax函数值,即,所述分类特征向量归属于各个分类标签的概率值。最后,将概率值较大者对应的标签作为所述分类结果,所述分类结果为待传递的军工领域消息的主题标签。
在本申请的一个具体的实施例中,所述待传递的军工领域消息的主题标签为包含敏感消息和不包含敏感消息。当然,待传递的军工领域消息的主题标签也可以根据保密等级进行设置。
在步骤S180中,基于所述分类结果,生成消息传递指示。也就是,在得到所述军工领域消息的主题后,可基于所述主体生成消息传递提示。
例如,当所述待传递的军工领域消息的主题标签为包含敏感消息,生成敏感消息提示,通过敏感消息提示,通过敏感消息提示可以有效避免工作人员在数据传输时因误传或者错传而导致消息的泄露,对此,并不为本申请所局限。
综上,基于本申请实施例的所述基于计算机的军工领域消息的传递方法,其首先对待传递的军工领域消息的各个段落进行语义编码,再将各个段落的语义特征表示通过双向长短期记忆神经网络以进行段落间高维语义编码,考虑到进行段落间语义提取会忽略了不同段落的词之间的高维语义关联而导致语义识别的精准度的下降,因此,使用文本卷积神经网络来提取不同段落的词之间的高维语义关联特征,然后对上述语义特征向量进行融合以得到分类特征矩阵,并通过分类器得到用于表示待传递的军工领域消息的主题标签的分类结果,最终基于分类结果生成消息传递指示,这样,避免因误传或者错传而导致消息的泄露。
示例性系统
图5图示了根据本申请实施例的基于计算机的军工领域消息的传递系统的框图示意图。如图5所示,根据本申请实施例的所述基于计算机的军工领域消息的传递系统600,包括:传递消息获取单元610,用于获取待传递的军工领域消息;段落获取单元620,用于将所述待传递的军工领域消息按照段落进行划分以得到多个段落;段落语义特征向量获取单元630,用于将所述多个段落分别通过包含嵌入层的上下文编码器以得到多个段落语义特征向量;第一语义特征向量获取单元640,用于将所述多个段落语义特征向量进行二维排列后通过第一卷积神经网络以得到第一语义特征向量;第二语义特征向量获取单元650,用于将所述多个段落语义特征向量进行一维排列后通过双向长短期记忆神经网络模型以得到第二语义特征向量;分类特征矩阵获取单元660,用于对所述第一语义特征向量和所述第二语义特征向量进行特征向量关联式融合以得到分类特征矩阵;分类单元670,用于将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果为待传递的军工领域消息的主题标签;以及,指示生成单元680,基于所述分类结果,生成消息传递指示。
在本申请一示例中,图6图示了根据本申请实施例的基于计算机的军工领域消息的传递系统中段落语义特征向量获取单元的框图。如图6所示,段落语义特征向量获取单元630,包括分词处理单元631、嵌入单元632、上下文语义编码单元633以及向量级联单元634。其中,分词处理单元631,用于对所述多个段落中的各个段落进行分词处理以得到对应于各个所述段落的词序列;嵌入单元632,用于使用所述上下文编码器的嵌入层将各个所述段落的词序列中的各个词分别转化为词嵌入向量以得到对应于各个所述段落的词嵌入向量的序列;上下文语义编码单元633,用于将所述上下文编码器的基于转换器的Bert模型对各个所述段落的词嵌入向量的序列进行上下文语义编码以得到对应于各个所述段落的多个词特征向量;向量级联单元634,用于将各个所述段落的多个词特征向量进行级联以得到对应于各个所述段落的段落语义特征向量。
这里,本领域技术人员可以理解,上述基于计算机的军工领域消息的传递系统中的各个单元和模块的具体功能和操作已经在上面参考图1到图4的基于计算机的军工领域消息的传递方法的描述中得到了详细介绍,并因此,将省略其重复描述。
如上所述,根据本申请实施例的基于计算机的军工领域消息的传递系统600可以实现在各种终端设备中,例如具有基于计算机的军工领域消息的传递算法的服务器等。在一个示例中,根据基于计算机的军工领域消息的传递系统600可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该基于计算机的军工领域消息的传递系统600可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该基于计算机的军工领域消息的传递系统600同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该基于计算机的军工领域消息的传递系统600与该终端设备也可以是分立的设备,并且基于计算机的军工领域消息的传递系统600可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
示例性电子设备
下面,参考图7来描述根据本申请实施例的电子设备。
图7图示了根据本申请实施例的电子设备的框图。
如图7所示,电子设备10包括一个或多个处理器11和存储器12。
处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备10中的其他组件以执行期望的功能。
存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的基于计算机的军工领域消息的传递以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如待传递的军工领域消息等各种内容。
在一个示例中,电子设备10还可以包括:输入装置13和输出装置14,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
该输入装置13可以包括例如键盘、鼠标等等。
该输出装置14可以向外部输出各种信息,包括消息传递指示等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的基于计算机的军工领域消息的传递方法的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的基于计算机的军工领域消息的传递方法的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (7)

1.一种基于计算机的军工领域消息的传递方法,其特征在于,包括:
获取待传递的军工领域消息;
将所述待传递的军工领域消息按照段落进行划分以得到多个段落;
将所述多个段落分别通过包含嵌入层的上下文编码器以得到多个段落语义特征向量;
将所述多个段落语义特征向量进行二维排列后通过第一卷积神经网络以得到第一语义特征向量;
将所述多个段落语义特征向量进行一维排列后通过双向长短期记忆神经网络模型以得到第二语义特征向量;
对所述第一语义特征向量和所述第二语义特征向量进行特征向量关联式融合以得到分类特征矩阵;
将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果为待传递的军工领域消息的主题标签;以及
基于所述分类结果,生成消息传递指示;
其中,对所述第一语义特征向量和所述第二语义特征向量进行特征向量关联式融合以得到分类特征矩阵,包括:
计算所述第一语义特征向量与所述第二语义特征向量的转置向量之间的向量乘积以得到关联特征矩阵;
计算所述关联特征矩阵的低秩表示;
以所述关联特征矩阵中各个位置的特征值分别除以所述关联特征矩阵的低秩表示以得到低秩约束关联特征矩阵;以及
对所述低秩约束关联特征矩阵进行指数运算以得到指数化低秩约束关联特征矩阵作为所述分类特征矩阵。
2.根据权利要求1所述的基于计算机的军工领域消息的传递方法,其中,将所述待传递的军工领域消息按照段落进行划分以得到多个段落,包括:
去除所述待传递的军工领域消息中的非文本数据以得到纯文本军工领域消息;
识别所述纯文本军工领域消息中的断句标识;以及
基于所述断句标识对所述纯文本军工领域消息进行段落划分以得到所述多个段落。
3.根据权利要求2所述的基于计算机的军工领域消息的传递方法,其中,将所述多个段落分别通过包含嵌入层的上下文编码器以得到多个段落语义特征向量,包括:
对所述多个段落中的各个段落进行分词处理以得到对应于各个所述段落的词序列;
使用所述上下文编码器的嵌入层将各个所述段落的词序列中的各个词分别转化为词嵌入向量以得到对应于各个所述段落的词嵌入向量的序列;
将所述上下文编码器的基于转换器的Bert模型对各个所述段落的词嵌入向量的序列进行上下文语义编码以得到对应于各个所述段落的多个词特征向量;以及
将各个所述段落的多个词特征向量进行级联以得到对应于各个所述段落的段落语义特征向量。
4.根据权利要求3所述的基于计算机的军工领域消息的传递方法,其中,将所述多个段落语义特征向量进行二维排列后通过第一卷积神经网络以得到第一语义特征向量,包括:
将所述多个段落语义特征向量进行二维排列以得到段落语义特征矩阵;
使用所述第一卷积神经网络的各层在层的正向传递中对输入数据分别进行卷积处理、基于特征矩阵的均值池化处理和非线性激活处理以由所述第一卷积神经网络的最后一层输出所述第一语义特征向量,其中,所述第一卷积神经网络的输入为所述段落语义特征矩阵。
5.根据权利要求4所述的基于计算机的军工领域消息的传递方法,其中,将所述多个段落语义特征向量进行一维排列后通过双向长短期记忆神经网络模型以得到第二语义特征向量,包括:
将所述多个段落语义特征向量进行一维排列以得到段落语义特征向量的序列;以及
使用所述双向长短期记忆神经网络模型对所述段落语义特征向量的序列进行上下文语义编码以得到所述第二语义特征向量。
6.根据权利要求5所述的基于计算机的军工领域消息的传递方法,其中,将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果为待传递的军工领域消息的主题标签,包括:
使用所述分类器以如下公式对所述分类特征矩阵进行处理以得到所述分类结果,其中,所述公式为:softmax{(Wn,Bn):…:(W1,B1)|Project(F)},其中project(F)表示将所述分类特征矩阵投影为向量,W1至Wn为各层全连接层的权重矩阵,B1至Bn表示各层全连接层的偏置矩阵。
7.根据权利要求6所述的基于计算机的军工领域消息的传递方法,其中,基于所述分类结果,生成消息传递指示,包括:
响应于所述待传递的军工领域消息的主题标签为包含敏感消息,生成敏感消息提示。
CN202210885294.5A 2022-07-26 2022-07-26 一种基于计算机的军工领域消息的传递方法 Active CN115827856B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210885294.5A CN115827856B (zh) 2022-07-26 2022-07-26 一种基于计算机的军工领域消息的传递方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210885294.5A CN115827856B (zh) 2022-07-26 2022-07-26 一种基于计算机的军工领域消息的传递方法

Publications (2)

Publication Number Publication Date
CN115827856A CN115827856A (zh) 2023-03-21
CN115827856B true CN115827856B (zh) 2023-06-20

Family

ID=85522938

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210885294.5A Active CN115827856B (zh) 2022-07-26 2022-07-26 一种基于计算机的军工领域消息的传递方法

Country Status (1)

Country Link
CN (1) CN115827856B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115994177B (zh) * 2023-03-23 2023-06-02 山东文衡科技股份有限公司 基于数据湖的知识产权管理方法及其系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110532395A (zh) * 2019-05-13 2019-12-03 南京大学 一种基于语义嵌入的词向量改进模型的建立方法
CN112364638A (zh) * 2020-10-13 2021-02-12 北京工业大学 一种基于社交文本的人格识别方法
KR20220098991A (ko) * 2021-01-05 2022-07-12 세종대학교산학협력단 음성 신호에 기반한 감정 인식 장치 및 방법

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11140115B1 (en) * 2014-12-09 2021-10-05 Google Llc Systems and methods of applying semantic features for machine learning of message categories
CN108694200B (zh) * 2017-04-10 2019-12-20 北京大学深圳研究生院 一种基于深度语义空间的跨媒体检索方法
US10599769B2 (en) * 2018-05-01 2020-03-24 Capital One Services, Llc Text categorization using natural language processing
CN110413785B (zh) * 2019-07-25 2021-10-19 淮阴工学院 一种基于bert和特征融合的文本自动分类方法
CN110874410A (zh) * 2019-11-01 2020-03-10 河南理工大学 一种基于长短时记忆网络和卷积神经网络的文本分类方法
CN110598191B (zh) * 2019-11-18 2020-04-07 江苏联著实业股份有限公司 一种基于神经网络的复杂pdf结构解析方法及装置
CN111984791B (zh) * 2020-09-02 2023-04-25 南京信息工程大学 一种基于注意力机制的长文分类方法
CN113553848B (zh) * 2021-07-19 2024-02-02 北京奇艺世纪科技有限公司 长文本分类方法、系统、电子设备、计算机可读存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110532395A (zh) * 2019-05-13 2019-12-03 南京大学 一种基于语义嵌入的词向量改进模型的建立方法
CN112364638A (zh) * 2020-10-13 2021-02-12 北京工业大学 一种基于社交文本的人格识别方法
KR20220098991A (ko) * 2021-01-05 2022-07-12 세종대학교산학협력단 음성 신호에 기반한 감정 인식 장치 및 방법

Also Published As

Publication number Publication date
CN115827856A (zh) 2023-03-21

Similar Documents

Publication Publication Date Title
CN115203380B (zh) 基于多模态数据融合的文本处理系统及其方法
CN108959246B (zh) 基于改进的注意力机制的答案选择方法、装置和电子设备
WO2022134759A1 (zh) 关键词生成方法、装置、电子设备及计算机存储介质
CN115796173B (zh) 针对监管报送需求的数据处理方法和系统
CN110298035B (zh) 基于人工智能的字向量定义方法、装置、设备及存储介质
CN115994177B (zh) 基于数据湖的知识产权管理方法及其系统
CN116257406A (zh) 用于智慧城市的网关数据管理方法及其系统
US20230259707A1 (en) Systems and methods for natural language processing (nlp) model robustness determination
CN113158656B (zh) 讽刺内容识别方法、装置、电子设备以及存储介质
US11755636B2 (en) System and method for text processing for summarization and optimization
CN115827856B (zh) 一种基于计算机的军工领域消息的传递方法
CN116151845A (zh) 基于工业物联网技术的产品全生命周期管理系统及其方法
CN115544560A (zh) 一种敏感信息的脱敏方法、装置、计算机设备及存储介质
CN108763202A (zh) 识别敏感文本的方法、装置、设备及可读存储介质
CN112464927A (zh) 一种信息提取方法、装置及系统
CN115115432B (zh) 基于人工智能的产品信息推荐方法及装置
CN116151604A (zh) 一种web环境下办公系统流程分析系统及其方法
CN116127019A (zh) 动态参数与可视化模型生成web 2d自动建模引擎系统
CN113722475A (zh) 基于云存储的文件操作方法、系统和电子设备
CN113138773A (zh) 云计算分布式服务集群方法
CN112528647A (zh) 相似文本生成方法、装置、电子设备及可读存储介质
CN112800217A (zh) 基于向量关联性矩阵的政务事务处理报告的智能评估方法
CN112926314A (zh) 文档的重复性识别方法、装置、电子设备以及存储介质
CN113553058B (zh) 前端页面访问方法、系统和电子设备
CN113268616B (zh) 参考文献内容提取方法和装置

Legal Events

Date Code Title Description
DD01 Delivery of document by public notice

Addressee: National Defense Science and Technology Industry Bureau Military Project Review Center Received by the person in charge of patent

Document name: Notice of Deemed Not Entrusting Patent Agency (Individual)

Addressee: National Defense Science and Technology Industry Bureau Military Project Review Center Received by the person in charge of patent

Document name: Correction notice

DD01 Delivery of document by public notice
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant