CN116257406A - 用于智慧城市的网关数据管理方法及其系统 - Google Patents

用于智慧城市的网关数据管理方法及其系统 Download PDF

Info

Publication number
CN116257406A
CN116257406A CN202310249215.6A CN202310249215A CN116257406A CN 116257406 A CN116257406 A CN 116257406A CN 202310249215 A CN202310249215 A CN 202310249215A CN 116257406 A CN116257406 A CN 116257406A
Authority
CN
China
Prior art keywords
semantic
feature vector
context
global
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310249215.6A
Other languages
English (en)
Inventor
余跃辉
陈晓克
黄泽准
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Huacai Weiye Network Technology Co ltd
Original Assignee
Hunan Huacai Weiye Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Huacai Weiye Network Technology Co ltd filed Critical Hunan Huacai Weiye Network Technology Co ltd
Priority to CN202310249215.6A priority Critical patent/CN116257406A/zh
Publication of CN116257406A publication Critical patent/CN116257406A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A30/00Adapting or protecting infrastructure or their operation
    • Y02A30/60Planning or developing urban green infrastructure

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Machine Translation (AREA)

Abstract

本申请涉及智慧城市领域,其具体地公开了一种用于智慧城市的网关数据管理方法及其系统,其采用基于深度学习及人工智能的自然语言处理技术,以通过包含词嵌入层的上下文语义编码器和作为特征提取器的卷积神经网络模型对于数据网关在运行过程中产生的在预定时间段的运行日志数据进行智能化分析以对于数据网关的运行状态进行异常检测。这样,能够在数据网关运行过程中出现异常时及时发出预警来提醒相关工作人员进行维修,从而优化数据网关的功能,推进智慧城市的发展。

Description

用于智慧城市的网关数据管理方法及其系统
技术领域
本申请涉及智慧城市领域,且更为具体地,涉及一种用于智慧城市的网关数据管理方法及其系统。
背景技术
2010年,IBM正式提出了“智慧的城市”愿景,经过10多年的发展,智慧城市逐步发展成熟。特别是以物联网为代表的设备多类型、多厂商。
数据网关是软硬一体化设备,其主要功能有数据接入、数据适配、数据传输和运行控制,其为实现“一个盒子采集多设备、多厂商物联数据”提供可能。
数据网关在运行过程中产生的大量的感知数据,如何让这些数据产生价值是目前“智慧的城市”需要解决的问题。
因此,期待一种用于智慧城市的网关数据管理方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种用于智慧城市的网关数据管理方法及其系统,其采用基于深度学习及人工智能的自然语言处理技术,以通过包含词嵌入层的上下文语义编码器和作为特征提取器的卷积神经网络模型对于数据网关在运行过程中产生的在预定时间段的运行日志数据进行智能化分析以对于数据网关的运行状态进行异常检测。这样,能够在数据网关运行过程中出现异常时及时发出预警来提醒相关工作人员进行维修,从而优化数据网关的功能,推进智慧城市的发展。
根据本申请的一个方面,提供了一种用于智慧城市的网关数据管理方法,其包括:
获取待检测数据网关在预定时间段的运行日志数据;
对所述运行日志数据进行数据预处理后以得到预处理后运行日志数据;
对所述预处理后运行日志数据进行分词处理后通过包含词嵌入层的上下文编码器以得到多个上下文运行状态语义理解特征向量;
将所述多个上下文运行状态语义理解特征向量进行二维排列为全局语义输入矩阵后通过作为特征提取器的卷积神经网络模型以得到局部语义增强全局语义特征向量;
将所述多个上下文运行状态语义理解特征向量进行级联以得到全局语义特征向量;
融合所述局部语义增强全局语义特征向量和所述全局语义特征向量以得到分类特征向量;以及
将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示待检测数据网关的运行状态是否异常。
在上述用于智慧城市的网关数据管理方法中,对所述预处理后运行日志数据进行分词处理后通过包含词嵌入层的上下文编码器以得到多个上下文运行状态语义理解特征向量,包括:对所述预处理后运行日志数据进行分词处理以获得词序列;将所述词序列通过所述词嵌入层以将所述词序列中各个词转化为词嵌入向量以得到词嵌入向量的序列;以及,将所述词嵌入向量的序列输入所述包含词嵌入层的上下文编码器的转换器以得到所述多个上下文运行状态语义理解特征向量。
在上述用于智慧城市的网关数据管理方法中,将所述词嵌入向量的序列输入所述包含词嵌入层的上下文编码器的转换器以得到所述多个上下文运行状态语义理解特征向量,包括:将所述词嵌入向量的序列排列为输入向量;将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,将所述自注意力特征矩阵与以所述词嵌入向量的序列中各个词嵌入向量作为值向量分别进行相乘以得到所述多个上下文运行状态语义理解特征向量。
在上述用于智慧城市的网关数据管理方法中,将所述多个上下文运行状态语义理解特征向量进行二维排列为全局语义输入矩阵后通过作为特征提取器的卷积神经网络模型以得到局部语义增强全局语义特征向量,包括:使用所述卷积神经网络模型的各层在层的正向传递中分别进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行基于局部特征矩阵的均值池化以得到池化特征图;以及,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述卷积神经网络模型的最后一层的输出为所述局部语义增强全局语义特征向量,所述卷积神经网络模型的第一层的输入为所述全局语义输入矩阵。
在上述用于智慧城市的网关数据管理方法中,将所述多个上下文运行状态语义理解特征向量进行级联以得到全局语义特征向量,包括:以如下公式将所述多个上下文运行状态语义理解特征向量进行级联以得到全局语义特征向量;其中,所述公式为:
X=Concat[Va,Vb,···,Vn]
其中,Va,Vb,···,Vn表示所述多个上下文运行状态语义理解特征向量,Concat[·,·]表示级联函数,X表示所述全局语义特征向量。
在上述用于智慧城市的网关数据管理方法中,融合所述局部语义增强全局语义特征向量和所述全局语义特征向量以得到分类特征向量,包括:计算所述局部语义增强全局语义特征向量和所述全局语义特征向量的关联-概率密度分布仿射映射因数以得到第一关联-概率密度分布仿射映射因数和第二关联-概率密度分布仿射映射因数;以所述第一关联-概率密度分布仿射映射因数和所述第二关联-概率密度分布仿射映射因数作为权重,分别对所述局部语义增强全局语义特征向量和所述全局语义特征向量进行加权以得到加权后局部语义增强全局语义特征向量和加权后全局语义特征向量;以及,将所述加权后局部语义增强全局语义特征向量和所述加权后全局语义特征向量进行级联以得到所述分类特征向量。
在上述用于智慧城市的网关数据管理方法中,计算所述局部语义增强全局语义特征向量和所述全局语义特征向量的关联-概率密度分布仿射映射因数以得到第一关联-概率密度分布仿射映射因数和第二关联-概率密度分布仿射映射因数,包括:以如下公式计算所述局部语义增强全局语义特征向量和所述全局语义特征向量的关联-概率密度分布仿射映射因数以得到第一关联-概率密度分布仿射映射因数和第二关联-概率密度分布仿射映射因数;其中,所述公式为:
Figure BDA0004127256880000031
Figure BDA0004127256880000032
其中,V1和V2分别表示所述局部语义增强全局语义特征向量和所述全局语义特征向量,M为所述局部语义增强全局语义特征向量和所述全局语义特征向量之间的逐位置关联得到的关联矩阵,μ和∑是所述局部语义增强全局语义特征向量和所述全局语义特征向量构成的高斯密度图的均值向量和协方差矩阵,
Figure BDA0004127256880000041
表示矩阵乘法,exp(·)表示自然指数函数运算,w1和w2分别表示所述第一关联-概率密度分布仿射映射因数和所述第二关联-概率密度分布仿射映射因数。
在上述用于智慧城市的网关数据管理方法中,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示待检测数据网关的运行状态是否异常,包括:将所述分类特征向量输入所述分类器的Softmax分类函数以得到所述分类特征向量归属于各个分类标签的概率值;以及,将最大概率值对应的分类标签确定为所述分类结果。
根据本申请的另一方面,提供了一种用于智慧城市的网关数据管理系统,包括:
运行日志获取模块,用于获取待检测数据网关在预定时间段的运行日志数据;
预处理模块,用于对所述运行日志数据进行数据预处理后以得到预处理后运行日志数据;
上下文语义理解模块,用于对所述预处理后运行日志数据进行分词处理后通过包含词嵌入层的上下文编码器以得到多个上下文运行状态语义理解特征向量;
局部语义增强模块,用于将所述多个上下文运行状态语义理解特征向量进行二维排列为全局语义输入矩阵后通过作为特征提取器的卷积神经网络模型以得到局部语义增强全局语义特征向量;
级联整合模块,用于将所述多个上下文运行状态语义理解特征向量进行级联以得到全局语义特征向量;
融合模块,用于融合所述局部语义增强全局语义特征向量和所述全局语义特征向量以得到分类特征向量;以及
检测结果生成模块,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示待检测数据网关的运行状态是否异常。
根据本申请的再一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的用于智慧城市的网关数据管理方法。
根据本申请的又一方面,提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的用于智慧城市的网关数据管理方法。
与现有技术相比,本申请提供的用于智慧城市的网关数据管理方法及其系统,其采用基于深度学习及人工智能的自然语言处理技术,以通过包含词嵌入层的上下文语义编码器和作为特征提取器的卷积神经网络模型对于数据网关在运行过程中产生的在预定时间段的运行日志数据进行智能化分析以对于数据网关的运行状态进行异常检测。这样,能够在数据网关运行过程中出现异常时及时发出预警来提醒相关工作人员进行维修,从而优化数据网关的功能,推进智慧城市的发展。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1为根据本申请实施例的用于智慧城市的网关数据管理方法的流程图。
图2为根据本申请实施例的用于智慧城市的网关数据管理方法的架构图。
图3为根据本申请实施例的用于智慧城市的网关数据管理方法中对所述预处理后运行日志数据进行分词处理后通过包含词嵌入层的上下文编码器以得到多个上下文运行状态语义理解特征向量的流程图。
图4为根据本申请实施例的用于智慧城市的网关数据管理方法中将所述词嵌入向量的序列输入所述包含词嵌入层的上下文编码器的转换器以得到所述多个上下文运行状态语义理解特征向量的流程图。
图5为根据本申请实施例的用于智慧城市的网关数据管理系统的框图。
图6为根据本申请实施例的电子设备的框图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
申请概述
如背景技术部分所言,数据网关在运行过程中产生的大量的感知数据,如何让这些数据产生价值是目前“智慧的城市”需要解决的问题。相应地,在本申请的技术方案中,期待对于数据网关在运行过程中产生的在预定时间段的运行日志数据进行智能化分析以精准地检测数据网关的运行状态是否出现异常,这样能够在数据网关运行过程中出现异常时及时发出预警来提醒相关工作人员进行维修,从而优化数据网关的功能,推进智慧城市的发展。
近年来,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。此外,深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域,也展现出了接近甚至超越人类的水平。
深度学习以及神经网络的发展为构建用于智慧城市的网关数据管理方案提供了新的解决思路。
具体地,在本申请的技术方案中,首先,获取待检测数据网关在预定时间段的运行日志数据。这里,所述运行日志是记录数据网关在运行过程中产生的各种重要信息的文件,其作用是记录数据网关的运行过程及异常信息,为快速定位数据网关运行中出现的问题提供详细信息。
考虑到所述待检测数据网关在预定时间段的运行日志数据中存在与对于数据网关的运行状态进行分类判断无关的信息,例如标点符号等,在本申请的技术方案中,对所述运行日志数据进行数据预处理后以得到预处理后运行日志数据。在对所述运行日志数据进行数据预处理的过程中,可以去除所述运行日志数据中的譬如标点符号等与数据网关的运行状态无关的信息,并提取保留与数据网关的运行状态相关的信息,例如重要字段(日志级别、日志主要信息等)的属性值。
接着,对所述预处理后运行日志数据进行分词处理以避免词序混乱后通过包含词嵌入层的上下文编码器以得到多个上下文运行状态语义理解特征向量。也就是,利用所述上下文编码器来对所述预处理后运行日志数据进行深度语义理解以刻画其所蕴含的高维隐含语义关联特征信息。
所述上下文编码器包括词嵌入层和基于转换器(Transformer)的Bert模型。应可以理解,所述预处理后运行日志数据中包含字母与数字,也就是说,所述预处理后运行日志数据并非结构化数据。而所述词嵌入层的作用在于将所述预处理后运行日志数据的各个词进行向量化转化以将一个词映射转化为一个词嵌入向量,从而得到词嵌入向量的序列。其中,所述词嵌入层可以基于词袋模型来构建,或者,基于低维语义嵌入模型来构建,例如,Word2Vec等。所述基于转换器的Bert模型的作用为对所述词嵌入向量的序列进行基于全局的上下文语义编码以得到多个上下文运行状态语义理解特征向量。也就是,基于Transformer思想,利用转换器能够捕捉长距离上下文依赖的特性,对所述词嵌入向量的序列中各个词嵌入向量进行基于全局的上下文语义编码以得到以所述词嵌入向量的序列的整体语义关联为上下文背景的上下文语义关联特征表示,即,所述多个上下文运行状态语义理解特征向量。
考虑到运行日志数据中各个字段之间具有不同程度的隐含关联关系,譬如静态信息ID(Static ID)与静态信息ID对应的静态信息文本(Static Text)之间的信息相关程度较高,而与附加信息(AppendInfo)之间的信息相关程度较低。如果能够提取到这种隐含的关联关系,显然能够提升对于数据网关的运行状态异常检测的精准度。由此,在本申请的技术方案中,将所述多个上下文运行状态语义理解特征向量进行二维排列为全局语义输入矩阵后通过作为特征提取器的卷积神经网络模型以得到局部语义增强全局语义特征向量。也就是,使用在局部关联特征提取领域具有优异性能表现的卷积神经网络模型来对所述全局语义输入矩阵进行基于卷积核的特征过滤以捕捉所述全局语义输入矩阵中的高维局部隐含关联特征。
虽然卷积神经网络在局部关联特征提取方面具有优异的性能表现,但受限于卷积编码的局限性,由所述作为特征提取器的卷积神经网络模型所提取得到的特征会具有相对较小的特征感受野,也就是说,所述局部语义增强全局语义特征向量在全局特征表征方面的表现较弱。为了弥补这种局限性,在本申请的技术方案中,首先,将所述多个上下文运行状态语义理解特征向量进行级联以保留原始的全局语义特征信息,从而得到全局语义特征向量。然后,融合所述局部语义增强全局语义特征向量和所述全局语义特征向量以得到分类特征向量,所述分类特征向量既避免了全局语义特征信息的大量丢失,又包含了局部的高维隐含关联特征信息,提高了后续分类的准确性。
在得到所述分类特征向量后,将其通过分类器以得到分类结果,所述分类结果用于表示待检测数据网关的运行状态是否异常。也就是,在本申请的技术方案中,所述分类器的标签包括待检测数据网关的运行状态出现异常(第一标签),以及,待检测数据网关的运行状态没有出现异常(第二标签),其中,所述分类器通过软最大值函数来确定所述分类特征向量属于哪个分类标签。值得注意的是,这里的所述第一标签和所述第二标签并不包含人为设定的概念,实际上在训练过程当中,计算机模型并没有“待检测数据网关的运行状态是否异常”这个概念,其只是有两个分类标签,例如L1和L2,且输出特征在这两个分类标签下的概率,即p1和p2之和为一。因此,待检测数据网关的运行状态是否异常的分类结果实际上是通过分类标签转化为符合自然规律的二分类的类概率分布,实质上用到的是标签的自然概率分布的物理意义,而不是“待检测数据网关的运行状态是否异常”的语言文本意义。应可以理解,在本申请的技术方案中,在得到所述分类结果后,响应于所述分类结果为待检测数据网关的运行状态出现异常,可以产生预警提示信息来提醒相关工作人员进行维修,从而优化数据网关的功能,推进智慧城市的发展。
这里,在融合所述局部语义增强全局语义特征向量和所述全局语义特征向量得到所述分类特征向量时,如果能够提升所述局部语义增强全局语义特征向量和所述全局语义特征向量的逐位置关联性以及其整体特征分布在类概率密度分布下的一致性,就可以提升所述局部语义增强全局语义特征向量和所述全局语义特征向量的融合效果,以提升融合得到的所述分类特征向量通过分类器得到的分类结果的准确性。
因此,本申请的申请人计算所述局部语义增强全局语义特征向量,例如记为V1和所述全局语义特征向量,例如记为V2的关联-概率密度分布仿射映射因数,表示为:
Figure BDA0004127256880000081
Figure BDA0004127256880000082
M为所述局部语义增强全局语义特征向量V1和所述全局语义特征向量V2之间的逐位置关联得到的关联矩阵,μ和∑是所述局部语义增强全局语义特征向量V1和所述全局语义特征向量V2构成的联合高斯密度图的均值向量和逐位置方差矩阵。
也就是,通过构造所述局部语义增强全局语义特征向量V1和所述全局语义特征向量V2之间的关联特征空间和由高斯概率密度表示的类概率密度空间,可以通过将所述局部语义增强全局语义特征向量V1和所述全局语义特征向量V2分别映射到关联特征空间和类概率密度空间内的仿射单应性子空间中,来提取特征表示在关联特征域和类概率密度域内的符合仿射单应性的表示,通过以所述关联-概率密度分布仿射映射因数值w1和w2分别对所述局部语义增强全局语义特征向量V1和所述全局语义特征向量V2进行加权,就可以提升所述局部语义增强全局语义特征向量V1和所述全局语义特征向量V2的特征表示的逐位置关联性和整体概率密度分布上的一致性,从而提升所述局部语义增强全局语义特征向量V1和所述全局语义特征向量V2的融合效果,以提升融合得到的所述分类特征向量通过分类器得到的分类结果的准确性。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
示例性方法
图1为根据本申请实施例的用于智慧城市的网关数据管理方法的流程图。如图1所示,根据本申请实施例的用于智慧城市的网关数据管理方法,包括:S110,获取待检测数据网关在预定时间段的运行日志数据;S120,对所述运行日志数据进行数据预处理后以得到预处理后运行日志数据;S130,对所述预处理后运行日志数据进行分词处理后通过包含词嵌入层的上下文编码器以得到多个上下文运行状态语义理解特征向量;S140,将所述多个上下文运行状态语义理解特征向量进行二维排列为全局语义输入矩阵后通过作为特征提取器的卷积神经网络模型以得到局部语义增强全局语义特征向量;S150,将所述多个上下文运行状态语义理解特征向量进行级联以得到全局语义特征向量;S160,融合所述局部语义增强全局语义特征向量和所述全局语义特征向量以得到分类特征向量;以及,S170,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示待检测数据网关的运行状态是否异常。
图2为根据本申请实施例的用于智慧城市的网关数据管理方法的架构图。如图2所示,在该架构中,首先,获取待检测数据网关在预定时间段的运行日志数据;接着,对所述运行日志数据进行数据预处理后以得到预处理后运行日志数据;然后,对所述预处理后运行日志数据进行分词处理后通过包含词嵌入层的上下文编码器以得到多个上下文运行状态语义理解特征向量;继而,将所述多个上下文运行状态语义理解特征向量进行二维排列为全局语义输入矩阵后通过作为特征提取器的卷积神经网络模型以得到局部语义增强全局语义特征向量;同时,将所述多个上下文运行状态语义理解特征向量进行级联以得到全局语义特征向量;再融合所述局部语义增强全局语义特征向量和所述全局语义特征向量以得到分类特征向量;最后,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示待检测数据网关的运行状态是否异常。
如背景技术部分所言,数据网关在运行过程中产生的大量的感知数据,如何让这些数据产生价值是目前“智慧的城市”需要解决的问题。相应地,在本申请的技术方案中,期待对于数据网关在运行过程中产生的在预定时间段的运行日志数据进行智能化分析以精准地检测数据网关的运行状态是否出现异常,这样能够在数据网关运行过程中出现异常时及时发出预警来提醒相关工作人员进行维修,从而优化数据网关的功能,推进智慧城市的发展。
近年来,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。此外,深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域,也展现出了接近甚至超越人类的水平。
深度学习以及神经网络的发展为构建用于智慧城市的网关数据管理方案提供了新的解决思路。
在步骤S110中,获取待检测数据网关在预定时间段的运行日志数据。这里,所述运行日志是记录数据网关在运行过程中产生的各种重要信息的文件,其作用是记录数据网关的运行过程及异常信息,为快速定位数据网关运行中出现的问题提供详细信息。
在步骤S120中,对所述运行日志数据进行数据预处理后以得到预处理后运行日志数据。考虑到所述待检测数据网关在预定时间段的运行日志数据中存在与对于数据网关的运行状态进行分类判断无关的信息,例如标点符号等,在本申请的技术方案中,对所述运行日志数据进行数据预处理后以得到预处理后运行日志数据。在对所述运行日志数据进行数据预处理的过程中,可以去除所述运行日志数据中的譬如标点符号等与数据网关的运行状态无关的信息,并提取保留与数据网关的运行状态相关的信息,例如重要字段(日志级别、日志主要信息等)的属性值。
在步骤S130中,对所述预处理后运行日志数据进行分词处理后通过包含词嵌入层的上下文编码器以得到多个上下文运行状态语义理解特征向量。在本申请的技术方案中,对所述预处理后运行日志数据进行分词处理以避免词序混乱后通过包含词嵌入层的上下文编码器以得到多个上下文运行状态语义理解特征向量。也就是,利用所述上下文编码器来对所述预处理后运行日志数据进行深度语义理解以刻画其所蕴含的高维隐含语义关联特征信息。
所述上下文编码器包括词嵌入层和基于转换器(Transformer)的Bert模型。应可以理解,所述预处理后运行日志数据中包含字母与数字,也就是说,所述预处理后运行日志数据并非结构化数据。而所述词嵌入层的作用在于将所述预处理后运行日志数据的各个词进行向量化转化以将一个词映射转化为一个词嵌入向量,从而得到词嵌入向量的序列。其中,所述词嵌入层可以基于词袋模型来构建,或者,基于低维语义嵌入模型来构建,例如,Word2Vec等。所述基于转换器的Bert模型的作用为对所述词嵌入向量的序列进行基于全局的上下文语义编码以得到多个上下文运行状态语义理解特征向量。也就是,基于Transformer思想,利用转换器能够捕捉长距离上下文依赖的特性,对所述词嵌入向量的序列中各个词嵌入向量进行基于全局的上下文语义编码以得到以所述词嵌入向量的序列的整体语义关联为上下文背景的上下文语义关联特征表示,即,所述多个上下文运行状态语义理解特征向量。
图3为根据本申请实施例的用于智慧城市的网关数据管理方法中对所述预处理后运行日志数据进行分词处理后通过包含词嵌入层的上下文编码器以得到多个上下文运行状态语义理解特征向量的流程图。如图3所示,对所述预处理后运行日志数据进行分词处理后通过包含词嵌入层的上下文编码器以得到多个上下文运行状态语义理解特征向量,包括步骤:S210,对所述预处理后运行日志数据进行分词处理以获得词序列;S220,将所述词序列通过所述词嵌入层以将所述词序列中各个词转化为词嵌入向量以得到词嵌入向量的序列;以及,S230,将所述词嵌入向量的序列输入所述包含词嵌入层的上下文编码器的转换器以得到所述多个上下文运行状态语义理解特征向量。
图4为根据本申请实施例的用于智慧城市的网关数据管理方法中将所述词嵌入向量的序列输入所述包含词嵌入层的上下文编码器的转换器以得到所述多个上下文运行状态语义理解特征向量的流程图。如图4所示,将所述词嵌入向量的序列输入所述包含词嵌入层的上下文编码器的转换器以得到所述多个上下文运行状态语义理解特征向量,包括步骤:S310,将所述词嵌入向量的序列排列为输入向量;S320,将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;S330,计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;S340,对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;S350,将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,S360,将所述自注意力特征矩阵与以所述词嵌入向量的序列中各个词嵌入向量作为值向量分别进行相乘以得到所述多个上下文运行状态语义理解特征向量。
在步骤S140中,将所述多个上下文运行状态语义理解特征向量进行二维排列为全局语义输入矩阵后通过作为特征提取器的卷积神经网络模型以得到局部语义增强全局语义特征向量。考虑到运行日志数据中各个字段之间具有不同程度的隐含关联关系,譬如静态信息ID(Static ID)与静态信息ID对应的静态信息文本(Static Text)之间的信息相关程度较高,而与附加信息(AppendInfo)之间的信息相关程度较低。如果能够提取到这种隐含的关联关系,显然能够提升对于数据网关的运行状态异常检测的精准度。由此,在本申请的技术方案中,将所述多个上下文运行状态语义理解特征向量进行二维排列为全局语义输入矩阵后通过作为特征提取器的卷积神经网络模型以得到局部语义增强全局语义特征向量。也就是,使用在局部关联特征提取领域具有优异性能表现的卷积神经网络模型来对所述全局语义输入矩阵进行基于卷积核的特征过滤以捕捉所述全局语义输入矩阵中的高维局部隐含关联特征。
具体地,在本申请实施例中,将所述多个上下文运行状态语义理解特征向量进行二维排列为全局语义输入矩阵后通过作为特征提取器的卷积神经网络模型以得到局部语义增强全局语义特征向量,包括:使用所述卷积神经网络模型的各层在层的正向传递中分别进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行基于局部特征矩阵的均值池化以得到池化特征图;以及,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述卷积神经网络模型的最后一层的输出为所述局部语义增强全局语义特征向量,所述卷积神经网络模型的第一层的输入为所述全局语义输入矩阵。
在步骤S150和步骤S160中,将所述多个上下文运行状态语义理解特征向量进行级联以得到全局语义特征向量,并融合所述局部语义增强全局语义特征向量和所述全局语义特征向量以得到分类特征向量。虽然卷积神经网络在局部关联特征提取方面具有优异的性能表现,但受限于卷积编码的局限性,由所述作为特征提取器的卷积神经网络模型所提取得到的特征会具有相对较小的特征感受野,也就是说,所述局部语义增强全局语义特征向量在全局特征表征方面的表现较弱。为了弥补这种局限性,在本申请的技术方案中,首先,将所述多个上下文运行状态语义理解特征向量进行级联以保留原始的全局语义特征信息,从而得到全局语义特征向量。然后,融合所述局部语义增强全局语义特征向量和所述全局语义特征向量以得到分类特征向量,所述分类特征向量既避免了全局语义特征信息的大量丢失,又包含了局部的高维隐含关联特征信息,提高了后续分类的准确性。
具体地,在本申请实施例中,以如下公式将所述多个上下文运行状态语义理解特征向量进行级联以得到全局语义特征向量;其中,所述公式为:
X=Concat[Va,Vb,···,Vn]
其中,Va,Vb,···,Vn表示所述多个上下文运行状态语义理解特征向量,Concat[·,·]表示级联函数,X表示所述全局语义特征向量。
具体地,在本申请实施例中,融合所述局部语义增强全局语义特征向量和所述全局语义特征向量以得到分类特征向量的编码过程,包括:首先,计算所述局部语义增强全局语义特征向量和所述全局语义特征向量的关联-概率密度分布仿射映射因数以得到第一关联-概率密度分布仿射映射因数和第二关联-概率密度分布仿射映射因数;接着,以所述第一关联-概率密度分布仿射映射因数和所述第二关联-概率密度分布仿射映射因数作为权重,分别对所述局部语义增强全局语义特征向量和所述全局语义特征向量进行加权以得到加权后局部语义增强全局语义特征向量和加权后全局语义特征向量;然后,将所述加权后局部语义增强全局语义特征向量和所述加权后全局语义特征向量进行级联以得到所述分类特征向量。
这里,在融合所述局部语义增强全局语义特征向量和所述全局语义特征向量得到所述分类特征向量时,如果能够提升所述局部语义增强全局语义特征向量和所述全局语义特征向量的逐位置关联性以及其整体特征分布在类概率密度分布下的一致性,就可以提升所述局部语义增强全局语义特征向量和所述全局语义特征向量的融合效果,以提升融合得到的所述分类特征向量通过分类器得到的分类结果的准确性。
因此,本申请的申请人计算所述局部语义增强全局语义特征向量,例如记为V1和所述全局语义特征向量,例如记为V2的关联-概率密度分布仿射映射因数,表示为:
Figure BDA0004127256880000141
Figure BDA0004127256880000142
其中,V1和V2分别表示所述局部语义增强全局语义特征向量和所述全局语义特征向量,M为所述局部语义增强全局语义特征向量和所述全局语义特征向量之间的逐位置关联得到的关联矩阵,μ和∑是所述局部语义增强全局语义特征向量和所述全局语义特征向量构成的高斯密度图的均值向量和协方差矩阵,
Figure BDA0004127256880000143
表示矩阵乘法,exp(·)表示自然指数函数运算,w1和w2分别表示所述第一关联-概率密度分布仿射映射因数和所述第二关联-概率密度分布仿射映射因数。
也就是,通过构造所述局部语义增强全局语义特征向量V1和所述全局语义特征向量V2之间的关联特征空间和由高斯概率密度表示的类概率密度空间,可以通过将所述局部语义增强全局语义特征向量V1和所述全局语义特征向量V2分别映射到关联特征空间和类概率密度空间内的仿射单应性子空间中,来提取特征表示在关联特征域和类概率密度域内的符合仿射单应性的表示,通过以所述关联-概率密度分布仿射映射因数值w1和w2分别对所述局部语义增强全局语义特征向量V1和所述全局语义特征向量V2进行加权,就可以提升所述局部语义增强全局语义特征向量V1和所述全局语义特征向量V2的特征表示的逐位置关联性和整体概率密度分布上的一致性,从而提升所述局部语义增强全局语义特征向量V1和所述全局语义特征向量V2的融合效果,以提升融合得到的所述分类特征向量通过分类器得到的分类结果的准确性。
在步骤S170中,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示待检测数据网关的运行状态是否异常。也就是,在本申请的技术方案中,所述分类器的标签包括待检测数据网关的运行状态出现异常(第一标签),以及,待检测数据网关的运行状态没有出现异常(第二标签),其中,所述分类器通过软最大值函数来确定所述分类特征向量属于哪个分类标签。值得注意的是,这里的所述第一标签和所述第二标签并不包含人为设定的概念,实际上在训练过程当中,计算机模型并没有“待检测数据网关的运行状态是否异常”这个概念,其只是有两个分类标签,例如L1和L2,且输出特征在这两个分类标签下的概率,即p1和p2之和为一。因此,待检测数据网关的运行状态是否异常的分类结果实际上是通过分类标签转化为符合自然规律的二分类的类概率分布,实质上用到的是标签的自然概率分布的物理意义,而不是“待检测数据网关的运行状态是否异常”的语言文本意义。应可以理解,在本申请的技术方案中,在得到所述分类结果后,响应于所述分类结果为待检测数据网关的运行状态出现异常,可以产生预警提示信息来提醒相关工作人员进行维修,从而优化数据网关的功能,推进智慧城市的发展。
具体地,在本申请实施例中,将所述分类特征向量通过分类器以得到分类结果的编码过程,包括:首先,将所述分类特征向量输入所述分类器的Softmax分类函数以得到所述分类特征向量归属于各个分类标签的概率值;然后,将最大概率值对应的分类标签确定为所述分类结果。
综上,基于本申请实施例的用于智慧城市的网关数据管理方法被阐明,其采用基于深度学习及人工智能的自然语言处理技术,以通过包含词嵌入层的上下文语义编码器和作为特征提取器的卷积神经网络模型对于数据网关在运行过程中产生的在预定时间段的运行日志数据进行智能化分析以对于数据网关的运行状态进行异常检测。这样,能够在数据网关运行过程中出现异常时及时发出预警来提醒相关工作人员进行维修,从而优化数据网关的功能,推进智慧城市的发展。
示例性系统
图5为根据本申请实施例的用于智慧城市的网关数据管理系统的框图。如图5所示,根据本申请实施例的用于智慧城市的网关数据管理系统100,包括:运行日志获取模块110,用于获取待检测数据网关在预定时间段的运行日志数据;预处理模块120,用于对所述运行日志数据进行数据预处理后以得到预处理后运行日志数据;上下文语义理解模块130,用于对所述预处理后运行日志数据进行分词处理后通过包含词嵌入层的上下文编码器以得到多个上下文运行状态语义理解特征向量;局部语义增强模块140,用于将所述多个上下文运行状态语义理解特征向量进行二维排列为全局语义输入矩阵后通过作为特征提取器的卷积神经网络模型以得到局部语义增强全局语义特征向量;级联整合模块150,用于将所述多个上下文运行状态语义理解特征向量进行级联以得到全局语义特征向量;融合模块160,用于融合所述局部语义增强全局语义特征向量和所述全局语义特征向量以得到分类特征向量;以及,检测结果生成模块170,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示待检测数据网关的运行状态是否异常。
这里,本领域技术人员可以理解,上述用于智慧城市的网关数据管理系统100中的各个单元和模块的具体功能和操作已经在上面参考图1到图4的用于智慧城市的网关数据管理方法的描述中得到了详细介绍,并因此,将省略其重复描述。
如上所述,根据本申请实施例的用于智慧城市的网关数据管理系统100可以实现在各种终端设备中,例如适用于智慧城市的网关数据管理的服务器等。在一个示例中,根据本申请实施例的用于智慧城市的网关数据管理系统100可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该用于智慧城市的网关数据管理系统100可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该用于智慧城市的网关数据管理系统100同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该用于智慧城市的网关数据管理系统100与该终端设备也可以是分立的设备,并且该用于智慧城市的网关数据管理系统100可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
示例性电子设备
下面,参考图6来描述根据本申请实施例的电子设备。图6为根据本申请实施例的电子设备的框图。如图6所示,电子设备10包括一个或多个处理器11和存储器12。
处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备10中的其他组件以执行期望的功能。
存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的用于智慧城市的网关数据管理方法中的功能以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如运行日志数据等各种内容。
在一个示例中,电子设备10还可以包括:输入装置13和输出装置14,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
该输入装置13可以包括例如键盘、鼠标等等。
该输出装置14可以向外部输出各种信息,包括分类结果等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图6中仅示出了该电子设备10中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的用于智慧城市的网关数据管理方法中的功能中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的用于智慧城市的网关数据管理方法中的功能中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (10)

1.一种用于智慧城市的网关数据管理方法,其特征在于,包括:
获取待检测数据网关在预定时间段的运行日志数据;
对所述运行日志数据进行数据预处理后以得到预处理后运行日志数据;
对所述预处理后运行日志数据进行分词处理后通过包含词嵌入层的上下文编码器以得到多个上下文运行状态语义理解特征向量;
将所述多个上下文运行状态语义理解特征向量进行二维排列为全局语义输入矩阵后通过作为特征提取器的卷积神经网络模型以得到局部语义增强全局语义特征向量;
将所述多个上下文运行状态语义理解特征向量进行级联以得到全局语义特征向量;
融合所述局部语义增强全局语义特征向量和所述全局语义特征向量以得到分类特征向量;以及
将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示待检测数据网关的运行状态是否异常。
2.根据权利要求1所述的用于智慧城市的网关数据管理方法,其特征在于,对所述预处理后运行日志数据进行分词处理后通过包含词嵌入层的上下文编码器以得到多个上下文运行状态语义理解特征向量,包括:
对所述预处理后运行日志数据进行分词处理以获得词序列;
将所述词序列通过所述词嵌入层以将所述词序列中各个词转化为词嵌入向量以得到词嵌入向量的序列;以及
将所述词嵌入向量的序列输入所述包含词嵌入层的上下文编码器的转换器以得到所述多个上下文运行状态语义理解特征向量。
3.根据权利要求2所述的用于智慧城市的网关数据管理方法,其特征在于,将所述词嵌入向量的序列输入所述包含词嵌入层的上下文编码器的转换器以得到所述多个上下文运行状态语义理解特征向量,包括:
将所述词嵌入向量的序列排列为输入向量;
将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;
计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;
对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;
将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及
将所述自注意力特征矩阵与以所述词嵌入向量的序列中各个词嵌入向量作为值向量分别进行相乘以得到所述多个上下文运行状态语义理解特征向量。
4.根据权利要求3所述的用于智慧城市的网关数据管理方法,其特征在于,将所述多个上下文运行状态语义理解特征向量进行二维排列为全局语义输入矩阵后通过作为特征提取器的卷积神经网络模型以得到局部语义增强全局语义特征向量,包括:使用所述卷积神经网络模型的各层在层的正向传递中分别进行:
对输入数据进行卷积处理以得到卷积特征图;
对所述卷积特征图进行基于局部特征矩阵的均值池化以得到池化特征图;以及
对所述池化特征图进行非线性激活以得到激活特征图;
其中,所述卷积神经网络模型的最后一层的输出为所述局部语义增强全局语义特征向量,所述卷积神经网络模型的第一层的输入为所述全局语义输入矩阵。
5.根据权利要求4所述的用于智慧城市的网关数据管理方法,其特征在于,将所述多个上下文运行状态语义理解特征向量进行级联以得到全局语义特征向量,包括:
以如下公式将所述多个上下文运行状态语义理解特征向量进行级联以得到全局语义特征向量;
其中,所述公式为:
X=Concat[Va,Vb,···,Vn]
其中,Va,Vb,···,Vn表示所述多个上下文运行状态语义理解特征向量,Concat[·,·]表示级联函数,X表示所述全局语义特征向量。
6.根据权利要求5所述的用于智慧城市的网关数据管理方法,其特征在于,融合所述局部语义增强全局语义特征向量和所述全局语义特征向量以得到分类特征向量,包括:
计算所述局部语义增强全局语义特征向量和所述全局语义特征向量的关联-概率密度分布仿射映射因数以得到第一关联-概率密度分布仿射映射因数和第二关联-概率密度分布仿射映射因数;
以所述第一关联-概率密度分布仿射映射因数和所述第二关联-概率密度分布仿射映射因数作为权重,分别对所述局部语义增强全局语义特征向量和所述全局语义特征向量进行加权以得到加权后局部语义增强全局语义特征向量和加权后全局语义特征向量;以及
将所述加权后局部语义增强全局语义特征向量和所述加权后全局语义特征向量进行级联以得到所述分类特征向量。
7.根据权利要求6所述的用于智慧城市的网关数据管理方法,其特征在于,计算所述局部语义增强全局语义特征向量和所述全局语义特征向量的关联-概率密度分布仿射映射因数以得到第一关联-概率密度分布仿射映射因数和第二关联-概率密度分布仿射映射因数,包括:
以如下公式计算所述局部语义增强全局语义特征向量和所述全局语义特征向量的关联-概率密度分布仿射映射因数以得到第一关联-概率密度分布仿射映射因数和第二关联-概率密度分布仿射映射因数;
其中,所述公式为:
Figure FDA0004127256870000031
Figure FDA0004127256870000032
其中,V1和V2分别表示所述局部语义增强全局语义特征向量和所述全局语义特征向量,M为所述局部语义增强全局语义特征向量和所述全局语义特征向量之间的逐位置关联得到的关联矩阵,μ和∑是所述局部语义增强全局语义特征向量和所述全局语义特征向量构成的高斯密度图的均值向量和协方差矩阵,
Figure FDA0004127256870000033
表示矩阵乘法,exp(·)表示自然指数函数运算,w1和w2分别表示所述第一关联-概率密度分布仿射映射因数和所述第二关联-概率密度分布仿射映射因数。
8.根据权利要求7所述的用于智慧城市的网关数据管理方法,其特征在于,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示待检测数据网关的运行状态是否异常,包括:
将所述分类特征向量输入所述分类器的Softmax分类函数以得到所述分类特征向量归属于各个分类标签的概率值;以及
将最大概率值对应的分类标签确定为所述分类结果。
9.一种用于智慧城市的网关数据管理系统,其特征在于,包括:
运行日志获取模块,用于获取待检测数据网关在预定时间段的运行日志数据;
预处理模块,用于对所述运行日志数据进行数据预处理后以得到预处理后运行日志数据;
上下文语义理解模块,用于对所述预处理后运行日志数据进行分词处理后通过包含词嵌入层的上下文编码器以得到多个上下文运行状态语义理解特征向量;
局部语义增强模块,用于将所述多个上下文运行状态语义理解特征向量进行二维排列为全局语义输入矩阵后通过作为特征提取器的卷积神经网络模型以得到局部语义增强全局语义特征向量;
级联整合模块,用于将所述多个上下文运行状态语义理解特征向量进行级联以得到全局语义特征向量;
融合模块,用于融合所述局部语义增强全局语义特征向量和所述全局语义特征向量以得到分类特征向量;以及
检测结果生成模块,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示待检测数据网关的运行状态是否异常。
10.根据权利要求9所述的用于智慧城市的网关数据管理系统,其特征在于,所述上下文语义理解模块,进一步用于:
对所述预处理后运行日志数据进行分词处理以获得词序列;
将所述词序列通过所述词嵌入层以将所述词序列中各个词转化为词嵌入向量以得到词嵌入向量的序列;以及
将所述词嵌入向量的序列输入所述包含词嵌入层的上下文编码器的转换器以得到所述多个上下文运行状态语义理解特征向量。
CN202310249215.6A 2023-03-15 2023-03-15 用于智慧城市的网关数据管理方法及其系统 Pending CN116257406A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310249215.6A CN116257406A (zh) 2023-03-15 2023-03-15 用于智慧城市的网关数据管理方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310249215.6A CN116257406A (zh) 2023-03-15 2023-03-15 用于智慧城市的网关数据管理方法及其系统

Publications (1)

Publication Number Publication Date
CN116257406A true CN116257406A (zh) 2023-06-13

Family

ID=86679210

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310249215.6A Pending CN116257406A (zh) 2023-03-15 2023-03-15 用于智慧城市的网关数据管理方法及其系统

Country Status (1)

Country Link
CN (1) CN116257406A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116680557A (zh) * 2023-08-03 2023-09-01 山东省地质矿产勘查开发局第八地质大队(山东省第八地质矿产勘查院) 用于煤层气钻井工程的实时监测系统及其方法
CN117215766A (zh) * 2023-06-26 2023-12-12 杭州喜倍科技有限公司 多媒体智能调度机及其方法
CN117235630A (zh) * 2023-11-15 2023-12-15 吉林大学 智慧病区可视化管理系统及其方法
CN117237559A (zh) * 2023-11-10 2023-12-15 陕西天润科技股份有限公司 面向数字孪生城市的三维模型数据智能分析方法及系统
CN117676099A (zh) * 2024-02-01 2024-03-08 深圳市丛文安全电子有限公司 基于物联网的安全预警方法及系统
CN118227132A (zh) * 2024-05-23 2024-06-21 广东汉佳信息技术有限公司 基于流程自定义的处理界面自动生成方法及系统
CN118227132B (zh) * 2024-05-23 2024-09-10 广东汉佳信息技术有限公司 基于流程自定义的处理界面自动生成方法及系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117215766A (zh) * 2023-06-26 2023-12-12 杭州喜倍科技有限公司 多媒体智能调度机及其方法
CN116680557A (zh) * 2023-08-03 2023-09-01 山东省地质矿产勘查开发局第八地质大队(山东省第八地质矿产勘查院) 用于煤层气钻井工程的实时监测系统及其方法
CN116680557B (zh) * 2023-08-03 2023-10-27 山东省地质矿产勘查开发局第八地质大队(山东省第八地质矿产勘查院) 用于煤层气钻井工程的实时监测系统及其方法
CN117237559A (zh) * 2023-11-10 2023-12-15 陕西天润科技股份有限公司 面向数字孪生城市的三维模型数据智能分析方法及系统
CN117237559B (zh) * 2023-11-10 2024-02-27 陕西天润科技股份有限公司 面向数字孪生城市的三维模型数据智能分析方法及系统
CN117235630A (zh) * 2023-11-15 2023-12-15 吉林大学 智慧病区可视化管理系统及其方法
CN117235630B (zh) * 2023-11-15 2024-03-05 吉林大学 智慧病区可视化管理系统及其方法
CN117676099A (zh) * 2024-02-01 2024-03-08 深圳市丛文安全电子有限公司 基于物联网的安全预警方法及系统
CN117676099B (zh) * 2024-02-01 2024-04-05 深圳市丛文安全电子有限公司 基于物联网的安全预警方法及系统
CN118227132A (zh) * 2024-05-23 2024-06-21 广东汉佳信息技术有限公司 基于流程自定义的处理界面自动生成方法及系统
CN118227132B (zh) * 2024-05-23 2024-09-10 广东汉佳信息技术有限公司 基于流程自定义的处理界面自动生成方法及系统

Similar Documents

Publication Publication Date Title
CN115796173B (zh) 针对监管报送需求的数据处理方法和系统
CN115203380B (zh) 基于多模态数据融合的文本处理系统及其方法
CN116257406A (zh) 用于智慧城市的网关数据管理方法及其系统
CN115783923B (zh) 基于大数据的电梯故障模式识别系统
CN116629275B (zh) 一种基于大数据的智能决策支持系统及方法
CN110705301A (zh) 实体关系抽取方法及装置、存储介质、电子设备
CN116247824B (zh) 电力设备的控制方法及其系统
CN117251699B (zh) 基于人工智能的医疗大数据分析方法及系统
CN112052684A (zh) 电力计量的命名实体识别方法、装置、设备和存储介质
CN116245513B (zh) 基于规则库的自动化运维系统及其方法
CN116015837A (zh) 用于计算机网络信息安全的入侵检测方法及系统
CN116308754B (zh) 一种银行信贷风险预警系统及其方法
CN110968725B (zh) 图像内容描述信息生成方法、电子设备及存储介质
CN111091004B (zh) 一种语句实体标注模型的训练方法、训练装置及电子设备
CN113360654B (zh) 文本分类方法、装置、电子设备及可读存储介质
JP7005045B2 (ja) ナイーブベイズ分類器に対する限界攻撃方法
CN116579618B (zh) 基于风险管理的数据处理方法、装置、设备及存储介质
CN116127019B (zh) 动态参数与可视化模型生成web 2d自动建模引擎系统
CN116759053A (zh) 基于物联网系统的医疗体系防控方法及系统
CN115471216A (zh) 智慧实验室管理平台的数据管理方法
CN117421655A (zh) 工业互联网数据流异常检测方法及系统
CN117316462A (zh) 一种医疗数据管理方法
CN112800217A (zh) 基于向量关联性矩阵的政务事务处理报告的智能评估方法
CN117056902A (zh) 物联网密码管理方法及系统
CN116629211B (zh) 基于人工智能的写作方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination