CN116400201A - 一种芯粒工作状态监测方法、装置、电子设备及存储介质 - Google Patents

一种芯粒工作状态监测方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN116400201A
CN116400201A CN202310660157.6A CN202310660157A CN116400201A CN 116400201 A CN116400201 A CN 116400201A CN 202310660157 A CN202310660157 A CN 202310660157A CN 116400201 A CN116400201 A CN 116400201A
Authority
CN
China
Prior art keywords
core particle
working
working parameter
moment
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310660157.6A
Other languages
English (en)
Other versions
CN116400201B (zh
Inventor
王嘉诚
张少仲
张栩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongcheng Hualong Computer Technology Co Ltd
Original Assignee
Zhongcheng Hualong Computer Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongcheng Hualong Computer Technology Co Ltd filed Critical Zhongcheng Hualong Computer Technology Co Ltd
Priority to CN202310660157.6A priority Critical patent/CN116400201B/zh
Publication of CN116400201A publication Critical patent/CN116400201A/zh
Application granted granted Critical
Publication of CN116400201B publication Critical patent/CN116400201B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/28Testing of electronic circuits, e.g. by signal tracer
    • G01R31/2851Testing of integrated circuits [IC]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E30/00Energy generation of nuclear origin
    • Y02E30/30Nuclear fission reactors

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及芯粒监测技术领域,特别涉及一种芯粒工作状态监测方法、装置、电子设备及存储介质,其中方法包括:获取各芯粒待检测时刻的各项工作参数检测值及一段连续历史时刻的工作参数,并进行标准化处理;截取待检测时刻前最新一段历史时刻的工作参数,输入训练好的CNN‑LSTM预测模型,获得待检测时刻对应的工作参数预测值;基于一段连续历史时刻的工作参数,确定各项工作参数待检测时刻的参照值;基于各芯粒待检测时刻的各项工作参数检测值、预测值及参照值,判定各芯粒工作状态是否出现异常,是则报警,否则继续检测。本发明能够监测各个芯粒的工作状态,以及时发现异常征兆。

Description

一种芯粒工作状态监测方法、装置、电子设备及存储介质
技术领域
本发明实施例涉及芯粒监测技术领域,特别涉及一种芯粒工作状态监测方法、装置、电子设备及存储介质。
背景技术
芯粒(Chiplet,又称小芯片)是一种功能电路块,芯粒技术是将一个功能丰富且面积较大的芯片裸片(die)拆分成多个芯粒(chiplet),并将这些具有特定功能的芯粒通过封装的形式组合在一起,最终形成一个系统芯片。采用芯粒技术的半导体器件包括多个相互连接、配合的芯粒,若其中有芯粒出现异常,则会影响器件整体的工作效果,甚至导致芯片功能失效。
目前,现有技术多是对面积较大、功能较完整的芯片进行整体监测,如利用特定电路监测芯片是否耗电正常等。对于多芯粒的器件,通常难以确定每个芯粒的实际状态。
发明内容
针对上述至少一部分不足之处,本发明实施例提供了一种芯粒工作状态监测方法、装置、电子设备及存储介质,能够通过各个芯粒的工作参数动态监测单个芯粒及整体器件的工作状态。
第一方面,本发明实施例提供了一种芯粒工作状态监测方法,包括:
获取各芯粒待检测时刻的各项工作参数检测值及一段连续历史时刻的工作参数,并进行标准化处理;
截取待检测时刻前最新一段历史时刻的工作参数,输入训练好的CNN-LSTM预测模型,获得待检测时刻对应的工作参数预测值;所述CNN-LSTM预测模型是以样本工作参数为输入和以相应的预测工作参数为输出进行训练的;
基于一段连续历史时刻的工作参数,确定各项工作参数待检测时刻的参照值;
基于各芯粒待检测时刻的各项工作参数检测值、预测值及参照值,判定各芯粒工作状态是否出现异常,是则报警,否则继续检测。
可选地,单个芯粒的各项工作参数至少包括芯粒的温度、输入电压、输出电压和电流。
可选地,所述CNN-LSTM预测模型包括连接的CNN网络及LSTM网络;其中,所述LSTM网络包括输入层、全连接层、LSTM层、注意力机制层和输出层,所述输入层用于输入所述CNN网络提取的特征,所述全连接层用于融合输入的特征,所述LSTM层用于基于融合后的特征提取隐层状态,所述注意力机制层用于根据注意力机制调整各隐层状态的概率分布,修正最终输出特征,所述输出层用于通过全连接操作,基于最终输出特征得到对应的工作参数预测值。
可选地,所述LSTM层中,LSTM单元结构的输入门和遗忘门的前向通道上分别增设有Dropout层,用于在前向传播中对设定范围内的神经元进行失活处理,以抑制过拟合现象;
其中,设于输入门的前向通道的Dropout层丢弃率取值范围为[0.2, 0.4],设于遗忘门的前向通道的Dropout层丢弃率取值范围为[0.1, 0.3],且设于遗忘门的前向通道的Dropout层丢弃率低于设于输入门的前向通道的Dropout层丢弃率。
可选地,所述基于一段连续历史时刻的工作参数,确定各项工作参数待检测时刻的参照值,包括:
基于一段连续历史时刻的工作参数,通过多项式拟合,确定各项工作参数对应待检测时刻的参照值。
可选地,所述基于各芯粒待检测时刻的各项工作参数检测值、预测值及参照值,判定各芯粒工作状态是否出现异常,包括:
对于每个芯粒,比较各项工作参数待检测时刻的预测值与参照值,若各项预测值与参照值之间的偏差程度之和大于预设的第一阈值,则认为预测结果出现问题或芯粒出现异常征兆,进行报错,否则继续比较各项工作参数检测值、预测值及参照值,若单项工作参数的预测值与检测值之间的偏差大于预测值与参照值之间的偏差,则认为该项工作参数异常;
若单个芯粒有超过一项工作参数异常,则认为该芯粒工作状态出现异常。
可选地,该方法还包括:
对于各个芯粒,若有且只有一项工作参数异常,则将该项工作参数的预测值取代检测值作为当前时刻的工作参数存入,更新历史时刻的工作参数数据集。
第二方面,本发明实施例还提供了一种芯粒工作状态监测装置,包括:
获取模块,用于获取各芯粒待检测时刻的各项工作参数检测值及一段连续历史时刻的工作参数,并进行标准化处理;
预测模块,用于截取待检测时刻前最新一段历史时刻的工作参数,输入训练好的CNN-LSTM预测模型,获得待检测时刻对应的工作参数预测值;所述CNN-LSTM预测模型是以样本工作参数为输入和以相应的预测工作参数为输出进行训练的;
参考模块,用于基于一段连续历史时刻的工作参数,确定各项工作参数待检测时刻的参照值;
判定模块,用于基于各芯粒待检测时刻的各项工作参数检测值、预测值及参照值,判定各芯粒工作状态是否出现异常,是则报警,否则继续检测。
第三方面,本发明实施例还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时,实现本说明书任一实施例所述的方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行本说明书任一实施例所述的方法。
本发明实施例提供了一种芯粒工作状态监测方法、装置、电子设备及存储介质,本发明采用CNN-LSTM预测模型获取各芯粒待检测时刻的工作参数预测值,再结合根据历史时刻工作参数确定的参照值,对芯粒待检测时刻工作参数检测值进行异常判定,从而监测各芯粒实际工作状态,以便及时发现异常征兆。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的一种芯粒工作状态监测方法流程图;
图2是本发明一实施例提供的一种电子设备的硬件架构图;
图3是本发明一实施例提供的一种芯粒工作状态监测装置结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如前所述,采用芯粒技术的半导体器件包括多个相互连接、配合的芯粒,若其中有芯粒出现异常,则会影响器件整体的工作效果,甚至导致芯片功能失效。目前,现有技术多是对面积较大、功能较完整的芯片进行整体监测,如利用特定电路监测芯片是否耗电正常等。对于多芯粒的器件,通常难以确定每个芯粒的实际状态。有鉴于此,本发明提出一种对各个芯粒工作状态进行检测及分析的方法,以及时发现异常征兆。
下面描述以上构思的具体实现方式。
请参考图1,本发明实施例提供了一种芯粒工作状态监测方法,该方法包括:
步骤100,获取各芯粒待检测时刻的各项工作参数检测值及一段连续历史时刻的工作参数,并进行标准化处理;
标准化处理能够消除参数单位等因素对数值变化特征的影响;
优选地,单个芯粒的各项工作参数至少包括芯粒的温度、输入电压、输出电压和电流;
步骤102,截取待检测时刻前最新一段历史时刻的工作参数,输入训练好的CNN-LSTM预测模型,获得待检测时刻对应的工作参数预测值;
所述CNN-LSTM预测模型是以样本工作参数为输入和以相应的预测工作参数为输出进行训练的;
此步骤102中,截取待检测时刻前最新一段历史时刻的工作参数,即截取待检测时刻前邻近时段的数据,通过最新的数据进行预测,能够提高预测准确性;
所述CNN-LSTM预测模型基于CNN网络和LSTM网络构建,能够根据已有的历史时段的数据预测下一时刻的数据;
步骤104,基于一段连续历史时刻的工作参数,确定各项工作参数待检测时刻的参照值;
步骤106,基于各芯粒待检测时刻的各项工作参数检测值、预测值及参照值,判定各芯粒工作状态是否出现异常,是则报警,否则继续检测,即返回步骤100。
本发明实施例中,采用基于CNN网络和LSTM网络构建的预测模型挖掘时序数据的关联及规律,对各芯粒待检测时刻的各项工作参数进行预测,同时,考虑到正常状态下芯片工作参数不会在短时间内发生明显跳变,还根据连续历史时刻的工作参数确定各项工作参数对应待检测时刻的参照值,用作判断是否出现异常的参考。本发明能够智能化、自动化地监测单个芯粒工作状态是否正常,为及时发现芯粒器件异常征兆提供了技术支持。
下面描述图1所示的各个步骤的执行方式。
可选地,针对步骤100,还包括:
对各芯粒待检测时刻的各项工作参数检测值进行初步筛选;若超过一项工作参数检测值缺失或明显错误,则直接报错。
进一步地,若有一项工作参数检测值缺失或明显错误,则根据历史时刻的对应数据进行纠错,同时上报纠错事件及纠错结果。
采用上述实施例,可以快速发现芯粒的工作状态异常或检测结果异常,以便及时通知工作人员进行处理。对于偶发的采集错误,也能够进行处理,避免出现虚警。进行纠错的具体方式可参考现有技术,如奇异谱缺失填补法、KNNI计算法等。
可选地,针对步骤102,所述CNN-LSTM预测模型包括连接的CNN网络及LSTM网络,其中所述LSTM网络包括输入层、全连接层、LSTM层、注意力机制层和输出层,所述输入层用于输入所述CNN网络提取的特征,所述全连接层用于进一步融合输入的特征,所述LSTM层用于基于融合后的特征提取隐层状态,所述注意力机制层用于根据注意力机制调整各隐层状态的概率分布,修正最终输出特征,所述输出层用于通过全连接操作,基于最终输出特征得到对应的工作参数预测值。
上述实施例在现有LSTM网络的基础上进行了改进,在LSTM层前增设全连接层,进一步融合输入的特征,以增加网络深度,提升特征提取效率,在LSTM层后利用注意力机制层调整模型对于目标信息的注意力,降低或忽略无关信息,而放大所需的重要信息。在LSTM网络中使用注意力机制来计算当前时间步与之前时间步的相似度,进而得到一个加权表示的上下文向量,这个向量可以与当前时间步的输入进行加和,得到一个新的输入向量。这样,模型可以更加灵活地利用历史信息来生成当前的输出,从而深度挖掘时序数据内部的关联关系。
更进一步地,所述LSTM层中,LSTM单元结构的输入门和遗忘门的前向通道上分别增设有Dropout层,用于在前向传播中对设定范围内的神经元进行失活处理,以抑制模型的过拟合现象;其中,设于输入门的前向通道的Dropout层的丢弃率取值范围为[0.2, 0.4],设于遗忘门的前向通道的Dropout层的丢弃率取值范围为[0.1, 0.3],且设于遗忘门的前向通道的Dropout层的丢弃率低于设于输入门的前向通道的Dropout层的丢弃率。
在模型训练过程中,神经网络会出现一定程度的过拟合现象,过拟合会影响模型预测结果。对于芯粒工作参数,正常范围的取值数量较为有限,训练样本普遍偏少,且所述LSTM网络相比现有技术增加了网络深度,这些因素都可能加重过拟合问题。为抑制过拟合现象,本发明对LSTM单元结构增设了Dropout层,Dropout层可在每轮训练中随机选取一定量的节点进行失活,以提升模型的泛化能力。LSTM单元结构包括遗忘门、输入门和输出门,用于控制记忆神经元参数,输入门决定LSTM学习的新信息,遗忘门决定从历史状态中丢弃哪些历史信息,最终由输出门决定输出信息。上述实施例对LSTM单元结构中输入门和遗忘门的前向通道分别增设Dropout层,且相比输入门,对设于遗忘门的Dropout层设置更低的丢弃率,令输入门适当失活而遗忘门失活少于输入门,能够更为有效的保留长时间的历史状态信息,相比现有技术,能更好地缓解训练带来的泛化能力降低问题,并提高模型的准确性与鲁棒性。
可选地,针对步骤104,进一步包括:
基于一段连续历史时刻的工作参数,通过多项式拟合,确定各项工作参数对应待检测时刻的参照值。
采用上述实施例,可以综合历史时刻的工作参数变化规律,从而确定对应待检测时刻的参照值。在其他实施例中,也可采用其他计算方式确定参照值,例如自回归移动平均模型等。步骤104中的参照值根据数学方法确定,同样反映了工作参数的变化规律,能够为预测模型所得预测值提供参考,也就是综合了不同方式的预测结果,提高预测结果的可靠性。
可选地,针对步骤106,进一步包括:
对于每个芯粒,比较各项工作参数待检测时刻的预测值与参照值,若各项预测值与参照值之间的偏差程度之和大于预设的第一阈值,则认为预测结果出现问题或芯粒出现异常征兆,进行报错,否则继续比较各项工作参数检测值、预测值及参照值,若单项工作参数的预测值与检测值之间的偏差大于预测值与参照值之间的偏差,则认为该项工作参数异常;
若单个芯粒有超过一项工作参数异常,则认为该芯粒工作状态出现异常。
上述实施例在判定芯粒工作状态是否出现异常时,先比较不同方式确定的各项工作参数待检测时刻的预测值与参照值,当预测值与参照值之间存在较大的偏差,通常有两种可能性:其一即预测值或参照值出错,预测模型失效或数学方法计算结果与实际出现较大偏差,其二即预测模型提前发觉了芯粒异常征兆,在这两种情况下,参照值与预测值之间的偏差无法再构成动态阈值。而当各项预测值与参照值之间的偏差程度(即偏差量的绝对值)之和小于等于预设的第一阈值,则可将参照值与预测值之间的偏差程度用作动态阈值,判定检测值是否出现异常。当单个芯粒有一项工作参数异常,可能是检测结果有误,当单个芯粒有多项工作参数异常,则可认为芯粒工作状态出现异常。采用上述实施例,能够动态化地判定工作参数检测值异常,且能够避免检测结果错误造成的误判,有利于智能化、自动化地快速判定芯粒工作状态。
进一步地,针对步骤106,若多项预测值与参照值之间的偏差程度之和大于预设的第一阈值,而单项工作参数的预测值与检测值之间的偏差小于预设的第二阈值,则可认为预测模型提前发觉了芯粒异常变化征兆,同样可以认为监测到芯粒工作状态异常。
可选地,针对步骤106,所述报警包括上报工作状态出现异常的芯粒名称及相应的工作参数预测值、参照值与检测值,以便工作人员进行进一步人工检测。
进一步地,所述进行报错同样包括上报出错的芯粒名称及相应的工作参数预测值、参照值与检测值,并提示可能出现的错误原因。
可选地,该方法还包括:
步骤108,对于各个芯粒,若有且只有一项工作参数异常,则将该项工作参数的预测值取代检测值作为当前时刻的工作参数存入,更新历史时刻的工作参数数据集。
采用上述实施例,能够剔除检测错误的数据,获取更加准确、可靠的历史时刻工作参数数据集,以便后续挖掘数据规律,计算预测值及参照值。
如图2、图3所示,本发明实施例还提供了一种芯粒工作状态监测装置。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。从硬件层面而言,如图2所示,为本发明实施例提供的一种芯粒工作状态监测装置所在电子设备的一种硬件架构图,除了图2所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的电子设备通常还可以包括其他硬件,如负责处理报文的转发芯片等等。以软件实现为例,如图3所示,作为一个逻辑意义上的装置,是通过其所在电子设备的CPU将非易失性存储器中对应的计算机程序读取到内存中运行形成的。本实施例提供的一种芯粒工作状态监测装置,包括:
获取模块301,用于获取各芯粒待检测时刻的各项工作参数检测值及一段连续历史时刻的工作参数,并进行标准化处理;
预测模块302,用于截取待检测时刻前最新一段历史时刻的工作参数,输入训练好的CNN-LSTM预测模型,获得待检测时刻对应的工作参数预测值;所述CNN-LSTM预测模型是以样本工作参数为输入和以相应的预测工作参数为输出进行训练的;
参考模块303,用于基于一段连续历史时刻的工作参数,确定各项工作参数待检测时刻的参照值;
判定模块304,用于基于各芯粒待检测时刻的各项工作参数检测值、预测值及参照值,判定各芯粒工作状态是否出现异常,是则报警,否则继续检测。
在本发明实施例中,获取模块301可用于执行上述方法实施例中的步骤100,预测模块302可用于执行上述方法实施例中的步骤102,参考模块303可用于执行上述方法实施例中的步骤104,判定模块304可用于执行上述方法实施例中的步骤106。
可选地,单个芯粒的各项工作参数至少包括芯粒的温度、输入电压、输出电压和电流。
可选地,所述CNN-LSTM预测模型包括连接的CNN网络及LSTM网络,其中所述LSTM网络使用多头注意力机制提高预测准确率。
可选地,参考模块303用于执行:
基于一段连续历史时刻的工作参数,通过多项式拟合,确定各项工作参数对应待检测时刻的参照值。
可选地,判定模块304用于执行:
对于每个芯粒,比较各项工作参数待检测时刻的预测值与参照值,若各项预测值与参照值之间的偏差程度之和大于预设的第一阈值,则认为预测结果出现问题或芯粒出现异常征兆,进行报错,否则继续比较各项工作参数检测值、预测值及参照值,若单项工作参数的预测值与检测值之间的偏差大于预测值与参照值之间的偏差,则认为该项工作参数异常;
若单个芯粒有超过一项工作参数异常,则认为该芯粒工作状态出现异常。
可选地,所述报警包括上报工作状态出现异常的芯粒名称及相应的工作参数预测值、参照值与检测值。
可选地,该装置还包括:
更新模块305,用于执行如下操作:
对于各个芯粒,若有且只有一项工作参数异常,则将该项工作参数的预测值取代检测值作为当前时刻的工作参数存入,更新历史时刻的工作参数数据集。更新模块305可用于执行上述方法实施例中的步骤108。
可以理解的是,本发明实施例示意的结构并不构成对一种芯粒工作状态监测装置的具体限定。在本发明的另一些实施例中,一种芯粒工作状态监测装置可以包括比图示更多或者更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或者软件和硬件的组合来实现。
上述装置内的各模块之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
本发明实施例还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时,实现本发明任一实施例中的一种芯粒工作状态监测方法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序在被处理器执行时,使所述处理器执行本发明任一实施例中的一种芯粒工作状态监测方法。
具体地,可以提供配有存储介质的系统或者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。
在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本发明的一部分。
用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上下载程序代码。
此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作,从而实现上述实施例中任意一项实施例的功能。
此外,可以理解的是,将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展模块中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展模块上的CPU等来执行部分和全部实际操作,从而实现上述实施例中任一实施例的功能。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种芯粒工作状态监测方法,其特征在于,包括:
获取各芯粒待检测时刻的各项工作参数检测值及一段连续历史时刻的工作参数,并进行标准化处理;
截取待检测时刻前最新一段历史时刻的工作参数,输入训练好的CNN-LSTM预测模型,获得待检测时刻对应的工作参数预测值;所述CNN-LSTM预测模型是以样本工作参数为输入和以相应的预测工作参数为输出进行训练的;
基于一段连续历史时刻的工作参数,确定各项工作参数待检测时刻的参照值;
基于各芯粒待检测时刻的各项工作参数检测值、预测值及参照值,判定各芯粒工作状态是否出现异常,是则报警,否则继续检测。
2.根据权利要求1所述的方法,其特征在于,
单个芯粒的各项工作参数至少包括芯粒的温度、输入电压、输出电压和电流。
3.根据权利要求2所述的方法,其特征在于,
所述CNN-LSTM预测模型包括连接的CNN网络及LSTM网络;其中,所述LSTM网络包括输入层、全连接层、LSTM层、注意力机制层和输出层,所述输入层用于输入所述CNN网络提取的特征,所述全连接层用于融合输入的特征,所述LSTM层用于基于融合后的特征提取隐层状态,所述注意力机制层用于根据注意力机制调整各隐层状态的概率分布,修正最终输出特征,所述输出层用于通过全连接操作,基于最终输出特征得到对应的工作参数预测值。
4.根据权利要求3所述的方法,其特征在于,
所述LSTM层中,LSTM单元结构的输入门和遗忘门的前向通道上分别增设有Dropout层,用于在前向传播中对设定范围内的神经元进行失活处理,以抑制过拟合现象;
其中,设于输入门的前向通道的Dropout层丢弃率取值范围为[0.2, 0.4],设于遗忘门的前向通道的Dropout层丢弃率取值范围为[0.1, 0.3],且设于遗忘门的前向通道的Dropout层丢弃率低于设于输入门的前向通道的Dropout层丢弃率。
5.根据权利要求2所述的方法,其特征在于,
所述基于一段连续历史时刻的工作参数,确定各项工作参数待检测时刻的参照值,包括:
基于一段连续历史时刻的工作参数,通过多项式拟合,确定各项工作参数对应待检测时刻的参照值。
6.根据权利要求2所述的方法,其特征在于,
所述基于各芯粒待检测时刻的各项工作参数检测值、预测值及参照值,判定各芯粒工作状态是否出现异常,包括:
对于每个芯粒,比较各项工作参数待检测时刻的预测值与参照值,若各项预测值与参照值之间的偏差程度之和大于预设的第一阈值,则认为预测结果出现问题或芯粒出现异常征兆,进行报错,否则继续比较各项工作参数检测值、预测值及参照值,若单项工作参数的预测值与检测值之间的偏差大于预测值与参照值之间的偏差,则认为该项工作参数异常;
若单个芯粒有超过一项工作参数异常,则认为该芯粒工作状态出现异常。
7.根据权利要求6所述的方法,其特征在于,该方法还包括:
对于各个芯粒,若有且只有一项工作参数异常,则将该项工作参数的预测值取代检测值作为当前时刻的工作参数存入,更新历史时刻的工作参数数据集。
8.一种芯粒工作状态监测装置,其特征在于,包括:
获取模块,用于获取各芯粒待检测时刻的各项工作参数检测值及一段连续历史时刻的工作参数,并进行标准化处理;
预测模块,用于截取待检测时刻前最新一段历史时刻的工作参数,输入训练好的CNN-LSTM预测模型,获得待检测时刻对应的工作参数预测值;所述CNN-LSTM预测模型是以样本工作参数为输入和以相应的预测工作参数为输出进行训练的;
参考模块,用于基于一段连续历史时刻的工作参数,确定各项工作参数待检测时刻的参照值;
判定模块,用于基于各芯粒待检测时刻的各项工作参数检测值、预测值及参照值,判定各芯粒工作状态是否出现异常,是则报警,否则继续检测。
9.一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如权利要求1-7中任一项所述的方法。
10.一种存储介质,其上存储有计算机程序,其特征在于,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-7中任一项所述的方法。
CN202310660157.6A 2023-06-06 2023-06-06 一种芯粒工作状态监测方法、装置、电子设备及存储介质 Active CN116400201B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310660157.6A CN116400201B (zh) 2023-06-06 2023-06-06 一种芯粒工作状态监测方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310660157.6A CN116400201B (zh) 2023-06-06 2023-06-06 一种芯粒工作状态监测方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN116400201A true CN116400201A (zh) 2023-07-07
CN116400201B CN116400201B (zh) 2023-08-11

Family

ID=87012681

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310660157.6A Active CN116400201B (zh) 2023-06-06 2023-06-06 一种芯粒工作状态监测方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116400201B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116933608A (zh) * 2023-09-15 2023-10-24 深圳市正和兴电子有限公司 一种存储类芯片的管理方法、系统及存储介质
CN117148117A (zh) * 2023-10-27 2023-12-01 中诚华隆计算机技术有限公司 一种Chiplet故障自动检测修复方法及系统

Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0886628A (ja) * 1994-09-16 1996-04-02 Rohm Co Ltd 神経回路網による半導体チップリード半田外観検査法
US5945069A (en) * 1996-03-21 1999-08-31 California Institute Of Technology Gas sensor test chip
KR20150037022A (ko) * 2013-09-30 2015-04-08 한국전력공사 초고압 케이블의 뇌임펄스 전압시험을 위한 시험전류 차단장치
CN105548833A (zh) * 2015-12-09 2016-05-04 天津二十冶建设有限公司 一种高压电缆变频串联谐振耐压的调试方法
CN105572545A (zh) * 2014-10-29 2016-05-11 中国石油化工股份有限公司 一种电力线路故障测距装置和测距方法
CN205656273U (zh) * 2016-03-25 2016-10-19 上海蓝波高电压技术设备有限公司 用于电缆附件盐雾试验中的三相工频耐压试验装置
CN107677949A (zh) * 2017-08-08 2018-02-09 上海交通大学 集成电路批量检测方法
CN108241114A (zh) * 2016-12-26 2018-07-03 北京邮电大学 混合电路芯片的在线故障检测方法、装置及故障检测电路
CN109298300A (zh) * 2018-12-04 2019-02-01 武汉康电电气有限公司 一种用于高压电缆耐压试验时局部放电测试系统及方法
CN209496104U (zh) * 2018-12-04 2019-10-15 武汉康电电气有限公司 一种用于高压电缆耐压试验时局部放电测试系统
CN111896823A (zh) * 2020-06-30 2020-11-06 成都四威功率电子科技有限公司 一种对功放进行在线健康监测与故障预警的系统
CN112817524A (zh) * 2021-01-19 2021-05-18 置富科技(深圳)股份有限公司 基于动态神经网络的闪存可靠性等级在线预测方法和装置
CN113391622A (zh) * 2021-06-22 2021-09-14 中国人民解放军国防科技大学 利用多元多步预测技术的航天器姿态系统异常检测方法
WO2021232266A1 (zh) * 2020-05-20 2021-11-25 华为技术有限公司 芯片的控制方法和控制装置
CN113885691A (zh) * 2021-09-30 2022-01-04 上海商汤阡誓科技有限公司 芯片功耗调整、神经网络训练方法、装置以及芯片系统
CN115440292A (zh) * 2022-11-02 2022-12-06 深圳市芯片测试技术有限公司 存储芯片的测试方法、装置、设备及存储介质
CN115828466A (zh) * 2022-12-15 2023-03-21 河北工业大学 一种基于宽核卷积的风机主轴部件故障预测方法
CN115879607A (zh) * 2022-11-28 2023-03-31 国网福建省电力有限公司营销服务中心 一种电能表状态预测方法、系统、设备和存储介质
US20230153608A1 (en) * 2021-11-15 2023-05-18 East China Jiaotong University Method for predicting remaining useful life of railway train bearing based on can-lstm

Patent Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0886628A (ja) * 1994-09-16 1996-04-02 Rohm Co Ltd 神経回路網による半導体チップリード半田外観検査法
US5945069A (en) * 1996-03-21 1999-08-31 California Institute Of Technology Gas sensor test chip
KR20150037022A (ko) * 2013-09-30 2015-04-08 한국전력공사 초고압 케이블의 뇌임펄스 전압시험을 위한 시험전류 차단장치
CN105572545A (zh) * 2014-10-29 2016-05-11 中国石油化工股份有限公司 一种电力线路故障测距装置和测距方法
CN105548833A (zh) * 2015-12-09 2016-05-04 天津二十冶建设有限公司 一种高压电缆变频串联谐振耐压的调试方法
CN205656273U (zh) * 2016-03-25 2016-10-19 上海蓝波高电压技术设备有限公司 用于电缆附件盐雾试验中的三相工频耐压试验装置
CN108241114A (zh) * 2016-12-26 2018-07-03 北京邮电大学 混合电路芯片的在线故障检测方法、装置及故障检测电路
CN107677949A (zh) * 2017-08-08 2018-02-09 上海交通大学 集成电路批量检测方法
CN109298300A (zh) * 2018-12-04 2019-02-01 武汉康电电气有限公司 一种用于高压电缆耐压试验时局部放电测试系统及方法
CN209496104U (zh) * 2018-12-04 2019-10-15 武汉康电电气有限公司 一种用于高压电缆耐压试验时局部放电测试系统
WO2021232266A1 (zh) * 2020-05-20 2021-11-25 华为技术有限公司 芯片的控制方法和控制装置
CN111896823A (zh) * 2020-06-30 2020-11-06 成都四威功率电子科技有限公司 一种对功放进行在线健康监测与故障预警的系统
CN112817524A (zh) * 2021-01-19 2021-05-18 置富科技(深圳)股份有限公司 基于动态神经网络的闪存可靠性等级在线预测方法和装置
CN113391622A (zh) * 2021-06-22 2021-09-14 中国人民解放军国防科技大学 利用多元多步预测技术的航天器姿态系统异常检测方法
CN113885691A (zh) * 2021-09-30 2022-01-04 上海商汤阡誓科技有限公司 芯片功耗调整、神经网络训练方法、装置以及芯片系统
US20230153608A1 (en) * 2021-11-15 2023-05-18 East China Jiaotong University Method for predicting remaining useful life of railway train bearing based on can-lstm
CN115440292A (zh) * 2022-11-02 2022-12-06 深圳市芯片测试技术有限公司 存储芯片的测试方法、装置、设备及存储介质
CN115879607A (zh) * 2022-11-28 2023-03-31 国网福建省电力有限公司营销服务中心 一种电能表状态预测方法、系统、设备和存储介质
CN115828466A (zh) * 2022-12-15 2023-03-21 河北工业大学 一种基于宽核卷积的风机主轴部件故障预测方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116933608A (zh) * 2023-09-15 2023-10-24 深圳市正和兴电子有限公司 一种存储类芯片的管理方法、系统及存储介质
CN116933608B (zh) * 2023-09-15 2023-12-22 深圳市正和兴电子有限公司 一种存储类芯片的管理方法、系统及存储介质
CN117148117A (zh) * 2023-10-27 2023-12-01 中诚华隆计算机技术有限公司 一种Chiplet故障自动检测修复方法及系统
CN117148117B (zh) * 2023-10-27 2023-12-29 中诚华隆计算机技术有限公司 一种Chiplet故障自动检测修复方法及系统

Also Published As

Publication number Publication date
CN116400201B (zh) 2023-08-11

Similar Documents

Publication Publication Date Title
CN116400201B (zh) 一种芯粒工作状态监测方法、装置、电子设备及存储介质
KR101713985B1 (ko) 예지 정비 방법 및 장치
Vodenčarević et al. Using behavior models for anomaly detection in hybrid systems
CN110164501A (zh) 一种硬盘检测方法、装置、存储介质及设备
CN112148768A (zh) 一种指标时间序列异常检测方法、系统及存储介质
US11640328B2 (en) Predicting equipment fail mode from process trace
CN115794588A (zh) 内存故障预测方法、装置、系统及监测服务器
US9865158B2 (en) Method for detecting false alarm
CN110489260B (zh) 故障识别方法、装置及bmc
CN115980585A (zh) 电池故障的检测方法、装置、计算机设备和存储介质
CN116401137B (zh) 一种芯粒健康状态预测方法、装置、电子设备及存储介质
CN117067920B (zh) 动力电池的故障检测方法、装置、电子设备及电动汽车
CN111104670B (zh) 一种apt攻击的识别和防护方法
CN117251114A (zh) 模型训练方法、磁盘寿命预测方法、相关装置及设备
CN115856613A (zh) 断路器状态评估方法
Arunan et al. A change point detection integrated remaining useful life estimation model under variable operating conditions
CN111314110A (zh) 一种用于分布式系统的故障预警方法
US7814034B2 (en) Method and system for automatically developing a fault classification system by segregation of kernels in time series data
US11665193B2 (en) Method for managing plant, plant design device, and plant management device
Mokhtari et al. Measurement data intrusion detection in industrial control systems based on unsupervised learning
JP6896380B2 (ja) 故障予兆判定方法、故障予兆判定装置および故障予兆判定プログラム
CN112684476B (zh) 导航接收机信号通道虚警率降低方法及星载导航接收机
CN114610560B (zh) 系统异常监控方法、装置和存储介质
Pipe et al. An automated data-driven toolset for predictive analytics
CN111078974A (zh) 实时检测新闻量异常的方法、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant