CN115128438A - 一种芯片内部故障监测方法及其装置 - Google Patents

一种芯片内部故障监测方法及其装置 Download PDF

Info

Publication number
CN115128438A
CN115128438A CN202211070459.XA CN202211070459A CN115128438A CN 115128438 A CN115128438 A CN 115128438A CN 202211070459 A CN202211070459 A CN 202211070459A CN 115128438 A CN115128438 A CN 115128438A
Authority
CN
China
Prior art keywords
real
power information
chip
time
early warning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211070459.XA
Other languages
English (en)
Inventor
王嘉诚
张少仲
张栩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongcheng Hualong Computer Technology Co Ltd
Original Assignee
Zhongcheng Hualong Computer Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongcheng Hualong Computer Technology Co Ltd filed Critical Zhongcheng Hualong Computer Technology Co Ltd
Priority to CN202211070459.XA priority Critical patent/CN115128438A/zh
Publication of CN115128438A publication Critical patent/CN115128438A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/28Testing of electronic circuits, e.g. by signal tracer
    • G01R31/2851Testing of integrated circuits [IC]

Abstract

本发明涉及半导体技术领域,为芯片的检测技术方向,具体为一种芯片内部故障监测方法及其装置;方法包括:获取待检测芯片的多个检测点;获取多个检测点的实时电力信息;将多个所述实时电力信息与预设的电力信息阈值进行比较确定多个所述实时电力信息是否处于预设的电力信息阈值之内,当至少一个所述检测点的所述实时电力信息未处于时,则说明所述待检测芯片具有故障;本申请实施例通过构建实时电力信息阈值能够精确的获得芯片的异常数据,并且针对异常数据的获得确定芯片是否具有故障。并且,通过设置预警信息获取机制,能够实现潜在的芯片中的故障预警信息,保证了芯片在一段时间运行过程中所产生的故障的概率基于概率从而推断芯片的故障信息。

Description

一种芯片内部故障监测方法及其装置
技术领域
本发明涉及半导体技术领域,为芯片的检测技术方向,具体为一种芯片内部故障监测方法及其装置。
背景技术
在芯片工艺过程中需要对具体的芯片进行故障检测,针对于现有的芯片故障检测方式以芯片的启动电流为依据,如果其启动电流曲线偏差超过一定范围,则判定该芯片处于故障状态。对于单颗孤立的芯片,最常用的检测设备是图示仪,其检测原理为:通过给待检测芯片提供一个由低到高变化的电压,来测量其对应不同供电电压值时,待检测芯片的吸收电流值的大小,并以曲线形式进行显示,将显示的IV曲线与正常工作芯片的IV曲线进行比较,判定待检测芯片是否处于故障状态。
而现有的检测方式,因为曲线进行特征比对以及异常获取的准确度不高,仅能实现初步的检测,无法实现精准信息的获得。
发明内容
为了解决以上的技术问题,本申请提供一种芯片内部故障监测方法及其装置,能够实现较低成本的芯片故障监测,且在异常数据获取的同时对芯片中潜在的故障信息进行预警。
为了达到上述目的,本申请实施例采用的技术方案如下:
第一方面,一种芯片内部故障监测方法,所述方法包括:获取待检测芯片的多个检测点;获取多个检测点的实时电力信息;将多个所述实时电力信息与预设的电力信息阈值进行比较确定多个所述实时电力信息是否处于预设的电力信息阈值之内,当至少一个所述检测点的所述实时电力信息未处于时,则说明所述待检测芯片具有故障;所述预设的电力信息阈值确定,包括以下方法:获取多个所述实时电力信息对应的样本数据,并确定所述样本数据中目标特征的特征取值;其中,所述目标特征为多个所述实时电力信息具有的特征;对所述特征取值进行变换,变换后的所述特征取值对应的概率密度分布结果符合设定的分布形态要求;根据变换后的所述特征取值对应的概率密度分布结果和预先设定的所述各项实时电力信息的查出率,确定所述目标特征对应的阈值;其中,所述目标特征对应的阈值用于在各实时电力信息中查出所述各项实时电力信息,查出的所述各项实时电力信息的数量占全部所述各项实时电力信息的数量的比率为所述查出率。
在第一方面的第一种可实现方式中,所述预设的电力信息阈值确定,还包括:对变换后的所述特征取值进行概率密度分布,得到变换后的所述特征取值对应的概率密度分布结果;利用校验模型对变换后的所述特征取值对应的概率密度分布结果进行校验,得到变换后的所述特征取值对应的概率密度分布的形态与设定的分布形态之间的相似度;若所述相似度大于相似度阈值,则确定变换后的所述特征取值对应的概率密度分布结果符合设定的分布形态要求。
在第一方面的第二种可实现方式中,所述实时电力信息包括实时电流信息,所述实时电流信息包括实时电流有效值。
在第一方面的第三种可实现方式中,所述实时电力信息包括和实时波形信息中,所述实时波形信息包括实时波形特征。
结合第一方面的第三种可能的实现方式,在第四种可能的实现方式中,获取所述实时波形特征包括以下方法:按照多个尺度分别对波形进行分割,得到所述多个尺度对应的波形序列,任一尺度对应的波形序列包括属于所述任一尺度的多个波形片段;分别对每个尺度对应的波形序列中的多个波形片段进行编码,得到所述每个尺度对应的第一特征序列,任一尺度对应的第一特征序列包括属于所述任一尺度的多个波形片段编码得到的波形特征;分别将所述每个尺度对应的第一特征序列中的多个波形特征进行融合,得到所述每个尺度对应的第二特征序列;将所述多个尺度对应的第二特征序列进行拼接,得到所述波形对应的波形特征信息。
结合第一方面的第二种可能的实现方式,在第五种可能的实现方式中,将多个所述实时电力信息与预设的电力信息阈值进行比较确定多个所述实时电力信息是否处于预设的电力信息阈值之内,包括:将所述实时电流有效值与预设对应的电流有效值阈值进行比较,得到电流异常数据。
结合第一方面的第四种可能的实现方式,在第六种可能的实现方式中,将所述实时波形特征与预设对应的波性特征阈值进行比较,得到波形异常数据。
在第一方面的第七种可实现方式中,当多个所述检测点的所述实时电力信息都处于预设的电力信息阈值之内时,还包括:
基于预设置的预警活动特征数据库对多个所述检测点进行预警。
在第一方面的第七种可实现方式中,在第八种可能的实现方式中,基于预设置的预警活动特征数据库对多个所述检测点进行预警,具体包括以下方法:构建预警活动特征数据库;提取多个所述实时电力信息中涉及的预警状态活动的预警状态活动特征;将所述预警状态活动特征与所述预警活动特征数据库进行比对,得到预警信息;将所述预警信息下发至对应的用户端。
第二方面,本申请实施例还提供一种芯片内部故障监测装置,包括:第一获取模块,用户获取待检测芯片的多个检测点;第二获取模块,用于获取多个检测点的实时电力信息;故障识别模块,用于将多个所述实时电力信息与预设的电力信息阈值进行确定所述待检测芯片是否具有故障。
本申请实施例提供的技术方案中,通过构建实时电力信息阈值能够精确的获得芯片的异常数据,并且针对异常数据的获得确定芯片是否具有故障。并且,通过设置预警信息获取机制,能够实现潜在的芯片中的故障预警信息,保证了芯片在一段时间运行过程中所产生的故障的概率基于概率从而推断芯片的故障信息。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
附图中的方法、系统和/或程序将根据示例性实施例进一步描述。这些示例性实施例将参照图纸进行详细描述。这些示例性实施例是非限制的示例性实施例,其中示例数字在附图的各个视图中代表相似的机构。
图1是本申请实施例提供的装置方框示意图。
图2是根据本申请的一些实施例所示的芯片内部故障监测方法的流程图。
具体实施方式
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本申请技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。
在下面的详细描述中,通过实例阐述了许多具体细节,以便提供对相关指导的全面了解。然而,对于本领域的技术人员来说,显然可以在没有这些细节的情况下实施本申请。在其他情况下,公知的方法、程序、系统、组成和/或电路已经在一个相对较高水平上被描述,没有细节,以避免不必要的模糊本申请的方面。
本申请中使用流程图说明根据本申请的实施例的系统所执行的执行过程。应当明确理解的是,流程图的执行过程可以不按顺序执行。相反,这些执行过程可以以相反的顺序或同时执行。另外,可以将至少一个其他执行过程添加到流程图。一个或多个执行过程可以从流程图中删除。
对本发明实施例进行进一步详细说明之前,对本发明实施例中涉及的名词和术语进行说明,本发明实施例中涉及的名词和术语适用于如下的解释。
(1)响应于,用于表示所执行的操作所依赖的条件或者状态,当满足所依赖的条件或状态时,所执行的一个或多个操作可以是实时的,也可以具有设定的延迟;在没有特别说明的情况下,所执行的多个操作不存在执行先后顺序的限制。
(2)基于,用于表示所执行的操作所依赖的条件或者状态,当满足所依赖的条件或状态时,所执行的一个或多个操作可以是实时的,也可以具有设定的延迟;在没有特别说明的情况下,所执行的多个操作不存在执行先后顺序的限制。
本申请实施例提供的技术方案,主要通过获取芯片中的多个待检测点的实时电力信息与预设对应的电力信息阈值进行比对,得到比对结果,实时电力信息处于预设的阈值范围内时,则说明芯片不具有故障。当比对结果不处于预设的阈值范围内时,则说明待检测芯片具有故障。并且,在本实施例中通过构建预警活动特征数据库,基于多个实时电力信息中涉及的预警状态活动的预警状态活动特征进行比对,得到比对结果,如果预警状态活动特征在预警活动特征数据库中有对应关系,则说明对待检测的芯片的检测点具有潜在的异常风险。
本实施例,不仅能够实现对于异常数据的获取,还能够实现对于预警信息的获取。
本申请实施例提供一种终端设备,该终端与用户端通信,用于将异常信息和预警信息发送至对应的用户端。在本实施例中,该终端设备包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,其中处理器执行芯片内部故障监测方法,对芯片中的异常信息以及预警信息进行识别判断。
在本实施例中,该终端可以为服务器,针对于服务器的物理结构,包括存储器、处理器和通信单元。存储器、处理器以及通信单元各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器用于存储特定的信息和程序,通信单元用于将处理后的信息进行发送至对应的用户端。
本实施例将存储模块划分为两个存储区域,其中一个存储区为程序存储单元,另一个存储区域为数据存储单元。程序存储单元相当于固件区,该区域的读写权限设置为只读模式,其内存储的数据不可擦除和更改。而数据存储单元中的数据可以进行擦除或读写,当数据存储区域的容量已满时,新写入的数据会对最早期的历史数据进行覆盖。
其中,存储器可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Ele超声ric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器可能是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(DSP))、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
参阅图2,在本实施例中,针对于芯片内部故障监测方法,其工作逻辑为,在进行芯片启动时,芯片会获取一个启动电压,而针对于检测的逻辑即在启动电压的条件作为基础获取对应启动电压下对应的实时电力信息,将实时电力信息与预设的实时电力信息阈值进行比较,如果当实时电力信息不处于电力信息阈值范围内时,则说明在芯片上存在某种故障导致内部实时电力信息的异常。
具体包括以下方法:
步骤S210.获取待检测芯片的多个检测点。
在本实施例中,针对于待检测芯片的故障监测,如果单用一个检测点进行故障信息获取的话,有可能造成监测结果不准确的问题。所以,需要对芯片的多个位置进行检测,所以需要设置多个检测点,而多个检测点的设置可以根据具体芯片的规格以及电子电路的具体设置进行配置。因为集成的晶体管规模不一样,针对不不同制程的芯片其检测点的设置也不同。但至少需要包括两个检测点,并且分别对其中任意一个检测点进行监测。
而如何选择检测点,本实施例中不再进行说明。
步骤S220.获取多个检测点的实时电力信息。
在本实施例中,针对于故障检测主要通过对于实时电力信息的获取,并基于实时电力信息中的数据进行判断得到异常数据,并判断芯片内部是否存在故障。
步骤S230.将多个所述实时电力信息与预设的电力信息阈值进行比较确定多个所述实时电力信息是否处于预设的电力信息阈值之内,当至少一个所述检测点的所述实时电力信息未处于时,则说明所述待检测芯片具有故障。
以上为本实施例提供的芯片内部故障监测方法,下面针对于以上的过程进行详细的描述。
针对于步骤S230,主要采用的方法是将实时电力信息进行比较,而比较的对象为预设的电力信息阈值,所以在本实施例中需要针对于电力信息阈值的确定进行详细的说明。值得注意的是,针对于电力信息阈值的确定为本实施例必不可少的处理过程。
而针对于芯片的特点,在芯片进行工作过程中因为运行环境的影响,会造成各电力信息进行一定的波动,而针对于此波动,无法根据传统经验算法对于阈值设置,为了更为精准的阈值获取,需要建立较为精准的阈值设置方法。针对于阈值的构建包括以下过程:
步骤S231.获取多个所述实时电力信息对应的样本数据,并确定所述样本数据中目标特征的特征取值。
在本实施例,因为采集的实时电力信息为特定类型或特定性质的信息值,所以针对于特定的实时电力信息可以基于监测的历史数据进行获取。或者,在其他实施例中,还可以通过仿真模型例如芯片设计阶段仿真过程中验证阶段进行获取,而在以上两种方法中的任意一种方法过程中获取的信息都可以作为样本数据
并且,在本实施例中实时电力信息包括实时电流信息以及实时波形信息。其中,针对于实时电流信息为实时电流有效值,实时波形信息为实时波形特征。而针对于实时电流有效值的获取可以通过常规的手段进行获得,而针对于实时波形特征的获取需要基于实时波形进行特征提取的方式进行获取,而在本实施例中,为了实现波形提取的准确性,针对于实时波形的提取包括以下方法:
基于获取的实时波形,按照多个尺度分别对获取的波形进行分割,并得到多个尺度对应的波形序列,其中针对任一尺度对应的波形序列包括属于任一尺度的多个波形片段。
基于多个波形片段,分别对每个尺度对应的波形序列中的多个波形片段进行编码,得到每个尺度对应的第一特征序列,在本实施例中,任一尺度对应的第一特征序列包括属于任一尺度的多个波形片段编码得到的波形特征。
基于得到的多个波形特征,分别将每个尺度对应的第一特征序列中的多个波形特征进行融合,得到每个尺度对应的第二特征序列。
基于得到的第二特征序列,将多个尺度对应的第二特征序列进行拼接,得到波形对应的波形特征信息。在本实施例中,通过对于特征序列的融合以及拼接处理得到波形特征信息,提高了波形特征提取的准确度,从而实现对于异常数据检测的准确度。
在步骤S231中,针对于目标特征被配置为多个实时电力信息具有的特征。
步骤S232.基于获取的样本数据中目标特征的特征取值,对特征取值进行变换,并且使变换后的特征取值对应的概率度分布结果符合设定的分布形态要求。
本实施例中,通过概率密度算法获得特征取值,因为概率密度算法属于现有的算法,在本实施例中针对于概率密度算法不进行详细说明,采用现有的算法即可。
步骤S233.根据变换后的特征取值对应的概率密度分布结果和预先设定的实时电力信息的查出率,确定目标特征对应的阈值。
在本实施例中,查出率基于预先设定的方式进行确定。并且,在本实施例中,目标特征对应的阈值用于在多个实时电力信息中查出多个实时电力信息,查出的实时电力信息的数量占全部实时电力信息的数量的比率为查出率。在本实施例中,查出率可以是经验数值,即通过有限的仿真或优先的实现可以获得的数据。
本实施例,针对于步骤S232,还包括以下方法:
对变换后的特征取值进行概率密度分布处理,得到变换后的特征取值对应的概率密度分布结果。此过程同样的采用现有的概率密度分布算法,在本实施例中不再进行详细的描述。
针对于变换后的特征取值,利用校验模型对其所对应的概率密度分布结果进行校验,得到变换后的特征取值对应的概率密度分布的形态与设定的分布形态之间的相似度。在本实施例中,此过程主要是对处理的结果进行验证,提高处理的准确度。
基于判断结果,若相似度大于相似度阈值时,则确定变换后的特征取值对应的概率密度分布结果符合设定的分布形态要求。
在以上的过程中,主要是基于获取的实时电力信息与预设的电力信息阈值进行比较,基于比较结果确定对应的检测点是否具有异常,如果在多个检测点中任意一个检测点超出预设的电力信息阈值范围时,则判定对应的检测点具有异常,即具有故障,并通过通信方式将异常数据进行发送至对应的用户端或者产生报警信号。
以上的处理过程主要是实时异常数据的获取和识别,但针对本实施例提供的另外一种方式中,还提供一种预警方法,基于实时电力信息对芯片中潜在的异常情况进行识别,此过程基于在实时电力信息不具有异常情况下,对实时电力信息进行处理得到预警信息,即在本实施例中其处理方法在步骤S230中的检测点的实时电力信息处于预设的电力信息阈值之内时,进行预警信息的获得。
具体方法包括:
基于样本数据构建预警活动特征数据库。
提取多个实时电力信息中涉及的预警状态活动的预警状态活动特征。
将预警状态活动特征与预警活动特征数据库进行比对,得到预警信息。
在本实施例中,针对于实时电力信息同样的为实时电流有效值以及实时波形特征,而针对于预警活动特征数据库中配置的数据为实时电流有效值中的预警活动特征以及实时波形预警活动特征。
而针对于本实施例中,对于预警活动特征数据库为基于样本数据中对应的预警状态活动特征的集合。
其中,针对于样本数据对应的预警状态活动特征以及实时电力信息中的预警状态活动特征的获取依据满足网络收敛要求的预警状态决策网络对样本数据中的电力信息以及实时电力信息进行处理获得。
在本实施例中,满足网络收敛要求的预警状态决策网络为以卷积神经网络为基础进行训练得到的决策网络模型。而针对于训练过程包括以下方法:
确定样本数据中至少两个芯片监控数据簇中的第一参考芯片监控数据的第一参考芯片状态活动的预警状态活动特征以及第二参考芯片监控数据的第二参考芯片状态活动的预警状态活动特征。
一种示例性的设计思路中,在确定参考芯片监控数据簇中的第一参考芯片监控数据的第一参考芯片状态活动的预警状态活动特征以及第二参考芯片监控数据的第二参考芯片状态活动的预警状态活动特征时,可以通过如下步骤进行实施:确定参考芯片监控数据簇中第一参考芯片监控数据的第一参考芯片状态活动的预警状态活动特征、第二参考芯片监控数据的第二参考芯片状态活动的预警状态活动特征、以及第三参考芯片监控数据的第三参考芯片状态活动的预警状态活动特征。
一种示例性的设计思路中,针对参考芯片监控数据簇中的第一参考芯片监控数据,可以在对第一参考芯片状态活动进行采集确定对应的第一参考芯片监控数据后,确定每个第一参考芯片监控数据中第一参考芯片状态活动的参考芯片状态活动的预警状态活动特征。在依据深度学习网络模型确定第一参考芯片监控数据的基础上,例如可以依据深度学习网络模型确定的深度芯片监控数据,获得第一参考芯片状态活动的参考芯片状态活动的预警状态活动特征。
一种示例性的设计思路中,针对参考芯片监控数据簇中的第二参考芯片监控数据,本申请实施例提供了一种确定第二参考芯片监控数据的第二参考芯片状态活动的预警状态活动特征的相关内容,可以具体包括如下步骤:确定每一第二参考芯片监控数据的芯片状态活动特征。依据第二参考芯片监控数据的芯片状态活动特征以及第二参考芯片监控数据,融合构建第二参考芯片监控数据的第二参考芯片状态活动的预警状态活动特征。
一种示例性的设计思路中,第二参考芯片监控数据可以理解为包括确定的多组包括非关键特征的芯片状态活动芯片监控数据,且每一第二参考芯片监控数据皆包括确定的芯片状态活动特征。其中,第二参考芯片监控数据中涉及的芯片状态活动特征用于确定第二参考芯片监控数据对应的参考芯片状态活动的预警状态活动特征。
可以理解,在获得第二参考芯片监控数据的芯片状态活动特征的基础上,可以依据融合策略构建第二参考芯片监控数据的第二参考芯片状态活动的预警状态活动特征。
依据初始化预警状态决策网络,对参考芯片监控数据簇中的第一参考芯片监控数据和第二参考芯片监控数据进行特征决策,获得第一参考芯片监控数据的第一参考芯片状态活动的决策预警状态活动特征以及第二参考芯片监控数据的第二参考芯片状态活动的决策预警状态活动特征。
一种示例性的设计思路中,在确定第一参考芯片监控数据的第一参考芯片状态活动的决策预警状态活动特征以及第二参考芯片监控数据的第二参考芯片状态活动的决策预警状态活动特征时,可以通过如下步骤进行实施:依据初始化预警状态决策网络,对参考芯片监控数据簇中的第一参考芯片监控数据、第二参考芯片监控数据、以及第三参考芯片监控数据进行特征决策,获得第一参考芯片监控数据的第一参考芯片状态活动的决策预警状态活动特征、第二参考芯片监控数据的第二参考芯片状态活动的决策预警状态活动特征、以及第三参考芯片监控数据的第三参考芯片状态活动的决策预警状态活动特征。
可以理解,确定第一参考芯片监控数据、第二参考芯片监控数据、以及第三参考芯片监控数据中至少一种参考芯片监控数据的步骤可以与依据初始化预警状态决策网络对第一参考芯片监控数据、第二参考芯片监控数据、以及第三参考芯片监控数据中至少一种进行特征决策的步骤同步执行,也即可以直接得到依据初始化预警状态决策网络对第一参考芯片监控数据、第二参考芯片监控数据、以及第三参考芯片监控数据中至少一种进行特征决策后分别涉及的决策预警状态活动特征。
另外,在依据初始化预警状态决策网络对第一参考芯片监控数据、第二参考芯片监控数据、以及第三参考芯片监控数据中至少一种进行特征决策时,可以同时对第一参考芯片监控数据、第二参考芯片监控数据、以及第三参考芯片监控数据中至少一种进行特征决策;或者,根据真实指标对第一参考芯片监控数据、第二参考芯片监控数据、以及第三参考芯片监控数据中至少一种按照顺序进行特征决策,以得到第一参考芯片监控数据的第一参考芯片状态活动的决策预警状态活动特征、第二参考芯片监控数据的第二参考芯片状态活动的决策预警状态活动特征、以及第三参考芯片监控数据的第三参考芯片状态活动的决策预警状态活动特征。
一种示例性的设计思路中,对于参考芯片监控数据簇中涉及的第一参考芯片监控数据和第二参考芯片监控数据,可以按照预设比例范围挑选不同数目的第一参考芯片监控数据、第二参考芯片监控数据,并将选定的第一参考芯片监控数据和第二参考芯片监控数据导入到初始化预警状态决策网络中;在参考芯片监控数据簇包括第一参考芯片监控数据、第二参考芯片监控数据和第三参考芯片监控数据的基础上,可以按照预设比例范围挑选不同数目的第一参考芯片监控数据、第二参考芯片监控数据、和第三参考芯片监控数据,并将选定的第一参考芯片监控数据、第二参考芯片监控数据和第三参考芯片监控数据导入到初始化预警状态决策网络中。
一种示例性的设计思路中,在将参考芯片监控数据导入到初始化预警状态决策网络后,初始化预警状态决策网络能够对参考芯片监控数据进行特征决策,并导出每一参考芯片监控数据的决策芯片状态活动的预警状态活动特征;依据决策芯片状态活动的预警状态活动特征,和每一参考芯片监控数据对应的参考芯片状态活动的预警状态活动特征,确定预警状态决策网络的网络收敛参数(模型损失),该网络收敛参数用于评估预警状态决策网络在构建芯片状态活动的预警状态活动特征时的精准性。
依据第一参考芯片状态活动的预警状态活动特征和决策预警状态活动特征、第二参考芯片状态活动的预警状态活动特征和决策预警状态活动特征,对初始化预警状态决策网络进行网络权重优化,以获得满足网络收敛要求的所述预警状态决策网络。
一种示例性的设计思路中,在对初始化预警状态决策网络进行网络权重优化以得到预警状态决策网络时,可以能够以下操作步骤进行实施:依据第一参考芯片状态活动的预警状态活动特征和决策预警状态活动特征、第二参考芯片状态活动的预警状态活动特征和决策预警状态活动特征、以及第三参考芯片状态活动的预警状态活动特征和决策预警状态活动特征,对初始化预警状态决策网络进行网络权重优化,网络权重优化完成后得到预警状态决策网络。
本实施通过提供一种基于实时电力信息的芯片异常数据识别以及预警信息获得方法,通过配置实时电力信息阈值能够实现对于芯片故障的实时获取,通过配置预警活动特征数据库能够实现对于芯片中预警信息的获取。
并且,参阅图1,在本实施例中配置有一种装置100,用于执行上述的方法,包括:第一获取模块110,户获取待检测芯片的多个检测点。第二获取模块120,用于获取多个检测点的实时电力信息。故障识别模块130,用于将多个所述实时电力信息与预设的电力信息阈值进行确定所述待检测芯片是否具有故障。
需要理解的是,针对上述内容没有进行名词解释的技术术语,本领域技术人员可以根据上述所公开的内容进行前后推导毫无疑义地确定其所指代的含义在此均不作限定。
本领域技术人员可以根据上述已公开的内容毫无疑义对一些预设的、基准的、预定的、设定的以及偏好标签的技术特征/技术术语进行确定,例如阈值、阈值区间、阈值范围等。对于一些未作解释的技术特征术语,本领域技术人员完全能够基于前后文的逻辑关系进行合理地、毫无疑义地推导,从而清楚、完整地实施上述技术方案。未作解释的技术特征术语的前缀,例如“第一”、“第二”、“示例”、 “目标”等,可以根据前后文进行毫无疑义地推导和确定。未作解释的技术特征术语的后缀,例如“集合”、“列表”等,也可以根据前后文进行毫无疑义地推导和确定。
本申请实施例公开的上述内容对于本领域技术人员而言是清楚完整的。应当理解,本领域技术人员基于上述公开的内容对未作解释的技术术语进行推导和分析的过程是基于本申请所记载的内容进行的,因此上述内容并不是对整体方案的创造性的评判。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅作为示例,而并不构成对本申请的限定。虽然此处并没有明确说明,本领域技术人员可以对本申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议,所以该类修改、改进、修正仍属于本申请示范实施例的精神和范围。
同时,本申请使用了特定术语来描述本申请的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同部分两次或多次提到的“一实施例”或“一个实施例”或“一替代性实施例”并不一定是指同一实施例。此外,本申请的至少一个实施例中的某些特征、结构或特点可以进行适当的组合。
另外,本领域普通技术人员可以理解的是,本申请的各个方面可以通过若干的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可以被称为“单元”、“组件”或“系统”。此外,本申请的各方面可以表现为位于至少一个计算机可读介质中的计算机产品,所述产品包括计算机可读程序编码。
计算机可读信号介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等等、或合适的组合形式。计算机可读信号介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机可读信号介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤缆线、RF、或类似介质、或任何上述介质的组合。
本申请各方面执行所需的计算机程序码可以用一种或多种程序语言的任意组合编写,包括面向对象程序设计,如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET,Python等,或类似的常规程序编程语言,如"C"编程语言,Visual Basic,Fortran2003,Perl,COBOL 2002,PHP,ABAP,动态编程语言如Python,Ruby和Groovy或其它编程语言。所述程式设计编码可以完全在用户计算机上执行、或作为独立的软体包在用户计算机上执行、或部分在用户计算机上执行部分在远程计算机执行、或完全在远程计算机或服务器上执行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网络(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,本申请所述处理元件和序列的顺序、数位字母的使用、或其他名称的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,并不仅限于披露的实施例,相反,申请旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件装置实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或行动装置上安装所描述的系统。
同样应当理解的是,为了简化本申请揭示的表述,从而帮助对至少一个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。

Claims (10)

1.一种芯片内部故障监测方法,其特征在于,所述方法包括:
获取待检测芯片的多个检测点;
获取多个检测点的实时电力信息;
将多个所述实时电力信息与预设的电力信息阈值进行比较确定多个所述实时电力信息是否处于预设的电力信息阈值之内,当至少一个所述检测点的所述实时电力信息未处于时,则说明所述待检测芯片具有故障;
所述预设的电力信息阈值确定,包括以下方法:
获取多个所述实时电力信息对应的样本数据,并确定所述样本数据中目标特征的特征取值;其中,所述目标特征为多个所述实时电力信息具有的特征;
对所述特征取值进行变换,变换后的所述特征取值对应的概率密度分布结果符合设定的分布形态要求;
根据变换后的所述特征取值对应的概率密度分布结果和预先设定的多个所述实时电力信息的查出率,确定所述目标特征对应的阈值;
其中,所述目标特征对应的阈值用于在多个所述实时电力信息中查出多个实时电力信息,查出的所述实时电力信息的数量占全部所述实时电力信息的数量的比率为所述查出率。
2.根据权利要求1所述的芯片内部故障监测方法,其特征在于,所述预设的电力信息阈值确定,还包括:
对变换后的所述特征取值进行概率密度分布,得到变换后的所述特征取值对应的概率密度分布结果;
利用校验模型对变换后的所述特征取值对应的概率密度分布结果进行校验,得到变换后的所述特征取值对应的概率密度分布的形态与设定的分布形态之间的相似度;
若所述相似度大于相似度阈值,则确定变换后的所述特征取值对应的概率密度分布结果符合设定的分布形态要求。
3.根据权利要求1所述的芯片内部故障监测方法,其特征在于,所述实时电力信息包括实时电流信息,所述实时电流信息包括实时电流有效值。
4.根据权利要求1所述的芯片内部故障监测方法,其特征在于,所述实时电力信息包括实时波形信息,所述实时波形信息包括实时波形特征。
5.根据权利要求4所述的芯片内部故障监测方法,其特征在于,获取所述实时波形特征包括以下方法:
按照多个尺度分别对波形进行分割,得到多个尺度对应的波形序列,任一尺度对应的波形序列包括属于任一尺度的多个波形片段;
分别对每个尺度对应的波形序列中的多个波形片段进行编码,得到所述每个尺度对应的第一特征序列,任一尺度对应的第一特征序列包括属于所述任一尺度的多个波形片段编码得到的波形特征;
分别将每个尺度对应的第一特征序列中的多个波形特征进行融合,得到每个尺度对应的第二特征序列;
将多个尺度对应的第二特征序列进行拼接,得到波形对应的波形特征信息。
6.根据权利要求3所述的芯片内部故障监测方法,其特征在于,将多个所述实时电力信息与预设的电力信息阈值进行比较确定多个实时电力信息是否处于预设的电力信息阈值之内,包括:
将所述实时电流有效值与预设对应的电流有效值阈值进行比较,得到电流异常数据。
7.根据权利要求5所述的芯片内部故障监测方法,其特征在于,将所述实时波形特征与预设对应的波性特征阈值进行比较,得到波形异常数据。
8.根据权利要求1所述的芯片内部故障监测方法,其特征在于,当多个所述检测点的所述实时电力信息都处于预设的电力信息阈值之内时,还包括:
基于预设置的预警活动特征数据库对多个所述检测点进行预警。
9.根据权利要求8所述的芯片内部故障监测方法,其特征在于,基于预设置的预警活动特征数据库对多个所述检测点进行预警,具体包括以下方法:
构建预警活动特征数据库;提取多个所述实时电力信息中涉及的预警状态活动的预警状态活动特征;将所述预警状态活动特征与所述预警活动特征数据库进行比对,得到预警信息;
将所述预警信息下发至对应的用户端。
10.一种芯片内部故障监测装置,其特征在于,包括:
第一获取模块,用户获取待检测芯片的多个检测点;
第二获取模块,用于获取多个检测点的实时电力信息;
故障识别模块,用于将多个所述实时电力信息与预设的电力信息阈值进行确定所述待检测芯片是否具有故障。
CN202211070459.XA 2022-09-02 2022-09-02 一种芯片内部故障监测方法及其装置 Pending CN115128438A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211070459.XA CN115128438A (zh) 2022-09-02 2022-09-02 一种芯片内部故障监测方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211070459.XA CN115128438A (zh) 2022-09-02 2022-09-02 一种芯片内部故障监测方法及其装置

Publications (1)

Publication Number Publication Date
CN115128438A true CN115128438A (zh) 2022-09-30

Family

ID=83387284

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211070459.XA Pending CN115128438A (zh) 2022-09-02 2022-09-02 一种芯片内部故障监测方法及其装置

Country Status (1)

Country Link
CN (1) CN115128438A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116256620B (zh) * 2023-05-15 2023-07-14 中诚华隆计算机技术有限公司 Chiplet集成芯片的检测方法、装置、电子设备及存储介质
CN117589798A (zh) * 2024-01-19 2024-02-23 中诚华隆计算机技术有限公司 一种芯片故障检测方法、装置及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040049722A1 (en) * 2002-09-09 2004-03-11 Kabushiki Kaisha Toshiba Failure analysis system, failure analysis method, a computer program product and a manufacturing method for a semiconductor device
CN101821640A (zh) * 2008-12-17 2010-09-01 惠瑞捷(新加坡)私人有限公司 用于确定用于检测芯片上的故障的相关值以及确定芯片上的位置的故障概率的方法和装置
CN102288890A (zh) * 2011-08-12 2011-12-21 福建星网锐捷网络有限公司 一种芯片故障检测方法及装置
CN107422255A (zh) * 2017-07-13 2017-12-01 南京信息工程大学 一种数字芯片故障检测系统及其检测方法
CN109615171A (zh) * 2018-11-09 2019-04-12 阿里巴巴集团控股有限公司 特征阈值确定方法及装置、问题对象确定方法及装置
CN113763931A (zh) * 2021-05-07 2021-12-07 腾讯科技(深圳)有限公司 波形特征提取方法、装置、计算机设备及存储介质
CN113900006A (zh) * 2021-08-26 2022-01-07 湖南艾科诺维科技有限公司 一种芯片故障测试装置、系统及方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040049722A1 (en) * 2002-09-09 2004-03-11 Kabushiki Kaisha Toshiba Failure analysis system, failure analysis method, a computer program product and a manufacturing method for a semiconductor device
CN101821640A (zh) * 2008-12-17 2010-09-01 惠瑞捷(新加坡)私人有限公司 用于确定用于检测芯片上的故障的相关值以及确定芯片上的位置的故障概率的方法和装置
CN102288890A (zh) * 2011-08-12 2011-12-21 福建星网锐捷网络有限公司 一种芯片故障检测方法及装置
CN107422255A (zh) * 2017-07-13 2017-12-01 南京信息工程大学 一种数字芯片故障检测系统及其检测方法
CN109615171A (zh) * 2018-11-09 2019-04-12 阿里巴巴集团控股有限公司 特征阈值确定方法及装置、问题对象确定方法及装置
CN113763931A (zh) * 2021-05-07 2021-12-07 腾讯科技(深圳)有限公司 波形特征提取方法、装置、计算机设备及存储介质
CN113900006A (zh) * 2021-08-26 2022-01-07 湖南艾科诺维科技有限公司 一种芯片故障测试装置、系统及方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116256620B (zh) * 2023-05-15 2023-07-14 中诚华隆计算机技术有限公司 Chiplet集成芯片的检测方法、装置、电子设备及存储介质
CN117589798A (zh) * 2024-01-19 2024-02-23 中诚华隆计算机技术有限公司 一种芯片故障检测方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN115128438A (zh) 一种芯片内部故障监测方法及其装置
JP2019016209A (ja) 診断装置、診断方法およびコンピュータプログラム
CN107490964B (zh) 一种基于特征证据离散化的旋转机械故障特征约简方法
CN113884961B (zh) Soc校准方法、建模方法、建模装置、计算机设备及介质
CN103649858A (zh) 用于预测组件或系统状况的方法和设备及计算机程序产品
CN113837596B (zh) 一种故障确定方法、装置、电子设备及存储介质
CN115238828A (zh) 一种色谱仪故障监测方法及装置
CN113641994B (zh) 基于图数据的数据处理方法及系统
CN105278966B (zh) 基于失效模式分析的卫星星载制导与导航软件的设计与测试方法
CN110147820A (zh) 航班额外油量的推荐方法、装置、设备及存储介质
CN116092269A (zh) 一种隧道工程岩体灾害预警方法、装置及电子设备
CN116304909A (zh) 一种异常检测模型训练方法、故障场景定位方法及装置
CN114661994A (zh) 基于人工智能的用户兴趣数据处理方法、系统及云平台
CN113253709B (zh) 一种适用于轨道交通车辆健康诊断方法及装置
CN113761210A (zh) 基于报告文本信息识别的信息处理方法及系统
CN113472860A (zh) 大数据和数字化环境下的业务资源分配方法及服务器
CN112528306A (zh) 基于大数据和人工智能的数据访问方法及云计算服务器
CN112446601A (zh) 不可算台区数据诊断方法及系统
CN116738261A (zh) 基于聚类分箱的数值型特征离散化归因分析方法及装置
CN113971136B (zh) 基于图像识别的页面测试方法及系统
CN116054910A (zh) 基于知识图谱构建的地球站设备故障分析及装置
US11567143B2 (en) Partial discharge determination device and method
US20210382947A1 (en) Accuracy metric for regular expression
CN114879070A (zh) 一种电池状态评估方法及相关设备
CN110177006B (zh) 基于接口预测模型的节点测试方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20220930