CN116050530A - 量子计算机的ai芯片异常预测方法、装置和电子设备 - Google Patents

量子计算机的ai芯片异常预测方法、装置和电子设备 Download PDF

Info

Publication number
CN116050530A
CN116050530A CN202211569729.1A CN202211569729A CN116050530A CN 116050530 A CN116050530 A CN 116050530A CN 202211569729 A CN202211569729 A CN 202211569729A CN 116050530 A CN116050530 A CN 116050530A
Authority
CN
China
Prior art keywords
chip
atoms
current
probability value
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211569729.1A
Other languages
English (en)
Inventor
谢利明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN202211569729.1A priority Critical patent/CN116050530A/zh
Publication of CN116050530A publication Critical patent/CN116050530A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N10/00Quantum computing, i.e. information processing based on quantum-mechanical phenomena
    • G06N10/70Quantum error correction, detection or prevention, e.g. surface codes or magic state distillation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供了一种量子计算机的AI芯片异常预测方法、装置、电子设备及可读存储介质,所述AI芯片包括原子,所述方法包括:获取所述AI芯片的当前芯片温度;根据所述当前芯片温度预测所述AI芯片的原子的当前退火概率值;其中,所述当前退火概率值用于表征所述AI芯片的原子的原子自旋和原子位置的优劣,所述AI芯片的原子的原子自旋和原子位置的优劣反映了所述AI芯片的运算能力的高低;获取所述AI芯片的原子在自旋移动过程中发生异常时收集的历史异常数据;根据所述历史异常数据和所述当前退火概率值确定所述AI芯片的原子的异常类型。在本发明实施例中可以准确确定AI芯片的异常类型。

Description

量子计算机的AI芯片异常预测方法、装置和电子设备
技术领域
本发明实施例涉及量子计算机技术领域,特别是涉及一种量子计算机的AI芯片异常预测方法、一种量子计算机的AI芯片异常预测装置、一种电子设备以及一种计算机可读存储介质。
背景技术
随着AI(Artificial Inteligence,人工智能)的热潮席卷各行各业,作为人工智能核心的AI芯片变得炙手可热,AI芯片是所有智能设备必不可少的核心器件,专门用于处理AI相关的计算任务。Al芯片领域不光是半导体芯片公司竞争的舞台,连互联网公司、云计算公司都纷纷发布推出AI芯片的计划。
由于传统计算机的运算能力较差,不能满足日益增长的运算需求,量子计算机应运而生。具体地,量子计算机是一类遵循量子力学规律进行高速数学和逻辑运算、存储及处理量子信息的物理装置。量子计算机的特点具有运算能力高以及应用范围较广等等。然而,量子计算机的AI芯片的运算能力会受到其运行环境的影响,当量子计算机的AI芯片处于健康状态时,运算能力较高,反之,当量子计算机的AI芯片处于异常状态时,运算能力较低,因此,如果能够准确确定量子计算机的AI芯片的异常类型,就可以根据异常类型来调整量子计算机的AI芯片的运行环境,从而保障量子计算机的AI芯片的运算能力。
发明内容
本发明实施例是提供一种量子计算机的AI芯片异常预测方法、装置、电子设备以及计算机可读存储介质,以解决无法准确确定量子计算机的AI芯片的异常类型,进而可以根据异常类型来调整量子计算机的AI芯片的运行环境,保障量子计算机的AI芯片的运算能力的问题。
本发明实施例公开了一种量子计算机的AI芯片异常预测方法,所述AI芯片包括原子,所述方法包括:
获取所述AI芯片的当前芯片温度;
根据所述当前芯片温度预测所述AI芯片的原子的当前退火概率值;其中,所述当前退火概率值用于表征所述AI芯片的原子的原子自旋和原子位置的优劣,所述AI芯片的原子的原子自旋和原子位置的优劣反映了所述AI芯片的运算能力的高低;
获取所述AI芯片的原子在自旋移动过程中发生异常时收集的历史异常数据;
根据所述历史异常数据和所述当前退火概率值确定所述AI芯片的原子的异常类型。
可选地,所述根据所述当前芯片温度预测所述AI芯片的原子的当前退火概率值,包括:
采用模拟退火差分模型根据所述当前芯片温度预测所述AI芯片的原子的当前退火概率值,其中,所述模拟退火差分模型为:
P(e,e,T)=exp(-(e-e)/T)
其中,所述e是当前误差,所述e为历史误差,所述T为当前芯片温度。
可选地,所述历史异常数据包括所述原子的历史芯片温度,所述根据所述历史异常数据和所述当前退火概率值确定所述AI芯片的原子的异常类型,包括:
当所述历史异常数据中存在与所述AI芯片的原子的所述当前芯片温度匹配的历史芯片温度时,若所述当前退火概率值大于或等于预设阈值,则确定为造成所述AI芯片的异常类型为所述AI芯片的原子的原子位置异常,若所述当前退火概率值小于预设阈值,则确定为造成所述AI芯片的异常类型为所述AI芯片的原子的原子自旋异常。
可选地,在所述根据所述历史异常数据和所述当前退火概率值确定所述AI芯片的原子的异常类型之后,所述方法还包括:
获取训练样本数据;其中,所述训练样本数据至少包括当前退火概率值和所述当前退火概率值对应的异常类型;
采用所述历史异常数据对分类预测模型进行训练,得到训练完成的分类预测模型;
在预测所述AI芯片的异常类型时,将所述AI芯片的当前退火概率值输入到训练完成的分类预测模型中,得到所述AI芯片的异常类型。
可选地,所述AI芯片的原子的原子位置异常为所述量子计算机的硬件原因造成,所述AI芯片的原子的原子自旋异常为所述量子计算机所处的磁场原因造成;其中,所述硬件原因至少包括所述量子计算机长时间不关机,所述量子计算机的散热功能差。
本发明实施例还公开了一种量子计算机的AI芯片异常预测装置,所述AI芯片包括原子,所述装置包括:
当前芯片温度获取模块,用于获取所述AI芯片的当前芯片温度;
退火概率值预测模块,用于根据所述当前芯片温度预测所述AI芯片的原子的当前退火概率值;其中,所述当前退火概率值用于表征所述AI芯片的原子的原子自旋和原子位置的优劣,所述AI芯片的原子的原子自旋和原子位置的优劣反映了所述AI芯片的运算能力的高低;
历史异常数据获取模块,用于获取所述AI芯片的原子在自旋移动过程中发生异常时收集的历史异常数据;
异常类型确定模块,用于根据所述历史异常数据和所述当前退火概率值确定所述AI芯片的原子的异常类型。
可选地,所述退火概率值预测模块,具体用于:
采用模拟退火差分模型根据所述当前芯片温度预测所述AI芯片的原子的当前退火概率值,其中,所述模拟退火差分模型为:
P(e,e,T)=exp(-(e-e)/T)
其中,所述e是当前误差,所述e为历史误差,所述T为当前芯片温度。
可选地,所述历史异常数据包括所述原子的历史芯片温度,所述异常类型确定模块,具体用于:
当所述历史异常数据中存在与所述AI芯片的原子的所述当前芯片温度匹配的历史芯片温度时,若所述当前退火概率值大于或等于预设阈值,则确定为造成所述AI芯片的异常类型为所述AI芯片的原子的原子位置异常,若所述当前退火概率值小于预设阈值,则确定为造成所述AI芯片的异常类型为所述AI芯片的原子的原子自旋异常。
可选地,所述装置还包括:分类预测模型训练模块,用于:
获取训练样本数据;其中,所述训练样本数据至少包括当前退火概率值和所述当前退火概率值对应的异常类型;
采用所述历史异常数据对分类预测模型进行训练,得到训练完成的分类预测模型;
在预测所述AI芯片的异常类型时,将所述AI芯片的当前退火概率值输入到训练完成的分类预测模型中,得到所述AI芯片的异常类型。
可选地,所述AI芯片的原子的原子位置异常为所述量子计算机的硬件原因造成,所述AI芯片的原子的原子自旋异常为所述量子计算机所处的磁场原因造成;其中,所述硬件原因至少包括所述量子计算机长时间不关机,所述量子计算机的散热功能差。
本发明实施例还公开了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口以及所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行存储器上所存放的程序时,实现如本发明实施例所述的方法。
本发明实施例还公开了一种计算机程序产品,该程序产品被存储在存储介质中,该计算机程序产品被至少一个处理器执行以实现如本发明实施例所述的方法。
本发明实施例还公开了一种计算机可读存储介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如本发明实施例所述的方法。
本发明实施例包括以下优点:
在本发明实施例中,获取AI芯片的当前芯片温度,根据当前芯片温度预测AI芯片的原子的当前退火概率值,其中,当前退火概率值用于表征AI芯片的原子的原子自旋和原子位置的优劣,AI芯片的原子的原子自旋和原子位置的优劣反映了AI芯片的运算能力的高低,然后,可以获取历史日志数据中AI芯片的原子在自旋移动过程中发生异常时收集的历史异常数据,据历史异常数据和当前退火概率值确定AI芯片的原子的异常类型。在具体实际中,AI芯片的原子的当前退火概率值已经可以一定程度上确认AI芯片的原子的原子位置和原子自旋的优劣,即可以确定AI芯片的运算能力的高低,但是无法准确确定AI芯片的异常类型,因此,在本发明实施例中根据当前芯片温度预测AI芯片的原子的当前退火概率值后,将基于历史日志中AI芯片的历史异常数据结合当前退火概率值,以准确确定AI芯片的异常类型,通过准确确定量子计算机的AI芯片的异常类型,进而可以根据异常类型来调整量子计算机的AI芯片的运行环境,提高AI芯片的运算能力以更好地完成运算任务。
附图说明
图1是本发明实施例中提供的一种量子计算机的AI芯片异常预测方法的步骤流程图;
图2是本发明实施例中提供的一种量子计算机的AI芯片异常预测装置的结构框图;
图3是实现本发明各个实施例的一种电子设备的硬件结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,示出了本发明实施例中提供的一种量子计算机的AI芯片异常预测方法的步骤流程图,所述AI芯片包括原子,具体可以包括如下步骤:
步骤101、获取所述AI芯片的当前芯片温度。
步骤102、根据所述当前芯片温度预测所述AI芯片的原子的当前退火概率值;其中,所述当前退火概率值用于表征所述AI芯片的原子的原子自旋和原子位置的优劣,所述AI芯片的原子的原子自旋和原子位置的优劣反映了所述AI芯片的运算能力的高低。
步骤103、获取所述AI芯片的原子在自旋移动过程中发生异常时收集的历史异常数据。
步骤104、根据所述历史异常数据和所述当前退火概率值确定所述AI芯片的原子的异常类型。
在上述量子计算机的AI芯片方法中,获取AI芯片的当前芯片温度,根据当前芯片温度预测AI芯片的原子的当前退火概率值,其中,当前退火概率值用于表征AI芯片的原子的原子自旋和原子位置的优劣,AI芯片的原子的原子自旋和原子位置的优劣反映了AI芯片的运算能力的高低,然后,可以获取历史日志数据中AI芯片的原子在自旋移动过程中发生异常时收集的历史异常数据,据历史异常数据和当前退火概率值确定AI芯片的原子的异常类型。在具体实际中,AI芯片的原子的当前退火概率值已经可以一定程度上确认AI芯片的原子的原子位置和原子自旋的优劣,即可以确定AI芯片的运算能力的高低,但是无法准确确定AI芯片的异常类型,因此,在本发明实施例中根据当前芯片温度预测AI芯片的原子的当前退火概率值后,将基于历史日志中AI芯片的历史异常数据结合当前退火概率值,以准确确定AI芯片的异常类型,通过准确确定量子计算机的AI芯片的异常类型,进而可以根据异常类型来调整量子计算机的AI芯片的运行环境,提高AI芯片的运算能力以更好地完成运算任务。
下面,对本示例性实施例中量子计算机的AI芯片异常预测方法作进一步地说明。
在步骤101中、获取所述AI芯片的当前芯片温度。
在步骤102中、根据所述当前芯片温度预测所述AI芯片的原子的当前退火概率值;其中,所述当前退火概率值用于表征所述AI芯片的原子的原子自旋和原子位置的优劣,所述AI芯片的原子的原子自旋和原子位置的优劣反映了所述AI芯片的运算能力的高低。
在具体实现中,量子计算机的AI芯片是由原子构成的,而实际中温度使AI芯片的能量升高,使得AI芯片的原子会离开原来的位置,随机地在其他位置中移动并自旋。而实际中,AI芯片的原子自旋和原子位置越好,则AI芯片的运算能力越高,反之,AI芯片的原子自旋和原子位置越差,则AI芯片的运算能力越差。而AI芯片的原子自旋和原子位置的优劣是受到其运行环境的影响,具体地,运行环境可以涉及量子计算机本身硬件和量子计算机所处的磁场。
AI芯片的芯片温度是可以影响其原子的原子位置和原子自旋,也就是说,芯片温度可以影响AI芯片的运算能力,因此,在本发明实施例中,可以获取到AI芯片的当前芯片温度,然后可以根据AI芯片的当前芯片温度确定AI芯片的健康状态(运算能力),以在AI芯片运算能力较差时,通过对应调整AI芯片的运行环境,来提高AI芯片的运算能力。
具体地,退火概率值可以用于表征AI芯片的原子的原子自旋和原子位置的优劣,即,可以通过退火概率值来表征AI芯片的运算能力的高低。作为本发明实施例的一种可选示例,所述步骤102、根据所述当前芯片温度预测所述AI芯片的原子的当前退火概率值,包括:
采用模拟退火差分模型根据所述当前芯片温度预测所述AI芯片的原子的当前退火概率值,其中,所述模拟退火差分模型为:
P(e,e,T)=exp(-(e-e)/T)
其中,所述e是当前误差,所述e为历史误差,所述T为当前芯片温度。
在本发明实施例中,可以使用模拟退火算法来基于AI芯片的计算AI芯片的退火概率值,具体地,模拟退火算法来源于固体退火原理,是一种基于概率的算法,模拟退火差分模型为基于模拟退火算法构建的模型,可以用于预测AI芯片的退火概率值,其中,上述的模拟退火差分模型得到的退火概率值可以是0到1之间的数字。本发明实施例的模拟退火差分模型,可以对AI芯片的每一个原子采用模拟退火算法进行概率预测,随后,可以按照将AI芯片中每个原子的原子标识对应记录对应的退火概率值。其中,退火概率值越低说明AI芯片的原子位置和原子自旋的位置越好,反之,退火概率值越高说明AI芯片的原子位置和原子自旋的位置越差。
当然,在具体实时本发明实施例时也可以选用除模拟退火差分模型之外的其他方式计算AI芯片的退火概率值,本发明实施例对此无需加以限制。
在步骤103中、获取所述AI芯片的原子在自旋移动过程中发生异常时收集的历史异常数据。
在本发明实施例中,针对AI芯片可以收集有AI芯片的原子在自旋移动过程中发生异常时收集的历史异常数据,其中,该历史异常数据包括在AI芯片运行过程中超过阈值时得各种告警数据,例如可以包括在AI芯片的在自旋移动过程中发生异常时的历史芯片温度。
在步骤104中、根据所述历史异常数据和所述当前退火概率值确定所述AI芯片的原子的异常类型。
在本发明的一种可选实施例,所述历史异常数据包括所述原子的历史芯片温度,所述步骤104、根据所述历史异常数据和所述当前退火概率值确定所述AI芯片的原子的异常类型,可以包括:
当所述历史异常数据中存在与所述AI芯片的原子的所述当前芯片温度匹配的历史芯片温度时,若所述当前退火概率值大于或等于预设阈值,则确定为造成所述AI芯片的异常类型为所述AI芯片的原子的原子位置异常,若所述当前退火概率值小于预设阈值,则确定为造成所述AI芯片的异常类型为所述AI芯片的原子的原子自旋异常。
在本发明实施例中,AI芯片的原子的异常类型至少可以分为两种,一种是原子的原子位置异常,另一种是原子自旋异常。其中,所述AI芯片的原子的原子位置异常为所述量子计算机的硬件原因造成,所述AI芯片的原子的原子自旋异常为所述量子计算机所处的磁场原因造成;其中,所述硬件原因至少包括所述量子计算机长时间不关机,所述量子计算机的散热功能差。
在得到历史异常数据时,就可以结合AI芯片的当前退火概率值来准确确定AI芯片的原子的异常类型,即是原子位置异常或者是原子自旋异常,其中,若AI芯片原子发生异常,同时退火概率值高,则原子位置造成AI芯片异常概率较大,反之,若AI芯片原子发生异常,同时退火概率值小,则原子自旋造成AI芯片异常概率较大。具体地,在本发明实施例中,首先可以在历史异常数据中查找是否存在与AI芯片的当前芯片温度匹配的历史芯片温度,若存在说明在相同的芯片温度时AI芯片时会出现异常,则可以进一步确定AI芯片的异常类型,具体地,当若AI芯片的当前退火概率值大于或等于预设阈值,则确定为造成AI芯片的异常类型为AI芯片的原子的原子位置异常,若AI芯片的当前退火概率值小于预设阈值,则确定为造成AI芯片的异常类型为AI芯片的原子的原子自旋异常。
在确定然后AI芯片的异常类型后就可以根据异常类型,来调整量子计算机的AI芯片的运行环境,以提高AI芯片的运算能力。举例来说,假设AI芯片的异常类型为原子位置异常,而造成原子位置异常的原因为量子计算机的硬件原因,则可以尝试将量子计算机关机一段时间,或者加强量子计算机的散热功能;假设AI芯片的异常类型为原子自旋异常,而造成原子自旋异常的原因为量子计算机的外部原因(磁场原因),则可以尝试调整量子计算机的放置位置以改变所在磁场。
在本发明的一种可选实施例,在所述步骤104、根据所述历史异常数据和所述当前退火概率值确定所述AI芯片的原子的异常类型之后,所述方法还可以包括如下步骤:
获取训练样本数据;其中,所述训练样本数据至少包括当前退火概率值和所述当前退火概率值对应的异常类型;
采用所述历史异常数据对分类预测模型进行训练,得到训练完成的分类预测模型;
在预测所述AI芯片的异常类型时,将所述AI芯片的当前退火概率值输入到训练完成的分类预测模型中,得到所述AI芯片的异常类型。
在本发明实施例中,还可以构建分类预测模型,用于更加精确预测AI芯片的原子自旋过程中发生异常的异常类型的分类概率。具体地,可以将包括当前退火概率值和当前退火概率值对应的异常类型的训练样本数据放入构建的分类预测模型中进行训练,在训练完成后就可以得到训练完成的分类预测模型,然后,在需要预测量子计算机的AI芯片的异常类型时,可以在模拟退火差分模型得到AI芯片的当前退火概率值后,将该当前退火概率值输入到训练完成的分类预测模型中,得到AI芯片的异常类型。
需要说明的是,由于本发明实施例是根据AI芯片的历史异常数据结合当前退火概率值准确确认的异常类型,因此若使用这些数据作为分类预测模型的训练样本数据,可以准确预测的AI芯片的异常类型。
作为一个可选示例,分类预测模型可以是基于贝叶斯定理构建的分类预测模型,具体地,贝叶斯定理是朴素贝叶斯分类法(Naive Bayesian Classifier)的基础,如果给定数据集里有M个分类类别,通过朴素贝叶斯分类法,可以预测给定观察值是否属于具有最高后验概率的特定类别,也就是说,朴素贝叶斯分类方法预测X属于类别C时,表示当且仅当:
P(Ci|X)>P(Cj|X)1≤j≤m,j≠i
此时如果最大化P(Ci|X),其P(Ci|X)最大的类Ci被称为最大后验假设,根据贝叶斯定理:
Figure BDA0003987507370000101
可知,由于P(X)对于所有的类别是均等的,因此只需要P(X|Ci)P(Ci)取最大即可。
为了预测一个未知样本X的类别,可对每个类别Ci估算相应的P(X|Ci)P(Ci)。
P(Ci|X)>P(Cj|X)1≤j≤m,j≠i
当然,上述根据贝叶斯定理构建的分类预测模型仅仅是作为示例,在具体实施本发明实施例时,也可以采用其他算法或者模型构建的分类预测模型,本发明实施例对此无需加以限制。
为了使本领域技术人员更好地理解本发明实施例,以下采用一个具体示例进行说明。具体地,量子计算机的AI芯片异常预测的主要步骤包括:
步骤一、构建模拟退火差分模型,对每一个AI芯片的原子采用模拟退火算法进行退火概率值预测。其中,退火概率值低说明AI芯片的原子位置和原子自旋的位置好,反之退火概率值高说明AI芯片的原子位置和原子自旋的位置差。
步骤二、访问历史日志数据获取AI芯片的原子在自旋移动过程中发生异常时收集的历史异常数据,并结合退火概率值准确确定AI芯片的异常类型。其中,原子发生异常,同时退火概率值高,则原子位置造成AI芯片异常概率较大,反之,原子发生异常,同时退火概率值低,则原子自旋造成AI芯片异常概率较大。
步骤三、基于退火概率值和对应的异常类型构建分类预测模型,从而可以根据分类预测模型更加精确预测AI芯片在自旋移动过程中发生的异常类型。
综上,应用本发明实施例至少具有如下优点:1、在量子计算机的AI芯片的当前芯片温度得到的当前退火概率值的基础上,结合历史日志数据中记录的量子计算机的AI芯片的原子在自旋移动过程中发生异常时收集的历史异常数据,来准确识别AI芯片的异常类型,解决了仅依靠模拟退火算法判断原子的异常类型时判断不准确的问题。2、通过准确的异常类型(原子自旋、原子位置)和当前退火概率值来训练分类预测模型,可以准确预测AI芯片属于哪种异常类型。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图2,示出了本发明实施例中提供的一种量子计算机的AI芯片异常预测装置的结构框图,所述AI芯片包括原子,所述装置具体可以包括如下模块:
当前芯片温度获取模块201,用于获取所述AI芯片的当前芯片温度;
退火概率值预测模块202,用于根据所述当前芯片温度预测所述AI芯片的原子的当前退火概率值;其中,所述当前退火概率值用于表征所述AI芯片的原子的原子自旋和原子位置的优劣,所述AI芯片的原子的原子自旋和原子位置的优劣反映了所述AI芯片的运算能力的高低;
历史异常数据获取模块203,用于获取所述AI芯片的原子在自旋移动过程中发生异常时收集的历史异常数据;
异常类型确定模块204,用于根据所述历史异常数据和所述当前退火概率值确定所述AI芯片的原子的异常类型。
在本发明的一种可选实施例中,所述退火概率值预测模块202,具体用于:
采用模拟退火差分模型根据所述当前芯片温度预测所述AI芯片的原子的当前退火概率值,其中,所述模拟退火差分模型为:
P(e,e,T)=exp(-(e-e)/T)
其中,所述e是当前误差,所述e为历史误差,所述T为当前芯片温度。
在本发明的一种可选实施例中,所述历史异常数据包括所述原子的历史芯片温度,所述异常类型确定模块204,具体用于:
当所述历史异常数据中存在与所述AI芯片的原子的所述当前芯片温度匹配的历史芯片温度时,若所述当前退火概率值大于或等于预设阈值,则确定为造成所述AI芯片的异常类型为所述AI芯片的原子的原子位置异常,若所述当前退火概率值小于预设阈值,则确定为造成所述AI芯片的异常类型为所述AI芯片的原子的原子自旋异常。
在本发明的一种可选实施例中,所述装置还包括:分类预测模型训练模块,用于:
获取训练样本数据;其中,所述训练样本数据至少包括当前退火概率值和所述当前退火概率值对应的异常类型;
采用所述历史异常数据对分类预测模型进行训练,得到训练完成的分类预测模型;
在预测所述AI芯片的异常类型时,将所述AI芯片的当前退火概率值输入到训练完成的分类预测模型中,得到所述AI芯片的异常类型。
在本发明的一种可选实施例中,所述AI芯片的原子的原子位置异常为所述量子计算机的硬件原因造成,所述AI芯片的原子的原子自旋异常为所述量子计算机所处的磁场原因造成;其中,所述硬件原因至少包括所述量子计算机长时间不关机,所述量子计算机的散热功能差。
在本发明实施例中根据当前芯片温度预测AI芯片的原子的当前退火概率值后,将基于历史日志中AI芯片的历史异常数据结合当前退火概率值,以准确确定AI芯片的异常类型,通过准确确定量子计算机的AI芯片的异常类型,进而可以根据异常类型来调整量子计算机的AI芯片的运行环境,提高AI芯片的运算能力以更好地完成运算任务。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
另外,本发明实施例还提供了一种电子设备,包括:处理器,存储器,存储在存储器上并可在处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述量子计算机的AI芯片异常预测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述量子计算机的AI芯片异常预测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(RandomAccess Memory,简称RAM)、磁碟或者光盘等。
本发明实施例还提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如上述量子计算机的AI芯片异常预测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
图3为实现本发明各个实施例的一种电子设备的硬件结构示意图。
该电子设备300包括但不限于:射频单元301、网络模块302、音频输出单元303、输入单元304、传感器305、显示单元306、用户输入单元307、接口单元308、存储器309、处理器310、以及电源311等部件。本领域技术人员可以理解,图3中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,电子设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
应理解的是,本发明实施例中,射频单元301可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器310处理;另外,将上行的数据发送给基站。通常,射频单元301包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元301还可以通过无线通信系统与网络和其他设备通信。
电子设备通过网络模块302为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元303可以将射频单元301或网络模块302接收的或者在存储器309中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元303还可以提供与电子设备300执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元303包括扬声器、蜂鸣器以及受话器等。
输入单元304用于接收音频或视频信号。输入单元304可以包括图形处理器(Graphics Processing Unit,GPU)3041和麦克风3042,图形处理器3041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元306上。经图形处理器3041处理后的图像帧可以存储在存储器309(或其它存储介质)中或者经由射频单元301或网络模块302进行发送。麦克风3042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元301发送到移动通信基站的格式输出。
电子设备300还包括至少一种传感器305,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板3061的亮度,接近传感器可在电子设备300移动到耳边时,关闭显示面板3061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器305还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元306用于显示由用户输入的信息或提供给用户的信息。显示单元306可包括显示面板3061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板3061。
用户输入单元307可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元307包括触控面板3071以及其他输入设备3072。触控面板3071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板3071上或在触控面板3071附近的操作)。触控面板3071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器310,接收处理器310发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板3071。除了触控面板3071,用户输入单元307还可以包括其他输入设备3072。具体地,其他输入设备3072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板3071可覆盖在显示面板3061上,当触控面板3071检测到在其上或附近的触摸操作后,传送给处理器310以确定触摸事件的类型,随后处理器310根据触摸事件的类型在显示面板3061上提供相应的视觉输出。虽然在图3中,触控面板3071与显示面板3061是作为两个独立的部件来实现电子设备的输入和输出功能,但是在某些实施例中,可以将触控面板3071与显示面板3061集成而实现电子设备的输入和输出功能,具体此处不做限定。
接口单元308为外部装置与电子设备300连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元308可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到电子设备300内的一个或多个元件或者可以用于在电子设备300和外部装置之间传输数据。
存储器309可用于存储软件程序以及各种数据。存储器309可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器309可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器310是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器309内的软件程序和/或模块,以及调用存储在存储器309内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。处理器310可包括一个或多个处理单元;优选的,处理器310可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器310中。
电子设备300还可以包括给各个部件供电的电源311(比如电池),优选的,电源311可以通过电源管理系统与处理器310逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,电子设备300包括一些未示出的功能模块,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
本领域普通技术人员可以意识到,结合本发明实施例中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种量子计算机的AI芯片异常预测方法,其特征在于,所述AI芯片包括原子,所述方法包括:
获取所述AI芯片的当前芯片温度;
根据所述当前芯片温度预测所述AI芯片的原子的当前退火概率值;其中,所述当前退火概率值用于表征所述AI芯片的原子的原子自旋和原子位置的优劣,所述AI芯片的原子的原子自旋和原子位置的优劣反映了所述AI芯片的运算能力的高低;
获取所述AI芯片的原子在自旋移动过程中发生异常时收集的历史异常数据;
根据所述历史异常数据和所述当前退火概率值确定所述AI芯片的原子的异常类型。
2.根据权利要求1所述的方法,其特征在于,所述根据所述当前芯片温度预测所述AI芯片的原子的当前退火概率值,包括:
采用模拟退火差分模型根据所述当前芯片温度预测所述AI芯片的原子的当前退火概率值,其中,所述模拟退火差分模型为:
P(e,e,T)=exp(-(e-e)/T)
其中,所述e是当前误差,所述e为历史误差,所述T为当前芯片温度。
3.根据权利要求1所述的方法,其特征在于,所述历史异常数据包括所述原子的历史芯片温度,所述根据所述历史异常数据和所述当前退火概率值确定所述AI芯片的原子的异常类型,包括:
当所述历史异常数据中存在与所述AI芯片的原子的所述当前芯片温度匹配的历史芯片温度时,若所述当前退火概率值大于或等于预设阈值,则确定为造成所述AI芯片的异常类型为所述AI芯片的原子的原子位置异常,若所述当前退火概率值小于预设阈值,则确定为造成所述AI芯片的异常类型为所述AI芯片的原子的原子自旋异常。
4.根据权利要求1所述的方法,其特征在于,在所述根据所述历史异常数据和所述当前退火概率值确定所述AI芯片的原子的异常类型之后,所述方法还包括:
获取训练样本数据;其中,所述训练样本数据至少包括当前退火概率值和所述当前退火概率值对应的异常类型;
采用所述历史异常数据对分类预测模型进行训练,得到训练完成的分类预测模型;
在预测所述AI芯片的异常类型时,将所述AI芯片的当前退火概率值输入到训练完成的分类预测模型中,得到所述AI芯片的异常类型。
5.根据权利要求2所述的方法,其特征在于,所述AI芯片的原子的原子位置异常为所述量子计算机的硬件原因造成,所述AI芯片的原子的原子自旋异常为所述量子计算机所处的磁场原因造成;其中,所述硬件原因至少包括所述量子计算机长时间不关机,所述量子计算机的散热功能差。
6.一种量子计算机的AI芯片异常预测装置,其特征在于,所述AI芯片包括原子,所述装置包括:
当前芯片温度获取模块,用于获取所述AI芯片的当前芯片温度;
退火概率值预测模块,用于根据所述当前芯片温度预测所述AI芯片的原子的当前退火概率值;其中,所述当前退火概率值用于表征所述AI芯片的原子的原子自旋和原子位置的优劣,所述AI芯片的原子的原子自旋和原子位置的优劣反映了所述AI芯片的运算能力的高低;
历史异常数据获取模块,用于获取所述AI芯片的原子在自旋移动过程中发生异常时收集的历史异常数据;
异常类型确定模块,用于根据所述历史异常数据和所述当前退火概率值确定所述AI芯片的原子的异常类型。
7.根据权利要求6所述的装置,其特征在于,所述退火概率值预测模块,具体用于:
采用模拟退火差分模型根据所述当前芯片温度预测所述AI芯片的原子的当前退火概率值,其中,所述模拟退火差分模型为:
P(e,e,T)=exp(-(e-e)/T)
其中,所述e是当前误差,所述e为历史误差,所述T为当前芯片温度。
8.根据权利要求6所述的装置,其特征在于,所述历史异常数据包括所述原子的历史芯片温度,所述异常类型确定模块,具体用于:
当所述历史异常数据中存在与所述AI芯片的原子的所述当前芯片温度匹配的历史芯片温度时,若所述当前退火概率值大于或等于预设阈值,则确定为造成所述AI芯片的异常类型为所述AI芯片的原子的原子位置异常,若所述当前退火概率值小于预设阈值,则确定为造成所述AI芯片的异常类型为所述AI芯片的原子的原子自旋异常。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口以及所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行存储器上所存放的程序时,实现如权利要求1-5任一项所述的方法。
10.一种计算机可读存储介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如权利要求1-5任一项所述的方法。
CN202211569729.1A 2022-12-08 2022-12-08 量子计算机的ai芯片异常预测方法、装置和电子设备 Pending CN116050530A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211569729.1A CN116050530A (zh) 2022-12-08 2022-12-08 量子计算机的ai芯片异常预测方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211569729.1A CN116050530A (zh) 2022-12-08 2022-12-08 量子计算机的ai芯片异常预测方法、装置和电子设备

Publications (1)

Publication Number Publication Date
CN116050530A true CN116050530A (zh) 2023-05-02

Family

ID=86126305

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211569729.1A Pending CN116050530A (zh) 2022-12-08 2022-12-08 量子计算机的ai芯片异常预测方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN116050530A (zh)

Similar Documents

Publication Publication Date Title
CN108511002B (zh) 危险事件声音信号识别方法、终端和计算机可读存储介质
CN108984066B (zh) 一种应用程序图标显示方法及移动终端
WO2021190387A1 (zh) 检测结果输出的方法、电子设备及介质
WO2017088434A1 (zh) 人脸模型矩阵训练方法、装置及存储介质
CN111090877B (zh) 数据生成、获取方法及对应的装置、存储介质
CN110659179B (zh) 一种评估系统运行状况的方法、装置及电子设备
CN107330867B (zh) 图像合成方法、装置、计算机可读存储介质和计算机设备
JP7221305B2 (ja) 対象物認識方法及び移動端末
CN108366171B (zh) 一种温升控制方法和移动终端
CN107895108B (zh) 一种操作管理方法和移动终端
CN112001442B (zh) 特征检测方法、装置、计算机设备及存储介质
CN109992941B (zh) 一种权限管理方法及终端设备
CN109240531B (zh) 触控数据的采样补偿方法、装置、移动终端和存储介质
CN111370026A (zh) 设备状态检测方法及电子设备
CN115565236A (zh) 一种人脸识别攻击处理方法、装置、设备及存储介质
CN113112011B (zh) 一种数据预测方法及装置
CN116050530A (zh) 量子计算机的ai芯片异常预测方法、装置和电子设备
CN108958603A (zh) 一种操作模式控制方法及移动终端
CN108108608A (zh) 一种移动终端的控制方法及移动终端
CN114581230A (zh) 流式图中的洗钱行为检测方法、装置、介质
CN110096863B (zh) 一种报警方法及移动终端
CN112308771A (zh) 一种图像处理方法、装置及电子设备
CN112015973A (zh) 一种异构网络的关系推理方法及终端
CN109029765A (zh) 一种信号处理方法和信号处理装置
CN113518152B (zh) 电话号码的识别方法、系统及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination