CN116741254A - 一种数据存储方法、装置、设备及介质 - Google Patents
一种数据存储方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116741254A CN116741254A CN202310716986.1A CN202310716986A CN116741254A CN 116741254 A CN116741254 A CN 116741254A CN 202310716986 A CN202310716986 A CN 202310716986A CN 116741254 A CN116741254 A CN 116741254A
- Authority
- CN
- China
- Prior art keywords
- data
- uncorrectable error
- uncorrectable
- error
- generated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000013500 data storage Methods 0.000 title claims abstract description 58
- 230000005540 biological transmission Effects 0.000 claims abstract description 23
- 230000015654 memory Effects 0.000 claims description 72
- 230000006870 function Effects 0.000 claims description 27
- 238000007726 management method Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 12
- 238000011897 real-time detection Methods 0.000 claims description 10
- 238000001514 detection method Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 11
- 230000009471 action Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- KJLPSBMDOIVXSN-UHFFFAOYSA-N 4-[4-[2-[4-(3,4-dicarboxyphenoxy)phenyl]propan-2-yl]phenoxy]phthalic acid Chemical compound C=1C=C(OC=2C=C(C(C(O)=O)=CC=2)C(O)=O)C=CC=1C(C)(C)C(C=C1)=CC=C1OC1=CC=C(C(O)=O)C(C(O)=O)=C1 KJLPSBMDOIVXSN-UHFFFAOYSA-N 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C29/00—Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
- G11C29/04—Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
- G11C29/08—Functional testing, e.g. testing during refresh, power-on self testing [POST] or distributed testing
- G11C29/12—Built-in arrangements for testing, e.g. built-in self testing [BIST] or interconnection details
- G11C29/38—Response verification devices
- G11C29/42—Response verification devices using error correcting codes [ECC] or parity check
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Techniques For Improving Reliability Of Storages (AREA)
Abstract
本发明公开了一种数据存储方法、装置、设备及介质,涉及计算机技术领。该数据存储方法,应用于服务器的操作系统,包括:实时检测不可纠正错误对应的不可纠正错误寄存器的状态位;此时保证了发现不可纠正错误时效性,能够对不可纠正错误及时处理;根据状态位的输出数据确定系统内是否产生不可纠正错误;当确定系统内产生不可纠正错误时,传输中断信号至基本输入输出系统;通过中断信号锁住硬盘的数据传输接口,并执行下关机操作,由于中断信号锁住硬盘的数据传输接口,避免了错误数据被认为是正常数据,导致错误数据落盘,进一步导致硬盘数据失效的情况。此时进一步实现了节约系统硬盘的存储空间并同时实现保证数据存储的准确性。
Description
技术领域
本发明涉及计算机技术领域,特别是涉及一种数据存储方法、装置、设备及介质。
背景技术
随着进阶精简指令集机器(Advanced RISC Machine,ARM)架构服务器、x86架构服务器的快速发展,ARM架构服务器以其高性价比、低功耗的优势更为广泛应用,然而对于服务器架构来说,最核心的还是内存的稳定性功能,倘若内存发生了致命的错误(如:不可纠正错误,一般其英文表示为:UCE错误)时,系统将会宕机并触发系统内存不可修复日志信息。
为了节约系统硬盘的存储空间并保证数据存储的准确性,一般要求正在系统硬盘上不存储任何多余的数据。然而,ARM架构服务器当前的处理流程是:当内存产生不可恢复故障(UCE)时,中央处理器(Central Processing Unit,CPU)不通知操作系统,此时操作系统会认为内存为正常状态,同样的,对应产生的错误数据被认为是正常数据,导致错误数据落盘,进一步导致硬盘数据失效。
鉴于上述存在的问题,寻求如何节约系统硬盘的存储空间并同时实现保证数据存储的准确性是本领域技术人员竭力解决的问题。
发明内容
本发明的目的是提供一种数据存储方法、装置、设备及介质,用于节约系统硬盘的存储空间并同时实现保证数据存储的准确性。
为解决上述技术问题,本发明提供一种数据存储方法,应用于服务器的操作系统,包括:
实时检测不可纠正错误对应的不可纠正错误寄存器的状态位;
根据所述状态位的输出数据确定系统内是否产生所述不可纠正错误;
当确定所述系统内产生所述不可纠正错误时,传输中断信号至基本输入输出系统;
通过所述中断信号锁住硬盘的数据传输接口,并执行下关机操作。
另一方面,根据所述状态位的输出数据确定系统内是否产生所述不可纠正错误包括:
判断所述输出数据是否为表征所述系统内产生所述不可纠正错误的预设数据;
若否,则确定所述系统内未产生所述不可纠正错误,并返回至所述实时检测不可纠正错误对应的不可纠正错误寄存器的状态位的步骤;
若是,则确定所述系统内产生所述不可纠正错误;
其中,表征所述系统内产生所述不可纠正错误的所述预设数据为1,对应的,表征所述系统内未产生所述不可纠正错误的所述预设数据为0;
对应的,所述判断所述输出数据是否为表征所述系统内产生所述不可纠正错误的预设数据包括:
判断所述输出数据是否为1;
若否,则确定所述系统内未产生所述不可纠正错误,并返回至所述实时检测不可纠正错误对应的不可纠正错误寄存器的状态位的步骤;
若是,则确定所述系统内产生所述不可纠正错误。
另一方面,实时检测不可纠正错误对应的不可纠正错误寄存器的状态位包括:
通过所述基本输入输出系统利用事件函数实时检测所述状态位。
另一方面,实时检测不可纠正错误对应的不可纠正错误寄存器的状态位包括:
设置预设时间间隔;
根据所述时间间隔实时检测所述状态位;
对应的,所述基本输入输出系统利用事件函数实时检测所述状态位包括:
通过所述基本输入输出系统利用事件函数和所述时间间隔实时检测所述状态位。
另一方面,在所述传输中断信号至基本输入输出系统包括:
通过所述基本输入输出系统存储所述不可纠正错误至高级配置和电源管理接口表中;
根据存储于所述高级配置和电源管理接口表中的所述不可纠正错误生成并传输所述中断信号。
另一方面,在所述通过所述中断信号锁住硬盘的数据传输接口,并执行下关机操作之后,还包括:
通过基板管理控制器解析并记录发生所述不可纠正错误的错误信息;
当确定所述记录信息完成记录时,发送提示信息。
另一方面,在所述发送提示信息之后,还包括:
根据所述提示信息,确定内存错误,并执行重启操作。
为解决上述技术问题,本发明还提供了一种数据存储装置,应用于服务器的操作系统,包括:
第一实时检测模块,用于实时检测不可纠正错误对应的不可纠正错误寄存器的状态位;
第一确定模块,用于根据所述状态位的输出数据确定系统内是否产生所述不可纠正错误;
传输模块,用于当确定所述系统内产生所述不可纠正错误时,传输中断信号至基本输入输出系统;
锁住并下关机模块,用于通过所述中断信号锁住硬盘的数据传输接口,并执行下关机操作。
另外,该装置还提供以下模块:
另一方面,根据所述状态位的输出数据确定系统内是否产生所述不可纠正错误包括:
第一判断模块,用于判断所述输出数据是否为表征所述系统内产生所述不可纠正错误的预设数据;
若否,则触发第二确定模块,用于确定所述系统内未产生所述不可纠正错误,并返回至所述实时检测不可纠正错误对应的不可纠正错误寄存器的状态位的步骤;
若是,则触发第三确定模块,用于确定所述系统内产生所述不可纠正错误;
其中,表征所述系统内产生所述不可纠正错误的所述预设数据为1,对应的,表征所述系统内未产生所述不可纠正错误的所述预设数据为0;
对应的,所述判断所述输出数据是否为表征所述系统内产生所述不可纠正错误的预设数据包括:
第二判断模块,用于判断所述输出数据是否为1;
若否,则触发第四确定模块,用于确定所述系统内未产生所述不可纠正错误,并返回至所述实时检测不可纠正错误对应的不可纠正错误寄存器的状态位的步骤;
若是,则触发第五确定模块,用于确定所述系统内产生所述不可纠正错误。
另一方面,实时检测不可纠正错误对应的不可纠正错误寄存器的状态位包括:
第二实时检测模块,用于通过所述基本输入输出系统利用事件函数实时检测所述状态位。
另一方面,实时检测不可纠正错误对应的不可纠正错误寄存器的状态位包括:
设置模块,用于设置预设时间间隔;
第三实时检测模块,用于根据所述时间间隔实时检测所述状态位;
对应的,所述基本输入输出系统利用事件函数实时检测所述状态位包括:
第四实时检测模块,用于通过所述基本输入输出系统利用事件函数和所述时间间隔实时检测所述状态位。
另一方面,在所述传输中断信号至基本输入输出系统包括:
存储模块,用于通过所述基本输入输出系统存储所述不可纠正错误至高级配置和电源管理接口表中;
生成并传输模块,用于根据存储于所述高级配置和电源管理接口表中的所述不可纠正错误生成并传输所述中断信号。
另一方面,在所述通过所述中断信号锁住硬盘的数据传输接口,并执行下关机操作之后,还包括:
解析并记录模块,用于通过基板管理控制器解析并记录发生所述不可纠正错误的错误信息;
发送模块,用于当确定所述记录信息完成记录时,发送提示信息。
另一方面,在所述发送提示信息之后,还包括:
确定并执行模块,用于根据所述提示信息,确定内存错误,并执行重启操作。
为解决上述技术问题,本发明还提供了一种数据存储设备,包括:
存储器,用于存储计算机程序;
处理器,用于指向计算机程序,实现数据存储方法的步骤。
为解决上述技术问题,本发明还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,实现上述全部数据存储方法的步骤。
本发明所提供的一种数据存储方法,应用于服务器的操作系统,包括:实时检测不可纠正错误对应的不可纠正错误寄存器的状态位;此时保证了发现不可纠正错误时效性,能够对不可纠正错误及时处理;根据状态位的输出数据确定系统内是否产生不可纠正错误;当确定系统内产生不可纠正错误时,传输中断信号至基本输入输出系统;通过中断信号锁住硬盘的数据传输接口,并执行下关机操作,由于中断信号锁住硬盘的数据传输接口,避免了错误数据被认为是正常数据,导致错误数据落盘,进一步导致硬盘数据失效的情况。此时进一步实现了节约系统硬盘的存储空间并同时实现保证数据存储的准确性。
本发明还提供了一种数据存储装置、设备及介质,效果同上。
附图说明
为了更清楚地说明本发明实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所提供的第一种数据存储方法流程图;
图2为本发明实施例所提供的第二种数据存储方法流程图;
图3为本发明实施例所提供的一种数据存储装置结构图;
图4为本发明实施例所提供的一种数据存储设备结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本发明保护范围。
本发明的核心是提供一种数据存储方法、装置、设备及介质,其能够节约系统硬盘的存储空间并同时实现保证数据存储的准确性。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
首先需要说明的是,本发明所提及的一种数据存储方法、装置、设备及介质主要应用于金融行业,当然可以理解的是,可根据具体实施方式确定其应用场景,上述提及的应用于金融行业仅为众多实施例中的一种,对于本发明中所提及的应用场景不做出限定。
对于金融行业来说,使用ARM架构的服务器是最好的选择,但对于任何架构服务器中最核心的还是内存的稳定性功能,倘若内存发生了致命的错误(如:不可纠正错误)时,系统将会宕机并触发系统内存不可修复日志信息,但是,金融行业所需要的操作系统不希望任何多余的数据存储在系统硬盘上,因为这将对硬盘数据中的信息造成混乱导致金融行业中的各种金融数据不准确,而国产ARM架构服务器当前处理流程是内存产生不可恢复故障,CPU没有通知操作系统,操作系统会认为内存为正常状态,此时问题内存产生的错误数据被认为是正常数据,导致错误数据落盘导致硬盘数据失效,而客户的需求是支持ARM服务器内存产生不可恢复故障(UCE)错误,但不能将数据写入硬盘中避免出现硬盘数据错误。
以下为本发明所提供的一种数据存储方法,可以简要概述为:
当ARM架构服务器内存产生UCE错误时,需要系统立刻关机且不能将内存UCE错误信息记录在系统中避免影响硬盘数据中的数据可靠性和稳定性,为了解决该问题,通过基本输入输出系统(Basic Input Output System,BIOS)和操作系统进行联合开发,即当BIOS侦测到内存UCE错误时,将产生中断信号给到操作系统,操作系统接收到BIOS传递的内存UCE错误信号时,此时设置第一优先级:将系统中的硬盘数据接口进行锁住,当数据硬盘接口已确认锁定完毕后,操作系统执行下关机动作。但是,当ARM服务器因内存UCE错误宕机时,系统未将内存UCE错误信息记录在系统中且执行关机动作,用户无法知道关机的原因,此时,需要基板管理控制器(Baseboard Management Controller,BMC)记录下内存UCE错误发生时的记录,这就需要BMC对CPU的内存UCE错误寄存器进行轮训功能,一旦BMC读取或者获取到CPU寄存器中内存UCE错误时便将该问题进行记录到BMC的日志中,当用户发现服务器关机时,对BMC中的日志进行查看以确认关机原因。
其具体实现过程如下:
图1为本发明实施例所提供的第一种数据存储方法流程图,如图1所示,该数据存储方法,应用于服务器的操作系统,包括:
S10:实时检测不可纠正错误对应的不可纠正错误寄存器的状态位;
S11:根据状态位的输出数据确定系统内是否产生不可纠正错误;
S12:当确定系统内产生不可纠正错误时,传输中断信号至基本输入输出系统;
S13:通过中断信号锁住硬盘的数据传输接口,并执行下关机操作。
其中,根据状态位的输出数据确定系统内是否产生不可纠正错误包括:
判断输出数据是否为表征系统内产生不可纠正错误的预设数据;
若否,则确定系统内未产生不可纠正错误,并返回至实时检测不可纠正错误对应的不可纠正错误寄存器的状态位的步骤;
若是,则确定系统内产生不可纠正错误;
其中,表征系统内产生不可纠正错误的预设数据为1,对应的,表征系统内未产生不可纠正错误的预设数据为0;可以理解的是,表征系统内产生不可纠正错误的预设数据还可以设置为0,对应的,表征系统内未产生不可纠正错误的预设数据设置为1,此时下述实施例应按照预设数据进行适应调整。
对应的,判断输出数据是否为表征系统内产生不可纠正错误的预设数据包括:
判断输出数据是否为1;
若否,则确定系统内未产生不可纠正错误,并返回至实时检测不可纠正错误对应的不可纠正错误寄存器的状态位的步骤;
若是,则确定系统内产生不可纠正错误。
此时使用预设数据保证了判断的简单性,且为了保护数据的可靠性提供了进一步支持。
本发明所提供的一种数据存储方法,应用于服务器的操作系统,包括:实时检测不可纠正错误对应的不可纠正错误寄存器的状态位;此时保证了发现不可纠正错误时效性,能够对不可纠正错误及时处理;根据状态位的输出数据确定系统内是否产生不可纠正错误;当确定系统内产生不可纠正错误时,传输中断信号至基本输入输出系统;通过中断信号锁住硬盘的数据传输接口,并执行下关机操作,由于中断信号锁住硬盘的数据传输接口,避免了错误数据被认为是正常数据,导致错误数据落盘,进一步导致硬盘数据失效的情况。此时进一步实现了节约系统硬盘的存储空间并同时实现保证数据存储的准确性。
在上述实施例的基础上,作为一种更优选的实施例,实时检测不可纠正错误对应的不可纠正错误寄存器的状态位包括:
通过基本输入输出系统利用事件函数实时检测状态位。
则,实时检测不可纠正错误对应的不可纠正错误寄存器的状态位包括:
设置预设时间间隔;
根据时间间隔实时检测状态位;
对应的,基本输入输出系统利用事件函数实时检测状态位包括:
通过基本输入输出系统利用事件函数和时间间隔实时检测状态位。
事件函数(event function)只在响应一个事件时被激活,因此能保证功能实现的唯一性,由于事件函数的唯一性以及时间间隔实时检测状态位,使得本发明能够进一步实现数据存储的准确性。
本实施例采取通过BIOS在操作系统下运行事件函数,事件函数采用时间间隔轮训机制对所有内存的UCE错误寄存器进行轮训读取,并对获取的内存UCE错误寄存器的状态位进行判断,当状态位设置1时,则认为内存UCE错误已产生,此时,BIOS通过ACPI表将内存UCE错误寄存器数据传递给操作系统,操作系统对BIOS传递的内存UCE错误进行确认,若是设置1则立刻将硬盘的数据接口进行锁定并禁止所有数据读写,完成后将内存UCE错误信息打印并传递给BMC端,BMC将此内存UCE错误信息进行保存并解析将内存UCE错误的具体位置记录到BMC的日志中,当完成信息记录后BMC通知操作系统进行系统内核panic动作(可以理解为内存错误)并执行关机再开机动作(重启操作),此时,BMC日志可清楚记录ARM架构服务器关机或者再开机的具体原因,保证了ARM架构服务器数据安全可靠、重启原因定位清晰的功能。
在上述实施例的基础上,作为一种更优选的实施例,在传输中断信号至基本输入输出系统包括:
通过基本输入输出系统存储不可纠正错误至高级配置和电源管理接口表中;其中,高级配置和电源管理接口表为ACPI表。
根据存储于高级配置和电源管理接口表中的不可纠正错误生成并传输中断信号。
另外,在通过中断信号锁住硬盘的数据传输接口,并执行下关机操作之后,还包括:
通过基板管理控制器解析并记录发生不可纠正错误的错误信息;
当确定记录信息完成记录时,发送提示信息;
根据提示信息,确定内存错误,并执行重启操作。
此时,能够通过BMC查询日志,以便于用户发现服务器关机时对BMC的日志进行查看以确认关机原因。便于后续对服务器的维护与修复。
图2为本发明实施例所提供的第二种数据存储方法流程图,如图2所示,该方法还能够按照一定的顺序执行,具体为:
其一,ARM服务器开机启动,进入国产操作系统;
其二,在操作系统内,服务器正常运行,BIOS代码通过运行阶段的事件函数,通过时间间隔去读取内存寄存器的UCE错误寄存器状态位并进行状态位判断;
其三,若内存UCE错误寄存器状态位始终为0,则表示服务器目前无内存UCE错误产生,可继续运行系统下的应用程序,继续循环执行步骤2;
其四,若内存UCE错误寄存器状态位变成1,则表示服务器此时内存已产生内存UCE错误,BIOS则通过ACPI表将此内存UCE错误传递给操作系统;
其五,操作系统下的内存UCE错误检测程序检测到BIOS上报的ACPI表内存UCE错误寄存器状态位后,先将硬盘数据接口进行数据锁定即禁止对硬盘中的数据进行读写操作;
其六,当步骤5执行完毕后,操作系统将内存UCE错误的具体位置进行打印到系统日志中,同时,BMC保存系统下打印的系统日志信息,BMC对系统下打印的系统日志进行解析并将内存UCE错误的内存具体位置记录到BMC的日志中;该日志可以为sel日志;
其七,当BMC中的sel日志记录到内存UCE错误记录时,通知操作系统已完成记录,操作系统将执行系统panic动作,并执行重启动作。
由于内存UCE错误产生后会将内存UCE错误数据记录到系统中影响硬盘中数据的可靠性和稳定性,本发明通过BIOS的ACPI表、操作系统下内存UCE错误应用程序、BMC,三者之间协同工作以解决系统下内存UCE错误产生时将硬盘数据接口进行锁定以实现数据安全可靠,同时,操作系统与BMC协同处理内存UCE错误产生的具体位置并当BMC记录完内存UCE错误的具体位置(可以理解为内存地址)后,BMC通知操作系统进行重启操作以实现ARM架构服务器的稳定性运行,此时,可通过BMC记录的信息对ARM服务器重启并产生的内存UCE错误进行详细记录。此时,BIOS在操作系统下通过事件函数采取时间间隔方式读取内存UCE错误寄存器并对状态位进行判断,根据判断结果后确认是否通过ACPI表将内存UCE错误信息上报给操作系统功能,操作系统根据上报结果锁定硬盘的数据传输接口并打印信息传递给BMC,BMC对数据进行解析并记录内存UCE错误具体位置,然后BMC在通知操作系统进行内存错误后重启服务器。
另外,需要说明的是,本发明中所提到的操作系统具有很强的可复制性和拓展性,通过BIOS、操作系统、BMC管理软件三者之间的信息传递对ARM架构服务器内存UCE错误进行相应处理,BIOS负责固定周期对内存UCE错误寄存器进行轮训读取,一旦发现内存UCE错误寄存器状态位设置1后立刻通过BIOS和操作系统之前通信的ACPI表将信息传递给操作系统,一旦操作系统获取到BIOS传递的内存UCE错误信息后立刻将服务器中的所有硬盘数据接口进行锁定并禁止所有数据写入功能,同时,操作系统将内存UCE错误信息传递给BMC,BMC记录并对数据进行解析产生内存UCE错误的具体位置信息并记录到日志中,当BMC完成解析记录后通知操作系统执行系统panic动作并关机重启服务器,通过上述方案可以满足ARM架构服务器在产生内存UCE错误时既可以记录产生错误的位置信息及根因,也可保证当内存UCE错误产生时避免将错误信息写入到ARM架构服务器的数据硬盘中。
在上述实施例中,对于数据存储方法进行了详细描述,本发明还提供数据存储装置对应的实施例。需要说明的是,本发明从两个角度对装置部分的实施例进行描述,一种是基于功能模块的角度,另一种是基于硬件的角度。
图3为本发明实施例所提供的一种数据存储装置结构图,如图3所示,本发明还提供了一种数据存储装置,应用于服务器的操作系统,包括:
第一实时检测模块30,用于实时检测不可纠正错误对应的不可纠正错误寄存器的状态位;
第一确定模块31,用于根据所述状态位的输出数据确定系统内是否产生所述不可纠正错误;
传输模块32,用于当确定所述系统内产生所述不可纠正错误时,传输中断信号至基本输入输出系统;
锁住并下关机模块33,用于通过所述中断信号锁住硬盘的数据传输接口,并执行下关机操作。
此外,该装置还包括以下模块:
在一些实施例中,根据所述状态位的输出数据确定系统内是否产生所述不可纠正错误包括:
第一判断模块,用于判断所述输出数据是否为表征所述系统内产生所述不可纠正错误的预设数据;
若否,则触发第二确定模块,用于确定所述系统内未产生所述不可纠正错误,并返回至所述实时检测不可纠正错误对应的不可纠正错误寄存器的状态位的步骤;
若是,则触发第三确定模块,用于确定所述系统内产生所述不可纠正错误;
其中,表征所述系统内产生所述不可纠正错误的所述预设数据为1,对应的,表征所述系统内未产生所述不可纠正错误的所述预设数据为0;
对应的,所述判断所述输出数据是否为表征所述系统内产生所述不可纠正错误的预设数据包括:
第二判断模块,用于判断所述输出数据是否为1;
若否,则触发第四确定模块,用于确定所述系统内未产生所述不可纠正错误,并返回至所述实时检测不可纠正错误对应的不可纠正错误寄存器的状态位的步骤;
若是,则触发第五确定模块,用于确定所述系统内产生所述不可纠正错误。
在一些实施例中,实时检测不可纠正错误对应的不可纠正错误寄存器的状态位包括:
第二实时检测模块,用于通过所述基本输入输出系统利用事件函数实时检测所述状态位。
在一些实施例中,实时检测不可纠正错误对应的不可纠正错误寄存器的状态位包括:
设置模块,用于设置预设时间间隔;
第三实时检测模块,用于根据所述时间间隔实时检测所述状态位;
对应的,所述基本输入输出系统利用事件函数实时检测所述状态位包括:
第四实时检测模块,用于通过所述基本输入输出系统利用事件函数和所述时间间隔实时检测所述状态位。
在一些实施例中,在所述传输中断信号至基本输入输出系统包括:
存储模块,用于通过所述基本输入输出系统存储所述不可纠正错误至高级配置和电源管理接口表中;
生成并传输模块,用于根据存储于所述高级配置和电源管理接口表中的所述不可纠正错误生成并传输所述中断信号。
在一些实施例中,在所述通过所述中断信号锁住硬盘的数据传输接口,并执行下关机操作之后,还包括:
解析并记录模块,用于通过基板管理控制器解析并记录发生所述不可纠正错误的错误信息;
发送模块,用于当确定所述记录信息完成记录时,发送提示信息。
在一些实施例中,在所述发送提示信息之后,还包括:
确定并执行模块,用于根据所述提示信息,确定内存错误,并执行重启操作。
由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
图4为本发明实施例所提供的一种数据存储设备结构图,如图4所示,一种数据存储设备包括:存储器40,用于存储计算机程序;处理器41,用于执行计算机程序时实现如上述实施例中所提到的数据存储方法的步骤。
本实施例提供的数据存储设备可以包括但不限于智能手机、平板电脑、笔记本电脑或台式电脑等。其中,处理器41可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器41可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(ProgrammableLogic Array,PLA)中的至少一种硬件形式来实现。处理器41也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器(CentralProcessing Unit,CPU);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器41可以集成有图像处理器(Graphics Processing Unit,GPU),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器41还可以包括人工智能(Artificial Intelligence,AI)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器40可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器40还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器40至少用于存储以下计算机程序,其中,该计算机程序被处理器41加载并执行之后,能够实现前述任意一个实施例公开的数据存储方法的相关步骤。另外,存储器40所存储的资源还可以包括操作系统和数据等,存储方式可以是短暂存储或者永久存储。其中,操作系统可以包括Windows、Unix、Linux等。数据可以包括但不限于数据存储方法等。
在一些实施例中,数据存储设备还可包括有显示屏、输入输出接口、通信接口、电源以及通信总线。本领域技术人员可以理解,图4中示出的结构并不构成对数据存储设备的限定,可以包括比图示更多或更少的组件。
本发明实施例提供的数据存储设备,包括存储器40和处理器41,处理器41在执行存储器40存储的程序时,能够实现数据存储方法。
最后,本发明还提供一种计算机可读存储介质对应的实施例。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述方法实施例中记载的步骤。
可以理解的是,如果上述实施例中的方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory),ROM、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上对本发明所提供的一种数据存储方法、装置、设备及介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (10)
1.一种数据存储方法,其特征在于,应用于服务器的操作系统,包括:
实时检测不可纠正错误对应的不可纠正错误寄存器的状态位;
根据所述状态位的输出数据确定系统内是否产生所述不可纠正错误;
当确定所述系统内产生所述不可纠正错误时,传输中断信号至基本输入输出系统;
通过所述中断信号锁住硬盘的数据传输接口,并执行下关机操作。
2.根据权利要求1所述的数据存储方法,其特征在于,所述根据所述状态位的输出数据确定系统内是否产生所述不可纠正错误包括:
判断所述输出数据是否为表征所述系统内产生所述不可纠正错误的预设数据;
若否,则确定所述系统内未产生所述不可纠正错误,并返回至所述实时检测不可纠正错误对应的不可纠正错误寄存器的状态位的步骤;
若是,则确定所述系统内产生所述不可纠正错误;
其中,表征所述系统内产生所述不可纠正错误的所述预设数据为1,对应的,表征所述系统内未产生所述不可纠正错误的所述预设数据为0;
对应的,所述判断所述输出数据是否为表征所述系统内产生所述不可纠正错误的预设数据包括:
判断所述输出数据是否为1;
若否,则确定所述系统内未产生所述不可纠正错误,并返回至所述实时检测不可纠正错误对应的不可纠正错误寄存器的状态位的步骤;
若是,则确定所述系统内产生所述不可纠正错误。
3.根据权利要求1所述的数据存储方法,其特征在于,所述实时检测不可纠正错误对应的不可纠正错误寄存器的状态位包括:
通过所述基本输入输出系统利用事件函数实时检测所述状态位。
4.根据权利要求3所述的数据存储方法,其特征在于,所述实时检测不可纠正错误对应的不可纠正错误寄存器的状态位包括:
设置预设时间间隔;
根据所述时间间隔实时检测所述状态位;
对应的,所述基本输入输出系统利用事件函数实时检测所述状态位包括:
通过所述基本输入输出系统利用事件函数和所述时间间隔实时检测所述状态位。
5.根据权利要求1所述的数据存储方法,其特征在于,所述传输中断信号至基本输入输出系统包括:
通过所述基本输入输出系统存储所述不可纠正错误至高级配置和电源管理接口表中;
根据存储于所述高级配置和电源管理接口表中的所述不可纠正错误生成并传输所述中断信号。
6.根据权利要求1所述的数据存储方法,其特征在于,在所述通过所述中断信号锁住硬盘的数据传输接口,并执行下关机操作之后,还包括:
通过基板管理控制器解析并记录发生所述不可纠正错误的错误信息;
当确定所述记录信息完成记录时,发送提示信息。
7.根据权利要求6所述的数据存储方法,其特征在于,在所述发送提示信息之后,还包括:
根据所述提示信息,确定内存错误,并执行重启操作。
8.一种数据存储装置,其特征在于,应用于服务器的操作系统,包括:
第一实时检测模块,用于实时检测不可纠正错误对应的不可纠正错误寄存器的状态位;
第一确定模块,用于根据所述状态位的输出数据确定系统内是否产生所述不可纠正错误;
传输模块,用于当确定所述系统内产生所述不可纠正错误时,传输中断信号至基本输入输出系统;
锁住并下关机模块,用于通过所述中断信号锁住硬盘的数据传输接口,并执行下关机操作。
9.一种数据存储设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任意一项所述的数据存储方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述的数据存储方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310716986.1A CN116741254A (zh) | 2023-06-16 | 2023-06-16 | 一种数据存储方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310716986.1A CN116741254A (zh) | 2023-06-16 | 2023-06-16 | 一种数据存储方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116741254A true CN116741254A (zh) | 2023-09-12 |
Family
ID=87916488
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310716986.1A Pending CN116741254A (zh) | 2023-06-16 | 2023-06-16 | 一种数据存储方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116741254A (zh) |
-
2023
- 2023-06-16 CN CN202310716986.1A patent/CN116741254A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7900090B2 (en) | Systems and methods for memory retention across resets | |
US20180314580A1 (en) | Data error detection in computing systems | |
US11068360B2 (en) | Error recovery method and apparatus based on a lockup mechanism | |
US9690642B2 (en) | Salvaging event trace information in power loss interruption scenarios | |
US20220391103A1 (en) | Memory anomaly processing method and system, electronic device, and storage medium | |
CN110069361B (zh) | 用于tpm故障切换的方法和装置 | |
WO2017023270A1 (en) | Data copy to non-volatile memory | |
WO2022111048A1 (zh) | 一种电源控制方法、装置、服务器及非易失性存储介质 | |
US20190004818A1 (en) | Method of UEFI Shell for Supporting Power Saving Mode and Computer System thereof | |
CN110058973B (zh) | 数据储存装置的测试系统与数据储存装置的测试方法 | |
US7447943B2 (en) | Handling memory errors in response to adding new memory to a system | |
CN115576734B (zh) | 一种多核异构日志存储方法和系统 | |
CN116627702A (zh) | 虚拟机的宕机重启方法及装置 | |
CN116741254A (zh) | 一种数据存储方法、装置、设备及介质 | |
US20210311833A1 (en) | Targeted repair of hardware components in a computing device | |
US11900150B2 (en) | Methods and systems for collection of system management interrupt data | |
JP2022126549A (ja) | 情報処理装置 | |
CN118069057A (zh) | 一种数据写入方法、装置、设备及介质 | |
WO2024035534A1 (en) | Triple modular redundancy (tmr) radiation hardened memory system | |
CN118152182A (zh) | 服务器开机处理方法、装置、电子设备及存储介质 | |
CN117687821A (zh) | 高速缓冲存储器坏块的处理方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |