CN106940666B - 内存数据检测方法 - Google Patents
内存数据检测方法 Download PDFInfo
- Publication number
- CN106940666B CN106940666B CN201610012101.XA CN201610012101A CN106940666B CN 106940666 B CN106940666 B CN 106940666B CN 201610012101 A CN201610012101 A CN 201610012101A CN 106940666 B CN106940666 B CN 106940666B
- Authority
- CN
- China
- Prior art keywords
- processing chip
- test data
- external memory
- count value
- retransmission count
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1008—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
- G06F11/1012—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices using codes or arrangements adapted for a specific type of error
- G06F11/1016—Error in accessing a memory location, i.e. addressing error
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1405—Saving, restoring, recovering or retrying at machine instruction level
- G06F11/141—Saving, restoring, recovering or retrying at machine instruction level for bus or memory accesses
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
- Techniques For Improving Reliability Of Storages (AREA)
Abstract
本发明提供一种内存数据检测方法,由一处理芯片执行,该处理芯片电连接一外部内存,该处理芯片将一测试数据写入该外部内存,且读取该外部内存的测试数据,来检测写入该外部内存的该测试数据是否正确;若检测结果为不正确,则该处理芯片增加一重传计数值,且判断该重传计数值是否大于一上限次数值,若否,则该处理芯片清除该外部内存的测试数据;若检测结果为正确,则该处理芯片判断该重传计数值是否大于一下限次数值,若是,则该处理芯片记录一错误讯息,藉此实现对该外部内存的数据传输检测。
Description
技术领域
本发明是有关于一种电子数据检测方法,特别是指一种内存数据检测方法。
背景技术
常用于服务器等计算机系统的储存设备,如集束磁盘(Just a bunch of disks,JBOD)中,包含多个硬盘、一电连接服务器及该等硬盘的扩充处理器(Expander),及一电连接该扩充处理器的非挥发随机存取内存(Non-volatile random access memory,NVRAM),该扩充处理器支持串行附接式小型计算机接口(SAS),且读取该非挥发随机存取内存所储存的开机组态、映像文件等物理层设定数据,来执行开机初始化,或使服务器计算机透过其存取该等硬盘的数据等。
然而,当该非挥发随机存取内存的数据线(Data line)存在例如开路、短路故障,造成数据写入不全、或是储存的数据损毁时,会导致该扩充处理器功能无法正常执行,且使服务器无法存取该等硬盘等。因此,提供一种内存数据传输检测方法就成为一个重要的课题。
发明内容
因此,本发明的主要目的在于提供一种内存数据检测方法。
为达上述目的,本发明内存数据检测方法,由一处理芯片执行,该处理芯片电连接一外部内存,且该内存数据检测方法包含一步骤(A)、一步骤(B)、一步骤(C)、一步骤(D)、一步骤(E)、一步骤(G),及一步骤(H)。
该步骤(A)是该处理芯片将一测试数据写入该外部内存。
该步骤(B)是该处理芯片读取该外部内存的测试数据,且检测该测试数据是否正确。
该步骤(C)是若步骤(B)的检测结果为不正确,则该处理芯片增加一重传计数值。
该步骤(D)是该处理芯片判断该重传计数值是否大于一上限次数值。
该步骤(E)是若步骤(D)的判断结果为否,则该处理芯片清除该外部内存的测试数据,并返回步骤(A)。
该步骤(G)是若步骤(B)的检测结果为正确,则该处理芯片判断该重传计数值是否大于一下限次数值,且该下限次数值小于该上限次数值。
该步骤(H)是若步骤(G)的判断结果为是,则该处理芯片记录一错误讯息。
与现有技术相比,本发明藉由该处理芯片将该测试数据写入该外部内存,并验证该测试数据是否正确,并于该测试资料检测为不正确时,累积该重传计数值并重传该测试数据,藉此实现对该外部内存的数据检测。
【附图说明】
本发明之其他的特征及功效,将于参照图式的实施方式中清楚地呈现,其中:
图1是一系统方块图,说明执行本发明内存数据检测方法的一储存设备;
图2是一流程图,说明本发明内存数据检测方法的一第一实施例;及
图3是一流程图,说明本发明内存数据检测方法的一第二实施例。
【具体实施方式】
在本发明被详细描述之前,应当注意在以下的说明内容中,类似的组件是以相同的编号来表示。
参阅图1,本发明内存数据检测方法,在如图1所示的一储存设备(Storage)1中实施,该储存设备1例如应用于服务器等计算机系统的集束磁盘(Just a bunch of disks,JBOD),且包括一处理芯片11、一外部内存12,及一警示单元13。
该处理芯片11包括一预存一测试数据的系统内存111,及一用以传输该测试数据的总线接口112,且该处理芯片11记录一重传计数值,当该测试数据传输失败时,该处理芯片11会重新传送,并在此时累加该重传次数值,来计算重传的次数。详言之,该处理芯片11为扩展处理器(Expander),支持串行附接式小型计算机接口(SAS)的工业标准,并可与例如硬盘(图未示出)电连接,以提供例如服务器计算机存取硬盘的功能,及扩展服务器计算机的储存容量。另外,该总线接口112具有多条用以传输该测试数据的数据线(Data line)113,且每条数据线113可记录1位(bit)的数据。
该外部内存12电连接该处理芯片11的总线接口112,以经由该总线接口112的数据线113,来接收该测试数据。另外,该外部内存12用以储存开机组态、映像文件等物理层设定数据,以供该处理芯片11读取及写入。该外部内存12可以例如非挥发随机存取内存(Non-volatile random access memory,NVRAM)、非挥发性静态随机存取内存(Non-volatilestatic random access memory,NVSRAM)、或闪存(Flash memory)来实施。
该警示单元13电连接该处理芯片11,能受该处理芯片11触发而发出一警示,以通知用户该外部内存12发生记忆功能异常,如数据线113故障等。该警示单元13例如为发光二极管。
参阅图2,本发明内存数据检测方法的一第一实施例,由该处理芯片11执行,以下详细说明该第一实施例的各个步骤。
在步骤S1,该处理芯片11加载预存于该系统内存111的测试数据。
在步骤S2,该处理芯片11清除其所记录的该重传计数值。进一步说,该重传计数值是自一下限次数值累积至一上限次数值,该下限次数值(例如0)小于该上限次数值(例如3),且在此步骤中,该处理芯片11清除该重传计数值成该下限次数值。
在步骤A中,该处理芯片11将该测试数据写入该外部内存12。详言之,该处理芯片11经由该总线接口112的数据线113,将该测试数据的各个位(bit)数据记录于该外部内存12中。
在步骤B中,该处理芯片11读取该外部内存12的测试数据,且检测该测试资料是否正确。若检测结果为正确,即进到步骤H;若检测结果为不正确,进到步骤C。于此步骤中,该处理芯片11比较于步骤S1所加载的该测试数据,是否相同于该外部内存12的测试数据,来判断该测试数据是否正确。更详细地说,该处理芯片11比较记录于该系统内存111的测试数据的所有位,与该总线接口112的数据线113上记录的所有位是否相同,如果其中有任何一个位不同,则判断该外部内存12记录的测试数据不正确。
在步骤C中,若步骤B的检测结果为不正确,则该处理芯片11增加该重传计数值。在本实施例中,该处理芯片11将该重传计数值增加1。
在步骤D中,该处理芯片11判断该重传计数值是否大于该上限次数值,例如判断是否大于3次;若判断结果为是,进到步骤F,若判断结果为否,进到步骤E。
在步骤E中,该处理芯片11清除该外部内存12的测试数据,并返回步骤A,也就是说,该处理芯片重复将该测试数据写入该外部内存12,并再次判断该测试数据是否正确。
在步骤F中,当该处理芯片11判断该重传计数值大于该上限次数值,即触发该警示单元13发出该警示,并接着进到步骤H。该警示单元13例如显示警示灯号,以通知用户该外部内存12发生异常。
在步骤G中,该处理芯片11判断该重传次数值是否大于该下限次数值,例如判断是否大于0次;若判断结果为是,则进到步骤H,若判断结果为否,直接进到步骤I。
在步骤H中,当该处理芯片11在步骤F判断该重传计数值大于该上限次数值,以及在步骤G中判断该重传计数值大于该下限次数值时,该处理芯片11记录一错误讯息于一工作日志(log)中,并接着进到步骤I。换言之,只要该处理芯片11增加该重传计数值,或是该重传计数值大于该上限次数值,该处理芯片11即记录该错误讯息告知用户。其中,该错误讯息即记录数据线有错误的讯息,供用户得知该外部内存12异常或有损毁的情形。
在步骤I中,该处理芯片11清除该外部内存12的测试数据,以供下次测试时能再次写入。
在步骤J中,该处理芯片11等候一预定时间,并返回步骤S2。亦即,该处理芯片11间隔该预定时间,例如10分钟之后,清除该重传计数值,并重复执行所述数据检测方法,以定期检测该外部内存12的数据是否能正常写入。
因此,本发明内存数据检测方法,藉由每间隔该预定时间,写入该测试数据至该外部内存12,以定期执行该外部内存12的传输检测,来确保该外部内存12能正常运作。并且,于该测试数据检测为不正确,亦即该测试数据写入失败时,即重传该测试数据,并且累积该重传计数值。
此外,在本实施例中,该处理芯片11还根据该重传计数值执行相对应的动作,以于执行传输检测过程中有错误发生时,达到不同程度的提示作用:一、当该处理芯片11判断该重传计数值小于该下限次数值,即0次时,表示此时未有错误发生,该处理芯片11清除该外部内存12的测试数据,等候再次写入测试;二、当该处理芯片11判断该重传计数值大于该下限次数值时,该处理芯片11会记录该错误讯息于该工作日志,因为实际而言,该等数据线113可能因为受到电气讯号干扰、或是该处理芯片11发生数据写入异常等程序异常的因素,导致该处理芯片11在写入和验证该外部内存12的测试数据时,发生重传1次验证失败,但重传2次验证成功的情形,故只要增加该重传计数值,该处理芯片11便记录该错误讯息,以提醒用户该等数据线113传输检测时曾经有错误发生;三、当该处理芯片11判断该重传次数值大于该上限次数值,即3次时,表示该等资料线113发生异常或毁损的机率很高,因此该处理芯片11除了记录该错误讯息外,更触发该警示单元13发出该警示通知使用者,如此一来,便能根据不同的重传次数值,分类不同层级的错误,并给予使用者不同程度的提示。
参阅图3,本发明内存数据检测方法的一第二实施例,与该第一实施例的差异在于:该步骤D能于步骤A及步骤B之间实施。也就是说,相较于该第一实施例,该处理芯片11在将该测试数据写入该外部内存12之后,先判断该重传计数值是否大于该上限次数值,若判断为是,即进到步骤F触发该警示单元13发出该警示;若判断为否,进到步骤C,将该重传计数值增加1,并进到步骤E,清除该外部内存12的测试数据,且返回步骤A,即重传该测试数据至该外部内存12,再次判断该测试数据是否正确。如此,可增加本发明于实施上的弹性。
综上所述,本发明内存数据检测方法,藉由该处理芯片11定期检测该外部内存12是否能正常执行数据写入,并于发生异常时,除了重传该测试数据至该外部内存12之外,该处理芯片11还根据该重传计数值,执行相对应的动作,确保该外部内存12的正常运作,如此,该处理芯片11也能正确地读取该外部内存12所储存的开机组态、映像文件等物理层设定数据,来执行开机初始化,以确保例如服务器计算机经由该处理芯片11能够正确、稳定地存取硬盘,故确实能达成本发明之目的。
上述各实施例及图示仅为本发明的较佳实施例而已,但不能以之限定本发明实施之范围,即大凡依本发明权利要求书所作的均等变化与修饰,皆应属本发明专利涵盖的范围内。
Claims (4)
1.一种内存数据检测方法,由一处理芯片执行,该处理芯片记录一重传计数值并电连接一外部内存及一警示单元,其特征在于,该内存数据检测方法包含:
(S1)该处理芯片加载一测试数据;及
(S2)该处理芯片清除该重传计数值;
(A)该处理芯片将该测试数据写入该外部内存;
(B)该处理芯片读取该外部内存的测试数据,来检测写入该外部内存的该测试数据是否正确;
(C)若步骤(B)的检测结果为不正确,则该处理芯片增加该重传计数值;及
(D)该处理芯片判断该重传计数值是否大于一上限次数值;
(E)若步骤(D)的判断结果为否,则该处理芯片清除该外部内存的测试数据,并返回步骤(A);
(F)若步骤(D)的判断结果为是,则该处理芯片触发该警示单元以发出一警示,并进到步骤(H)
(G)若步骤(B)的检测结果为正确,则该处理芯片判断该重传计数值是否大于一下限次数值,且该下限次数值小于该上限次数值;及
(H)若步骤(G)的判断结果为是,则该处理芯片记录一错误讯息;
(I)若步骤(G)判断的结果为否,则该处理芯片清除该外部内存的测试数据;及
(J)该处理芯片等候一预定时间,并返回步骤(S2)。
2.如权利要求1所述的内存数据检测方法,其特征在于,在步骤(B)中,该处理芯片比较于步骤(S1)所加载的该测试数据,是否相同于该外部内存的测试数据,来判断该测试数据是否正确。
3.如权利要求1所述的内存数据检测方法,其特征在于,该重传计数值是自该下限次数值累积至该上限次数值,且在该步骤(S2)中,该处理芯片清除该重传计数值成该下限次数值。
4.一种内存数据检测方法,由一处理芯片执行,该处理芯片电连接一外部内存,且该处理芯片记录一重传计数值,该内存数据检测方法包含:
(S1)该处理芯片加载一测试数据;及
(S2)该处理芯片清除该重传计数值;
(A)该处理芯片将该测试数据写入该外部内存;
(D)该处理芯片判断该重传计数值是否大于一上限次数值;
(B)若步骤(D)判断为否,则该处理芯片读取该外部内存的测试数据,来检测写入该外部内存的该测试数据是否正确;
(C)若步骤(B)的检测结果为不正确,则该处理芯片增加该重传计数值;及
(E)该处理芯片清除该外部内存的测试数据,并返回步骤(A);
(F)若步骤(D)的判断结果为是,则该处理芯片触发一警示单元以发出一警示,并进到步骤(G);及
(G)若步骤(B)的检测结果为正确,则该处理芯片判断该重传计数值是否大于一下限次数值,且该下限次数值小于该上限次数值;
(H)若步骤(G)的判断结果为是,则该处理芯片记录一错误讯息;
(I)若步骤(G)判断的结果为否,则该处理芯片清除该外部内存的测试数据;及
(J)该处理芯片等候一预定时间,并返回步骤(S2)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610012101.XA CN106940666B (zh) | 2016-01-05 | 2016-01-05 | 内存数据检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610012101.XA CN106940666B (zh) | 2016-01-05 | 2016-01-05 | 内存数据检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106940666A CN106940666A (zh) | 2017-07-11 |
CN106940666B true CN106940666B (zh) | 2020-09-22 |
Family
ID=59468488
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610012101.XA Active CN106940666B (zh) | 2016-01-05 | 2016-01-05 | 内存数据检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106940666B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113806108A (zh) * | 2021-08-25 | 2021-12-17 | 海光信息技术股份有限公司 | 一种重传方法、内存控制器、处理器系统及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW341367U (en) * | 1997-10-28 | 1998-09-21 | Utek Semiconductor Corp | An auto repairing memory |
TW200601348A (en) * | 2004-06-30 | 2006-01-01 | Hon Hai Prec Ind Co Ltd | System and method for testing memory |
CN103208314A (zh) * | 2013-03-04 | 2013-07-17 | 深圳市硅格半导体有限公司 | 嵌入式系统的内存测试方法及嵌入式系统 |
CN103699463A (zh) * | 2012-09-28 | 2014-04-02 | 国际商业机器公司 | 一种使用Xeon处理器的服务器的内存测试方法和系统 |
CN103839578A (zh) * | 2012-11-27 | 2014-06-04 | 李欣 | 一种提高基于nand的固态存储器数据保持时间的方法 |
-
2016
- 2016-01-05 CN CN201610012101.XA patent/CN106940666B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW341367U (en) * | 1997-10-28 | 1998-09-21 | Utek Semiconductor Corp | An auto repairing memory |
TW200601348A (en) * | 2004-06-30 | 2006-01-01 | Hon Hai Prec Ind Co Ltd | System and method for testing memory |
CN103699463A (zh) * | 2012-09-28 | 2014-04-02 | 国际商业机器公司 | 一种使用Xeon处理器的服务器的内存测试方法和系统 |
CN103839578A (zh) * | 2012-11-27 | 2014-06-04 | 李欣 | 一种提高基于nand的固态存储器数据保持时间的方法 |
CN103208314A (zh) * | 2013-03-04 | 2013-07-17 | 深圳市硅格半导体有限公司 | 嵌入式系统的内存测试方法及嵌入式系统 |
Also Published As
Publication number | Publication date |
---|---|
CN106940666A (zh) | 2017-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109328340B (zh) | 内存故障的检测方法、装置和服务器 | |
US8775864B2 (en) | Controlling a solid state disk (SSD) device | |
US20090150721A1 (en) | Utilizing A Potentially Unreliable Memory Module For Memory Mirroring In A Computing System | |
WO2017079454A1 (en) | Storage error type determination | |
CN104951383A (zh) | 用于监测硬盘的健康状况的方法和装置 | |
US11017875B2 (en) | Tracking address ranges for computer memory errors | |
US8984379B2 (en) | MRAM field disturb detection and recovery | |
US10915388B2 (en) | Data storage device and associated operating method capable of detecting errors and effectively protecting data | |
CN111048139A (zh) | 一种存储介质检测方法、装置、设备及可读存储介质 | |
US10338999B2 (en) | Confirming memory marks indicating an error in computer memory | |
CN102135925A (zh) | 用于检测错误检查和纠正内存的方法和装置 | |
US20240311233A1 (en) | Hardware Fault Detection Method for Internal Memory, Apparatus, and Internal Memory Controller | |
CN103825649A (zh) | 光模块信息的修复方法和装置 | |
CN114860487A (zh) | 一种内存故障识别方法及一种内存故障隔离方法 | |
CN106940666B (zh) | 内存数据检测方法 | |
US11175980B2 (en) | Mitigation of solid state memory read failures | |
CN102981925A (zh) | 应用于通讯设备的寄存器巡检校验控制方法 | |
US20210124649A1 (en) | Dynamically adjusting a journal snapshot window | |
CN109102839B (zh) | 一种坏块标记方法、装置、设备及可读存储介质 | |
CN113625957B (zh) | 一种硬盘故障的检测方法、装置及设备 | |
CN107643877A (zh) | 磁盘故障检测方法以及装置 | |
TWI607455B (zh) | 記憶體資料檢測方法 | |
US11340979B2 (en) | Mitigation of solid state memory read failures with a testing procedure | |
US5740177A (en) | Method of correcting error, suitable for storage device | |
US10754566B2 (en) | Data storage device and data storage method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |