CN116662042A - 内存装置及其工作方法、计算机可读存储介质及设备 - Google Patents

内存装置及其工作方法、计算机可读存储介质及设备 Download PDF

Info

Publication number
CN116662042A
CN116662042A CN202210153582.1A CN202210153582A CN116662042A CN 116662042 A CN116662042 A CN 116662042A CN 202210153582 A CN202210153582 A CN 202210153582A CN 116662042 A CN116662042 A CN 116662042A
Authority
CN
China
Prior art keywords
memory
particles
type
bank
color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210153582.1A
Other languages
English (en)
Inventor
黄丽萍
黄国维
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changxin Memory Technologies Inc
Original Assignee
Changxin Memory Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changxin Memory Technologies Inc filed Critical Changxin Memory Technologies Inc
Priority to CN202210153582.1A priority Critical patent/CN116662042A/zh
Publication of CN116662042A publication Critical patent/CN116662042A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3037Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/325Display of status information by lamps or LED's
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

本申请涉及一种内存装置及其工作方法、计算机可读存储介质及设备。该内存装置包括内存条,内存条包括若干个内存颗粒;内存控制器,用于获取各内存颗粒的地址信息;内存条通过系统管理总线与内存控制器进行通信;解析装置,与内存条及内存控制器相连接,用于接收内存控制器获取的各内存颗粒的地址信息,获取内存条与内存控制器的通信信息,并对所述通信信息进行解析,以得到各内存颗粒的工作状态;若干个状态指示装置,各状态指示装置均与解析装置相连接,且与内存颗粒对应设置,用于根据预设规则及地址信息,对内存颗粒的工作状态予以指示。本申请提供的内存装置能够节约排除故障所需时间,提升故障排除的效率和准确度。

Description

内存装置及其工作方法、计算机可读存储介质及设备
技术领域
本申请涉及半导体技术领域,特别是涉及一种内存装置及其工作方法、计算机可读存储介质及设备。
背景技术
随着大数据时代的来临,人们对内存的需求日益增大,要求也日益严苛。主板上的双列直插式存储模块(Dual-Inline-Memory-Modules,DIMM)越来越多,而每根DIMM上的动态随机存取存储器(Dynamic Random Access Memor y,DRAM)颗粒可以为几颗到几十颗不等;并且随着内存增多,内存颗粒更易出现异常。这些给内存问题定位和解析带来极大挑战。
一旦某颗或某几颗DRAM颗粒出现问题时可能导致系统宕机,相关人员只能通过查看异常日志或消除故障(Debug)手段才能定位到异常DIMM,以及该DIMM上的异常DRAM颗粒,再通过相关人员对异常DRAM颗粒进行分析。这样不仅流程繁琐,而且容易由于人为失误导致定位出错。
因此,如何直观地获知DIMM上各DRAM颗粒的工作状态,是亟需解决的问题。
发明内容
基于此,有必要针对上述现有技术中的不足之处,提供一种内存装置及其工作方法、计算机可读存储介质及设备。
为了实现上述目的,一方面,本申请提供了一种内存装置,包括:
内存条,所述内存条包括若干个内存颗粒;
内存控制器,用于获取各所述内存颗粒的地址信息;
系统管理总线,所述内存条通过所述系统管理总线与所述内存控制器进行通信;
解析装置,与所述内存条及所述内存控制器相连接,用于接收所述内存控制器获取的各所述内存颗粒的地址信息,获取所述内存条与内存控制器的通信信息,并对所述通信信息进行解析,以得到各所述内存颗粒的工作状态;
若干个状态指示装置,各所述状态指示装置均与所述解析装置相连接,且与所述内存颗粒对应设置;所述状态指示装置用于根据预设规则及所述地址信息,对所述内存颗粒的所述工作状态予以指示。
在其中一个实施例中,所述内存颗粒的工作状态包括:训练过程异常、发生第一类型错误及发生第二类型错误中的至少一种。
在其中一个实施例中,所述第一类型错误包括可纠正错误,所述第二类型错误包括不可纠正错误。
在其中一个实施例中,所述解析装置包括解析芯片;所述状态指示装置包括指示灯,所述指示灯位于所述内存条上。
在其中一个实施例中,所述内存颗粒的工作状态包括训练过程异常、发生第一类型错误及发生第二类型错误;
所述指示灯至少具有第一指示色、第二指示色及第三指示色,所述指示灯被配置为:
在所述内存颗粒的训练过程异常时亮起所述第一指示色,在所述内存颗粒发生第一类型错误时亮起所述第二指示色,在所述内存颗粒发生第二类型错误亮起所述第三指示色。
在其中一个实施例中,所述通信信息包括带外信号;所述解析装置通过所述系统管理总线将所述带外信号与所述内存条通信连接。
在其中一个实施例中,所述内存条包括双列直插式存储模块内存条,所述内存颗粒包括动态随机存取存储器颗粒。
基于同样的发明构思,本申请还提供一种如前述任一实施例中提供的内存装置的工作方法,所述工作方法包括:
使用所述解析装置接收所述内存控制器获取的各所述内存颗粒的地址信息,获取所述内存条与所述内存控制器的通信信息,并对所述通信信息进行解析,以得到各所述内存颗粒的工作状态;
通过各所述状态指示装置,根据预设规则及所述地址信息对所述内存颗粒的所述工作状态予以指示。
在其中一个实施例中,所述使用所述解析装置获取所述内存条与内存控制器的通信信息之前,所述工作方法还包括:
对所述内存条、所述解析装置及所述内存控制器通电,所述内存条与所述内存控制器通过系统管理总线进行通信。
在其中一个实施例中,所述使用所述解析装置接收所述内存控制器获取的各所述内存颗粒的地址信息之前,所述工作方法还包括:
通过所述内存控制器对命令信息进行解析以定位所述内存颗粒所在的所述内存条,对输入/输出数据及配置信息进行解析以定位所述内存颗粒。
在其中一个实施例中,所述内存颗粒的工作状态包括训练过程异常、发生第一类型错误及发生第二类型错误;
所述状态指示装置包括指示灯,所述指示灯至少具有第一指示色、第二指示色及第三指示色;
所述通过各所述状态指示装置,根据预设规则及所述地址信息对所述内存颗粒的所述工作状态予以指示,包括:
对所述内存颗粒进行训练,判断所述内存颗粒的训练过程是否正常,所述指示灯在所述内存颗粒的训练过程异常时亮起所述第一指示色;
所述内存颗粒进入运行程序,判断所述内存颗粒的工作是否正常,若判断所述内存颗粒工作异常,则判断所述内存颗粒是否存在第一类型错误,所述指示灯在所述内存颗粒发生第一类型错误时亮起所述第二指示色;若否,则判断所述内存颗粒是否存在第二类型错误,所述指示灯在所述内存颗粒发生第二类型错误亮起所述第三指示色。
在其中一个实施例中,所述第一类型错误包括可纠正错误,所述第二类型错误包括不可纠正错误。
在其中一个实施例中,所述指示灯亮起所述第一指示色之后,所述工作方法还包括:
将所述内存颗粒所在的所述内存条断电;
重新插拔所述内存条或更换所述内存条;
为重新插拔后的所述内存条或更换后的所述内存条通电,使得更换后的所述内存条与所述内存控制器进行通信;
所述指示灯亮起所述第二指示色之后,所述工作方法还包括:
将所述内存颗粒所在的所述内存条断电;
更换所述内存条;
为更换后的所述内存条通电,使得更换后的所述内存条与所述内存控制器进行通信;
所述指示灯亮起所述第三指示色之后,所述工作方法还包括:
将所述内存颗粒所在的所述内存条断电;
更换所述内存条;
为更换后的所述内存条通电,使得更换后的所述内存条与所述内存控制器进行通信。
基于同样的发明构思,本申请还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如前述任一实施例所述的工作方法的步骤。
基于同样的发明构思,本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器用于执行所述计算机程序时实现如前述任一实施例所述的工作方法的步骤。
本申请提供的内存装置,能够通过状态指示装置对各内存颗粒的工作状态予以指示,无需Debug或通过相关人员解析,即可获知各内存颗粒的工作状态,并定位有问题的内存颗粒所在,不仅节约排除故障所需时间,还不容易由于人为失误导致定位出错,能够提升故障排除的效率和准确度。同时,由于内存条通过系统管理总线与内存控制器进行通信,通信过程不会占用内存装置带内信号的带宽,保证带内信号传输质量。
本申请提供的内存装置的工作方法,能够通过状态指示装置对内存颗粒的工作状态直观地予以指示,无需Debug或通过相关人员解析,即可获知内存颗粒的工作状态,并定位有问题的内存颗粒所在,不仅节约时间,还不容易在沟通或操作时出错,能够提升故障排除的效率和准确度。同时,前述任一实施例所述的内存装置所能实现的其他技术效果,该工作方法也均能实现,此处不再详述。
附图说明
为了更清楚地说明本申请实施例或传统技术中的技术方案,下面将对实施例或传统技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一种传统内存装置的工作方法的流程图;
图2为本申请其中一个实施例提供的内存装置的结构示意图;
图3为本申请其中一个实施例提供的内存装置的工作方法的流程图;
图4为本申请另一个实施例提供的内存装置的工作方法的流程图。
附图标记说明:
10、内存条;101、内存颗粒;20、内存控制器;30、系统管理总线;401、解析芯片;50、状态指示装置。
具体实施方式
为了便于理解本申请,下面将参照相关附图对本申请进行更全面的描述。附图中给出了本申请的首选实施例。但是,本申请可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本申请的公开内容更加透彻全面。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。
应当明白,当元件被称为“位于...上”时,其可以直接地在其它元件上,或者可以存在居间的元件。应当明白,尽管可使用术语第一、第二、第三等描述各种元件、部件或部分,这些元件、部件或部分不应当被这些术语限制。这些术语仅仅用来区分一个元件、部件或部分与另一个元件、部件或部分。因此,在不脱离本申请教导之下,下面讨论的第一元件、部件或部分可表示为第二元件、部件或部分;举例来说,可以将第一指示色称为第二指示色,且类似地,可以将第二指示色称为第一指示色;第一指示色与第二指示色为不同的颜色。
在此使用时,单数形式的“一”、“一个”和“所述/该”也可以包括复数形式,除非上下文清楚指出另外的方式。还应明白,当术语“组成”和/或“包括”在该说明书中使用时,可以确定所述特征、整数、步骤、操作、元件和/或部件的存在,但不排除一个或更多其它的特征、整数、步骤、操作、元件、部件和/或组的存在或添加。同时,在此使用时,术语“和/或”包括相关所列项目的任何及所有组合。
这里参考作为本申请的理想实施例的示意图来描述发明的实施例,这样可以预期由于例如制造技术和/或容差导致的所示形状的变化。本申请的实施例不应当局限于在此所示的区的特定形状,而是包括由于例如制造技术导致的形状偏差;因此,图中显示的器件实质上是示意性的,它们的形状并不表示器件的实际形状,且并不限定本申请的范围。
目前在服务器、笔记本电脑和个人电脑等产品上可以看到各种类型的双列直插式存储模块(Dual-Inline-Memory-Modules,DIMM),每个平台可以配置多根DIMM,每根DIMM上又有着几个甚至几十个动态随机存取存储器(Dynami c Random Access Memory,DRAM)颗粒。
如图1所示,当系统发生异常时,需要通过查看异常日志或消除故障(De bug)手段确定内存报错,在得到错误数据的物理位置信息后,先根据内存槽位定位到异常DIMM,再根据异常数据(DQ)和原始卡(Raw card)信息定位到该DIMM上的异常DRAM颗粒后,才能对异常DRAM颗粒进行分析,对于服务器平台,由于DIMM数量很多,需要耗费更多的时间才能找到异常DIMM和异常DRAM颗粒,而且可能人为失误导致物理定位错误。
鉴于现有技术的上述不足之处,本申请提供一种内存装置。
请参阅图2,该内存装置可以具体包括内存条10、内存控制器20、系统管理总线30、解析装置及若干个状态指示装置50。
具体的,内存条10可以包括若干个内存颗粒101,内存条10通过系统管理总线30与内存控制器20进行通信;内存控制器20至少可以用于获取各内存颗粒101的地址信息;解析装置与内存条10及内存控制器20相连接,可以用于接收内存控制器20获取的各内存颗粒101的地址信息,获取内存条10与内存控制器20的通信信息,并对该通信信息进行解析,以得到各内存颗粒101的工作状态;各状态指示装置50均与解析装置相连接,且与内存颗粒101对应设置,状态指示装置50可以用于根据预设规则及地址信息,对内存颗粒101的工作状态予以指示。
内存条10在电子系统中十分常见,尤其是在大数据中心等服务器上,内存条10数量非常多;并且,每根DIMM上又可以具有几个甚至几十个内存颗粒101。一旦内存颗粒101出现问题,只有通过查看异常日志或Debug手段才能找到异常内存颗粒101及该异常内存颗粒101所在的内存条10,这是一件非常繁琐的事情。上述实施例中提供的内存装置,能够通过状态指示装置50对各内存颗粒101的工作状态予以指示,无需Debug或通过相关人员解析,即可获知各内存颗粒101的工作状态,并定位有问题的内存颗粒101所在,不仅节约排除故障所需时间,还不容易由于人为失误导致定位出错,能够提升故障排除的效率和准确度。
同时,由于内存条10通过系统管理总线30与内存控制器20进行通信,通信过程不会占用内存装置带内信号的带宽,保证带内信号传输质量。
需要说明的是,异常内存颗粒101的地址解析由内存控制器20完成。
当内存条10上存在异常内存颗粒101时,内存控制器20可以通过解析命令信息(CMD)得到MC(存储器单元)、Channel(通道,指存储器接口内独立控制存储器设备的分区的一组物理上分立的连接)、Rank(列,指在存储器设备管芯堆栈内以多点方式连接到单个通道的多个切片)和输入/输出数据(DQ)等信息后,结合配置信息(SPD)中的原始卡信息,可以定位到异常内存颗粒101具体位于哪一个内存条10上,从而使得内存控制器20能够获取异常内存颗粒101的地址信息,进而将异常内存颗粒101的地址信息发送至解析装置,解析装置接收异常内存颗粒101的地址信息,并获取内存条10与内存控制器20的通信信息,并对该通信信息进行解析,以得到异常内存颗粒101的工作状态。
内存条10上存在异常内存颗粒101时,解析装置得到各内存颗粒101的工作状态后,根据该工作状态及接收到的异常内存颗粒101的地址信息,控制异常内存颗粒101对应的状态指示装置50对该异常内存颗粒101的工作状态予以指示。
本申请对于内存条10的具体形式并不做限定,内存条10可以包括但不限于双列直插式存储模块内存条或单列直插式存储器模块(SIM)内存条等等。
请继续参阅图2,在其中一个实施例中,内存条10包括双列直插式存储模块内存条;在此基础上,内存颗粒101可以包括动态随机存取存储器颗粒。
具体的,该双列直插式存储模块内存条可以包括布置在印刷电路板上的若干个动态随机存取存储器颗粒;可以理解,双列直插式存储模块内存条上动态随机存取存储器颗粒的数量受到相应的双列直插式存储模块内存条插槽或槽的长度的限制。
请继续参阅图2,内存条10内还可以包括电源管理集成电路(Power Mana gementIntegrated Circuits,PMIC)及配置信息存储模块。
其中,电源管理集成电路可以用于对供电电源进行管理,配置信息存储模块可以用于存放内存条10上各内存颗粒101的物理位置。
此外,本申请中涉及的内存条10的配置信息还可以包括但不限于内存条10的模组厂商、工作电压、工作频率、速度、容量、行/列地址及数量及各种主要操作时序等等。在一些可能的示例中,配置信息存储模块包括带电可擦可编程只读存储器(可擦写的eeprom);可选的,内存条10的配置信息可以在出厂前,由内存条10制造厂商根据其实际性能写入到该带电可擦可编程只读存储器中。
示例性的,本申请中涉及的内存颗粒101的工作状态可以包括但不限于训练过程异常、发生第一类型错误及发生第二类型错误等等工作状态中的一种或几种。
需要说明的是,本申请中涉及的训练过程可以包括初始化内存颗粒101的过程及对内存颗粒101进行训练的过程;具体来说,初始化内存颗粒101的过程用于对整个信号链路进行对齐和补偿;在一些示例中,初始化内存颗粒101的过程中,还可以通过系统管理总线30读取配置信息存储模块的内容,对各个延迟记录在案,可供后续步骤使用;对内存颗粒101进行训练的过程用于准确设定内存颗粒101的时序,使得多个内存颗粒101的时序一致。
具体的,在其中一个实施例中,第一类型错误可以包括可纠正错误,第二类型错误可以包括不可纠正错误。
本申请对于可纠正错误和不可纠正错误的形式并不做具体限定。在其中一个实施例中,可纠正错误可以包括传输的数据中异常数据的位(bit)数低于预设阈值的情况;对应的,不可纠正错误可以包括传输的数据中异常数据的位(b it)数大于等于预设阈值的情况。
请继续参阅图2,在其中一个实施例中,解析装置可以包括解析芯片401。
本申请对于状态指示装置50的具体形式并不做限定,只要其能够根据预设规则及地址信息对内存颗粒101的工作状态予以指示即可。在其中一个实施例中,状态指示装置50可以包括指示灯;具体的,指示灯可以位于内存条10上。
本申请对于状态指示装置50的位置并不做具体限定;例如,状态指示装置50可以位于内存条10上,也可以位于其他相关人员能够方便地进行观察的位置。
请继续参阅图2,在其中一个实施例中,各状态指示装置50均位于内存条10的上边沿,这样状态指示装置50更加显眼易被观察。
本申请对于状态指示装置50与内存颗粒101对应设置的方式亦不做具体限定;状态指示装置50的数量可以与内存颗粒101的数量相同,且各状态指示装置50与各内存颗粒101一一对应;状态指示装置50的数量也可以少于内存颗粒101的数量,这些状态指示装置50至少与部分内存颗粒101一一对应。
在其中一个实施例中,内存颗粒101的工作状态包括训练过程异常、发生第一类型错误及发生第二类型错误;同时,状态指示装置50包括指示灯,且指示灯至少具有第一指示色、第二指示色及第三指示色。
具体的,在本实施例中,指示灯可以被配置为:在内存颗粒101的训练过程异常时亮起第一指示色,在内存颗粒101发生第一类型错误时亮起第二指示色,并在内存颗粒101发生第二类型错误亮起所述第三指示色。
上述实施例中提供的内存装置,当内存条10上存在异常内存颗粒101时,异常内存颗粒101对应的状态指示装置50亮起,这样不仅能够通过指示灯亮起或不亮,以及亮起指示色对内存颗粒101的工作状态更加直观地予以指示,还可以按照内存颗粒101出现的问题种类,亮起相应的指示色以进行分类指示,进一步地节约排除故障所需时间。同时,上述实施例中提供的内存装置,使得相关人员可以直观、迅速地确定出现问题的内存颗粒101所在位置及问题类型并开始下一步的分析,若后续需要更换新内存条10,能够直接根据内存颗粒101的问题类型,更换异常内存条10。
需要说明的是,本申请对于第一指示色、第二指示色及第三指示色的颜色并不做具体限定,只要第一指示色、第二指示色不同及第三指示色均不同。在其中一个实施例中,第一指示色可以包括蓝色,第二指示色可以包括黄色,第三指示色可以包括红色。
请继续参阅图2,在其中一个实施例中,通信信息包括带外信号;在此基础上,解析装置可以通过系统管理总线30将带外信号与内存条10通信连接。
根据联合电子设备工程委员会(Joint Electron Device Engineering Council,JEDEC)的规范,内存条10和内存控制器20之间除了有带内信号进行通信连接,还有带外信号。其中,带内信号可以包括但不限于时钟信号(CLK)、输入/输出数据、参考信号(DQS)、控制信号(CTRL)及地址信号(Address)等等,还可以用于读取包括但不仅限于命令信息;带外信号可以包括但不限于警报信号(ALERT)、电源信号(POWER)、参考电压信号(GND),还可以用于读取包括但不限于配置信息、温度信息及电源管理集成电路信息等等;具体的,配置信息中可以含有原始卡信息,而该原始卡信息可以用于确定内存条10上内存颗粒101的物理位置。
上述实施例中提供的内存装置,内存控制器20可以通过带外信号将内存颗粒101的工作状态及地址信息告知内存条10,这样不会占用内存装置带内信号的带宽,保证带内信号传输质量。
可以理解,在系统上,每个内存颗粒101的系统管理总线30地址是不一样的,内存控制器20与每个内存条10均能够通过带外信号实现通信连接;也就是说,同一内存控制器20下不会存在相同物理地址的内存条10,这样能够保证内存控制器20可以和每个内存条10进行带外信号通信。
可选的,在另一些示例中,内存条10还可以通过I3C串行总线(Improved Inter-Integrated Circuit,I3C)与内存控制器20进行通信。I3C串行总线可以支持多个主设备,不仅能够与传统的两线式串行总线(Inter-Integrated Circuit,I2C)设备兼容,相比较于I2C串行总线的功耗还更低,可以支持软中断,并且速度更快,可以支持到12.5MHZ。
基于同样的发明构思,本申请还提供一种前述任一实施例中提供的内存装置的工作方法。
请结合图2参阅图3,在其中一个实施例中,该工作方法具体可以包括如下步骤:
S20:使用解析装置接收内存控制器20获取的各内存颗粒101的地址信息,获取内存条10与内存控制器20的通信信息,并对该通信信息进行解析,以得到各内存颗粒101的工作状态。
S30:通过各状态指示装置50,根据预设规则及地址信息对内存颗粒101的工作状态予以指示。
本申请提供的内存装置的工作方法,能够通过状态指示装置50对内存颗粒101的工作状态直观地予以指示,无需Debug或通过相关人员解析,即可获知内存颗粒101的工作状态,并定位有问题的内存颗粒101所在,不仅节约时间,还不容易在沟通或操作时出错,能够提升故障排除的效率和准确度;同时,前述任一实施例所述的内存装置所能实现的其他技术效果,该工作方法也均能实现,此处不再详述。
请继续参阅图3,在其中一个实施例中,在步骤S20之前,该工作方法还可以包括如下步骤:
S30:对内存条10、解析装置及内存控制器20通电,内存条10与内存控制器20通过系统管理总线30进行通信。
可以理解,当对内存条10通电的同时,也就能够对内存条10上各内存颗粒101通电。
上述实施例中提供的工作方法中,由于内存条10通过系统管理总线30与内存控制器20进行通信,通信过程不会占用内存装置带内信号的带宽,保证带内信号传输质量。
在其中一个实施例中,在步骤S20之前,还可以通过内存控制器20对命令信息进行解析,以定位内存颗粒101所在的内存条10,对输入/输出数据及配置信息进行解析以定位内存颗粒101。
当内存条10上存在异常内存颗粒101时,内存控制器20至少可以通过解析命令信息,定位到异常内存颗粒101所在的内存条10;并根据输入/输出数据及配置信息中的原始卡信息,可以定位到异常内存颗粒101在内存条10上的具体位置,从而使得内存控制器20能够获取异常内存颗粒101的地址信息。
在其中一个实施例中,内存颗粒101的工作状态包括训练过程异常、发生第一类型错误及发生第二类型错误;同时,状态指示装置50包括指示灯,且该指示灯至少具有第一指示色、第二指示色及第三指示色。
在上述实施例提供的工作方法中,步骤S30具体可以包括如下步骤:
对内存颗粒101进行训练,判断内存颗粒101的训练过程是否正常,指示灯在内存颗粒101的训练过程异常时亮起第一指示色;
内存颗粒101进入运行程序,判断内存颗粒101的工作是否正常,若判断内存颗粒101工作异常,则判断内存颗粒101是否存在第一类型错误,指示灯在内存颗粒101发生第一类型错误时亮起第二指示色;若否,则判断内存颗粒101是否存在第二类型错误,指示灯在内存颗粒101发生第二类型错误亮起第三指示色。
上述实施例中提供的工作方法,当内存条10上存在异常内存颗粒101时,异常内存颗粒101对应的状态指示装置50亮起,这样不仅能够通过指示灯亮起或不亮,以及亮起指示色对内存颗粒101的工作状态更加直观地予以指示,还可以按照内存颗粒101出现的问题种类,亮起相应的指示色以进行分类指示,进一步地节约排除故障所需时间。同时,上述实施例中提供的工作方法,使得相关人员可以直观、迅速地确定出现问题的内存颗粒101所在位置及问题类型并开始下一步的分析,若后续需要更换新内存条10,能够直接根据内存颗粒101的问题类型,更换异常内存条10。
具体的,在其中一个实施例中,第一类型错误可以包括可纠正错误,第二类型错误可以包括不可纠正错误。
请结合图3参阅图4,对本发明其中一个实施例提供的工作方法具体步骤进行更详细的说明。
该实施例提供的工作方法,具体可以包括如下步骤:
对内存条10、解析装置及内存控制器20通电,内存条10与内存控制器20通过系统管理总线30进行通信。其中,内存控制器20可以通过系统管理总线30(或I3C串行总线)利用带外信号与每个内存条10实现通信连接,通信信息由内存条10上的解码芯片401解析,得到内存颗粒101的工作状态,并利用指示灯展示。
内存条10通电并完成初始化后,进入训练过程。判断内存颗粒101的训练过程是否正常,若是,则指示灯不点亮;若否,指示灯亮起第一指示色
训练过程完成后,内存颗粒101进入运行程序。判断内存颗粒101的工作是否正常,若是,则指示灯不点亮;若否,则判断内存颗粒101是否存在第一类型错误,对应的指示灯在内存颗粒101发生第一类型错误时亮起第二指示色;若否,则判断内存颗粒101是否存在第二类型错误,对应的指示灯在内存颗粒101发生第二类型错误亮起第三指示色。
具体的,当判断得到内存颗粒101的工作并非正常时,还可以包括如下步骤:
对命令信息进行解析,以定位到异常内存颗粒101所在的内存条10;解析输入/输出数据中哪一个或哪些数据出现错误,结合配置信息,以定位到异常内存颗粒101在内存条10上的具体位置,结合前述解析结果,获取异常内存颗粒101的地址信息。
请继续参阅图4,在其中一个实施例中,当指示灯亮起第一指示色之后,还可以包括将内存颗粒101所在的内存条10断电,重新插拔内存条10或更换内存条10,并为重新插拔后的内存条10或更换后的内存条10通电,使得更换后的内存条10与内存控制器20进行通信的步骤。
请继续参阅图4,在其中一个实施例中,指示灯亮起第二指示色之后,还可以包括将内存颗粒101所在的内存条10断电,更换内存条10,并为更换后的内存条10通电,使得更换后的内存条10与内存控制器20进行通信的步骤。
请继续参阅图4,在其中一个实施例中,当指示灯亮起第三指示色之后,还可以包括将内存颗粒101所在的内存条10断电,更换内存条10,并为更换后的内存条10通电,使得更换后的内存条10与内存控制器20进行通信的步骤。
应该理解的是,虽然图3及图4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图3及图4中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如前述任一实施例所述的工作方法的步骤。
上述实施例提供的计算机可读存储介质,能够实现如前述任一实施例所述的工作方法的步骤,因此前述任一实施例所述的工作方法所能实现的其他技术效果,该计算机可读存储介质也均能实现,此处不再详述。
基于同样的发明构思,本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器用于执行所述计算机程序时实现如前述任一实施例所述的工作方法的步骤。
上述实施例提供的计算机设备,也能够实现如前述任一实施例所述的工作方法的步骤,因此前述任一实施例所述的工作方法所能实现的其他技术效果,该计算机可读存储介质也均能实现,此处不再详述。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (15)

1.一种内存装置,其特征在于,包括:
内存条,所述内存条包括若干个内存颗粒;
内存控制器,用于获取各所述内存颗粒的地址信息;
系统管理总线,所述内存条通过所述系统管理总线与所述内存控制器进行通信;
解析装置,与所述内存条及所述内存控制器相连接,用于接收所述内存控制器获取的各所述内存颗粒的地址信息,获取所述内存条与内存控制器的通信信息,并对所述通信信息进行解析,以得到各所述内存颗粒的工作状态;
若干个状态指示装置,各所述状态指示装置均与所述解析装置相连接,且与所述内存颗粒对应设置;所述状态指示装置用于根据预设规则及所述地址信息,对所述内存颗粒的所述工作状态予以指示。
2.根据权利要求1所述的内存装置,其特征在于,所述内存颗粒的工作状态包括:训练过程异常、发生第一类型错误及发生第二类型错误中的至少一种。
3.根据权利要求2所述的内存装置,其特征在于,所述第一类型错误包括可纠正错误,所述第二类型错误包括不可纠正错误。
4.根据权利要求2所述的内存装置,其特征在于,所述解析装置包括解析芯片;所述状态指示装置包括指示灯,所述指示灯位于所述内存条上。
5.根据权利要求4所述的内存装置,其特征在于,所述内存颗粒的工作状态包括训练过程异常、发生第一类型错误及发生第二类型错误;
所述指示灯至少具有第一指示色、第二指示色及第三指示色,所述指示灯被配置为:
在所述内存颗粒的训练过程异常时亮起所述第一指示色,在所述内存颗粒发生第一类型错误时亮起所述第二指示色,在所述内存颗粒发生第二类型错误亮起所述第三指示色。
6.根据权利要求1所述的内存装置,其特征在于,所述通信信息包括带外信号;所述解析装置通过所述系统管理总线将所述带外信号与所述内存条通信连接。
7.根据权利要求1所述的内存装置,其特征在于,所述内存条包括双列直插式存储模块内存条,所述内存颗粒包括动态随机存取存储器颗粒。
8.一种如权利要求1至7中任一项所述的内存装置的工作方法,其特征在于,所述工作方法包括:
使用所述解析装置接收所述内存控制器获取的各所述内存颗粒的地址信息,获取所述内存条与所述内存控制器的通信信息,并对所述通信信息进行解析,以得到各所述内存颗粒的工作状态;
通过各所述状态指示装置,根据预设规则及所述地址信息对所述内存颗粒的所述工作状态予以指示。
9.根据权利要求8所述的工作方法,其特征在于,所述使用所述解析装置获取所述内存条与内存控制器的通信信息之前,还包括:
对所述内存条、所述解析装置及所述内存控制器通电,所述内存条与所述内存控制器通过系统管理总线进行通信。
10.根据所述权利要求8所述的工作方法,其特征在于,所述使用所述解析装置接收所述内存控制器获取的各所述内存颗粒的地址信息之前,还包括:
通过所述内存控制器对命令信息进行解析以定位所述内存颗粒所在的所述内存条,对输入/输出数据及配置信息进行解析以定位所述内存颗粒。
11.根据权利要求8所述的工作方法,其特征在于,所述内存颗粒的工作状态包括训练过程异常、发生第一类型错误及发生第二类型错误;
所述状态指示装置包括指示灯,所述指示灯至少具有第一指示色、第二指示色及第三指示色;
所述通过各所述状态指示装置,根据预设规则及所述地址信息对所述内存颗粒的所述工作状态予以指示,包括:
对所述内存颗粒进行训练,判断所述内存颗粒的训练过程是否正常,所述指示灯在所述内存颗粒的训练过程异常时亮起所述第一指示色;
所述内存颗粒进入运行程序,判断所述内存颗粒的工作是否正常,若判断所述内存颗粒工作异常,则判断所述内存颗粒是否存在第一类型错误,所述指示灯在所述内存颗粒发生第一类型错误时亮起所述第二指示色;若否,则判断所述内存颗粒是否存在第二类型错误,所述指示灯在所述内存颗粒发生第二类型错误亮起所述第三指示色。
12.根据权利要求11所述的工作方法,其特征在于,所述第一类型错误包括可纠正错误,所述第二类型错误包括不可纠正错误。
13.根据权利要求11所述的工作方法,其特征在于,所述指示灯亮起所述第一指示色之后,还包括:
将所述内存颗粒所在的所述内存条断电;
重新插拔所述内存条或更换所述内存条;
为重新插拔后的所述内存条或更换后的所述内存条通电,使得更换后的所述内存条与所述内存控制器进行通信;
所述指示灯亮起所述第二指示色之后,还包括:
将所述内存颗粒所在的所述内存条断电;
更换所述内存条;
为更换后的所述内存条通电,使得更换后的所述内存条与所述内存控制器进行通信;
所述指示灯亮起所述第三指示色之后,还包括:
将所述内存颗粒所在的所述内存条断电;
更换所述内存条;
为更换后的所述内存条通电,使得更换后的所述内存条与所述内存控制器进行通信。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求9至13中任一项所述的工作方法的步骤。
15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器用于执行所述计算机程序时实现如权利要求9至13中任一项所述的工作方法的步骤。
CN202210153582.1A 2022-02-18 2022-02-18 内存装置及其工作方法、计算机可读存储介质及设备 Pending CN116662042A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210153582.1A CN116662042A (zh) 2022-02-18 2022-02-18 内存装置及其工作方法、计算机可读存储介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210153582.1A CN116662042A (zh) 2022-02-18 2022-02-18 内存装置及其工作方法、计算机可读存储介质及设备

Publications (1)

Publication Number Publication Date
CN116662042A true CN116662042A (zh) 2023-08-29

Family

ID=87722933

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210153582.1A Pending CN116662042A (zh) 2022-02-18 2022-02-18 内存装置及其工作方法、计算机可读存储介质及设备

Country Status (1)

Country Link
CN (1) CN116662042A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117421257A (zh) * 2023-10-24 2024-01-19 上海合芯数字科技有限公司 一种内存条的初始化方法、装置、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117421257A (zh) * 2023-10-24 2024-01-19 上海合芯数字科技有限公司 一种内存条的初始化方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US7356431B2 (en) Method for testing an input/output functional board
US7177211B2 (en) Memory channel test fixture and method
CN106055438B (zh) 一种快速定位主板上内存条异常的方法及系统
CN112331253B (zh) 一种芯片的测试方法、终端和存储介质
CN107832199A (zh) 基于cpld的硬盘监控系统
US10198385B2 (en) System and method for detecting types of storage drives connected to backplane controller or enclosure management controller
US20090217111A1 (en) Evaluation method and evaluation system for semiconductor storage device
US7487413B2 (en) Memory module testing apparatus and method of testing memory modules
CN111722990A (zh) 一种主背板间的线缆连接校验方法和装置
US8738819B2 (en) Memory-module extender card for visually decoding addresses from diagnostic programs and ignoring operating system accesses
US6751740B1 (en) Method and system for using a combined power detect and presence detect signal to determine if a memory module is connected and receiving power
CN111142630A (zh) 一种处理器板卡
CN110955387A (zh) 自适应识别闪存类型方法及计算机可读取存储介质及装置
CN116662042A (zh) 内存装置及其工作方法、计算机可读存储介质及设备
CN101354673B (zh) 内存之spd芯片错误信息仿真装置
CN109117299B (zh) 服务器的侦错装置及其侦错方法
CN110825547B (zh) 一种基于smbus的pcie卡异常恢复装置及方法
CN210721440U (zh) 一种pcie卡异常恢复装置及pcie卡、pcie扩展系统
US20030051193A1 (en) Computer system with improved error detection
US11068369B2 (en) Computer device and testing method for basic input/output system
CN116662043A (zh) 内存装置及其工作方法、计算机可读存储介质及设备
CN111176942A (zh) 一种故障加速卡快速定位装置及故障加速卡快速定位方法
US20240070007A1 (en) Memory with fail indicators, including memory with led fail indicators, and associated systems, devices, and methods
CN112416723A (zh) 基于cpu故障检测的结果类型编号显示方法及板卡
CN112968979B (zh) 一种多从机系统中有效预防从机地址异常的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination