CN101174230B - 一种多核处理器活性检测方法及系统 - Google Patents
一种多核处理器活性检测方法及系统 Download PDFInfo
- Publication number
- CN101174230B CN101174230B CN2007101810203A CN200710181020A CN101174230B CN 101174230 B CN101174230 B CN 101174230B CN 2007101810203 A CN2007101810203 A CN 2007101810203A CN 200710181020 A CN200710181020 A CN 200710181020A CN 101174230 B CN101174230 B CN 101174230B
- Authority
- CN
- China
- Prior art keywords
- nuclear
- active
- data surface
- task
- active detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
Abstract
本发明旨在提供一种多核处理器的活性检测方法,所述多核处理器包括控制面核和数据面核,该方法包括:控制面核运行时创建活性检测任务,所述活性检测任务构造活性检测报文,数据面核运行时创建活性检测代理任务,所述活性检测代理任务构造活性检测应答报文;所述活性检测任务定时向各个数据面核上活性检测代理任务发送活性检测报文,活性检测代理任务收到活性检测报文后向活性检测任务回复活性检测应答报文;若所述控制面核活性检测任务没有收到数据面核回复的活性检测应答报文,则认为数据面核异常,通过设置相应的硬件寄存器复位该异常的数据面核。本发明还提供了一种多核处理器的活性检测系统,包括活性检测任务和活性检测代理任务。
Description
技术领域
本发明涉及处理器领域,更具体的说,涉及是一种多核处理器应用在通信领域时核的活性检测方法。
背景技术
随着信息时代的到来和各种新技术、新业务不断涌现,用户对于移动通信以及数据通信的带宽需求都越来越高,为了满足单个用户高带宽的需求,运行商要求移动通信设备和数据通信设备具有大容量、高接入和高处理性能。为了达到大容量,高接入和高处理性能的需求,目前移动通信设备和数据通信设备中开始大量使用高处理能力的多核处理器。
多核处理器是在一片芯片上集中多个核的处理器,每个核相当于一个CPU。在移动通信设备和数据通信设备中,多核处理器常见应用模式是一部分核作为控制面和管理面,这部分核上面运行商用操作系统。剩余的核作为数据面处理进行包处理,为了提高包处理性能,作为数据面的核通常不运行商用操作系统并且多采用并行处理方式。
运行商用操作系统的控制面核在运行过程中如果出现异常,则操作系统崩溃并抛出异常,从而使用多核处理器的设备不能正常工作,但是如果部分数据面核出现异常,则只影响一部分包处理并且可以通过单独复位出现异常的核使其重新正常工作。由于数据面核不运行操作系统,数据面核出现异常也不容易发现,因此需要寻找一种方法能够自动检测多核处理器中某个核是否正常工作。
发明内容
本发明解决的技术问题是,提供一种多核处理器应用在通信领域时自动检测其数据面核是否正常工作的方法,以解决多核处理器中数据面核异常时不能及时发现而影响部分包处理的问题。
鉴于上述问题,本发明所述的一种多核处理器的活性检测方法包括以下步骤:
A控制面核运行时创建活性检测任务,活性检测任务构造活性检测报文,数据面核运行时创建活性检测代理任务,活性检测代理任务构造活性检测应答报文;
B活性检测任务定时向各个数据面核上活性检测代理任务发送活性检测报文,活性检测代理任务收到活性检测报文后向活性检测任务回复活性检测应答报文;
C若控制面核活性检测任务没有收到数据面核回复的活性检测应答报文,则认为数据面核异常,通过设置相应的硬件寄存器复位该异常的数据面核。
上述的方法,其中,对于活性检测应答报文,控制面核上活性检测任务能够识别,且包含能够识别数据面核的标识;对于活性检测报文,数据面核活性检测代理任务能够识别。
上述的方法,其中,在活性检测任务向各个数据面核上活性检测代理任务发送活性检测报文,活性检测任务针对所述各个数据面核设置活性检测应答报文的等待定时器;若活性检测任务在等待定时器设定的时间内收到活性检测应答报文,则认为数据面核正常;若没有收到活性检测应答报文,则认为数据面核异常;活性检测任务为各数据面核分别设置活性检测报文等待次数计数器,若活性检测任务在等待定时器设定的时间内未收到活性检测应答报文,则等待次数计数器加1,当等待次数计数器超过设定的数值时,则认为数据面核异常。若活性检测任务认为数据面核异常,则等待次数计数器清零,设置该数据面核对应的复位寄存器。
上述的方法,其中,活性检测代理任务构造活性检测应答报文时,在报文中预留固定字节用于附加数据面核标识,数据面核标识为核ID;活性检测代理任务判断是否收到所述活性检测报文,若收到,数据面核读取自身的核ID,并将读取的核ID附加到活性检测应答报文预留的固定字节中。
本发明还提供了一种多核处理器的活性检测系统,包括控制面核和数据面核;
所述控制面核,用于创建活性检测任务,所述活性检测任务构造活性检测报文,定时向各数据面核活性检测代理任务发送活性检测报文,若活性检测任务没有收到数据面核回复的活性检测应答报文,则认为数据面核异常,通过设置相应的硬件寄存器复位该异常的数据面核;
所述数据面核,用于创建活性检测代理任务,所述活性检测代理任务构造活性检测应答报文,且当收到活性检测报文后向活性检测任务回复活性检测应答报文。
本发明利用控制面核和数据面核之间发送活性检测报文来检测数据面核是否工作正常,由于活性检测报文是定时发送的,因此数量不多、不影响控制面核和数据面核处理性能。但是采用该方法可以自动检测出数据面出现异常并可以自动复位出现异常的数据面核而使其重新工作。因此采用本发明的多核处理器的产品在发生非致命性异常时可以自动复位而继续使用,这样可以大大缩短设备宕机恢复时间,减少对用户的影响和用户的投诉,提高用户对产品的满意度。由于能自动检测出数据面核异常并自动复位,因此可以省去人工监控而大大节省设备的维护费用,具有很好的经济性。
附图说明
图1是本发明提供的一种多核处理器的活性检测系统图;
图2是本发明提供的一种多核处理器的活性检测方法图;
图3是本发明中活性检测代理任务处理流程图;
图4是本发明中活性检测任务处理流程图。
具体实施方式
下面结合附图对本发明的具体实施方式进行进一步说明。
图1是本发明提供的一种多核处理器的活性检测系统图,系统包括:
活性检测任务,用于构造活性检测报文,定时向各数据面核活性检测代理任务发送活性检测报文,若活性检测任务没有收到数据面核回复的活性检测应答报文,则认为数据面核异常,通过设置相应的硬件寄存器复位该异常的数据面核;
活性检测代理任务,用于构造活性检测应答报文,且当收到活性检测报文后向活性检测任务回复活性检测应答报文。
图2是本发明提供的一种多核处理器的活性检测方法图,该方法包括:
201、控制面核运行完整商用操作系统,控制面核运行时在操作系统上创建活性检测任务。
202、活性检测任务工作后先在数据区中构造数据面核上活性检测代理任务可以识别的活性检测报文。
203、各数据面核运行时创建活性检测代理任务,由于活性检测代理任务比较简单,也可以和数据面核上包处理任务是同一个任务。
204、活性检测代理任务工作后在数据区中构造控制面核活性检测任务可以识别的活性检测应答报文,要求应答报文中包含数据面核ID。
205、单板上电后控制面核上活性检测任务向各数据面核发送活性检测报文,并针对个数据面核分别设置等待定时器。
206、各数据面核上活性检测代理任务收到活性检测报文后回复活性检测应答报文。
207、如果活性检测任务在定时时间内收到活性检测应答报文,则认为数据面核工作正常,否则连续几次(可以定为3次)在定时时间内没有收到活性检测应答报文,则认为数据面核异常。
208、设置出现异常的数据面核硬件寄存器,复位出现异常的数据面核。
上述具体实施方式中,数据面核上活性检测代理任务的具体处理流程如图32所示:
步骤301,活性检测代理任务运行后在数据区中构造活性检测应答报文,报文中某一个位置要留出固定字节用于附加数据面核ID;
步骤302,活性检测代理判断是否收到控制面核上活性检测任务发来的活性检测报文,如果没有收到,继续检测,否则转步骤203;
步骤303,数据面核收到活性检测报文后读取自己的核ID,将自己的核ID附加在活性检测报文中预留的位置;
步骤304,活性检测代理任务将附加了核ID的活性检测应答报文发给控制面核上的活性检测任务。
上述具体实施方式中,控制面核上活性检测任务的具体处理流程如图4所示:
步骤401,活性检测任务运行后在数据区中构造活性检测报文;
步骤402,构造完活性检测报文后活性检测任务等待各数据面核上电;
步骤403,判断数据面核是否上电成功,如果有数据面核没有上电成功,则转步骤402继续等待,否则转步骤404;
步骤404,活性检测任务为各数据面核分别设置活性检测报文发送定时器,并针对各核初始化等待次数计数器,有多少数据面核就有多少发送定时器和等待次数计数器;
步骤405,判断是否有发送定时器超时,如果没有定时器超时,则继续等待,否则转步骤406;
步骤406,发送定时器超时后向相应的数据面核发送活性检测报文,并为相应数据面核设置等待活性检测应答报文的定时器;
步骤407,判断是否有等待定时器超时,如果没有则继续等待,否则转步骤408;
步骤408,如果某数据面核对应的等待定时器超时,则判断是否收到该数据面核回复的活性检测应答报文,如果收到应答报文,则转到步骤406,否则转到步骤409;
步骤409,对等待次数计数器进行加1操作,然后转步骤410;
步骤410,判断等待次数计数器是否大于某个规定数值(比如3次),如果不大于规定数值,则转步骤412,否则转步骤411;
步骤411,清除等待次数计数器,设置该数据面核对应的复位寄存器,转到步骤406对复位后的数据面核继续进行活性检测;
步骤412,重新设置该数据面核对应的等待定时器,转步骤407,等待下次定时器超时。
上述步骤408中活性检测任务区分中活性检测应答报文的方法是通过判断活性检测报文中附加的数据面核号来完成的。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种多核处理器的活性检测方法,所述多核处理器包括控制面核和数据面核,其特征在于,所述方法包括:
A控制面核运行时创建活性检测任务,所述活性检测任务构造活性检测报文,数据面核运行时创建活性检测代理任务,所述活性检测代理任务构造活性检测应答报文;
B所述活性检测任务定时向各个数据面核上活性检测代理任务发送活性检测报文,活性检测代理任务收到活性检测报文后向活性检测任务回复活性检测应答报文;
C若所述控制面核活性检测任务没有收到数据面核回复的活性检测应答报文,则认为数据面核异常,通过设置相应的硬件寄存器复位该异常的数据面核。
2.根据权利要求1所述的方法,其特征在于,对于活性检测应答报文,控制面核上活性检测任务能够识别,且包含能够识别数据面核的标识。
3.根据权利要求1所述的方法,其特征在于,对于活性检测报文,数据面核活性检测代理任务能够识别。
4.根据权利要求1所述的方法,其特征在于,在所述活性检测任务向各个数据面核上活性检测代理任务发送活性检测报文,所述活性检测任务针对所述各个数据面核设置活性检测应答报文的等待定时器。
5.根据权利要求4所述的方法,其特征在于,若所述活性检测任务在所述等待定时器设定的时间内收到活性检测应答报文,则认为数据面核正常;若没有收到活性检测应答报文,则认为数据面核异常。
6.根据权利要求5所述的方法,其特征在于,所述活性检测任务为各数据面核分别设置活性检测报文等待次数计数器,若所述活性检测任务在所述等待定时器设定的时间内未收到活性检测应答报文,则等待次数计数器加1,当等待次数计数器超过设定的数值时,则认为数据面核异常。
7.根据权利要求6所述的方法,其特征在于,若所述活性检测任务认为数据面核异常,则所述等待次数计数器清零,设置该数据面核对应的复位寄存器。
8.根据权利要求2所述的方法,其特征在于,所述活性检测代理任务构造活性检测应答报文时,在所述报文中预留固定字节用于附加数据面核标识,数据面核标识为核ID。
9.根据权利要求8所述的方法,其特征在于,所述活性检测代理任务判断是否收到所述活性检测报文,若收到,数据面核读取自身的核ID,并将所述读取的核ID附加到所述活性检测应答报文预留的固定字节中。
10.一种多核处理器的活性检测系统,其特征在于,包括控制面核和数据面核;
所述控制面核,用于创建活性检测任务,所述活性检测任务构造活性检测报文,定时向各数据面核活性检测代理任务发送活性检测报文,若活性检测任务没有收到数据面核回复的活性检测应答报文,则认为数据面核异常,通过设置相应的硬件寄存器复位该异常的数据面核;
所述数据面核,用于创建活性检测代理任务,所述活性检测代理任务构造活性检测应答报文,且当收到活性检测报文后向活性检测任务回复活性检测应答报文。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007101810203A CN101174230B (zh) | 2007-09-26 | 2007-09-26 | 一种多核处理器活性检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007101810203A CN101174230B (zh) | 2007-09-26 | 2007-09-26 | 一种多核处理器活性检测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101174230A CN101174230A (zh) | 2008-05-07 |
CN101174230B true CN101174230B (zh) | 2010-06-02 |
Family
ID=39422753
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007101810203A Expired - Fee Related CN101174230B (zh) | 2007-09-26 | 2007-09-26 | 一种多核处理器活性检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101174230B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102750192B (zh) * | 2012-06-06 | 2016-04-20 | 杭州华三通信技术有限公司 | 一种数据平面异常检测的方法和装置 |
CN107133130B (zh) * | 2017-05-19 | 2021-01-01 | 杭州新中大科技股份有限公司 | 计算机运行监测方法和装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1945543A (zh) * | 2006-11-13 | 2007-04-11 | 杭州华为三康技术有限公司 | 多核处理器的业务流处理方法及多核处理器 |
-
2007
- 2007-09-26 CN CN2007101810203A patent/CN101174230B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1945543A (zh) * | 2006-11-13 | 2007-04-11 | 杭州华为三康技术有限公司 | 多核处理器的业务流处理方法及多核处理器 |
Also Published As
Publication number | Publication date |
---|---|
CN101174230A (zh) | 2008-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101800675B (zh) | 故障监控方法、监控设备及通信系统 | |
CN100471128C (zh) | 一种实现设备状态轮询的方法及装置 | |
CN101976217A (zh) | 网络处理器异常检测方法及系统 | |
CN100370756C (zh) | 系统的复位处理方法及装置 | |
CN102075380A (zh) | 一种服务器状态检测方法及装置 | |
CN106411655B (zh) | 基于串行通讯设备状态诊断的通讯处理方法 | |
CN102158364A (zh) | 一种基于时间片调度的设备轮询方法和装置 | |
CN101964724B (zh) | 通信单板的节能方法和一种通信单板 | |
CN109525434B (zh) | 一种基于机载设备板卡的冗余备份方法 | |
CN106549967A (zh) | 一种基于事件驱动机制的iec104规约解析系统及方法 | |
CN101174230B (zh) | 一种多核处理器活性检测方法及系统 | |
CN106155826A (zh) | 用于在总线结构中检测及处理错误的方法和系统 | |
CN101500249B (zh) | 一种单板状态检测的实现方法 | |
CN102810072B (zh) | 计算机系统及其重新启动方法 | |
CN101165630A (zh) | 一种组合式复位系统处理方法及装置 | |
CN102023887B (zh) | 一种计算机系统的电源管理方法及计算机系统 | |
CN105224426A (zh) | 物理主机故障检测方法、装置及虚机管理方法、系统 | |
CN101764698B (zh) | 电力设备自动回复的方法 | |
CN101511098A (zh) | 一种分布式网元任务管理系统及方法 | |
CN104038387B (zh) | 框式交换机业务板上线检测方法 | |
CN112148535B (zh) | 一种机架式设备双监控系统 | |
CN202153352U (zh) | 防止计算机控制系统失效的看门狗装置 | |
CN115495309A (zh) | 共用存储服务器的数据库服务器io处理方法及装置 | |
CN102075011B (zh) | 具有自恢复功能的电力集中器 | |
CN102238022A (zh) | 一种网络管理系统及数据采集方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20100602 Termination date: 20160926 |
|
CF01 | Termination of patent right due to non-payment of annual fee |