JP4653838B2 - 演算処理装置、演算処理装置の制御方法及び制御プログラム - Google Patents
演算処理装置、演算処理装置の制御方法及び制御プログラム Download PDFInfo
- Publication number
- JP4653838B2 JP4653838B2 JP2008502593A JP2008502593A JP4653838B2 JP 4653838 B2 JP4653838 B2 JP 4653838B2 JP 2008502593 A JP2008502593 A JP 2008502593A JP 2008502593 A JP2008502593 A JP 2008502593A JP 4653838 B2 JP4653838 B2 JP 4653838B2
- Authority
- JP
- Japan
- Prior art keywords
- instruction
- processing unit
- arithmetic processing
- unit
- failure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 44
- 230000007850 degeneration Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 238000011946 reduction process Methods 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 230000009849 deactivation Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0793—Remedial or corrective actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0721—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
- G06F11/0724—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU] in a multiprocessor or a multi-core unit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/0802—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
- G06F12/0804—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches with main memory updating
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Hardware Redundancy (AREA)
Description
本実施形態では、演算処理装置としての1つのプロセサが複数の命令処理部としてのコア部を有し、1コアあたり複数スレッドを同時に実行可能で、コアにライトバック方式のキャシュを装備し、コア内の命令実行部としてのストランド部で共有する構成した例を示している。なお、図1では、プロセサ1を一つだけ示したが、本実施形態のシステムは、該プロセサ1を複数備えている。
ンタといったレジスタ等である。
Claims (17)
- 命令を実行する演算処理装置において、
命令を実行する複数の命令実行部と前記複数の命令実行部が共有する命令実行共有部とを含む命令処理部を複数有するとともに、前記複数の命令処理部が共有する命令処理共有部とを、ハードウェア資源として有する演算処理装置に対して、前記命令処理共有部の故障または前記演算処理装置に含まれる全ての命令処理部の故障を示す通知を受けた場合には前記演算処理装置の全範囲を、前記演算処理装置の一部の命令処理部に含まれる命令実行共有部の故障または一部の命令処理部に含まれる全ての命令実行部の故障を示す通知を受けた場合には前記演算処理装置内の一部の命令処理部を、前記命令処理部内の一部の命令実行部の故障を示す通知を受けた場合には前記命令処理部内の一部の命令実行部を、前記故障によって使用できないハードウェア資源の範囲として判定する故障範囲判定手段と、
前記判定の結果に基づいて故障範囲のハードウェア資源の使用の停止を指示する停止指示手段と、
前記停止指示手段から前記使用の停止の指示を受けた前記故障範囲のハードウェア資源に対して、前記演算処理装置の次回の立ち上げ時に、クロックの供給を停止するクロック供給停止手段と、
を備えたことを特徴とする演算処理装置。 - 前記演算処理装置において、
前記故障範囲で示されたハードウェア資源の使用を停止させる際、故障範囲外の命令処理手順に影響を与えないように所定の処理を行ったのちに、前記ハードウェア資源を停止させる手段を備えた
ことを特徴とする請求項1記載の演算処理装置。 - 前記演算処理装置において、
前記故障範囲にライトバック方式のキャッシュメモリを含む場合、前記所定の処理として前記キャッシュメモリの内容を故障範囲外のキャッシュメモリに書き出す処理を行う
ことを特徴とする請求項2記載の演算処理装置。 - 前記演算処理装置はさらに、
使用停止状態であるハードウェア資源を示す停止情報を保持する停止情報保持手段を備え、
前記停止指示手段が、前記停止情報保持手段に保持された停止情報と新たに受信した故障範囲とから新たに使用するハードウェア資源を決定することを特徴とする請求項1から3の何れか1項に記載の演算処理装置。 - 前記演算処理装置において、
前記ハードウェア資源としての命令実行部を前記ハードウェア資源としての命令処理部が複数有し、前記命令処理部の一部の命令実行部が使用停止状態であり、前記故障範囲判定手段が前記命令処理部に含まれる前記使用停止状態の命令実行部以外の全ての命令実行部を新たに故障範囲と判定した場合、前記停止指示手段が、前記現在の停止情報と新たな故障範囲とに基づき、前記命令処理部を停止させる
ことを特徴とする請求項4記載の演算処理装置。 - 前記演算処理装置は、外部制御装置に接続され、
前記故障範囲判定手段が、前記外部制御装置に故障範囲を報告し、
前記停止指示手段が、前記外部制御装置から故障範囲を受信する
ことを特徴とする請求項1から5の何れか1項に記載の演算処理装置。 - 前記演算処理装置において、
前記停止指示手段が、前記演算処理装置の起動処理時に前記外部制御装置から故障範囲を受信し、前記故障範囲のハードウェア資源の使用を停止させる
ことを特徴とする請求項6記載の演算処理装置。 - 前記演算処理装置において、
前記ハードウェア資源がキャッシュメモリであり、故障によりキャッシュメモリの内容の整合性がとれない場合、前記故障範囲判定手段が、前記演算処理装置の全範囲を故障範囲と判定し、停止指示手段が全てのハードウェア資源を停止させる
ことを特徴とする請求項1から7の何れか1項に記載の演算処理装置。 - 前記演算処理装置の制御方法において、
命令を実行する複数の命令実行部と前記複数の命令実行部が共有する命令実行共有部とを含む命令処理部を複数有するとともに、前記複数の命令処理部が共有する命令処理共有部とを、ハードウェア資源として有する演算処理装置に対して、前記命令処理共有部の故障または前記演算処理装置に含まれる全ての命令処理部の故障を示す通知を受けた場合には前記演算処理装置の全範囲を、前記演算処理装置の一部の命令処理部に含まれる命令実行共有部の故障または一部の命令処理部に含まれる全ての命令実行部の故障を示す通知を受けた場合には前記演算処理装置内の一部の命令処理部を、前記命令処理部内の一部の命令実行部の故障を示す通知を受けた場合には前記命令処理部内の一部の命令実行部を、前記演算処理装置が有する故障範囲判定部が、前記故障によって使用できないハードウェア資源の範囲として判定するステップと、
前記演算処理装置が有する停止指示部が、前記判定の結果に基づいて故障範囲のハードウェア資源の使用停止を指示するステップと、
前記演算処理装置が有するクロック供給停止部が、前記停止指示ステップにより前記使用の停止の指示を受けた前記故障範囲のハードウェア資源に対して、前記演算処理装置の次回の立ち上げ時に、クロックの供給を停止するステップと、
を有することを特徴とする演算処理装置の制御方法。 - 前記演算処理装置の制御方法において、
前記故障範囲で示されたハードウェア資源の使用を停止させる際、故障範囲外の命令処理手順に影響を与えないように所定の処理を行ったのちに、前記ハードウェア資源を停止させる
ことを特徴とする請求項9記載の演算処理装置の制御方法。 - 前記演算処理装置の制御方法において、
前記故障範囲にライトバック方式のキャッシュメモリを含む場合、前記所定の処理として前記キャッシュメモリの内容を故障範囲外のキャッシュメモリに書き出す処理を行う
ことを特徴とする請求項10に記載の演算処理装置の制御方法。 - 前記演算処理装置の制御方法において、
前記演算処理装置はさらに、
使用停止状態であるハードウェア資源を示す停止情報を保持する停止情報保持部を備え、
前記停止指示部が、前記停止情報保持部に保持された停止情報と新たに受信した故障範囲とから新たに使用停止にするハードウェア資源を決定する
ことを特徴とする請求項9から11の何れか1項に記載の演算処理装置の制御方法。 - 前記演算処理装置の制御方法において、
前記ハードウェア資源としての命令実行部を前記ハードウェア資源としての命令処理部が複数有し、前記命令処理部の一部の命令実行部が使用停止状態であり、前記故障範囲判定部が前記命令処理部に含まれる前記使用停止状態の命令実行部以外の全ての命令実行部を新たに故障範囲と判定した場合、前記停止指示部が、前記現在の停止情報と新たな故障範囲とに基づき、前記命令処理部を停止させる
ことを特徴とする請求項12記載の演算処理装置の制御方法。 - 前記演算処理装置の制御方法において、
前記演算処理装置は、外部制御装置に接続され、前記故障範囲判定部が、前記外部制御装置に故障範囲を報告し、
前記停止指示部が、前記ハードウェア資源の使用を停止する際、前記外部制御装置から故障範囲を受信する
ことを特徴とする請求項9から13の何れか1項に記載の演算処理装置の制御方法。 - 前記演算処理装置の制御方法において、
前記停止指示部が、前記演算処理装置の起動処理時に前記外部制御装置から故障範囲を受信し、前記故障範囲のハードウェア資源の使用を停止させる
ことを特徴とする請求項14記載の演算処理装置の制御方法。 - 前記演算処理装置の制御方法において、
前記ハードウェア資源がキャッシュメモリであり、故障によりキャッシュメモリの内容の整合性がとれない場合、前記故障範囲判定部が、前記演算処理装置の全範囲を故障範囲と判定し、停止指示部が全てのハードウェア資源を停止させる
ことを特徴とする請求項9から15の何れか1項に記載の演算処理装置の制御方法。 - 命令を実行する演算処理装置の制御プログラムにおいて、
命令を実行する複数の命令実行部と前記複数の命令実行部が共有する命令実行共有部とを含む命令処理部を複数有するとともに、前記複数の命令処理部が共有する命令処理共有部とを、ハードウェア資源として有する演算処理装置に対して、前記命令処理共有部の故障または前記演算処理装置に含まれる全ての命令処理部の故障を示す通知を受けた場合には前記演算処理装置の全範囲を、前記演算処理装置の一部の命令処理部に含まれる命令実行共有部の故障または一部の命令処理部に含まれる全ての命令実行部の故障を示す通知を受けた場合には前記演算処理装置内の一部の命令処理部を、前記命令処理部内の一部の命令実行部の故障を示す通知を受けた場合には前記命令処理部内の一部の命令実行部を、前記故障によって使用できないハードウェア資源の範囲として判定するステップと、
前記判定の結果に基づいて故障範囲のハードウェア資源の使用停止を指示するステップと、
前記停止指示ステップにより前記使用の停止の指示を受けた前記故障範囲のハードウェア資源に対して、前記演算処理装置の次回の立ち上げ時に、クロックの供給を停止するステップと、
を前記演算処理装置に実行させることを特徴とする演算処理装置の制御プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2006/303771 WO2007099606A1 (ja) | 2006-02-28 | 2006-02-28 | プロセサ制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2007099606A1 JPWO2007099606A1 (ja) | 2009-07-16 |
JP4653838B2 true JP4653838B2 (ja) | 2011-03-16 |
Family
ID=38458730
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008502593A Expired - Fee Related JP4653838B2 (ja) | 2006-02-28 | 2006-02-28 | 演算処理装置、演算処理装置の制御方法及び制御プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8060778B2 (ja) |
JP (1) | JP4653838B2 (ja) |
WO (1) | WO2007099606A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5126393B2 (ja) | 2011-06-29 | 2013-01-23 | 日本精工株式会社 | 車載電子制御装置 |
JP6074955B2 (ja) | 2012-08-31 | 2017-02-08 | 富士通株式会社 | 情報処理装置および制御方法 |
US9043654B2 (en) * | 2012-12-07 | 2015-05-26 | International Business Machines Corporation | Avoiding processing flaws in a computer processor triggered by a predetermined sequence of hardware events |
US9304848B2 (en) * | 2013-01-15 | 2016-04-05 | International Business Machines Corporation | Dynamic accessing of execution elements through modification of issue rules |
WO2015072004A1 (ja) * | 2013-11-15 | 2015-05-21 | 株式会社日立製作所 | 計算機、計算機制御方法、および計算機制御プログラム |
JP2020181569A (ja) * | 2019-04-23 | 2020-11-05 | 株式会社デンソー | 電子制御装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01295338A (ja) * | 1987-12-25 | 1989-11-29 | Fujitsu Ltd | 二重化システムの切離し表示フラグオン切換え制御方式 |
JPH0719211B2 (ja) * | 1988-10-08 | 1995-03-06 | 日本電気株式会社 | クロック制御方式 |
JPH10105527A (ja) * | 1996-10-02 | 1998-04-24 | Mitsubishi Electric Corp | マルチプロセッサ計算機及びマルチプロセッサ計算機における障害復旧方法 |
JP2000322397A (ja) * | 1999-05-14 | 2000-11-24 | Nec Software Kobe Ltd | 情報処理装置 |
JP2001175489A (ja) * | 1999-12-15 | 2001-06-29 | Fujitsu Ltd | 異常検出時の動作モードを決定する装置および方法 |
JP2002229811A (ja) * | 2001-02-05 | 2002-08-16 | Nec Eng Ltd | 論理分割システムの制御方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4453215A (en) * | 1981-10-01 | 1984-06-05 | Stratus Computer, Inc. | Central processing apparatus for fault-tolerant computing |
US5157667A (en) * | 1990-04-30 | 1992-10-20 | International Business Machines Corporation | Methods and apparatus for performing fault isolation and failure analysis in link-connected systems |
JPH0719211A (ja) | 1993-06-29 | 1995-01-20 | Azuma Kogyo Kk | パイプ用連結装置 |
US6574752B1 (en) * | 1999-07-15 | 2003-06-03 | International Business Machines Corporation | Method and system for error isolation during PCI bus configuration cycles |
US20020184576A1 (en) * | 2001-03-29 | 2002-12-05 | International Business Machines Corporation | Method and apparatus for isolating failing hardware in a PCI recoverable error |
US6868479B1 (en) * | 2002-03-28 | 2005-03-15 | Emc Corporation | Data storage system having redundant service processors |
US7080288B2 (en) * | 2003-04-28 | 2006-07-18 | International Business Machines Corporation | Method and apparatus for interface failure survivability using error correction |
-
2006
- 2006-02-28 WO PCT/JP2006/303771 patent/WO2007099606A1/ja active Application Filing
- 2006-02-28 JP JP2008502593A patent/JP4653838B2/ja not_active Expired - Fee Related
-
2008
- 2008-08-27 US US12/198,927 patent/US8060778B2/en not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01295338A (ja) * | 1987-12-25 | 1989-11-29 | Fujitsu Ltd | 二重化システムの切離し表示フラグオン切換え制御方式 |
JPH0719211B2 (ja) * | 1988-10-08 | 1995-03-06 | 日本電気株式会社 | クロック制御方式 |
JPH10105527A (ja) * | 1996-10-02 | 1998-04-24 | Mitsubishi Electric Corp | マルチプロセッサ計算機及びマルチプロセッサ計算機における障害復旧方法 |
JP2000322397A (ja) * | 1999-05-14 | 2000-11-24 | Nec Software Kobe Ltd | 情報処理装置 |
JP2001175489A (ja) * | 1999-12-15 | 2001-06-29 | Fujitsu Ltd | 異常検出時の動作モードを決定する装置および方法 |
JP2002229811A (ja) * | 2001-02-05 | 2002-08-16 | Nec Eng Ltd | 論理分割システムの制御方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2007099606A1 (ja) | 2007-09-07 |
JPWO2007099606A1 (ja) | 2009-07-16 |
US20090049336A1 (en) | 2009-02-19 |
US8060778B2 (en) | 2011-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9335998B2 (en) | Multi-core processor system, monitoring control method, and computer product | |
US7251746B2 (en) | Autonomous fail-over to hot-spare processor using SMI | |
JP5413515B2 (ja) | 仮想計算機のデータ複製方法、情報処理装置及びプログラム | |
US7007192B2 (en) | Information processing system, and method and program for controlling the same | |
JP4653838B2 (ja) | 演算処理装置、演算処理装置の制御方法及び制御プログラム | |
WO2009157178A1 (ja) | 仮想計算機制御装置、仮想計算機制御プログラム及び仮想計算機制御回路 | |
US8713262B2 (en) | Managing a spinlock indicative of exclusive access to a system resource | |
CN107451019B (zh) | 处理器核心中的自测试 | |
WO2018095107A1 (zh) | 一种bios程序的异常处理方法及装置 | |
US9372702B2 (en) | Non-disruptive code update of a single processor in a multi-processor computing system | |
US20150006978A1 (en) | Processor system | |
US10379931B2 (en) | Computer system | |
US20120226849A1 (en) | Virtual computer system, area management method, and program | |
JPS62221732A (ja) | 情報処理装置 | |
JP5508354B2 (ja) | モジュール、周波数制御方法、及び周波数制御プログラム | |
CN115576734B (zh) | 一种多核异构日志存储方法和系统 | |
JP2004302731A (ja) | 情報処理装置および障害診断方法 | |
US20180089012A1 (en) | Information processing apparatus for analyzing hardware failure | |
JP2009157808A (ja) | データ処理装置及びデータ処理装置におけるバスアクセス制御方法 | |
CN107003898B (zh) | 包括至少一个具有线程模式和事务模式的资源的设备及方法 | |
US10540222B2 (en) | Data access device and access error notification method | |
JP2021043725A (ja) | 計算システム、計算方法及びプログラム | |
JP2000347758A (ja) | 情報処理装置 | |
JP2022107229A (ja) | 情報処理装置、制御方法及び制御プログラム | |
TWI244031B (en) | Booting switch method for computer system having multiple processors |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080924 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091006 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091207 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100518 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100716 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100817 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101012 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101207 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101217 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4653838 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131224 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |