JP2020198044A - 並列処理装置 - Google Patents

並列処理装置 Download PDF

Info

Publication number
JP2020198044A
JP2020198044A JP2019105442A JP2019105442A JP2020198044A JP 2020198044 A JP2020198044 A JP 2020198044A JP 2019105442 A JP2019105442 A JP 2019105442A JP 2019105442 A JP2019105442 A JP 2019105442A JP 2020198044 A JP2020198044 A JP 2020198044A
Authority
JP
Japan
Prior art keywords
data
interrupt
command
transmission
reception
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019105442A
Other languages
English (en)
Inventor
広大 太田
Kodai Ohta
広大 太田
功克 松浦
Isakatsu Matsuura
功克 松浦
和 松森
Kazu Matsumori
和 松森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2019105442A priority Critical patent/JP2020198044A/ja
Priority to EP20175005.6A priority patent/EP3748496A1/en
Priority to US16/879,818 priority patent/US11074102B2/en
Priority to CN202010483979.8A priority patent/CN112052108A/zh
Publication of JP2020198044A publication Critical patent/JP2020198044A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4812Task transfer initiation or dispatching by interrupt, e.g. masked
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0772Means for error signaling, e.g. using interrupts, exception flags, dedicated error registers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0721Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
    • G06F11/0724Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU] in a multiprocessor or a multi-core unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0781Error filtering or prioritizing based on a policy defined by the user or on a policy defined by a hardware/software module, e.g. according to a severity level

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Multi Processors (AREA)
  • Information Transfer Systems (AREA)
  • Bus Control (AREA)

Abstract

【課題】複数のノードを制御する制御装置がノードから受信するデータに基づいて発行する割り込みの回数を削減する。【解決手段】制御装置は、対応するノードからのコマンドとコマンドに続くデータ列とを処理する複数の処理部を有し、各処理部は、データ列の各データが順次格納される受信データレジスタと、受信データレジスタにデータが格納される毎にデータが転送される受信データバッファと、データ列の受信データバッファへの転送を検出する受信完了検出部と、受信したコマンドが、異常コマンドかを検出する異常検出部と、異常コマンドの検出に基づいて割り込みを発行し、異常コマンドを検出しない場合、受信データ列の転送完了の検出に基づいて割り込みを発行する割り込み発行部と、を有し、制御装置は、割り込み発行部が発行した割り込みに基づいて割り込み処理を実行する割り込み処理部と、を有する。【選択図】図1

Description

本発明は、並列処理装置に関する。
多重化されたコンピュータシステム内で発生するエラーに基づいて発行する割り込みの通知先を、システムに対する影響度に応じて変更可能にする手法が提案されている(例えば、特許文献1参照)。仮想サーバー・ブレードがエミュレートする仮想BMC(Baseboard Management Controller)を、物理BMCのように振る舞わせ、仮想BMCにイベントおよびエラーをログに記録するなどの処理を実施させる手法が提案されている(例えば、特許文献2参照)。OS(Operating System)を起動するディスク装置を選択的に切り替える機能をBMCに持たせることで、OSの起動の信頼性を向上させる手法が提案されている(例えば、特許文献3参照)。
特開2006−178557号公報 特表2008−523512号公報 特開2002−259130号公報
例えば、サーバ等のノードと、ノードを制御するBMCを含む制御装置とは、IPMI(Intelligent Platform Management Interface)標準のKCS(Keyboard Controller Style)インターフェースを使用してコマンドやデータ列を通信する。ノードは、BMCにコマンドおよびデータ列を送信する場合、コマンドに続くデータ列を1バイトずつ制御装置の受信回路に送信する。受信回路は、1バイトのデータをノードから受信する毎にBMCに割り込みを発行する。BMCのファームウェアは、割り込みに応答して、制御装置がノードから受信したデータを処理する。
例えば、BMCが複数のノードを制御する場合、BMCが制御するノードの数が増えるほど、BMCによる割り込みの受信頻度および割り込み処理の頻度が高くなり、BMCの負荷は高くなる。
1つの側面では、本発明は、複数のノードを制御する制御装置がノードから受信するデータに基づいて発行する割り込みの回数を削減することを目的とする。
一つの観点によれば、並列処理装置は、情報処理を実行する複数のノードと、前記複数のノードを制御する制御装置とを有する並列処理装置であって、前記制御装置は、前記複数のノードの各々に対応して設けられ、対応するノードから受信するコマンドとコマンドに続くデータ列とを処理する複数の処理部を有し、前記複数の処理部の各々は、対応するノードから受信するコマンドに続く受信データ列の各データが順次格納される受信データレジスタと、前記受信データレジスタにデータが格納される毎に、前記受信データレジスタからデータが転送される受信データバッファと、受信データ列が前記受信データバッファに転送されたことを検出する受信完了検出部と、受信したコマンドが、対応するノードの状態の異常を示す異常コマンドであるかを検出する異常検出部と、前記異常検出部による前記異常コマンドの検出に基づいて割り込みを発行し、前記異常検出部が異常コマンドを検出しない場合、前記受信完了検出部による受信データ列の転送完了の検出に基づいて割り込みを発行する割り込み発行部と、を有し、前記制御装置はさらに、前記複数のノードの各々に対応して設けられ、前記割り込み発行部が発行した割り込みに基づいて割り込み処理を実行する割り込み処理部と、を有する。
1つの側面では、本発明は、複数のノードを制御する制御装置がノードから受信するデータに基づいて発行する割り込みの回数を削減することができる。
一実施形態における並列処理装置の一例を示すブロック図である。 別の実施形態における並列処理装置の一例を示すブロック図である。 図2のKCS処理部の一例を示すブロック図である。 図3のコマンドレジスタに書き込まれるコマンドの一例を示す図である。 図3の受信データレジスタおよび送信データレジスタに格納されるデータフォーマットの一例を示す図である。 図2のノードが稼働状態を通知する場合のデータフォーマットの一例を示す図である。 図6のデータフォーマットにおいて、ノードの稼働状態を通知するリクエストデータとそのレスポンスデータの一例を示す図である。 図2のノードがシステム時刻情報を取得する場合のデータフォーマットの一例を示す図である。 図8のデータフォーマットにおいて、システム時刻情報を取得するリクエストとそのレスポンスの一例を示す図である。 図2のKCS処理部の動作の一例を示すフロー図である。 図10の動作OP50の処理の一例を示すフロー図である。 図10の動作OP70の処理の一例を示すフロー図である。 図2のBMCによるKCS割り込み処理の一例を示すフロー図である。
以下、図面を用いて実施形態が説明される。
図1は、一実施形態における並列処理装置の一例を示す。図1に示す並列処理装置100は、情報処理を実行する複数のノード1と、複数のノード1を制御する制御装置2とを有する。例えば、各ノード1は、サーバ等の情報処理装置でもよく、CPU(Central Processing Unit)等のプロセッサでもよい。あるいは、各ノード1は、CPUに含まれる複数のCPUコアでもよい。なお、ノード1は、図示しないネットワークを介して相互に接続され、情報処理に使用するデータを相互に転送してもよい。
例えば、ノード1は、コマンドとコマンドに続くデータ列とを制御装置2に送信する。例えば、コマンドがノード状態の通知を示す通知コマンドの場合、コマンドに続くデータ列は、ノードがどのような稼働状態または停止状態にあるのかを示す。例えば、コマンドが、時刻等のシステム情報の要求を示す要求コマンド、または、ノード1の状態の異常を示す異常コマンドの場合、コマンドに続くデータ列はなく、コマンドのみが送信されてもよい。ノード1の状態の異常とは、制御装置2との間で通信が正常にできないことをノード1が検出した場合を含む。
制御装置2は、複数のノード1の各々に対応して設けられる複数の処理部3を有する。各処理部3は、受信データレジスタ4、受信データバッファ5、受信完了検出部6、異常検出部7および割り込み発行部8を有する。また、制御装置2は、複数のノード1の各々に対応して設けられる割り込み処理部9を有する。
例えば、処理部3は、ハードウェアにより実現され、割り込み処理部9は、制御装置2に搭載されるBMC等のコントローラが実行するファームウェアにより実現される。なお、処理部3の一部は、ソフトウェアにより実現されてもよく、割り込み処理部9は、FPGA(Field Programmable Gate Array)等のハードウェアにより実現されてもよい。
受信データレジスタ4は、対応するノード1から受信するコマンドに続くデータ列に含まれる各データが順次格納される。受信データバッファ5は、受信データレジスタ4にデータが格納される毎に、受信データレジスタ4からデータが転送される。例えば、受信データレジスタ4のサイズは1バイトであり、受信データバッファ5のサイズは、ノード1から受信するデータ列の最大サイズ以上(複数バイト)である。処理部3は、受信データレジスタ4にデータが書き込まれる毎に、書き込まれたデータを受信データバッファ5に転送する。なお、コマンドに続くデータ列は、1バイトでもよい。
受信完了検出部6は、受信したコマンドに続くデータ列の全てが、受信データレジスタ4から1バイトずつ受信データバッファ5に転送されたことを検出する。例えば、受信完了検出部6は、データ列の受信データバッファ5への転送が完了したことに基づいて、ノード1からのデータ列の受信が完了したことを示す受信完了情報を割り込み発行部8に出力する。
異常検出部7は、受信したコマンドが、コマンドを送信したノード1の状態の異常を示す異常コマンドであるかを検出する。異常検出部7は、異常コマンドの検出に基づいて直ちに、ノード1の状態の異常を示す異常情報を割り込み発行部8に出力する。
割り込み発行部8は、異常検出部7による異常コマンドの検出に基づいて直ちに、割り込み処理部9に割り込みを発行する。また、割り込み発行部8は、異常検出部7が異常コマンドを検出しない場合、受信完了検出部6によるデータ列の受信データバッファ5への転送完了の検出に基づいて、割り込み処理部9に割り込みを発行する。
割り込み処理部9は、割り込み発行部8が発行した割り込みに基づいて、割り込み要因毎に割り込み処理を実行する。例えば、ノード状態の通知を示す通知コマンドに続くデータ列の受信に基づく割り込み処理では、データ列により示されるノードの状態がBMC内の状態記憶領域に格納され、データ列を受信したことを示す応答コマンドがノードに発行される。例えば、時刻等のシステム情報の要求を示す要求コマンドの受信に基づく割り込み処理では、時刻等のシステム情報が取得され、取得したシステム情報がノード1に応答される。例えば、ノード1の状態の異常を示す異常コマンドの受信に基づく割り込み処理では、異常の内容や原因が解析され、ノード1または管理者端末に異常の内容や原因が通知される。
図1に示す並列処理装置100では、受信完了検出部6は、通知コマンドに続いてノード1から受信するデータ列の受信データバッファ5への転送が完了したことに基づいて、受信完了情報を割り込み発行部8に出力する。このため、データ列に含まれる各データを受信データレジスタ4で受信する毎に受信完了情報を割り込み発行部8に出力する場合に比べて、割り込み発行部8が割り込み処理部9に発行する割り込みの回数を削減することができる。これにより、割り込みに基づいて実行される割り込み処理の回数を削減することができ、BMC(割り込み処理部9)に掛かる負荷を軽減することができる。この結果、より多くのノード1の制御を制御装置2に実行させることが可能になる。換言すれば、コマンドに続いてノード1から送信されるデータを1バイト受信する毎に割り込みを発行する場合に比べて、並列処理装置100内に配置する制御装置2の数を削減することができ、並列処理装置のコストを削減することができる。
また、異常コマンドを受信した場合には、異常情報が割り込み発行部8に直ちに出力され、割り込み発行部8が割り込み処理部9に割り込みを発行するため、ノード1の異常状態に対する割り込み処理を迅速に開始することができる。
図2は、別の実施形態における並列処理装置の一例を示す。図1と同様の要素については、詳細な説明は省略する。図3に示す並列処理装置100Aは、情報処理を実行する複数のノード10と、複数のノード10を制御および管理する制御装置20とを有する。例えば、ノード10は、ネットワークで相互に接続されている。ノード10は、サーバ等の情報処理装置でもよく、CPU等のプロセッサでもよく、CPUに含まれる複数のCPUコアでもよい。
制御装置20は、制御部30およびBMC40を有する。制御部30は、例えば、ハードウェアにより実現され、各ノード10に対するコマンドおよびコマンドに続くデータ列の送受信を制御する。例えば、ノード10と制御部30とは、IPMI標準のKCSインターフェースを使用してコマンドおよびデータ列を送受信する。なお、図2では、ノード10から受信するコマンドおよびデータに関する要素を示し、ノード10に送信するコマンドおよびデータに関する要素の記載を省略している。
制御部30は、各ノード10に対応してそれぞれ設けられる複数のKCS処理部50および割り込みレジスタ60を有する。KCS処理部50は、KCSインターフェースレジスタ52、KCSデータ処理回路54、KCSサポートステータスレジスタ56およびKCSサポートデータバッファ58を有する。KCS処理部50の例は、図3に示される。KCS処理部50は、処理部の一例である。
KCSインターフェースレジスタ52は、ノード10から受信するコマンドに続くデータ列を保持するとともに、コマンドとともにノード10に送信するデータ列を保持する。KCSデータ処理回路54は、KCSインターフェースレジスタ52によるデータ列の受信に基づいて、KCS割り込みの発行を判断した場合、KCSサポートステータスレジスタ56の所定のKCS割り込みフラグをセットする。ここで、KCS割り込みは、KCSインターフェースを使用したノード10から制御装置20への通信に起因して発生する割り込みである。
KCSサポートデータバッファ58は、KCSインターフェースレジスタ52を介してノード10から1バイトずつ受信するデータをデータ列として保持する。また、KCSサポートデータバッファ58は、KCSインターフェースレジスタ52を介してノード10に1バイトずつ送信されるデータを含むデータ列を保持する。
BMC40は、各ノード10の電源の制御、温度情報等の取得、イベントの記録等のノード10の管理を実行するとともに、制御部30から発行されるKCS割り込みに基づいて、KCS割り込み処理を実行する。KCS割り込み処理は、KCS割り込みに基づいて実行される割り込み処理である。図2では、KCS割り込み処理に関する要素のみを記載し、ノード10を管理する要素の記載を省略する。
BMC40は、割り込みスレッド42と、KCS割り込みが発生したときに割り込みスレッド42により起動されるノード10毎のKCSスレッド44とを、ファームウェアにより実行する。例えば、KCSスレッド44は、対応するKCS処理部50からの割り込みに基づいて、KCS割り込み処理を実行し、対応するノード10に送信する応答データを生成する割り込み処理部の一例である。KCSスレッド44は、KCS割り込みに基づくKCS割り込み処理が完了した場合に終了する。なお、BMC40は、割り込みスレッド42およびKCSスレッド44の一方または両方の代わりに、割り込み処理を実行する割り込み処理回路を有してもよい。
図3は、図2のKCS処理部50の一例を示す。KCSインターフェースレジスタ52は、コマンドレジスタ522、ステータスレジスタ524、受信データレジスタ526および送信データレジスタ528を有する。例えば、コマンドレジスタ522、ステータスレジスタ524、受信データレジスタ526および送信データレジスタ528は、それぞれ1バイトである。
KCSデータ処理回路54は、比較部541、アンド部542、立ち上がり検出部543、受信完了検出部544、送信完了検出部545およびその他異常検出部546を有する。また、KCSデータ処理回路54は、受信データライトカウンタ547、送信データライトカウンタ548および送信データリードカウンタ549を有する。
KCSサポートステータスレジスタ56は、KCS割り込みフラグとして、アボードフラグ、受信完了フラグ、送信完了フラグおよびその他異常フラグを有する。なお、KCS処理部50は、アボードフラグABRT、受信完了フラグ、送信完了フラグまたはその他異常フラグに基づいて、割り込みレジスタ60に割り込みを発行する割り込み発行制御部592を有する。
KCSサポートデータバッファ58は、受信データバッファ582および送信データバッファ584を有する。また、KCS処理部50は、受信サイズレジスタ594および送信サイズレジスタ596を有する。KCSサポートステータスレジスタ56および割り込み発行制御部592は、異常コマンドの検出、または、異常コマンドを検出しない場合に受信データ列または送信データ列の転送完了の検出に基づいてKCS割り込みを発行する割り込み発行部の一例である。
コマンドレジスタ522は、ノード10から送信されるコマンドを保持する。受信データレジスタ526は、対応するノード10から受信するコマンドに続くデータ列に含まれるデータを、例えば1バイト毎に保持する。例えば、ノード10は、コマンドレジスタ522にコマンドを書き込み、受信データレジスタ526に1バイトずつデータを書き込む。ノード10から受信するデータ列は、受信データ列の一例である。ノード10から受信するデータ列は、受信データレジスタ526に1バイトずつ保持される毎に受信データバッファ582に転送される。
ステータスレジスタ524は、IPMI仕様におけるIBFフラグを有する。ステータスレジスタ524のIBFフラグは、ノード10によりコマンドレジスタ522にコマンドが書き込まれ、またはノード10により受信データレジスタ526にデータが書き込まれた場合に”1”にセットされる。
送信データレジスタ528は、ノード10に送信する1バイトのデータを保持する。送信データレジスタ528に保持されるデータは、KCSデータ処理回路54による制御に基づいて送信データバッファ584から転送される。
例えば、BMC40(図2のKCSスレッド44)は、受信データバッファ582に転送されたデータ列を処理するKCS割り込み処理を実行し、対応するノード10に応答するデータ列を生成し、生成したデータ列を送信データバッファ584に格納する。そして、送信データバッファ584から送信データレジスタ528に1バイトずつ順次転送されるデータは、対応するノード10に応答データ列として送信される。
比較部541は、コマンドレジスタ522に保持されたコマンドとアボートコマンドとを比較する。比較部541は、コマンドレジスタ522に保持されたコマンドがアボートコマンドである場合、”1”を出力し、コマンドレジスタ522に保持されたコマンドがアボートコマンドでない場合、”0”を出力する。例えば、コマンドレジスタ522には、コマンドを識別するコマンドコードが格納され、比較部541は、コマンドレジスタ522に保持されたコマンドコードと、アボードコマンドを識別するコマンドコードとを比較する。アボードコマンドは、ノード10の状態の異常を示す異常コマンドの一例である。
アンド部542は、IBFフラグに”1”がセットされ、比較部541が”1”を出力する場合、”1”を出力し、IBFフラグが”0”または比較部541の出力が”0”の場合、”0”を出力する。立ち上がり検出部543は、アンド部542の出力が”0”から”1”に変化したことを検出した場合、アボートフラグをセットする。比較部541およびアンド部542は、ノード10から受信したコマンドが、対応するノード10の状態の異常を示す異常コマンドであるかを検出する異常検出部の一例である。
受信完了検出部544は、ノード10から受信したデータ列の受信データバッファ582への転送の完了を示す受信完了信号RCPLTを受信データライトカウンタ547から受けた場合、KCSサポートステータスレジスタ56の受信完了フラグをセットする。但し、受信完了検出部544は、アンド部542から”1”を受けている場合、受信完了フラグのセット動作を抑止し、受信完了信号RCPLTに応答する割り込みの発行を抑止させる。アボートコマンドをノード10から受信した場合、ノード10が異常動作している可能性があり、ノード10から受信したデータ列が正しくないおそれがある。このため、アボートコマンドを受信した場合に、受信データ列の受信完了に伴う割り込みの発行を抑止することで、BMC40により無駄な割り込み処理が実行されることを抑止することができる。
送信完了検出部545は、送信データライトカウンタ548および送信データリードカウンタ549から送信完了信号TCPLT1、TCPLT2の両方を受信した場合、応答データ列のノード10への送信完了を検出する。そして、送信完了検出部545は、KCSサポートステータスレジスタ56の送信完了フラグをセットする。
但し、送信完了検出部545は、アンド部542から”1”を受けている場合、送信完了フラグのセット動作を抑止し、送信完了信号TCPLT1、TCPLT2に応答する割り込みの発行を抑止させる。アボートコマンドをノード10から受信した場合、ノード10が異常動作している可能性があり、制御装置20から送信したデータ列をノード10が正しく受信しないおそれがある。このため、アボートコマンドを受信した場合に、送信データ列の送信完了に伴う割り込みの発行を抑止することで、BMC40により無駄な割り込み処理が実行されることを抑止することができる。
その他異常検出部546は、ノード10からのアボートコマンドとは無関係に、ノード10との間の通信等の異常が制御装置20内で検出された場合、その他異常フラグをセットする。例えば、その他異常フラグは、受信データサイズ分の受信データ列を受信する前にタイムアウトが発生した場合、または、送信データサイズ分の送信データ列を送信する前にタイムアウトが発生した場合等にセットされる。
受信データライトカウンタ547は、コマンドとともにノード10から受信したデータ列に含まれる各データが、受信データレジスタ526から受信データバッファ582に書き込まれる毎にカウンタ値を更新する。受信データライトカウンタ547は、カウンタ値が受信サイズレジスタ594に保持された受信データサイズになった場合、受信完了検出部544に、受信完了信号RCPLTを出力する。例えば、受信データライトカウンタ547は、受信データレジスタ526から受信データバッファ582にデータを書き込むときに生成される書き込み要求をモニタし、書き込み要求が発生する毎にカウンタ値を更新する。受信データライトカウンタ547は、受信データカウンタの一例である。
受信データライトカウンタ547により、受信データバッファ582に書き込まれるデータを1つずつカウントすることで、受信データバッファ582への受信データ列の転送の完了に合わせて、割り込みを発行することができる。これにより、受信データバッファ582への受信データ列の転送が完了する前に割り込みが発行されることを抑止でき、受信データバッファ582への受信データ列の転送が完了してから割り込みが発行されるまでの時間が掛かることを抑止できる。したがって、受信データ列の転送の完了に基づいて割り込みを発行する場合に、割り込み処理の効率が低下することを抑止することができる。
送信データライトカウンタ548は、送信データバッファ584から送信データレジスタ528にデータが書き込まれる毎にカウンタ値を更新する。送信データライトカウンタ548は、カウンタ値が送信サイズレジスタ596に保持された送信データサイズになった場合、送信完了検出部545に送信完了信号TCPLT1を出力する。
すなわち、送信データライトカウンタ548は、カウンタ値が応答データ列のデータ数分更新された場合、送信完了信号TCPLT1を出力する。例えば、送信データライトカウンタ548は、送信データバッファ584から送信データレジスタ528にデータを書き込むときに生成される書き込み要求をモニタし、書き込み要求が発生する毎にカウンタ値を更新する。送信データライトカウンタ548は、第1の送信データカウンタの一例であり、送信完了信号TCPLT1は、第1の送信完了信号の一例である。
送信データリードカウンタ549は、送信データレジスタ528に格納されたデータがノード10により読み出される毎にカウンタ値を更新する。送信データリードカウンタ549は、カウンタ値が送信サイズレジスタ596に保持された送信データサイズになった場合、送信完了検出部545に送信完了信号TCPLT2を出力する。
すなわち、送信データリードカウンタ549は、カウンタ値が応答データ列のデータ数分更新された場合、送信完了信号TCPLT2を出力する。例えば、送信データリードカウンタ549は、送信データレジスタ528からデータを読み出す場合にノード10から発行される読み出し要求をモニタし、読み出し要求が発生する毎にカウンタ値を更新する。送信データリードカウンタ549は、第2の送信データカウンタの一例であり、送信完了信号TCPLT2は、第2の送信完了信号の一例である。
送信データライトカウンタ548および送信データリードカウンタ549により、送信データ列に含まれるデータを1つずつカウントすることで、送信データ列のノード10への送信の完了に合わせて、割り込みを発行することができる。これにより、ノード10への送信データ列の送信中に割り込みが発生されることを抑止でき、ノード10への送信データ列の送信が完了してから割り込みが発行されるまでの時間が掛かることを抑止できる。したがって、送信データ列の送信の完了に基づいて割り込みを発行する場合に、割り込み処理の効率が低下することを抑止することができる。
また、送信データライトカウンタ548および送信データリードカウンタ549の両方によるデータのカウントに基づいて、割り込みを発行するため、割り込みの発行の信頼性を向上することができる。
なお、受信データライトカウンタ547は、受信サイズレジスタ594を使用せずに、データ列の受信の完了を判定してもよい。例えば、KCSデータ処理回路54は、ノード10から受信したコマンドに基づいて、コマンドに続く受信データ列のサイズ(受信データサイズ)を求め、求めた受信データサイズを受信データライトカウンタ547にセットする。受信データライトカウンタ547は、受信データレジスタ526から受信データバッファ582にデータが書き込まれる毎にカウンタ値をデクリメントし、カウンタ値が”0”になったときに、受信完了信号RCPLTを出力する。
また、送信データライトカウンタ548および送信データリードカウンタ549は、送信サイズレジスタ596を使用せずに、データ列の送信の完了を判定してもよい。例えば、KCSデータ処理回路54は、コマンドに続いてノード10に送信するデータ列のサイズ(送信データサイズ)を送信データライトカウンタ548および送信データリードカウンタ549にセットする。送信データライトカウンタ548は、送信データバッファ584から送信データレジスタ528にデータが書き込まれる毎にカウンタ値をデクリメントし、カウンタ値が”0”になったときに、送信完了信号TCPLT1を出力する。送信データリードカウンタ549は、送信データレジスタ528に格納されたデータがノード10により読み出される毎にカウンタ値をデクリメントし、カウンタ値が”0”になったときに、送信完了信号TCPLT2を出力する。
割り込み発行制御部592は、アボードフラグ、受信完了フラグ、送信完了フラグまたはその他異常フラグのいずれかがセットされたことに応答して、割り込みレジスタ60にKCS割り込みを発行する。割り込みレジスタ60は、KCS割り込みを受信した場合、KCS割り込みをBMC40の割り込みスレッド42に通知する。
なお、KCS割り込みの発行の優先順は、アボードフラグおよびその他異常フラグが、受信完了フラグおよび送信完了フラグよりも高く設定されてもよい。この場合、アボードフラグがセットされ、アボードフラグに対応する割り込み処理が実行されると、受信完了フラグまたは送信完了フラグに応答する割り込みの発行はマスクされる。一方、受信完了フラグがセットされ、受信完了フラグに対応する割り込み処理が実行されても、アボードフラグまたはその他異常フラグがセットされた場合、割り込みレジスタ60への割り込みが発行される。
なお、例えば、受信完了フラグのセットに応答して割り込み処理が実行されているときに、受信完了フラグが再度セットされた場合、再度セットされた受信完了フラグに対応する割り込みの発行はマスクされる。このように、割り込み発行制御部592は、割り込みの発行のマスク機能を有する。
受信データバッファ582は、受信データレジスタ526から転送されたデータを保持する。受信データバッファ582に保持されたデータ列(受信データ)は、BMC40により読み出される。例えば、受信データバッファ582のサイズは、ノード10から受信する受信データ列の最大サイズ以上(複数バイト)である。
送信データバッファ584は、BMC40によりデータ列が書き込まれる。送信データバッファ584に保持されたデータ列(送信データ)は、送信データレジスタ528に1バイトずつ転送され、ノード10により読み出される。例えば、送信データバッファ584のサイズは、ノード10に送信する送信データ列の最大サイズ以上(複数バイト)である。
受信サイズレジスタ594は、コマンドとともにノード10から送信されるデータ列のサイズである受信データサイズが格納される。送信サイズレジスタ596は、コマンドとともにノード10に送信するデータ列のサイズである送信データサイズが格納される。
図4は、図3のコマンドレジスタ522に書き込まれるコマンドの一例を示す。図4に示すコマンドは、IPMI仕様におけるKCS制御コードと同様である。例えば、ノード10は、制御装置20にデータを転送する場合、コマンドレジスタ522にWRITE_START(コマンドコード=61h)を書き込んでトランザクションを開始した後、データを受信データレジスタ526に1バイトずつ書き込む。なお、コマンドコードの末尾の”h”は、16進数を示す。そして、最終のデータを受信データレジスタ526に書き込んだ後、コマンドレジスタ522にWRITE_END(コマンドコード=62h)を書き込み、トランザクションを終了する。
また、ノード10は、コマンドレジスタ522にWRITE_STARTを書き込んでからWRITE_ENDを書き込むまでに、通信異常等を検出した場合、コマンドレジスタ522にABORT(アボートコマンド;コマンドコード=60h)を書き込む。アボートコマンドを受信した制御装置20は、後述するアボート処理を実行する。なお、例えば、コマンドコードは、いずれも1バイトである。
図5は、図3の受信データレジスタ526および送信データレジスタ528に格納されるデータフォーマットの一例を示す。図5に示すリクエストデータフォーマットは、IPMI仕様におけるリクエストメッセージフォーマットと同様である。図5に示すレスポンスデータフォーマットは、IPMI仕様におけるレスポンスメッセージフォーマットと同様である。
ノード10から受信データレジスタ526に書き込まれるリクエストデータフォーマットは、1バイトのネットワーク機能コードNetFn/LUN(Logical Unit Number)と、1バイトのコマンドCmdと、0バイト以上のデータDataとを含む。BMC40から送信データレジスタ528に書き込まれるレスポンスデータフォーマットは、1バイトのNetFn/LUNと、1バイトのCmdと、1バイトの完了コード(Completion Code)と、0バイト以上のデータDataとを含む。
図6は、図2のノード10が稼働状態を通知する場合のデータフォーマットの一例を示す。例えば、ノード10は、稼働状態を通知する場合、NetFn/LUNを30hに設定し、Cmdを00hに設定し、3バイト目のDataに稼働状態を示すコードを設定し、4バイト目のDataに付加情報を設定する。Dataの5バイト目と6バイト目は、リザーブ領域である。図6に示す例では、ノード10は、3バイト目のDataに応じて、8種類の稼働状態を通知することができる。また、ノード10は、4バイト目の付加情報により、シャットダウンが通常のシャットダウンなのか異常なシャットダウンなのかを通知することができる。
稼働状態の通知を受けたBMC40は、レスポンスにおいて、NetFn/LUNおよびCmdを、リクエストと同じ30hと00hにそれぞれ設定し、正常のレスポンスの場合、3バイト目のDataに正常終了を示す00hを設定する。稼働状態の通知に対するレスポンスでは、Data領域は使用されない。
図7は、図6のデータフォーマットにおいて、ノードの稼働状態を通知するリクエストデータとそのレスポンスデータの一例を示す。例えば、ノード10からBMC40に、ノード10のOSが稼働状態であることを通知する場合、NetFn/LUNおよびCmdの30h、00hに続き、受信データレジスタ526に0Ahが書き込まれる。レスポンスデータの内容は、図6と同じである。
図8は、図2のノード10がシステムの時刻情報を取得する場合のデータフォーマットの一例を示す。例えば、ノード10は、システム時刻情報を取得する場合、NetFn/LUNを31hに設定し、Cmdを01hに設定する。3バイト目以降のDataは存在しない。
システム時刻情報の取得の通知を受けたBMC40は、レスポンスにおいて、NetFn/LUNおよびCmdを、リクエストと同じ31hと01hにそれぞれ設定し、正常のレスポンスの場合、3バイト目のDataに正常終了を示す00hを設定する。また、4バイト目から7バイト目の4バイトにシステム時刻を示すデータを設定する。例えば、システム時刻は、UTC(Universal Time Coordinated)が1970年1月1日からの累積秒として示される。
図9は、図8のデータフォーマットにおいて、システム時刻情報を取得するリクエストとそのレスポンスの一例を示す。リクエストデータの内容は、図8と同じである。また、レスポンスデータの最初の3バイトは、図8と同じである。例えば、レスポンスデータの4バイト目から7バイト目には、システム時刻を示す5ch、bdh、85h、e5hがそれぞれ書き込まれる。
図10は、図3のKCS処理部50の動作の一例を示す。まず、動作OP10において、KCS処理部50は、ノード10からのコマンドを待ち、ノード10からコマンドを受信した場合、動作OP20に移行する。動作OP20において、KCSデータ処理回路54は、コマンドがアボートコマンドか否かを比較部541により判定する。
コマンドがアボートコマンドの場合、動作OP40に移行され、以下で説明するように、アボート処理が実行され、アボード処理の完了後、動作OP10のコマンド待ちに戻る。
動作OP40において、立ち上がり検出部543は、KCSサポートステータスレジスタ56のアボートフラグをセットする。次に、動作OP41において、割り込み発行制御部592は、アボートフラグのセットに応答して割り込みレジスタ60に割り込み要求をセットすることで、BMC40に割り込みを発行し、動作OP42に移行する。
動作OP42において、例えば、割り込み発行制御部592は、割り込みレジスタ60への割り込みの発行に基づいて、アボートフラグをリセットする。次に、動作OP43において、KCSデータ処理回路54は、BMC40によるアボート処理の完了を待ち、アボート処理が完了した場合、動作OP10に戻る。
一方、動作OP20でコマンドがアボートコマンドでない場合、動作OP30に移行され、KCSデータ処理回路54は、その他異常が発生したか否かを判定する。その他異常が発生した場合、動作OP31において、その他異常検出部546は、KCSサポートステータスレジスタ56のその他異常フラグをセットする。次に、動作OP32において、割り込み発行制御部592は、その他異常フラグのセットに応答して割り込みレジスタ60に割り込み要求をセットすることで、BMC40に割り込みを発行する。次に、動作OP33において、例えば、割り込み発行制御部592は、割り込みレジスタ60への割り込みの発行に基づいて、その他異常フラグをリセットし、動作OP70に移行する。
一方、アボートもその他異常も発生していない場合、動作OP50において、KCSデータ処理回路54は、ノード10からのデータ列の受信処理を実行し、データ列の受信処理の完了後、動作を動作OP70に移行する。動作OP50の動作の例は、図11に示す。
動作OP70において、KCSデータ処理回路54は、割り込み処理の完了に基づいてノード10に送信される応答データの送信確認処理を実行した後、動作OP10のコマンド待ちに戻る。動作OP70の動作の例は、図12に示す。
図11は、図10の動作OP50の一例を示す。まず、動作OP51において、KCS処理部50は、受信サイズレジスタ594に受信データサイズをセットする。次に、動作OP52において、KCS処理部50は、ノード10からのデータが受信データレジスタ526に格納されるのを待つ。受信データレジスタ526にデータが格納された場合、動作OP53において、KCS処理部50は、受信データレジスタ526が保持するデータを受信データバッファ582に格納する。次に、動作OP54において、KCSデータ処理回路54は、受信データライトカウンタ547のカウンタ値を更新する。
次に、動作OP55において、KCSデータ処理回路54は、受信データライトカウンタ547のカウンタ値に基づいて、受信データサイズ分のデータ列をノード10から受信したか否かを判定する。受信データサイズ分のデータ列をノード10から受信していない場合、動作OP52において、KCS処理部50は、次のデータの受信を待つ。受信データサイズ分のデータ列をノード10から受信した場合、動作OP56において、受信完了検出部544は、KCSサポートステータスレジスタ56の受信完了フラグをセットする。
次に、動作OP57において、割り込み発行制御部592は、受信完了フラグのセットに応答して割り込みレジスタ60に割り込み要求をセットすることで、BMC40に割り込みを発行する。次に、動作OP58において、例えば、割り込み発行制御部592は、割り込みレジスタ60への割り込みの発行に基づいて、受信完了フラグをリセットし、図10に示した動作OP70に移行する。
図12は、図10の動作OP70の一例を示す。まず、動作OP71において、KCS処理部50は、送信サイズレジスタ596に送信データサイズをセットする。次に、動作OP72において、KCSデータ処理回路54は、送信データバッファ584が保持するデータ列のうちの1バイトを、送信データレジスタ528にセットする。次に、KCSデータ処理回路54は、送信データライトカウンタ548のカウンタ値を更新する。
次に、動作OP73において、KCSデータ処理回路54は、送信データレジスタ528に保持されたデータをノード10が読み出すまで待つ。そして、ノード10がデータを読み出した場合、動作OP75において、KCSデータ処理回路54は、送信データリードカウンタ549のカウンタ値を更新する。
次に、動作OP76において、KCSデータ処理回路54は、送信データライトカウンタ548のカウンタ値と送信データリードカウンタ549のカウンタ値とに基づいて、送信データサイズ分のデータ列をノード10に送信したか否かを判定する。送信データサイズ分のデータ列をノード10に送信していない場合、動作OP74に戻る。送信データサイズ分のデータ列をノード10に送信した場合、動作OP77において、KCSデータ処理回路54は、KCSサポートステータスレジスタ56の送信完了フラグをセットする。
次に、動作OP78において、割り込み発行制御部592は、送信完了フラグのセットに応答して割り込みレジスタ60に割り込み要求をセットすることで、BMC40に割り込みを発行する。次に、動作OP79において、例えば、割り込み発行制御部592は、割り込みレジスタ60への割り込みの発行に基づいて、送信完了フラグをリセットし、図10に示した動作OP10に戻る。
図13は、図2のBMC40によるKCS割り込み処理の一例を示す。例えば、図13に示す処理は、BMC40が実行するファームウェアより実行される。
まず、ステップS11において、BMC40は、制御装置20等からの割り込みを待つ。割り込みを受信した場合、ステップS12において、BMC40は、割り込みがKCS割り込みか否かを判定し、KCS割り込みの場合、処理をステップS13に移行し、KCS割り込みでない場合、処理をステップS20に移行する。
ステップS13において、BMC40は、KCS割り込みがアボートによる割り込みか否かを判定し、アボートによる割り込みの場合、処理をステップS14に移行し、アボートによる割り込みでない場合、処理をステップS15に移行する。ステップS14において、BMC40は、アボートによる割り込みに対する処理であるアボート処理を実行し、処理をステップS11に戻す。
ステップS15において、BMC40は、受信サイズレジスタ594から受信データサイズを取得する。次に、ステップS16において、BMC40は、受信データバッファ582から受信データサイズ分のデータ列を読み出す。次に、ステップS17において、BMC40は、割り込みに対する応答処理を実行する。例えば、BMC40は、応答処理において、ノード10に応答する送信データ列を送信データバッファ584に格納する。
次に、ステップS18において、BMC40は、送信データバッファ584に格納したデータ列がノード10に送信されたことに基づいて発行されるKCS割り込みを待ち、KCS割り込みを受信した場合、処理をステップS19に移行する。ステップS19において、BMC40は、KCS割り込みの受信に基づいてノード10への応答完了を検出し、処理をステップS11に戻す。一方、ステップS20において、BMC40は、KCS割り込み以外の割り込みに対する割り込み処理を実行し、処理をステップS11に戻す。
以上、図2から図13に示す実施形態においても、図1に示す実施形態と同様の効果を得ることができる。例えば、KCS処理部50は、アボートコマンドを受信しない場合、コマンドに続くデータ列が受信データバッファ582に転送されたことに基づいて、KCS割り込みを発行する。このため、データ列の各データを受信データレジスタ526で受信する毎にKCS割り込みを発行する場合に比べて、BMC40に発行する割り込みの回数を削減することができる。これにより、割り込みに基づいて実行される割り込み処理の回数を削減することができ、BMC40に掛かる負荷を軽減することができる。この結果、より多くのノード1の制御を制御装置20に実行させることが可能になる。
さらに、図2から図13に示す実施形態では、受信データバッファ582への受信データ列の転送の完了に合わせて、割り込みを発行することができる。これにより、受信データバッファ582への受信データ列の転送が完了する前に割り込みが発行されることを抑止でき、受信データバッファ582への受信データ列の転送が完了してから割り込みが発行されるまでの時間が掛かることを抑止できる。したがって、受信データ列の転送の完了に基づいて割り込みを発行する場合に、割り込み処理の効率が低下することを抑止することができる。
送信データライトカウンタ548および送信データリードカウンタ549により、送信データ列に含まれるデータを1つずつカウントすることで、送信データ列のノード10への送信の完了に合わせて、割り込みを発行することができる。これにより、ノード10への送信データ列の送信中に割り込みが発生されることを抑止でき、ノード10への送信データ列の送信が完了してから割り込みが発行されるまでの時間が掛かることを抑止できる。したがって、送信データ列の送信の完了に基づいて割り込みを発行する場合に、割り込み処理の効率が低下することを抑止することができる。
アボートコマンドを受信した場合に、受信データ列の受信完了に伴う割り込みの発行を抑止することで、BMC40により無駄な割り込み処理が実行されることを抑止することができる。また、アボートコマンドを受信した場合に、送信データ列の送信完了に伴う割り込みの発行を抑止することで、BMC40により無駄な割り込み処理が実行されることを抑止することができる。
以上の詳細な説明により、実施形態の特徴点および利点は明らかになるであろう。これは、特許請求の範囲がその精神および権利範囲を逸脱しない範囲で前述のような実施形態の特徴点および利点にまで及ぶことを意図するものである。また、当該技術分野において通常の知識を有する者であれば、あらゆる改良および変更に容易に想到できるはずである。したがって、発明性を有する実施形態の範囲を前述したものに限定する意図はなく、実施形態に開示された範囲に含まれる適当な改良物および均等物に拠ることも可能である。
1 ノード
2 制御装置
3 処理部
4 受信データレジスタ
5 受信データバッファ
6 受信完了検出部
7 異常検出部
8 割り込み発行部
9 割り込み処理部
10 ノード
20 制御装置
30 制御部
40 BMC
42 割り込みスレッド
44 KCSスレッド
50 KCS処理部
52 KCSインターフェースレジスタ
54 KCSデータ処理回路
56 KCSサポートステータスレジスタ
58 KCSサポートデータバッファ
60 割り込みレジスタ
100、100A 並列処理装置
522 コマンドレジスタ
524 ステータスレジスタ
526 受信データレジスタ
528 送信データレジスタ
541 比較部
542 アンド部
543 立ち上がり検出部
544 受信完了検出部
545 送信完了検出部
546 その他異常検出部
547 受信データライトカウンタ
548 送信データライトカウンタ
549 送信データリードカウンタ
582 受信データバッファ
584 送信データバッファ
594 受信サイズレジスタ
596 送信サイズレジスタ

Claims (5)

  1. 情報処理を実行する複数のノードと、前記複数のノードを制御する制御装置とを有する並列処理装置であって、
    前記制御装置は、前記複数のノードの各々に対応して設けられ、対応するノードから受信するコマンドとコマンドに続くデータ列とを処理する複数の処理部を有し、
    前記複数の処理部の各々は、
    対応するノードから受信するコマンドに続く受信データ列の各データが順次格納される受信データレジスタと、
    前記受信データレジスタにデータが格納される毎に、前記受信データレジスタからデータが転送される受信データバッファと、
    受信データ列が前記受信データバッファに転送されたことを検出する受信完了検出部と、
    受信したコマンドが、対応するノードの状態の異常を示す異常コマンドであるかを検出する異常検出部と、
    前記異常検出部による前記異常コマンドの検出に基づいて割り込みを発行し、前記異常検出部が異常コマンドを検出しない場合、前記受信完了検出部による受信データ列の転送完了の検出に基づいて割り込みを発行する割り込み発行部と、を有し、
    前記制御装置はさらに、前記複数のノードの各々に対応して設けられ、前記割り込み発行部が発行した割り込みに基づいて割り込み処理を実行する割り込み処理部と、を有することを特徴とする並列処理装置。
  2. 前記複数の処理部の各々は、
    前記受信データレジスタから前記受信データバッファにデータが転送される毎に、カウンタ値を更新し、カウンタ値が受信データ列のデータ数分更新された場合、受信完了信号を出力する受信データカウンタを有し、
    前記受信完了検出部は、前記受信完了信号の受信に基づいて、受信データ列の前記受信データバッファへの転送完了を検出すること、を特徴とする請求項1に記載の並列処理装置。
  3. 前記受信完了検出部は、前記異常検出部が前記異常コマンドを検出した場合、受信完了信号の受信に基づく前記割り込み発行部への割り込みの発行を抑止すること、を特徴とする請求項2に記載の並列処理装置。
  4. 前記複数の処理部の各々は、
    前記受信データバッファに転送された受信データ列を処理する割り込み処理により生成され、対応するノードに応答される応答データ列に含まれるデータが順次格納される送信データレジスタと、
    前記送信データレジスタにデータが格納される毎に、カウンタ値を更新し、カウンタ値が、応答データ列のデータ数分更新された場合、第1の送信完了信号を出力する第1の送信データカウンタと、
    前記送信データレジスタに格納されたデータが前記ノードに転送される毎に、カウンタ値を更新し、カウンタ値が応答データ列のデータ数分更新された場合、第2の送信完了信号を出力する第2の送信データカウンタと、
    前記第1の送信完了信号と前記第2の送信完了信号との両方を受信した場合、応答データ列の前記ノードへの送信完了を検出する送信完了検出部と、
    を有し、
    前記割り込み発行部は、前記異常検出部が異常コマンドを検出しない場合、前記受信完了検出部による受信データ列の転送完了の検出または前記送信完了検出部による応答データ列の送信完了の検出に基づいて割り込みを発行すること、を特徴とする請求項1ないし請求項3のいずれか1項に記載の並列処理装置。
  5. 前記送信完了検出部は、前記異常検出部が前記異常コマンドを検出した場合、前記第1の送信完了信号および前記第2の送信完了信号の受信に基づく前記割り込み発行部への割り込みの発行を抑止すること、を特徴とする請求項4に記載の並列処理装置。
JP2019105442A 2019-06-05 2019-06-05 並列処理装置 Pending JP2020198044A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2019105442A JP2020198044A (ja) 2019-06-05 2019-06-05 並列処理装置
EP20175005.6A EP3748496A1 (en) 2019-06-05 2020-05-15 Parallel processing apparatus
US16/879,818 US11074102B2 (en) 2019-06-05 2020-05-21 Parallel processing apparatus
CN202010483979.8A CN112052108A (zh) 2019-06-05 2020-06-01 并行处理设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019105442A JP2020198044A (ja) 2019-06-05 2019-06-05 並列処理装置

Publications (1)

Publication Number Publication Date
JP2020198044A true JP2020198044A (ja) 2020-12-10

Family

ID=70775259

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019105442A Pending JP2020198044A (ja) 2019-06-05 2019-06-05 並列処理装置

Country Status (4)

Country Link
US (1) US11074102B2 (ja)
EP (1) EP3748496A1 (ja)
JP (1) JP2020198044A (ja)
CN (1) CN112052108A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11709664B2 (en) * 2020-06-02 2023-07-25 SambaNova Systems, Inc. Anti-congestion flow control for reconfigurable processors
US11442696B1 (en) 2021-03-23 2022-09-13 SambaNova Systems, Inc. Floating point multiply-add, accumulate unit with exception processing

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09266472A (ja) * 1996-03-28 1997-10-07 Nec Eng Ltd 障害通知回路
JPH1091592A (ja) * 1996-09-18 1998-04-10 Hitachi Ltd 並列計算機
JP2002044183A (ja) * 2000-07-21 2002-02-08 Sony Corp 通信制御装置及び通信制御方法
JP2006184964A (ja) * 2004-12-24 2006-07-13 Fuji Electric Retail Systems Co Ltd 自動販売機
JP2011065537A (ja) * 2009-09-18 2011-03-31 Toppan Printing Co Ltd データ受信システムおよび割り込み実行方法
JP2012234252A (ja) * 2011-04-28 2012-11-29 Nec Corp 遠隔操作システム、データ処理方法およびプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4225959A (en) * 1978-08-04 1980-09-30 Honeywell Information Systems Inc. Tri-state bussing system
US4791641A (en) * 1986-09-15 1988-12-13 Thinking Machines Corporation Parallel processor error checking
CN1040803C (zh) * 1989-05-17 1998-11-18 国际商业机器公司 在数据处理系统提供附加系统特性的方法和装置
CA2019300C (en) * 1989-06-22 2001-06-12 Kendall Square Research Corporation Multiprocessor system with shared memory
EP0481735A3 (en) * 1990-10-19 1993-01-13 Array Technology Corporation Address protection circuit
JP2002259130A (ja) 2001-03-02 2002-09-13 Toshiba Corp 情報処理システムおよびその起動制御方法
US7694298B2 (en) 2004-12-10 2010-04-06 Intel Corporation Method and apparatus for providing virtual server blades
JP2006178557A (ja) 2004-12-21 2006-07-06 Nec Corp コンピュータシステム及びエラー処理方法
US20070005828A1 (en) * 2005-06-30 2007-01-04 Nimrod Diamant Interrupts support for the KCS manageability interface
CN107533458A (zh) * 2016-02-04 2018-01-02 慧与发展有限责任合伙企业 基于存储器寄存器中断的信令和消息传递

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09266472A (ja) * 1996-03-28 1997-10-07 Nec Eng Ltd 障害通知回路
JPH1091592A (ja) * 1996-09-18 1998-04-10 Hitachi Ltd 並列計算機
JP2002044183A (ja) * 2000-07-21 2002-02-08 Sony Corp 通信制御装置及び通信制御方法
JP2006184964A (ja) * 2004-12-24 2006-07-13 Fuji Electric Retail Systems Co Ltd 自動販売機
JP2011065537A (ja) * 2009-09-18 2011-03-31 Toppan Printing Co Ltd データ受信システムおよび割り込み実行方法
JP2012234252A (ja) * 2011-04-28 2012-11-29 Nec Corp 遠隔操作システム、データ処理方法およびプログラム

Also Published As

Publication number Publication date
US11074102B2 (en) 2021-07-27
US20200387397A1 (en) 2020-12-10
EP3748496A1 (en) 2020-12-09
CN112052108A (zh) 2020-12-08

Similar Documents

Publication Publication Date Title
US7536584B2 (en) Fault-isolating SAS expander
US6067628A (en) Method to monitor universal serial bus hub overcurrent
US10261803B2 (en) Systems and methods for in-situ fabric link optimization in a modular information handling system chassis
EP2052326B1 (en) Fault-isolating sas expander
US8510606B2 (en) Method and apparatus for SAS speed adjustment
US7395362B2 (en) Method for a slave device to convey an interrupt and interrupt source information to a master device
RU2559765C2 (ru) Применение косвенных адресных слов данных расширенной схемы асинхронного перемещения данных
JP2008090375A (ja) 割込み制御システム、およびこれを利用した記憶制御システム
US8843680B2 (en) Storage system having SAS as its backend communication standard
US20140068134A1 (en) Data transmission apparatus, system, and method
US5644700A (en) Method for operating redundant master I/O controllers
JP4818843B2 (ja) リモートコピーを行うストレージシステム
JP2020198044A (ja) 並列処理装置
JP6183931B2 (ja) クラスタシステム、サーバ装置、クラスタシステムの管理方法、及びプログラム。
US9473273B2 (en) Memory system capable of increasing data transfer efficiency
US7281163B2 (en) Management device configured to perform a data dump
RU2541106C2 (ru) Облегчение операций ввода-вывода в режиме передачи между канальной подсистемой и устройствами ввода-вывода
CN114020670B (zh) 一种pcie卡的管理方法、系统、设备及存储介质
EP2096550B1 (en) Information processing apparatus and control method thereof
US11314582B2 (en) Systems and methods for dynamically resolving hardware failures in an information handling system
JP4572138B2 (ja) サーバ装置、サーバシステム、及びサーバシステムでの系切り換え方法
CN113672537B (zh) 一种sata设备热插拔管理方法和装置
US20230315672A1 (en) Interface device and computing system including the same
CN115687217A (zh) 一种管理背板设备热插拔的方法、系统
JP5338367B2 (ja) 通信制御装置、障害検出方法、通信制御回路及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220308

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220823

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230228