JP7044974B2 - プロセッサ及び情報処理装置 - Google Patents

プロセッサ及び情報処理装置 Download PDF

Info

Publication number
JP7044974B2
JP7044974B2 JP2018136597A JP2018136597A JP7044974B2 JP 7044974 B2 JP7044974 B2 JP 7044974B2 JP 2018136597 A JP2018136597 A JP 2018136597A JP 2018136597 A JP2018136597 A JP 2018136597A JP 7044974 B2 JP7044974 B2 JP 7044974B2
Authority
JP
Japan
Prior art keywords
communication line
error rate
threshold value
hbm
spare
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018136597A
Other languages
English (en)
Other versions
JP2020013446A (ja
Inventor
誠 須賀
俊 安藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2018136597A priority Critical patent/JP7044974B2/ja
Priority to US16/439,788 priority patent/US10848373B2/en
Publication of JP2020013446A publication Critical patent/JP2020013446A/ja
Application granted granted Critical
Publication of JP7044974B2 publication Critical patent/JP7044974B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0893Assignment of logical groups to network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring

Description

本発明は、プロセッサ及び情報処理装置に関する。
近年、CoWoS(Taiwan Semiconductor Manufacturing Company Limitedの登録商標)のような新しい積層技術が開発され、プロセッサとメモリを同一パッケージ内に搭載する実装が増え始めている。しかし、このことが搭載部品ごとの交換を困難にしており、歩留まりや修理コストの悪化を招く場合があった。
そこで、上記の積層技術により製造されるメモリであるHBM(High Bandwidth Memory)とそのメモリコントローラには、両者を接続する通信線に障害があった場合に、障害が発生した通信線の代りに予備線を用いて通信を行う機能がある。
なお、HBMとそのメモリコントローラが用いる予備線は、2つの通信線群(各通信線群はデータ信号、データマスク信号、データ反転制御信号を伝播する)ごとに1つ設けられている。
特開2014-241082号公報 特開2010-113751号公報
SK Hynix, "TSV based Memory Solutions Engaging in IoT & IoE Trend", p.25, [online], 2015, MemCon, Santa Clara, [平成30年5月29日検索], インターネット<http://www.memcon.com/pdfs/proceedings2015/MKT105_SKhynix.pdf>
上記のように予備線は、2つの通信線群ごとに1つしか設けられていない。そのため、2つの通信線群のうち既に一方の通信線群において予備線が使用されている場合、他方の通信線群に、上記一方の通信線群に含まれる通信線よりもエラーレートの高い通信線があっても、他方の通信線群ではその予備線を使用することができない。これにより、通信の安定性が損なわれる可能性があった。
1つの側面では、本発明は、メモリコントローラとHBMとの間の通信の安定性を高めることを目的とする。
1つの実施態様では、2つの通信線群ごとに1つの予備線が設けられた複数の通信線によりHBMに接続されており、前記2つの通信線群の各々に含まれる通信線を伝播する信号のエラーレートを計測し、前記2つの通信線群のうち第1の通信線群に属す第1の通信線を伝播する信号の第1のエラーレートが第1の閾値を超えたとき、前記第1の通信線の代りに前記予備線を用いて前記HBMと通信を行い、前記第1の通信線の代りに前記予備線が用いられているとき、前記第1のエラーレートが前記第1の閾値より高い第2の閾値よりも低く、前記2つの通信線群のうち第2の通信線群に属す第2の通信線を伝播する信号の第2のエラーレートが前記第2の閾値よりも高い場合、前記第2の通信線の代りに前記予備線を用いるとともに、前記第1の通信線を用いて前記HBMとの通信を行うように使用する前記通信線を切り替えるメモリコントローラと、前記メモリコントローラを介して、前記HBMと情報の送受信を行うプロセッサコア部と、を有するプロセッサが提供される。
また、1つの実施態様では、情報処理装置が提供される。
1つの側面では、本発明は、メモリコントローラとHBMとの間の通信の安定性を高められる。
第1の実施の形態の情報処理装置の一例を示す図である。 2つの通信線群の各々において1つの通信線を不使用とする例を示す図である。 第2の実施の形態の情報処理装置及びプロセッサの一例を示す図である。 初期状態における第1交代フラグと第2交代フラグの例を示す図である。 初期状態における切替部の状態を模式的に示す図である。 交代箇所判定部の動作の一例の流れを示すフローチャートである。 第1交代フラグの変更例を示す図である。 使用する通信線を切り替えた例を示す図である。 第2交代フラグの変更例を示す図である。 予備線が使用されている状態で第2交代フラグがオンした場合の通信線の切り替え例を示す図である。
以下、発明を実施するための形態を、図面を参照しつつ説明する。
(第1の実施の形態)
図1は、第1の実施の形態の情報処理装置の一例を示す図である。
情報処理装置10は、プロセッサ11、HBM12、プロセッサ11とHBM12とを接続する通信線群13a,13b及び予備線13cを有する。
プロセッサ11は、たとえば、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、GPU(Graphics Processing Unit)などであり、プロセッサコア部11aとメモリコントローラ11bを有する。
プロセッサコア部11aは、プロセッサコアの他、キャッシュメモリなどを有し、メモリコントローラ11bを介して、HBM12と情報の送受信を行う。
メモリコントローラ11bは、2つの通信線群ごとに1つの予備線が設けられた複数の通信線によりHBM12に接続されている。
以下では、説明を簡略化するために、複数の通信線として、2つの通信線群13a,13bと予備線13cが用いられている例を示す。通信線群13aは、通信線13a1,13a2,13a3,…,13a9,13a10を含む。通信線群13aの1つの通信線として予備線13cが使用されない場合には、通信線13a1~13a10により、データ信号DQ0,DQ1,…,DQ7と、後述するデータマスク信号DM及びデータ反転制御信号DBIが伝播される。通信線群13bは、通信線13b1,13b2,13b3,…,13b9,13b10を含み、通信線群13bの1つの通信線として予備線13cが使用されない場合には、通信線13a1~13a10により、上記と同様の信号が伝播される。
メモリコントローラ11bは、アクセスリクエスト制御部11b1、HBM制御部11b2、交代箇所判定部11b3を有する。
アクセスリクエスト制御部11b1は、プロセッサコア部11aから供給されるHBM12へのアクセス要求、ライトデータなどに基づいて、データマスク信号DM、データ信号DQ0~DQ7、データ反転制御信号DBIを出力する。また、アクセスリクエスト制御部11b1は、HBM12から読み出されたリードデータを、データ信号DQ0~DQ7として受け、プロセッサコア部11aに伝える。
また、アクセスリクエスト制御部11b1は、ライトデータの各ビットの論理レベルがH(High)よりもL(Low)の方が多い場合、ライトデータの各ビットの論理レベルを反転したデータ信号DQ0~DQ7を生成する機能を有する。HBM12では、論理レベルがHの信号を処理するよりも、論理レベルがLの信号を処理するほうが、消費電力が高くなるためである。
データマスク信号DMは、データ信号DQ0~DQ7をマスクするための信号であり、たとえば、データマスク信号DMの論理レベルがHの場合、データ信号DQ0~DQ7は、HBM12にライトされない。
データ反転制御信号DBIは、アクセスリクエスト制御部11b1がライトデータの各ビットの論理レベルを反転したか否かを示す信号である。
なお、メモリコントローラ11bとHBM12との間で送受信される情報は他にもあるが(アドレス情報など)、簡略化のため説明を省略する。
HBM制御部11b2は、切替部11b21、エラーレート計測部11b22、交代箇所設定部11b23を有する。
切替部11b21は、交代箇所設定部11b23に設定される設定情報に基づいて、使用する通信線を切り替える。
エラーレート計測部11b22は、通信線群13a,13bの各々に含まれる通信線13a1~13a10,13b1~13b10を伝播する信号のエラーを検出し、所定期間のエラー数をカウントすることで、エラーレートを計測する。通信線群13a,13bの各々に含まれる通信線13a1~13a10,13b1~13b10を伝播する信号のエラーは、たとえば、HBM12に格納されるECC(Error Check Code)を用いて検出できる。
交代箇所設定部11b23には、交代箇所判定部11b3から取得された設定情報が設定される。交代箇所設定部11b23は、たとえば、複数のレジスタによって実現される。
交代箇所判定部11b3は、エラーレートと2つの閾値TH1,TH2(TH1<TH2)との比較結果に基づいて、交代箇所(不使用とする通信線)を示す設定情報を生成する。交代箇所判定部11b3は、通信線群13a,13bのうち、たとえば、通信線群13aに属す通信線を伝播する信号のエラーレートが閾値TH1を超えたとき、その通信線を交代箇所とする。この場合、予備線13cは、通信線群13aの1つの通信線として用いられる。通信線群13aに属す通信線の代りに予備線13cが用いられているとき、その通信線のエラーレートが閾値TH2よりも低い場合で、通信線群13bに属す通信線を伝播する信号のエラーレートが閾値TH2よりも高くなったとする。このとき、交代箇所判定部11b3は、通信線群13bに属すその通信線を交代箇所とする。この場合、予備線13cは、通信線群13bの1つの通信線として用いられ、不使用とされていた通信線群13aに属す通信線は、HBM12との通信に用いられる。
なお、閾値TH1は、たとえば、通信可能な程度(安定的な通信ができない程度)のエラーレートであり、閾値TH2は、たとえば、まったく通信ができないような高いエラーレートである。閾値TH2は、通信が可能なエラーレートの上限値であってもよい。
以下、情報処理装置10による、通信線の交代動作の例を説明する。
初めは、予備線13cは用いられていないものとする。交代箇所判定部11b3は、所定期間ごとにエラーレート計測部11b22から各通信線を伝播する信号のエラーレートを受ける。
交代箇所判定部11b3は、たとえば、通信線群13aの通信線13a3を伝播する信号(図1の例ではデータ信号DQ1)のエラーレートBER1が、閾値TH1を超えた場合、通信線13a3を交代箇所とする設定情報を生成する。この設定情報は、交代箇所設定部11b23に設定される。そして、切替部11b21は、交代箇所設定部11b23に設定される設定情報に基づいて、通信線13a3を不使用とし、代わりに予備線13cを用いた通信を行うように、使用する通信線を切り替える。
また、図示を省略しているが、HBM12にも、切替部11b21と交代箇所設定部11b23に相当する要素が含まれる。交代箇所判定部11b3が生成した設定情報は、HBM12に送られ、その設定情報に基づいて、HBM12内でも上記の切替部11b21と同様の動作が行われる。
通信線13a3の代りに予備線13cが用いられているとき、エラーレートBER1が閾値TH2よりも低く、通信線群13bに属す通信線13b2を伝播する信号(図1の例ではデータ信号DQ0)のエラーレートBER2が閾値TH2よりも高くなったとする。この場合、交代箇所判定部11b3は、通信線13b2を交代箇所とする設定情報を生成する。この設定情報は、上記と同様に交代箇所設定部11b23に設定される。そして、切替部11b21は、交代箇所設定部11b23に設定される設定情報に基づいて、通信線13b2を不使用とし、代わりに予備線13cを用いた通信を行うように、使用する通信線を切り替える。
なお、このとき切替部11b21は、通信線13b2と予備線13cとを直接入れ替えるのではなく、図1に示されているように、通信線13b2の隣の通信線13b1を通信線13b2の代りにデータ信号DQ0を伝播するように切り替えてもよい。この場合、切替部11b21は、通信線13b1により伝播されていたデータ反転制御信号DBIが、予備線13cを用いて伝播されるように切り替えを行う。このような切り替えを行う切替部11b21は、設定情報に基づいて、2つの信号のうち一方を、通信線13a1~13a10,13b1~13b10、予備線13cの何れかに出力する複数の2入力セレクタを用いて実現できる。
また、切替部11b21は、不使用となっていた通信線13a3を使用して通信を行うように、使用する通信線を切り替える。HBM12でも同様の動作が行われる。
以上のような、情報処理装置10及びプロセッサ11によれば、2つの通信線群13a,13bごと1つ設けられる予備線13cが、エラーレートがより高い通信線が属す通信線群で優先的に用いられるため、より悪い通信線が救済され通信の安定性が高まる。
また、閾値TH2を、まったく通信ができないような高いエラーレートまたは通信可能なエラーレートの上限値とすることで、予備線13cが、通信不可能な通信線が属す通信線群で優先的に用いられるため、通信不可能な状態が生じることを防止できる。
(比較例)
図2は、2つの通信線群の各々において1つの通信線を不使用とする例を示す図である。
図2では、通信線群13aにおいて通信線13a2を不使用とし、通信線群13bにおいて通信線13b3を不使用とする例が示されている。この場合、通信線群13aにて伝播させるはずのデータ反転制御信号DBIと、通信線群13bにて伝播させるはずのデータ反転制御信号DBIとが、両方、予備線13cに伝播してしまうことになり、データ反転制御信号DBIは使用できなくなる。このため、HBM12の消費電力が増加してしまう可能性がある。
第1の実施の形態の情報処理装置10及びプロセッサ11によれば、予備線13cは、通信線群13a,13bのうち、エラーレートがより高い通信線が属す通信線群で優先的に用いられるため、データ反転制御信号DBIが犠牲になることがない。
(第2の実施の形態)
図3は、第2の実施の形態の情報処理装置及びプロセッサの一例を示す図である。
情報処理装置20は、プロセッサ21、HBM22を有する。
プロセッサ21は、第1の実施の形態のプロセッサ11と同様、たとえば、CPU、DSP、GPUなどであり、プロセッサコア部21aとメモリコントローラ21bを有する。
プロセッサコア部21aは、第1の実施の形態のプロセッサ11のプロセッサコア部11aと同じ機能を有する。
メモリコントローラ21bは、2つの通信線群ごとに1つの予備線が設けられた複数の通信線によりHBM22に接続されている。図3では、図1に示したような2つの通信線群と1つの予備線が、まとめて1つの矢印で図示されており、2つの通信線群と1つの予備線による通信線のグループが、8つ設けられている。1つの通信線群あたり図1に示したように8ビットのデータ(8つのデータ信号DQ0~DQ7)が伝播される場合、図3の例では、合計8×2×8=128ビットのデータが伝播される。なお、図示を省略しているが、上記のように8つの矢印で示されている複数の通信線を1チャネルとして、HBM22とメモリコントローラ21bの間には、複数チャネル(たとえば、8つの)が存在していてもよい。他のチャネルを用いて通信を行う構成についても、図3に示した構成と同様である。チャネル数が8つの場合、HBM22とメモリコントローラ21bの間で128×8=1024ビットのデータが送受信できる。
なお、2つの通信線群と1つの予備線による通信線のグループの数や、チャネル数は8つに限定されるものではない。
メモリコントローラ21bは、アクセスリクエスト制御部21ba、HBM制御部21bb、交代箇所判定部21bc1,21bc2,…,21bc8を有する。
アクセスリクエスト制御部21baは、第1の実施の形態のプロセッサ11のアクセスリクエスト制御部11b1と同じ機能を有する。
HBM制御部21bbは、上記2つの通信線群と1つの予備線による通信線のグループの数に対応して、8つの切替部30a1,30a2,…,30a8と、エラーレート計測部31と、交代箇所設定部32と、を有する。
切替部30a1~30a8の各々は、交代箇所設定部32に設定される設定情報に基づいて、使用する通信線を切り替える。
エラーレート計測部31は、各通信線群に含まれる通信線を伝播する信号のエラーを検出し、所定期間のエラー数をカウントすることで、エラーレートを計測する。エラーレート計測部31は、たとえば、ECCによりエラーを検出する。そして、エラーレート計測部31は、上記8つのグループの各々についてのエラーレートの計測結果と、エラーレートを更新させるための更新制御信号を、交代箇所判定部21bc1~21bc8のうちの対応する交代箇所判定部に供給する。
交代箇所設定部32には、交代箇所判定部21bc1~21bc8から取得された設定情報が設定される。交代箇所設定部32は、たとえば、複数のレジスタによって実現される。
なお、HBM22にも、切替部30a1~30a8と同様の切替部22a1,22a2,…,22a8と、交代箇所設定部32と同様の交代箇所設定部22bが設けられる。
交代箇所判定部21bc1は、閾値保持部33、エラーレート保持部34、交代箇所決定部35、交代フラグ保持部36、設定情報保持部37を有する。交代箇所判定部21bc2~21bc8も、交代箇所判定部21bc1と同様の要素を有している。
閾値保持部33は、第1の実施の形態の情報処理装置10の説明で述べたような2つの閾値TH1,TH2(TH1<TH2)を保持する。
エラーレート保持部34は、2つの通信線群に含まれる通信線を伝播する各信号のエラーレートを保持する。また、エラーレート保持部34は、エラーレート計測部31から供給される更新制御信号によりエラーレートの更新が指示された場合に、更新制御信号とともに供給されるエラーレートを用いて、保持していたエラーレートを更新する。
交代箇所決定部35は、エラーレート保持部34に保持されているエラーレートと閾値保持部33に保持されている閾値TH1,TH2とを比較する。そして、交代箇所決定部35は、その比較結果と、交代フラグ保持部36に保持されている2つの交代フラグに基づいて、2つの通信線群の何れかに属す通信線の代りに予備線を用いてHBM22と通信を行うか否かを決定する。また、交代箇所決定部35は、その決定結果に基づいて、交代箇所(不使用とする通信線)を示す設定情報を生成し、設定情報保持部37に保持させる。
交代フラグ保持部36は、2つの通信線群において、エラーレートと閾値TH1との比較結果に基づいて使用する通信線を切り替えたか否かを示す第1交代フラグを保持する。また、交代フラグ保持部36は、エラーレートと閾値TH2との比較結果に基づいて使用する通信線を切り替えたか否かを示す第2交代フラグを保持する。
設定情報保持部37は、交代箇所決定部35にて生成された設定情報を保持する。
以下、情報処理装置20による、通信線の交代動作の例を説明する。
初めは、予備線は用いられていないものとする。この場合、第1交代フラグ及び第2交代フラグは以下に示すような状態となっている。
図4は、初期状態における第1交代フラグと第2交代フラグの例を示す図である。
第1交代フラグ36a、第2交代フラグ36bの両方とも、両通信線群(第1通信線群及び第2通信線群)におけるフラグは“OFF”となっている。このような第1交代フラグ36a及び第2交代フラグ36bは、2ビットの値で表現できる。
また、初期状態では、切替部30a1は以下に示すような状態となっている。
図5は、初期状態における切替部の状態を模式的に示す図である。図5では、初期状態における切替部30a1の状態が模式的に示されているが、他の切替部30a2~30a8も同じ状態である。
初期状態では、通信線群38aに含まれる通信線38a1,38a2,38a3,…,38a9,38a10により、データ信号DQ0,DQ1,…,DQ7と、データマスク信号DM及びデータ反転制御信号DBIが伝播される。また、通信線群38bに含まれる通信線38b1,38b2,38b3,…,38b9,38b10により、上記と同様の信号が伝播される。予備線38cには、信号が伝播されない。
交代箇所判定部21bc1は、エラーレート計測部31より、エラーレート及びエラーレートの更新を指示する更新制御信号を受信すると、以下の動作を行う。なお、以下では交代箇所判定部21bc1は、図5に示した通信線群38a,38bに含まれる通信線38a1~38a10,38b1~38b10を伝播する信号のエラーレートを受信するものとする。
図6は、交代箇所判定部の動作の一例の流れを示すフローチャートである。
交代箇所判定部21bc1のエラーレート保持部34は、受信したエラーレートを用いて、保持していたエラーレートを更新する(ステップS1)。交代箇所決定部35は、更新したエラーレートBERが、閾値TH1よりも高くなる通信線があるか否かを判定する(ステップS2)。エラーレートBERが閾値TH1よりも高くなる通信線がない場合、交代箇所の変更は行われずに、交代箇所判定部21bc1の動作が終了する。
エラーレートBERが閾値TH1よりも大きくなる通信線がある場合、交代箇所決定部35は、その通信線のエラーレートBERが閾値TH2より高いか否かを判定する(ステップS3)。
エラーレートBERが閾値TH2を超えていない場合、交代箇所決定部35は、通信線群38a,38bについての第1交代フラグ及び第2交代フラグが両方OFFになっているか否かを判定する(ステップS4)。交代箇所決定部35は、通信線群38a,38bについての第1交代フラグ及び第2交代フラグが両方OFFになっていない場合、予備線38cが既に使用されているため、交代箇所の変更は行われずに、交代箇所判定部21bc1の動作が終了する。
通信線群38a,38bについての第1交代フラグ及び第2交代フラグが両方OFFになっている場合、交代箇所決定部35は、BER>TH1となった通信線が属す通信線群(図6では自通信線群と表記されている)の第1交代フラグをオンする。そして、交代箇所決定部35は、BER>TH1となった通信線を交代箇所として決定する(ステップS5)。ステップS5の処理では、交代箇所決定部35は、BER>TH1となった通信線を交代箇所(不使用)とする設定情報を生成し、設定情報保持部37に保持させる。設定情報は、所定のタイミングで、HBM制御部21bbの交代箇所設定部32や、HBM22の交代箇所設定部22bに設定され、切替部22a1,30a1は、交代箇所設定部22b,32に設定された設定情報に基づいて使用する通信線を切り替える。
図7は、第1交代フラグの変更例を示す図である。
図4に示した初期状態の第1交代フラグ36aでは“OFF”であった第1通信線群(たとえば、通信線群38a,38bの何れか一方)におけるフラグが、“ON”に変更されている。
図8は、使用する通信線を切り替えた例を示す図である。図8では、通信線38a2が交代箇所となった場合の、切替部30a1の状態が模式的に示されている。
通信線群38aに属す通信線38a2が不使用となり、データ信号DQ0は、隣の通信線38a3により伝播されるように、使用する通信線が切り替えられている。また、データ反転制御信号DBIが、予備線38cを用いて伝播されるように切り替えられている。
ステップS5の処理後、一度のエラーレートの受信に対する交代箇所判定部21bc1の動作が終了する。
交代箇所決定部35は、ステップS3の処理で、通信線のエラーレートBERが閾値TH2より高いと判定した場合、通信線群38a,38bについての第2交代フラグが両方OFFになっているか否かを判定する(ステップS6)。
通信線群38a,38bについての第2交代フラグが両方OFFになっている場合、交代箇所決定部35は、BER>TH2となった通信線が属す通信線群(図6では自通信線群と表記されている)の第2交代フラグをオンする。そして、交代箇所決定部35は、BER>TH2となった通信線を交代箇所として決定する(ステップS7)。ステップS7の処理では、交代箇所決定部35は、BER>TH2となった通信線を交代箇所(不使用)とする設定情報を生成し、設定情報保持部37に保持させる。設定情報は、所定のタイミングで、HBM制御部21bbの交代箇所設定部32や、HBM22の交代箇所設定部22bに設定され、切替部22a1,30a1は、交代箇所設定部22b,32に設定された設定情報に基づいて使用する通信線を切り替える。
図9は、第2交代フラグの変更例を示す図である。
図4に示した初期状態の第2交代フラグ36bでは“OFF”であった第2通信線群(たとえば、通信線群38a,38bの何れか一方)におけるフラグが、“ON”に変更されている。
なお、図9に示すように第1交代フラグ36aにおいて、第1通信線群(たとえば、通信線群38a,38bの何れか他方)におけるフラグも、“ON”になっていて、予備線38cは、第1通信線群に属す通信線の代りに使用されている状態である。しかし、第2交代フラグ36bの第2通信線群におけるフラグが“ON”になった場合、予備線38cは、第2通信線群に属す通信線の代りに使用される。
図10は、予備線が使用されている状態で第2交代フラグがオンした場合の通信線の切り替え例を示す図である。図10では、予備線38cが、通信線群38aに属す信号線の代りに使用されている状態で、第2交代フラグ36bの第2通信線群におけるフラグが“ON”になった場合の例が示されている。
図10の例では、通信線群38bに属す通信線38b2が不使用となり、データ信号DQ0は、隣の通信線38b1により伝播されるように、使用する通信線が切り替えられている。また、データ反転制御信号DBIが、予備線38cを用いて伝播されるように切り替えられている。
ステップS7の処理後、一度のエラーレートの受信に対する交代箇所判定部21bc1の動作が終了する。
ステップS6の処理にて、通信線群38a,38bの第2交代フラグが一方でもONである場合、交代箇所決定部35は、交代が不可であることを示す設定情報を生成する(ステップS8)。なお、交代箇所決定部35は、交代が不可であることを示す設定情報を、設定情報保持部37に保持させてもよいし、プロセッサコア部21aに通知してもよい。
ステップS8の処理後、一度のエラーレートの受信に対する交代箇所判定部21bc1の動作が終了する。
交代箇所判定部21bc1は、上記の動作を、エラーレート計測部31からエラーレートを受信するたびに行う。
以上のような第2の実施の形態の情報処理装置20及びプロセッサ21によれば、第1の実施の形態の情報処理装置10及びプロセッサ11と同様の効果が得られる。すなわち、2つの通信線群ごとに1つ設けられる予備線が、エラーレートがより高い通信線が属す通信線群で優先的に用いられるため、より悪い通信線が救済され通信の安定性が高まる。
また、交代箇所判定部21bc1が上記のように第1交代フラグと第2交代フラグを用いて交代箇所を決定することで、交代箇所の変更が不要な状況での設定情報の更新が避けられる。交代箇所の変更が不要な状況とは、たとえば、エラーレートが閾値TH1を超え、閾値TH2を超えない信号が再度見つかった場合や、エラーレートが閾値TH2を超える信号が再度見つかった場合などである。このような状況では、既に同様のエラーレートの信号を伝播していた通信線の代りに予備線38cが使用されているため、交代箇所の変更は不要である。
以上、実施の形態に基づき、本発明のプロセッサ及び情報処理装置の一観点について説明してきたが、これらは一例にすぎず、上記の記載に限定されるものではない。
10 情報処理装置
11 プロセッサ
11a プロセッサコア部
11b メモリコントローラ
11b1 アクセスリクエスト制御部
11b2 HBM制御部
11b21 切替部
11b22 エラーレート計測部
11b23 交代箇所設定部
11b3 交代箇所判定部
12 HBM
13a,13b 通信線群
13a1~13a10,13b1~13b10 通信線
13c 予備線
DBI データ反転制御信号
DM データマスク信号
DQ0~DQ7 データ信号

Claims (5)

  1. 2つの通信線群ごとに1つの予備線が設けられた複数の通信線によりHBMに接続されており、前記2つの通信線群の各々に含まれる通信線を伝播する信号のエラーレートを計測し、前記2つの通信線群のうち第1の通信線群に属す第1の通信線を伝播する信号の第1のエラーレートが第1の閾値を超えたとき、前記第1の通信線の代りに前記予備線を用いて前記HBMと通信を行い、前記第1の通信線の代りに前記予備線が用いられているとき、前記第1のエラーレートが前記第1の閾値より高い第2の閾値よりも低く、前記2つの通信線群のうち第2の通信線群に属す第2の通信線を伝播する信号の第2のエラーレートが前記第2の閾値よりも高い場合、前記第2の通信線の代りに前記予備線を用いるとともに、前記第1の通信線を用いて前記HBMとの通信を行うように使用する前記通信線を切り替えるメモリコントローラと、
    前記メモリコントローラを介して、前記HBMと情報の送受信を行うプロセッサコア部と、
    を有するプロセッサ。
  2. 前記メモリコントローラは、
    前記エラーレートと前記第1の閾値及び前記第2の閾値との比較結果に基づいて、不使用とする前記第1の通信線または前記第2の通信線を示す設定情報を生成する交代箇所判定部と、
    前記エラーレートを計測するとともに前記エラーレートを前記交代箇所判定部に供給し、前記設定情報を前記交代箇所判定部から取得し、前記設定情報に基づいて、前記第1の通信線または前記第2の通信線の代りに前記予備線を用いた通信を行う制御部と、
    を有する請求項1に記載のプロセッサ。
  3. 前記交代箇所判定部は、
    前記第1の通信線群及び前記第2の通信線群において、前記エラーレートと前記第1の閾値との比較結果に基づいて使用する前記通信線を切り替えたか否かを示す第1のフラグと、前記エラーレートと前記第2の閾値との比較結果に基づいて、使用する前記通信線を切り替えたか否かを示す第2のフラグとを保持する保持部と、
    前記エラーレートと前記第1の閾値または前記第2の閾値との比較結果と、前記第1のフラグと前記第2のフラグとに基づいて、前記第1の通信線の代りに前記予備線を用いて前記HBMと通信を行うか否か、または、前記第2の通信線の代りに前記予備線を用いて前記HBMと通信を行うか否か、を決定する決定部と、
    を有する請求項2に記載のプロセッサ。
  4. 前記第2の閾値は、通信可能な前記エラーレートの上限値、または、通信が不可能な前記エラーレートである、請求項1乃至3の何れか一項に記載のプロセッサ。
  5. HBMと、
    2つの通信線群ごとに1つの予備線が設けられた複数の通信線により前記HBMに接続されており、前記2つの通信線群の各々に含まれる通信線を伝播する信号のエラーレートを計測し、前記2つの通信線群のうち第1の通信線群に属す第1の通信線を伝播する信号の第1のエラーレートが第1の閾値を超えたとき、前記第1の通信線の代りに前記予備線を用いて前記HBMと通信を行い、前記第1の通信線の代りに前記予備線が用いられているとき、前記第1のエラーレートが前記第1の閾値より高い第2の閾値よりも低く、前記2つの通信線群のうち第2の通信線群に属す第2の通信線を伝播する信号の第2のエラーレートが前記第2の閾値よりも高い場合、前記第2の通信線の代りに前記予備線を用いるとともに、前記第1の通信線を用いて前記HBMとの通信を行うように使用する前記通信線を切り替えるメモリコントローラと、前記メモリコントローラを介して、前記HBMと情報の送受信を行うプロセッサコア部と、を備えたプロセッサと、
    を有する情報処理装置。
JP2018136597A 2018-07-20 2018-07-20 プロセッサ及び情報処理装置 Active JP7044974B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018136597A JP7044974B2 (ja) 2018-07-20 2018-07-20 プロセッサ及び情報処理装置
US16/439,788 US10848373B2 (en) 2018-07-20 2019-06-13 Processor and information processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018136597A JP7044974B2 (ja) 2018-07-20 2018-07-20 プロセッサ及び情報処理装置

Publications (2)

Publication Number Publication Date
JP2020013446A JP2020013446A (ja) 2020-01-23
JP7044974B2 true JP7044974B2 (ja) 2022-03-31

Family

ID=69162550

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018136597A Active JP7044974B2 (ja) 2018-07-20 2018-07-20 プロセッサ及び情報処理装置

Country Status (2)

Country Link
US (1) US10848373B2 (ja)
JP (1) JP7044974B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5440538A (en) 1993-09-23 1995-08-08 Massachusetts Institute Of Technology Communication system with redundant links and data bit time multiplexing
JP2007067887A (ja) 2005-08-31 2007-03-15 Nec Saitama Ltd 通信システム、通信装置、および回線制御方法
JP4305748B2 (ja) 2003-10-01 2009-07-29 株式会社豊田中央研究所 排ガス浄化用触媒
JP2015232500A (ja) 2014-06-10 2015-12-24 マイクロン テクノロジー, インク. 半導体装置
JP2018504832A (ja) 2014-12-30 2018-02-15 華為技術有限公司Huawei Technologies Co.,Ltd. データ伝送チャネルを管理するための方法および装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04305748A (ja) * 1991-04-02 1992-10-28 Oki Electric Ind Co Ltd 高信頼性バス
JP5131158B2 (ja) 2008-11-05 2013-01-30 横河電機株式会社 リダンダンシ演算方法及び装置並びにメモリ試験装置
JP6243145B2 (ja) 2013-06-12 2017-12-06 Necプラットフォームズ株式会社 高密度実装を実現するパターン配線における重要回線を救済する方法及び高密度実装装置
US9881697B2 (en) * 2016-03-04 2018-01-30 Sandisk Technologies Llc Dynamic-shifting redundancy mapping for non-volatile data storage
US10756954B2 (en) * 2016-05-24 2020-08-25 Nec Corporation Information processing system, relay device, auxiliary relay device, management device, method, and storage medium
US10362117B1 (en) * 2017-06-28 2019-07-23 Rockwell Collins, Inc. Systems and methods for modified network routing based on modal information
US10546628B2 (en) * 2018-01-03 2020-01-28 International Business Machines Corporation Using dual channel memory as single channel memory with spares

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5440538A (en) 1993-09-23 1995-08-08 Massachusetts Institute Of Technology Communication system with redundant links and data bit time multiplexing
JP4305748B2 (ja) 2003-10-01 2009-07-29 株式会社豊田中央研究所 排ガス浄化用触媒
JP2007067887A (ja) 2005-08-31 2007-03-15 Nec Saitama Ltd 通信システム、通信装置、および回線制御方法
JP2015232500A (ja) 2014-06-10 2015-12-24 マイクロン テクノロジー, インク. 半導体装置
JP2018504832A (ja) 2014-12-30 2018-02-15 華為技術有限公司Huawei Technologies Co.,Ltd. データ伝送チャネルを管理するための方法および装置

Also Published As

Publication number Publication date
US10848373B2 (en) 2020-11-24
JP2020013446A (ja) 2020-01-23
US20200028729A1 (en) 2020-01-23

Similar Documents

Publication Publication Date Title
JP5419107B2 (ja) マルチコア処理システム
TW201435895A (zh) 錯誤檢測與校正之設備及方法
US20140331109A1 (en) Apparatus and method for detecting errors on a transmission path
JP5947398B2 (ja) 統合データマスキング、データポイズニング及びデータバス反転シグナリング
JP2014010713A (ja) ストレージ装置および書込完了通知方法
JP4322659B2 (ja) シリアル伝送制御装置、コンピュータシステム、および、シリアル伝送制御方法
JP7044974B2 (ja) プロセッサ及び情報処理装置
JP2013254274A (ja) データ伝送装置、およびデータ伝送方法
JP2013034133A (ja) 送信装置、送受信システムおよび制御方法
US8239737B2 (en) Data line storage and transmission utilizing both error correcting code and synchronization information
JP5090934B2 (ja) インターフェース装置及びチップ間通信インターフェース装置
JP2006260139A (ja) エラー検出訂正装置の制御方法、エラー検出訂正装置、情報処理システム、エラー検出訂正装置の制御プログラム、データ処理装置
JP6861611B2 (ja) 半導体装置及びそれを備えた半導体システム
KR102023121B1 (ko) 에러를 보정하는 메모리 장치 및 그의 에러 보정 방법
KR20190132238A (ko) 메모리 시스템 및 메모리 시스템의 동작 방법
KR20160005646A (ko) 메모리 네트워크 메카니즘을 가지는 전자 시스템 및 그 동작 방법
JP2018116344A (ja) 並列処理装置およびバーストエラー再現方法
JP2014120195A (ja) 組合せ数体系を用いて符号化および復号するための方法
JP2017107390A (ja) ビデオサーバ装置およびデータ書き込み/読み出し方法
JP2012119813A (ja) エラー訂正回路及びエラー訂正方法
TWI501083B (zh) 針對快閃儲存系統以bch及ldpc引擎進行檢測與修正錯誤的方法
US11841793B2 (en) Switch-based free memory tracking in data center environments
JP4829376B2 (ja) 情報処理装置および情報処理方法
JP2008225835A (ja) メモリアクセス制御方法及び回路、並びに情報処理装置
JP6620647B2 (ja) 情報処理システム、送信装置および情報処理システムの制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210408

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20210413

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20210413

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220209

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220228

R150 Certificate of patent or registration of utility model

Ref document number: 7044974

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150