JP5302050B2 - 障害解析のためのトレース装置およびトレース方法 - Google Patents

障害解析のためのトレース装置およびトレース方法 Download PDF

Info

Publication number
JP5302050B2
JP5302050B2 JP2009051074A JP2009051074A JP5302050B2 JP 5302050 B2 JP5302050 B2 JP 5302050B2 JP 2009051074 A JP2009051074 A JP 2009051074A JP 2009051074 A JP2009051074 A JP 2009051074A JP 5302050 B2 JP5302050 B2 JP 5302050B2
Authority
JP
Japan
Prior art keywords
trace
trace data
lsi
target
layer circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009051074A
Other languages
English (en)
Other versions
JP2010205064A (ja
Inventor
由佳 細川
崇史 山本
俊和 植木
賢太 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2009051074A priority Critical patent/JP5302050B2/ja
Priority to US12/714,939 priority patent/US20100228507A1/en
Publication of JP2010205064A publication Critical patent/JP2010205064A/ja
Application granted granted Critical
Publication of JP5302050B2 publication Critical patent/JP5302050B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/28Testing of electronic circuits, e.g. by signal tracer
    • G01R31/317Testing of digital circuits
    • G01R31/31705Debugging aspects, e.g. using test circuits for debugging, using dedicated debugging test circuits

Description

本発明は、LSI(Large Scale Integrated circuit)などの半導体集積回路装置における障害解析のためのトレース装置およびそのトレース方法に関する。
LSIにおいてエラーなどの障害を検出した場合、動作時に蓄積していたメモリ内のデータを使用して障害解析をする技術が従来技術として知られている。
図7に、複数のLSIを搭載した情報処理装置の構成例を示す。情報処理装置は、複数のシステムボード(SB)及びI/O制御ユニット(IOU)などが、データクロスバ(DATA CROSSBAR)、アドレスクロスバ(ADDRESS CROSSBAR)で接続されて構成される。
システムボード(SB)は、メモリコントローラ(LDX),マイクロプロセッサ(CPU)、メモリ(DIMM)、CPU−メモリ間のコントローラ(FLN)、ファームウェアハブ(FWH)、などを含む。
また、I/O制御ユニット(IOU)は、I/Oコントローラ(FLI)、I/Oコントローラのハブ(ICH6)などを含む。
また、システムサービスプロセッサ(MMB)は、情報処理装置内の制御、監視、パーティション管理、システム初期化などを行う。
上述の情報処理装置のうち、例えばメモリコントローラ、CPU−メモリ間のコントローラ、I/Oコントローラを構成するLSIに、該LSIの障害解析を行うためのトレース機能が搭載されている。
図8に一般的なLSIのブロック図の例を示す。
LSI800は、システムコア回路801、書込制御回路803、読出制御回路804、トレースデータメモリ805を含む。そして、システムコア回路801は、該システムコア回路でのエラーを検出するコア回路エラー検出部802を備える。また、トレースデータメモリ805は、トレースデータを格納するメモリである。
システムサービスプロセッサ806は、システム全体の制御装置であり、図7のMMBに対応する。
書込制御回路803は、システムサービスプロセッサ806から出力されるトレースデータの書き込みを指示する信号(書込指示信号809)に基づいて、トレースデータメモリ805に書込制御信号811を出力し、トレースデータメモリ805へのシステムコア回路トレースデータバス807上のデータの書き込みを制御する。
読出制御回路804は、システムサービスプロセッサ806から出力されるトレースデータの読み出しを指示する信号(読出指示信号810)に基づいて、トレースデータメモリ805に読出制御信号812を出力し、トレースデータメモリ805から読出トレースデータバス808へのトレースデータの読み出しを制御する。
システムサービスプロセッサ806から書込制御回路803に対してトレースデータの書込を指示する信号(書込指示信号809)が送られて、システムコア回路801のトレースデータがトレースデータバス(システムコア回路トレースデータバス807)を介してトレースデータメモリ805に格納される。
システムコア回路801でエラーが発生するとコア回路エラー検出部802でエラーが検出され、エラー通知信号813がシステムサービスプロセッサ806に通知される。システムサービスプロセッサ806は、書込制御回路803にトレースデータメモリ805への書き込みを中止する指示信号(書込指示信号809)を送る。すると、書込制御回路803からトレースデータメモリ805にデータ書き込みを中止する書込制御信号811が送られて、トレースデータの書き込みが中止される。更に、システムサービスプロセッサ806は、読出制御回路804に読み出しを指示する信号(読出指示信号810)を送り、読出制御回路804は読出制御信号812を出力し、トレースデータメモリ805からトレースデータを読み出す。読み出されたトレースデータを使用して障害解析を行い、故障被疑箇所を検出する。
以上のようにLSIにおいてログの採取、つまりトレースが行われるが、図9に、従来のLSIにおけるトレース対象のデータについて示す。
図9に示すように、従来のLSIにおいてトレース対象は、システム(例えば情報処理装置)初期化動作時、および、システムの通常動作時において変化しない。つまり、システム初期化動作時、通常動作時ともにシステムログ採取の対象は常に同じである。よって、エラー発生時の動作回路がどの箇所であっても、トレースされる対象は固定である。
また、特許文献1では、プロセッサ(LSI)の出力データが条件を満たしていることを検出する目的として、前もってトレースのトリガとなるアドレスをROMに書き込むことによって、シーケンシャルなトリガ設定を可能にし、トレースの途中でトレース条件を変更可能にするようなトレース装置を開示している。
ところで、近年、情報処理装置の処理速度の高速化により、特にLSI(チップセット)間インタフェースが高速化されている。例えば、PCI Express(PCIバスに変わるPC向シリアル転送インタフェース)などは、5Gbpsのシリアル伝送であり、情報処理装置への電源投入後、インタフェース部のトレーニング(ネゴシエーション)を実施し、Link−upを確立するという初期化動作の後に、通常動作に移る。また、その回路は階層構造となっており、初期化動作のときと通常動作のときでは、動作する階層が異なる。
このようなことから、PCI Express等の伝送回路においては、初期化動作時の障害は物理層が中心になり、通常動作時の障害はリンク層が中心になる可能性が高い。よって、初期化動作時に障害が発生した場合には物理層回路のトレースを行い、通常動作時に障害が発生した場合にはリンク層回路のトレースを行う、というように、後の障害解析において、より有効なトレースデータを採取しておくことが望まれる。
特開平1−201740号公報
しかしながら、上述したように、従来のLSIにおけるトレースでは、トレース対象が固定である。そのため、障害解析に必要な物理層・リンク層の両階層のトレースデータを採取しようとすると、ハードウェアの増大、ハードウェア増大に伴うコストの増大、トレースデータ量の増大、トレースデータを解析し被疑部品を特定するための処理時間の増大、などが問題となる。
また上述した、ROMなどに予め書き込まれたアドレスをシーケンシャルトリガとして利用するトレース装置では、トレース対象となる回路のイベント発生が予測できれば適当なトレース対象に切り替えることが可能であるが、予測できないようなイベント(エラーなど)が発生した場合には対応できない。また、ハードウェア増大を防ぐ手段としても有効とは言えない。
そこで、本発明の課題は、LSIの障害解析に必要なデータを的確にトレース可能なトレース装置およびトレース方法を提供し、障害解析処理の効率化を図ることにある。
上記の課題を解決するために、LSIにおいて障害解析のためのトレースを行うトレース装置を、該LSIを含むシステム等の動作状態およびエラーなどの障害発生箇所及び障害発生タイミングに応じてトレース対象を切り替えてトレースを行うように構成する。
前記トレース対象は伝送回路における物理層回路およびリンク層回路を含む。この構成において、システム等の初期動作時または物理層回路に障害が発生した場合には物理層回路をトレース対象とし、システム等の通常動作時またはリンク層回路に障害が発生した場合にはリンク層回路をトレース対象とする。これにより、障害解析に必要なデータを的確にトレース可能である。
開示のトレース装置では、システムの動作状態および障害(エラー)発生のタイミングおよび障害の発生箇所に応じて、トレース対象を切り替えてトレースを行う。これにより、障害解析に必要なデータを的確にトレース可能であり、トレースデータの増大を抑えることができる、という効を奏する。これにより、トレースデータを格納しておくための記憶領域用のハードウェアの節約、それに伴うコストの削減、更にはトレースデータを用いて障害解析処理を行う時間を短縮することができ、障害解析効率を上げることができる。
本発明の実施例1に係る情報処理装置のブロック図を示す図である。 本発明の実施例1に係るLSIのブロック図を示す図である。 本発明の実施例1に係るトレース対象を説明する図である。 本発明の実施例1に係るトレース対象切替に関わる部分の構成を示す図である。 本発明の実施例1に係るトレースデータメモリのメモリフォーマットを示す図である。 本発明の実施例1に係るトレース処理のフローチャートを示す図である。 情報処理装置の構成例を示す図である。 従来のLSIのブロック図の例を示す図である。 従来のLSIにおけるトレース対象を説明する図である。
以下、本発明の実施の形態について添付の図面を参照して詳細に説明する。
以下の実施例は本発明が実施可能である一例であり、また、当業者が本発明を実施するのに十分な程度に詳細に開示される。そして、他の実施の形態においても本発明は利用可能であり、かつ、本発明の趣旨から逸脱することのない範囲において、構造的、論理的等の変形が可能であることは理解されるべきことである。
図1に、実施例1に係る情報処理装置のブロック図を示す。
実施例1の情報処理装置においてシステムボード101をクロスバ(Cross Bar)102によって接続する。伝送回路は、物理層回路103、リンク層回路104を含んで構成される。リンク層回路104内に、トレースデータを採取するトレース回路(図2に示す)を含む。尚、図1は概念的に図7に対応するものである。図1はクロスバ102を中心に描いたものである。システムボード内に含まれる複数のLSI内の伝送路の物理層回路、リンク層回路をクロスバ102上に描いているため一見すると対応が難しく思えるが、図1と図7が対応することは理解されるところである。
図2に、実施例1に係るLSIのブロック図を示す。
LSI200は、物理層回路203、リンク層回路205、トレース回路207、を含む。物理層回路203およびリンク層回路205は、それぞれの回路の障害を検出する回路である、物理層回路エラー検出部204およびリンク層回路エラー検出部206を備える。
トレース回路207は、トレースデータを選択するときのトレースモードを格納するトレースモードレジスタ211、トレース対象である物理層回路203およびリンク層回路205からのデータバスを選択するトレースデータ選択回路208、トレース対象の切替信号としてのトレース選択信号217をトレースデータ選択回路208に送るトレース対象決定部212、トレースデータを格納するトレースデータメモリ209、トレースデータメモリ209への読み出し及び書き込みを制御するリード/ライト制御回路210を含む。
システムサービスプロセッサ106は、情報処理装置などのシステム全体の制御装置であり、図1のシステムサービスプロセッサ106である。
図2のLSI200の動作を説明すると次のようになる。尚、LSI200を含む、例えば情報処理装置などに代表されるシステムの状態は、システム電源投入後、システム初期化動作を行い、システム初期化完了後、システム通常動作に遷移するものとする。
システム電源投入後、システム初期化動作中にトレースデータの採取設定(図3にそのタイミングを示す)が行われるが、その際にシステムサービスプロセッサ106からモード切替指示信号219がトレースモードレジスタ211に送られる。これにより、トレースモードレジスタ211にトレースモードを設定する値が格納される。トレースモードの種類については後述するが、ここではシステム初期化動作中は物理層回路203をトレースし、初期化動作完了後はリンク層回路205をトレースする、というモード0が設定されているとする。
モード0の場合、システム初期化動作中は、物理層回路203を対象としたトレースバス、すなわち、物理層トレースデータバス213がトレースデータ選択回路208により選択され、トレースデータはトレースデータバス215を介してトレースデータメモリ209に格納される。
システム初期化が完了すると、物理層回路203からトレース対象決定部212に向けて初期化完了通知信号221が通知される。トレース対象決定部212で決定されたトレース対象に関する情報を含む信号が、トレース選択信号217として、トレースデータ選択回路208に向けて送信される。トレースデータ選択回路208では、該信号に基づいて、トレース対象を物理層回路203からリンク層回路205に切り替える。すなわち、リンク層トレースデータバス214がトレースデータ選択回路208により選択され、トレースデータはトレースデータバス215を介してトレースデータメモリ209に格納される。
システム通常動作時に、物理層回路エラー検出部204にてエラーが検出されると、物理層エラー通知信号222がトレース対象決定部212に通知される。トレース対象決定部212で決定されたトレース対象に関する情報を含む信号が、トレース選択信号217としてトレースデータ選択回路208に向けて送信される。トレースデータ選択回路208では、該信号に基づいて、トレース対象をリンク層回路205から物理層回路203に切り替える。システム通常動作時に、リンク層回路エラー検出部206にてエラーが検出されると、リンク層エラー通知信号223がトレース対象決定部212に通知されるが、すでに通常動作時は基本的にはリンク層トレースデータバス214が選択されているため、引き続きリンク層回路205のトレースを行う。
また、システムサービスプロセッサ106は、エラー発生を通知されると、リード/ライト制御回路210にトレースデータの書き込み停止を指示し、トレースデータメモリ209からトレースデータの読み出し(読み出しトレースデータバス216)を行う。この読出しトレースデータを使用して障害解析を行い、エラー被疑箇所を特定する。
以上説明したように、エラー発生時は、エラーを検出したタイミングでエラー発生箇所のトレースを行うように、トレースデータ選択回路208にてトレース対象を切り替える。トレースデータバス215上のデータがトレースデータメモリ209まで到達するには時間がかかるため、エラー発生直後にトレース対象を切り替えることで、必要なトレースデータの採取が可能となる。
尚、トレースデータメモリ209へトレースデータを格納する際、トレース対象を示す情報を加えて、リード/ライト制御回路210からの制御によりデータの書込が行われるものとするが、トレースデータメモリ209のデータフォーマットについては後述することとする。
次に、図3に示した、初期化動作時から通常動作時へのトレース対象の切替を説明する図を参照して説明する。
まず、電源投入(Power On)後、各種設定が行われる。この際、トレースデータ採取設定が行われる。すなわち、システムサービスプロセッサ106からモード切替指示信号219として、例えばモード0を示す信号がトレースモードレジスタ211に送られる。
その後、初期化動作時には物理層回路203をトレース対象とし、初期化動作が完了するとリンク層回路205をトレース対象とする。ちなみに、初期化動作が完了した通常動作時のトレース対象はリンク層回路205のみではなく、全トレースデータの10%程度は物理層回路もトレースの対象としている。これは予めハードウェア的に組み込まれて構成されるものである。
また、図3のトレースデータ採取設定の際に設定されるトレースモードであるが、実施例1ではモード0からモード5までの6つのモードが用意されている。以下、各モードについて説明する。
モード0:システム初期化動作中は物理層回路203をトレース対象とし、初期化動作完了後は、リンク層回路205をトレース対象とする。
モード1:リンク層回路205のうち入力インタフェース部分をトレース対象とする
モード2:リンク層回路205のうち出力インタフェース部分をトレース対象とする
モード3:リンク層回路205のうち入力/出力パケットをトレース対象とする
モード4:物理層およびリンク層回路205の制御信号、SMBUS信号(システムサービスプロセッサからの制御信号)をトレース対象とする
モード5:物理層回路203をトレース対象とする
以上6つのモードがあるが、情報処理装置などのシステムに電源投入後、図3に示したトレースデータ採取設定のタイミングで、システムサービスプロセッサ106からのモード切替指示信号219によりいずれのモードでトレースが行われるかが設定される。
通常では、システムサービスプロセッサ106は、モード0を設定して初期化動作を開始する。よって、上述したように、モード0の場合、初期化動作時には物理層回路203をトレース対象とし、初期化が完了するとリンク層回路205をトレース対象に切り替える。
モード1、2、3および5については、エラーの再現試験時など、予めトレース対象を限定(疑わしい箇所から集中してトレースデータを採取するなど)してトレースデータを採取したい場合に用いられるモードである。システムサービスプロセッサ106を介して、または外部の設定手段からトレースモードレジスタ211の設定値を変更してから情報処理装置などのシステムを立ち上げて利用する。例えばモード1、2が指定された場合には、リンク層回路205内のLSI200への入力/出力インタフェース部分をトレース対象に限定し、モード3が指定された場合には、リンク層回路205でやりとりされる通信パケットをトレースの対象に限定し、モード5が指定された場合には物理層回路203をトレース対象に限定する。
また、モード4については、システムサービスプロセッサ106などからの制御信号、SMBUS信号をトレース対象とするため、システムの初期化に失敗した場合など、初期化動作時のレジスタの設定値を確認する場合などに用いられる。システム初期化に失敗した場合に、それを再現させるために、トレースモードレジスタ211の設定値を変更してからシステムを立ち上げて利用する。
トレースモードレジスタ211を含むトレース回路207は、複数のLSIを含む情報処理装置において、それぞれのLSIに備えられているため、システムサービスプロセッサ106は、モード設定によりLSIのイベントタイミングがずれていても、監視、管理が可能である。
次に図4を参照して、トレース回路207のトレース対象を切り替える機能を担う部分について再度説明をする。
トレース対象決定部212には、トレースモード指示信号224、初期化完了通知信号221、物理層およびリンク層からのエラー通知信号222、223が入力される。トレースモード指示信号224は、システムサービスプロセッサ106からトレースモードレジスタ211に設定された値に基づいてトレース対象決定部212に入力される信号である。トレース対象決定部212は、これらの信号に基づいて、物理層回路203とリンク層回路205のいずれのトレースデータを採取するかを決定し、トレース対象の切替信号としてのトレース選択信号217を生成し、トレースデータ選択回路208のセレクタに向けて出力する。トレースデータ選択回路208では、トレース選択信号217により、物理層トレースデータバスおよびリンク層トレースデータバスを選択し、トレースデータバス215として、トレースデータメモリ209に出力する。
トレースデータメモリ209のメモリフォーマットを図5に示す。
Validフラグは、トレースデータが有効か否かを示す。
物理層データフラグは、トレースデータ領域に格納されたデータが物理層のトレースデータであることを示す。
リンク層データフラグは、トレースデータ領域に格納されたデータがリンク層のトレースデータであることを示す。
Validフラグ、物理層データフラグ、リンク層データフラグの各データは、トレースデータ選択回路208が物理層トレースデータバス213またはリンク層トレースデータバス214のいずれかから選択して、トレースデータバス215に出力する際にトレースデータに付加してトレースデータメモリ209へ送られるものである。
トレースデータ領域は、トレースデータが格納される領域である。
図5に示すように、物理層データフラグまたはリンク層データフラグによりどこのログを採取したか、ということが記録されているため、障害解析処理の際に、どの箇所で障害が発生しているかを特定するのに有効である。
以上、実施例1について説明したが、最後に実施例1の処理のフローを図6に示す。ただし、動作モードはモード0に設定されているとする。
まず、ステップS1で、情報処理装置などのシステムに電源が投入される。
次に、ステップS2で、システムの初期化動作が始まる。初期化動作時には、物理層回路203からトレースデータを採取する。
次に、ステップS3で、初期化が完了したかどうか判断される。初期化が完了していない場合(NO)は、S2に戻り物理層回路203のトレースを続ける。初期化が完了すると(YES)、ステップS4に進む。
ステップS4では、システムは通常動作となる。通常動作時は、リンク層回路205からトレースデータを採取する。
ステップS5で、伝送回路にエラー(障害)が発生していないかどうか判断される。エラーが発生していない場合(NO)には、S4に戻り、リンク層回路205のトレースを続ける。エラーが発生した場合(YES)には、ステップS6に進む。
ステップS6では、エラー発生箇所に合わせてトレース対象を変更する。すなわち、物理層回路203でエラーが発生したことが検出された場合には、トレース対象を物理層回路203に切り替え、リンク層でエラーが発生したことが検出された場合には、トレース対象をリンク層回路205に切り替える。
ステップS6の後、システムサービスプロセッサ106がトレースを行うのを停止させる。すなわち、システムサービスプロセッサ106からの読出/書込指示信号220に基づいて書込を停止し、読み出しを開始する信号をリード/ライト制御回路210に送信する。そして、リード/ライト制御回路210は読出/書込制御信号218を用いて、トレースデータメモ209への書き込みを停止させ、データの読み出しを開始させる。
以上、実施例1について詳細に説明した。
実施例1によれば、システム初期化動作時には、物理層回路をトレース対象とし、システム通常動作時にはリンク層回路をトレース対象として、トレースデータの採取を動的に遷移させる。更に、エラーが発生した場合には、システムの状態とそのエラーが発生した箇所に応じてトレースの対象を適時切り替える。
このように、システムの動作状態やエラー発生箇所に対応してトレース対象を切り替えることで、トレースデータ量の増大を抑えることができる。トレースデータ量の増大を抑えることができることにより、トレースデータを記憶しておくトレースデータメモリの容量を節約することが可能、すなわちハードウェア量の増大を抑えることができ、ひいては、ハードウェア量の増大に伴うコストの増大を抑えることが可能である。また、トレースデータ量の増大を抑えることができるため障害解析処理時間も削減することができ、更に、採取したトレースデータをトレースデータメモリに記憶する際に、どの箇所(トレース対象)から採取したトレースデータであるかをトレースデータとともに記録するため、これによっても障害解析処理の効率を上げることが可能である。
以上実施例1を詳細に説明したが、本発明は実施例1に記載したことに限定されないことはいうまでもない。実施例1では、トレース対象を物理層回路およびリンク層回路としたが、トレース対象は複数以上であってもかまわない。また、工場出荷時の試験ではLSI間の伝送路エラーが特定できず問題となっている。このようなLSI間の伝送路エラーを確定するために、伝送路間インタフェースなどをトレース対象として、本発明を実施することも可能であると考える。また、実施例1ではトレース対象が存在する同一LSI上に存在しているが、本発明は特にこれに限定されず、LSIを含むシステム内のいずれの箇所に存在しても構わない。このように、本発明の趣旨を逸脱しない範囲において様々な変更が可能である。
以上の実施例1を含む実施形態に関し、更に以下の付記を開示する。
(付記1)
LSIにおいて障害解析のためのトレースを行うトレース装置であって、
トレースデータを格納しておくトレースデータ格納部と、
前記LSIを含むシステムの動作状態及び、前記LSI内に存在する二つ以上のトレース対象内でエラーが発生した場合に該トレース対象から通知される障害発生通知に基づいて、いずれのトレース対象のトレースデータを前記トレースデータ格納部に格納するかを決定するトレース対象決定部と、
前記トレース対象決定部の決定に基づいて、前記トレースデータ格納部に格納するトレースデータを前記二つ以上のトレース対象からのトレースデータから選択し、前記トレースデータ格納部に格納するトレース対象選択部と、
を備えることを特徴とするトレース装置。
(付記2)
前記トレース対象は伝送回路における物理層回路およびリンク層回路を含み、
前記障害発生通知は、前記物理層回路およびリンク層回路がそれぞれ備えるエラー検出部から前記トレース対象決定部に直接通知されることを特徴とする付記1記載のトレース装置。
(付記3)
前記動作状態は、前記LSIを含むシステムの初期化動作を行う初期動作時、および前記LSIを含むシステムの初期化動作完了後の動作を行う通常動作時を含むことを特徴とする付記2記載のトレース装置。
(付記4)
前記トレース対象決定部は、前記初期動作時または前記物理層回路のエラー検出部により障害発生通知が通知された場合には、前記物理層回路をトレース対象に決定し、前記通常動作時または前記リンク層回路のエラー検出部により障害発生通知が通知された場合には、前記リンク層をトレース対象に決定し、該決定に基づいて前記トレース対象選択部にトレース対象を選択するための信号を生成し、送信することを特徴とする付記3記載のトレース装置。
(付記5)
前記トレース対象選択部は、前記トレース対象決定部から送信される信号に基づいて、前記二つ以上あるトレース対象から出力されるデータバスを選択する選択回路であることを特徴とする付記4記載のトレース装置。
(付記6)
前記トレースデータ格納部にトレースデータを格納する際に、いずれのトレース対象のトレースデータであるかを示すフラグを該トレースデータに付加して前記トレースデータ格納部に格納することを特徴とする付記1記載のトレース装置。
(付記7)
エラーが発生した場合に、前記トレースデータ格納部にトレースデータを格納するのを停止し、格納されていたトレースデータを読み出すことを特徴とする付記1記載のトレース装置。
(付記8)
障害解析のためのトレースを行うLSIであって、
トレースデータを格納しておくトレースデータ格納部と、
二つ以上のトレース対象と、
前記トレース対象に各々備えられ、該トレース対象内で障害が発生したことを検出する障害検出部と、
前記LSIを含むシステムの動作状態及び、前記障害検出部から直接通知される障害発生通知に基づいて、いずれのトレース対象のトレースデータを前記トレースデータ格納部に格納するかを決定するトレース対象決定部と、
前記トレース対象決定部の決定に基づいて、前記トレースデータ格納部に格納するトレースデータを前記二つ以上のトレース対象からのトレースデータから選択し、前記トレースデータ格納部に格納するトレース対象選択部と、
を備えることを特徴とするLSI。
(付記9)
前記トレース対象は、伝送回路における物理層回路およびリンク層回路を含み、
前記障害検出部は、物理層回路エラー検出部およびリンク層回路エラー検出部であることを特徴とする付記8記載のLSI。
(付記10)
前記動作状態は、前記LSIを含むシステムの初期化動作を行う初期動作時、および前記LSIを含むシステムの初期化動作完了後の動作を行う通常動作時を含むことを特徴とする付記9記載のLSI。
(付記11)
前記トレース対象決定部は、前記初期動作時または前記物理層回路エラー検出部により障害発生通知が通知された場合には、前記物理層回路をトレース対象に決定し、前記通常動作時または前記リンク層回路エラー検出部により障害発生通知が通知された場合には、前記リンク層をトレース対象に決定し、該決定に基づいて前記トレース対象選択部にトレース対象を選択するための信号を生成し、送信することを特徴とする付記10記載のLSI。
(付記12)
前記トレース対象選択部は、前記トレース対象決定部から送信される信号に基づいて、前記二つ以上あるトレース対象から出力されるデータバスを選択する選択回路であることを特徴とする付記11記載のLSI。
(付記13)
前記トレースデータ格納部にトレースデータを格納する際に、いずれのトレース対象のトレースデータであるかを示すフラグを該トレースデータに付加して前記トレースデータ格納部に格納することを特徴とする付記8記載のLSI。
(付記14)
エラーが発生した場合に、前記トレースデータ格納部にトレースデータを格納するのを停止し、格納されていたトレースデータを読み出すことを特徴とする付記8記載のLSI。
(付記15)
障害解析のためのトレースが行われるべきLSIを少なくとも一つ含む情報処理装置であって、
前記LSIは、
トレースデータを格納しておくトレースデータ格納部と、
二つ以上のトレース対象と、
前記トレース対象に各々備えられ、該トレース対象内で障害が発生したことを検出する障害検出部と、
前記情報処理装置の動作状態及び、前記障害検出部から直接通知される障害発生通知に基づいて、いずれのトレース対象のトレースデータを前記トレースデータ格納部に格納するかを決定するトレース対象決定部と、
前記トレース対象決定部の決定に基づいて、前記トレースデータ格納部に格納するトレースデータを前記二つ以上のトレース対象からのトレースデータから選択し、前記トレースデータ格納部に格納するトレース対象選択部と
を備える、
ことを特徴とする情報処理装置。
(付記16)
前記トレース対象は、伝送回路における物理層回路およびリンク層回路を含み、
前記障害検出部は、物理層回路エラー検出部およびリンク層回路エラー検出部であることを特徴とする付記15記載の情報処理装置。
(付記17)
前記動作状態は、前記LSIを含むシステムの初期化動作を行う初期動作時、および前記LSIを含むシステムの初期化動作完了後の動作を行う通常動作時を含むことを特徴とする付記16記載の情報処理装置。
(付記18)
前記トレース対象決定部は、前記初期動作時または前記物理層回路エラー検出部により障害発生通知が通知された場合には、前記物理層回路をトレース対象に決定し、前記通常動作時または前記リンク層回路エラー検出部により障害発生通知が通知された場合には、前記リンク層をトレース対象に決定し、該決定に基づいて前記トレース対象選択部にトレース対象を選択するための信号を生成し、送信することを特徴とする付記17記載の情報処理装置。
(付記19)
前記トレース対象選択部は、前記トレース対象決定部から送信される信号に基づいて、前記二つ以上あるトレース対象から出力されるデータバスを選択する選択回路であることを特徴とする付記18記載の情報処理装置。
(付記20)
前記トレースデータ格納部にトレースデータを格納する際に、いずれのトレース対象のトレースデータであるかを示すフラグを該トレースデータに付加して前記トレースデータ格納部に格納することを特徴とする付記15記載の情報処理装置。
(付記21)
エラーが発生した場合に、前記トレースデータ格納部にトレースデータを格納するのを停止し、格納されていたトレースデータを読み出すことを特徴とする付記15記載の情報処理装置。
(付記22)
LSIにおける障害解析のためのトレース方法であって、
二つ以上のトレース対象内において、各々、障害が発生した場合に障害発生を検出し、 前記LSIを含むシステムの動作状態および該障害発生検出に基づいて、いずれのトレース対象のトレースデータをトレースデータメモリに格納するかを決定する第一のステップと、
前記決定に基づいて、前記トレースデータメモリに格納するトレースデータを前記二つ以上のトレース対象からのトレースデータから選択し、前記トレースデータメモリに格納する第二のステップと、
を含むことを特徴とするトレース方法。
(付記23)
前記トレース対象は伝送回路における物理層回路およびリンク層回路を含むことを特徴とする付記22記載のトレース方法。
(付記24)
前記動作状態は、前記LSIを含むシステムの初期化動作を行う初期動作時、および前記LSIを含むシステムの初期化動作完了後の動作を行う通常動作時を含むことを特徴とする付記23記載のトレース方法。
(付記25)
前記第一のステップにおいて、前記初期動作時または前記物理階層回路に障害が検出された場合には前記物理層回路をトレース対象に決定し、前記通常動作時または前記リンク層回路に障害が検出された場合には前記リンク層回路をトレース対象に決定する、ことを特徴とする付記24記載のトレース方法。
101 システムボード
102 クロスバ
103 物理層回路
104 リンク層回路
105 ルーティング回路
106 システムサービスプロセッサ
200 LSI
201 物理層
202 リンク層
203 物理層回路
204 物理層回路エラー検出部
205 リンク層回路
206 リンク層回路エラー検出部
207 トレース回路
208 トレースデータ選択回路
209 トレースデータメモリ
210 リード/ライト制御回路
211 トレースモードレジスタ
212 トレース対象決定部
213 物理層トレースデータバス
214 リンク層トレースデータバス
215 トレースデータバス
216 読出しトレースデータバス
217 トレース選択信号
218 読出/書込制御信号
219 モード切替指示信号
220 読出/書込指示信号
221 初期化完了通知信号
222 物理層エラー通知信号
223 リンク層エラー通知信号
224 トレースモード指示信号
800 LSI
801 システムコア回路
802 コア回路エラー検出部
803 書込制御回路
804 読出制御回路
805 トレースデータメモリ
806 システムサービスプロセッサ
807 システムコア回路トレースデータバス
808 読出トレースデータバス
809 書込指示信号
810 読出指示信号
811 書込制御信号
812 読出制御信号
813 エラー通知信号

Claims (8)

  1. LSIにおいて障害解析のためのトレースを行うトレース装置であって、
    トレース対象を特定する設定情報を保持するレジスタと、
    トレースデータを格納しておくトレースデータ格納部と、
    前記設定情報に従って、前記LSIを含むシステムの動作状態及び、前記LSI内に存在する二つ以上のトレース対象内でエラーが発生した場合に該トレース対象から通知される障害発生通知に基づいて、いずれのトレース対象のトレースデータを前記トレースデータ格納部に格納するかを決定するトレース対象決定部と、
    前記トレース対象決定部の決定に基づいて、前記トレースデータ格納部に格納するトレースデータを前記二つ以上のトレース対象からのトレースデータから選択し、前記トレースデータ格納部に格納するトレース対象選択部と、
    を備え、
    前記トレース対象は伝送回路における物理層回路およびリンク層回路を含み、
    前記障害発生通知は、前記物理層回路およびリンク層回路がそれぞれ備えるエラー検出部から前記トレース対象決定部に直接通知され、
    前記動作状態は、前記LSIを含むシステムの初期化動作を行う初期動作時、および前記LSIを含むシステムの初期化動作完了後の動作を行う通常動作時を含み、
    前記LSIの初期動作時に、前記レジスタに対して、LSIの制御を行う制御装置から前記設定情報が設定される、
    ことを特徴とするトレース装置。
  2. 前記トレース対象決定部は、前記初期動作時または前記物理層回路のエラー検出部により障害発生通知が通知された場合には、前記物理層回路をトレース対象に決定し、前記通常動作時または前記リンク層回路のエラー検出部により障害発生通知が通知された場合には、前記リンク層をトレース対象に決定し、該決定に基づいて前記トレース対象選択部にトレース対象を選択するための信号を生成し、送信することを特徴とする請求項1記載のトレース装置。
  3. 前記トレース対象選択部は、前記トレース対象決定部から送信される信号に基づいて、前記二つ以上あるトレース対象から出力されるデータバスを選択する選択回路であることを特徴とする請求項2記載のトレース装置。
  4. 前記トレースデータ格納部にトレースデータを格納する際に、いずれのトレース対象のトレースデータであるかを示すフラグを該トレースデータに付加して前記トレースデータ格納部に格納することを特徴とする請求項1記載のトレース装置。
  5. エラーが発生した場合に、前記トレースデータ格納部にトレースデータを格納するのを停止し、格納されていたトレースデータを読み出すことを特徴とする請求項1記載のトレース装置。
  6. 障害解析のためのトレースを行うLSIであって、
    トレース対象を特定する設定情報を保持するレジスタと、
    トレースデータを格納しておくトレースデータ格納部と、
    二つ以上のトレース対象と、
    前記トレース対象に各々備えられ、該トレース対象内で障害が発生したことを検出する障害検出部と、
    前記設定情報に従って、前記LSIを含むシステムの動作状態及び、前記障害検出部から直接通知される障害発生通知に基づいて、いずれのトレース対象のトレースデータを前記トレースデータ格納部に格納するかを決定するトレース対象決定部と、
    前記トレース対象決定部の決定に基づいて、前記トレースデータ格納部に格納するトレースデータを前記二つ以上のトレース対象からのトレースデータから選択し、前記トレースデータ格納部に格納するトレース対象選択部と、
    を備え、
    前記トレース対象は伝送回路における物理層回路およびリンク層回路を含み、
    前記障害発生通知は、前記物理層回路およびリンク層回路がそれぞれ備えるエラー検出部から前記トレース対象決定部に直接通知され、
    前記動作状態は、前記LSIを含むシステムの初期化動作を行う初期動作時、および前記LSIを含むシステムの初期化動作完了後の動作を行う通常動作時を含み、
    前記LSIの初期動作時に、前記レジスタに対して、LSIの制御を行う制御装置から前記設定情報が設定される、
    ことを特徴とするLSI。
  7. 障害解析のためのトレースを行うLSIを少なくとも一つ含む情報処理装置であって、
    前記LSIは、
    トレース対象を特定する設定情報を保持するレジスタと、
    トレースデータを格納しておくトレースデータ格納部と、
    二つ以上のトレース対象と、
    前記トレース対象に各々備えられ、該トレース対象内で障害が発生したことを検出する障害検出部と、
    前記設定情報に従って、前記情報処理装置の動作状態及び、前記障害検出部から直接通知される障害発生通知に基づいて、いずれのトレース対象のトレースデータを前記トレースデータ格納部に格納するかを決定するトレース対象決定部と、
    前記トレース対象決定部の決定に基づいて、前記トレースデータ格納部に格納するトレースデータを前記二つ以上のトレース対象からのトレースデータから選択し、前記トレースデータ格納部に格納するトレース対象選択部と
    を備え、
    前記トレース対象は伝送回路における物理層回路およびリンク層回路を含み、
    前記障害発生通知は、前記物理層回路およびリンク層回路がそれぞれ備えるエラー検出部から前記トレース対象決定部に直接通知され、
    前記動作状態は、前記LSIを含むシステムの初期化動作を行う初期動作時、および前記LSIを含むシステムの初期化動作完了後の動作を行う通常動作時を含み、
    前記LSIの初期動作時に、前記レジスタに対して、LSIの制御を行う制御装置から前記設定情報が設定される、
    ことを特徴とする情報処理装置。
  8. トレース対象を特定する設定情報を保持するレジスタを備えたLSIにおける障害解析のためのトレース方法であって、
    二つ以上のトレース対象内において、各々、障害が発生した場合に障害発生を検出し、
    トレース対象決定部が、前記設定情報に従って、前記LSIを含むシステムの動作状態および該障害発生検出に基づいて、いずれのトレース対象のトレースデータをトレースデータメモリに格納するかを決定する第一のステップと、
    前記決定に基づいて、前記トレースデータメモリに格納するトレースデータを前記二つ以上のトレース対象からのトレースデータから選択し、前記トレースデータメモリに格納する第二のステップと、
    を含み、
    前記トレース対象は伝送回路における物理層回路およびリンク層回路を含み、
    前記障害発生検出は、前記物理層回路およびリンク層回路がそれぞれ備えるエラー検出部からトレース対象決定部に直接通知され、
    前記動作状態は、前記LSIを含むシステムの初期化動作を行う初期動作時、および前記LSIを含むシステムの初期化動作完了後の動作を行う通常動作時を含み、
    前記LSIの初期動作時に、前記レジスタに対して、LSIの制御を行う制御装置から前記設定情報が設定される、
    ことを特徴とするトレース方法。
JP2009051074A 2009-03-04 2009-03-04 障害解析のためのトレース装置およびトレース方法 Expired - Fee Related JP5302050B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009051074A JP5302050B2 (ja) 2009-03-04 2009-03-04 障害解析のためのトレース装置およびトレース方法
US12/714,939 US20100228507A1 (en) 2009-03-04 2010-03-01 Trace device and trace method for failure analysis

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009051074A JP5302050B2 (ja) 2009-03-04 2009-03-04 障害解析のためのトレース装置およびトレース方法

Publications (2)

Publication Number Publication Date
JP2010205064A JP2010205064A (ja) 2010-09-16
JP5302050B2 true JP5302050B2 (ja) 2013-10-02

Family

ID=42678994

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009051074A Expired - Fee Related JP5302050B2 (ja) 2009-03-04 2009-03-04 障害解析のためのトレース装置およびトレース方法

Country Status (2)

Country Link
US (1) US20100228507A1 (ja)
JP (1) JP5302050B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012160997A (ja) * 2011-02-02 2012-08-23 Ricoh Co Ltd 集積回路、画像形成装置、内部信号提供方法、内部信号提供プログラム及び記録媒体
US20130007534A1 (en) 2011-06-29 2013-01-03 International Business Machines Corporation Trace capture of successfully completed transactions for trace debugging of failed transactions
JP6106994B2 (ja) * 2012-08-31 2017-04-05 富士通株式会社 情報処理装置、データ転送装置、情報処理システム、および方法
JP6049564B2 (ja) * 2013-07-29 2016-12-21 三菱電機株式会社 データトレース回路、集積回路およびデータトレース方法
JP6309919B2 (ja) 2015-06-23 2018-04-11 ファナック株式会社 データ取得機能を有する数値制御装置
JP6055036B2 (ja) * 2015-07-03 2016-12-27 株式会社ユニバーサルエンターテインメント 遊技機
JP2021072074A (ja) * 2019-11-03 2021-05-06 ルネサスエレクトロニクス株式会社 半導体装置および半導体装置の制御方法
CN113032220B (zh) * 2021-03-29 2022-06-07 中国南方电网有限责任公司 一种基于会话染色实现全链路性能安全追踪的方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4715034A (en) * 1985-03-04 1987-12-22 John Fluke Mfg. Co., Inc. Method of and system for fast functional testing of random access memories
JPS62151950A (ja) * 1985-12-25 1987-07-06 Nec Corp 動作履歴記憶方式
JPS62224842A (ja) * 1986-03-26 1987-10-02 Nec Corp 動作履歴記憶方式
JP2678283B2 (ja) * 1988-03-15 1997-11-17 株式会社日立製作所 データ通信制御装置
JPH02288631A (ja) * 1989-04-28 1990-11-28 Nec Corp ネットワークのトレース情報蓄積装置
JPH05173846A (ja) * 1991-12-25 1993-07-13 Nec Ibaraki Ltd 障害解析情報トレース方法
JP2868141B2 (ja) * 1992-03-16 1999-03-10 株式会社日立製作所 ディスクアレイ装置
JPH07319779A (ja) * 1994-05-25 1995-12-08 Fujitsu Ltd 情報処理装置
JPH0863374A (ja) * 1994-08-22 1996-03-08 Toshiba Corp トレース機能内蔵型lsi
US6105156A (en) * 1996-01-23 2000-08-15 Nec Corporation LSI tester for use in LSI fault analysis
JP2004101203A (ja) * 2002-09-04 2004-04-02 Oki Electric Ind Co Ltd ロジックlsiの不良解析システム及び不良解析方法
JP2005190202A (ja) * 2003-12-25 2005-07-14 Toshiba Corp シリアルataインタフェースを持つ電子機器及びシリアルataバスのパワーセーブ方法
US7636814B1 (en) * 2005-04-28 2009-12-22 Symantec Operating Corporation System and method for asynchronous reads of old data blocks updated through a write-back cache
US8381077B2 (en) * 2009-09-08 2013-02-19 Lsi Corporation Systems and methods for implementing error correction in relation to a flash memory

Also Published As

Publication number Publication date
US20100228507A1 (en) 2010-09-09
JP2010205064A (ja) 2010-09-16

Similar Documents

Publication Publication Date Title
JP5302050B2 (ja) 障害解析のためのトレース装置およびトレース方法
US20070070885A1 (en) Methods and structure for detecting SAS link errors with minimal impact on SAS initiator and link bandwidth
US9141463B2 (en) Error location specification method, error location specification apparatus and computer-readable recording medium in which error location specification program is recorded
CN105183575A (zh) 处理器故障的诊断方法、装置及系统
JP5391994B2 (ja) ストレージシステム,制御装置および診断方法
CN101126994B (zh) 数据处理装置及其模式管理装置以及模式管理方法
CN101127580B (zh) 节点装置、控制装置和控制方法
US7925728B2 (en) Facilitating detection of hardware service actions
JP2010134751A (ja) マルチパーティション・コンピュータシステム、障害処理方法及びそのプログラム
JP2008176477A (ja) 計算機システム
JP2010245589A (ja) 通信システム、通信装置、被疑箇所の特定方法及びプログラム
JP3838992B2 (ja) 障害検出方法及び情報処理システム
JP5440673B1 (ja) プログラマブルロジックデバイス、情報処理装置、被疑箇所指摘方法およびプログラム
CN113992501A (zh) 一种故障定位系统、方法及计算装置
JP3638773B2 (ja) ディスクアレイ装置
JP3374910B2 (ja) マルチプロセッサシステム
JP2013196410A (ja) サーバ装置及び障害管理方法及び障害管理プログラム
JP4209866B2 (ja) 監視装置、監視方法および情報処理装置
JP4779948B2 (ja) サーバシステム
JP3576978B2 (ja) メモリポート、記憶装置、情報処理システム
JPH1027115A (ja) コンピュータシステムの障害情報採取回路
JP2003337758A (ja) 二重化メモリシステム
CN115686896A (zh) 扩展内存错误处理方法、系统、电子设备及存储介质
JPH086909A (ja) 並列計算機システム
CN115756975A (zh) 一种pcie链路连接方法、系统、设备以及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130129

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130330

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130416

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130509

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20130516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130520

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20130516

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130618

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130620

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees