JP4038372B2 - 順序外データのトレーシング - Google Patents
順序外データのトレーシング Download PDFInfo
- Publication number
- JP4038372B2 JP4038372B2 JP2001384402A JP2001384402A JP4038372B2 JP 4038372 B2 JP4038372 B2 JP 4038372B2 JP 2001384402 A JP2001384402 A JP 2001384402A JP 2001384402 A JP2001384402 A JP 2001384402A JP 4038372 B2 JP4038372 B2 JP 4038372B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- trace
- value
- instruction
- tracing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000012545 processing Methods 0.000 claims description 58
- 239000000872 buffer Substances 0.000 claims description 30
- 238000000034 method Methods 0.000 claims description 22
- 230000003111 delayed effect Effects 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 6
- 238000012546 transfer Methods 0.000 description 45
- 230000007246 mechanism Effects 0.000 description 16
- 230000006870 function Effects 0.000 description 12
- 230000001960 triggered effect Effects 0.000 description 10
- 238000007906 compression Methods 0.000 description 9
- 230000006835 compression Effects 0.000 description 9
- 230000001360 synchronised effect Effects 0.000 description 9
- 210000003813 thumb Anatomy 0.000 description 9
- 230000006837 decompression Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000013144 data compression Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000033772 system development Effects 0.000 description 2
- 229920006345 thermoplastic polyamide Polymers 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 206010000210 abortion Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001343 mnemonic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 238000004454 trace mineral analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3824—Operand accessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/362—Software debugging
- G06F11/3636—Software debugging by tracing the execution of the program
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3802—Instruction prefetching
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Debugging And Monitoring (AREA)
- Advance Control (AREA)
Description
【発明の属する技術分野】
本発明は、データ処理システムに関し、より詳細には、本発明はデータアクセスをトレースできるようにするためのトレーシング機構を提供するデータ処理システムに関する。
【0002】
【従来の技術】
新システムのための開発時間を短縮したいという要望がある一方で、データ処理システムの複雑性が増すにつれ、データ処理システムの開発中に使用できるデバッグおよびトレーシングツールおよび機構を改善したいという要望が生じている。システム内のステップごとのアクティビティを示すデータを含むトレースストリームを発生するように、データ処理システムのアクティビティをトレースすることは、システム開発において極めて有効なツールとなっている。しかしながら、コアをより深く埋め込むという一般的な動向と共に、外部からアクセス可能なピンを通してコアのステートをトラッキングすることはより困難となっている。従って、トレースデータを捕捉し、分析するためのオフチップトレーシング機構と同じように、チップには多量のトレーシング機能が組み込まれている。かかるオフチップトレーシング機構の例として英国ケンブリッジのARMリミティッド社により、この会社のARM7およびARM9プロセッサに関連して提供されている埋め込み型トレースマクロセルがある。
【0003】
データ処理オペレーションのトレーシングに関連する別の問題は、速度および並列性を追求する際にデータ処理システムの複雑性が高まったことにより、オペレーションをシーケンス化する方法も複雑となったことである。初期のデータ処理システムでは、プロセッサは順に各プログラム命令を実行し、プログラム命令が完了するまで待機し、プログラム命令の完了後、次のプログラム命令の実行を開始していた。しかしながら、プログラム命令の処理スループットを高めるために、次の命令を開始する前に、常に命令を完了していなくてもよいように、またはパイプライン状に、異なる命令をパラレルに実行できるようにする種々の技術が採用されている。このタイプのより複雑な動作の例としては、ロードミスに対するデータ処理システムの応答が挙げられる。
【0004】
メモリロケーションからデータ値(このデータ値は処理用データまたは命令ワードでよい)をデータ処理システムがロードしたい場合、ロードミスが起こり得る。そのデータ値がローカルキャッシュメモリ内に存在している場合、ロード命令を高速で、可能な場合には1つのクロックサイクル内で完了できる。しかしながら、キャッシュからデータ値のロードを満たすことができず、例えばメインメモリへのより低速の非キャッシュアクセスが必要となるようなロードミスが生じた場合、多数の処理サイクルの間でもデータ値がリターンされないことが起こり得る。後の命令がまだ検索されていないデータ値を必要とすることなく、すなわちまだ検索されていないデータ値に依存しないことを条件に、先のロードミスからのデータを待機しながら、他のプログラム命令の実行を続けることができるARM1020Tプロセッサのようなシステムを提供することが、ホールトデータ処理以外にも知られている。
【0005】
【発明が解決しようとする課題】
データアクセスミス後にオペレーションの続行をサポートするかかるシステムでは、実行中の命令ストリームがメモリバス上で発見されるようなメモリアクセスからリターンされるデータ値に容易に相関化しないという点で、重要なトレーシングを行う上で問題が生じる。
【0006】
【課題を解決するための手段】
本発明の1つの特徴によれば、
(i)処理命令の制御によりデータ値を処理するようになっている処理回路と、
(ii)メモリ内に記憶されたデータ値にアクセスするためのデータアクセス命令に応答自在であり、処理すべきデータ値を記憶するようになっているメモリと、
(iii)前記処理回路によって実行される処理命令および前記処理回路がアクセスするデータ値を識別するトレースデータストリームを発生するようになっているトレーシング回路とを備え、
(iv)前記データアクセス命令に対応するデータ値が、データミスが生じることなく前記データアクセスが行われた時、そのサイクルの次の処理サイクル時にアクセスされるようなデータミスがデータアクセス命令の結果生じることがあり、
(v)前記トレーシング回路は、前記データミスに応答して、前記データミスが生じなかった場合、前記トレースデータのストリーム内の前記データ値を識別するデータが位置づけられるであろう位置に、データプレースホルダーを発生し、前記データ値に対する前記アクセスが行われた時、前記データ値を識別する後のデータ値をトレースデータの前記ストリーム内の後のポイントに挿入する、データを処理するための装置が提供される。
【0007】
本発明はデータアクセスミスおよび後にリターンされるデータ値による上記問題を認識し、ミスが生じなかった場合にデータ値をリターンしたはずのポイントを識別するデータプレイスホルダーをトレースデータのストリーム内に挿入し、次にミスから生じた後のデータ値をその後挿入する解決案を提供するものである。データプレイスホルダーと後のデータ値の組み合わせによってデータストリームのその後の分析を可能にし、どのデータ値がどのアクセス命令に対応しているかを正しく識別し、よってデータ処理システムの動作を正しく理解することが可能となる。データ値は命令ワードだけでなく、操作のためのデータでもよく、データ値なる用語は双方の可能性を含むものであることが理解できよう。
【0008】
本発明は種々の異なる環境内で使用できるが、システム内のアクセスミスが比較的一般的な場所で生じるように、キャッシュメモリとメモリシステムが設けられているシステムに特に適し、アクセスミスに関するシステムの正しい動作を理解することが、かかるシステムを正しくデバッギングする上で重要である。
【0009】
データプレイスホルダーと後のデータとの間の相関化は種々の異なる方法で行うことができる。1つの好ましい実施例は、タグ値と各データプレイスホルダーとを関連付け、次に対応するタグ値と後の各データ値とを関連付けることである(この機構はそれぞれのプレイスホルダーに異なる順序で後のデータアイテムをリターンさせることをうまく処理することもできる)。従って、トレースデータのストリームの分析時に、後のどのデータ値がどのデータプレイスホルダーに対応しているかを判断するように、それぞれのタグ値を一致させることができる。別の好ましい実施例はトレースされたデータのストリーム内に各データプレイスホルダーを挿入する際に、トレースされたデータのストリームを後に分析する時に、トレースデータの完全なストリームを必要とすることなく、適当な後のデータ値を適当なデータプレイスホルダーに一致させることができるように、そのときにどれだけ多くのペンディング中の後のデータ値が未解決となっているかの表示もなされる。別の好ましい実施例は、トレースされたデータのストリームがその時にどれだけ多くの未解決の後のデータ値を待っているかを示す周期的同期化データを含む例である。従って、途中でトレースされたデータのストリームをピックアップする際に、1つの同期化データ部分を一旦読み出せば、次のデータプレイスホルダーとデータ値を一致させることができる。
【0010】
データ処理システムのトレーシングオペレーションのコンテキストにおいて、トレーシングウォッチポイントを設けることは公知である。トレーシングオペレーション、例えば単一命令のトレーシング、所定の組の基準が満たされるかどうかに基づくトレースストリームのターンオン、トレースストリームまたはその他のトレーシング動作のターンオフの制御をトリガーするのに、かかるトレーシングウォッチポイントを使用できる。かかるウォッチポイントの基準の一例は、アクセスデータ値が特定の条件に一致しているかどうかということである。一例として、所定量よりも大きいデータ値に対してアクセスがなされる時は常に、トレーシングデータのストリームをスイッチオンするようにトレーシングウォッチポイントを設定できる。これに関連し、アクセスミスは重要な複雑な問題を生じさせることが理解できよう。アクセスミスが生じると、そのアクセスミスに対応するデータ値がトリガー条件に一致するのか一致しないのかは、後の時間まで判らない。この問題は完全に解決することはできないが、本発明の好ましい実施例は後のデータ値がリターンされた時にトリガーが一致するとの仮定でアクセスが生じた時に、トリガー条件がトリガーされることを選択するか、または後のデータ値が実際にリターンされ、一致していると判るまでトリガー条件をトリガーしないことを選択するかのいずれかの能力を提供するものである。これらオプション案の双方を設けることによって、ユーザーが望むように、このような状況に対し、システムの動作を構成できる能力がトレースシステムユーザーに与えられる。2つの動作が必要な場合の状況の例として次の例がある。
【0011】
(a)ウォッチポイントに基づきトレースストリームをターンオンし、オンの状態のままにする。トレースストリームを早期にターンオンしないことが重要であるが、元のアクセスを生じさせた命令をトレースすることは遅すぎることとなる。
(b)ウォッチポイントの基準が満たされた場合にしかトレースストリームをターンオンせず、次に再びターンオフとする。データストリーム内に記憶されるデータ量を少なくするために、データ値の比較を実行するが、ロードミスが生じた場合、データが利用できるようになり、よって一致していると見なされる前にロードミスをトレースするかどうかの判断を行わなければならない。
【0012】
上記2つの状況はデータが将来の事象をトレースすべきかどうかを判断するか、または当該データがそのデータ自身であるかどうかのいずれかである。
【0013】
本発明の別の特徴によれば、
(i)処理命令の制御によりデータ値を処理する工程と、
(ii)処理すべきデータ値を記憶する工程とを備え、データアクセス命令が記憶されたデータ値にアクセスするようになっており、
(iii)実行される処理命令およびアクセスされるデータ値を識別するトレースデータのストリームを発生する工程とを備え、
(iv)前記データアクセス命令に対応するデータ値が、データミスが生じることなく前記データアクセスが行われた時、そのサイクルの次の処理サイクル時にアクセスされるようなデータミスがデータアクセス命令の結果生じることがあり、
(v)前記トレーシング回路は、前記データミスに応答して、前記データミスが生じなかった場合、前記トレースデータのストリーム内の前記データ値を識別するデータが位置づけられるであろう位置に、データプレースホルダーを発生し、前記データ値に対する前記アクセスが行われた時、前記データ値を識別する後のデータ値をトレースデータの前記ストリーム内の後のポイントに挿入する、データを処理する方法が提供される。
【0014】
上記トレースデータを発生するための装置、例えばマイクロプロセッサを載せた集積回路および方法を提供するだけでなく、本発明の相補的特徴は、かかる装置およびかかる方法によって発生されるトレースデータのストリームを分析できるシステムを提供することである。かかるコンピュータプログラムは標準的な汎用コンピュータで実行でき、コンピュータプログラム製品として、例えばフロッピー(登録商標)ディスクまたはCD記録媒体として提供できる。
【0015】
添付図面を参照し、次の実施例の詳細な説明を読めば、本発明の上記以外の目的、特徴および利点が明らかとなろう。
【0016】
【発明の実施の形態】
図1は、オンチップトレーシング機構を提供するデータ処理システム2を略図で示す。集積回路4は、マイクロプロセッサコア6と、キャッシュメモ8と、オンチップトレースモジュールコントローラ10と、オンチップトレースバッファ12とを含む。キャッシュメモリ8内でキャッシュミスが生じた際にアクセスされる外部メモリ14には集積回路4が接続されている。オンチップトレースモジュールコントローラ10およびオンチップトレースバッファ12には汎用コンピュータ16が結合されており、この汎用コンピュータ16上で実行されるソフトウェアを使って、これら要素からのトレーシングデータのストリームを回復し、分析するように働く。
【0017】
オペレーション中に外部メモリ14にある実際の空間よりも多いデータ処理命令およびデータにプロセッサコア6がアクセスしなければならないようなケースが多い。例えば外部メモリ14のサイズが1MBであり、一方、プロセッサコア6が一般に32ビットのアドレスを指定でき、よって4GBの命令およびデータを指定できることがある。従って、プロセッサコア6が必要とする命令およびデータのすべては外部記憶装置18、例えばハードディスクに記憶され、次にプロセッサコア6が特定のオペレーションステートで作動すべき場合に、そのオペレーションステートのための対応する命令およびデータを外部メモリ14内にロードする。
【0018】
図2は図1のシステム内で生じ得るデータアクセス命令への応答時の種々の動作を示す。この場合におけるプロセッサコア6はARMオブジェクトコード命令を実行するARMプロセッサである。図2における第1コードシーケンスは別のレジスタRmに与えられるアドレスによって指定されるメモリロケーションから指定レジスタ内にデータをロードするロード命令18を示す。この場合、データアクセス命令の結果、キャッシュメモリ8内でヒットが生じ、レジスタRmによって指定されたアドレスから対応するデータ値が同じサイクルでプロセッサコア6へリターンされる。
【0019】
第2の例では、同じ命令シーケンスが発生されるが、この場合、命令20の結果、キャッシュメモリ8内でミスが生じる。集積回路4はこのような動作にうまく対応し、その後の命令がミスの生じたデータを必要としないことを条件に、ミスを発生したロード命令20の後の命令を実行し続けるようになっている。可変時間後に、アクセスミスに対応するデータはシステムのデータバスにリターンされる。この後のデータは正しいレジスタにルーチングされ、レジスタのインターロッキングはクリアされる。後のデータがリターンされるまでの遅延時間は特定の状況に応じて変わり得ることが理解できよう。集積回路4は更に記憶容量を増すために、より大きく、低速のメインARMメモリの前に、比較的高速のオフチップキャッシュメモリを含むようなマルチレベルの外部メモリシステムに結合できる。集積回路自体がこのような後の可変遅れデータにうまく対応できるようにするための機構は当技術分野で知られており、本発明の技術は少なくとも好ましい実施例において、データのトレーシングがこのような後にリターンされるデータおよび可変遅れデータにうまく対応できるようにする機構を提供せんとするものである。
【0020】
図2における第3コードシーケンスは2つのロード命令22、24を有し、これら双方の命令の結果、データミスが生じ、これら命令はリターンされる対応する後のデータを有する。この例では、データバスにリターンされた後のデータは、このデータミスを発生させたデータアクセス命令22、24のシーケンスの順序からはずれている。従って、第1のミスされたデータアクセス22は第2の後のデータアイテム26に対応し、一方第2のミスされたデータアクセス24は第1の後のデータアイテム28に対応する。
【0021】
図3は、データミスを発生するデータアクセス命令に応答するオンチップトレースモジュールコントローラ10の動作を示す。このオンチップトレースモジュール10はそのトレースデータを高速でオンチップトレースバッファ12内に書き込む。これによってプロセッサコア6による命令のフルスピードの実行に対してリアルタイムでペースを合わせながら、トレーシングを発生させることができる。後の時間に汎コンピュータ16がトレースバッファ12の内容を読み出し、トレースデータを分析することができる。
【0022】
図3に示されるように、第1ロード命令30の結果、キャッシュ命令8内でデータミスが生じる。従って、このミスを発生した命令トレースストリーム内の命令30に対する対応するポイントにあるデータトレースストリーム内にデータプレイスホルダー32が挿入される。このデータプレイスホルダー32は、そのデータプレイスホルダーを識別する関連するタグ値(Tag1)を有する。その後の時間に、別のデータアクセス命令34の結果、同じ処理サイクル内でリターンされ、命令34に直接一致するポイントにおいてデータトレースストリーム内に入れられたデータ値36とのヒットが生じる。次の命令38の結果、別のデータミスが生じ、異なる識別タグ値(Tag2)を有する別のデータプレイスホルダー40が挿入される。
【0023】
可変時間の後に、データバス上に2つの後のデータ値42、44がリターンされ、データトレースストリーム内に挿入される。これら後のデータ値の各々はデータトレースストリーム内で先行する対応するデータプレイスホルダーに一致できるようにする関連したタグ値を有する。この特定の例では、後のデータ値はデータミスを発生したデータミスの順序と異なる順序でリターンされる。従って、リターンされた第1の後のデータ値42はTag2のタグ値を有し、データプレイスホルダー40および命令38に対応する。第2の後のデータ値44はTag1のタグ値を有し、データプレイスホルダー32および命令30に対応する。
【0024】
データプレイスホルダーおよび後のデータ値の分析は汎用コンピュータ16を使用して集積回路4の外部で行われることが理解できよう。この汎用コンピュータ16はプログラム制御に従って対応するタグ値を有するデータプレイスホルダーのためにデータトレースストリームをサーチし、命令とリターンされる対応するデータとの間の適性な対応性を引き出すことができるように、これらデータプレイスホルダーを、一致するタグを有する、後に識別された後のデータ値に置換する。フルトレース分析では、タグの一致を使ってこれら後のデータ値を一致する命令に正しく関連付けするようなトレーシング環境内で、リターンの遅延効果も正しく理解できるよう、データ値がリターンされた位置に後のデータ値を残すことができる。
【0025】
命令トレースストリームおよびデータトレースストリームの動作について定義したので、標準技術および標準集積回路設計ツールに従い、このような機能を提供するオンチップトレースモジュールコントローラ内の制御ロジックを誘導できる。
【0026】
図4は別の実施例を示す。この実施例では、データプレイスホルダーはタグ値を含まず、代わりに後のデータ値自身をデータトレースストリーム内に挿入する際に未解決となっているペンディング中の後のデータ値の個数を示す。従って、命令46から生じるデータミスの結果、データプレイスホルダー48はペンディング中の後のデータ値の個数ゼロを示す。データプレイスホルダー48に対応する後のデータ値がリターンされる前に、ミスを発生させるような次の命令50が生じ、従って、データプレイスホルダー52は既に未解決のペンディング中の後のデータ値があることを表示する。次に、ミスを発生させるような別の命令56が実行される前に、命令46に対応する後のデータ値54がリターンされる。命令56を実行する際に、未解決の後のデータ値の数はまだ1つであるので、データプレイスホルダー58はこれを表示するようにマークされる。
【0027】
図4に示されたデータトレースストリームフォーマットは、このデータストリームを分析することにより可変位置からピックアップされ、トレースストリームのスタートより前のポイントに対しリターンされた後のデータ値による混同を防止することが可能となるが、(図5の実施例で行っているように)ミスは順序通りにリターンされなければならない。
【0028】
図5は、別の例のトレースストリームフォーマットを示す。この例では、トレースされたデータのストリーム内に同期化データ60を周期的に挿入する。この同期化データはこの時間ポイントにおいて未解決の後のデータアイテムの数を示す。従って、同期化データアイテム60はミスしたデータアクセス命令62に対応する1つのペンディング中の後のデータアイテムを示す。本例におけるデータプレイスホルダーはこれらが対応する命令を指定する別の情報を含まない。
【0029】
同期化データアイテム60の次のロード命令64の結果によってもミスが生じ、データストリーム内に対応するデータプレイスホルダー66が挿入される。リターンされた第1の後のデータアイテム68が、ミスを発生しよって正しく分析できないトレースされていない先の命令62に対応していることを、同期化データ要素60が示すので、リターンされた第1の後のデータアイテム68は無視される。次の後のデータアイテム70がリターンされると、このデータアイテムはロード命令64に対応していると判断される。
【0030】
図6は、トレーシング制御オペレーションをトリガーするのに使用できる回路要素72を示す。この回路要素72は適当なトレースウォッチポイントをトリガーするために、現在のバスの値とアドレスデータ値とを比較するよう、所定の値、可能な場合には関連するマスクをロードできる複数の比較器を含む。
【0031】
後にリターンされたデータのコンテキスト内にて、データウォッチポイントは完全一致ウォッチポイントまたは不完全一致ウォッチポイントのいずれかとなるように構成される。後のデータがリターンされ、指定されている基準に一致していることが判るまで、完全一致ウォッチポイントがトリガーされることはない。逆に、不完全一致ウォッチポイントは、後のデータがリターンされた時に、一致を引き起こすと仮定して、そのデータ値に対するデータミスが発生した時にトリガーされる。これら2つの動作のいずれかに対するウォッチポイントのコンフィギュレーションは、トレースシステムのユーザーによって所望するように制御できる。リターンされる後のデータ値とこれら値が関連する対応するアドレスとの間のリンクをするように、ウォッチポイント比較システム内には後のデータ値に対応するタグ値も保持される。
【0032】
図7および8は、図7のシステムから生じ得る異なるタイプの動作を示す。命令74の結果、データミスが生じ、データ76は後の時間にデータバス上に後にリターンされる。
【0033】
図8は命令74内で指定されたアドレスに対応するアドレスにウォッチポイントが設定され、従って、指示されたすべての可能性に対してアドレスの一致が生じると仮定している。第1の2つの可能性において、ウォッチポイントは完全一致ウォッチポイントに設定されている。従って、最初の2つの例では、データ76がリターンされ、一致していることが判るまで、トレーシング事象はトリガーしない。図8の第1の行は、データが一致し、トレーシング起動ポイントが図7内のポイントP1となることを示している。図8の第3および第4の行では、ウォッチポイントは不完全ウォッチポイントとして設定されている。従って、これらケースの双方においてデータの一致がその後生じるか否かに関係なく、ポイントP2でアドレスの一致が発生する際に、トレースの制御がトリガーされる。第4の行ではその後、データの一致が生じていなくてもトレースポイントがトリガーされていることが理解できよう。
【0034】
種々の方法、例えば条件に応じて完全一致信号を構成自在とし(この方法が好ましい)、比較を行うべき、用途に応じたハードウェア内で完全一致信号を選択し、比較ハードウェアが同時に双方の動作を提供できるようにし、トレーシング回路の異なる部分内で異なる動作を適当に使用することによって完全一致信号を制御し、使用することができる。
【0035】
図9は、マイクロプロセッサの集積回路104と外部メモリの集積回路106とを含むデータ処理システム102を示す。マイクロプロセッサの集積回路104はその多くの異なる回路要素(そのすべてが図示されているわけではない)のうちにレジスタバンク108と、キャッシュメモリ110と、乗算器112と、シフター114と、加算器116と、命令デコーダ118と、トレースコントローラ120と、トレースデータバッファ122とを含む。
【0036】
オペレーション時に、命令デコーダ118はプログラム命令ワードを受信し、制御信号を発生する。この制御信号はマイクロプロセッサの集積回路104内の他の要素によって使用され、これら要素のオペレーションを制御するようになっている。特定の命令は乗算器112、シフター114および加算器116のうちの1つ以上を使用し、レジスタバンク108のレジスタ内に保持されている値に対して代数論理演算の実行に関与し得る。命令デコーダが応答できる別のタイプのデータ処理命令は、マルチワードデータ転送命令である。かかるタイプの命令の一例としては、マイクロプロセッサ、例えばARM7およびARM9によって提供されるLSM命令が挙げられる。これら例のマルチワードデータ転送命令のオペレーションの詳細については、上記マイクロプロセッサのデータシートに記載されている。
【0037】
マイクロプロセッサの集積回路104のチップ上にはトレースコントローラ120およびトレースデータバッファ122が設けられている。このトレースコントローラ120は多くの異なるタイプのオペレーションを提供し、これらタイプのオペレーション内にはトレーストリガー条件が検出された時のトレーシングオペレーションの開始が含まれる。トレースコントローラは特定のアドレス値およびデータ値を検出するよう、システム内のアドレスバスおよびデータバスを「スヌープ」できるか、またはレジスタバンク108内の特定のアドレスへのアクセスを検出するよう、レジスタバンク108を制御する信号に応答できる。これらケースのいずれにおいても、トレースコントローラ120は所定の条件が検出された時にトレーシングオペレーションを開始し、トレースデータストリームをトレースデータバッファ122内に記憶させるように働くことができる。その後、トレースデータのこのストリームはトレースデータバッファから外部トレースデータバッファ分析システムへダウンロードでき、この分析システム内で、システムをデバッグしたり、またはその分離をより完全に理解することを望む者が検査し、解読できる。
【0038】
図10はマルチワードデータ転送命令、すなわち上記LSM命令を示す。この命令のオペレーションを制御するフィールド内にはレジスタバンク108内のレジスタRnに対するポインターがあり、このポインターは命令のマルチワード転送をするためのスタートポイントを示すメモリアドレス記憶データ値を制御する。この命令は、レジスタバンク108内の16個のレジスタの各々に1ビットが対応する16ビットフィールドも含む。特定のビット位置における「1」の値は、そのレジスタに対してデータ転送が行われるべきであることを示し、従って、単一のLSM命令によって1〜16までの任意の数のデータ転送を指定できる。図示されている例では、レジスタリストはレジスタRn内に保持されている値で開始するメモリアドレスと、レジスタR0、R1、R3、R7およびR11内に保持されている値でスタートするメモリアドレスとの間で5つのデータワードを転送すべきであることを指定する。この転送は、最小数のレジスタでスタートし、転送ごとに4ビットメモリをインクリメントしながら進む。
【0039】
図10に示されるように、データ処理システム102の高性能の実施例は、メモリシステム(キャッシュメモリ110または外部メモリ106のいずれか)からそれらのそれぞれのレジスタへパラレルに2つのデータ値を転送するように働くことができる。これによってLSM命令をより短時間で完了し、全体の処理をスピードアップすることが可能となる。かかる実施例では、LSM命令の実行の途中にインターラプトまたは例外が生じた場合でも、データ転送を逐次行うようなプログラマーのモデルが破られることがないように注意を払わなければならない。
【0040】
図11は、図10の例を発展したものであり、この図10を使ってマルチワードデータ転送命令LSMの所定のトレース開始条件のトリガーを部分的に示している。特に、レジスタR3とメモリロケーションAdd+8との間のデータワードDW3の第3のデータ転送はトリガーを生じさせている。このトリガーは「#」と表示されているアクセス中の特定のレジスタから、「*」と表示されている転送中のデータ値から、または「!」と表示されているアクセス中のメモリロケーションから行うことができる。これら多数の条件を同時に満たし、その結果、マルチサイクルのマルチワードデータ転送命令内のそのポイントでトレーストリガーを行うこともできる。
【0041】
トレースコントローラ120はトレーストリガー条件を検出し、トレースをトリガーした転送からスタートし、トレースデータバッファ122にトレースデータのトレースデータストリームを書き込むことによってトレーシングオペレーションを開始する。特に、トレースデータストリームにはマルチワードデータ転送自体が書き込まれ、その後、トレーストリガーを生じさせたデータ値およびアドレス値が書き込まれる。マルチワードデータ転送命令(この命令は書き込みまたは読み出しでよい)の終了までの残りのデータ転送の結果、トレースデータストリームにトレースデータが追加される。トレースデータストリームのバンド幅を保留するために、より詳細な情報を含むのではなく、LSM命令の終了までのこれら転送の各々に対し、プレースフォルダーデータコードを挿入できる。このプレースフォルダーコードはトリガーを開始したレジスタまでカウントバックし、よって当該レジスタを識別するように、後の分析システムによって使用できる。トレースコントローラ120はトリガー転送自体および同じ命令内のその後の転送しかトレースせず、その後の命令の後のトレースは行わないようにするか、または前方のポイントからリターンされたままになっているトレーシングをターンオンするように構成できる。当業者にはこれらのいずれも、また、他の可能な案も明らかであろう。
【0042】
図12はトレースコントローラ120によって実行できる制御オペレーションを略図で示す。ステップ124においてトレースコントローラ120はこのコントローラがトレーシングをスタートするようにトリガーされたかどうかを判断するために連続的にチェックを行う。ステップ126において、マルチワードデータ転送命令LSMの実行中にトレースがトリガーされたかどうかのチェックを行う。トレーストリガーがマルチワードデータ転送命令の結果でない場合、処理は他のルーチン128に進む。このルーチンについては本技術の解説ではこれ以上説明しない。
【0043】
LSM命令によってトレースがトリガーされたと仮定された場合、ステップ130を実行する。このステップではトリガーオペレーションのためのトレースデータストリーム内に命令、データワードおよびメモリアドレスを書き込む。その後の各オペレーションがステップ132で検出されると、このオペレーションが同じLSM命令の一部であるかどうかのチェックをステップ134で行う。同じLSM命令が続いている場合、処理はステップ136に進み、このステップでトレースデータストリーム内にプレイスホルダーコードを挿入し、別のデータ転送を表示し、ステップ132にリターンする。マルチワードデータ転送命令が終了したことをステップ134の判断が示している場合、その命令のトレーシングは終了する。一部の実施例では、トレーシングはオン状態のままとし、その後の命令をトレーシングされたデータストリーム内にトレースするか、または特定のトリガー命令だけをトレースすると設定されていた場合には、トレーシングは終了してもよい。
【0044】
図13は上記実施例に従って発生したトレースデータストリームに応答自在なトレースデータ分析システム内で実行し得る処理を略図で示している。ステップ138において、トレースデータストリーム(またはトレースデータストリームのうちの少なくとも命令部分)内でLSMマルチワードデータ転送命令に遭遇する。ステップ140において、分析システムはトレースデータストリーム内でデータ転送のうちの最終データ転送および総カウントが確立するまで、そのLSM命令に対し、トレースデータストリーム内にマークされた転送の終了までカウントを行う。
【0045】
次のアーキテクチャの説明に本発明の少なくとも好ましい実施例のトレーシング技術の更なる説明が記載されており、次のアーキテクチャの説明は英国ケンブリッジのARMリミティッド社から公に入手できる、埋め込み型トレースマクロセル(Revl)と関連して読むべきである。
【0046】
以上で、添付図面を参照し、本発明の図示した実施例について詳細に説明したが、本発明は本書に説明した実施例のみに限定すべきでなく、当業者であれば特許請求の範囲記載の発明の要旨から逸脱することなく、種々の変形および変更を行うことができよう。
【0047】
1.1
本書では、次の用語および略語を使用する。
【0048】
範囲
本書はETM10の機能を特定するためのものであり、ETM10は命令およびデータのトレーシングを行うことができるリアルタイムトレースモジュールである。機能はARM7およびARM9の以前のETM実現例の機能に類似している。読者は埋め込み型トレースマクロセルの仕様(ARM IHI 0014D)に概略が記載された元のETM仕様に精通しているものと見なす。本仕様はETM10と以前のETMバージョンとの間の共通するアーキテクチャ上の特徴を記述し直すものではなく、むしろETM10に対して変わったETM仕様の部分について記述するものである。これら変更のほとんどはARM1020Eを正しくトレーシングできる新しいETMプロトコルの作成に関連したものであり、このプロトコルは将来のARMコアも同じようにトレーシングするように拡張可能となっている。
【0049】
前書き
埋め込み型トレースマクロセルは、ETM、トレースポートアナライザおよびソフトデバッガー(例えばADW)を含むARMのリアルタイムデバッグ解決案の不可欠な部分である。
埋め込み型トレースマクロセルは2つの部分、すなわちトレースブロックとトリガーブロックとから成る。トレースブロックは圧縮されたトレースを作成し、狭いトレースポートを通過するようにこれを出力する役割を果たす。トリガーブロックはユーザーがトリガー条件を指定できるようにするプログラマブルリソースを含む。トリガーブロックリソースはどの命令およびどのデータ転送をトレースするかを制御するためのフィルタとしても使用される。(トリガーブロックリソースを含む)すべてのETMコンフィギュレーションレジスタは、JTAGインターフェースを通してプログラムされる。ユーザーはソフトウェアデバッガーを使ってこれらレジスタにアクセスし、一旦トレースがキャプチャーされると、デバッガーはトレースを逆圧縮し、実行したコードのフルディスアセンブリをユーザーに提供する役割を果たす。デバッガー用ソフトウェアはリアルタイムでETMトレースポート出力を処理できないので、最初は外部トレースポートアナライザ(TPA)内にトレースがキャプチャーされる。TPAは完全に機能的なロジックアナライザまたはETM固有のデバイス、例えばAgilent社の n Traceボックスでよい。一旦トリガー条件が発生し、デバッグの実行が完了すると、デバッガーはTPAからトレース情報を抽出する。このハイレベルの記述では、ETM10はETM7およびETM9に機能的に同一である。
【0050】
ETM10に必要な変更
ユーザーから見れば、ETM10はETM7およびETM9が提供する機能に対し、等価的な命令およびデータトレーシング機能を提供するが、違いはわずかである。この章ではETM10のためのETMアーキテクチャに対して行われた変更およびこれら変更を行った理由について述べる。多くの変更は、逆圧縮ソフトウェアにしか影響せず、トレースツールキットソフトウェアの他の部分と同じように、エンドユーザーには判らない。しかしながら、いくつかの変更点はプログラマーのモデルに影響するか、またはその結果、ETM7およびETM9とはトレーシングの動作に若干の変更がある。この章では、かかる変更について述べる。新プロトコルのより詳細な説明を必要とするETM10に対する変更は、第5章に示されたプロトコルの説明に、より完全にカバーされている。
【0051】
1.2 ブランチファントムトレーシング
ARM10は「ブランチフォールディング」を実現する。このことは、通常の命令ストリームからブランチを予測し、引出し、プログラム内の次の命令とパラレルに効果的に実行できることを意味する。これらのフォールディングされたブランチをブランチファントムと称す。旧プロトコルにおけるPIPESTATコーディングは1回のサイクルについて実行される1つの命令しか考慮していない。ブランチファントムのトレースを可能にするために命令とパラレルにフォールディングされたブランチを示すPIPESTATに新しいコーディングが追加される。第5章のETM10のプロトコル仕様には、新PIPESTAT値が記載されている。
フォールディングされたブランチはトリガーブロックの変更も必要とする。ブランチがフォールディングされると、2つの命令がパラレルに効果的に実行される。これら2つの命令に対するPC値は識別可能な関係となるように保証されていないので、サイクルごとに2つのアドレスの比較を行わなければならない。このことは、各アドレスレジスタが2つのコンパレータを必要とすることを意味する。トレーシングがイネーブルかどうか判断する際には、コンパレータの双方の出力を検討する。(これら2つの命令のいずれかをトレースしなければならない場合、そのサイクルでトレーシングをイネーブルする。)ブランチフォールディングにより多くて1つのエキストラ命令をトレースすることを保証するには、特別な注意を払わなければならない。一般にユーザーはブランチがフォールディングされ、TraceEnableまたはVewDataを正しくプログラムするために次の命令とパラレルに実行されていることをユーザーは知っている必要はない。
事象に対し、命令のパラレルな実行によってETM10対ETM7/9と若干異なる動作とすることができる。事象を一般に使用する態様に起因し、機能の損失が大きくなることは感じられない。カウンターは1サイクルにつき1回しかカウントダウンできないが、単一アドレスのコンパレータを使用する際には、カウンティングはアクセスの完全カウントしか提供しない。更に、Trigger、TraceEnable、VewData、またはExtOutに対する機能のロスはなく、命令転送またはデータ転送のいずれかが、個々に事象をアクティブにした場合(このことは望ましい動作である)、その事象はアクティブとなる。シーケンサが同じサイクル内で多数の過渡リクエストを受けた場合、過渡現象は発生せず、シーケンサは元の状態のままである。このような動作はETM7およびETM9の動作と同じである。ARM10は、よりパラレルな実行をサポートするので、ETM10は1サイクル内で多数の過渡リクエストの発生をより多く有し得る。ユーザーはシーケンサをプログラムする際にはこのような動作を知っていなければならないが、単一事象に対してはワークアラウンドがある。望ましい動作が事象Aに基づくステート1≧2からの、および事象Bに基づくステート2≧3からの過渡である場合、事象(A&!B)において1≧2が発生し、事象Bにおいて2≧3が発生し、および事象(A&B)において1≧3が発生するようにプログラムする。このようにシーケンサをプログラムすることによって、事象Aと事象Bの同時発生を正しく処理することが保証できる。
【0052】
1.3 ロードミスおよび例外トレーシング
ARM10は非ブロッキングデータキャッシュを有し、このデータキャッシュは他のメモリ命令を含む他の命令を単一の未解決ミスの元で実行できるようにするので、データキャッシュはデータをコアへ順不同でリターンすることができるようにする。この機能は、現在のプロトコルはロードデータをFIFOに順に挿入することを予測しているので、ロードデータをトラッキングする上での問題となっている。データパケットは一部が順序外ロードミスデータに適合するためのヘッダーバイトのプリフィックスが付けられている。ヘッダーバイトについては第5章で詳細に説明する。
非ブロッキングキャッシュをサポートするには、データコンパレータを変更することも必要である。ETM7およびETM9と同様に、ETM10はデータコンパレータを有し、これらデータコンパレータは一対のアドレスコンパレータと組み合わせて使用される。コンパレータを使用する際に、コンパレータはデータが一致した時の一致しかトリガーしない。ミスの基では他のメモリアクセスも起こり得るので、ミスを生じ、支えたロードリクエストに対するアドレスが一致しているかどうかを思い出すことができるようにするために、各コンパレータに1つのビットを加える。ロードミスデータがリターンされると、データ値の比較を行い、セーブされたアドレス一致ビットを使用して比較の結果の評価を行う。この一致ビットをクリアする。ある場合、ユーザーはコンパレータをイネーブルするためにミスデータが戻されるのを待つのを望まないことがある。その代わりにユーザーはデータアドレスだけに基づき、ロードミスを常にトレースすることを望むことがある。双方の異様モデルをサポートするために、各コンパレータに対し、どのモードをイネーブルするかをユーザーが指定できるようにするために、アドレスアクセスタイプのレジスタに1ビットが加えられている。ユーザーが比較するロードミスデータを待つことを望む場合、アドレスアクセスタイプレジスタのうちのビット8、すなわち完全一致ビットをセットしなければならない。(アクセスタイプのレジスタに関して更に情報が欲しい場合にはレファレンス1を参照されたい。)トリガーおよびその他の事象を発生するために、データ値を使用する際にはデータの比較が生じるのを待つことが有効である。トレースフィルタリングに対し、コンパレータを使用し、余分なトレーシングが問題であると見なされない場合、アドレスだけに基づくロードミスのトレーシングが有効である。ユーザーは事象、例えばシーケンサの変化を生じさせるためにデータ値を使用する結果、ロードデータが順序外データとしてリターンすることができるので、順序外の事象が発生し得ることについて知っていなければならない。ARM10の非ブロッキングキャッシュがプログラムされた事象に影響し得ることをユーザーが気にする場合、この機能はcp15のコンフィギュレーションレジスタ(r1)への書き込みによりコアでディスエーブルできる。より詳細については、ARM1020E TRM(レファレンス3)を参照されたい。
【0053】
アボート、インターラプトまたはソフトリセットが行われる際の、コンパレータの動作を特定するために、アクセスタイプのレジスタのビット7も使用される。これら条件は包括的に例外と称される。データアクセスがアボートされ、ビット7がアサートされる場合、コンパレータはデータの一致がリクエストされるか否かに拘わらず、NOT演算の結果、一致を出力する。コンパレータが命令アドレスに結合されている場合、例外としてマークされた命令に対するノッチを防止するために、完全一致ビットが使用される。例外を生じさせるような命令およびデータリクエストは、一旦アボート条件またはインターラプト条件が解決されると、通常再試行されるので、コンパレータが1回だけファイアーを意味している場合には、このような動作が望まれることが多い。データアクセスのケースではビット7がアサートされないと、データ値は有効でないと見なされるので、アボートされたアクセスは純粋にアドレスに基づく一致を生じさせる。
【0054】
所望される動作は一般に双方のケースに対して同じであるので、ロードミスおよびデータアボートの適正な取り扱いを判断するのに、同じ完全一致ビットが使用される。四角な一致ビットに対するデフォルト値はゼロである。
【0055】
1.4 ARM10のデータトレーシング
ARM1020Eは1サイクルで64ビットのデータをリターンできる64ビットデータバスを有する。この64ビットデータバスをサポートするためには、ETM10は1サイクルで2つの隣接するデータ値をトレーシングできなければならない。1つの値またはその他の値のトレーシングをサポートするために次に2つのViewData出力を発生する。しかしながら、複数の事象に対して1つの出力およびTraceEnableに対して1つの出力しかない。同じサイクルでアクセスされる2つの隣接する32ビットのリクエストの結果、カウンターが1つデクリメントされるか、またはシーケンサにより1つのステート変化しか生じないので、1つの事象出力を設けると、カウンターおよびシーケンサロジックに影響がおよぶ。事象ロジックをプログラムする際にユーザーはこのことを考慮しなければならないが、大きな問題となるとは予想されない。
【0056】
1.5 LSMトレーシング
ARM1020Eは独立したロード/記憶ユニットを有する。このロード/記憶ユニットがデータアクセスを繰り返す間(すなわちLSMの実行はコアをストールさせない)、ロードまたは記憶マルチ命令(以下、LSMと称す)の元でこのユニットによりその他の命令を実行することが可能となる。これをサポートするために、アドレスコンパレータの出力およびTraceEnableのアサーションに若干の変更が必要である。
・LSM命令を繰り返しながら、この命令をアクティブにトレーシングする時はいつも、トレーシングはアクティブなままであるが、この状態はTraceEnableがアサートされた状態のままであるか否かにかかわらず、LSMが完了するまでこのトレーシングのアクティブ状態は続く。(この規則に対する唯一の例外はオーバーフローが生じるケースである。)この規則は、他の命令が他の方法で実行されるか否かにかかわらず、LSMの元で実行される他の命令をトレーシングする副次的な効果を有する。しかしながら、定義によりLSMの元で実行される命令はデータ命令となり得ないので、余分なデータパケットは生じない。
・LSMの命令アドレス上でコンパレータが被動される時は常に、全命令が完了するまで、そのコンパレータのViewData出力はアサートされたままに留まる。ユーザーの意図はこの命令に関連するすべてのデータパケットをトレースすることにあるので、このことが行われる。同様に、LSM命令が完了するまでViewDataおよび事象レンジ出力はアサートされた状態に留まる。定義により、1サイクルの間、これら出力はアサートされなければならないので、事象の単一アドレスコンパレータの出力はアサートされた状態に留まらない。
・LSMに関連するデータ転送を一旦トレースすると、通常トレースされないその命令に関連するその後の転送はプレイスホルダーパケット出力(トレースされない値(第5章参照)を有する。どのワードをトレースしたかを判断するには、これらプレイスホルダーパケットが必要である。
EMプロトコルはロード/記憶データアドレス(およびデータ値)に基づき、命令トレーシングをイネーブルできるようにする。ARM10ではトレーシングイネーブル事象が生じた時にLSM命令はコア実行ステージ内に存在できないので、この機能をサポートするには特別な方法でこの命令アドレスを周辺に維持または一斉送信する必要がある。このことは、プログレスTFOパケット内のLSMを使って行われる。トレースパケットオフセットについては5.2.4章に記載されている。
【0057】
1.6 補助データトレーシング
プロトコルにデータヘッダーを加えることによって、補助データタイプのトレーシング(すなわちロード、記憶およびCPRT命令に対するデータ以外のデータ値のトレーシング)も可能になる。この補助データタイプのトレーシングとは、ETMの将来のバージョンにおける外部ASICデータのトレーシングを含み得るETMトレーシングの拡張を可能にすることを意味する。より詳細な情報については第5章におけるデータヘッダーの説明における補助データトレーシングに述べられている。
【0058】
1.7 CONTEXT IDのトレーシング
CONTEXT ID値を更新する時、および同期化のためにTFOパケットが必要とされる時は常に、CONTEXT ID値を一斉送信する必要がある。ETM10の場合、CONTEXT ID変更を生じさせたCPRT命令に対するデータトレーシングを単にイネーブルすることによって、CONTEXT IDを更新する際にこれらCONTEXT ID値を出力する。このデータパケットに対するユニークなデータヘッダーによって、データが新しいCONTEXTID値をデコンプレッサが認識できるようになる(データヘッダーについては第5章に記載されている)。ETMはトレースがイネーブルされる時は常に、更に5.2.4章に記載されているトレース同期化サイクル中に、現在のCONTEXT ID値も一斉送信する。このCONTEXT ID更新命令はMCR c15、0、rd、c13、c0、1である。
ETM10は、ARM10とETM10とのインターフェース上の別の32ビットポートを必要とする以外に、CONTEXT IDが内部シャドーレジスタ内の現在CONTEXT ID値を更新し、これを維持することを認識する。コヒーレンシーを正しく維持するためにETMがPOWERDOWNモードとなっていても、このレジスタは常に更新される。(ETMレジスタ0×4、ビット0はアサートされる)。
トレースフィルタリングのためにCONTEXT ID値を使用することは、ETM10のための別機能として追加される。このことは、予想されるCONTEXT ED値を指定できるETM内の新しい組のプログラマブルレジスタを介して実行される。
【0059】
【表1】
【0060】
各CONTEXT IDコンパレータに対して同じマスクを使用し、このマスクはデータコンパレータマスクと同じように働く。
アドレスコンパレータのアクセスタイプのレジスタのビット9:8は、CONTEXT IDコンパレータを使用していることを表示する。00の値はCONTEXT IDコンパレータを無視する。CONTEXT IDマスクを考慮した後に、現在のCONTEXT IDがCONTEXT IDコンパレータ1、2または3内の値に一致している場合に限り、01、10または11の値はアドレスコンパレータを一致させる。
事象ブロック内から直接CONTEXT IDコンパレータにアクセスできるように、新しい事象リソースが割り当てられる(ARM IHI 0014Dの3.3.4章参照)。これら新しいリソースは0×58〜0×5Aにマッピングされる。
【0061】
【表2】
【0062】
存在するCONTEXT IDコンパレータの数を示すように、ETMコンフィギュレーションコードレジスタに新しいフィールドが追加される(ARM IHI 0014Dの4.2.2章参照)。
【0063】
【表3】
【0064】
1.8 トレース出力の周波数
ARM1020Eのマクロセルは、300MHzを越えるコア周波数で作動できる。以前のETMの実現では200MHzを越える周波数では使用できなかった。ETMトレース出力で達成できる最大出力周波数はトレースアナラアイザの最大サンプリング周波数およびパッドで達成できる最大出力周波数によって決まる。アギレント社およびテクトロニクス社のアナライザは、それぞれ333MHzおよび400MHzの最大周波数で捕捉できる。しかしながら、ARM社のパートナーから得られるCMOSパッドは、この周波数で、クリーンでトレース可能な信号を発生できる可能性は低い。従って、これらパッドはスピードを制限する要素となると予想される。より大きいパッドを使用し、および/またはボードレベルのバッファリングを使用することによって、ある程度の速度の改良を行うことができる。これら技術によって200MHzで信頼できるトレーシングが可能となり得る。これより高い速度でトレーシングするには2つのオプションがある。ピンのカウント数を2倍にし、周波数(多重解除トレースポート)を半分にするか、またはオンチップトレースバッファを使用することができる。いずれの技術も肯定的なポイントと否定的なポイントを有する。
【0065】
ピンカウントを2倍にすることはパッケージの制限および追加ピンの高コストから一部のパートナーには魅力的なオプション案ではない。この技術では、TPAを変更することも必要となり、更に最も可能性の高いことに、より広い面積を占め、更にコストを増すような第2のミクターコネクタを増設することも必要となる。更に、この技術では400MHzのスピード制限がある。ホットプロセスで製造されたARM10プロセッサはこれらスピードを越える可能性が最も高い。
【0066】
オンチップバッファのオプションにはコアクロック速度で信頼性高くトレーシングでき、かつ余分なピンを必要としないという利点がある。実際、オンチップバッファを使ってすべてのトレースの捕捉を行う場合、オンチップバッファはJTAGポートを通してマルチICEを介し、ダウンロードされるので、外部からビジブルなETMポートを省略できる。この解決案の欠点は、オンチップバッファのサイズが8〜16KBのオーダーで極めて小さいということである。従って、トレーシング深度が制限される。より大きいオンチップトレースバッファを使用することも可能であるが、これはASICのサイズに直接影響し、小さいトレースバッファでも一部の設計で可能なスペースよりも大きいシリコンスペースを使用し得る。
【0067】
各方法の利点と欠点が異なっているので、これまで述べたオプションのいずれも、サポートすることが計画されている。ARM10200rev 1テストチップは、高速トレーシング用の多重解除トレースポートで製造され、オンチップトレースバッファはARM10200rev 1テストチップの一部とはならない。
【0068】
ETM9用のオンチップトレースバッファ用の仕様については既に記載されており、その実現は進行中である。5.2章に詳細に記載される新しい4ビットのPIPESTATコーディングをサポートするために、若干の変更をしたこのデザインからETM10とコンパーチブルなオンチップトレースバッファを作成することが可能となる。ETM10をサポートするのにどのトレースキャプチャーデバイスの変更が必要であるかの情報を更に欲しい場合にはレファレンス4を参照されたい。ETM10とコンパーチブルなオンチップトレースバッファはタイムスケールに応じ、別の機能、例えばダイナミックトレース圧縮機能を提供でき、実際にこのバッファはFIFOの置換回路としてETM10デザイン内に直接集積化できる。
【0069】
1.9 同期化レジスタ
先のETM実現例では1024サイクルごとの5バイト命令アドレスを介し、更に1024サイクルごとの5バイトデータアドレスを介し、同期化が生じていた。ETM10では、これら同期化ポイントは新しい12ビットプログラマブルレジスタによって構成できる。構成可能な同期化によってフルレンジのトレースバッファサイズを使用することがより容易となる。より小さいトレースバッファ、例えばオンチップトレースバッファは、トレースの大きい部分を処分することを防止するように頻繁に同期化できるが、より大きいトレースバッファは必要とされない同期時におけるむだなトレーススループットを防止するのに、あまり頻繁には同期化できない。デフォルトカウンター値は1024サイクルとなる。データアドレスの同期化と命令アドレスの同期化とが同時に生じるのを防止するために、カウンターが中間値に達したときにデータアドレス同期化が行われ、カウンターが0に達したときに命令アドレスの同期化が行われる。新同期化レジスタに対するアドレスは0×78となる。
【0070】
1.10 メモリマップデコーダ
以前のETM実現例で存在していた外部メモリマップリソース入力はETM10に対してサポートされていない。ARM10のアーキテクチャ内に存在する余分な複雑性によって、外部デコーダの実現はより困難となっている。外部事象はサイクルが完全EXPIN入力を使用することによってまだトレーシングを制御できる(これについては4.15章に記載されている)。
【0071】
1.11 レンジアウト
以前のETM実現例はエキストラトリガーリソースとして埋め込み型ICEロジック内のデータ値比較レジスタを使用することができた。この機能は埋め込み型ICEからのRANGEOUT出力を使用することによって達成されていた。ARM10デバッグユニットはデータ値比較機能を全く有しないので、これらRANGEOUT出力を有していない。従って、ETM10に対してはこのリソースの再使用は不可能である。これらリソースはもはやプログラムできないので、このことはプログラマーモデルに若干影響する。
【0072】
1.12 インターラプトベクトルへのブランチ
現在のプロトコルはインターラプトベクトルテーブル内のエントリーへの直接ブランチを間接ブランチとしてトレースしなければならないと指定している。このことは、ファントムブランチを提案されたプロトコル内で間接ブランチに変換できないので、このことは常に可能であるとは言えない。従って、間接ブランチがブランチファントムであるかどうかとは関係なく、一貫性および簡潔性のためにインターラプトベクトルに対する直接ブランチは間接ブランチとしてトレースされない。5.3.1章に記載されているアドレスバイト5の特別コード化に起因し、PABORT、FIQ、IRQ、DABORTおよびRESETベクトルに対するブランチを検出することが可能である。
【0073】
1.13 プロトコルバージョン
ETM7およびETM9におけるコンフィギュレーションコードレジスタ(レジスタ0×01)に存在する4ビットのETMプロトコルバージョンフィールドは、ETMに対する将来のプロトコルバージョンをサポートするには不十分であると判断されている。従って、マイナーなプロトコルバージョンナンバーだけでなく、主要なプロトコルバージョンナンバー用のARMコアを指定するフィールドを含む新しいETM IDレジスタが定義されている。このレジスタはレジスタアドレス0×79にマッピングされ、コンフィギュレーションレジスタにおけるビット31がセットされる時は常に有効であると見なされる。これによってETM7およびETM9はIDレジスタを必要とすることなく、プロトコル変形例0〜7をまだ使用することが可能となっている。ETM IDレジスタは次のフィールドに分配された32ビットの値を含む。
【0074】
【表4】
【0075】
1.14 トレーススタート/ストップリソース
TraceEnableスタート/ストップロジックの現在ステートを与えるために、新しい事象リソースが含まれる。このリソースにはリソース番号1011111が与えられ(ARM IHI 0014Dの3.3.4章参照)、トレーススタート/ストップブロックがアクティブな時は常にアサートされる。このスタート/ストップリソースをサポートするETMバージョンもETM制御レジスタ内のビット23をアサートする。
【0076】
1.15 TPAの変更
ARM10のための新しいトリガーおよびトレースイネーブルステータス値をサポートするために、すべてのTPAはわずかな変更を必要とする。すなわちこれらTPAはTRおよびTD PIPESTATを検出するためにPIPESTAT[3]/TRACESYNCがLOWとなることを保証しなければならない。ロジックアナライザにとってこのことはわずかなソフトウェア変更にすぎない。アギラント社のnTraceは同じようにわずかなハードウェア変更を必要とする。多重解除された半速度ETMポートを通した高速トーレシングをサポートするには、TPAはサイクルごとにトレースデータのうちの2つのコアサイクルの価値を捕捉できなければならない。このデータはミクター社の2つのコネクタを通して一斉送信される。従って、マルチコネクタ用のサポートも同じように必要とされる。これら変更に関して更に情報が欲しい場合には、レファレンス4を参照されたい。
【0077】
1.16 正確な事象
ETM7およびETM9では、イベントブロックを介して発生される事象は正確ではなかった。このことは、事象を発生したデータアクセスまたは命令をトレースするのに、ユーザーは保証されていなかったことを意味する。ETM10はもはやこのようなケースとはなっていない。ViewDataおよびTraceEnableのアサーションはそれらがどのように発生されたかにかかわらず、常に正確である。
【0078】
1.17 FIFOFULLレベルレジスタ
ETM7およびETM9では、FIFOFULLがアサートされる前にFIFOが到達しなければならないレベルを設定するのに、レジスタ0×0Bが使用されていた。ETM10では、FIFOFULLのこのレジスタは使用されず、代わりに新しいパケットをFIFOFULLに挿入しなければならない時は常に、イネーブルされたFIFOFULLがアサートされる。ETM10はETM7/9よりもより深いパイプライン状となっており、FIFOFULLはこのように使用される場合に十分有効となるように早期にしかアサートできない。ETM10ではFIFOFULLレジスタはFIFOサイズを指定するリードオンリーレジスタとして再使用される。FIFOサイズはETM7/9ではソフトウェアによって決定できないようなサイズとなっている。
【0079】
1.18 TRIGGER出力
プロセッサがモニタデバッグモードの場合、DBGRQは無視される。従って、トリガーが生じたことをコアが認識できるようにするための他の機構を設けることが有効である。この目的のため、ETM10のためのETMインターフェースには単一ビットのTRIGGER出力が追加されている。PIPESTATバス上で4ビットのTRIGGERステータスがドライブされる時は常に、TRIGGER出力がアサートされる。この信号はインターラプトのアサーションによりコアにトリガーを通知するよう、インターラプトコントローラによって使用できる。このTRIGGER出力が必要でない場合、この出力は付属されない状態のままにすることができる。
【0080】
1.19 カウンター事象
ETM7/9に対してはカウンター事象レジスタは連続的にカウントするのに使用できるエキストラビット17を有していた。このビットの動作は冗長であり、証明が困難であるので、このビットは除かれている。ユーザーが連続カウンターを望めば、常にアクティブにすべきハードウェアである外部リソース15に等しくなるように事象を単にプログラムする。
【0081】
ETM10のトレースポート
1.20 ETM10のポート信号
ETM10のトレースポートは2つの信号、すなわちPIPESTATおよびTRACEPKTとから成る。これらはいずれも(GCLKと周波数が同じである)TRACECLKの立ち上がりエッジで有効である。ETM10に対してPIPESTATは3ビット信号から4ビット信号に拡張されており、ブランチファントム用のコーディングスペースを増している。TRACEPKTは先のETMバージョンからは変更されていない。すなわちこれはコンフィギュレーションに応じて4、8または16ビットでよい。別の機構を介して同期化が行われるので、プロトコルからTRACESYNCピンが除かれている。全体の結果として、トレースポートは先のETM実現例と同じピンカウントを有する。
1.21 PIPESTATエンコーディグ
【0082】
【表5】
【0083】
1.21.1 ブランチファントムのPIPESTAT
次の命令とパラレルに実行されるブランチファントムを考慮して8つの新しいブランチファントムエンコーディングが追加されている。このコーディングは実行ストリーム内の最初に存在するブランチ命令として常に解読すべきである。直接ブランチしか予想されないので、ブランチファントムはFIFO内にデータパケットを挿入しない。ミス予想されたフォールドブランチの結果、正常なIE/IM PIPESTATが生じる。その理由は、パラレルに実行された命令は正しくない命令ストリームからのものであるので、キャンセルされるからである。
【0084】
1.21.2 データPIPESTAT
「D」で始まるすべてのニューモニックは、FIFOサイクル内で一部の種類のデータパケットが挿入され、最終的にTRACEPKTピンに出力されることを意味する。新プロトコルに対する「パケット」なるワードはFIFO内の単一バイトではなく、FIFO内に挿入されるマルチバイトの量を意味することに留意されたい。データパケットはブランチアドレス、ロード/記憶転送、CPRT転送または補助データパケットでよい。ETM10は1サイクルでFIFO内に最大3つのデータパケット(2つのLDST/CPRT転送および1つのブランチアドレスパケット)を挿入する。1サイクルにおいて、3つのパケットがプロトコルではなくハードウェアの限界であることに留意されたい。プロトコルにパケットヘッダーバイトを加えたことにより、別個のデータおよびブランチPIPESTATが不要となっている。DWおよびDMステータス値を加えたことにより、任意のサイクルにデータパケットを付属させることが可能となっている。この値を加えることは、LDC/STCの長さを決定するための高プロセッサのマップはもはや不要であり、可変長さのLDC/STC命令のトレーシングがサポートされることを意味する。パケットヘッダーバイトについては5.3章により詳細に記載する。
【0085】
1.21.3 命令PIPESTAT
非待機PIPESTAT値、すなわち命令が実行されたことを示す値は、その命令が実行されている最初のサイクルで常に与えられる。数サイクルの間で実行し、データをリターンするLSM命令にとってこの違いは重要である。この動作はLSMを実行した最終サイクルで実行されたPIPESTAT値を与える以前のプロトコルバージョンと異なっていることに留意されたい。
「実行されない」PIPESTAT(IN/DN)は2つの理由から起こり得る。命令がその条件コードを実行できなかったか、または例外により命令が実行されなかった場合である。先に述べたように、起こり得る例外としてはインターラプト、プリフェッチアボート、リセットアサーションが挙げられる。データアボートを生じさせるようなロード/記憶命令は実行されたと見なされるので、IN/DNステータスは与えられない。デコンプレッサは例外が命令の実行を阻止していることを認識しなければならない。この情報は先のLSM命令からの後のデータパケットが例外命令に付属されるのを防止するために使用される。(「実行されない」PIPESTATを有する命令に対して認められる唯一のデータパケットはブランチアドレスである。)
【0086】
1.21.4 TDステータスおよびTFO
TDのステータスはTRACEPKTのこのサイクルでトレースFIFOデータが存在しないことを意味する。このことが起こる理由は2つある。すなわち
・FIFO内にトレースすべきデータがない場合(FIFOが空であれば、ステータスはWTとなる)。特に、次にイネーブルされるまでトレースがディスエーブルされた直後にこのことが起こる。
・TFOがETMの同期化のために一斉送信されている場合。
【0087】
PIPESTAT上にTDステータスが示される時には、圧縮解除ソフトウェアはTFOが一斉送信されたかどうかを判断するためにTRACEPKT値を見なければならなくなる。先のETM実現例で行われているように、サイクルに正確なトレースと非サイクル正確なトレースとを区別するために、TRACEPKT[0]が使用される。以前と同じようにTRACEPKT[0]=0の場合、トレースキャプチャーデバイスはTDサイクルを廃棄できる。TRACEPKT[0]がアサートされれば、TFOを送信するかどうかを指定するためにTRACEPKT[3:1]が使用される。TFOが一斉送信されると、TRACEPKT[7:4]はTFO値のうちの下位の4ビットを指定する。TRACEPKT[3:1]は下記の表に示されるように、他のTFO値を指定する。有効なTFO値のレンジを最大にするよう、TFOはこのようにコード化される。
【0088】
【表6】
【0089】
パイプラインステータス(PIPESTAT)とFIFO出力(TRACEPKT)とを同期化するために、トレース情報を逆圧縮する際にTFO、すなわちTraceFIFOOffsetを使用する。トレースが最初にイネーブルされる時、更に命令同期化カウンターが0に達する時はいつもTFOを発生する。このTFOは以前のETM実現例で使用されたアドレスパケットオフセット(APO)情報を置き換える。TFOはブランチをカウントする代わりに、現在FIFOにあるバイト数をカウントする。このように同期化することにより、プロトコル内のTRACESYNCピンが不要となる。更に、BE PIPESTATによるトレーシングのスタートと、それに続くAPO値のための2つのデッドサイクルも不要となる。
【0090】
トレースが既にイネーブルされている間、同期化のためにTFOが一斉送信される時は、IEのPIPESTAT値が示される。トレーシングを開始するためにTFOが一斉送信される際には、PIPESTATは示されず、次のサイクルで最初にトレースされた命令に対するPIPESTATが与えられる。
次の基準のすべてが満たされる時に、同期化のためのTFOが発生される。
・一般に1024に初期化されるサイクルカウンターが0に達すること。
・現在の命令が「IE」のPIPESTAT値を有すること。
【0091】
同期化リクエストが一旦表示されている場合、命令同期化レジスタ(デフォルト値は1024である)にどんな値がプログラムされていても、TFOサイクルカウンターはその間にリセットされ、再びカウントを開始する。最初のリクエストの同期化サービスが完了する前に第2の同期化リクエストがなされた場合、同期化を強制的に生じさせるようにETMはオーバーフローさせられる。このシナリオでは一部のトレースは失われるが、このことが起きた場合、プロセッサは無限ループ内でスタックする可能性が最も高いので、このことは問題であるとは考えられない。従って、重要なトレースは失われない。同期化カウンターがばかげたほど小さい数にリセットされた場合、このようなケースとはならない。従って、同期化値を小さすぎる値(50サイクルよりも低い値)にセットすることは軽率なことである。
【0092】
TFOサイクルが発生すると、このサイクルでFIFOにデータのいくつかのバイトが挿入される。このデータはTFOパケットと称され、一般に特殊なヘッダーバイトと、現在のCONTEXT IDと、フル命令アドレスとから成る。TFKパケットに対する正しいフォーマットは5.4章に示されている。
【0093】
4ビットのTRACEPKTコンフィギュレーションにおいて、1バイトのうちの第2のニブルが予想される時にTFOが生じた場合、TFO値の直後にTRACEPKT[3:0]に値「0×6」のエクストラニブルが出力される。TFO値はニブルではなく、バイトによって同期化を指定するので、このニブルが必要とされる。このエクストラニブルを出力することによって、ETM10はTFO値によりポイントされるFIFOの現在のトップのバイトが一致することを保証する。同期化が必要でないケースでは、このエクストラニブルがTRACEPKT[3:0]に生じることをデコンプレッサが認識していることが重要である。TFOが同期化によるものか、またはトレースのイネーブルによるものかは関係なく、奇数のニブルでTFOが発生される時に、デコンプレッサは常にこのイクストラニブルを予想しなければならない。TRACEPKT[3:0]で完全なTFO値(および必要な場合にはエクストラニブル)が出力されるまで、FIFO出力は遅延される。
【0094】
1.21.5 トリガーステータス
トリガーステータス(TR)はこのサイクルに対する実際の4ビットのステータスがTRACEPKT[3:0]に載せられ、FIFO出力が1サイクルだけ遅延されることを意味する。この動作はETM7およびETM9と同一である。トリガーとTFOが同時に発生したい場合、TRACEPKT[3:0]上のPIPESTAT値はTDとなる。トリガーが生じる時にWT PIPESTATは決してTD PIPESTATに変換されないので、TDは真のTFOとして一義的に識別可能である。4ビットポートのケースでは、TFO一斉送信の第2サイクル(またはギャップサイクル)においてトリガーが発生したい場合、トリガーが発生し、エクストラサイクルだけFIFO出力が遅延され、残りのTFOニブルを出力する。従って、トリガーは遅延されず、発生時に出力されることが保証される。
【0095】
1.22 パケットヘッダーエンコーディング
「D」エンコーディングを有するPIPESTAT値により、FIFO内にはパケットが挿入される。単一サイクルにおいてFIFO内には3つまでのパケット(2つのデータパケットと1つのブランチアドレスパケット)を挿入できる。下記の表にはパケットヘッダー値に対するエンコーディングが示されている。
【0096】
【表7】
【0097】
データヘッダー上のCビットは、単一サイクルでどれだけ多くのパケットがFIFOに挿入されているかを逆圧縮ツールに伝えるために使用される。このCビットは最終パケットまで挿入され、最終パケットを含まない各パケットに対してアサートされる。このことは、どのパケットをどのサイクル、従ってどの命令に結び付けなければならないかをデコンプレッサが認識するのに必要である。このCビットは、より低いケース「c」によって表示されるアドレス連続ビットと混同してはならない。
【0098】
1.22.1 ブランチアドレス
ブランチアドレスは以前のETM実現例と同じようにコード化される。1つのブランチパケットは1〜5ビットの長さでよく、cビットがイネーブルされる時は逆圧縮ツールはより多数のバイトを予想しなければならない。しかしながら、ThumbとARMステートとを区別するのに、ブランチアドレスのビットゼロはもはや使用されない。代わりに、すべてのブランチアドレスにはプレ圧縮により33番目のビット位置に1のプレフィックスが付けられる。一旦圧縮されると、すべてのブランチアドレスには0番目のビット位置に1がサフィックスとして付けられる。ビット0における1はブランチアドレスとしてパケットを識別するものであり、ビット33における1はARMアドレスとthumbアドレスとを区別するために使用される。ARMアドレスはワードが一致していなければならないので、ARMアドレスのうちのビット[31:2]しか一斉送信されない。Thumbアドレスは半ワード一致しているので、ビット[31:1」を一斉送信するだけでよい。33番目のビットの、常にアサートされたプレ圧縮と組み合わせて、ARMアドレスとThumbアドレスに対し、異なる数のビットを一斉送信することにより、ARMステートとThumbステートとの間の変化時にフルの5バイトのアドレスが一斉送信されることが保証される。更に、ARMアドレスおよびThumbアドレスは次の表に示されるように、5番目のアドレスバイトの内の高位ビットによって常に一義的に識別できる。
【0099】
【表8】
【0100】
ブランチターゲットアドレスが存在する場合、このブランチターゲットアドレスは常に所定のサイクルでFIFO内に挿入すべき最終アイテムとなる。従って、パケット連続ビット(Cビット)は不要である。理由コードは5.4章で説明するTFOパケットヘッダーの一部として与えられるので、このコードは5番目のバイト内のアドレスビット6:4で一斉送信されることはない。5番目のバイトのうちのビット6は(上記表における「E」によって表示される)例外ブランチアドレスを表示するのに使用される。このビットはアボート、インターラプトまたはソフトリセットに起因し、任意のブランチ上でセットされる。これらインターラプトされた命令が実際には実行されていないことをデコンプレッサが認識し、ユーザーに表示できるように、このビットは有効となっている。5番目のアドレスバイトのうちのビット7およびビット5は将来使用するために留保されたままになっている。
【0101】
1.22.2 通常のデータ
キャッシュ内でミスしないすべてのロードおよび記憶データパケットに対し、通常のデータヘッダーが使用される。このデータヘッダーはCPRTデータトレーシングがイネーブルされた場合に、CPRTデータパケットに対しても使用される。データアドレストレーシングがイネーブルされた場合、ヘッダーパケットの後であって、データ値(存在する場合)の前でデータアドレスが一斉送信される。このデータアドレスは命令ブランチアドレスと同じ圧縮技術を使って一斉送信されるので、1つ〜5つのバイトから成る。以前のETM実現例に当てはまるように、トレーシングが開始される前にデータアドレスがトレースされたかどうかを統計的に判断しなければならない。(64ビットのデータ転送に起因し)単一サイクルで通常の2つのデータパケットが与えられた場合、最初のパケットしかデータアドレスを含まない。LSM命令のためのデータが一斉送信されると、次のデータパケットが別のサイクルで転送されるが、データアドレスは最初のデータパケットと共に一斉送信されるだけである。通常のデータヘッダーにおけるAビットは、これが特定命令に対する最初のデータパケットであることを指定するのに使用され、従って、(アドレストレーシングがイネーブルされる場合)データアドレスを予想しなければならない。ヘッダーバイト内でこの情報を利用可能にすることにより、逆圧縮できないコード部分(すなわち二進法を利用できない領域)を通るトレーシングを行う際に、デコンプレッサは同期状態を維持できるようになる。このAビットはCPRTパケット上ではアサートされない。
【0102】
通常のデータコーディングにおける「MSS」ビットはデータ値の圧縮に使用される。Mビットが低レベルであると、SSビットは転送されるデータ値のサイズを指定する。先行するゼロを簡単な形態のデータ圧縮として値から除く予備的な実験によれば、この圧縮は約20〜30%の圧縮を可能にすることが判った。この値はヘッダーバイトの追加的バンド幅コストを相殺するのに十分である。将来の圧縮技術のためにMビットの組によるコーディングが保留されている。次の表にはMSSビットのための正確なコーディングが示されている。
【0103】
【表9】
【0104】
1.22.3 ロードミス
ロードミス発生ヘッダータイプおよびロードミスデータヘッダータイプは、データキャッシュ内でミスするロードリクエストを取り扱う。ロードミスが生じると、データ値が予想されるFIFO内にロードミス発生パケットが挿入される。データアドレストレーシングがイネーブルされた場合、パケットはデータアドレスを含む。イネーブルされない場合、パケットはロードミス発生ヘッダーバイトから成る。ロードミス発生パケットが読み出されると、逆圧縮ソフトウェアはデータ値が現在未解決のミスであることを認識し、このデータ値は後にリターンされる。データが一旦リターンされると、このタイプに対するPIPESTAT値は「+DATA」バージョンに変更され、FIFO内にロードミスデータヘッダーバイトと実際のデータ値とから成るロードミスデータパケットが挿入される。ロードミスデータパケットはデータアドレスを決して含むことはない。ロード/記憶ユニットはロードミスデータをリターンするための自由サイクルを有していなければならないので、このデータは別のロードリクエストまたは記憶リクエストに対するデータと同じサイクルでリターンされることはない。
【0105】
ロードミスヘッダータイプにおける「TT」ビットは、各ロードミスを識別するためのタグとして使用される。ロードミス発生パケットは常に対応するロードミスデータパケットと同じタグ値を常に有する。ARM1020Eは位置度に1つの未解決のロードミスしかサポートせず、第1ミスに対するデータがリターンされる前に第2のロードミスパケットを一斉送信できる。従って、すべてのロードミスを一義的に識別するために、ETM10rev0ではタグ値2’Bb00および2’B01がサポートされている。これら2つのビットはより多数の未解決のミスを許容できる、将来のプロセッサをサポートするために、タグフィールド内に割り当てられている。更に、ARM1020Eはミスデータを(他のロードミスに対して)順にリターンするが、このタグ付け機構はミスデータを順序外でリターンできる将来のプロセッサをサポートする。
【0106】
16ビットのロード値でミスが生じると、同じサイクルでFIFO内に2つのロードミスパケットが挿入される。双方のパケットは同じタグ値を有し、同じサイクル内でFIFO内に挿入されるので、デコンプレッサはこれら2つのミスが単一の64ビット値に対するものであることを認識する。通常のデータパケットに関し、データアドレスは最初のロードミスパケットと共に存在するだけであるので、既にデータパケットを一斉送信したLSMの中間でミスが生じた場合、データアドレスは全く存在しないことになる。64ビットのケースに対し、ロードミスデータがリターンされると、このロードミスは同じサイクルで与えられた2つの別個のロードミスデータパケットとして常にリターンされる。双方のパケットは同じミスタグを有することになる。
【0107】
ロードミスデータパケットは通常のデータに対して行われているのと同じようなデータ圧縮およびサイズ情報に対し、MSSビットを使用する。デコンプレッサが予想しないロードミスデータパケット(例えば同じタグを有するペンディング中のミス発生パケットを有しないミスデータパケットが与えられる)を受信した場合、デコンプレッサはサイズとして示された所定の数のバイトだけスキップしなければならない。未解決のミスデータがリターンされる前にトレースがディスエーブルされるた場合に、利用できるようになるとすぐに「DW」PIPESTATと共にFIFO内にこのデータアイテムが挿入される。オーバーフローまたは脱出したデバッグの理由コードによってトレースがイネーブルされた場合、デコンプレッサはペンディング中のロードミスパケットをキャンセルしなければならない。
【0108】
1.22.4 補助およびフル視覚性データトレーシング
補助およびフル視覚性データヘッダーコーディングは、プロトコルを拡張するために保留されたスロットの組である。プロセッサに対し、内部および外部にある補助データをトレーシングするために、これらパケットタイプを使用することが可能である(フル視覚性とは、すべてのレジスタファイルの更新をトレースすることを意味する)。他のデータパケットと同じように補助データパケットはサイズ情報のためにSSビットを使用している。フル視覚性データトレーシングは同じように更に圧縮をするためのMビットをサポートしている。ETM10rev0ではこれらパケットタイプは使用されない。
【0109】
1.22.5 コンテキストID
コンテキストIDヘッダーバイトはコンテキストID更新命令、すなわちMRC c15、0、rd、c13、c0、1によってコンテキストIDが変更される時にしか使用されない。データ値のサイズはETM10の制御レジスタ(レジスタ0×0、ビット[15:14])で指定されたコンテキストIDサイズによって統計的に決定される。指定されたバイト数よりも新しい値が大きくても、指定された数のバイトしかトレースされない。サイズが0として指定されている場合、コンテキストID更新はトレースされない。コンテキストID更新命令がMRCであっても、コンテキストID値のトレーシングは他のCPRT命令からのトレーシングデータ値から完全に独立している。このコンテキストID値のトレーシングはETM10の制御レジスタ(レジスタ0×0、ビット[1])内のモニタCPRTビットによって影響されることはない。コンテキストID更新に対し、ユニークなヘッダー値を使用することによって、逆圧縮できないコード領域(すなわち二進法を利用できない領域)を通るトレーシングを行う時でも、デコンプレッサはコンテキストIDの変更を認識できる。
【0110】
1.22.6 トレースされない値
先のETM実現例はLSMオペレーションのためにデータ値のすべてをトレースできるか、または全くトレースできないかのいずれかであった。この判断は、第1転送時に行われていた。今日のコンパイラーは隣接するLDR/STRオペレーションをユーザーに知られていないLSMへ組み合わせることが多いので、このような動作は望ましくない。値がトレースされていないパケットを加えることによって、LSMを部分的にトレースし、トリガー基準に正しく一致するデータ値を出力する能力を増していた。
LSMに関連する第1データ値をトレースする時は常に、(アドレストレーシングがイネーブルされている場合の)データアドレスと、(データ値のトレーシングがイネーブルされている場合の)データ値とを含むFIFO内に通常のデータパケットが挿入される。このLSMのためのその後のすべてのデータ転送の結果、FIFO内にパケットが挿入される。その後の値をトレースする場合、データ値だけを与える通常のデータパケットがトレースされる。その後のデータ転送をトレースすべきでない場合、値をトレースしないパケットがこれら転送用のFIFO内に挿入される。値がトレースされていないパケットは値がトレースされていないヘッダーバイトのみから成る。逆圧縮ソフトウェアは最終データ転送から後方向に作用することにより、どのLSM値がトレースされ、どの値がトレースされなかったかを判断するために、通常のデータパケットと組み合わせて値をトレースしなかったパケットを使用することができる。ここで、先に述べたように、LSM命令でトレーシングが一旦開始すると、このトレーシングは命令の完了前にTraceEnableがデアサートされていても、LSMが完了するまで続く。
【0111】
1.22.7 保留
データヘッダーコーディング内には保留されたスロットが総計10個残っている。これらスロットのすべては、必要とされる場合、および/または将来のETM実現例が使用するために、プロトコルを補強するのに利用可能とされる。通常のデータおよびフル視覚性トレースコーディング内のMビットも、将来のETM実現例がより多数のヘッダータイプを必要とする場合でも圧縮の代わりに新しいデータヘッダーコーディングのために使用することもできる。
【0112】
1.23 TFOパケットヘッダーコーディング
(5.2.4章に記載されている)TFOサイクルによりFIFO内にTFOパケットが挿入される。デコンプレッサはTFOによりFIFO内にパケットが挿入されたことを知るので、TFOパケットは自己のヘッダーバイトコーディングを有する。このコーディングはPIPESTATデータパケットにより使用されるコーディングスペースから完全に独立している。次の表にはTFOパケットヘッダーコーディングが示されている。
【0113】
【表10】
【0114】
1.23.1 命令アドレス
TFOパケットの第1バイトに対し、TRACEPKT[1:0]!=2’b10である場合、このTFOパケットは1つの命令アドレスから成る。常にフルアドレスが必要とされるので、圧縮は行われず、4バイト値としてアドレスが常に出力される。アドレスのうちのビット0はこのアドレスがThumbまたはARM命令アドレスかどうかを指定する。TFOパケットが命令アドレスから成る時、このことは次のことを意味する。
・(ContextIDSize、ETMレジスタビット[15:14]によって決定されるように)CONTEXT ID値はトレースされない。
・TFOの理由コードは2’b00、すなわち通常の同期化である。
理由コードがゼロでないか、またはCONTEXT ID値がトレース中である場合、次のTFOパケットのうちの1つが必要とされる。1つのアドレスから成るTFOパケットはプロトコルに合わせるためには厳密に必要ではなく、ETM10rev0では実現されない。
【0115】
1.23.2 通常のTFOパケット
通常のTFOパケットはヘッダーバイトと、それに続くCONTEXT IDのうちの0〜4バイトおよびそれに続く4バイトの命令アドレスから成る。トレースされるCONTEXT IDバイトの数はETM制御レジスタビット[15:14]によって統計的に決定される。命令アドレスは常に4バイトであり、圧縮されない。ビット0はThumbビットを指定する。TFOヘッダーバイトは(上記表においてRRと表示された)2ビットの理由コードを含む。これら理由コードはプロトコルバージョン0および1におけるETM7およびETM9によって使用されるコードと一貫している。これら理由コードは次の表に示されている。
【0116】
【表11】
【0117】
1.23.3 進行TFOパケット内のLSM
マルチメモリアクセス命令(LDM、STM、LDCまたはSTC)の中間でトレースがイネーブルされ、別の命令が現在実行中の時に限り進行パケット内のLSMが生じる。これらパケットはヘッダーバイトと、それに続くCONTEXT IDのうちの0〜4バイト、それに続くLSMのための4バイトの命令アドレス、それに続く現在実行中の命令のための圧縮されたアドレスの1〜5バイトから成る。LSM命令はThumbビットを指定するビット0を有する固定された4バイトアドレスである。現在の命令アドレスは(5.3.1章に指定されているように)ブランチアドレスと同じ技術を使用して圧縮される。最終命令アドレスはLSM命令からのフルアドレスに対して圧縮される。次の命令PIPESTATは第2アドレスによりポイントされる命令のためのものであり、このポイントから前方に通常の方法でトレーシングが開始する。このパケットタイプは特定のデータアドレスまたはデータ値にタッチするすべての命令を正しくトレーシングするのに必要である。これがない場合、LSM命令はデータアドレスに基づき正しくトレースすることはできない。LSM自体の間でのみトレーシングがターンオンするようにプログラムされていても、LSM下で発生する命令はトレースされることに留意されたい。同様に、LSMの元でたまたま実行される命令の命令アドレスによってトレーシングがターンオンされた場合、進行TFOパケット内のLSMは出力されたままとなる。通常のTFOパケットと進行TFOパケット内のLSMとの間の差を更に明瞭にするために、次の表は各ケースに対して予想されるはずのバイトを示している。
【0118】
【表12】
【0119】
ARM10のTRACEインターフェース
この章では、ARM1020EとETM10との間の信号インターフェースが記載されている。このインターフェースの大部分はARM1020EによってETM10にドライブされる。信号の記述はカスタムデータパス入力と、合成された制御入力と、ETM出力とに分割されている。合成制御信号は後に変更できるが、データパス信号の変更はカスタムロジックのリワークを必要とするので、これらは設計において後に変更することはできない。すべての入力信号はETM10内に即座に登録され、すべての出力はレジスタの出力端から直接ドライブされる。インターフェースは合計220の信号から成り、これら信号は213の入力信号と、ETM10パースペクティブからの4つの出力信号とを含む。
【0120】
1.24 ETMデータパス入力
ETMデータトレーシング用に関係するデータバスは4つある。すなわちロードデータバスと、記憶データバスと、MCRデータバスと、MRCデータバスとがある。これら4つのすべてのバスは幅が64ビットである。所定サイクルにおいては、これらバスのうちの1つしか有効データを含むことができないので、4つのすべてのバスはARM1020E内では1つの64ビットデータバス、すなわちETMDATAに多重化されている。ETMDATAはETMにドライブされる前にARM1020E内に登録される。このETMデータはARM1020Eのパイプラインの書き込み(WR)ステージにおいて有効である。ARM1020EからETM10へドライブされるアドレスバスは4つある。これらバスのうちの3つは命令アドレス用であり、残りの1つはデータアドレス用である。R15バスはARM1020Eパイプラインの実行(EX)ステージ内でETMにドライブされるが、一方、IAおよびDAアドレスバスはメモリ(ME)内で有効である。ETMにドライブされるすべてのデータパスバスは次の表に示されている。
【0121】
【表13】
【0122】
1.25 ETM制御入力
1.25.1 ETMCORECTL[23:0]
ETMCORECTLはすべてARM10のコアから来る種々の制御信号を含む。これら信号はすべてコア内に登録され、ETM10にドライブされる前にこの共通バス上で組み合わされる。これらバス上に存在する制御信号およびそれらの意味は次の表に示されている。特に指定されない限り、ARM1020Eのパイプラインの書き込みステージ(WR)において、これらのいずれもが有効である。
【0123】
【表14】
【0124】
1.25.2 ETMDATAVALID[1:1]
この信号はバスETMDATA[63:0]でドライブされるデータを評価する。データバスのうちの各半分に対し1つのビットがある。
【0125】
1.26 ETM出力
この章では、ARM1020Eにフィードバックされる出力およびARM1020Eから必要とされるものについて記載する。
【0126】
1.26.1 FIFOFULL
イネーブル時にFIFO内に挿入されたバイトがある時は、ETM出力のFIFOFULLがアサートされ、FIFOが空になるまでアサートされた状態のままとなる。この動作はFIFOFULLをアサートする前にFIFOが所定の指定されたレベルに達するまで待機するETM7/9と若干異なっている(4.16章を参照)。FIFOFULLはコア、本例ではARM1020Eによって使用され、ARMパイプラインを停止させる。これによってETMのオーバーフローが防止されるので、コア内で生じる事象のタイミングを若干変更する福次的効果により完全なトレースを保証できる。ここで、タイミング要因によりFIFOFULLのアサーションの結果、ARM1020Eの中間ストールは生じない。従って、稀なことであるが、FIFOFULLがアサートされていても、オーバーフローが生じる可能性が時々ある。このオーバーフローが生じた時に、ミスした命令の数は少ない。その理由は、FIFOが排出中である間、(FIFOFULLのアサーションに起因し)プロセッサは停止された状態のままとなるからである。
【0127】
1.26.2 PWRDOWN
HIGHの時、このことはETMが現在イネーブルされていないことを示すので、CLK入力をストップできる。これはトレースを使用していない時の電力消費量を低減するのに使用される。リセット時にPWRDOWNはETM10がプログラムされるまでアサートされる。ARM10200のテストチップはETM10のCLK入力を直接ゲート制御するのにPWRDOWN出力を使用しなければならない。以前指摘したように、PWRDOWNはCONTEXT IDの更新時に一時的にディスエーブルされ、ETM10の内部CONTEXT IDシャドーレジスタでの更新を可能にする。CONTEXT ID更新のケースを除き、PWRDOWNはTCLKに同期して変更され、デバッグセッションの開始時にARMデバッグツールによってクリアされる。PWRDOWNはトレースがイネーブルされる前に多くのサイクルを変えるので、ETM10のCLKをゲート制御するのにTCLKに基づく信号を使用しても準安定性問題を生じさせない。
【0128】
1.26.3 DBGRQ
先のETMの実現例と同じように、トリガー条件が生じた時は常にDBGRQをアサートするよう、ETM10をプログラムすることができる。DBGRQはDGBACKが発見されるまでアサートされたままである。DBGRQはARM1020Eの外部デバッグリクエストピン、すなわちEDBGRQに接続しなければならない。このETM出力に対してはARM1020Eからのエキストラサポートは不要である。EDBGRQ入力がASIC内の他の、ある機能ブロックによって既に使用されている場合には、多数のDBGRQ信号を共にOR演算することができる。このようにデバッグをイネーブリングすることは、任意の特定の命令境界に入るように保証されていないことに留意すべきである。更に、ARM10がそのときにハードウェアデバッグモードとなっていいる場合、コアはEDGBRQを認識するにすぎない。
【0129】
1.26.4 TDO
ETM10は先のETMバージョンと同じTAPインターフェース配線を使用する。TDOピンはARM1020Eのスキャン拡張入力SDOUTBSに接続されており、ETM10のレジスタは先のETM実現例と同じように、スキャンチェイン6によってアクセスされ、プログラムされる。このETM出力に対してはARM1020Eからのエキストラサポートは不要である。
【0130】
コンフィギュレーション
ETM7/9は小、中および大コンフィギュレーションで利用できていた。中および大コンフィギュレーションは、別のエリアを代償にして、より多数のトリガーハードウェアリソースおよび大きいFIFO深さを提供する。新コンフィギュレーションと共にソフトマクロを単に再合成するだけで、異なるASICアプリケーションに対し、異なるコンフィギュレーションを選択できる。ETM10は同様な範囲のコンフィギュレーションを提供する。次の表は現在ETM10に対して提案されているコンフィギュレーションを示す。ほとんどのトリガーリソースはETM7およびETM9と同一であるが、例外は、64ビットコンパレータのサイズが大きくなっていることにより、大コンフィギュレーションにおけるデータコンパレータが8つから4つまで減少していることである。各コンフィギュレーションにおける大きいFIFOサイズはARM1020Eの、より高い命令スループット(すなわち性能)をサポートする必要があることを示している。各コンフィギュレーションに対するFIFOサイズは面積の影響および性能のモデル化からのフィードバックに基づき増加できる。ETM10のコンフィギュレーションに対して与えられるゲートカウントはETM10のrtlモデルの初期の合成に基づく推定値である。これら推定されたゲートカウントは最終実現例で得られるカウントと異なる可能性が高い。大きいサイズのETM10はARM10200テストチップに挿入されるものである。各カテゴリーにおけるETM9用のリソースの対応する数は比較のために括弧内に示されている。
【0131】
【表15】
【図面の簡単な説明】
【図1】オンチップトレーシング機構を提供するデータ処理システムを略図で示す。
【図2】データをトレーシングする際のデータアクセスミスの問題を略図で示す。
【図3】データアクセスミスを取り扱うための3つの異なるシステムのうちの1つを略図で示す。
【図4】データアクセスミスを取り扱うための3つの異なるシステムのうちの1つを略図で示す。
【図5】データアクセスミスを取り扱うための3つの異なるシステムのうちの1つを略図で示す。
【図6】トレーストリガー機構を示す。
【図7】データアクセスミスに対応するように構成できるトレーストリガー機構の動作量を示す。
【図8】データアクセスミスに対応するように構成できるトレーストリガー機構の動作量を示す。
【図9】トレーシング機構およびマルチワードデータ転送命令をサポートするデータ処理システムを略図で示す。
【図10】マルチワードデータ転送命令を略図で示す。
【図11】マルチワードデータ転送命令およびその結果生じるトレースデータストリームにより途中で生じるトレーストリガーポイントを略図で示す。
【図12】オンチップトレーシングハードウェア内の制御フローを示すフローチャートである。
【図13】図9〜12のシステムに従って発生されるトレースデータを分析するためのシステム内で実行できる処理オペレーションを略図で示す。
【符号の説明】
2 データ処理システム
4 集積回路
6 マイクロプロセッサコア
8 キャッシュメモリ
10 オンチップトレースモジュールコントローラ
12 オンチップトレースバッファ
14 外部メモリ
16 プロセッサコア
18 外部記憶装置
Claims (12)
- (i)処理命令の制御によりデータ値を処理する処理回路と、
(ii)処理すべきデータ値を記憶するメモリであって、前記処理回路は前記メモリ内に記憶されたデータ値にアクセスするためのデータアクセス命令に応答するものであるメモリと、
(iii)前記処理回路によって実行される処理命令および前記処理回路によってアクセスされるデータ値をそれぞれ識別するデータから成る複数のトレースデータのストリームを発生してトレースバッファに記録させるトレーシング回路とを備え、
(iv)データアクセス命令は、予め決められた処理サイクル時間内にデータアクセス命令に対応するデータ値をメモリから得ることのできないデータミスを発生させることがあり、
(v)前記トレーシング回路は、データミスが発生すると、前記トレースデータのストリーム内のデータミスが発生しなかった場合にデータ値を識別するデータが置かれるべき位置にデータプレイスホルダーを代わりに発生して前記トレースバッファに記録させ、
データ値を前記予め決められた処理サイクル時間のあとに遅れて得た時に、前記トレーシング回路は遅れて得たデータ値を識別するデータを前記トレースデータのストリーム内の最尾部に挿入する、
データを処理するための装置。 - 前記メモリが、キャッシュメモリとメインメモリとを含み、アクセス中のデータ値が前記キャッシュメモリ内に記憶されていない時にデータミスが生じる、請求項1記載の装置。
- 前記データプレイスホルダーが前記データプレイスホルダーに対応するタグ値を含み、前記遅れて得たデータ値を識別するデータが前記プレイスホルダーのタグ値に一致するタグ値を含む、請求項1記載の装置。
- 複数のデータミスの結果、複数のデータプレイスホルダーが発生された場合、遅れて得たデータ値を識別するデータをデータミスが発生した順序とは異なる順序で発生して前記トレースバッファに記録できる、請求項3記載の装置。
- 前記データプレイスホルダーが、トレースの開始から該データプレイスホルダーが生成された時点の間にメモリから得ることのできなかったデータ値の数を示す、請求項1記載の装置。
- 前記トレースデータのストリームには周期的に同期化データが挿入され、前記同期化データがトレースの開始から該同期化データが挿入された時点の間にメモリから得ることのできなかったデータ値の数を示すデータを含む、請求項1記載の装置。
- 前記トレーシング回路が、1つ以上の前記データ値および該データ値に関連するメモリアドレスに依存するトリガー条件に相当する予め決められた条件の検出によって、トレーシングオペレーションを制御する、請求項1記載の装置。
- 前記トレーシング回路が、完全一致信号によって、データミスが発生した場合のそのデータに関連する前記トリガー条件を、
(i)前記データ値を得て、前記トリガー条件に合致することが判るまでトリガーしない完全一致トリガー条件、または
(ii)データミス時に、将来得られるデータ値が前記トリガー条件に合致すると仮定してトリガーする非完全一致トリガ条件、
のいずれかとする、請求項7記載の装置。 - 前記完全一致信号によるトリガー条件(i)または(ii)がユーザーによって選択可能である、請求項8記載の装置。
- 前記トリガー条件の使用によって、前記完全一致信号がハードウェア制御下に置かれる、請求項8記載の装置。
- 前記完全一致信号が複数の異なる値を持ち、前記トレーシング回路の異なる部分が同時に動作して、それによって前記トリガー条件を、(i)完全一致トリガー条件、または、(ii)非完全一致トリガ条件のいずれかとする、請求項8記載の装置。
- (i)処理回路によって、処理命令の制御によりデータ値を処理する工程と、
(ii)処理すべきデータ値をメモリ内に記憶する工程とを備え、前記処理装置がデータアクセス命令に応答して前記メモリ内に記憶されたデータ値にアクセスし、
(iii)トレーシング回路を使用して、複数トレースデータのストリームを発生する工程であって、各トレースデータは前記処理回路によって実行された処理命令およびアクセスされたデータ値をそれぞれ識別するデータから成り、
(iv)データアクセス命令は、予め決められた処理サイクル時間内にデータアクセス命令に対応するデータ値をメモリから得ることのできないデータミスを発生させることがあり、
(v)前記トレーシング回路は、データミスが発生すると、前記トレースデータのストリーム内のデータミスが発生しなかった場合にデータ値を識別するデータがおかれるべき位置に、代わりにデータスペースホルダーを発生し、前記データ値を前記予め決められた処理サイクル時間のあとに遅れて得た時に、前記遅れて得たデータ値を識別するデータを前記トレースデータのストリーム内に最尾部に挿入する、
データを処理する方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US773387 | 1991-10-08 | ||
US09/773,387 US7093236B2 (en) | 2001-02-01 | 2001-02-01 | Tracing out-of-order data |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002244881A JP2002244881A (ja) | 2002-08-30 |
JP4038372B2 true JP4038372B2 (ja) | 2008-01-23 |
Family
ID=25098097
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001384402A Expired - Lifetime JP4038372B2 (ja) | 2001-02-01 | 2001-12-18 | 順序外データのトレーシング |
Country Status (3)
Country | Link |
---|---|
US (2) | US7093236B2 (ja) |
JP (1) | JP4038372B2 (ja) |
GB (1) | GB2371897B (ja) |
Families Citing this family (108)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6985848B2 (en) * | 2000-03-02 | 2006-01-10 | Texas Instruments Incorporated | Obtaining and exporting on-chip data processor trace and timing information |
US7287147B1 (en) * | 2000-12-29 | 2007-10-23 | Mips Technologies, Inc. | Configurable co-processor interface |
US7069544B1 (en) * | 2001-04-30 | 2006-06-27 | Mips Technologies, Inc. | Dynamic selection of a compression algorithm for trace data |
US7124072B1 (en) | 2001-04-30 | 2006-10-17 | Mips Technologies, Inc. | Program counter and data tracing from a multi-issue processor |
US7181728B1 (en) | 2001-04-30 | 2007-02-20 | Mips Technologies, Inc. | User controlled trace records |
US7168066B1 (en) * | 2001-04-30 | 2007-01-23 | Mips Technologies, Inc. | Tracing out-of order load data |
US7185234B1 (en) | 2001-04-30 | 2007-02-27 | Mips Technologies, Inc. | Trace control from hardware and software |
US7178133B1 (en) | 2001-04-30 | 2007-02-13 | Mips Technologies, Inc. | Trace control based on a characteristic of a processor's operating state |
US7134116B1 (en) | 2001-04-30 | 2006-11-07 | Mips Technologies, Inc. | External trace synchronization via periodic sampling |
US7065675B1 (en) | 2001-05-08 | 2006-06-20 | Mips Technologies, Inc. | System and method for speeding up EJTAG block data transfers |
CA2347647A1 (en) * | 2001-05-15 | 2002-11-15 | Ibm Canada Limited-Ibm Canada Limitee | Storing and restoring snapshots of a computer process |
US7231551B1 (en) | 2001-06-29 | 2007-06-12 | Mips Technologies, Inc. | Distributed tap controller |
US7043668B1 (en) | 2001-06-29 | 2006-05-09 | Mips Technologies, Inc. | Optimized external trace formats |
US6834365B2 (en) * | 2001-07-17 | 2004-12-21 | International Business Machines Corporation | Integrated real-time data tracing with low pin count output |
US7080289B2 (en) * | 2001-10-10 | 2006-07-18 | Arm Limited | Tracing multiple data access instructions |
US6990569B2 (en) * | 2001-10-25 | 2006-01-24 | Arm Limited | Handling problematic events in a data processing apparatus |
US6615371B2 (en) * | 2002-03-11 | 2003-09-02 | American Arium | Trace reporting method and system |
US7055139B2 (en) * | 2002-03-28 | 2006-05-30 | Hewlett-Packard Development Company, L.P. | Multiprocess debugging using multiple conventional debuggers |
US7254115B1 (en) * | 2002-08-28 | 2007-08-07 | Advanced Micro Devices, Inc. | Split-transaction bus intelligent logic analysis tool |
US7359994B1 (en) | 2002-08-28 | 2008-04-15 | Advanced Micro Devices, Inc. | Split-transaction bus decoder |
US7099817B2 (en) * | 2002-11-22 | 2006-08-29 | Texas Instruments Incorporated | Stalling CPU pipeline to prevent corruption in trace while maintaining coherency with asynchronous events |
US7171497B2 (en) * | 2002-11-22 | 2007-01-30 | Texas Instruments Incorporated | Progressive extended compression mask for dynamic trace |
US20040103399A1 (en) * | 2002-11-22 | 2004-05-27 | Manisha Agarwala | Data trace compression map |
US20040128597A1 (en) * | 2002-12-17 | 2004-07-01 | Swoboda Gary L. | Apparatus and method for selecting program halts in an unprotected pipeline at non-interruptible points in code execution |
US7299386B2 (en) * | 2002-12-17 | 2007-11-20 | Texas Instruments Incorporated | Apparatus and method for detecting address characteristics for use with a trigger generation unit in a target processor |
CA2424006A1 (en) * | 2003-03-28 | 2004-09-28 | Ibm Canada Limited - Ibm Canada Limitee | A technique to generically manage extensible correlation data |
US7331003B2 (en) * | 2003-05-09 | 2008-02-12 | Hewlett-Packard Development Company, L.P. | Match circuit for performance counter |
US7159101B1 (en) | 2003-05-28 | 2007-01-02 | Mips Technologies, Inc. | System and method to trace high performance multi-issue processors |
ES2231042B2 (es) * | 2003-08-06 | 2006-08-16 | Hewlett-Packard Development Company, L.P. | Circuito de adaptacion para contador de comportamiento. |
US7395527B2 (en) | 2003-09-30 | 2008-07-01 | International Business Machines Corporation | Method and apparatus for counting instruction execution and data accesses |
US20050071816A1 (en) * | 2003-09-30 | 2005-03-31 | International Business Machines Corporation | Method and apparatus to autonomically count instruction execution for applications |
US7373637B2 (en) | 2003-09-30 | 2008-05-13 | International Business Machines Corporation | Method and apparatus for counting instruction and memory location ranges |
US20050071608A1 (en) * | 2003-09-30 | 2005-03-31 | International Business Machines Corporation | Method and apparatus for selectively counting instructions and data accesses |
US7937691B2 (en) | 2003-09-30 | 2011-05-03 | International Business Machines Corporation | Method and apparatus for counting execution of specific instructions and accesses to specific data locations |
US7421681B2 (en) | 2003-10-09 | 2008-09-02 | International Business Machines Corporation | Method and system for autonomic monitoring of semaphore operation in an application |
US8381037B2 (en) | 2003-10-09 | 2013-02-19 | International Business Machines Corporation | Method and system for autonomic execution path selection in an application |
US7225309B2 (en) * | 2003-10-09 | 2007-05-29 | International Business Machines Corporation | Method and system for autonomic performance improvements in an application via memory relocation |
US20050086455A1 (en) * | 2003-10-16 | 2005-04-21 | International Business Machines Corporation | Method and apparatus for generating interrupts for specific types of instructions |
US7458078B2 (en) * | 2003-11-06 | 2008-11-25 | International Business Machines Corporation | Apparatus and method for autonomic hardware assisted thread stack tracking |
US7257657B2 (en) * | 2003-11-06 | 2007-08-14 | International Business Machines Corporation | Method and apparatus for counting instruction execution and data accesses for specific types of instructions |
US7328429B2 (en) * | 2003-11-13 | 2008-02-05 | Intel Corporation | Instruction operand tracing for software debug |
US7293164B2 (en) * | 2004-01-14 | 2007-11-06 | International Business Machines Corporation | Autonomic method and apparatus for counting branch instructions to generate branch statistics meant to improve branch predictions |
US7197586B2 (en) * | 2004-01-14 | 2007-03-27 | International Business Machines Corporation | Method and system for recording events of an interrupt using pre-interrupt handler and post-interrupt handler |
US7526757B2 (en) | 2004-01-14 | 2009-04-28 | International Business Machines Corporation | Method and apparatus for maintaining performance monitoring structures in a page table for use in monitoring performance of a computer program |
US7114036B2 (en) * | 2004-01-14 | 2006-09-26 | International Business Machines Corporation | Method and apparatus for autonomically moving cache entries to dedicated storage when false cache line sharing is detected |
US7392370B2 (en) * | 2004-01-14 | 2008-06-24 | International Business Machines Corporation | Method and apparatus for autonomically initiating measurement of secondary metrics based on hardware counter values for primary metrics |
US7290255B2 (en) * | 2004-01-14 | 2007-10-30 | International Business Machines Corporation | Autonomic method and apparatus for local program code reorganization using branch count per instruction hardware |
US7415705B2 (en) * | 2004-01-14 | 2008-08-19 | International Business Machines Corporation | Autonomic method and apparatus for hardware assist for patching code |
US7093081B2 (en) | 2004-01-14 | 2006-08-15 | International Business Machines Corporation | Method and apparatus for identifying false cache line sharing |
US7181599B2 (en) | 2004-01-14 | 2007-02-20 | International Business Machines Corporation | Method and apparatus for autonomic detection of cache “chase tail” conditions and storage of instructions/data in “chase tail” data structure |
US7895382B2 (en) * | 2004-01-14 | 2011-02-22 | International Business Machines Corporation | Method and apparatus for qualifying collection of performance monitoring events by types of interrupt when interrupt occurs |
US7496908B2 (en) * | 2004-01-14 | 2009-02-24 | International Business Machines Corporation | Method and apparatus for optimizing code execution using annotated trace information having performance indicator and counter information |
US7082486B2 (en) * | 2004-01-14 | 2006-07-25 | International Business Machines Corporation | Method and apparatus for counting interrupts by type |
US7987453B2 (en) * | 2004-03-18 | 2011-07-26 | International Business Machines Corporation | Method and apparatus for determining computer program flows autonomically using hardware assisted thread stack tracking and cataloged symbolic data |
US7421684B2 (en) * | 2004-03-22 | 2008-09-02 | International Business Machines Corporation | Method and apparatus for autonomic test case feedback using hardware assistance for data coverage |
US7296130B2 (en) | 2004-03-22 | 2007-11-13 | International Business Machines Corporation | Method and apparatus for providing hardware assistance for data access coverage on dynamically allocated data |
US7526616B2 (en) | 2004-03-22 | 2009-04-28 | International Business Machines Corporation | Method and apparatus for prefetching data from a data structure |
US7480899B2 (en) | 2004-03-22 | 2009-01-20 | International Business Machines Corporation | Method and apparatus for autonomic test case feedback using hardware assistance for code coverage |
US7299319B2 (en) | 2004-03-22 | 2007-11-20 | International Business Machines Corporation | Method and apparatus for providing hardware assistance for code coverage |
US8135915B2 (en) | 2004-03-22 | 2012-03-13 | International Business Machines Corporation | Method and apparatus for hardware assistance for prefetching a pointer to a data structure identified by a prefetch indicator |
US20050240727A1 (en) * | 2004-04-23 | 2005-10-27 | Shishir Shah | Method and system for managing storage area networks |
US7669190B2 (en) * | 2004-05-18 | 2010-02-23 | Qlogic, Corporation | Method and system for efficiently recording processor events in host bus adapters |
US20060064531A1 (en) * | 2004-09-23 | 2006-03-23 | Alston Jerald K | Method and system for optimizing data transfer in networks |
JP4608276B2 (ja) * | 2004-10-04 | 2011-01-12 | ルネサスエレクトロニクス株式会社 | トレース制御回路、マイクロプロセッサ及びトレース制御方法 |
JP2006120071A (ja) * | 2004-10-25 | 2006-05-11 | Matsushita Electric Ind Co Ltd | プロセッサおよび開発支援装置 |
US7886198B2 (en) * | 2005-05-16 | 2011-02-08 | Texas Instruments Incorporated | Method and system of identifying overlays used by a program |
US7774763B1 (en) | 2005-06-22 | 2010-08-10 | Emc Corporation | Techniques for forming a multi-tasking executable program and using the same |
JP4832125B2 (ja) * | 2006-03-15 | 2011-12-07 | 富士通セミコンダクター株式会社 | 性能解析装置、性能解析方法、性能解析プログラム、および記録媒体 |
US8087002B2 (en) * | 2006-04-04 | 2011-12-27 | Tibco Software Inc. | Method and system for providing a visual debugger for an interpreted statistical language |
US20080155235A1 (en) * | 2006-10-02 | 2008-06-26 | Dewey Douglas W | Instructions Capable of Preventing Incorrect Usage of UContext Functions in a Multi-Process Environment |
US8370806B2 (en) * | 2006-11-15 | 2013-02-05 | Qualcomm Incorporated | Non-intrusive, thread-selective, debugging method and system for a multi-thread digital signal processor |
US8533530B2 (en) | 2006-11-15 | 2013-09-10 | Qualcomm Incorporated | Method and system for trusted/untrusted digital signal processor debugging operations |
US8341604B2 (en) * | 2006-11-15 | 2012-12-25 | Qualcomm Incorporated | Embedded trace macrocell for enhanced digital signal processor debugging operations |
US8380966B2 (en) * | 2006-11-15 | 2013-02-19 | Qualcomm Incorporated | Method and system for instruction stuffing operations during non-intrusive digital signal processor debugging |
US7536615B1 (en) * | 2007-03-26 | 2009-05-19 | Lattice Semiconductor Corporation | Logic analyzer systems and methods for programmable logic devices |
US7743296B1 (en) * | 2007-03-26 | 2010-06-22 | Lattice Semiconductor Corporation | Logic analyzer systems and methods for programmable logic devices |
US20080244327A1 (en) * | 2007-03-28 | 2008-10-02 | Seagate Technology Llc | Trace device for monitoring electronic device |
US8484516B2 (en) * | 2007-04-11 | 2013-07-09 | Qualcomm Incorporated | Inter-thread trace alignment method and system for a multi-threaded processor |
US7783865B2 (en) * | 2007-08-01 | 2010-08-24 | International Business Machines Corporation | Conditional data watchpoint management |
JP2009059005A (ja) * | 2007-08-29 | 2009-03-19 | Panasonic Corp | デバッグシステム、デバッグ装置および方法 |
GB2456813B (en) * | 2008-01-24 | 2012-03-07 | Advanced Risc Mach Ltd | Diagnostic context construction and comparison |
US20090222797A1 (en) * | 2008-02-29 | 2009-09-03 | Infineon Technologies Ag | Apparatus and method for providing a trigger |
US8122437B2 (en) * | 2008-03-31 | 2012-02-21 | Freescale Semiconductor, Inc. | Method and apparatus to trace and correlate data trace and instruction trace for out-of-order processors |
US20100083237A1 (en) * | 2008-09-26 | 2010-04-01 | Arm Limited | Reducing trace overheads by modifying trace operations |
US8438547B2 (en) * | 2009-05-05 | 2013-05-07 | Freescale Semiconductor, Inc. | Address translation trace message generation for debug |
US8589738B2 (en) * | 2009-05-05 | 2013-11-19 | Freescale Semiconductor, Inc. | Program trace message generation for page crossing events for debug |
US8490061B2 (en) * | 2009-05-07 | 2013-07-16 | International Business Machines Corporation | Profiling application performance according to data structure |
WO2011048442A1 (en) * | 2009-10-22 | 2011-04-28 | Freescale Semiconductor, Inc. | Integrated circuits and methods for debugging |
US9582396B2 (en) * | 2009-10-23 | 2017-02-28 | Novell, Inc. | Techniques for generating an executable debugger script |
US9348688B2 (en) | 2010-06-21 | 2016-05-24 | Arm Limited | Correlating trace data streams |
GB2481384B (en) * | 2010-06-21 | 2018-10-10 | Advanced Risc Mach Ltd | Key allocation when tracing data processing systems |
GB2481380B (en) | 2010-06-21 | 2018-05-16 | Advanced Risc Mach Ltd | Correlating trace data streams |
GB2497736A (en) * | 2011-12-16 | 2013-06-26 | St Microelectronics Ltd | Hardware monitor with context selector for selecting from multiple contexts |
US8924796B2 (en) * | 2012-03-22 | 2014-12-30 | Intel Mobile Communications GmbH | System and method for processing trace information |
US8954809B2 (en) * | 2012-07-25 | 2015-02-10 | Texas Instruments Incorporated | Method for generating descriptive trace gaps |
US10339229B1 (en) | 2013-05-31 | 2019-07-02 | Cadence Design Systems, Inc. | Simulation observability and control of all hardware and software components of a virtual platform model of an electronics system |
US9195457B1 (en) * | 2014-06-11 | 2015-11-24 | Amazon Technologies, Inc. | Interactive application programming interface documentation |
GB2530050B (en) * | 2014-09-10 | 2021-07-21 | Advanced Risc Mach Ltd | Debugging in a data processing apparatus |
US9632907B2 (en) * | 2014-12-10 | 2017-04-25 | Intel Corporation | Tracking deferred data packets in a debug trace architecture |
US11487561B1 (en) | 2014-12-24 | 2022-11-01 | Cadence Design Systems, Inc. | Post simulation debug and analysis using a system memory model |
US10802852B1 (en) * | 2015-07-07 | 2020-10-13 | Cadence Design Systems, Inc. | Method for interactive embedded software debugging through the control of simulation tracing components |
EP3338192A1 (en) | 2015-08-18 | 2018-06-27 | Telefonaktiebolaget LM Ericsson (PUBL) | Method for observing software execution, debug host and debug target |
US10095603B2 (en) | 2017-01-09 | 2018-10-09 | International Business Machines Corporation | Pre-fetching disassembly code for remote software debugging |
US10599555B2 (en) * | 2017-09-20 | 2020-03-24 | Texas Instruments Incorporated | Context-sensitive debug requests for memory access |
US20190354369A1 (en) * | 2018-05-15 | 2019-11-21 | Sandisk Technologies, Llc | Computing architecture to provide simplified post-silicon debugging capabilities |
US10747543B2 (en) | 2018-12-28 | 2020-08-18 | Marvell Asia Pte, Ltd. | Managing trace information storage using pipeline instruction insertion and filtering |
US11928045B1 (en) * | 2021-04-21 | 2024-03-12 | Cadence Design Systems, Inc. | System and method for non-intrusive debugging at an embedded software breakpoint |
US20230185651A1 (en) * | 2021-12-10 | 2023-06-15 | Arm Limited | Post-manufacturing adaptation of a data processing apparatus |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4439827A (en) | 1981-12-28 | 1984-03-27 | Raytheon Company | Dual fetch microsequencer |
US4590550A (en) * | 1983-06-29 | 1986-05-20 | International Business Machines Corporation | Internally distributed monitoring system |
US4794521A (en) * | 1985-07-22 | 1988-12-27 | Alliant Computer Systems Corporation | Digital computer with cache capable of concurrently handling multiple accesses from parallel processors |
JPS6240538A (ja) | 1985-08-15 | 1987-02-21 | Mitsubishi Electric Corp | デ−タ処理装置 |
US4821178A (en) * | 1986-08-15 | 1989-04-11 | International Business Machines Corporation | Internal performance monitoring by event sampling |
US5115500A (en) | 1988-01-11 | 1992-05-19 | International Business Machines Corporation | Plural incompatible instruction format decode method and apparatus |
US5151981A (en) * | 1990-07-13 | 1992-09-29 | International Business Machines Corporation | Instruction sampling instrumentation |
GB9023633D0 (en) * | 1990-10-31 | 1990-12-12 | Int Computers Ltd | Predicting the performance of a computer system |
JP2777496B2 (ja) * | 1991-02-28 | 1998-07-16 | インターナショナル・ビジネス・マシーンズ・コーポレイション | コンピュータシステムにおいてマルチプロセスをプロファイリングする際の使用方法 |
DE69227604T2 (de) | 1991-03-11 | 1999-06-24 | Silicon Graphics Inc Mountain | Rückwärts kompatible Rechnerarchitektur mit erweiterten Wortbreiten und Adressraum |
US5347652A (en) * | 1991-06-26 | 1994-09-13 | International Business Machines Corporation | Method and apparatus for saving and retrieving functional results |
US5265254A (en) * | 1991-08-14 | 1993-11-23 | Hewlett-Packard Company | System of debugging software through use of code markers inserted into spaces in the source code during and after compilation |
US5379432A (en) * | 1993-07-19 | 1995-01-03 | Taligent, Inc. | Object-oriented interface for a procedural operating system |
US5555392A (en) * | 1993-10-01 | 1996-09-10 | Intel Corporation | Method and apparatus for a line based non-blocking data cache |
US5550974A (en) * | 1994-04-15 | 1996-08-27 | Motorola, Inc. | Testable memory array which is immune to multiple wordline assertions during scan testing |
GB2290395B (en) | 1994-06-10 | 1997-05-28 | Advanced Risc Mach Ltd | Interoperability with multiple instruction sets |
EP0689141A3 (en) | 1994-06-20 | 1997-10-15 | At & T Corp | Disruption-based hardware support for system performance profiling |
US6139198A (en) * | 1994-10-04 | 2000-10-31 | International Business Machines Corporation | System and method for enabling tracing of program execution in an object-oriented system |
US5659785A (en) * | 1995-02-10 | 1997-08-19 | International Business Machines Corporation | Array processor communication architecture with broadcast processor instructions |
US5745729A (en) * | 1995-02-16 | 1998-04-28 | Sun Microsystems, Inc. | Methods and apparatuses for servicing load instructions |
US5541920A (en) * | 1995-06-15 | 1996-07-30 | Bay Networks, Inc. | Method and apparatus for a delayed replace mechanism for a streaming packet modification engine |
EP0762280B1 (en) | 1995-08-30 | 2001-11-14 | Motorola, Inc. | Data processor with built-in emulation circuit |
US5802273A (en) | 1996-12-17 | 1998-09-01 | International Business Machines Corporation | Trailing edge analysis |
GB9626401D0 (en) | 1996-12-19 | 1997-02-05 | Sgs Thomson Microelectronics | Diagnostic procedures in an integrated circuit device |
US5978886A (en) * | 1997-01-17 | 1999-11-02 | Hewlett-Packard Company | Method and apparatus for duplicating tag systems to maintain addresses of CPU data stored in write buffers external to a cache |
US5978742A (en) * | 1997-04-04 | 1999-11-02 | Tektronix, Inc. | Method and apparatus for digital sampling of electrical waveforms |
US6009270A (en) * | 1997-04-08 | 1999-12-28 | Advanced Micro Devices, Inc. | Trace synchronization in a processor |
US5987598A (en) * | 1997-07-07 | 1999-11-16 | International Business Machines Corporation | Method and system for tracking instruction progress within a data processing system |
US6077311A (en) * | 1997-07-09 | 2000-06-20 | Silicon Graphics, Inc. | Method and apparatus for extraction of program region |
US6175913B1 (en) | 1997-09-12 | 2001-01-16 | Siemens Ag | Data processing unit with debug capabilities using a memory protection unit |
US6125400A (en) * | 1997-11-10 | 2000-09-26 | International Business Machines Corporation | Method and system of running object oriented programs across a network through compression and distillation of remote method invocation |
US6374367B1 (en) | 1997-11-26 | 2002-04-16 | Compaq Computer Corporation | Apparatus and method for monitoring a computer system to guide optimization |
US6000044A (en) * | 1997-11-26 | 1999-12-07 | Digital Equipment Corporation | Apparatus for randomly sampling instructions in a processor pipeline |
US5923872A (en) * | 1997-11-26 | 1999-07-13 | Digital Equipment Corporation | Apparatus for sampling instruction operand or result values in a processor pipeline |
US6052802A (en) * | 1997-12-31 | 2000-04-18 | Intel Corporation | Apparatus and method for cycle accounting in microprocessors |
US6067644A (en) * | 1998-04-15 | 2000-05-23 | International Business Machines Corporation | System and method monitoring instruction progress within a processor |
JP3258284B2 (ja) | 1998-11-10 | 2002-02-18 | セイコーインスツルメンツ株式会社 | 半導体回路 |
US6247097B1 (en) * | 1999-01-22 | 2001-06-12 | International Business Machines Corporation | Aligned instruction cache handling of instruction fetches across multiple predicted branch instructions |
US6415378B1 (en) * | 1999-06-30 | 2002-07-02 | International Business Machines Corporation | Method and system for tracking the progress of an instruction in an out-of-order processor |
US6574727B1 (en) * | 1999-11-04 | 2003-06-03 | International Business Machines Corporation | Method and apparatus for instruction sampling for performance monitoring and debug |
US6539502B1 (en) * | 1999-11-08 | 2003-03-25 | International Business Machines Corporation | Method and apparatus for identifying instructions for performance monitoring in a microprocessor |
US6681321B1 (en) * | 2000-04-20 | 2004-01-20 | International Business Machines Corporation | Method system and apparatus for instruction execution tracing with out of order processors |
-
2001
- 2001-02-01 US US09/773,387 patent/US7093236B2/en not_active Expired - Lifetime
- 2001-02-26 US US09/792,643 patent/US7020768B2/en not_active Expired - Lifetime
- 2001-10-18 GB GB0125095A patent/GB2371897B/en not_active Expired - Lifetime
- 2001-12-18 JP JP2001384402A patent/JP4038372B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US7020768B2 (en) | 2006-03-28 |
GB2371897A (en) | 2002-08-07 |
GB2371897B (en) | 2004-10-06 |
JP2002244881A (ja) | 2002-08-30 |
US7093236B2 (en) | 2006-08-15 |
US20020184477A1 (en) | 2002-12-05 |
GB0125095D0 (en) | 2001-12-12 |
US20020147965A1 (en) | 2002-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4038372B2 (ja) | 順序外データのトレーシング | |
US7080289B2 (en) | Tracing multiple data access instructions | |
JP4225851B2 (ja) | データ処理装置用トレース要素生成システム | |
US20040030962A1 (en) | Generation of trace elements within a data processing apparatus | |
JP3105223B2 (ja) | マイクロコンピュータ,マイクロプロセッサおよびコア・プロセッサ集積回路用デバッグ周辺装置 | |
US4879646A (en) | Data processing system with a pipelined structure for editing trace memory contents and tracing operations during system debugging | |
US5347636A (en) | Data processor which efficiently accesses main memory and input/output devices | |
US7093108B2 (en) | Apparatus and method for efficiently incorporating instruction set information with instruction addresses | |
Brunvand | The NSR processor | |
JP2003085000A (ja) | トレース情報生成装置およびその方法 | |
JP2004171573A (ja) | 新規な分割命令トランズアクションモデルを使用して構築したコプロセッサ拡張アーキテクチャ | |
JPH05204709A (ja) | プロセッサ | |
JP2002163127A (ja) | トレース制御回路 | |
JP2003263337A (ja) | デバック機能内蔵型マイクロコンピュータ | |
KR100605141B1 (ko) | 디버깅을 위해 데이터 최적화와 동시에 객체 크기 정보의 유지 | |
JPS62179033A (ja) | 集積回路マイクロプロセツサ | |
GB2389931A (en) | Selective generation of trace elements | |
JP2000231550A (ja) | マイクロプロセッサ | |
JP2003263339A (ja) | デバック機能内蔵型マイクロコンピュータ | |
WO2003034225A2 (en) | Debugging of processors | |
JPH08255476A (ja) | データ処理システムにおけるメモリ拡張スタック装置および方法 | |
JPH1049373A (ja) | パイプライン・デジタル・プロセッサにおいて多重で高精度の事象を操作する方法と装置 | |
JP4608276B2 (ja) | トレース制御回路、マイクロプロセッサ及びトレース制御方法 | |
JP3349911B2 (ja) | マイクロプロセッサ及びその開発支援装置 | |
JP2002541582A (ja) | エミュレータシステム内のユーザメモリを更新する方法およびシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060707 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060725 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20061025 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20061030 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070119 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070209 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070509 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070601 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070828 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20071003 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071023 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071105 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4038372 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101109 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111109 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111109 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121109 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121109 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131109 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |