JP5604373B2 - Instruction speculative execution tracing - Google Patents

Instruction speculative execution tracing Download PDF

Info

Publication number
JP5604373B2
JP5604373B2 JP2011136189A JP2011136189A JP5604373B2 JP 5604373 B2 JP5604373 B2 JP 5604373B2 JP 2011136189 A JP2011136189 A JP 2011136189A JP 2011136189 A JP2011136189 A JP 2011136189A JP 5604373 B2 JP5604373 B2 JP 5604373B2
Authority
JP
Japan
Prior art keywords
trace
group
instruction
value
traced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011136189A
Other languages
Japanese (ja)
Other versions
JP2012003771A (en
Inventor
ポール・アンソニー・ギルカーソン
ジョン・マイケル・ホーリー
Original Assignee
アーム・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アーム・リミテッド filed Critical アーム・リミテッド
Publication of JP2012003771A publication Critical patent/JP2012003771A/en
Application granted granted Critical
Publication of JP5604373B2 publication Critical patent/JP5604373B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30145Instruction analysis, e.g. decoding, instruction word fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/348Circuit details, i.e. tracer hardware
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/362Software debugging
    • G06F11/3636Software debugging by tracing the execution of the program
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3471Address tracing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/865Monitoring of software
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/88Monitoring involving counting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明の分野はデータ処理に関し、より具体的にはデータ処理操作を監視する診断機構に関する。   The field of the invention relates to data processing, and more specifically to a diagnostic mechanism for monitoring data processing operations.

処理回路によって行われる処理を追跡することが望ましい状況は数多くある。例えば、データ処理システムの開発中にはかかる情報が有用となる。トレーシングツールはかかる作業に役立つツールの一例である。   There are many situations in which it is desirable to track the processing performed by a processing circuit. For example, such information is useful during development of a data processing system. A tracing tool is an example of a tool useful for such work.

データ処理システムの活動をトレースすることで、システム内のステップごとの活動を表すデータを含むトレースストリームを生成すれば、システム開発に大いに役立つ。かかるトレーシングツールは、監視の対象となるチップ上に存在する組み込みトレースマクロセル(ETM、ARM Limited、ケンブリッジの商標)等、プログラムの流れをトレースするにあたって様々な手段を使用する。   By tracing the activity of a data processing system and generating a trace stream that includes data representing the activity of each step in the system, it is very useful for system development. Such a tracing tool uses various means for tracing the flow of a program such as an embedded trace macrocell (ETM, ARM Limited, a trademark of Cambridge) existing on a chip to be monitored.

処理システムのステップごとの全活動を監視すると、収集、伝送、蓄積するべきデータの量は途方もなく多くなる。そこで、この情報量を減らすため様々な方法が考案されてきた。例えば分岐や読み込み/蓄積命令等、一部の命令だけをトレースし、その他の「トレース無効」命令はこれらの「トレース有効」命令のトレースと命令ストリームの情報から推断することで、トレースデータの生成量を減らす。トレース無効とみなされる実行部分についてはトレースデータが生成されないようトレースのオン及びオフを切り替える機能を設けることで、トレースストリームのさらなる削減が可能である。米国特許第7,707,394号には命令の一部のみトレースする機能が記載されている。   Monitoring the overall activity of a processing system step by step results in a tremendous amount of data to collect, transmit and store. Various methods have been devised to reduce this amount of information. Trace data is generated by tracing only some instructions such as branch and read / store instructions, and other "trace invalid" instructions are inferred from the trace of these "trace valid" instructions and information of the instruction stream. Reduce the amount. By providing a function for switching on and off the trace so that the trace data is not generated for the execution portion regarded as invalid, it is possible to further reduce the trace stream. U.S. Pat. No. 7,707,394 describes the ability to trace only a portion of instructions.

殆どのプロセッサ命令セットアーキテクチャは、処理速度を高めるため命令を推測的に実行する機能を含んでいる。例えば、分岐が処理されるときのデータ処理システムの状態を条件とし、条件が真であるならば実行し目的地へ分岐し、条件が偽であるならば実行せず次の順次命令を継続する分岐命令は、何らかの形で実行するものと予測できるため、後続の命令は、条件が真又は偽であるかが分かる前に実行できる。予測を誤った場合は推測的に実行された命令をキャンセルし、分岐以前の状態にプロセッサを戻す必要がある。   Most processor instruction set architectures include the ability to speculatively execute instructions to increase processing speed. For example, if the condition is the state of the data processing system when the branch is processed, execute if the condition is true, branch to the destination, and if the condition is false, continue without executing the next sequential instruction Since branch instructions can be expected to execute in some way, subsequent instructions can be executed before the condition is known to be true or false. If the prediction is wrong, it is necessary to cancel the speculatively executed instruction and return the processor to the state before the branch.

推測的に実行される命令をトレースする場合、トレースストリーム出力を実際にコミットされる命令に整合させることは必ずしも容易ではない。   When tracing speculatively executed instructions, it is not always easy to match the trace stream output to the instructions that are actually committed.

第1の態様から見て、本発明は、少なくとも1つの命令ストリームを実行する少なくとも1つのプロセッサの処理活動を指示するトレースデータ項目を生成するトレースユニットを提供し、前記少なくとも1つの命令ストリームは複数の命令グループを備え、前記少なくとも1つのプロセッサは前記命令の少なくとも一部を推測的に実行し、前記トレースユニットは、現在のトレース制御データによって制御され前記少なくとも1つのプロセッサの挙動を監視するトレース回路と、前記実行される命令グループのうち該当する命令グループに関連する前記トレース制御データの少なくとも一部を蓄積するデータストアと、を備え、前記トレース回路は、前記命令グループの実行の検出に応じて前記トレース制御データを前記データストアに蓄積するよう構成され、前記トレース回路は、前記推測的に実行された少なくとも1つの命令グループをキャンセルする前記少なくとも1つのプロセッサを検出することに反応し、前記データストアに蓄積された前記トレース制御データの少なくとも一部を取り出し、且つ前記取り出されたトレース制御データにより前記トレース回路を制御する。   Viewed from a first aspect, the present invention provides a trace unit that generates a trace data item that indicates the processing activity of at least one processor executing at least one instruction stream, wherein the at least one instruction stream is a plurality. A trace circuit that speculatively executes at least a portion of the instructions and wherein the trace unit is controlled by current trace control data and monitors the behavior of the at least one processor And a data store for storing at least a part of the trace control data related to the corresponding instruction group among the executed instruction groups, the trace circuit responding to detection of execution of the instruction group The trace control data is stored in the data store. And wherein the trace circuit is responsive to detecting the at least one processor canceling the speculatively executed at least one instruction group and the trace control data stored in the data store. At least a part is extracted, and the trace circuit is controlled by the extracted trace control data.

本発明では、推測的命令を実行するデータ処理装置をトレースすると、推測的に実行された命令が後ほどキャンセルされた場合に、トレースデータ出力を理解することが困難になる場合があると認識する。本発明は、実行される各命令グループにつきトレース制御データをデータストアに蓄積することでこの問題に対処するものであり、こうすることで推測的に実行された命令がキャンセルされる場合には、以前に使われていたトレース制御データの値をデータストアから取り出すことができる。従って、当時現行であったトレース制御データを復元することができる。   The present invention recognizes that tracing a data processing device that executes speculative instructions may make it difficult to understand the trace data output if the speculatively executed instructions are later canceled. The present invention addresses this problem by accumulating trace control data in the data store for each instruction group that is executed, and in this way, if instructions that are speculatively executed are canceled, Trace control data values that were previously used can be retrieved from the data store. Therefore, it is possible to restore the trace control data that was current at that time.

一部の実施形態において、前記トレースユニットはさらに、前記トレース回路を制御するため前記現在のトレース制御データを蓄積する蓄積回路を備え、前記トレース回路は、前記推測的に実行された少なくとも1つの命令グループをキャンセルする前記少なくとも1つのプロセッサを検出することに応じ、前記取り出されたトレース制御データを前記蓄積回路に蓄積する。   In some embodiments, the trace unit further comprises a storage circuit that stores the current trace control data to control the trace circuit, wherein the trace circuit includes at least one speculatively executed instruction. In response to detecting the at least one processor that cancels a group, the retrieved trace control data is stored in the storage circuit.

トレース制御データはトレース回路の制御に用いる論理状態でよいが、一部の実施形態ではこれが蓄積回路に蓄積される。   The trace control data may be the logic state used to control the trace circuit, but in some embodiments it is stored in the storage circuit.

一部の実施形態において、前記トレース制御データは、前記該当する命令グループを識別する識別子とともに、前記データストアに蓄積される。   In some embodiments, the trace control data is stored in the data store along with an identifier that identifies the corresponding instruction group.

蓄積されるトレース制御データは、何らかの方法で該当する命令グループに関係づける必要がある。これは識別子により関係づけることができるほか、蓄積形式等の他の形式で関係づけることもできる。   The accumulated trace control data needs to be related to the corresponding instruction group in some way. This can be related by an identifier, or can be related in other forms such as a storage form.

一部の実施形態において、前記トレース回路は、前記キャンセルされた命令グループの前記データストアに蓄積された前記トレース制御データの前記少なくとも一部を取り出すよう構成される。   In some embodiments, the trace circuit is configured to retrieve the at least part of the trace control data stored in the data store of the canceled instruction group.

トレース回路を正常に機能させるには、命令グループがキャンセルされた場合に、キャンセルされた命令グループの開始時に現行であったトレース制御データを復元しなければならない。一部の実施形態では、グループの開始時に現行であったトレース制御データが当該グループのデータストアに蓄積されるため、これが取り出される。別の実施形態では、グループの実行終了時に現行であったトレース制御データが当該グループのため蓄積される。この場合は、キャンセルされたグループの直前のグループのトレース制御データが取り出されることになる。   In order for the trace circuit to function properly, if the instruction group is canceled, the trace control data that was current at the start of the canceled instruction group must be restored. In some embodiments, the trace control data that was current at the start of the group is stored in the group's data store and is retrieved. In another embodiment, trace control data that was current at the end of group execution is accumulated for the group. In this case, the trace control data of the group immediately before the canceled group is retrieved.

一部の実施形態において、前記グループは命令グループを備え、前記グループ内の最初の命令が実行されると、前記グループ内の前記命令の全てが実行する。   In some embodiments, the group comprises an instruction group, and when the first instruction in the group is executed, all of the instructions in the group are executed.

命令は数通りの方法でグループ分けできる。一部の実施形態ではグループが単一の命令からなるが、この場合はトレース制御データを蓄積するデータストアが大きくなる。命令は、グループ内の最初の命令が実行される場合にグループ全体が実行されるようグループ分けするべきである。換言すると、グループ内で例外が発生することはなく、命令はグループ全体としてキャンセル及びコミットされる。推測的に実行される命令は、その結末が分かったときに、すなわち推測が正しかったか否かが分かったときに、コミット又はキャンセルされ、正しい場合にはコミットされ、正しくない場合にはキャンセルされる。   Instructions can be grouped in several ways. In some embodiments, the group consists of a single instruction, but in this case the data store for storing trace control data is large. The instructions should be grouped so that the entire group is executed when the first instruction in the group is executed. In other words, no exception occurs within the group and the instruction is canceled and committed as a whole group. An instruction that is speculatively executed is committed or canceled when its end is known, i.e., when the guess is correct or not, committed if correct, canceled if incorrect .

一部の実施形態において、前記トレース制御データはスティッキー値を備え、前記トレース回路は所定値を有する前記スティッキー値に反応し、trace enable信号がenabled値を有するか否かにかかわらず、後に実行されるトレース有効命令のトレース値を出力する。トレース有効命令はトレースデータ項目の出力をトリガする命令である。   In some embodiments, the trace control data comprises a sticky value, and the trace circuit is responsive to the sticky value having a predetermined value and is executed later regardless of whether the trace enable signal has an enabled value. The trace value of the trace valid instruction is output. The trace valid instruction is an instruction that triggers output of a trace data item.

トレースされる推測実行命令のキャンセルにともなう問題として、トレースがトレース有効命令のトレースエレメントだけを出力し、後続命令のトレースから他の命令は実行済みと示唆する場合、命令グループはキャンセルされることがあり、trace enableはオン又はオフに異なる時点で切り替えられることがあるため、もしも命令グループの最後の命令がトレース有効命令ではなく、次の命令がトレースされる前にtrace enableがオフに切り替わると、トレースデータを診断する診断装置には、このトレース無効命令が実行済みであることが分からない。この問題は、トレース制御データ内のスティッキー値の使用により対処される。   The problem with canceling a traced speculative instruction is that the instruction group may be canceled if the trace outputs only the trace element of the trace-enabled instruction, and the trace of the subsequent instruction indicates that another instruction has been executed. Yes, trace enable may be switched on or off at different times, so if the last instruction in the instruction group is not a trace valid instruction and trace enable is switched off before the next instruction is traced, The diagnostic device that diagnoses the trace data does not know that the trace invalid instruction has been executed. This problem is addressed by the use of sticky values in the trace control data.

トレース回路は、トレースデータ項目の出力をトリガするトレース有効命令ではない前記命令グループの1命令グループにおける最終命令の実行を検出することに反応し、後続命令グループを制御するため前記トレース制御データにて前記スティッキー値を設定し、且つ後続命令グループの前記データストアに前記スティッキー値を蓄積する。   The trace circuit is responsive to detecting execution of a final instruction in one instruction group of the instruction group that is not a trace valid instruction that triggers output of a trace data item, and in the trace control data to control a subsequent instruction group The sticky value is set, and the sticky value is stored in the data store of a subsequent instruction group.

つまり、グループ内の最終命令がトレースエレメントを出力しないトレース無効命令なら、後続グループのためスティッキー値が設定される。従って、後続のトレース有効命令が実行されると、トレースがイネーブルされようがされまいが、トレースエレメントは出力される。トレースエレメントが出力されると、蓄積回路に蓄積されたスティッキー値はリセットされる。このスティッキー値により、トレースデータを解析する診断装置は、トレース無効命令が実際に実行したことを認識する。推測的に実行された命令グループがキャンセルされると、キャンセルされた命令に適用されていたスティッキー値が蓄積回路に戻される。後続命令グループのためスティッキー値が蓄積されているため、このグループがキャンセルされる場合にはスティッキー値が更新され、次のトレース有効命令ではトレースエレメントが出力されるため、先行グループにおける最終トレース無効命令の実行は示唆できる。   That is, if the last instruction in the group is a trace invalid instruction that does not output a trace element, a sticky value is set for the subsequent group. Thus, when a subsequent trace valid instruction is executed, the trace element is output, regardless of whether tracing is enabled or not. When the trace element is output, the sticky value stored in the storage circuit is reset. Based on this sticky value, the diagnostic device that analyzes the trace data recognizes that the trace invalid instruction has actually been executed. When the speculatively executed instruction group is canceled, the sticky value applied to the canceled instruction is returned to the storage circuit. Since the sticky value is accumulated for the succeeding instruction group, the sticky value is updated when this group is canceled, and the trace element is output in the next trace valid instruction. Can be suggested.

一部の実施形態において、前記トレース制御データはprevious traced値を備え、前記トレース回路は、先行グループの最終命令が実行されるときに前記trace enable信号の値を前記後続グループの前記previous−traced値として蓄積するよう構成され、前記トレース回路は、推測的に実行された命令グループをキャンセルする前記プロセッサと、イネーブルされる前記trace enable値と、前記キャンセルされたグループとの関連で蓄積され設定される前記previous−traced値とに反応し、前記トレースがオンであることを指示するトレースエレメントを出力する。   In some embodiments, the trace control data comprises a previously traced value, and the trace circuit sets the value of the trace enable signal when the last instruction of the preceding group is executed to the previous-traced value of the subsequent group. And the trace circuit is stored and set in association with the processor canceling a speculatively executed instruction group, the trace enable value enabled, and the canceled group. In response to the previous-traced value, a trace element is output indicating that the trace is on.

推測的に実行された命令のキャンセルにともなうさらなる問題として、命令グループのときにトレースがオンになってこの命令グループが後ほどキャンセルされると、トレースがオンであることを伝えるため出力された指示は失われる。previous−traced値は、キャンセルされた命令に鑑みtrace on信号の出力を指示するため使用される。previous−traced値の簡素な設定方法では、先行グループの最終命令のtrace enable値を後続グループのprevious traced値として蓄積する。こうすることで、その命令グループの実行が完了したときにトレースがイネーブルだったか否かを簡単に指示できる。   As a further problem with canceling speculatively executed instructions, if tracing is turned on for an instruction group and this instruction group is later canceled, the instruction output to tell that tracing is on is Lost. The previous-traced value is used to instruct the output of the trace on signal in view of the canceled instruction. In a simple setting method of the previous-traced value, the trace enable value of the last instruction of the preceding group is accumulated as the previous traced value of the succeeding group. This makes it easy to indicate whether or not tracing was enabled when execution of the instruction group was completed.

一部の実施形態において、前記トレース制御データはinitial−traced値を備え、前記initial−traced値は、命令グループの最初の命令の実行でトレースがイネーブルされることに応じて設定され、前記トレース回路は、命令グループをキャンセルする前記プロセッサと、前記命令グループでクリアになる前記initial−traced値と、前記命令グループで設定される前記previous−tracedとを検出することに応じ、前記キャンセル後に実行された前記命令の実行アドレスを指示する状態エレメントを出力する。   In some embodiments, the trace control data comprises an initial-traced value, and the initial-traced value is set in response to trace being enabled upon execution of the first instruction of the instruction group, the trace circuit Executed after the cancellation in response to detecting the processor that cancels the instruction group, the initial-traced value that is cleared in the instruction group, and the previous-traced set in the instruction group A status element indicating the execution address of the instruction is output.

推測的グループの実行中にトレースがイネーブルされ、その後このグループがキャンセルされる場合にはさらなる問題が生じる。トレースがイネーブルされると実行アドレスを指示する状態トレースエレメントが出力され、診断装置はトレースが再びイネーブルされたことを理解できる。これらの命令が後ほどキャンセルされると、診断装置は、キャンセルされた命令のため出力された実行アドレスから実行が進行していると考え、問題が生じる。initial−traced値の使用は、さらなる実行命令アドレスを指示するさらなる状態エレメントの出力をトリガすることにより、この問題の回避に役立つ。つまり、グループのキャンセルに応じ、キャンセルされたグループのinitial−tracedがクリアで、同グループのprevious tracedが設定されると、さらなる状態エレメントが出力される。previous tracedが設定される場合は、先行グループの、この場合はキャンセルされたグループの前のグループの、最終命令が実行されたときに、トレースがイネーブルされていたことを意味し、initial−tracedがクリアの場合は、キャンセルされたグループの最初の命令が実行されたときにトレースがイネーブルされなかったことを意味する。キャンセルされたグループの実行中にはトレースがイネーブルされ状態エレメントが出力されたかもしれない。そこで、追加の状態エレメントが出力される。   A further problem arises if tracing is enabled during the execution of a speculative group and then this group is canceled. When the trace is enabled, a status trace element indicating the execution address is output, and the diagnostic device can understand that the trace is enabled again. If these instructions are later canceled, the diagnostic device considers that execution is proceeding from the execution address output because of the canceled instruction, causing a problem. The use of an initial-traced value helps to avoid this problem by triggering the output of a further state element that points to a further execution instruction address. That is, in response to the cancellation of the group, if the initial-traced of the canceled group is clear and the previously traced of the same group is set, a further state element is output. If previously traced is set, it means that tracing was enabled when the last instruction of the preceding group, in this case the group before the canceled group, was executed, and initial-traced is Clear means that the trace was not enabled when the first instruction of the canceled group was executed. During execution of the canceled group, tracing may be enabled and a status element may have been output. An additional state element is then output.

一部の実施形態において、前記トレース制御データはtraced interesting値を備え、前記traced interesting値は、グループのトレースエレメントが出力されることに応じて設定され、且つグループのトレースエレメントが出力されない場合にクリアになる。   In some embodiments, the trace control data comprises a traced interesting value, the traced interesting value is set in response to a group trace element being output, and is cleared when the group trace element is not output. become.

本発明の実施形態で使用できるさらなるトレース制御値はtraced interesting値である。これは、グループのトレースエレメントが出力される場合とグループのトレースエレメントが出力されない場合を指示するため使用される。これを使用することにより、コミットされたグループがトレースされなかった場合を判断でき、トレース出力のコミットカウント値はこのグループがトレースされたと示唆しない。これは後述するカウンタ折り返しの場合にも使用できる。   A further trace control value that can be used in embodiments of the present invention is a traced interesting value. This is used to indicate when a group trace element is output and when a group trace element is not output. This can be used to determine when a committed group was not traced, and the commit count value in the trace output does not suggest that this group was traced. This can also be used in the case of counter folding described later.

一部の実施形態において、前記トレース制御データは前記グループのtrace start/stop値を備え、前記trace start/stop値はtrace enableが設定されるか否かに影響し、前記trace start/stop値は、前記少なくとも1つのプロセッサの所定挙動の検出に応じて設定される。   In some embodiments, the trace control data comprises a trace start / stop value for the group, the trace start / stop value affects whether or not a trace enable is set, and the trace start / stop value is , Set in response to detection of a predetermined behavior of the at least one processor.

トレースがイネーブルされるか否かは特定のプロセッサ状態によって制御される。一部の実施形態では、これらの状態によって制御されようがされまいが、start/stop値によりtrace enableをオン又はオフにできる。従来のプロセッサはこの制御値を使用している。ただしこの場合、本発明の実施形態はグループの値を蓄積するため、そのグループが後ほどキャンセルされる場合には、値を適切な値に戻すことができる。   Whether tracing is enabled is controlled by a particular processor state. In some embodiments, trace enable can be turned on or off by the start / stop value, regardless of whether it is controlled by these states. Conventional processors use this control value. However, in this case, since the embodiment of the present invention accumulates the group value, the value can be returned to an appropriate value when the group is canceled later.

一部の実施形態において、前記トレース制御データはtrace multiple値を備え、前記値が設定される場合は前記グループがトレースエレメントを生成する2つのトレース有効命令を備えていることを指示し、前記値が設定されない場合は前記グループが1個又は0個のトレース有効命令を備えていることを意味する。   In some embodiments, the trace control data comprises a trace multiple value, and if the value is set, indicates that the group comprises two trace valid instructions that generate a trace element; If is not set, it means that the group includes one or zero trace valid instructions.

命令グループは2つ以下のトレース有効命令に制限されることがある。この場合はトレース制御データにtrace multiple値を含めることで、グループに2つのトレース有効命令があるか否かを指示できる。後ほど明らかになるように、こうすることでより少ない値を使用しグループのトレースを実行できる。   An instruction group may be limited to no more than two trace valid instructions. In this case, by including a trace multiple value in the trace control data, it can be indicated whether or not there are two trace valid instructions in the group. As you will see later, this allows you to trace the group using fewer values.

別の実施形態で、前記trace multiple値は、前記グループ内のトレース有効命令数を指示する値を備える。   In another embodiment, the trace multiple value comprises a value indicating the number of trace valid instructions in the group.

別の実施形態ではtrace multiple値を数ビットとし、グループ内にあるトレース有効命令数を指示する。こうすることでグループ内に1、2、3、又は4つのトレース有効命令があるかどうかを2ビット値で指示でき、2つのトレースキー(最初値と最後値を指示)を蓄積するより効率的である。   In another embodiment, the trace multiple value is a few bits, indicating the number of trace valid instructions in the group. By doing this, it is possible to indicate by a 2-bit value whether there are 1, 2, 3, or 4 trace valid instructions in the group, and it is more efficient than storing two trace keys (specifying the first value and the last value). It is.

一部の実施形態において、前記トレースユニットは、インデックス値を生成し、且つ前記命令グループの各々に割り振られた前記インデックス値を蓄積するよう構成され、前記インデックス値は、トレースエレメントが生成されるたびに更新される。   In some embodiments, the trace unit is configured to generate an index value and accumulate the index value assigned to each of the instruction groups, the index value being generated each time a trace element is generated. Updated to

生成されるトレースエレメントを追跡する一方法ではインデックス値を設け、これを各命令グループに割り振り、トレースエレメントが生成されるたびに更新する。このようなインデックスから提供される情報は圧縮が容易であり、トレースデータを解析する診断装置によって理解される。   One method of tracking the trace elements that are generated provides an index value that is allocated to each instruction group and updated each time a trace element is generated. Information provided from such an index is easy to compress and is understood by a diagnostic device that analyzes trace data.

一部の実施形態において、前記トレースユニットは、前記インデックス値を生成するカウンタを備え、前記トレース回路は、前記グループの実行開始時の前記カウンタ値を指示する最初カウンタ値と、前記グループの実行終了時の前記カウンタ値を指示する最後カウンタ値とのうち、少なくとも一方を、各命令グループの前記データストアに蓄積する。   In some embodiments, the trace unit includes a counter that generates the index value, and the trace circuit includes an initial counter value that indicates the counter value at the start of execution of the group, and an end of execution of the group. At least one of the last counter value indicating the counter value of the hour is stored in the data store of each instruction group.

インデックス値によりトレース情報にインデックスを付ける方法はいくつかあるが、一部の実施形態ではカウンタを備える。カウンタはインデックス機能を提供する簡素な方法であるほか、容易に圧縮できるインデックスを提供する。一部の実施形態ではグループの最初カウンタ値と最後カウンタ値の両方が蓄積されるが、別の実施形態では、いずれか一方のみが蓄積される。命令がキャンセル又はコミットされるときには、グループの実行開始時のカウンタ値とグループの実行終了時のカウンタ値を使用することで、出力されたトレースエレメントのうち、キャンセルされた命令とコミットされた命令に関係するトレースエレメントがどれなのかを正確に判断することができる。いずれか一方だけが蓄積される場合でも、グループ内のトレース有効命令数が2に制限され、且つグループのmultiple traced値が蓄積される場合には、キャンセルされた命令とコミットされた命令に関係するトレースエレメントを判断できる。この場合、最初値及び最後値の他方は推定できる。これの利点として、カウンタ値が多ビットとなるのに対し、multiple traced値は単一ビットである。   There are several ways to index trace information by index value, but some embodiments include a counter. Counters are a simple way to provide indexing functions and provide an index that can be easily compressed. In some embodiments, both the first and last counter values of the group are stored, while in other embodiments, only one of them is stored. When an instruction is canceled or committed, by using the counter value at the start of group execution and the counter value at the end of group execution, out of the output trace elements, the canceled instruction and the committed instruction It is possible to accurately determine which trace element is involved. Even when only one of them is accumulated, when the number of trace valid instructions in the group is limited to 2 and the group's multiple traced value is accumulated, it relates to the canceled instruction and the committed instruction. The trace element can be determined. In this case, the other of the first value and the last value can be estimated. The advantage of this is that the counter value is multi-bit while the multiple traced value is a single bit.

一部の実施形態において、前記トレース回路は、推測的に実行された選択命令グループがキャンセルされたことを指示するキャンセル指示を前記データ処理装置から受信し、前記キャンセルされた選択命令グループを指示するキャンセルトレース項目を生成し、且つ前記現在カウンタ値と、前記キャンセルされたグループの実行開始時の前記カウンタ値との差に関する情報を、前記キャンセルトレース項目に含めるよう構成される。   In some embodiments, the trace circuit receives a cancel instruction from the data processor indicating that the speculatively executed selected instruction group has been canceled and indicates the canceled selected instruction group. A cancel trace item is generated, and information related to a difference between the current counter value and the counter value at the start of execution of the canceled group is configured to be included in the cancel trace item.

命令グループがキャンセルされる場合には、トレースエレメントを解析する診断装置でこれを推定できることが重要であり、さもないと診断装置は実行されたストリームを正しく解析できなくなる。カウンタ値を使ってトレースエレメントにインデックスを付ければ、ストリームの中で出力されたトレースエレメントのうち、キャンセルされたエレメントがいくつあるかを指示するキャンセルトレース項目を提供することにより、診断装置に対しキャンセルを指示できる。   If an instruction group is canceled, it is important that this can be estimated by a diagnostic device that analyzes the trace elements, otherwise the diagnostic device will not be able to correctly analyze the executed stream. By indexing a trace element using a counter value, the diagnostic device can be canceled by providing a cancel trace entry that indicates how many of the trace elements output in the stream have been canceled. Can be instructed.

一部の実施形態において、前記トレース回路は、前記traced−interesting値を頼りに前記差に関する前記情報を判断するよう構成される。   In some embodiments, the trace circuit is configured to determine the information regarding the difference depending on the traced-interesting value.

キャンセルされたグループにトレースされなかった命令があった場合は、キャンセルされた命令グループ数に関する出力情報で、キャンセルされたグループがトレースエレメントを出力しなかったことを示唆してはならない。traced interesting値は、これが示唆されないよう出力値を修正するため使用される。   If there are instructions that were not traced in the canceled group, the output information regarding the number of canceled instruction groups should not indicate that the canceled group did not output a trace element. The traced interesting value is used to modify the output value so that this is not suggested.

一部の実施形態において、前記トレースユニットは、推測的に実行された選択命令グループがコミットされたことを伝える前記データ処理装置からのコミット指示の受信に反応し、前記選択グループを指示するコミットトレース項目を生成し、且つ前記現在カウンタ値と前記選択グループの前記最後カウンタ値との差に関する情報を含める。   In some embodiments, the trace unit is responsive to receipt of a commit indication from the data processing device that communicates that a speculatively executed select instruction group has been committed, and a commit trace that indicates the select group Generate an item and include information about the difference between the current counter value and the last counter value of the selected group.

キャンセルと同様、命令グループのインデックスはどの命令がコミットされたかを指示するため使用できる。コミットされた命令を指示するため出力される値を計算するときにはtraced interestingも役立つ。トレースされた命令がないグループがある場合、コミット信号は、出力されたトレースエレメントの一部がこれらのグループに属することを示唆しない。   Similar to cancel, the index of the instruction group can be used to indicate which instruction has been committed. Traced interviewing is also useful when calculating the output value to indicate a committed instruction. If there are groups that have no traced instructions, the commit signal does not suggest that some of the output trace elements belong to these groups.

本発明の第2の態様は、命令ストリームを実行するデータ処理装置と、前記データ処理装置を監視する本発明の第1の態様によるトレースユニットと、を備えるデータ処理ユニットを提供する。   According to a second aspect of the present invention, there is provided a data processing unit comprising: a data processing device that executes an instruction stream; and a trace unit according to the first aspect of the present invention that monitors the data processing device.

本発明の第3の態様は、少なくとも1つの命令ストリームを実行する少なくとも1つのプロセッサの処理活動を指示するトレースデータ項目を生成する方法を提供し、前記少なくとも1つの命令ストリームは複数の命令グループを備え、前記少なくとも1つのプロセッサは前記命令の少なくとも一部を推測的に実行し、前記方法は、現在のトレース制御データにより制御されるトレース回路を使用し前記少なくとも1つのプロセッサの挙動を監視するステップと、前記実行される命令グループの1命令グループに関連する前記トレース制御データの少なくとも一部を蓄積するステップと、前記推測的に実行された少なくとも1つの命令グループをキャンセルする前記少なくとも1つのプロセッサを検出することに応じ、前記キャンセルされる推測実行命令の直前に実行された前記命令グループの前記データストアに蓄積された前記トレース制御データの少なくとも一部を取り出すステップと、前記取り出されたトレース制御データにより前記トレース回路を制御するステップと、を備える。   A third aspect of the present invention provides a method for generating a trace data item indicating processing activity of at least one processor executing at least one instruction stream, wherein the at least one instruction stream comprises a plurality of instruction groups. The at least one processor speculatively executes at least a portion of the instructions, and the method monitors the behavior of the at least one processor using a trace circuit controlled by current trace control data. Storing at least a portion of the trace control data associated with one instruction group of the executed instruction group; and at least one processor for canceling the at least one speculatively executed instruction group. In response to detection, the canceled Extracting at least a part of the trace control data stored in the data store of the instruction group executed immediately before the measurement execution instruction, and controlling the trace circuit by the extracted trace control data; Is provided.

本発明の第4の態様は、少なくとも1つの命令ストリームを実行する少なくとも1つのプロセッサの処理活動を指示するトレースデータ項目を生成するトレース手段を提供し、前記少なくとも1つの命令ストリームは複数の命令グループを備え、前記少なくとも1つのプロセッサは前記命令の少なくとも一部を推測的に実行し、前記トレース手段は、現在のトレース制御データにより制御される前記少なくとも1つのプロセッサの挙動を監視するトレース監視手段と、前記実行される命令グループのうち該当する命令グループに関連する前記トレース制御データの少なくとも一部を蓄積するデータ蓄積手段と、を備え、前記トレース監視手段は、前記命令グループの実行の検出に応じ、前記トレース制御データの前記少なくとも一部を前記データ蓄積手段に蓄積し、前記トレース監視手段は、前記推測的に実行された少なくとも1つの命令グループをキャンセルする前記少なくとも1つのプロセッサに反応し、前記キャンセルされた推測実行命令の前に実行された前記命令グループの前記データ蓄積手段に蓄積された前記トレース制御データの少なくとも一部を取り出し、且つ前記取り出されたトレース制御データにより前記トレース監視手段を制御する。   A fourth aspect of the present invention provides trace means for generating trace data items indicating processing activity of at least one processor executing at least one instruction stream, the at least one instruction stream comprising a plurality of instruction groups The at least one processor speculatively executes at least part of the instructions, and the tracing means comprises trace monitoring means for monitoring the behavior of the at least one processor controlled by current trace control data; Data storage means for storing at least a part of the trace control data related to the corresponding instruction group among the executed instruction groups, wherein the trace monitoring means responds to detection of execution of the instruction group. The at least part of the trace control data The trace monitoring means is responsive to the at least one processor canceling the at least one instruction group executed speculatively and executed before the canceled speculative execution instruction. At least a part of the trace control data stored in the data storage unit of the instruction group is extracted, and the trace monitoring unit is controlled by the extracted trace control data.

本発明の上記及び他の目的、特徴、及び利点は、以降の例証的実施形態の詳細な説明を添付の図面とともに読むことにより明白となるであろう。   The above and other objects, features and advantages of the present invention will become apparent upon reading the following detailed description of exemplary embodiments in conjunction with the accompanying drawings.

データ処理装置と、データ処理装置によるプログラム実行を解析する診断装置と、を有するシステムを示す図である。It is a figure which shows the system which has a data processor and the diagnostic apparatus which analyzes the program execution by a data processor. 本発明の一実施形態によるトレースユニットを有するデータ処理装置を示す図である。1 is a diagram illustrating a data processing apparatus having a trace unit according to an embodiment of the present invention. 本発明によるトレースユニットの一実施形態を示す図である。It is a figure which shows one Embodiment of the trace unit by this invention. trace start/stop値の設定を概略的に示す図である。It is a figure which shows schematically the setting of trace start / stop value. グループ内の命令の例、実行、及びトレーシングを示す図である。FIG. 4 is a diagram illustrating an example of instructions in a group, execution, and tracing. グループ内の命令の例、実行、及びトレーシングを示す図である。FIG. 4 is a diagram illustrating an example of instructions in a group, execution, and tracing. グループ内の命令の例、実行、及びトレーシングを示す図である。FIG. 4 is a diagram illustrating an example of instructions in a group, execution, and tracing. グループ内の命令の例、実行、及びトレーシングを示す図である。FIG. 4 is a diagram illustrating an example of instructions in a group, execution, and tracing. グループ内の命令の例、実行、及びトレーシングを示す図である。FIG. 4 is a diagram illustrating an example of instructions in a group, execution, and tracing. グループ内の命令の例、実行、及びトレーシングを示す図である。FIG. 4 is a diagram illustrating an example of instructions in a group, execution, and tracing. 本発明の別の実施形態によるトレースユニットを示す図である。FIG. 6 shows a trace unit according to another embodiment of the invention. 命令の実行に応じトレース制御値がどのように設定されるかを示す流れ図を示す図である。It is a figure which shows the flowchart which shows how a trace control value is set according to execution of an instruction | indication. 命令の実行に応じトレース制御値がどのように設定されるかを示す流れ図を示す図である。It is a figure which shows the flowchart which shows how a trace control value is set according to execution of an instruction | indication. 命令の実行に応じトレース制御値がどのように設定されるかを示す流れ図を示す図である。It is a figure which shows the flowchart which shows how a trace control value is set according to execution of an instruction | indication. 命令グループの実行中にトレース制御値がどのように変化するかを示す図である。It is a figure which shows how a trace control value changes during execution of an instruction group. 本発明の一実施形態によるデータをトレースする方法を示す図である。FIG. 3 illustrates a method for tracing data according to an embodiment of the present invention.

図1に見られるシステムは、命令ストリームを部分的に推測的に実行するデータ処理装置5と、命令の実行を監視し且つトレースストリーム42を生成するトレースユニット40とを含み、トレースストリーム42は出力52を通じて診断装置140へ出力される。診断装置140は診断ロジック142を有し、診断ロジック142はソフトウェアプログラムの形をとってよい。診断ロジック142はプロセッサ10によって実行されるプログラムに関連してトレースストリームを解析し、トレースストリームはデータストアに蓄積される。診断ロジック144はデータ処理装置5によるプログラム実行に関する情報を出力し、出力された情報は故障の診断に役立てられる。   The system seen in FIG. 1 includes a data processing device 5 that partially speculatively executes an instruction stream, and a trace unit 40 that monitors instruction execution and generates a trace stream 42, the trace stream 42 being an output. 52 to the diagnostic device 140. The diagnostic device 140 has diagnostic logic 142, which may take the form of a software program. The diagnostic logic 142 analyzes the trace stream in connection with the program executed by the processor 10, and the trace stream is stored in the data store. The diagnosis logic 144 outputs information related to program execution by the data processing device 5, and the output information is useful for failure diagnosis.

本発明の一実施形態によるトレースユニット40を含むデータ処理装置5を図2に示す。データ処理装置5はプロセッサコア10(データ処理ユニット)と、プロセッサコア10の処理活動を監視し、且つコアの処理活動を示すトレースデータ項目を生成するよう構成されたトレースユニット40とを備え、トレースデータ項目は出力52にてトレースストリームとして出力される。   A data processing apparatus 5 including a trace unit 40 according to an embodiment of the present invention is shown in FIG. The data processing device 5 comprises a processor core 10 (data processing unit) and a trace unit 40 configured to monitor the processing activity of the processor core 10 and to generate trace data items indicative of the processing activity of the core, The data item is output at output 52 as a trace stream.

プロセッサコア10はフェッチユニット20と実行ユニット25とを備える。フェッチユニット20はメモリ(図示せず)から命令をフェッチし、これらの命令は実行ユニット25へ引き渡され、実行ユニット25にて実行される。プロセッサコア10は推測型プロセッサであるため、フェッチユニット20は実行ユニット25向けの命令をフェッチするよう構成され、命令は要求により分岐予測ユニット30によって予測される(ただし保証されない)。実行ユニット25はこれらの命令を推測的に実行し、後ほど推測が正しいか否かが判明した時点で命令をキャンセルするかコミットする。   The processor core 10 includes a fetch unit 20 and an execution unit 25. The fetch unit 20 fetches instructions from a memory (not shown), and these instructions are delivered to the execution unit 25 and executed by the execution unit 25. Since the processor core 10 is a speculative processor, the fetch unit 20 is configured to fetch instructions for the execution unit 25, which are predicted (but not guaranteed) by the branch prediction unit 30 on demand. The execution unit 25 executes these instructions speculatively, and cancels or commits the instructions when it is later determined whether the guess is correct.

トレースユニット40は、推測的命令実行を含むプロセッサコア10の処理活動を示すトレースエレメントを生成し、且つそれらを出力52にてトレースデータストリームとして出力するよう構成される。トレースユニット40が推測的に実行される命令との関連で生成されるトレースデータ項目をバッファし、推測が解決した時点でそれらを出力トレースストリームに放出することは原理上可能ではあるが、それにはトレースユニット40内にかなりの蓄積空間が必要となり、面積的に高くつく。   Trace unit 40 is configured to generate trace elements indicative of processing activity of processor core 10 including speculative instruction execution and output them as a trace data stream at output 52. While it is possible in principle that the trace unit 40 buffers trace data items generated in the context of speculatively executed instructions and releases them to the output trace stream when the speculation is resolved, A considerable storage space is required in the trace unit 40, which is expensive in terms of area.

そこで図2に示す実施形態のトレースユニット40は、推測的に実行される命令と非推測的に実行される命令の両方についてトレースデータを生成し、且つ推測が正しいか否かが分かった時点でキャンセル信号かコミット信号を生成するよう構成されている。こうしてトレースデータを解析する診断装置はトレースデータを理解することができる。   Therefore, the trace unit 40 of the embodiment shown in FIG. 2 generates trace data for both speculatively executed instructions and non-speculatively executed instructions, and when it is determined whether the guess is correct. It is configured to generate a cancel signal or a commit signal. Thus, the diagnostic device that analyzes the trace data can understand the trace data.

図3ではトレースユニット40がより詳細に示されている。トレースユニット40は、プロセッサコアから信号を受信するトレース回路50を有する。トレースユニットは信号を監視し、トレースエレメントを適宜生成し、トレースストリームの形でトレースエレメントを出力し、トレースストリームは診断装置へ送信される。トレースユニット40はまたtrace enable信号を受信し、これによりトレース回路の中でtrace enableビットが設定される。trace enableはトレースエレメントが出力されるか否かを制御する。   In FIG. 3, the trace unit 40 is shown in more detail. The trace unit 40 includes a trace circuit 50 that receives a signal from the processor core. The trace unit monitors the signal, generates trace elements accordingly, outputs the trace elements in the form of a trace stream, and the trace stream is sent to the diagnostic device. The trace unit 40 also receives the trace enable signal, which sets the trace enable bit in the trace circuit. trace enable controls whether or not a trace element is output.

この実施形態のトレースユニット40は、トレース制御データを蓄積するレジスタ60を有し、トレース制御データはtrace enable値とともにトレース回路50の動作を制御する。尚、一部の実施形態においてはこれらの値がレジスタに蓄積されず、データは検出される信号値のみとなる。さらに、これらの制御値は多くの実施形態において2つのとりうる値を有し、一般的には単一ビットとして表される。トレースユニットはまた、データストア65を有し、データストア65は、推測的に実行されまだコミット又はキャンセルされていない命令に関するトレース制御データ等、トレース情報を蓄積する。この情報により、命令が実行前の値までキャンセルされる場合にはレジスタ60が更新されるほか、命令グループのキャンセルやコミットに関する情報がトレースストリームに出力される。その結果、診断装置には十分な情報が送信され、診断装置は、トレースストリームの項目のうち、キャンセルされた命令に関係する項目がどれなのかを判断できる。トレース回路は、どの命令がキャンセル又はコミットされたかを指示するトレース信号を出力するほか、プロセッサの処理活動を指示するトレース項目を出力する。こうして診断装置はトレースストリームを理解でき、トレースされた命令のうちキャンセル又はコミットされた命令がいくつあるかを認識できる。   The trace unit 40 of this embodiment has a register 60 for accumulating trace control data, and the trace control data controls the operation of the trace circuit 50 together with the trace enable value. Note that in some embodiments, these values are not stored in the register, and the data is only the detected signal value. Furthermore, these control values have two possible values in many embodiments and are generally represented as a single bit. The trace unit also has a data store 65 that stores trace information, such as trace control data regarding instructions that have been speculatively executed and not yet committed or canceled. With this information, when the instruction is canceled up to the value before execution, the register 60 is updated, and information on cancellation and commit of the instruction group is output to the trace stream. As a result, sufficient information is transmitted to the diagnostic device, and the diagnostic device can determine which of the items of the trace stream is related to the canceled command. The trace circuit outputs a trace signal indicating which instruction is canceled or committed, and also outputs a trace item indicating the processing activity of the processor. Thus, the diagnostic device can understand the trace stream and can recognize how many of the traced instructions have been canceled or committed.

トレース回路を正常に動作させるには、推測的実行のときに変化したトレース制御値を不正推測実行以前の値にリセットすることが重要となる。   In order for the trace circuit to operate normally, it is important to reset the trace control value changed at the time of the speculative execution to a value before the execution of the illegal speculation.

推測的実行を効率よく管理するため、命令は命令グループとして管理される。これは、命令がまとめてコミットされキャンセルされる不可分の命令ブロックにグループ分けされ、グループの中で例外が発生しない場合に可能である。   In order to manage speculative execution efficiently, instructions are managed as instruction groups. This is possible when instructions are grouped into indivisible instruction blocks that are committed and canceled together and no exceptions occur within the group.

トレース回路は命令をトレースするときにこれらのグループを使用し、トレース有効命令が実行されトレースエレメントが出力されるたびにトレースキーを使ってカウントする。グループの実行が始まるときと終わるときのトレースキー値は最初値及び最後値と呼ばれ、データストア65に蓄積される。こうすることで、命令がグループとしてコミット及びキャンセルされるにつれ、グループの始まりと終わりを判断できる。命令ストリームにおける処理位置を診断装置が正確に判断できるようにするため、トレースキーが時折出力されることもある。通常は、トレース有効命令が実行されたことを示すトレースエレメントと、キャンセルもしくはコミットされた命令数を示すカウント値を出力すれば、これを判断できる。   The trace circuit uses these groups when tracing instructions, and uses the trace key to count each time a trace valid instruction is executed and a trace element is output. Trace key values at the start and end of group execution are called first and last values and are stored in the data store 65. This allows the beginning and end of the group to be determined as instructions are committed and canceled as a group. Trace keys are sometimes output to allow the diagnostic device to accurately determine the processing position in the instruction stream. Normally, this can be determined by outputting a trace element indicating that a trace valid instruction has been executed and a count value indicating the number of instructions canceled or committed.

これよりトレースキーがどのように生成され蓄積されるかを詳しく説明する。トレースユニット40にはトレースインデックスユニット70が設けられる。インデックスユニット70は、トレースユニット50によって生成されるトレースデータ項目の少なくとも一部にインデックス値かトレースキーを割り振るよう構成される。具体的に、インデックスユニット70は所定のインデックス値シーケンスとしてインデックス値を生成するよう構成され、所定のシーケンスの中でn+1番目のインデックス値はn番目のインデックス値から決定される。図示された実施形態においては、インデックスユニット70内のカウンタ72によってこの機能が提供される。   Now, how the trace key is generated and stored will be described in detail. The trace unit 40 is provided with a trace index unit 70. The index unit 70 is configured to allocate an index value or a trace key to at least some of the trace data items generated by the trace unit 50. Specifically, the index unit 70 is configured to generate an index value as a predetermined index value sequence, and the (n + 1) th index value is determined from the nth index value in the predetermined sequence. In the illustrated embodiment, this function is provided by a counter 72 in the index unit 70.

トレースユニット50は所定のインデックス値シーケンスを提供するカウンタ72を備え、トレースユニット40は生成するトレースデータ項目(の一部)にこれを割り振ることができる。トレースユニット40はまた、カウンタ72によって生成されたインデックス値を蓄積できるデータストア65を備える。データストア65は、推測的に実行される各グループの最初カウンタ値と最後カウンタ値を、当該グループのさらなるトレース制御値とともに、蓄積する。推測的に実行される命令グループ内の最初の命令の場合、トレースユニット40は、カウンタ72からの現在カウンタ値をデータストア65の最初インデックス蓄積ユニット(グループ番号によりインデックスが付く)に蓄積するよう構成される。逆に、新たなグループがスタートするときには、データストア65の最後インデックス蓄積ユニットに現在カウンタ値が蓄積される。   The trace unit 50 includes a counter 72 that provides a predetermined index value sequence, which the trace unit 40 can allocate to (part of) the trace data items to be generated. Trace unit 40 also includes a data store 65 that can store the index values generated by counter 72. The data store 65 stores the first and last counter values of each group that are speculatively executed, along with further trace control values for that group. For the first instruction in a speculatively executed instruction group, the trace unit 40 is configured to store the current counter value from the counter 72 in the first index storage unit (indexed by group number) of the data store 65. Is done. Conversely, when a new group starts, the current counter value is stored in the last index storage unit of the data store 65.

図示された実施形態で、データストア65は命令グループの点でプロセッサの最大推測デプス(depth)に対応する十分なエントリを有する。プロセッサの最大推測デプスはデータストア65で保持しなければならない最大エントリ数であり、このデプスを超えるとプロセッサは命令グループをコミットもしくはキャンセルしなければならず、インデックス蓄積ユニット内のエントリは空になる。   In the illustrated embodiment, the data store 65 has sufficient entries to correspond to the processor's maximum guess depth in terms of instruction groups. The maximum guess depth of the processor is the maximum number of entries that must be held in the data store 65, beyond which the processor must commit or cancel the instruction group and the entry in the index storage unit is empty .

oldest uncommitted値を蓄積するデータストアもある。この値は、特定のグループをコミットする信号に応じ、診断ツールに対し実際にコミットされる命令がどれなのかを出力するため使用される。   Some data stores store oldest uncommitted values. This value is used to output to the diagnostic tool which instructions are actually committed in response to a signal to commit a particular group.

グループの実行中にtrace enableの値が切り替わる場合は特に、推測的実行中の命令追跡は容易ではない。この実行を首尾よく追跡できるようにするには、最初カウンタ値と最後カウント値に対しさらなる情報が必要となるため、データストア65はさらなる値を蓄積する。   It is not easy to trace instructions during speculative execution, especially when the value of trace enable switches during group execution. To be able to successfully track this execution, the data store 65 accumulates further values because more information is needed on the first and last count values.

トレース回路を制御する現在のトレース制御データを蓄積するレジスタ60は、previous traced値と、スティッキービットと、initial traced値と、traced interesting値とを蓄積する。previous traced値は先行グループの最終命令のtrace enable値であり、スティッキービットは、先行命令がトレースデータを出力しない場合に設定され、出力する場合にクリアされる。先行グループの最終命令が実行されたときのスティッキービットの値は後続グループのスティッキービットとしてデータストア65に蓄積されるが、レジスタ60内のその値は命令が実行されるにつれ更新され、更新された値は当該グループのデータストア65に蓄積されない。initial traced値はグループ内の最初の命令のtrace enableであり、traced interestingはトレースされた命令がグループにあることを指示する。これらの値から診断装置は、例えば2つのグループがコミットされたことをトレース回路が指示し、特にこれらのグループの一方でトレースがイネーブルされず実際にトレースされなかった場合に、これがトレースエレメント出力にどのように関係しているかを判断できる。以降の図に関し、これらの値がどのように更新され使用されるかを説明する。   A register 60 that accumulates current trace control data for controlling the trace circuit accumulates a previously traced value, a sticky bit, an initial traced value, and a traced interesting value. The previously traced value is the trace enable value of the last instruction of the preceding group, and the sticky bit is set when the preceding instruction does not output the trace data, and is cleared when outputting. The value of the sticky bit when the last instruction of the preceding group is executed is stored in the data store 65 as the sticky bit of the succeeding group, but the value in the register 60 is updated and updated as the instruction is executed. The value is not stored in the data store 65 of the group. The initial traced value is the trace enable of the first instruction in the group, and traced interesting indicates that the traced instruction is in the group. From these values, the diagnostic device indicates, for example, that the trace circuit indicates that two groups have been committed, especially if the trace is not enabled and not actually traced in one of these groups. You can determine how they are related. With respect to the following figures, it will be explained how these values are updated and used.

データストア65はグループのtrace start/stop値も蓄積する。これはグループ内の最初の命令より前のstart/stopビットの値である。開始遷移の後、停止状態でトレースがディスエーブルされる場合、すなわちtrace enableが0になる場合、trace−enableは停止遷移まで他のソースに依存する。   The data store 65 also stores the trace start / stop values for the group. This is the value of the start / stop bit before the first instruction in the group. If the trace is disabled in the stop state after the start transition, that is, if trace enable becomes 0, trace-enable depends on other sources until the stop transition.

開始条件は、例えばサブルーチン内の最初の命令のアドレスでよく、停止条件はサブルーチン内の最後の命令のアドレスでよい。こうすることで、このサブルーチン内の命令だけがトレースされる。   The start condition may be, for example, the address of the first instruction in the subroutine, and the stop condition may be the address of the last instruction in the subroutine. By doing this, only the instructions in this subroutine are traced.

キャンセル後に開始/停止挙動の整合をとるには、start/stop値をデータストアに蓄積し、キャンセル時に蓄積済みの値まで逆戻りする必要がある。推測的に実行される命令だけでなく構造的に実行される命令により開始/停止挙動を定義するためである。   In order to make the start / stop behavior consistent after cancellation, it is necessary to accumulate the start / stop value in the data store and to return to the accumulated value at the time of cancellation. This is because the start / stop behavior is defined not only by speculatively executed instructions but also by structurally executed instructions.

新たなグループがスタートすると、グループ内の最初の命令が処理される前のstart/stop値が、グループに対応するデータストア内の行に蓄積される。   When a new group starts, the start / stop values before the first instruction in the group is processed are accumulated in the row in the data store corresponding to the group.

グループがキャンセルされると、キャンセルされた命令に対応するデータストア内の行からstart/stopビットが取り出される。   When the group is canceled, the start / stop bits are taken from the row in the data store corresponding to the canceled instruction.

図4は、start/stopビットがどのように設定され、トレースがイネーブルされるか否かの決定にどのように使われるかを概略的に示すものである。命令アドレスが受信されると照合が行われ、命令アドレスがトレースユニットの構成時に定められた範囲内にあるか否かを確認する。範囲内にあるなら、start/stopビットが設定される。同様に照合が行われ、命令アドレスがトレースユニットの構成時に定められた停止アドレス範囲内にあるか否かを確認する。範囲内にあるなら、start/stopビットはクリアされる。   FIG. 4 schematically shows how the start / stop bit is set and used to determine if the trace is enabled. When an instruction address is received, a check is performed to see if the instruction address is within the range defined when the trace unit was configured. If so, the start / stop bit is set. Similarly, verification is performed to check whether the instruction address is within the stop address range determined when the trace unit is configured. If within range, the start / stop bit is cleared.

実行され、トレースされ、コミットされる命令グループA、B、C、及びDの例を図5に示す。この場合のトレース出力はEアトムであり、キーは出力されないが命令のたびに更新され、その一部は図3のデータストア65に蓄積される。   An example of instruction groups A, B, C, and D that are executed, traced, and committed is shown in FIG. The trace output in this case is an E atom, and the key is not output, but is updated for each instruction, and a part thereof is stored in the data store 65 of FIG.

この例ではグループAが実行される。グループAは分岐命令を含んでいるため、トレースがイネーブルされるとトレースエレメントEが出力され、図3のカウンタ72の値であるkey 1がこの命令に割り振られ、グループAとして蓄積される。そしてカウンタは増加する。次に実行される命令はグループBの中にある。これは新たなグループであるため、グループBの分岐命令には現在のトレースキー値key 2が割り振られる。グループBは分岐を含んでおり、トレースは引き続きイネーブルされるため、別のトレースエレメントが出力され、カウンタ72はkey 3に増加する。次の命令は新たなグループの中にあり、これも分岐であり、トレースは引き続きイネーブルになっているためさらなるトレースエレメントが出力され、トレースキー3がこの命令に割り振られ、カウンタ72は増加する。   In this example, group A is executed. Since group A contains a branch instruction, trace element E is output when tracing is enabled, and key 1 which is the value of counter 72 in FIG. 3 is assigned to this instruction and accumulated as group A. And the counter increases. The next instruction to be executed is in group B. Since this is a new group, the current trace key value key 2 is assigned to the branch instruction of group B. Since group B contains branches and tracing is still enabled, another trace element is output and counter 72 is incremented to key 3. The next instruction is in a new group, which is also a branch, and trace is still enabled, so more trace elements are output, trace key 3 is assigned to this instruction, and counter 72 is incremented.

次に実行される命令はグループDの中にある。この命令はトレース無効命令である。トレース回路はトレースエレメントを生成しないよう構成されるため、トレースエレメントは出力されず、キーは増加しない。次に分岐命令があり、これはトレースエレメントを生成し、トレースキーの現在値4がこれに割り振られ、カウンタは増加する。次に、グループCがコミットされたことを伝えるコミット信号をトレース回路50がプロセッサから受信すると、グループCと、これに先立つグループA及びBは推測でなくなる。トレース出力を解析している診断ツールにこれを伝達する必要があるため、トレース出力にはコミット信号が加えられる。このコミット信号ではコミットされたグループを正確に指示する必要がある。それには、コミットされたグループのキー値から、蓄積(図3のストア80)された中で最も古い以前のコミットのキー値を引いたものを出力する。この場合は先行グループにコミットされたものがないため、出力される値は、グループCの最終命令に割り振られたキー値key 3−0となり、key 3信号が出力される。診断装置はこれからグループA、B、及びCの命令がコミット済みであると判断できる。   The next instruction to be executed is in group D. This instruction is a trace invalid instruction. Since the trace circuit is configured not to generate a trace element, the trace element is not output and the key is not increased. Next is a branch instruction, which generates a trace element, the current value 4 of the trace key is assigned to it, and the counter is incremented. Next, when the trace circuit 50 receives from the processor a commit signal indicating that the group C has been committed, the group C and the preceding groups A and B are no longer speculative. Since this needs to be communicated to the diagnostic tool that is analyzing the trace output, a commit signal is added to the trace output. This commit signal must indicate exactly the committed group. For this purpose, the key value of the committed group minus the key value of the oldest previous commit stored (store 80 in FIG. 3) is output. In this case, since there is no commit in the preceding group, the output value is the key value key 3-0 allocated to the final instruction of group C, and the key 3 signal is output. The diagnostic device can now determine that the instructions in groups A, B, and C have been committed.

そのグループで蓄積された最後のキー値key 3はoldest committedストアに蓄積される。   The last key value key 3 stored in the group is stored in the oldest committed store.

尚、この実施形態では図3のデータストア65に見られるように各グループにつき最初カウンタ値と最後カウンタ値を蓄積するのではなく、データストア65には単一のキー値が蓄積される。これはグループ内の最終命令に割り振られるキー値である。   In this embodiment, instead of storing the first counter value and the last counter value for each group as seen in the data store 65 of FIG. 3, a single key value is stored in the data store 65. This is the key value assigned to the last instruction in the group.

図6に示す例は図5に似ているが、一部の命令の実行中にはトレースがディスエーブルされる。図6ではグループCの実行とグループDの半分でトレースがディスエーブルされる。この場合はグループAの実行によってトレースエレメントの出力がトリガされ、カウンタ72の現在値であるトレースkey 1がグループAのキー値として蓄積され、カウンタ72は増加する。次にグループBに入ると現在のカウンタ値2がグループBとして蓄積され、グループB内の分岐命令の実行によりトレースエレメントの出力とキー値3への増加がトリガされる。次にトレース出力がディスエーブルされ、分岐Cが実行されてもトレースエレメントの出力はトリガされない。従って、カウンタキーの現在値3がグループCとして蓄積されるが、トレースエレメントが出力されないため、値は増加しない。次に新たなグループDに入り、最初の命令はトレース無効命令であり、いずれにせよトレースはディスエーブルされるので、トレースエレメントは出力されず、カウンタは増加しない。次にトレースがイネーブルされ、実行される次のトレース有効命令はグループD内の分岐であるため、トレースエレメントは出力され、このグループとして現在のキー値3が蓄積され、カウンタは4に増加する。   The example shown in FIG. 6 is similar to FIG. 5, but the trace is disabled during execution of some instructions. In FIG. 6, the trace is disabled for group C execution and group D half. In this case, the execution of group A triggers the output of the trace element, trace key 1 which is the current value of counter 72 is accumulated as the key value of group A, and counter 72 is incremented. Next, when the group B is entered, the current counter value 2 is accumulated as the group B, and execution of the branch instruction in the group B triggers the output of the trace element and the increase to the key value 3. The trace output is then disabled and the output of the trace element is not triggered when branch C is executed. Accordingly, the current value 3 of the counter key is accumulated as group C, but the value does not increase because the trace element is not output. Then, in a new group D, the first instruction is a trace invalid instruction, and in any case the trace is disabled, so no trace element is output and the counter is not incremented. Trace is then enabled and the next trace valid instruction to be executed is a branch in group D, so the trace element is output, the current key value 3 is accumulated as this group, and the counter is incremented to 4.

トレース回路は、グループCがコミットされたことを伝える信号を受信する。これを指示する信号をトレース出力ストリームで送信する必要がある。ただしグループCはトレースされていない。   The trace circuit receives a signal telling that group C is committed. A signal indicating this needs to be transmitted in the trace output stream. However, group C is not traced.

この問題に対処するためトレース制御データでtraced interesting値が使用される。この値は、命令グループにトレースされるトレース有効命令がある場合に設定され、トレースされる命令がない場合にクリアになる。つまり、トレースされる命令がなければ設定されない。従ってグループCの場合はこれがクリアになる。これはグループがコミット又はキャンセルされる場合に使用される。この場合、グループCはコミットされ、そのtraced interesting値はクリアである。グループCで蓄積されたキー値は3であり、traced interestingビットはクリアであるため、コミットは、蓄積されたキー値−oldest uncommitted値(この場合は0)−1、すなわち2となるよう計算される。従ってcommit 2信号が送信され、診断装置は、前の2つのトレースエレメントがコミット済みのグループに属すると推定できる。すなわち、グループA及びBがコミットされていると推定できる。もしもコミット値から1を引かなければcommit 3信号が出力され、トレース出力を解析する診断ツールは、分岐Dを含め最初の3つのトレース済み命令がコミット済みと想定することになる。これは誤りである。もしもtraced−interestingが設定されたなら、キー値から1は引かれないが、この場合は分岐Cがトレースされたことになる。   To deal with this problem, a traced interesting value is used in the trace control data. This value is set when there is a trace valid instruction traced in the instruction group and is cleared when there is no traced instruction. That is, it is not set if there are no traced instructions. Therefore, in the case of group C, this is cleared. This is used when a group is committed or canceled. In this case, group C is committed and its traced interesting value is clear. Since the key value accumulated in group C is 3 and the traced interesting bit is clear, the commit is calculated to be the accumulated key value-oldest uncommitted value (in this case 0) -1, i.e. 2. The Therefore, a commit 2 signal is transmitted and the diagnostic apparatus can estimate that the previous two trace elements belong to the committed group. That is, it can be estimated that groups A and B are committed. If 1 is not subtracted from the commit value, a commit 3 signal is output, and the diagnostic tool for analyzing the trace output assumes that the first three traced instructions including branch D have been committed. This is an error. If traced-interesting is set, 1 is not subtracted from the key value, but in this case, branch C is traced.

次にoldest uncommitted値はkey 3に設定される。   The oldest uncommitted value is then set to key 3.

traced−interesting値は、推測がプロセッサの推測デプスに達し、カウンタが折り返した場合にも使用できる。この場合、コミット又はキャンセルするキーは最も古い以前のコミットと同じ値になることがある。これは計算コミット値0を提供する。さもないとコミットされるのが0なのか、あるいは最大推測デプスNなのか分からない。これは最終グループのtraced−interestingビットから推定でき、これが設定されるなら値はゼロではなくNに違いなく、これがクリアなら値はNではなくゼロに違いない。   The traced-interesting value can also be used when the guess reaches the guess depth of the processor and the counter wraps around. In this case, the key to commit or cancel may be the same value as the oldest previous commit. This provides a calculation commit value of zero. Otherwise, it is not known whether the commit is 0 or the maximum guess depth N. This can be estimated from the last group of traced-interesting bits, and if it is set, the value must be N, not zero, and if it is clear, the value must be zero instead of N.

一部の実施形態ではデータストア65が命令グループの最初カウンタ値と最後カウンタ値を蓄積する。これらの値を使用することにより、推測的命令のキャンセル及びコミットに応じキャンセル又はコミットする必要があるトレースストリームの値を判断することができる。以下、これを説明する。   In some embodiments, the data store 65 stores the first and last counter values of the instruction group. By using these values, it is possible to determine the value of the trace stream that needs to be canceled or committed in response to canceling and committing speculative instructions. This will be described below.

図3に見られる実施形態等、一部の実施形態では、最初カウンタ値と最後カウンタ値が各グループのデータストア65に蓄積される。カウンタ72は所定のインデックス値シーケンスを提供し、トレースユニット40は生成するトレースデータ項目(の一部)にこれを割り振ることができる。推測的に実行される命令グループ内の最初の命令の場合、トレースユニット40は、カウンタ72からの現在カウンタ値を当該グループの最初値として蓄積するよう構成され、逆に、新たなグループがスタートするときには、当該グループの最後値として現在カウンタ値が蓄積される。   In some embodiments, such as the embodiment seen in FIG. 3, the first counter value and the last counter value are stored in each group of data stores 65. The counter 72 provides a predetermined sequence of index values that the trace unit 40 can allocate to (part of) the trace data items that it generates. In the case of the first instruction in a speculatively executed instruction group, the trace unit 40 is configured to store the current counter value from the counter 72 as the initial value of the group, and conversely, a new group starts. Sometimes, the current counter value is stored as the last value of the group.

データストア65は、命令グループの点でプロセッサの最大推測デプスに対応する十分なエントリを有するよう構成される。プロセッサの最大推測デプスはインデックス蓄積ユニットで保持しなければならない最大エントリ数であり、このデプスを超えるとプロセッサは命令グループをコミットもしくはキャンセルしなければならず、インデックス蓄積ユニット内のエントリは空になる。   The data store 65 is configured to have sufficient entries corresponding to the maximum speculative depth of the processor in terms of instruction groups. The maximum speculative depth of the processor is the maximum number of entries that must be held by the index storage unit, beyond which the processor must commit or cancel the instruction group and the entries in the index storage unit will be empty .

これより下の表1を参照しながら最初値と最後値の使用を説明する。   The use of the first and last values will be described with reference to Table 1 below.

表1は、プロセッサコア100が命令グループA、B、及びCを推測的に実行した後、グループBのキャンセルとグループAのコミットを指示する状況で、トレースユニット110でカウンタ値と、oldest uncommitted値と、追跡テーブルがどのように更新されるかを示している。   Table 1 shows a counter value and an oldest uncommitted value in the trace unit 110 in a situation where the processor core 100 instructs to cancel the group B and commit the group A after speculatively executing the instruction groups A, B, and C. And how the tracking table is updated.

グループAはload(LDR)命令から始まり、これは「interesting」であり、現在トレースされている。グループAに対応する最初インデックスユニット230のエントリ(「A.first」)には現在カウンタ値0が蓄積され、カウンタは1に増加する。最後に、グループAに対応する最後インデックスユニット240のエントリ(「A.last」)に現在カウンタ値1が蓄積される。グループAの次の命令はmove命令(MOV)であり、これは「interesting」ではなく、トレースされない。グループAの最後の命令はbranch−if−equal(BEQ)命令であり、これは「interesting」でありトレースされため、カウンタは2に増加する。そして、グループAに対応する最後インデックスユニット240のエントリ(「A.last」)が現在カウンタ値2により更新される。尚、各命令の最終ステップでは常に現在のグループに対応する最後インデックスユニット240のエントリが現在カウンタ値により更新される。勿論、これが何らかの効果をもたらすのは、その命令でカウンタが更新されている場合に限る。表1の残りの命令では、この「最後」値の更新を明確に説明しない。   Group A begins with a load (LDR) instruction, which is “interesting” and is currently being traced. The entry of the first index unit 230 corresponding to group A (“A.first”) is currently stored with a counter value of 0, and the counter is incremented to 1. Finally, the current counter value 1 is stored in the entry (“A. last”) of the last index unit 240 corresponding to the group A. The next instruction in group A is a move instruction (MOV), which is not “interesting” and is not traced. The last instruction in group A is a branch-if-equal (BEQ) instruction, which is “interesting” and is traced, so the counter is incremented to two. Then, the entry (“A. last”) of the last index unit 240 corresponding to the group A is updated with the current counter value 2. In the last step of each instruction, the entry of the last index unit 240 corresponding to the current group is always updated with the current counter value. Of course, this only has some effect if the counter is updated with that instruction. The remaining instructions in Table 1 do not explicitly explain this “last” value update.

グループBはADD命令から始まり、これは「interesting」ではなくトレースされないが、新たなグループの最初の命令であるため最初インデックス値蓄積ユニットのエントリには現在カウンタ値2が蓄積される(B.first=2)。グループBの2番目の命令はSUB命令であり、これも同様に「interesting」ではなくトレースされず、値を更新しない。   Group B begins with an ADD instruction, which is not “interesting” and is not traced, but because it is the first instruction of a new group, the current counter value 2 is stored in the entry of the first index value storage unit (B.first) = 2). The second instruction in group B is a SUB instruction, which is similarly not “interesting”, not traced, and does not update the value.

グループCはstore(STR)命令から始まり、これは「interesting」でありトレースされるため、最初インデックス蓄積ユニットのC.firstエントリには現在カウンタ値が蓄積され、カウンタは3に増加する。グループCの2番目の命令はbranch−if−not−equal(BNE)命令であり、これも「interesting」でありトレースされるため、カウンタは4に更新される。   Group C begins with a store (STR) instruction, which is “interesting” and is traced, so the C. The first counter value is stored in the first entry, and the counter is incremented to 3. The second instruction of group C is a branch-if-not-equal (BNE) instruction, which is also “interesting” and is traced, so the counter is updated to 4.

次にプロセッサコア100は、グループBの推測的実行が不適正であるためグループB及びCのキャンセルを指示する。これに応じ、トレースユニット110(トレース制御ユニット200により制御)はカウンタ210の現在カウント値4と、最初インデックス蓄積ユニット230のエントリ(B.first)に蓄積された値2を参照する。トレースユニット110は2つのトレースデータ項目をキャンセルすべきと判断し(4−2)、これを指示するトレースデータ項目を生成する。カウンタ210は2にリセットされる(4から2項目キャンセルのため)。   Next, the processor core 100 instructs to cancel the groups B and C because the speculative execution of the group B is inappropriate. In response to this, the trace unit 110 (controlled by the trace control unit 200) refers to the current count value 4 of the counter 210 and the value 2 initially stored in the entry (B.first) of the index storage unit 230. The trace unit 110 determines that two trace data items should be canceled (4-2), and generates a trace data item indicating this. The counter 210 is reset to 2 (to cancel 2 items from 4).

次にプロセッサコア100は、命令グループAの推測的実行が適正であったと判断し、命令グループAのコミットを指示する。これに応じ、トレースユニット110(トレース制御ユニット200の制御下)は、oldest uncommitted蓄積ユニット250に蓄積された値(現在0)と、このグループに対応する最後インデックス蓄積ユニット240のエントリ(A.last)2を参照する。トレースユニット110は2つのトレースデータ項目をコミットすべきと判断し(2−0)、これを指示するトレースデータ項目を生成する。oldest uncommitted蓄積ユニット250に蓄積された値は、このグループで読み取られた「最後」の値に、この例では2に、リセットされる。   Next, the processor core 100 determines that the speculative execution of the instruction group A is appropriate and instructs the instruction group A to commit. In response, the trace unit 110 (under the control of the trace control unit 200) sends the value (currently 0) stored in the oldest uncommitted storage unit 250 and the entry (A. last) of the last index storage unit 240 corresponding to this group. ) Refer to 2. The trace unit 110 determines that two trace data items should be committed (2-0), and generates a trace data item indicating this. The value stored in the oldest uncommitted storage unit 250 is reset to the “last” value read in this group, to 2 in this example.

尚、表1を参照しながら説明する実施形態では、イベント数の参照によりキャンセルとコミットが行われ、生成されるトレースデータ項目はキャンセル又はコミットされるイベント数を指示する。別の実施形態では、トレースユニットはイベント番号の参照によりキャンセル/コミットトレース項目を生成できる。この場合、キャンセルトレース項目の場合は「最初」値から、すなわち最初インデックス値蓄積ユニットの該当するエントリから、イベント番号が取られ、コミットトレース項目の場合は「最後」値から、すなわち最後インデックス値蓄積ユニットの該当するエントリから、イベント番号が取られる。イベント番号によるコミット及びキャンセルではハードウェアを削減できるように思われるが(減算が不要のため)、イベント数によりキャンセル/コミットを指示する場合は通常ならば先行ゼロがあるため、大抵は圧縮できる。「イベント数」によりコミット/キャンセルにするか、それとも「イベント番号」によりコミット/キャンセルするかの選択は、システム要求に応じて判断できる。すなわち、トレースユニットのハードウェア削減とトレースストリームにおける帯域幅削減のうち、どちらを重視するかによって判断できる。   In the embodiment described with reference to Table 1, cancellation and commit are performed by referring to the number of events, and the generated trace data item indicates the number of events to be canceled or committed. In another embodiment, the trace unit can generate a cancel / commit trace item by reference to the event number. In this case, in the case of a cancel trace item, the event number is taken from the “first” value, that is, from the corresponding entry in the first index value accumulation unit, and in the case of a commit trace item, from the “last” value, that is, the last index value accumulation. The event number is taken from the corresponding entry in the unit. Although it seems that hardware can be reduced by committing and canceling by event number (since subtraction is not required), when cancel / commit is instructed by the number of events, there is usually a leading zero, so it can usually be compressed. Whether to commit / cancel based on the “number of events” or to commit / cancel based on the “event number” can be determined according to a system request. That is, the determination can be made based on which of the hardware reduction of the trace unit and the bandwidth reduction in the trace stream is important.

Figure 0005604373
Figure 0005604373

これより下の表2を参照しながらさらなる例を説明する。この例のトレースユニットは、store(STR)命令をトレースしないことにより生成されるトレースをさらに選別する。表2におけるグループA及びBの値は表1の値と同じである。ただしグループCの最初の命令でSTR命令はトレースされないため、カウントは増加しない。このためカウントは、グループCでBNE命令(トレースされる)に遭遇したときに3に増加する。   Further examples will be described with reference to Table 2 below. The trace unit in this example further screens the trace generated by not tracing the store (STR) instruction. The values of groups A and B in Table 2 are the same as those in Table 1. However, since the STR instruction is not traced in the first instruction of group C, the count does not increase. Thus, the count increases to 3 when a BNE instruction (traced) is encountered in group C.

プロセッサコアが「cancel B」メッセージを発行すると、トレースユニット110は、現在カウントが3、B.firstが2(表1の例と同様)であるため、ただ1つのトレース項目をキャンセルすべきと判断する(3−2)。同様に、カウントは1減少する(値2まで減少)。表1のようにプロセッサコアが「commit A」メッセージを発行すると、oldest uncommittedカウントは0、A.last=2であるため、2つのトレース項目がコミットされる。そしてoldest uncommittedカウントは2に更新される。   When the processor core issues a “cancel B” message, the trace unit 110 has a current count of 3. Since first is 2 (similar to the example in Table 1), it is determined that only one trace item should be canceled (3-2). Similarly, the count is decreased by 1 (decreased to a value of 2). When the processor core issues a “commit A” message as shown in Table 1, the oldest uncommitted count is 0, Since last = 2, two trace entries are committed. The oldest uncommitted count is updated to 2.

Figure 0005604373
Figure 0005604373

制御レジスタ60におけるprevious−traced制御値の使用を図7に示す。ここでは、トレースがオフだったときに実行された命令がキャンセルされたためtrace on信号の出力を不要につき禁止する。previous−traced値は、先行グループの最終命令が実行されたときのtrace enable値である。従って図7の例でグループBのprevious−traced値はクリアになっている。グループBでトレースがイネーブルされると、trace on信号が分岐BのトレースエレメントEとともに出力されるほか、トレースがオンになったときのコアによるプログラム実行位置を指示する状態エレメント2000(図示せず)が出力される。グループCが実行されるときにはトレースが再びオフになる。その後グループCはキャンセルされ、グループDが実行される。グループCがキャンセルされたため、グループDに先行するグループはグループBとなり、このグループのトレースはイネーブルされていたため、グループDのprevious−traced値は設定される。trace enableは遷移しているが、トレース回路はprevious−tracedの設定を受けてtrace−on信号の出力を禁止する。もしもグループCがキャンセルされなかったなら、グループDでprevious−tracedは設定され、trace enable信号の遷移を受けてtrace on信号が生成されることになる。   The use of previous-traced control values in the control register 60 is illustrated in FIG. Here, since the instruction executed when the trace is off is canceled, the output of the trace on signal is prohibited because it is unnecessary. The previous-traced value is a trace enable value when the last instruction of the preceding group is executed. Therefore, in the example of FIG. 7, the previous-traced value of group B is clear. When trace is enabled in group B, a trace on signal is output along with trace element E in branch B, and a state element 2000 (not shown) that indicates the program execution position by the core when the trace is turned on. Is output. When group C is executed, tracing is turned off again. Thereafter, group C is canceled and group D is executed. Since group C is cancelled, the group preceding group D is group B, and the trace of this group is enabled, so the previous-traced value of group D is set. Although trace enable has changed, the trace circuit receives the setting of previous-traced and prohibits the output of the trace-on signal. If the group C is not canceled, the previous-traced is set in the group D, and the trace on signal is generated in response to the transition of the trace enable signal.

trace enableが値を変える別の例を図8に示す。この場合、グループAは分岐であり、トレースはイネーブルされ、トレースエレメントは出力され、initial−tracedは、グループ内の最初の命令のtrace enable値であるため、設定される。次にトレースはイネーブルされず、グループBの実行が始まる。グループBの最初の命令でトレースはイネーブルされないためグループBのinitial−tracedはクリアになり、グループAの最終命令でトレースはイネーブルされているためprevious−tracedは設定される。グループBの2番目の命令でトレースはイネーブルされ、これはグループの中間であるため、これを受けてtrace on信号は常に出力され、トレースがオンになるときのプロセッサの実行位置を指示する状態3004が出力される。その後、グループBの次の命令が実行され、トレースエレメントが出力される。そしてグループBのキャンセルを指示するキャンセル信号をコアから受信する。グループBで出力されたトレースエレメントは1つであるため、キャンセルは1である。   FIG. 8 shows another example in which the value of trace enable changes. In this case, group A is a branch, trace is enabled, trace elements are output, and initial-traced is set because it is the trace enable value of the first instruction in the group. Trace is then not enabled and group B execution begins. Since the trace is not enabled by the first instruction of group B, initial-traced of group B is cleared, and since the trace is enabled by the final instruction of group A, previous-traced is set. Trace is enabled on the second instruction of group B, which is in the middle of the group, so in response, the trace on signal is always output, and state 3004 indicates the execution position of the processor when the trace is turned on. Is output. Thereafter, the next instruction of group B is executed and the trace element is output. A cancel signal instructing cancellation of group B is received from the core. Since there is one trace element output in group B, the cancellation is 1.

トレース回路はキャンセルされたグループBのinitial−traced値と、現在蓄積されているprevious−tracedをチェックする。もしもinitial−tracedがクリアでprevious−tracedが設定されているなら、キャンセルされたグループの実行中にtrace enableが値を変化させ、状態エレメントが出力されたことになる。これらの値に応じて新たな状態エレメントが出力される。   The trace circuit checks the canceled group B initial-traced value and the currently accumulated previous-traced value. If initial-traced is clear and previous-traced is set, trace enable changes the value during execution of the canceled group, and the status element is output. A new state element is output according to these values.

この場合、次に実行される命令はグループCのトレース無効命令であり、グループBで蓄積されたinitial traced値とグループCで蓄積されたprevious traced値に応じ状態エレメント4000が出力される。診断装置は、トレースがアドレス3004ではなくアドレス4000からのものであることを知る。   In this case, the next instruction to be executed is a trace invalid instruction of group C, and the status element 4000 is output according to the initial traced value accumulated in group B and the previously traced value accumulated in group C. The diagnostic device knows that the trace is from address 4000, not address 3004.

要約すると、キャンセルされたグループに対応する表の同一行から取り出されるprevious_tracedが1でinitial_tracedが0ならforce−state−outputは出力される。図8ではグループBがキャンセルされる。グループBの前の命令はトレースされるが、グループBの最初の命令はトレースされないため、previous_traced=1、initial_traced=0となる。キャンセル後の最初のグループでprevious_traced値は1であるため、第2のtrace−onは出力されない。   In summary, if previous_traced taken from the same row of the table corresponding to the canceled group is 1 and initial_traced is 0, the force-state-output is output. In FIG. 8, group B is cancelled. The previous instruction of group B is traced, but the first instruction of group B is not traced, so previous_traced = 1 and initial_traced = 0. Since the previous_traced value is 1 in the first group after cancellation, the second trace-on is not output.

previous_tracedとinitial_tracedには4通りの値がある。   There are four values for previous_traced and initial_traced.

Figure 0005604373
Figure 0005604373

図9に見られる推測的命令をトレースするときに生じるもうひとつの問題には、本発明の実施形態により対処する。前述したように、トレース無効命令の実行はトレース有効命令の実行をトレースすることによって示唆できるため、トレース無効命令はトレースせず、トレース有効命令に指定された命令だけをトレースすることによってトレースデータの生成量は減らすことができる。トレース有効命令は分岐、読み込み、蓄積等であり、トレース無効命令は算術命令等の他の命令である。ただし、トレースをイネーブル又はディスエーブルする機能と併せてこの種のトレーシングを使用すると、トレースがオフになった場合に後続のトレース有効命令がトレースされないため、トレース無効命令の実行を示唆できなくなる。この問題に対処するにはトレース制御データのスティッキー値を使用する。実行されるグループの最後の命令がトレースエレメントの出力をトリガするトレース有効命令でない場合には、後続グループのためスティッキー値が設定される。このスティッキー値は後続グループのデータストアに蓄積されるほか、トレースを制御する図3の制御レジスタ60の中で設定される。スティッキー値はトレースエレメントが出力されるまでトレース制御レジスタ60の中で維持され、トレースエレメントが出力されるとリセットされる。つまり、トレースがイネーブルされトレース有効命令に遭遇するとトレースエレメントが出力され、制御レジスタではスティッキー値がリセットされる。診断装置は、トレースエレメントが出力されなかった先行グループの最後のトレース無効命令が実際に実行されたと判断できる。   Another problem that arises when tracing speculative instructions found in FIG. 9 is addressed by embodiments of the present invention. As described above, since the execution of the trace invalid instruction can be suggested by tracing the execution of the trace valid instruction, the trace invalid instruction is not traced, and only the instruction specified in the trace valid instruction is traced. The amount produced can be reduced. Trace valid instructions are branch, read, store, etc., and trace invalid instructions are other instructions such as arithmetic instructions. However, if this type of tracing is used in conjunction with the ability to enable or disable trace, subsequent trace valid instructions are not traced when the trace is turned off, and therefore cannot indicate the execution of a trace invalid instruction. To deal with this problem, use the sticky value of the trace control data. If the last instruction of the group to be executed is not a trace valid instruction that triggers the output of the trace element, a sticky value is set for the subsequent group. This sticky value is stored in the data store of the subsequent group, and is set in the control register 60 of FIG. 3 that controls the trace. The sticky value is maintained in the trace control register 60 until the trace element is output, and is reset when the trace element is output. That is, when the trace is enabled and a trace valid instruction is encountered, the trace element is output and the sticky value is reset in the control register. The diagnostic device can determine that the last trace invalid instruction of the preceding group for which no trace element has been output has actually been executed.

図9では、グループBのトレース無効命令の実行を受けてグループCのためスティッキー値が設定される。グループCの分岐が実行されるときにtrace enableはオフだが、スティッキー値が設定されているため、トレースエレメントは出力される。こうすることで、診断ツールはグループBのNOPが実行されたことを示唆できる。トレースエレメントが出力された後には制御レジスタ60でスティッキー値がリセットされるが、グループCのデータストアに蓄積されたスティッキー値は引き続き設定される。   In FIG. 9, a sticky value is set for group C in response to execution of the trace invalid instruction of group B. Trace enable is off when the branch of group C is executed, but the sticky value is set, so the trace element is output. In this way, the diagnostic tool can indicate that a Group B NOP has been performed. After the trace element is output, the sticky value is reset in the control register 60, but the sticky value accumulated in the data store of group C is continuously set.

図10に見られる同様の例では、推測的に実行された命令の一部がキャンセルされる。この場合、グループAではトレースがイネーブルされ、トレースエレメントが出力される。グループBでトレースはイネーブルされるが、トレース無効命令であるため、トレースエレメントは出力されない。ただしスティッキー値は設定される。次にグループCが実行され、トレースはイネーブルされないがスティッキー値が設定されているため、分岐によりトレースアトムの出力がトリガされる。次に図3の制御レジスタ60でスティッキー値がリセットされるが、データストア65では引き続きグループCに設定されている。次にグループDが実行され、トレースは再びイネーブルされ、トレースアトムが出力される。先行グループでスティッキー値が設定されたため「trace−on」出力はない。   In a similar example seen in FIG. 10, some of the speculatively executed instructions are canceled. In this case, the trace is enabled in group A, and the trace element is output. Trace is enabled in group B, but no trace element is output because it is a trace invalid instruction. However, the sticky value is set. Group C is then executed and the trace is not enabled but the sticky value is set, so the branch triggers the output of the trace atom. Next, the sticky value is reset in the control register 60 of FIG. 3, but the data store 65 continues to be set to group C. Group D is then executed, tracing is re-enabled, and a trace atom is output. Since the sticky value is set in the preceding group, there is no “trace-on” output.

次にコアからcancel group Cが受信され、前の2つのアトムのキャンセルを指示するためcancel 2が出力される。グループCをキャンセルするときには、グループBで蓄積されたトレース制御値の一部が制御レジスタに読み込まれる。グループBで蓄積されたスティッキー値は設定されており、これが制御レジスタに読み込まれ、例外が生じる。制御レジスタではスティッキー値が設定されているため、trace enableがローでも例外はトレースされる。   Next, cancel group C is received from the core, and cancel 2 is output to instruct the cancellation of the previous two atoms. When canceling group C, a part of the trace control values accumulated in group B is read into the control register. The sticky value stored in group B has been set and is read into the control register, causing an exception. Since a sticky value is set in the control register, an exception is traced even if trace enable is low.

図11に見られるトレースユニット40は図3のそれに似ているが、レジスタ60とデータストア65にはmultiple−tracedというトレース制御値が追加されている。この実施形態ではグループ内のトレース有効命令が2つまでとなるよう装置が構成され、グループに含まれるトレース有効命令が2つならmultiple tracedが設定され、グループのトレース有効命令が1つかトレース有効命令がなければ(traced_interestingから判断)multiple tracedはクリアになる。こうすることで、最初のキー値か実施形態によっては最後のキー値だけをデータストア65に蓄積すればよく、残りはmultiple traced値が設定されるか否かによって判断できる。従って、多ビットのカウント値を蓄積するのではなく単一ビットを蓄積することで残りのキーを指示できる。   The trace unit 40 seen in FIG. 11 is similar to that of FIG. 3, but a trace control value of multiple-traced is added to the register 60 and the data store 65. In this embodiment, the apparatus is configured so that there are up to two trace valid instructions in the group. If there are two trace valid instructions included in the group, multiple traced is set, and there is one trace valid instruction in the group. If there is no (determined from traced_interesting), multiple traced is cleared. In this way, only the first key value or the last key value may be stored in the data store 65 in some embodiments, and the rest can be determined by whether or not a multiple traced value is set. Therefore, the remaining keys can be indicated by accumulating a single bit rather than accumulating a multi-bit count value.

別の実施形態ではmultiple−traced値を数ビット幅とし、グループ内の合計トレース有効命令数を蓄積する。この場合はこの値を使ってカウンタを更新できる。この値は多ビット幅だが、最初カウント値と最後カウント値を指示する2つのトレースキーを蓄積するよりは効率的である。さらに別の実施形態ではこれを多ビット幅とし、グループ内の合計トレース有効命令数−1を蓄積する。トレース有効命令が1つかゼロかはtraced_interesting値から判断する。   In another embodiment, the multiple-traced value is several bits wide and the total number of trace valid instructions in the group is stored. In this case, the counter can be updated using this value. Although this value is multi-bit wide, it is more efficient than accumulating two trace keys indicating the first count value and the last count value. In yet another embodiment, this is multi-bit wide and the total number of trace valid instructions in the group minus one is stored. Whether the trace valid instruction is 1 or 0 is determined from the traced_interesting value.

尚、トレース制御値はグループごとに設定され、新たなグループに遭遇するとデータストア65に蓄積される。ただしtraced−interestingはグループ内の各命令につき適宜更新され、当該グループにとっての最終的な値が蓄積される。当該グループのデータストア65には制御レジスタ60にある最初のスティッキー値が蓄積されるが、これはグループの実行にともない更新されることがあり、更新された値はデータストアに蓄積されない。   The trace control value is set for each group, and is accumulated in the data store 65 when a new group is encountered. However, the traced-interesting is appropriately updated for each instruction in the group, and a final value for the group is accumulated. The first sticky value in the control register 60 is accumulated in the data store 65 of the group, but this may be updated as the group is executed, and the updated value is not accumulated in the data store.

図12a乃至12cは、種々のトレース制御値がどのように更新されるかを説明する流れ図である。   Figures 12a to 12c are flow diagrams illustrating how various trace control values are updated.

スティッキービットがどのように設定されクリアされるかを図12aに示す。まずは、新たなグループが受信されたか否かを判断し、受信された場合は現在のスティッキービットがデータストア65に蓄積される。次に、新たなグループが受信されようがされまいが、命令がトレース有効命令か否かを判断し、トレース有効命令ならスティッキービットはクリアされ、トレース有効命令でなければトレースがイネーブルされるか否かを判断し、イネーブルされるならスティッキービットが設定される。次に、トレース有効命令があるならスティッキービットはクリアされ、命令がトレース有効命令でなくトレースがイネーブルされるならスティッキービットは設定される。   FIG. 12a shows how the sticky bit is set and cleared. First, it is determined whether or not a new group has been received. If it has been received, the current sticky bit is stored in the data store 65. Next, whether or not a new group is received, it is determined whether or not the instruction is a trace valid instruction. If the trace valid instruction, the sticky bit is cleared. If not, the trace is enabled. The sticky bit is set if enabled. Next, if there is a trace valid instruction, the sticky bit is cleared, and if the instruction is not a trace valid instruction and trace is enabled, the sticky bit is set.

previous−tracedがどのように設定されるかを図12bに示す。新たなグループがスタートするとprevious−tracedの現在値がデータストア65に蓄積される。次に、トレースがイネーブルされるか否かを判断し、イネーブルされるならprevious−tracedが設定され、イネーブルされないならスティッキービットが設定されているか否かを判断し、設定されているならprevious−tracedが設定され、設定されていなければprevious−tracedはクリアされる。   FIG. 12b shows how the previous-traced is set. When a new group starts, the current value of previous-traced is accumulated in the data store 65. Next, it is determined whether or not the trace is enabled. If enabled, the previous-traced is set. If not enabled, it is determined whether the sticky bit is set. If it is set, the previous-traced is set. Is set, and if it is not set, previous-traced is cleared.

グループがキャンセルされた場合に新規状態の出力をいつ強制するかを判断するため、initial_tracedがどのように更新され使用されるかを図12cに示す。グループの実行が始まるとスティッキービットが設定されているか否かを判断する。スティッキービットが設定されている場合は、トレースがイネーブルされようがされまいが、キャンセルされたグループのprevious_traced値とinitial_traced値を検討する必要がある。   FIG. 12c shows how initial_traced is updated and used to determine when to force a new state output when a group is canceled. When the execution of the group starts, it is determined whether or not the sticky bit is set. If the sticky bit is set, tracing is not enabled, but the previous_traced and initial_traced values of the canceled group need to be considered.

スティッキービットが設定されていない場合はトレースがイネーブルされるか否かを判断する。イネーブルされないならinitial_tracedはクリアされ(これはグループの最初の命令のtrace_enable値)、イネーブルされるなら、これがキャンセル後の最初の命令であるか否かを判断する。キャンセル後の最初の命令なら、キャンセルされたグループのprevious_traced値とinitial_traced値を検討する。   If the sticky bit is not set, it is determined whether tracing is enabled. If not enabled, initial_traced is cleared (this is the trace_enable value of the first instruction in the group), and if enabled, it is determined whether this is the first instruction after cancellation. If it is the first instruction after cancellation, consider the previous_traced value and initial_traced value of the canceled group.

キャンセルされたグループでprevious_tracedが設定されている場合は、キャンセルされたグループの前のグループの最終命令が実行されたときにトレースがイネーブルされていたことを意味し、initial_tracedがクリアの場合は、キャンセルされたグループの最初の命令が実行されたときにトレースがイネーブルされていなかったことを意味する。キャンセルされたグループの実行中にはトレースがイネーブルされ、状態エレメントが出力されたかもしれない。これが検出されるとforce new stateが発生する。グループがキャンセルされ、trace_enableが0から1に遷移し状態が出力されたと判断される場合には新規状態が出力され、トレース診断ツールはプログラムの実行位置を判断することができる。   If previous_traced is set for a canceled group, it means that tracing was enabled when the last instruction of the group preceding the canceled group was executed, and if initial_traced is clear, cancel This means that tracing was not enabled when the first instruction of the specified group was executed. During execution of the canceled group, tracing may be enabled and a status element may have been output. When this is detected, a force new state is generated. When it is determined that the group is canceled and trace_enable transitions from 0 to 1 and the state is output, a new state is output, and the trace diagnosis tool can determine the execution position of the program.

この場合、そのグループの最初の命令でトレースがイネーブルされていないとinitial−tracedはクリアされる(initial_tracedがクリアならトレースはイネーブルされていなかったことを意味し、キャンセルされたグループの以前の値にリセットされる)。キャンセルされたグループでinitial_tracedが設定されているなら、このグループの最初の命令でトレースはイネーブルされているため、initial−tracedは設定される。   In this case, initial-traced is cleared if tracing is not enabled in the first instruction of the group (if initial_traced is cleared, tracing was not enabled, and the previous value of the canceled group is set to the previous value). Reset). If initial_traced is set in the canceled group, initial-traced is set because tracing is enabled by the first instruction in this group.

命令がキャンセル後の最初の命令でないか、あるいはprevious_tracedが設定されていなければ、グループの最初の命令でトレースはイネーブルされinitial_tracedでこれを反映するためinitial_tracedは設定される。   If the instruction is not the first instruction after cancellation or previous_traced is not set, tracing is enabled on the first instruction in the group and initial_traced is set to reflect this in initial_traced.

次に新たなグループがスタートすると、そのグループのinitial_tracedが蓄積される。   Next, when a new group starts, initial_traced of the group is accumulated.

命令実行の例と、カウンタキー値とトレース制御値がどのように変化するかを図13に示す。実行される最初の命令はグループAの中にあり、アドレス1000を持ち、分岐命令である。トレースはイネーブルされ、トレースエレメントは出力され、現在のカウンタ値key 1がこの命令のトレースキーとして蓄積される。この時点でスティッキー値は0であり、initial traceは1に設定されている。load storeはなく、multiple trace命令はなく、previous traced値はまだなく、oldest committed命令は0に設定されている。   FIG. 13 shows an example of instruction execution and how the counter key value and the trace control value change. The first instruction to be executed is in group A, has address 1000, and is a branch instruction. Trace is enabled, the trace element is output, and the current counter value key 1 is stored as the trace key for this instruction. At this time, the sticky value is 0 and the initial trace is set to 1. There is no load store, no multiple trace instruction, no previously traced value, and the oldest committed instruction is set to zero.

次に実行される命令はグループBの中にあり、トレース無効命令である。トレースは引き続きイネーブルされ、カウンタは2に増加したためこのグループについてはkey 2が蓄積され、トレース無効命令の実行によりスティッキー値が設定される。先行グループの最後の命令が実行したときにトレースはイネーブルされていたためprevious traced値は1に設定され、このグループの最初の命令が実行したときにトレースはイネーブルされていたためinitial tracedは1に設定される。   The next instruction to be executed is in group B and is a trace invalid instruction. Trace is still enabled and the counter is incremented to 2, so key 2 is accumulated for this group and the sticky value is set by executing the trace invalid instruction. Since the trace was enabled when the last instruction of the preceding group executed, the previously traced value was set to 1, and since trace was enabled when the first instruction of this group was executed, initial traced was set to 1. The

次に実行される命令はグループCにある。これもトレース無効命令であり、トレースはイネーブルされない。カウンタ値は増加しないため、グループCのこの命令にはkey 2が割り振られ、スティッキー値は設定され続ける。   The next instruction to be executed is in group C. This is also a trace invalid instruction and the trace is not enabled. Since the counter value does not increase, this instruction in group C is assigned key 2 and the sticky value continues to be set.

次に実行される命令は分岐であり、trace enableは引き続きオフである。ただしスティッキー値が設定されているので、3000で命令が実行されたことをトレースストリームを解析する診断装置に指示するため、トレースアトムが出力される。この命令についてはカウンタ値key 2が蓄積され、カウンタは増加する。このトレースアトムの出力に応じてスティッキー値はリセットされる。   The next instruction to be executed is a branch and trace enable is still off. However, since a sticky value is set, a trace atom is output to instruct the diagnostic device that analyzes the trace stream that the instruction has been executed in 3000. For this instruction, the counter value key 2 is accumulated and the counter is incremented. The sticky value is reset according to the output of the trace atom.

次に実行されるグループはグループDであり、トレースはイネーブルされ、分岐命令であるためトレースエレメントが出力される。カウンタ値はkey 3であるためkey 3が蓄積され、この命令に割り振られる。スティッキー値は引き続き0であり、グループCの最終命令が実行したときにトレースはイネーブルされていなかったためprevious tracedは0であり、グループDの最初の命令が実行したときにトレースはイネーブルされていたためinitial tracedは1である。   The next group to be executed is group D, the trace is enabled, and a trace element is output because it is a branch instruction. Since the counter value is key 3, key 3 is accumulated and allocated to this instruction. The sticky value is still 0, and since trace was not enabled when the last instruction of group C was executed, previously traced was 0, and the trace was enabled when the first instruction of group D was executed, so initial traced is 1.

次にトレース回路は、グループCまで命令をキャンセルすることを指示する信号を受信する。グループCで蓄積されたキーはkey 2であり、oldest committedは0だから、2−0、すなわち2のキャンセル信号がトレースストリームにて診断装置へ送信され、カウンタは2減少する。グループCに関係するデータストアの値からトレースを制御する制御状態が復元される。   The trace circuit then receives a signal instructing to cancel the instruction up to group C. Since the key accumulated in group C is key 2 and oldest committed is 0, a cancel signal of 2-0, that is, 2 is transmitted to the diagnostic apparatus in the trace stream, and the counter is decreased by 2. The control state controlling the trace is restored from the value of the data store related to group C.

次に受信される命令はグループEにあり、分岐であり、トレースはイネーブルされるためトレースエレメントが出力され、キーは増加し、この命令についてはkey 2が蓄積される。previous tracedとinitial traceはいずれも1に設定され、このグループにはさらなるトレース有効命令loadがあるため、multiple traceは1に設定される。load及びstore命令のアドレスを出力する必要があることを指示するためtrace load storeも1に設定される。この場合はトレースがイネーブルされないためアドレスは出力されない。   The next instruction received is in group E, it is a branch, the trace is enabled so that the trace element is output, the key is incremented, and key 2 is accumulated for this instruction. Since both previous traced and initial trace are set to 1 and there are further trace valid instructions load in this group, multiple trace is set to 1. The trace load store is also set to 1 to indicate that the address of the load and store instructions needs to be output. In this case, no address is output because the trace is not enabled.

次の命令はグループFの中にあり、トレース無効命令である。このときtrace enableがオンになるため、trace onと状態出力が出力される。カウンタは増加せず、トレース無効命令であるためスティッキー値は設定されない。   The next instruction is in group F and is a trace invalid instruction. Since trace enable is turned on at this time, trace on and a status output are output. The counter does not increment and the sticky value is not set because it is a trace invalid instruction.

グループFの次の命令は分岐であるためトレースエレメントは出力される。スティッキー値はリセットされ、カウンタは4に増加する。   Since the next instruction of group F is a branch, the trace element is output. The sticky value is reset and the counter is incremented to 4.

次に、グループBをコミットする指示をコアから受信する。グループBで蓄積されたキー値はkey 2であるので、通常ならばoldest committed値が0であるためcommit 2信号が出力される。ただし、グループBのtraced interestingは0でグループBがトレースされなかったことを指示しているため、グループAの分岐命令が実行済みであることを指示するcommit 1が出力される。   Next, an instruction to commit group B is received from the core. Since the key value accumulated in the group B is “key 2”, the commit 2 signal is output because the oldest committed value is 0 in normal cases. However, since the group B traced interesting is 0 and indicates that the group B has not been traced, the commit 1 indicating that the group A branch instruction has been executed is output.

次のグループはグループGである。カウンタは引き続き増加し、これはトレース有効命令でありトレースはイネーブルされるため、アトムは出力される。カウンタがコミット信号の影響を受けないことに注意されたい。   The next group is group G. The counter continues to increment, and since this is a trace valid instruction and the trace is enabled, an atom is output. Note that the counter is not affected by the commit signal.

本発明の一実施形態による方法を説明する流れ図を図14に示す。   A flow diagram illustrating a method according to an embodiment of the invention is shown in FIG.

命令グループの形に配列された命令ストリームを処理するプロセッサの挙動は、トレース制御回路によって監視される。蓄積回路にはトレース回路を制御するため現在のトレース制御データが蓄積され、グループが実行されると、実行されたグループのトレース制御データの少なくとも一部がグループを識別する識別子とともにデータストアに蓄積される。次に、推測的に実行された命令グループをプロセッサがキャンセルしたか否かを判断する。これはプロセッサを監視するトレース制御回路によって判断される。命令がキャンセルされた場合は、キャンセルされた命令の直前の命令グループのトレース制御データが取り出され、これが蓄積回路に蓄積されることにより、トレース回路は適切なトレース制御データによって制御される。命令がキャンセルされていなければ、トレース回路はトレース制御データの制御下でプロセッサの監視を続ける。   The behavior of a processor that processes an instruction stream arranged in an instruction group is monitored by a trace control circuit. The storage circuit stores current trace control data for controlling the trace circuit. When a group is executed, at least a part of the trace control data of the executed group is stored in the data store together with an identifier for identifying the group. The Next, it is determined whether or not the processor has canceled the speculatively executed instruction group. This is determined by a trace control circuit that monitors the processor. When the instruction is canceled, the trace control data of the instruction group immediately before the canceled instruction is fetched and stored in the storage circuit, whereby the trace circuit is controlled by appropriate trace control data. If the instruction is not canceled, the trace circuit continues to monitor the processor under the control of the trace control data.

ここでは添付の図面を参照しながら本発明の例証的実施形態を説明してきたが、本発明はこれらの実施形態に限定されず、添付の請求項によって定められる本発明の範囲と精神から逸脱することなく当業者により様々な変更及び修正を行えることを理解されたい。   Although illustrative embodiments of the present invention have been described herein with reference to the accompanying drawings, the present invention is not limited to these embodiments and departs from the scope and spirit of the invention as defined by the appended claims. It should be understood that various changes and modifications can be made by those skilled in the art without limitation.

50 トレース回路
60 レジスタ
65 データストア
70 トレースインデックスユニット
72 カウンタ
80 ストア
50 Trace Circuit 60 Register 65 Data Store 70 Trace Index Unit 72 Counter 80 Store

Claims (25)

少なくとも1つの命令ストリームを実行する少なくとも1つのプロセッサの処理活動を示すトレースデータ項目を生成するトレースユニットであって、前記少なくとも1つの命令ストリームは複数の命令グループを備え、前記少なくとも1つのプロセッサは前記命令の少なくとも一部を推測的に実行し、前記トレースユニットは、
現在のトレース制御データによって制御され前記少なくとも1つのプロセッサの挙動を監視するトレース回路と、
前記実行される命令グループのうち該当する命令グループに関連する前記トレース制御データの少なくとも一部を蓄積するデータストアと、を備え、
前記トレース回路は、前記命令グループの実行の検出に応じて前記トレース制御データを前記データストアに蓄積するよう構成され、
前記トレース回路は、前記推測的に実行された少なくとも1つの命令グループを前記少なくとも1つのプロセッサがキャンセルしたことを検出することに反応し、前記データストアに蓄積された前記トレース制御データの少なくとも一部を取り出し、且つ前記取り出されたトレース制御データにより前記トレース回路を制御することを特徴とするトレースユニット。
A trace unit that generates trace data items indicative of processing activity of at least one processor executing at least one instruction stream, the at least one instruction stream comprising a plurality of instruction groups, wherein the at least one processor Speculatively executing at least part of the instructions, the trace unit comprising:
A trace circuit controlled by current trace control data and monitoring the behavior of the at least one processor;
A data store for storing at least a part of the trace control data related to the corresponding instruction group among the executed instruction groups;
The trace circuit is configured to store the trace control data in the data store in response to detection of execution of the instruction group;
The trace circuit is responsive to detecting that the at least one processor canceled the speculatively executed instruction group and at least a portion of the trace control data stored in the data store And a trace unit for controlling the trace circuit according to the extracted trace control data.
前記トレースユニットはさらに、前記トレース回路を制御するため前記現在のトレース制御データを蓄積する蓄積回路を備え、前記トレース回路は、前記推測的に実行された少なくとも1つの命令グループをキャンセルする前記少なくとも1つのプロセッサを検出することに応じ、前記取り出されたトレース制御データを前記蓄積回路に蓄積することを特徴とする請求項1に記載のトレースユニット。   The trace unit further comprises a storage circuit that stores the current trace control data to control the trace circuit, the trace circuit canceling the at least one instruction group executed speculatively. 2. The trace unit according to claim 1, wherein the extracted trace control data is stored in the storage circuit in response to detecting one processor. 前記トレース制御データは、前記該当する命令グループを識別する識別子とともに、前記データストアに蓄積されることを特徴とする請求項1に記載のトレースユニット。   The trace unit according to claim 1, wherein the trace control data is stored in the data store together with an identifier for identifying the corresponding instruction group. 前記トレース回路は、前記キャンセルされた命令グループの前記データストアに蓄積された前記トレース制御データの前記少なくとも一部を取り出すよう構成されることを特徴とする請求項1に記載のトレースユニット。   The trace unit according to claim 1, wherein the trace circuit is configured to retrieve the at least part of the trace control data stored in the data store of the canceled instruction group. 前記命令グループは、前記グループ内の最初の命令が実行されると前記グループ内の前記命令の全てが実行するようグループ分けされた命令を備えることを特徴とする請求項1に記載のトレースユニット。   The trace unit of claim 1, wherein the instruction group comprises instructions grouped such that all of the instructions in the group execute when the first instruction in the group is executed. 前記トレースユニットは、アサートされたtrace enable信号に反応し前記トレース回路による前記少なくとも1つのプロセッサの前記挙動の監視を可能にし、且つアサートされていない前記trace enable信号に反応し前記トレース回路による前記挙動の監視を禁止することを特徴とする請求項1に記載のトレースユニット。   The trace unit is responsive to an asserted trace enable signal to allow the trace circuit to monitor the behavior of the at least one processor and is responsive to an unasserted trace enable signal to respond to the behavior of the trace circuit. The trace unit according to claim 1, wherein monitoring is prohibited. 前記トレース制御データはスティッキー値を備え、前記トレース回路は所定値を有する前記スティッキー値に反応し、trace enable信号がenabled値を有するか否かにかかわらず、後に実行されるトレース有効命令のトレース値を出力し、且つ前記スティッキー値をリセットし、トレース有効命令はトレースデータ項目の出力をトリガする命令であることを特徴とする請求項6に記載のトレースユニット。   The trace control data includes a sticky value, the trace circuit responds to the sticky value having a predetermined value, and a trace value of a trace valid instruction to be executed later regardless of whether or not the trace enable signal has an enabled value. The trace unit according to claim 6, wherein the trace valid instruction is an instruction that triggers output of a trace data item. 前記トレース回路は、トレースデータ項目の出力をトリガするトレース有効命令ではない命令の実行を検出することに反応し、前記トレース制御データにて前記スティッキー値を設定することを特徴とする請求項7に記載のトレースユニット。   8. The trace circuit sets the sticky value in the trace control data in response to detecting execution of an instruction that is not a trace valid instruction that triggers output of a trace data item. The described trace unit. 前記トレース回路は、トレースデータ項目の出力をトリガするトレース有効命令ではない前記命令グループの1命令グループにおける最終命令の実行を検出することに反応し、前記トレース制御データにて前記スティッキー値を設定し、且つ前記設定されたスティッキー値を前記後続命令グループの前記データストアに蓄積することを特徴とする請求項8に記載のトレースユニット。   The trace circuit is responsive to detecting execution of a final instruction in one instruction group of the instruction group that is not a trace valid instruction that triggers output of a trace data item, and sets the sticky value in the trace control data. 9. The trace unit according to claim 8, wherein the set sticky value is stored in the data store of the subsequent instruction group. 前記トレース制御データはprevious−traced値を備え、前記トレース回路は、先行グループの最終命令が実行されるときにトレースがイネーブルされていないことを検出することに反応し、前記後続命令グループのため前記previous−traced値を設定し、前記トレース回路は、推測的に実行された命令グループをキャンセルする前記プロセッサと、前記キャンセルされたグループとの関連で蓄積され設定される前記previous−traced値とに反応し、前記トレースがオンになることを指示するトレースエレメントを出力することを特徴とする請求項1に記載のトレースユニット。   The trace control data comprises a previous-traced value, and the trace circuit is responsive to detecting that trace is not enabled when a last instruction of a preceding group is executed, and for the subsequent instruction group Setting a previous-traced value, the trace circuit reacts to the processor canceling a speculatively executed instruction group and the previous-traced value stored and set in relation to the canceled group The trace unit according to claim 1, wherein a trace element instructing that the trace is turned on is output. 前記トレース制御データはinitial−traced値を備え、前記トレース回路は、命令グループの実行中に命令アドレスを指示するトレース状態エレメントの出力に反応し、前記グループの前記initial−traced値を設定し、前記トレース回路は、前記initial−traced値が設定された命令グループをキャンセルする前記プロセッサを検出することに応じ、前記キャンセル後に実行された前記命令の命令アドレスを指示するさらなる状態エレメントを出力することを特徴とする請求項1に記載のトレースユニット。   The trace control data comprises an initial-traced value, and the trace circuit is responsive to an output of a trace state element indicating an instruction address during execution of an instruction group, sets the initial-traced value of the group, and The trace circuit outputs a further state element indicating an instruction address of the instruction executed after the cancellation in response to detecting the processor that cancels the instruction group in which the initial-traced value is set. The trace unit according to claim 1. 前記トレース制御データはtraced−interesting値を備え、前記traced−interesting値は、グループのトレースエレメントが出力されることに応じて設定され、且つグループのトレースエレメントが出力されない場合にクリアになることを特徴とする請求項1に記載のトレースユニット。   The trace control data includes a traced-interesting value, the traced-interesting value is set in response to the output of a group trace element, and is cleared when the group trace element is not output. The trace unit according to claim 1. 前記トレース制御データはtrace multiple値を備え、前記値が設定される場合は前記グループがトレースエレメントを生成する複数のトレース有効命令を備えていることを意味し、前記値が設定されない場合は前記グループが1個又はゼロ個のトレース有効命令を備えていることを意味することを特徴とする請求項1に記載のトレースユニット。   The trace control data includes a trace multiple value, and when the value is set, the group includes a plurality of trace valid instructions for generating a trace element, and when the value is not set, the group The trace unit according to claim 1, which means that comprises one or zero trace valid instructions. 前記トレース制御データはtrace multiple値を備え、前記値は、トレースエレメントを生成する前記グループ内のトレース有効命令数を指示することを特徴とする請求項1に記載のトレースユニット。   The trace unit according to claim 1, wherein the trace control data comprises a trace multiple value, and the value indicates the number of trace valid instructions in the group for generating a trace element. 前記トレースユニットは、インデックス値を生成し、且つ前記命令グループの各々に割り振られた前記インデックス値を蓄積するよう構成され、前記インデックス値はトレースエレメントが生成されるたびに更新されることを特徴とする請求項1に記載のトレースユニット。   The trace unit is configured to generate an index value and store the index value allocated to each of the instruction groups, the index value being updated each time a trace element is generated. The trace unit according to claim 1. 前記トレースユニットは前記インデックス値を生成するカウンタを備え、前記トレース回路は、前記グループの実行開始時の前記カウンタ値を指示する最初カウンタ値と、前記グループの実行終了時の前記カウンタ値を指示する最後カウンタ値とのうち、少なくとも一方を、各命令グループの前記データストアに蓄積することを特徴とする請求項15に記載のトレースユニット。   The trace unit includes a counter that generates the index value, and the trace circuit indicates an initial counter value that indicates the counter value at the start of execution of the group and the counter value at the end of execution of the group. The trace unit according to claim 15, wherein at least one of the last counter values is stored in the data store of each instruction group. 前記トレースユニットは前記インデックス値を生成するカウンタを備え、前記トレース回路は、前記グループの実行開始時の前記カウンタ値を指示する最初カウンタ値と、前記グループの実行終了時の前記カウンタ値を指示する最後カウンタ値とを、各命令グループの前記データストアに蓄積することを特徴とする請求項15に記載のトレースユニット。   The trace unit includes a counter that generates the index value, and the trace circuit indicates an initial counter value that indicates the counter value at the start of execution of the group and the counter value at the end of execution of the group. 16. The trace unit according to claim 15, wherein a last counter value is stored in the data store of each instruction group. 前記トレース回路は、推測的に実行された選択命令グループがキャンセルされたことを指示するキャンセル指示を前記データ処理装置から受信し、前記キャンセルされた選択命令グループを指示するキャンセルトレース項目を生成し、且つ前記現在カウンタ値と、前記キャンセルされたグループの実行開始時の前記カウンタ値との差に関する情報を、前記キャンセルトレース項目に含めるよう構成されることを特徴とする請求項17に記載のトレースユニット。   The trace circuit receives a cancel instruction from the data processing apparatus indicating that the speculatively executed selected instruction group is canceled, and generates a cancel trace item indicating the canceled selected instruction group; 18. The trace unit according to claim 17, wherein the cancel trace item is configured to include information on a difference between the current counter value and the counter value at the start of execution of the canceled group. . 前記トレース制御データはtraced−interesting値を備え、前記traced−interesting値は、グループのトレースエレメントが出力されることに応じて設定され、且つグループのトレースエレメントが出力されない場合にクリアになり、前記トレース回路は、前記traced−interesting値を頼りに前記差に関する前記情報を判断するよう構成されることを特徴とする請求項18に記載のトレースユニット。   The trace control data includes a traced-interesting value, the traced-interesting value is set in response to the output of a group trace element, and is cleared when the group trace element is not output. The trace unit of claim 18, wherein a circuit is configured to determine the information about the difference depending on the traced-interesting value. 前記トレースユニットは、推測的に実行された選択命令グループがコミットされたことを伝える前記データ処理装置からのコミット指示の受信に反応し、前記選択グループを指示するコミットトレース項目を生成し、且つ前記現在カウンタ値と前記選択グループの前記最後カウンタ値との差に関する情報を含むようにすることを特徴とする請求項16に記載のトレースユニット。   The trace unit is responsive to receiving a commit indication from the data processing device that communicates that a speculatively executed selection instruction group has been committed, and generates a commit trace item indicating the selection group; and The trace unit according to claim 16, characterized in that it includes information on the difference between the current counter value and the last counter value of the selected group. 前記トレース制御データはtraced−interesting値を備え、前記traced−interesting値は、グループのトレースエレメントが出力されることに応じて設定され、且つグループのトレースエレメントが出力されない場合にクリアになり、前記トレース回路は、前記traced−interesting値を頼りに前記差に関する前記情報を判断するよう構成されることを特徴とする請求項20に記載のトレースユニット。   The trace control data includes a traced-interesting value, the traced-interesting value is set in response to the output of a group trace element, and is cleared when the group trace element is not output. 21. The trace unit of claim 20, wherein a circuit is configured to determine the information regarding the difference depending on the traced-interesting value. 前記トレース制御データは前記グループのtrace start/stop値を備え、前記trace start/stop値はtrace enableが設定されるか否かに影響し、前記trace start/stop値は前記少なくとも1つのプロセッサの検出される所定挙動に応じて設定されることを特徴とする請求項1に記載のトレースユニット。   The trace control data includes a trace start / stop value of the group, the trace start / stop value affects whether or not a trace enable is set, and the trace start / stop value is detected by the at least one processor. The trace unit according to claim 1, wherein the trace unit is set according to a predetermined behavior. 命令ストリームを実行するデータ処理装置と、前記データ処理装置を監視する請求項1に記載のトレースユニットと、を備えることを特徴とするデータ処理ユニット。   A data processing unit comprising: a data processing device that executes an instruction stream; and the trace unit according to claim 1 that monitors the data processing device. 少なくとも1つの命令ストリームを実行する少なくとも1つのプロセッサの処理活動を示すトレースデータ項目を生成する方法であって、前記少なくとも1つの命令ストリームは複数の命令グループを備え、前記少なくとも1つのプロセッサは前記命令の少なくとも一部を推測的に実行し、前記方法は、
現在のトレース制御データにより制御されるトレース回路を使用し前記少なくとも1つのプロセッサの挙動を監視するステップと、
前記実行される命令グループの1命令グループに関連する前記トレース制御データの少なくとも一部を蓄積するステップと、
前記推測的に実行された少なくとも1つの命令グループを前記少なくとも1つのプロセッサがキャンセルしたことを検出することに応じ、前記キャンセルされる推測実行命令の直前に実行された前記命令グループのデータストアに蓄積された前記トレース制御データの少なくとも一部を取り出すステップと、前記取り出されたトレース制御データにより前記トレース回路を制御するステップと、を備えることを特徴とする方法。
A method for generating trace data items indicative of processing activity of at least one processor executing at least one instruction stream, wherein the at least one instruction stream comprises a plurality of instruction groups, the at least one processor comprising the instructions And at least partly performing the method, the method comprising:
Monitoring the behavior of the at least one processor using a trace circuit controlled by current trace control data;
Storing at least a portion of the trace control data associated with an instruction group of the executed instruction group;
Accumulating in the data store of the instruction group executed immediately before the speculative execution instruction to be canceled in response to detecting that the at least one processor has canceled the at least one instruction group executed speculatively Extracting at least a part of the trace control data obtained, and controlling the trace circuit according to the fetched trace control data.
少なくとも1つの命令ストリームを実行する少なくとも1つのプロセッサの処理活動を示すトレースデータ項目を生成するトレース装置であって、前記少なくとも1つの命令ストリームは複数の命令グループを備え、前記少なくとも1つのプロセッサは前記命令の少なくとも一部を推測的に実行し、前記トレース装置は、
現在のトレース制御データにより制御される前記少なくとも1つのプロセッサの挙動を監視するトレース監視手段と、
前記実行される命令グループのうち該当する命令グループに関連する前記トレース制御データの少なくとも一部を蓄積するデータ蓄積手段と、を備え、
前記トレース監視手段は、前記命令グループの実行の検出に応じ、前記トレース制御データの前記少なくとも一部を前記データ蓄積手段に蓄積し、
前記トレース監視手段は、前記推測的に実行された少なくとも1つの命令グループを前記少なくとも1つのプロセッサがキャンセルしたことを検出することに反応し、前記キャンセルされた推測実行命令の前に実行された前記命令グループの前記データ蓄積手段に蓄積された前記トレース制御データの少なくとも一部を取り出し、且つ前記取り出されたトレース制御データにより前記トレース監視手段を制御することを特徴とするトレース装置
A tracing device for generating trace data items indicative of processing activity of at least one processor executing at least one instruction stream, wherein the at least one instruction stream comprises a plurality of instruction groups, wherein the at least one processor Speculatively executing at least part of the instructions, the tracing device comprising:
Trace monitoring means for monitoring the behavior of the at least one processor controlled by current trace control data;
Data storage means for storing at least a part of the trace control data related to the corresponding instruction group among the executed instruction groups;
The trace monitoring means stores the at least part of the trace control data in the data storage means in response to detection of execution of the instruction group;
The trace monitoring means is responsive to detecting that the at least one processor cancels the at least one instruction group executed speculatively, and the trace monitoring means is executed before the canceled speculative execution instruction. A tracing apparatus characterized in that at least a part of the trace control data stored in the data storage means of an instruction group is extracted and the trace monitoring means is controlled by the extracted trace control data.
JP2011136189A 2010-06-21 2011-06-20 Instruction speculative execution tracing Active JP5604373B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB1010356.2 2010-06-21
GB1010356.2A GB2481385B (en) 2010-06-21 2010-06-21 Tracing speculatively executed instructions

Publications (2)

Publication Number Publication Date
JP2012003771A JP2012003771A (en) 2012-01-05
JP5604373B2 true JP5604373B2 (en) 2014-10-08

Family

ID=42582707

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011136189A Active JP5604373B2 (en) 2010-06-21 2011-06-20 Instruction speculative execution tracing

Country Status (4)

Country Link
US (2) US8769344B2 (en)
JP (1) JP5604373B2 (en)
CN (1) CN102289405B (en)
GB (1) GB2481385B (en)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2481385B (en) * 2010-06-21 2018-08-15 Advanced Risc Mach Ltd Tracing speculatively executed instructions
US8799719B2 (en) * 2011-05-19 2014-08-05 International Business Machines Corporation On demand tracing of application code execution
WO2013101214A1 (en) * 2011-12-30 2013-07-04 Intel Corporation Optional logging of debug activities in a real time instruction tracing log
US9411591B2 (en) 2012-03-16 2016-08-09 International Business Machines Corporation Run-time instrumentation sampling in transactional-execution mode
US9367316B2 (en) 2012-03-16 2016-06-14 International Business Machines Corporation Run-time instrumentation indirect sampling by instruction operation code
US9442824B2 (en) 2012-03-16 2016-09-13 International Business Machines Corporation Transformation of a program-event-recording event into a run-time instrumentation event
US9471315B2 (en) 2012-03-16 2016-10-18 International Business Machines Corporation Run-time instrumentation reporting
US9454462B2 (en) 2012-03-16 2016-09-27 International Business Machines Corporation Run-time instrumentation monitoring for processor characteristic changes
US9250902B2 (en) 2012-03-16 2016-02-02 International Business Machines Corporation Determining the status of run-time-instrumentation controls
US9280447B2 (en) 2012-03-16 2016-03-08 International Business Machines Corporation Modifying run-time-instrumentation controls from a lesser-privileged state
US9483268B2 (en) 2012-03-16 2016-11-01 International Business Machines Corporation Hardware based run-time instrumentation facility for managed run-times
US9465716B2 (en) 2012-03-16 2016-10-11 International Business Machines Corporation Run-time instrumentation directed sampling
US9405541B2 (en) 2012-03-16 2016-08-02 International Business Machines Corporation Run-time instrumentation indirect sampling by address
US9158660B2 (en) 2012-03-16 2015-10-13 International Business Machines Corporation Controlling operation of a run-time instrumentation facility
US9430238B2 (en) 2012-03-16 2016-08-30 International Business Machines Corporation Run-time-instrumentation controls emit instruction
US9880842B2 (en) * 2013-03-15 2018-01-30 Intel Corporation Using control flow data structures to direct and track instruction execution
RU2635044C2 (en) * 2013-06-27 2017-11-08 Интел Корпорейшн Tracking mode in the processing device of the tracing commands systems
JP6122749B2 (en) * 2013-09-30 2017-04-26 ルネサスエレクトロニクス株式会社 Computer system
US9626119B2 (en) * 2014-11-14 2017-04-18 Intel Corporation Using counters and a table to protect data in a storage device
US9910475B2 (en) 2014-12-23 2018-03-06 Intel Corporation Processor core power event tracing
US10061583B2 (en) * 2014-12-24 2018-08-28 Intel Corporation Systems, apparatuses, and methods for data speculation execution
GB2534923B (en) * 2015-02-06 2022-03-09 Advanced Risc Mach Ltd Trace data capture device and method, system, diagnostic method and apparatus and computer program
US9542290B1 (en) 2016-01-29 2017-01-10 International Business Machines Corporation Replicating test case data into a cache with non-naturally aligned data boundaries
US10169180B2 (en) 2016-05-11 2019-01-01 International Business Machines Corporation Replicating test code and test data into a cache with non-naturally aligned data boundaries
GB2551747B (en) * 2016-06-29 2019-04-10 Advanced Risc Mach Ltd Diagnostic data capture
US10055320B2 (en) 2016-07-12 2018-08-21 International Business Machines Corporation Replicating test case data into a cache and cache inhibited memory
GB2553582B (en) * 2016-09-13 2020-07-08 Advanced Risc Mach Ltd An apparatus and method for generating and processing a trace stream indicative of instruction execution by processing circuitry
US10223225B2 (en) 2016-11-07 2019-03-05 International Business Machines Corporation Testing speculative instruction execution with test cases placed in memory segments with non-naturally aligned data boundaries
US10261878B2 (en) 2017-03-14 2019-04-16 International Business Machines Corporation Stress testing a processor memory with a link stack
US10365987B2 (en) 2017-03-29 2019-07-30 Google Llc Synchronous hardware event collection
US9875167B1 (en) 2017-03-29 2018-01-23 Google Inc. Distributed hardware tracing
GB2570466B (en) * 2018-01-25 2020-03-04 Advanced Risc Mach Ltd Commit window move element
US10956157B1 (en) 2018-03-06 2021-03-23 Advanced Micro Devices, Inc. Taint protection during speculative execution
US10936402B2 (en) 2018-11-26 2021-03-02 International Business Machines Corporation Speculative data processing and recovery
US11526780B2 (en) * 2019-08-05 2022-12-13 Microsoft Technology Licensing, Llc Converting nonnative skills for conversational computing interfaces
US11463443B2 (en) 2019-09-19 2022-10-04 Bank Of America Corporation Real-time management of access controls

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0404068A3 (en) * 1989-06-20 1991-12-27 Fujitsu Limited Branch instruction executing device
JP2563708B2 (en) 1990-11-29 1996-12-18 株式会社東芝 Microprocessor device and emulator device using the same
US5564028A (en) * 1994-01-11 1996-10-08 Texas Instruments Incorporated Pipelined data processing including instruction trace
US5802272A (en) * 1994-12-19 1998-09-01 Digital Equipment Corporation Method and apparatus for tracing unpredictable execution flows in a trace buffer of a high-speed computer system
US6094729A (en) * 1997-04-08 2000-07-25 Advanced Micro Devices, Inc. Debug interface including a compact trace record storage
US6021488A (en) * 1997-09-23 2000-02-01 International Business Machines Corp. Data processing system having an apparatus for tracking a status of an out-of-order operation and method thereof
US7137105B2 (en) * 1999-05-12 2006-11-14 Wind River Systems, Inc. Dynamic software code instrumentation method and system
US7058928B2 (en) * 1999-12-23 2006-06-06 Identify Software Ltd. System and method for conditional tracing of computer programs
US6681321B1 (en) * 2000-04-20 2004-01-20 International Business Machines Corporation Method system and apparatus for instruction execution tracing with out of order processors
US8069336B2 (en) 2003-12-03 2011-11-29 Globalfoundries Inc. Transitioning from instruction cache to trace cache on label boundaries
FR2864655B1 (en) * 2003-12-31 2006-03-24 Trusted Logic METHOD OF CONTROLLING INTEGRITY OF PROGRAMS BY VERIFYING IMPRESSIONS OF EXECUTION TRACES
US7228457B2 (en) * 2004-03-16 2007-06-05 Arm Limited Performing diagnostic operations upon a data processing apparatus with power down support
US7283619B2 (en) * 2004-06-15 2007-10-16 Cisco Technology, Inc. System and method for end-to-end communications tracing
US7707394B2 (en) * 2006-05-30 2010-04-27 Arm Limited Reducing the size of a data stream produced during instruction tracing
US7487340B2 (en) * 2006-06-08 2009-02-03 International Business Machines Corporation Local and global branch prediction information storage
US20080155339A1 (en) * 2006-10-25 2008-06-26 Gary S Lowe Automated tracing
US7757068B2 (en) * 2007-01-16 2010-07-13 Oracle America, Inc. Method and apparatus for measuring performance during speculative execution
GB2459652B (en) 2008-04-28 2010-09-22 Imagination Tech Ltd Controlling instruction scheduling based on the space in a trace buffer
GB2478328B (en) * 2010-03-03 2015-07-01 Advanced Risc Mach Ltd Method, apparatus and trace module for generating timestamps
GB2481385B (en) * 2010-06-21 2018-08-15 Advanced Risc Mach Ltd Tracing speculatively executed instructions

Also Published As

Publication number Publication date
GB2481385A (en) 2011-12-28
US20140195786A1 (en) 2014-07-10
US20110314342A1 (en) 2011-12-22
GB2481385B (en) 2018-08-15
CN102289405B (en) 2016-11-23
US8769344B2 (en) 2014-07-01
CN102289405A (en) 2011-12-21
US9639361B2 (en) 2017-05-02
GB201010356D0 (en) 2010-08-04
JP2012003771A (en) 2012-01-05

Similar Documents

Publication Publication Date Title
JP5604373B2 (en) Instruction speculative execution tracing
JP5914521B2 (en) Processing device, trace unit, and diagnostic device
KR100382126B1 (en) Out-of-pipeline trace buffer for holding instructions that may be re-executed following misspeculation
TWI517035B (en) Key allocation when tracing data processing systems
US6754856B2 (en) Memory access debug facility
TW201439904A (en) Managing potentially invalid results during runahead
KR20010024751A (en) System for ordering load and store instructions that performs out-of-order multithread execution
KR20010033242A (en) Processor having multiple program counters and trace buffers outside an execution pipeline
JP4903149B2 (en) Method for processing a computer program on a computer system
US7519510B2 (en) Derivative performance counter mechanism
US20170199778A1 (en) Lazy runahead operation for a microprocessor
US9514046B1 (en) Dynamic detection and software correction of incorrect lock and atomic update hint bits
US20140164738A1 (en) Instruction categorization for runahead operation
TW201737060A (en) Program loop control
US20040025146A1 (en) Cycles per instruction stack in a computer processor
JP2008513899A (en) Method for processing a computer program on a computer system
US6910120B2 (en) Speculative counting of performance events with rewind counter
US9921953B2 (en) Dynamic detection and correction of incorrect lock and atomic update hint bits
US9858172B2 (en) Apparatus and method for controlling debugging of program instructions including a transaction
JP7153731B2 (en) Commit window move element

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130904

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140507

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140702

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140728

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140825

R150 Certificate of patent or registration of utility model

Ref document number: 5604373

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250