JP2014225088A - Arithmetic unit - Google Patents
Arithmetic unit Download PDFInfo
- Publication number
- JP2014225088A JP2014225088A JP2013103260A JP2013103260A JP2014225088A JP 2014225088 A JP2014225088 A JP 2014225088A JP 2013103260 A JP2013103260 A JP 2013103260A JP 2013103260 A JP2013103260 A JP 2013103260A JP 2014225088 A JP2014225088 A JP 2014225088A
- Authority
- JP
- Japan
- Prior art keywords
- task
- processing
- data
- unit
- storage unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Advance Control (AREA)
- Memory System Of A Hierarchy Structure (AREA)
Abstract
Description
本発明は、演算装置に関する。 The present invention relates to an arithmetic device.
従来から、プログラムに応じた演算処理を実行するプロセッサを備えた演算装置がある。このような演算装置では、プロセッサが実行するそれぞれの演算処理を複数のタスクに分割し、プロセッサは、分割したそれぞれのタスクを順次実行することによって演算処理を行う。演算装置における演算処理では、外部のメモリにアクセスしながら実行する、すなわち、演算処理で使用するデータを、外部のメモリから読み出したり、外部のメモリに書き込んだりしながら実行する演算処理もある。しかし、外部のメモリへのアクセスには多くの時間を要してしまうため、外部のメモリへのアクセスを伴う演算処理は、内部のみで行うことができる演算処理に比べて多くの時間を要する。このため、従来の演算装置では、演算装置の処理速度を向上させるため、演算処理に使用するデータを予め外部のメモリから読み出して、外部のメモリよりも高速なメモリ、いわゆる、キャッシュメモリに一時記憶しておく構成のものが多く見受けられる。 2. Description of the Related Art Conventionally, there is an arithmetic device including a processor that executes arithmetic processing according to a program. In such an arithmetic device, each arithmetic processing executed by the processor is divided into a plurality of tasks, and the processor performs arithmetic processing by sequentially executing the divided tasks. In the arithmetic processing in the arithmetic device, there is an arithmetic processing that is executed while accessing an external memory, that is, the data used in the arithmetic processing is read from the external memory or written to the external memory. However, since it takes a lot of time to access an external memory, a calculation process involving access to an external memory requires a lot of time compared to a calculation process that can be performed only inside. For this reason, in the conventional arithmetic device, in order to improve the processing speed of the arithmetic device, data used for the arithmetic processing is read from an external memory in advance and temporarily stored in a memory faster than the external memory, so-called cache memory. There are many things that can be configured.
しかしながら、キャッシュメモリを備えた演算装置であっても、演算装置の回路規模の観点から、演算処理に必要な全てのデータを保持しておくことができるだけの記憶容量を持ったキャッシュメモリを備えることはできない。このため、演算処理に必要なデータがキャッシュメモリに事前に保持されていない場合、いわゆる、キャッシュミスの状態である場合には、やはり外部のメモリに対するアクセスが発生し、演算装置の処理速度を向上させることができない場合もある。 However, even with an arithmetic device provided with a cache memory, from the viewpoint of the circuit scale of the arithmetic device, it is provided with a cache memory having a storage capacity sufficient to hold all data necessary for arithmetic processing. I can't. For this reason, if the data required for the arithmetic processing is not stored in the cache memory in advance, in the case of a so-called cache miss, access to the external memory still occurs, improving the processing speed of the arithmetic unit. There are cases where it cannot be allowed to.
このことから、プロセッサがメモリからデータを読み出すロード命令およびメモリにデータを書き込むストア命令を含む演算命令(以下、「ロード・ストア命令」という)を抽出し、抽出したロード・ストア命令によってアクセスするメモリのアドレスに対するプリフェッチ命令を、データを使用する演算命令よりも早いタイミングで実行することによって、キャッシュミスを防止するようにした演算装置がある(特許文献1参照)。 From this, the processor extracts a calculation instruction including a load instruction for reading data from the memory and a store instruction for writing data to the memory (hereinafter referred to as “load / store instruction”), and is accessed by the extracted load / store instruction. There is an arithmetic unit that prevents a cache miss by executing a prefetch instruction for a given address at an earlier timing than an arithmetic instruction that uses data (see Patent Document 1).
また、プロセッサを複数備え、それぞれのプロセッサが、例えば、画像処理などの一連の処理を分担して並列に演算処理を行う、いわゆる、分散並列処理型の演算装置がある。分散並列処理型の演算装置では、要求された演算命令を複数個のプロセッサが分担して行うことによって、演算処理に要する時間の短縮を図ることができる。 In addition, there is a so-called distributed parallel processing type arithmetic device in which a plurality of processors are provided and each processor shares a series of processing such as image processing and performs arithmetic processing in parallel. In the distributed parallel processing type arithmetic device, the time required for arithmetic processing can be shortened by sharing a requested arithmetic instruction by a plurality of processors.
このような分散並列処理型の演算装置において、プロセッサ同士でのそれぞれのタスクの処理の待ち合わせやラインバッファ処理など、データを一定時間保持する必要がある処理、あるいは演算装置に搭載しているプロセッサの数よりも多くのタスクからなる処理を行うために、特許文献1で開示された、キャッシュミスを防止する技術を適用することも考えられる。
In such a distributed parallel processing type arithmetic device, processing that requires the data to be held for a certain period of time, such as waiting for processing of each task between the processors and line buffer processing, or the processor installed in the arithmetic device In order to perform processing consisting of more tasks than the number, it is conceivable to apply the technique for preventing cache misses disclosed in
しかしながら、演算装置に備えたプロセッサによる実際の演算処理においては、プリフェッチ命令が発行されてから、プリフェッチ命令によって事前に取得したデータを実際に使用する演算命令が実行されるまでのサイクル数が、プログラムの組み方によって変動する。そして、プリフェッチ命令の発行からデータを使用するまでのサイクル数を制御することはできない。このため、特許文献1で開示された技術を適用した演算装置であっても、演算命令に応じてデータを使用するときまでに、必要なデータの準備が必ず完了していることが保証されるものではない。
However, in the actual arithmetic processing by the processor provided in the arithmetic unit, the number of cycles from when the prefetch instruction is issued until the arithmetic instruction that actually uses data acquired in advance by the prefetch instruction is executed is It will vary depending on how it is assembled. The number of cycles from issuing the prefetch instruction to using the data cannot be controlled. For this reason, even in the arithmetic device to which the technique disclosed in
例えば、データを使用する今回の演算命令の1サイクル前にプリフェッチ命令を実行したとしても、プリフェッチ命令に応じたデータを取得するための外部のメモリのアクセスに30サイクルを要し、前の演算命令の実行が1サイクルで完了してしまうような場合には、プリフェッチ命令によって事前にデータを準備しておくことができず、29サイクルの間、今回の演算命令の実行が待たされることになる。この演算命令の実行が待たされている時間、つまり、キャッシュミスの状態になっている時間は、プロセッサが演算処理を行うことができず、演算装置の処理速度が低下する要因となってしまう。 For example, even if a prefetch instruction is executed one cycle before the current operation instruction using data, 30 cycles are required to access an external memory for acquiring data corresponding to the prefetch instruction, and the previous operation instruction When the execution of is completed in one cycle, the data cannot be prepared in advance by the prefetch instruction, and the execution of the current operation instruction is waited for 29 cycles. The time for which the execution of the arithmetic instruction is awaited, that is, the time when the cache instruction is in a cache miss state, the processor cannot perform the arithmetic processing, which causes a reduction in the processing speed of the arithmetic device.
このように、特許文献1で開示された技術を適用した演算装置であっても、常にキャッシュメモリへのデータのプリフェッチが間に合うということを保証することができず、必ずしもキャッシュミスを防止することができるとはいえない、という問題がある。
As described above, even an arithmetic device to which the technique disclosed in
本発明は、上記の課題認識に基づいてなされたものであり、複数のプロセッサが連携して処理を行う演算装置において、それぞれのプロセッサが実際にデータを使用するタイミングまでに、必要なデータを準備しておくことにより、キャッシュミスを防止することができる演算装置を提供することを目的としている。 The present invention has been made on the basis of the above-mentioned problem recognition, and in an arithmetic device in which a plurality of processors perform processing in cooperation, necessary data is prepared before each processor actually uses the data. An object of the present invention is to provide an arithmetic device capable of preventing a cache miss.
上記の課題を解決するため、本発明の演算装置は、入力されたタスクに応じた演算処理を行う処理機能を有し、次に実行する演算処理に関する情報を前記タスクとして出力する複数の処理演算部と、それぞれの前記処理演算部が前記タスクに応じた演算処理を実行する際に使用するデータ、または前記タスクに応じた演算処理を実行した結果のデータを格納するデータ記憶部と、前記タスクに応じた演算処理を実行する際に使用するデータを接続された外部記憶部から読み出して前記データ記憶部に格納、または前記データ記憶部に格納されている前記タスクに応じた演算処理を実行した結果のデータを接続された前記外部記憶部に書き込むメモリ制御部と、前記タスクを順次格納するタスクキューを具備し、該タスクキューに格納された前記タスクを、複数の前記処理演算部の内、いずれか1つの前記処理演算部に出力すると共に、前記タスクキューに格納されたそれぞれの前記タスクに応じた演算処理を前記処理演算部が実行する際のタイミングに基づいて、前記外部記憶部へのアクセスを前記メモリ制御部に指示するアクセス指示を出力するタスク制御部と、を備えることを特徴とする。 In order to solve the above problems, the arithmetic device of the present invention has a processing function for performing arithmetic processing according to an input task, and outputs a plurality of processing arithmetics as information about the arithmetic processing to be executed next as the task A data storage unit that stores data used when each processing operation unit executes an arithmetic process corresponding to the task, or data obtained as a result of executing the arithmetic process corresponding to the task, and the task The data used when executing the arithmetic processing according to the data is read from the connected external storage unit and stored in the data storage unit, or the arithmetic processing according to the task stored in the data storage unit is executed A memory control unit for writing the result data to the connected external storage unit, and a task queue for sequentially storing the tasks; When a task is output to any one of the plurality of processing operation units among the plurality of processing operation units, and the processing operation unit executes an operation process corresponding to each task stored in the task queue And a task control unit that outputs an access instruction for instructing the memory control unit to access the external storage unit based on the timing.
本発明によれば、複数のプロセッサが連携して処理を行う演算装置において、それぞれのプロセッサが実際にデータを使用するタイミングまでに、必要なデータを準備しておくことにより、キャッシュミスを防止することができる演算装置を提供することができるという効果が得られる。 According to the present invention, in an arithmetic unit in which a plurality of processors perform processing in cooperation, a cache miss is prevented by preparing necessary data before each processor actually uses the data. The effect that the arithmetic device which can be provided can be provided is acquired.
以下、本発明の実施形態について、図面を参照して説明する。図1は、本実施形態における演算装置の概略構成の一例を示したブロック図である。図1に示した演算装置10は、n個の処理演算部11a〜処理演算部11nと、タスク制御部12と、メモリ制御部13と、n個のデータ記憶部14a〜データ記憶部14nと、を備えている。また、演算装置10には、外部記憶部20が接続されている。演算装置10は、要求された演算処理を、処理演算部11a〜処理演算部11nのそれぞれで分担して行う、分散並列処理型の演算装置である。
Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram illustrating an example of a schematic configuration of the arithmetic device according to the present embodiment. The
なお、以下の説明においては、処理演算部11a〜処理演算部11nのそれぞれを区別せずに表す場合には、「処理演算部11」という。また、データ記憶部14a〜データ記憶部14nのそれぞれを区別せずに表す場合には、「データ記憶部14」という。
In the following description, when each of the
外部記憶部20は、処理演算部11a〜処理演算部11nのそれぞれで共有される、例えば、DRAM(Dynamic Random Access Memory)などのメモリである。外部記憶部20には、処理演算部11a〜処理演算部11nのそれぞれが起動するためのプログラムや、処理演算部11a〜処理演算部11nのそれぞれが演算処理を実行するために用いるデータが格納されている。また、外部記憶部20には、処理演算部11a〜処理演算部11nのそれぞれが演算処理の途中で生成したデータなどが、一時的に格納される。
The
処理演算部11a〜処理演算部11nのそれぞれは、同じ処理機能を持ったプロセッサである。処理演算部11a〜処理演算部11nのそれぞれは、演算装置10に接続された外部記憶部20へのデータの書き込みや、外部記憶部20からのデータの読み出しを行いながら、タスク制御部12から入力された、演算装置10に対して要求された演算処理におけるそれぞれのタスクを実行する。ただし、演算装置10では、外部記憶部20へのデータの書き込みや、外部記憶部20からのデータの読み出しを、処理演算部11a〜処理演算部11nのそれぞれが直接行わない。そして、処理演算部11a〜処理演算部11nのそれぞれがタスクを実行する際には、外部記憶部20へのデータの書き込みや、外部記憶部20からのデータの読み出しの代わりに、データ記憶部14へのデータの書き込みや、データ記憶部14からのデータの読み出しを行いながら、タスク制御部12から入力されたそれぞれのタスクを実行する。
Each of the
また、処理演算部11a〜処理演算部11nのそれぞれは、自身がタスクを実行した後に引き続き別の処理演算部11または自身に、次のタスクを実行させるための情報や、次に実行するタスクの内容を表す情報を、次のタスクの実行要求として、タスク制御部12に出力する。ここで、処理演算部11がタスク制御部12に出力する次のタスクの実行要求の情報には、タスクを実行する際に使用するデータが保持されている外部記憶部20のアドレスやデータ記憶部14を指定する情報が含まれている。また、処理演算部11がタスク制御部12に出力する次のタスクの実行要求の情報には、次のタスクの実行に必要な様々なパラメータのデータが含まれている。なお、以下の説明においては、処理演算部11がタスク制御部12に出力する、次のタスクの実行要求も、タスクという。
In addition, each of the
また、処理演算部11a〜処理演算部11nのそれぞれは、タスク制御部12から入力された、別の処理演算部11または自身が前回のタスクを実行した結果である、次のタスクを実行する。なお、処理演算部11a〜処理演算部11nのそれぞれは、さらに別の処理演算部11または自身が引き続き実行するタスクがある場合には、引き続き別の処理演算部11または自身に、次のタスクを実行させるための情報や、次に実行するタスクの内容を表す情報を、次のタスクとして再度、タスク制御部12に出力する。
In addition, each of the
また、処理演算部11a〜処理演算部11nのそれぞれは、次のタスクを受け付けられる状態であるか否かを表す信号を、タスク制御部12に出力する。処理演算部11a〜処理演算部11nのそれぞれは、今回実行しているタスクの処理が完了し、次のタスクを実行する準備が整ったときに、次に実行するタスクを受け付けられる状態であることを表す信号を、タスク制御部12に出力する。
In addition, each of the
タスク制御部12は、処理演算部11a〜処理演算部11nのそれぞれから入力されたそれぞれのタスクを受け付け、処理演算部11a〜処理演算部11nのそれぞれから入力された、次のタスクを受け付けられる状態であるか否かを表す信号に基づいて、受け付けたタスクを、処理演算部11a〜処理演算部11nのいずれか1つに割り当てる。
The
より具体的には、タスク制御部12は、処理演算部11a〜処理演算部11nのそれぞれから入力されたそれぞれのタスクに基づいて、次のタスクを受け付けられる状態であることを表す信号を入力している処理演算部11の中から、次のタスクを実行させる、いずれか1つ処理演算部11を選択する。そして、タスク制御部12は、選択したいずれか1つの処理演算部11にタスクを出力することによって、演算装置10に対して要求された演算処理におけるそれぞれのタスクを、処理演算部11a〜処理演算部11nのそれぞれに分配する。
More specifically, the
タスク制御部12は、処理演算部11a〜処理演算部11nのそれぞれからのタスクを受け付けるための構成として、タスクキュー121を備えている。タスクキュー121は、入力されたタスクを格納する待ち行列のメモリである。タスクキュー121には、処理演算部11a〜処理演算部11nのそれぞれから入力されたそれぞれのタスクが、入力された順番で順次格納される。タスクキュー121に格納されたそれぞれのタスクは、基本的に、格納された順番で出力されるが、演算装置10では、タスク制御部12が、タスクキュー121に格納されたタスクを出力する処理演算部11や、タスクの出力順番を制御する。
The
また、タスク制御部12は、タスクキュー121に格納されたそれぞれのタスクを実行するタイミングに基づいて、外部記憶部20にアクセスするための指示(以下、「アクセス指示」という)を、メモリ制御部13に出力する。例えば、タスク制御部12は、DMA(Direct Memory Access)によって外部記憶部20へのデータの書き込み、および外部記憶部20からのデータの読み出しを行うアクセス指示を、メモリ制御部13に出力する。
Further, the
より具体的には、タスク制御部12は、タスクキュー121に順次格納されたそれぞれのタスクに基づいて、タスクを実行する際に使用する外部記憶部20に格納されているデータを、このタスクが割り当てられた処理演算部11が実際にタスクを実行するタイミングまでに、事前に取得する(読み出す)ためのDMAのアクセス指示を、メモリ制御部13に出力する。また、タスク制御部12は、タスクキュー121に順次格納されたそれぞれのタスクに基づいて、それぞれの処理演算部11が割り当てられたタスクを実行する際に使用しないデータを、事前に外部記憶部20に退避する(書き込む)ためのDMAのアクセス指示を、メモリ制御部13に出力する。ここで、タスク制御部12がメモリ制御部13に出力するアクセス指示には、外部記憶部20のアドレスや、読み出しまたは書き込みを行うデータの量(大きさ)などを表す情報が含まれている。
More specifically, the
なお、タスク制御部12によるタスクを出力する処理演算部11やタスクの出力順番の制御方法、およびメモリ制御部13に出力する外部記憶部20へのアクセス指示に関する詳細な説明は、後述する。
A detailed description of the processing operation unit 11 that outputs tasks by the
メモリ制御部13は、タスク制御部12から入力されたアクセス指示に応じて、演算装置10に接続された外部記憶部20からのデータの読み出しや、外部記憶部20へのデータの書き込みを行う。
The
より具体的には、メモリ制御部13は、タスク制御部12から入力された、外部記憶部20に格納されているデータを事前に取得する(読み出す)ためのアクセス指示に応じて、アクセス指示によって指定された外部記憶部20のアドレスから、アクセス指示によって指定された量のデータを読み出し、読み出したデータを、アクセス指示によって指定されたデータ記憶部14に格納する。メモリ制御部13は、タスク制御部12から入力された、データを外部記憶部20に退避する(書き込む)ためのアクセス指示に応じて、アクセス指示によって指定されたデータ記憶部14に格納されているデータを読み出し、読み出したデータを、アクセス指示によって指定された外部記憶部20のアドレスの記憶領域に書き込む。
More specifically, the
また、メモリ制御部13は、タスク制御部12から入力されたアクセス指示に応じて、処理演算部11a〜処理演算部11nのそれぞれから入力された次のタスクの実行要求の情報に含まれる、タスクの実行に必要な様々なパラメータのデータを、データ記憶部14に格納、または外部記憶部20に退避する。
In addition, the
より具体的には、メモリ制御部13は、タスク制御部12から入力された、パラメータのデータを格納する(書き込む)ためのアクセス指示に応じて、アクセス指示によって指定されたデータ記憶部14a〜データ記憶部14nのいずれかに、アクセス指示によって指定されたパラメータのデータを格納する。メモリ制御部13は、タスク制御部12から入力された、パラメータのデータを外部記憶部20に退避する(書き込む)ためのアクセス指示に応じて、アクセス指示によって指定されたパラメータのデータを、アクセス指示によって指定された外部記憶部20のアドレスの記憶領域に書き込む。ここで外部記憶部20に退避されたパラメータのデータは、タスク制御部12から必要に応じて入力されるパラメータのデータを読み出すためのアクセス指示に応じて、外部記憶部20から読み出され、アクセス指示によって指定されたデータ記憶部14に再び格納される。
More specifically, the
データ記憶部14a〜データ記憶部14nのそれぞれは、処理演算部11a〜処理演算部11nのそれぞれに対応し、対応する処理演算部11がタスクを実行する際に使用するデータや、次のタスクを実行する際に使用するデータ(例えば、現在のタスクを実行した結果のデータ)を格納する、例えば、SRAM(Static Random Access Memory)などのメモリ、いわゆる、キャッシュメモリである。
Each of the data storage unit 14a to the data storage unit 14n corresponds to each of the
なお、図1では、演算装置10内に、処理演算部11のそれぞれに対応したn個のデータ記憶部14を備えた構成を示しているが、データ記憶部14の構成は、本実施形態の構成のみに限定されるものではない。例えば、演算装置内に1つのデータ記憶部を備え、このデータ記憶部の記憶領域を、処理演算部11のそれぞれに対応する数に分割した構成であっても、同様に考えることができる。ただし、複数の処理演算部11が同時にデータ記憶部の別の領域に対してデータの書き込みや読み出しを行うことを考慮すると、データ記憶部は、図1に示したように、処理演算部11のそれぞれに対応した構成であることが望ましいと考えられる。
1 shows a configuration in which the n data storage units 14 corresponding to each of the processing calculation units 11 are provided in the
このように、演算装置10では、いずれの処理演算部11から出力されたタスクも、タスク制御部12を経由してから、次のタスクを実行する処理演算部11に入力される。そして、演算装置10では、次のタスクが割り当てられた処理演算部11が、外部記憶部20に格納されているデータを使用するタイミングよりも早いタイミングで、タスクを実行する際に使用するデータを、事前にデータ記憶部14に格納しておく。また、演算装置10では、処理演算部11がタスクを実行する際にデータを使用しない場合には、対応するデータ記憶部14に格納されたデータを、外部記憶部20に退避しておく。
As described above, in the
次に、演算装置10の動作について説明する。なお、以下の説明においては、演算装置10に備えている処理演算部11とデータ記憶部14とは、それぞれ4つずつである、すなわち、演算装置10には、処理演算部11a〜処理演算部11dと、データ記憶部14a〜データ記憶部14dとを備えているものとして説明する。また、演算装置10に備えた4つの処理演算部11a〜処理演算部11dは、想定される以下の10種類のタスクをそれぞれ実行することができ、それぞれのタスクを実行する際の実行時間(サイクル数)は、以下のサイクル数であるものとする。ここで、10種類のタスクの平均のサイクル数は、100サイクルである。
Next, the operation of the
タスク0=110サイクル
タスク1=120サイクル
タスク2=130サイクル
タスク3=140サイクル
タスク4=150サイクル
タスク5=90サイクル
タスク6=80サイクル
タスク7=70サイクル
タスク8=60サイクル
タスク9=50サイクル
なお、タスク制御部12は、それぞれのタスクを実行する際の上記のサイクル数が事前にわかっているものとする。また、メモリ制御部13が外部記憶部20に格納されているデータを事前に取得する(読み出す)、または外部記憶部20にデータを退避する(書き込む)際には、DMAによって外部記憶部20にアクセスするものとする。なお、メモリ制御部13がDMAによって外部記憶部20にアクセスする際のデータ転送時間(サイクル数)は、100サイクルであるものとする。
It is assumed that the
<第1の動作>
まず、演算装置10の動作において、タスク制御部12が、タスクキュー121に格納されたタスクの順番に基づいて、外部記憶部20に格納されているデータをDMAによって事前に取得する(読み出す)ためのアクセス指示(以下「DMAリードアクセス指示」を、メモリ制御部13に出力する第1の動作について説明する。図2は、本実施形態の演算装置10に備えたタスク制御部12の概略構成、およびタスク制御部12に格納されたタスクの一例を説明する図である。
<First operation>
First, in the operation of the
上述したように、タスク制御部12は、DMAによって外部記憶部20にアクセスするためのDMAリードアクセス指示を、メモリ制御部13に出力する。このため、タスク制御部12には、図2に示したように、DMAリクエスト発生部122を備えている。DMAリクエスト発生部122は、タスクキュー121に順次格納されたそれぞれのタスクに基づいて決定されたタイミングのときに、DMAリードアクセス指示をメモリ制御部13に出力する。
As described above, the
また、図2には、タスク制御部12に備えたタスクキュー121のそれぞれにタスクが格納されている状態を示している。なお、図2においてタスクキュー121内に示した“#(シャープ)”に続く数字は、タスクキュー121にそれぞれのタスクが格納された順番を表すタスク番号を示し、“#0”が最初に格納されたタスク(図2では、タスク6)であり、“#1”が2番目に格納されたタスク(図2では、タスク3)であることを示している。また、タスク番号は、それぞれのタスクが処理演算部11に出力される順番も示している。
FIG. 2 shows a state in which tasks are stored in each of the
タスク制御部12は、基本的に、タスクキュー121にそれぞれのタスクが格納された順番で、それぞれのタスクを処理演算部11に出力する。このとき、最初に格納された“#0”のタスク6が処理演算部11に出力されると、“#1”〜“#9”のそれぞれのタスクは、タスク番号が1つずつ小さくなる。すなわち、図2における“#1”のタスク3が“#0”のタスク3になり、同様に、“#2”〜“#9”のそれぞれのタスクも“#1”〜“#8”のそれぞれのタスクとなる。これにより、タスク制御部12は、常に“#0”のタスクを処理演算部11に出力するタスクとすることにより、タスクの出力順番の制御を容易に行うことができる。
The
しかし、以下の説明においては、説明を容易にするため、“#0”のタスクが処理演算部11に出力される毎にタスク番号が変わるのではなく、タスク制御部12が、タスクキュー121に格納されているタスク番号が小さいタスクから、すなわち、#0”のタスク6からタスク番号が大きくなっていく順番で、それぞれのタスクを処理演算部11に出力するものとして説明する。そして、以下の説明においては、“#8”のタスク0および“#9”のタスク1を処理演算部11に出力する前に、タスク制御部12が、“#8”のタスク0および“#9”のタスク1を実行する際に使用するデータを事前に取得する(読み出す)場合の動作について説明する。なお、“#0”〜“#7”のそれぞれのタスクでは、外部記憶部20に格納されているデータを使用しない、すなわち、“#0”〜“#7”のそれぞれのタスクを実行するためのDMAリードアクセス指示は出力しないものとする。
However, in the following description, for ease of explanation, the
ここで、タスク制御部12が、DMAリードアクセス指示をメモリ制御部13に出力するタイミングを決定する際の考え方について説明する。タスク制御部12は、外部記憶部20に格納されているデータを使用するタスクの実行が開始されるタイミングよりも前に、外部記憶部20へのアクセスが終了し、タスクを実行する際に使用するデータがデータ記憶部14に格納されている状態にしておく。
Here, the concept when the
このため、タスク制御部12は、外部記憶部20に格納されているデータを使用するタスク(以下、「対象タスク」という)よりも前に実行するタスク(以下、「先行タスク」という)の実行時間(以下、「実行サイクル数」という)が、外部記憶部20にアクセスする際のデータ転送時間(以下、「転送サイクル数」という)よりも長いタイミングとなるように、DMAリードアクセス指示をメモリ制御部13に出力するタイミングに決定する。このタイミングは、下式(1)の関係を満足する必要がある。
Therefore, the
((データ転送開始順番+コア数)×最短タスク実行時間÷コア数)≧データ転送時間
・・・(1)
((Data transfer start order + number of cores) x shortest task execution time ÷ number of cores) ≥ data transfer time
... (1)
そして、上式(1)を満足するデータ転送開始順番は、下式(2)となる。 The data transfer start order that satisfies the above equation (1) is the following equation (2).
データ転送開始順番≧(コア数×(データ転送時間÷最短タスク実行時間−1))
・・・(2)
Data transfer start order ≥ (number of cores x (data transfer time ÷ shortest task execution time -1))
... (2)
第1の動作における演算装置10の構成では、上式(2)におけるコア数は“4”、データ転送時間は100サイクルであり、10種類のタスクにおける最短タスク実行時間、すなわち、10種類のタスクの内最小の実行サイクル数は50サイクルである。従って、第1の動作の演算装置10におけるデータ転送開始順番は、下式(3)となる。
In the configuration of the
データ転送開始順番≧(4×(100÷50−1))=4 ・・・(3) Data transfer start order ≧ (4 × (100 ÷ 50−1)) = 4 (3)
タスク制御部12は、対象タスクが上式(3)のデータ転送開始順番となったタイミングを、対象タスクに対応したDMAリードアクセス指示をメモリ制御部13に出力するタイミングに決定する。より具体的には、図2に示した“#8”のタスク0を対象タスクとした場合、対象タスクを出力する順番が4番目、すなわち、“#4”となったタイミングを、対象タスクに対応したDMAリードアクセス指示をメモリ制御部13に出力するタイミングに決定する。また、図2に示した“#9”のタスク1を対象タスクとした場合、対象タスクを出力する順番が4番目、すなわち、“#4”となったタイミングを、対象タスクに対応したDMAリードアクセス指示をメモリ制御部13に出力するタイミングに決定する。
The
そして、タスク制御部12は、決定したタイミングのときに、DMAリードアクセス指示をメモリ制御部13に出力させるための指示を、DMAリクエスト発生部122に出力する。この指示に応じて、DMAリクエスト発生部122は、DMAリードアクセス指示をメモリ制御部13に出力し、メモリ制御部13は、DMAリクエスト発生部122から入力されたDMAリードアクセス指示に応じて、外部記憶部20からのデータの読み出しを行う。
Then, the
なお、タスク制御部12は、上式(3)のデータ転送開始順番=4を予め記憶しておく。しかし、データ転送開始順番を記憶しておく構成は、タスク制御部12内に記憶しておく構成に限定されるものではなく、例えば、演算装置10を制御する不図示の制御部内に記憶しておき、制御部が、記憶しているデータ転送開始順番をタスク制御部12に出力する構成であってもよい。
The
図3は、本実施形態の演算装置10に備えたタスク制御部12による第1の動作におけるタスクの分配とデータ転送とのタイミングを示したタイミングチャートである。図3に示したタイミングチャートでは、演算装置10に備えた4つの処理演算部11a〜処理演算部11dにおける前のタスクの実行が同時に完了し、その後、タスク制御部12が、それぞれの処理演算部11に順次タスクを出力する場合を示している。
FIG. 3 is a timing chart showing the timing of task distribution and data transfer in the first operation by the
より具体的には、最初の“#0”のタスク6を処理演算部11aに、2番目の“#1”のタスク3を処理演算部11bに、3番目の“#2”のタスク4を処理演算部11cに、4番目の“#3”のタスク0を処理演算部11dに、それぞれ出力する。このとき、“#8”のタスク0が、4番目(“#4”)のタスクとなるため、タスク制御部12は、図2に示した“#8”のタスク0に対応したDMAリードアクセス指示をメモリ制御部13に出力させるための指示を、DMAリクエスト発生部122に出力する。これにより、DMAリクエスト発生部122は、“#8”のタスク0に対応したDMAリードアクセス指示をメモリ制御部13に出力し、メモリ制御部13は、DMAリクエスト発生部122から入力されたDMAリードアクセス指示に応じて、“#8”のタスク0に対応したデータを外部記憶部20から読み出して、“#8”のタスク0を実行する処理演算部11dに対応したデータ記憶部14dに格納する。
More specifically, the first “# 0”
その後、処理演算部11aが最初の“#0”のタスク6の実行が完了したとき、タスク制御部12は、5番目の“#4”のタスク3を処理演算部11aに出力する。このとき、“#9”のタスク1が、4番目(“#4”)のタスクとなるため、タスク制御部12は、図2に示した“#9”のタスク1に対応したDMAリードアクセス指示をメモリ制御部13に出力させるための指示を、DMAリクエスト発生部122に出力する。これにより、DMAリクエスト発生部122は、“#9”のタスク1に対応したDMAリードアクセス指示をメモリ制御部13に出力する。そして、メモリ制御部13は、“#8”のタスク0に対応したデータの外部記憶部20からの読み出しが終了した後、DMAリクエスト発生部122から入力されたDMAリードアクセス指示に応じて、“#9”のタスク1に対応したデータを外部記憶部20から読み出して、“#9”のタスク1を実行する処理演算部11bに対応したデータ記憶部14bに格納する。
After that, when the
このように、タスク制御部12は、対象タスクが割り当てられる処理演算部11が、外部記憶部20に格納されているデータを使用するタイミングよりも早いタイミングで、対象タスクを実行する際に使用するデータを、事前にデータ記憶部14に格納しておく。
As described above, the
なお、対象タスクを実行する際に使用するデータを、対応するデータ記憶部14に事前に格納する際には、このデータ記憶部14に演算処理に必要な前のデータが格納されていないか、すなわち、演算処理に必要なデータが残っていないかを確認し、演算処理に必要な前のデータが格納されていない場合にのみ、対象タスクを実行する際に使用するデータを事前に格納する。従って、対応するデータ記憶部14に演算処理に必要な前のデータが格納されている、すなわち、演算処理に必要なデータが残っている場合には、現在格納されているデータを、外部記憶部20にデータを退避しておく(書き込んでおく)必要がある。このため、タスク制御部12は、決定したデータ転送開始順番よりも前のタイミングを、対象タスクに対応したDMAリードアクセス指示をメモリ制御部13に出力するタイミングに決定することが望ましい。この場合には、例えば、上式(2)におけるデータ転送時間を2倍にして、データ転送開始順番を決定するなどの方法が考えられる。
In addition, when data used when executing the target task is stored in advance in the corresponding data storage unit 14, whether or not the previous data necessary for the arithmetic processing is stored in the data storage unit 14, That is, it is confirmed whether or not data necessary for the arithmetic processing remains, and only when the previous data necessary for the arithmetic processing is not stored, data used when executing the target task is stored in advance. Accordingly, when the previous data necessary for the arithmetic processing is stored in the corresponding data storage unit 14, that is, when the data necessary for the arithmetic processing remains, the currently stored data is stored in the external storage unit. 20 needs to be saved (written). Therefore, it is desirable that the
次に、対象タスクが実行される前に、対象タスクが使用するデータを事前にデータ記憶部14に格納しておく、タスク制御部12の処理手順について説明する。図4は、本実施形態の演算装置10に備えたタスク制御部12による第1の動作における処理手順を示したフローチャートである。なお、以下の説明においては、説明を容易にするため、DMAリクエスト発生部122が、対象タスクに対応したDMAリードアクセス指示をメモリ制御部13に出力するタイミングを決定するものとして説明する。また、対象タスクにおけるデータ転送開始順番は“4”であるものとする。
Next, a processing procedure of the
DMAリクエスト発生部122は、タスク制御部12がタスクキュー121に格納されたタスクを処理演算部11に出力する毎に、図4に示したDMAリードアクセス指示をメモリ制御部13に出力するタイミングの決定処理を実行する。まず、タスク制御部12が、タスクキュー121に格納された最初の“#0”のタスク6を処理演算部11aに出力すると、DMAリクエスト発生部122は、ステップS1においてタスク番号iを“0”にクリアし、タスクキュー121に格納されている“#0”のタスク(図2に示した2番目の“#1”のタスク3)から、DMAリードアクセス指示をメモリ制御部13に出力するタイミングの決定処理を開始する。なお、図4において、QUEUE−MAXは、タスク番号の最大値である。
The
DMAリードアクセス指示をメモリ制御部13に出力するタイミングの決定処理において、DMAリクエスト発生部122は、“#0”のタスク(図2に示した2番目の“#1”のタスク3)が、外部記憶部20に格納されているデータを使用する対象タスクであるか否かを確認する(ステップS11)。ステップS11において、外部記憶部20に格納されているデータを使用する対象タスクでない場合(ステップS11の“NO”)には、ステップS1においてタスク番号iに1を加えて、すなわち、タスク番号i=1として、タスクキュー121に格納された2番目の“#1”のタスク(図2に示した3番目の“#2”のタスク4)に対する確認を繰り返す。
In the process of determining the timing for outputting the DMA read access instruction to the
なお、図2に示した2番目の“#1”のタスク3〜8番目の“#7”のタスク6は、外部記憶部20に格納されているデータを使用する対象タスクではないため、ステップS11における確認の結果は、“NO”の結果を繰り返す。そして、タスク番号i=7のとき、8番目の“#7”のタスク(図2に示した9番目の“#8”のタスク0)は対象タスクであるため、ステップS11において、外部記憶部20に格納されているデータを使用する対象タスクである場合(ステップS11の“YES”)となる。
Note that the second “# 1”
ステップS11における確認の結果が“YES”の結果である場合、DMAリクエスト発生部122は、対象タスクにおけるデータ転送開始順番=4を取得する(ステップS12)。
If the result of the confirmation in step S11 is “YES”, the DMA
続いて、DMAリクエスト発生部122は、取得したデータ転送開始順番=4が、タスク番号iと同じであるか否か、すなわち、対象タスクが4番目の“#4”であるか否かを確認する(ステップS13)。ステップS13において、対象タスクが4番目の“#4”でない場合(ステップS13の“NO”)には、ステップS1においてタスク番号iに1を加えて、タスクキュー121に格納された次のタスク(図2に示した10番目の“#9”のタスク1)に対する確認を行う。
Subsequently, the DMA
また、ステップS13において、対象タスクが4番目の“#4”である場合(ステップS13の“YES”)には、DMAリクエスト発生部122は、4番目の“#4”のタスク(図2に示した9番目の“#8”のタスク0)が使用するデータを外部記憶部20から事前に取得するためのDMAリードアクセス指示を、メモリ制御部13に出力する(ステップS14)。これにより、メモリ制御部13は、DMAリクエスト発生部122から入力されたDMAリードアクセス指示に応じて、“#8”のタスク0に対応したデータを外部記憶部20から読み出して、“#8”のタスク0を実行する処理演算部11dに対応したデータ記憶部14dに格納する。
In step S13, if the target task is the fourth “# 4” (“YES” in step S13), the DMA
以降、同様に、タスク制御部12がタスクキュー121に格納されたタスクを処理演算部11に出力する毎に、図4に示したDMAリードアクセス指示をメモリ制御部13に出力するタイミングの決定処理が実行される。これにより、メモリ制御部13は、“#8”のタスク0に対応したデータの外部記憶部20からの読み出しが終了した後、DMAリクエスト発生部122から入力されたDMAリードアクセス指示に応じて、“#9”のタスク1に対応したデータを外部記憶部20から読み出して、“#9”のタスク1を実行する処理演算部11bに対応したデータ記憶部14bに格納する。
Thereafter, similarly, every time the
このように、タスク制御部12における第1の動作では、タスクキュー121に格納されたタスクを処理演算部11に出力する毎に、外部記憶部20に格納されているデータを使用する対象タスクが処理演算部11に出力される順番を確認することによって、対象タスクが割り当てられる処理演算部11が、対象タスクを実行するよりも早いタイミングで、対象タスクを実行する際に使用するデータを、事前にデータ記憶部14に格納しておく。これにより、演算装置10では、それぞれの処理演算部11が使用するデータのキャッシュミスを防止することができる。
As described above, in the first operation in the
なお、上述したように、対象タスクを実行する際に使用するデータを、対応するデータ記憶部14に事前に格納する際には、このデータ記憶部14に演算処理に必要な前のデータが格納されていないかを確認し、データ記憶部14に演算処理に必要な前のデータが格納されている場合には、現在格納されているデータを、外部記憶部20にデータを退避しておく(書き込んでおく)必要がある。このため、例えば、図4に示したフローチャートのステップS11とステップS12との間に、データ記憶部14に演算処理に必要な前のデータが格納されているか否かを確認するステップを設け、このステップにおいて、データ記憶部14に演算処理に必要な前のデータが格納されていないと確認された場合に、ステップS12以降の処理を実行することが望ましい。なお、このステップにおいて、データ記憶部14に演算処理に必要な前のデータが格納されていると確認された場合には、データ記憶部14に現在格納されているデータを外部記憶部20にデータを退避してから(書き込んでから)、ステップS12以降の処理を実行することになる。
As described above, when data used when executing the target task is stored in advance in the corresponding data storage unit 14, the previous data necessary for the arithmetic processing is stored in the data storage unit 14. If the previous data required for the arithmetic processing is stored in the data storage unit 14, the currently stored data is saved in the external storage unit 20 ( Need to write). For this reason, for example, a step for confirming whether or not the previous data necessary for the arithmetic processing is stored in the data storage unit 14 is provided between step S11 and step S12 in the flowchart shown in FIG. In the step, when it is confirmed that the previous data necessary for the arithmetic processing is not stored in the data storage unit 14, it is desirable to execute the processing after step S12. In this step, when it is confirmed that the previous data necessary for the arithmetic processing is stored in the data storage unit 14, the data currently stored in the data storage unit 14 is transferred to the
<第2の動作>
次に、演算装置10の動作、特にタスク制御部12の第2の動作について説明する。第2の動作は、タスクキュー121に格納されたそれぞれのタスクからタスク制御部12が予測した先行タスクの実行時間に基づいて、外部記憶部20に格納されているデータをDMAによって事前に取得する(読み出す)ためのDMAリードアクセス指示を、メモリ制御部13に出力する動作である。なお、本第2の動作の説明においても、タスク制御部12の概略構成は、図2に示したタスク制御部12の概略構成と同様である。また、タスク制御部12に格納されたタスクも、図2に示したタスクが格納されているものとして説明を行う。
<Second operation>
Next, the operation of the
図5は、本実施形態の演算装置10に備えたタスク制御部12による第2の動作における処理手順を示したフローチャートである。なお、以下の説明においても、説明を容易にするため、DMAリクエスト発生部122が、対象タスクに対応したDMAリードアクセス指示をメモリ制御部13に出力するタイミングを決定するものとして説明する。また、対象タスクに対応したDMAリードアクセス指示をメモリ制御部13に出力するタイミング(以下、「データ転送開始タイミング」という)は、外部記憶部20にアクセスする際の転送サイクル数と同じタイミング、すなわち、100サイクルであるものとする。
FIG. 5 is a flowchart illustrating a processing procedure in the second operation by the
なお、タスク制御部12は、データ転送開始タイミング=100を予め記憶しておく構成であっても、例えば、演算装置10を制御する不図示の制御部内にデータ転送開始タイミングを記憶しておき、制御部が、記憶しているデータ転送開始タイミングをタスク制御部12に出力する構成であってもよい。
Note that the
DMAリクエスト発生部122は、タスク制御部12がタスクキュー121に格納されたタスクを処理演算部11に出力する毎に、図5に示したDMAリードアクセス指示をメモリ制御部13に出力するタイミングの決定処理を実行する。まず、DMAリクエスト発生部122は、ステップS2においてタスク番号iを“0”にクリアする。そして、DMAリクエスト発生部122は、タスクキュー121に格納されている最初の“#0”のタスク6から、DMAリードアクセス指示をメモリ制御部13に出力するタイミングの決定処理を開始する。
The
DMAリードアクセス指示をメモリ制御部13に出力するタイミングの決定処理において、DMAリクエスト発生部122は、最初の“#0”のタスク6が、外部記憶部20に格納されているデータを使用する対象タスクであるか否かを確認する(ステップS21)。ステップS21において、最初の“#0”のタスク6が、外部記憶部20に格納されているデータを使用する対象タスクでない場合(ステップS21の“NO”)には、ステップS2においてタスク番号iに1を加えてタスク番号i=1とし、タスクキュー121に格納された2番目の“#1”のタスク3に対する確認を繰り返す。
In the process of determining the timing for outputting the DMA read access instruction to the
なお、図2に示した最初の“#0”のタスク6〜8番目の“#7”のタスク6は、外部記憶部20に格納されているデータを使用する対象タスクではないため、ステップS21における確認の結果は、“NO”の結果を繰り返す。そして、タスク番号i=8のとき、9番目の“#8”のタスク0は対象タスクであるため、ステップS21において、外部記憶部20に格納されているデータを使用する対象タスクである場合(ステップS21の“YES”)となる。
Note that the first “# 0”
ステップS21における確認の結果が“YES”の結果である場合、DMAリクエスト発生部122は、対象タスクが実行されるよりも前に実行される先行タスク(最初の“#0”のタスク6〜8番目の“#7”のタスク6)のそれぞれが処理演算部11に割り当てられることを想定した場合に、それぞれの処理演算部11に幾つの先行タスクが割り当てられるか、すなわち、処理演算部11あたりの先行タスク数NUM−OF−MINを算出する(ステップS22)。例えば、図2に示したタスクキュー121の状態では、処理演算部11あたりの先行タスク数NUM−OF−MINは“2”となる。また、それぞれの処理演算部11に割り当てられた先行タスクを実行する際の、処理演算部11あたりの実行サイクル数の最小値MIN[NUM−OF−MIN]の値を、“最大値(図5においては0xFF)”にクリアする。
If the result of the confirmation in step S21 is “YES”, the DMA
続いて、DMAリクエスト発生部122は、ステップS23において処理演算部11あたりの先行タスク数kを“0”にクリアし、それぞれの処理演算部11に先行タスク数NUM−OF−MINのタスクが割り当てられた場合に想定される最小の実行サイクル数を求める。このため、DMAリクエスト発生部122は、先行タスクをそれぞれの処理演算部11が実行する際の、処理演算部11あたりの実行サイクル数の最小値MIN[NUM−OF−MIN]の値を、先行タスクの実行サイクル数に応じた値に更新する処理を開始する。
Subsequently, in step S23, the DMA
処理演算部11あたりの実行サイクル数の最小値MIN[NUM−OF−MIN]の値の更新処理では、DMAリクエスト発生部122は、まず、ステップS24において先行タスク番号jを“0”にクリアする。そして、DMAリクエスト発生部122は、最初の先行タスクである“#0”のタスク6の実行サイクル数が、実行サイクル数の最小値MIN[k]の値よりも小さいか否かを確認する(ステップS25)。
In the update process of the minimum value MIN [NUM-OF-MIN] of the number of execution cycles per processing operation unit 11, the DMA
ここでは、ステップS22において、実行サイクル数の最小値MIN[NUM−OF−MIN]を“最大値”にしているため、ステップS25における確認の結果が“YES”となり、“#0”のタスク6の実行サイクル数=80を、実行サイクル数の最小値MIN[0]の値にする(ステップS26)。なお、ステップS25における確認の結果が“NO”の結果である場合には、ステップS24において先行タスク番号jに1を加えて先行タスク番号j=1とし、ステップS25において、タスクキュー121に格納された2番目の“#1”のタスク3の実行サイクル数が、実行サイクル数の最小値MIN[0]の値よりも小さいか否かの確認を繰り返す。
Here, since the minimum value MIN [NUM-OF-MIN] of the number of execution cycles is set to “maximum value” in step S22, the result of the confirmation in step S25 is “YES”, and
同様に、ステップS24のループによって、先行タスクの中の最小の実行サイクル数が、実行サイクル数の最小値MIN[0]の値となる。全ての先行タスクに対するステップS24のループの処理が完了すると、DMAリクエスト発生部122は、ステップS23において先行タスク数kに1を加えて先行タスク数k=1とする。そして、同様に、ステップS24のループによる、処理演算部11あたりの実行サイクル数の最小値MIN[1]の値の更新処理を行う。
Similarly, by the loop of step S24, the minimum number of execution cycles in the preceding task becomes the value of the minimum value MIN [0] of the number of execution cycles. When the processing of the loop in step S24 for all the preceding tasks is completed, the DMA
なお、2回目以降の実行サイクル数の最小値MIN[NUM−OF−MIN]の更新処理においては、その前の回の実行サイクル数の最小値MIN[NUM−OF−MIN]の更新処理において使用した先行タスクの実行サイクル数とならないように、1度採用した先行タスクは、2回目以降の実行サイクル数の最小値MIN[NUM−OF−MIN]の更新処理に使用しないようにする。例えば、図2に示したタスクキュー121の状態では、“#5”のタスク7の実行サイクル数=70が、実行サイクル数の最小値MIN[0]の値となるため、実行サイクル数の最小値MIN[1]の値の更新処理では、“#5”のタスク7の実行サイクル数の確認を行わないようにする。これにより、図2に示したタスクキュー121の状態では、“#6”のタスク7の実行サイクル数=70が、実行サイクル数の最小値MIN[1]の値となる。
In the update process of the minimum value MIN [NUM-OF-MIN] of the second and subsequent execution cycles, the update process of the minimum value MIN [NUM-OF-MIN] of the previous execution cycle number is used. In order not to have the number of execution cycles of the preceding task, the preceding task adopted once is not used for the update process of the minimum value MIN [NUM-OF-MIN] of the second and subsequent execution cycles. For example, in the state of the
このステップS23のループによって、処理演算部11あたりの実行サイクル数の最小値MIN[NUM−OF−MIN]の値が、先行タスクの実行サイクル数が最小である値に、順次更新される。 Through the loop of step S23, the minimum value MIN [NUM-OF-MIN] of the number of execution cycles per processing operation unit 11 is sequentially updated to a value with the minimum number of execution cycles of the preceding task.
続いて、DMAリクエスト発生部122は、実行サイクル数の最小値MIN[k]の値を全て合算した、合計値MIN−SUMを算出する(ステップS27)。続いて、DMAリクエスト発生部122は、合計値MIN−SUMに基づいて、現在がデータ転送開始タイミングであるか否かを判定する(ステップS28)。DMAリクエスト発生部122におけるステップS28の判定は、例えば、データ転送開始タイミングの値が合計値MIN−SUMの値よりも小さく(データ転送開始タイミング<合計値MIN−SUM)、かつ、データ転送開始タイミングの値が1つの処理演算部11が実行する先行タスクの実行サイクル数の平均値よりも大きい(データ転送開始タイミング>合計値MIN−SUM−合計値MIN−SUM/先行タスク数NUM−OF−MIN)場合に、現在がデータ転送開始タイミングである(ステップS28の“YES”)と判定する。
Subsequently, the DMA
例えば、図2に示したタスクキュー121の状態では、先行タスク数NUM−OF−MIN=2、実行サイクル数の最小値MIN[0]=70、実行サイクル数の最小値MIN[1]=70であり、合計値MIN−SUM=140である。従って、DMAリクエスト発生部122は、データ転送開始タイミングが、140>データ転送開始タイミング>140−140/2(=70)の条件を満足するときに、現在がデータ転送開始タイミングであると判定する。
For example, in the state of the
ステップS28において、現在がデータ転送開始タイミングでないと判定された場合(ステップS28の“NO”)には、ステップS2においてタスク番号iに1を加えて、タスクキュー121に格納された次のタスク(図2に示した10番目の“#9”のタスク1)に対する確認を行う。 If it is determined in step S28 that the current time is not the data transfer start timing (“NO” in step S28), 1 is added to the task number i in step S2 and the next task stored in the task queue 121 ( Confirmation is performed for the tenth “# 9” task 1) shown in FIG.
また、ステップS28において、現在がデータ転送開始タイミングであると判定された場合(ステップS28の“YES”)には、DMAリクエスト発生部122は、9番目の“#8”のタスク0が使用するデータを外部記憶部20から事前に取得するためのDMAリードアクセス指示を、メモリ制御部13に出力する(ステップS29)。これにより、メモリ制御部13は、例えば、図3に示した第1の動作におけるタスクの分配とデータ転送とのタイミングと同様に、DMAリクエスト発生部122から入力されたDMAリードアクセス指示に応じて、“#8”のタスク0に対応したデータを外部記憶部20から読み出して、“#8”のタスク0を実行する処理演算部11dに対応したデータ記憶部14dに格納する。
If it is determined in step S28 that the current time is the data transfer start timing (“YES” in step S28), the DMA
以降、同様に、タスク制御部12がタスクキュー121に格納されたタスクを処理演算部11に出力する毎に、図5に示したDMAリードアクセス指示をメモリ制御部13に出力するタイミングの決定処理が実行される。これにより、メモリ制御部13は、図3に示した第1の動作におけるタスクの分配とデータ転送とのタイミングと同様に、“#8”のタスク0に対応したデータの外部記憶部20からの読み出しが終了した後、DMAリクエスト発生部122から入力されたDMAリードアクセス指示に応じて、“#9”のタスク1に対応したデータを外部記憶部20から読み出して、“#9”のタスク1を実行する処理演算部11bに対応したデータ記憶部14bに格納する。
Thereafter, similarly, every time the
このように、タスク制御部12における第2の動作では、タスクキュー121に格納されたタスクを処理演算部11に出力する毎に、先行タスクの実行時間を予測し、予測した先行タスクの実行時間とデータ転送開始タイミングとに基づいて、対象タスクが使用するデータを取得するためのDMAリードアクセス指示をメモリ制御部13に出力するタイミングを決定する。これにより、タスク制御部12における第2の動作でも、対象タスクが割り当てられる処理演算部11が、対象タスクを実行するよりも早いタイミングで、対象タスクを実行する際に使用するデータを、事前にデータ記憶部14に格納しておくことができる。このことにより、演算装置10では、それぞれの処理演算部11が使用するデータのキャッシュミスを防止することができる。
As described above, in the second operation in the
なお、対象タスクを実行する際に使用するデータを、対応するデータ記憶部14に事前に格納する際には、このデータ記憶部14に演算処理に必要な前のデータが格納されていないかを確認し、データ記憶部14に演算処理に必要な前のデータが格納されている場合には、現在格納されているデータを、外部記憶部20にデータを退避しておく(書き込んでおく)必要がある。このため、例えば、図5に示したフローチャートのステップS28とステップS29との間に、データ記憶部14に演算処理に必要な前のデータが格納されているか否かを確認するステップを設け、このステップにおいて、データ記憶部14に演算処理に必要な前のデータが格納されていないと確認された場合に、ステップS29の処理を実行することが望ましい。なお、このステップにおいて、データ記憶部14に演算処理に必要な前のデータが格納されていると確認された場合には、データ記憶部14に現在格納されているデータを外部記憶部20にデータを退避してから(書き込んでから)、ステップS29の処理を実行することになる。このため、ステップS28において判定されるデータ転送開始タイミングは、例えば、外部記憶部20にアクセスする際の転送サイクル数を2倍にしておくなど、メモリ制御部13がDMAによって外部記憶部20にアクセスする際の転送サイクル数に対して余裕を持っておくことが望ましい。
When data used when executing the target task is stored in the corresponding data storage unit 14 in advance, whether or not the previous data necessary for the arithmetic processing is stored in the data storage unit 14 is checked. When the previous data necessary for the arithmetic processing is stored in the data storage unit 14, it is necessary to save (write) the currently stored data in the
<第3の動作>
次に、演算装置10の動作、特にタスク制御部12の第3の動作について説明する。第3の動作は、タスクキュー121に格納されたそれぞれのタスクの優先度に基づいて、外部記憶部20に格納されているデータをDMAによって事前に取得する(読み出す)ためのDMAリードアクセス指示を、メモリ制御部13に出力する動作である。
<Third operation>
Next, the operation of the
図6は、本実施形態の演算装置10に備えたタスク制御部12の概略構成、およびタスク制御部12に格納されたタスクの別の一例を説明する図である。本第3の動作の説明においても、タスク制御部12の概略構成は、図2に示したタスク制御部12の概略構成と同様である。ただし、本第3の動作の説明においては、図6に示したように、タスク制御部12に格納されたタスクが、図2に示したタスクと異なるものとする。
FIG. 6 is a diagram illustrating a schematic configuration of the
なお、図6に示したタスクにおいても、図2に示したタスクと同様に、タスクキュー121内に示した“#(シャープ)”に続く数字は、タスクキュー121にそれぞれのタスクが格納された順番を表すタスク番号を示している。また、本第3の動作においては、タスクに続く数字が大きいほど優先度が高い、つまり、優先度は、タスク9>タスク8>タスク7>タスク6>タスク5>タスク4>タスク3>タスク2>タスク1>タスク0であるものとする。
Also in the task shown in FIG. 6, as in the task shown in FIG. 2, the numbers following “# (sharp)” in the
図7は、本実施形態の演算装置10に備えたタスク制御部12による第3の動作における処理手順を示したフローチャートである。なお、以下の説明においては、“#0”〜“#7”のそれぞれのタスクは対象タスクではなく、優先度に応じて処理演算部11に出力する順番の並び替えが完了しているものとし、“#8”のタスク0および“#9”のタスク1を処理演算部11に出力する順番を、優先度に応じて並び替える場合について説明する。
FIG. 7 is a flowchart illustrating a processing procedure in the third operation by the
DMAリクエスト発生部122は、タスク制御部12がタスクキュー121に格納されたタスクを処理演算部11に出力する毎に、図7に示したタスクを処理演算部11に出力する順番を優先度に応じて並び替える処理を実行する。まず、DMAリクエスト発生部122は、ステップS3において最高優先度PRI−MAXを“−1”に、最高優先度のタスク番号PRI−MAX−IDXを“0”にクリアする。
Each time the
続いて、DMAリクエスト発生部122は、ステップS31においてタスク番号iを“8”とし、タスクキュー121に格納されている9番目の“#8”のタスク0から、処理演算部11に出力する順番の並び替え処理を開始する。
Subsequently, the DMA
処理演算部11に出力する順番の並び替え処理において、DMAリクエスト発生部122は、“#8”のタスク0が、処理演算部11に出力済みであるか否かを確認する(ステップS32)。ステップS32において、“#8”のタスク0が処理演算部11に出力済みである場合(ステップS32の“YES”)には、ステップS31においてタスク番号iに1を加えて、すなわち、タスク番号i=9として、タスクキュー121に格納された10番目の“#9”のタスク1に対する確認を繰り返す。
In the rearrangement process of the order of output to the processing operation unit 11, the DMA
ステップS32における確認の結果が、“#8”のタスク0が処理演算部11に出力済みでない場合(ステップS32の“NO”)、DMAリクエスト発生部122は、ステップS33において、“#8”のタスク0の優先度が、最高優先度PRI−MAXよりも高いか否かを確認する。ステップS33において、“#8”のタスク0の優先度が、最高優先度PRI−MAXよりも高くない、すなわち、“#8”のタスク0の優先度が最高優先度PRI−MAXよりも低い場合(ステップS33の“NO”)には、ステップS31においてタスク番号iに1を加えて、タスクキュー121に格納された10番目の“#9”のタスク1に対する確認を繰り返す。
As a result of the confirmation in step S32, when the
ステップS33における確認の結果が、“#8”のタスク0の優先度が最高優先度PRI−MAXよりも高い場合(ステップS33の“YES”)、DMAリクエスト発生部122は、ステップS34において、最高優先度PRI−MAXを“#8”のタスク0の優先度の値とする。また、DMAリクエスト発生部122は、最高優先度のタスク番号PRI−MAX−IDXを、“#8”にする。そして、DMAリクエスト発生部122は、ステップS31においてタスク番号iに1を加えて、タスクキュー121に格納された10番目の“#9”のタスク1に対する処理演算部11に出力する順番の並び替え処理を開始する。
When the priority of the
続いて、DMAリクエスト発生部122は、ステップS31のループの処理が完了すると、すなわち、タスクキュー121に格納された全てのタスクに対して、処理演算部11に出力する順番の並び替え処理を完了すると、最後に、最高優先度のタスク番号PRI−MAX−IDXのタスクが使用するデータを外部記憶部20から事前に取得するためのDMAリードアクセス指示を、メモリ制御部13に出力する(ステップS35)。
Subsequently, when the processing of the loop in step S31 is completed, the DMA
上述したように、本第3の動作においては、タスクに続く数字が大きいほど優先度が高い、つまり、優先度は、“#9”のタスク1>“#8”のタスク0である。従って、ステップS31のループの処理が完了したとき、すなわち、“#9”のタスク1に対する処理演算部11に出力する順番の並び替え処理が完了したときには、最高優先度PRI−MAXは“#9”のタスク1の優先度となり、最高優先度のタスク番号PRI−MAX−IDXは“#9”となっている。このため、タスク制御部12は、9番目の“#8”のタスク0に対応したDMAリードアクセス指示よりも先に、10番目の“#9”のタスク1に対応したDMAリードアクセス指示を、メモリ制御部13に出力する。
As described above, in the third operation, the higher the number following the task, the higher the priority, that is, the priority is
図8は、本実施形態の演算装置10に備えたタスク制御部12による第3の動作におけるタスクの分配とデータ転送とのタイミングを示したタイミングチャートである。図8に示したタイミングチャートには、タスク制御部12が、演算装置10に備えた4つの処理演算部11a〜処理演算部11dのそれぞれに、“#0”のタスク7〜“#7”のタスク0を順次出力し、その後、“#8”のタスク0よりも先に“#9”のタスク1を処理演算部11dに出力する場合を示している。
FIG. 8 is a timing chart showing the timing of task distribution and data transfer in the third operation by the
より具体的には、“#4”のタスク4を処理演算部11aに、“#5”のタスク3を処理演算部11bに、“#6”のタスク3を処理演算部11cに、“#7”のタスク0を処理演算部11dに、それぞれ出力する。そして、処理演算部11a〜処理演算部11dの内、割り当てられたタスクの実行が最も早く完了した処理演算部11dに、次にタスクキュー121に格納された“#8”のタスク0よりも優先度が高い“#9”のタスク1を出力し、その後に、割り当てられたタスクの実行が最も早く完了した処理演算部11bに、“#9”のタスク1よりも優先度が低い“#8”のタスク0を出力する場合を示している。
More specifically, the
この場合であっても、タスク制御部12は、本第3の動作によって、優先度が低い“#8”のタスク0に対応したDMAリードアクセス指示よりも先に、優先度が高い“#9”のタスク1に対応したDMAリードアクセス指示をメモリ制御部13に出力している。これにより、メモリ制御部13は、タスク制御部12から入力されたDMAリードアクセス指示に応じて、“#9”のタスク1に対応したデータを外部記憶部20から読み出して、“#9”のタスク1を実行する処理演算部11dに対応したデータ記憶部14dに格納する。その後、メモリ制御部13は、タスク制御部12から入力されたDMAリードアクセス指示に応じて、“#8”のタスク0に対応したデータを外部記憶部20から読み出して、“#8”のタスク0を実行する処理演算部11bに対応したデータ記憶部14bに格納する。
Even in this case, the
このように、タスク制御部12における第3の動作では、タスクキュー121に格納されたタスクを処理演算部11に出力する毎に、タスクキュー121内の対象タスクの優先度を確認することによって、対象タスクが割り当てられる処理演算部11が、対象タスクを実行するよりも早いタイミングで、対象タスクを実行する際に使用するデータを、事前にデータ記憶部14に格納しておくことができる。
As described above, in the third operation in the
また、タスク制御部12における第3の動作では、それぞれのタスクの優先度に応じて処理演算部11に出力するタスクの順番を並び替えることができる。
In the third operation in the
ここで、それぞれのタスクの優先度に応じて処理演算部11に出力するタスクの順番を並び替える場合の一例について説明する。図9〜図11は、本実施形態の演算装置10に備えたタスク制御部12による第3の動作において処理演算部11に出力するタスクの順番を入れ替える場合の一例を説明する図である。図9には、本一例におけるそれぞれのタスクの優先度の関係を示し、図10には、タスクの順番を入れ替える前のタスクキュー121に格納されたそれぞれのタスクの状態と処理演算部11がそれぞれのタスクを実行するタイミングを示し、図11には、タスクの順番を入れ替えた後のタスクキュー121に格納されたそれぞれのタスクの状態と処理演算部11がそれぞれのタスクを実行するタイミングを示している。なお、以下の説明においては、説明を容易にするため、演算装置10内に1つの処理演算部11のみを備えている場合について説明する。
Here, an example of rearranging the order of tasks output to the processing operation unit 11 according to the priority of each task will be described. 9 to 11 are diagrams for explaining an example in which the order of tasks output to the processing arithmetic unit 11 is switched in the third operation by the
まず、図9を参照して、本一例におけるそれぞれのタスクの優先度の関係を説明する。本一例では、処理演算部11がそれぞれのタスクを実行した際に、図9に示したような、ぞれぞれのタスクに関連する下位のタスクが発生するものとする。より具体的には、処理演算部11がタスク0を実行した結果として、タスク0−0とタスク0−1との下位のタスクが発生し、さらに、処理演算部11がタスク0−0を実行した結果として、タスク0−0−0とタスク0−0−1との下位のタスクが発生するものとする。また、処理演算部11がタスク1を実行した結果として、タスク1−0の下位のタスクが発生するものとする。
First, with reference to FIG. 9, the relationship of the priority of each task in this example will be described. In this example, it is assumed that when the processing operation unit 11 executes each task, a lower-order task related to each task as shown in FIG. 9 occurs. More specifically, as a result of execution of
また、本一例では、それぞれのタスクの優先度の関係は、図9に示したように、タスクに続く数字が大きいほど優先度が低く、同じ系列のタスクでは、上位のタスクほど優先度が低く、同じ階層のタスクでは、タスクに続く数字の階層が大きいほど優先度が低いものとする。より具体的には、タスク0とタスク1との優先度はタスク0>タスク1であり、タスク0と、タスク0−0と、タスク0−0−0との優先度はタスク0−0−0>タスク0−0>タスク0であり、タスク0−0とタスク0−1との優先度はタスク0−0>タスク0−1であるものとする。つまり、図9に示したそれぞれのタスクの優先度は、タスク0−0−0>タスク0−0−1>タスク0−0>タスク0−1>タスク1−0>タスク0>タスク1であるものとする。
Further, in this example, as shown in FIG. 9, the priority relationship of each task is lower as the number following the task is larger, and in the same series of tasks, the higher task is lower in priority. For tasks in the same hierarchy, the higher the number hierarchy following the task, the lower the priority. More specifically, the priority of
図9に示したような関係にあるタスクが発生した順番でタスクキュー121に順次格納されると、例えば、図10(a)に示したように、タスクキュー121の“#0”にタスク0が、“#1”にタスク1が、“#2”にタスク0−0が、“#3”にタスク1−0が、“#4”にタスク0−0−0が、“#5”にタスク0−0−1が、“#6”にタスク0−1がそれぞれ格納される。このような順番でタスクキュー121に格納されたそれぞれタスクを、1つの処理演算部11が順次実行すると、図10(b)に示したように、“#3”にタスク1−0の実行が完了した時点で、タスク1の系列の全てのタスクが完了し、その後、“#6”にタスク0−1の実行が完了した時点で、タスク0の系列の全てのタスクが完了することになる。これは、上述したタスク0とタスク1との優先度(タスク0>タスク1)の関係にある優先順位通りにそれぞれの系列のタスクが完了していないことになる。
When the tasks having the relationship as shown in FIG. 9 are sequentially stored in the
しかし、演算装置10では、タスク制御部12における第3の動作によって、タスクキュー121に格納されたタスクの優先度を確認し、それぞれのタスクの優先度に応じて処理演算部11に出力するタスクの順番を並び替えることによって、タスク0とタスク1とのそれぞれの系列のタスクを、優先順位通りに完了させることができる。
However, in the
より具体的には、図9に示したような関係にあるタスクが発生した順番でタスクキュー121に順次格納された後に、処理演算部11に出力するタスクの順番を並び替える。これにより、例えば、図11(a)に示したように、タスクキュー121の“#0”にタスク0が、“#1”にタスク1が、“#2”にタスク0−0が、“#3”にタスク0−0−0が、“#4”にタスク0−0−1が、“#5”にタスク0−1が、“#6”にタスク1−0がそれぞれ格納された状態と同様の順番で、それぞれのタスクが処理演算部11に出力される。このような順番でタスクキュー121に格納されたそれぞれタスクを、1つの処理演算部11が順次実行すると、図11(b)に示したように、“#5”にタスク0−1の実行が完了した時点で、タスク0の系列の全てのタスクが完了し、その後、“#6”にタスク1−0の実行が完了した時点で、タスク1の系列の全てのタスクが完了することになる。これは、上述したタスク0とタスク1との優先度(タスク0>タスク1)の関係にある優先順位通りにそれぞれの系列のタスクが完了している。
More specifically, after the tasks having the relationship shown in FIG. 9 are sequentially stored in the
このように、タスク制御部12は、それぞれのタスクの優先度に応じて処理演算部11に出力するタスクの順番を並び替えることによって、優先順位通りにそれぞれのタスクの実行を完了させることができる。
In this way, the
このように、タスク制御部12における第3の動作では、タスクキュー121に格納されたタスクを処理演算部11に出力する毎に、タスクキュー121内の対象タスクの優先度を確認することによって、対象タスクが割り当てられる処理演算部11が、対象タスクを実行するよりも早いタイミングで、対象タスクを実行する際に使用するデータを、事前にデータ記憶部14に格納しておくことができる。これにより、演算装置10では、それぞれのタスクの優先度に応じて処理演算部11に出力するタスクの順番を並び替えると共に、それぞれの処理演算部11が使用するデータのキャッシュミスを防止することができる。
As described above, in the third operation in the
なお、対象タスクを実行する際に使用するデータを、対応するデータ記憶部14に事前に格納する際には、このデータ記憶部14に演算処理に必要な前のデータが格納されていないかを確認し、データ記憶部14に演算処理に必要な前のデータが格納されている場合には、現在格納されているデータを、外部記憶部20にデータを退避しておく(書き込んでおく)必要がある。このため、例えば、図7に示したフローチャートのステップS31のループとステップS35との間に、データ記憶部14に演算処理に必要な前のデータが格納されているか否かを確認するステップを設け、このステップにおいて、データ記憶部14に演算処理に必要な前のデータが格納されていないと確認された場合に、ステップS35の処理を実行することが望ましい。なお、このステップにおいて、データ記憶部14に演算処理に必要な前のデータが格納されていると確認された場合には、データ記憶部14に現在格納されているデータを外部記憶部20にデータを退避してから(書き込んでから)、ステップS35の処理を実行することになる。このため、ステップS35においてDMAリードアクセス指示をメモリ制御部13に出力するタイミングは、例えば、外部記憶部20にアクセスする際の転送サイクル数を2倍にしておくなどの対応によって、余裕を持ったタイミングにしておくことが望ましい。なお、DMAリードアクセス指示をメモリ制御部13に出力するタイミングの考え方は、第1の動作および第2の動作と同様であるため、詳細な説明は省略する。
When data used when executing the target task is stored in the corresponding data storage unit 14 in advance, whether or not the previous data necessary for the arithmetic processing is stored in the data storage unit 14 is checked. When the previous data necessary for the arithmetic processing is stored in the data storage unit 14, it is necessary to save (write) the currently stored data in the
なお、優先度の高いタスクを処理演算部11に出力するときに、このタスクを実行する際に使用するデータのデータ記憶部14への事前の格納が終了していない場合には、例えば、優先度は低いが外部記憶部20に格納されているデータを使用しないタスクを、このタスクよりも先に処理演算部11に出力することもできる。これにより、優先度の高いタスクを処理演算部11に出力するタイミングを、データ記憶部14へのデータの格納が終了するタイミングまで遅らせることができる。
In addition, when a task with high priority is output to the processing operation unit 11 and the prior storage in the data storage unit 14 of data used when executing this task is not completed, for example, priority is given. A task that does not use data stored in the
<第4の動作>
次に、演算装置10の動作、特にタスク制御部12の第4の動作について説明する。図12は、本実施形態の演算装置10に備えたタスク制御部12による第4の動作における処理手順を示したフローチャートである。第4の動作は、第3の動作と同様に、タスクキュー121に格納されたそれぞれのタスクの優先度に基づいて、外部記憶部20に格納されているデータをDMAによって事前に取得する(読み出す)ためのDMAリードアクセス指示を出力する前に、データ記憶部14に演算処理に必要な前のデータが格納されているか否かの確認を行う動作である。そして、第4の動作は、データ記憶部14に演算処理に必要な前のデータが格納されている場合に、データ記憶部14に現在格納されているデータを、DMAによって外部記憶部20に退避する(書き込む)ためのアクセス指示(以下「DMAライトアクセス指示」を、メモリ制御部13に出力する動作である。
<Fourth operation>
Next, the operation of the
すなわち、第4の動作は、図7に示したタスク制御部12の第3の動作の処理手順に、データ記憶部14に演算処理に必要な前のデータが格納されているか否かを確認するステップを設けた動作である。従って、本第4の動作の説明においては、図7に示したタスク制御部12の第3の動作の処理手順と同様の手順に同じステップ番号を付与して説明を省略し、図7に示したタスク制御部12の第3の動作の処理手順と異なる手順のみを説明する。
That is, in the fourth operation, it is confirmed whether or not the previous data necessary for the arithmetic processing is stored in the data storage unit 14 in the processing procedure of the third operation of the
なお、図12に示したタスク制御部12の第4の動作の処理手順では、ステップS31のループにおいてタスク番号iを“0”にクリアしている。しかし、ステップS31のループにおいてクリアしたタスク番号iが異なっている場合でも、ステップS31のループ内の処理は同様に考えることができるため、同様に、詳細な説明は省略する。
In the procedure of the fourth operation of the
DMAリクエスト発生部122は、タスク制御部12がタスクキュー121に格納されたタスクを処理演算部11に出力する毎に、図12に示したタスクを処理演算部11に出力する順番を優先度に応じて並び替える処理を実行する。図12に示したタスクを処理演算部11に出力する順番を優先度に応じて並び替える処理では、DMAリクエスト発生部122は、図7に示したタスク制御部12の第3の動作の処理手順と同様に、ステップS3において最高優先度PRI−MAXを“−1”に、最高優先度のタスク番号PRI−MAX−IDXを“0”にクリアする。
Each time the
続いて、DMAリクエスト発生部122は、図7に示したタスク制御部12の第3の動作の処理手順と同様に、ステップS32〜ステップS34を含むステップS31のループにおいて、処理演算部11に出力する順番の並び替え処理を行い、最高優先度PRI−MAXと最高優先度のタスク番号PRI−MAX−IDXとの値を、最も優先度が高いタスクに応じた値にする。
Subsequently, the DMA
続いて、DMAリクエスト発生部122は、ステップS31のループの処理が完了すると、すなわち、タスクキュー121に格納された全てのタスクに対して、処理演算部11に出力する順番の並び替え処理を完了すると、最高優先度のタスク番号PRI−MAX−IDXのタスクが使用するデータを外部記憶部20から事前に取得して格納するデータ記憶部14が空きの状態であるか否かを確認する(ステップS4)。つまり、最も優先度が高いタスクを実行する処理演算部11に対応したデータ記憶部14に、演算処理に必要な前のデータが格納されているか否かを確認する。
Subsequently, when the processing of the loop in step S31 is completed, the DMA
ステップS4において、データ記憶部14が空きの状態であると確認された場合(ステップS4の“YES”)には、図7に示したタスク制御部12の第3の動作の処理手順と同様に、ステップS35において、最高優先度のタスク番号PRI−MAX−IDXのタスクが使用するデータを外部記憶部20から事前に取得するためのDMAリードアクセス指示を、メモリ制御部13に出力する。
If it is confirmed in step S4 that the data storage unit 14 is empty (“YES” in step S4), the processing procedure of the third operation of the
ステップS4において、データ記憶部14が空きの状態でないと確認された場合(ステップS4の“NO”)には、ステップS5において、最高優先度のタスク番号PRI−MAX−IDXのタスクに対応した処理演算部11が使用するデータ記憶部14に現在格納されているデータを、外部記憶部20に事前に退避しておく、データ退避の処理を行う。
If it is confirmed in step S4 that the data storage unit 14 is not empty ("NO" in step S4), processing corresponding to the task with the highest priority task number PRI-MAX-IDX in step S5. Data saving processing is performed in which the data currently stored in the data storage unit 14 used by the calculation unit 11 is saved in the
そして、DMAリクエスト発生部122は、ステップS5におけるデータ記憶部14に現在格納されているデータのデータ退避処理を完了すると、図7に示したタスク制御部12の第3の動作の処理手順と同様に、ステップS35において、最高優先度のタスク番号PRI−MAX−IDXのタスクが使用するデータを外部記憶部20から事前に取得するためのDMAリードアクセス指示を、メモリ制御部13に出力する。
Then, when the DMA
ここで、ステップS5におけるデータ退避処理について説明する。図13は、本実施形態の演算装置10に備えたタスク制御部12が、データ記憶部14に格納されているデータを退避する処理手順を示したフローチャートである。タスク制御部12によるデータ退避処理は、タスクキュー121に格納されたそれぞれのタスクの優先度に基づいて、最も優先度が低いタスクを実行する処理演算部11に対応するデータ記憶部14に格納されたデータを、DMAによって外部記憶部20に退避する(書き込む)ためのDMAライトアクセス指示を、メモリ制御部13に出力する処理である。
Here, the data saving process in step S5 will be described. FIG. 13 is a flowchart illustrating a processing procedure in which the
DMAリクエスト発生部122は、図12に示したタスクを処理演算部11に出力する順番を優先度に応じて並び替える処理のステップS4において、データ記憶部14が空きの状態でないと確認された場合(ステップS4の“NO”)に、図13に示したデータ退避処理を実行する。まず、DMAリクエスト発生部122は、ステップS51において最低優先度PRI−MINを“最大値(図13においては0xFF)”に、最低優先度のタスク番号PRI−MIN−IDXを“0”にクリアする。
When the DMA
続いて、DMAリクエスト発生部122は、ステップS52においてタスク番号iを“0”にクリアし、タスクキュー121に格納されている“#0”のタスクから、処理演算部11に出力するタスクにおいて、最も優先度が低いタスクを選択する処理を開始する。
Subsequently, the DMA
処理演算部11に出力する最も優先度が低いタスクの選択処理において、DMAリクエスト発生部122は、“#0”のタスクが、処理演算部11に出力済みであるか否かを確認する(ステップS53)。ステップS53において、“#0”のタスクが処理演算部11に出力済みである場合(ステップS53の“YES”)には、ステップS52においてタスク番号iに1を加えて、すなわち、タスク番号i=1として、タスクキュー121に格納された2番目の“#1”のタスクに対する確認を繰り返す。
In the process of selecting the lowest priority task to be output to the processing operation unit 11, the DMA
ステップS53における確認の結果が、“#0”のタスクが処理演算部11に出力済みでない場合(ステップS53の“NO”)、DMAリクエスト発生部122は、ステップS54において、“#0”のタスクの優先度が、最低優先度PRI−MINよりも低いか否かを確認する。ステップS54において、“#0”のタスクの優先度が、最低優先度PRI−MINよりも低くない、すなわち、“#0”のタスクの優先度が最低優先度PRI−MINよりも高い場合(ステップS54の“NO”)には、ステップS52においてタスク番号iに1を加えて、タスクキュー121に格納された2番目の“#1”のタスクに対する確認を繰り返す。
If the result of the confirmation in step S53 is that the task “# 0” has not been output to the processing operation unit 11 (“NO” in step S53), the
ステップS54における確認の結果が、“#0”のタスクの優先度が最低優先度PRI−MINよりも低い場合(ステップS54の“YES”)、DMAリクエスト発生部122は、ステップS55において、最低優先度PRI−MINを“#0”のタスクの優先度の値とする。また、DMAリクエスト発生部122は、最低優先度のタスク番号PRI−MIN−IDXを、“#0”にする。そして、DMAリクエスト発生部122は、ステップS52においてタスク番号iに1を加えて、タスクキュー121に格納された2番目の“#1”のタスクに対する最も優先度が低いタスクの選択処理を開始する。
If the priority of the task “# 0” is lower than the lowest priority PRI-MIN (“YES” in step S54), the
続いて、DMAリクエスト発生部122は、ステップS52のループの処理が完了すると、すなわち、タスクキュー121に格納された全てのタスクに対して、最も優先度が低いタスクの選択処理を完了すると、最後に、最低優先度のタスク番号PRI−MIN−IDXのタスクで使用するデータ記憶部14のデータを、外部記憶部20に事前に退避するためのDMAライトアクセス指示を、メモリ制御部13に出力する(ステップS56)。
Subsequently, when the processing of the loop of step S52 is completed, that is, when the task selection processing with the lowest priority is completed for all the tasks stored in the
このように、データ退避処理では、タスクキュー121に格納されたタスクの内、処理演算部11によって実行がされていないタスクの優先度を確認し、最も優先度が低いタスクに対応したデータ記憶部14が格納しているデータを、事前に外部記憶部20に退避するためのDMAライトアクセス指示を、メモリ制御部13に出力する。なお、図12に示したタスクを処理演算部11に出力する順番を優先度に応じて並び替える処理のステップS4において、データ記憶部14が空きの状態でないと確認されたタスクが複数ある場合には、タスクキュー121に格納された優先度が低いタスクに対応したデータ記憶部14から順次、データを外部記憶部20に退避する。
Thus, in the data saving process, the priority of the task not executed by the processing operation unit 11 among the tasks stored in the
このように、タスク制御部12における第4の動作では、タスクキュー121に格納されたタスクを処理演算部11に出力する毎に、タスクキュー121内のタスクの優先度を確認する。さらに、最も優先度が高い対象タスクを実行する処理演算部11に対応したデータ記憶部14に、演算処理に必要なデータが格納されているか否かを確認する。そして、データ記憶部14に演算処理に必要なデータが格納されている場合には、データ記憶部14に現在格納されているデータを外部記憶部20にデータを退避してから(書き込んでから)、最も優先度が高い対象タスクが使用するデータを取得するためのDMAリードアクセス指示をメモリ制御部13に出力する。これにより、タスク制御部12における第4の動作でも、対象タスクが割り当てられる処理演算部11が対象タスクを実行するよりも早いタイミングで、対象タスクを実行する際に使用するデータを、事前にデータ記憶部14に格納しておくことができる。このことにより、演算装置10では、それぞれのタスクの優先度に応じて処理演算部11に出力するタスクの順番を並び替えると共に、それぞれの処理演算部11が使用するデータのキャッシュミスを防止することができる。
As described above, in the fourth operation in the
上記に述べたとおり、本発明を実施するための形態によれば、複数の処理演算部(プロセッサ)が連携して処理を行う演算装置において、それぞれの処理演算部が実際にデータを使用するタスクを実行するよりも早いタイミングで、タスクを実行する際に使用するデータを、事前に外部記憶部から取得してデータ記憶部に格納しておく。これにより、本発明を実施するための形態では、それぞれの処理演算部が他のタスクを実行している期間に、外部記憶部からデータを取得する処理の期間を隠蔽することができる。このことにより、本発明を実施するための形態では、それぞれの処理演算部がタスクを実行する際に使用するデータのキャッシュミスを防止することができる演算装置を提供することができる。 As described above, according to the mode for carrying out the present invention, in a computing device in which a plurality of processing computing units (processors) cooperate to perform processing, each processing computing unit actually uses data. The data used when executing the task is acquired from the external storage unit in advance and stored in the data storage unit at a timing earlier than executing the above. Thereby, in the form for implementing this invention, the period of the process which acquires data from an external storage part can be concealed in the period when each process calculating part is performing another task. Thus, in the embodiment for carrying out the present invention, it is possible to provide an arithmetic device capable of preventing a cache miss of data used when each processing arithmetic unit executes a task.
また、本発明を実施するための形態によれば、外部記憶部から取得したデータを格納するデータ記憶部に、演算処理に必要な前のデータが格納されている場合には、このデータを、事前に外部記憶部に退避しておく。これにより、本発明を実施するための形態では、それぞれの処理演算部が他のタスクを実行している期間に、外部記憶部にデータを退避する処理の期間を隠蔽することができる。このことにより、本発明を実施するための形態では、それぞれの処理演算部がタスクを実行する際に使用するデータを外部記憶部から取得するための期間を、十分に確保することができる。 Further, according to the embodiment for carrying out the present invention, when the previous data necessary for the arithmetic processing is stored in the data storage unit that stores the data acquired from the external storage unit, Save to the external storage unit in advance. Thereby, in the form for implementing this invention, the period of the process which saves data to an external memory | storage part can be concealed in the period when each process calculating part is performing another task. Thereby, in the form for implementing this invention, the period for acquiring the data used when each process calculating part performs a task from an external memory | storage part can fully be ensured.
これらにより、本発明を実施するための形態では、演算装置を備えたシステムにおける処理時間の短縮を図ることができ、演算装置を備えたシステムの性能を向上させることができる。 As a result, in the embodiment for carrying out the present invention, it is possible to shorten the processing time in the system including the arithmetic device, and to improve the performance of the system including the arithmetic device.
なお、本実施形態においては、外部記憶部20が演算装置10に接続されている構成について説明したが、演算装置10と外部記憶部20との接続は、本発明を実施するための形態のように、演算装置10と外部記憶部20とが直接接続されている構成に限定されるものではない。例えば、外部記憶部20が、ネットワーク上に構成されたサーバであり、演算装置10とサーバとが、ネットワークを介して接続される構成であっても、同様に、本発明の考え方を適用することができる。この場合、例えば、メモリ制御部13は、通信部を介して、サーバからのデータの読み出し(受信)や、サーバへのデータの書き込み(送信)を行うと考えることができる。
In the present embodiment, the configuration in which the
また、本実施形態においては、タスク制御部12が、それぞれのタスクを実行する際の実行時間(サイクル数)など、外部記憶部20にアクセスするタイミングを決定するための情報が事前にわかっているものとして説明したが、タスク制御部12は、本発明を実施するための形態に限定されるものではない。例えば、タスクキュー121に格納されたタスクに含まれるプログラムのサイズや、データ量またはループ回数などのパラメータに基づいて、タスクを実行する際の実行時間(サイクル数)などの、外部記憶部20にアクセスするタイミングを決定するための情報を算出する構成であってもよい。
Further, in the present embodiment, information for determining the timing for accessing the
また、本実施形態においては、それぞれの処理演算部11の処理機能に関して説明していないが、例えば、演算装置10を、撮像装置などの撮像システム内に備えている場合には、それぞれの処理演算部11は、撮像システムにおける画像処理を行う処理機能を持っていると考えることができる。
In the present embodiment, the processing function of each processing operation unit 11 is not described. For example, when the
また、本実施形態においては、演算装置10に備えたそれぞれの処理演算部11が持っている処理機能について説明していない。しかし、例えば、演算装置10が、撮像装置などの撮像システムに備えた画像処理装置である場合には、それぞれの処理演算部11の処理機能は、YC変換処理、ノイズ除去処理、歪み補正処理、キズ補正処理、画像圧縮処理など、撮像システムにおける様々な画像処理を行うことができる処理機能であると考えられる。また、例えば、演算装置10が、撮像装置などの撮像システムに備えた画像処理装置内の画像認識部など、撮像システムにおける画像処理の一部の処理部である場合には、それぞれの処理演算部11の処理機能は、画像処理装置内の一部の処理部において種々の処理を行うための処理機能であると考えられる。
Moreover, in this embodiment, the processing function which each processing calculating part 11 with which the calculating
以上、本発明の実施形態について、図面を参照して説明してきたが、具体的な構成はこの実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲においての種々の変更も含まれる。 The embodiment of the present invention has been described above with reference to the drawings. However, the specific configuration is not limited to this embodiment, and includes various modifications within the scope of the present invention. It is.
10・・・演算装置
11,11a,11b,11n・・・処理演算部
12・・・タスク制御部
121・・・タスクキュー(タスク制御部)
122・・・DMAリクエスト発生部(タスク制御部)
13・・・メモリ制御部
14,14a,14b,14n・・・データ記憶部
20・・・外部記憶部
DESCRIPTION OF
122... DMA request generation unit (task control unit)
13 ...
Claims (9)
それぞれの前記処理演算部が前記タスクに応じた演算処理を実行する際に使用するデータ、または前記タスクに応じた演算処理を実行した結果のデータを格納するデータ記憶部と、
前記タスクに応じた演算処理を実行する際に使用するデータを接続された外部記憶部から読み出して前記データ記憶部に格納、または前記データ記憶部に格納されている前記タスクに応じた演算処理を実行した結果のデータを接続された前記外部記憶部に書き込むメモリ制御部と、
前記タスクを順次格納するタスクキューを具備し、該タスクキューに格納された前記タスクを、複数の前記処理演算部の内、いずれか1つの前記処理演算部に出力すると共に、前記タスクキューに格納されたそれぞれの前記タスクに応じた演算処理を前記処理演算部が実行する際のタイミングに基づいて、前記外部記憶部へのアクセスを前記メモリ制御部に指示するアクセス指示を出力するタスク制御部と、
を備えることを特徴とする演算装置。 A plurality of processing operation units having a processing function for performing arithmetic processing according to the input task, and outputting information on the arithmetic processing to be executed next as the task;
A data storage unit for storing data used when each processing operation unit executes an operation process corresponding to the task, or data obtained as a result of executing the operation process corresponding to the task;
Data used when executing arithmetic processing according to the task is read from a connected external storage unit and stored in the data storage unit, or arithmetic processing according to the task stored in the data storage unit A memory control unit for writing data of the execution result to the connected external storage unit;
A task queue for sequentially storing the tasks is provided, and the task stored in the task queue is output to any one of the plurality of processing operation units and stored in the task queue. A task control unit that outputs an access instruction for instructing the memory control unit to access the external storage unit, based on a timing when the processing operation unit executes a calculation process corresponding to each of the tasks performed; ,
An arithmetic device comprising:
前記タスクキューに格納された前記タスクを前記処理演算部に出力する毎に、該タスクキューに格納されたそれぞれの前記タスクに応じた演算処理を、それぞれの前記処理演算部が実行するタイミングを確認し、該確認したタイミングに基づいて、それぞれの前記タスクに対応した前記外部記憶部へのアクセスが、それぞれの前記タスクを前記処理演算部に出力するタイミングまでに完了するように、それぞれの前記タスクに対応する前記アクセス指示を出力する、
ことを特徴とする請求項1に記載の演算装置。 The task control unit
Each time the task stored in the task queue is output to the processing arithmetic unit, the timing at which the processing arithmetic unit executes the arithmetic processing corresponding to the task stored in the task queue is confirmed. Then, based on the confirmed timing, each task is configured such that access to the external storage unit corresponding to each task is completed by the time when each task is output to the processing operation unit. Outputting the access instruction corresponding to
The arithmetic unit according to claim 1.
前記タスクキューに格納されたそれぞれの前記タスクの中から、前記外部記憶部に格納されているデータを使用した演算処理を行う前記タスクである対象タスクを選択し、該対象タスクを前記処理演算部に出力する順番に基づいて、該対象タスクに応じた演算処理を前記処理演算部が実行するタイミングを確認し、該対象タスクで使用するデータを前記外部記憶部から読み出すための前記外部記憶部へのアクセスが、該対象タスクを前記処理演算部に出力するタイミングまでに完了するように、該対象タスクに対応した前記アクセス指示を出力する、
ことを特徴とする請求項2に記載の演算装置。 The task control unit
From among each of the tasks stored in the task queue, a target task that is the task for performing arithmetic processing using data stored in the external storage unit is selected, and the target task is selected as the processing arithmetic unit. To the external storage unit for checking the timing at which the processing operation unit executes the arithmetic processing according to the target task based on the order of output to the target task, and reading the data used in the target task from the external storage unit The access instruction corresponding to the target task is output so that the access is completed by the time when the target task is output to the processing operation unit.
The arithmetic unit according to claim 2.
前記タスクキューに格納された前記対象タスクを前記処理演算部に出力する順番が、当該演算装置に備えた前記処理演算部の数と、前記タスクキューに格納されることが想定されるそれぞれの前記タスクにおいて、該タスクに応じた演算処理を実行する際の処理時間が最小である実行時間と、前記メモリ制御部が前記外部記憶部にアクセスしてデータの転送を行う際の転送時間とに基づいて予め定めたデータ転送開始順番になったときに、該対象タスクに対応した前記アクセス指示を出力する、
ことを特徴とする請求項3に記載の演算装置。 The task control unit
The order in which the target task stored in the task queue is output to the processing arithmetic unit is assumed to be stored in the task queue and the number of the processing arithmetic units provided in the arithmetic device. In a task, based on an execution time that minimizes the processing time when executing arithmetic processing according to the task, and a transfer time when the memory control unit accesses the external storage unit to transfer data Output the access instruction corresponding to the target task when the predetermined data transfer start order is reached.
The arithmetic unit according to claim 3.
前記タスクキューに格納されたそれぞれの前記タスク内の、前記外部記憶部に格納されているデータを使用した演算処理を行う前記タスクである対象タスクよりも前に該タスクキューに格納された、前記外部記憶部に格納されているデータを使用しない演算処理を行う前記タスクである先行タスクに応じた演算処理を実行するそれぞれの実行時間に基づいて、該対象タスクに応じた演算処理を前記処理演算部が実行するタイミングを確認し、該対象タスクで使用するデータを前記外部記憶部から読み出すための前記外部記憶部へのアクセスが、該対象タスクを前記処理演算部に出力するタイミングまでに完了するように、該対象タスクに対応した前記アクセス指示を出力する、
ことを特徴とする請求項2に記載の演算装置。 The task control unit
In each of the tasks stored in the task queue, stored in the task queue before the target task that is the task that performs the arithmetic processing using the data stored in the external storage unit, Based on each execution time for executing the arithmetic processing corresponding to the preceding task, which is the task for performing arithmetic processing that does not use the data stored in the external storage unit, the arithmetic processing corresponding to the target task is the processing arithmetic The access to the external storage unit for reading the data used in the target task from the external storage unit is completed by the timing when the target task is output to the processing operation unit. And outputting the access instruction corresponding to the target task,
The arithmetic unit according to claim 2.
前記先行タスクのそれぞれを前記処理演算部のそれぞれに出力することを想定し、それぞれの前記処理演算部が入力された前記先行タスクに応じた演算処理を実行した際の最小の実行時間を算出し、該算出した最小の実行時間と、前記メモリ制御部が前記外部記憶部にアクセスしてデータの転送を行う際の転送時間とに基づいて、前記対象タスクに対応した前記アクセス指示を出力する、
ことを特徴とする請求項5に記載の演算装置。 The task control unit
Assuming that each of the preceding task is output to each of the processing calculation units, the minimum execution time when the calculation processing corresponding to the input preceding task is executed by each of the processing calculation units is calculated. The access instruction corresponding to the target task is output based on the calculated minimum execution time and the transfer time when the memory control unit accesses the external storage unit to transfer data.
The arithmetic unit according to claim 5.
前記タスクキューに格納されたそれぞれの前記タスク内の、前記外部記憶部に格納されているデータを使用した演算処理を行う前記タスクである対象タスクの優先度に基づいて、前記対象タスクを前記処理演算部に出力する順番を並び替え、最も優先度が高い前記対象タスクから、該対象タスクで使用するデータを前記外部記憶部から読み出すための前記外部記憶部へのアクセスが、該対象タスクを前記処理演算部に出力するタイミングまでに完了するように、該対象タスクに対応した前記アクセス指示を出力する、
ことを特徴とする請求項2に記載の演算装置。 The task control unit
The target task is processed based on the priority of the target task, which is the task that performs arithmetic processing using data stored in the external storage unit in each of the tasks stored in the task queue. Rearranging the order of output to the calculation unit, and from the target task having the highest priority, access to the external storage unit for reading data used in the target task from the external storage unit, the target task is Outputting the access instruction corresponding to the target task so as to be completed by the timing of outputting to the processing operation unit,
The arithmetic unit according to claim 2.
前記対象タスクに対応した前記アクセス指示に応じて前記外部記憶部に格納されているデータを読み出して格納する前記データ記憶部に、前記タスクに応じた演算処理で使用するデータが格納されている場合には、該データ記憶部に格納されているデータを前記外部記憶部に書き込んで退避するための前記アクセス指示を、前記対象タスクに対応した前記アクセス指示を出力するよりも前に出力する、
ことを特徴とする請求項3から請求項7のいずれか1の項に記載の演算装置。 The task control unit
When data used for arithmetic processing corresponding to the task is stored in the data storage unit that reads and stores data stored in the external storage unit in response to the access instruction corresponding to the target task In order to write the data stored in the data storage unit to the external storage unit and save the access instruction before outputting the access instruction corresponding to the target task,
The arithmetic unit according to any one of claims 3 to 7, wherein the arithmetic unit is any one of the above.
前記タスクキューに格納されたそれぞれの前記タスク内の、前記データ記憶部に格納されているデータを使用した演算処理を行う前記タスクの優先度に基づいて、最も優先度が低い前記タスクが使用するデータを格納している前記データ記憶部から、格納されているデータを前記外部記憶部に書き込んで退避するための前記アクセス指示を出力する、
ことを特徴とする請求項8に記載の演算装置。 The task control unit
Used by the task with the lowest priority based on the priority of the task that performs arithmetic processing using the data stored in the data storage unit in each of the tasks stored in the task queue Outputting the access instruction for writing and evacuating the stored data to the external storage unit from the data storage unit storing the data;
The arithmetic unit according to claim 8.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013103260A JP6161395B2 (en) | 2013-05-15 | 2013-05-15 | Arithmetic unit |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013103260A JP6161395B2 (en) | 2013-05-15 | 2013-05-15 | Arithmetic unit |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014225088A true JP2014225088A (en) | 2014-12-04 |
JP6161395B2 JP6161395B2 (en) | 2017-07-12 |
Family
ID=52123736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013103260A Expired - Fee Related JP6161395B2 (en) | 2013-05-15 | 2013-05-15 | Arithmetic unit |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6161395B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021111586A1 (en) * | 2019-12-05 | 2021-06-10 | 日本電信電話株式会社 | Distributed processing system |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003034229A1 (en) * | 2001-10-19 | 2003-04-24 | Telefonaktiebolaget Lm Ericsson | Data prefecthing in a computer system |
JP2005284749A (en) * | 2004-03-30 | 2005-10-13 | Kyushu Univ | Parallel computer |
JP2007047968A (en) * | 2005-08-09 | 2007-02-22 | Olympus Corp | Multiprocessor system |
JP2008015668A (en) * | 2006-07-04 | 2008-01-24 | Toyota Infotechnology Center Co Ltd | Task management device |
JP2008217134A (en) * | 2007-02-28 | 2008-09-18 | Univ Waseda | Memory management method, information processor, creation method of program, and program |
-
2013
- 2013-05-15 JP JP2013103260A patent/JP6161395B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003034229A1 (en) * | 2001-10-19 | 2003-04-24 | Telefonaktiebolaget Lm Ericsson | Data prefecthing in a computer system |
JP2005284749A (en) * | 2004-03-30 | 2005-10-13 | Kyushu Univ | Parallel computer |
JP2007047968A (en) * | 2005-08-09 | 2007-02-22 | Olympus Corp | Multiprocessor system |
JP2008015668A (en) * | 2006-07-04 | 2008-01-24 | Toyota Infotechnology Center Co Ltd | Task management device |
JP2008217134A (en) * | 2007-02-28 | 2008-09-18 | Univ Waseda | Memory management method, information processor, creation method of program, and program |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021111586A1 (en) * | 2019-12-05 | 2021-06-10 | 日本電信電話株式会社 | Distributed processing system |
JPWO2021111586A1 (en) * | 2019-12-05 | 2021-06-10 | ||
JP7347537B2 (en) | 2019-12-05 | 2023-09-20 | 日本電信電話株式会社 | distributed processing system |
Also Published As
Publication number | Publication date |
---|---|
JP6161395B2 (en) | 2017-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4801725B2 (en) | Arithmetic processing device and control method of arithmetic processing device | |
JP5431003B2 (en) | Reconfigurable circuit and reconfigurable circuit system | |
TW201209709A (en) | Multiprocessor system-on-a-chip for machine vision algorithms | |
JP5776688B2 (en) | Information processing apparatus and task switching method | |
JP5730126B2 (en) | Data supply device, cache device, data supply method, cache method, and program | |
JP2006318178A (en) | Device and method for data transfer arbitration | |
CN109726798B (en) | Data processing method and device | |
JP5993267B2 (en) | Image processing device | |
WO2012120573A1 (en) | Deadlock avoidance method and deadlock avoidance mechanism | |
CN112204523A (en) | Multi-kernel wavefront scheduler | |
US20140331021A1 (en) | Memory control apparatus and method | |
JP6161395B2 (en) | Arithmetic unit | |
JP6004463B2 (en) | Storage device and control method thereof | |
CN105378652A (en) | Method and apparatus for allocating thread shared resource | |
CN114780460B (en) | DMA controller and method | |
CN116243983A (en) | Processor, integrated circuit chip, instruction processing method, electronic device, and medium | |
JP6817827B2 (en) | Accelerator processing management device, host device, accelerator processing execution system, method and program | |
CN115858667A (en) | Method, apparatus, device and storage medium for synchronizing data | |
JP6368452B2 (en) | Improved scheduling of tasks performed by asynchronous devices | |
JP2014225089A (en) | Arithmetic unit | |
JP5630798B1 (en) | Processor and method | |
JP2006215621A (en) | Dma controller | |
JP4924970B2 (en) | Data processing system | |
US9015720B2 (en) | Efficient state transition among multiple programs on multi-threaded processors by executing cache priming program | |
JP2011034214A (en) | Memory controller |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160120 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160816 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160927 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20161118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170411 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170530 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20170531 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170606 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170613 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6161395 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |