WO2022091651A1

WO2022091651A1 - 演算装置及び検査方法

Info

Publication number: WO2022091651A1
Application number: PCT/JP2021/034804
Authority: WO
Inventors: 宏貴中村; 一芹沢
Original assignee: 日立Astemo株式会社
Priority date: 2020-10-28
Filing date: 2021-09-22
Publication date: 2022-05-05
Also published as: JP7454700B2; JPWO2022091651A1

Abstract

並列化プログラムの動作の検査に掛かる負荷を軽減することが可能な演算装置を提供する。複数のタスクT1～T10で共有される資源へのアクセスに関するアクセス情報を取得し、複数のタスクT1～T10に対して第一の条件を適用したときの複数のタスクT1～T10の第一の処理順序と、複数のタスクT1～T10に対して第一の条件とは異なる第二の条件を適用したときの複数のタスクT1～T10の第二の処理順序とを求める。第一の処理順序および第二の処理順序にて、複数のタスクT1～T10で共有される資源へアクセスする第一のタスクより前に行われる先行タスクグループと、第一のタスクより後に行われる後続タスクグループとを比較する。比較結果に基づいて特定されたタスクに対して、アクセス情報を用いて、並列化プログラムにおける所定の違反の有無を検知する。

Description

演算装置及び検査方法

　本開示は、演算装置及び検査方法に関する。

　近年、電子機器の多機能化などにより、電子機器で実行される演算処理の演算量が年々増加しており、それに伴い、電子機器に搭載するＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）などのプロセッサの性能の向上が望まれている。

　このため、電子機器に搭載するプロセッサの数を増やしたり、プロセッサに内蔵させるプロセッサコアの数を増やしたりすることで、電子機器にプロセッサコアを複数搭載するマルチコア化を図ることが多くなっている。

　また、複数のプロセッサコアを利用するために、単一のプロセッサコア向けのプログラムから並列処理が可能な部分を抽出して、各プロセッサコアで実行される複数のプログラムを含む並列化プログラムを作成することがある。並列化プログラムでは、元のプログラムの各タスクが複数のプロセッサコアに適宜割り当てられている。

　並列化プログラムによって元のプログラムと同じ実行結果を得るためには、各タスクの依存関係を考慮して、各プロセッサコアで実行されるプログラムを作成する必要がある。

　例えば、あるタスクの計算結果が別のタスクで使用される場合、それらのタスクの実行順序が元のプログラムでの実行順序と同じにように、各プロセッサコアで実行されるプログラムを作成する必要がある。

　このため、並列化プログラムの動作を検査する際に、依存関係を有するタスクの実行順序が元のプログラムでの実行順序と同一か否かを確認することがある。

　これに対して、特許文献１には、各ＣＰＵコアに割り当てた複数のタスクのうち、互いに同時実行可能な２つのタスクに注目して、それらのタスクの実行順序を入れ替えて実行した時の結果と、同時実行される場合の不具合を、それを引き起こす所定の条件を確認する方法が開示されている。

特開２０１８－１５１８０３号公報

　同時実行可能なタスクを取得し、それらのタスク間で、所定の条件を判定することができれば、並列化プログラムにおける所定の違反の有無を検知することができる。

　しかしながら、従来技術においては、同時実行可能なタスクを見出すことは非常に困難であり、特許文献１においても、同時実行可能なタスクを取得する方法は開示されていない。

　自動で並列化された並列化プログラムは、どのタスクが同時に実行されるかが自明ではないため、並列化プログラムが複雑になればなるほど、同時実行可能なタスクの取得は困難となる。

　本開示の目的は、並列化プログラムを構成する複数のタスク間の関係を効率的に自動取得するアルゴリズムを提供し、タスク間において所定の条件を判定することで、並列化プログラムの動作の検査に掛かる負荷を軽減することが可能な演算装置及び検査方法を提供することである。

　上記目的を達成するため、本開示は次のように構成される。

　複数のプロセッサコアのそれぞれで実行される複数のタスクからなるプログラムを並列化した並列化プログラムの動作を検査する演算装置であって、前記複数のタスクで共有される資源と、前記並列化プログラムを記憶するメモリと、前記並列化プログラムに基づいて動作する制御部と、を備え、前記制御部は、前記複数のタスクで共有される前記資源へのアクセスに関するアクセス情報を取得し、少なくとも、前記複数のタスクに対して第一の条件を適用したときの前記複数のタスクの第一の処理順序と、前記複数のタスクに対して前記第一の条件とは異なる第二の条件を適用したときの前記複数のタスクの第二の処理順序と、を求め、前記第一の処理順序および前記第二の処理順序において、前記複数のタスクで共有される前記資源へアクセスする第一のタスクより前に行われるタスクからなる先行タスクグループと、前記第一のタスクより後に行われるタスクからなる後続タスクグループと、を比較し、比較結果に基づいて特定されたタスクに対して、前記アクセス情報を用いて、前記並列化プログラムにおける所定の違反の有無を検知する。

　複数のプロセッサコアのそれぞれで実行される複数のタスクからなるプログラムを並列化した並列化プログラムの動作を検査する検査方法であって、前記複数のタスクで共有される前記資源へのアクセスに関するアクセス情報を取得し、少なくとも、前記複数のタスクに対して第一の条件を適用したときの前記複数のタスクの第一の処理順序と、前記複数のタスクに対して前記第一の条件とは異なる第二の条件を適用したときの前記複数のタスクの第二の処理順序と、を求め、前記第一の処理順序および前記第二の処理順序において、前記複数のタスクで共有される資源へアクセスする第一のタスクより前に行われるタスクからなる先行タスクグループと、前記第一のタスクより後に行われるタスクからなる後続タスクグループと、を比較し、比較結果に基づいて特定されたタスクに対して、前記アクセス情報を用いて、前記並列化プログラムにおける所定の違反の有無を検知する。

　本開示によれば、並列化プログラムを構成する複数のタスク間の関係を効率的に自動取得するアルゴリズムを提供し、タスク間において所定の条件を判定することで、並列化プログラムの動作の検査に掛かる負荷を軽減することが可能な演算装置及び検査方法を提供することができる。

本開示の実施例１に係るテスト装置の構成を示すブロック図である。本開示の実施例１に係るプログラムが実行されることで実現されるＣＰＵ１２００の機能的な構成の一例を示す図である。本開示の実施例１に係るテスト装置の機能的な構成を示す図である。本開示の実施例１に係る違反判定処理の動作の一例を説明するためのフローチャートである。本開示の実施例１に係るアクセス競合解析処理の動作の一例を説明するためのフローチャートである。本開示の実施例１に係る同時実行可能なタスク取得処理の一例である正順／逆順を説明するための図である。本開示の実施例１に係る先行／後続タスク取得処理の動作の一例を説明するためのフローチャートである。本開示の実施例１に係るスケジューラの一例である全優先度付きスケジューラを説明するための図である。本開示の実施例１に係る同時実行可能なタスク取得処理の一例である最早を説明するための図である。本開示の実施例１に係る同時実行可能なタスク取得処理の一例である最遅を説明するための図である。本開示の実施例１に係る同時実行可能なタスク取得処理の一例である最早／最遅を説明するための図である。本開示の実施例１に係るスケジューラの一例である最遅スケジューラを説明するための図である。本開示の実施例１に係るスケジューラの一例である最早スケジューラを説明するための図である。並列化プログラムの依存関係の具体例を説明するための図である。最遅スケジューラによる実行順序の具体例を説明するための図である。先行タスクグループおよび後続タスクグループの具体例を説明するための図である。先行タスクグループおよび後続タスクグループを弁図の形式で表した図である。常に先行するタスク、同時実行可能なタスク、常に後続するタスクの具体例を説明するための図である。全優先度付きスケジューラによる実行順序の具体例を説明するための図である。本開示の実施例２に係るテスト装置の機能的な構成を示す図である。本開示の実施例２に係る違反判定処理の動作の一例を説明するためのフローチャートである。本開示の実施例２に係るアクセス順序解析処理の動作の一例を説明するためのフローチャートである。本開示の実施例２に係る先行／後続タスク取得処理の動作の一例を説明するためのフローチャートである。本開示の実施例２に係る同時実行可能なタスク取得処理の一例である最早を説明するための図である。本開示の実施例２に係る同時実行可能なタスク取得処理の一例である最遅を説明するための図である。本開示の実施例２に係る同時実行可能なタスク取得処理の一例である最早／最遅を説明するための図である。

　以下、本開示の実施形態について図面を参照して説明する。本開示は、複数のプロセッサコアのそれぞれで実行される複数のタスクからなるプログラムを並列化した並列化プログラムの動作を検査する演算装置及び検査装置である。

　（実施例１）
　まず、実施例１を図１から図１８を用いて説明する。

　図１は、本開示の実施例１に係るテスト装置１０００の概略構成を示すブロック図である。

　図１において、テスト装置１０００は、複数のプロセッサコア向けのプログラムである並列化プログラムの動作を検査する検査処理を実行する演算装置である。並列化プログラムは、単一のプロセッサコア向けのプログラムである単一コア用プログラムから所定のツール等を用いて生成されたものでもよい。並列化プログラムは、複数のプロセッサコアのそれぞれで実行される複数の個別プログラムを含む。

　テスト装置１０００は、メモリ１１００と、ＣＰＵ１２００とを有する。メモリ１１００及びＣＰＵ１２００は、内部バス又はアダプタなどを介して相互に接続される。

　メモリ１１００は、複数のタスクで共有される資源と、並列化プログラムを記憶する。つまり、メモリ１１００は、ＣＰＵ１２００の動作を規定する種々のプログラムを含む種々の情報を記憶する記憶部である。そして、ＣＰＵ１２００は、並列化プログラムに基づいて動作する制御部である。ＣＰＵ１２００は、以下に説明するプログラムに従って、並列化プログラムにおける所定の違反の有無を検知する（検査する）。

　本実施例１では、メモリ１１００は、エミュレータ１１０１と、違反検査プログラム１１０２と、ｃｏｒｅ０用プログラム１１０３と、ｃｏｒｅ１用プログラム１１０４と、ｃｏｒｅ２用プログラム１１０５と、を記憶する。メモリ１１００は、さらに、違反情報１１０６と、変数アクセス情報１１０７と、タスクグループ情報１１０８と、実行順序情報１１０９と、選択コア情報１１１０と、同期フラグ１１１１と、を記憶する。変数アクセス情報１１０７には、例えば、グローバル変数等の変数も含まれ、これらの変数は、複数のタスクで共有される資源である。

　エミュレータ１１０１は、並列化プログラムの各個別プログラムを実行する複数のプロセッサコアを仮想的に実現するためのプログラムである。本実施例１では、複数のプロセッサコアとして、３つのＣＰＵコア（仮想ＣＰＵコア０、仮想ＣＰＵコア１および仮想ＣＰＵコア２）が仮想的に実現される。

　違反検査プログラム１１０２は、エミュレータ１１０１にて、並列化プログラムに対し、そのプログラムが所定の条件を満たすか否かを検査するためのプログラムである。そのときに必要なタスク実行順序は、実現された仮想ＣＰＵコア０、仮想ＣＰＵコア１および仮想ＣＰＵコア２を、並列化プログラムを実行させるプロセッサコアとして用いて取得する。

　以下では、便宜上、プログラム及びタスクを各処理の動作主体として説明することもあるが、各処理の実際の動作主体は制御部であるＣＰＵ１２００である。

　ｃｏｒｅ０用プログラム１１０３、ｃｏｒｅ１用プログラム１１０４およびｃｏｒｅ２用プログラム１１０５は、検査処理の検査対象となる並列化プログラムを構成する。ｃｏｒｅ０用プログラム１１０３、ｃｏｒｅ１用プログラム１１０４およびｃｏｒｅ２用プログラム１１０５は、それぞれ、仮想ＣＰＵコア０、仮想ＣＰＵコア１および仮想ＣＰＵコア２により個別に実現される。

　違反情報１１０６は、並列化プログラムが所定の条件の成立可否などの情報を示す。

　変数アクセス情報１１０７は、各ｃｏｒｅ用プログラム１１０３～１１０５が、アクセスしている変数の情報を示す。

　タスクグループ情報１１０８は、あるタスクあるいは処理に対し、それ以外のタスクあるいは処理が、とりうる状態毎にグループ分けしたリストを示す。

　実行順序情報１１０９は、タスクあるいは処理が実行された順序を示す。

　選択コア情報１１１０は、実行順序取得（スケジュール）処理において、プロセッサコアを管理するために使用される管理情報であり、本実施例１では、検査処理において選択中及び選択済みのプロセッサコアを示す。

　同期フラグ１１１１は、並列化プログラムの各タスクの実行順序に関する制約を規定するための制約情報である。同期フラグ１１１１は、具体的には、並列化プログラムの各タスクのうち、他のタスクに依存している依存タスクの実行可否を示す。

　依存タスクは、依存対象のタスクの演算結果を使用するなど、依存対象のタスクとの間に実行順序に関する制約を有するタスクである。なお、同期フラグ１１１１は、複数あってもよい。

　図２は、プログラムが実行されることで実現されるＣＰＵ１２００の機能的な構成の一例を示す図である。

　図２に示すように、エミュレータ１１０１にて、仮想ＣＰＵコア０、仮想ＣＰＵコア１及び仮想ＣＰＵコア２が仮想的に実現される。ｃｏｒｅ０用プログラム１１０３、ｃｏｒｅ１用プログラム１１０４及びｃｏｒｅ２用プログラム１１０５は、ここでは、タスクＴ１～Ｔ１０を含む単一コア用プログラムから、３つのプロセッサコアで並列処理が可能なように作成されている。

　ｃｏｒｅ０用プログラム１１０３は、仮想ＣＰＵコア０にタスクＴ１、Ｔ２、Ｔ６及びＴ７を実行させる個別プログラムである。ｃｏｒｅ１用プログラム１１０４のタスクＴ３、Ｔ４及びＴ５、ｃｏｒｅ２用プログラム１１０５のタスクＴ８、Ｔ９及びＴ１０も同様にそれぞれの仮想ＣＰＵで実行される。

　フラグＡは、タスクＴ１が終了するまでタスクＴ３（タスクＴ１に依存した依存タスク）を開始させないように制御するための同期フラグである。フラグＡは、タスクＴ１によってセットされる。タスクＴ３はタスクＴ１によってフラグＡがセットされるまで待機する。

　なお、フラグを、実行可能を示す状態にすることを「フラグをセットする」と呼び、フラグが実行可能を示す状態になるまで待機することを「セット待ち」と呼ぶ。同様に、フラグＢは、タスクＴ７とタスクＴ４の依存関係を制御し、フラグＣは、タスクＴ４とタスクＴ８の依存関係を制御する。

　違反検査システムは、同期フラグ１１１１にて規定される各タスクＴ１～Ｔ１０の実行順序に関する制約を満たしつつ、優先条件に従ってタスクＴ１～Ｔ１０を順次実行させる検査処理を行うことで、ｃｏｒｅ０用プログラム１１０３、ｃｏｒｅ１用プログラム１１０４及びｃｏｒｅ２用プログラム１１０５の各タスクの実行順序に関する制約、つまり各タスクの依存関係が元の単一コア用プログラムと等しいか否かを検査する。

　あるタスクに着目した時、そのタスクに対して、必ず順序が決まるタスクと同時実行可能なタスクが定まる。

　したがって、全てのコアに着目することで、全ての同時実行可能なタスクを抽出できる。

　例えば、タスクＴ４に着目すると、タスクＴ２、Ｔ６、Ｔ９、Ｔ１０が同時実行可能なタスクである。それ以外のタスクは、必ず順序が決まるタスクである。

　実施例１では、異なるコア上で実行される同時実行可能なタスクにおいて、変数アクセスが所定の条件（例えば、同一の変数（共有の資源）へのリード動作またはライト動作が行われているか（リード動作またはライト動作の競合が存在するか（ただし、少なくとも一つのライト動作の競合が存在することが必要である）））を満たすか否かを判定することで、並列プログラムの違反を検査する。

　図３に示す違反検査システム３１０１は、競合を検査する検査システムである。違反検査システム３１０１は、違反判定処理３１０２と、アクセス競合解析処理３１０３と、同時実行可能タスク取得処理３１０４と、先行／後続タスクグループ取得処理３１０５と、スケジューラ（実行順序取得処理）３１０６と、で構成される。

　違反判定処理３１０２は、プログラム全体における違反の有無を判定する処理である。本実施例１では、競合を検査する。

　アクセス競合解析処理３１０３は、ある変数に対して、複数のタスクから、同時にアクセスが発生しないことを判定し、その結果を違反判定処理３１０２に返す。ある変数は、違反判定処理３１０２から受け取った、タスク（以下、基準タスクと記述）内で、Ｗｒｉｔｅ処理をしている変数すべてである。

　同時実行可能タスク取得処理３１０４は、アクセス競合解析処理３１０３から受け取った、基準タスクと、同時に実行されうるタスク（同時実行可能なタスク）を取得し、アクセス競合解析処理３１０３に返す。

　先行／後続タスクグループ取得処理３１０５は、様々な実行順序において、基準タスクより先に動作したタスクグループのリストと、より後に動作したタスクグループのリストと、を取得し、同時実行可能タスク取得処理３１０４に返す。

　なお、様々な実行順序は、同時実行可能なタスク取得処理３１０４から受け取った、実行順序条件に基づく。

　スケジューラ（実行順序取得処理）３１０６は、先行後続タスクグループ取得処理３１０５から受け取った実行順序条件に従い、実行順序を取得して、先行後続タスクグループ取得処理３１０５に返す処理である。

　図４は、図３の違反判定処理３１０２の内容の一例を示すフローチャートである。

　違反検査システム３１０１は、並列化プログラムを構成する全てのタスクについて、ループ４１００で、順番に検査する。

　違反検査システム３１０１は、ループ４１００で、選択されているタスクにおいて、共有（グローバル）変数へのＷｒｉｔｅ処理の有無を判定する。共有（グローバル）変数へのＷｒｉｔｅ処理が有の場合（Ｙｅｓの場合）は、フラグをセットする。

　なお、ポインタ変数はローカルで宣言されていても、その指し先がグローバル領域ならグローバル変数として扱う（ステップ４１０１）。

　違反検査システム３１０１は、基準タスクに対する、アクセス競合を検査するサブフローである。ステップ４１０２の詳細は図５で説明する。

　違反検査システム３１０１は、ステップ４１０２の結果がＯＫである場合、何もせずループ４１００を続行し、ＮＧであった場合、ステップ４１０４を実行する（ステップ４１０４）。

　違反検査システム３１０１は、違反ありを図１の違反情報１１０６に格納し、プログラムを終了させる。

　図５は、変数のアクセス競合の有無を判定するためのフローチャートであり、図４のステップ４１０２のアクセス競合解析のサブフローである。なお、図５に示したフローチャートは、図３のアクセス競合解析処理３１０３の動作に相当する。

　アクセス競合解析処理３１０３は、違反判定処理３１０２から受け取った、基準タスクに対して、それと同時に実行されうるタスクを、同時実行可能タスク処理３１０４から取得する（ステップ５１０１）。

　アクセス競合解析処理３１０３は、アクセス競合を検査する（ステップ５１０２）。つまり、ステップ５１０１で取得したタスク群に対し、当該タスクでＷｒｉｔｅするコア間共有変数の少なくとも一つに対するＲ／Ｗ有りか無しかを判定する。

　基準タスクでＷｒｉｔｅしている共有変数すべてに対し、基準タスクと同時実行可能なタスクで、当該共有変数へのＲｅａｄあるいはＷｒｉｔｅの有無を検索し、当該共有変数すべてのうち、少なくとも１つの共有変数に１つのＲｅａｄあるいはＷｒｉｔｅが検出された場合、ステップ５１０３を実行する。

　一方、基準タスクと同時実行可能なタスクにおいて、すべての当該共有変数に対するＲｅａｄとＷｒｉｔｅが一つも見つからなかった場合、処理を終了し、図４のフローに戻る。

　違反判定プログラム３１０１は、アクセス競合があった場合に実行されるフローであり、違反ありを図４のフローに返す（ステップ５１０３）。なお、違反箇所をメモリ１１００の違反情報１１０６に格納するように変更する。違反箇所はディスプレイ等の適切な出力装置に出力することができる。これは、コードを修正する際に有用な情報である。

　図６は、図３に示した同時実行可能タスク取得処理３１０４の内容の一例を示すフローチャートである。図６に示すフローチャートは、複数のプロセッサコア（仮想ＣＰＵコア０、仮想ＣＰＵコア１、仮想ＣＰＵコア２）のそれぞれに任意の実行優先順序を割り当てる第一の条件と、複数のプロセッサコア（仮想ＣＰＵコア０、仮想ＣＰＵコア１、仮想ＣＰＵコア２）のそれぞれに第一の条件と逆の優先順序を割り当てる第二の条件を用いる。

　複数のタスクに対して第一の条件を適用したときの複数のタスクの処理順序を第一の処理順序とし、複数のタスクに対して第一の条件とは異なる第二の条件を適用したときの複数のタスクの処理順序を第二の処理順序とする（以下の説明においても、同様である）。

　図６に示したフローチャートは、正順・逆順の二通りの実行順序から、アクセス競合解析処理３１０３より受け取った、基準タスクと同時実行可能なタスクを取得する。

　違反検査システム３１０１は、複数の実行順序において、基準タスクより先に実行されたタスクを格納する先行タスクグループおよび、基準タスクより後に実行されたタスクを格納する後続タスクグループを初期化（リストを空に）する（ステップ６１０１）。

　違反検査システム３１０１は、実行順序を取得するにあたって、実行順序取得処理におけるポリシーを設定する（ステップ６１０２）。実施例１では、正順、逆順の２本のリストを設定するというポリシーを設定する。

　正順は、すべてのタスクに対して、コアごとに実行優先度を設定する。たとえば、仮想ＣＰＵコア０を第一優先、仮想ＣＰＵコア１を第二優先、・・・というような具合である。

　逆順は、正順で設定した実行優先度を逆転したものである。実行順序取得処理において、優先度が第一優先の仮想ＣＰＵコア０に属するタスクは、第二優先以下のコアに属するタスクより可能な限り先に実行するようにスケジュールされる。

　違反検査システム３１０１は、ステップ６１０２で設定した全てのポリシーで、実行順序から情報をループ６１０３で取得する。本実施例１では、ループ回数は２である。

　違反検査システム３１０１は、先行／後続タスクグループを取得する処理であり、実行順序から、先行タスクグループおよび後続タスクグループに各タスクを振り分ける（ステップ６１０４）。

　違反検査システム３１０１は、先行タスクグループ、後続タスクグループの集合和を取り、同時実行可能なタスクとして、図５のフローに、そのリストを返す（ステップ６１０５）。つまり、先行タスクグループと後続タスクグループのＡＮＤを取り、図５のフローに返す。同時実行可能なタスクは、基準タスクに対し、順序が不定（入れ替え可能）であることから、先行タスクグループ、後続タスクグループの両方に含まれ、集合和を取ることで、同時実行可能なタスクを取得することができる。

　図７は、図３の先行／タスクグループ取得処理３１０５の内容の一例を示すフローチャートである。

　図７において、ステップ７１０１は、実行順序の取得に用いるスケジューラ（最早スケジューラ、最遅スケジューラ、正順／逆順スケジューラ）を選択する分枝処理である。
ステップ７１０２で、違反検査システム３１０１は、あるコアを最早で実行する最早スケジューリングを実施する最早スケジューラを選択する。

　ステップ７１０３で、違反検査システム３１０１は、あるコアを最遅で実行する最遅スケジューリングを実施する最遅スケジューラを選択する。

　ステップ７１０４で、違反検査システム３１０１は、全てのコアに優先度を付与して実行する優先度付きスケジューリングを実施する全優先度付きスケジューラを選択する。

　ステップ７１０５で、違反検査システム３１０１は、選択されたスケジューラで実行順序を取得する。

　違反検査システム３１０１は、先行タスクグループに、ステップ７１０５において取得した実行順序において、基準タスクより先に実行されるタスクを追加する（ステップ７１０６）。

　なお、ステップ７１０６が２回目以降に実行される場合は、先行タスクグループに既にあるタスクとＯＲを取りながら追加する。

　違反検査システム３１０１は、後続タスクグループに、ステップ７１０５において取得した実行順序において、基準タスクより後に実行されるタスクを追加する（ステップ７１０７）。

　なお、ステップ７１０７が２回目以降に実行される場合は、後続タスクグループに既にあるタスクとＯＲを取りながら追加する。

　図８は、図７のステップ７１０４で設定した全優先度付きスケジューラを、ステップ７１０５で実行するときの実行順序取得処理の一例を説明するためのフローチャートである。図８に示したフローチャートは、図３では、スケジューラ３１０６の動作に相当する。

　ステップ８１０１で、違反検査システム３１０１は、優先順位が最も高いプロセッサコアを対象プロセッサコアとして選択する。ステップ８１０２で、違反検査システム３１０１は、選択中の対象プロセッサコアが実行可能か否かを判断する。対象プロセッサコアが実行可能でない場合、ステップ８１０３の処理を実行する。対象プロセッサコアが実行可能である場合、ステップ８１０４を実行する。

　ステップ８１０３で、違反検査システム３１０１は、優先順位が選択中の対象プロセッサコアの次に高いプロセッサコアを対象プロセッサコアとして選択し、ステップ８１０２の処理に戻る。

　ステップ８１０４で、違反検査システム３１０１は、対象プロセッサコアに対してタスクの実行を指示し、実行したタスクを実行順序情報１１０９にある実行順序リストの末尾に追加する。

　ステップ８１０５で、違反検査システム３１０１は、タスクを実行した、対象プロセッサコアがフラグをセットしたか否かを判断する。

　対象プロセッサコアがフラグをセットした場合、ステップ８１０１の処理に戻る。一方、対象プロセッサコアがフラグをセットしていない場合、ステップ８１０６の処理を実行する。

　ステップ８１０６で、違反検査システムは、全てのプロセッサコアの全てのタスクが終了したか否かを判断する。全てのタスクが終了していない場合、ステップ８１０２の処理に戻り、全てのタスクが終了した場合、処理を終了する。

　以上の動作により、図６のステップ６１０２で設定した優先順位に従って各プロセッサコアにタスクを実行し、その実行順序を取得することができる。また、プロセッサコアのいずれかがフラグをセットした場合（ステップ４１０１：Ｙｅｓ）、そのプロセッサコアよりも優先順位が高いプロセッサコアがタスクを実行可能である可能性があるため、ステップ８１０１の処理に戻している。

　図９を用いて、実施例１の変形例１を説明する。図９は図６と異なり、全てのコアを１回ずつ最早に設定したコア数本の実行順序を用いて、基準タスクと同時実行可能なタスクを取得する。図６との相違点は、ステップ９１０２がステップ６１０２と異なり、ステップ９１０２がステップ６１０３と異なる点である。

　図９に示したフローチャートの動作においては、第一の条件は、複数のプロセッサコア（仮想ＣＰＵコア０、仮想ＣＰＵコア１、仮想ＣＰＵコア２）の一つのプロセッサコアに対し、その他のプロセッサコアより優先して実行する最早条件であり、第二の条件は、上記一つのプロセッサコア以外のプロセッサコアを一度ずつ最早条件とする条件である。

　違反検査システム３１０１は、あるコアを最早（選択したコアで実行されるタスクが、その他のコアで実行されるタスクに対して、可能な限り先行する）で実行するという条件を、全てのコアに適応した、コア数本の実行条件を設定する（ステップ９１０２）。

　違反検査システム３１０１は、ループ９１０３で、ステップ９１０２で設定した全てのポリシーで、実行順序から情報を取得する。本実施例１の変形例１では、ループ回数はコア数と同じである。

　図１０を用いて、実施例１の変形例２を説明する。図１０の例は図６の例と異なり、全てのコアを１回ずつ最遅に設定したコア数本の実行順序を用いて、基準タスクと同時実行可能なタスクを取得する。図６との相違点は、ステップ１０１０２がステップ６１０２と異なり、ステップ１０１０２がステップ６１０３と異なる点である。

　違反検査システム３１０１は、あるコアを最遅（選択したコアで実行されるタスクに対し、その他のコアで実行されるタスクが、可能な限り先行する）で実行するという条件を、全てのコアに適応した、コア数本の実行条件を設定する（ステップ１０１０２）。

　違反検査システム３１０１は、ループ１０１０３で、ステップ１０１０２で設定した全てのポリシーで、実行順序から情報を取得する。本実施例１の変形例２では、ループ回数はコア数と同じである。

　図１１を用いて、実施例１の変形例３を説明する。図１１は図６と異なり、基準タスクが属するコアが最早、最遅に設定した２本の実行順序を用いて、基準タスクと同時実行可能なタスクを取得する。図６との相違点は、ステップ１１１０２がステップ６１０２と異なる点である。

　図１１に示したフローチャートにおいては、第一の条件は、複数のプロセッサコア（仮想ＣＰＵコア０、仮想ＣＰＵコア１、仮想ＣＰＵコア２）の一つのプロセッサコアに対し、その他のプロセッサコアより優先して実行する最早条件であり、第二の条件は、複数のプロセッサコア（仮想ＣＰＵコア０、仮想ＣＰＵコア１、仮想ＣＰＵコア２）の一つのプロセッサコアに対し、その他のプロセッサコアを優先して実行する最遅条件である。

　違反検査システム３１０１は、基準タスクが属するコアを最早にする条件と、最遅にして実行するという条件の、２本の実行条件を設定する（ステップ１０１０２）。

　図１２は、図７のステップ７１０３のタスク実行処理の一例を説明するための図である。図１２におけるタスク実行処理は、優先条件を、対象プロセッサコアを他の全てのプロセッサコアよりも優先度を低くする最遅条件下で実行順序を取得する最遅スケジューラである。

　最遅条件は、対象プロセッサコアによるタスクの実行をできるだけ後に行うことを意味する。最遅条件は、より具体的には、他のプロセッサコアがタスクを実行可能な場合、他のプロセッサコアにタスクを実行させ、他のプロセッサコアがタスクを実行可能でない場合、対象プロセッサコアにタスクを実行させる条件である。タスクを実行可能なプロセッサコアは、割り当てられたタスクに未だ実行していないタスクがあり、かつ、次に実行するタスクがセット待ちでないプロセッサコアである。

　ステップＳ２０１において、タスク実行処理（最遅スケジューリング）では、先ず、違反検査システム３１０１は、タスクを実行可能な他のプロセッサコアが存在するか否かを判断する。このとき、違反検査システム３１０１は、対象プロセッサコアがタスクを実行可能でなくなるまで、タスクを実行させる。

　なお、他のプロセッサコアは、選択中の対象プロセッサコア以外のプロセッサコアである。

　ステップＳ２０２において、タスクを実行可能な他のプロセッサコアが存在する場合、違反検査システム３１０１は、そのタスクを実行可能な他のプロセッサコアに対してタスクの実行を指示して、タスクを実行させ、ステップＳ２０１の処理に戻る。

　ステップＳ２０３において、タスクを実行可能な他のプロセッサコアが存在しない場合、違反検査システム３１０１は、選択中の対象プロセッサコアに対してタスクの実行を指示して、タスクを実行させる。このとき、違反検査システム３１０１は、対象プロセッサコアがフラグをセットするか、セット待ちになるか、又は、全てのタスクを終了するまで、対象プロセッサコアにタスクを実行させる。

　ステップＳ２０４において、違反検査システム３１０１は、全てのプロセッサコアの全てのタスクが終了したか否かを判断する。違反検査システム３１０１は、全てのタスクが終了していない場合、ステップＳ２０１の処理に戻り、全てのタスクが終了した場合、処理を終了する。

　図１３は、図７のステップ７１０２のタスク実行処理の他の例を説明するための図である。図１３におけるタスク実行処理は、優先条件を、対象プロセッサコアを他の全てのプロセッサコアよりも優先度を高くする最早条件下で実行順序を取得する最早スケジューラである。

　最早条件は、対象プロセッサコアによるタスクの実行をできるだけ早く行うことを意味する。最早条件は、より具体的には、対象プロセッサコアがタスクを実行可能な場合、対象プロセッサコアにタスクを実行させ、対象プロセッサコアがタスクを実行可能でない場合、他のプロセッサコアにタスクを実行させる条件である。

　タスク実行処理（最早スケジューリング）では、先ず、違反検査システム３１０１は、選択中の対象プロセッサコアがタスクを実行可能であるか否かを判断する（ステップＳ３０１）。

　対象プロセッサコアがタスクを実行可能である場合、違反検査システム３１０１は、対象プロセッサコアに対してタスクの実行を指示して、タスクを実行させ（ステップＳ３０２）、ステップＳ３０１の処理に戻る。このとき、違反検査システム３１０１は、対象プロセッサコアがタスクを実行可能でなくなるまで、タスクを実行させる。

　対象プロセッサコアがタスクを実行可能でない場合、違反検査システム３１０１は、対象プロセッサコアのセット待ちのフラグをセットするプロセッサコアを検索する（ステップＳ３０３）。

　違反検査システム３１０１は、検索されたプロセッサコアがセット待ちか否かを判断する（ステップＳ３０４）。

　検索されたプロセッサコアがセット待ちの場合、違反検査システム３１０１は、検索されたプロセッサコアのセット待ちのフラグをセットするプロセッサコアを検索し（ステップＳ３０５）、ステップＳ３０４の処理に戻る。

　なお、ステップＳ３０４では、最後に選択されたプロセッサコアがセット待ちか否かが判断される。

　検索されたプロセッサコアがセット待ちでない場合、違反検査システム３１０１は、検索されたプロセッサコアに対してタスクの実行を指示して、タスクを１つ実行させる（ステップＳ３０６）。

　違反検査システム３１０１は、全てのプロセッサコアの全てのタスクが終了したか否かを判断する（ステップＳ３０７）。違反検査システム３１０１は、全てのタスクが終了していない場合、ステップＳ３０１の処理に戻り、全てのタスクが終了した場合、処理を終了する。

　なお、上記の動作において、ステップＳ３０２によって対象プロセッサコアが割り当てられたタスクを終了した場合、ステップＳ３０３では、違反検査システム３１０１は、対象プロセッサコアのセット待ちのフラグをセットするプロセッサコアを検索する代わりに、他のプロセッサコアのうち実行可能なプロセッサコアを検索する。

　本実施例１では、複数の条件を適用して得られた実行順序を比較することにより、同時実行可能なタスクが得られる。具体的には、複数の実行順序間で順序関係が、少なくとも１つの実行順序の組み合わせで入れ替わっている２つのタスク対として現れる。

　この原理に基づき取得した同時実行可能なタスクの全ての組み合わせで、任意の変数に対して、Ｒｅａｄ－Ｗｒｉｔｅ、Ｗｒｉｔｅ－Ｗｒｉｔｅなるアクセスがないことを確認することで、その変数に対しては、プログラム全体を通して、競合が発生しえないことが示せる。すなわち、いかなる場合においてもデータ競合が発生しないことが示せる。

　以下では、変形例２について前記の原理と、前記のフローの動作を解説する。

　図１４Ａは、タスクＡ～Ｈで構成されたある並列化プログラムのグラフモデルである。グラフモデルにおいてタスクはノードとして表現され、タスク間の依存関係はエッジとして表現される。エッジの始点に結合するタスクαとエッジの終点に結合するタスクβとの間には、必ずタスクαの実行終了をまってタスクβを実行しなければならない、という関係が成立する。

　図１４Ａでは、タスクＡ、Ｂ、Ｇ、Ｈがｃｏｒｅ０で実行され、タスクＣ、Ｅがｃｏｒｅ１で実行され、タスクＤ、Ｆがｃｏｒｅ２で実行される。

　並列プログラムで特に重要となるものは、コア間の依存関係である。タスクＡからタスクＣ、Ｄに、タスクＣからタスクＦに、タスクＥからタスクＧに、タスクＦからＨにというコア間依存関係がある。

　したがって、これらのタスクには順序制約あり、一方が必ず先、もう一方が必ず後に実行される。

　一方、依存関係がないタスクは、同時実行可能なタスクである。それらのタスクには順序制約がなく、逆転した順序や同時に実行される。例えば、タスクＥとＦは互いに依存関係がなく、同時実行可能である。

　図１４Ｂは、各コアを最遅とした実行順序を示す図である。

　図１４Ｂにおいて、タスクＥとＦに注目し、ｃｏｒｅ１が最遅の場合と、ｃｏｒｅ２が最遅の実行順序を比較する。ｃｏｒｅ１が最遅の場合では、タスクＦからＥ、ｃｏｒｅ２が最遅の場合では、タスクＥからＦなる順序で実行されており、２つは同時実行可能なタスクであることが分かる。

　最遅を課した最遅スケジューリングにおいて、最遅に指定したｃｏｒｅに含まれるタスクに対して、その他のｃｏｒｅに含まれるタスクが可能な限り先行して実行されるという制約がある。ｃｏｒｅ１が最遅の場合では、タスクＥ（ｃｏｒｅ１）よりタスクＦ（ｃｏｒｅ２）が先に動作するように制御される。ｃｏｒｅ２が最遅の場合では、タスクＦ（ｃｏｒｅ２）よりタスクＥ（ｃｏｒｅ１）が先に動作するように制御される。

　ここで重要なのは、最遅を課した最遅スケジューリングにおける制約より、プログラムの依存関係の方が強い制約であるという点にある。したがって、最遅スケジューリングは、プログラムの依存関係を無視した実行制御をしないということである。

　これにより、必ず同時実行可能なタスクのみが、複数の実行順序で、その順序が入れ替わることが保証できる。

　図１５は、先行タスクグループと後続タスクグループの例を示す図である。図１５では、タスクＦを基準とし、それより先に実行されたタスクを先行タスクグループに、タスクＦより後に実行されたタスクを後続タスクグループに追加する。

　図１６は、図１５に示した先行タスクグループと後続タスクグループから、いかなる場合も基準タスクＦよりも先に実行される常に先行するタスクＡ、Ｄ、Ｃと、同時実行可能なタスクＢ、Ｅ、Ｇと、いかなる場合も基準タスクＦよりも後に実行される常に後続するタスクＨに分類する様子を示した図である。

　常に先行するタスクＡ、Ｄ、Ｃは、先行タスクグループにおける後続タスクグループの補集合となる。同時実行可能なタスクＢ、Ｅ、Ｇは、先行タスクグループと後続タスクグループの積集合となる。常に後続するタスクＨは、後続タスクグループにおける先行タスクグループの補集合である。

　図１７は、タスクＦに対して定まる常に先行するタスクＡ、Ｃ、Ｄと、同時実行可能なタスクＢ、Ｅ、Ｇと、常に後続するタスクＨを示す図である。

　本実施例１では、すべての共有変数にＷｒｉｔｅしているタスクに対して、同時実行可能なタスクのみを抽出し、その中で共有変数へのＲｅａｄ－Ｗｒｉｔｅ競合、Ｗｒｉｔｅ－Ｗｒｉｔｅ競合がないかをチェックすることで、共有変数の競合（データ競合、不可分操作違反）を検出でき、それらがないことが示せれば、共有変数へのアクセスの順序が一意に定まることが示せる。

　したがって、実施例１の変形例２によれば、基準タスクに対して定まる同時実行可能なタスクをもれなく抽出することができる。変形例１と変形例３も変形例２と同様である。

　一方、正順・降順は同時実行可能なタスクを見逃してしまうケースがある。図１８は、図１４Ａに示した例を、正順（第一優先：ｃｏｒｅ２、第二優先：ｃｏｒｅ０、第三優先：ｃｏｒｅ１）、逆順（第一優先：ｃｏｒｅ１、第二優先：ｃｏｒｅ０、第三優先：ｃｏｒｅ２）でスケジュールした実行順序を示す図である。図１８において、Ｆを基準タスク（同時実行可能なタスクはタスクＢ、Ｅ、Ｇ）としたとき、タスクＥ、Ｇは基準タスクＦに対して、正順と逆順で順序が入れ替わっているが、タスクＢは基準タスクＦに対して順序が入れ替わっておらず、同時実行可能なタスクを全て取得できないことが分かる。

　このような現象が発生するケースとして、当該コア（基準タスクＦがあるＣＰＵコア）より優先度が低く設定されているコアに、基準タスクと同時実行可能なコアが存在し、当該コアにおいて基準タスク以前のタスクに対し、同期フラグを送信するタスクを含むコア（遮断するコア（遮断コア））の優先度が、同時実行可能なタスクを含むコアのより低い場合などが考えられる。

　本来であれば、基準タスクは、同時実行可能なタスクに対し、先行して実行されなければならないところを、遮断コアが基準タスクにある基準コアの実行を妨げることによって、同時実行可能なタスクの方が先に実行される。

　遮断コアが同期フラグを発行していないため、当該コアは実行待ちとなり、当該コアより優先度が低いタスクを実行する。基準タスクと同時実行可能なタスクが属するコアが、遮断コアより優先度が高い場合、遮断コアが同期フラグを発行する前に、同時実行可能なタスクが実行されてしまう。

　変形例１あるいは変形例２では、基準タスクを含むコアが最早あるいは最遅の順序では、基準タスクと同時実行可能なタスクは必ず、基準タスクより必ず後あるいは先に実行されることが保証される。

　基準タスクを含むコア以外が最早あるいは最遅のとき、その最早あるいは最遅に設定されたコアに含まれる同時実行可能なタスクは基準タスクに対し、必ず先あるいは後に実行される。基準タスクを含むコア以外のコアを全て一度ずつ最早あるいは最遅に設定して、実行した場合、基準タスクに対し、同時実行可能なタスクはいずれかの順序で必ず先あるいは後に実行される。

　したがって、各コアを一度ずつ最遅に設定した実行順序から、先行タスクグループと後続タスクグループを取得した時、同時実行可能なタスクは両者に含まれる。すなわち、両者の集合和には、全ての基準タスクに対して定まる同時実行可能なタスクが必ず含まれる。

　変形例３も、同様に基準タスクに対して定まる同時実行可能なタスクをもれなく抽出できる。基準タスクを含むコア以外が最早あるいは最遅のとき、その最早あるいは最遅に設定されたコアに含まれる同時実行可能なタスクは基準タスクに対し、必ず先あるいは後に実行される。したがって、基準タスクを最早、最遅に設定した実行順序から、先行タスクグループと後続タスクグループを取得した場合でも、同時実行可能なタスクは両者に含まる。

　さらに、実行順序を各条件で一回だけ実行し、その結果をメモリ１１００のタスクグループ情報１１０８に記録しておくことで、計算量を減らすことが可能である。図７においてスケジューラは、指定された条件と一致する実行順序が生成済みの場合、それを参照するように変更することで実施できる。この場合、変形例１、２における実行順を序生成する回数はコア数、変形例３では、コア数×２回となる。

　本開示の実施例１によれば、全ての同時実行可能なタスクを抽出することができるので、それらのタスク間で所定の条件により判定して、並列化プログラムの違反の有無を検知することができ、並列化プログラムの動作の検査に掛かる負荷を軽減することが可能な演算装置及び検査方法を提供することができる。

　本開示においては、制御部であるＣＰＵ１２００は、複数のタスクＴ１～Ｔ１０で共有される資源へのアクセスに関するアクセス情報を取得し、少なくとも、複数のタスクＴ１～Ｔ１０に対して第一の条件を適用したときの複数のタスクＴ１～Ｔ１０の第一の処理順序と、複数のタスクＴ１～Ｔ１０に対して第一の条件とは異なる第二の条件を適用したときの複数のタスクＴ１～Ｔ１０の第二の処理順序とを求める。

　そして、第一の処理順序および第二の処理順序において、複数のタスクＴ１～Ｔ１０で共有される資源へアクセスする第一のタスクより前に行われるタスクからなる先行タスクグループと、第一のタスクより後に行われるタスクからなる後続タスクグループとを比較する。比較結果に基づいて特定されたタスクに対して、上記アクセス情報を用いて、並列化プログラムにおける所定の違反の有無を検知する。

　（実施例２）
　以下では、本開示の実施例２について図１９から図２５を使用して、説明する。

　実施例２では、ある変数に対する実行順序が規定を満たすかを、必ず順序が決まるタスクを参照して検査する。

　実施例２では、先行タスクグループと後続タスクグループのそれぞれに存在してはいけない、共有資源へのアクセス処理が存在する違反であり、先行タスクグループと後続タスクグループに、そのような共有資源へのアクセス処理が一つでも存在する場合に違反とする。

　より具体的に言えば、ある変数へのＷｒｉｔｅ処理を含むタスクに対して定まる、必ず順序が決まるタスク（先か後に実行）から、ある変数に対する処理の実行順序を得ることが可能であり、その順序が規定を満たすかを判定する。上記判定を、ある変数へのすべてのＷｒｉｔｅ処理に対して実施する。

　図１９は本開示の実施例２における違反検査システム１９１０１の概略構成図である。
図１９に示す違反検査システム１９１０１は、実行順序違反を検査する検査システムである。図１９に示した違反検査システム１９１０１は、図３に示した違反検査システム３１０１とおおよそ同じ構成である。図３に示した構成と異なる部分は、アクセス順序解析処理１９１０３と、先行／後続タスク取得処理１９１０４である。

　アクセス順序解析処理１９１０３は、ある変数におけるある処理に対して、他の同一変数への処理に対して、所定の順序制約が満たされることを確認し、その結果を違反判定処理１９１０２に返す。ある変数は、違反判定処理１９１０２から受け取った、タスク（基準タスク）内で、Ｗｒｉｔｅ処理をしている変数すべてである。

　先行／後続タスク取得処理１９１０４は、アクセス順序解析処理１９１０３から受け取った、基準タスクより、先行タスクグループと後続タスクグループを取得し、アクセス順序解析処理１９１０２に返す。

　図２０は、図１９の違反判定処理１９１０２の内容の一例を示すフローチャートである。図２０に示したフローチャートは、図４に示したフローチャートのステップ４１０２の内容が、ステップ２０１０２の内容となり、その他のステップの内容は図４に示したフローチャートと同様である。ステップ２０１０２において、違反検査システム１９１０１は、あるタスク（基準タスク）に対する、実行順序を検査するサブフローである。詳細は図２１で説明する。

　図２１は、変数のアクセス順序の解析処理を行い、正当性を判定するためのフローチャートである。なお、図１９のアクセス順序解析処理１９１０３の動作に相当する。

　違反検査システム１９１０１においては、図２０に示したフローチャートの処理により受け取った、基準タスクに対して、常に先行するタスクと常に後続するタスクを取得する（ステップ２１１０１）。

　違反検査システム１９１０１においては、アクセス順序違反（所定の順序制約を破る）の有無を判断する処理を行う。当該タスクでＷｒｉｔｅする共有変数と同一変数のその他の処理について、先にあるべき処理が、後続タスクグループに無いか、後にあるべき処理が、後続タスクグループに無いか、かつ、プログラム上に存在するかを判定する（ステップ２１１０２）。

　つまり、基準タスクでＷｒｉｔｅしている共有変数すべてに対し、以下の２点を確認する（ステップ２１１０２）。

　当該処理より先に実行されるべき処理が、いずれかのタスクに存在し、かつ後続タスクグループに存在しないこと（条件Ｃ２２１）を確認する。

　当該処理より後に実行されるべき処理が、いずれかのタスクに存在し、かつ先行タスクグループに存在しないこと（条件Ｃ２２２）を確認する。

　上記条件Ｃ２２１及びＣ２２２が破られた場合、ステップ２１１０３を実行する。それ以外の場合、処理を終了し、図２０のフローに戻る。

　条件Ｃ２２１が成立するならば、常に先行するタスクのみに、当該処理より先に実行されるべき処理が存在する。したがって、プログラム実行時に、それらの処理は当該処理より常に先に実行されることが保証される。

　条件Ｃ２２２が成立するならば、常に後続するタスクのみに、当該処理より後に実行されるべき処理が存在する。したがって、プログラム実行時に、それらの処理は当該処理より常に後に実行されることが保証される。

　上記条件が、ある変数のＷｒｉｔｅ処理に対して成立すれば、プログラムは、ある変数における実行順序の規定を満たす。さらに、全ての変数に対し、上記条件が成立するなら、いかなる場合でも、プログラムは全ての変数に対する実行順序の規定を満たす。

　ステップ２１１０３において、違反判定プログラムは、アクセス順序違反があった場合に実行されるフローであり、違反ありを図２０のフローに返す。

　図２２は、図１９に示した先行／後続タスク取得処理１９１０４の内容の一例を示すフローチャートである。図２２に示したフローチャートは、正順・逆順の二通りの実行順序から、図２１に示したフローチャートの処理により受け取った、基準タスクに対して定まる先行タスクグループ、後続タスクグループを取得する処理である。

　図２２のステップ２２１０１から２０１０４は、図６のステップ６１０１からステップ６１０４と同じである。

　図２２のステップ２２１０５において、違反検査システム１９１０１は、先行タスクグループ、後続タスクグループを図２１のフローに返す。

　図２３を用いて、実施例２の変形例１を説明する。図２３に示すフローチャートは、図２２に示したフローチャートと異なり、全てのコアを１回ずつ最早に設定したコア数本の実行順序を用いて、図２１のフローチャートの処理より受け取った、基準タスクに対して定まる先行タスクグループ、後続タスクグループを取得する。

　ステップ２３１０１から２３１０４は、図９のステップ９１０１から９１０４と同じである。ステップ２３１０５は、図２２の２２１０５と同じである。

　図２４を用いて、実施例２の変形例２を説明する。図２４に示したフローチャートは、図２２に示したフローチャートと異なり、全てのコアを１回ずつ最遅に設定したコア数本の実行順序を用いて、図２１のフローチャートの処理により受け取った、基準タスクに対して定まる先行タスクグループ、後続タスクグループを取得する。

　図２４のステップ２４１０１から２４１０４は、図１０のステップ１０１０１から１０１０４と同じである。

　ステップ２４１０５は、図２２のステップ２２１０５と同じである。

　図２５に示したフローチャートを用いて、実施例２の変形例３を説明する。図２５に示したフローチャートは、図２２に示したフローチャートと異なり、基準タスクが属するコアが最早、最遅に設定した２本の実行順序を用いて、図２１のフローチャートの処理により受け取った、基準タスクに対して定まる先行タスクグループ、後続タスクグループを取得する。

　ステップ２５１０１から２５１０４は、図１１のステップ１１１０１から１１１０４と同じである。ステップ２５１０５は、図２２のステップ２２１０５と同じである。

　本開示の実施例２によれば、ある変数に対する実行順序が規定を満たすかを、必ず順序が決まるタスクを参照して検査するように構成したので、並列化プログラムの違反の有無を検知することができ、並列化プログラムの動作の検査に掛かる負荷を軽減することが可能な演算装置及び検査方法を提供することができる。

　１０００・・・テスト装置、１１００・・・メモリ、１１０１・・・エミュレータ、１１０２・・・違反プログラム、１１０３・・・ｃｏｒｅ０用プログラム、１１０４・・・ｃｏｒｅ１用プログラム、１１０５・・・ｃｏｒｅ２用プログラム、１１０６・・・違反情報、１１０７・・・変数アクセス情報、１１０８・・・タスクグループ情報、１１０９・・・実行順序情報、１１１０・・・選択コア情報、１１１１・・・同期フラグ、１２００・・・ＣＰＵ（制御部）、３１０１、１９１０１・・・違反検出システム、Ｔ１～Ｔ１０・・・タスク

Claims

　複数のプロセッサコアのそれぞれで実行される複数のタスクからなるプログラムを並列化した並列化プログラムの動作を検査する演算装置であって、
　前記複数のタスクで共有される資源と、前記並列化プログラムを記憶するメモリと、
　前記並列化プログラムに基づいて動作する制御部と、
　を備え、
　前記制御部は、前記複数のタスクで共有される前記資源へのアクセスに関するアクセス情報を取得し、少なくとも、前記複数のタスクに対して第一の条件を適用したときの前記複数のタスクの第一の処理順序と、前記複数のタスクに対して前記第一の条件とは異なる第二の条件を適用したときの前記複数のタスクの第二の処理順序と、を求め、前記第一の処理順序および前記第二の処理順序において、前記複数のタスクで共有される前記資源へアクセスする第一のタスクより前に行われるタスクからなる先行タスクグループと、前記第一のタスクより後に行われるタスクからなる後続タスクグループと、を比較し、比較結果に基づいて特定されたタスクに対して、前記アクセス情報を用いて、前記並列化プログラムにおける所定の違反の有無を検知することを特徴とする演算装置。
　請求項１に記載の演算装置において、
　前記第一の条件は、前記複数のプロセッサコアのそれぞれに任意の実行優先順序を割り当てる条件であり、前記第二の条件は前記複数のプロセッサコアのそれぞれに前記第一の条件と逆の優先順序を割り当てる条件であることを特徴とする演算装置。
　請求項１に記載の演算装置において、
　前記第一の条件は、前記複数のプロセッサコアの一つのプロセッサコアに対し、その他のプロセッサコアより優先して実行する最早条件であり、前記第二の条件は前記一つのプロセッサコア以外のプロセッサコアを一度ずつ前記最早条件とすることを特徴とする演算装置。
　請求項１に記載の演算装置において、
　前記第一の条件は、前記複数のプロセッサコアの一つのプロセッサコアに対し、その他のプロセッサコアを優先して実行する最遅条件であり、前記第二の条件は前記一つのプロセッサコア以外のプロセッサコアを一度ずつ前記最遅条件とすることを特徴とする演算装置。
　請求項１に記載の演算装置において、
　前記第一の条件は、前記複数のプロセッサコアの一つのプロセッサコアに対し、その他のプロセッサコアより優先して実行する最早条件であり、前記第二の条件は、前記複数のプロセッサコアの前記一つのプロセッサコアに対し、その他のプロセッサコアを優先して実行する最遅条件であることを特徴とする演算装置。
　請求項１に記載の演算装置において、
　前記所定の違反は、前記先行タスクグループと前記後続タスクグループの集合和で得られたタスクでアクセスしている前記共有される資源のうち、同一の資源に対するリード動作またはライト動作の競合が少なくとも１つ存在する場合に、違反とすることを特徴とする演算装置。
　請求項１に記載の演算装置において、
　前記所定の違反は、前記先行タスクグループと前記後続タスクグループのそれぞれに存在してはいけない、前記共有される資源へのアクセス処理が存在する違反であり、前記先行タスクグループと前記後続タスクグループに、前記共有される資源への前記アクセス処理が一つでも存在する場合に、違反とすることを特徴とする演算装置。
　複数のプロセッサコアのそれぞれで実行される複数のタスクからなるプログラムを並列化した並列化プログラムの動作を検査する検査方法であって、
　前記複数のタスクで共有される前記資源へのアクセスに関するアクセス情報を取得し、少なくとも、前記複数のタスクに対して第一の条件を適用したときの前記複数のタスクの第一の処理順序と、前記複数のタスクに対して前記第一の条件とは異なる第二の条件を適用したときの前記複数のタスクの第二の処理順序と、を求め、前記第一の処理順序および前記第二の処理順序において、前記複数のタスクで共有される資源へアクセスする第一のタスクより前に行われるタスクからなる先行タスクグループと、前記第一のタスクより後に行われるタスクからなる後続タスクグループと、を比較し、比較結果に基づいて特定されたタスクに対して、前記アクセス情報を用いて、前記並列化プログラムにおける所定の違反の有無を検知することを特徴とする検査方法。
　請求項８に記載の検査方法において、
　前記第一の条件は、前記複数のプロセッサコアのそれぞれに任意の実行優先順序を割り当てる条件であり、前記第二の条件は前記複数のプロセッサコアのそれぞれに前記第一の条件と逆の優先順序を割り当てる条件であることを特徴とする検査方法。
　請求項８に記載の検査方法において、
　前記第一の条件は、前記複数のプロセッサコアの一つのプロセッサコアに対し、その他のプロセッサコアより優先して実行する最早条件であり、前記第二の条件は前記一つのプロセッサコア以外のプロセッサコアを一度ずつ前記最早条件とすることを特徴とする検査方法。
　請求項８に記載の検査方法において、
　前記第一の条件は、前記複数のプロセッサコアの一つのプロセッサコアに対し、その他のプロセッサコアを優先して実行する最遅条件であり、前記第二の条件は前記一つのプロセッサコア以外のプロセッサコアを一度ずつ前記最遅条件とすることを特徴とする検査方法。
　請求項８に記載の検査方法において、
　前記第一の条件は、前記複数のプロセッサコアの一つのプロセッサコアに対し、その他のプロセッサコアより優先して実行する最早条件であり、前記第二の条件は、前記複数のプロセッサコアの前記一つのプロセッサコアに対し、その他のプロセッサコアを優先して実行する最遅条件であることを特徴とする検査方法。
　請求項８に記載の検査方法において、
　前記所定の違反は、前記先行タスクグループと前記後続タスクグループの集合和で得られたタスクでアクセスしている前記共有される資源のうち、同一の資源に対するリード動作またはライト動作の競合が少なくとも１つ存在する場合に、違反とすることを特徴とする検査方法。
　請求項８に記載の検査方法において、
　前記所定の違反は、前記先行タスクグループと前記後続タスクグループのそれぞれに存在してはいけない、前記共有される資源へのアクセス処理が存在する違反であり、前記先行タスクグループと前記後続タスクグループに、前記共有される資源への前記アクセス処理が一つでも存在する場合に、違反とすることを特徴とする検査方法。