JP6945634B2 - 画像処理装置、画像処理方法、及び画像処理プログラム - Google Patents

画像処理装置、画像処理方法、及び画像処理プログラム Download PDF

Info

Publication number
JP6945634B2
JP6945634B2 JP2019539104A JP2019539104A JP6945634B2 JP 6945634 B2 JP6945634 B2 JP 6945634B2 JP 2019539104 A JP2019539104 A JP 2019539104A JP 2019539104 A JP2019539104 A JP 2019539104A JP 6945634 B2 JP6945634 B2 JP 6945634B2
Authority
JP
Japan
Prior art keywords
unit
image processing
task
processing
end detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019539104A
Other languages
English (en)
Other versions
JPWO2019044340A1 (ja
Inventor
和幸 板垣
和幸 板垣
長尾 隆
隆 長尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Corp
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Corp, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Publication of JPWO2019044340A1 publication Critical patent/JPWO2019044340A1/ja
Application granted granted Critical
Publication of JP6945634B2 publication Critical patent/JP6945634B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/60Memory management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4015Image demosaicing, e.g. colour filter arrays [CFA] or Bayer patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/38Registration of image sequences

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)

Description

本開示は、画像処理装置、画像処理方法、及び画像処理プログラムに関する。
特開2004−030312号公報には、複数のスレッド(演算装置)が同期をとりながら、一連の処理を複数のスレッドで分担して同時に処理することで、処理の高速化を実現する制御方式が開示されている。
また、Mark Grand, Patterns in Java: A Catalog of Reusable Design Patterns Illustrated with UML, 2nd Edition, Vol. 1, Wiley Pub., 2003/02/17, p. 495-500、及び、Rajat P. Gang and Ilya Sharapov, Techniques for Optimizing Applications: High Performance Computing, Prentice-Hall, 2001/07/25, p. 394-395には、タスク供給者(Producer)がキューに投入されたタスクを、複数のワーカースレッドによるタスク消費者(Consumer)に供給する技術が開示されている。
上記特開2004−030312号公報や、Mark Grand, Patterns in Java: A Catalog of Reusable Design Patterns Illustrated with UML, 2nd Edition, Vol. 1, Wiley Pub., 2003/02/17, p. 495-500、及び、Rajat P. Gang and Ilya Sharapov, Techniques for Optimizing Applications: High Performance Computing, Prentice-Hall, 2001/07/25, p. 394-395に開示された技術では、主として部分処理を行う第1演算部と非同期に、第1演算部の指示により第2演算部で部分処理を実行する場合、第2演算部における部分処理の終了の検知が効率的に行われない場合があった。この場合、部分処理が終了しているにもかかわらず、部分処理の終了が検知されるまで第2演算部に新たに部分処理を行わせることができないため、第2演算部を十分に稼働させることができず、画像処理の処理効率が低下する場合があった。
本開示は、第2演算部における部分処理の終了の検知をより効率的に行うことにより画像処理を高速化する、画像処理装置、画像処理方法、及び画像処理プログラムを提供する。
本開示の第1の態様は、画像処理を実行するオブジェクトが有向非循環グラフ形態で複数連結されたオブジェクト群の各オブジェクトにより画像処理を実行する画像処理装置であって、画像処理の対象となる画像データを複数の分割画像データに分割する分割部と、分割画像データに対して行う画像処理である部分処理で、かつ前後の依存関係に応じて処理可能な部分処理を第1演算部が備える複数の演算装置の各々に並列して実行させる制御を行う制御部と、第1演算部と非同期に第2演算部が部分処理を実行可能な場合、第2演算部に対する部分処理の実行を指示する実行指示タスクを第1演算部の演算装置において実行した後に、第2演算部における部分処理の終了を検知する終了検知タスクを終了検知タスク管理情報に登録する登録部と、終了検知タスク管理情報にアクセスし、第2演算部が部分処理を終了した終了検知タスクの有無を判定する判定部と、を備える。
また、本開示の第2の態様は、上記第1の態様において、演算装置は、部分処理の実行後に判定部として動作してもよい。
また、本開示の第3の態様は、上記第2の態様において、演算装置は、判定部として終了検知タスクの有無の判定の終了後、再び制御部の制御により他の部分処理を実行してもよい。
また、本開示の第4の態様は、上記態様において、演算装置は、登録部として動作してもよい。
また、本開示の第5の態様は、上記態様において、演算装置は、登録部としての動作と判定部としての動作とを連続して行ってもよい。
また、本開示の第6の態様は、上記第1の態様において、制御部は、判定部として動作させるための判定タスクを演算装置に実行させてもよい。
また、本開示の第7の態様は、上記態様において、登録部及び判定部の終了検知タスク管理情報へのアクセスが排他制御されていてもよい。
また、本開示の第8の態様は、上記態様において、判定部は、第2演算部が部分処理を終了した終了検知タスクを終了検知タスク管理情報から削除してもよい。
また、本開示の第9の態様は、上記態様において、制御部は、タスクキューに格納された部分処理を順次取り出して複数の演算装置に並列して実行させてもよい。
また、本開示の第10の態様は、画像処理を実行するオブジェクトが有向非循環グラフ形態で複数連結されたオブジェクト群の各オブジェクトにより画像処理を実行する画像処理装置による画像処理方法であって、画像処理の対象となる画像データを複数の分割画像データに分割し、分割画像データに対して行う画像処理である部分処理で、かつ前後の依存関係に応じて処理可能な部分処理を第1演算部が備える複数の演算装置の各々に並列して実行させる制御を行い、第1演算部と非同期に第2演算部が部分処理を実行可能な場合、第2演算部に対する部分処理の実行を指示する実行指示タスクを第1演算部の演算装置において実行した後に、第2演算部における部分処理の終了を検知する終了検知タスクを終了検知タスク管理情報に登録し、終了検知タスク管理情報にアクセスし、第2演算部が部分処理を終了した終了検知タスクの有無を判定する、処理を含む。
また、本開示の第11の態様は、画像処理プログラムであって、コンピュータを本開示の画像処理装置の分割部、制御部、登録部、及び判定部として機能させる。
本開示の第12の態様は、画像処理を実行するオブジェクトが有向非循環グラフ形態で複数連結されたオブジェクト群の各オブジェクトにより画像処理を実行する画像処理装置であって、画像処理の対象となる画像データを複数の分割画像データに分割し、分割画像データに対して行う画像処理である部分処理で、かつ前後の依存関係に応じて処理可能な部分処理を第1演算部が備える複数の演算装置の各々に並列して実行させる制御を行い、第1演算部と非同期に第2演算部が部分処理を実行可能な場合、第2演算部に対する部分処理の実行を指示する実行指示タスクを第1演算部の演算装置において実行した後に、第2演算部における部分処理の終了を検知する終了検知タスクを終了検知タスク管理情報に登録し、終了検知タスク管理情報にアクセスし、第2演算部が部分処理を終了した終了検知タスクの有無を判定するプロセッサを有する。
本開示の上記態様によれば、第2演算部における部分処理の終了の検知をより効率的に行うことにより画像処理を高速化する、画像処理装置、画像処理方法、及び画像処理プログラムを提供できる。
第1例示的実施形態に係る画像処理装置として機能するコンピュータの構成の一例を示すブロック図である。 画像処理DAGの一例を示す概略図である。 画像処理DAGに入出力用のメモリを加えた場合の一例を示す概略図である。 第1例示的実施形態に係る処理制御部の機能的な構成の一例を示すブロック図である。 入力画像の分割処理の一例の説明に供する概略図である。 入力画像の分割処理の一例の説明に供する概略図である。 画像処理モジュールが部分処理に分割された画像処理DAGの一例を示す概略図である。 非同期処理終了検知タスクリストの説明に供する概略図である。 非同期処理終了検知タスクリストの説明に供する概略図である。 非同期処理終了検知タスクリストの判定の説明に供する概略図である。 非同期処理終了検知タスクリストの判定の説明に供する概略図である。 非同期処理終了検知タスクリストの判定の説明に供する概略図である。 第1例示的実施形態に係るDAG構築・実行処理の流れの一例を示すフローチャートである。 第1例示的実施形態に係るタスク格納処理の流れの一例を示すフローチャートである。 第1例示的実施形態に係る画像処理DAG実行処理の説明に供する概略図である。 第1例示的実施形態に係るタスク実行処理の流れの一例を示すフローチャートである。 第1例示的実施形態に係る非同期処理終了検知タスクリスト判定処理の流れを示すフローチャートである。 GPU処理である2つのタスクが連続して行われる場合における処理の流れの一例を示す概略図である。 第1演算部のコアと同期して第2演算部(GPU)が処理を行う場合における処理の流れの一例を示す概略図である。 第1演算部のコアと非同期に第2演算部(GPU)が処理を行う場合における処理の流れの一例を示す概略図である。 第2例示的実施形態に係るタスク実行処理の流れの一例を示すフローチャートである。 第3例示的実施形態に係るタスク実行処理の流れの一例を示すフローチャートである。 第3例示的実施形態に係る画像処理DAG実行処理の説明に供する概略図である。
以下、図面を参照して、本開示を実施するための形態例を詳細に説明する。
[第1例示的実施形態]
まず、図1を参照して、画像処理装置として機能するコンピュータ10の構成を説明する。なお、コンピュータ10は、複写機、プリンタ、ファクシミリ装置、これらの装置の機能を兼ね備えた複合機、及びスキャナ等の内部で画像処理を行う画像取扱機器に組み込まれたコンピュータであってもよい。また、コンピュータ10は、PC(Personal Computer)等の独立したコンピュータであってもよく、PDA(Personal Digital Assistant)及び携帯電話機等の携帯機器に組み込まれたコンピュータであってもよい。
図1に示すように、本例示的実施形態に係るコンピュータ10は、第1演算部12A、第2演算部12B、メモリ14、表示部16、操作部18、記憶部20、画像データ供給部22、及び画像出力部24を備えている。また、第1演算部12A、第2演算部12B、メモリ14、表示部16、操作部18、記憶部20、画像データ供給部22、及び画像出力部24の各部は、バス26を介して互いに接続されている。
本例示的実施形態に係る第1演算部12Aは、コンピュータ10のメイン・プロセッサであり、一例として複数のプロセッサ・コア13(以下、「コア13」という。)を有するCPU(Central Processing Unit)である。以下では、各コア13を区別して説明する場合は、コア13A、コア13Bのように、符号の末尾にアルファベットを付して説明する。本例示的実施形態のコア13が、本開示の演算装置の一例である。
また、本例示的実施形態に係る第2演算部12Bは、一例として内部にローカルメモリ15を有するGPU(Graphics Processing Unit)である。なお、第2演算部12Bは、ローカルメモリ15等の内部メモリを備え、内部メモリに記憶された画像データに対して画像処理を行う演算装置であれば、特に限定されず、例えば、CPUでもよい。また、第2演算部12Bは、第1演算部12Aに内蔵されたGPUでもよい。また、第1演算部12A及び第2演算部12Bは、FPGA(Field Programmable Gate Array)等の演算器でもよい。
メモリ14は、第1演算部12Aが一時的にデータを記憶させる不揮発性の記憶手段である。本例示的実施形態に係る第2演算部12Bにより画像処理を行う場合、第1演算部12Aはメモリ14又は記憶部20の記憶領域に記憶された画像データを第2演算部12Bにバス26を介して転送する。そして、第2演算部12Bは、第1演算部12Aから転送された画像データをローカルメモリ15に記憶し、記憶した画像データに対して画像処理を行う。
コンピュータ10が前述した画像取扱機器に組み込まれている場合、表示部16及び操作部18は、例えば画像取扱機器に設けられたLCD(Liquid Crystal Display)等の表示パネル及びテンキー等が適用される。また、コンピュータ10が独立したコンピュータである場合、表示部16及び操作部18は、例えばコンピュータ10に接続されたディスプレイ、及びキーボード、マウス等が適用される。また、表示部16及び操作部18は、タッチパネル及びディスプレイが一体化して構成されたタッチパネルディスプレイ等でもよい。また、記憶部20は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、及びフラッシュメモリ等の不揮発性の記憶媒体が適用される。
画像データ供給部22は、処理対象の画像データを供給するものであればよく、例えば紙又は写真フィルム等の記録材料に記録されている画像を読み取って画像データを出力する画像読取部が適用される。また、画像データ供給部22は、例えば通信回線を介して外部装置から画像データを受信する受信部、及び画像データを記憶する画像記憶部(メモリ14又は記憶部20)等が適用される。
画像出力部24は、画像処理を経た画像データ又は画像処理を経た画像データが表す画像を出力するものであればよく、例えば画像データが表す画像を紙又は感光材料等の記録材料に記録する画像記録部が適用される。また、画像出力部24は、画像データが表す画像をディスプレイ等に表示する表示部(表示部16)、画像データをCD−ROM(Compact Disk Read Only Memory)等の記録媒体に書き込む書込装置が適用される。また、画像出力部24は、画像処理を経た画像データを、通信回線を介して外部装置に送信する送信部が適用される。また、画像出力部24は、画像処理を経た画像データを記憶する画像記憶部(メモリ14又は記憶部20)であってもよい。
図1に示すように、記憶部20には、第1演算部12A及び第2演算部12Bによって実行される各種プログラムが記憶されている。記憶部20には、各種プログラムとして、リソースの管理、プログラムの実行の管理、及びコンピュータ10と外部装置との通信等を司るオペレーティングシステム30のプログラムが記憶されている。また、記憶部20には、各種プログラムとして、コンピュータ10を画像処理装置として機能させるための画像処理プログラム群34が記憶されている。また、記憶部20には、各種プログラムとして、上記画像処理装置に対して所望の画像処理を行わせる各種のアプリケーションプログラム群32(以下、「アプリケーション32」という。)が記憶されている。
画像処理プログラム群34は、前述した画像取扱機器、携帯機器、及びPC等で実行される画像処理プログラムを開発する際の負荷を軽減することを目的として開発されたプログラムである。また、画像処理プログラム群34は、前述した画像取扱機器、携帯機器、及びPC等の各種機器(プラットフォーム)で共通に実行可能に開発されたプログラムである。
画像処理プログラム群34によって実現される画像処理装置は、アプリケーション32からの構築指示に従い、アプリケーション32が指示した画像処理を行う画像処理DAG(有向非循環グラフ:Directed Acyclic Graph)50A(詳細は後述)を構築する。そして、上記画像処理装置は、アプリケーション32からの実行指示に従い画像処理DAG50Aの処理を実行する。このため、画像処理プログラム群34は、所望の画像処理を行う画像処理DAG50Aの構築を指示したり、構築された画像処理DAG50Aによる画像処理の実行を指示したりするためのインタフェースをアプリケーション32に提供している。
以上の構成により、内部で画像処理を行う必要のある任意の機器を新規に開発する場合等にも、上記画像処理を行うプログラムの開発に関しては、上記任意の機器で必要とされる画像処理を、上記インタフェースを利用して画像処理プログラム群34に行わせるアプリケーション32を開発すればよい。従って、開発者は、実際に画像処理を行うプログラムを新たに開発する必要が無くなり、開発者の負荷が軽減される。
次に、本例示的実施形態に係る画像処理プログラム群34について詳細に説明する。図1に示すように、画像処理プログラム群34は、モジュールライブラリ36、処理構築部42のプログラム、及び処理制御部46のプログラムを含む。
モジュールライブラリ36は、予め定められた互いに異なる画像処理を行う複数種類の画像処理モジュール38のプログラムが各々登録されている。この画像処理としては、例えば、入力処理、フィルタ処理、色変換処理、拡大・縮小処理(図1では「拡縮処理」と表記)、スキュー角検知処理、画像回転処理、画像合成処理、及び出力処理等が挙げられる。
また、モジュールライブラリ36には、画像処理の種類が同一で、かつ実行する画像処理の内容が異なる画像処理モジュール38も登録されている。図1では、この種の画像処理モジュールを「モジュール1」、「モジュール2」と、末尾に数字を付して区別している。例えば、拡大・縮小処理を行う画像処理モジュール38については、入力された画像データを、水平方向及び垂直方向の各方向ともに1画素おきに間引くことで画像の縦横のサイズを50%に縮小する縮小処理を行う画像処理モジュール38が用意されている。さらに、例えば、拡大・縮小処理を行う画像処理モジュール38については、入力された画像データに対して指定された拡大・縮小率で拡大・縮小処理を行う画像処理モジュール38等が用意されている。
また、例えば、色変換処理を行う画像処理モジュール38については、RGB(Red Green Blue)色空間の画像をCMYK(Cyan Magenta Yellow Key-Plate(黒))色空間の画像へ変換する画像処理モジュール38、及びCMYK色空間の画像をRGB色空間の画像へ変換する画像処理モジュール38が用意されている。さらに、例えば、色変換処理を行う画像処理モジュール38については、RGB色空間の画像をYCbCr色空間の画像へ変換する画像処理モジュール38、及びYCbCr色空間の画像をRGB色空間の画像へ変換する画像処理モジュール38等が用意されている。
また、モジュールライブラリ36には、画像データを記憶するための記憶領域(バッファ)を備えたバッファモジュール40も登録されている。
本例示的実施形態に係る処理構築部42は、アプリケーション32からの指示により、DAG形態の画像処理DAG50Aを構築する。画像処理DAG50Aは、一例として図2Aに示すように、1つ以上の画像処理モジュール38が、個々の画像処理モジュール38の前段及び後段の少なくとも一方に配置されたバッファモジュール40を介して連結される。
なお、個々の画像処理モジュール38は、入力画像データに対して画像処理を実行するオブジェクトの一例である。また、図2Aに示す例では、バッファモジュール40を介して前段に画像処理モジュール38が連結された画像処理モジュール38は、前段の画像処理モジュール38による画像処理が終了した場合に、自身の画像処理の実行が可能となることを示している。また、バッファモジュール40を介して前段に複数の画像処理モジュール38が連結された画像処理モジュール38は、前段の複数の画像処理モジュール38の全ての画像処理が終了した場合に、自身の画像処理の実行が可能となることを示している。
また、図2Aでは、各モジュールのみが処理の順に接続されたDAGを示しているが、このDAGが実行される際には、図2Bに示すようにメモリ14に記憶された入力画像データが入力されてDAGに従って画像処理が行われる。そして、最終的にメモリ14に処理済みの出力画像データ等の処理結果が記憶される。
次に、図3を参照して、本例示的実施形態に係る処理制御部46の機能的な構成を説明する。図3に示すように、処理制御部46は、分割部60、制御部62、タスクキュー64、出力部66、登録部67、判定部68、及び非同期処理終了検知タスクリスト(以下、単に「リスト」という)69を備えている。
本実施の形態に係る分割部60は、入力画像データの処理対象とする部分により示される画像を複数の部分領域(以下、「分割画像」という。)に分割する。一例として図4Aに示すように、分割部60は、入力画像データの処理対象とする部分により示される画像Gを、複数(図4Aに示す例では3つ)の分割画像B1〜B3に分割する。なお、以下では分割画像を示す画像データを「分割画像データ」という。また、入力画像データの処理対象とする部分とは、色変換処理のように入力画像全体を処理対象とする画像処理では、入力画像データ全体が処理対象とする部分を意味する。また、入力画像データの処理対象とする部分とは、切り抜き(トリミング)処理のように、入力画像の一部を処理対象とする画像処理では、入力画像の一部を意味する。以下では、錯綜を回避するために、入力画像データの処理対象とする部分を、単に「入力画像データ」という。
また、図4Aに示した例では、分割部60が画像Gを正面視上下に分割しているが、これに限定されない。例えば分割部60は画像Gを正面視左右に分割してもよいし、図4Bに示すように、正面視上下左右に分割してもよい。
なお、分割部60による入力画像データの分割数は特に限定されない。例えば、分割部60は、予め定められた数又はサイズで入力画像データを分割してもよい。また、例えば、分割部60は、画像処理モジュール38による画像処理を実行する演算部が有するプロセッサ・コア数以下で、かつ2以上の数に入力画像データを分割してもよい。
また、例えば、分割部60は、画像処理モジュール38による画像処理を実行する演算部が有するキャッシュメモリの容量以下のサイズで入力画像データを分割してもよい。この場合、例えば、分割部60は、画像処理モジュール38による画像処理を実行する演算部のプロセッサから最も遠いレベルのキャッシュメモリ、所謂LLC(Last Level Cache)の容量以下で、かつLLCの容量に極力一致するサイズで入力画像データを分割する形態が例示される。
本例示的実施形態に係る制御部62は、分割画像データに対応するタスクを複数のコア13に並列に実行させる制御を行う。なお、ここでいう並列とは、依存関係に基づいて実行可能となったタスクが複数のコア13により並列に(同時に)実行されることを意味する。
具体的には、制御部62は、一例として図5に示すように、画像処理DAG50Aの各画像処理モジュール38で実行される画像処理を分割画像データ(分割部60により分割された分割画像データ)の各々に対応する部分処理39に分割して、画像処理DAG50Aを画像処理DAG50Bに更新する。なお、画像処理DAG50Bは、各部分処理39のタスクにおけるDAGを表すものであり、いわゆるタスクDAGである。
なお、図5は、図2Aに示した画像処理DAG50Aにおいて、入力画像データを4つの分割画像データに分割した場合の画像処理DAG50Bを示している。図5では、錯綜を回避するために、バッファモジュール40の図示を省略している。
本例示的実施形態に係る制御部62は、画像処理モジュール38で実行される画像処理の種類に応じて、前段に連結された画像処理モジュール38の部分処理39と、後段に連結された画像処理モジュール38の部分処理39との間で依存関係を付与する。なお、図5では、この依存関係を破線の矢印で示している。
例えば、色変換処理のように、処理対象とする画素のみに対して画像処理を行う処理は、各部分処理39も1対1の依存関係となる。一方、例えば、フィルタ処理のように、処理対象とする画素の周辺画素も必要な画像処理では、周辺画素に対して画像処理を行う前段の部分処理39にも依存関係を付与することとなる。すなわち、この依存関係は、連結された画像処理モジュール38間において、前段に連結された画像処理モジュール38の部分処理39が終了した場合に、後段に連結された画像処理モジュール38の部分処理39が実行可能となる関係である。従って、各部分処理39は、前段に依存関係が付与された部分処理39が存在しない場合か、又は依存関係が付与された前段の全ての部分処理39が終了した場合に実行可能となる。
具体的には、例えば、図5に示す部分処理39A及び部分処理39Bは、画像処理の実行開始時に実行可能となる。また、例えば、図5に示す部分処理39Cは、依存関係が付与された前段の部分処理39A及び部分処理39Bの双方の処理が終了した場合に実行可能となる。
なお、本例示的実施形態においては、分割画像データに対応する部分処理39について、「タスク」と称している。
制御部62は、実行可能となっているタスクを、格納されたタスクを複数のコア13の各々が順次取り出して実行するためのタスクキュー64に格納する。なお、一例として、本例示的実施形態の制御部62は、タスクキュー64に同時に格納するタスクの数を2つ以下としている。
なお、タスクキュー64に同時に格納するタスクの数は、本例示的実施形態に限定されないが、2つ以上であることが好ましい。タスクキュー64にタスクを1つだけ格納する場合に、タスクの実行が完了するまで新たなタスクをタスクキュー64に格納しないとすると、新たなタスクがタスクキュー64に格納されず、複数あるコア13のうち、稼働しないコア13が増加してしまい、コア13の稼働率が低下する。一方、タスクキュー64が同時に格納可能なタスクの数を制限しない場合、タスクキュー64に格納された全てのタスクに対して、前処理(詳細後述)において、メモリが確保されるため、確保されるメモリ容量が多くなってしまう。
そのため、タスクキュー64が同時に格納可能なタスクの数を制限することにより、前処理において確保されるメモリ等のリソースの量が増加するのが抑制される。そのため、タスクキュー64が同時に格納可能なタスクの数は、メモリの容量等に応じて定めてもよいし、コア13の稼働率に応じて可変としてもよい。
本例示的実施形態におけるタスクには、同期タスクと非同期タスクとの2種類がある。同期タスクとは、コア13Aがコア13Bまたは第2演算部12Bに処理の実行を指示すると、コア13Bまたは第2演算部12Bにおける処理が終了するまでコア13Aに制御が戻らないタスクである。一方、非同期タスクとは、コア13Aがコア13Bまたは第2演算部12Bに処理の実行を指示すると、コア13Bまたは第2演算部12Bにおける処理の終了を待たずにコア13Aに制御が戻るタスクである。
制御部62は、タスクキュー64からタスクを取得し、取得したタスクを実行させる。タスクの実行が開始されると、本例示的実施形態では、タスクから処理を終了したか又は継続中かを表す情報が制御部62に出力される。なお、本例示的実施形態に限定されず、例えば、継続中かを表す情報については出力せず、処理を終了したことを表す情報のみを制御部62に出力する形態であってもよい。
タスクが非同期タスクの場合、タスクの実行を開始したばかりのタイミングであるためタスクからは処理が継続中であることを表す情報が出力される。この場合、制御部62は、登録部67を介して、処理が継続中である非同期タスクをリスト69に登録する。本例示的実施形態のリスト69が、本開示の終了検知タスク管理情報の一例である。
リスト69に登録される非同期タスクは、非同期処理の終了を検知するための終了検知タスク(詳細後述)が組み合わされたタスクとされている。以下では、終了検知タスクが組み合わされた非同期タスクを単に「終了検知タスク」という。また、以下では、終了検知タスクにおいて、組み合わされた非同期タスクの処理が継続中である状態のものを「継続中の終了検知タスク」といい、組み合わされた非同期タスクの処理が終了している状態のものを「終了済の終了検知タスク」という。
図6Aは、リスト69の状態の一例を示している。図6Aに示した例では、既に2つの継続中の終了検知タスクTEpがリスト69に登録された状態が模式的に示されている。なお、リスト69において示した実線の矢印は、リストの先頭から末尾へ向かう方向を表している。具体的には、図6A中では、リスト69の左側が先頭であり、矢印の先に当たる右側が末尾になる。
図6Bは、登録部67が、新たな継続中の終了検知タスクTEpを1つ、リスト69に登録する例を模式的に示している。登録部67は、リスト69に終了検知タスクTEpを登録する場合、一例として図6Bに示すように、リスト69の末尾に終了検知タスクTEpを登録する。
一方、タスクが同期タスクの場合、タスクからは処理を終了したことを表す情報が出力される。この場合、制御部62は、タスクキュー64に次のタスクを取得しに行く前に、判定部68でのリスト判定処理(詳細後述)を実行する。
判定部68は、リスト69を先頭から順番に走査し、終了済の終了検知タスクの有無を調べる。判定部68は、終了済の終了検知タスクが有ると判定した場合、判定した終了済の終了検知タスクをリスト69から抜き出すことにより削除してリスト69を更新する。
図7Aは、判定部68がリスト69を先頭から順番に走査し、リスト69中の2番目の終了検知タスクが終了済の終了検知タスクTEfであると判定した状態の例を模式的に示している。図7Bに示すように判定部68は、終了済の終了検知タスクTEfであると判定した場合、判定した終了済の終了検知タスクTEfをリスト69から抜き出すことにより削除してリスト69を更新する。図7Cに示すように続けて判定部68は、次の順番の終了検知タスクが終了済の終了検知タスクTEfであるか否かを判定する。判定部68は、以上の処理をリスト69の末尾まで実行する。
本例示的実施形態に係る出力部66は、制御部62による制御により、画像処理DAG50Bの最終段の画像処理モジュール38により実行された画像処理の結果得られた出力画像データを出力する。本例示的実施形態では、出力部66は、得られた出力画像データにより示される出力画像を表示部16に表示する。なお、出力部66は、出力画像データを外部装置に出力(送信)してもよい。また、コンピュータ10がプリンタに組み込まれている場合は、出力部66は、出力画像データにより示される出力画像を紙等の記録材料に出力(形成)してもよい。
次に、図8〜図13を参照して、本例示的実施形態に係るコンピュータ10の作用を説明する。なお、図8は、アプリケーション32により画像処理の実行開始の指示が入力された場合に第1演算部12Aによって実行されるDAG構築・実行処理の流れの一例を示すフローチャートである。また、DAG構築・実行処理のプログラム(DAG構築・実行処理プログラム)は記憶部20に予めインストールされている。また、第1演算部12Aにおける何らかのタスクを実行していなく、タスクを実行可能なコア13がDAG構築・実行処理プログラムを実行することで、前述した処理構築部42及び制御部62として機能する。
図8のステップ100で、処理構築部42は、アプリケーション32からの構築指示に従い、アプリケーション32が指示した画像処理を行う画像処理DAG50Aを構築する。また、処理構築部42は、画像処理DAG50Aを上述したように画像処理DAG50Bに更新する。
次のステップ102で、制御部62は、ステップ100で構築された画像処理DAG50Bによる画像処理の実行を、第1演算部12A(コア13)及び第2演算部12Bに実行させる画像処理DAG実行処理を実行した後、本DAG構築・実行処理を終了する。
本DAG構築・実行処理を実行することにより、出力部66からアプリケーション32が所望する画像処理の結果が得られる。なお、本例示的実施形態では、本DAG構築・実行処理が終了した場合、制御部62は、処理が完了したことを表す情報、もしくは、処理中に何らかのエラーが生じた場合、その旨を表す情報をアプリケーション32へ通知する。
次に、上記DAG構築・実行処理のステップ102における画像処理DAG実行処理について詳細に説明する。本例示的実施形態のDAG構築・実行処理には、画像処理DAG50Bの実行可能なタスクをタスクキュー64に格納するタスク格納処理と、タスクキュー64に格納されているタスクを実行するタスク実行処理と、2つの処理が含まれる。
まず、図9を参照してタスク格納処理について説明する。図9は、タスク格納処理の流れの一例を示すフローチャートである。本例示的実施形態では、タスク格納処理のプログラム(タスク格納処理プログラム)は、DAG構築・実行処理プログラムの一部、または別のいわゆるサブプログラム等として記憶部20に予めインストールされている。
第1演算部12Aにおける何らかのタスクを実行していなく、タスクを実行可能なコア13がタスク格納処理プログラムを実行することで、制御部62として機能し、図9に示したタスク格納処理を実行する。
図9のステップ110で制御部62は、タスクキュー64に、実行可能なタスクが格納されているか否かを判定する。本例示的実施形態では、タスクキュー64に格納されている実行可能なタスクが2以上の場合、ステップ110の判定が肯定判定となりステップ114へ移行する。
一方、タスクキュー64に格納されている実行可能なタスクが2つ未満の場合、ステップ110の判定が否定判定となりステップ112へ移行する。
ステップ112で制御部62は、画像処理DAG50Bから実行可能なタスクを見つけ出してタスクキュー64に格納する。図10に示した例では、制御部62が、画像処理DAG50Bの実行可能な同期タスクTを、既に実行可能な非同期タスクTが格納されているタスクキュー64に格納した状態を示している。
なお、タスクを格納する場合、上述したように、タスクキュー64に格納されているタスクの数が2以下であればよく、本ステップにおいて制御部62がタスクキュー64に同時に格納させるタスクの数は1つでもよいし、2つでもよい。具体的には、タスクキュー64にタスクが格納されていない場合、制御部62は、タスクキュー64にタスクを1つもしくは2つ格納すればよいし、タスクキュー64にタスクが1つ格納されている場合、制御部62は、タスクキュー64にタスクを1つ格納すればよい。制御部62が、本ステップにおいてタスクキュー64に同時に格納させるタスクの数をいずれとするかは、予め定めておいてもよいし、各コア13におけるタスク処理の進行に応じて可変としてもよい。
次のステップ114で制御部62は、画像処理DAG50Bの全タスクをタスクキュー64に格納したか否かを判定する。未だタスクキュー64に格納していないタスクが有る場合、ステップ114の判定が否定判定となりステップ110に戻り本タスク格納処理を繰り返す。一方、全てのタスクをタスクキュー64に格納した場合、ステップ114の判定が肯定判定となり本タスク格納処理を終了する。
次に、図11を参照してタスク実行処理について説明する。図11は、タスク実行処理の流れの一例を示すフローチャートである。本例示的実施形態では、タスク実行処理のプログラム(タスク実行処理プログラム)は、DAG構築・実行処理プログラムの一部、または別のいわゆるサブプログラム等として記憶部20に予めインストールされている。
第1演算部12Aにおける何らかのタスクを実行していなく、タスクを実行可能なコア13の各々がタスク実行処理プログラムを実行することで、制御部62、登録部67、及び判定部68として機能し、図11に示したタスク実行処理を実行する。なお、本例示的実施形態では、上記タスク格納処理及びタスク実行処理を異なるコア13で実行することにより、タスク格納処理及びタスク実行処理が並列に実行される。
図11のステップ120で制御部62は、タスクキュー64からタスクを取得する。
次のステップ122で制御部62は、タスクの実行において予め定められた前処理を実行する。本ステップにおいて実行する前処理は画像処理前に行っておくことが予め定められている処理であり、特に限定されないが、例えば、画像処理結果を格納するための出力バッファ領域の確保や画像処理用の変数の初期化等の演算用のリソースの確保を行う処理である。
次のステップ124で制御部62は、上記ステップ120で取得したタスクを、第1演算部12Aのコア13または第2演算部12Bに実行させる。なお、第2演算部12Bにタスクを実行させる場合、第1演算部12Aのコア13が、第2演算部12Bにタスクを実行させる処理を行うことにより、第2演算部12Bによりタスクが実行される。本例示的実施形態の第2演算部12Bに実行させるタスクが、本開示の実行指示タスクの一例である。
なお、タスクが第2演算部12Bで実行するタスクであるか否かを表す情報は、上記DAG構築・実行処理のステップ100(図8参照)で処理構築部42が画像処理DAG50Aから画像処理DAG50Bを生成する処理において付与される。
次のステップ126で制御部62は、上記ステップ124で実行したタスクが終了した(終了済)であるか否かを判定する。
タスクが第2演算部12Bで実行されるタスクの場合(図10の矢印(a)参照)、高速に処理を行うため、一般的に処理に必要なデータ(画像データ)は第2演算部12Bのローカルメモリ15に転送して処理される。以下では、第2演算部12BがGPUである場合を具体例として説明する。一例として、図13Aに示すように、GPU処理であるタスクT1、T2が連続して行われる場合、図13Bに一例を示すように、タスクT1の実行前にメモリ14から第2演算部12Bのローカルメモリ15への転送処理、及びタスクT2の実行後にローカルメモリ15からメモリ14への処理結果の転送処理が行われる。
上述したように、コア13がタスクを実行してCPUに指示することによりGPUが起動及び制御され、GPUによりタスクが実行される。図13Bに一例を示した同期処理(GPUにおける処理が終了するまでコア13に制御が戻らない処理)の場合、通常のCPUにより実行されるタスクと同じように構成されるが、図13BにおけるGPU処理1とGPU処理2との間、コア13は処理が終了するまで待機状態となりコア13の稼働において無駄が生じる。
図13Cに一例を示した非同期処理(コア13がGPUに処理の実行を指示すると処理の終了を待たずに、コア13側に制御が戻る処理)の場合、コア13はGPU処理1及びGPU処理2と並行して別のタスクが実行可能であるため稼働率が向上される。
なお、非同期処理の場合、GPUにより実行されるタスク(図13Cでは、タスクT1、T2)の終了の検知を行う必要がある。そのため、図13Cに示すように、GPUへの転送、処理、及びGPUからの処理結果の転送の各々(タスクT0〜T3)を非同期で処理するための指示をコア13が行う。そして、コア13側に制御が戻ると、コア13は、GPUにおけるタスクの終了を検知する終了検知タスクT4を実行する。
この場合、ステップS124が実行されたタイミングでは、処理が終了済となることは、殆どない。処理が終了済ではない場合、ステップ126の判定が否定判定となり、ステップ128へ移行する。
ステップ128で制御部62は、登録部67によりリスト69の末尾に終了検知タスクT4を登録させた後、本タスク実行処理を終了する。
図10に示した例では、既に2つの終了検知タスクTEp、TEfが登録されているリスト69の末尾に、非同期タスクTを第2演算部12Bに実行させたコア13Aが、その終了検知タスクTEpを登録した状態を示している(矢印(b)参照)。
一方、タスクが第1演算部12Aで実行されるタスクの場合(図10の矢印(c)参照)、コア13において同期処理で実行が行われ、同期処理が終了するまで制御部62に制御が戻らない。従って制御部62に制御が戻った後のステップ126の判定では同期処理が終了済となっているため、ステップ126の判定が肯定判定となり、ステップ130へ移行する。
ステップ130で制御部62は、後処理を行う。本ステップにおいて実行する後処理はタスクに対応する部分処理の後に行うことが予め定められている処理であり、特に限定されないが、例えば、上記ステップ122の処理において確保した演算用のリソースの解放等を行う処理である。
次のステップ132で制御部62は、処理構築部42にタスクの完了通知を行う。タスクの完了通知を受け取った処理構築部42は、画像処理DAG50Bの依存関係を更新する。このように、画像処理DAG50Bの依存関係が更新されると、上述したタスク格納処理(図9参照)において処理構築部42は、更新された依存関係に基づいて、実行可能なタスクを判定する。
次のステップ134で制御部62は、リスト69に登録された終了検知タスクに対する判定を行うリスト判定処理を判定部68に実行させた後、本タスク実行処理を終了する。
次に、図12を参照して、上記タスク実行処理(図11参照)のステップ134のリスト判定処理について詳細に説明する。図12は、リスト判定処理の流れの一例を示すフローチャートである。
ステップ150で判定部68は、リスト69の先頭に登録されている終了検知タスクを取得する。
次のステップ152で判定部68は、終了検知タスクの取得が成功したか否かを判定する。リスト69が空であり、終了検知タスクを取得できなかった場合、ステップ152の判定が否定判定となり、本リスト判定処理を終了する。
一方、終了検知タスクを取得できた場合、ステップ152の判定が肯定判定となり、ステップ154へ移行する。
ステップ154で判定部68は、取得した終了検知タスクに対応する非同期処理が終了済であるか否かを判定する。非同期処理が継続しており、終了検知タスクにより非同期処理の終了を未だ検知していない場合、例えば図10に示した例では判定部68が取得した終了検知タスクが終了検知タスクTEpである場合、ステップ154の判定が否定判定となり、ステップ162へ移行する。ステップ162で判定部68は、リスト69から次に登録されている終了検知タスクを取得して、ステップ152の処理に戻る。
一方、非同期処理が終了済であり、対応する終了検知タスクにより非同期処理の終了を検知した場合、例えば図10に示した例では判定部68が取得した終了検知タスクが終了検知タスクTEfである場合、ステップ154の判定が肯定判定となり、ステップ156へ移行する。
ステップ156で判定部68は、終了済である終了検知タスクをリスト69から抜き出して削除する(図7Bも参照)。
次のステップ158で判定部68は、上述したタスク実行処理(図11参照)のステップ130と同様に後処理を行う。さらに次のステップ160で判定部68は、上述したタスク実行処理のステップ132と同様に、処理構築部42にタスクの完了通知を行う。
次のステップ162で判定部68は、リスト69から次に登録されている終了検知タスクを取得して、ステップ152の処理に戻る。
すなわち、制御部62は、リスト69を先頭から末尾まで順番に走査し、終了検知タスクの各々について、組み合わされている非同期処理を終了したか否かの判定を実行する。図10の矢印(d)は、同期タスクTsの処理を終了したコア13Bが、2番目に登録されている終了検知タスクが、終了済の終了検知タスクTEfである状態のリスト69を先頭から順番に走査する場合を例示している。
このように本例示的実施形態では、第2演算部12Bに非同期タスクの処理の実行を指示し、かつタスクの実行が終了していないコア13は、リスト69に終了検知タスクを登録する。また、タスクの実行が終了したコア13は、リスト判定処理を行って、終了済みの終了検知タスクをリスト69から削除し、さらに対応する非同期タスクの後処理を行って処理構築部42にタスクの完了通知を行う。
本例示的実施形態では、終了検知タスクの管理をリスト69により行うため、第2演算部12Bで実行される非同期タスクの終了の検知を効率的に行うことができる。これにより、本例示的実施形態では、第2演算部12Bを効率的に稼働させることができ、スケーラビリティを高めた並列処理を実現することができる。
なお、リスト69に終了検知タスクが登録されているにもかかわらず、タスク格納処理(図9参照)によりタスクキュー64に格納されたタスクがなくなった場合、リスト69に登録されている終了検知タスクをタスクキュー64に格納するとよい。これにより、コア13が待機状態になり、デッドロックしてしまうのを抑制することができる。
なお、本例示的実施形態において、上述した画像処理DAG50Bの更新やタスクキュー64へのタスクの格納、及びタスクキュー64からタスクの取り出しの各々の処理は、排他制御しながら行う必要があることは言うまでもない。
[第2例示的実施形態]
本例示的実施形態では、終了検知タスクの登録、判定のための走査、及び削除の各々を行うためのリスト69へのアクセスを、錯綜を回避するために排他制御する形態について説明する。なお、上記第1例示的実施形態と同様の構成及び動作については、その旨を記載し、詳細な説明を省略する。
本例示的実施形態のコンピュータ10の構成は第1例示的実施形態のコンピュータ10の構成(図1及び3参照)と同様であるため、詳細な説明を省略する。
本例示的実施形態では、コンピュータ10が実行するDAG構築・実行処理(図8参照)におけるタスク格納処理は第1例示的実施形態のタスク格納処理(図9参照)と同様であるため説明を省略する。一方、タスク実行処理は、第1例示的実施形態のタスク実行処理(図11参照)と異なる処理を含むため、以下では、本例示的実施形態におけるタスク実行処理について詳細に説明する。
図14は、本例示的実施形態のタスク実行処理の流れの一例を示すフローチャートである。図14に示すように本例示的実施形態のタスク実行処理は、ステップ126とステップ128との間にステップ127A及び127Bの処理を含み、ステップ128の後にステップ129の処理を含む点で、第1例示的実施形態のタスク実行処理(図11参照)と異なっている。
本例示的実施形態ではステップ126で否定判定となった場合、ステップ127Aに移行する。ステップ127Aで制御部62は、リスト69のアクセスに対する排他制御のロックを取得できたか否かを判定する。ロックが取得できるまでステップ127Aの判定が否定判定となり、ロックが取得できるとステップ127Aの判定が肯定判定となりステップ127Bへ移行する。
ステップ127Bで制御部62は、上述した第1例示的実施形態のタスク実行処理のステップ134と同様に、判定部68によりリスト判定処理を行った後、ステップ128に移行する。ステップ128で上述したように、登録部67によりリスト69の末尾に終了検知タスクを登録させた後、ステップ129へ移行する。
ステップ129で制御部62は、取得したロックを解放した後、本タスク実行処理を終了する。
また、図14に示すように本例示的実施形態のタスク実行処理は、ステップ132とステップ134との間にステップ133の処理を含み、ステップ134の処理の後にステップ135の処理を含む点で、第1例示的実施形態のタスク実行処理(図11参照)と異なっている。
ステップ133で制御部62は、リスト69のアクセスに対する排他制御のロックを取得できたか否かを判定する。ロックが取得できなかった場合、ステップ133の判定が否定判定となり、本タスク実行処理を終了する。一方、ロックが取得できた場合、ステップ133の判定が肯定判定となりステップ134へ移行する。
また、ステップ135で制御部62は、取得したロックを解放した後、本タスク実行処理を終了する。
このように本例示的実施形態のコンピュータ10では、リスト69に終了検知タスクを登録するコア13は、リスト69に対するアクセスのロックが取得できるまで待機状態となり、ロックが取得できるとリスト判定処理を行った後、リスト69に終了検知タスクを登録する。また、タスクの完了通知を受け取ったコア13は、リスト69に対するアクセスのロックが取得できた場合、リスト判定処理を行い、ロックが取得できない場合、リスト判定処理を行わない。
本例示的実施形態と異なり、リスト69へのアクセスを単に排他制御した場合、リスト判定処理を実行するコア13が複数有り、コア13の各々がリスト69にアクセスするタイミングが重なると、1つのコア13がリスト69にアクセスしている間、他のコア13がブロックされてしまう。この場合、ブロックされるコア13の稼働に無駄が生じる。リスト69に対するアクセスのロックを取得したコア13がリスト判定処理によりリスト69内の全ての終了検知タスクを走査するため、他のコア13によるリスト判定処理は行わなくてよい。
そこで、本例示的実施形態では、ロックが取得できなかったコア13は、リスト判定処理を行わないことで、処理を効率化し、コア13の稼働の無駄を抑制することができる。
また、終了検知タスクの登録を行うコア13がリスト69へのロックを取得している間、リスト判定処理を行うコア13はブロックされてしまう。本例示的実施形態と異なり、リスト判定処理を行うコア13のブロックのみを行うと、終了済みの終了検知タスクの判定が遅れてしまい、第2演算部12Bに新たに非同期タスクを行わせることができなくなり、第2演算部12Bの稼働に無駄が生じる。
そこで、本例示的実施形態では、終了検知タスクの登録を行うコア13がリスト69へのロックを取得した場合、リスト判定処理も行うことで、終了済みの終了検知タスクの判定をより効率的に行うことができる。これにより、本例示的実施形態では、第2演算部12Bをより効率的に稼働させることができ、スケーラビリティを高めた並列処理を実現することができる。
[第3例示的実施形態]
本例示的実施形態では、リスト判定処理を1つのタスクとして扱う形態について説明する。なお、上記第1例示的実施形態と同様の構成及び動作については、その旨を記載し、詳細な説明を省略する。
本例示的実施形態のコンピュータ10の構成は第1例示的実施形態のコンピュータ10の構成(図1及び3参照)と同様であるため、詳細な説明を省略する。
本例示的実施形態では、コンピュータ10が実行するDAG構築・実行処理(図8参照)におけるタスク格納処理は第1例示的実施形態のタスク格納処理(図9参照)と同様であるため説明を省略する。一方、タスク実行処理は、第1例示的実施形態のタスク実行処理(図11参照)と異なる処理を含むため、以下では、本例示的実施形態におけるタスク実行処理について詳細に説明する。
図15は、本例示的実施形態のタスク実行処理の流れの一例を示すフローチャートである。図15に示すように本例示的実施形態のタスク実行処理は、ステップ128の後にステップ139の処理を含む点で、第1例示的実施形態のタスク実行処理(図11参照)と異なっている。
終了検知タスクをリスト69に登録した後、ステップ139で制御部62は、リスト判定処理を行わせるための判定タスクをタスクキュー64に格納した後、本タスク実行処理を終了する。図16に示して例では、リスト69に終了検知タスクTEp格納したコア13Aが、タスクキュー64に判定タスクTを格納する状態を示している(矢印(e)参照)。
また、図15に示すように本例示的実施形態のタスク実行処理は、ステップ120とステップ122との間にステップ121の処理を含む点、及びステップ134の処理を実行するタイミングが第1例示的実施形態のタスク実行処理(図11参照)と異なっている。
ステップ121で制御部62は、取得したタスクが判定タスクであるか否かを判定する。取得したタスクが判定タスクではない場合、ステップ121の判定が否定判定となり、ステップ122へ移行する。一方、取得したタスクが判定タスクである場合、ステップ121の判定が肯定判定となり、ステップ134移行し、リスト判定処理を実行した後、本タスク実行処理を終了する。なお、本例示的実施形態では、ステップ132で処理構築部42にタスクの完了通知を行った後、本タスク実行処理を終了する。
このように本例示的実施形態では、リスト判定処理を行うための判定タスクをタスクキュー64に格納することにより、リスト判定処理を行うタイミングをコア13がタスクキュー64から判定タスクを取得したタイミングとしている。
本例示的実施形態の場合においても、複数の終了検知タスクを一括してリスト69により管理し、一度のリスト判定処理の実行により、リスト69に登録されている全ての終了検知タスクについて、終了済みの終了検知タスクであるか否かを判定している。そのため、例えば、個々の終了検知タスクをタスクキュー64に格納する場合に比べて、終了済みの終了検知タスクの判定を効率的に行うことができる。これにより、本例示的実施形態では、第2演算部12Bを効率的に稼働させることができ、スケーラビリティを高めた並列処理を実現することができる。
以上説明したように、上記各例示的実施形態のコンピュータ10は、画像処理を実行するオブジェクトが有向非循環グラフ形態で複数連結されたオブジェクト群の各オブジェクトにより画像処理を実行するコンピュータ10であって、画像処理の対象となる画像データを複数の分割画像データに分割する分割部60と、分割画像データに対して行う画像処理であるタスクで、かつ前後の依存関係に応じて処理可能なタスクを第1演算部12Aが備える複数のコア13の各々に並列して実行させる制御を行う制御部62と、第1演算部12Aと非同期に第2演算部12Bがタスクを実行可能な場合、第2演算部12Bに対するタスクの実行を指示する実行指示タスクを第1演算部12Aのコア13において実行した後に、第2演算部12Bにおけるタスクの終了を検知する終了検知タスクをリスト69に登録する登録部67と、リスト69にアクセスし、第2演算部12Bがタスクを終了した終了検知タスクの有無を判定する判定部68と、を備える。
このように上記各例示的実施形態では、第2演算部12Bに非同期タスクの処理の実行を指示したコア13は、リスト69に終了検知タスクを登録する。また、コア13は、リスト判定処理により終了済みの終了検知タスクをリスト69から削除し、処理構築部42にタスクの完了通知を行う。
これに対して上記各例示的実施形態と異なり、終了検知タスクをタスクキュー64に格納する場合、終了検知タスクの前に格納されている他のタスクの実行が終了し、終了検知タスクがタスクキュー64から取得されるまでタスクの実行が終了しているにもかかわらず、第2演算部12Bに新たにタスクを行わせることができない。そのため、第2演算部12Bを十分に稼働させることができず、画像処理の処理効率が低下する。
一方、上記各例示的実施形態では、複数の終了検知タスクの管理をリスト69により行うため、第2演算部12Bで実行される非同期タスクの終了の検知を効率的に行うことができる。これにより、上記各例示的実施形態では、第2演算部12Bを効率的に稼働させることができ、スケーラビリティを高めた並列処理を実現することができる。
従って、上記各例示的実施形態のコンピュータ10によれば、第2演算部12Bにおけるタスクの終了の検知をより効率的に行うことにより画像処理を高速化することができる。
なお、上記各例示的実施形態では、第2演算部12Bがコンピュータ10内部に備えられている場合について説明したが、第2演算部12Bは、コンピュータ10の外部に設けられていてもよいし、コンピュータ10と異なるコンピュータに備えられていてもよい。
また、上記各例示的実施形態では、各種プログラムが記憶部20に予め記憶(インストール)されている態様を説明したが、これに限定されない。各種プログラムは、CD−ROM、DVD−ROM(Digital Versatile Disk Read Only Memory)、USB(Universal Serial Bus)メモリ等の記録媒体に記録された形態で提供されてもよい。また、各種プログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
日本出願特願2017−165510の開示は、その全体が参照により本明細書に取り込まれる。
本明細書に記載された全ての文献、特許出願、および技術規格は、個々の文献、特許出願、および技術規格が参照により取り込まれることが具体的かつ個々に記された場合と同程度に、本明細書中に参照により取り込まれる。

Claims (13)

  1. 画像処理を実行するオブジェクトが有向非循環グラフ形態で複数連結されたオブジェクト群の各オブジェクトにより画像処理を実行する画像処理装置であって、
    前記画像処理の対象となる画像データを複数の分割画像データに分割する分割部と、
    前記分割画像データに対して行う画像処理であって前記オブジェクトに1つ以上含まれる部分処理で、かつ前後の依存関係に応じて処理可能な部分処理を第1演算部が備える複数の演算装置の各々に並列して実行させる制御を行う制御部と、
    前記第1演算部と非同期に実行され、処理の終了を検知する終了検知タスクが対応付けられた非同期処理である前記部分処理を第2演算部が実行可能な場合、前記第2演算部に対する前記部分処理の実行を指示する実行指示タスクを前記第1演算部の演算装置において実行した後に、実行を指示した前記部分処理に対応付けられている終了検知タスクを終了検知タスク管理情報に登録する登録部と、
    前記終了検知タスク管理情報にアクセスし、登録されている終了検知タスクを実行し、前記第2演算部が前記部分処理を終了した前記部分処理に対応付けられている前記終了検知タスクの有無を判定する判定部と、
    を備え
    前記非同期処理である前記部分処理は、前記第2演算部に対する前記部分処理の実行を指示する実行指示タスクを前記第1演算部の演算装置において実行した後に、前記第2演算部における前記部分処理の終了を待たずに前記第1演算部の演算装置に当該演算装置の制御が戻る部分処理である、画像処理装置。
  2. 前記演算装置は、前記部分処理の実行後に前記判定部として動作する、請求項1に記載の画像処理装置。
  3. 前記演算装置は、前記判定部として前記終了検知タスクの有無の判定の終了後、再び前記制御部の制御により他の部分処理を実行する、請求項2に記載の画像処理装置。
  4. 前記演算装置は、前記登録部として動作する、請求項1から請求項3のいずれか1項に記載の画像処理装置。
  5. 前記演算装置は、前記登録部としての動作と前記判定部としての動作とを連続して行う、請求項1から請求項4のいずれか1項に記載の画像処理装置。
  6. 前記制御部は、前記判定部として動作させるための判定タスクを前記演算装置に実行させる、請求項1に記載の画像処理装置。
  7. 前記登録部及び前記判定部の前記終了検知タスク管理情報へのアクセスは排他制御されている、請求項1から請求項6のいずれか1項に記載の画像処理装置。
  8. 前記判定部は、前記第2演算部が前記部分処理を終了した前記終了検知タスクを前記終了検知タスク管理情報から削除する、請求項1から請求項7のいずれか1項に記載の画像処理装置。
  9. 前記制御部は、タスクキューに格納された前記部分処理を順次取り出して前記複数の演算装置に並列して実行させる、請求項1から請求項8のいずれか1項に記載の画像処理装置。
  10. 前記非同期処理である部分処理と、前記終了検知タスクとが1対1で対応付けられる、請求項1から請求項9のいずれか一項に記載の画像処理装置。
  11. 画像処理を実行するオブジェクトが有向非循環グラフ形態で複数連結されたオブジェクト群の各オブジェクトにより画像処理を実行する画像処理装置による画像処理方法であって、
    前記画像処理の対象となる画像データを複数の分割画像データに分割し、
    前記分割画像データに対して行う画像処理であって前記オブジェクトに1つ以上含まれる部分処理で、かつ前後の依存関係に応じて処理可能な部分処理を第1演算部が備える複数の演算装置の各々に並列して実行させる制御を行い、
    前記第1演算部と非同期に実行され、処理の終了を検知する終了検知タスクが対応付けられた非同期処理である前記部分処理を第2演算部が実行可能な場合、前記第2演算部に対する前記部分処理の実行を指示する実行指示タスクを前記第1演算部の演算装置において実行した後に、実行を指示した前記部分処理に対応付けられている終了検知タスクを終了検知タスク管理情報に登録し、
    前記終了検知タスク管理情報にアクセスし、登録されている終了検知タスクを実行し、前記第2演算部が前記部分処理を終了した前記部分処理に対応付けられている前記終了検知タスクの有無を判定する、
    処理を含み、
    前記非同期処理である前記部分処理は、前記第2演算部に対する前記部分処理の実行を指示する実行指示タスクを前記第1演算部の演算装置において実行した後に、前記第2演算部における前記部分処理の終了を待たずに前記第1演算部の演算装置に当該演算装置の制御が戻る制御が戻る部分処理である、画像処理方法。
  12. 前記非同期処理である部分処理と、前記終了検知タスクとが1対1で対応付けられる、請求項11に記載の画像処理方法。
  13. コンピュータを、請求項1から請求項10のいずれか1項に記載の画像処理装置の分割部、制御部、登録部、及び判定部として機能させるための画像処理プログラム。
JP2019539104A 2017-08-30 2018-07-31 画像処理装置、画像処理方法、及び画像処理プログラム Active JP6945634B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017165510 2017-08-30
JP2017165510 2017-08-30
PCT/JP2018/028743 WO2019044340A1 (ja) 2017-08-30 2018-07-31 画像処理装置、画像処理方法、及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JPWO2019044340A1 JPWO2019044340A1 (ja) 2020-10-29
JP6945634B2 true JP6945634B2 (ja) 2021-10-06

Family

ID=65527284

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019539104A Active JP6945634B2 (ja) 2017-08-30 2018-07-31 画像処理装置、画像処理方法、及び画像処理プログラム

Country Status (4)

Country Link
US (1) US11257178B2 (ja)
JP (1) JP6945634B2 (ja)
CN (1) CN111052084B (ja)
WO (1) WO2019044340A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10861126B1 (en) * 2019-06-21 2020-12-08 Intel Corporation Asynchronous execution mechanism
DE102020117505A1 (de) * 2019-07-27 2021-01-28 Analog Devices International Unlimited Company Autonomes system zum einreihen von jobs in eine warteschlange für hardware -beschleuniger
US11397612B2 (en) 2019-07-27 2022-07-26 Analog Devices International Unlimited Company Autonomous job queueing system for hardware accelerators

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03246746A (ja) * 1990-02-26 1991-11-05 Hitachi Ltd 並列実行方法およびコンパイラおよび並列プロセススケジュール支援ツール
JP2956201B2 (ja) * 1990-11-06 1999-10-04 日本電信電話株式会社 画像信号のタスク分割並列処理方法
JP2003263331A (ja) * 2002-03-07 2003-09-19 Toshiba Corp マルチプロセッサシステム
JP2004030321A (ja) 2002-06-26 2004-01-29 Mitsubishi Heavy Ind Ltd 3d―cad図面干渉確認方法および3d―cad図面干渉確認システム
US8310491B2 (en) * 2007-06-07 2012-11-13 Apple Inc. Asynchronous notifications for concurrent graphics operations
JP4964219B2 (ja) * 2008-12-16 2012-06-27 富士フイルム株式会社 画像処理装置、方法及びプログラム
JP5479519B2 (ja) * 2012-03-30 2014-04-23 富士フイルム株式会社 画像処理装置、方法及びプログラム
US9588804B2 (en) * 2014-01-21 2017-03-07 Qualcomm Incorporated System and method for synchronous task dispatch in a portable device
US10026145B2 (en) * 2016-12-13 2018-07-17 Qualcomm Incorporated Resource sharing on shader processor of GPU

Also Published As

Publication number Publication date
CN111052084B (zh) 2023-10-17
JPWO2019044340A1 (ja) 2020-10-29
US20200202482A1 (en) 2020-06-25
US11257178B2 (en) 2022-02-22
CN111052084A (zh) 2020-04-21
WO2019044340A1 (ja) 2019-03-07

Similar Documents

Publication Publication Date Title
JP6632709B2 (ja) 画像処理装置、画像処理方法、及び画像処理プログラム
JP6945634B2 (ja) 画像処理装置、画像処理方法、及び画像処理プログラム
US10949942B2 (en) Image processing apparatus, image processing method, and image processing program
JP6648257B2 (ja) 画像処理装置、画像処理方法、及び画像処理プログラム
US10878526B2 (en) Image processing apparatus, image processing method, and image processing program
US11315212B2 (en) Image processing apparatus, image processing method, and computer readable medium for executing partial processes on image-section data items
US11341599B2 (en) Image processing apparatus, image processing method, and computer readable medium storing image processing program
JP7039424B2 (ja) 画像処理装置、画像処理方法、及び画像処理プログラム
JP6600077B2 (ja) 画像処理装置、画像処理方法、及び画像処理プログラム

Legal Events

Date Code Title Description
A529 Written submission of copy of amendment under section 34 (pct)

Free format text: JAPANESE INTERMEDIATE CODE: A5211

Effective date: 20200221

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210420

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210621

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210907

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210914

R150 Certificate of patent or registration of utility model

Ref document number: 6945634

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150