JP5452335B2 - 並列処理装置 - Google Patents

並列処理装置 Download PDF

Info

Publication number
JP5452335B2
JP5452335B2 JP2010093851A JP2010093851A JP5452335B2 JP 5452335 B2 JP5452335 B2 JP 5452335B2 JP 2010093851 A JP2010093851 A JP 2010093851A JP 2010093851 A JP2010093851 A JP 2010093851A JP 5452335 B2 JP5452335 B2 JP 5452335B2
Authority
JP
Japan
Prior art keywords
time
processor
data
calculation
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010093851A
Other languages
English (en)
Other versions
JP2010277579A (ja
Inventor
裕幸 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2010093851A priority Critical patent/JP5452335B2/ja
Publication of JP2010277579A publication Critical patent/JP2010277579A/ja
Application granted granted Critical
Publication of JP5452335B2 publication Critical patent/JP5452335B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Multi Processors (AREA)

Description

この発明は、連続して入力されるデータに対して並列に演算を行う並列処理装置に関し、特に、レーダ装置のように、連続して受信される信号に対して並列に処理する並列信号処理装置に関する。
複数のプロセッサを用いて並列に演算を行う並列処理装置においては、並列に演算する処理単位の大きさ、すなわち粒度が小さいと、単位時間当たりの並列に処理する粒の数が多くなるので、並列処理のための制御や通信に裂く時間の割合が実際の演算時間に比べて大きくなる。そのため、粒度をある程度の大きさにしないと、並列処理のための制御や通信のオーバヘッドが大きくなり、処理効率が悪くなる。また、単位時間当たりの並列に処理する粒の数が多くなるので、処理に必要なプロセッサの数が多くなってしまう。
パルスの送信と受信を複数回繰り返したものをビームと呼び、これを1塊として処理するレーダ信号処理では、ビーム毎の信号処理は独立しているので、ビーム単位で並列に演算可能である。このビームには、パルス数やセンシングする距離等の大小により、信号処理時間のかかるものから瞬時に処理が完了するものまである。従って、ビームをそのまま並列処理の単位とすると、粒度として小さ過ぎる場合があり、並列制御のオーバヘッドが大きくなり、並列処理の効果が出ないことがある。また、必要なプロセッサの数が多くなる。
これを解決するには、複数のビームを束ねて、並列処理の単位とすることが考えられる。すなわち、連続する複数のビームの処理を同じプロセッサに割り付けるようにする。また、従来の並列信号処理装置として、各プロセッサへのビーム処理の割り付けの際に、高負荷演算を1つ、低負荷演算を複数個割り付けるようにすることで、プロセッサの使用効率を上げ、装置規模を抑えるものがある(例えば、特許文献1参照)。
特開2008−128785号公報
レーダの信号処理は、いわゆるリアルタイムシステムであり、後段の処理に処理結果を渡すために、ある制限時間内に信号処理を完了する必要がある。従って、多くのビームを束ね過ぎると、この制限時間内に信号処理が完了しなくなってしまう危険性が出てくるという問題がある。
また、束ねるビームの数を多くすると、並列粒度が大きくなるので、プロセッサが何も処理していないアイドル状態が多く発生するという問題がある。
逆に、それらの問題を避けるために、束ねるビームの数を少なくすると、並列に処理する単位の数が増えるので、多くのプロセッサが必要になるという問題がある。
この発明の目的は、リアルタイムシステムにおいて、制限時間内に処理が完了する範囲内で、できるだけ並列に処理する粒度を大きくすることで必要なプロセッサ台数を少なくし、更にアイドル状態のプロセッサを少なくすることでプロセッサの使用効率を上げて、装置規模を抑えることができる並列処理装置を提供することである。
この発明に係る並列処理装置は、処理単位に区切られたデータが連続して入力され、当該データに対する演算を複数のプロセッサを用いて処理する並列処理装置において、データ入力の際に示される情報を用いてデータの受信時間、演算時間、演算結果の送信時間を算出し、算出結果に従ってデータの演算処理をプロセッサに割り付けるスケジューラと、前記データを割り付けられたプロセッサに転送するデータ転送手段とを備え、前記スケジューラは、それぞれのデータの受信開始から演算結果の送信完了までの時間が予め指定された時間を越えない場合は、それらのデータの演算を同一のプロセッサで処理するように割り付け、予め指定された時間を超える場合、データは別プロセッサで処理するように割り付けることを特徴とする。
この発明によれば、制限時間内に処理が完了する範囲内で、できるだけ並列に処理する粒度を大きくすることで必要なプロセッサ台数を少なくし、更にアイドル状態のプロセッサを少なくすることでプロセッサの使用効率を上げて、装置規模を抑えることができる。
この発明の実施の形態1〜5に係る並列処理装置の構成図である。 この発明の実施の形態1に係る並列処理装置において1つ目のビームをプロセッサに割り付けようとしている時点のタイムチャートである。 この発明の実施の形態1に係る並列処理装置において2つ目のビームをプロセッサに割り付けようとしている時点のタイムチャートである。 この発明の実施の形態1に係る並列処理装置において3つ目のビームをプロセッサに割り付けようとしている時点のタイムチャートである。 この発明の実施の形態1に係る並列処理装置において4つ目のビームを最初のプロセッサに割り付けようとしている時点のタイムチャートである。 この発明の実施の形態1に係る並列処理装置において4つ目のビームを2つ目のプロセッサに割り付けようとしている時点のタイムチャートである。 この発明の実施の形態2に係る並列処理装置において3つ目のビームを2つ目のプロセッサに割り付けようとしている時点のタイムチャートである。 この発明の実施の形態2に係る並列処理装置において6つ目のビームを最初のプロセッサに割り付けようとしている時点のタイムチャートである。 この発明の実施の形態2に係る並列処理装置において6つ目のビームを3つ目のプロセッサに割り付けようとしている時点のタイムチャートである。 この発明の実施の形態3に係る並列処理装置において7つ目のビームを入力する時点のタイムチャートである。 この発明の実施の形態3に係る並列処理装置において7つ目のビームを2つ目のプロセッサに割り付けようとしている時点のタイムチャートである。 この発明の実施の形態4に係る並列処理装置において8つ目のビームを入力する時点のタイムチャートである。 この発明の実施の形態4に係る並列処理装置において8つ目のビームを3つ目のプロセッサに割り付けようとしている時点のタイムチャートである。 この発明の実施の形態5に係る並列処理装置において1つ目のビームをプロセッサに割り付けようとしている時点のタイムチャートである。 この発明の実施の形態5に係る並列処理装置において2つ目のビームをプロセッサに割り付けようとしている時点のタイムチャートである。 この発明の実施の形態5に係る並列処理装置において4つ目のビームをプロセッサに割り付けようとしている時点のタイムチャートである。 この発明の実施の形態5に係る並列処理装置において5つ目のビームをプロセッサに割り付けようとしている時点のタイムチャートである。
実施の形態1.
図1は、この発明の実施の形態1に係る並列処理装置の構成図である。また、図2〜図6は、この発明の実施の形態1に係る並列処理装置における処理の流れを示すタイムチャートである。
この発明の実施の形態1に係る並列処理装置は、図1に示すように、受信信号入力線2を介して外部から受信信号が入力するとともにデータ転送路7eを介して受信信号を出力する入力インターフェース(I/F)3、外部から緒元情報入力線1を介してビームの緒元情報を入力するとともに制御線5を介して入力インターフェース3に制御信号を送るスケジューラ4、入力インターフェース3から入力される受信信号をデータ転送路7eを介してプロセッサ8(8a〜8dを総称する)に転送するとともにプロセッサ8が演算した演算結果をデータ転送路7a〜7d及び7fを介して外部に出力するデータ転送手段としてのネットワークスイッチ(HUB)6、受信信号を演算して演算結果を出力する4個のプロセッサ(PE)8a〜8dを備える。
次に、実施の形態1に係る並列処理装置の動作について説明する。実施の形態1に係るスケジューラ4は、緒元情報入力線1を介して入力されるビームの緒元情報を用いて、処理単位に区切られたデータであるビームの受信時間、演算時間、演算結果の送信時間を算出する。パルスのヒット数やセンシング距離等のビームの諸元情報からビームのデータ量は自ずと決まる。また、信号処理の演算結果のデータ量は一定と考えてよい。ネットワークを介した送受信時間は、通信するデータ量に比例する。また、信号処理は定型的な処理であるため、処理すべきデータ量に比例する。従って、事前に通信時間や演算時間を幾つかのデータ量で計測しておくことにより、ビームのデータ量が分かれば、送受信時間、演算時間を算出することが可能である。
図2は、スケジューラ4が、ビームA9の諸元情報に基づいて、受信時間、演算時間、結果の送信時間を算出し、ビームA9の処理をプロセッサ8aに割付可能かをチェックしている状況である。すなわち、ビームA9のデータ受信開始から演算結果の送信完了までの時間10(これをビームA9の遅延時間と呼ぶ)が制限時間に間に合っているかどうかをチェックする。
算出されたビームA9の受信、演算、送信時間が、それぞれ、80ミリ秒、100ミリ秒、20ミリ秒とすると、ビームA9をプロセッサ8aに割り付けた時の遅延時間10は、80+100+20=200ミリ秒となる。そして、制限時間が例えば1,000ミリ秒とすると、200<1,000であり、ビームA9をプロセッサ8aに割り付けた時の遅延時間10は制限時間以内なので、スケジューラ4は、ビームA9をプロセッサ8aに割り付けるよう、制御線5を介して入力インターフェース3に制御信号を送る。それにより、受信信号入力線2を介して外部から入力されたビームA9の受信信号データは、データ転送路7e、ネットワークスイッチ6、データ転送路7aを介して、プロセッサ8aに転送される。
次に、図3は、次に入力されるビームB11の諸元情報に基づいて、受信時間、演算時間、結果の送信時間を算出し、ビームB11の処理をプロセッサ8aに割付可能かをチェックしている状況である。すなわち、ビームA9の遅延時間12とビームB11の遅延時間13が共に制限時間に間に合っているかどうかをチェックする。
算出されたビームB11の受信、演算、送信時間が、それぞれ、40ミリ秒、80ミリ秒、20ミリ秒とすると、ビームA9とビームB11を共にプロセッサ8aに割り付けた時の、ビームA9の遅延時間12は80+40+100+20=240ミリ秒、ビームB11の遅延時間13は40+100+20+80+20=260ミリ秒となり、どちらも制限時間1,000ミリ秒以下なので、スケジューラ4は、ビームB11をプロセッサ8aに割り付けるよう、制御線5を介して入力インターフェース3に制御信号を送る。それにより、受信信号入力線2を介して外部から入力されたビームB11の受信信号データは、データ転送路7e、ネットワークスイッチ6、データ転送路7aを介して、プロセッサ8aに転送される。
次に、図4は、次に入力されるビームC14の諸元情報に基づいて、受信時間、演算時間、結果の送信時間を算出し、ビームC14の処理をプロセッサ8aに割付可能かをチェックしている状況である。すなわち、ビームA9の遅延時間15、ビームB11の遅延時間16、ビームC14の遅延時間17が全て制限時間に間に合っているかどうかをチェックする。
算出されたビームC14の受信、演算、送信時間が、それぞれ、240ミリ秒、450ミリ秒、20ミリ秒とすると、ビームA9、ビームB11、ビームC14を全てプロセッサ8aに割り付けた時の、ビームA9の遅延時間15は80+40+240+100+20=480ミリ秒、ビームB11の遅延時間16は40+240+100+20+80+20=500ミリ秒、ビームC14の遅延時間17は240+100+20+80+20+450+20=930ミリ秒となり、全て制限時間1,000ミリ秒以下なので、スケジューラ4は、ビームC14をプロセッサ8aに割り付けるよう、制御線5を介して入力インターフェース3に制御信号を送る。それにより、受信信号入力線2を介して外部から入力されたビームC14の受信信号データは、データ転送路7e、ネットワークスイッチ6、データ転送路7aを介して、プロセッサ8aに転送される。
次に、図5は、次に入力されるビームD18の諸元情報に基づいて、受信時間、演算時間、結果の送信時間を算出し、ビームD18の処理をプロセッサ8aに割付可能かをチェックしている状況である。すなわち、ビームA9の遅延時間19、ビームB11の遅延時間20、ビームC14の遅延時間21、ビームD18の遅延時間22が全て制限時間に間に合っているかどうかをチェックする。
算出されたビームD18の受信、演算、送信時間が、それぞれ、80ミリ秒、100ミリ秒、20ミリ秒とすると、ビームA9、ビームB11、ビームC14、ビームD18を全てプロセッサ8aに割り付けた時の、ビームA9の遅延時間19は80+40+240+80+100+20=560ミリ秒、ビームB11の遅延時間20は40+240+80+100+20+80+20=580ミリ秒、ビームC14の遅延時間21は240+80+100+20+80+20+450+20=1,010ミリ秒、ビームD18の遅延時間22は80+100+20+80+20+450+20+100+20=890ミリ秒となり、ビームC14の遅延時間21が制限時間1,000ミリ秒を越えているので、スケジューラ4は、ビームD18をプロセッサ8aに割り付け不可能と判断し、プロセッサ8aへの割付を終了するよう、制御線5を介して入力インターフェース3に制御信号を送る。それにより、エンドオブデータが、データ転送路7e、ネットワークスイッチ6、データ転送路7aを介して、プロセッサ8aに転送され、プロセッサ8aは、これ以上ビームの処理が割り付けられないと分かり、ビームA9の演算処理を開始する。
次に、スケジューラ4は、ビームD18の処理をプロセッサ8aとは異なるプロセッサに割り付けることを試みる。この時、どのプロセッサに割り付けるかを判断する基準は、その時点で何も処理をしていないプロセッサとする。図6は、ビームD18の処理をその時点で何も処理をしていないプロセッサ8bに割付可能かをチェックしている状況である。すなわち、ビームD18の遅延時間23が制限時間に間に合っているかどうかをチェックする。ビームD18をプロセッサ8bに割り付けた時の遅延時間23は、80+100+20=200ミリ秒となり、制限時間1,000ミリ秒以下なので、スケジューラ4は、ビームD18をプロセッサ8bに割り付けるよう、制御線5を介して入力インターフェース3に制御信号を送る。それにより、受信信号入力線2を介して外部から入力されたビームD18の受信信号データは、データ転送路7e、ネットワークスイッチ6、データ転送路7bを介して、プロセッサ8bに転送される。
この並列処理装置は、ビームの諸元情報に基づいて、そのビームの処理に必要な受信時間、演算時間、結果の送信時間を算出し、その情報を基に、それぞれのビームの受信開始から演算結果の送信完了までの遅延時間を算出し、それらが予め指定された制限時間を越えない限り、各ビームの処理を同一のプロセッサに割り付けるようにしているので、制限時間を守れる範囲で最大限の並列粒度となり、並列処理単位の数が少なくなっているので、より少ない数のプロセッサで処理を行うことができるため、並列処理装置の規模を抑えることができるという効果がある。
実施の形態2.
この発明の実施の形態2に係る並列処理装置は、実施の形態1に係る並列処理装置とスケジューラ4が異なっており、それ以外は同様であるので、同様な部分に同じ符号を付記して説明は省略する。
実施の形態1に係るスケジューラ4では、各ビームの遅延時間が制限時間以下である間、それらのビームを同一プロセッサに割り付けている。一方、実施の形態2に係るスケジューラ4は、各ビームの遅延時間が制限時間以下であっても、これまで割り付けたビームの総演算時間と総送信時間の和より、次に割り付けようとしているビームの受信時間が長い場合は、そのビーム以降の処理を他のプロセッサに割り付ける。すなわち、実施の形態2に係るスケジューラ4は、これまで割り付けたビーム及び次に割り付けようとしているビームのいずれかの遅延時間が制限時間を越えるか、又は、これまで割り付けたビームの総演算時間と総送信時間の和より、次に割り付けようとしているビームの受信時間が長い場合に、そのビーム以降の処理を他のプロセッサに割り付ける。
図7は、実施の形態1の図4に対応する実施の形態2のタイムチャートであり、既にビームA9及びビームB11がプロセッサ8aに割り付けられ、ビームC14をプロセッサ8bに割り付けようとしている状態である。
これまでプロセッサ8aに割り付けたビームA9及びビームB11の総演算時間は100+80=180ミリ秒、総送信時間は20+20=40ミリ秒で、その和は220ミリ秒である。ビームC14の受信時間は240ミリ秒と220ミリ秒より大きいため、スケジューラ4は、ビームC14をプロセッサ8a以外のプロセッサに割り付けるよう判断し、プロセッサ8aへの割付を終了するよう、制御線5を介して入力インターフェース3に制御信号を送る。それにより、エンドオブデータがデータ転送路7e、ネットワークスイッチ6、データ転送路7aを介して、プロセッサ8aに転送され、プロセッサ8aはこれ以上ビームの処理が割り付けられないと分かり、ビームA9の演算処理を開始する。
次に、スケジューラ4は、ビームC14の処理をプロセッサ8aとは異なるプロセッサに割り付けることを試みる。この時、どのプロセッサに割り付けるかを判断する基準は、その時点で何も処理をしていないプロセッサとする。図7は、ビームC14の処理をその時点で何も処理をしていないプロセッサ8bに割付可能かをチェックしている状況である。すなわち、ビームC14の遅延時間24が制限時間に間に合っているかどうかをチェックする。ビームC14をプロセッサ8bに割り付けた時の遅延時間24は、240+450+20=710ミリ秒となり、制限時間1,000ミリ秒以下なので、スケジューラ4は、ビームC14をプロセッサ8bに割り付けるよう、制御線5を介して入力インターフェース3に制御信号を送る。それにより、受信信号入力線2を介して外部から入力されたビームC14の受信信号データはデータ転送路7e、ネットワークスイッチ6、データ転送路7bを介して、プロセッサ8bに転送される。
ここで、プロセッサ8bでのビームC14の受信が完了した時点では、プロセッサ8aでのビームA9及びビームB11の処理は全て完了しており、その時点ではプロセッサ8aはアイドル状態であり、プロセッサ8aは、次に、入力されるビームD18を割り付けることも可能な状態になっている。従って、その時点での使用中のプロセッサ数は、ビームC14の処理を別プロセッサに分けたにも係わらず、実施の形態1のように分けない場合と変わっておらず、より多くのプロセッサを必要とすることはない。これは、元々がアイドル状態であったプロセッサを有効利用しているからである。
図8は、更に、ビームE25、ビームF26をプロセッサに割り付けたタイムチャートである。ビームE25のビームの受信、演算、送信時間が、それぞれ、120ミリ秒、200ミリ秒、20ミリ秒、ビームF26のビームの受信、演算、送信時間が、それぞれ、250ミリ秒、400ミリ秒、20ミリ秒とする。仮にこの2つのビームを共にプロセッサ8bに割り付けた場合、ビームC14の遅延時間は240+80+120+250+450+20=1,160ミリ秒となり、制限時間1,000ミリ秒を越えてしまう。そこで、ビームF26はプロセッサ8aに割り付ける。この場合のビームC14の遅延時間27は240+80+120+450+20=910ミリ秒、ビームD18の遅延時間28は80+120+450+20+100+20=790ミリ秒、ビームE25の遅延時間29は120+450+20+100+20+200+20=930ミリ秒、ビームF26の遅延時間30は250+400+20=670ミリ秒と、全て制限時間1,000ミリ秒以下になる。
図9は、実施の形態1の図6の状態から、ビームE25、ビームF26をプロセッサに割り付けたタイムチャートである。仮にこの2つのビームを共にプロセッサ8bに割り付けた場合、ビームF26の遅延時間は250+100+20+200+20+400+20=1,010ミリ秒となり、制限時間1,000ミリ秒を越えてしまう。そこで、ビームF26はその時点でアイドルであるプロセッサ8cに割り付ける。この場合のビームD18の遅延時間31は80+120+100+20=320ミリ秒、ビームE25の遅延時間32は120+100+20+200+20=460ミリ秒、ビームF26の遅延時間33は250+400+20=670ミリ秒と、全て制限時間1,000ミリ秒以下になる。しかし、この時点で、3つのプロセッサを使用しており、より多くのプロセッサを必要とする。
この実施の形態2に係る並列処理装置は、アイドル状態のプロセッサを有効に利用して、一部の処理をそれらアイドル状態のプロセッサに割り付けるようにして、それ以降のビームをより多く同一プロセッサで処理できるようにしているので、より少ない数のプロセッサで処理を行うことができるため、並列処理装置の規模を抑えることができるという効果がある。
実施の形態3.
この発明の実施の形態3に係る並列処理装置は、実施の形態1及び実施の形態2に係る並列処理装置とスケジューラ4が異なっており、それ以外は同様であるので、同様な部分に同じ符号を付記して説明は省略する。
実施の形態1及び実施の形態2に係るスケジューラ4では、これまでとは異なるプロセッサに割り付けることを試みる時に、どのプロセッサに割り付けるかを判断する基準が、その時点で何も処理をしていないアイドル状態のプロセッサとしている。一方、実施の形態3に係るスケジューラ4は、各プロセッサの処理が完了する時刻を管理して、まもなく処理が完了するプロセッサへ割り付けるようにする。
図10は、ビームD18を入力しようとしているところで、実施の形態1の図6との違いは、プロセッサ8bがアイドル状態ではなく、ビームX34、ビームY35、ビームZ36の処理を行っているという点である。なお、ビームX34のビームの受信、演算、送信時間は、160ミリ秒、310ミリ秒、20ミリ秒であり、ビームY35のビームの受信、演算、送信時間は、140ミリ秒、260ミリ秒、20ミリ秒であり、ビームZ3のビームの受信、演算、送信時間は、100ミリ秒、180ミリ秒、20ミリ秒である。ビームD18を入力する時点では、ビームX34の処理は完了し、ビームY35の処理を行っている。ビームD18はプロセッサ8aには割り付けられないことは実施の形態1で示したので、ビームD18をその他のプロセッサに割り付けることを試みる。この時、どのプロセッサに割り付けるかを判断する基準は、例え割り付けられているビームの処理が完了していなくても、ビームD18の処理が割り付けられても、既に割り付けられているビームの処理及びビームD18の処理が制限時間以内で完了するプロセッサとする。
図11は、ビームD18の処理をプロセッサ8bに割付可能かをチェックしている状況である。スケジューラ4は、既に各プロセッサ8に割り付けたビーム処理をこのようなタイムチャートとして管理している。ビームD18の処理をプロセッサ8bに割り付けるには、処理中のビームY35の処理を中断して、ビームD18のデータ受信を行い、受信が完了したら、再びビームY35の処理を再開する。従って、割付可能かのチェックは、ビームY35の遅延時間37、ビームZ36の遅延時間38、ビームD18の遅延時間39が全て制限時間に間に合っているかどうかのチェックとなる。
ビームD18をプロセッサ8bに割り付けた時の、ビームY35の遅延時間37は140+100+310+20+30+80+230+20=930ミリ秒、ビームZ36の遅延時間38は100+310+20+30+80+230+20+180+20=990ミリ秒、ビームD18の遅延時間39は80+230+20+180+20+100+20=650ミリ秒となり、全て制限時間1,000ミリ秒以下なので、スケジューラ4は、ビームD18をプロセッサ8bに割り付けるよう、制御線5を介して入力インターフェース3に制御信号を送る。それにより、受信信号入力線2を介して外部から入力されたビームD18の受信信号データはデータ転送路7e、ネットワークスイッチ6、データ転送路7bを介して、プロセッサ8bに転送される。
この実施の形態3に係る並列処理装置は、これまでとは異なるプロセッサに割り付けることを試みる時に、その時点で何も処理をしていないアイドル状態のプロセッサだけでなく、各プロセッサの処理が完了する時刻を管理して、制限時間を守れる範囲で、まもなく処理が完了するプロセッサへ割り付けるようにしているので、アイドル状態のプロセッサが存在しない場合でもビームの処理を制限時間内に処理するよう割り付けることが可能であり、それにより、より少ない数のプロセッサで処理を行うことができるため、並列処理装置の規模を抑えることができるという効果がある。
実施の形態4.
この発明の実施の形態4に係る並列処理装置は、実施の形態1、実施の形態2及び実施の形態3に係る並列処理装置とスケジューラ4が異なっており、それ以外は同様であるので、同様な部分に同じ符号を付記して説明は省略する。
実施の形態2に係るスケジューラ4では、これまでとは異なるプロセッサに割り付けることを試みる時に、どのプロセッサに割り付けるかを判断する基準が、その時点で何も処理をしていないアイドル状態のプロセッサとしている。一方、実施の形態4に係るスケジューラ4は、各プロセッサの処理が完了する時刻を管理して、まもなく処理が完了するプロセッサへ割り付けるようにする。
図12は、ビームC14を入力しようとしているところで、これまでプロセッサ8aに割り付けたビームA9及びビームB11の総演算時間は100+80=180ミリ秒、総送信時間は20+20=40ミリ秒で、その和は220ミリ秒であり、ビームC14の受信時間は240ミリ秒と220ミリ秒より大きいため、スケジューラ4は、ビームC14をプロセッサ8a以外のプロセッサに割り付けるよう判断する。ただし、実施の形態2の図7との違いは、プロセッサ8bがアイドル状態ではなく、ビームX34、ビームY35、ビームZ36の処理を行っており、更にプロセッサ8cもアイドル状態ではなく、ビームV、ビームW40の処理を行っているという点である。なお、ビームVの演算、送信時間は、320ミリ秒、20ミリ秒であり、ビームW40の受信、演算、送信時間は、180ミリ秒、200ミリ秒、20ミリ秒である。ビームC14を入力する時点では、ビームVの処理は完了し、ビームW40の処理を行っている。
図13は、ビームC14の処理を、より早く処理が完了するプロセッサ8cに割付可能かをチェックしている状況である。スケジューラ4は、既に各プロセッサ8に割り付けたビーム処理をこのようなタイムチャートとして管理している。ビームC14の処理をプロセッサ8cに割り付けるには、処理中のビームW40の処理を中断して、ビームC14のデータ受信を行い、受信が完了したら、再びビームW40の処理を再開する。従って、割付可能かのチェックは、ビームW40の遅延時間41、ビームC14の遅延時間42が全て制限時間に間に合っているかどうかのチェックとなる。
ビームC14をプロセッサ8cに割り付けた時の、ビームW40の遅延時間41は180+320+20+180+240+20+20=980ミリ秒、ビームC14の遅延時間42は240+20+20+450+20=750ミリ秒となり、全て制限時間1,000ミリ秒以下なので、スケジューラ4は、ビームC14をプロセッサ8cに割り付けるよう、制御線5を介して入力インターフェース3に制御信号を送る。それにより、受信信号入力線2を介して外部から入力されたビームC14の受信信号データはデータ転送路7e、ネットワークスイッチ6、データ転送路7cを介して、プロセッサ8cに転送される。
この実施の形態4に係る並列処理装置は、これまでとは異なるプロセッサに割り付けることを試みる時に、その時点で何も処理をしていないアイドル状態のプロセッサだけでなく、各プロセッサの処理が完了する時刻を管理して、制限時間を守れる範囲で、まもなく処理が完了するプロセッサへ割り付けるようにしているので、アイドル状態のプロセッサが存在しない場合でもビームの処理を制限時間内に処理するよう割り付けることが可能であり、更にまもなくアイドルになるプロセッサを有効に利用して、一部の処理をそれらまもなくアイドル状態になるプロセッサに割り付けるようにして、それ以降のビームをより多く同一プロセッサで処理できるようにしているので、より少ない数のプロセッサで処理を行うことができるため、並列処理装置の規模を抑えることができるという効果がある。
実施の形態5.
この発明の実施の形態5に係る並列処理装置は、実施の形態1、実施の形態2、実施の形態3及び実施の形態4に係る並列処理装置とスケジューラ4が異なっており、それ以外は同様であるので、同様な部分に同じ符号を付記して説明は省略する。
実施の形態1〜4に係るスケジューラ4では、プロセッサに割り付ける演算は入力されたビームに対する信号処理のみであったが、通常のレーダ装置では信号処理を行った後にその結果を基にして追尾処理を行う。この追尾処理は、信号処理とは異なる処理装置で行うこともあるが、同一の処理装置で行うことも多い。そのため、実施の形態5では、信号処理と追尾処理を同一の処理装置で行う。すなわち、実施の形態5においてプロセッサに割り付ける演算は、入力されたビームに対する信号処理の演算と、その結果に基づいて行う追尾処理の演算を含む。そして、実施の形態5に係るスケジューラ4は、ビームが入力されてから、そのビームに対応する信号処理及び追尾処理の演算が完了してそれらの演算結果を送信するまでの総和時間を遅延時間として扱い、制約時間も信号処理及び追尾処理を含めた最終的な結果が得られるまでの時間で設定しておく。
追尾処理の並列化方式を含めた処理方法は、“佐藤裕幸, 尾崎敦夫:「並列処理環境における消費電力量低減化方式の評価」, 情報処理学会研究報告,2007-ARC-174, 2007”の3.1章「並列化手法」に示されている。ここに示されている追尾処理の並列化単位は、目標の次観測時の予測位置であるゲートが重なり合っている航跡の集合であるクラスタである。このクラスタは、空間的な範囲を示していることになるので、ビームの覆域(観測範囲)とクラスタは対応付けが可能である。
また、クラスタ内の追尾処理の処理負荷に関しては、同研究報告の3.2章「処理時間の見積り」に示されている通り、クラスタ内の航跡数と探知データ数の積から予測することが可能である。ここで、探知データ数は信号処理の結果として得られるものなので、信号処理前の状態では不明である。しかし、クラスタ内の航跡数は決まっているので、そのクラスタの追尾処理時間の上限値を見積ることは可能である。
スケジューラ4は、実施の形態1〜4と同様に、緒元情報入力線1を介して入力されるビームの緒元情報を用いて、処理単位に区切られたデータであるビームの受信時間、信号処理の演算時間を算出すると共に、ビーム緒元情報の覆域を用いてこのビームに対応するクラスタを特定し、そのクラスタの航跡数を用いて追尾処理の演算時間の上限値も算出する。また、信号処理及び追尾処理の演算結果の送信時間も算出する。
図14は、スケジューラ4が、ビームA9の諸元情報に基づいて、受信時間、信号処理の演算時間(図中のAs)、追尾処理の演算時間の上限値(図中のAt)、結果の送信時間を算出し、ビームA9の処理をプロセッサ8aに割付可能かをチェックしている状況である。すなわち、ビームA9のデータ受信開始から信号処理及び追尾処理の演算結果の送信完了までの時間43(これをビームA9の遅延時間と呼ぶ)が制限時間に間に合っているかどうかをチェックする。
算出されたビームA9の受信、信号演算、追尾演算、送信時間が、それぞれ、80ミリ秒、100ミリ秒、150ミリ秒、20ミリ秒とすると、ビームA9をプロセッサ8aに割り付けた時の遅延時間10は、80+100+150+20=350ミリ秒となる。そして、信号処理及び追尾処理を含めた制限時間が例えば2,000ミリ秒とすると、350<2,000であり、ビームA9をプロセッサ8aに割り付けた時の遅延時間43は制限時間以内なので、スケジューラ4は、ビームA9をプロセッサ8aに割り付けるよう、制御線5を介して入力インターフェース3に制御信号を送る。それにより、受信信号入力線2を介して外部から入力されたビームA9の受信信号データは、データ転送路7e、ネットワークスイッチ6、データ転送路7aを介して、プロセッサ8aに転送される。
次に、図15は、次に入力されるビームB11の諸元情報に基づいて、受信時間、信号処理の演算時間(図中のBs)、追尾処理の演算時間の上限値(図中のBt)、結果の送信時間を算出し、ビームB11の処理をプロセッサ8aに割付可能かをチェックしている状況である。すなわち、ビームA9の遅延時間44とビームB11の遅延時間45が共に制限時間に間に合っているかどうかをチェックする。
算出されたビームB11の受信、信号演算、追尾演算、送信時間が、それぞれ、40ミリ秒、80ミリ秒、200ミリ秒、20ミリ秒とすると、ビームA9とビームB11を共にプロセッサ8aに割り付けた時の、ビームA9の遅延時間44は80+40+100+80+150+20=470ミリ秒、ビームB11の遅延時間45は40+100+80+150+20+200+20=610ミリ秒となり、どちらも制限時間2,000ミリ秒以下なので、スケジューラ4は、ビームB11をプロセッサ8aに割り付けるよう、制御線5を介して入力インターフェース3に制御信号を送る。それにより、受信信号入力線2を介して外部から入力されたビームB11の受信信号データは、データ転送路7e、ネットワークスイッチ6、データ転送路7aを介して、プロセッサ8aに転送される。
次に、図16は、次に入力されるビームC14の処理がプロセッサ8aに割付可能であることがチェックされて既に割り付けが行われた後に、その次に入力されるビームD18の諸元情報に基づいて、受信時間、信号処理の演算時間(図中のDs)、追尾処理の演算時間の上限値(図中のDt)、結果の送信時間を算出し、ビームD18の処理をプロセッサ8aに割付可能かをチェックしている状況である。すなわち、ビームA9の遅延時間46、ビームB11の遅延時間47、ビームC14の遅延時間48、ビームD18の遅延時間49が全て制限時間に間に合っているかどうかをチェックする。
算出されたビームC14の受信、信号演算、追尾演算、送信時間が、それぞれ、240ミリ秒、450ミリ秒、360ミリ秒、20ミリ秒、算出されたビームD18の受信、信号演算、追尾演算、送信時間が、それぞれ、80ミリ秒、100ミリ秒、120ミリ秒、20ミリ秒、とすると、ビームA9、ビームB11、ビームC14、ビームD18を全てプロセッサ8aに割り付けた時の、ビームA9の遅延時間46は80+40+240+80+100+80+450+100+150+20=1,340ミリ秒、ビームB11の遅延時間47は40+240+80+100+80+450+100+150+20+200+20=1,480ミリ秒、ビームC14の遅延時間48は240+80+100+80+450+100+150+20+200+20+360+20=1,820ミリ秒、ビームD18の遅延時間49は80+100+80+450+100+150+20+200+20+360+20+120+20=1,720となり、全て制限時間2,000ミリ秒以下なので、スケジューラ4は、ビームD18をプロセッサ8aに割り付けるよう、制御線5を介して入力インターフェース3に制御信号を送る。それにより、受信信号入力線2を介して外部から入力されたビームD18の受信信号データは、データ転送路7e、ネットワークスイッチ6、データ転送路7aを介して、プロセッサ8aに転送される。
次に、図17は、次に入力されるビームE50の諸元情報に基づいて、受信時間、信号処理の演算時間(図中のEs)、追尾処理の演算時間の上限値(図中のEt)、結果の送信時間を算出し、ビームE50の処理をプロセッサ8aに割付可能かをチェックしている状況である。すなわち、ビームA9の遅延時間51、ビームB11の遅延時間52、ビームC14の遅延時間53、ビームD18の遅延時間54、ビームE50の遅延時間55が全て制限時間に間に合っているかどうかをチェックする。
算出されたビームE50の受信、信号演算、追尾演算、送信時間が、それぞれ、120ミリ秒、100ミリ秒、160ミリ秒、20ミリ秒とすると、ビームA9、ビームB11、ビームC14、ビームD18、ビームE50を全てプロセッサ8aに割り付けた時の、ビームA9の遅延時間51は80+40+240+80+120+100+80+450+100+100+150+20=1,560ミリ秒、ビームB11の遅延時間52は40+240+80+120+100+80+450+100+100+150+20+200+20=1,700ミリ秒、ビームC14の遅延時間53は240+80+120+100+80+450+100+100+150+20+200+20+360+20=2,040ミリ秒、ビームD18の遅延時間54は80+120+100+80+450+100+100+150+20+200+20+360+20+120+20=1,940ミリ秒となり、ビームE50の遅延時間55は120+100+80+450+100+100+150+20+200+20+360+20+120+20+160+20=2,040ミリ秒となり、ビームC14の遅延時間53及びビームE50の遅延時間55が制限時間2,000ミリ秒を越えているので、スケジューラ4は、ビームE50をプロセッサ8aに割り付け不可能と判断し、プロセッサ8aへの割付を終了するよう、制御線5を介して入力インターフェース3に制御信号を送る。それにより、エンドオブデータが、データ転送路7e、ネットワークスイッチ6、データ転送路7aを介して、プロセッサ8aに転送され、プロセッサ8aは、これ以上ビームの処理が割り付けられないと分かり、ビームA9の演算処理を開始する。
次に、スケジューラ4は、ビームE50の処理をプロセッサ8aとは異なるプロセッサに割り付けることを試みる。この時、どのプロセッサに割り付けるかを判断する基準は、その時点で何も処理をしていないプロセッサでも良いし、まもなく処理が完了するプロセッサへ割り付けるようにするのでも良い。それらの方法は、実施の形態1及び実施の形態3で示した通りである。また、追尾処理を含めたプロセッサへの割付においても、実施の形態2で示したように、各ビームの遅延時間が制限時間以下であっても、これまで割り付けたビームの総演算時間と総送信時間の和より、次に割り付けようとしているビームの受信時間が長い場合は、そのビーム以降の処理を他のプロセッサに割り付けても良い。更に、本実施の形態5では、割り付けたビームの全ての信号処理が終った後で追尾処理を開始していたが、対応するビームの信号処理の直後に可能であれば追尾処理を開始する形態を採っても構わない。その場合には、各ビームの遅延時間は変ってくる。ただし、追尾処理のクラスタ範囲が複数の信号処理の覆域に跨る場合には、それら複数の信号処理を行った後に追尾処理を開始する必要がある。
この実施の形態5に係る並列処理装置は、ビームの諸元情報に基づいて、そのビームの処理に必要な受信時間、信号処理の演算時間、追尾処理の演算時間の上限値、結果の送信時間を算出し、その情報を基に、それぞれのビームの受信開始から信号処理及び追尾処理の演算結果の送信完了までの遅延時間を算出し、それらが予め指定された信号処理及び追尾処理を含めた制限時間を越えない限り、各ビームの処理を同一のプロセッサに割り付けるようにしている。そのため、信号処理と追尾処理のどちらか一方の処理負荷が高い場合には、信号処理と追尾処理でそれぞれ制限時間を設けるよりも、制限時間を守れる範囲でより最大限の並列粒度となり、並列処理単位の数が少なくなるので、より少ない数のプロセッサで処理を行うことができ、並列処理装置の規模を抑えることができるという効果がある。信号処理と追尾処理でそれぞれ制限時間を設けていた実施の形態1では、ビームA9〜ビームD18は同一プロセッサに割り付けられなかったが、信号処理と追尾処理を同一装置で実行し、制限時間を1つにした実施の形態5では、ビームA9〜ビームD18は同一プロセッサに割り付けられる。
1 緒元情報入力線、2 受信信号入力線、3 入力インターフェース(I/F)、4 スケジューラ、5 制御線、6 ネットワークスイッチ、7a〜7f データ転送路、8a〜8d プロセッサ。

Claims (5)

  1. 処理単位に区切られたデータが連続して入力され、当該データに対する演算を複数のプロセッサを用いて処理する並列処理装置において、
    データ入力の際に示される情報を用いてデータの受信時間、演算時間、演算結果の送信時間を算出し、算出結果に従ってデータの演算処理をプロセッサに割り付けるスケジューラと、
    前記データを割り付けられたプロセッサに転送するデータ転送手段と
    を備え、
    前記スケジューラは、それぞれのデータの受信開始から演算結果の送信完了までの時間が予め指定された時間を越えない場合は、それらのデータの演算を同一のプロセッサで処理するように割り付け、予め指定された時間を超える場合、データは別プロセッサで処理するように割り付ける
    ことを特徴とする並列処理装置。
  2. 請求項1に記載の並列処理装置において、
    前記スケジューラは、これまで同一プロセッサに割り付けたデータの総演算時間と総演算結果送信時間の和より、次に割り付けようとするデータの受信時間が長い場合に、そのデータ以降の処理を別プロセッサで処理するように割り付ける
    ことを特徴とする並列処理装置。
  3. 請求項1または2に記載の並列処理装置において、
    前記スケジューラは、データの演算をこれまでのデータとは異なる別プロセッサで処理するよう割り付ける際に、割り付けられた全ての処理が完了しているプロセッサへ割り付ける
    ことを特徴とする並列処理装置。
  4. 請求項1または2に記載の並列処理装置において、
    前記スケジューラは、データの演算をこれまでのデータとは異なる別プロセッサで処理するよう割り付ける際に、割り付けられたデータの処理がまもなく完了するプロセッサへ割り付け、それぞれのデータの受信開始から演算結果の送信完了までの時間の算出の際に、既に割り付けられているデータの処理が完了するまでの時間を加算して、その時間が予め指定された時間を越えない場合は、それらのデータの演算を同一のプロセッサで処理するように割り付け、予め指定された時間を超える場合、データは別プロセッサで処理するように割り付ける
    ことを特徴とする並列処理装置。
  5. 請求項1から4のいずれかに記載の並列処理装置において、
    前記プロセッサに割り付けるデータの演算は、第1演算とその結果に基づいて行う第2演算を含み、
    前記スケジューラは、データ入力の際に示される情報を用いてデータの受信時間、第1演算時間、第2演算時間、第1、第2演算結果の送信時間を算出し、それぞれのデータの受信開始から第1、第2演算結果の送信完了までの時間が予め指定された時間を越えない間は、それらのデータの第1、第2演算を同一のプロセッサで処理するように割り付け、予め指定された時間を超える場合、データは別プロセッサで処理するように割り付ける
    ことを特徴とする並列処理装置。
JP2010093851A 2009-04-30 2010-04-15 並列処理装置 Expired - Fee Related JP5452335B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010093851A JP5452335B2 (ja) 2009-04-30 2010-04-15 並列処理装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2009111299 2009-04-30
JP2009111299 2009-04-30
JP2010093851A JP5452335B2 (ja) 2009-04-30 2010-04-15 並列処理装置

Publications (2)

Publication Number Publication Date
JP2010277579A JP2010277579A (ja) 2010-12-09
JP5452335B2 true JP5452335B2 (ja) 2014-03-26

Family

ID=43424436

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010093851A Expired - Fee Related JP5452335B2 (ja) 2009-04-30 2010-04-15 並列処理装置

Country Status (1)

Country Link
JP (1) JP5452335B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014219230A (ja) * 2013-05-02 2014-11-20 三菱電機株式会社 並列信号処理装置
JP6900824B2 (ja) * 2017-08-01 2021-07-07 富士通株式会社 並列処理装置、並列処理方法、及びプログラム

Also Published As

Publication number Publication date
JP2010277579A (ja) 2010-12-09

Similar Documents

Publication Publication Date Title
CN104516475B (zh) 用于管理多核片上系统上的全局芯片功率的方法和装置
CN102822798B (zh) 用于虚拟容器系统内的资源容量评估的方法和装置
US8812639B2 (en) Job managing device, job managing method and job managing program
US8516491B2 (en) Multi-core processor
JP6202850B2 (ja) 目標追尾装置
US20050254519A1 (en) Dynamic load-based credit distribution
US20140372810A1 (en) Apparatus and method for monitoring performance of cores based on multi-core processor
KR20140134190A (ko) 멀티 코어 시스템 및 멀티 코어 시스템의 작업 스케줄링 방법
KR20080041047A (ko) 멀티 코어 프로세서 시스템에서 로드 밸런싱을 위한 장치및 방법
JP7006607B2 (ja) 分散処理システム、分散処理方法、及び記録媒体
CN109005223A (zh) 物联网资源调度方法及系统、计算机可读存储介质和终端
CN104331331A (zh) 任务数目和性能感知的可重构多核处理器的资源分配方法
JP5452335B2 (ja) 並列処理装置
CN103455375A (zh) Hadoop云平台下基于负载监控的混合调度方法
CN115269108A (zh) 一种数据处理方法、装置及设备
CN108390807B (zh) 一种基于单片机的多机通讯方法
JPWO2021131576A5 (ja) 制御装置、パワーコンディショニングシステム、分散電源システム、電力制御システム、制御方法およびプログラム
JP3645135B2 (ja) 並列多目標追尾装置
CN107329813B (zh) 一种面向众核处理器的全局感知数据主动预取方法及系统
JP6732693B2 (ja) リソース割当制御システム、リソース割当制御方法、及びプログラム
JP3713015B2 (ja) レーダ信号処理装置及びレーダ信号処理方法
JP3952058B2 (ja) 推定伸長率に基づくトランザクション負荷分散方法及び方式並びにコンピュータ可読記録媒体
CN106899510A (zh) 一种基于iSCSI协议的传输速率控制方法和装置
JP6750498B2 (ja) 制御装置、制御方法、制御プログラム及び制御システム
KR101907455B1 (ko) 실시간 처리 시스템의 서버 자원 배치 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121114

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131022

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131227

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees