JP2016189363A - 半導体外観検査装置および画像処理装置 - Google Patents

半導体外観検査装置および画像処理装置 Download PDF

Info

Publication number
JP2016189363A
JP2016189363A JP2015067920A JP2015067920A JP2016189363A JP 2016189363 A JP2016189363 A JP 2016189363A JP 2015067920 A JP2015067920 A JP 2015067920A JP 2015067920 A JP2015067920 A JP 2015067920A JP 2016189363 A JP2016189363 A JP 2016189363A
Authority
JP
Japan
Prior art keywords
processing
pipeline
image
unit
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015067920A
Other languages
English (en)
Inventor
祐市 桜井
Yuichi Sakurai
祐市 桜井
高志 広井
Takashi Hiroi
高志 広井
忠信 鳥羽
Tadanobu Toba
忠信 鳥羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi High Tech Corp
Original Assignee
Hitachi High Technologies Corp
Hitachi High Tech Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi High Technologies Corp, Hitachi High Tech Corp filed Critical Hitachi High Technologies Corp
Priority to JP2015067920A priority Critical patent/JP2016189363A/ja
Publication of JP2016189363A publication Critical patent/JP2016189363A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Microcomputers (AREA)
  • Image Analysis (AREA)
  • Testing Or Measuring Of Semiconductors Or The Like (AREA)
  • Advance Control (AREA)

Abstract

【課題】
検査対象であるウェハの微細化に伴い、プロセッサの数を増やし対応しなければならない画像処理装置は、プロセッ数の増加により装置が高コスト化する課題が存在した。
【解決手段】
ウェハの外観を検査する半導体外観検査装置であって、ウェハの画像データを検出する画像検出部と、検出された画像データからウェハの欠陥判定処理を行う複数のCPUコアと、CPUコアが行う欠陥判定処理のうち所定の処理を実行する複数のパイプラン演算部を有し、複数のパイプライン演算部で所定の処理を並列処理するアクセラレータ部と、を備える。
【選択図】 図1

Description

本発明は、半導体外観検査装置および画像処理装置に関する。
本技術分野の背景技術として、WO2011/148920公報(特許文献1)がある。この公報には、「並列実行制御処理の柔軟性、拡張性を損なわずに高速化を可能とする。1つまたは複数のメインプロセッサ及び複数のサブプロセッサと、各サブプロセッサの実行制御を行う実行制御回路とを備え、実行制御回路は、各サブプロセッサの実行制御処理のための実行制御用プロセッサと、各サブプロセッサのコマンド起動用のコントロールバス出力手段と、各サブプロセッサからのステータス通知用のステータスバス入力手段と、ステータス通知が動作シーケンス上で次に発行される処理コマンドと1対1の依存関係にあり高速処理するか否かを判定する判定回路と、高速処理する場合に対応する処理起動コマンドを発行するステータスアクセラレータと、実行制御用プロセッサを用いてステータス通知を処理するためのステータスFIFO制御部とを備えるマルチプロセッサシステムを提供する。」と記載されている(要約参照)。
WO2011/148920公報
特許文献1には、「並列実行制御処理の柔軟性、拡張性を損なわずに高速化を可能とするマルチプロセッサシステムを提供できる」、と記載されているが、特許文献1のマルチプロセッサシステムは、例えばヒストグラム処理は高速処理出来ないため、システムの高性能化にはプロセッサの数を増やしてプロセッサあたりの処理データ量を減らさなければならない。そのため、例えば、プロセッサ数の増加により装置が高コスト化する課題が存在した。
そこで、本発明は、画像処理の負荷を低減し、ハードウェア量の増大を抑えて低コスト化、低消費電力化した半導体外観検査装置を提供することを目的とする。
上記課題を解決するために、例えば下記の構成を採用する。
ウェハの外観を検査する半導体外観検査装置であって、ウェハの画像データを検出する画像検出部と、検出された画像データからウェハの欠陥判定処理を行う複数のCPUコアと、CPUコアが行う欠陥判定処理のうち所定の処理を実行する複数のパイプライン演算部を有し、複数のパイプライン演算部で所定の処理を並列処理するアクセラレータ部と、を備える。
本発明によれば、画像処理の負荷を低減し、ハードウェア量の増大を抑えて低コスト化、低消費電力化を実現する。
上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
実施例1の半導体外観検査装置の構成図 実施例1の画像検出部の処理の一例の模式図。 実施例1の命令フェッチ部の構成の一例を示す図 実施例1のアクセラレータ起動データの構成の一例を示す図 実施例1のパイプライン制御データの構成の一例を示す図 実施例1のパイプライン演算部の構成の一例を示す図 実施例1のCPUコアで実施される画像処理の一例のフローチャート 実施例1の画像処理の動作とデータの流れの一例を説明する図 従来の半導体外観検査装置の構成図 従来の半導体外観検査装置の動作とデータの流れの一例 従来の半導体外観検査装置の別の構成図 実施例2の半導体外観検査装置の構成の一例を示す図 実施例2のヒストグラム演算部を説明する構成の一例を示す図 従来の半導体外観検査装置の処理の一例を説明するフローチャート 従来の半導体外観検査装置の処理の一例を説明する模式図 実施例3の半導体外観検査装置の構成の一例を示す図 実施例3のLUT演算部を説明する構成の一例を示す図 実施例4の半導体外観検査装置の構成の一例を示す図 実施例4のデータバッファを説明する図 実施例5の半導体外観検査装置の構成の一例を示す図 実施例6半導体外観検査装置の構成の一例を示す図
以下、実施例を、図面を用いて説明する。
本実施例では、画像処理をパイプラインで高速化することで複数のCPUコアの処理負荷を低減し、画像処理ハードウェア量の増大を抑えて半導体外観検査装置の低コスト化を実現する半導体外観検査装置の例を説明する。
図1は、本実施例の半導体外観検査装置の一例の構成図である。
半導体外観検査装置99は、XYステージ1、ウェハ2、対物レンズ4、イメージセンサ5、集約レンズ6、光源7、アナログ画像情報8、画像検出部31、A/D変換機32、画像データ9、画像処理装置10、サーバ11a、11b、CPU12a、12b、アクセラレータ部13、命令フェッチ部14、パイプライン演算部16a、16b、16c、16d、パイプライン制御バス17、演算結果バス20、命令フェッチバス21、内部バス23、CPUコア24a、24b、画像メモリ25、中央制御部26、画像検出部状態信号27、画像処理装置状態信号28、結果出力部29、画像処理結果データ30、を有する。
結果出力部29は、図示しないGUI(Graphical User Interface)を備えており、オペレータの指示を受け、中央制御部26を介し、装置全体を制御する働きがある。GUIとしては、パーソナルコンピュータの表示モニタ、キーボードやマウス等の入力手段が一般的に用いられる。GUIの制御対象には、例えば、検査シーケンスの制御、検査後に欠陥情報を特徴量に基づいて分類し、検出した欠陥の確認を行う処理、検査のレシピの作成、装置を運用する際に必要なユーティリティの制御、等が存在する。
画像検出部31の構成は以下のとおりである。光源7は、光(例えばUV光、DUV光)を出力する。集約レンズ6は、光源7から出力された光をスリット状に集光し、対物レンズを通して、ウェハ2上に照射する。XYステージ1はウェハ2を所定方向に移動する。対物レンズ4は、ウェハ2上に形成された回路パターンから反射された光を集光し、結像する。イメージセンサ5はTDIセンサ等である。イメージセンサ5は結像した回路パターンの像を撮像し、アナログ画像情報8を出力する。
A/D変換機32は、センサ5から出力されたアナログ画像情報8を画像データ9に変換する。 図2は、画像検出部31がウェハ上チップのデータをセンサ5が取得する処理の一例を示した模式図である。
ウェハ399上にチップ(1)300、チップ(2)301が存在する。
センサ5は、ウェハ399の画像データを取得する。図2では、チップ画像データを5個のCPUコアに分担する例を示している。よって、センサ5によって、チップ(1)300からはCPUコア分担画像データ303〜307が、チップ(2)301からは308〜312が連続的に取得される。
CPU12a、12bの構成は以下のとおりである。画像メモリ25は、画像データ9を受け取る。CPUコア24a、24bは、画像メモリ25が受け取った画像データ9を用いて、所定のデータ処理を実施する。CPUコア24a、24bは、CPUコア内で演算するコア命令と、アクセラレータ部13で演算するアクセラレータ命令と、その他命令を実行する。 アクセラレータ部13は、命令フェッチ部14と複数のパイプライン演算部16により構成され、CPUコア24が行う複数の演算処理のうち、所定の処理を並列処理する。
CPUコア24a、24bは、アクセラレータ命令を実行すると、命令と画像メモリ25のアドレス情報などアクセラレータ処理に必要なアクセラレータ起動データ1499を生成して、アクセラレータ部13の命令フェッチ部14に送信する。命令フェッチ部14は、アクセラレータ起動データ1499を受け取る。
図3は、命令フェッチ部14の一例を説明する図である。
命令フェッチ部14は、起動データ格納部1401、データ読み出し部1402、データバッファ部1403、パイプライン選択部1404、情報合成部1405、を有する。起動データ格納部1401は、アクセラレータ起動データ1499を受け取る。起動データ格納部1401は、一例として、FIFOメモリである。
図4は、アクセラレータ起動データ1499の一例を説明する図である。
アクセラレータ起動データ1499は、命令発行元のCPUコアを一意に識別するコア識別値、アクセラレート命令を一意に示す命令識別値、処理データの先頭メモリアドレス値、処理データの終端メモリアドレス値、を有する。アクセラレータ起動データ1499は、一例として、C言語での構造体変数である。
図3に戻り、データ読み出し部1402は、起動データ格納部1401から、アクセラレータ起動データ1499を受け取り、先頭メモリアドレス値、終端メモリアドレス値を抽出する。
データ読み出し部1402は、命令フェッチバス21を介し、画像メモリ25にメモリ読み出し要求を出す。
データバッファ1403は、命令フェッチバス21を介し、画像データ9のうち先頭メモリアドレス値、終端メモリアドレス値で指定されたデータを受け取る。
パイプライン選択部1404は、起動データ格納部1401から、同様にアクセラレータ起動データ1499を受け取り、アクセラレート命令の命令識別値を抽出する。
パイプライン選択部1404は、抽出したアクセラレート命令を実行可能であるパイプライン演算部16a〜16dの個数と、演算結果バス20の通知によるパイプライン演算部16a〜16dの演算完了状態、から、演算可能なパイプライン演算部を決定し、そのパイプライン演算部を示す一意のパイプラインID番号を生成する。
情報合成部1405は、データバッファ1403から画像データを受け取り、パイプライン選択部1404からパイプラインID番号を受けとり、それら情報を合成してパイプライン制御データ1799を生成する。
図5は、パイプライン制御データ1799の一例を説明する図である。
パイプライン制御データ1799は、命令発行元のCPUコアを一意に識別するコア識別値、演算実施パイプラインを一意に識別するパイプライン識別値、パイプラインで処理するデータ0(先頭)からn(終端)まで、を有する。
図1に戻り、パイプライン演算部16a〜16dは、パイプライン制御バス17を介し、パイプライン制御データ1799を受け取る。
図6は、パイプライン演算部16a〜16dの一例を説明する図である。なお、パイプライン演算部16a〜16dを全て同一の構成とし、代表例としてパイプライン演算部16として説明する。しかしながら、パイプライン演算部16a〜16dの構成は全て同一ではなくても良く、異なる演算種類を実行する異なる構成のパイプライン演算部が、異なる個数で存在してもよい。一例として、パイプライン演算部16a〜16dの全てが異なる演算を実行する異なる構成のパイプライン演算部でもよい。
パイプライン選択部1404は、これらパイプライン演算部16a〜16dの組み合わせについては、すべて既知とする。
パイプライン演算部16は、パイプラインセレクタ1601、パイプライン識別ID1602、パイプライン処理1603、1604、結果書き込み部1605、を有する。
パイプラインセレクタ1601はパイプライン制御データ1799を受け取り、パイプライン識別ID1602と照合する。
パイプライン処理1603は、パイプラインセレクタ1601でパイプライン識別ID1602と合致したパイプライン制御データ1799の処理データ0を用い、処理を行う。
パイプライン処理1604は、パイプライン制御データ1799の処理データ0を用い、処理を行う。
パイプライン処理1603、1604は、パイプライン制御データ1799の処理データnまで、連続し処理を行う。
結果書き込み部1605は、パイプライン処理1604を経た処理結果データを、命令発行元のCPUコアを一意に識別するコア識別値を用いて、演算結果バス20を介して、CPUコア24a、24bのうち該当するCPUコアに、送る。
パイプライン演算部16は、以上のように、演算に必要な特定の処理1603、1604だけで構成されており、特定処理に特化することで、回路規模は汎用のCPUコアに比べ小さく構成可能である。
パイプライン演算部16は、パイプライン制御データ1799の処理データ0から処理データnを1603、1604で処理を行う。処理データ個数が1から10、100と増えるにつれ、パイプライン演算部16は1サイクルごとに演算結果が出るようになり、これは、パイプライン処理の特徴である。
パイプライン演算部16は、また、パイプライン制御データ1799の処理データ0から処理データnを連続して、中断や割り込み、分岐など無く、処理を行う。これは、中断や割り込み、分岐などがあり、またキャッシュメモリアクセス時のキャッシュミスなどがあるCPUコア24a、24bにくらべて、高速に処理を完了することが可能である。
図1のCPUコア24a、24bは、パイプライン演算部16a〜16dからの処理結果データを受け取り、アクセラレータ命令の実行を完了する。
結果出力部30は、画像処理装置10のサーバ11a、11bのCPU12a、12bのCPUコア24a、24bが行った処理結果を統合したものを、装置のユーザに対して処理結果として表示する。
画像処理装置状態信号28は、画像処理装置10でのデータ処理の状況のステータス情報であり、中央制御部26で受け取られる。
画像検出部状態信号27は、画像検出部31の制御の状況のステータス情報であり、中央制御部26で受け取られる。
図7は、CPUコア24a、24bで実施される画像処理の一例のフローチャートを示す。
CPUコア24a、24bにおいて画像処理が開始される(2700)と、画像メモリ25に検査画像が入力される(2701)。入力された検査画像は、位置ずれ検出および/または補正処理が施される(2702)。位置ずれ検出処理および/または補正処理が施された検査画像は、閾値算出処理(2703)される。
閾値算出処理された検査画像は、欠陥判定処理(2704)され、CPUコア24a、24bにおける、画像処理の完了(2705)となる。
図8は、本実施例による半導体外観検査装置99の、画像処理の動作とデータの流れの一例を説明する図である。
画像データ9は、最初のダイ(1)2100の画像2115をCPU12aに分配し、2番目の画像2116をCPU12bに、以下同様にCPU12dまで、転送する。
画像データ9は、ウェハ上のスキャンが機械的に連続して行われるため、次のダイ(2)2101の最初の画像2120をCPU12aに、2番目の画像2121をCPU12bに、以下同様にCPU12dに、順次転送する。
CPU12aからCPU12dでは、分配されたデータを画像処理する。例えばCPU12aにおいては、ダイ(2)2101の画像2121を分配された後、画像処理2108を行う。
以上のように、半導体外観検査装置99は、連続するディジタル画像情報である画像データ9を、複数のCPUに割付けることで欠陥検査を行う。
ここで、本実施例と従来における半導体外観検査装置の比較のため、従来の半導体外観検査装置について、図9を用いて説明する。図9は、従来の半導体外観検査装置の構成図である。
従来の半導体外観検査装置999は、XYステージ1、ウェハ2、対物レンズ4、イメージセンサ5、集約レンズ6、光源7、アナログ画像情報8、画像検出部31、A/D変換機32、画像データ9、画像処理装置10、サーバ11a、11b、CPU12a、12b、内部バス23、CPUコア24a、24b、画像メモリ25、中央制御部26、画像検出部状態信号27、画像処理装置状態信号28、結果出力部29、画像処理結果データ30、を有する。
図1の半導体外観検査装置99の構成と異なる点は、図1のアクセラレータ部13、命令フェッチ部14、パイプライン演算部16a〜16d、パイプライン制御バス17、演算結果バス20、命令フェッチバス21、が備えられていない点である。その他の構成は、既に説明した図1に示された同一の符号を付された構成と、同一の機能を有するので、説明は省略する。
図10は、本実施例による画像分配制御および画像処理を行った場合の従来の半導体外観検査装置999の動作とデータの流れの一例を説明する図である。
画像データ9は、最初のダイ(2)2100の画像2115をCPU12aに分配し、2番目の画像2116をCPU12bに、以下同様にCPU12dまで、転送する。
画像データ9は、ウェハ上のスキャンが機械的に連続して行われるため、次のダイ(2)2101の最初の画像2120をCPU12aに、2番目の画像2121をCPU12bに、以下同様にCPU12dに、順次転送する。
CPU12aからCPU12dでは、分配されたデータを画像処理する。例えばCPU12bにおいては、ダイ(2)2101の画像(5)2121に対し、画像処理1008を行う。
画像処理1008は、本実施例の半導体外観検査装置99の画像処理2108に比べ、処理時間が長大化する。これは、画像処理1008が、CPU12bのCPUコアにおいてCPUコア内で演算するコア命令のみで画像処理1008を実施するからである。
ここで、CPU12bにおける総画像処理時間は2割程度、演算時間が長大化したとすると、画像処理1008と先に行っていた画像処理1011とがオーバラップする時間帯1010が発生する。
先行する画像処理と次のダイの画像処理とがオーバラップする時間帯1010は、画像処理の演算速度を落とす要因であり、画像処理時間がさらに長大化する。検出データ2105のCPUへの分配は、ウェハ上のスキャンが機械的に引き続き行われるため停止せず、画像データ9の生成速度に画像処理速度が追い付かなくなるため、速度のバランスが崩れ、ネットワークバッファオーバフローなど、装置として致命的なエラー発生の原因となる。
図11は、従来の半導体外観検査装置999において、装置として致命的なエラーを発生させないように構成した、画像処理の動作を説明するデータの流れの一例を説明する図である。図11に示した構成例は、図10と違い、CPU数を2台増やし6CPUとした。
画像データ9は、最初のダイ2100の画像1115をCPU12aに分配し、2番目の画像1116をCPU12bに、以下同様にCPU12fまで、転送する。
画像データ9は、ウェハ上のスキャンが機械的に連続して行われるため、次のダイ2101の最初の画像1120をCPU12a、2番目の画像1121をCPU12bに、以下同様にCPU12fに、順次転送する。
CPU12aからCPU12fでは、分配されたデータを画像処理する。
ここで、図11に示す画像処理1108は、CPU台数を2台増やしたことにより、図10に示す画像処理1008に比べ、処理時間が短縮する。これは、CPU台数を2台増やしたことにより、画像1121のサイズが画像2121に比べて4割減となったためである。
画像1121のサイズが減少したことにより、画像処理1108の処理時間が短縮するため、CPUコアにおいてコア命令のみで画像処理を実施しても、画像処理がオーバラップする時間帯の発生を抑えている。
図11に示した構成での従来の半導体外観検査装置999は、前のダイの画像処理と次のダイの画像処理がオーバラップする時間帯が存在せず、装置として致命的なエラーは発生しない。しかし、図1に示す本実施例による半導体外観検査装置99の画像処理に比べてCPU数が2台増加しており、画像処理装置10が2割高コスト化している。
このように、半導体外観検査装置はウェハの微細化、ウェハサイズの大型化にともなう検査画像データの大容量化と、検査スループットの向上要求から、画像処理装置10はCPU数またCPUを搭載するサーバ数増大で対応しているが、CPU数、サーバ数の増加により画像処理部10、また半導体外観検査装置が高コスト化する課題が存在した。
これに対し、本実施例による半導体外観検査装置99は、命令フェッチ部14、複数のパイプライン14a〜16dからなるアクセラレート部13を具備し、画像処理をパイプラインで高速化することで複数のCPUコアの処理負荷を低減し、画像処理ハードウェア量の増大を抑えて、半導体外観検査装置の低コスト化を実現する。以上から、画像処理装置10を低コスト化した半導体外観検査装置を実現可能とした。
本実施例による半導体外検査装置99は、図9の従来例に示す、ウェハの微細化、ウェハサイズの大型化にともなう検査画像データの大容量化と、検査スループットの向上要求に対して画像処理装置10を構成するCPU数、サーバ数を増大する構成とすることなく、高速大容量な並列画像処理を低コストに実現可能なため、装置の低コスト化、低消費電力という面で優れている。
本実施例では、画像処理としてヒストグラム処理を行う半導体外観検査装置において、ヒストグラム処理をパイプライン化で高速化することで複数のCPUコアの処理負荷を低減し、画像処理ハードウェア量の増大を抑えて半導体外観検査装置の低コスト化を実現する半導体外観検査装置の例を説明する。
図12は、本実施例の半導体外観検査装置の一例の構成図である。
半導体外観検査装置1299は、図1の半導体外観検査装置99のパイプライン演算部16a〜16dの演算例として、ヒストグラム演算部1399a〜1399dを有する。
その他の構成は、既に説明した図1に示された同一の符号を付された構成と、同一の機能を有するので、説明は省略する。
本実施例と、実施例1との構成の違いを、図13〜15を用いて詳細に説明する。
図13は、ヒストグラム演算部1399a〜1399dの一例を説明する図である。代表例としてヒストグラム演算部1399として説明する。
ヒストグラム演算部1399は、パイプラインセレクタ1601、パイプライン識別ID1602、メモリ制御部1300、メモリアドレス1301、RAM部1302、インクリメント部1303、ヒストグラム値1304、結果書き込み部1605、を有する。
パイプラインセレクタ1601はパイプライン制御データ1799を受け取り、パイプライン識別ID1602と照合する。
メモリ制御部1300は、パイプラインセレクタ1601でパイプライン識別ID1602と合致したパイプライン制御データ1799の処理データ0を用い、処理データ0の値をメモリアドレス1301に送る。
RAM部1302はメモリアドレス1301を受け取る。
RAM部1302はメモリアドレス1301で受け取ったメモリアドレスに格納されている値を読み出し、ヒストグラム値1304に送る。
インクリメント部1303はヒストグラム値1304に1を加算する。
RAM部1302はメモリアドレス1301で受け取ったメモリアドレスに、インクリメント部1303でヒストグラム値1304に1を加算された値を、格納する。
メモリ制御部1300、RAM部1302、インクリメント部1303は、パイプライン制御データ1799の処理データnまで、連続し処理を行う。
結果書き込み部1605は、パイプライン制御データ1799の処理データnまで連続し処理を行った結果のRAM部1302の全ヒストグラム値1304を読み出し、命令発行元のCPUコアを一意に識別するコア識別値を用いて、演算結果バス20を介して、CPUコア24a、24bのうち該当するCPUコアに送る。
比較のため、従来のヒストグラム処理をCPUコア24a〜24bのCPUコア内で演算するコア命令で処理する流れを、半導体外観検査装置999を例に説明する。
図14は、ヒストグラム処理をCPUコア24a、24bのCPUコア内で演算するコア命令で処理する一例を説明するフローチャート1400である。
CPUコア24a〜24bにおけるヒストグラム処理が開始される(1401)と、全ヒストグラムカウンタが初期化される(1402)。次に、ヒストグラム対象のデータが入力され(1403)、データ値よりヒストグラムカウンタのメモリアドレスを計算し(1404)、計算されたアドレスから保存されていたカウンタ値をロードし(1405)、ロードしたカウンタ値を1インクリメントし(1406)、インクリメントされたカウンタ値を元のアドレスにストアする(1407)。(1403)から(1407)をパイプライン制御データ1799の処理データnまで実行し、終了と判定(1408)されたら、ヒストグラム処理は終了する(1409)。
図15は、図14で示すフローチャートを、模式図の一例として示した図である。図15を用いて、図14の処理を説明する。
図15のCPUコア24a、24bにてフローチャート(1405)〜(1407)を実行すると、メモリ上のヒストグラム変数に対し、ランダムアクセス1500が発生する。
図15のランダムアクセスは、キャッシュメモリを有するCPUコア24a、24bにおいて性能を悪化させる要因である。しかし、制御と演算と記憶装置が分離するノイマンアーキテクチャを採用する一般的なCPUコアについて、図14、図15で説明する、連続データ処理時の性能悪化は、本質的に避けることが出来ない。
これに対し、本実施例による半導体外観検査装置1299は、ヒストグラム処理を複数のヒストグラム処理パイプライン1399a〜1399dで高速化することで複数のCPUコアの処理負荷を低減し、CPU、またサーバなど画像処理ハードウェア量の増大を抑えて、半導体外観検査装置の低コスト化を実現する。本実施例による半導体外検査装置1299は、図9の従来例に示す、ウェハの微細化、ウェハサイズの大型化にともなう検査画像データの大容量化と、検査スループットの向上要求に対して画像処理装置10を構成するCPU数、サーバ数を増大する構成とすることなく、高速な並列ヒストグラム処理を低コストに実現可能なため、装置の低コスト化、低消費電力という面で優れている。
本実施例では、画像処理としてLUT(Look Up Table)処理を行う半導体外観検査装置において、LUT処理をパイプライン化して高速化することで複数のCPUコアの処理負荷を低減し、画像処理ハードウェア量の増大を抑えて半導体外観検査装置の低コスト化を実現する半導体外観検査装置の例を説明する。
画像処理において、LUTは、入力データを処理に適した形に変換するのに使われる。
図16は、本実施例の半導体外観検査装置の一例の構成図である。
半導体外観検査装置1699は、図1の半導体外観検査装置99のパイプライン演算部16a〜16dの演算例として、LUT演算部1798a〜1798dを有する。
その他の構成は、既に説明した図1に示された同一の符号を付された構成と、同一の機能を有するので、説明は省略する。
本実施例と、実施例1との構成の違いを、図17を用いて詳細に説明する。
図17は、LUT演算部1798a〜1798dの一例を説明する図である。代表例としてLUT演算部1798として説明する。
LUT演算部1798は、パイプラインセレクタ1601、パイプライン識別ID1602、メモリ制御部1300、メモリアドレス1301、RAM部1302、階調パターンデータ1703、階調パターン1704、変換後階調値1705、結果書き込み部1605、を有する。
RAM部1302に、あらかじめ階調パターン1704から階調パターンデータ1703を読みだす。
パイプラインセレクタ1601はパイプライン制御データ1799を受け取り、パイプライン識別ID1602と照合する。
メモリ制御部1300は、パイプラインセレクタ1601でパイプライン識別ID1602と合致したパイプライン制御データ1799の処理データ0を用い、処理データ0の値をメモリアドレス1301に送る。
RAM部1302はメモリアドレス1301を受け取る。
RAM部1302はメモリアドレス1301で受け取ったメモリアドレスに格納されている変換後階調値を読み出し、変換後階調値1705に送る。
メモリ制御部1300、RAM部1302、パイプライン制御データ1799の処理データnまで、連続し処理を行う。
結果書き込み部1605は、パイプライン制御データ1799の処理データnまで連続し処理を行った結果の変換後階調値データ1705を、命令発行元のCPUコアを一意に識別するコア識別値を用いて、演算結果バス20を介して、CPUコア24a、24bのうち該当するCPUコアに、送る。
本実施例による半導体外観検査装置1699は、LUT処理を複数のLUT処理パイプライン1798a〜1798dで高速化し、LUT処理をパイプラインで高速化することで複数のCPUコアの処理負荷を低減し、画像処理ハードウェア量の増大を抑えて、半導体外観検査装置の低コスト化を実現する。本実施例による半導体外検査装置1699は、図9の従来例に示す、ウェハの微細化、ウェハサイズの大型化にともなう検査画像データの大容量化と、検査スループットの向上要求に対して画像処理装置10を構成するCPU数を増大する構成とすることなく、高速大容量な並列ヒストグラム処理を低コストに実現可能なため、装置の低コスト化、低消費電力という面で優れている。
本実施例では、画像処理をパイプラインで高速化し、パイプラインへのデータ供給を並列化することでより高効率に並列パイプライン演算を可能とし、複数のCPUコアの処理負荷をさらに低減し、画像処理ハードウェア量の増大を抑えて半導体外観検査装置の低コスト化を実現する半導体外観検査装置の例を説明する。
図18は、本実施例の半導体外観検査装置の一例の構成図である。
半導体外観検査装置2099は、図1の半導体外観検査装置99にデータバッファ15、データバッファ情報18、データバッファバス22を有する。
その他の構成は、既に説明した図1に示された同一の符号を付された構成と、同一の機能を有するので、説明は省略する。
本実施例と、実施例1との構成の違いを、図18〜図19を用いて詳細に説明する。
図19は、データバッファ15の一例を説明する図である。
データバッファ15は、メモリI/O2100、アービタ2101、Bank制御部2012、Read制御部2103、Port制御部2104、マルチバンクメモリ2105a〜2015d、Write制御部2106、を有する。
Read制御部2103は、命令フェッチ部14の起動データ格納部1401から、アクセラレータ起動データ1499を受け取り、先頭メモリアドレス値、終端メモリアドレス値を抽出する。
Read制御部2103は、また、命令フェッチ部14のパイプライン選択部1404から、パイプライン制御データ1799を受け取る。
Read制御部2103は、アービタ2101、メモリI/O2100を介し、画像メモリ25にメモリ読み出し要求を出す。
Bank制御部2102は、メモリI/O2100、アービタ2101を介し、画像データ9のうち先頭メモリアドレス値、終端メモリアドレス値で指定されたデータを受け取る。
Bank制御部2102は、マルチバンクメモリ2105a〜2105dのバンク数に応じ、画像データ9のうち先頭メモリアドレス値、終端メモリアドレス値で指定されたデータを各バンクに分割制御する。
Port制御部2104は、Read制御部からパイプライン制御データ1799を受け取り、パイプライン識別値を抽出し、該当するパイプライン16a〜16dを識別し、該当するパイプライン16a〜16dに接続されたポートのマルチバンクメモリ2105a〜2105dに、Bank制御部2102からの画像データを分配制御する。
Write制御部2106は、パイプライン演算部16a〜16dの演算結果データをアービタ2101、メモリI/O2100を介してWrite制御する。
本実施例による半導体外観検査装置2099は、データバッファ15を具備し、パイプライン16a〜16dに対する処理データのバッファリング、供給をまとめて並列に実施でき、パイプラインでの画像処理高速化をさらに高効率にすることができる。そのため、複数のCPUコアの処理負荷を低減し、画像処理ハードウェア量の増大を抑えて、半導体外観検査装置の低コスト化を実現する。本実施例による半導体外検査装置2099は、図9の従来例に示す、ウェハの微細化、ウェハサイズの大型化にともなう検査画像データの大容量化と、検査スループットの向上要求に対して画像処理装置10を構成するCPU数を増大する構成とすることなく、高速大容量な並列ヒストグラム処理を低コストに実現可能なため、装置の低コスト化、低消費電力という面で優れている。
本実施例では、画像処理を書き換え可能な回路によるパイプラインで高速化することで複数のCPUコアの処理負荷を低減し、画像処理ハードウェア量の増大を抑えて半導体外観検査装置低コスト化を実現する半導体外観検査装置の例を説明する。
図20は、本実施例の半導体外観検査装置の一例の構成図である。
半導体外観検査装置1899は、図1の半導体外観検査装置99に、書き換え制御部1800、書き換え可能アクセラレート部1813を有する。
その他の構成は、既に説明した図1に示された同一の符号を付された構成と、同一の機能を有するので、説明は省略する。
本実施例と、実施例1との構成の違いを、図20を用いて詳細に説明する。
書き換え制御部1800は、パイプライン演算部16a〜16dの構成を、例としてヒストグラム演算とLUT演算の組み合わせのように、任意の演算の組み合わせに書き換えし再構成する。
書き換え制御部1800は、また、命令フェッチ部14にパイプライン演算部16a〜16dの構成情報を送る。これにより、命令フェッチ部14のパイプライン選択部1404にてパイプライン演算部16a〜16dの選択、管理を正確に行う事が可能となる。
本実施例による半導体外観検査装置1899は、パイプライン演算部16a〜16dの構成を書き換えし再構成可能とし、CPUコア24a、24bにおけるプログラムの構成が変化し画像処理アルゴリズムが変更になっても、頻繁に必要とされる処理をパイプラインで高速化することが可能となり、複数のCPUコアの処理負荷を低減し、画像処理ハードウェア量の増大を抑えて、半導体外観検査装置の低コスト化を実現する。
書き換え可能アクセラレート部1813は、例えば、FPGA(Field Programmable Gate Array)によって構成される。
書き換え可能アクセラレート部1813は、例えば、FPGAで構成した場合、CPUコア24a〜CPUコア24bに比べて動作周波数が1/10となる課題が存在する。例えば、CPUコア24aが4GHzで動作するのに対して、書き換え可能アクセラレート部1813は400MHz動作である。
書き換え可能アクセラレート部1813の動作周波数が遅い課題に対しては、アクセラレートする演算機の並列度を上げることで解決する。
本実施例による半導体外観検査装置1899は、パイプライン演算部16a〜16dを、演算に必要な処理1603、1604だけで構成しており、特定処理に特化することで、回路規模は汎用のCPUコアに比べ小さく構成可能である。
また、本実施例による半導体外観検査装置1899は、パイプライン演算部16a〜16dをパイプライン制御データ1799の処理データ0から処理データnを1603、1604で処理を行う。処理データ個数が1から10、100と増えるにつれ、パイプライン演算部16は1サイクルごとに演算結果が出るようになり、これは、パイプライン処理の特徴である
また、本実施例による半導体外観検査装置1899は、パイプライン演算部16a〜16dを、パイプライン制御データ1799の処理データ0から処理データnを連続して、中断や割り込み、分岐など無く、処理を行う。これは、中断や割り込み、分岐などがあり、またキャッシュメモリアクセス時のキャッシュミスなどがあるCPUコア24a、24bにくらべて、高速に処理を完了することが可能である。
以上により、本実施例による半導体外観検査装置1899は、パイプライン演算部16a〜16dを特定処理に特化し、CPUコア24a、24bにくらべ少ない回路規模で実現することで、並列性を向上し実装可能であり、CPUコア24a〜CPUコア24bに対して書き換え可能アクセラレート部1813の動作周波数が遅いという課題を解決している。
本実施例による半導体外検査装置1899は、図9の従来例に示す、ウェハの微細化、ウェハサイズの大型化にともなう検査画像データの大容量化と、検査スループットの向上要求に対して画像処理装置10を構成するCPU数を増大する構成とすることなく、高速大容量な並列ヒストグラム処理を低コストに実現可能なため、装置の低コスト化、低消費電力という面で優れている。
本実施例では、画像処理を、半導体ウェハの検査情報(レシピ)から抽出した回路情報によりパイプラインの構成を書き換え、パイプラインで高速化することで複数のCPUコアの処理負荷を低減し、画像処理ハードウェア量の増大を抑えて半導体外観検査装置低コスト化を実現する半導体外観検査装置の例を説明する。
図21は、本実施例の半導体外観検査装置の一例の構成図である。
半導体外観検査装置1999は、図20の半導体外観検査装置1899に、さらに半導体ウェハの検査情報部1902、抽出画像処理パラメタ1901を有する。
その他の構成は、既に説明した図20に示された同一の符号を付された構成と、同一の機能を有するので、説明は省略する。
本実施例と、実施例5との構成の違いを、図21を用いて詳細に説明する。
画像処理パラメタ1901は、半導体ウェハの検査情報部1902から、CPUコア24a、24bの画像処理アルゴリズムを最適に高速処理するパイプライン演算の種類と個数を抽出し、保存する。
書き換え制御部1800は、パイプライン演算部16a〜16dの構成を、画像処理パラメタ1901を読み出し、指定された演算の組み合わせに書き換えし再構成する。
書き換え制御部1800は、また、命令フェッチ部14にパイプライン演算部16a〜16dの構成情報を送る。これにより、命令フェッチ部14のパイプライン選択部1404にてパイプライン演算部16a〜16dの選択、管理を正確に行う事が可能となる。
本実施例による半導体外観検査装置1999は、CPUコア24a、24bにおけるプログラムの構成が変化し画像処理アルゴリズムが変更になったとしても、自動で最適に、パイプライン演算部16a〜16dの構成を書き換えし再構成可能とし、頻繁に必要とされる処理をパイプラインで高速化することが可能となり、複数のCPUコアの処理負荷を低減し、画像処理ハードウェア量の増大を抑えて、半導体外観検査装置の低コスト化を実現する。
本実施例による半導体外検査装置1999は、図9の従来例に示す、ウェハの微細化、ウェハサイズの大型化にともなう検査画像データの大容量化と、検査スループットの向上要求に対して画像処理装置10を構成するCPU数を増大する構成とすることなく、高速大容量な並列ヒストグラム処理を低コストに実現可能なため、装置の低コスト化、低消費電力という面で優れている。
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード、DVD等の記録媒体に置くことができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
99 半導体外観検査装置
1 XYステージ、2 ウェハ、4 対物レンズ、5 イメージセンサ、6 集約レンズ、7 光源、8 アナログ画像情報、31 画像検出部、32 A/D変換機、9 画像データ、10 画像処理装置、11a〜11b サーバ、12a〜12b CPU、13 アクセラレータ部、14 命令フェッチ部、16a〜16d パイプライン演算部、17 パイプライン制御バス、20 演算結果バス、21 命令フェッチバス、23 内部バス、24a〜24b CPUコア、25 画像メモリ、26 中央制御部、27 画像検出部状態信号、28 画像処理装置状態信号、29 結果出力部、30 画像処理結果データ
399 ウェハ、300 チップ(1)、301 チップ(2)
303〜307、308〜312 CPUコア分担画像データ
1401 起動データ格納部、1402 データ読み出し部、1403 データバッファ部、1404 パイプライン選択部、1405 情報合成部1405
1499 アクセラレータ起動データ
16 パイプライン演算部、1601 パイプラインセレクタ、1602 パイプライン識別ID、1603〜1604 パイプライン処理、1605 結果書き込み部
999 従来の半導体外観検査装置
1399、1399a〜1399d ヒストグラム演算部、1300 メモリ制御部、1301 メモリアドレス、1302 RAM部、1303 インクリメント部、1304 ヒストグラム値
1798、1798a〜1798d LUT演算部、1703 階調パターンデータ、1704 階調パターン、1705 変換後階調値
15 データバッファ、18 データバッファ情報、22 データバッファバス、2100 メモリI/O、2101 アービタ、2102 Bank制御部、2103 Read制御部、2104 Port制御部、2105a〜2105d マルチバンクメモリ、2106 Write制御部
1899、1999 半導体外観検査装置、1800 書き換え制御部、書き換え可能アクセラレート部1813、1902 半導体ウェハの検査情報部、1901 抽出画像処理パラメタ

Claims (11)

  1. ウェハの外観を検査する半導体外観検査装置であって、
    前記ウェハの画像データを検出する画像検出部と、
    前記検出された画像データから前記ウェハの欠陥判定処理を行う複数のCPUコアと、
    前記CPUコアが行う欠陥判定処理のうち所定の処理を実行する複数のパイプライン演算部と、前記CPUコアからの処理命令を受信し、前記複数のパイプライン演算部に前記CPUコアからの処理命令を分配する命令フェッチ部と、を有し、前記複数のパイプライン演算部で前記所定の処理を並列処理するアクセラレータ部と、
    を備える半導体外観検査装置。
  2. 請求項1に記載の半導体外観検査装置であって、
    前記パイプライン演算部は、前記画像データのヒストグラムを計算することを特徴とする半導体外観検査装置。
  3. 請求項1に記載の半導体外観検査装置であって、
    前記パイプライン演算部は、前記画像データの変換後階調値をLUTに記憶し、前記LUTに基づいて演算処理を行うことを特徴とする半導体外観検査装置。
  4. 請求項1に記載の半導体外観検査装置であって、
    前記アクセラレータ部は、前記複数のパイプライン演算部に並列にデータ供給するデータバッファを備える、ことを特徴とする半導体外観検査装置。
  5. 請求項1に記載の半導体外観検査装置であって、
    前記アクセラレータ部を書き換え可能回路で構成したことを特徴とする半導体外観検査装置。
  6. 請求項1に記載の半導体外観検査装置であって、
    前記アクセラレータ部を書き換え回路で構成し、前記ウェハの検査情報に基づいて前記パイプライン演算部の個数または前記パイプライン演算部で処理する演算の種類を決定することを特徴とする半導体外観検査装置。
  7. 画像データを処理する画像処理装置であって、
    前記画像データから画像処理を行う複数のCPUコアと、
    前記CPUコアが行う画像処理のうち所定の処理を実行する複数のパイプライン演算部と、前記CPUコアからの処理命令を受信し、前記複数のパイプライン演算部に前記CPUコアからの処理命令を分配する命令フェッチ部と、を有し、前記複数のパイプライン演算部で前記所定の処理を並列処理するアクセラレータ部と、
    を備える画像処理装置。
  8. 請求項7に記載の画像処理装置であって、
    前記パイプライン演算部は、前記画像データのヒストグラムを計算することを特徴とする画像処理装置。
  9. 請求項7に記載の画像処理装置であって、
    前記パイプライン演算部は、前記画像データの変換後階調値をLUTに記憶し、前記LUTに基づいて演算処理を行うことを特徴とする画像処理装置。
  10. 請求項7に記載の画像処理装置であって、
    前記アクセラレータ部は、前記複数のパイプライン演算部に並列にデータ供給するデータバッファを備える、ことを特徴とする画像処理装置。
  11. 請求項7に記載の画像処理装置であって、
    前記アクセラレータ部を書き換え可能回路で構成したことを特徴とする画像処理装置。
JP2015067920A 2015-03-30 2015-03-30 半導体外観検査装置および画像処理装置 Pending JP2016189363A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015067920A JP2016189363A (ja) 2015-03-30 2015-03-30 半導体外観検査装置および画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015067920A JP2016189363A (ja) 2015-03-30 2015-03-30 半導体外観検査装置および画像処理装置

Publications (1)

Publication Number Publication Date
JP2016189363A true JP2016189363A (ja) 2016-11-04

Family

ID=57239831

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015067920A Pending JP2016189363A (ja) 2015-03-30 2015-03-30 半導体外観検査装置および画像処理装置

Country Status (1)

Country Link
JP (1) JP2016189363A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112655071A (zh) * 2018-09-12 2021-04-13 东京毅力科创株式会社 学习装置、推断装置以及已学习模型

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112655071A (zh) * 2018-09-12 2021-04-13 东京毅力科创株式会社 学习装置、推断装置以及已学习模型
CN112655071B (zh) * 2018-09-12 2024-04-16 东京毅力科创株式会社 学习装置、推断装置以及已学习模型

Similar Documents

Publication Publication Date Title
CN111247533B (zh) 用于神经网络加速的机器学习运行时库
US9342365B2 (en) Multi-core system for balancing tasks by simultaneously comparing at least three core loads in parallel
US20190361747A1 (en) Merging scaled-down container clusters using vitality metrics
EP2707797B1 (en) Automatic load balancing for heterogeneous cores
US20190227936A1 (en) Heterogeneous computing system configured to adaptively control cache coherency
EP3557434B1 (en) Computational resource pipelining in general purpose graphics processing unit
US20130312001A1 (en) Task allocation optimization system, task allocation optimization method, and non-transitory computer readable medium storing task allocation optimization program
US20130332702A1 (en) Control flow in a heterogeneous computer system
US20200073677A1 (en) Hybrid computing device selection analysis
US11288047B2 (en) Heterogenous computer system optimization
CN105700956A (zh) 用于处理分布式作业的方法和系统
US9830731B2 (en) Methods of a graphics-processing unit for tile-based rendering of a display area and graphics-processing apparatus
KR20190116256A (ko) 가변 파면 크기
US10248466B2 (en) Managing workload distribution among processing systems based on field programmable devices
US10353591B2 (en) Fused shader programs
US9898333B2 (en) Method and apparatus for selecting preemption technique
JP2016189363A (ja) 半導体外観検査装置および画像処理装置
US20230409302A1 (en) Computer-readable recording medium storing conversion program and conversion processing method
CN112214443A (zh) 设置于图形处理器中的二次卸载装置和方法
US20200264891A1 (en) Constant scalar register architecture for acceleration of delay sensitive algorithm
US20220222177A1 (en) Systems, apparatus, articles of manufacture, and methods for improved data transfer for heterogeneous programs
US20230205578A1 (en) Error Avoidance Load Balancing Across Distributed Clustered Containerized Environments
US11632275B2 (en) CMOS signaling front end for extra short reach links
US20140208334A1 (en) Computation device and computation execution method
US10877926B2 (en) Method and system for partial wavefront merger

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20170117

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20170124