JP4113189B2 - Dnaチップのエラースポットの検出方法及びそのシステム - Google Patents

Dnaチップのエラースポットの検出方法及びそのシステム Download PDF

Info

Publication number
JP4113189B2
JP4113189B2 JP2005044333A JP2005044333A JP4113189B2 JP 4113189 B2 JP4113189 B2 JP 4113189B2 JP 2005044333 A JP2005044333 A JP 2005044333A JP 2005044333 A JP2005044333 A JP 2005044333A JP 4113189 B2 JP4113189 B2 JP 4113189B2
Authority
JP
Japan
Prior art keywords
intensity
background
spot
average
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005044333A
Other languages
English (en)
Other versions
JP2005249782A (ja
Inventor
祉 令 呉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2005249782A publication Critical patent/JP2005249782A/ja
Application granted granted Critical
Publication of JP4113189B2 publication Critical patent/JP4113189B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B22CASTING; POWDER METALLURGY
    • B22DCASTING OF METALS; CASTING OF OTHER SUBSTANCES BY THE SAME PROCESSES OR DEVICES
    • B22D17/00Pressure die casting or injection die casting, i.e. casting in which the metal is forced into a mould under high pressure
    • B22D17/20Accessories: Details
    • B22D17/2015Means for forcing the molten metal into the die
    • B22D17/203Injection pistons
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B22CASTING; POWDER METALLURGY
    • B22DCASTING OF METALS; CASTING OF OTHER SUBSTANCES BY THE SAME PROCESSES OR DEVICES
    • B22D17/00Pressure die casting or injection die casting, i.e. casting in which the metal is forced into a mould under high pressure
    • B22D17/20Accessories: Details
    • B22D17/2007Methods or apparatus for cleaning or lubricating moulds

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Mechanical Engineering (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、DNAチップのエラースポットを検出する方法及びそのシステムに係り、さらに詳細には、DNAチップの定量化過程の結果に基づいてエラースポットを検出する方法及びそのシステムに関する。
DNAチップは、従来の分子生物学的な知識に、現代に目覚しい発展を遂げた機械及び電子工学の技術を融合して作られた。DNAチップは、機械自動化及び電子制御技術などを利用して、少なくは数百個から、多くは数十万個のDNAを、とても小さな空間に入れるように作ったものである。すなわち、DNAチップとは、遺伝子検索用として途方もなく多くの種類のDNAを高密度で付けたものを意味する。このようなDNAチップが代えられる従来の代表的な遺伝工学方法としては、southern及びnorthern blot、突然変異検索、そしてDNAシーケンシングがある。
DNAチップは、製作方法によって4つに大別される。そのそれぞれを説明すれば、ピンを利用したマイクロドッティング(面接触)方法で製作されるピンマイクロアレイチップ、インクジェット原理を利用したマイクロドッティング方法で製作されるインクジェットチップ、フォトリソグラフィチップ及びエレクトロニックアレイチップなどがある。
図1は、DNAチップを利用した遺伝子分析方法を示すフローチャートである。
図1を参照すれば、分析のためのサンプルを採取するサンプル前処理過程を行う(S100)。サンプル前処理過程は、血液のような生物学的サンプルから分析のための純粋な遺伝子を抽出する過程である。
そして、サンプル前処理過程を通じて抽出された遺伝子を分析可能なレベルに増幅させる(S110)。増幅過程は、一般的に、酵素重合連鎖反応(Polymerase Chain Reation:PCR)を利用する。
増幅された遺伝子、すなわち、ターゲットサンプルをチップに付ける(S120)。S120は、実験対象となるターゲットサンプルを、遺伝子の情報が仕込まれたオリゴサンプルが植えられたチップに混成させて、同じ配列を有するオリゴサンプルに付ける過程である。
次いで、オリゴプローブに付かず、チップに残存しているターゲットサンプルを除去する(ワッシング)(S130)。そして、オリゴプローブにターゲットサンプルがどの程度で付いているかを感知するために、スキャナーでチップのイメージを読み込む(スキャニング)(S140)。スキャニングイメージを統計的に分析するために定量化する(S150)。
DNAチップの定量化過程が完了した後、色々なアルゴリズム及びチップの各スポットの定量化された値を利用して、統計的な分析過程を通じて患者サンプルであるか正常人サンプルであるかを分別する(S160)。
図1に示されたように、従来の遺伝子分析過程は、一連の連続的な7段階よりなる。図1の第1段階ないし第5段階S100ないしS140間の実験で、色々なエラー原因が発生し、これにより、色々な類型のエラースポットが発生する。エラーによる誤った情報に基づいて定量化過程を経た後に統計的な分析をすれば、前記エラーの原因として正しく定量化されていないスポットデータが分析に合流されて分析の信頼度を落す。また、誤って分別して正常人と患者とを区分できない。
本発明が解決しようとする技術的課題は、DNAチップのエラースポットを検出し、検出されたエラースポットを統計的な分析過程から排除して統計的な分析結果の信頼を高めるためのエラースポットの検出方法及びそのシステムを提供することである。
本発明が解決しようとする他の技術的課題は、DNAチップのエラースポットを検出し、検出されたエラースポットを統計的な分析過程から排除して統計的な分析結果の信頼を高めるためのエラースポットの検出方法をコンピュータで実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体を提供することである。
前記課題を解決するための本発明によるエラースポットの検出方法の一実施形態は、(I)DNAチップの各スポットの位置及び形状を指定し、並びに読み込む領域を設定し、(II)設定された領域で、背景に読み込む領域のピクセルと前面に読み込む領域のピクセルとを区分し、(III)前記背景及び前記前面の各ピクセルから読み込んだ強度のメディアン値を合算し、合算値をピクセル数で割算して前記背景及び前記前面についての各強度の平均を求め、(IV)各ピクセルの強度のメディアン値に基づいて前記背景及び前記前面それぞれについての標準偏差を求める、ことからなるDNAチップのイメージプロセシング過程を通じて、前記スポットの前面強度及び背景強度のそれぞれの平均、標準偏差及びピクセル数よりなる結果ファイルを生成する段階と、前記結果ファイルを受信し、パーシングして、背景強度についての第1平均、第1標準偏差及び背景のピクセル数と、前面強度についての第2平均、第2標準偏差及び前面のピクセル数とを含む入力データを抽出する段階と、前記入力データを用いて、前記DNAチップのそれぞれのスポットの前記背景強度及び前面強度の分散程度を分析する分散分析段階と、前記入力データ及び前記分散程度に基づいて前記背景強度及び前面強度の平均の有意的な差の有無を検証する平均検証段階と、前記検証結果に基づいてエラースポットを判断するエラースポット判断段階と、を含む。
前記課題を解決するための本発明によるエラースポット検出システムの一実施形態は、(I)DNAチップの各スポットの位置及び形状を指定し、並びに読み込む領域を設定し、(II)設定された領域で、背景に読み込む領域のピクセルと前面に読み込む領域のピクセルとを区分し、(III)前記背景及び前記前面の各ピクセルから読み込んだ強度のメディアン値を合算し、合算値をピクセル数で割算して前記背景及び前記前面についての各強度の平均を求め、(IV)各ピクセルの強度のメディアン値に基づいて前記背景及び前記前面それぞれについての標準偏差を求める、ことからなるDNAチップのイメージプロセシング過程を通じて、前記スポットの前面強度及び背景強度のそれぞれの平均、標準偏差及びピクセル数よりなる結果ファイルを生成し、前記結果ファイルを受信し、パーシングして、背景強度についての第1平均、第1標準偏差及び背景のピクセル数と、前面強度についての第2平均、第2標準偏差及び前面のピクセル数とを含む入力データを抽出するデータ入力部と、前記入力データを用いて、前記DNAチップのそれぞれのスポットの前記背景強度及び前面強度の分散程度を分析する分散分析部と、前記入力データ及び前記分散程度に基づいて前記背景強度及び前面強度の平均の有意的な差の有無を検証する平均分析部と、前記検証結果に基づいてエラースポットを判断するエラースポット判断部と、を含む。さらに、前記他の課題を解決するための本発明によるエラースポットの検出方法をコンピュータで実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体の一実施形態は、(I)DNAチップの各スポットの位置及び形状を指定し、並びに読み込む領域を設定し、(II)設定された領域で、背景に読み込む領域のピクセルと前面に読み込む領域のピクセルとを区分し、(III)前記背景及び前記前面の各ピクセルから読み込んだ強度のメディアン値を合算し、合算値をピクセル数で割算して前記背景及び前記前面についての各強度の平均を求め、(IV)各ピクセルの強度のメディアン値に基づいて前記背景及び前記前面それぞれについての標準偏差を求める、ことからなるDNAチップのイメージプロセシング過程を通じて、前記スポットの前面強度及び背景強度のそれぞれの平均、標準偏差及びピクセル数よりなる結果ファイルを生成する段階と、前記結果ファイルを受信し、パーシングして、背景強度についての第1平均、第1標準偏差及び背景のピクセル数と、前面強度についての第2平均、第2標準偏差及び前面のピクセル数とを含む入力データを抽出する段階と、前記入力データを用いて、前記DNAチップのそれぞれのスポットの前記背景強度及び前面強度の分散程度を分析する段階と、前記入力データ及び前記分散程度に基づいて前記背景強度及び前面強度の平均の有意的な差の有無を検証する段階と、前記検証結果に基づいてエラースポットを判断する段階と、を含むことを特徴とする。
本発明によれば、スポットのサイズが小さいか、または正しく整列されずに低い強度を有するスポットまたは一部にのみ飽和された強度を有する類型のスポットを対象として、前面強度及び背景強度の分散程度が大きいスポットをエラースポットとして検出することにより、今後の統計的な分析で正常人のサンプルと患者のサンプルとを誤って分別するエラーを減らす。すなわち、統計的な分析結果の信頼を高める。
以下、添付された図面を参照して本発明をさらに詳細に説明する。
図2は、DNAチップのイメージプロセシング過程を示すフローチャートであり、図3は、イメージスキャニングの一実施形態を示す図面である。
DNAチップのイメージプロセシング過程は、一般的に、スキャニング過程と定量化段階とより構成される。スキャニング過程と定量化過程とは、互いに密接な関係があり、いかなる方式でスキャニングするかによって定量化される値に変動が発生する。
図2及び図3を参照すれば、DNAチップの各スポットの位置と形状及び読み込む領域を設定する(S200)。
そして、設定されたスポットで、背景310に読み込む領域のピクセルと前面320に読み込む領域のピクセルとを区分する(S210)。前面320と背景310とを区分するための色々な方法が存在し、代表的な方法で、固定化円形方法及び流動的な円形方法がある。
固定化円形方法は、全てのスポットの同じサイズ及び形状を有するという仮定で、同じ円を描いて背景及び前面の領域を区分する。流動的な円形方法は、それぞれのスポットごとに異なる形態を帯びており、各スポットのサイズに差があるという点を勘案して、隣接するピクセル間の強度差が大きいピクセルを連結してスポットの形態を描く方法である。
背景及び前面のピクセル領域の区分が完了すれば(S210)、背景及び前面の各ピクセルから読み込んだ強度のメディアン値を合算してピクセル数で割算して背景及び前面についての各強度の平均を求める。また、各ピクセルの強度のメディアン値に基づいて背景及び前面それぞれについての標準偏差を求める。
スポットの強度をスキャニングして定量化する方法も、スポットの領域を区分する方法のように多様である。代表的な定量化方法には、背景標準偏差を利用する方法、スポット領域を利用する方法及び中央点を利用する方法がある。
背景標準偏差を利用する方法は、前面の各ピクセルのメディアン強度が、メディアン背景強度とその標準偏差の1倍数または2倍数とを合算した値より大きいピクセルのパーセントに基づいて定量化する方法である。この方法は、強度の偏差に敏感な長所があるが、パーセントの臨界値を決定し難く、スポットの形状や整列エラーを分別し難いという短所がある。
スポット領域を利用した方法は、スポットの前面に読み込んだ領域の面積であるグリッディングした領域の面積と比較してエラースポットを分類する方法である。
spot shape QC score=(spot area=pR/2pR)/(spot perimeter=R/2)
QC score<=R/2であれば、エラースポット
すなわち、面積を比較した結果、前面に読み込んだ領域の面積がR/2より小さければ、エラースポットとして分類する方法である。この方法は、強度エラーやスポットの広まり現象、背景の不均一性のようなエラーを分別できないという問題点がある。
スポットの中央点を利用する方法は、固定化されてグリッディングしたスポットの中央点と流動的にグリッディングしたスポットの中央点との差を比較して、差が大きいスポットをエラースポットとして分類する方法である。この方法は、強度エラーやスポットの広まり現象のようなエラーを分別できないという問題点がある。
図4は、DNAチップの分析過程で発生するエラー及びそれによる類型を示す図面である。
図4を参照すれば、DNAチップの分析過程で発生するエラー400には、Low DNA amount in the spot、Purity of DNA、Attatchment of glass、Uneven hybridizaion、Suboptimal labeling、Target 2ndary structures、Array surfaces、Dirty pins、Spotting liquid volumn、Scratched surfaces、Uneven coating、Bleedingがある。
このようなエラーによって発生するスキャニングエラーの類型410には、Spot intensity、Spot size、Spot morphology、Alignment error、Bleeding、Background intensity、Background noisyがある。
図5は、図4に示されたエラーの類型として現れる結果を示す図面である。
図5を参照すれば、Intensity variationは、Spot size、Spot morphology、Alignment error、Bleeding、Background noisyによって発生する。Low intensityは、Spot size、Spot morphology、Alignment errorによって発生する。そして、Saturated intensityは、Spot size、Spot morphology、Bleedingによって発生する。
したがって、DNAチップでエラーの類型と結果との連関性を分析すれば、1)低い強度、2)背景強度及び前面強度の不均一性、3)飽和された強度を有するスポットがエラーの類型として分類される。
図6Aは、スポットサイズと強度との関係を示す図面であり、図6Bは、スポット強度の偏差と強度との関係を分析した図面である。
図6Bを参照すれば、強度の偏差が大きいほど低い強度である場合が多いという統計的な結論に到達する。
図7A及び図7Bは、本発明によるエラースポットの検出方法に使われる入力データの一例を示す図面である。
図7A及び図7Bを参照すれば、スポット700の前面720と背景710とを区分し、前面720をなすそれぞれのピクセル強度のメディアンを前面のピクセル数780で割算した平均770及び標準偏差775を求め、背景710をなすそれぞれのピクセル強度のメディアンを背景のピクセル数765で割算した平均755及び標準偏差760を求める。
したがって、本発明によるエラースポットの検出に使われる入力データ750は、前面強度についての平均770、標準偏差775及び前面をなすピクセル数780と背景強度についての平均755、標準偏差760及び背景をなすピクセル数765よりなる。
DNAチップのスポット強度を定量化するプログラムは、多数存在し、各プログラムは、定量化過程の結果として背景及び前面についての平均、標準偏差及びピクセル数を含む。したがって、従来のプログラムを通じた定量化過程が行われれば、定量化過程の結果として出力されるファイルから本発明に必要な変数を抽出する。一般的に、定量化プログラムは、GPRという拡張子を有するファイルを出力ファイルとして出力する。
図8は、本発明によるエラースポットの検出方法の一実施形態を示すフローチャートである。
図8を参照すれば、定量化プログラムは、スポットの前面強度及び背景強度についてのそれぞれの平均、標準偏差及びピクセル数を含む結果ファイルを出力する。定量化プログラムは、従来のプログラムを利用できる。
本発明に必要なスポットの前面及び背景の強度についての平均、標準偏差及びピクセル数よりなる入力データを結果ファイルから抽出するために、結果ファイルをパーシングする(S800)。
そして、前面強度及び背景強度の標準偏差を利用して分散程度を分析する。分散程度を分析するための方法で、f−testを使用する。f−testは、2つの集団間の分散が、有意なレベルで差があるかどうかを検証するテスト方法である。
分散の分析が完了すれば(S805)、分散の程度に基づいて背景強度及び前面強度の平均の有意的な差の有無を検証する(S810ないしS815)。f−testを利用して分析した分散程度の結果が、有意的な意味があれば、平均検証のためにpooled t−testを使用し、有意的な意味がなければ、nonpooled t−testを使用して平均検証する。例えば、f−testの結果値が0.05以上であれば、有意的な意味があると判断し、0.05以下であれば、有意的な意味がないと判断する。有意的な意味の判断のための基準である0.05は、統計的な実験結果によって多少変動させて使用できる。
t−testは、2つの集団間の平均の有意な差の有無を検証するテストである。
Figure 0004113189
数式1は、2つの集団の平均(mg1,mg2)間の差を計算するpooled t−testであって、2つの集団の分散類型が類似した場合に使われる。
Figure 0004113189
Figure 0004113189
数式2及び数式3は、2つの集団間の平均の有意な差tの有無を検証するnonpooled test及び自由度を表す。2つの集団間の分散が大きいほど、自由度を増大させて平均の差を分析する。したがって、分散の程度によって平均の有意的な差が影響を受ける。
分散程度によって、pooled t−testまたはnonpooled t−testを行った後、そのテスト結果に基づいてp−valueを計算する(S825)。p−valueが有意なレベルであれば、被検出対象スポットをエラースポットと判断する(S835)。例えば、p−valueが0.05以上であれば、p−valueを有意なレベルと判断し、被検出対象スポットをエラースポットとして分類する。p−valueの有意なレベルを判断する0.05は、統計的な実験結果によって多少変動して使用できる。
図9は、本発明によるエラースポット検出システムの一実施形態の構成を示すブロック図である。
図9を参照すれば、エラースポット検出システムは、データ入力部900、分散分析部910、平均検証部920、エラースポットの判断部930より構成される。平均検証部920は、分散程度に対応して行われるpooled t−test部922及びnonpooled t−test部924より構成される。
データ入力部900は、定量化過程の結果を含むファイルを受信する。そして、データ入力部900は、ファイルからエラースポットの検出のために必要な入力データを抽出する。エラースポットの検出のために、本発明は、分散分析及び平均検証の過程を行うので、スポットの背景強度及び前面強度についてのそれぞれの平均、標準偏差及びピクセル数を入力データとして抽出する。
分散分析部910は、データ入力部900によって抽出された入力データの標準偏差に基づいて背景強度及び前面強度についての分散程度を分析する。分散分析部910は、f−testを利用して分散を分析する。
平均検証部920は、分散分析部910による分散分析結果に基づいて、背景強度及び前面強度間に平均の有意的な差があるかどうかを検証する。平均検証部920は、t−testを使用して平均の有意な差の有無を検証する。平均検証部920は、分散程度によってpooled t−test部922によるpooled t−testを行うか、またはnonpooled t−test部924によるnonpooled t−testを行う。
例えば、f−testの結果が0.05以上であれば、分散程度が有意的な意味があると判断し、nonpooled t−testを行い、0.05以下であれば、pooled t−testを行う。
エラースポットの判断部930は、平均検証部920の検証結果に基づいて、p−valueを計算し、その計算結果に基づいてエラースポットを判断する。例えば、p−valueが0.05以上であれば、被検出対象スポットをエラースポットと判断する。
図10及び図11は、それぞれのDNAチップから検出されるエラースポットの比率及びエラースポットの類型を示す図面である。
図10を参照すれば、0.7%ないし8.23%ほどのスポットがエラースポットとして検出される。図10で、エラースポットとして検出されたデータを分析すれば、図11のように、前面強度の標準偏差fsdと背景強度の標準偏差bsdとが大きく、前面強度fmdと背景強度bmdとが小さなスポットがほとんどであるが、一部強度の偏差が大きい場合、強度が10,000以上であるにも拘わらず、エラースポットとして検出される。
図12は、エラースポットを除去することによって現れるRobust Mの変化を示す図面である。
図12を参照すれば、Roubst Mの変化が、大きくは2.5ほどの差を示す。これは、分析で変化が1以上である場合、差を分別するカーネルが大きく変化することを勘案すれば、大きい差を有することが分かり、これにより、結果の信頼性を高めうる。
また、本発明は、コンピュータ読み取り可能な記録媒体にコンピュータ読み取り可能なコードとして具現することが可能である。コンピュータ読み取り可能な記録媒体は、コンピュータシステムによって読出されるデータが保存される全ての種類の記録装置を含む。コンピュータ読み取り可能な記録媒体の例としては、ROM、RAM、CD−ROM、磁気テープ、フロッピーディスク、光データ保存装置があり、また、キャリアウェーブ(例えば、インターネットを通じた伝送)状に具現されるものも含む。また、コンピュータ読み取り可能な記録媒体は、ネットワークに連結されたコンピュータシステムに分散されて、分散方式でコンピュータ読み取り可能なコードが保存されかつ実行されうる。
以上、本発明についてその望ましい実施形態を中心に説明した。当業者は、本発明が、本発明の本質的な特性から逸脱しない範囲で変形された形態で具現されうることが分かる。したがって、開示された実施形態は、限定的な観点ではなく、説明的な観点で考慮されねばならない。本発明の範囲は、前述した説明ではなく、特許請求の範囲に現れており、それと同等な範囲内にある全ての差異点は、本発明に含まれたものと解釈せねばならない。
本発明は、DNAチップを利用した遺伝子分析方法でDNAチップのエラースポットを検出するのに使用されうる。
DNAチップを利用した遺伝子分析方法を示すフローチャートである。 DNAチップのイメージプロセシング過程を示すフローチャートである。 イメージスキャニングの一実施形態を示す図面である。 DNAチップの分析過程で発生するエラーとそれによる類型とを示す図面である。 図4に示されたエラーの類型で現れる結果を示す図面である。 スポットのサイズと強度との関係を示す図面である。 スポット強度の偏差と強度との関係を分析した図面である。 本発明によるエラースポットの検出方法に使われる入力データの一例を示す図面である。 本発明によるエラースポットの検出方法に使われる入力データの一例を示す図面である。 本発明によるエラースポットの検出方法の一実施形態を示すフローチャートである。 本発明によるエラースポット検出システムの一実施形態の構成を示すブロック図である。 DNAチップから検出されるエラースポットの比率を示す図面である。 DNAチップから検出されるエラースポットの類型を示す図面である。 エラースポットを除去することによって現れるRobust Mの変化を示す図面である。

Claims (11)

  1. (I)DNAチップの各スポットの位置及び形状を指定し、並びに読み込む領域を設定し、
    (II)設定された領域で、背景に読み込む領域のピクセルと前面に読み込む領域のピクセルとを区分し、
    (III)前記背景及び前記前面の各ピクセルから読み込んだ強度のメディアン値を合算し、合算値をピクセル数で割算して前記背景及び前記前面についての各強度の平均を求め、
    (IV)各ピクセルの強度のメディアン値に基づいて前記背景及び前記前面それぞれについての標準偏差を求める、
    ことからなるDNAチップのイメージプロセシング過程を通じて、前記スポットの前面強度及び背景強度のそれぞれの平均、標準偏差及びピクセル数よりなる結果ファイルを生成する段階と、
    前記結果ファイルを受信し、パーシングして、背景強度についての第1平均、第1標準偏差及び背景のピクセル数と、前面強度についての第2平均、第2標準偏差及び前面のピクセル数とを含む入力データを抽出する段階と、
    前記入力データを用いて、前記DNAチップのそれぞれのスポットの前記背景強度及び前面強度の分散程度を分析する分散分析段階と、
    前記入力データ及び前記分散程度に基づいて前記背景強度及び前面強度の平均の有意的な差の有無を検証する平均検証段階と、
    前記検証結果に基づいてエラースポットを判断するエラースポット判断段階と、を含むことを特徴とするエラースポットの検出方法。
  2. 前記分散分析段階は、前記背景強度及び前面強度のそれぞれの標準偏差に基づいてf−testを行って分散程度を分析する段階を含むことを特徴とする請求項1に記載のエラースポットの検出方法。
  3. 前記平均検証段階は、前記分散程度に基づいてpooled t−testまたはnonpooled t−testを利用して平均の有意的な差を検証する段階を含むことを特徴とする請求項1に記載のエラースポットの検出方法。
  4. 前記平均検証段階は、前記分散程度が大きければ、自由度を増大させて平均の有意的な差を検証する段階を含むことを特徴とする請求項1または3に記載のエラースポットの検出方法。
  5. 前記エラースポット判断段階は、前記平均分析段階の検証結果に基づいて計算したp−valueに基づいてエラースポットを判断する段階を含むことを特徴とする請求項1に記載のエラースポットの検出方法。
  6. 前記エラースポット判断段階は、前記p−valueが0.05以上であれば、エラースポットと判断する段階を含むことを特徴とする請求項5に記載のエラースポットの検出方法。
  7. (I)DNAチップの各スポットの位置及び形状を指定し、並びに読み込む領域を設定し、
    (II)設定された領域で、背景に読み込む領域のピクセルと前面に読み込む領域のピクセルとを区分し、
    (III)前記背景及び前記前面の各ピクセルから読み込んだ強度のメディアン値を合算し、合算値をピクセル数で割算して前記背景及び前記前面についての各強度の平均を求め、
    (IV)各ピクセルの強度のメディアン値に基づいて前記背景及び前記前面それぞれについての標準偏差を求める、
    ことからなるDNAチップのイメージプロセシング過程を通じて、前記スポットの前面強度及び背景強度のそれぞれの平均、標準偏差及びピクセル数よりなる結果ファイルを生成し、
    前記結果ファイルを受信し、パーシングして、背景強度についての第1平均、第1標準偏差及び背景のピクセル数と、前面強度についての第2平均、第2標準偏差及び前面のピクセル数とを含む入力データを抽出するデータ入力部と、
    前記入力データを用いて、前記DNAチップのそれぞれのスポットの前記背景強度及び前面強度の分散程度を分析する分散分析部と、
    前記入力データ及び前記分散程度に基づいて前記背景強度及び前面強度の平均の有意的な差の有無を検証する平均分析部と、
    前記検証結果に基づいてエラースポットを判断するエラースポット判断部と、を含むことを特徴とするエラースポット検出システム。
  8. 前記分散分析部は、前記背景強度及び前面強度のそれぞれの標準偏差に基づいてf−testを行って分散程度を分析することを特徴とする請求項7に記載のエラースポット検出システム。
  9. 前記平均分析部は、前記分散程度に基づいてpooled t−testまたはnonpooled t−testを利用して平均の有意的な差を検証することを特徴とする請求項7に記載のエラースポット検出システム。
  10. エラースポット判断部は、前記平均分析部の検証結果に基づいて計算したp−valueに基づいてエラースポットを判断することを特徴とする請求項7に記載のエラースポット検出システム。
  11. (I)DNAチップの各スポットの位置及び形状を指定し、並びに読み込む領域を設定し、
    (II)設定された領域で、背景に読み込む領域のピクセルと前面に読み込む領域のピクセルとを区分し、
    (III)前記背景及び前記前面の各ピクセルから読み込んだ強度のメディアン値を合算し、合算値をピクセル数で割算して前記背景及び前記前面についての各強度の平均を求め、
    (IV)各ピクセルの強度のメディアン値に基づいて前記背景及び前記前面それぞれについての標準偏差を求める、
    ことからなるDNAチップのイメージプロセシング過程を通じて、前記スポットの前面強度及び背景強度のそれぞれの平均、標準偏差及びピクセル数よりなる結果ファイルを生成する段階と、
    前記結果ファイルを受信し、パーシングして、背景強度についての第1平均、第1標準偏差及び背景のピクセル数と、前面強度についての第2平均、第2標準偏差及び前面のピクセル数とを含む入力データを抽出する段階と、
    前記入力データを用いて、前記DNAチップのそれぞれのスポットの前記背景強度及び前面強度の分散程度を分析する段階と、
    前記入力データ及び前記分散程度に基づいて前記背景強度及び前面強度の平均の有意的な差の有無を検証する段階と、
    前記検証結果に基づいてエラースポットを判断する段階と、を含むことを特徴とするエラースポットの検出方法をコンピュータで実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2005044333A 2004-02-21 2005-02-21 Dnaチップのエラースポットの検出方法及びそのシステム Expired - Fee Related JP4113189B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040011654A KR100590542B1 (ko) 2004-02-21 2004-02-21 Dna 칩의 오류 스팟 검출 방법 및 그 시스템

Publications (2)

Publication Number Publication Date
JP2005249782A JP2005249782A (ja) 2005-09-15
JP4113189B2 true JP4113189B2 (ja) 2008-07-09

Family

ID=34747931

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005044333A Expired - Fee Related JP4113189B2 (ja) 2004-02-21 2005-02-21 Dnaチップのエラースポットの検出方法及びそのシステム

Country Status (5)

Country Link
US (1) US20050186670A1 (ja)
EP (1) EP1569155B1 (ja)
JP (1) JP4113189B2 (ja)
KR (1) KR100590542B1 (ja)
DE (1) DE602005000834T2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101324419B1 (ko) 2006-02-09 2013-11-01 케이엘에이-텐코 코포레이션 웨이퍼의 특성을 결정하기 위한 방법 및 시스템
US7528944B2 (en) * 2006-05-22 2009-05-05 Kla-Tencor Technologies Corporation Methods and systems for detecting pinholes in a film formed on a wafer or for monitoring a thermal process tool
JP5024636B2 (ja) * 2006-06-27 2012-09-12 日本電気株式会社 基板又は電子部品の反り解析方法、基板又は電子部品の反り解析システム及び基板又は電子部品の反り解析プログラム
US7912658B2 (en) * 2008-05-28 2011-03-22 Kla-Tencor Corp. Systems and methods for determining two or more characteristics of a wafer
WO2009155502A2 (en) * 2008-06-19 2009-12-23 Kla-Tencor Corporation Computer-implemented methods, computer-readable media, and systems for determining one or more characteristics of a wafer
US8269960B2 (en) * 2008-07-24 2012-09-18 Kla-Tencor Corp. Computer-implemented methods for inspecting and/or classifying a wafer
US20140307931A1 (en) * 2013-04-15 2014-10-16 Massachusetts Institute Of Technology Fully automated system and method for image segmentation and quality control of protein microarrays

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5784162A (en) * 1993-08-18 1998-07-21 Applied Spectral Imaging Ltd. Spectral bio-imaging methods for biological research, medical diagnostics and therapy
US6044179A (en) * 1997-11-26 2000-03-28 Eastman Kodak Company Document image thresholding using foreground and background clustering
US6245517B1 (en) * 1998-09-29 2001-06-12 The United States Of America As Represented By The Department Of Health And Human Services Ratio-based decisions and the quantitative analysis of cDNA micro-array images
US6633659B1 (en) * 1999-09-30 2003-10-14 Biodiscovery, Inc. System and method for automatically analyzing gene expression spots in a microarray
US20020069033A1 (en) * 2000-09-19 2002-06-06 Rocke David M. Method for determining measurement error for gene expression microarrays
WO2004068136A1 (en) * 2003-01-22 2004-08-12 Rosetta Inpharmatics Llc Improved anova method for data analysis
US7996155B2 (en) * 2003-01-22 2011-08-09 Microsoft Corporation ANOVA method for data analysis

Also Published As

Publication number Publication date
EP1569155B1 (en) 2007-04-11
EP1569155A1 (en) 2005-08-31
DE602005000834T2 (de) 2007-08-16
KR100590542B1 (ko) 2006-06-19
KR20050083245A (ko) 2005-08-26
DE602005000834D1 (de) 2007-05-24
US20050186670A1 (en) 2005-08-25
JP2005249782A (ja) 2005-09-15

Similar Documents

Publication Publication Date Title
JP4113189B2 (ja) Dnaチップのエラースポットの検出方法及びそのシステム
CN107918931B (zh) 图像处理方法及系统及计算机可读存储介质
US6245517B1 (en) Ratio-based decisions and the quantitative analysis of cDNA micro-array images
US10467749B2 (en) Method and system for processing an image comprising spots in nucleic acid sequencing
CN102682224B (zh) 检测拷贝数变异的方法和装置
US7089120B2 (en) Process for evaluating chemical and biological assays
CN111868832B (zh) 识别拷贝数异常的方法
Kim et al. A novel method using edge detection for signal extraction from cDNA microarray image analysis
EP3843034A1 (en) Method and device for detecting bright spots on image, and computer program product
CN112289377B (zh) 检测图像上的亮斑的方法、装置和计算机程序产品
CN116189763A (zh) 一种基于二代测序的单样本拷贝数变异检测方法
CN111180013B (zh) 检测血液病融合基因的装置
KR101771042B1 (ko) 질병 관련 유전자 탐색 장치 및 그 방법
Saberkari et al. A shape-independent algorithm for fully-automated gridding of cDNA microarray images
KR102175857B1 (ko) 무세포 dna 무결성 평가 방법
KR102349023B1 (ko) 뉴클레오티드 서열 변이의 빈도 분포 결정
CN111316366A (zh) 用于同时多变量特征选择、特征生成和样本聚类的方法
CN112669909B (zh) 假阳性样本的排除方法、装置以及电子设备
CN116072217B (zh) 一种单细胞转录组数据可用性处理方法、介质及设备
KR102228852B1 (ko) 무세포 dna 무결성 평가 방법
Rueda Image Processing of Affymetrix Microarrays
CN117976042A (zh) 确定读段质量分数的方法、测序方法及装置
Arteaga-Salas 9 Image Processing of Affymetrix Microarrays
US20090182512A1 (en) Gene information processing apparatus and gene information display apparatus
CN114038506A (zh) 一种微滴式数字pcr高浓度检测方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070404

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070911

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071204

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080401

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080410

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees