JP2002505442A5 - - Google Patents

Download PDF

Info

Publication number
JP2002505442A5
JP2002505442A5 JP2000534679A JP2000534679A JP2002505442A5 JP 2002505442 A5 JP2002505442 A5 JP 2002505442A5 JP 2000534679 A JP2000534679 A JP 2000534679A JP 2000534679 A JP2000534679 A JP 2000534679A JP 2002505442 A5 JP2002505442 A5 JP 2002505442A5
Authority
JP
Japan
Prior art keywords
separation
data
quality
peak
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000534679A
Other languages
English (en)
Other versions
JP4360479B2 (ja
JP2002505442A (ja
Filing date
Publication date
Priority claimed from US09/036,767 external-priority patent/US6019896A/en
Application filed filed Critical
Publication of JP2002505442A publication Critical patent/JP2002505442A/ja
Publication of JP2002505442A5 publication Critical patent/JP2002505442A5/ja
Application granted granted Critical
Publication of JP4360479B2 publication Critical patent/JP4360479B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【書類名】 明細書
【発明の名称】 生化学分離の品質の評価に品質評価基準を用いる方法
【特許請求の範囲】
【請求項1】 生化学試料の分析方法であって、
分離ランにおいて、上記試料を複数の構成成分に分離し、上記構成成分に関する物理的特性を示す信号の検出を示す分離データであって複数の試料ピークを有する分離データを、時間又は分離経路に沿った距離のいずれかの関数として作成する工程と、
既知の物理的特性を有する構成成分を有する共移動標準を分離して参照ピークを上記分離データに導入する工程と、
上記分離データに基づいて、分離ランの品質を示す品質評価基準を計算する工程であって、上記分離データにおける試料ピークの分解能を示す値を計算し、上記分離データにおける信号対ノイズ比を示す値を計算し、参照ピークの線形性の程度を求めることを含む工程と、
上記品質評価基準に基づいて、試料を分析する次の工程に進むか又は上記分離ランを繰り返す工程と
を含む方法。
【請求項2】 上記品質評価基準を第1の閾値と比較する工程と、
上記品質評価基準が上記第1の閾値未満の場合に、第1のインジケータを作成する工程と、
上記品質評価基準が上記第1の閾値以上の場合に、上記品質評価基準と第2の閾値とを比較する工程と、
上記品質評価基準が上記第2の閾値未満の場合に、第2のインジケータを作成する工程と、
上記品質評価基準が上記第2の閾値以上の場合に、第3のインジケータを作成する工程と
を含む、請求項1の方法。
【請求項3】 上記第1のインジケータが作成された場合に、上記分離ランを繰り返す工程を含む、請求項2の方法。
【請求項4】 上記第2のインジケータが作成された場合に、上記分離データをマニュアル検査し、上記分離データのマニュアル検査の結果に基づいて上記分離ランを繰り返す工程を含む、請求項3の方法。
【請求項5】 上記第3のインジケータが作成された場合に、上記試料を分析する次の工程に進むことを含む、請求項4の方法。
【請求項6】 上記生化学試料が、アミノ酸、ヌクレオチド及び糖からなる群から選択される生化学モノマーと、DNA、RNA、ペプチド及び炭水化物を含む生化学ポリマーを含み、上記試料の分離工程が、電気泳動分離、カラムクロマトグラフィー及び高性能液体クロマトグラフィーのいずれかを含む、請求項1の方法。
【請求項7】 ポリヌクレオチドの分析方法であって、
上記ポリヌクレオチドの試料の複製を作って増幅生成物を生成させる工程と、
上記増幅生成物中の目標配列を標識する工程と、
増幅生成物にサイズ標準を混合する工程と、
分離ランにおいて上記増幅生成物を分離する工程であって、上記増幅生成物の構成成分を示す信号を検出し、サイズ標準の分離を示す参照ピークを含むデータであって検出信号の変化を示すデータを時間又は分離経路の長さに沿った距離のいずれかの関数として示すことを含む工程と、
上記分離ランの品質を示す品質評価基準を上記データの関数として計算する工程であって、上記データにおけるピーク値の分解能を計算し、上記データの信号対ノイズ比を計算し、上記参照ピークの移動度の線形性の程度を計算することを含む工程と、
上記品質評価基準の値に基づいて、上記品質評価基準が第1の閾値未満の場合に第1のインジケータを作成し、上記品質評価基準が上記第1の閾値を超えかつ第2の閾値未満の場合に第2のインジケータを作成する工程と
を含む方法。
【請求項8】 上記第1のインジケータが作成された場合に、上記分離ランを繰り返し、上記第2のインジケータが作成された場合に、上記分離ランを繰り返すか否かを判断するために上記データをマニュアル評価する工程を含む、請求項7の方法。
【請求項9】 上記品質評価基準が上記第2の閾値を超える場合に、第3のインジケータを作成する工程を含む、請求項7の方法。
【請求項10】 上記ポリヌクレオチドが遺伝子材料を構成し、上記第3のインジケータが作られた場合に、当該方法が上記データから対立遺伝子を同定する工程をさらに含む、請求項9の方法。
【請求項11】 上記分離工程は、キャピラリー電気泳動分離又はキャピラリーアレイ式電気泳動分離のいずれかであり、上記データが電気泳動プロファイルである、請求項7の方法。
【請求項12】 上記分離工程がスラブゲル電気泳動分離を含み、上記データがゲル画像から得られたデータである、請求項7の方法。
【請求項13】 上記増幅工程が、ポリメラーゼ連鎖反応(PCR)で増幅される工程である、請求項7の方法。
【請求項14】 遺伝子材料の分離アッセイ法であって、
上記遺伝子材料を増幅及び標識して増幅生成物を生成させる工程と、
サイズ標準を上記増幅生成物と混合する工程と、
分離ランにおいて、上記増幅生成物及び上記サイズ標準を電気泳動で分離してそれらの構成成分を分離する工程と、
構成成分を示す信号を検出し、上記構成成分のサイズに対応したピーク値を含む分離データであって、検出信号と時間との関係の変化を示す分離データを作成する工程と、
上記分離ランの品質を示す品質評価基準を計算する工程であって、上記ピーク値の分解能を計算し、上記分離データの信号対ノイズ比を計算することを含む工程と、
上記品質評価基準の上記値に基づいて、(i)分析の次工程に進むか、(ii)上記分離ランを繰り返すか否かを判断するために上記分離データをマニュアル評価するか、或いは(iii)上記分離ランを繰り返す工程と
を含む方法。
【請求項15】 上記次工程が上記分離データから対立遺伝子を同定する工程である、請求項14の方法。
【請求項16】 上記分離工程が、スラブゲル電気泳動分離、キャピラリー電気泳動分離及びキャピラリーアレイ式電気泳動分離のいずれかを含み、上記分離データが電気泳動プロファイルである、請求項14の方法。
【請求項17】 上記増幅工程が、ポリメラーゼ連鎖反応によって上記遺伝子材料の所定の部分を増幅する工程である、請求項14の方法。
【請求項18】 上記増幅工程が、上記遺伝子材料の所定の部分をクローニングする工程である、請求項14の方法。
【発明の詳細な説明】
【0001】
【技術分野】
本発明は、広義には生化学的分離法、具体的には、DNAフラグメント(断片)の分離の品質を評価するための品質評価基準(quality metric)の使用に関する。
【0002】
【背景技術】
生化学的分離は、無数の複雑な生物、環境及び工業試料の分析研究で重要な役割を果たす。分離法は、試料中の構成成分を明らかにし、物の性質及び純度の理解に光明を与える。分離法は単純なツールであり、複雑な混合物に関する情報量を増し、情報の質を高める。最も複雑な混合物、特に生化学的起源の混合物は、類似した基本構造と共通した官能基を含んでいる。そのため、構成成分が混合物に残留している限り、構成成分の同定及び定量は、不可能でなければ困難である。混合物中の構成成分を分離すれば、例えば物理的特性(例えば、光吸収、大きさ、質量タグ、色素タグの有無)の検出によってそれらを同定することができる。
【0003】
生化学的分離技術は、食品のタンパク質、脂肪酸含有量及び炭水化物含有量に関する栄養分析;食品の毒(例えば、細菌汚染又は貝毒)に関する分析;ゲル電気泳動及びタンパク質精製を始めとするタンパク質分析;炭水化物の分離、オリゴヌクレオチド及びヌクレチオド、アミノ酸、糖及び生体アミン等の個別分子の分離;農薬その他の合成有機分子の分離及び分析;薬物及び医薬品の分析;血清タンパク質分析等の臨床検査;犯罪及び爆発性化合物の分析;血清有機酸、シアン化物とその関連化合物及び化学兵器の分析;薬物代謝産物の尿検査;カテコールアミンやエピネフリン等の神経伝達物質の分析;リポタンパク質の分離及び分析、ビタミンの分離及び分析;モノクローナル抗体の調製又は精製;並びにタンパク質消化配列決定又は構造分析を始めとして、様々なライフサイエンス及び関連産業で用いられている。これらは網羅的なものでなく、分離法の多数の応用例及び多様な用途を挙げたものである。
【0004】
分離法で得られた分離データのマニュアル検査は、労力と時間がかかる。プロセスの繰返しのため誤差を生じやすく、人間によるデータの主観的な解釈の信頼性のため一貫性に欠ける結果を生じることがある。これは、データ源(すなわち、データが電気泳動分離で得られたものかクロマトグラフィー法で得られたものか)を問わず、また研究対象の生化学的分析物の性状を問わず、あらゆる分離データに一般的に当てはまる。
【0005】
最も一般的な生化学的分離の用途の一つはDNAの分析であり、この分野で最も大きな事業の一つはヒトゲノム計画である。遺伝子解析プロジェクトは、何千、何百万というDNA遺伝子型を決定、解析、検査しなければならない。例えば、糖尿病や心臓病などの多遺伝子性疾患のマッピングには、最大百万の遺伝子型が必要とされると推定されている。
【0006】
遺伝子マッピングは、遺伝子発見の過程で重要な役割を果たす。研究者は、新たな遺伝子マーカーや地図を備えて、急激なペースで新たな遺伝子の位置特定を行える態勢にある。遺伝子連鎖の解析に用いられている最も一般的な遺伝子マーカーは、極めて有益な単純反復配列(SSR)多型である。現在、こうした2、3及び4塩基対(bp)の反復は、スラブゲル電気泳動装置で得られた電気泳動プロファイルのマニュアル検査及びスコアリングによって遺伝子型同定されている。例えば、Mansfield他は、研究者による分離データの初期検査に基づくDNA断片の長さを自動計算法について開示している(David C. Mansfield et al., ‘Automation of Genetic Linkage Analysis Using Fluorescent Microsatellite Markers,’ Genomics, Vol. 24, pp. 225- 233,1994)。最終的な解析はコンピュータで行なわれるが、研究者によって実施される初期スクリーニング段階は依然として存在する。
【0007】
初期スクリーニングの目的は、自動分析プロファイルから、ユーザが容認できない品質とみなすランを除外することである。不良ランは、多数のエラー源から発生する可能性がある。例えば、試料中に不純物が夾雑していたり、DNAが検出できないレベルのときは、不良な分離データを生じる。遺伝子サンプルが良好であったとしても、分離ランの状態は、分離能の劣るマトリックス又は電場の制御の不良不によって損なわれることがある。ユーザは、プロファイルを検査し、データをその後の分析に利用できるか否か或いは当該ランを繰り返す必要があるか否かを判断しなければならない。Mansfield他の技術は、この工程は自動的には行われず、全データを研究者がマニュアルで精査することに依拠している。さらに、良好な分離ランの場合、Mansfield他の技術その他の慣用法では、研究者が所定の情報を分離データから引き出してその情報をコンピュータに入力することが以前として必要とされる。
【0008】
そこで、生化学試料の分析のある段階で自動的に判断する方法が必要とされている。具体的には、解析プロセスにおける後段の一連の行為に関して判断できるように、分離データの解析を自動化することが望ましい。次工程に進む前に、分離ランの品質を自動的に確認することが望ましい。
【0009】
【発明の開示】
生化学試料(サンプル)の分離アッセイを実施する方法は、試料の分離ランを行なって分離データを得ることを含む。データを分析して、分離ランの品質を示す品質評価基準を作成する。この品質評価基準は、アッセイにおける次工程の選択、すなわち、アッセイにおける次の工程に進むか、或いは分離ランを繰り返すかを決定するために用いられる。本発明の好ましい実施形態では、品質評価基準は、データ中の試料ピークの分解能の測定及びデータにおける信号対ノイズ比に基づく。これらの場合に、分離ランにサイズ標準が含まれていれば、品質評価基準は、さらに、サイズ標準の共移動の参照ピークの線形性の程度の測定に基づく。共移動させる定量又は同定用の標準の挙動を分離に利用できる。
【0010】
本方法の特定の実施例では、遺伝子解析は、DNA試料の選択と増幅を含む。増幅生成物は、関心のある目標配列を識別するために標識が付される。電気泳動分離ランを実施して、増幅材料の構成成分を示す信号を検出する。強度が経時的に変化する信号(ピーク)の収集は、分離データを構成する。このデータは、分離ランの分解能(品質)を示す品質評価基準を得るために後で分析される。
【0011】
次に、品質評価基準は、高品質、限界(中位)品質又は低品質分離を区別するために設けられた2つの閾値と比較される。限界品質と低品質のサンプルとを区別するため、品質評価基準が第1の閾値よりも低い場合には第1のインジケータが作られ、同様に、品質評価基準が第2の閾値よりも低い場合には第2のインジケータが作られる。第1及び第2のインジケータは、それぞれ「不合格(FAIL)」及び「精査(REVIEW)」インジケータである。不合格インジケータが作成されると、サンプルの再ラン(再分離)が行なわれる。精査インジケータが作成されると分離データのマニュアル評価が行なわれる。品質評価基準が第2の閾値を超える場合、遺伝子解析はプロセスの次工程(通常は遺伝子型同定工程)で続行される。
【0012】
【発明を実施するため最良の形態】
図1に示すフローチャート100を参照すると、本発明に係る分離アッセイの作業フローは、以下の工程を有する。生化学試料を入手して調製する(ステップ102)。次に、試料の分離操作を行う(ステップ104)。次に、得られた分離データを解析して品質評価基準を得る(ステップ106)。次に、品質評価基準を用いて、分離を繰り返すか否か(ステップ101)、分離データを目視検査するか否か(ステップ103)、又は試料の分析における次工程に進むか否か(ステップ108)を判断する。データの目視検査が求められた場合には、目視検査の結果に基づいて、分離を繰り返すか否か(ステップ105)又は分離の次の工程に進むか否か(ステップ108)の判断が別途なされる。
【0013】
分離における後段の工程の信頼性は分離ランで得られたデータの品質に依存するので、分離ランの品質は常に重要である。従来の技術では、コンピュータ解析用のデータを提示する前に、人間によるデータのスクリーニングが必要とされる。品質評価基準の開発(その計算法の詳細については後述する。)によって、最初の分離ランの「良好さ」つまり品質を判断するための標準化された基準が得られる。また、品質評価基準によって、用途によっては人が介在せずに生成することができる大量のデータを最初に選別するのにコンピュータ解析を利用できるようになり、データ解析プロセスを自動化できる。例えば、ヒトゲノム計画では、数十億塩基対のヒトDNA又は数百万の遺伝子型の解析が遺伝子配列のマッピングに必要とされる。
【0014】
以上のように、本発明は、分離ランの品質を判断し解析プロセスの作業フローを制御するのに品質評価基準を使用する点に特徴を有するもので、分析すべき生化学試料の種類とは無関係である。例えば、本発明の分析技術は、食品のタンパク質、脂肪酸及び炭水化物含有量に関する分析;炭水化物、オリゴヌクレオチド及び個別分子(例えば、ヌクレオチド、アミノ酸、糖及び生体アミン)の分離;農薬その他の合成有機分子の分離及び分析;薬物及び医薬品の分析;犯罪及び爆発性化合物の分析;シアン化物とその関連化合物、及び化学兵器の分析;薬代謝産物の尿検査の実施などに利用できる。
【0015】
様々な公知の分離技術で得られた分離データは内容の点で類似しており、そのためステップ106での処理に容易に付される。例えば、キャピラリー電気泳動分離は、検出信号(例えば、蛍光標識分析物からの放出)を溶出時間の関数として記録したデータを生成する。データにおける各ピークの出現時間は、対応分析物の質量に関連する。スラブゲル電気泳動では、データは、ゲル中の分離経路に沿った分析物の検出を含む。この場合、データは、検出信号を、ゲル上での出発地点から分離経路に沿った距離の関数として記録する。この場合、出発地点からのピーク値の距離は、対応する分析物の電荷の大きさに関係する。一般に、分析物の分離は、分析物の分子量又は電荷のような物理的特性に基づいて起こる。同様に、分離の際に検出される信号は、分析物の物理的特性に基づく。電気泳動分離の場合、例えば、検出特性は蛍光発光であり、蛍光標識の使用によって分析物に付与される。
【0016】
本発明によれば、判断ステップ101及び103は、ユーザが次の適切な行為を判断するのを補助する第1及び第2のインジケータを作成することからなる。したがって、ステップ101では、品質評価基準が第1の数値範囲内にあるときに不合格インジケータが作成され、特定のランが低品質であるとみなされたことをユーザに通知する。その場合、判断記号101からの点線で示すように、ユーザは分離ランを再び実行することを選択する可能性が高い。同様に、ステップ103では、品質評価基準が第2の数値範囲内にあるときに精査インジケータが作成され、対応するランのデータをマニュアルで精査する必要があることをユーザに通知する。ユーザはデータ(通常は電気泳動プロファイルのようなグラフの形態)を目視検査し、再度分離ランを行なうことの適否を判断できる。最後に、許容できる品質とみなされたランに対しては、合格インジケータが作成され、データ解析プロセスの次の工程に解析を進めることができることをユーザに通知する(ステップ108)。
【0017】
品質評価基準について説明するため、本発明に係る分離アッセイの特定の実施例を示す。しかし、本発明の実施は、ある特定の分離法に限定されるものでもないし、特定の種類の化合物の分析に限定されるものでもない。
【0018】
次に図2を参照すると、遺伝子フラグメント解析の作業フローをフローチャート200に示す。この手順は、遺伝子連鎖マップの作成において、ヒトDNAの全遺伝子の同定という最終目標の第1段階で用いられる。
【0019】
まず、ポリヌクレオチド(例えば、DNA、cDNA及び各種形態のRNA)の試料を得る(ステップ202)。次に、増幅として知られるプロセスによって試料のコピー(複製)を作る(ステップ204)。遺伝子材料の増幅は、インビボクローニング及びポリメラーゼ鎖反応(PCR)を始めとする数多くの技術で達成できる。PCR法は短時間で高い収率が得られるので、好ましくはPCR法が用いられる。蛍光標識プライマー又は基質及びPCRその他の増幅法を用いたDNAの酵素合成によって、増幅生成物中の目標配列を標識する。得られた標識増幅生成物を、構成成分のサイズに応じて分析される(ステップ208)。スラブゲル電気泳動、キャピラリー電気泳動及びキャピラリーアレイ式電気泳動を始めとする多数の電気泳動技術が知られている。
【0020】
標識試料の各分離ランには、既知のサイズの複数のDNA断片(マーカー)を含む共移動(co-migrating)サイズ標準を含める。DNAサイズ標準の断片を増幅生成物の成分から識別するために、独特な標識を用いる。慣用技術は、サイズ標準と増幅生成生物とで別々の蛍光タグを使用することである。キャピラリー又はスラブゲル内を物質が移動する際に、励起光源を用いてタグに蛍光を誘起する。発光を近くの検出器に集光し、検出された蛍光強度を示す信号を生成し、時間の関数として強度変化を示す分離データを与えるため得られた測定値を時間基準で記憶する。
【0021】
分離データから、品質評価基準Qを計算する(ステップ210)。品質評価基準は、分離ランの品質を示し、後段の処理を選択するための定量的基礎を研究者に与える。図2から明らかなように、品質評価基準Qは2組の範囲と対比される(ステップ201、203)。本実施例では、特定のランについて計算された評価基準が0.0〜0.2の範囲内にある場合、そのランには不合格インジケータが付される(ステップ212)。計算された評価基準が、0.2〜0.5の範囲内にある場合、そのランには精査インジケータが付される(ステップ214)。計算された評価基準が0.5以上の場合、システムはプロセスの次工程に進む。
【0022】
以下で説明する通り、品質評価基準は0.0〜1.0の範囲内の実数である。そこで、ステップ201及び203で用いられる範囲は、0.2及び0.5の2つの閾値で規定される。計算された品質評価基準が第1の閾値の0.2未満である分離ランは、アッセイ試料が、不純物の混入、試料の調製不備又は分離マトリックスの汚染などによって損なわれていたことを示す。ランが不合格インジケータを有する試料は、再度ランしなければならないものと思われる。フローチャート200のステップ212からの点線は、新たな試料を調製するか或いは単に同じ試料を再度ランすればよいことを示し、その選択は研究者によってなされる。
【0023】
品質評価基準が第2の閾値0.5未満であるが第1の閾値0.2未満でない試料は、低品質の試料であることを示す。しかし、この評価基準は、試料がプロセスの後の工程で遺伝子型同定できる遺伝子座(loci)を少なくとも幾つかは含んでいる可能性があることを示す。そこで、かかるランのデータは、研究者によってマニュアル評価(ステップ216)され、再度ランするのがよいか或いはデータをプロセスの次の工程で利用できるか判断される(ステップ205)。最後に、第2の閾値を超える品質評価基準は、合格インジケータを生成し、データをプロセスの次工程に進めるように指示する。本発明の特定の用途では、データは自動的に対立遺伝子解析(ステップ220)に送られ、データから対立遺伝子が同定される。種々の遺伝子型同定アルゴリズムが知られており、それらの任意のものが本発明と共に利用できる。
【0024】
閾値はユーザが定義し得るものであり、研究者が所望により変更できる。こうして、研究者は、ある所与の実験条件に対して分離ランの品質レベルを調整することができる。
【0025】
分離アッセイの基本工程の概要は図1に示してあり、品質評価基準の使用がプロセスに容易に組み込めることを示す。図2は、品質評価基準の遺伝子解析への典型的な応用例を示す。以下、品質評価基準自体について説明する。
【0026】
図3を参照すると、品質評価基準は分離データから得られる項目からなることが分かる。第一にピーク分解能の項であり、分離ランで検出された試料ピークの全体的分解能の尺度である。次は、分離ランからの検出信号の信号対ノイズ(S/N)比である。最後に、ランにサイズ標準を含めた場合、標準で得られた参照ピークの移動度の線形性指標を計算する。これらの項を結合して、品質評価基準Qを生成させる。
【0027】
まず、図4を参照してピーク分解能の項について説明すると、この図4は、電気泳動図の概略を示し、説明を容易にするため特徴が強調されている。4つのピークA〜Dは試料ピークを表し、それぞれピーク強度I,I,I、I及び検出時間t〜tを有する。図4には、各ピークの強度が最大値の半分となる幅として測定されたバンド幅W〜Wも示してある。
【0028】
本発明によれば、ピーク分解能の項は、内側ピーク(つまり、両端のピーク(ピークAとD)以外のピーク)の各々について分解能評価基準を計算することによって計算される。本発明における分解能評価基準は、内側ピークの両隣の2つのピークを考慮した尺度である。対照的に、従来の分解能は、2つのピーク間の分解能の尺度である。したがって、各内側ピークについて、分解能評価基準は、そのピークから、その右側と左側のピークまでのデータを含む。一般式は以下の通りである。
【数1】
Figure 2002505442
従って、内側ピークB及びCに関する分解能評価基準R及びRは以下の通りである。
【数2】
Figure 2002505442
両側のピークA及びDについては、以下の通り、通常の分解能の計算が用いられる。
【数3】
Figure 2002505442
【0029】
最後に、ピーク分解能の項は、個々の分解能計算値の平均((R+R+R+R)/4)を取ることによって算出される。
【0030】
品質評価基準の次の要素である信号対ノイズ比(S/N)について、図5A及び図5Bを参照して説明する。図4と同様に、図5Aは、電気泳動図の概略を示し、試料の分離ランに対するデータの特徴を誇張して示してある。この計算は、試料に対する分離データ中の「ノイズレベル」を計算する部分と、データの「信号レベル」を計算する部分を有する部分との2つの部分に分かれる。
【0031】
まず、ノイズレベルの計算について説明する。分離データをまずハイパスフィルタリングアルゴリズムによってデジタル前処理して、ベースラインを平坦化する(つまり信号中の低周波数変動の除去。)。
【0032】
次に、ローパスフィルタアルゴリズムを用いてノイズの大きさ(ノイズレベル)を決定する。一般に、この処理は分離データにおける信号の大きさのパーセンタイル分布を観察することを含む。各ピークのパーセンタイル順位を、各パーセンタイル順位におけるピークの数に対してプロットする。得られる曲線は、低強度信号(すなわち、ノイズ)の直線領域と高強度信号(すなわち所望信号)の狭い領域との間で劇的な変化を示す。直線ノイズ領域の接線を伸ばして、パーセンタイル目盛りと交差させる。交点でのパーセンタイル順位に関連する大きさが、分離データにおける観測ノイズの大きさであり、品質評価基準の計算に用いられる。
【0033】
具体的には、図5Aを参照すると、データから最大ピーク値(つまり強度Imaxを有するピークA2)を求める。データにおけるゼロからImaxまでの強度スケールは、N個の間隔に分割される。各間隔iについて、上限はImax×(N−i+1)/Nであり、下限はImax×(N−i)/Nである。図5Aに示す例ではNは7であるが、Nは典型的には100程度であり、一般にユーザが特定し、後で修正し得る。
【0034】
図5Bを参照すると、各間隔内におけるピークの数を、間隔数の関数として求める。例えば、間隔1は、ImaxからImax×(N−1)/Nの強度範囲であり、A1とA2の2つのピークを含む。第2の間隔は、Imax×(N−1)/NからImax×(N−2)/Nの強度範囲であり、B1とB2の2つのピークを含む。間隔数3は1つのピーク(C)を含み、間隔数4は4つのピーク(D1〜D4)を含む。
【0035】
図5Bに示すようなピーク数と間隔数とのプロットは、ある間隔Kでカウントされるピークの数に急激な増加を示す。これは、分離データにおいてピークが主にノイズに起因する領域を示す。Kは、ピーク数対間隔のプロットの変曲点を示す。これは曲線の1次導関数の最大点である。
【0036】
間隔Kが決まれば、ノイズレベルは次式で計算される。
【数4】
Figure 2002505442
次いで、1からKまでの間隔におけるピーク数を求め、以下のように、ピーク閾値Mと対比する。
【数5】
Figure 2002505442
式中、Piは間隔iにおけるピークの数である。
【0037】
ピーク閾値Mは、大きなノイズではなく、ピーク(信号)に帰属しうる最小信号を表す。ピーク閾値はユーザによって選択され、ユーザの要件に応じて変更できる。
【0038】
間隔1〜Kで出現するピークの総数がピーク閾値M未満の場合には、プロセスは間隔K〜Nに対して繰り返す。これは、Imax×(N−K+1)/NからゼロまでのデータをN個の間隔に分割することに等しい。この繰り返しにおける各間隔は、上限値I’max×(N−K+1)/Nと下限値I’max×(N−K)/Nで規定され、I’max は間隔Kの上限Imax×(N−K+1)/Nに等しい。
【0039】
ピーク数と間隔数の関係を新たに求め、Kを選択するための上述の基準に基づいて新たな間隔K’が選択される。ノイズレベルは以下のように再計算される。
【数6】
Figure 2002505442
【0040】
ピーク閾値Mを、間隔1から新たな間隔K’との間のピーク数と対比する。式5の関係が維持される場合には、細分割プロセスを再び繰り返し、式5の関係が成立しなくなり、S/N値の計算に使用される「ノイズレベル」に達するまで、上記プロセスを繰り返し続ける。
【0041】
S/N比の計算で使用される第2の項は「信号レベル」である。信号レベルは、分離データにおいて(F×ノイズレベル)よりも大きいピークの平均ピーク高さと定義される(ただし、Fはノイズ閾値である。)。
【0042】
Fは、ノイズからピークを分離するための、ユーザ選択可能な閾値であり、F>2である。ピーク分析において検出限界は一般にS/N>2のピークとして定義されることから、このカットオフ閾値は2を超える値でなければならない。
【0043】
最後に、観測されたピーク信号の平均は、以下の式で計算される。
【数7】
Figure 2002505442
式中、Hiは、信号レベル項で用いられるピークのピーク高さであり、nはそのようなピークの数である。
【0044】
品質評価基準の第3の要素は、サイズ標準の線形性指標(linearity index)である。サイズ標準は、試料ピークのピーク検出時間を対応するサイズの尺度(例えば、塩基対数又は分子量)に変換する基準を与える。例えば、ポリヌクレオチドの電気泳動分離では、サイズ標準は、100塩基対、200塩基対及び400塩基対の鎖長のヌクレオチド鎖を有するマーカーピークを含む。これらのマーカーの溶出時間は例えばそれぞれ10分、20分及び40分である。30分にピークを有する共移動試料は、サイズ標準の20分と40分にピークをもつ隣接マーカーを内挿することによって、300塩基対の長さを有すると推定されるであろう。内挿の精度は、サイズ標準のサイズと時間の関係の三次曲線の線形性又はフィティングに依存する。なお、すべての分離が直線となるわけでないが、二次、三次又は高次の曲線に正確にフィットさせることができる。したがって、サイズ標準の線形性指標は、線形性度の尺度又はサイズ/時間関係の三次曲線へのフィッティング精度として役立ち、以下の方法で得られる。
【0045】
まず、サイズ標準における成分マーカーの大きさと対応溶出時間を得る。最も小さなマーカーが最初に溶出されることから、標準でのデータにおける最初のピークは最小マーカーの検出に対応する。最小マーカーのサイズ(すなわち、塩基対の数)は、第1のピークの出現時間に対応する。同様に、標準で次に大きいマーカーが、第2のピークの出現時間に対応する時間に現れる。この関係のグラフが図6に示してあり、塩基対の長さ(BP)を溶出時間(t)の関数としてプロットしてある。例えば遺伝子解析では、標準はヌクレオチドマーカー断片の集合であり、各断片の「サイズ」は塩基対で表わされる。他の分離アッセイでは、標準中の成分の「サイズ」は、分子量のような成分の他の物理的特性を表すこともある。
【0046】
次に、最小二乗法を用いて、データの複数の点を三次多項式で近似する。その他の内挿法を利用することもできるが、サイズ標準における全範囲のサイズ(塩基対)に対して三次曲線が最も良好な結果を示すことが確認されている。具体的には、三次多項式y(t)は、以下の項が最小となるように選択される。
【数8】
Figure 2002505442
【0047】
次いで、線形性指標が以下のように計算される。
【数9】
Figure 2002505442
【0048】
最後に、品質評価基準Qは、以下のように計算される。
【数10】
Figure 2002505442
【0049】
スケール定数a,b,cはユーザが選択可能であり、キャピラリー分離でのデフォルト値はa=5、b=0.2、c=1.0である。範囲及びデフォルト値は、プロセスでどのような信号強度及び分解能が観測されるかに応じて、他の形式の分離に調整することができる。
【0050】
以上の説明はキャピラリー電気泳動(CE)分離法に焦点を当てたものであるが、この方法は他の種類の分離アッセイにも等しく適用できる。例えば、ゲル分離で得られるデータは、ピーク検出は時間ではなく距離に基づくものである。しかし、ゲル画像データは、時間尺度を距離尺度に置き換える点を除いて、電気泳動図と同様の分析に付される。クロマトグラフィー分離法では、CE分離法と同様に、分析物は固定された検出器を通過し、信号強度と時間の関係が測定される。
【0051】
本発明の方法は、コンピュータシステム上で動作するソフトウェアの形で容易に実施され、図7A及び図7Bに示す工程からなる方法で実施される。96個のキャピラリーのランで、同量のDNAを分離した。分離の殆どは、評価基準Qが最も高い4つのキャピラリー(図7A)で示されるように、高品質であった。低品質分離は、評価基準Qが最も低いキャピラリー(図7B)にみられるように、幅が広く、弱いピークを生じる。ソフトウェアの実施は、通常の技術を有する平均的プログラマーの範囲内にある。また、ソフトウェアは、試料を調製して分離ランを実行するためのロボットマニピュレータを使用する半自動システムに組み込むことができる。合格、不合格及び精査インジケータは、本発明に基づく各種タスクを実行するためマニピュレータを操作するためのロボット制御部に伝送される信号からなるものである。したがって、不合格ランを有する試料は、自動的に再度実行され、精査とされた試料のランはマニュアル検査用に研究者に送られる。
【0052】
上述した特定の計算は、本発明者が発明を実施するための最良の形態と思料するものを記載したものである。ただし、分離データは、本発明の範囲及び精神から逸脱することなく、分離の品質を示す他の分析、及び分離ランの後の行為を管理するために用いることができる他の分析にかけてもよい。
【図面の簡単な説明】
【図1】 本発明に係る分離アッセイの工程を示すフローチャートである。
【図2】 本発明の例示的用途における工程のフローチャートである。
【図3】 品質評価基準を構成する項目を示す。
【図4】 典型的な電気泳動図の例を示し、ピーク分解能の計算方法を示す。
【図5A】 S/N比の計算方法を示す。
【図5B】 S/N比の計算方法を示す。
【図6】 サイズ標準のグラフを示し、線形性指標を求めるために情報をどのように使用するかを示す。
【図7A】 本発明をDNAフラグメント分離の分析に応用した例を示し、高品質分離で高いQスコアが得られることを示す。
【図7B】 本発明をDNAフラグメント分離の分析に応用した例を示し、低品質サンプルは、それらの低いスコアに基づいて除外されることを示す。
JP2000534679A 1998-03-06 1999-02-25 生化学分離の品質の評価に品質評価基準を用いる方法 Expired - Fee Related JP4360479B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/036,767 US6019896A (en) 1998-03-06 1998-03-06 Method for using a quality metric to assess the quality of biochemical separations
US09/036,767 1998-03-06
PCT/US1999/004246 WO1999045148A1 (en) 1998-03-06 1999-02-25 Method for using a quality metric to assess the quality of biochemical separations

Publications (3)

Publication Number Publication Date
JP2002505442A JP2002505442A (ja) 2002-02-19
JP2002505442A5 true JP2002505442A5 (ja) 2009-04-23
JP4360479B2 JP4360479B2 (ja) 2009-11-11

Family

ID=21890529

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000534679A Expired - Fee Related JP4360479B2 (ja) 1998-03-06 1999-02-25 生化学分離の品質の評価に品質評価基準を用いる方法

Country Status (6)

Country Link
US (1) US6019896A (ja)
EP (1) EP1070142B1 (ja)
JP (1) JP4360479B2 (ja)
AT (1) ATE388240T1 (ja)
DE (1) DE69938296T2 (ja)
WO (1) WO1999045148A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6136541A (en) 1999-02-22 2000-10-24 Vialogy Corporation Method and apparatus for analyzing hybridized biochip patterns using resonance interactions employing quantum expressor functions
US6142681A (en) 1999-02-22 2000-11-07 Vialogy Corporation Method and apparatus for interpreting hybridized bioelectronic DNA microarray patterns using self-scaling convergent reverberant dynamics
US20030170734A1 (en) * 2000-04-28 2003-09-11 Stephen Williams Multiplexed assays using electrophoretically separated molecular tags
AU2002211212A1 (en) * 2000-07-21 2002-02-05 Applera Corporation Methods, systems, and articles of manufacture for evaluating biological data
US20020116135A1 (en) * 2000-07-21 2002-08-22 Pasika Hugh J. Methods, systems, and articles of manufacture for evaluating biological data
GB0119959D0 (en) * 2001-08-16 2001-10-10 Sec Dep Of The Home Department Improvements in and relating to analysis
SE0200949D0 (sv) * 2002-03-27 2002-03-27 Biacore Ab Method and system for curve quality control
WO2003085374A2 (en) * 2002-04-02 2003-10-16 Aclara Biosciences, Inc. Multiplexed assays using electrophoretically separated molecular tags
DE10315581B4 (de) * 2003-04-05 2007-06-28 Agilent Technologies, Inc. (n.d.Ges.d.Staates Delaware), Palo Alto Verfahren zur Qualitätsbestimmung von RNA-Proben
EP1792263A2 (en) 2004-09-02 2007-06-06 Vialogy Corporation Detecting events of interest using quantum resonance interferometry
GB0419482D0 (en) * 2004-09-02 2004-10-06 Sec Dep For The Home Departmen Improvements in and relating to analysis
JP2006230917A (ja) * 2005-02-28 2006-09-07 Kaoru Imaoka 重心動揺計および重心動揺特性評価方法
US7799527B2 (en) * 2005-07-01 2010-09-21 Illumina, Inc. Systems and methods for automated quality control of polymer synthesis
US10488393B2 (en) 2010-09-30 2019-11-26 Robert Bosch Gmbh Device and method for self-referenced confidence test
US20140149050A1 (en) * 2011-07-08 2014-05-29 Shimadzu Corporation Data processing system for chromatograph
EP2783215B1 (en) * 2011-11-22 2018-04-25 Robert Bosch GmbH Method for self-referenced confidence test
EP3742159A1 (en) * 2019-05-24 2020-11-25 Sartorius Stedim Biotech GmbH Chromatography method, method of determining the influence of the interdependency of at least two parameters in a chromatography method and method of obtaining at least one chromatography method parameter
US11285484B2 (en) 2019-08-12 2022-03-29 Intabio, Llc Multichannel isoelectric focusing devices and high voltage power supplies

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0359320A3 (en) * 1988-09-14 1991-10-23 Philips Electronics Uk Limited Chromatography apparatus
US5558998A (en) * 1992-02-25 1996-09-24 The Regents Of The Univ. Of California DNA fragment sizing and sorting by laser-induced fluorescence
US5580728A (en) * 1994-06-17 1996-12-03 Perlin; Mark W. Method and system for genotyping
US5604097A (en) * 1994-10-13 1997-02-18 Spectragen, Inc. Methods for sorting polynucleotides using oligonucleotide tags
US6015667A (en) * 1996-06-03 2000-01-18 The Perkin-Emer Corporation Multicomponent analysis method including the determination of a statistical confidence interval

Similar Documents

Publication Publication Date Title
JP4360479B2 (ja) 生化学分離の品質の評価に品質評価基準を用いる方法
JP2002505442A5 (ja)
Mueller et al. RNA integrity number (RIN)–standardization of RNA quality control
Burns et al. Measurement issues associated with quantitative molecular biology analysis of complex food matrices for the detection of food fraud
JP2008533558A (ja) 遺伝子型分析のための正規化方法
Terp et al. Extraction of cell-free DNA: evaluation of efficiency, quantity, and quality
Hawtin et al. Utility of lab‐on‐a‐chip technology for high‐throughput nucleic acid and protein analysis
CN111394434B (zh) 一种TaqMan探针法的CHO宿主细胞DNA残留检测试剂盒及其应用
US12091705B2 (en) Barcoded molecular standards
Alwi et al. Internal validation of reduced PCR reaction volume of the Qiagen Investigator® Argus X‐12 QS Kit from blood samples on FTA cards
CN116555449A (zh) 一种基于rpa-lfd同时检测多种关键耐药基因的试剂盒及其应用
WO2023021978A1 (ja) 自己免疫疾患を検査する方法
CN112592965B (zh) 一种TaqMan探针法的E.coli宿主DNA残留检测试剂盒
CN107614674B (zh) 检查系统、检查装置以及检查方法
JP3975663B2 (ja) 遺伝子多型解析方法
Coşkun et al. Electrophoresis applications used in medicine
US20050014176A1 (en) Method for quantitative end-point PCR
EP2053401A1 (en) A method for measuring the biological diversity of a sample
Bregu Investigation of Baseline Noise: Establishing an RFU threshold for forensic DNA analysis
JPH11118760A (ja) 核酸断片の電気泳動パターンの解析法
JP2009531037A (ja) 混合試料の特性決定法
JP2004526941A (ja) 化学試料を分析するための装置および方法
Lin et al. Automatic analysis for biochip based on macromolecular compound material
Mwololo et al. An overview of advances in bioinformatics and its application in functional genomics
CN115851934A (zh) 一种单基因检测方法及其应用