JP5709840B2 - 動的シグナルの相関分析による、パターン認識、機械学習、および自動遺伝子型分類の迅速な方法 - Google Patents

動的シグナルの相関分析による、パターン認識、機械学習、および自動遺伝子型分類の迅速な方法 Download PDF

Info

Publication number
JP5709840B2
JP5709840B2 JP2012506134A JP2012506134A JP5709840B2 JP 5709840 B2 JP5709840 B2 JP 5709840B2 JP 2012506134 A JP2012506134 A JP 2012506134A JP 2012506134 A JP2012506134 A JP 2012506134A JP 5709840 B2 JP5709840 B2 JP 5709840B2
Authority
JP
Japan
Prior art keywords
genotype
dynamic profile
vector
average
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012506134A
Other languages
English (en)
Other versions
JP2012523645A (ja
Inventor
カンデリアン,サミ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon USA Inc
Original Assignee
Canon US Life Sciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon US Life Sciences Inc filed Critical Canon US Life Sciences Inc
Publication of JP2012523645A publication Critical patent/JP2012523645A/ja
Application granted granted Critical
Publication of JP5709840B2 publication Critical patent/JP5709840B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Organic Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Bioethics (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Description

関連出願の相互参照
本願は、その全体が参照により本明細書に組み込まれている、2009年4月13日に出願された米国特許出願第61/168,649号の利益を主張する。
本発明は、核酸の分析、および生体試料中に存在する遺伝子型の同定のための方法に関する。より具体的には、本発明の実施形態は、核酸の遺伝子型を同定し、核酸の配列を分析するための自動化方法に関する。
核酸の検出は、医薬、法医学的科学、工業的処理、作物および動物の育種、ならびに多くの他の分野にとって重要である。病状(例えば、癌)、感染性の生物(例えば、HIV)、遺伝系統、遺伝子マーカーなどを検出する能力は、疾患診断および予後、マーカーに補助された選択、犯罪現場の特徴の正確な識別、工業用生物を増殖させる能力、ならびに多くの他の技法にとって遍在する技術である。対象とする核酸の完全性の判定は、感染症または癌の病理に関連する場合がある。少量の核酸を検出するための最も強力で基本的な技術の1つは、核酸配列の一部またはすべてを多数回複製し、次いで増幅産物を分析することである。PCRは、いくつかの異なる増幅技法のうちでおそらく最も周知である。
PCRは、DNAの短い切片を増幅するための強力な技法である。PCRを用いると、1つの鋳型DNA分子から出発して、数百万のDNAのコピーを急速に作製することができる。PCRは、1本鎖へのDNAの変性、変性鎖に対するプライマーのアニーリング、および熱安定性DNAポリメラーゼ酵素によるプライマーの伸長という3段階の温度サイクルを含む。このサイクルは、検出および分析されるのに十分なコピーが存在するように繰り返される。原理上は、PCRの各サイクルは、コピー数を2倍にすることができるであろう。実際には、各サイクル後に実現される増倍は、常に2未満である。さらに、PCRサイクリングが続く場合、増幅されたDNA産物の蓄積は、必要とされる反応物の濃度が減少するにつれて最終的に止まる。PCRに関する一般的な詳細については、Sambrook and Russell、Molecular Cloning−A Laboratory Manual(3版)、1〜3巻、Cold Spring Harbor Laboratory、Cold Spring Harbor、N.Y.(2000)、Current Protocols in Molecular Biology、F.M.Ausubelら編、Current Protocols、Greene Publishing Associates,Inc.とJohn Wiley&Sons,Inc.のジョイントベンチャー(2005年にかけて補足された)、およびPCR Protocols A Guide to Methods and Applications、M.A.Innisら編、Academic Press Inc.San Diego、Calif.(1990)を参照。
リアルタイムPCRは、1回のPCRサイクル当たり一般に1回、反応が進行する際に、増幅されるDNA産物の蓄積を測定する技法の発展しつつあるセットを指す。経時的に産物の蓄積をモニターすることにより、反応の効率の判定、ならびにDNA鋳型分子の初期濃度の推定が可能になる。リアルタイムPCRに関する一般的な詳細については、Real−Time PCR:An Essential Guide、K.Edwardsら編、Horizon Bioscience、Norwich、U.K.(2004)を参照。
つい最近では、例えば、マイクロ流体デバイス内での増幅反応を伴う、PCRおよび他の増幅反応を実施するためのいくつかのハイスループット手法、ならびにデバイス内またはデバイス上で増幅核酸を検出および分析するための方法が開発された。マイクロ流体デバイス内での増幅のための試料の熱サイクリングは、2つの方法のうちの1つにおいて通常実現される。第1の方法では、試料溶液がデバイス内に装填され、温度が正しいテンポでサイクルにかけられ、従来のPCR機器と非常に類似している。第2の方法では、試料溶液は、空間的に変化する温度ゾーンを通して、持続的にポンプで送られる。例えば、Lagallyら(Analytical Chemistry 73:565〜570頁(2001))、Koppら(Science 280:1046〜1048頁(1998))、Parkら(Analytical Chemistry 75:6029〜6033頁(2003))、Hahnら(WO2005/075683)、Enzelbergerら(米国特許第6,960,437号)、およびKnappら(米国特許出願公開第2005/0042639号)を参照。
十分な数の元のDNA分子のコピーが存在するようになると、DNAを特徴づけることができる。DNAを特徴づける1つの方法は、DNAが二本鎖DNA(dsDNA)から一本鎖DNA(ssDNA)に移行する際のDNAの解離挙動を調査することである。温度を上昇させてDNAをdsDNAからssDNAに移行させる方法は、「高解像度温度(熱)融解(HRTm)」法、または単に「高解像度融解」法と時折呼ばれる。あるいは、ssDNAからdsDNAへの移行は、様々な電気化学的方法によって観察することができ、これは、システムにわたる電位が変化する際に動的電流を生成する。
融解プロファイル分析は、核酸を分析するのに重要な技法である。いくつかの方法では、二本鎖核酸は、2本の鎖が結合しているかどうかを示す色素の存在下で変性される。そのようなインジケータ色素の例には、SYBR(登録商標)Green Iなどの非特異的結合色素が含まれ、その蛍光効率は、この色素が二本鎖DNAに結合しているかどうかに強く依拠する。混合物の温度が上げられるにつれて、色素からの蛍光が低減することにより、核酸分子が、部分的または完全に融解した、すなわち、解けたことが示される。したがって、温度の関数として色素の蛍光を測定することによって、二本鎖の長さ、GC含量、またはさらには正確な配列に関する情報が得られる。例えば、Ririeら(Anal Biochem 245:154〜160頁、1997)、Wittwerら(Clin Chem 49:853〜860頁、2003)、Liewら(Clin Chem 50:1156〜1164頁(2004)、Herrmannら(Clin Chem 52:494〜503頁、2006)、Knappら(米国特許出願公開第2002/0197630号)、Wittwerら(米国特許出願公開第2005/0233335号)、Wittwerら(米国特許出願公開第2006/0019253号)、Sundbergら(米国特許出願公開第2007/0026421号)、およびKnightら(米国特許出願公開第2007/0231799号)を参照。
核酸を分析するための代替の方法では、核酸ハイブリダイゼーションを検出するための電気化学的バイオセンサーを検出するのにボルタンメトリーが使用される。電気化学的技術は、反応条件を制御しながら、小型化可能であり、正確であり、感度が良い。核酸ハイブリダイゼーションを検出するのに、無標識手法および標識手法の両方が存在する。無標識手法は一般に、核酸に結合されるときの界面の電気的特性の変化、剛性のdsDNAとより柔軟性のssDNAとの間の柔軟性の変化、またはグアニン塩基の電気化学的酸化に依拠する。例えば、Gooding(Electroanalysis 14:1149〜1156頁、2002)、Goodingら(Chem.Commun.2003:1938〜1939頁、2003)、Mearnsら(Electroanalysis 18:1971〜1981頁、2006)、Paleck(Electroanalysis 8:7〜14頁、1996)を参照。核酸ハイブリダイゼーションを検出するための標識手法は、無標識手法より一般的であり、周知である。これらの手法は一般に、酸化還元活性分子を伴い、これは、核酸のワトソン−クリック塩基対同士の間、または核酸二次構造の副溝もしくは主溝中に介在し、したがって、一本鎖核酸と相互作用しない。そのような酸化還元活性分子の例には、Co(Phen) 3+、Co(bpy) 3+、およびメチレンブルーが含まれる。例えば、Mikkelsen(Electroanalysis 8:15〜19頁、1996)、Erdemら(Anal.Chim.Acta 422:139〜149頁、2000)を参照。いくつかの場合では、酸化還元活性分子は、dsDNAまたはssDNAに優先的に結合する。別の代替方法は、電極表面上に固定化された核酸プローブの末端に、フェロセン基などの標識基を結合させることを含む。例えば、Mearnsら(Electrochemistry 18:1971〜1981頁、2006)、Anneら(J.Am.Chem.Soc.128:542〜547頁、2006)、Laiら(Proc.Natl.Acad.Sci.U.S.A.103:4017〜4021頁、2006)、Fanら(Proc.Natl.Acad.Sci.U.S.A.100:9134〜9147頁、2003)、Xiaoら(Proc.Natl.Acad.Sci.U.S.A.103:16677〜16680頁、2006)を参照。一本鎖プローブ分子は、十分に柔軟であり、フェロセン基は、電極表面に十分近接することによって、酸化または還元され得る。しかし、ハイブリダイズすると、剛性の二本鎖核酸分子は、電極表面に垂直に立ち、フェロセン基は、電極から十分に遠く、これは、酸化または還元されない。
これらのシステムはすべて、サイクリックボルタンメトリーによって調べることができる。システムにわたって経時的に増減する電位を印加することによって、多様な電流が標識として生成され、またはDNA分子が酸化もしくは還元される。標的分子のプローブ分子への完全なハイブリダイゼーションは、印加された電圧に対して生成される電流の特徴的な動的プロファイル(dynamic profile)を生じさせる。標的分子が、突然変異遺伝子型を含んでいた場合に起こる不完全なハイブリダイゼーションは、印加された電圧に対して生成される電流の異なる動的プロファイルをもたらす。したがって、異なる核酸配列は、そのそれぞれのボルタモグラムを調査することによって互いに区別することができる。
いくつかの核酸アッセイは、既知の遺伝子型のクラス内の可能な遺伝子型同士間の区別を必要とする。一般に、熱融解(thermal melt)分析について、研究者らは、熱融解プロファイルを視覚的に検査することによって、試料中の核酸の融解温度を求める。しかし、いくつかの核酸アッセイは、1つのヌクレオチドの変化を同定する必要があり、この場合、野生型核酸と突然変異体核酸の間の融解温度(T)の差異はかなり小さい(例えば、0.25℃未満)。このレベルの温度解像度を、視覚的な検査で実現するのは困難である。さらに、融解温度を求める熱融解プロファイルの視覚的検査では、プロファイルに含まれる重要な追加の情報、例えば、プロファイルの全体的な形状および分布などが無視される。
WO2005/075683 米国特許第6,960,437号 米国特許出願公開第2005/0042639号 米国特許出願公開第2002/0197630号 米国特許出願公開第2005/0233335号 米国特許出願公開第2006/0019253号 米国特許出願公開第2007/0026421号 米国特許出願公開第2007/0231799号 米国特許出願公開第2009/0112484号 米国特許出願公開第2007/0231799号 米国特許出願公開第2008/0176230号
Sambrook and Russell、Molecular Cloning−A Laboratory Manual(3版)、1〜3巻、Cold Spring Harbor Laboratory、Cold Spring Harbor、N.Y.(2000) Current Protocols in Molecular Biology、F.M.Ausubelら編、Current Protocols、Greene Publishing Associates,Inc.とJohn Wiley&Sons,Inc.のジョイントベンチャー(2005年にかけて補足された) PCR Protocols A Guide to Methods and Applications、M.A.Innisら編、Academic Press Inc.San Diego、Calif.(1990) Real−Time PCR:An Essential Guide、K.Edwardsら編、Horizon Bioscience、Norwich、U.K.(2004) 、Lagallyら(Analytical Chemistry 73:565〜570頁(2001)) Koppら(Science 280:1046〜1048頁(1998)) Parkら(Analytical Chemistry 75:6029〜6033頁(2003)) Ririeら(Anal Biochem 245:154〜160頁、1997) Wittwerら(Clin Chem 49:853〜860頁、2003) Liewら(Clin Chem 50:1156〜1164頁(2004) Herrmannら(Clin Chem 52:494〜503頁、2006) Gooding(Electroanalysis 14:1149〜1156頁、2002) Goodingら(Chem.Commun.2003:1938〜1939頁、2003) Mearnsら(Electroanalysis 18:1971〜1981頁、2006) Paleck(Electroanalysis 8:7〜14頁、1996) Mikkelsen(Electroanalysis 8:15〜19頁、1996) Erdemら(Anal.Chim.Acta 422:139〜149頁、2000) Mearnsら(Electrochemistry 18:1971〜1981頁、2006) Anneら(J.Am.Chem.Soc.128:542〜547頁、2006) Laiら(Proc.Natl.Acad.Sci.U.S.A.103:4017〜4021頁、2006) Fanら(Proc.Natl.Acad.Sci.U.S.A.100:9134〜9147頁、2003) Xiaoら(Proc.Natl.Acad.Sci.U.S.A.103:16677〜16680頁、2006) Genome Analysis:A Laboratory Manual Series(I〜IV巻)、Cold Spring Harbor Laboratory Press Using Antibodies:A Laboratory Manual、Cold Spring Harbor Laboratory Press Cells:A Laboratory Manual、Cold Spring Harbor Laboratory Press PCR Primer:A Laboratory Manual、Cold Spring Harbor Laboratory Press Molecular Cloning:A Laboratory Manual、Cold Spring Harbor Laboratory Press Stryer,L.(1995)Biochemistry(4版)Freeman、N.Y. Gait、Oligonucleotide Synthesis:A Practical Approach、1984、IRL Press、London Nelson and Cox(2000)、Lehninger、Principles of Biochemistry 3版、W.H.Freeman Pub.、New York、N.Y. Bergら(2002)Biochemistry、5版、W.H.Freeman Pub.、New York、N.Y. Lee,Mら(J Med Chem 36(7):863〜870頁(1993)) Haugland(Handbook of Fluorescent Probes and Research Chemicals、Molecular Probes,Inc.、Eugene、OR(1996))
したがって、特に、熱融解曲線が狭い温度範囲によって区別される場合に、これらの熱融解曲線をより正確に区別し、これらの融解曲線からDNA配列情報を得ることができる、高解像度融解分析のための方法およびシステムが望まれる。1つまたは複数のピークまたは突然変異を含むDNAについての配列情報の検出を促進する熱融解曲線をより正確に識別する、高解像度融解分析についての方法およびシステムも望まれる。プロファイルならびに全体的な形状の特徴の両方を考慮に入れつつ、核酸配列をより正確に同定し、類似配列同士間を区別することができる方法およびシステムも望まれる。ユーザーからの介入および意思決定を最小にして、遺伝子型を迅速に同定することができる方法も望まれる。
本発明は、核酸の分析、および生体試料中に存在する遺伝子型の同定のための方法およびシステムに関する。より具体的には、本発明の実施形態は、生体試料中に存在する核酸の遺伝子型の同一性を決定するのに有用である、核酸の配列を分析し、核酸の遺伝子型を分類するための自動化された方法およびシステムに関する。
したがって一態様では、本発明は、生体試料中に存在する核酸の遺伝子型の同一性を決定するための方法を提供する。この態様によれば、本方法は、生体試料中に含有される未知の遺伝子型の動的プロファイルを生成するステップを含む。動的プロファイルは、独立変数に対して、未知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含む。本方法は、未知の遺伝子型の動的プロファイルを、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ(average)動的プロファイルと相関させることによって、相関ベクトルを生成することも含む。各既知の遺伝子型のアベレージ動的プロファイルは、独立変数に対して、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルのアベレージ測定値を含む。相関ベクトルは、未知の遺伝子型の動的プロファイルと、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルとの間の相関係数を含む。本方法は、相関ベクトルまたはその変換が、許容できる範囲内に入るかどうかを判定することによって、未知の遺伝子型を既知の遺伝子型の1つとして分類し、それによって生体試料中の遺伝子型の同一性が決定されることをさらに含む。
一実施形態では、既知の遺伝子型のアベレージプロファイルは、トレーニングセットから得られ、これは、本明細書に記載されるように調製することができる。別の実施形態では、独立変数は、温度とすることができる。さらなる実施形態では、物理的変化は、核酸の変性とすることができる。別の実施形態では、核酸の変性を表すシグナルは、蛍光である。さらなる実施形態では、独立変数は、電位である。別の実施形態では、物理的変化は、生体試料中の酸化還元活性分子の酸化である。さらなる実施形態では、酸化還元活性分子の酸化を表すシグナルは、電流である。別の実施形態では、未知の遺伝子型が既知の遺伝子型である事後確率が、相関係数から各既知の遺伝子型について計算される。別の実施形態では、本方法は自動化されている。さらなる実施形態では、本方法は、コンピューターを使用する。
さらなる実施形態では、判定ステップは、最大事後確率、および対応する遺伝子型のアベレージ動的プロファイルに対する相関係数が、許容できる既定の閾値内に入るかどうかを判定することによって、未知の遺伝子型を分類し、それによってこの遺伝子型を同定することを含む。別の実施形態では、相関ステップは、各既知の遺伝子型のクラス条件付き密度を使用して、既知の遺伝子型のクラス内の既知の遺伝子型のそれぞれについて、未知の遺伝子型が既知の遺伝子型である尤度を計算することを含む。相関ステップは、計算された尤度から、生体試料が各既知の遺伝子型を含有する事後確率を計算することも含む。一実施形態では、事後確率は、ベイズの定理を使用して計算される。別の実施形態では、クラス条件付き密度は、各遺伝子型についての平均(mean)変換型ベクトル(transformed vector)(本明細書で平均ベクトルとも呼ばれる)および共分散行列を使用して計算される。一実施形態では、平均変換型ベクトルおよび共分散行列は、トレーニングセットから得られる各遺伝子型のグループ化された変換型ベクトルを含む行列から得られる。別の実施形態では、相関ベクトルはあるベクトルに変換され、変換型ベクトルの各要素は正規分布している。さらなる実施形態では、変換型ベクトルの要素は、球座標として表現される。別の実施形態では、動的プロファイルは、所定の平均値および標準偏差を有するように正規化される。
別の実施形態では、生体試料中に存在する核酸の遺伝子型の同一性を決定する方法は、陽性対照動的プロファイルを使用して、独立変数のシフトおよびスケール変化を補正するステップをさらに含む。したがって、この第1の態様の方法は、(1)対照遺伝子型の陽性対照動的プロファイルを生成するステップであって、陽性対照動的プロファイルは、独立変数に対して、対照遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含むステップと、(2)陽性対照動的プロファイルを、対照遺伝子型の標準参照対照(standard reference control)動的プロファイルと比較することによって、独立変数のシフト値を求めるステップと、(3)陽性対照動的プロファイルおよび未知の遺伝子型の動的プロファイルの独立変数をシフト値によってシフトするステップとをさらに含む。
第2の態様では、本発明は、既知の遺伝子型のクラス内から、ある既知の遺伝子型を装置に認識させるためのトレーニングセットを生成する方法を提供する。このトレーニングセットは、本明細書に記載される生体試料中に存在する核酸の遺伝子型の同一性を決定する方法において特に有用である。トレーニングセットは、後に未知の遺伝子型を分類することができるように、既知の遺伝子型のクラス内から、ある既知の遺伝子型を装置、例えばコンピューターに認識させる。本発明のこの第2の態様によれば、本方法は、既知の遺伝子型のクラス内の各既知の遺伝子型について、同じ遺伝子型の複数の動的プロファイルをグループ化することを含む。各動的プロファイルは、独立変数に対して、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含む。本方法は、動的プロファイルのそれぞれを正規化することと、同じ遺伝子型の正規化動的プロファイルをアベレージすることによって、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ正規化動的プロファイルを得ることとをさらに含む。本方法は、各動的プロファイルを、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ正規化動的プロファイルと相関させることによって、各動的プロファイルについての相関ベクトルを生成することをさらに含む。各相関ベクトルは、既知の遺伝子型のクラス内の各既知の遺伝子型の各アベレージ正規化動的プロファイルに対する動的プロファイルの相関係数を含む。
本発明のこの第2の態様の方法は、遺伝子型によって一緒にグループ化されたとき、変換型ベクトルの要素のそれぞれが正規分布するように相関ベクトルを変換することも含む。さらに、本方法は、既知の遺伝子型のクラス内の各既知の遺伝子型について1つの行列が存在するように、各変換型ベクトルを変換型ベクトルの行列にコンパイルすることを含む。本方法は、(i)要素が各既知の遺伝子型についてのアベレージ変換型ベクトルを含む、平均変換型ベクトルを生成することであって、変換型ベクトルは、各コンパイルされた行列のアベレージであることと、(ii)コンパイルされた行列のそれぞれの共分散行列を計算することによって、既知の遺伝子型についての共分散行列を計算することとをさらに含む。したがって、トレーニングセットは、各既知の遺伝子型についてのアベレージ正規化動的プロファイル、各既知の遺伝子型についての平均変換型ベクトル、および各既知の遺伝子型についての共分散行列を含む。
一実施形態では、トレーニングセットを生成する方法は、上述した陽性対照動的プロファイルを使用して、検知される独立変数のシフトおよびスケール変化を補正するステップをさらに含む。この実施形態では、陽性対照動的プロファイルおよび既知の遺伝子型の動的プロファイルの独立変数は、シフト値によってシフトされる。さらなる実施形態では、各動的プロファイルは、所定の平均値および標準偏差を有するように正規化される。
別の実施形態では、本方法は、各相関ベクトルをn球座標に転換するステップをさらに含み、nは、可能な突然変異のすべてを構成する遺伝子型の数より1小さい。一実施形態では、本方法は、各相関ベクトルを球座標に転換するステップを含む。さらに別の実施形態では、各動的プロファイルは、同じ既知の遺伝子型の動的プロファイル同士間の分離を最小にしつつ、既知の遺伝子型のクラス内の異なる既知の遺伝子型の動的プロファイル同士間の分離を最大にするように選択される範囲にわたって測定される独立変数に対して、各既知の遺伝子型を含有する各核酸の物理的変化を表すシグナルの測定値を含む。
別の態様では、本発明は、生体試料中に存在する核酸の遺伝子型の同一性を決定する方法を提供する。この態様によれば、本発明は、生体試料中に含有される未知の遺伝子型の動的プロファイルを生成することを含む。動的プロファイルは、独立変数に対して、未知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含む。本方法は、未知の遺伝子型の動的プロファイルを、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルと相関させることによって、相関ベクトルを生成することも含む。各既知の遺伝子型のアベレージ動的プロファイルは、トレーニングセット中に設けられ、独立変数に対して、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルのアベレージ測定値を含む。相関ベクトルは、未知の遺伝子型の動的プロファイルと、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルとの間の相関係数を含む。
本方法は、各既知の遺伝子型のクラス条件付き密度を使用して、既知の遺伝子型のクラス内の既知の遺伝子型のそれぞれについて、未知の遺伝子型が既知の遺伝子型である尤度を計算することをさらに含む。クラス条件付き密度は、各遺伝子型についての平均変換型ベクトルおよび共分散行列を使用して計算される。平均変換型ベクトルおよび行列は、トレーニングセットから得られる各遺伝子型についてのグループ化された変換型ベクトルを含む行列から得られる。さらに、本方法は、計算された尤度から、生体試料が各既知の遺伝子型を含有する事後確率を計算することを含む。本方法は、生体試料がある遺伝子型を含有する事後確率が、許容できる閾値内に入るかどうかを判定することによって、未知の遺伝子型が、既知の遺伝子型の1つとして分類されるかどうかを判定し、それによって生体試料中の核酸の遺伝子型の同一性が決定されることをさらに含む。
一実施形態では、事後確率はベイズの定理を使用して計算される。別の実施形態では、本方法は、上述した陽性対照動的プロファイルを使用して、独立変数のシフトおよびスケール変化を補正するステップをさらに含む。さらなる実施形態では、各動的プロファイルは、所定の平均値および標準偏差を有するように正規化される。別の実施形態では、本発明のこの態様において利用されるトレーニングセットは、本明細書に記載されるように調製される。別の実施形態では、各動的プロファイルは、所定の平均値および標準偏差を有するように正規化される。さらなる実施形態では、トレーニングセットは、上述した陽性対照動的プロファイルを使用して、独立変数のシフトおよびスケール変化を補正するステップを用いて調製される。
なおさらなる実施形態では、許容できる閾値内に入る事後確率は、95%超である。別の実施形態では、本方法は、相関ベクトルが許容できる範囲内に入るかどうかを判定することによって、既知の遺伝子型の1つが、生体試料中に存在する未知の遺伝子型と同一であるかどうかを判定することをさらに含む。一実施形態では、許容できる範囲は、動的プロファイル内で、独立変数に対するシグナルの測定値の既定の閾値百分率を含むトレーニングセットの共分散行列の固有ベクトルによって画定される楕円体である。別の実施形態では、相関ベクトルの要素は、各要素が正規分布した、同じ数の要素を有するベクトルに変換される。別の実施形態では、本方法は、各相関ベクトルをn球座標に転換することをさらに含み、nは、可能な突然変異のすべてを構成する遺伝子型の数より1小さい。
追加の実施形態では、本方法は、
(a)各遺伝子型についての平均変換型ベクトルおよびパラメータ行列を使用して、既知の遺伝子型のクラスについてのクラス内散乱(within−class scatter)行列を計算するステップと、各遺伝子型についての平均変換型ベクトルおよびパラメータ行列を使用して、既知の遺伝子型のクラスのクラス間散乱(between−class scatter)行列を計算するステップと、(c)クラス内散乱行列の行列式とクラス間散乱行列の行列式との比である分離比を求めるステップと、独立変数についての分離最大化範囲を求めるステップであって、分離最大化範囲は、分離比を最大にするように選択されるステップとをさらに含む。この実施形態では、各動的プロファイルは、分離最大化範囲にわたって測定される独立変数に対して、各既知の遺伝子型を含有する各核酸の物理的変化を表すシグナルの測定値を含む。
別の態様では、本発明は、生体試料中に存在する核酸の遺伝子型の同一性を決定するためのシステムを提供する。この態様によれば、本システムは、生成モジュール、相関モジュール、クラス条件付き密度モジュール、事後確率モジュール、および判定モジュールを備える。生成モジュールは、生体試料中に含有される未知の遺伝子型の動的プロファイルを生成することができる。動的プロファイルは、独立変数に対して、未知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含む。相関モジュールは、未知の遺伝子型の動的プロファイルを、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルと相関させることによって、相関ベクトルを生成することができる。各既知の遺伝子型のアベレージ動的プロファイルは、トレーニングセット中に設けられ、独立変数に対して、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルのアベレージ測定値を含む。相関ベクトルは、未知の遺伝子型の動的プロファイルと、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルとの間の相関係数を含む。
クラス条件付き密度モジュールは、既知の遺伝子型のそれぞれのクラス条件付き密度を使用して、既知の遺伝子型のクラス内の既知の遺伝子型のそれぞれについて、未知の遺伝子型が既知の遺伝子型である尤度を計算することができる。クラス条件付き密度は、各遺伝子型の平均変換型ベクトルおよび共分散行列を使用して計算される。平均変換型ベクトルおよび共分散行列は、トレーニングセットから得られる各遺伝子型についてのグループ化された変換型ベクトルを含む行列から得られる。事後確率モジュールは、計算された尤度から、生体試料が各既知の遺伝子型を含有する事後確率を計算することができる。判定モジュールは、最大事後確率を有する既知の遺伝子型が、許容できる閾値内に入るかどうかを判定することによって、未知の遺伝子型が、最大事後確率を有する遺伝子型として分類されるかどうかを判定することができ、それによって生体試料中の遺伝子型の同一性が決定される。
一実施形態では、事後確率モジュールは、ベイズの定理を使用して事後確率を計算する。別の実施形態では、本システムは、エラー補正モジュールをさらに備える。エラー補正モジュールは、陽性対照プロファイルを対照遺伝子型の既知のプロファイルと比較することによって、独立変数のシフト値を求めることができる。エラー補正モジュールは、シフト値による、未知の遺伝子型の動的プロファイル内の独立変数のシフトを実施することができる。
さらなる実施形態では、本システムは、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイル、およびパラメータ行列を含むトレーニングセットモジュールも備える。パラメータ行列の要素は、相関ベクトルである。各相関ベクトルは、動的プロファイルと、既知の遺伝子型のクラス内の各既知の遺伝子型の各アベレージ動的プロファイルとの間の相関係数を含む。別の実施形態では、アベレージ動的プロファイルは、アベレージ正規化動的プロファイルである。
追加の実施形態では、トレーニングセットモジュールは、要素が、既知の遺伝子型のクラス内の各既知の遺伝子型の各アベレージ動的プロファイルに対する、各既知の遺伝子型の各動的プロファイルの相関係数のアベレージ値を含む平均変換型ベクトル、およびパラメータ行列の共分散行列を計算することによって得られる既知の遺伝子型についての共分散行列をさらに含む。一実施形態では、アベレージ動的プロファイルは、アベレージ正規化動的プロファイルである。
一実施形態では、相関モジュールは、相関ベクトルを変換型ベクトルにさらに変換し、変換型ベクトルの各要素は正規分布している。別の実施形態では、判定モジュールは、変換型ベクトルが、最大事後確率を有する遺伝子型についてのトレーニングセットから得られるもののうちで許容できる閾値内に入るかどうかを判定することがさらにできる。さらなる実施形態では、許容できる範囲は、動的プロファイル内で、独立変数に対するシグナルの測定値の既定の閾値百分率を含むトレーニングセットの共分散行列の固有ベクトルによって画定される楕円体である。別の実施形態では、本システムは、転換モジュールをさらに備える。転換モジュールは、相関ベクトルをn球座標に転換することができ、nは、可能な突然変異のすべてを構成する遺伝子型の数より1小さい。一実施形態では、この転換により、正規分布したパラメータを生成することができる。別の実施形態では、転換モジュールは、相関ベクトルを球座標に転換することができる。この実施形態では、この転換により、正規分布したパラメータを生成することができる。さらなる実施形態では、本システムは、上述した独立変数についての分離最大化範囲を求めることができる、分離最大化範囲選択モジュールも備える。
本明細書に組み込まれ、明細書の一部を形成する添付図面は、本発明の様々な実施形態を例示する。
本発明の実施形態による、既知の遺伝子型のクラス内から、ある既知の遺伝子型を認識するためのトレーニングセットを生成する方法を示す流れ図である。 本発明の実施形態による、既知の遺伝子型のクラス内から、ある既知の遺伝子型を認識するためのトレーニングセットを生成する方法を示す流れ図である。 ワルファリンVKORC1クラス内の各遺伝子型についての蛍光対温度動的プロファイルを例示する図である。 ワルファリンVKORC1クラス内の各遺伝子型についての蛍光対温度動的プロファイルの負の導関数のプロットである。 陽性対照動的プロファイルを、陽性対照の既知の動的プロファイルと相関させることによって求められたシフト値によって、水平方向にシフトされた後の図3の動的曲線を例示する図である。 所定の標準偏差に対して正規化した後の図4の動的プロファイル、および一実施形態によるワルファリンVKORC1クラス内の各遺伝子型のアベレージ動的プロファイルを例示する図である。 相関ベクトルの要素が正規分布していない、ワルファリンVKORC1についての相関ベクトルの3次元プロットである。 相関係数が正規分布していない、ワルファリンVKORC1クラス内の各遺伝子型のアベレージ動的プロファイルに対する野生型動的プロファイルの相関係数パラメータのプロットである。 相関ベクトルが球座標に転換され、正規分布している、ワルファリンVKORC1クラスについての相関ベクトルの3次元プロットである。 相関係数が正規分布している、ワルファリンVKORC1クラス内の各遺伝子型のアベレージ動的プロファイルに対する、相関ベクトルが球座標に転換された後の野生型動的プロファイルの相関係数パラメータのプロットである。 相関ベクトルが正規分布している、面x+y+z=0上に投影されたワルファリンVKORC1クラスについての相関ベクトルの3次元プロットである。 本発明の態様による、生体試料中に存在する核酸の遺伝子型の同一性を決定する方法を示す流れ図である。 本発明の態様による、生体試料中に存在する核酸の遺伝子型の同一性を決定する方法を示す流れ図である。 独立変数のシフト値を求めるために対照遺伝子型の既知の動的プロファイルに相関されている対照遺伝子型プロファイルについての陽性対照を例示する図である。 シフト値に対する、対照遺伝子型の既知の動的プロファイルとの陽性対照動的プロファイルの相関係数のプロットである。 ワルファリンVKORC1クラス内の各既知の遺伝子型について、未知の遺伝子型の異なる動的プロファイルを既知の遺伝子型のアベレージ動的プロファイルに相関させることによって生成される相関係数のグレースケールカラーマップを例示する図である。 未知の遺伝子型の異なる動的プロファイルのそれぞれが、ワルファリンVKORC1クラス内の各既知の遺伝子型の動的プロファイルを表す事後確率のグレースケールカラーマップを例示する図である。 同じ遺伝子型クラスの動的プロファイル同士間の分離を最小にしつつ、異なる既知の遺伝子型の動的プロファイル同士間の分離を最大にするように選択される温度範囲を選ぶのに使用される、クラス間散乱とクラス内散乱の比のグレースケールカラーマップを例示する図である。 本発明の態様によるトレーニングセットを使用して、生体試料中に存在する核酸の遺伝子型の同一性を決定する方法を示す流れ図である。 本発明の態様によるトレーニングセットを使用して、生体試料中に存在する核酸の遺伝子型の同一性を決定する方法を示す流れ図である。 本発明の態様によるトレーニングセットを使用して、生体試料中に存在する核酸の遺伝子型の同一性を決定する方法を示す流れ図である。 本発明の態様によるトレーニングセットを使用して、生体試料中に存在する核酸の遺伝子型の同一性を決定する方法を示す流れ図である。 本発明のいくつかの態様によるマイクロ流体デバイスを例示する図である。 MTHFR667多型クラス内の各遺伝子型についての蛍光対温度動的プロファイルを例示する図である。 MTHFR667多型クラス内の各遺伝子型についての蛍光対温度動的プロファイルの負の導関数のプロットである。 陽性対照の既知の動的プロファイルに対する陽性対照動的プロファイルの相関によって求められたシフト値によって水平方向にシフトされた後の図20の動的曲線を例示する図である。 所定の標準偏差に対して正規化した後の図21の動的プロファイル、および一実施形態による多型クラス(既知の遺伝子型のクラス)内の各遺伝子型のアベレージプロファイルを例示する図である。 相関ベクトルの要素が正規分布していない、MTHFR667多型クラスについての相関ベクトルの3次元プロットである。 相関ベクトルが正規分布している、面x+y+z=0上に投影されたMTHFR667多型についての相関ベクトルの3次元プロットである。 相関ベクトルが球座標に転換され、正規分布している、MTHFR667多型クラスについての相関ベクトルの3次元プロットである。
本発明は、いくつかの実施形態を有し、当業者に公知の詳細については、特許、特許出願、および他の参考文献に依拠する。したがって、特許、特許出願、または他の参考文献が本明細書で引用され、または繰り返される場合、これは、すべての目的、ならびに列挙される提案のために、その全体が参照により組み込まれていることが理解されるべきである。
本発明の実践には、別段の指定のない限り、当技術分野の技術の範囲内である、有機化学、ポリマー技術、分子生物学(組換え技法を含む)、細胞生物学、生化学、および免疫学の従来の技法および記述を使用することができる。そのような従来の技法には、ポリマーアレイ合成、ハイブリダイゼーション、ライゲーション、および標識を使用するハイブリダイゼーションの検出が含まれる。適当な技法の具体的な実例は、以下の本明細書の例を参照することによって得ることができる。しかし、他の等価な従来の手順も、もちろん使用することができる。そのような従来の技法および記述は、標準的な実験室マニュアル、例えば、Genome Analysis:A Laboratory Manual Series(I〜IV巻)、Using Antibodies:A Laboratory Manual、Cells:A Laboratory Manual、PCR Primer:A Laboratory Manual、およびMolecular Cloning:A Laboratory Manual(すべてCold Spring Harbor Laboratory Pressから)、Stryer,L.(1995)Biochemistry(4版)Freeman、N.Y.、Gait、Oligonucleotide Synthesis:A Practical Approach、1984、IRL Press、London、Nelson and Cox(2000)、Lehninger、Principles of Biochemistry 3版、W.H.Freeman Pub.、New York、N.Y.、およびBergら(2002)Biochemistry、5版、W.H.Freeman Pub.、New York、N.Y.などに見出すことができ、そのすべては、すべての目的のためにその全体が参照により本明細書に組み込まれている。
蛍光の熱融解曲線は、温度の傾斜上昇を介して二本鎖状態から2つの別個の一本鎖に変性されるときのDNA鎖の融解温度を求めるのに使用された。一般に、融解温度またはTは、対になったDNA鎖の50%が一本鎖に変性されたときの温度であると定義される。二本鎖DNAに結合しているとき蛍光を放ち、変性されたときその蛍光を失うインターカレーティング色素が、Tの測定に多くの場合使用される。一般に、温度に対する蛍光の負の導関数(−dF/dT)が、Tの判定に使用されている。一般的なシステムでは、ピーク−dF/dTでの温度が、融解温度Tの推定値として使用される。
−dF/dT導関数曲線は、任意のシグナルの導関数を推定することができる、Savitsky−Golay(SG)導関数フィルターを使用して得ることができる。Savitsky−Golayフィルターは、ローパス、有限インパルス応答(FIR)導関数フィルターであり、未処理シグナルを伴うFIRフィルターパラメータの畳み込みによって、任意の動的シグナルに適用される。独立変数の間隔が均一である場合、フィルターされた結果は、等価な独立変数に対する従属変数の一次導関数および高次導関数を与えることができる。そのようなフィルターの効果は、移動多項式フィット、その後のウインドウの中心で評価されたその多項式の導関数の評価と等価である。−dF/dT導関数曲線を得るための他の方法は、米国特許出願公開第2009/0112484号に見出すことができ、これは、参照により本明細書に組み込まれている。
本発明は、核酸の動的プロファイルを分析するための方法およびシステムに関する。これらの動的プロファイルは、独立変数に対して、核酸の物理的変化を表すシグナルの測定値を含むデータセットである。この物理的変化の一例は、核酸の解離挙動である。特定の遺伝子型の核酸の動的プロファイルを分析することにより、核酸の同定および特定の遺伝子型の同定を補助することができる。より具体的には、本発明は、生体試料中の未知の遺伝子型の動的プロファイルを分析することにより、生体試料中に存在する核酸の遺伝子型の同一性を決定するための方法およびシステムに関する。
上述したように、動的プロファイルは、独立変数に対して、核酸の物理的変化を表すシグナルの測定値を含む。この物理的変化は、例えば、特定の遺伝子型を含有する核酸の変性とすることができる。そのような動的プロファイルは、例えば、分子融解曲線または熱変性曲線とすることができる。核酸についてのそのような熱変性曲線におけるシグナルは、例えば、測定された熱パラメータ、インジケータ色素/分子の蛍光、蛍光偏光、誘電特性などであってもよい。分子融解曲線または熱変性曲線である動的プロファイルは、融解曲線分析によって生成され得る。
融解曲線分析は一般に、ストップトフロー形式または連続フロー形式で実施される。ストップトフロー形式の一例では、流れは、マイクロ流体デバイスのマイクロチャネル内で止められる一方で、そのチャネル内の温度は、所望の融解曲線を生成するのに必要とされる温度範囲にかけて勾配を成す。代替のストップトフロー形式では、融解曲線分析は、核酸試料が添加されたチャンバー内で行われる。連続フロー形式の一例では、融解曲線分析は、マイクロ流体デバイスのマイクロチャネルの長さ(流れの方向)に沿って温度勾配をかけることによって実施される。融解曲線分析で、分析される分子が、第1の温度から第2の温度に及ぶ温度範囲に曝されることを必要とする場合、マイクロチャネルの一端での温度は第1の温度に制御され、その長さの他端での温度は第2の温度に制御され、こうして、第1と第2の選択された温度間の温度範囲に及ぶ連続的な温度勾配が作られる。融解曲線分析を実施するための機器の例は、その全体が参照により本明細書に組み込まれている、米国特許出願公開第2007/0231799号に開示されている。本発明は、任意の環境において得られる動的プロファイルの分析に適用可能であるが、本発明は、マイクロ流体環境において得られる動的プロファイルに特に有用であり、その理由は、この環境においてより大きい感度を必要とするためである。
本発明のある特定の態様によれば、動的プロファイルは、1つまたは複数の分子、例えば、1つまたは複数の核酸の温度を選択された時間上昇させ、この1つまたは複数の分子から発せられるシグナル(すなわち、検出可能な特性)を測定することによって生成され、ここでシグナルは、核酸の変性の程度を示す。この時間は、例えば、間のすべての時間を含めて、約0.01秒から約1.0分以上、約0.01秒から約10秒以上、約0.1秒から約1.0秒以上の範囲とすることができる。一実施形態では、加熱は、1つまたは複数の分子の温度を持続的に増大させることによって、この1つまたは複数の分子の温度を上昇させることを含む。例えば、分子(複数可)の温度は、約0.1℃/秒〜約1℃/秒の範囲の速度で持続的に増大させることができる。あるいは、分子(複数可)の温度は、約0.01℃/秒〜約0.1℃/秒の範囲内の速度などのより遅い速度、または例えば、約1℃/秒〜約10℃/秒の範囲内の速度などのより速い速度で持続的に増大させてもよい。加熱は、当技術分野で公知であるように、内部または外部の加熱源を適用することによって行うことができる。
分子の1つまたは複数の物理的変化の実際の検出は、関与する特定の分子および反応に応じて多数の方法で検出することができる。例えば、分子の変性は、アッセイにおいて、分子からの蛍光または放射光をたどることによって追跡することができる。蛍光の程度または変化は、アッセイされている分子の構造の変化の程度に相関または比例する。したがって、いくつかの方法では、分子(複数可)の特性の検出は、結合の相対的な量の関数として変化する分子(複数可)からの蛍光または放射光のレベルを検出することを含む。一構成では、蛍光を検出することは、第1の分子および第2の分子を伴い、ここで第1の分子は、蛍光インジケータ色素または蛍光インジケータ分子であり、第2の分子は、アッセイされる標的分子である。一実施形態では、蛍光インジケータ色素または蛍光インジケータ分子は、第2の分子上の疎水性残基または親水性残基に結合することによって第2の分子に結合または付随する。検出する方法は、蛍光インジケータ色素または蛍光インジケータ分子を励起することによって、励起蛍光インジケータ色素または励起蛍光インジケータ分子を作り、励起した蛍光インジケータ色素または蛍光インジケータ分子の放出または消光事象を識別および測定することを任意選択によりさらに含む。
動的プロファイルは、いくつかの異なる方法で生成することができる。いくつかの方法では、動的プロファイルの生成は、蛍光インジケータ色素または蛍光インジケータ分子を含む1つの分子、および酵素、リガンド、ペプチド核酸、補助因子、受容体、基質、タンパク質、ポリペプチド、核酸(二本鎖もしくは一本鎖)、抗体、抗原、または酵素複合体のうちの1つまたは複数を含む少なくとも1つの第2の分子を提供することを含む。温度の関数として、第2の分子の存在下で第1の分子の蛍光が測定され、得られるデータは、動的プロファイルを構成する。他の方法では、動的プロファイルの生成は、温度の変化による別の分子(複数可)の物理的特性の変化に相関または比例する、1つの分子の蛍光の変化を測定することを含む。さらに他の方法では、動的プロファイルの生成は、第2の分子が存在しないで、温度の関数としてシステムの全自由エネルギーの変化を測定することを含む。一般に、本方法は、類似の様式で、対照試料の陽性対照プロファイル、または既知の試料の既知の動的プロファイルを生成することも含む。
対象とする分子の変性を測定するのにいくつかの技法が存在し、これらのいずれも、本発明の態様によって分析されるデータの生成に使用することができる。そのような技法には、蛍光、蛍光偏光、蛍光共鳴エネルギー移動、円偏光二色性、およびUV吸光度が含まれる。簡単に言えば、蛍光技法では、標的分子が温度の変化に曝される際の、標的分子の変性/アンフォールディングを追跡するのに、蛍光または光の変化を測定するための分光法の使用を伴う。例えば、蛍光による分光分析は、熱で誘発された分子の変性/アンフォールディングを検出する有用な方法である。蛍光を伴う多くの異なる方法が、分子の変性を検出するのに利用可能であり(例えば、内在蛍光、多数の蛍光インジケータ色素または分子、蛍光偏光、蛍光共鳴エネルギー移動など)、本発明の任意選択の実施形態である。これらの方法は、標的分子の内部蛍光特性、または外部蛍光、すなわち、分析に関与する追加のインジケータ分子の蛍光を活用することができる。
標的分子の変性/アンフォールディングの程度を測定する方法は、標的分子および対象とする任意の試験分子とともに、マイクロ流体デバイスに加えられた色素または分子の蛍光をモニターすることによるものである。蛍光色素または蛍光分子は、標的分子がアンフォールドもしくは変性されると、または標的分子が、例えば、変性によって構造的な変化を受ける前に、標的分子に結合することができ、例えば、指定波長の光によって励起された後、蛍光エネルギーまたは光を放出する、任意の蛍光分子または蛍光化合物(例えば、フルオロフォア)を指す。
マイクロ流体デバイスにおいて使用される1つの色素のタイプは、核酸の鎖内に介在するものである。そのような色素の古典的な例は、臭化エチジウムである。結合アッセイのための臭化エチジウムの例示的使用は、例えば、試験分子が核酸標的分子に結合することによる臭化エチジウムからの蛍光発光の減少をモニターすることを含む(臭化エチジウム置換アッセイ)。例えば、Lee,Mら(J Med Chem 36(7):863〜870頁(1993))を参照。変性の測定において核酸インターカレート剤を使用することは、当業者に公知である。例えば、Haugland(Handbook of Fluorescent Probes and Research Chemicals、Molecular Probes,Inc.、Eugene、OR(1996))を参照。
インターカレーション以外の機構によって核酸に結合する色素も、本発明の実施形態において使用することができる。例えば、二本鎖DNAの副溝に結合する色素を使用することによって、温度による標的分子の分子アンフォールディング/変性をモニターすることができる。適当な副溝結合色素の例は、Molecular Probes Inc.(Eugene、OR、USA)によって販売されている色素のSYBRグリーン群である。例えば、Haugland(Handbook of Fluorescent Probes and Research Chemicals、Molecular Probes,Inc.、Eugene、OR、USA(1996))を参照。SYBRグリーン色素は、任意の二本鎖DNA分子に結合する。SYBRグリーン色素が二本鎖DNAに結合するとき、蛍光発光の強度は増大する。より多くの二本鎖DNAが温度の増大によって変性されるにつれて、SYBRグリーン色素のシグナルは減少する。別の適当な色素は、Idaho Technology,Inc.(Salt Lake City、UT、USA)によって販売されているLCGreen Plusである。
蛍光偏光(FP)は、対象とする分子同士間のハイブリダイゼーション形成を検出するための有用な方法をもたらす。この方法は、例えば、一塩基多型(SNP)をモニターするための、核酸同士間のハイブリダイゼーション検出に特に適用可能である。一般に、FPは、試験分子および標的分子を含む分子同士間の結合事象の前、間、および/または後に、蛍光色素または分子指標などの蛍光標識の回転速度をモニターすることによって作用する。手短に言えば、試験分子が標的分子に結合すると、通常、分子の1つに結合した標識の回転速度が減少し、FPの変化をもたらす。
蛍光共鳴エネルギー移動(FRET)を使用することによって、温度の関数として、標的分子の構造的な変化(および標的分子に結合することができる試験分子との相互作用)を追跡することができる。FRETは、ドナーフルオロフォアからアクセプターフルオロフォアへのエネルギーの距離依存性移動に依拠する。アクセプターフルオロフォアが励起されたドナーフルオロフォアにごく接近している場合、ドナーフルオロフォアの発光は、アクセプターフルオロフォアに移される場合がある。これにより、ドナーフルオロフォアの発光強度の随伴する低減、およびアクセプターフルオロフォアの発光強度の増大が生じる。励起移動の効率はとりわけ、2つのフルオロフォアの間の距離に依拠するので、この技法は、構造の変化を検出するときに起こるなどの、極めて小さい距離を測定するのに使用することができる。この技法は、結合反応、タンパク質間相互作用、例えば、対象とするタンパク質の抗体への結合など、および2つの標識された分子の近接を変化させる他の生物学的事象の測定に特に適している。多くの適切な相互作用的な標識が知られている。例えば、蛍光標識、色素、酵素標識、および抗体標識は、すべて適切である。
円偏光二色性(CD)は、温度の関数として標的分子/テキスト分子(text molecule)の構造的変化をたどるのに使用することができ、分子融解曲線を構築するのに使用することができる。CDは、光吸収分光法の1つのタイプであり、これは、右円偏光と左円偏光の間の分子による吸光度の差異を測定する。CDは、ポリペプチドおよびタンパク質の構造に非常に敏感である。
UV吸光度も、核酸分子の変性を検出および/もしくは追跡し、かつ/または核酸の全量を定量化するのに使用することができる。UVは、変性の程度を測定するのに使用することができ、その理由は、一本鎖核酸分子のUV吸光度値は、二本鎖核酸分子の吸光度値より大きいためである。
標的分子の変性/アンフォールディングの程度を測定する代替の方法は、試料にわたって印加される電圧に対して、試料によって生成される電流をモニターすることによって、ボルタンメトリー曲線を作成することによるものである。いくつかの方法では、ボルタンメトリー曲線の作成は、酵素、リガンド、ペプチド核酸、補助因子、受容体、基質、タンパク質、ポリペプチド、核酸(二本鎖、または一本鎖)、抗体、抗原、または酵素複合体のうちの1つまたは複数を含む1つの分子を提供することを含む。さらに、一本鎖核酸または二本鎖核酸に優先的に結合する酸化還元活性分子を含む少なくとも1つの第2の分子が提供される。一般に、特定のタンパク質または対象とする核酸を表すプローブ分子が提供され、プローブ分子は、リガンド、ペプチド核酸、基質、タンパク質、ポリペプチド、核酸(二本鎖もしくは一本鎖であり、対象とする特定の配列にハイブリダイズすることができるオリゴヌクレオチドであってもよい)、抗体、抗原、または酵素複合体とすることができる。好ましくは、酸化還元活性分子は、その酸化または還元電位が、これが二本鎖核酸と相互作用しない場合と異なるように二本鎖核酸と相互作用する。そのような酸化還元活性分子は、多くの場合、核酸のワトソン−クリック塩基対の間、または核酸の二次構造の副溝または主溝中に介在し、したがって一本鎖核酸と相互作用しない。あるいは、酸化還元活性分子は、対象とする配列に優先的に結合することができる。そのような酸化還元活性分子の非限定例は、調べられる対象とする配列、およびプローブの遊離端に結合したフェロセン標識を含むプローブ分子である。
そのような酸化還元活性分子を含む試料にわたって電位を印加すると、電流を生じ、この電流は、異なる電位の印加とともに変化する。試料にわたって様々な電位を印加することによって、動的プロファイルを作るために、生成される電流の様々な測定値を得ることができる。例えば、第1の分子が、プローブ分子に完全にハイブリダイズした場合、動的プロファイルは、第1の分子が、プローブ分子に不完全にハイブリダイズするか、またはまったくハイブリダイズしない場合に生成される動的プロファイルと異なることになる。次いで、動的プロファイルは、電流対電圧を表す曲線としてプロットすることによって、ボルタンメトリー曲線を作成することができる。高解像度熱融解の場合における動的プロファイルについて本明細書に記載されるプロセスおよび流れ図は、電気化学的ボルタンメトリーの場合における動的プロファイルにあてはまる。
これらの方法によって生成される動的プロファイルは、シグネチャ曲線(signature curve)を生成するのにデータをプロットするために使用される任意の利用可能な媒体にプロットすることができる。シグネチャ曲線は、人が、1つの動的プロファイルを別の動的プロファイルと視覚的に照合することを可能にし、これにより、研究者が、生体試料中の異なる遺伝子型を区別することが可能になるので有用である。最初のシグネチャ曲線は、数学的に改変または操作することによって第2のシグネチャ曲線を生成することもでき、これにより研究者が、未知の遺伝子型を表すシグネチャ曲線を、既知の遺伝子型を表すシグネチャ曲線とより容易に比較することが可能になる場合がある。シグネチャ曲線は、例えば、熱融解曲線とすることができる。熱融解曲線は一般に、温度に対する蛍光の負の導関数(−dF/dT)のプロットであり、これらは熱融解データから生成される。研究者は、これらの曲線を「視覚的に」に調べることによって、異なる遺伝子型の熱融解曲線の外観の差異に基づいて、異なる遺伝子型を区別することができ、この差異は、2つの遺伝子型の間の動的プロファイルの差異を表す。この視覚的検査は、特定の遺伝子型の同定において、高い程度のユーザー介入を必要とし、その理由は、研究者は、未知の遺伝子型の動的プロファイルから生成されるシグネチャ曲線を、既知の遺伝子型の動的プロファイルから生成される既知のシグネチャ曲線と照合しなければならないためである。さらに、曲線の形状のわずかな差異は、人の検査によって検出されない場合があり、遺伝子型の誤同定に至る恐れがある。
未知の遺伝子型の熱融解曲線の差異を分析するための定量的方法も存在する。1つの定量的方法は、ピーク−dF/dTでの温度を求めることを含む。この温度は、核酸の融解温度Tの推定値として使用される。核酸のTのこの推定値は、その値を、既知の遺伝子型の融解温度の分布と比較することによって、核酸の遺伝子型を分類するのに使用することができる。しかし、この方法も潜在的な欠点を呈する。例えば、この方法は、遺伝子型を決定するために、熱融解曲線全体のただ1点、すなわち、導関数のピークを使用する。これはおそらく、試料の遺伝子型を決定するのに有用となり得る曲線の幅およびピークの高さを含めた、熱融解曲線の全体的形状を無視する。さらに、2つの一塩基多型は、0.5℃未満離れた融解温度の差異を有する場合がある。この場合、マイクロ流体デバイスで得られるデータから生成される2つの熱融解曲線の解像度は低すぎて、2つの遺伝子型の融解温度の間、したがって、遺伝子型同士間の差異を識別することを可能にすることができない場合がある。
本発明の一態様によれば、上記方法によって生成される動的プロファイルは、本明細書で未知の遺伝子型とも呼ばれる、生体試料中に存在する核酸の遺伝子型の同一性を決定するのに使用することができる。本発明の別の態様によれば、上記方法によって生成される動的プロファイルは、既知の遺伝子型のクラス内から、ある既知の遺伝子型を装置に認識させるために、トレーニングセットを生成するのに使用することができる。本発明のさらなる態様によれば、上記方法は、対照遺伝子型の陽性対照動的プロファイルを生成するのに使用することができ、このプロファイルは、計測装置、初期条件、周囲条件、および実験の実施同士間の他の変動の差異によって取り入れられるエラーを説明し、補正するのに使用される。本発明の様々な実施形態は、図面を参照して、以下により詳細に説明される。
一態様では、本発明は、既知の遺伝子型のクラス内から、ある既知の遺伝子型を装置に認識させるためのトレーニングセットを生成する方法を提供する。この態様によれば、既知の遺伝子型のクラスのトレーニングセットは、以下のステップ、すなわち、(a)既知の遺伝子型のクラス内の各既知の遺伝子型について、同じ遺伝子型の複数の動的プロファイルをグループ化するステップと、(b)動的プロファイルのそれぞれを正規化するステップと、(c)同じ遺伝子型の正規化動的プロファイルをアベレージすることによって、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ正規化動的プロファイルを得るステップと、(d)各動的プロファイルを、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ正規化動的プロファイルと相関させることによって、各動的プロファイルについての相関ベクトルを生成するステップと、(e)遺伝子型によって一緒にグループ化されたとき、変換型ベクトルの要素のそれぞれが正規分布するように相関ベクトルを変換するステップと、(f)既知の遺伝子型のクラス内の各既知の遺伝子型について1つの行列が存在するように、各変換型ベクトルを変換型ベクトルの行列にコンパイルするステップと、(g)要素が、各既知の遺伝子型についてのアベレージ変換型ベクトルを含む、平均変換型ベクトルを生成するステップであって、変換型ベクトルは、各コンパイルされた行列のアベレージであるステップと、(h)コンパイルされた行列のそれぞれの共分散行列を計算することによって、既知の遺伝子型についての共分散行列を計算するステップとを使用して生成される。
一実施形態では、各動的プロファイルは、本明細書に記載されるように、独立変数に対して、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含む。したがって、動的プロファイルは、核酸の物理的変化を表すシグナルの測定値から導出される。既知の遺伝子型のクラスの各既知の遺伝子型について、複数の動的プロファイルを生成することができる。一実施形態では、複数の動的プロファイルは、これらがすべて同じ平均値および標準偏差を有するように正規化することができる。別の実施形態では、各相関ベクトルは、既知の遺伝子型のクラス内の各既知の遺伝子型の各アベレージ正規化動的プロファイルに対する、動的プロファイルについての相関係数を含む。すなわち、トレーニングセットを構成する個々の動的曲線のそれぞれは、アベレージ正規化プロファイルのそれぞれに対して相関されることによって、トレーニングセット中の各動的曲線についての相関ベクトルを得る。さらなる実施形態では、同じ遺伝子型に属する変換型ベクトルは、一緒にグループ化されてスタックド行列(stacked matrix)にされ、平均ベクトル(それによって行列の各行がアベレージされる)、およびスタックド行列の共分散行列が得られる。一実施形態では、本方法により、アベレージ正規化動的プロファイル、各既知の遺伝子型についての平均変換型ベクトル、既知の遺伝子型のクラス内の各既知の遺伝子型についての共分散行列を含むトレーニングセットが生じる。
一実施形態では、トレーニングセットを生成する方法は、(i)対照遺伝子型の陽性対照動的プロファイルを生成することであって、陽性対照動的プロファイルは、未知の遺伝子型の動的プロファイルを構成する測定値と並行してとられた、独立変数に対する、対照遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含むことと、(ii)陽性対照動的プロファイルを、対照遺伝子型の標準陽性対照動的プロファイルと比較することによって、独立変数のシフト値を求めることと、(iii)陽性対照動的プロファイルおよび既知の遺伝子型の動的プロファイルの独立変数を、シフト値によってシフトすることとをさらに含む。さらなる実施形態では、各動的プロファイルは、本明細書に記載されるものなどの、同じ既知の遺伝子型の動的プロファイル同士間の分離(クラス内散乱)を最小にしつつ、既知の遺伝子型のクラス内の異なる既知の遺伝子型の動的プロファイル同士間の分離(クラス間散乱)を最大にするように選択された範囲にわたって測定された独立変数に対して、各既知の遺伝子型を含有する各核酸の物理的変化を表すシグナルの測定値を含む。
別の実施形態では、相関ベクトルの要素は、新しいベクトルに変換され、この場合、各要素は、その遺伝子型によるガウス分布に属する。別の実施形態では、本方法は、各相関ベクトルを、n座標のベクトルに転換するステップであって、nは、可能なクラスまたは遺伝子型の数以下であるステップをさらに含む。クラスまたは遺伝子型の数は、増幅されたDNAセグメントにおいて可能である塩基対の異なる組合せの数に等しい。変換ベクトルは、クラスによってグループ化される場合、要素のそれぞれが正規分布するように構築することができる。これにより、DNA試料が各可能なクラスに属する尤度および確率を計算するために、多変量ガウス分布を記述する式を使用することが可能になる。これを行うための1つのそのような方法は、各相関ベクトルを、可能な遺伝子型の数に等しい要素の数、nを有する球座標に変換することである。これは、要素のすべてが正規分布しているわけではない相関ベクトルを、要素のそれぞれが、クラスによってグループ化されたとき、正規分布しているベクトルに変換する。あるいは、nがクラスの数未満である変換を使用することができ、相関ベクトルより少ない数の要素を有する変換型ベクトルを生じる。
図1A〜1Bは、本発明の実施形態によるトレーニングセットを生成するための方法100についての流れ図を例示する。方法100におけるステップ102は、複数の生体試料中に含有される既知の遺伝子型の複数の動的プロファイルを生成することを含む。動的プロファイルは、ステップ104において生成されるデータから生成することができる。ステップ104におけるデータは、動的プロファイルまたはシグネチャ曲線のデータを生成するために上述した方法のいずれかによって生成することができる。動的プロファイルはそれぞれ、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値y(t)を含む。シグナルのこれらの測定値は、独立変数、x(t)に対して記録される。パラメータtは、独立変数およびシグナルの両方が測定される任意のパラメータとすることができる。動的プロファイルにおける測定値が、インターカレーティング色素を伴った、既知の遺伝子型を含有する核酸の熱融解を通じて生成される場合、x(t)は温度T(t)であり、y(t)は、蛍光、F(t)、または温度に対する蛍光の導関数−dF/dTである。あるいは、動的プロファイルが、酸化還元活性分子を伴った核酸のボルタンメトリーを通じて生成される場合、x(t)は電位V(t)であり、y(t)は電流I(t)である。非限定例として、ワルファリンVKORC1多型における3つの異なる遺伝子型のいくつかの動的プロファイルのプロットが、図2に蛍光対温度曲線の形式で、および図3に温度に対する蛍光の導関数として示されている。
図1Aのステップ106は、対照遺伝子型の関連陽性対照動的プロファイル(associated positive control dynamic profile)を生成することを含む。一実施形態では、関連陽性対照動的プロファイルは、既知の遺伝子型の複数の動的プロファイルのそれぞれが生成されるのと同時に生成される。陽性対照遺伝子型の各陽性対照動的プロファイルも、既知の遺伝子型の動的プロファイルと同じ独立変数に対する同じシグナルの測定値からなるが、測定値は、既知の遺伝子型を含有する試料ではなく、陽性対照試料から取得される。陽性対照遺伝子型についてのシグナルの測定値は、既知の遺伝子型についてのシグナルの測定値とともに、ステップ104において同時に生成されることが好ましい。この陽性対照動的プロファイルは、対照遺伝子型の標準参照動的プロファイルと比較することができる。あるいは、陽性対照動的プロファイルのそれぞれの独立変数は、ステップ108に示すように、陽性対照動的プロファイルがマッチし、シフトされるすべての陽性対照動的プロファイルについてのシフト値Δxの平均が0であるように、シフト値Δxによってシフトすることができる。ステップ110において、陽性対照動的プロファイルに関連する動的プロファイルの独立変数も、関連陽性対照動的プロファイルと同じシフト値Δxによってシフトされる。陽性対照動的プロファイルまたは動的プロファイルにおける独立変数を、シフト値Δxによってシフトするために、Δxが、陽性対照動的プロファイルまたは動的プロファイルにおける独立変数から減算され、またはこの独立変数に加算される。
動的プロファイルは、ステップ112に示すように、正規化されることによって所定の標準偏差を有することができる。シフトされた動的プロファイルは、正規化されることが最適である。いくつかの実施形態では、正規化手順は、所定の標準偏差および所定のアベレージ値の両方を有するために、動的プロファイルも正規化する。所定のアベレージ値は0とすることができ、所定の標準偏差は1とすることができる。正規化動的プロファイルy’(x)は以下のように計算することができる。
式中、μ(y(x))は、動的プロファイルのアベレージ値であり、σ(y(x))は、動的プロファイルの標準偏差である。例として、図4に例示したように、−dF/dT対温度曲線の形式で、いくつかのシフトされた動的プロファイルが、ワルファリンVKORC1多型における3つの異なる遺伝子型について示されている。
図1Aに戻って参照すると、既知の遺伝子型のクラス内の各遺伝子型についての既知の遺伝子型に関連したすべての動的プロファイルをシフトおよび正規化した後、一連の正規化され、シフトされた動的プロファイル114が生成される。いくつかの実施形態では、これらは、本発明の他の態様において使用するために、データストレージに登録することができる。
動的プロファイルは、ステップ116において、同じ既知の遺伝子型に対応する他の動的プロファイルとともにアベレージすることができる。同じ既知の遺伝子型に対応するいくつかの動的プロファイルを一緒にアベレージすることにより、既知の遺伝子型のアベレージ動的プロファイルが生成され、これは、独立変数に対して、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルのアベレージ測定値を含む。本発明の一実施形態では、遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイル118が生成され、本発明の他の態様において使用するために記憶される。
1つの既知の遺伝子型のアベレージ動的プロファイルを生成するために、1つの既知の遺伝子型の複数の動的プロファイルを一緒にアベレージすることができる。動的プロファイルを一緒にアベレージするための1つの方法は、アベレージされている動的プロファイルのすべてにわたって、独立変数の各異なる値についてのシグナルの測定値の平均値を計算することによって、既知の遺伝子型のアベレージプロファイルを構成することである。いくつかの実施形態では、一部の範囲外のデータセットを、研究者の自由裁量で除外することができる。図5は、ワルファリンVKORC1多型クラス内の各既知の遺伝子型のアベレージプロファイルを、より細い線の中で太い、濃い線として示す。
さらに、同じ陽性対照遺伝子型を表す陽性対照動的プロファイルを一緒にアベレージすることによって、アベレージ陽性対照動的プロファイルを、同様の様式で生成することができる。動的プロファイル(または陽性対照動的プロファイル)は、既知の遺伝子型または陽性対照遺伝子型のアベレージ正規化動的プロファイルを作るために、これらを一緒にアベレージする前に、上述したようにシフトおよび正規化されることが好ましい。
本明細書で使用する場合、遺伝子型のクラスは、未知の遺伝子型を合理的に比較することを望む、あらゆる遺伝子型を含むことができる。いくつかの実施形態では、遺伝子型のクラスは、特定の多型に関連する遺伝子型となる。例えば、ワルファリンVKORC1多型について、この多型に関連する3つの可能な遺伝子型、すなわち、野生型(WT)、ヘテロ接合性突然変異体(HE)、およびホモ接合性突然変異体(HM)が存在する。この場合における遺伝子型のクラスは、3つすべての遺伝子型(WT、HE、およびHM)を含むことが好ましいが、このクラスは、より少ない遺伝子型を含むことができ、ワルファリンVKORC1多型に関連するもの以外の追加の遺伝子型も同様に含んでもよい。同様に、凝固因子MTHFR677一塩基多型について、3つの可能な遺伝子型、すなわち、野生型(WT)、ヘテロ接合体(HE)、およびホモ接合体(HM)が存在する。いくつかの実施形態では、遺伝子型のクラスは、WT、HE、およびHM遺伝子型を当然に含むことができる。
図1Aに戻って参照すると、ステップ120において、対照遺伝子型の各既知の動的プロファイルは、所定の平均値および標準偏差を有するように正規化される。いくつかの実施形態では、この正規化手順は、上記に論じた、動的プロファイルについて使用された正規化手順と同一である。ステップ122において、陽性対照動的プロファイルがアベレージされることによって、対照遺伝子型の標準参照動的プロファイルが生成される。標準参照動的プロファイルは、既知の遺伝子型のアベレージ動的プロファイルが計算されるのと同じ様式で計算することができる。標準参照動的プロファイルは、ステップ124において出力することができる。他の実施形態では、これは、本発明の他の態様において使用するために、データストレージに記憶することができる。
ステップ126において、既知の遺伝子型のアベレージ動的プロファイルを計算するのに使用された既知の遺伝子型の各動的プロファイルは、各既知の遺伝子型のアベレージ動的プロファイルに対して相関されることによって、その動的プロファイルについての相関ベクトルrが生成される。
式中、r、r、...、rNgは、動的プロファイルと、既知の遺伝子型のクラス内の各既知の遺伝子型についてのアベレージ動的プロファイルのそれぞれとの相関値である。相関ベクトルrは、[N×1]行列であってもよく、Nは、可能な突然変異のすべてを構成する遺伝子型の数である。相関ベクトルの各要素は、既知の遺伝子型の異なるアベレージ動的プロファイルに対する動的プロファイルの相関係数とすることができる。
相関係数は、実際の相関係数である必要はなく、代わりに、2つのセットのデータ、または2つの動的プロファイルの間の差異の程度を表す任意の値であってもよい。そのような統計データには、それだけに限らないが、動的プロファイルとアベレージ動的プロファイルとの間の二乗和誤差、またはアベレージ動的プロファイルと動的プロファイルとの間の相関係数が含まれる。
所与の遺伝子型について、既知の遺伝子型のアベレージ動的プロファイルに対する様々な動的プロファイルの相関係数は、これらがガウス分布に一致しないという点で、正規分布していない場合がある。図6は、3次元空間に配置されたとき、ワルファリンVKORC1多型についてのトレーニングセット中の相関係数は、正規分布していないが、代わりに1で仕切ることを示す。同様に、図7は、野生型のアベレージ動的プロファイル、ヘテロ接合性突然変異体のアベレージ動的プロファイル、およびホモ接合突然変異体の動的プロファイルに対するワルファリンVKORC1 WT遺伝子型の一群の動的プロファイルの相関係数の分布を示す。これらのグラフを検査すると、相関係数の分布は、正規分布またはガウス分布に一致しないことを示す。相関係数の正規分布に強制的にするために、図1Bにおけるステップ128に示すように、rをn球座標に転換することによって、相関係数の相関ベクトルrを相関ベクトルvに変換することができる。相関ベクトルrは、以下のようにn球座標に転換することができる。
相関ベクトル:
長さ:
jが1からN−1に進む場合のj番目の角度:
変換型ベクトル:
n球座標は、直交デカルト座標系を参照して点を定義するのではなく、点が、n−球上のその角度、および原点からのその径方向の距離によって代わりに定義される任意の座標系を含む。n球座標の例には、1球座標(一般に、極座標と呼ばれる)、または2球座標(一般に、単に球座標と呼ばれる)が含まれる。一実施形態では、N個の可能な遺伝子型の1つであり得る試料から得られる相関ベクトルをn球座標に変換することにより、1つの長さ座標lおよびN−1個の角座標を有する、変換型相関ベクトルがもたらされる。したがって、この実施形態では、相関ベクトルは、n=N−1であるn球座標に変換することができる。
相関ベクトルをn球座標に変換することにより、正規分布しており、ガウス分布に確かに一致する、既知の遺伝子型のアベレージ動的プロファイルに対する様々な動的プロファイルの一連の相関係数がもたらされる。図8は、3次元格子上にプロットされたワルファリンVKORC1クラスにおける3つの可能な遺伝子型のそれぞれについての変換された相関係数を示し、これは、相関係数がおおよそ正規分布していることを示す。同様に、図9は、相関ベクトルが球座標に転換された後の、野生型のアベレージ動的プロファイル、ヘテロ接合性突然変異体のアベレージ動的プロファイル、およびホモ接合突然変異体のアベレージ動的プロファイルに対するワルファリンVKORC1 WT遺伝子型の動的プロファイルの群の相関係数の分布を示す。これらのグラフを検査すると、相関係数の分布は、釣鐘曲線、すなわち、ガウス分布におおよそ一致することを示す。
図1Bに戻って参照すると、本発明の態様では、既知の遺伝子型についての少なくとも2つの相関ベクトルは、既知の遺伝子型についてのパラメータ行列Vにコンパイルすることができ、これは、ステップ130に示されている。変換型相関ベクトルvは、既知の遺伝子型についてのパラメータ行列にコンパイルされることが好ましい。好ましくは、既知の遺伝子型についてのすべての相関ベクトルが、既知の遺伝子型についてのパラメータ行列にコンパイルされ、すなわち、特定のk番目の遺伝子型のN個の動的プロファイルが一緒にアベレージされることによって、特定の遺伝子型のアベレージ動的プロファイルが生成され、各動的プロファイルが、これに関連する相関ベクトルを有する場合、パラメータ行列Vは、n個の相関ベクトルを含むはずである。これは、以下のように数学的に表現することができる。
式中、Vは、遺伝子型のクラス内のk番目の遺伝子型についてのパラメータ行列であり、Nは、k番目の遺伝子型のアベレージ動的プロファイルを生成するために一緒にアベレージされるi番目の動的プロファイルの数である。この実施形態では、Vの寸法は、[N×N]である。この実施形態について、各行は、パラメータ(例えば、l、a、aなど)であり、各列は、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ正規化プロファイルを参照して、既知の遺伝子型の動的プロファイルについての相関ベクトルである。
本発明の別の態様では、図1B中のステップ132において示すように、既知の遺伝子型についてのパラメータ行列Vが使用されることによって、既知の遺伝子型についての平均ベクトルμが生成される。平均ベクトルμの要素は、パラメータ行列Vの各行のアベレージを含み、すなわち、平均ベクトルの各要素は、遺伝子型のクラス内の同じ、または異なる既知の遺伝子型のアベレージ動的プロファイルに対する、既知の遺伝子型の各動的プロファイルの相関値のアベレージである。ステップ134において、パラメータ行列Vの共分散行列Cが、既知の遺伝子型について計算される。共分散行列Cは、要素が以下のように計算される正方行列である。
式中、Nは、k番目の遺伝子型のアベレージプロファイルを構成するためにコンパイルされる動的プロファイルの数である。この実施形態では、Cは[N×N]行列である。本発明のこれらの態様では、既知の遺伝子型についての平均ベクトル、既知の遺伝子型についての共分散行列、および既知の遺伝子型についてのアベレージ正規化プロファイルは、既知の遺伝子型についてのトレーニングセット136に含まれる。トレーニングセットは、陽性対照遺伝子型の標準陽性対照動的プロファイル124をさらに含むことができる。トレーニングセットは、未知の遺伝子型を含有する生体試料が、可能な既知の遺伝子型の1つにマッチする確率および/または信頼度を求めるのに使用することができる。
n球座標への相関ベクトルの変換では、相関ベクトルrと相関ベクトルvの間で同じ数のパラメータが保存され、情報損失がまったくない変換をもたらす。図8および9は、そのような変換を例示する。代替の実施形態では、相関ベクトルrを変換することによって、相関値の分布を正規化する一方でまた、相関ベクトルにおける次元の数を低減することができる。図10は、面x+y+z=0に投影された後の、野生型のアベレージ動的プロファイル、ヘテロ接合性突然変異体のアベレージ動的プロファイル、およびホモ接合突然変異体の動的プロファイルに対する、ワルファリンVKORC1 WT、HE、およびHM遺伝子型の動的プロファイルの一群の相関係数の分布を示す。次元の数を2つに低減することにより、一部の情報は失われる場合があるが、相関係数は、正規分布されるようになる。一実施形態では、この変換は、相関ベクトルrに変換ベクトルTを乗じることによって実現することができる。Nが、可能な突然変異のすべてを構成する遺伝子型の数である場合の相関ベクトルが[N×1]行列である場合、Tは、[(N−h)×N]行列とすることができ、式中、hは、相関ベクトルの次元の数の低減である。
次いで、変換型相関ベクトルvは、Tに相関ベクトルrを乗じることによって計算することができる。
v=T・r
これは、次元[(N−h)×1]を有する変換型相関ベクトルvをもたらす。そのような変換型相関ベクトルを含むパラメータ行列Vは、[(N−h)×N]行列であり、式中、Nは、トレーニングセット中のk番目の遺伝子型の動的プロファイルの合計数である。平均ベクトルμは、[N−h×1]行列であり、共分散行列は[N−h×N−h]行列である。このシナリオは、いくらかの情報損失をもたらす場合があるが、Tは、異なる遺伝子型同士間の分離を最大にし、同一の遺伝子型同士間の分離を最小にするために、クラス間散乱とクラス内散乱の比を最大にするように導出することができる。例えば、図10中のグラフを導出するために、面x+y+z=0上に各rを投影する以下の変換行列Tを使用することができる。
相関ベクトルをより低い次元に変換することによって、生体試料中の未知の遺伝子型を確信的に同定するのに使用することができる、既知の遺伝子型のアベレージプロファイルを計算するのに必要な動的プロファイルの数を低減することが可能である。
別の態様では、本発明は、生体試料中に存在する未知の核酸の遺伝子型(未知の遺伝子型とも呼ばれる)の同一性を決定する方法を提供する。この態様によれば、未知の遺伝子型は、以下のステップ、すなわち、(a)生体試料中に含有される未知の遺伝子型の動的プロファイルを生成するステップと、(b)未知の遺伝子型の動的プロファイルを、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルと相関させることによって、相関ベクトルを生成するステップと、(c)既知の遺伝子型のクラス内の既知の遺伝子型の1つとして未知の遺伝子型を分類するために、相関ベクトルまたはその変換が許容できる範囲内に入るかどうかを判定し、それによって、生体試料中の核酸の遺伝子型の同一性が決定されるステップとを使用して決定される。
一実施形態では、動的プロファイルは、独立変数に対して、未知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含む。したがって、動的プロファイルは、核酸の物理的変化を表すシグナルの測定値から導出される。別の実施形態では、各既知の遺伝子型のアベレージ動的プロファイルは、本明細書に記載されるような独立変数に対して、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルのアベレージ測定値を含む。いくつかの実施形態では、各動的プロファイルは、所定の平均値および標準偏差を有するように正規化される。さらなる実施形態では、相関ベクトルは、未知の遺伝子型の動的プロファイルと既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルとの間の相関係数を含む。いくつかの実施形態では、相関ベクトルの要素は、各要素が正規分布している、同じ数の要素を含むベクトルに変換される。
一実施形態では、既知の遺伝子型のアベレージ動的プロファイルは、上述したように調製されるものなどのトレーニングセットから得られる。別の実施形態では、本方法は、自動化されている。追加の実施形態では、1つまたは複数のステップは、コンピューターを利用して実施される。さらなる実施形態では、本方法は、各既知の遺伝子型のクラス条件付き密度を使用して、既知の遺伝子型のクラス内の既知の遺伝子型のそれぞれについて、未知の遺伝子型が既知の遺伝子型である尤度を計算することをも含む。この実施形態では、クラス条件付き密度は、各遺伝子型についての平均変換型ベクトルおよび共分散行列を使用して計算される。一実施形態では、平均変換型ベクトルおよび共分散行列は、トレーニングセットから得られる各遺伝子型についてのグループ化された変換型ベクトルを含む行列から得られる。別の実施形態では、本方法は、計算された尤度から、生体試料が各既知の遺伝子型を含有する事後確率を計算することをさらに含む。この実施形態では、判定ステップはまた、生体試料がある遺伝子型を含有する事後確率が許容できる閾値内に入るかどうかを判定することによって、未知の遺伝子型が、既知の遺伝子型の1つとして分類されるかどうかを判定する。いくつかの実施形態では、許容できる閾値内に入る事後確率は、例えば、95%などの既定の閾値より大きい。
別の実施形態では、判定ステップは、未知の遺伝子型を分類するため、すなわち、既知の遺伝子型の1つが、生体試料中に存在する未知の遺伝子型と同一であるかどうかを判定するために、相関ベクトルが許容できる範囲内に入るかどうかを判定することも含む。この実施形態では、許容できる範囲は、動的プロファイル内で、独立変数に対するシグナルの測定値の既定の閾値百分率(例えば95%)を含むトレーニングセットの共分散行列の固有ベクトルによって画定される楕円体である。別の実施形態では、本方法は、各相関ベクトルをn球座標に転換することをさらに含み、ここでnは、可能な突然変異を構成する遺伝子型の数より1小さい数である。
さらなる実施形態では、本方法は、(i)対照遺伝子型の陽性対照動的プロファイルを生成することであって、陽性対照動的プロファイルは、未知の遺伝子型の動的プロファイルを構成する測定値と並行してとられた、独立変数に対する、対照遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含むことと、(ii)陽性対照動的プロファイルを、対照遺伝子型の標準陽性対照動的プロファイルと比較することによって、独立変数のシフト値を求めることと、(iii)陽性対照動的プロファイルおよび未知の遺伝子型の動的プロファイルの独立変数を、シフト値によってシフトすることとを含む。適切なシフト値および/またはスケール値は、実験に関連する陽性対照と標準陽性対照の間に最大の相関を生じるものである。この手順により、実験間または実験内の異なる生体試料についての独立変数の感度の変化またはシフトを補正することができる。例えば、異なる時間(異なる実験)において、またはチップまたはウェルに基づくシステムにおける異なる空間的位置から収集される温度の読みのわずかなシフトを、このようにして補正することによって、独立変数における分散を最小限にし、したがって遺伝子型の分類精度を増大させることができる。
別の実施形態では、各動的プロファイルは、同じ既知の遺伝子型の動的プロファイル同士間の分離を最小にしつつ、既知の遺伝子型のクラス内の異なる既知の遺伝子型の動的プロファイル同士間の分離を最大にするように選択された範囲にわたって測定された独立変数に対して、各既知の遺伝子型を含有する各核酸の物理的変化を表すシグナルの測定値を含む。この実施形態は、以下のステップ、すなわち、(a)各遺伝子型についての平均ベクトルおよびパラメータ行列を使用して、既知の遺伝子型のクラスについてのクラス内散乱行列を計算するステップと、(b)各遺伝子型についての平均ベクトルおよびパラメータ行列を使用して、既知の遺伝子型のクラスについてのクラス間散乱行列を計算するステップと、(c)クラス内散乱行列の行列式とクラス間散乱行列の行列式との比である分離比を求めるステップと、(d)独立変数についての分離最大化範囲を求めるステップであって、分離最大化範囲は、分離比を最大にするように選択されるステップとを使用して実施することができる。各動的プロファイルは、分離最大化範囲にわたって測定される独立変数に対して、各既知の遺伝子型を含有する各核酸の物理的変化を表すシグナルの測定値を含む。判定ステップは、(c)において定義された分離比を使用して定量化することができる異なる遺伝子型同士間の分離を最大にする、独立変数(x軸)上の境界によって定義される動的曲線の領域を求めることによって実施することができる。異なる遺伝子型同士間の分離の程度の定量化も、これらの動的な曲線を生じるアッセイを設計する科学者にとって重要である。この分離クオンティファイアは、科学者らが、遺伝子型を分類する精度を最大にするための、彼らの新しいアッセイ設計の改善の程度を測定するのに役立つ。
別の実施形態では、未知の遺伝子型の動的プロファイルを分類することは、(1)未知の遺伝子型の動的プロファイルを、全て一緒になって未知の遺伝子型を含有する試料についての相関ベクトルを構成する、可能な遺伝子型のそれぞれのアベレージ正規化プロファイルと相関させることと、(2)変換型ベクトルの各要素が、そのクラスまたは遺伝子型によって正規分布(例えば、ガウス分布)するように、相関ベクトルを別のベクトルに数学的に変換することと、(3)トレーニングセットから得られる各可能な遺伝子型のクラス条件付き密度を使用して、未知の遺伝子型の生体試料に対する各可能な遺伝子型の尤度を計算することと、(4)得られた各可能な遺伝子型についての尤度値から、生体試料が既知の遺伝子型を含有する事後確率を計算することとを含む。一実施形態では、各可能な遺伝子型のアベレージ正規化プロファイルは、既知の遺伝子型の複数の核酸から導出される複数の動的プロファイルのトレーニングセットから得られる。別の実施形態では、動的プロファイルは、所定の平均値および標準偏差を有するように正規化される。さらなる実施形態では、生体試料中の遺伝子型を分類する方法は、本明細書に記載されるように、陽性対照動的プロファイルを使用して、検知される独立変数のシフトおよびスケール変化を補正するステップをさらに含む。
図11A〜11Bは、本発明の実施形態によって、生体試料中に存在する核酸の遺伝子型の同一性を決定するための方法1100についての流れ図を例示する。ステップ1102において、生体試料中に含有される未知の遺伝子型の動的プロファイルy(x)が生成される。動的プロファイルは、本明細書に記載される方法のいずれかによって生成することができる。動的プロファイルは、シグナルの測定値、y(t)を含み、これは、既知の遺伝子型を含有する核酸の物理的変化を表す。シグナルのこれらの測定値は、独立変数、x(t)に対して記録される。これらの測定値は、ステップ1104における方法に入力される。動的プロファイルの生成のされ方に応じて、y(t)およびx(t)は、異なる物理的な量とすることができる。例えば、動的プロファイルが、インターカレーティング色素を伴った、既知の遺伝子型を含有する核酸の熱融解を通じて生成される場合、x(t)は温度T(t)であり、y(t)は、蛍光、F(t)、または温度に対する蛍光の導関数−dF/dTである。あるいは、動的プロファイルが、酸化還元活性分子を伴った核酸のボルタンメトリーを通じて生成される場合、x(t)は電位V(t)であり、y(t)は電流I(t)である。
ステップ1104において、対照遺伝子型の関連陽性対照動的プロファイルも、未知の遺伝子型の動的プロファイルが生成されるのと同時に生成される。陽性対照遺伝子型の関連陽性対照動的プロファイルも、動的プロファイルと同じ独立変数に対する同じシグナルの測定値からなるが、測定値は、未知の遺伝子型を含有する試料ではなく、陽性対照試料から取得される。ステップ1106において、陽性対照動的プロファイルが、陽性対照試料の測定値から生成される。ステップ1108において、陽性対照動的プロファイルは、対照遺伝子型の標準参照動的プロファイルと比較される。これは、独立変数のシフト値Δxを生成すために行われ、このステップは、トレーニングセットを生成する際に、シフト値Δxを求めるときに行われたのと同じ様式で実施される。陽性対照遺伝子型の標準参照動的プロファイルは、トレーニングセットが生成されたときに生成された標準参照動的プロファイル124とすることができる。
シフト値Δxならびに倍率αを生成するために、陽性対照プロファイルy(x)または動的プロファイルにおける独立変数が、シフト値Δxによってシフトされることによって、シフトされたプロファイルy’(x)が生成される。
’(x)=α(x−Δx)
次いでシフトされた陽性対照プロファイルy’(x)のそれぞれは、既知の陽性対照プロファイルyrs(x)と相関されることによって、相関係数rが生成される。y(x)に対する動的プロファイルy(x)の相関係数は、以下のように計算される。
式中、nは、動的プロファイルを構成する点の数であり、μy1およびμy2は、そのプロファイルの平均値であり、σy1およびσy2は、それぞれの標準偏差である。Δxおよびαの値は、相関係数rが最大化されるように選ぶことができる。図12は、本発明の一態様によってシフトされる陽性対照動的プロファイルを示す。既知の陽性対照動的プロファイル、すなわち、参照実験からの陽性対照との最大の重なり度を生成するために右にシフトされた、−dF/dT対T曲線である陽性対照動的プロファイル。図13は、相関係数r対シフト値Δxのプロットである。図から分かるように、最大相関係数をもたらすシフト値、Δx=0.7℃が選ばれ、陽性対照プロファイルは、その量によってシフトされている。
ステップ1110において、未知の遺伝子型の動的プロファイルにおける独立変数は、シフト値Δxによってシフトされる。未知の遺伝子型の動的プロファイルは、倍率αによってスケール変更することもできる。陽性対照に関連する同じ実験から取得されるすべての動的プロファイルは、同じ量によってシフトし、スケール変更することができ、すなわち、1つを超える未知の遺伝子型の動的プロファイルが1つの実験において生成される場合、ただ1つの陽性対照動的プロファイルが生成される必要があり、ただ1つのシフト値Δxが求められる必要がある。このシフト手順およびスケール変更手順により、1つの実験から次の実験で独立変数のばらつきが最小にされることによって、結果が、矛盾がなく再現可能であることが確実になる。
ステップ1112において、未知の遺伝子型の動的プロファイルは、所定の標準偏差を有するように正規化される。所定の平均値および所定の標準偏差を有するように未知の遺伝子型の動的プロファイルを正規化することも可能である。一実施形態では、未知の遺伝子型の動的プロファイルは、未知の遺伝子型の動的プロファイルが比較されることになる、既知の遺伝子型についての任意のトレーニングセットを生成するのに使用される既知の遺伝子型の動的プロファイルと同じ所定の標準偏差および/または平均値を有するように正規化される。
ステップ1114において、動的プロファイルが、遺伝子型118のクラス内の各既知の遺伝子型のアベレージ動的プロファイルのそれぞれ1つと相関されることによって、各既知の遺伝子型についての相関値を得る。この相関値は、未知の遺伝子型の動的プロファイルと既知の遺伝子型のアベレージ動的プロファイルとの間の二乗和誤差、未知の遺伝子型の動的プロファイルと既知の遺伝子型のアベレージ動的プロファイルとの間の相関係数、または未知の遺伝子型が、既知の遺伝子型のアベレージ動的プロファイルにおいて表される遺伝子型である事後確率とすることができる。相関係数および二乗和誤差は、トレーニングセットを生成する方法において相関係数および二乗和誤差を計算するのに使用された様式と同一の様式で計算することができる。
数学的に、最大値を生じる、既知の遺伝子型のアベレージ動的プロファイルに対する未知の遺伝子型を含有する動的プロファイルの相関係数は、未知の遺伝子型がその既知の遺伝子型であることを示すはずである。同様に、未知の遺伝子型の動的プロファイルと既知の遺伝子型のアベレージ動的プロファイルとの間で最小のアベレージ二乗和誤差を生じる既知の遺伝子型のアベレージ動的プロファイルは、未知の遺伝子型がその既知の遺伝子型であることを示すはずである。
しかし、統計的に、最大相関係数または最小二乗和誤差は、必ずしも正しい遺伝子型に対応しない場合がある。一実施形態では、未知の遺伝子型を含有する生体試料が、特定の既知の遺伝子型を含有する確率または信頼度を統計的に計算するために、未知の遺伝子型が既知の遺伝子型である事後確率が計算される。最初に、相関ベクトルrが計算される。一実施形態では、相関ベクトルrは、未知の遺伝子型の動的プロファイルと、遺伝子型のクラス内のある既知の遺伝子型のアベレージ動的プロファイル118のそれぞれとの間の相関係数をその要素中に含む、次元[N×1]を有するベクトルである。あるいは、相関係数は、未知の遺伝子型の動的プロファイルと、遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルとの間のアベレージ二乗和誤差であってもよい。ステップ1116において、相関ベクトルrの要素は、相関ベクトルrの要素をn球座標に転換することによって相関ベクトルvに転換され、これにより、相関ベクトルの要素は、正規(またはガウス)分布内に入る。
ステップ1118において、第1の既知の遺伝子型の動的プロファイルを、第1の既知の遺伝子型のアベレージ正規化動的プロファイルと相関させると、変換型相関ベクトルvを生成するクラス条件付き確率p(g|v)が計算される。既知の遺伝子型gが相関ベクトルvを生成するクラス条件付き確率は、以下の式を使用することによって、その既知の遺伝子型についてのトレーニングセット1120中に含まれる平均ベクトルμおよび共分散行列Cから計算することができる。
式中、|C|は、共分散行列の行列式であり、Nは、可能な突然変異のすべてを構成する遺伝子型の数である。
遺伝子型のクラス内の各可能な遺伝子型の出現が、集団において等しくありそうな場合、未知の遺伝子型は、より大きな程度の信頼度を伴った最大のクラス条件付き確率を有する遺伝子型として同定することができる。しかし、一実施形態では、未知の遺伝子型が既知の遺伝子型に対応する事後確率は、図11Bのステップ1122に例示されているように計算される。ユーザーは、ステップ1124に例示されているように、既知の遺伝子型の頻度P(g)をアルゴリズム中に入力することができ、ベイズの定理を使用することによって、未知の試料が既知の遺伝子型である事後確率p(v|g)を計算することができる。
本発明の一実施形態では、ステップ1126に示されているように、遺伝子型について計算された事後確率が所定の閾値値より大きい場合にコールが行われる。本発明の一実施形態では、閾値値は、95%以上である。事後確率のいずれも閾値値より大きくない場合、コールは行われず、この結果は、ステップ1128で出力される。事後確率が閾値値より大きい場合、未知の遺伝子型は、既知の遺伝子型として分類することができる。いくつかの実施形態では、相関ベクトルが許容できる範囲内に入らない場合、未知の遺伝子型が既知の遺伝子型である事後確率が所定の閾値より大きい場合であっても、未知の遺伝子型が既知の遺伝子型として分類される場合はなく、したがって、ステップ1128に例示されているように、コールは出力されない。
許容できる範囲を求めるために、既知の遺伝子型の共分散行列の固有ベクトルおよび固有値が計算される。共分散行列の固有ベクトルは、既知の遺伝子型についてのトレーニングセットにおける既知の遺伝子型の各動的プロファイルから生成される、所定の割合の変換型相関ベクトルvを含むはずであるn−楕円体(ここでnは、変換型相関ベクトルv中の要素の数である)を画定する。一実施形態では、所定の割合は98%である。ステップ1130において、相関ベクトルvが許容できる範囲内に入ると判定される場合、ステップ1132において、未知の遺伝子型は、最大事後確率を有する既知の遺伝子型として分類される。
上述したように、最大相関係数を生じる既知の遺伝子型のアベレージ動的プロファイルに対する、未知の遺伝子型を含有する動的プロファイルの相関係数は、未知の遺伝子型がその既知の遺伝子型であることを示すことができる。しかし、より確実であるために、いくつかの実施形態では、試料が特定の既知の遺伝子型を含有する事後確率を計算することが好適である。図14は、WTのアベレージ動的プロファイル、HEのアベレージ動的プロファイル、およびHMのアベレージ動的プロファイルに対する、異なる試料から得られた63の異なる動的プロファイルの相関係数を示す。より濃い範囲は、より大きい相関係数を表し、より薄い範囲は、より小さい相関係数を表す。その一方で、図15は、対応する事後確率を示し、より濃い範囲は、より大きい事後確率を表し、より薄い範囲は、より小さい事後確率を表す。両図において、円は実際の遺伝子型を表す一方で、エックスは、図16において最大相関係数、および図15において最大事後確率を表す。図14において、動的プロファイルは、3つすべての遺伝子型について、アベレージ動的プロファイルに対して有意な相関を示すことが分かる。しかし、図15において、事後確率が使用される場合、遺伝子型の判定は、ほぼ100%確実である。
本発明のさらなる実施形態では、動的プロファイルは、独立変数値の特定の分離最大化範囲内で得られる。一実施形態では、分離最大化範囲は、遺伝子型のクラス内の異なる遺伝子型同士間の分離を定量化することによって求められる。この分離は、クラス間散乱とクラス内散乱の比として定量化することができる。この分離を定量化するために、パラメータ行列Vが、遺伝子型のクラス内からのN個の遺伝子型のそれぞれについてのk個のトレーニングセットのそれぞれから得られる。遺伝子型のクラスについて、クラス間散乱行列およびクラス内散乱行列を計算してもよい。遺伝子型のクラスについてのクラス内散乱行列は、以下の式を使用して計算することができ、
一方、クラス間散乱行列は、以下の式を使用して計算することができる。
式中、μは、i番目のトレーニングセットについての平均ベクトルであり、μは、遺伝子型のクラスについてのトレーニングセットのすべてを構成するすべての動的プロファイルの平均パラメータセットである。次いで分離比qは、クラス間散乱行列とクラス内散乱行列の行列式の比を計算することによって求めることができる。
分離最大化範囲は、分離比qの最大値が得られるように選ばれる。qは、最小値xmimと最大値xmaxの間の範囲内の独立変数に対するシグナルの測定値のみが含まれる、既知の遺伝子型のクラス内の各既知の遺伝子型の動的プロファイルからトレーニングセットを最初に得ることによって、遺伝子型の特定のクラスについて最大にされる。次いで分離比qが計算され、記録される。第3に、多種多様な異なるxmimおよびxmaxについて第1および第2のステップが繰り返される。次いで、qの最大値をもたらすxmimおよびxmaxの値が、独立変数値の分離最大化範囲として選択される。分離最大化範囲内の独立変数値に対するシグナルの測定値が、遺伝子型のそのクラス内の遺伝子型の動的プロファイル、ならびに遺伝子型のそのクラス内の遺伝子型の1つであると推定される未知の遺伝子型の動的プロファイルに含められる。一実施形態では、xmimおよびXmaxの異なる値についてqを繰り返して計算することによって、qが最大になるxminおよびxmaxの値を求め、したがって分離最大化範囲を求めることができる。
図16は、ワルファリンVKORC1多型クラスにおける熱融解曲線である動的プロファイルの計算を示す。各正方形は、℃でのTmimとTmaxの間の温度ウインドウを表す。正方形の濃淡の濃さは、qの対数に比例している。図から分かるように、曲線の分離は、Tminが70℃と80℃の間であり、Tmaxが80℃と85℃の間である場合に一般に最大になる。最適な温度ウインドウは、この図から、79℃と82℃の間である。
本発明の他の実施形態が、図17A〜17Cに例示されている。例えば、図17A〜17Cは、トレーニングセットを生成する方法100、および未知の遺伝子型を同定する方法1100を、どのように組み合わせて、生体試料中に存在する核酸の遺伝子型の同一性を決定するための方法1700にすることができるかを示す流れ図を例示する。未知の遺伝子型を含有する生体試料からの独立変数に対するシグナルの測定値が生成され、ステップ1104に入力される。同様に、各試料に関連する対照遺伝子型のシグナルとともに、独立変数に対して、既知の遺伝子型の複数の試料からのシグナルの測定値が、ステップ104において生成される。ステップ104において、各試料に関連する対照遺伝子型に対応するシグナルの測定値とともに、独立変数に対する既知の遺伝子型の複数の生体試料からのシグナルの測定値を入力することによって、トレーニングセットが最初に生成される。これらのシグナルは、ステップ102において既知の遺伝子型の動的プロファイルを生成するとともに、ステップ106において対照遺伝子型の陽性対照動的プロファイルを生成するのに使用される。陽性対照動的プロファイルの独立変数は、ステップ108においてシフト値を生成するために、既知の陽性対照動的プロファイルと測定された陽性対照動的プロファイルとの間の相関係数が最大になるようにシフトされる。次いで、既知の遺伝子型の動的プロファイルは、ステップ110においてシフト値によってシフトし、ステップ112において1の標準偏差および0のアベレージ値を有するように正規化することができる。
次いで、既知の遺伝子型の動的プロファイルは、図17Bに例示されているように、ステップ116において、一緒にアベレージされることによって、既知の遺伝子型のアベレージ動的プロファイルを生成することができる。次いで、既知の遺伝子型の各動的プロファイルは、ステップ126において、遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルに対して相関されることによって、その要素が、各既知の遺伝子型の各アベレージ動的プロファイルに対する既知の遺伝子型の動的プロファイルの相関係数である、いくつかの相関ベクトルrを生成することができる。これらの相関ベクトルrは、ステップ128において、n球座標に変換されることによって、既知の遺伝子型のアベレージ動的プロファイルに対する特定の既知の遺伝子型のすべての動的プロファイルについての相関係数が正規分布していることを保証する。このステップにより、いくつかの変換型相関ベクトルvが生成される。特定の既知の遺伝子型のすべての動的プロファイルについての変換型相関ベクトルは、既知の遺伝子型についてのパラメータ行列V中に一緒にグループ化することができ、これは、ステップ132において平均ベクトルμ、およびステップ134において既知の遺伝子型についての共分散行列Cを生成するのに使用することができる。
図17A〜17Cは、遺伝子型が生体試料中に存在するかどうかを判定するための、特定の遺伝子型について生成されたトレーニングセットの使用を例示する。未知の遺伝子型を含有する生体試料の動的プロファイルが、ステップ1102において生成される。同時に、陽性対照遺伝子型の陽性対照動的プロファイルが、ステップ1106において生成される。陽性対照動的プロファイルの独立変数は、シフト値を生成するために、ステップ1108において、既知の陽性対照動的プロファイルと、測定された陽性対照動的プロファイルとの間の相関係数が最大になるようにシフトされる。次いで、未知の遺伝子型の動的プロファイルが、ステップ1110において、シフト値によってシフトされ、ステップ1112において、1の標準偏差、および0の平均値を有するように正規化される。
次いでステップ1114において、未知の遺伝子型の動的プロファイルは、ステップ116においてトレーニングセットを生成する方法によって生成された、既知の遺伝子型の1つまたは複数のアベレージ動的プロファイルと相関される。分離最大化範囲がステップ1702で入力され、ステップ1114において、分離最大化範囲内に入る動的プロファイル内の独立変数値でのシグナルの測定値のみが、やはり分離最大化範囲内にあるアベレージ動的プロファイル中の点と比較される。
好ましくは、未知の遺伝子型の動的プロファイルは、遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルと相関されることによって、相関ベクトルrが生成される。次いで、ステップ1116に示されるように、この相関ベクトルは、相関ベクトルの要素を強制的に正規分布するようにするために、n球座標に変換されることによって、変換型相関ベクトルvが生成される。ステップ1118において、変換型相関ベクトルvが、ステップ132において生成された既知の遺伝子型についての平均ベクトルμ、およびステップ134において生成された既知の遺伝子型についての共分散行列Cとともに使用されることによって、既知の遺伝子型の動的プロファイルが変換型相関ベクトルvを生成するクラス条件付き確率p(v|g)が求められる。集団P(g)中の既知の遺伝子型の頻度を、ステップ1124で本方法に入力することができ、ステップ1122において、集団P(g)中の既知の遺伝子型のクラス条件付き確率p(v|g)および頻度を使用することによって、試料が既知の遺伝子型を含有する事後確率p(g|v)を計算することができる。好適な実施形態では、遺伝子型のクラス内の各既知の遺伝子型についての事後確率は、同様にこのようにして計算される。
一般に、未知の遺伝子型は、最大事後確率を生じる既知の遺伝子型と同一であるが、信頼度内で確実であるために、ステップ1126において、最大事後確率を閾値値と比較することができる。いくつかの実施形態では、最大事後確率が閾値値より大きくない場合、未知の遺伝子型は、最大事後確率を生じた既知の遺伝子型として同定することができる。最大事後確率が閾値値より大きい場合、相関ベクトルvが許容できる範囲内に入るかどうかのコールを行うことができ、これは、ステップ1130として示されている。最大事後確率に対応する遺伝子型についての共分散行列Cの固有ベクトルに沿って画定されるn−楕円体内に入る相関ベクトルは、許容できる範囲に入る。このn−楕円体は、最大事後確率に対応する遺伝子型のパラメータ行列V中にコンパイルされる相関ベクトルの所定の閾値百分率を含むことができる。ステップ1132において、変換型相関ベクトルVがこのn−楕円体内に確かに入る場合、未知の遺伝子型は、最大事後確率に対応する遺伝子型として同定することができる。
図1A、1B、11A、11B、17A、17B、および17Cに示された実施形態の1つまたは複数のステップは、コンピューターを使用して実施することができる。さらに、図1A、1B、11A、および11Bに示された実施形態の方法は、動的プロファイルおよび陽性対照プロファイル、ならびに一般集団における遺伝子型のクラス内の各可能な遺伝子型の確率を生成するのに使用される、独立変数に対するシグナルの測定値を入力すること以外に、ユーザーからいずれの入力もすることなく、すべてのステップを実施するのにコンピューターを使用して自動化することができる。本発明の方法は、コンピューターまたは自動設定で実施されるのに最適であり、その理由は、これらが、未知の核酸の遺伝子型を同定するための直接かつ迅速な解決策であり、この解決策は、遺伝子型を同定するための先の計算方法より、ユーザーの介入および計算の必要が著しく少ないためである。さらに、本方法は、1つのパラメータ(例えば、融解温度)からの動的プロファイルによって表される遺伝子型を単に同定しようと試みるのではなく、動的プロファイルの全体的な形状および動態を考慮に入れる。
他の態様によれば、本発明は、少なくとも1つの未知の遺伝子型を含有する生体試料中の遺伝子型を同定するためのシステムも提供する。このシステムは、生成モジュール、相関モジュール、クラス条件付き密度モジュール、事後確率モジュール、および判定モジュールを備える。生成モジュールは、生体試料中に含有される未知の遺伝子型の動的プロファイルを生成することができる。動的プロファイルは、本明細書に記載されるような独立変数に対して、未知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含む。
未知の遺伝子型の動的プロファイルを生成することなど、本発明のいくつかの態様によって使用するのに適したシステムの例が、図18とともに例示されている。図18に例示されているように、システム1800は、マイクロ流体デバイス1802を含むことができる。マイクロ流体デバイス1802は、1つまたは複数のマイクロ流体チャネル1804を含むことができる。示された例では、デバイス1802は、2つのマイクロ流体チャネル、すなわち、チャネル1804aおよびチャネル1804bを含む。2つのチャネルのみが例示的な実施形態において示されているが、デバイス1802は、2つより少ない、または2つを超えるチャネルを有することができることが企図されている。例えば、いくつかの実施形態では、デバイス1802は、8つのチャネル1804を含む。
デバイス1802は、2つのDNA処理ゾーン、すなわち、DNA増幅ゾーン1831(別名PCRゾーン1831)およびDNA融解ゾーン1832を含むことができる。PCRゾーン1831を通って移動するDNA試料は、PCRを受けることができ、融解ゾーン1832を通過するDNA試料は、高解像度熱融解を受けることができる。図18に例示されているように、PCRゾーン1831は、チャネル1804の第1の部分を含み、融解ゾーン1832は、チャネル1804の第2の部分を含み、これは、第1の部分から下流にある。
デバイス1802はまた、シッパー(sipper)1808を含むことができる。シッパー1808は、中空の管の形態であってもよい。シッパー1808は、入口1809に接続された近位末端を有し、この入口は、シッパー1808の近位末端をチャネル1804に連結する。デバイス1802はまた、入口1809に接続された一般的な試薬ウェル1806を含むことができる。デバイス1802はまた、各チャネル1804に対して、遺伝子座特異的試薬ウェル1805を含むことができる。例えば、示された実施形態では、デバイス1802は、チャネル1804aに接続された遺伝子座特異的試薬ウェル1805aを含み、チャネル1804bに接続された遺伝子座特異的試薬ウェル1805bを含むことができる。デバイス1802はまた、各チャネル1804に対して廃棄物ウェル1810を含むことができる。
一般的な試薬ウェル1806中に貯蔵される溶液は、dNTP、ポリメラーゼ酵素、塩、緩衝液、表面不動態化試薬、1つまたは複数の非特異的蛍光DNA検出分子、流体マーカーなどを含むことができる。遺伝子座特異的試薬ウェル1805中に貯蔵される溶液は、PCRプライマー、配列特異的蛍光性DNAプローブまたはマーカー、塩、緩衝液、表面不動態化試薬などを含むことができる。
チャネル1804中に試料溶液を導入するために、システム1800は、複数のウェル1898を含み、少なくともそのいくつかは、試料溶液(例えば、DNA試料を含む溶液)を含むウェルプレート1896を含むことができる。示された実施形態では、ウェルプレート1896は、位置決めシステム1894に接続されており、このシステムは、主制御装置1830に接続されている。
1830.
主制御装置1830は、例えば、Austin、TXのNational Instruments Corporationから入手可能なPXI−8105制御装置を使用して実装することができる。位置決めシステム1894は、ウェルプレート1896を位置決めするためのポジショナー(例えば、PAのParker Hannifin Corporation(「Parker」)から入手可能なMX80ポジショナー)、ポジショナーを駆動するためのステッピングドライブ(例えば、Parkerから入手可能なE−AC Microstepping Drive)、およびステッピングドライブを制御するための制御装置(例えば、Parkerから入手可能な6K4制御装置)を含むことができる。
チャネル1804中に試料溶液を導入するために、位置決めシステム1894が制御されることによって、シッパー1808の遠位末端が、ウェル1898の1つに貯蔵された試料溶液中に浸されるように、ウェルプレート1896が移動する。図18は、1808の遠位末端が、ウェル1898n中に貯蔵された試料溶液内に浸されているのを示す。
試料溶液を強制的にシッパーから上昇させ、チャネル1804中に移動させるために、真空マニホールド1812およびポンプ1814を使用することができる。真空マニホールド1812は、デバイス1802の一部と作動可能に接続することができ、ポンプ1814は、マニホールド1812と作動可能に接続することができる。ポンプ1814が稼動すると、ポンプ1814は、圧力差を作り(例えば、ポンプ1814は、廃棄物ウェル1810から空気を引き出すことができる)、この圧力差が、ウェル1898n中に貯蔵された試料溶液を、シッパー1808を昇り、入口チャネル1809を通って、チャネル1804中に流れさせる。さらに、これは、ウェル1806および1805中の試薬をチャネル中に流れさせる。したがって、ポンプ1814は、試料溶液およびリアルタイムPCR試薬を、チャネル1804を通って強制的に流れさせるように機能する。図18に例示されているように、融解ゾーン1832は、PCRゾーン1831から下流に配置されている。したがって、試料溶液は、PCRゾーンを最初に通り、次いで融解ゾーンを通って流れることになる。
ウェルプレート1896に戻って参照すると、ウェルプレート1896は、緩衝液ウェル1898aを含むことができる。一実施形態では、緩衝液ウェル1898aは、緩衝液1897を保持する。緩衝液1897は、従来のリアルタイム(RT)PCR緩衝液などの従来のPCR緩衝液を含むことができる。従来のPCR緩衝液は、Bio−Rad Laboratories,Inc.、Applied Biosystems、Roche Diagnostics、および他の供給業者を含めたいくつかの供給業者から入手可能である。
PCRゾーン1831を通って流れるDNA試料にPCRを実現するために、当技術分野で周知であるように、試料の温度をサイクルさせなければならない。したがって、いくつかの実施形態では、システム1800は、温度制御システム1820を含む。温度制御システム1820は、温度センサー、加熱器/冷却器、および温度制御装置を含むことができる。いくつかの実施形態では、温度制御システム1820は、主制御装置1830がPCRゾーンおよび融解ゾーンを通って流れる試料の温度を制御することができるように、主制御装置1830と連係されている。主制御装置1830は、グラフィカルユーザーインターフェースを表示するための表示デバイスに接続することができる。主制御装置1830はまた、ユーザー入力デバイス1834に接続することができ、これにより、ユーザーが主制御装置1830にデータおよびコマンドを入力することが可能になる。
それぞれPCRゾーン1831および融解ゾーン1832で行われるPCRプロセスおよび融解プロセスをモニターするために、システム1800は、イメージングシステム1818を含むことができる。イメージングシステム1818は、励起源、画像取得デバイス、制御装置、および画像記憶ユニットを含むことができる。本発明のいくつかの態様による、適当なシステムの他の態様は、その全体が参照により本明細書に組み込まれている、米国特許出願公開第2008/0176230号に開示されている。
システム1800は、ユーザー入力デバイス1834、表示デバイス1836、および主制御装置1830と連通した適切に制御可能なコンピューターをさらに含む。コンピューターは、多くの情報源、イメージングシステム1818、および温度制御システム1820の中から情報を受け取り、本発明のいくつかの態様によって、生体試料中の未知の遺伝子型の同定を可能にし、本発明の別の態様により、トレーニングセットの生成を可能にすることによって、遺伝子型のクラス内から、ある既知の遺伝子型を装置に認識させる。
上述したように、本発明のこの態様によるシステムは、生成モジュールを備える。生成モジュールは、生体試料中に含有される未知の遺伝子型の動的プロファイルを生成することができる。動的プロファイルは、独立変数に対して、未知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含む。一実施形態では、生成モジュールは、独立変数に対して、未知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を取得し、この測定値を処理することによって、未知の遺伝子型の動的プロファイルを作成することができる任意のデバイスである。別の実施形態では、生成モジュールは、上述したマイクロ流体デバイスである。
本発明のいくつかの態様によるシステムは、未知の遺伝子型の動的プロファイルをアベレージ動的プロファイルと相関させることができる相関モジュールをさらに備え、このアベレージ動的プロファイルは、既知の遺伝子型のクラス内の各遺伝子型についての既知の遺伝子型の、本明細書に記載されるようなアベレージ正規化動的プロファイルであってもよい。相関モジュールは、その要素が、未知の遺伝子型の動的プロファイルと、既知の遺伝子型のクラス内の各既知の遺伝子型についてのアベレージ正規化動的プロファイルとの間の相関係数を含む相関ベクトルを生成することができる。既知の遺伝子型のアベレージ動的プロファイルのそれぞれは、その遺伝子型についてのトレーニングセット中に含まれる既知の遺伝子型のアベレージ動的プロファイルである。一実施形態では、既知の遺伝子型についてのトレーニングセットは、既知の遺伝子型についての平均変換型ベクトル、および既知の遺伝子型についての共分散行列をさらに含むことができる。別の実施形態では、相関モジュールは、相関ベクトルを変換型ベクトルに変換することもでき、変換型ベクトルの各要素は、正規分布している。一実施形態によれば、相関モジュールは、適切にプログラムされたコンピューター、またはコンピューター判読可能な媒体上に記憶されたソフトウェアを備え、ソフトウェアは、コンピューターによって実行されるとき、ソフトウェアがコンピューターに、未知の遺伝子型の動的プロファイルを、既知の遺伝子型のアベレージ動的プロファイルと相関させることによって、相関ベクトルを生成することを可能するように構成されている。適切にプログラムされたコンピューターまたはソフトウェアは、コンピューターによって実行されるとき、ソフトウェアがコンピューターに、相関ベクトルを変換型ベクトルに変換することを可能にするように構成することもできる。
本発明のいくつかの態様によるシステムは、クラス条件付き密度モジュールをさらに備える。クラス条件付き密度モジュールは、既知の遺伝子型のクラス内の既知の遺伝子型のそれぞれのクラス条件付き密度を使用して、既知の遺伝子型のクラス内の既知の遺伝子型のそれぞれについて、未知の遺伝子型が既知の遺伝子型である尤度を計算することができる。クラス条件付き密度は、各既知の遺伝子型についての平均変換型ベクトルおよび共分散行列を使用して計算することができる。平均変換型ベクトルおよび共分散行列は、トレーニングセットから得られる各既知の遺伝子型についてのグループ化された変換型ベクトルを含む行列から得ることができる。一実施形態によれば、クラス条件付き密度モジュールは、適切にプログラムされたコンピューター、またはコンピューター判読可能な媒体上に記憶されたソフトウェアを備え、ソフトウェアは、コンピューターによって実行されるとき、ソフトウェアがコンピューターに、クラス条件付き密度から尤度を計算することを可能にするように構成される。
さらなる実施形態では、システムは、事後確率モジュールを含む。事後確率モジュールは、クラス条件付き密度モジュールによって計算された尤度から、生体試料が各既知の遺伝子型を含有する事後確率を計算することができる。一実施形態では、事後確率は、計算された尤度およびベイズの定理から計算することができる。一実施形態によれば、事後確率モジュールは、適切にプログラムされたコンピューター、またはコンピューター判読可能な媒体上に記憶されたソフトウェアを備え、ソフトウェアは、コンピューターによって実行されるとき、ソフトウェアがコンピューターに、事後確率を計算することを可能にするように構成される。
システムは、最大事後確率を有する既知の遺伝子型が、許容できる閾値内に入るかどうかを判定することによって、未知の遺伝子型が、最大事後確率を有する遺伝子型として分類されるかどうかを判定し、したがって、これにより未知の遺伝子型を同定することができる判定モジュールをさらに含むことができる。一実施形態では、判定モジュールは、相関ベクトルから得られた変換型ベクトルが、最大事後確率を有する遺伝子型についてのトレーニングセットから求められた範囲内の許容できる範囲内に入るかどうかを判定し、これにより遺伝子型の同定が正しいという信頼度レベルを増大させることもできる。許容できる範囲は、パラメータ行列中に所定の割合の相関ベクトルを含むトレーニングセットの共分散行列の固有ベクトルによって画定されるn楕円体とすることができる。一実施形態では、許容できる範囲は、動的プロファイル内の独立変数に対するシグナルの測定値の既定の割合(例えば、99%)を含むトレーニングセットの共分散行列の固有ベクトルによって画定される楕円体である。一実施形態によれば、判定モジュールは、適切にプログラムされたコンピューター、またはコンピューター判読可能な媒体上に記憶されたソフトウェアを備え、ソフトウェアは、コンピューターによって実行されるとき、ソフトウェアがコンピューターに、未知の遺伝子型の同一性を決定することを可能にするように構成される。適切にプログラムされたコンピューターまたはソフトウェアは、コンピューターによって実行されるとき、ソフトウェアがコンピューターに、変換型ベクトルが、許容できる範囲内に入るかどうかを判定することを可能にするように構成することもできる。
本発明のいくつかの態様では、システムは、エラー補正モジュールをさらに含むことができる。エラー補正モジュールは、陽性対照動的プロファイルを、対照遺伝子型の既知の動的プロファイルと比較することによって、動的プロファイルの独立変数のシフト値を求めることができる。エラー補正モジュールは、未知の遺伝子型の動的プロファイルにおける独立変数を、シフト値によってシフトすることもできる。一実施形態によれば、エラー補正モジュールは、適切にプログラムされたコンピューター、またはコンピューター判読可能な媒体上に記憶されたソフトウェアを備え、ソフトウェアは、コンピューターによって実行されるとき、ソフトウェアがコンピューターに、シフト値を計算し、未知の遺伝子型の動的プロファイルにおける独立変数をシフトすることを可能にするように構成される。
本発明の別の態様では、システムは、トレーニングセットモジュールを含む。トレーニングセットモジュールは、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルを備える。既知の遺伝子型のアベレージ動的プロファイルは、独立変数に対して、各既知の遺伝子型の様々な動的プロファイルのアベレージ測定値を含むことができる。アベレージ動的プロファイルは、本明細書に記載されるような、アベレージ正規化動的プロファイルであってもよい。トレーニングセットモジュールは、パラメータ行列も備える。パラメータ行列の要素は相関ベクトルであり、ここで各相関ベクトルは、動的プロファイルと、既知の遺伝子型のクラス内の各既知の遺伝子型の各アベレージ動的プロファイルとの間の相関係数を含む。さらなる実施形態では、トレーニングセットモジュールは、平均変換型ベクトルを含む。平均変換型ベクトルの要素は、遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルに対する、各既知の遺伝子型の各動的プロファイルの相関係数のアベレージ値である。さらに、トレーニングセットモジュールは、共分散行列を含むことができ、これは、パラメータ行列の共分散行列であってもよい。一実施形態によれば、トレーニングセットモジュールは、適切にプログラムされたコンピューター、またはコンピューター判読可能な媒体上に記憶されたソフトウェアを備え、ソフトウェアは、コンピューターによって実行されるとき、ソフトウェアがコンピューターに、トレーニングセットモジュール内に含まれるデータを得ることを可能にするように構成される。
さらなる実施形態では、システムは、分離最大化範囲選択モジュールも含む。分離最大化範囲選択モジュールは、各遺伝子型についての相関ベクトルの平均ベクトルおよびベクトルを使用して、既知の遺伝子型クラスについてのクラス内散乱行列を計算することができる。さらに、分離最大化範囲選択モジュールは、各既知の遺伝子型についての相関ベクトルの平均ベクトルおよびベクトルを使用して、既知の遺伝子型クラスについてのクラス間散乱行列を計算することができる。分離最大化範囲選択モジュールは、クラス内散乱行列の行列式とクラス間散乱行列の行列式の比である分離比を求め、この分離比を最大にするにするために、分離最大化範囲を選択することもできる。一実施形態によれば、分離最大化範囲選択モジュールは、適切にプログラムされたコンピューター、またはコンピューター判読可能な媒体上に記憶されたソフトウェアを備え、ソフトウェアは、コンピューターによって実行されるとき、ソフトウェアがコンピューターに、独立変数についての分離最大化範囲を求めることを可能にするように構成される。
本発明によるシステムは、転換モジュールをさらに含むことができる。転換モジュールは、相関ベクトルをn球座標に転換することができ、ここでnは、可能な突然変異のすべてを構成する遺伝子型の数より少なくとも1小さい。一実施形態によれば、転換モジュールは、適切にプログラムされたコンピューター、またはコンピューター判読可能な媒体上に記憶されたソフトウェアを備え、ソフトウェアは、コンピューターによって実行されるとき、ソフトウェアがコンピューターに、相関ベクトルをn球座標に転換することを可能にするように構成される。
本発明の方法およびシステムは、以下の実施例を参照して理解することができ、これらは、限定的であることを意図されていない。
ワルファリンVKORC1多型についてのトレーニングセットの生成
ワルファリンVKORC1多型遺伝子型のそれぞれについて、等しく間隔をあけた温度間隔で蛍光の測定値を含むいくつかの熱融解曲線を、Roche LC280ライトサイクラーで実行した40PCRサイクルの後に、LC Green蛍光色素を使用して、毎秒0.5℃で50℃から95℃に高解像度熱融解することによって得た。これらの曲線を図2に示す。Savitsky−Golay導関数フィルターを適用することによって、生成した曲線のそれぞれについて−dF/dTを計算し、図3に示す曲線を得た。陽性対照熱融解曲線は、ワルファリンVKORC1多型遺伝子型のそれぞれの各熱融解曲線とともに、ワルファリンVKORC1多型の野生型遺伝子型を含有する既知の試料の高解像度熱融解分析によって得た。陽性対照についての蛍光の測定値を、いくつかの実施に対してアベレージすることによって、陽性対照についての参照標準熱融解曲線を生成した。陽性対照熱融解曲線を、選ばれた値Δxによってシフトすることによって、陽性対照熱融解曲線と参照標準熱融解曲線との間の相関係数を最大にした。ワルファリンVKORC1多型遺伝子型のそれぞれの各熱融解曲線を、同一の標準偏差(1)および同一の平均値(0)を有するように正規化した。これらの曲線を、より細い線として図5に示す。
ワルファリンVKORC1多型は、3つの可能な遺伝子型、すなわち、野生型(WT)、ヘテロ接合性突然変異体(HE)、およびホモ接合性突然変異体(HM)を有する。WT遺伝子型に対応する熱融解曲線のすべてを一緒にアベレージすることによって、WT遺伝子型についてのアベレージ熱融解曲線を生成した。HEおよびHM遺伝子型についてのアベレージ熱融解曲線を、同様の様式で生成した。WH、HE、およびHM遺伝子型についてのこれらのアベレージ熱融解曲線は、濃い、太い線として図5にプロットされている。
WT遺伝子型を含有する試料から生成した熱融解曲線のそれぞれを、WT、HE、およびHM遺伝子型についてのアベレージ熱融解曲線に対して相関させることによって、各熱融解曲線についての3つの相関係数、すなわちrwt、rsh、およびrhmを生成した。これらはそれぞれ、WT、HE、およびHM遺伝子型についてのアベレージ熱融解曲線に対する熱融解曲線の相関係数を表す。したがって、各熱融解曲線は、これに関連する相関ベクトルrを有し、相関ベクトルrは、
である。
図6は、WT、HE、およびHM遺伝子型についての熱融解曲線に関連する相関ベクトルのプロットを示す。このプロットから、相関ベクトルは正規分布していないことが分かる。図10は、図6と同じ点であるが、x+y+z=0の面に投影された点を示す。この2次元投影では、点は、正規分布している。しかし、相関ベクトルは、2次元の面に投影されたときのみ正規分布するので、この様式では一部の情報が失われる場合がある。したがって、相関ベクトルの正規分布を得るために、熱融解曲線についての相関ベクトルのすべてを、2球座標に転換することによって、rwt、rsh、およびrhmの値の分布が正規分布である、例えば、これがガウス分布であることを保証する。この変換は、以下の式によって実現することができる。
いくつかの実施形態では、可能な遺伝子型または次元の数であるNが3より大きい場合、この変換は、以下のように、すなわち
およびNが4より大きい他の実施形態について同様に拡張することができる。相関ベクトルを球座標に変換することによって、図8で分かるように、相関ベクトルの正規分布が実現される。同様に、図7は、相関係数自体は、WTクラスについて正規分布していないことを示す棒グラフを示すが、相関ベクトルを球座標に変換することによって、図9に示すように、より正規な分布を実現することができる。
WT熱融解曲線に関連する変換型相関ベクトルvは、パラメータ行列Vwt中に一緒にグループ化される(水平方向に積み重ねられる)。
式中、nは、野生型遺伝子型のアベレージ正規化プロファイルを計算するのに使用される動的プロファイルの数である。Vにおいて、各行は、パラメータ(すなわち、l、a、またはa)であり、各列は、その特定の遺伝子型についての異なる動的(融解)曲線の観察値である。Vwtの各行の平均値を計算することによって、平均ベクトルμwtを得る。
μ(l)、μ(a)、およびμ(a)は、それぞれ、l、a、aのアベレージ値である。次いで、Vwtの共分散行列Cwtの各要素(i,j)を以下のように計算する。
共分散行列Cwt、平均ベクトルμwt、およびWT遺伝子型についてのアベレージ熱融解曲線は、WT遺伝子型についてのトレーニングセットを構成する。同じステップによって、HEおよびHM、ならびに/または任意の他の可能な遺伝子型について、同様のトレーニングセットを生成する。
遺伝子型同士間の分離の程度の定量化
いくつかの実施形態では、ワルファリンVKORC1多型における遺伝子型同士間の分離は、分類分析において使用されるデータについての温度ウインドウを選択することによって最大化することができる。この温度ウインドウの境界であるTminおよびTmaxは、以下の式で示すように、クラス間散乱行列の行列式とクラス内散乱行列の行列式との比である分離ファクターqを最大にするように選ぶ。
クラス内散乱行列は、以下の式によって、WT、HE、およびHMトレーニングセットから計算することができる。
式中、vは、それぞれVWT、VHE、またはVHMの列または要素である。
クラス間散乱行列は、以下の式から計算することができる。
式中、μは、その要素が、ワルファリンVKORC1多型についてのトレーニングセットの作成において使用されるすべての熱融解曲線についてのrwt、rsh、およびrhmの平均値であるベクトルであり、NWT、NHE、およびNHMは、そのそれぞれの遺伝子型についてのアベレージプロファイルを構成する測定値の数である。
分離ファクターqは、異なるTminおよびTmaxを繰り返して選び、新しいクラス間散乱行列およびクラス内散乱行列を計算し、次いで、最大値が見つかるまで、qの値を記録することによって最大化する。遺伝子型のワルファリンVKORC1多型クラスについてのこのプロセスの結果を図16に示す。図16は、Tmax対Tmin対log(q)のプロットを示す。Log(q)は、グレースケールで表しており、より濃いグレーは、qのより大きい値を表し、一方より薄いグレーは、qのより小さい値を表す。この実施例では、qの最大値は、Tminが79℃であり、Tmaxが82℃であったときであることが判明した。
凝固因子MTHFR677多型についてのトレーニングセットの生成
凝固因子MTHFR677多型遺伝子型のそれぞれについて、等しく間隔をあけた温度間隔で蛍光の測定値を含むいくつかの熱融解曲線を、Roche LC480ライトサイクラーで実行した40PCRサイクルの後に、LC Green蛍光色素を使用して、毎秒0.5℃で50℃から95℃に高解像度熱融解することによって得た。これらの曲線を図19に示す。Savitsky−Golayフィルターを適用することによって、生成した曲線のそれぞれについて−dF/dTを計算し、図20に示す曲線を得た。曲線を、ワルファリンVKORC1多型についての熱融解曲線に対して行ったのと同じ様式で温度をシフトし、正規化する。これらのシフトされ、正規化された曲線を図21に示す。凝固因子MTHFR677多型は、3つの可能な遺伝子型、すなわち野生型(WT)、ヘテロ接合体(FIE)、およびホモ接合(HM)を有する。これらの遺伝子型についてのアベレージ熱融解曲線は、実施例1で行ったのと同じ様式で生成した。WH、HE、およびHM遺伝子型についてのこれらのアベレージ熱融解曲線を、濃い、太い線として図22にプロットする。
特定の遺伝子型を含有する試料から生成した熱融解曲線のそれぞれを、実施例1と同じ様式で分析することによって、各熱融解曲線についての相関係数、すなわちrwt、rhe、およびrhmを生成した。各熱融解曲線は、これに関連する相関ベクトルrを有し、ここで相関ベクトルrは、
である。
図23は、WT、HE、およびHM遺伝子型についての熱融解曲線に関連する相関ベクトルのプロットを示す。このプロットから、相関ベクトルは、やはり正規分布していないことが分かる。図24は、図23と同じ点であるが、x+y+z=0の面に投影された点を示す。この2次元投影では、点は正規分布している。しかし、相関ベクトルは、3次元を有するが、2次元面に投影されたときのみ正規分布するので、この様式では一部の情報が失われる場合がある。したがって、相関ベクトルの正規分布を得るために、ワルファリンVKORC1の実施例で行ったのと同様に、熱融解曲線についての相関ベクトルのすべてを球座標に転換することによって、rwt、rsh、およびrhmの値の分布が正規分布であることを保証する。
図25で分かるように、相関ベクトルを球座標に変換することによって、相関ベクトルの正規分布が実現される。WT熱融解曲線に関連する変換型相関ベクトルvは、実施例1で行ったように、パラメータ行列Vwt中に一緒にグループ化される。やはり、Vwtの各列の平均値を計算することによって、平均ベクトルμwtを得る。Vwtの共分散行列Cwtを、実施例1に開示したように計算する。共分散行列Cwt、平均ベクトルμwt、およびWT遺伝子型についてのアベレージ熱融解曲線は、WT遺伝子型についてのトレーニングセットを構成する。同じステップによって、HEおよびHM遺伝子型について、同様のトレーニングセットを生成する。
プローブの融解(より低い温度で)および単位複製配列の融解(より高い温度で)の両方が、凝固因子MTHFR677多型についての熱融解曲線において観察され、これは、図20において各遺伝子型についての2つのピークの出現によって示されている。本方法は、遺伝子型を同定するために、任意の曲線への熱融解データのフィッティングに依拠せず、遺伝子型を同定するためにパターン整合および統計分析にもっぱら依拠する。したがって、本方法は、動的プロファイルから遺伝子型を同定するための先の方法より万能である。
本発明を記述する脈絡において(特に以下の特許請求の範囲の脈絡において)、用語「a」および「an」および「the」、ならびに同様の指示対象の使用は、本明細書で別段の指定のない限り、または脈絡によって明らかに矛盾しない限り、単数形および複数形の両方を網羅すると解釈されるべきである。用語「含む(comprising)」、「有する」、「含む(including)」、および「含む(containing)」は、別段の注釈のない限り、制限のない用語(すなわち「含むが、それだけに限らない」)を意味すると解釈されるべきである。本明細書での値の範囲の列挙は、本明細書で別段の指定のない限り、その範囲内に入る各別個の値を個々に参照する簡便な方法として機能を果たすことが単に意図されており、各別個の値は、これが本明細書に個々に列挙されているように、本明細書に組み込まれている。例えば、範囲10〜15が開示されている場合、11、12、13、および14も開示されている。本明細書に記載されるすべての方法は、本明細書で別段の指定のない限り、またはさもなければ、脈絡によって明らかな矛盾のない限り、任意の適当な順序で実施することができる。本明細書に提供される、任意およびすべての例、または例示的な言い回し(例えば、「など」)は、本発明をより良好にはっきりさせることが単に意図されており、別段の主張のない限り、本発明の範囲を限定しない。本明細書中のいかなる言い回しも、本発明を実践するのに本質的であるとして、任意の請求されていない要素を示すものとして解釈されるべきでない。
本発明の方法および組成物は、様々な実施形態の形態に組み込むことができ、そのほんのわずかが本明細書に開示されていると理解されるであろう。こうした実施形態の変形は、前述の説明を読むと当業者に明らかになり得る。本発明者らは、適切な場合、当業者がそのような変形を使用することを予期し、本発明者らは、本発明が、本明細書で具体的に記載した以外の方法で実践されることを意図する。したがって、本発明は、適用法によって認められているように、本明細書に添付した特許請求の範囲に列挙された対象事項のすべての改変および均等物を含む。さらに、そのすべての可能な変形における上述した要素の任意の組合せは、本明細書で別段の指定のない限り、またはさもなれば、脈絡によって明らかに矛盾しない限り、本発明によって包含される。

Claims (53)

  1. 生体試料中に存在する核酸の遺伝子型の同一性をコンピューターにより決定する方法であって、
    (a)生体試料中に含有される未知の遺伝子型の動的プロファイルを生成するステップであって、動的プロファイルは、独立変数に対して、未知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含むステップと、
    (b)未知の遺伝子型の動的プロファイルを、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルと相関させることによって、相関ベクトルを生成するステップであって、各既知の遺伝子型のアベレージ動的プロファイルは、独立変数に対して、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルのアベレージ測定値を含み、相関ベクトルは、未知の遺伝子型の動的プロファイルと、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルとの間の相関係数を含むステップと、
    (c)相関ベクトルまたはその変換が、許容できる範囲内に入るかどうかを判定することによって、未知の遺伝子型を、既知の遺伝子型のクラス内の既知の遺伝子型の1つとして分類し、それによって生体試料中の核酸の遺伝子型の同一性が決定されるステップと
    を含む方法。
  2. 既知の遺伝子型のアベレージ動的プロファイルが、トレーニングセットから得られる、請求項1に記載の方法。
  3. 独立変数が温度である、請求項1に記載の方法。
  4. 物理的変化が核酸の変性である、請求項1に記載の方法。
  5. 核酸の変性を表すシグナルが蛍光である、請求項4に記載の方法。
  6. 独立変数が電位である、請求項1に記載の方法。
  7. 物理的変化が、生体試料中の酸化還元活性分子の酸化である、請求項1に記載の方法。
  8. 酸化還元活性分子の酸化を表すシグナルが電流である、請求項7に記載の方法。
  9. 1つまたは複数のステップが、コンピューターを利用して実施される、請求項1に記載の方法。
  10. 自動化されている、請求項1に記載の方法。
  11. 未知の遺伝子型が既知の遺伝子型である事後確率が、相関係数から各既知の遺伝子型について計算される、請求項1に記載の方法。
  12. ステップ(c)が、最大事後確率、および対応する既知の遺伝子型のアベレージ動的プロファイルに対する相関係数が、許容できる既定の閾値内に入るかどうかを判定することによって、未知の遺伝子型を分類することを含む、請求項11に記載の方法。
  13. 前記相関させるステップ(b)が、
    (i)各既知の遺伝子型のクラス条件付き密度を使用して、既知の遺伝子型のクラス内の既知の遺伝子型のそれぞれについて、未知の遺伝子型が既知の遺伝子型である尤度を計算することと、
    (ii)計算された尤度から、生体試料が各既知の遺伝子型を含有する事後確率を計算することと
    をさらに含む、請求項11に記載の方法。
  14. 事後確率が、ベイズの定理を使用して計算される、請求項13に記載の方法。
  15. クラス条件付き密度が、各遺伝子型についての平均変換型ベクトルおよび共分散行列を使用して計算される、請求項13に記載の方法。
  16. 平均変換型ベクトルおよび共分散行列が、トレーニングセットから得られる各遺伝子型のグループ化された変換型ベクトルを含む行列から得られる、請求項15に記載の方法。
  17. 相関ベクトルがあるベクトルに変換され、変換型ベクトルの各要素が正規分布している、請求項13に記載の方法。
  18. 変換型ベクトルの要素が、球座標として表現される、請求項17に記載の方法。
  19. 動的プロファイルが、所定の平均値および標準偏差を有するように正規化される、請求項1に記載の方法。
  20. (d)対照遺伝子型の陽性対照動的プロファイルを生成するステップであって、陽性対照動的プロファイルは、未知の遺伝子型の動的プロファイルを構成する測定値と並行してとられた、独立変数に対する、対照遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含むステップと、
    (e)陽性対照動的プロファイルを、対照遺伝子型の標準陽性対照動的プロファイルと比較することによって、独立変数のシフト値を求めるステップと、
    (f)陽性対照動的プロファイルおよび未知の遺伝子型の動的プロファイルの独立変数をシフト値によってシフトするステップと
    をさらに含む、請求項1に記載の方法。
  21. 既知の遺伝子型のクラスから、ある既知の遺伝子型を装置に認識させるためのトレーニングセットをコンピューターにより生成する方法であって、
    (a)既知の遺伝子型のクラス内の各既知の遺伝子型について、同じ遺伝子型の複数の動的プロファイルをグループ化することであって、各動的プロファイルは、独立変数に対して、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含むことと、
    (b)動的プロファイルのそれぞれを正規化することと、
    (c)同じ遺伝子型の正規化動的プロファイルをアベレージすることによって、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ正規化動的プロファイルを得ることと、
    (d)各動的プロファイルを、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ正規化動的プロファイルと相関させることによって、各動的プロファイルについての相関ベクトルを生成することであって、各相関ベクトルは、既知の遺伝子型のクラス内の各既知の遺伝子型の各アベレージ正規化動的プロファイルに対する動的プロファイルについての相関係数を含むことと、
    (e)遺伝子型によって一緒にグループ化されたとき、変換型ベクトルの要素のそれぞれが正規分布しているように相関ベクトルを変換することと、
    (f)既知の遺伝子型のクラス内の各既知の遺伝子型について1つの行列が存在するように、各変換型ベクトルを変換型ベクトルの行列にコンパイルすることと、
    (g)要素が各既知の遺伝子型についてのアベレージ変換型ベクトルを含む、平均変換型ベクトルを生成することであって、変換型ベクトルは、各コンパイルされた行列のアベレージであることと、
    (h)コンパイルされた行列のそれぞれの共分散行列を計算することによって、既知の遺伝子型についての共分散行列を計算することと
    を含み、
    トレーニングセットは、各既知の遺伝子型についてのアベレージ正規化動的プロファイル、各既知の遺伝子型についての平均変換型ベクトル、および各既知の遺伝子型についての共分散行列を含む、方法。
  22. (i)対照遺伝子型の陽性対照動的プロファイルを生成するステップであって、陽性対照動的プロファイルが、未知の遺伝子型の動的プロファイルを構成する測定値と並行してとられた、独立変数に対する、対照遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含むステップと、
    (ii)陽性対照動的プロファイルを、対照遺伝子型の標準陽性対照動的プロファイルと比較することによって、独立変数のシフト値を求めるステップと、
    (iii)陽性対照動的プロファイルおよび既知の遺伝子型の動的プロファイルの独立変数を、シフト値によってシフトするステップと
    をさらに含む、請求項21に記載の方法。
  23. 陽性対照動的プロファイルおよび既知の遺伝子型の動的プロファイルの独立変数を、スケール値によってスケール変更するステップをさらに含む、請求項22に記載の方法。
  24. 各動的プロファイルが、所定の平均値および標準偏差を有するように正規化される、請求項21に記載の方法。
  25. 各相関ベクトルをn球座標に転換するステップをさらに含み、nは、既知の遺伝子型のクラス内の既知の遺伝子型の数以下である、請求項21に記載の方法。
  26. 各動的プロファイルが、同じ既知の遺伝子型の動的プロファイル同士間の分離を最小にしつつ、既知の遺伝子型のクラス内の異なる既知の遺伝子型の動的プロファイル同士間の分離を最大にするように選択された範囲にわたって測定された独立変数に対して、各既知の遺伝子型を含有する各核酸の物理的変化を表すシグナルの測定値を含む、請求項21に記載の方法。
  27. 生体試料中に存在する核酸の遺伝子型の同一性をコンピューターにより決定する方法であって、
    (a)生体試料中に含有される未知の遺伝子型の動的プロファイルを生成するステップであって、動的プロファイルは、独立変数に対して、未知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含むステップと、
    (b)未知の遺伝子型の動的プロファイルを、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルと相関させることによって、相関ベクトルを生成するステップであって、各既知の遺伝子型のアベレージ動的プロファイルは、トレーニングセット中に設けられ、独立変数に対して、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルのアベレージ測定値を含み、相関ベクトルは、未知の遺伝子型の動的プロファイルと、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルとの間の相関係数を含むステップと、
    (c)各既知の遺伝子型のクラス条件付き密度を使用して、既知の遺伝子型のクラス内の既知の遺伝子型のそれぞれについて、未知の遺伝子型が既知の遺伝子型である尤度を計算するステップであって、クラス条件付き密度は、各遺伝子型についての平均変換型ベクトルおよび共分散行列を使用して計算され、平均変換型ベクトルおよび共分散行列は、トレーニングセットから得られる各遺伝子型についてのグループ化された変換型ベクトルを含む行列から得られるステップと、
    (d)計算された尤度から、生体試料が各既知の遺伝子型を含有する事後確率を計算するステップと、
    (e)生体試料がある遺伝子型を含有する事後確率が、許容できる閾値内に入るかどうかを判定することによって、未知の遺伝子型が、既知の遺伝子型の1つとして分類されるかどうかを判定し、それによって生体試料中の核酸の遺伝子型の同一性が決定されるステップと
    を含む方法。
  28. 事後確率がベイズの定理を使用して計算される、請求項27に記載の方法。
  29. (f)対照遺伝子型の陽性対照動的プロファイルを生成するステップであって、陽性対照動的プロファイルが、未知の遺伝子型の動的プロファイルを構成する測定値と並行してとられた、独立変数に対する、対照遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含むステップと、
    (g)陽性対照動的プロファイルを、対照遺伝子型の標準陽性対照動的プロファイルと比較することによって、独立変数のシフト値を求めるステップと、
    (h)陽性対照動的プロファイルおよび未知の遺伝子型の動的プロファイルの独立変数を、シフト値によってシフトするステップと
    をさらに含む、請求項27に記載の方法。
  30. 各動的プロファイルが、所定の平均値および標準偏差を有するように正規化される、請求項27に記載の方法。
  31. トレーニングセットが、
    (a)既知の遺伝子型のクラス内の各既知の遺伝子型について、同じ遺伝子型の複数の動的プロファイルをグループ化することであって、各動的プロファイルは、独立変数に対して、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含むことと、
    (b)動的プロファイルのそれぞれを正規化することと、
    (c)同じ遺伝子型の正規化動的プロファイルをアベレージすることによって、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ正規化動的プロファイルを得ることと、
    (d)各動的プロファイルを、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ正規化動的プロファイルと相関させることによって、各動的プロファイルについての相関ベクトルを生成することであって、各相関ベクトルは、既知の遺伝子型のクラス内の各既知の遺伝子型の各アベレージ正規化動的プロファイルに対する動的プロファイルについての相関係数を含むことと、
    (e)遺伝子型によって一緒にグループ化されたとき、変換型ベクトルの要素のそれぞれが正規分布するように相関ベクトルを変換することと、
    (f)既知の遺伝子型のクラス内の各既知の遺伝子型について1つの行列が存在するように、各変換型ベクトルを変換型ベクトルの行列にコンパイルすることと、
    (g)要素が、各既知の遺伝子型についてのアベレージ変換型ベクトルを含む、平均変換型ベクトルを生成することであって、変換型ベクトルは、各コンパイルされた行列のアベレージであることと、
    (h)コンパイルされた行列のそれぞれの共分散行列を計算することによって、既知の遺伝子型についての共分散行列を計算することと
    を含む方法によって調製され、
    トレーニングセットは、各既知の遺伝子型についてのアベレージ正規化動的プロファイル、各既知の遺伝子型についての平均変換型ベクトル、および各既知の遺伝子型についての共分散行列を含む、請求項27に記載の方法。
  32. 各動的プロファイルが、所定の平均値および標準偏差を有するように正規化される、請求項31に記載の方法。
  33. トレーニングセットを調製する方法が、
    (i)対照遺伝子型の陽性対照動的プロファイルを生成するステップであって、陽性対照動的プロファイルが、未知の遺伝子型の動的プロファイルを構成する測定値と並行してとられた、独立変数に対する、対照遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含むステップと、
    (ii)陽性対照動的プロファイルを、対照遺伝子型の標準陽性対照動的プロファイルと比較することによって、独立変数のシフト値を求めるステップと、
    (iii)陽性対照動的プロファイルおよび未知の遺伝子型の動的プロファイルの独立変数を、シフト値によってシフトするステップと
    をさらに含む、請求項31に記載の方法。
  34. 陽性対照動的プロファイルおよび未知の遺伝子型の動的プロファイルの独立変数を、スケール値によってスケール変更するステップをさらに含む、請求項33に記載の方法。
  35. 許容できる閾値に入る事後確率が95%超である、請求項33に記載の方法。
  36. 相関ベクトルが、許容できる範囲内に入るかどうかを判定することによって、既知の遺伝子型の1つが、生体試料中に存在する未知の遺伝子型と同一であるかどうかを判定するステップをさらに含む、請求項33に記載の方法。
  37. 許容できる範囲が、動的プロファイル内の独立変数に対するシグナルの測定値の既定の閾値百分率を含むトレーニングセットの共分散行列の固有ベクトルによって画定される楕円体である、請求項36に記載の方法。
  38. 相関ベクトルの要素が、各要素が正規分布している、同じ数の要素を有するベクトルに変換される、請求項27に記載の方法。
  39. 各相関ベクトルをn球座標に転換するステップであって、nは、可能な突然変異のすべてを構成する遺伝子型の数より1小さいステップをさらに含む、請求項27に記載の方法。
  40. 各相関ベクトルを相関ベクトルと同じ数の要素を有する、球座標のベクトルに転換するステップをさらに含む、請求項27に記載の方法。
  41. (a)各遺伝子型についての平均変換型ベクトルおよびパラメータ行列を使用して、既知の遺伝子型のクラスについてのクラス内散乱行列を計算するステップと、
    (b)各遺伝子型についての平均変換型ベクトルおよびパラメータ行列を使用して、既知の遺伝子型のクラス内についてのクラス間散乱行列を計算するステップと、
    (c)クラス内散乱行列の行列式とクラス間散乱行列の行列式との比である分離比を求めるステップと、
    (d)独立変数についての分離最大化範囲を求めるステップであって、分離最大化範囲は、分離比を最大にするように選択されるステップと
    をさらに含み、
    各動的プロファイルは、分離最大化範囲にわたって測定される独立変数に対して、各既知の遺伝子型を含有する各核酸の物理的変化を表すシグナルの測定値を含む、請求項31に記載の方法。
  42. 生体試料中に存在する核酸の遺伝子型の同一性を決定するためのシステムであって、
    (a)生体試料中に含有される未知の遺伝子型の動的プロファイルを生成することができる生成モジュールであって、動的プロファイルは、独立変数に対して、未知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含む生成モジュールと、
    (b)未知の遺伝子型の動的プロファイルを、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルと相関させることによって、相関ベクトルを生成することができる相関モジュールであって、各既知の遺伝子型のアベレージ動的プロファイルは、トレーニングセット中に設けられ、独立変数に対して、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルのアベレージ測定値を含み、相関ベクトルは、未知の遺伝子型の動的プロファイルと、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルとの間の相関係数を含む相関モジュールと、
    (c)既知の遺伝子型のそれぞれのクラス条件付き密度を使用して、既知の遺伝子型のクラス内の既知の遺伝子型のそれぞれについて、未知の遺伝子型が既知の遺伝子型である尤度を計算することができるクラス条件付き密度モジュールであって、クラス条件付き密度は、各既知の遺伝子型についての平均変換型ベクトルおよび共分散行列を使用して計算され、平均変換型ベクトルおよび共分散行列は、トレーニングセットから得られる各遺伝子型についてのグループ化された変換型ベクトルを含む行列から得られるクラス条件付き密度モジュールと、
    (d)計算された尤度から、生体試料が各既知の遺伝子型を含有する事後確率を計算することができる事後確率モジュールと、
    (e)最大事後確率を有する既知の遺伝子型が、許容できる閾値内に入るかどうかを判定することによって、未知の遺伝子型が、最大事後確率を有する遺伝子型として分類されるかどうかを判定することができる判定モジュールであって、それによって生体試料中の核酸の遺伝子型の同一性が決定される判定モジュールと
    を備えるシステム。
  43. 事後確率モジュールが、ベイズの定理を使用して事後確率を計算する、請求項42に記載のシステム。
  44. 陽性対照動的プロファイルを、対照遺伝子型の既知の動的プロファイルと比較することによって、独立変数のシフト値を求め、未知の遺伝子型の動的プロファイルにおける独立変数を、シフト値によってシフトすることができるエラー補正モジュールをさらに備える、請求項42に記載のシステム。
  45. 既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイル、およびパラメータ行列を備えるトレーニングセットモジュールをさらに備え、パラメータ行列の要素は相関ベクトルであり、各相関ベクトルは、動的プロファイルと、既知の遺伝子型のクラス内の各既知の遺伝子型の各アベレージ動的プロファイルとの間の相関係数を含む、請求項42に記載のシステム。
  46. アベレージ動的プロファイルがアベレージ正規化動的プロファイルである、請求項45に記載のシステム。
  47. 平均変換型ベクトルおよび共分散行列をさらに備え、平均変換型ベクトルの要素は、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルに対する、各既知の遺伝子型の各動的プロファイルの相関係数のアベレージ値を含み、既知の遺伝子型についての共分散行列は、パラメータ行列の共分散行列を計算することによって得られる、請求項45に記載のシステム。
  48. アベレージ動的プロファイルがアベレージ正規化動的プロファイルである、請求項47に記載のシステム。
  49. 相関モジュールが、各相関ベクトルを変換型ベクトルに変換することがさらにでき、変換型ベクトルの各要素は正規分布している、請求項42に記載のシステム。
  50. 判定モジュールが、変換型ベクトルが、最大事後確率を有する遺伝子型についてのトレーニングセットから得られるもののうちで許容できる閾値内に入るかどうかを判定することがさらにできる、請求項49に記載のシステム。
  51. 許容できる範囲が、動的プロファイル内の独立変数に対するシグナルの測定値の既定の閾値百分率を含むトレーニングセットの共分散行列の固有ベクトルによって画定される楕円体である、請求項50に記載のシステム。
  52. 相関ベクトルをn球座標に転換することができる転換モジュールをさらに備え、nは、可能な突然変異のすべてを構成する遺伝子型の数より1小さい、請求項42に記載のシステム。
  53. (a)各遺伝子型についての平均変換型ベクトルおよびパラメータ行列を使用して、既知の遺伝子型のクラス内散乱行列を計算すること、
    (b)各遺伝子型についての平均変換型ベクトルおよびパラメータ行列を使用して、既知の遺伝子型のクラス間散乱行列を計算すること、
    (c)クラス内散乱行列の行列式と、クラス間散乱行列の行列式との比である分離比を求めること、
    (d)分離比を最大にするように選択される、独立変数についての分離最大化範囲を求めること
    が可能である分離最大化範囲選択モジュールをさらに備える、請求項47に記載のシステム。
JP2012506134A 2009-04-13 2010-04-13 動的シグナルの相関分析による、パターン認識、機械学習、および自動遺伝子型分類の迅速な方法 Expired - Fee Related JP5709840B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16864909P 2009-04-13 2009-04-13
US61/168,649 2009-04-13
PCT/US2010/030918 WO2010120800A1 (en) 2009-04-13 2010-04-13 A rapid method of pattern recognition, machine learning, and automated genotype classification through correlation analysis of dynamic signals

Publications (2)

Publication Number Publication Date
JP2012523645A JP2012523645A (ja) 2012-10-04
JP5709840B2 true JP5709840B2 (ja) 2015-04-30

Family

ID=42982818

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012506134A Expired - Fee Related JP5709840B2 (ja) 2009-04-13 2010-04-13 動的シグナルの相関分析による、パターン認識、機械学習、および自動遺伝子型分類の迅速な方法

Country Status (4)

Country Link
US (2) US8412466B2 (ja)
EP (1) EP2419729A4 (ja)
JP (1) JP5709840B2 (ja)
WO (1) WO2010120800A1 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8538733B2 (en) * 2008-01-25 2013-09-17 Life Technologies Corporation Methods for the analysis of dissociation melt curve data
EP2419729A4 (en) * 2009-04-13 2015-11-25 Canon Us Life Sciences Inc FAST PROCEDURE FOR PATTERN RECOGNITION, MACHINE TRAINING AND AUTOMATED GENOTYPIC CLASSIFICATION THROUGH CORRELATION ANALYSIS OF DYNAMIC SIGNALS
US8483972B2 (en) * 2009-04-13 2013-07-09 Canon U.S. Life Sciences, Inc. System and method for genotype analysis and enhanced monte carlo simulation method to estimate misclassification rate in automated genotyping
US9114399B2 (en) 2010-08-31 2015-08-25 Canon U.S. Life Sciences, Inc. System and method for serial processing of multiple nucleic acid assays
US20130338928A1 (en) * 2012-06-15 2013-12-19 Thermo Fisher Scientific Oy Methods and systems for high resolution melt analysis of a nucleic acid sequence
GB2506375B (en) * 2012-09-27 2017-10-18 Epistem Ltd Data processing and analysis systems
US20140273254A1 (en) * 2013-03-15 2014-09-18 Thermo Fisher Scientific Oy Method, product, and system for quantifying the methylation status of a nucleic acid in a sample
US11351545B2 (en) 2016-07-29 2022-06-07 Canon U.S.A., Inc. High speed nucleic acid melting analysis
GB201613318D0 (en) 2016-08-02 2016-09-14 Univ Oxford Innovation Ltd System monitor and method of system monitoring
US10405440B2 (en) 2017-04-10 2019-09-03 Romello Burdoucci System and method for interactive protection of a mobile electronic device
RU2768718C2 (ru) * 2016-09-22 2022-03-24 Иллумина, Инк. Обнаружение соматического варьирования числа копий
CN108241792B (zh) * 2016-12-23 2021-03-23 深圳华大基因科技服务有限公司 一种整合多平台基因分型结果的方法和装置
WO2018119443A1 (en) * 2016-12-23 2018-06-28 The Regents Of The University Of California Method and device for digital high resolution melt
US10551366B2 (en) * 2017-05-12 2020-02-04 Becton, Dickinson And Company System and method for drug classification using multiple physical parameters
SG11202101782YA (en) * 2018-08-30 2021-03-30 Life Technologies Corp Machine learning system for genotyping pcr assays
US10804736B2 (en) 2018-11-13 2020-10-13 Mitsubishi Electric Research Laboratories, Inc. Methods and systems for post-disaster resilient restoration of power distribution system
CN109785899B (zh) * 2019-02-18 2020-01-07 东莞博奥木华基因科技有限公司 一种基因型校正的装置和方法
CN112413832B (zh) * 2019-08-23 2021-11-30 珠海格力电器股份有限公司 一种基于用户行为的用户身份识别方法及其电器设备
CN113609746B (zh) * 2021-05-11 2023-04-28 四川大学 基于蒙特卡洛树搜索及强化学习算法的配电网规划方法

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPO882497A0 (en) * 1997-08-29 1997-09-18 Grains Research & Development Corporation A method of genotyping
EP1053348B1 (en) * 1998-02-04 2010-06-02 Life Technologies Corporation Determination of a genotype of an amplification product at multiple allelic sites
US6379889B1 (en) * 1999-11-04 2002-04-30 Agilent Technologies, Inc. Multiplexing methods for identifying nucleic acids using denaturing liquid chromatography
US8900811B2 (en) * 2000-11-16 2014-12-02 Caliper Life Sciences, Inc. Method and apparatus for generating thermal melting curves in a microfluidic device
AU2002221104A1 (en) * 2000-12-11 2002-06-24 Chugai Seiyaku Kabushiki Kaisha Method of detecting relation between genes
US6960437B2 (en) * 2001-04-06 2005-11-01 California Institute Of Technology Nucleic acid amplification utilizing microfluidic devices
WO2002083952A1 (en) 2001-04-12 2002-10-24 Caliper Technologies Corp. Systems and methods for high throughput genetic analysis
US6897138B2 (en) * 2001-06-25 2005-05-24 Toyoda Gosei Co., Ltd. Method and apparatus for producing group III nitride compound semiconductor
US7272506B2 (en) * 2002-03-01 2007-09-18 Applera Corporation Computer algorithm for automatic allele determination from fluorometer genotyping device
AU2003272816A1 (en) * 2002-09-30 2004-04-19 Basic Resources, Inc. Outage notification device and method
AU2003286573B2 (en) * 2002-10-23 2009-09-10 Idaho Technology, Inc. Amplicon melting analysis with saturation dyes
US20050042639A1 (en) * 2002-12-20 2005-02-24 Caliper Life Sciences, Inc. Single molecule amplification and detection of DNA length
WO2004061616A2 (en) * 2002-12-27 2004-07-22 Rosetta Inpharmatics Llc Computer systems and methods for associating genes with traits using cross species data
WO2004097577A2 (en) * 2003-04-24 2004-11-11 New York University Methods, software arrangements, storage media, and systems for providing a shrinkage-based similarity metric
GB0401304D0 (en) * 2004-01-21 2004-02-25 Dynametrix Ltd Genotyping method
WO2005075683A1 (en) 2004-02-03 2005-08-18 Postech Foundation High throughput device for performing continuous-flow reactions
US7387887B2 (en) * 2004-04-20 2008-06-17 University Of Utah Research Foundation Nucleic acid melting analysis with saturation dyes
US7456281B2 (en) * 2005-04-20 2008-11-25 Idaho Technology, Inc. Nucleic acid melting analysis with saturation dyes
US7919242B2 (en) * 2005-06-30 2011-04-05 Roche Molecular Systems, Inc. Light emission modifiers and their uses in nucleic acid detection, amplification and analysis
US20070003939A1 (en) * 2005-07-01 2007-01-04 Hui Wang Melting temperature matching
JP4922646B2 (ja) * 2005-12-14 2012-04-25 株式会社日立ソリューションズ 遺伝子情報の表示方法及び表示装置
IL181030A (en) * 2006-01-29 2012-04-30 Rafael Advanced Defense Sys Multiple Optical Radar Space Time
US8778637B2 (en) * 2006-03-28 2014-07-15 Canon U.S. Life Sciences, Inc. Method and apparatus for applying continuous flow and uniform temperature to generate thermal melting curves in a microfluidic device
US7629124B2 (en) * 2006-06-30 2009-12-08 Canon U.S. Life Sciences, Inc. Real-time PCR in micro-channels
WO2008025093A1 (en) 2006-09-01 2008-03-06 Innovative Dairy Products Pty Ltd Whole genome based genetic evaluation and selection process
JP2008250971A (ja) * 2007-03-02 2008-10-16 Toray Ind Inc マイクロrna標的遺伝子予測装置、マイクロrna標的遺伝子予測方法、および、プログラム
US8538733B2 (en) * 2008-01-25 2013-09-17 Life Technologies Corporation Methods for the analysis of dissociation melt curve data
EP2419729A4 (en) * 2009-04-13 2015-11-25 Canon Us Life Sciences Inc FAST PROCEDURE FOR PATTERN RECOGNITION, MACHINE TRAINING AND AUTOMATED GENOTYPIC CLASSIFICATION THROUGH CORRELATION ANALYSIS OF DYNAMIC SIGNALS

Also Published As

Publication number Publication date
US20110010103A1 (en) 2011-01-13
EP2419729A4 (en) 2015-11-25
WO2010120800A1 (en) 2010-10-21
US20140039802A1 (en) 2014-02-06
EP2419729A1 (en) 2012-02-22
JP2012523645A (ja) 2012-10-04
US8412466B2 (en) 2013-04-02

Similar Documents

Publication Publication Date Title
JP5709840B2 (ja) 動的シグナルの相関分析による、パターン認識、機械学習、および自動遺伝子型分類の迅速な方法
US8483972B2 (en) System and method for genotype analysis and enhanced monte carlo simulation method to estimate misclassification rate in automated genotyping
US9292653B2 (en) High-resolution melting analysis
JP5805535B2 (ja) 融解曲線、特にdsDNA及びタンパク質の融解曲線の解析
US6730501B2 (en) Multi-test analysis of real-time nucleic acid amplification
JP6280124B2 (ja) リアルタイムpcrサイクル閾値を判定するための汎用的な方法
CA3021676C (en) Fractional abundance of polynucleotide sequences in a sample
JP2018512847A (ja) 集積型アレイを使用する核酸ハイブリダイゼーション熱力学の多重分析
US20230347353A1 (en) Systems and methods for analyzing a biological sample
US20170372002A1 (en) System and method for melting curve normalization
US9542526B2 (en) Method and system for temperature correction in thermal melt analysis
US8990059B2 (en) Analyzing tool for amplification reactions
US20210005286A1 (en) Methods for the analysis of dissociation melt curve data
EP4421814A1 (en) Device and method for reading positive/negative with respect to target assay substance in sample
US11056214B2 (en) Dual sample melting curve cluster and cost analysis

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120713

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140603

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140903

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140910

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141030

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150303

R150 Certificate of patent or registration of utility model

Ref document number: 5709840

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees