JP5709840B2

JP5709840B2 - 動的シグナルの相関分析による、パターン認識、機械学習、および自動遺伝子型分類の迅速な方法

Info

Publication number: JP5709840B2
Application number: JP2012506134A
Authority: JP
Inventors: カンデリアン，サミ
Original assignee: Canon US Life Sciences Inc
Current assignee: Canon USA Inc
Priority date: 2009-04-13
Filing date: 2010-04-13
Publication date: 2015-04-30
Anticipated expiration: 2030-04-13
Also published as: US20110010103A1; EP2419729A4; WO2010120800A1; US20140039802A1; EP2419729A1; JP2012523645A; US8412466B2

Description

関連出願の相互参照
本願は、その全体が参照により本明細書に組み込まれている、２００９年４月１３日に出願された米国特許出願第６１／１６８，６４９号の利益を主張する。

本発明は、核酸の分析、および生体試料中に存在する遺伝子型の同定のための方法に関する。より具体的には、本発明の実施形態は、核酸の遺伝子型を同定し、核酸の配列を分析するための自動化方法に関する。

核酸の検出は、医薬、法医学的科学、工業的処理、作物および動物の育種、ならびに多くの他の分野にとって重要である。病状（例えば、癌）、感染性の生物（例えば、ＨＩＶ）、遺伝系統、遺伝子マーカーなどを検出する能力は、疾患診断および予後、マーカーに補助された選択、犯罪現場の特徴の正確な識別、工業用生物を増殖させる能力、ならびに多くの他の技法にとって遍在する技術である。対象とする核酸の完全性の判定は、感染症または癌の病理に関連する場合がある。少量の核酸を検出するための最も強力で基本的な技術の１つは、核酸配列の一部またはすべてを多数回複製し、次いで増幅産物を分析することである。ＰＣＲは、いくつかの異なる増幅技法のうちでおそらく最も周知である。

ＰＣＲは、ＤＮＡの短い切片を増幅するための強力な技法である。ＰＣＲを用いると、１つの鋳型ＤＮＡ分子から出発して、数百万のＤＮＡのコピーを急速に作製することができる。ＰＣＲは、１本鎖へのＤＮＡの変性、変性鎖に対するプライマーのアニーリング、および熱安定性ＤＮＡポリメラーゼ酵素によるプライマーの伸長という３段階の温度サイクルを含む。このサイクルは、検出および分析されるのに十分なコピーが存在するように繰り返される。原理上は、ＰＣＲの各サイクルは、コピー数を２倍にすることができるであろう。実際には、各サイクル後に実現される増倍は、常に２未満である。さらに、ＰＣＲサイクリングが続く場合、増幅されたＤＮＡ産物の蓄積は、必要とされる反応物の濃度が減少するにつれて最終的に止まる。ＰＣＲに関する一般的な詳細については、ＳａｍｂｒｏｏｋａｎｄＲｕｓｓｅｌｌ、ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ−ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ（３版）、１〜３巻、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙ、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒ、Ｎ．Ｙ．（２０００）、ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ、Ｆ．Ｍ．Ａｕｓｕｂｅｌら編、ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓ、ＧｒｅｅｎｅＰｕｂｌｉｓｈｉｎｇＡｓｓｏｃｉａｔｅｓ，Ｉｎｃ．とＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ，Ｉｎｃ．のジョイントベンチャー（２００５年にかけて補足された）、およびＰＣＲＰｒｏｔｏｃｏｌｓＡＧｕｉｄｅｔｏＭｅｔｈｏｄｓａｎｄＡｐｐｌｉｃａｔｉｏｎｓ、Ｍ．Ａ．Ｉｎｎｉｓら編、ＡｃａｄｅｍｉｃＰｒｅｓｓＩｎｃ．ＳａｎＤｉｅｇｏ、Ｃａｌｉｆ．（１９９０）を参照。

リアルタイムＰＣＲは、１回のＰＣＲサイクル当たり一般に１回、反応が進行する際に、増幅されるＤＮＡ産物の蓄積を測定する技法の発展しつつあるセットを指す。経時的に産物の蓄積をモニターすることにより、反応の効率の判定、ならびにＤＮＡ鋳型分子の初期濃度の推定が可能になる。リアルタイムＰＣＲに関する一般的な詳細については、Ｒｅａｌ−ＴｉｍｅＰＣＲ：ＡｎＥｓｓｅｎｔｉａｌＧｕｉｄｅ、Ｋ．Ｅｄｗａｒｄｓら編、ＨｏｒｉｚｏｎＢｉｏｓｃｉｅｎｃｅ、Ｎｏｒｗｉｃｈ、Ｕ．Ｋ．（２００４）を参照。

つい最近では、例えば、マイクロ流体デバイス内での増幅反応を伴う、ＰＣＲおよび他の増幅反応を実施するためのいくつかのハイスループット手法、ならびにデバイス内またはデバイス上で増幅核酸を検出および分析するための方法が開発された。マイクロ流体デバイス内での増幅のための試料の熱サイクリングは、２つの方法のうちの１つにおいて通常実現される。第１の方法では、試料溶液がデバイス内に装填され、温度が正しいテンポでサイクルにかけられ、従来のＰＣＲ機器と非常に類似している。第２の方法では、試料溶液は、空間的に変化する温度ゾーンを通して、持続的にポンプで送られる。例えば、Ｌａｇａｌｌｙら（ＡｎａｌｙｔｉｃａｌＣｈｅｍｉｓｔｒｙ７３：５６５〜５７０頁（２００１））、Ｋｏｐｐら（Ｓｃｉｅｎｃｅ２８０：１０４６〜１０４８頁（１９９８））、Ｐａｒｋら（ＡｎａｌｙｔｉｃａｌＣｈｅｍｉｓｔｒｙ７５：６０２９〜６０３３頁（２００３））、Ｈａｈｎら（ＷＯ２００５／０７５６８３）、Ｅｎｚｅｌｂｅｒｇｅｒら（米国特許第６，９６０，４３７号）、およびＫｎａｐｐら（米国特許出願公開第２００５／００４２６３９号）を参照。

十分な数の元のＤＮＡ分子のコピーが存在するようになると、ＤＮＡを特徴づけることができる。ＤＮＡを特徴づける１つの方法は、ＤＮＡが二本鎖ＤＮＡ（ｄｓＤＮＡ）から一本鎖ＤＮＡ（ｓｓＤＮＡ）に移行する際のＤＮＡの解離挙動を調査することである。温度を上昇させてＤＮＡをｄｓＤＮＡからｓｓＤＮＡに移行させる方法は、「高解像度温度（熱）融解（ＨＲＴｍ）」法、または単に「高解像度融解」法と時折呼ばれる。あるいは、ｓｓＤＮＡからｄｓＤＮＡへの移行は、様々な電気化学的方法によって観察することができ、これは、システムにわたる電位が変化する際に動的電流を生成する。

融解プロファイル分析は、核酸を分析するのに重要な技法である。いくつかの方法では、二本鎖核酸は、２本の鎖が結合しているかどうかを示す色素の存在下で変性される。そのようなインジケータ色素の例には、ＳＹＢＲ（登録商標）ＧｒｅｅｎＩなどの非特異的結合色素が含まれ、その蛍光効率は、この色素が二本鎖ＤＮＡに結合しているかどうかに強く依拠する。混合物の温度が上げられるにつれて、色素からの蛍光が低減することにより、核酸分子が、部分的または完全に融解した、すなわち、解けたことが示される。したがって、温度の関数として色素の蛍光を測定することによって、二本鎖の長さ、ＧＣ含量、またはさらには正確な配列に関する情報が得られる。例えば、Ｒｉｒｉｅら（ＡｎａｌＢｉｏｃｈｅｍ２４５：１５４〜１６０頁、１９９７）、Ｗｉｔｔｗｅｒら（ＣｌｉｎＣｈｅｍ４９：８５３〜８６０頁、２００３）、Ｌｉｅｗら（ＣｌｉｎＣｈｅｍ５０：１１５６〜１１６４頁（２００４）、Ｈｅｒｒｍａｎｎら（ＣｌｉｎＣｈｅｍ５２：４９４〜５０３頁、２００６）、Ｋｎａｐｐら（米国特許出願公開第２００２／０１９７６３０号）、Ｗｉｔｔｗｅｒら（米国特許出願公開第２００５／０２３３３３５号）、Ｗｉｔｔｗｅｒら（米国特許出願公開第２００６／００１９２５３号）、Ｓｕｎｄｂｅｒｇら（米国特許出願公開第２００７／００２６４２１号）、およびＫｎｉｇｈｔら（米国特許出願公開第２００７／０２３１７９９号）を参照。

核酸を分析するための代替の方法では、核酸ハイブリダイゼーションを検出するための電気化学的バイオセンサーを検出するのにボルタンメトリーが使用される。電気化学的技術は、反応条件を制御しながら、小型化可能であり、正確であり、感度が良い。核酸ハイブリダイゼーションを検出するのに、無標識手法および標識手法の両方が存在する。無標識手法は一般に、核酸に結合されるときの界面の電気的特性の変化、剛性のｄｓＤＮＡとより柔軟性のｓｓＤＮＡとの間の柔軟性の変化、またはグアニン塩基の電気化学的酸化に依拠する。例えば、Ｇｏｏｄｉｎｇ（Ｅｌｅｃｔｒｏａｎａｌｙｓｉｓ１４：１１４９〜１１５６頁、２００２）、Ｇｏｏｄｉｎｇら（Ｃｈｅｍ．Ｃｏｍｍｕｎ．２００３：１９３８〜１９３９頁、２００３）、Ｍｅａｒｎｓら（Ｅｌｅｃｔｒｏａｎａｌｙｓｉｓ１８：１９７１〜１９８１頁、２００６）、Ｐａｌｅｃｋ（Ｅｌｅｃｔｒｏａｎａｌｙｓｉｓ８：７〜１４頁、１９９６）を参照。核酸ハイブリダイゼーションを検出するための標識手法は、無標識手法より一般的であり、周知である。これらの手法は一般に、酸化還元活性分子を伴い、これは、核酸のワトソン−クリック塩基対同士の間、または核酸二次構造の副溝もしくは主溝中に介在し、したがって、一本鎖核酸と相互作用しない。そのような酸化還元活性分子の例には、Ｃｏ（Ｐｈｅｎ）_３ ^３＋、Ｃｏ（ｂｐｙ）_３ ^３＋、およびメチレンブルーが含まれる。例えば、Ｍｉｋｋｅｌｓｅｎ（Ｅｌｅｃｔｒｏａｎａｌｙｓｉｓ８：１５〜１９頁、１９９６）、Ｅｒｄｅｍら（Ａｎａｌ．Ｃｈｉｍ．Ａｃｔａ４２２：１３９〜１４９頁、２０００）を参照。いくつかの場合では、酸化還元活性分子は、ｄｓＤＮＡまたはｓｓＤＮＡに優先的に結合する。別の代替方法は、電極表面上に固定化された核酸プローブの末端に、フェロセン基などの標識基を結合させることを含む。例えば、Ｍｅａｒｎｓら（Ｅｌｅｃｔｒｏｃｈｅｍｉｓｔｒｙ１８：１９７１〜１９８１頁、２００６）、Ａｎｎｅら（Ｊ．Ａｍ．Ｃｈｅｍ．Ｓｏｃ．１２８：５４２〜５４７頁、２００６）、Ｌａｉら（Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．Ｕ．Ｓ．Ａ．１０３：４０１７〜４０２１頁、２００６）、Ｆａｎら（Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．Ｕ．Ｓ．Ａ．１００：９１３４〜９１４７頁、２００３）、Ｘｉａｏら（Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．Ｕ．Ｓ．Ａ．１０３：１６６７７〜１６６８０頁、２００６）を参照。一本鎖プローブ分子は、十分に柔軟であり、フェロセン基は、電極表面に十分近接することによって、酸化または還元され得る。しかし、ハイブリダイズすると、剛性の二本鎖核酸分子は、電極表面に垂直に立ち、フェロセン基は、電極から十分に遠く、これは、酸化または還元されない。

これらのシステムはすべて、サイクリックボルタンメトリーによって調べることができる。システムにわたって経時的に増減する電位を印加することによって、多様な電流が標識として生成され、またはＤＮＡ分子が酸化もしくは還元される。標的分子のプローブ分子への完全なハイブリダイゼーションは、印加された電圧に対して生成される電流の特徴的な動的プロファイル（ｄｙｎａｍｉｃｐｒｏｆｉｌｅ）を生じさせる。標的分子が、突然変異遺伝子型を含んでいた場合に起こる不完全なハイブリダイゼーションは、印加された電圧に対して生成される電流の異なる動的プロファイルをもたらす。したがって、異なる核酸配列は、そのそれぞれのボルタモグラムを調査することによって互いに区別することができる。

いくつかの核酸アッセイは、既知の遺伝子型のクラス内の可能な遺伝子型同士間の区別を必要とする。一般に、熱融解（ｔｈｅｒｍａｌｍｅｌｔ）分析について、研究者らは、熱融解プロファイルを視覚的に検査することによって、試料中の核酸の融解温度を求める。しかし、いくつかの核酸アッセイは、１つのヌクレオチドの変化を同定する必要があり、この場合、野生型核酸と突然変異体核酸の間の融解温度（Ｔ_ｍ）の差異はかなり小さい（例えば、０．２５℃未満）。このレベルの温度解像度を、視覚的な検査で実現するのは困難である。さらに、融解温度を求める熱融解プロファイルの視覚的検査では、プロファイルに含まれる重要な追加の情報、例えば、プロファイルの全体的な形状および分布などが無視される。

ＷＯ２００５／０７５６８３米国特許第６，９６０，４３７号米国特許出願公開第２００５／００４２６３９号米国特許出願公開第２００２／０１９７６３０号米国特許出願公開第２００５／０２３３３３５号米国特許出願公開第２００６／００１９２５３号米国特許出願公開第２００７／００２６４２１号米国特許出願公開第２００７／０２３１７９９号米国特許出願公開第２００９／０１１２４８４号米国特許出願公開第２００７／０２３１７９９号米国特許出願公開第２００８／０１７６２３０号

ＳａｍｂｒｏｏｋａｎｄＲｕｓｓｅｌｌ、ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ−ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ（３版）、１〜３巻、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙ、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒ、Ｎ．Ｙ．（２０００）ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ、Ｆ．Ｍ．Ａｕｓｕｂｅｌら編、ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓ、ＧｒｅｅｎｅＰｕｂｌｉｓｈｉｎｇＡｓｓｏｃｉａｔｅｓ，Ｉｎｃ．とＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ，Ｉｎｃ．のジョイントベンチャー（２００５年にかけて補足された）ＰＣＲＰｒｏｔｏｃｏｌｓＡＧｕｉｄｅｔｏＭｅｔｈｏｄｓａｎｄＡｐｐｌｉｃａｔｉｏｎｓ、Ｍ．Ａ．Ｉｎｎｉｓら編、ＡｃａｄｅｍｉｃＰｒｅｓｓＩｎｃ．ＳａｎＤｉｅｇｏ、Ｃａｌｉｆ．（１９９０）Ｒｅａｌ−ＴｉｍｅＰＣＲ：ＡｎＥｓｓｅｎｔｉａｌＧｕｉｄｅ、Ｋ．Ｅｄｗａｒｄｓら編、ＨｏｒｉｚｏｎＢｉｏｓｃｉｅｎｃｅ、Ｎｏｒｗｉｃｈ、Ｕ．Ｋ．（２００４）、Ｌａｇａｌｌｙら（ＡｎａｌｙｔｉｃａｌＣｈｅｍｉｓｔｒｙ７３：５６５〜５７０頁（２００１））Ｋｏｐｐら（Ｓｃｉｅｎｃｅ２８０：１０４６〜１０４８頁（１９９８））Ｐａｒｋら（ＡｎａｌｙｔｉｃａｌＣｈｅｍｉｓｔｒｙ７５：６０２９〜６０３３頁（２００３））Ｒｉｒｉｅら（ＡｎａｌＢｉｏｃｈｅｍ２４５：１５４〜１６０頁、１９９７）Ｗｉｔｔｗｅｒら（ＣｌｉｎＣｈｅｍ４９：８５３〜８６０頁、２００３）Ｌｉｅｗら（ＣｌｉｎＣｈｅｍ５０：１１５６〜１１６４頁（２００４）Ｈｅｒｒｍａｎｎら（ＣｌｉｎＣｈｅｍ５２：４９４〜５０３頁、２００６）Ｇｏｏｄｉｎｇ（Ｅｌｅｃｔｒｏａｎａｌｙｓｉｓ１４：１１４９〜１１５６頁、２００２）Ｇｏｏｄｉｎｇら（Ｃｈｅｍ．Ｃｏｍｍｕｎ．２００３：１９３８〜１９３９頁、２００３）Ｍｅａｒｎｓら（Ｅｌｅｃｔｒｏａｎａｌｙｓｉｓ１８：１９７１〜１９８１頁、２００６）Ｐａｌｅｃｋ（Ｅｌｅｃｔｒｏａｎａｌｙｓｉｓ８：７〜１４頁、１９９６）Ｍｉｋｋｅｌｓｅｎ（Ｅｌｅｃｔｒｏａｎａｌｙｓｉｓ８：１５〜１９頁、１９９６）Ｅｒｄｅｍら（Ａｎａｌ．Ｃｈｉｍ．Ａｃｔａ４２２：１３９〜１４９頁、２０００）Ｍｅａｒｎｓら（Ｅｌｅｃｔｒｏｃｈｅｍｉｓｔｒｙ１８：１９７１〜１９８１頁、２００６）Ａｎｎｅら（Ｊ．Ａｍ．Ｃｈｅｍ．Ｓｏｃ．１２８：５４２〜５４７頁、２００６）Ｌａｉら（Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．Ｕ．Ｓ．Ａ．１０３：４０１７〜４０２１頁、２００６）Ｆａｎら（Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．Ｕ．Ｓ．Ａ．１００：９１３４〜９１４７頁、２００３）Ｘｉａｏら（Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．Ｕ．Ｓ．Ａ．１０３：１６６７７〜１６６８０頁、２００６）ＧｅｎｏｍｅＡｎａｌｙｓｉｓ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌＳｅｒｉｅｓ（Ｉ〜ＩＶ巻）、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓＵｓｉｎｇＡｎｔｉｂｏｄｉｅｓ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓＣｅｌｌｓ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓＰＣＲＰｒｉｍｅｒ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓＳｔｒｙｅｒ，Ｌ．（１９９５）Ｂｉｏｃｈｅｍｉｓｔｒｙ（４版）Ｆｒｅｅｍａｎ、Ｎ．Ｙ．Ｇａｉｔ、ＯｌｉｇｏｎｕｃｌｅｏｔｉｄｅＳｙｎｔｈｅｓｉｓ：ＡＰｒａｃｔｉｃａｌＡｐｐｒｏａｃｈ、１９８４、ＩＲＬＰｒｅｓｓ、ＬｏｎｄｏｎＮｅｌｓｏｎａｎｄＣｏｘ（２０００）、Ｌｅｈｎｉｎｇｅｒ、ＰｒｉｎｃｉｐｌｅｓｏｆＢｉｏｃｈｅｍｉｓｔｒｙ３版、Ｗ．Ｈ．ＦｒｅｅｍａｎＰｕｂ．、ＮｅｗＹｏｒｋ、Ｎ．Ｙ．Ｂｅｒｇら（２００２）Ｂｉｏｃｈｅｍｉｓｔｒｙ、５版、Ｗ．Ｈ．ＦｒｅｅｍａｎＰｕｂ．、ＮｅｗＹｏｒｋ、Ｎ．Ｙ．Ｌｅｅ，Ｍら（ＪＭｅｄＣｈｅｍ３６（７）：８６３〜８７０頁（１９９３））Ｈａｕｇｌａｎｄ（ＨａｎｄｂｏｏｋｏｆＦｌｕｏｒｅｓｃｅｎｔＰｒｏｂｅｓａｎｄＲｅｓｅａｒｃｈＣｈｅｍｉｃａｌｓ、ＭｏｌｅｃｕｌａｒＰｒｏｂｅｓ，Ｉｎｃ．、Ｅｕｇｅｎｅ、ＯＲ（１９９６））

したがって、特に、熱融解曲線が狭い温度範囲によって区別される場合に、これらの熱融解曲線をより正確に区別し、これらの融解曲線からＤＮＡ配列情報を得ることができる、高解像度融解分析のための方法およびシステムが望まれる。１つまたは複数のピークまたは突然変異を含むＤＮＡについての配列情報の検出を促進する熱融解曲線をより正確に識別する、高解像度融解分析についての方法およびシステムも望まれる。プロファイルならびに全体的な形状の特徴の両方を考慮に入れつつ、核酸配列をより正確に同定し、類似配列同士間を区別することができる方法およびシステムも望まれる。ユーザーからの介入および意思決定を最小にして、遺伝子型を迅速に同定することができる方法も望まれる。

本発明は、核酸の分析、および生体試料中に存在する遺伝子型の同定のための方法およびシステムに関する。より具体的には、本発明の実施形態は、生体試料中に存在する核酸の遺伝子型の同一性を決定するのに有用である、核酸の配列を分析し、核酸の遺伝子型を分類するための自動化された方法およびシステムに関する。

したがって一態様では、本発明は、生体試料中に存在する核酸の遺伝子型の同一性を決定するための方法を提供する。この態様によれば、本方法は、生体試料中に含有される未知の遺伝子型の動的プロファイルを生成するステップを含む。動的プロファイルは、独立変数に対して、未知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含む。本方法は、未知の遺伝子型の動的プロファイルを、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ（ａｖｅｒａｇｅ）動的プロファイルと相関させることによって、相関ベクトルを生成することも含む。各既知の遺伝子型のアベレージ動的プロファイルは、独立変数に対して、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルのアベレージ測定値を含む。相関ベクトルは、未知の遺伝子型の動的プロファイルと、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルとの間の相関係数を含む。本方法は、相関ベクトルまたはその変換が、許容できる範囲内に入るかどうかを判定することによって、未知の遺伝子型を既知の遺伝子型の１つとして分類し、それによって生体試料中の遺伝子型の同一性が決定されることをさらに含む。

一実施形態では、既知の遺伝子型のアベレージプロファイルは、トレーニングセットから得られ、これは、本明細書に記載されるように調製することができる。別の実施形態では、独立変数は、温度とすることができる。さらなる実施形態では、物理的変化は、核酸の変性とすることができる。別の実施形態では、核酸の変性を表すシグナルは、蛍光である。さらなる実施形態では、独立変数は、電位である。別の実施形態では、物理的変化は、生体試料中の酸化還元活性分子の酸化である。さらなる実施形態では、酸化還元活性分子の酸化を表すシグナルは、電流である。別の実施形態では、未知の遺伝子型が既知の遺伝子型である事後確率が、相関係数から各既知の遺伝子型について計算される。別の実施形態では、本方法は自動化されている。さらなる実施形態では、本方法は、コンピューターを使用する。

さらなる実施形態では、判定ステップは、最大事後確率、および対応する遺伝子型のアベレージ動的プロファイルに対する相関係数が、許容できる既定の閾値内に入るかどうかを判定することによって、未知の遺伝子型を分類し、それによってこの遺伝子型を同定することを含む。別の実施形態では、相関ステップは、各既知の遺伝子型のクラス条件付き密度を使用して、既知の遺伝子型のクラス内の既知の遺伝子型のそれぞれについて、未知の遺伝子型が既知の遺伝子型である尤度を計算することを含む。相関ステップは、計算された尤度から、生体試料が各既知の遺伝子型を含有する事後確率を計算することも含む。一実施形態では、事後確率は、ベイズの定理を使用して計算される。別の実施形態では、クラス条件付き密度は、各遺伝子型についての平均（ｍｅａｎ）変換型ベクトル（ｔｒａｎｓｆｏｒｍｅｄｖｅｃｔｏｒ）（本明細書で平均ベクトルとも呼ばれる）および共分散行列を使用して計算される。一実施形態では、平均変換型ベクトルおよび共分散行列は、トレーニングセットから得られる各遺伝子型のグループ化された変換型ベクトルを含む行列から得られる。別の実施形態では、相関ベクトルはあるベクトルに変換され、変換型ベクトルの各要素は正規分布している。さらなる実施形態では、変換型ベクトルの要素は、球座標として表現される。別の実施形態では、動的プロファイルは、所定の平均値および標準偏差を有するように正規化される。

別の実施形態では、生体試料中に存在する核酸の遺伝子型の同一性を決定する方法は、陽性対照動的プロファイルを使用して、独立変数のシフトおよびスケール変化を補正するステップをさらに含む。したがって、この第１の態様の方法は、（１）対照遺伝子型の陽性対照動的プロファイルを生成するステップであって、陽性対照動的プロファイルは、独立変数に対して、対照遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含むステップと、（２）陽性対照動的プロファイルを、対照遺伝子型の標準参照対照（ｓｔａｎｄａｒｄｒｅｆｅｒｅｎｃｅｃｏｎｔｒｏｌ）動的プロファイルと比較することによって、独立変数のシフト値を求めるステップと、（３）陽性対照動的プロファイルおよび未知の遺伝子型の動的プロファイルの独立変数をシフト値によってシフトするステップとをさらに含む。

第２の態様では、本発明は、既知の遺伝子型のクラス内から、ある既知の遺伝子型を装置に認識させるためのトレーニングセットを生成する方法を提供する。このトレーニングセットは、本明細書に記載される生体試料中に存在する核酸の遺伝子型の同一性を決定する方法において特に有用である。トレーニングセットは、後に未知の遺伝子型を分類することができるように、既知の遺伝子型のクラス内から、ある既知の遺伝子型を装置、例えばコンピューターに認識させる。本発明のこの第２の態様によれば、本方法は、既知の遺伝子型のクラス内の各既知の遺伝子型について、同じ遺伝子型の複数の動的プロファイルをグループ化することを含む。各動的プロファイルは、独立変数に対して、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含む。本方法は、動的プロファイルのそれぞれを正規化することと、同じ遺伝子型の正規化動的プロファイルをアベレージすることによって、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ正規化動的プロファイルを得ることとをさらに含む。本方法は、各動的プロファイルを、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ正規化動的プロファイルと相関させることによって、各動的プロファイルについての相関ベクトルを生成することをさらに含む。各相関ベクトルは、既知の遺伝子型のクラス内の各既知の遺伝子型の各アベレージ正規化動的プロファイルに対する動的プロファイルの相関係数を含む。

本発明のこの第２の態様の方法は、遺伝子型によって一緒にグループ化されたとき、変換型ベクトルの要素のそれぞれが正規分布するように相関ベクトルを変換することも含む。さらに、本方法は、既知の遺伝子型のクラス内の各既知の遺伝子型について１つの行列が存在するように、各変換型ベクトルを変換型ベクトルの行列にコンパイルすることを含む。本方法は、（ｉ）要素が各既知の遺伝子型についてのアベレージ変換型ベクトルを含む、平均変換型ベクトルを生成することであって、変換型ベクトルは、各コンパイルされた行列のアベレージであることと、（ｉｉ）コンパイルされた行列のそれぞれの共分散行列を計算することによって、既知の遺伝子型についての共分散行列を計算することとをさらに含む。したがって、トレーニングセットは、各既知の遺伝子型についてのアベレージ正規化動的プロファイル、各既知の遺伝子型についての平均変換型ベクトル、および各既知の遺伝子型についての共分散行列を含む。

一実施形態では、トレーニングセットを生成する方法は、上述した陽性対照動的プロファイルを使用して、検知される独立変数のシフトおよびスケール変化を補正するステップをさらに含む。この実施形態では、陽性対照動的プロファイルおよび既知の遺伝子型の動的プロファイルの独立変数は、シフト値によってシフトされる。さらなる実施形態では、各動的プロファイルは、所定の平均値および標準偏差を有するように正規化される。

別の実施形態では、本方法は、各相関ベクトルをｎ球座標に転換するステップをさらに含み、ｎは、可能な突然変異のすべてを構成する遺伝子型の数より１小さい。一実施形態では、本方法は、各相関ベクトルを球座標に転換するステップを含む。さらに別の実施形態では、各動的プロファイルは、同じ既知の遺伝子型の動的プロファイル同士間の分離を最小にしつつ、既知の遺伝子型のクラス内の異なる既知の遺伝子型の動的プロファイル同士間の分離を最大にするように選択される範囲にわたって測定される独立変数に対して、各既知の遺伝子型を含有する各核酸の物理的変化を表すシグナルの測定値を含む。

別の態様では、本発明は、生体試料中に存在する核酸の遺伝子型の同一性を決定する方法を提供する。この態様によれば、本発明は、生体試料中に含有される未知の遺伝子型の動的プロファイルを生成することを含む。動的プロファイルは、独立変数に対して、未知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含む。本方法は、未知の遺伝子型の動的プロファイルを、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルと相関させることによって、相関ベクトルを生成することも含む。各既知の遺伝子型のアベレージ動的プロファイルは、トレーニングセット中に設けられ、独立変数に対して、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルのアベレージ測定値を含む。相関ベクトルは、未知の遺伝子型の動的プロファイルと、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルとの間の相関係数を含む。

本方法は、各既知の遺伝子型のクラス条件付き密度を使用して、既知の遺伝子型のクラス内の既知の遺伝子型のそれぞれについて、未知の遺伝子型が既知の遺伝子型である尤度を計算することをさらに含む。クラス条件付き密度は、各遺伝子型についての平均変換型ベクトルおよび共分散行列を使用して計算される。平均変換型ベクトルおよび行列は、トレーニングセットから得られる各遺伝子型についてのグループ化された変換型ベクトルを含む行列から得られる。さらに、本方法は、計算された尤度から、生体試料が各既知の遺伝子型を含有する事後確率を計算することを含む。本方法は、生体試料がある遺伝子型を含有する事後確率が、許容できる閾値内に入るかどうかを判定することによって、未知の遺伝子型が、既知の遺伝子型の１つとして分類されるかどうかを判定し、それによって生体試料中の核酸の遺伝子型の同一性が決定されることをさらに含む。

一実施形態では、事後確率はベイズの定理を使用して計算される。別の実施形態では、本方法は、上述した陽性対照動的プロファイルを使用して、独立変数のシフトおよびスケール変化を補正するステップをさらに含む。さらなる実施形態では、各動的プロファイルは、所定の平均値および標準偏差を有するように正規化される。別の実施形態では、本発明のこの態様において利用されるトレーニングセットは、本明細書に記載されるように調製される。別の実施形態では、各動的プロファイルは、所定の平均値および標準偏差を有するように正規化される。さらなる実施形態では、トレーニングセットは、上述した陽性対照動的プロファイルを使用して、独立変数のシフトおよびスケール変化を補正するステップを用いて調製される。

なおさらなる実施形態では、許容できる閾値内に入る事後確率は、９５％超である。別の実施形態では、本方法は、相関ベクトルが許容できる範囲内に入るかどうかを判定することによって、既知の遺伝子型の１つが、生体試料中に存在する未知の遺伝子型と同一であるかどうかを判定することをさらに含む。一実施形態では、許容できる範囲は、動的プロファイル内で、独立変数に対するシグナルの測定値の既定の閾値百分率を含むトレーニングセットの共分散行列の固有ベクトルによって画定される楕円体である。別の実施形態では、相関ベクトルの要素は、各要素が正規分布した、同じ数の要素を有するベクトルに変換される。別の実施形態では、本方法は、各相関ベクトルをｎ球座標に転換することをさらに含み、ｎは、可能な突然変異のすべてを構成する遺伝子型の数より１小さい。

追加の実施形態では、本方法は、
（ａ）各遺伝子型についての平均変換型ベクトルおよびパラメータ行列を使用して、既知の遺伝子型のクラスについてのクラス内散乱（ｗｉｔｈｉｎ−ｃｌａｓｓｓｃａｔｔｅｒ）行列を計算するステップと、各遺伝子型についての平均変換型ベクトルおよびパラメータ行列を使用して、既知の遺伝子型のクラスのクラス間散乱（ｂｅｔｗｅｅｎ−ｃｌａｓｓｓｃａｔｔｅｒ）行列を計算するステップと、（ｃ）クラス内散乱行列の行列式とクラス間散乱行列の行列式との比である分離比を求めるステップと、独立変数についての分離最大化範囲を求めるステップであって、分離最大化範囲は、分離比を最大にするように選択されるステップとをさらに含む。この実施形態では、各動的プロファイルは、分離最大化範囲にわたって測定される独立変数に対して、各既知の遺伝子型を含有する各核酸の物理的変化を表すシグナルの測定値を含む。

別の態様では、本発明は、生体試料中に存在する核酸の遺伝子型の同一性を決定するためのシステムを提供する。この態様によれば、本システムは、生成モジュール、相関モジュール、クラス条件付き密度モジュール、事後確率モジュール、および判定モジュールを備える。生成モジュールは、生体試料中に含有される未知の遺伝子型の動的プロファイルを生成することができる。動的プロファイルは、独立変数に対して、未知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含む。相関モジュールは、未知の遺伝子型の動的プロファイルを、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルと相関させることによって、相関ベクトルを生成することができる。各既知の遺伝子型のアベレージ動的プロファイルは、トレーニングセット中に設けられ、独立変数に対して、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルのアベレージ測定値を含む。相関ベクトルは、未知の遺伝子型の動的プロファイルと、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルとの間の相関係数を含む。

クラス条件付き密度モジュールは、既知の遺伝子型のそれぞれのクラス条件付き密度を使用して、既知の遺伝子型のクラス内の既知の遺伝子型のそれぞれについて、未知の遺伝子型が既知の遺伝子型である尤度を計算することができる。クラス条件付き密度は、各遺伝子型の平均変換型ベクトルおよび共分散行列を使用して計算される。平均変換型ベクトルおよび共分散行列は、トレーニングセットから得られる各遺伝子型についてのグループ化された変換型ベクトルを含む行列から得られる。事後確率モジュールは、計算された尤度から、生体試料が各既知の遺伝子型を含有する事後確率を計算することができる。判定モジュールは、最大事後確率を有する既知の遺伝子型が、許容できる閾値内に入るかどうかを判定することによって、未知の遺伝子型が、最大事後確率を有する遺伝子型として分類されるかどうかを判定することができ、それによって生体試料中の遺伝子型の同一性が決定される。

一実施形態では、事後確率モジュールは、ベイズの定理を使用して事後確率を計算する。別の実施形態では、本システムは、エラー補正モジュールをさらに備える。エラー補正モジュールは、陽性対照プロファイルを対照遺伝子型の既知のプロファイルと比較することによって、独立変数のシフト値を求めることができる。エラー補正モジュールは、シフト値による、未知の遺伝子型の動的プロファイル内の独立変数のシフトを実施することができる。

さらなる実施形態では、本システムは、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイル、およびパラメータ行列を含むトレーニングセットモジュールも備える。パラメータ行列の要素は、相関ベクトルである。各相関ベクトルは、動的プロファイルと、既知の遺伝子型のクラス内の各既知の遺伝子型の各アベレージ動的プロファイルとの間の相関係数を含む。別の実施形態では、アベレージ動的プロファイルは、アベレージ正規化動的プロファイルである。

追加の実施形態では、トレーニングセットモジュールは、要素が、既知の遺伝子型のクラス内の各既知の遺伝子型の各アベレージ動的プロファイルに対する、各既知の遺伝子型の各動的プロファイルの相関係数のアベレージ値を含む平均変換型ベクトル、およびパラメータ行列の共分散行列を計算することによって得られる既知の遺伝子型についての共分散行列をさらに含む。一実施形態では、アベレージ動的プロファイルは、アベレージ正規化動的プロファイルである。

一実施形態では、相関モジュールは、相関ベクトルを変換型ベクトルにさらに変換し、変換型ベクトルの各要素は正規分布している。別の実施形態では、判定モジュールは、変換型ベクトルが、最大事後確率を有する遺伝子型についてのトレーニングセットから得られるもののうちで許容できる閾値内に入るかどうかを判定することがさらにできる。さらなる実施形態では、許容できる範囲は、動的プロファイル内で、独立変数に対するシグナルの測定値の既定の閾値百分率を含むトレーニングセットの共分散行列の固有ベクトルによって画定される楕円体である。別の実施形態では、本システムは、転換モジュールをさらに備える。転換モジュールは、相関ベクトルをｎ球座標に転換することができ、ｎは、可能な突然変異のすべてを構成する遺伝子型の数より１小さい。一実施形態では、この転換により、正規分布したパラメータを生成することができる。別の実施形態では、転換モジュールは、相関ベクトルを球座標に転換することができる。この実施形態では、この転換により、正規分布したパラメータを生成することができる。さらなる実施形態では、本システムは、上述した独立変数についての分離最大化範囲を求めることができる、分離最大化範囲選択モジュールも備える。

本明細書に組み込まれ、明細書の一部を形成する添付図面は、本発明の様々な実施形態を例示する。

本発明の実施形態による、既知の遺伝子型のクラス内から、ある既知の遺伝子型を認識するためのトレーニングセットを生成する方法を示す流れ図である。本発明の実施形態による、既知の遺伝子型のクラス内から、ある既知の遺伝子型を認識するためのトレーニングセットを生成する方法を示す流れ図である。ワルファリンＶＫＯＲＣ１クラス内の各遺伝子型についての蛍光対温度動的プロファイルを例示する図である。ワルファリンＶＫＯＲＣ１クラス内の各遺伝子型についての蛍光対温度動的プロファイルの負の導関数のプロットである。陽性対照動的プロファイルを、陽性対照の既知の動的プロファイルと相関させることによって求められたシフト値によって、水平方向にシフトされた後の図３の動的曲線を例示する図である。所定の標準偏差に対して正規化した後の図４の動的プロファイル、および一実施形態によるワルファリンＶＫＯＲＣ１クラス内の各遺伝子型のアベレージ動的プロファイルを例示する図である。相関ベクトルの要素が正規分布していない、ワルファリンＶＫＯＲＣ１についての相関ベクトルの３次元プロットである。相関係数が正規分布していない、ワルファリンＶＫＯＲＣ１クラス内の各遺伝子型のアベレージ動的プロファイルに対する野生型動的プロファイルの相関係数パラメータのプロットである。相関ベクトルが球座標に転換され、正規分布している、ワルファリンＶＫＯＲＣ１クラスについての相関ベクトルの３次元プロットである。相関係数が正規分布している、ワルファリンＶＫＯＲＣ１クラス内の各遺伝子型のアベレージ動的プロファイルに対する、相関ベクトルが球座標に転換された後の野生型動的プロファイルの相関係数パラメータのプロットである。相関ベクトルが正規分布している、面ｘ＋ｙ＋ｚ＝０上に投影されたワルファリンＶＫＯＲＣ１クラスについての相関ベクトルの３次元プロットである。本発明の態様による、生体試料中に存在する核酸の遺伝子型の同一性を決定する方法を示す流れ図である。本発明の態様による、生体試料中に存在する核酸の遺伝子型の同一性を決定する方法を示す流れ図である。独立変数のシフト値を求めるために対照遺伝子型の既知の動的プロファイルに相関されている対照遺伝子型プロファイルについての陽性対照を例示する図である。シフト値に対する、対照遺伝子型の既知の動的プロファイルとの陽性対照動的プロファイルの相関係数のプロットである。ワルファリンＶＫＯＲＣ１クラス内の各既知の遺伝子型について、未知の遺伝子型の異なる動的プロファイルを既知の遺伝子型のアベレージ動的プロファイルに相関させることによって生成される相関係数のグレースケールカラーマップを例示する図である。未知の遺伝子型の異なる動的プロファイルのそれぞれが、ワルファリンＶＫＯＲＣ１クラス内の各既知の遺伝子型の動的プロファイルを表す事後確率のグレースケールカラーマップを例示する図である。同じ遺伝子型クラスの動的プロファイル同士間の分離を最小にしつつ、異なる既知の遺伝子型の動的プロファイル同士間の分離を最大にするように選択される温度範囲を選ぶのに使用される、クラス間散乱とクラス内散乱の比のグレースケールカラーマップを例示する図である。本発明の態様によるトレーニングセットを使用して、生体試料中に存在する核酸の遺伝子型の同一性を決定する方法を示す流れ図である。本発明の態様によるトレーニングセットを使用して、生体試料中に存在する核酸の遺伝子型の同一性を決定する方法を示す流れ図である。本発明の態様によるトレーニングセットを使用して、生体試料中に存在する核酸の遺伝子型の同一性を決定する方法を示す流れ図である。本発明の態様によるトレーニングセットを使用して、生体試料中に存在する核酸の遺伝子型の同一性を決定する方法を示す流れ図である。本発明のいくつかの態様によるマイクロ流体デバイスを例示する図である。ＭＴＨＦＲ６６７多型クラス内の各遺伝子型についての蛍光対温度動的プロファイルを例示する図である。ＭＴＨＦＲ６６７多型クラス内の各遺伝子型についての蛍光対温度動的プロファイルの負の導関数のプロットである。陽性対照の既知の動的プロファイルに対する陽性対照動的プロファイルの相関によって求められたシフト値によって水平方向にシフトされた後の図２０の動的曲線を例示する図である。所定の標準偏差に対して正規化した後の図２１の動的プロファイル、および一実施形態による多型クラス（既知の遺伝子型のクラス）内の各遺伝子型のアベレージプロファイルを例示する図である。相関ベクトルの要素が正規分布していない、ＭＴＨＦＲ６６７多型クラスについての相関ベクトルの３次元プロットである。相関ベクトルが正規分布している、面ｘ＋ｙ＋ｚ＝０上に投影されたＭＴＨＦＲ６６７多型についての相関ベクトルの３次元プロットである。相関ベクトルが球座標に転換され、正規分布している、ＭＴＨＦＲ６６７多型クラスについての相関ベクトルの３次元プロットである。

本発明は、いくつかの実施形態を有し、当業者に公知の詳細については、特許、特許出願、および他の参考文献に依拠する。したがって、特許、特許出願、または他の参考文献が本明細書で引用され、または繰り返される場合、これは、すべての目的、ならびに列挙される提案のために、その全体が参照により組み込まれていることが理解されるべきである。

本発明の実践には、別段の指定のない限り、当技術分野の技術の範囲内である、有機化学、ポリマー技術、分子生物学（組換え技法を含む）、細胞生物学、生化学、および免疫学の従来の技法および記述を使用することができる。そのような従来の技法には、ポリマーアレイ合成、ハイブリダイゼーション、ライゲーション、および標識を使用するハイブリダイゼーションの検出が含まれる。適当な技法の具体的な実例は、以下の本明細書の例を参照することによって得ることができる。しかし、他の等価な従来の手順も、もちろん使用することができる。そのような従来の技法および記述は、標準的な実験室マニュアル、例えば、ＧｅｎｏｍｅＡｎａｌｙｓｉｓ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌＳｅｒｉｅｓ（Ｉ〜ＩＶ巻）、ＵｓｉｎｇＡｎｔｉｂｏｄｉｅｓ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ、Ｃｅｌｌｓ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ、ＰＣＲＰｒｉｍｅｒ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ、およびＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ（すべてＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓから）、Ｓｔｒｙｅｒ，Ｌ．（１９９５）Ｂｉｏｃｈｅｍｉｓｔｒｙ（４版）Ｆｒｅｅｍａｎ、Ｎ．Ｙ．、Ｇａｉｔ、ＯｌｉｇｏｎｕｃｌｅｏｔｉｄｅＳｙｎｔｈｅｓｉｓ：ＡＰｒａｃｔｉｃａｌＡｐｐｒｏａｃｈ、１９８４、ＩＲＬＰｒｅｓｓ、Ｌｏｎｄｏｎ、ＮｅｌｓｏｎａｎｄＣｏｘ（２０００）、Ｌｅｈｎｉｎｇｅｒ、ＰｒｉｎｃｉｐｌｅｓｏｆＢｉｏｃｈｅｍｉｓｔｒｙ３版、Ｗ．Ｈ．ＦｒｅｅｍａｎＰｕｂ．、ＮｅｗＹｏｒｋ、Ｎ．Ｙ．、およびＢｅｒｇら（２００２）Ｂｉｏｃｈｅｍｉｓｔｒｙ、５版、Ｗ．Ｈ．ＦｒｅｅｍａｎＰｕｂ．、ＮｅｗＹｏｒｋ、Ｎ．Ｙ．などに見出すことができ、そのすべては、すべての目的のためにその全体が参照により本明細書に組み込まれている。

蛍光の熱融解曲線は、温度の傾斜上昇を介して二本鎖状態から２つの別個の一本鎖に変性されるときのＤＮＡ鎖の融解温度を求めるのに使用された。一般に、融解温度またはＴ_ｍは、対になったＤＮＡ鎖の５０％が一本鎖に変性されたときの温度であると定義される。二本鎖ＤＮＡに結合しているとき蛍光を放ち、変性されたときその蛍光を失うインターカレーティング色素が、Ｔ_ｍの測定に多くの場合使用される。一般に、温度に対する蛍光の負の導関数（−ｄＦ／ｄＴ）が、Ｔ_ｍの判定に使用されている。一般的なシステムでは、ピーク−ｄＦ／ｄＴでの温度が、融解温度Ｔ_ｍの推定値として使用される。

−ｄＦ／ｄＴ導関数曲線は、任意のシグナルの導関数を推定することができる、Ｓａｖｉｔｓｋｙ−Ｇｏｌａｙ（ＳＧ）導関数フィルターを使用して得ることができる。Ｓａｖｉｔｓｋｙ−Ｇｏｌａｙフィルターは、ローパス、有限インパルス応答（ＦＩＲ）導関数フィルターであり、未処理シグナルを伴うＦＩＲフィルターパラメータの畳み込みによって、任意の動的シグナルに適用される。独立変数の間隔が均一である場合、フィルターされた結果は、等価な独立変数に対する従属変数の一次導関数および高次導関数を与えることができる。そのようなフィルターの効果は、移動多項式フィット、その後のウインドウの中心で評価されたその多項式の導関数の評価と等価である。−ｄＦ／ｄＴ導関数曲線を得るための他の方法は、米国特許出願公開第２００９／０１１２４８４号に見出すことができ、これは、参照により本明細書に組み込まれている。

本発明は、核酸の動的プロファイルを分析するための方法およびシステムに関する。これらの動的プロファイルは、独立変数に対して、核酸の物理的変化を表すシグナルの測定値を含むデータセットである。この物理的変化の一例は、核酸の解離挙動である。特定の遺伝子型の核酸の動的プロファイルを分析することにより、核酸の同定および特定の遺伝子型の同定を補助することができる。より具体的には、本発明は、生体試料中の未知の遺伝子型の動的プロファイルを分析することにより、生体試料中に存在する核酸の遺伝子型の同一性を決定するための方法およびシステムに関する。

上述したように、動的プロファイルは、独立変数に対して、核酸の物理的変化を表すシグナルの測定値を含む。この物理的変化は、例えば、特定の遺伝子型を含有する核酸の変性とすることができる。そのような動的プロファイルは、例えば、分子融解曲線または熱変性曲線とすることができる。核酸についてのそのような熱変性曲線におけるシグナルは、例えば、測定された熱パラメータ、インジケータ色素／分子の蛍光、蛍光偏光、誘電特性などであってもよい。分子融解曲線または熱変性曲線である動的プロファイルは、融解曲線分析によって生成され得る。

融解曲線分析は一般に、ストップトフロー形式または連続フロー形式で実施される。ストップトフロー形式の一例では、流れは、マイクロ流体デバイスのマイクロチャネル内で止められる一方で、そのチャネル内の温度は、所望の融解曲線を生成するのに必要とされる温度範囲にかけて勾配を成す。代替のストップトフロー形式では、融解曲線分析は、核酸試料が添加されたチャンバー内で行われる。連続フロー形式の一例では、融解曲線分析は、マイクロ流体デバイスのマイクロチャネルの長さ（流れの方向）に沿って温度勾配をかけることによって実施される。融解曲線分析で、分析される分子が、第１の温度から第２の温度に及ぶ温度範囲に曝されることを必要とする場合、マイクロチャネルの一端での温度は第１の温度に制御され、その長さの他端での温度は第２の温度に制御され、こうして、第１と第２の選択された温度間の温度範囲に及ぶ連続的な温度勾配が作られる。融解曲線分析を実施するための機器の例は、その全体が参照により本明細書に組み込まれている、米国特許出願公開第２００７／０２３１７９９号に開示されている。本発明は、任意の環境において得られる動的プロファイルの分析に適用可能であるが、本発明は、マイクロ流体環境において得られる動的プロファイルに特に有用であり、その理由は、この環境においてより大きい感度を必要とするためである。

本発明のある特定の態様によれば、動的プロファイルは、１つまたは複数の分子、例えば、１つまたは複数の核酸の温度を選択された時間上昇させ、この１つまたは複数の分子から発せられるシグナル（すなわち、検出可能な特性）を測定することによって生成され、ここでシグナルは、核酸の変性の程度を示す。この時間は、例えば、間のすべての時間を含めて、約０．０１秒から約１．０分以上、約０．０１秒から約１０秒以上、約０．１秒から約１．０秒以上の範囲とすることができる。一実施形態では、加熱は、１つまたは複数の分子の温度を持続的に増大させることによって、この１つまたは複数の分子の温度を上昇させることを含む。例えば、分子（複数可）の温度は、約０．１℃／秒〜約１℃／秒の範囲の速度で持続的に増大させることができる。あるいは、分子（複数可）の温度は、約０．０１℃／秒〜約０．１℃／秒の範囲内の速度などのより遅い速度、または例えば、約１℃／秒〜約１０℃／秒の範囲内の速度などのより速い速度で持続的に増大させてもよい。加熱は、当技術分野で公知であるように、内部または外部の加熱源を適用することによって行うことができる。

分子の１つまたは複数の物理的変化の実際の検出は、関与する特定の分子および反応に応じて多数の方法で検出することができる。例えば、分子の変性は、アッセイにおいて、分子からの蛍光または放射光をたどることによって追跡することができる。蛍光の程度または変化は、アッセイされている分子の構造の変化の程度に相関または比例する。したがって、いくつかの方法では、分子（複数可）の特性の検出は、結合の相対的な量の関数として変化する分子（複数可）からの蛍光または放射光のレベルを検出することを含む。一構成では、蛍光を検出することは、第１の分子および第２の分子を伴い、ここで第１の分子は、蛍光インジケータ色素または蛍光インジケータ分子であり、第２の分子は、アッセイされる標的分子である。一実施形態では、蛍光インジケータ色素または蛍光インジケータ分子は、第２の分子上の疎水性残基または親水性残基に結合することによって第２の分子に結合または付随する。検出する方法は、蛍光インジケータ色素または蛍光インジケータ分子を励起することによって、励起蛍光インジケータ色素または励起蛍光インジケータ分子を作り、励起した蛍光インジケータ色素または蛍光インジケータ分子の放出または消光事象を識別および測定することを任意選択によりさらに含む。

動的プロファイルは、いくつかの異なる方法で生成することができる。いくつかの方法では、動的プロファイルの生成は、蛍光インジケータ色素または蛍光インジケータ分子を含む１つの分子、および酵素、リガンド、ペプチド核酸、補助因子、受容体、基質、タンパク質、ポリペプチド、核酸（二本鎖もしくは一本鎖）、抗体、抗原、または酵素複合体のうちの１つまたは複数を含む少なくとも１つの第２の分子を提供することを含む。温度の関数として、第２の分子の存在下で第１の分子の蛍光が測定され、得られるデータは、動的プロファイルを構成する。他の方法では、動的プロファイルの生成は、温度の変化による別の分子（複数可）の物理的特性の変化に相関または比例する、１つの分子の蛍光の変化を測定することを含む。さらに他の方法では、動的プロファイルの生成は、第２の分子が存在しないで、温度の関数としてシステムの全自由エネルギーの変化を測定することを含む。一般に、本方法は、類似の様式で、対照試料の陽性対照プロファイル、または既知の試料の既知の動的プロファイルを生成することも含む。

対象とする分子の変性を測定するのにいくつかの技法が存在し、これらのいずれも、本発明の態様によって分析されるデータの生成に使用することができる。そのような技法には、蛍光、蛍光偏光、蛍光共鳴エネルギー移動、円偏光二色性、およびＵＶ吸光度が含まれる。簡単に言えば、蛍光技法では、標的分子が温度の変化に曝される際の、標的分子の変性／アンフォールディングを追跡するのに、蛍光または光の変化を測定するための分光法の使用を伴う。例えば、蛍光による分光分析は、熱で誘発された分子の変性／アンフォールディングを検出する有用な方法である。蛍光を伴う多くの異なる方法が、分子の変性を検出するのに利用可能であり（例えば、内在蛍光、多数の蛍光インジケータ色素または分子、蛍光偏光、蛍光共鳴エネルギー移動など）、本発明の任意選択の実施形態である。これらの方法は、標的分子の内部蛍光特性、または外部蛍光、すなわち、分析に関与する追加のインジケータ分子の蛍光を活用することができる。

標的分子の変性／アンフォールディングの程度を測定する方法は、標的分子および対象とする任意の試験分子とともに、マイクロ流体デバイスに加えられた色素または分子の蛍光をモニターすることによるものである。蛍光色素または蛍光分子は、標的分子がアンフォールドもしくは変性されると、または標的分子が、例えば、変性によって構造的な変化を受ける前に、標的分子に結合することができ、例えば、指定波長の光によって励起された後、蛍光エネルギーまたは光を放出する、任意の蛍光分子または蛍光化合物（例えば、フルオロフォア）を指す。

マイクロ流体デバイスにおいて使用される１つの色素のタイプは、核酸の鎖内に介在するものである。そのような色素の古典的な例は、臭化エチジウムである。結合アッセイのための臭化エチジウムの例示的使用は、例えば、試験分子が核酸標的分子に結合することによる臭化エチジウムからの蛍光発光の減少をモニターすることを含む（臭化エチジウム置換アッセイ）。例えば、Ｌｅｅ，Ｍら（ＪＭｅｄＣｈｅｍ３６（７）：８６３〜８７０頁（１９９３））を参照。変性の測定において核酸インターカレート剤を使用することは、当業者に公知である。例えば、Ｈａｕｇｌａｎｄ（ＨａｎｄｂｏｏｋｏｆＦｌｕｏｒｅｓｃｅｎｔＰｒｏｂｅｓａｎｄＲｅｓｅａｒｃｈＣｈｅｍｉｃａｌｓ、ＭｏｌｅｃｕｌａｒＰｒｏｂｅｓ，Ｉｎｃ．、Ｅｕｇｅｎｅ、ＯＲ（１９９６））を参照。

インターカレーション以外の機構によって核酸に結合する色素も、本発明の実施形態において使用することができる。例えば、二本鎖ＤＮＡの副溝に結合する色素を使用することによって、温度による標的分子の分子アンフォールディング／変性をモニターすることができる。適当な副溝結合色素の例は、ＭｏｌｅｃｕｌａｒＰｒｏｂｅｓＩｎｃ．（Ｅｕｇｅｎｅ、ＯＲ、ＵＳＡ）によって販売されている色素のＳＹＢＲグリーン群である。例えば、Ｈａｕｇｌａｎｄ（ＨａｎｄｂｏｏｋｏｆＦｌｕｏｒｅｓｃｅｎｔＰｒｏｂｅｓａｎｄＲｅｓｅａｒｃｈＣｈｅｍｉｃａｌｓ、ＭｏｌｅｃｕｌａｒＰｒｏｂｅｓ，Ｉｎｃ．、Ｅｕｇｅｎｅ、ＯＲ、ＵＳＡ（１９９６））を参照。ＳＹＢＲグリーン色素は、任意の二本鎖ＤＮＡ分子に結合する。ＳＹＢＲグリーン色素が二本鎖ＤＮＡに結合するとき、蛍光発光の強度は増大する。より多くの二本鎖ＤＮＡが温度の増大によって変性されるにつれて、ＳＹＢＲグリーン色素のシグナルは減少する。別の適当な色素は、ＩｄａｈｏＴｅｃｈｎｏｌｏｇｙ，Ｉｎｃ．（ＳａｌｔＬａｋｅＣｉｔｙ、ＵＴ、ＵＳＡ）によって販売されているＬＣＧｒｅｅｎＰｌｕｓである。

蛍光偏光（ＦＰ）は、対象とする分子同士間のハイブリダイゼーション形成を検出するための有用な方法をもたらす。この方法は、例えば、一塩基多型（ＳＮＰ）をモニターするための、核酸同士間のハイブリダイゼーション検出に特に適用可能である。一般に、ＦＰは、試験分子および標的分子を含む分子同士間の結合事象の前、間、および／または後に、蛍光色素または分子指標などの蛍光標識の回転速度をモニターすることによって作用する。手短に言えば、試験分子が標的分子に結合すると、通常、分子の１つに結合した標識の回転速度が減少し、ＦＰの変化をもたらす。

蛍光共鳴エネルギー移動（ＦＲＥＴ）を使用することによって、温度の関数として、標的分子の構造的な変化（および標的分子に結合することができる試験分子との相互作用）を追跡することができる。ＦＲＥＴは、ドナーフルオロフォアからアクセプターフルオロフォアへのエネルギーの距離依存性移動に依拠する。アクセプターフルオロフォアが励起されたドナーフルオロフォアにごく接近している場合、ドナーフルオロフォアの発光は、アクセプターフルオロフォアに移される場合がある。これにより、ドナーフルオロフォアの発光強度の随伴する低減、およびアクセプターフルオロフォアの発光強度の増大が生じる。励起移動の効率はとりわけ、２つのフルオロフォアの間の距離に依拠するので、この技法は、構造の変化を検出するときに起こるなどの、極めて小さい距離を測定するのに使用することができる。この技法は、結合反応、タンパク質間相互作用、例えば、対象とするタンパク質の抗体への結合など、および２つの標識された分子の近接を変化させる他の生物学的事象の測定に特に適している。多くの適切な相互作用的な標識が知られている。例えば、蛍光標識、色素、酵素標識、および抗体標識は、すべて適切である。

円偏光二色性（ＣＤ）は、温度の関数として標的分子／テキスト分子（ｔｅｘｔｍｏｌｅｃｕｌｅ）の構造的変化をたどるのに使用することができ、分子融解曲線を構築するのに使用することができる。ＣＤは、光吸収分光法の１つのタイプであり、これは、右円偏光と左円偏光の間の分子による吸光度の差異を測定する。ＣＤは、ポリペプチドおよびタンパク質の構造に非常に敏感である。

ＵＶ吸光度も、核酸分子の変性を検出および／もしくは追跡し、かつ／または核酸の全量を定量化するのに使用することができる。ＵＶは、変性の程度を測定するのに使用することができ、その理由は、一本鎖核酸分子のＵＶ吸光度値は、二本鎖核酸分子の吸光度値より大きいためである。

標的分子の変性／アンフォールディングの程度を測定する代替の方法は、試料にわたって印加される電圧に対して、試料によって生成される電流をモニターすることによって、ボルタンメトリー曲線を作成することによるものである。いくつかの方法では、ボルタンメトリー曲線の作成は、酵素、リガンド、ペプチド核酸、補助因子、受容体、基質、タンパク質、ポリペプチド、核酸（二本鎖、または一本鎖）、抗体、抗原、または酵素複合体のうちの１つまたは複数を含む１つの分子を提供することを含む。さらに、一本鎖核酸または二本鎖核酸に優先的に結合する酸化還元活性分子を含む少なくとも１つの第２の分子が提供される。一般に、特定のタンパク質または対象とする核酸を表すプローブ分子が提供され、プローブ分子は、リガンド、ペプチド核酸、基質、タンパク質、ポリペプチド、核酸（二本鎖もしくは一本鎖であり、対象とする特定の配列にハイブリダイズすることができるオリゴヌクレオチドであってもよい）、抗体、抗原、または酵素複合体とすることができる。好ましくは、酸化還元活性分子は、その酸化または還元電位が、これが二本鎖核酸と相互作用しない場合と異なるように二本鎖核酸と相互作用する。そのような酸化還元活性分子は、多くの場合、核酸のワトソン−クリック塩基対の間、または核酸の二次構造の副溝または主溝中に介在し、したがって一本鎖核酸と相互作用しない。あるいは、酸化還元活性分子は、対象とする配列に優先的に結合することができる。そのような酸化還元活性分子の非限定例は、調べられる対象とする配列、およびプローブの遊離端に結合したフェロセン標識を含むプローブ分子である。

そのような酸化還元活性分子を含む試料にわたって電位を印加すると、電流を生じ、この電流は、異なる電位の印加とともに変化する。試料にわたって様々な電位を印加することによって、動的プロファイルを作るために、生成される電流の様々な測定値を得ることができる。例えば、第１の分子が、プローブ分子に完全にハイブリダイズした場合、動的プロファイルは、第１の分子が、プローブ分子に不完全にハイブリダイズするか、またはまったくハイブリダイズしない場合に生成される動的プロファイルと異なることになる。次いで、動的プロファイルは、電流対電圧を表す曲線としてプロットすることによって、ボルタンメトリー曲線を作成することができる。高解像度熱融解の場合における動的プロファイルについて本明細書に記載されるプロセスおよび流れ図は、電気化学的ボルタンメトリーの場合における動的プロファイルにあてはまる。

これらの方法によって生成される動的プロファイルは、シグネチャ曲線（ｓｉｇｎａｔｕｒｅｃｕｒｖｅ）を生成するのにデータをプロットするために使用される任意の利用可能な媒体にプロットすることができる。シグネチャ曲線は、人が、１つの動的プロファイルを別の動的プロファイルと視覚的に照合することを可能にし、これにより、研究者が、生体試料中の異なる遺伝子型を区別することが可能になるので有用である。最初のシグネチャ曲線は、数学的に改変または操作することによって第２のシグネチャ曲線を生成することもでき、これにより研究者が、未知の遺伝子型を表すシグネチャ曲線を、既知の遺伝子型を表すシグネチャ曲線とより容易に比較することが可能になる場合がある。シグネチャ曲線は、例えば、熱融解曲線とすることができる。熱融解曲線は一般に、温度に対する蛍光の負の導関数（−ｄＦ／ｄＴ）のプロットであり、これらは熱融解データから生成される。研究者は、これらの曲線を「視覚的に」に調べることによって、異なる遺伝子型の熱融解曲線の外観の差異に基づいて、異なる遺伝子型を区別することができ、この差異は、２つの遺伝子型の間の動的プロファイルの差異を表す。この視覚的検査は、特定の遺伝子型の同定において、高い程度のユーザー介入を必要とし、その理由は、研究者は、未知の遺伝子型の動的プロファイルから生成されるシグネチャ曲線を、既知の遺伝子型の動的プロファイルから生成される既知のシグネチャ曲線と照合しなければならないためである。さらに、曲線の形状のわずかな差異は、人の検査によって検出されない場合があり、遺伝子型の誤同定に至る恐れがある。

未知の遺伝子型の熱融解曲線の差異を分析するための定量的方法も存在する。１つの定量的方法は、ピーク−ｄＦ／ｄＴでの温度を求めることを含む。この温度は、核酸の融解温度Ｔ_ｍの推定値として使用される。核酸のＴ_ｍのこの推定値は、その値を、既知の遺伝子型の融解温度の分布と比較することによって、核酸の遺伝子型を分類するのに使用することができる。しかし、この方法も潜在的な欠点を呈する。例えば、この方法は、遺伝子型を決定するために、熱融解曲線全体のただ１点、すなわち、導関数のピークを使用する。これはおそらく、試料の遺伝子型を決定するのに有用となり得る曲線の幅およびピークの高さを含めた、熱融解曲線の全体的形状を無視する。さらに、２つの一塩基多型は、０．５℃未満離れた融解温度の差異を有する場合がある。この場合、マイクロ流体デバイスで得られるデータから生成される２つの熱融解曲線の解像度は低すぎて、２つの遺伝子型の融解温度の間、したがって、遺伝子型同士間の差異を識別することを可能にすることができない場合がある。

本発明の一態様によれば、上記方法によって生成される動的プロファイルは、本明細書で未知の遺伝子型とも呼ばれる、生体試料中に存在する核酸の遺伝子型の同一性を決定するのに使用することができる。本発明の別の態様によれば、上記方法によって生成される動的プロファイルは、既知の遺伝子型のクラス内から、ある既知の遺伝子型を装置に認識させるために、トレーニングセットを生成するのに使用することができる。本発明のさらなる態様によれば、上記方法は、対照遺伝子型の陽性対照動的プロファイルを生成するのに使用することができ、このプロファイルは、計測装置、初期条件、周囲条件、および実験の実施同士間の他の変動の差異によって取り入れられるエラーを説明し、補正するのに使用される。本発明の様々な実施形態は、図面を参照して、以下により詳細に説明される。

一態様では、本発明は、既知の遺伝子型のクラス内から、ある既知の遺伝子型を装置に認識させるためのトレーニングセットを生成する方法を提供する。この態様によれば、既知の遺伝子型のクラスのトレーニングセットは、以下のステップ、すなわち、（ａ）既知の遺伝子型のクラス内の各既知の遺伝子型について、同じ遺伝子型の複数の動的プロファイルをグループ化するステップと、（ｂ）動的プロファイルのそれぞれを正規化するステップと、（ｃ）同じ遺伝子型の正規化動的プロファイルをアベレージすることによって、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ正規化動的プロファイルを得るステップと、（ｄ）各動的プロファイルを、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ正規化動的プロファイルと相関させることによって、各動的プロファイルについての相関ベクトルを生成するステップと、（ｅ）遺伝子型によって一緒にグループ化されたとき、変換型ベクトルの要素のそれぞれが正規分布するように相関ベクトルを変換するステップと、（ｆ）既知の遺伝子型のクラス内の各既知の遺伝子型について１つの行列が存在するように、各変換型ベクトルを変換型ベクトルの行列にコンパイルするステップと、（ｇ）要素が、各既知の遺伝子型についてのアベレージ変換型ベクトルを含む、平均変換型ベクトルを生成するステップであって、変換型ベクトルは、各コンパイルされた行列のアベレージであるステップと、（ｈ）コンパイルされた行列のそれぞれの共分散行列を計算することによって、既知の遺伝子型についての共分散行列を計算するステップとを使用して生成される。

一実施形態では、各動的プロファイルは、本明細書に記載されるように、独立変数に対して、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含む。したがって、動的プロファイルは、核酸の物理的変化を表すシグナルの測定値から導出される。既知の遺伝子型のクラスの各既知の遺伝子型について、複数の動的プロファイルを生成することができる。一実施形態では、複数の動的プロファイルは、これらがすべて同じ平均値および標準偏差を有するように正規化することができる。別の実施形態では、各相関ベクトルは、既知の遺伝子型のクラス内の各既知の遺伝子型の各アベレージ正規化動的プロファイルに対する、動的プロファイルについての相関係数を含む。すなわち、トレーニングセットを構成する個々の動的曲線のそれぞれは、アベレージ正規化プロファイルのそれぞれに対して相関されることによって、トレーニングセット中の各動的曲線についての相関ベクトルを得る。さらなる実施形態では、同じ遺伝子型に属する変換型ベクトルは、一緒にグループ化されてスタックド行列（ｓｔａｃｋｅｄｍａｔｒｉｘ）にされ、平均ベクトル（それによって行列の各行がアベレージされる）、およびスタックド行列の共分散行列が得られる。一実施形態では、本方法により、アベレージ正規化動的プロファイル、各既知の遺伝子型についての平均変換型ベクトル、既知の遺伝子型のクラス内の各既知の遺伝子型についての共分散行列を含むトレーニングセットが生じる。

一実施形態では、トレーニングセットを生成する方法は、（ｉ）対照遺伝子型の陽性対照動的プロファイルを生成することであって、陽性対照動的プロファイルは、未知の遺伝子型の動的プロファイルを構成する測定値と並行してとられた、独立変数に対する、対照遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含むことと、（ｉｉ）陽性対照動的プロファイルを、対照遺伝子型の標準陽性対照動的プロファイルと比較することによって、独立変数のシフト値を求めることと、（ｉｉｉ）陽性対照動的プロファイルおよび既知の遺伝子型の動的プロファイルの独立変数を、シフト値によってシフトすることとをさらに含む。さらなる実施形態では、各動的プロファイルは、本明細書に記載されるものなどの、同じ既知の遺伝子型の動的プロファイル同士間の分離（クラス内散乱）を最小にしつつ、既知の遺伝子型のクラス内の異なる既知の遺伝子型の動的プロファイル同士間の分離（クラス間散乱）を最大にするように選択された範囲にわたって測定された独立変数に対して、各既知の遺伝子型を含有する各核酸の物理的変化を表すシグナルの測定値を含む。

別の実施形態では、相関ベクトルの要素は、新しいベクトルに変換され、この場合、各要素は、その遺伝子型によるガウス分布に属する。別の実施形態では、本方法は、各相関ベクトルを、ｎ座標のベクトルに転換するステップであって、ｎは、可能なクラスまたは遺伝子型の数以下であるステップをさらに含む。クラスまたは遺伝子型の数は、増幅されたＤＮＡセグメントにおいて可能である塩基対の異なる組合せの数に等しい。変換ベクトルは、クラスによってグループ化される場合、要素のそれぞれが正規分布するように構築することができる。これにより、ＤＮＡ試料が各可能なクラスに属する尤度および確率を計算するために、多変量ガウス分布を記述する式を使用することが可能になる。これを行うための１つのそのような方法は、各相関ベクトルを、可能な遺伝子型の数に等しい要素の数、ｎを有する球座標に変換することである。これは、要素のすべてが正規分布しているわけではない相関ベクトルを、要素のそれぞれが、クラスによってグループ化されたとき、正規分布しているベクトルに変換する。あるいは、ｎがクラスの数未満である変換を使用することができ、相関ベクトルより少ない数の要素を有する変換型ベクトルを生じる。

図１Ａ〜１Ｂは、本発明の実施形態によるトレーニングセットを生成するための方法１００についての流れ図を例示する。方法１００におけるステップ１０２は、複数の生体試料中に含有される既知の遺伝子型の複数の動的プロファイルを生成することを含む。動的プロファイルは、ステップ１０４において生成されるデータから生成することができる。ステップ１０４におけるデータは、動的プロファイルまたはシグネチャ曲線のデータを生成するために上述した方法のいずれかによって生成することができる。動的プロファイルはそれぞれ、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値ｙ（ｔ）を含む。シグナルのこれらの測定値は、独立変数、ｘ（ｔ）に対して記録される。パラメータｔは、独立変数およびシグナルの両方が測定される任意のパラメータとすることができる。動的プロファイルにおける測定値が、インターカレーティング色素を伴った、既知の遺伝子型を含有する核酸の熱融解を通じて生成される場合、ｘ（ｔ）は温度Ｔ（ｔ）であり、ｙ（ｔ）は、蛍光、Ｆ（ｔ）、または温度に対する蛍光の導関数−ｄＦ／ｄＴである。あるいは、動的プロファイルが、酸化還元活性分子を伴った核酸のボルタンメトリーを通じて生成される場合、ｘ（ｔ）は電位Ｖ（ｔ）であり、ｙ（ｔ）は電流Ｉ（ｔ）である。非限定例として、ワルファリンＶＫＯＲＣ１多型における３つの異なる遺伝子型のいくつかの動的プロファイルのプロットが、図２に蛍光対温度曲線の形式で、および図３に温度に対する蛍光の導関数として示されている。

図１Ａのステップ１０６は、対照遺伝子型の関連陽性対照動的プロファイル（ａｓｓｏｃｉａｔｅｄｐｏｓｉｔｉｖｅｃｏｎｔｒｏｌｄｙｎａｍｉｃｐｒｏｆｉｌｅ）を生成することを含む。一実施形態では、関連陽性対照動的プロファイルは、既知の遺伝子型の複数の動的プロファイルのそれぞれが生成されるのと同時に生成される。陽性対照遺伝子型の各陽性対照動的プロファイルも、既知の遺伝子型の動的プロファイルと同じ独立変数に対する同じシグナルの測定値からなるが、測定値は、既知の遺伝子型を含有する試料ではなく、陽性対照試料から取得される。陽性対照遺伝子型についてのシグナルの測定値は、既知の遺伝子型についてのシグナルの測定値とともに、ステップ１０４において同時に生成されることが好ましい。この陽性対照動的プロファイルは、対照遺伝子型の標準参照動的プロファイルと比較することができる。あるいは、陽性対照動的プロファイルのそれぞれの独立変数は、ステップ１０８に示すように、陽性対照動的プロファイルがマッチし、シフトされるすべての陽性対照動的プロファイルについてのシフト値Δｘの平均が０であるように、シフト値Δｘによってシフトすることができる。ステップ１１０において、陽性対照動的プロファイルに関連する動的プロファイルの独立変数も、関連陽性対照動的プロファイルと同じシフト値Δｘによってシフトされる。陽性対照動的プロファイルまたは動的プロファイルにおける独立変数を、シフト値Δｘによってシフトするために、Δｘが、陽性対照動的プロファイルまたは動的プロファイルにおける独立変数から減算され、またはこの独立変数に加算される。

動的プロファイルは、ステップ１１２に示すように、正規化されることによって所定の標準偏差を有することができる。シフトされた動的プロファイルは、正規化されることが最適である。いくつかの実施形態では、正規化手順は、所定の標準偏差および所定のアベレージ値の両方を有するために、動的プロファイルも正規化する。所定のアベレージ値は０とすることができ、所定の標準偏差は１とすることができる。正規化動的プロファイルｙ’（ｘ）は以下のように計算することができる。
式中、μ（ｙ（ｘ））は、動的プロファイルのアベレージ値であり、σ（ｙ（ｘ））は、動的プロファイルの標準偏差である。例として、図４に例示したように、−ｄＦ／ｄＴ対温度曲線の形式で、いくつかのシフトされた動的プロファイルが、ワルファリンＶＫＯＲＣ１多型における３つの異なる遺伝子型について示されている。

図１Ａに戻って参照すると、既知の遺伝子型のクラス内の各遺伝子型についての既知の遺伝子型に関連したすべての動的プロファイルをシフトおよび正規化した後、一連の正規化され、シフトされた動的プロファイル１１４が生成される。いくつかの実施形態では、これらは、本発明の他の態様において使用するために、データストレージに登録することができる。

動的プロファイルは、ステップ１１６において、同じ既知の遺伝子型に対応する他の動的プロファイルとともにアベレージすることができる。同じ既知の遺伝子型に対応するいくつかの動的プロファイルを一緒にアベレージすることにより、既知の遺伝子型のアベレージ動的プロファイルが生成され、これは、独立変数に対して、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルのアベレージ測定値を含む。本発明の一実施形態では、遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイル１１８が生成され、本発明の他の態様において使用するために記憶される。

１つの既知の遺伝子型のアベレージ動的プロファイルを生成するために、１つの既知の遺伝子型の複数の動的プロファイルを一緒にアベレージすることができる。動的プロファイルを一緒にアベレージするための１つの方法は、アベレージされている動的プロファイルのすべてにわたって、独立変数の各異なる値についてのシグナルの測定値の平均値を計算することによって、既知の遺伝子型のアベレージプロファイルを構成することである。いくつかの実施形態では、一部の範囲外のデータセットを、研究者の自由裁量で除外することができる。図５は、ワルファリンＶＫＯＲＣ１多型クラス内の各既知の遺伝子型のアベレージプロファイルを、より細い線の中で太い、濃い線として示す。

さらに、同じ陽性対照遺伝子型を表す陽性対照動的プロファイルを一緒にアベレージすることによって、アベレージ陽性対照動的プロファイルを、同様の様式で生成することができる。動的プロファイル（または陽性対照動的プロファイル）は、既知の遺伝子型または陽性対照遺伝子型のアベレージ正規化動的プロファイルを作るために、これらを一緒にアベレージする前に、上述したようにシフトおよび正規化されることが好ましい。

本明細書で使用する場合、遺伝子型のクラスは、未知の遺伝子型を合理的に比較することを望む、あらゆる遺伝子型を含むことができる。いくつかの実施形態では、遺伝子型のクラスは、特定の多型に関連する遺伝子型となる。例えば、ワルファリンＶＫＯＲＣ１多型について、この多型に関連する３つの可能な遺伝子型、すなわち、野生型（ＷＴ）、ヘテロ接合性突然変異体（ＨＥ）、およびホモ接合性突然変異体（ＨＭ）が存在する。この場合における遺伝子型のクラスは、３つすべての遺伝子型（ＷＴ、ＨＥ、およびＨＭ）を含むことが好ましいが、このクラスは、より少ない遺伝子型を含むことができ、ワルファリンＶＫＯＲＣ１多型に関連するもの以外の追加の遺伝子型も同様に含んでもよい。同様に、凝固因子ＭＴＨＦＲ６７７一塩基多型について、３つの可能な遺伝子型、すなわち、野生型（ＷＴ）、ヘテロ接合体（ＨＥ）、およびホモ接合体（ＨＭ）が存在する。いくつかの実施形態では、遺伝子型のクラスは、ＷＴ、ＨＥ、およびＨＭ遺伝子型を当然に含むことができる。

図１Ａに戻って参照すると、ステップ１２０において、対照遺伝子型の各既知の動的プロファイルは、所定の平均値および標準偏差を有するように正規化される。いくつかの実施形態では、この正規化手順は、上記に論じた、動的プロファイルについて使用された正規化手順と同一である。ステップ１２２において、陽性対照動的プロファイルがアベレージされることによって、対照遺伝子型の標準参照動的プロファイルが生成される。標準参照動的プロファイルは、既知の遺伝子型のアベレージ動的プロファイルが計算されるのと同じ様式で計算することができる。標準参照動的プロファイルは、ステップ１２４において出力することができる。他の実施形態では、これは、本発明の他の態様において使用するために、データストレージに記憶することができる。

ステップ１２６において、既知の遺伝子型のアベレージ動的プロファイルを計算するのに使用された既知の遺伝子型の各動的プロファイルは、各既知の遺伝子型のアベレージ動的プロファイルに対して相関されることによって、その動的プロファイルについての相関ベクトルｒが生成される。
式中、ｒ_１、ｒ_２、．．．、ｒ_Ｎｇは、動的プロファイルと、既知の遺伝子型のクラス内の各既知の遺伝子型についてのアベレージ動的プロファイルのそれぞれとの相関値である。相関ベクトルｒは、［Ｎ_ｇ×１］行列であってもよく、Ｎ_ｇは、可能な突然変異のすべてを構成する遺伝子型の数である。相関ベクトルの各要素は、既知の遺伝子型の異なるアベレージ動的プロファイルに対する動的プロファイルの相関係数とすることができる。

相関係数は、実際の相関係数である必要はなく、代わりに、２つのセットのデータ、または２つの動的プロファイルの間の差異の程度を表す任意の値であってもよい。そのような統計データには、それだけに限らないが、動的プロファイルとアベレージ動的プロファイルとの間の二乗和誤差、またはアベレージ動的プロファイルと動的プロファイルとの間の相関係数が含まれる。

所与の遺伝子型について、既知の遺伝子型のアベレージ動的プロファイルに対する様々な動的プロファイルの相関係数は、これらがガウス分布に一致しないという点で、正規分布していない場合がある。図６は、３次元空間に配置されたとき、ワルファリンＶＫＯＲＣ１多型についてのトレーニングセット中の相関係数は、正規分布していないが、代わりに１で仕切ることを示す。同様に、図７は、野生型のアベレージ動的プロファイル、ヘテロ接合性突然変異体のアベレージ動的プロファイル、およびホモ接合突然変異体の動的プロファイルに対するワルファリンＶＫＯＲＣ１ＷＴ遺伝子型の一群の動的プロファイルの相関係数の分布を示す。これらのグラフを検査すると、相関係数の分布は、正規分布またはガウス分布に一致しないことを示す。相関係数の正規分布に強制的にするために、図１Ｂにおけるステップ１２８に示すように、ｒをｎ球座標に転換することによって、相関係数の相関ベクトルｒを相関ベクトルｖに変換することができる。相関ベクトルｒは、以下のようにｎ球座標に転換することができる。
相関ベクトル：
長さ：
ｊが１からＮ_ｇ−１に進む場合のｊ番目の角度：
変換型ベクトル：
ｎ球座標は、直交デカルト座標系を参照して点を定義するのではなく、点が、ｎ−球上のその角度、および原点からのその径方向の距離によって代わりに定義される任意の座標系を含む。ｎ球座標の例には、１球座標（一般に、極座標と呼ばれる）、または２球座標（一般に、単に球座標と呼ばれる）が含まれる。一実施形態では、Ｎ_ｇ個の可能な遺伝子型の１つであり得る試料から得られる相関ベクトルをｎ球座標に変換することにより、１つの長さ座標ｌおよびＮ_ｇ−１個の角座標を有する、変換型相関ベクトルがもたらされる。したがって、この実施形態では、相関ベクトルは、ｎ＝Ｎ_ｇ−１であるｎ球座標に変換することができる。

相関ベクトルをｎ球座標に変換することにより、正規分布しており、ガウス分布に確かに一致する、既知の遺伝子型のアベレージ動的プロファイルに対する様々な動的プロファイルの一連の相関係数がもたらされる。図８は、３次元格子上にプロットされたワルファリンＶＫＯＲＣ１クラスにおける３つの可能な遺伝子型のそれぞれについての変換された相関係数を示し、これは、相関係数がおおよそ正規分布していることを示す。同様に、図９は、相関ベクトルが球座標に転換された後の、野生型のアベレージ動的プロファイル、ヘテロ接合性突然変異体のアベレージ動的プロファイル、およびホモ接合突然変異体のアベレージ動的プロファイルに対するワルファリンＶＫＯＲＣ１ＷＴ遺伝子型の動的プロファイルの群の相関係数の分布を示す。これらのグラフを検査すると、相関係数の分布は、釣鐘曲線、すなわち、ガウス分布におおよそ一致することを示す。

図１Ｂに戻って参照すると、本発明の態様では、既知の遺伝子型についての少なくとも２つの相関ベクトルは、既知の遺伝子型についてのパラメータ行列Ｖにコンパイルすることができ、これは、ステップ１３０に示されている。変換型相関ベクトルｖは、既知の遺伝子型についてのパラメータ行列にコンパイルされることが好ましい。好ましくは、既知の遺伝子型についてのすべての相関ベクトルが、既知の遺伝子型についてのパラメータ行列にコンパイルされ、すなわち、特定のｋ番目の遺伝子型のＮ_ｋ個の動的プロファイルが一緒にアベレージされることによって、特定の遺伝子型のアベレージ動的プロファイルが生成され、各動的プロファイルが、これに関連する相関ベクトルを有する場合、パラメータ行列Ｖは、ｎ個の相関ベクトルを含むはずである。これは、以下のように数学的に表現することができる。
式中、Ｖ_ｋは、遺伝子型のクラス内のｋ番目の遺伝子型についてのパラメータ行列であり、Ｎ_ｋは、ｋ番目の遺伝子型のアベレージ動的プロファイルを生成するために一緒にアベレージされるｉ番目の動的プロファイルの数である。この実施形態では、Ｖ_ｋの寸法は、［Ｎ_ｇ×Ｎ_ｋ］である。この実施形態について、各行は、パラメータ（例えば、ｌ、ａ_１、ａ_２など）であり、各列は、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ正規化プロファイルを参照して、既知の遺伝子型の動的プロファイルについての相関ベクトルである。

本発明の別の態様では、図１Ｂ中のステップ１３２において示すように、既知の遺伝子型についてのパラメータ行列Ｖが使用されることによって、既知の遺伝子型についての平均ベクトルμ_ｋが生成される。平均ベクトルμ_ｋの要素は、パラメータ行列Ｖ_ｋの各行のアベレージを含み、すなわち、平均ベクトルの各要素は、遺伝子型のクラス内の同じ、または異なる既知の遺伝子型のアベレージ動的プロファイルに対する、既知の遺伝子型の各動的プロファイルの相関値のアベレージである。ステップ１３４において、パラメータ行列Ｖ_ｋの共分散行列Ｃ_ｋが、既知の遺伝子型について計算される。共分散行列Ｃ_ｋは、要素が以下のように計算される正方行列である。
式中、Ｎ_ｋは、ｋ番目の遺伝子型のアベレージプロファイルを構成するためにコンパイルされる動的プロファイルの数である。この実施形態では、Ｃ_ｋは［Ｎ_ｋ×Ｎ_ｋ］行列である。本発明のこれらの態様では、既知の遺伝子型についての平均ベクトル、既知の遺伝子型についての共分散行列、および既知の遺伝子型についてのアベレージ正規化プロファイルは、既知の遺伝子型についてのトレーニングセット１３６に含まれる。トレーニングセットは、陽性対照遺伝子型の標準陽性対照動的プロファイル１２４をさらに含むことができる。トレーニングセットは、未知の遺伝子型を含有する生体試料が、可能な既知の遺伝子型の１つにマッチする確率および／または信頼度を求めるのに使用することができる。

ｎ球座標への相関ベクトルの変換では、相関ベクトルｒと相関ベクトルｖの間で同じ数のパラメータが保存され、情報損失がまったくない変換をもたらす。図８および９は、そのような変換を例示する。代替の実施形態では、相関ベクトルｒを変換することによって、相関値の分布を正規化する一方でまた、相関ベクトルにおける次元の数を低減することができる。図１０は、面ｘ＋ｙ＋ｚ＝０に投影された後の、野生型のアベレージ動的プロファイル、ヘテロ接合性突然変異体のアベレージ動的プロファイル、およびホモ接合突然変異体の動的プロファイルに対する、ワルファリンＶＫＯＲＣ１ＷＴ、ＨＥ、およびＨＭ遺伝子型の動的プロファイルの一群の相関係数の分布を示す。次元の数を２つに低減することにより、一部の情報は失われる場合があるが、相関係数は、正規分布されるようになる。一実施形態では、この変換は、相関ベクトルｒに変換ベクトルＴを乗じることによって実現することができる。Ｎ_ｇが、可能な突然変異のすべてを構成する遺伝子型の数である場合の相関ベクトルが［Ｎ_ｇ×１］行列である場合、Ｔは、［（Ｎ_ｇ−ｈ）×Ｎ_ｇ］行列とすることができ、式中、ｈは、相関ベクトルの次元の数の低減である。

次いで、変換型相関ベクトルｖは、Ｔに相関ベクトルｒを乗じることによって計算することができる。
ｖ＝Ｔ・ｒ
これは、次元［（Ｎ_ｇ−ｈ）×１］を有する変換型相関ベクトルｖをもたらす。そのような変換型相関ベクトルを含むパラメータ行列Ｖ_ｋは、［（Ｎ_ｇ−ｈ）×Ｎ_ｋ］行列であり、式中、Ｎ_ｋは、トレーニングセット中のｋ番目の遺伝子型の動的プロファイルの合計数である。平均ベクトルμは、［Ｎ_ｇ−ｈ×１］行列であり、共分散行列は［Ｎ_ｇ−ｈ×Ｎ_ｇ−ｈ］行列である。このシナリオは、いくらかの情報損失をもたらす場合があるが、Ｔは、異なる遺伝子型同士間の分離を最大にし、同一の遺伝子型同士間の分離を最小にするために、クラス間散乱とクラス内散乱の比を最大にするように導出することができる。例えば、図１０中のグラフを導出するために、面ｘ＋ｙ＋ｚ＝０上に各ｒを投影する以下の変換行列Ｔを使用することができる。
相関ベクトルをより低い次元に変換することによって、生体試料中の未知の遺伝子型を確信的に同定するのに使用することができる、既知の遺伝子型のアベレージプロファイルを計算するのに必要な動的プロファイルの数を低減することが可能である。

別の態様では、本発明は、生体試料中に存在する未知の核酸の遺伝子型（未知の遺伝子型とも呼ばれる）の同一性を決定する方法を提供する。この態様によれば、未知の遺伝子型は、以下のステップ、すなわち、（ａ）生体試料中に含有される未知の遺伝子型の動的プロファイルを生成するステップと、（ｂ）未知の遺伝子型の動的プロファイルを、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルと相関させることによって、相関ベクトルを生成するステップと、（ｃ）既知の遺伝子型のクラス内の既知の遺伝子型の１つとして未知の遺伝子型を分類するために、相関ベクトルまたはその変換が許容できる範囲内に入るかどうかを判定し、それによって、生体試料中の核酸の遺伝子型の同一性が決定されるステップとを使用して決定される。

一実施形態では、動的プロファイルは、独立変数に対して、未知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含む。したがって、動的プロファイルは、核酸の物理的変化を表すシグナルの測定値から導出される。別の実施形態では、各既知の遺伝子型のアベレージ動的プロファイルは、本明細書に記載されるような独立変数に対して、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルのアベレージ測定値を含む。いくつかの実施形態では、各動的プロファイルは、所定の平均値および標準偏差を有するように正規化される。さらなる実施形態では、相関ベクトルは、未知の遺伝子型の動的プロファイルと既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルとの間の相関係数を含む。いくつかの実施形態では、相関ベクトルの要素は、各要素が正規分布している、同じ数の要素を含むベクトルに変換される。

一実施形態では、既知の遺伝子型のアベレージ動的プロファイルは、上述したように調製されるものなどのトレーニングセットから得られる。別の実施形態では、本方法は、自動化されている。追加の実施形態では、１つまたは複数のステップは、コンピューターを利用して実施される。さらなる実施形態では、本方法は、各既知の遺伝子型のクラス条件付き密度を使用して、既知の遺伝子型のクラス内の既知の遺伝子型のそれぞれについて、未知の遺伝子型が既知の遺伝子型である尤度を計算することをも含む。この実施形態では、クラス条件付き密度は、各遺伝子型についての平均変換型ベクトルおよび共分散行列を使用して計算される。一実施形態では、平均変換型ベクトルおよび共分散行列は、トレーニングセットから得られる各遺伝子型についてのグループ化された変換型ベクトルを含む行列から得られる。別の実施形態では、本方法は、計算された尤度から、生体試料が各既知の遺伝子型を含有する事後確率を計算することをさらに含む。この実施形態では、判定ステップはまた、生体試料がある遺伝子型を含有する事後確率が許容できる閾値内に入るかどうかを判定することによって、未知の遺伝子型が、既知の遺伝子型の１つとして分類されるかどうかを判定する。いくつかの実施形態では、許容できる閾値内に入る事後確率は、例えば、９５％などの既定の閾値より大きい。

別の実施形態では、判定ステップは、未知の遺伝子型を分類するため、すなわち、既知の遺伝子型の１つが、生体試料中に存在する未知の遺伝子型と同一であるかどうかを判定するために、相関ベクトルが許容できる範囲内に入るかどうかを判定することも含む。この実施形態では、許容できる範囲は、動的プロファイル内で、独立変数に対するシグナルの測定値の既定の閾値百分率（例えば９５％）を含むトレーニングセットの共分散行列の固有ベクトルによって画定される楕円体である。別の実施形態では、本方法は、各相関ベクトルをｎ球座標に転換することをさらに含み、ここでｎは、可能な突然変異を構成する遺伝子型の数より１小さい数である。

さらなる実施形態では、本方法は、（ｉ）対照遺伝子型の陽性対照動的プロファイルを生成することであって、陽性対照動的プロファイルは、未知の遺伝子型の動的プロファイルを構成する測定値と並行してとられた、独立変数に対する、対照遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含むことと、（ｉｉ）陽性対照動的プロファイルを、対照遺伝子型の標準陽性対照動的プロファイルと比較することによって、独立変数のシフト値を求めることと、（ｉｉｉ）陽性対照動的プロファイルおよび未知の遺伝子型の動的プロファイルの独立変数を、シフト値によってシフトすることとを含む。適切なシフト値および／またはスケール値は、実験に関連する陽性対照と標準陽性対照の間に最大の相関を生じるものである。この手順により、実験間または実験内の異なる生体試料についての独立変数の感度の変化またはシフトを補正することができる。例えば、異なる時間（異なる実験）において、またはチップまたはウェルに基づくシステムにおける異なる空間的位置から収集される温度の読みのわずかなシフトを、このようにして補正することによって、独立変数における分散を最小限にし、したがって遺伝子型の分類精度を増大させることができる。

別の実施形態では、各動的プロファイルは、同じ既知の遺伝子型の動的プロファイル同士間の分離を最小にしつつ、既知の遺伝子型のクラス内の異なる既知の遺伝子型の動的プロファイル同士間の分離を最大にするように選択された範囲にわたって測定された独立変数に対して、各既知の遺伝子型を含有する各核酸の物理的変化を表すシグナルの測定値を含む。この実施形態は、以下のステップ、すなわち、（ａ）各遺伝子型についての平均ベクトルおよびパラメータ行列を使用して、既知の遺伝子型のクラスについてのクラス内散乱行列を計算するステップと、（ｂ）各遺伝子型についての平均ベクトルおよびパラメータ行列を使用して、既知の遺伝子型のクラスについてのクラス間散乱行列を計算するステップと、（ｃ）クラス内散乱行列の行列式とクラス間散乱行列の行列式との比である分離比を求めるステップと、（ｄ）独立変数についての分離最大化範囲を求めるステップであって、分離最大化範囲は、分離比を最大にするように選択されるステップとを使用して実施することができる。各動的プロファイルは、分離最大化範囲にわたって測定される独立変数に対して、各既知の遺伝子型を含有する各核酸の物理的変化を表すシグナルの測定値を含む。判定ステップは、（ｃ）において定義された分離比を使用して定量化することができる異なる遺伝子型同士間の分離を最大にする、独立変数（ｘ軸）上の境界によって定義される動的曲線の領域を求めることによって実施することができる。異なる遺伝子型同士間の分離の程度の定量化も、これらの動的な曲線を生じるアッセイを設計する科学者にとって重要である。この分離クオンティファイアは、科学者らが、遺伝子型を分類する精度を最大にするための、彼らの新しいアッセイ設計の改善の程度を測定するのに役立つ。

別の実施形態では、未知の遺伝子型の動的プロファイルを分類することは、（１）未知の遺伝子型の動的プロファイルを、全て一緒になって未知の遺伝子型を含有する試料についての相関ベクトルを構成する、可能な遺伝子型のそれぞれのアベレージ正規化プロファイルと相関させることと、（２）変換型ベクトルの各要素が、そのクラスまたは遺伝子型によって正規分布（例えば、ガウス分布）するように、相関ベクトルを別のベクトルに数学的に変換することと、（３）トレーニングセットから得られる各可能な遺伝子型のクラス条件付き密度を使用して、未知の遺伝子型の生体試料に対する各可能な遺伝子型の尤度を計算することと、（４）得られた各可能な遺伝子型についての尤度値から、生体試料が既知の遺伝子型を含有する事後確率を計算することとを含む。一実施形態では、各可能な遺伝子型のアベレージ正規化プロファイルは、既知の遺伝子型の複数の核酸から導出される複数の動的プロファイルのトレーニングセットから得られる。別の実施形態では、動的プロファイルは、所定の平均値および標準偏差を有するように正規化される。さらなる実施形態では、生体試料中の遺伝子型を分類する方法は、本明細書に記載されるように、陽性対照動的プロファイルを使用して、検知される独立変数のシフトおよびスケール変化を補正するステップをさらに含む。

図１１Ａ〜１１Ｂは、本発明の実施形態によって、生体試料中に存在する核酸の遺伝子型の同一性を決定するための方法１１００についての流れ図を例示する。ステップ１１０２において、生体試料中に含有される未知の遺伝子型の動的プロファイルｙ（ｘ）が生成される。動的プロファイルは、本明細書に記載される方法のいずれかによって生成することができる。動的プロファイルは、シグナルの測定値、ｙ（ｔ）を含み、これは、既知の遺伝子型を含有する核酸の物理的変化を表す。シグナルのこれらの測定値は、独立変数、ｘ（ｔ）に対して記録される。これらの測定値は、ステップ１１０４における方法に入力される。動的プロファイルの生成のされ方に応じて、ｙ（ｔ）およびｘ（ｔ）は、異なる物理的な量とすることができる。例えば、動的プロファイルが、インターカレーティング色素を伴った、既知の遺伝子型を含有する核酸の熱融解を通じて生成される場合、ｘ（ｔ）は温度Ｔ（ｔ）であり、ｙ（ｔ）は、蛍光、Ｆ（ｔ）、または温度に対する蛍光の導関数−ｄＦ／ｄＴである。あるいは、動的プロファイルが、酸化還元活性分子を伴った核酸のボルタンメトリーを通じて生成される場合、ｘ（ｔ）は電位Ｖ（ｔ）であり、ｙ（ｔ）は電流Ｉ（ｔ）である。

ステップ１１０４において、対照遺伝子型の関連陽性対照動的プロファイルも、未知の遺伝子型の動的プロファイルが生成されるのと同時に生成される。陽性対照遺伝子型の関連陽性対照動的プロファイルも、動的プロファイルと同じ独立変数に対する同じシグナルの測定値からなるが、測定値は、未知の遺伝子型を含有する試料ではなく、陽性対照試料から取得される。ステップ１１０６において、陽性対照動的プロファイルが、陽性対照試料の測定値から生成される。ステップ１１０８において、陽性対照動的プロファイルは、対照遺伝子型の標準参照動的プロファイルと比較される。これは、独立変数のシフト値Δｘを生成すために行われ、このステップは、トレーニングセットを生成する際に、シフト値Δｘを求めるときに行われたのと同じ様式で実施される。陽性対照遺伝子型の標準参照動的プロファイルは、トレーニングセットが生成されたときに生成された標準参照動的プロファイル１２４とすることができる。

シフト値Δｘならびに倍率αを生成するために、陽性対照プロファイルｙ_ｐ（ｘ）または動的プロファイルにおける独立変数が、シフト値Δｘによってシフトされることによって、シフトされたプロファイルｙ_ｐ’（ｘ）が生成される。
ｙ_ｐ’（ｘ）＝α^＊ｙ_ｐ（ｘ−Δｘ）
次いでシフトされた陽性対照プロファイルｙ_ｐ’（ｘ）のそれぞれは、既知の陽性対照プロファイルｙ_ｒｓ（ｘ）と相関されることによって、相関係数ｒが生成される。ｙ_２（ｘ）に対する動的プロファイルｙ_１（ｘ）の相関係数は、以下のように計算される。
式中、ｎは、動的プロファイルを構成する点の数であり、μ_ｙ１およびμ_ｙ２は、そのプロファイルの平均値であり、σ_ｙ１およびσ_ｙ２は、それぞれの標準偏差である。Δｘおよびαの値は、相関係数ｒが最大化されるように選ぶことができる。図１２は、本発明の一態様によってシフトされる陽性対照動的プロファイルを示す。既知の陽性対照動的プロファイル、すなわち、参照実験からの陽性対照との最大の重なり度を生成するために右にシフトされた、−ｄＦ／ｄＴ対Ｔ曲線である陽性対照動的プロファイル。図１３は、相関係数ｒ対シフト値Δｘのプロットである。図から分かるように、最大相関係数をもたらすシフト値、Δｘ＝０．７℃が選ばれ、陽性対照プロファイルは、その量によってシフトされている。

ステップ１１１０において、未知の遺伝子型の動的プロファイルにおける独立変数は、シフト値Δｘによってシフトされる。未知の遺伝子型の動的プロファイルは、倍率αによってスケール変更することもできる。陽性対照に関連する同じ実験から取得されるすべての動的プロファイルは、同じ量によってシフトし、スケール変更することができ、すなわち、１つを超える未知の遺伝子型の動的プロファイルが１つの実験において生成される場合、ただ１つの陽性対照動的プロファイルが生成される必要があり、ただ１つのシフト値Δｘが求められる必要がある。このシフト手順およびスケール変更手順により、１つの実験から次の実験で独立変数のばらつきが最小にされることによって、結果が、矛盾がなく再現可能であることが確実になる。

ステップ１１１２において、未知の遺伝子型の動的プロファイルは、所定の標準偏差を有するように正規化される。所定の平均値および所定の標準偏差を有するように未知の遺伝子型の動的プロファイルを正規化することも可能である。一実施形態では、未知の遺伝子型の動的プロファイルは、未知の遺伝子型の動的プロファイルが比較されることになる、既知の遺伝子型についての任意のトレーニングセットを生成するのに使用される既知の遺伝子型の動的プロファイルと同じ所定の標準偏差および／または平均値を有するように正規化される。

ステップ１１１４において、動的プロファイルが、遺伝子型１１８のクラス内の各既知の遺伝子型のアベレージ動的プロファイルのそれぞれ１つと相関されることによって、各既知の遺伝子型についての相関値を得る。この相関値は、未知の遺伝子型の動的プロファイルと既知の遺伝子型のアベレージ動的プロファイルとの間の二乗和誤差、未知の遺伝子型の動的プロファイルと既知の遺伝子型のアベレージ動的プロファイルとの間の相関係数、または未知の遺伝子型が、既知の遺伝子型のアベレージ動的プロファイルにおいて表される遺伝子型である事後確率とすることができる。相関係数および二乗和誤差は、トレーニングセットを生成する方法において相関係数および二乗和誤差を計算するのに使用された様式と同一の様式で計算することができる。

数学的に、最大値を生じる、既知の遺伝子型のアベレージ動的プロファイルに対する未知の遺伝子型を含有する動的プロファイルの相関係数は、未知の遺伝子型がその既知の遺伝子型であることを示すはずである。同様に、未知の遺伝子型の動的プロファイルと既知の遺伝子型のアベレージ動的プロファイルとの間で最小のアベレージ二乗和誤差を生じる既知の遺伝子型のアベレージ動的プロファイルは、未知の遺伝子型がその既知の遺伝子型であることを示すはずである。

しかし、統計的に、最大相関係数または最小二乗和誤差は、必ずしも正しい遺伝子型に対応しない場合がある。一実施形態では、未知の遺伝子型を含有する生体試料が、特定の既知の遺伝子型を含有する確率または信頼度を統計的に計算するために、未知の遺伝子型が既知の遺伝子型である事後確率が計算される。最初に、相関ベクトルｒが計算される。一実施形態では、相関ベクトルｒは、未知の遺伝子型の動的プロファイルと、遺伝子型のクラス内のある既知の遺伝子型のアベレージ動的プロファイル１１８のそれぞれとの間の相関係数をその要素中に含む、次元［Ｎ_ｇ×１］を有するベクトルである。あるいは、相関係数は、未知の遺伝子型の動的プロファイルと、遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルとの間のアベレージ二乗和誤差であってもよい。ステップ１１１６において、相関ベクトルｒの要素は、相関ベクトルｒの要素をｎ球座標に転換することによって相関ベクトルｖに転換され、これにより、相関ベクトルの要素は、正規（またはガウス）分布内に入る。

ステップ１１１８において、第１の既知の遺伝子型の動的プロファイルを、第１の既知の遺伝子型のアベレージ正規化動的プロファイルと相関させると、変換型相関ベクトルｖを生成するクラス条件付き確率ｐ（ｇ_ｉ｜ｖ）が計算される。既知の遺伝子型ｇ_ｉが相関ベクトルｖを生成するクラス条件付き確率は、以下の式を使用することによって、その既知の遺伝子型についてのトレーニングセット１１２０中に含まれる平均ベクトルμ_ｉおよび共分散行列Ｃ_ｉから計算することができる。
式中、｜Ｃ_ｉ｜は、共分散行列の行列式であり、Ｎ_ｇは、可能な突然変異のすべてを構成する遺伝子型の数である。

遺伝子型のクラス内の各可能な遺伝子型の出現が、集団において等しくありそうな場合、未知の遺伝子型は、より大きな程度の信頼度を伴った最大のクラス条件付き確率を有する遺伝子型として同定することができる。しかし、一実施形態では、未知の遺伝子型が既知の遺伝子型に対応する事後確率は、図１１Ｂのステップ１１２２に例示されているように計算される。ユーザーは、ステップ１１２４に例示されているように、既知の遺伝子型の頻度Ｐ（ｇ_ｉ）をアルゴリズム中に入力することができ、ベイズの定理を使用することによって、未知の試料が既知の遺伝子型である事後確率ｐ（ｖ｜ｇ_ｉ）を計算することができる。

本発明の一実施形態では、ステップ１１２６に示されているように、遺伝子型について計算された事後確率が所定の閾値値より大きい場合にコールが行われる。本発明の一実施形態では、閾値値は、９５％以上である。事後確率のいずれも閾値値より大きくない場合、コールは行われず、この結果は、ステップ１１２８で出力される。事後確率が閾値値より大きい場合、未知の遺伝子型は、既知の遺伝子型として分類することができる。いくつかの実施形態では、相関ベクトルが許容できる範囲内に入らない場合、未知の遺伝子型が既知の遺伝子型である事後確率が所定の閾値より大きい場合であっても、未知の遺伝子型が既知の遺伝子型として分類される場合はなく、したがって、ステップ１１２８に例示されているように、コールは出力されない。

許容できる範囲を求めるために、既知の遺伝子型の共分散行列の固有ベクトルおよび固有値が計算される。共分散行列の固有ベクトルは、既知の遺伝子型についてのトレーニングセットにおける既知の遺伝子型の各動的プロファイルから生成される、所定の割合の変換型相関ベクトルｖ_ｉを含むはずであるｎ−楕円体（ここでｎは、変換型相関ベクトルｖ中の要素の数である）を画定する。一実施形態では、所定の割合は９８％である。ステップ１１３０において、相関ベクトルｖが許容できる範囲内に入ると判定される場合、ステップ１１３２において、未知の遺伝子型は、最大事後確率を有する既知の遺伝子型として分類される。

上述したように、最大相関係数を生じる既知の遺伝子型のアベレージ動的プロファイルに対する、未知の遺伝子型を含有する動的プロファイルの相関係数は、未知の遺伝子型がその既知の遺伝子型であることを示すことができる。しかし、より確実であるために、いくつかの実施形態では、試料が特定の既知の遺伝子型を含有する事後確率を計算することが好適である。図１４は、ＷＴのアベレージ動的プロファイル、ＨＥのアベレージ動的プロファイル、およびＨＭのアベレージ動的プロファイルに対する、異なる試料から得られた６３の異なる動的プロファイルの相関係数を示す。より濃い範囲は、より大きい相関係数を表し、より薄い範囲は、より小さい相関係数を表す。その一方で、図１５は、対応する事後確率を示し、より濃い範囲は、より大きい事後確率を表し、より薄い範囲は、より小さい事後確率を表す。両図において、円は実際の遺伝子型を表す一方で、エックスは、図１６において最大相関係数、および図１５において最大事後確率を表す。図１４において、動的プロファイルは、３つすべての遺伝子型について、アベレージ動的プロファイルに対して有意な相関を示すことが分かる。しかし、図１５において、事後確率が使用される場合、遺伝子型の判定は、ほぼ１００％確実である。

本発明のさらなる実施形態では、動的プロファイルは、独立変数値の特定の分離最大化範囲内で得られる。一実施形態では、分離最大化範囲は、遺伝子型のクラス内の異なる遺伝子型同士間の分離を定量化することによって求められる。この分離は、クラス間散乱とクラス内散乱の比として定量化することができる。この分離を定量化するために、パラメータ行列Ｖ_ｋが、遺伝子型のクラス内からのＮ_ｇ個の遺伝子型のそれぞれについてのｋ個のトレーニングセットのそれぞれから得られる。遺伝子型のクラスについて、クラス間散乱行列およびクラス内散乱行列を計算してもよい。遺伝子型のクラスについてのクラス内散乱行列は、以下の式を使用して計算することができ、
一方、クラス間散乱行列は、以下の式を使用して計算することができる。
式中、μ_ｉは、ｉ番目のトレーニングセットについての平均ベクトルであり、μは、遺伝子型のクラスについてのトレーニングセットのすべてを構成するすべての動的プロファイルの平均パラメータセットである。次いで分離比ｑは、クラス間散乱行列とクラス内散乱行列の行列式の比を計算することによって求めることができる。

分離最大化範囲は、分離比ｑの最大値が得られるように選ばれる。ｑは、最小値ｘ_ｍｉｍと最大値ｘ_ｍａｘの間の範囲内の独立変数に対するシグナルの測定値のみが含まれる、既知の遺伝子型のクラス内の各既知の遺伝子型の動的プロファイルからトレーニングセットを最初に得ることによって、遺伝子型の特定のクラスについて最大にされる。次いで分離比ｑが計算され、記録される。第３に、多種多様な異なるｘ_ｍｉｍおよびｘ_ｍａｘについて第１および第２のステップが繰り返される。次いで、ｑの最大値をもたらすｘ_ｍｉｍおよびｘ_ｍａｘの値が、独立変数値の分離最大化範囲として選択される。分離最大化範囲内の独立変数値に対するシグナルの測定値が、遺伝子型のそのクラス内の遺伝子型の動的プロファイル、ならびに遺伝子型のそのクラス内の遺伝子型の１つであると推定される未知の遺伝子型の動的プロファイルに含められる。一実施形態では、ｘ_ｍｉｍおよびＸ_ｍａｘの異なる値についてｑを繰り返して計算することによって、ｑが最大になるｘ_ｍｉｎおよびｘ_ｍａｘの値を求め、したがって分離最大化範囲を求めることができる。

図１６は、ワルファリンＶＫＯＲＣ１多型クラスにおける熱融解曲線である動的プロファイルの計算を示す。各正方形は、℃でのＴ_ｍｉｍとＴ_ｍａｘの間の温度ウインドウを表す。正方形の濃淡の濃さは、ｑの対数に比例している。図から分かるように、曲線の分離は、Ｔ_ｍｉｎが７０℃と８０℃の間であり、Ｔ_ｍａｘが８０℃と８５℃の間である場合に一般に最大になる。最適な温度ウインドウは、この図から、７９℃と８２℃の間である。

本発明の他の実施形態が、図１７Ａ〜１７Ｃに例示されている。例えば、図１７Ａ〜１７Ｃは、トレーニングセットを生成する方法１００、および未知の遺伝子型を同定する方法１１００を、どのように組み合わせて、生体試料中に存在する核酸の遺伝子型の同一性を決定するための方法１７００にすることができるかを示す流れ図を例示する。未知の遺伝子型を含有する生体試料からの独立変数に対するシグナルの測定値が生成され、ステップ１１０４に入力される。同様に、各試料に関連する対照遺伝子型のシグナルとともに、独立変数に対して、既知の遺伝子型の複数の試料からのシグナルの測定値が、ステップ１０４において生成される。ステップ１０４において、各試料に関連する対照遺伝子型に対応するシグナルの測定値とともに、独立変数に対する既知の遺伝子型の複数の生体試料からのシグナルの測定値を入力することによって、トレーニングセットが最初に生成される。これらのシグナルは、ステップ１０２において既知の遺伝子型の動的プロファイルを生成するとともに、ステップ１０６において対照遺伝子型の陽性対照動的プロファイルを生成するのに使用される。陽性対照動的プロファイルの独立変数は、ステップ１０８においてシフト値を生成するために、既知の陽性対照動的プロファイルと測定された陽性対照動的プロファイルとの間の相関係数が最大になるようにシフトされる。次いで、既知の遺伝子型の動的プロファイルは、ステップ１１０においてシフト値によってシフトし、ステップ１１２において１の標準偏差および０のアベレージ値を有するように正規化することができる。

次いで、既知の遺伝子型の動的プロファイルは、図１７Ｂに例示されているように、ステップ１１６において、一緒にアベレージされることによって、既知の遺伝子型のアベレージ動的プロファイルを生成することができる。次いで、既知の遺伝子型の各動的プロファイルは、ステップ１２６において、遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルに対して相関されることによって、その要素が、各既知の遺伝子型の各アベレージ動的プロファイルに対する既知の遺伝子型の動的プロファイルの相関係数である、いくつかの相関ベクトルｒを生成することができる。これらの相関ベクトルｒは、ステップ１２８において、ｎ球座標に変換されることによって、既知の遺伝子型のアベレージ動的プロファイルに対する特定の既知の遺伝子型のすべての動的プロファイルについての相関係数が正規分布していることを保証する。このステップにより、いくつかの変換型相関ベクトルｖが生成される。特定の既知の遺伝子型のすべての動的プロファイルについての変換型相関ベクトルは、既知の遺伝子型についてのパラメータ行列Ｖ中に一緒にグループ化することができ、これは、ステップ１３２において平均ベクトルμ、およびステップ１３４において既知の遺伝子型についての共分散行列Ｃを生成するのに使用することができる。

図１７Ａ〜１７Ｃは、遺伝子型が生体試料中に存在するかどうかを判定するための、特定の遺伝子型について生成されたトレーニングセットの使用を例示する。未知の遺伝子型を含有する生体試料の動的プロファイルが、ステップ１１０２において生成される。同時に、陽性対照遺伝子型の陽性対照動的プロファイルが、ステップ１１０６において生成される。陽性対照動的プロファイルの独立変数は、シフト値を生成するために、ステップ１１０８において、既知の陽性対照動的プロファイルと、測定された陽性対照動的プロファイルとの間の相関係数が最大になるようにシフトされる。次いで、未知の遺伝子型の動的プロファイルが、ステップ１１１０において、シフト値によってシフトされ、ステップ１１１２において、１の標準偏差、および０の平均値を有するように正規化される。

次いでステップ１１１４において、未知の遺伝子型の動的プロファイルは、ステップ１１６においてトレーニングセットを生成する方法によって生成された、既知の遺伝子型の１つまたは複数のアベレージ動的プロファイルと相関される。分離最大化範囲がステップ１７０２で入力され、ステップ１１１４において、分離最大化範囲内に入る動的プロファイル内の独立変数値でのシグナルの測定値のみが、やはり分離最大化範囲内にあるアベレージ動的プロファイル中の点と比較される。

好ましくは、未知の遺伝子型の動的プロファイルは、遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルと相関されることによって、相関ベクトルｒが生成される。次いで、ステップ１１１６に示されるように、この相関ベクトルは、相関ベクトルの要素を強制的に正規分布するようにするために、ｎ球座標に変換されることによって、変換型相関ベクトルｖが生成される。ステップ１１１８において、変換型相関ベクトルｖが、ステップ１３２において生成された既知の遺伝子型についての平均ベクトルμ、およびステップ１３４において生成された既知の遺伝子型についての共分散行列Ｃとともに使用されることによって、既知の遺伝子型の動的プロファイルが変換型相関ベクトルｖを生成するクラス条件付き確率ｐ（ｖ｜ｇ_ｉ）が求められる。集団Ｐ（ｇ_ｉ）中の既知の遺伝子型の頻度を、ステップ１１２４で本方法に入力することができ、ステップ１１２２において、集団Ｐ（ｇ_ｉ）中の既知の遺伝子型のクラス条件付き確率ｐ（ｖ｜ｇ_ｉ）および頻度を使用することによって、試料が既知の遺伝子型を含有する事後確率ｐ（ｇ_ｉ｜ｖ）を計算することができる。好適な実施形態では、遺伝子型のクラス内の各既知の遺伝子型についての事後確率は、同様にこのようにして計算される。

一般に、未知の遺伝子型は、最大事後確率を生じる既知の遺伝子型と同一であるが、信頼度内で確実であるために、ステップ１１２６において、最大事後確率を閾値値と比較することができる。いくつかの実施形態では、最大事後確率が閾値値より大きくない場合、未知の遺伝子型は、最大事後確率を生じた既知の遺伝子型として同定することができる。最大事後確率が閾値値より大きい場合、相関ベクトルｖが許容できる範囲内に入るかどうかのコールを行うことができ、これは、ステップ１１３０として示されている。最大事後確率に対応する遺伝子型についての共分散行列Ｃの固有ベクトルに沿って画定されるｎ−楕円体内に入る相関ベクトルは、許容できる範囲に入る。このｎ−楕円体は、最大事後確率に対応する遺伝子型のパラメータ行列Ｖ中にコンパイルされる相関ベクトルの所定の閾値百分率を含むことができる。ステップ１１３２において、変換型相関ベクトルＶがこのｎ−楕円体内に確かに入る場合、未知の遺伝子型は、最大事後確率に対応する遺伝子型として同定することができる。

図１Ａ、１Ｂ、１１Ａ、１１Ｂ、１７Ａ、１７Ｂ、および１７Ｃに示された実施形態の１つまたは複数のステップは、コンピューターを使用して実施することができる。さらに、図１Ａ、１Ｂ、１１Ａ、および１１Ｂに示された実施形態の方法は、動的プロファイルおよび陽性対照プロファイル、ならびに一般集団における遺伝子型のクラス内の各可能な遺伝子型の確率を生成するのに使用される、独立変数に対するシグナルの測定値を入力すること以外に、ユーザーからいずれの入力もすることなく、すべてのステップを実施するのにコンピューターを使用して自動化することができる。本発明の方法は、コンピューターまたは自動設定で実施されるのに最適であり、その理由は、これらが、未知の核酸の遺伝子型を同定するための直接かつ迅速な解決策であり、この解決策は、遺伝子型を同定するための先の計算方法より、ユーザーの介入および計算の必要が著しく少ないためである。さらに、本方法は、１つのパラメータ（例えば、融解温度）からの動的プロファイルによって表される遺伝子型を単に同定しようと試みるのではなく、動的プロファイルの全体的な形状および動態を考慮に入れる。

他の態様によれば、本発明は、少なくとも１つの未知の遺伝子型を含有する生体試料中の遺伝子型を同定するためのシステムも提供する。このシステムは、生成モジュール、相関モジュール、クラス条件付き密度モジュール、事後確率モジュール、および判定モジュールを備える。生成モジュールは、生体試料中に含有される未知の遺伝子型の動的プロファイルを生成することができる。動的プロファイルは、本明細書に記載されるような独立変数に対して、未知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含む。

未知の遺伝子型の動的プロファイルを生成することなど、本発明のいくつかの態様によって使用するのに適したシステムの例が、図１８とともに例示されている。図１８に例示されているように、システム１８００は、マイクロ流体デバイス１８０２を含むことができる。マイクロ流体デバイス１８０２は、１つまたは複数のマイクロ流体チャネル１８０４を含むことができる。示された例では、デバイス１８０２は、２つのマイクロ流体チャネル、すなわち、チャネル１８０４ａおよびチャネル１８０４ｂを含む。２つのチャネルのみが例示的な実施形態において示されているが、デバイス１８０２は、２つより少ない、または２つを超えるチャネルを有することができることが企図されている。例えば、いくつかの実施形態では、デバイス１８０２は、８つのチャネル１８０４を含む。

デバイス１８０２は、２つのＤＮＡ処理ゾーン、すなわち、ＤＮＡ増幅ゾーン１８３１（別名ＰＣＲゾーン１８３１）およびＤＮＡ融解ゾーン１８３２を含むことができる。ＰＣＲゾーン１８３１を通って移動するＤＮＡ試料は、ＰＣＲを受けることができ、融解ゾーン１８３２を通過するＤＮＡ試料は、高解像度熱融解を受けることができる。図１８に例示されているように、ＰＣＲゾーン１８３１は、チャネル１８０４の第１の部分を含み、融解ゾーン１８３２は、チャネル１８０４の第２の部分を含み、これは、第１の部分から下流にある。

デバイス１８０２はまた、シッパー（ｓｉｐｐｅｒ）１８０８を含むことができる。シッパー１８０８は、中空の管の形態であってもよい。シッパー１８０８は、入口１８０９に接続された近位末端を有し、この入口は、シッパー１８０８の近位末端をチャネル１８０４に連結する。デバイス１８０２はまた、入口１８０９に接続された一般的な試薬ウェル１８０６を含むことができる。デバイス１８０２はまた、各チャネル１８０４に対して、遺伝子座特異的試薬ウェル１８０５を含むことができる。例えば、示された実施形態では、デバイス１８０２は、チャネル１８０４ａに接続された遺伝子座特異的試薬ウェル１８０５ａを含み、チャネル１８０４ｂに接続された遺伝子座特異的試薬ウェル１８０５ｂを含むことができる。デバイス１８０２はまた、各チャネル１８０４に対して廃棄物ウェル１８１０を含むことができる。

一般的な試薬ウェル１８０６中に貯蔵される溶液は、ｄＮＴＰ、ポリメラーゼ酵素、塩、緩衝液、表面不動態化試薬、１つまたは複数の非特異的蛍光ＤＮＡ検出分子、流体マーカーなどを含むことができる。遺伝子座特異的試薬ウェル１８０５中に貯蔵される溶液は、ＰＣＲプライマー、配列特異的蛍光性ＤＮＡプローブまたはマーカー、塩、緩衝液、表面不動態化試薬などを含むことができる。

チャネル１８０４中に試料溶液を導入するために、システム１８００は、複数のウェル１８９８を含み、少なくともそのいくつかは、試料溶液（例えば、ＤＮＡ試料を含む溶液）を含むウェルプレート１８９６を含むことができる。示された実施形態では、ウェルプレート１８９６は、位置決めシステム１８９４に接続されており、このシステムは、主制御装置１８３０に接続されている。
１８３０．

主制御装置１８３０は、例えば、Ａｕｓｔｉｎ、ＴＸのＮａｔｉｏｎａｌＩｎｓｔｒｕｍｅｎｔｓＣｏｒｐｏｒａｔｉｏｎから入手可能なＰＸＩ−８１０５制御装置を使用して実装することができる。位置決めシステム１８９４は、ウェルプレート１８９６を位置決めするためのポジショナー（例えば、ＰＡのＰａｒｋｅｒＨａｎｎｉｆｉｎＣｏｒｐｏｒａｔｉｏｎ（「Ｐａｒｋｅｒ」）から入手可能なＭＸ８０ポジショナー）、ポジショナーを駆動するためのステッピングドライブ（例えば、Ｐａｒｋｅｒから入手可能なＥ−ＡＣＭｉｃｒｏｓｔｅｐｐｉｎｇＤｒｉｖｅ）、およびステッピングドライブを制御するための制御装置（例えば、Ｐａｒｋｅｒから入手可能な６Ｋ４制御装置）を含むことができる。

チャネル１８０４中に試料溶液を導入するために、位置決めシステム１８９４が制御されることによって、シッパー１８０８の遠位末端が、ウェル１８９８の１つに貯蔵された試料溶液中に浸されるように、ウェルプレート１８９６が移動する。図１８は、１８０８の遠位末端が、ウェル１８９８ｎ中に貯蔵された試料溶液内に浸されているのを示す。

試料溶液を強制的にシッパーから上昇させ、チャネル１８０４中に移動させるために、真空マニホールド１８１２およびポンプ１８１４を使用することができる。真空マニホールド１８１２は、デバイス１８０２の一部と作動可能に接続することができ、ポンプ１８１４は、マニホールド１８１２と作動可能に接続することができる。ポンプ１８１４が稼動すると、ポンプ１８１４は、圧力差を作り（例えば、ポンプ１８１４は、廃棄物ウェル１８１０から空気を引き出すことができる）、この圧力差が、ウェル１８９８ｎ中に貯蔵された試料溶液を、シッパー１８０８を昇り、入口チャネル１８０９を通って、チャネル１８０４中に流れさせる。さらに、これは、ウェル１８０６および１８０５中の試薬をチャネル中に流れさせる。したがって、ポンプ１８１４は、試料溶液およびリアルタイムＰＣＲ試薬を、チャネル１８０４を通って強制的に流れさせるように機能する。図１８に例示されているように、融解ゾーン１８３２は、ＰＣＲゾーン１８３１から下流に配置されている。したがって、試料溶液は、ＰＣＲゾーンを最初に通り、次いで融解ゾーンを通って流れることになる。

ウェルプレート１８９６に戻って参照すると、ウェルプレート１８９６は、緩衝液ウェル１８９８ａを含むことができる。一実施形態では、緩衝液ウェル１８９８ａは、緩衝液１８９７を保持する。緩衝液１８９７は、従来のリアルタイム（ＲＴ）ＰＣＲ緩衝液などの従来のＰＣＲ緩衝液を含むことができる。従来のＰＣＲ緩衝液は、Ｂｉｏ−ＲａｄＬａｂｏｒａｔｏｒｉｅｓ，Ｉｎｃ．、ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ、ＲｏｃｈｅＤｉａｇｎｏｓｔｉｃｓ、および他の供給業者を含めたいくつかの供給業者から入手可能である。

ＰＣＲゾーン１８３１を通って流れるＤＮＡ試料にＰＣＲを実現するために、当技術分野で周知であるように、試料の温度をサイクルさせなければならない。したがって、いくつかの実施形態では、システム１８００は、温度制御システム１８２０を含む。温度制御システム１８２０は、温度センサー、加熱器／冷却器、および温度制御装置を含むことができる。いくつかの実施形態では、温度制御システム１８２０は、主制御装置１８３０がＰＣＲゾーンおよび融解ゾーンを通って流れる試料の温度を制御することができるように、主制御装置１８３０と連係されている。主制御装置１８３０は、グラフィカルユーザーインターフェースを表示するための表示デバイスに接続することができる。主制御装置１８３０はまた、ユーザー入力デバイス１８３４に接続することができ、これにより、ユーザーが主制御装置１８３０にデータおよびコマンドを入力することが可能になる。

それぞれＰＣＲゾーン１８３１および融解ゾーン１８３２で行われるＰＣＲプロセスおよび融解プロセスをモニターするために、システム１８００は、イメージングシステム１８１８を含むことができる。イメージングシステム１８１８は、励起源、画像取得デバイス、制御装置、および画像記憶ユニットを含むことができる。本発明のいくつかの態様による、適当なシステムの他の態様は、その全体が参照により本明細書に組み込まれている、米国特許出願公開第２００８／０１７６２３０号に開示されている。

システム１８００は、ユーザー入力デバイス１８３４、表示デバイス１８３６、および主制御装置１８３０と連通した適切に制御可能なコンピューターをさらに含む。コンピューターは、多くの情報源、イメージングシステム１８１８、および温度制御システム１８２０の中から情報を受け取り、本発明のいくつかの態様によって、生体試料中の未知の遺伝子型の同定を可能にし、本発明の別の態様により、トレーニングセットの生成を可能にすることによって、遺伝子型のクラス内から、ある既知の遺伝子型を装置に認識させる。

上述したように、本発明のこの態様によるシステムは、生成モジュールを備える。生成モジュールは、生体試料中に含有される未知の遺伝子型の動的プロファイルを生成することができる。動的プロファイルは、独立変数に対して、未知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含む。一実施形態では、生成モジュールは、独立変数に対して、未知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を取得し、この測定値を処理することによって、未知の遺伝子型の動的プロファイルを作成することができる任意のデバイスである。別の実施形態では、生成モジュールは、上述したマイクロ流体デバイスである。

本発明のいくつかの態様によるシステムは、未知の遺伝子型の動的プロファイルをアベレージ動的プロファイルと相関させることができる相関モジュールをさらに備え、このアベレージ動的プロファイルは、既知の遺伝子型のクラス内の各遺伝子型についての既知の遺伝子型の、本明細書に記載されるようなアベレージ正規化動的プロファイルであってもよい。相関モジュールは、その要素が、未知の遺伝子型の動的プロファイルと、既知の遺伝子型のクラス内の各既知の遺伝子型についてのアベレージ正規化動的プロファイルとの間の相関係数を含む相関ベクトルを生成することができる。既知の遺伝子型のアベレージ動的プロファイルのそれぞれは、その遺伝子型についてのトレーニングセット中に含まれる既知の遺伝子型のアベレージ動的プロファイルである。一実施形態では、既知の遺伝子型についてのトレーニングセットは、既知の遺伝子型についての平均変換型ベクトル、および既知の遺伝子型についての共分散行列をさらに含むことができる。別の実施形態では、相関モジュールは、相関ベクトルを変換型ベクトルに変換することもでき、変換型ベクトルの各要素は、正規分布している。一実施形態によれば、相関モジュールは、適切にプログラムされたコンピューター、またはコンピューター判読可能な媒体上に記憶されたソフトウェアを備え、ソフトウェアは、コンピューターによって実行されるとき、ソフトウェアがコンピューターに、未知の遺伝子型の動的プロファイルを、既知の遺伝子型のアベレージ動的プロファイルと相関させることによって、相関ベクトルを生成することを可能するように構成されている。適切にプログラムされたコンピューターまたはソフトウェアは、コンピューターによって実行されるとき、ソフトウェアがコンピューターに、相関ベクトルを変換型ベクトルに変換することを可能にするように構成することもできる。

本発明のいくつかの態様によるシステムは、クラス条件付き密度モジュールをさらに備える。クラス条件付き密度モジュールは、既知の遺伝子型のクラス内の既知の遺伝子型のそれぞれのクラス条件付き密度を使用して、既知の遺伝子型のクラス内の既知の遺伝子型のそれぞれについて、未知の遺伝子型が既知の遺伝子型である尤度を計算することができる。クラス条件付き密度は、各既知の遺伝子型についての平均変換型ベクトルおよび共分散行列を使用して計算することができる。平均変換型ベクトルおよび共分散行列は、トレーニングセットから得られる各既知の遺伝子型についてのグループ化された変換型ベクトルを含む行列から得ることができる。一実施形態によれば、クラス条件付き密度モジュールは、適切にプログラムされたコンピューター、またはコンピューター判読可能な媒体上に記憶されたソフトウェアを備え、ソフトウェアは、コンピューターによって実行されるとき、ソフトウェアがコンピューターに、クラス条件付き密度から尤度を計算することを可能にするように構成される。

さらなる実施形態では、システムは、事後確率モジュールを含む。事後確率モジュールは、クラス条件付き密度モジュールによって計算された尤度から、生体試料が各既知の遺伝子型を含有する事後確率を計算することができる。一実施形態では、事後確率は、計算された尤度およびベイズの定理から計算することができる。一実施形態によれば、事後確率モジュールは、適切にプログラムされたコンピューター、またはコンピューター判読可能な媒体上に記憶されたソフトウェアを備え、ソフトウェアは、コンピューターによって実行されるとき、ソフトウェアがコンピューターに、事後確率を計算することを可能にするように構成される。

システムは、最大事後確率を有する既知の遺伝子型が、許容できる閾値内に入るかどうかを判定することによって、未知の遺伝子型が、最大事後確率を有する遺伝子型として分類されるかどうかを判定し、したがって、これにより未知の遺伝子型を同定することができる判定モジュールをさらに含むことができる。一実施形態では、判定モジュールは、相関ベクトルから得られた変換型ベクトルが、最大事後確率を有する遺伝子型についてのトレーニングセットから求められた範囲内の許容できる範囲内に入るかどうかを判定し、これにより遺伝子型の同定が正しいという信頼度レベルを増大させることもできる。許容できる範囲は、パラメータ行列中に所定の割合の相関ベクトルを含むトレーニングセットの共分散行列の固有ベクトルによって画定されるｎ楕円体とすることができる。一実施形態では、許容できる範囲は、動的プロファイル内の独立変数に対するシグナルの測定値の既定の割合（例えば、９９％）を含むトレーニングセットの共分散行列の固有ベクトルによって画定される楕円体である。一実施形態によれば、判定モジュールは、適切にプログラムされたコンピューター、またはコンピューター判読可能な媒体上に記憶されたソフトウェアを備え、ソフトウェアは、コンピューターによって実行されるとき、ソフトウェアがコンピューターに、未知の遺伝子型の同一性を決定することを可能にするように構成される。適切にプログラムされたコンピューターまたはソフトウェアは、コンピューターによって実行されるとき、ソフトウェアがコンピューターに、変換型ベクトルが、許容できる範囲内に入るかどうかを判定することを可能にするように構成することもできる。

本発明のいくつかの態様では、システムは、エラー補正モジュールをさらに含むことができる。エラー補正モジュールは、陽性対照動的プロファイルを、対照遺伝子型の既知の動的プロファイルと比較することによって、動的プロファイルの独立変数のシフト値を求めることができる。エラー補正モジュールは、未知の遺伝子型の動的プロファイルにおける独立変数を、シフト値によってシフトすることもできる。一実施形態によれば、エラー補正モジュールは、適切にプログラムされたコンピューター、またはコンピューター判読可能な媒体上に記憶されたソフトウェアを備え、ソフトウェアは、コンピューターによって実行されるとき、ソフトウェアがコンピューターに、シフト値を計算し、未知の遺伝子型の動的プロファイルにおける独立変数をシフトすることを可能にするように構成される。

本発明の別の態様では、システムは、トレーニングセットモジュールを含む。トレーニングセットモジュールは、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルを備える。既知の遺伝子型のアベレージ動的プロファイルは、独立変数に対して、各既知の遺伝子型の様々な動的プロファイルのアベレージ測定値を含むことができる。アベレージ動的プロファイルは、本明細書に記載されるような、アベレージ正規化動的プロファイルであってもよい。トレーニングセットモジュールは、パラメータ行列も備える。パラメータ行列の要素は相関ベクトルであり、ここで各相関ベクトルは、動的プロファイルと、既知の遺伝子型のクラス内の各既知の遺伝子型の各アベレージ動的プロファイルとの間の相関係数を含む。さらなる実施形態では、トレーニングセットモジュールは、平均変換型ベクトルを含む。平均変換型ベクトルの要素は、遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルに対する、各既知の遺伝子型の各動的プロファイルの相関係数のアベレージ値である。さらに、トレーニングセットモジュールは、共分散行列を含むことができ、これは、パラメータ行列の共分散行列であってもよい。一実施形態によれば、トレーニングセットモジュールは、適切にプログラムされたコンピューター、またはコンピューター判読可能な媒体上に記憶されたソフトウェアを備え、ソフトウェアは、コンピューターによって実行されるとき、ソフトウェアがコンピューターに、トレーニングセットモジュール内に含まれるデータを得ることを可能にするように構成される。

さらなる実施形態では、システムは、分離最大化範囲選択モジュールも含む。分離最大化範囲選択モジュールは、各遺伝子型についての相関ベクトルの平均ベクトルおよびベクトルを使用して、既知の遺伝子型クラスについてのクラス内散乱行列を計算することができる。さらに、分離最大化範囲選択モジュールは、各既知の遺伝子型についての相関ベクトルの平均ベクトルおよびベクトルを使用して、既知の遺伝子型クラスについてのクラス間散乱行列を計算することができる。分離最大化範囲選択モジュールは、クラス内散乱行列の行列式とクラス間散乱行列の行列式の比である分離比を求め、この分離比を最大にするにするために、分離最大化範囲を選択することもできる。一実施形態によれば、分離最大化範囲選択モジュールは、適切にプログラムされたコンピューター、またはコンピューター判読可能な媒体上に記憶されたソフトウェアを備え、ソフトウェアは、コンピューターによって実行されるとき、ソフトウェアがコンピューターに、独立変数についての分離最大化範囲を求めることを可能にするように構成される。

本発明によるシステムは、転換モジュールをさらに含むことができる。転換モジュールは、相関ベクトルをｎ球座標に転換することができ、ここでｎは、可能な突然変異のすべてを構成する遺伝子型の数より少なくとも１小さい。一実施形態によれば、転換モジュールは、適切にプログラムされたコンピューター、またはコンピューター判読可能な媒体上に記憶されたソフトウェアを備え、ソフトウェアは、コンピューターによって実行されるとき、ソフトウェアがコンピューターに、相関ベクトルをｎ球座標に転換することを可能にするように構成される。

本発明の方法およびシステムは、以下の実施例を参照して理解することができ、これらは、限定的であることを意図されていない。

ワルファリンＶＫＯＲＣ１多型についてのトレーニングセットの生成

ワルファリンＶＫＯＲＣ１多型遺伝子型のそれぞれについて、等しく間隔をあけた温度間隔で蛍光の測定値を含むいくつかの熱融解曲線を、ＲｏｃｈｅＬＣ２８０ライトサイクラーで実行した４０ＰＣＲサイクルの後に、ＬＣＧｒｅｅｎ蛍光色素を使用して、毎秒０．５℃で５０℃から９５℃に高解像度熱融解することによって得た。これらの曲線を図２に示す。Ｓａｖｉｔｓｋｙ−Ｇｏｌａｙ導関数フィルターを適用することによって、生成した曲線のそれぞれについて−ｄＦ／ｄＴを計算し、図３に示す曲線を得た。陽性対照熱融解曲線は、ワルファリンＶＫＯＲＣ１多型遺伝子型のそれぞれの各熱融解曲線とともに、ワルファリンＶＫＯＲＣ１多型の野生型遺伝子型を含有する既知の試料の高解像度熱融解分析によって得た。陽性対照についての蛍光の測定値を、いくつかの実施に対してアベレージすることによって、陽性対照についての参照標準熱融解曲線を生成した。陽性対照熱融解曲線を、選ばれた値Δｘによってシフトすることによって、陽性対照熱融解曲線と参照標準熱融解曲線との間の相関係数を最大にした。ワルファリンＶＫＯＲＣ１多型遺伝子型のそれぞれの各熱融解曲線を、同一の標準偏差（１）および同一の平均値（０）を有するように正規化した。これらの曲線を、より細い線として図５に示す。

ワルファリンＶＫＯＲＣ１多型は、３つの可能な遺伝子型、すなわち、野生型（ＷＴ）、ヘテロ接合性突然変異体（ＨＥ）、およびホモ接合性突然変異体（ＨＭ）を有する。ＷＴ遺伝子型に対応する熱融解曲線のすべてを一緒にアベレージすることによって、ＷＴ遺伝子型についてのアベレージ熱融解曲線を生成した。ＨＥおよびＨＭ遺伝子型についてのアベレージ熱融解曲線を、同様の様式で生成した。ＷＨ、ＨＥ、およびＨＭ遺伝子型についてのこれらのアベレージ熱融解曲線は、濃い、太い線として図５にプロットされている。

ＷＴ遺伝子型を含有する試料から生成した熱融解曲線のそれぞれを、ＷＴ、ＨＥ、およびＨＭ遺伝子型についてのアベレージ熱融解曲線に対して相関させることによって、各熱融解曲線についての３つの相関係数、すなわちｒ_ｗｔ、ｒ_ｓｈ、およびｒ_ｈｍを生成した。これらはそれぞれ、ＷＴ、ＨＥ、およびＨＭ遺伝子型についてのアベレージ熱融解曲線に対する熱融解曲線の相関係数を表す。したがって、各熱融解曲線は、これに関連する相関ベクトルｒを有し、相関ベクトルｒは、
である。

図６は、ＷＴ、ＨＥ、およびＨＭ遺伝子型についての熱融解曲線に関連する相関ベクトルのプロットを示す。このプロットから、相関ベクトルは正規分布していないことが分かる。図１０は、図６と同じ点であるが、ｘ＋ｙ＋ｚ＝０の面に投影された点を示す。この２次元投影では、点は、正規分布している。しかし、相関ベクトルは、２次元の面に投影されたときのみ正規分布するので、この様式では一部の情報が失われる場合がある。したがって、相関ベクトルの正規分布を得るために、熱融解曲線についての相関ベクトルのすべてを、２球座標に転換することによって、ｒ_ｗｔ、ｒ_ｓｈ、およびｒ_ｈｍの値の分布が正規分布である、例えば、これがガウス分布であることを保証する。この変換は、以下の式によって実現することができる。
いくつかの実施形態では、可能な遺伝子型または次元の数であるＮ_ｇが３より大きい場合、この変換は、以下のように、すなわち
およびＮ_ｇが４より大きい他の実施形態について同様に拡張することができる。相関ベクトルを球座標に変換することによって、図８で分かるように、相関ベクトルの正規分布が実現される。同様に、図７は、相関係数自体は、ＷＴクラスについて正規分布していないことを示す棒グラフを示すが、相関ベクトルを球座標に変換することによって、図９に示すように、より正規な分布を実現することができる。

ＷＴ熱融解曲線に関連する変換型相関ベクトルｖは、パラメータ行列Ｖ_ｗｔ中に一緒にグループ化される（水平方向に積み重ねられる）。
式中、ｎ_ｉは、野生型遺伝子型のアベレージ正規化プロファイルを計算するのに使用される動的プロファイルの数である。Ｖ_ｉにおいて、各行は、パラメータ（すなわち、ｌ、ａ_１、またはａ_２）であり、各列は、その特定の遺伝子型についての異なる動的（融解）曲線の観察値である。Ｖ_ｗｔの各行の平均値を計算することによって、平均ベクトルμ_ｗｔを得る。
μ（ｌ）、μ（ａ_１）、およびμ（ａ_２）は、それぞれ、ｌ、ａ_１、ａ_２のアベレージ値である。次いで、Ｖ_ｗｔの共分散行列Ｃ_ｗｔの各要素（ｉ，ｊ）を以下のように計算する。

共分散行列Ｃ_ｗｔ、平均ベクトルμ_ｗｔ、およびＷＴ遺伝子型についてのアベレージ熱融解曲線は、ＷＴ遺伝子型についてのトレーニングセットを構成する。同じステップによって、ＨＥおよびＨＭ、ならびに／または任意の他の可能な遺伝子型について、同様のトレーニングセットを生成する。

遺伝子型同士間の分離の程度の定量化

いくつかの実施形態では、ワルファリンＶＫＯＲＣ１多型における遺伝子型同士間の分離は、分類分析において使用されるデータについての温度ウインドウを選択することによって最大化することができる。この温度ウインドウの境界であるＴ_ｍｉｎおよびＴ_ｍａｘは、以下の式で示すように、クラス間散乱行列の行列式とクラス内散乱行列の行列式との比である分離ファクターｑを最大にするように選ぶ。
クラス内散乱行列は、以下の式によって、ＷＴ、ＨＥ、およびＨＭトレーニングセットから計算することができる。
式中、ｖは、それぞれＶ_ＷＴ、Ｖ_ＨＥ、またはＶ_ＨＭの列または要素である。

クラス間散乱行列は、以下の式から計算することができる。
式中、μは、その要素が、ワルファリンＶＫＯＲＣ１多型についてのトレーニングセットの作成において使用されるすべての熱融解曲線についてのｒ_ｗｔ、ｒ_ｓｈ、およびｒ_ｈｍの平均値であるベクトルであり、Ｎ_ＷＴ、Ｎ_ＨＥ、およびＮ_ＨＭは、そのそれぞれの遺伝子型についてのアベレージプロファイルを構成する測定値の数である。

分離ファクターｑは、異なるＴ_ｍｉｎおよびＴ_ｍａｘを繰り返して選び、新しいクラス間散乱行列およびクラス内散乱行列を計算し、次いで、最大値が見つかるまで、ｑの値を記録することによって最大化する。遺伝子型のワルファリンＶＫＯＲＣ１多型クラスについてのこのプロセスの結果を図１６に示す。図１６は、Ｔ_ｍａｘ対Ｔ_ｍｉｎ対ｌｏｇ（ｑ）のプロットを示す。Ｌｏｇ（ｑ）は、グレースケールで表しており、より濃いグレーは、ｑのより大きい値を表し、一方より薄いグレーは、ｑのより小さい値を表す。この実施例では、ｑの最大値は、Ｔ_ｍｉｎが７９℃であり、Ｔ_ｍａｘが８２℃であったときであることが判明した。

凝固因子ＭＴＨＦＲ６７７多型についてのトレーニングセットの生成

凝固因子ＭＴＨＦＲ６７７多型遺伝子型のそれぞれについて、等しく間隔をあけた温度間隔で蛍光の測定値を含むいくつかの熱融解曲線を、ＲｏｃｈｅＬＣ４８０ライトサイクラーで実行した４０ＰＣＲサイクルの後に、ＬＣＧｒｅｅｎ蛍光色素を使用して、毎秒０．５℃で５０℃から９５℃に高解像度熱融解することによって得た。これらの曲線を図１９に示す。Ｓａｖｉｔｓｋｙ−Ｇｏｌａｙフィルターを適用することによって、生成した曲線のそれぞれについて−ｄＦ／ｄＴを計算し、図２０に示す曲線を得た。曲線を、ワルファリンＶＫＯＲＣ１多型についての熱融解曲線に対して行ったのと同じ様式で温度をシフトし、正規化する。これらのシフトされ、正規化された曲線を図２１に示す。凝固因子ＭＴＨＦＲ６７７多型は、３つの可能な遺伝子型、すなわち野生型（ＷＴ）、ヘテロ接合体（ＦＩＥ）、およびホモ接合（ＨＭ）を有する。これらの遺伝子型についてのアベレージ熱融解曲線は、実施例１で行ったのと同じ様式で生成した。ＷＨ、ＨＥ、およびＨＭ遺伝子型についてのこれらのアベレージ熱融解曲線を、濃い、太い線として図２２にプロットする。

特定の遺伝子型を含有する試料から生成した熱融解曲線のそれぞれを、実施例１と同じ様式で分析することによって、各熱融解曲線についての相関係数、すなわちｒ_ｗｔ、ｒ_ｈｅ、およびｒ_ｈｍを生成した。各熱融解曲線は、これに関連する相関ベクトルｒを有し、ここで相関ベクトルｒは、
である。

図２３は、ＷＴ、ＨＥ、およびＨＭ遺伝子型についての熱融解曲線に関連する相関ベクトルのプロットを示す。このプロットから、相関ベクトルは、やはり正規分布していないことが分かる。図２４は、図２３と同じ点であるが、ｘ＋ｙ＋ｚ＝０の面に投影された点を示す。この２次元投影では、点は正規分布している。しかし、相関ベクトルは、３次元を有するが、２次元面に投影されたときのみ正規分布するので、この様式では一部の情報が失われる場合がある。したがって、相関ベクトルの正規分布を得るために、ワルファリンＶＫＯＲＣ１の実施例で行ったのと同様に、熱融解曲線についての相関ベクトルのすべてを球座標に転換することによって、ｒ_ｗｔ、ｒ_ｓｈ、およびｒ_ｈｍの値の分布が正規分布であることを保証する。

図２５で分かるように、相関ベクトルを球座標に変換することによって、相関ベクトルの正規分布が実現される。ＷＴ熱融解曲線に関連する変換型相関ベクトルｖは、実施例１で行ったように、パラメータ行列Ｖ_ｗｔ中に一緒にグループ化される。やはり、Ｖ_ｗｔの各列の平均値を計算することによって、平均ベクトルμ_ｗｔを得る。Ｖ_ｗｔの共分散行列Ｃ_ｗｔを、実施例１に開示したように計算する。共分散行列Ｃ_ｗｔ、平均ベクトルμ_ｗｔ、およびＷＴ遺伝子型についてのアベレージ熱融解曲線は、ＷＴ遺伝子型についてのトレーニングセットを構成する。同じステップによって、ＨＥおよびＨＭ遺伝子型について、同様のトレーニングセットを生成する。

プローブの融解（より低い温度で）および単位複製配列の融解（より高い温度で）の両方が、凝固因子ＭＴＨＦＲ６７７多型についての熱融解曲線において観察され、これは、図２０において各遺伝子型についての２つのピークの出現によって示されている。本方法は、遺伝子型を同定するために、任意の曲線への熱融解データのフィッティングに依拠せず、遺伝子型を同定するためにパターン整合および統計分析にもっぱら依拠する。したがって、本方法は、動的プロファイルから遺伝子型を同定するための先の方法より万能である。

本発明を記述する脈絡において（特に以下の特許請求の範囲の脈絡において）、用語「ａ」および「ａｎ」および「ｔｈｅ」、ならびに同様の指示対象の使用は、本明細書で別段の指定のない限り、または脈絡によって明らかに矛盾しない限り、単数形および複数形の両方を網羅すると解釈されるべきである。用語「含む（ｃｏｍｐｒｉｓｉｎｇ）」、「有する」、「含む（ｉｎｃｌｕｄｉｎｇ）」、および「含む（ｃｏｎｔａｉｎｉｎｇ）」は、別段の注釈のない限り、制限のない用語（すなわち「含むが、それだけに限らない」）を意味すると解釈されるべきである。本明細書での値の範囲の列挙は、本明細書で別段の指定のない限り、その範囲内に入る各別個の値を個々に参照する簡便な方法として機能を果たすことが単に意図されており、各別個の値は、これが本明細書に個々に列挙されているように、本明細書に組み込まれている。例えば、範囲１０〜１５が開示されている場合、１１、１２、１３、および１４も開示されている。本明細書に記載されるすべての方法は、本明細書で別段の指定のない限り、またはさもなければ、脈絡によって明らかな矛盾のない限り、任意の適当な順序で実施することができる。本明細書に提供される、任意およびすべての例、または例示的な言い回し（例えば、「など」）は、本発明をより良好にはっきりさせることが単に意図されており、別段の主張のない限り、本発明の範囲を限定しない。本明細書中のいかなる言い回しも、本発明を実践するのに本質的であるとして、任意の請求されていない要素を示すものとして解釈されるべきでない。

本発明の方法および組成物は、様々な実施形態の形態に組み込むことができ、そのほんのわずかが本明細書に開示されていると理解されるであろう。こうした実施形態の変形は、前述の説明を読むと当業者に明らかになり得る。本発明者らは、適切な場合、当業者がそのような変形を使用することを予期し、本発明者らは、本発明が、本明細書で具体的に記載した以外の方法で実践されることを意図する。したがって、本発明は、適用法によって認められているように、本明細書に添付した特許請求の範囲に列挙された対象事項のすべての改変および均等物を含む。さらに、そのすべての可能な変形における上述した要素の任意の組合せは、本明細書で別段の指定のない限り、またはさもなれば、脈絡によって明らかに矛盾しない限り、本発明によって包含される。

Claims

生体試料中に存在する核酸の遺伝子型の同一性をコンピューターにより決定する方法であって、
（ａ）生体試料中に含有される未知の遺伝子型の動的プロファイルを生成するステップであって、動的プロファイルは、独立変数に対して、未知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含むステップと、
（ｂ）未知の遺伝子型の動的プロファイルを、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルと相関させることによって、相関ベクトルを生成するステップであって、各既知の遺伝子型のアベレージ動的プロファイルは、独立変数に対して、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルのアベレージ測定値を含み、相関ベクトルは、未知の遺伝子型の動的プロファイルと、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルとの間の相関係数を含むステップと、
（ｃ）相関ベクトルまたはその変換が、許容できる範囲内に入るかどうかを判定することによって、未知の遺伝子型を、既知の遺伝子型のクラス内の既知の遺伝子型の１つとして分類し、それによって生体試料中の核酸の遺伝子型の同一性が決定されるステップと
を含む方法。
既知の遺伝子型のアベレージ動的プロファイルが、トレーニングセットから得られる、請求項１に記載の方法。
独立変数が温度である、請求項１に記載の方法。
物理的変化が核酸の変性である、請求項１に記載の方法。
核酸の変性を表すシグナルが蛍光である、請求項４に記載の方法。
独立変数が電位である、請求項１に記載の方法。
物理的変化が、生体試料中の酸化還元活性分子の酸化である、請求項１に記載の方法。
酸化還元活性分子の酸化を表すシグナルが電流である、請求項７に記載の方法。
１つまたは複数のステップが、コンピューターを利用して実施される、請求項１に記載の方法。
自動化されている、請求項１に記載の方法。
未知の遺伝子型が既知の遺伝子型である事後確率が、相関係数から各既知の遺伝子型について計算される、請求項１に記載の方法。
ステップ（ｃ）が、最大事後確率、および対応する既知の遺伝子型のアベレージ動的プロファイルに対する相関係数が、許容できる既定の閾値内に入るかどうかを判定することによって、未知の遺伝子型を分類することを含む、請求項１１に記載の方法。
前記相関させるステップ（ｂ）が、
（ｉ）各既知の遺伝子型のクラス条件付き密度を使用して、既知の遺伝子型のクラス内の既知の遺伝子型のそれぞれについて、未知の遺伝子型が既知の遺伝子型である尤度を計算することと、
（ｉｉ）計算された尤度から、生体試料が各既知の遺伝子型を含有する事後確率を計算することと
をさらに含む、請求項１１に記載の方法。
事後確率が、ベイズの定理を使用して計算される、請求項１３に記載の方法。
クラス条件付き密度が、各遺伝子型についての平均変換型ベクトルおよび共分散行列を使用して計算される、請求項１３に記載の方法。
平均変換型ベクトルおよび共分散行列が、トレーニングセットから得られる各遺伝子型のグループ化された変換型ベクトルを含む行列から得られる、請求項１５に記載の方法。
相関ベクトルがあるベクトルに変換され、変換型ベクトルの各要素が正規分布している、請求項１３に記載の方法。
変換型ベクトルの要素が、球座標として表現される、請求項１７に記載の方法。
動的プロファイルが、所定の平均値および標準偏差を有するように正規化される、請求項１に記載の方法。
（ｄ）対照遺伝子型の陽性対照動的プロファイルを生成するステップであって、陽性対照動的プロファイルは、未知の遺伝子型の動的プロファイルを構成する測定値と並行してとられた、独立変数に対する、対照遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含むステップと、
（ｅ）陽性対照動的プロファイルを、対照遺伝子型の標準陽性対照動的プロファイルと比較することによって、独立変数のシフト値を求めるステップと、
（ｆ）陽性対照動的プロファイルおよび未知の遺伝子型の動的プロファイルの独立変数をシフト値によってシフトするステップと
をさらに含む、請求項１に記載の方法。
既知の遺伝子型のクラスから、ある既知の遺伝子型を装置に認識させるためのトレーニングセットをコンピューターにより生成する方法であって、
（ａ）既知の遺伝子型のクラス内の各既知の遺伝子型について、同じ遺伝子型の複数の動的プロファイルをグループ化することであって、各動的プロファイルは、独立変数に対して、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含むことと、
（ｂ）動的プロファイルのそれぞれを正規化することと、
（ｃ）同じ遺伝子型の正規化動的プロファイルをアベレージすることによって、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ正規化動的プロファイルを得ることと、
（ｄ）各動的プロファイルを、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ正規化動的プロファイルと相関させることによって、各動的プロファイルについての相関ベクトルを生成することであって、各相関ベクトルは、既知の遺伝子型のクラス内の各既知の遺伝子型の各アベレージ正規化動的プロファイルに対する動的プロファイルについての相関係数を含むことと、
（ｅ）遺伝子型によって一緒にグループ化されたとき、変換型ベクトルの要素のそれぞれが正規分布しているように相関ベクトルを変換することと、
（ｆ）既知の遺伝子型のクラス内の各既知の遺伝子型について１つの行列が存在するように、各変換型ベクトルを変換型ベクトルの行列にコンパイルすることと、
（ｇ）要素が各既知の遺伝子型についてのアベレージ変換型ベクトルを含む、平均変換型ベクトルを生成することであって、変換型ベクトルは、各コンパイルされた行列のアベレージであることと、
（ｈ）コンパイルされた行列のそれぞれの共分散行列を計算することによって、既知の遺伝子型についての共分散行列を計算することと
を含み、
トレーニングセットは、各既知の遺伝子型についてのアベレージ正規化動的プロファイル、各既知の遺伝子型についての平均変換型ベクトル、および各既知の遺伝子型についての共分散行列を含む、方法。
（ｉ）対照遺伝子型の陽性対照動的プロファイルを生成するステップであって、陽性対照動的プロファイルが、未知の遺伝子型の動的プロファイルを構成する測定値と並行してとられた、独立変数に対する、対照遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含むステップと、
（ｉｉ）陽性対照動的プロファイルを、対照遺伝子型の標準陽性対照動的プロファイルと比較することによって、独立変数のシフト値を求めるステップと、
（ｉｉｉ）陽性対照動的プロファイルおよび既知の遺伝子型の動的プロファイルの独立変数を、シフト値によってシフトするステップと
をさらに含む、請求項２１に記載の方法。
陽性対照動的プロファイルおよび既知の遺伝子型の動的プロファイルの独立変数を、スケール値によってスケール変更するステップをさらに含む、請求項２２に記載の方法。
各動的プロファイルが、所定の平均値および標準偏差を有するように正規化される、請求項２１に記載の方法。
各相関ベクトルをｎ球座標に転換するステップをさらに含み、ｎは、既知の遺伝子型のクラス内の既知の遺伝子型の数以下である、請求項２１に記載の方法。
各動的プロファイルが、同じ既知の遺伝子型の動的プロファイル同士間の分離を最小にしつつ、既知の遺伝子型のクラス内の異なる既知の遺伝子型の動的プロファイル同士間の分離を最大にするように選択された範囲にわたって測定された独立変数に対して、各既知の遺伝子型を含有する各核酸の物理的変化を表すシグナルの測定値を含む、請求項２１に記載の方法。
生体試料中に存在する核酸の遺伝子型の同一性をコンピューターにより決定する方法であって、
（ａ）生体試料中に含有される未知の遺伝子型の動的プロファイルを生成するステップであって、動的プロファイルは、独立変数に対して、未知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含むステップと、
（ｂ）未知の遺伝子型の動的プロファイルを、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルと相関させることによって、相関ベクトルを生成するステップであって、各既知の遺伝子型のアベレージ動的プロファイルは、トレーニングセット中に設けられ、独立変数に対して、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルのアベレージ測定値を含み、相関ベクトルは、未知の遺伝子型の動的プロファイルと、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルとの間の相関係数を含むステップと、
（ｃ）各既知の遺伝子型のクラス条件付き密度を使用して、既知の遺伝子型のクラス内の既知の遺伝子型のそれぞれについて、未知の遺伝子型が既知の遺伝子型である尤度を計算するステップであって、クラス条件付き密度は、各遺伝子型についての平均変換型ベクトルおよび共分散行列を使用して計算され、平均変換型ベクトルおよび共分散行列は、トレーニングセットから得られる各遺伝子型についてのグループ化された変換型ベクトルを含む行列から得られるステップと、
（ｄ）計算された尤度から、生体試料が各既知の遺伝子型を含有する事後確率を計算するステップと、
（ｅ）生体試料がある遺伝子型を含有する事後確率が、許容できる閾値内に入るかどうかを判定することによって、未知の遺伝子型が、既知の遺伝子型の１つとして分類されるかどうかを判定し、それによって生体試料中の核酸の遺伝子型の同一性が決定されるステップと
を含む方法。
事後確率がベイズの定理を使用して計算される、請求項２７に記載の方法。
（ｆ）対照遺伝子型の陽性対照動的プロファイルを生成するステップであって、陽性対照動的プロファイルが、未知の遺伝子型の動的プロファイルを構成する測定値と並行してとられた、独立変数に対する、対照遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含むステップと、
（ｇ）陽性対照動的プロファイルを、対照遺伝子型の標準陽性対照動的プロファイルと比較することによって、独立変数のシフト値を求めるステップと、
（ｈ）陽性対照動的プロファイルおよび未知の遺伝子型の動的プロファイルの独立変数を、シフト値によってシフトするステップと
をさらに含む、請求項２７に記載の方法。
各動的プロファイルが、所定の平均値および標準偏差を有するように正規化される、請求項２７に記載の方法。
トレーニングセットが、
（ａ）既知の遺伝子型のクラス内の各既知の遺伝子型について、同じ遺伝子型の複数の動的プロファイルをグループ化することであって、各動的プロファイルは、独立変数に対して、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含むことと、
（ｂ）動的プロファイルのそれぞれを正規化することと、
（ｃ）同じ遺伝子型の正規化動的プロファイルをアベレージすることによって、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ正規化動的プロファイルを得ることと、
（ｄ）各動的プロファイルを、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ正規化動的プロファイルと相関させることによって、各動的プロファイルについての相関ベクトルを生成することであって、各相関ベクトルは、既知の遺伝子型のクラス内の各既知の遺伝子型の各アベレージ正規化動的プロファイルに対する動的プロファイルについての相関係数を含むことと、
（ｅ）遺伝子型によって一緒にグループ化されたとき、変換型ベクトルの要素のそれぞれが正規分布するように相関ベクトルを変換することと、
（ｆ）既知の遺伝子型のクラス内の各既知の遺伝子型について１つの行列が存在するように、各変換型ベクトルを変換型ベクトルの行列にコンパイルすることと、
（ｇ）要素が、各既知の遺伝子型についてのアベレージ変換型ベクトルを含む、平均変換型ベクトルを生成することであって、変換型ベクトルは、各コンパイルされた行列のアベレージであることと、
（ｈ）コンパイルされた行列のそれぞれの共分散行列を計算することによって、既知の遺伝子型についての共分散行列を計算することと
を含む方法によって調製され、
トレーニングセットは、各既知の遺伝子型についてのアベレージ正規化動的プロファイル、各既知の遺伝子型についての平均変換型ベクトル、および各既知の遺伝子型についての共分散行列を含む、請求項２７に記載の方法。
各動的プロファイルが、所定の平均値および標準偏差を有するように正規化される、請求項３１に記載の方法。
トレーニングセットを調製する方法が、
（ｉ）対照遺伝子型の陽性対照動的プロファイルを生成するステップであって、陽性対照動的プロファイルが、未知の遺伝子型の動的プロファイルを構成する測定値と並行してとられた、独立変数に対する、対照遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含むステップと、
（ｉｉ）陽性対照動的プロファイルを、対照遺伝子型の標準陽性対照動的プロファイルと比較することによって、独立変数のシフト値を求めるステップと、
（ｉｉｉ）陽性対照動的プロファイルおよび未知の遺伝子型の動的プロファイルの独立変数を、シフト値によってシフトするステップと
をさらに含む、請求項３１に記載の方法。
陽性対照動的プロファイルおよび未知の遺伝子型の動的プロファイルの独立変数を、スケール値によってスケール変更するステップをさらに含む、請求項３３に記載の方法。
許容できる閾値に入る事後確率が９５％超である、請求項３３に記載の方法。
相関ベクトルが、許容できる範囲内に入るかどうかを判定することによって、既知の遺伝子型の１つが、生体試料中に存在する未知の遺伝子型と同一であるかどうかを判定するステップをさらに含む、請求項３３に記載の方法。
許容できる範囲が、動的プロファイル内の独立変数に対するシグナルの測定値の既定の閾値百分率を含むトレーニングセットの共分散行列の固有ベクトルによって画定される楕円体である、請求項３６に記載の方法。
相関ベクトルの要素が、各要素が正規分布している、同じ数の要素を有するベクトルに変換される、請求項２７に記載の方法。
各相関ベクトルをｎ球座標に転換するステップであって、ｎは、可能な突然変異のすべてを構成する遺伝子型の数より１小さいステップをさらに含む、請求項２７に記載の方法。
各相関ベクトルを相関ベクトルと同じ数の要素を有する、球座標のベクトルに転換するステップをさらに含む、請求項２７に記載の方法。
（ａ）各遺伝子型についての平均変換型ベクトルおよびパラメータ行列を使用して、既知の遺伝子型のクラスについてのクラス内散乱行列を計算するステップと、
（ｂ）各遺伝子型についての平均変換型ベクトルおよびパラメータ行列を使用して、既知の遺伝子型のクラス内についてのクラス間散乱行列を計算するステップと、
（ｃ）クラス内散乱行列の行列式とクラス間散乱行列の行列式との比である分離比を求めるステップと、
（ｄ）独立変数についての分離最大化範囲を求めるステップであって、分離最大化範囲は、分離比を最大にするように選択されるステップと
をさらに含み、
各動的プロファイルは、分離最大化範囲にわたって測定される独立変数に対して、各既知の遺伝子型を含有する各核酸の物理的変化を表すシグナルの測定値を含む、請求項３１に記載の方法。
生体試料中に存在する核酸の遺伝子型の同一性を決定するためのシステムであって、
（ａ）生体試料中に含有される未知の遺伝子型の動的プロファイルを生成することができる生成モジュールであって、動的プロファイルは、独立変数に対して、未知の遺伝子型を含有する核酸の物理的変化を表すシグナルの測定値を含む生成モジュールと、
（ｂ）未知の遺伝子型の動的プロファイルを、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルと相関させることによって、相関ベクトルを生成することができる相関モジュールであって、各既知の遺伝子型のアベレージ動的プロファイルは、トレーニングセット中に設けられ、独立変数に対して、既知の遺伝子型を含有する核酸の物理的変化を表すシグナルのアベレージ測定値を含み、相関ベクトルは、未知の遺伝子型の動的プロファイルと、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルとの間の相関係数を含む相関モジュールと、
（ｃ）既知の遺伝子型のそれぞれのクラス条件付き密度を使用して、既知の遺伝子型のクラス内の既知の遺伝子型のそれぞれについて、未知の遺伝子型が既知の遺伝子型である尤度を計算することができるクラス条件付き密度モジュールであって、クラス条件付き密度は、各既知の遺伝子型についての平均変換型ベクトルおよび共分散行列を使用して計算され、平均変換型ベクトルおよび共分散行列は、トレーニングセットから得られる各遺伝子型についてのグループ化された変換型ベクトルを含む行列から得られるクラス条件付き密度モジュールと、
（ｄ）計算された尤度から、生体試料が各既知の遺伝子型を含有する事後確率を計算することができる事後確率モジュールと、
（ｅ）最大事後確率を有する既知の遺伝子型が、許容できる閾値内に入るかどうかを判定することによって、未知の遺伝子型が、最大事後確率を有する遺伝子型として分類されるかどうかを判定することができる判定モジュールであって、それによって生体試料中の核酸の遺伝子型の同一性が決定される判定モジュールと
を備えるシステム。
事後確率モジュールが、ベイズの定理を使用して事後確率を計算する、請求項４２に記載のシステム。
陽性対照動的プロファイルを、対照遺伝子型の既知の動的プロファイルと比較することによって、独立変数のシフト値を求め、未知の遺伝子型の動的プロファイルにおける独立変数を、シフト値によってシフトすることができるエラー補正モジュールをさらに備える、請求項４２に記載のシステム。
既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイル、およびパラメータ行列を備えるトレーニングセットモジュールをさらに備え、パラメータ行列の要素は相関ベクトルであり、各相関ベクトルは、動的プロファイルと、既知の遺伝子型のクラス内の各既知の遺伝子型の各アベレージ動的プロファイルとの間の相関係数を含む、請求項４２に記載のシステム。
アベレージ動的プロファイルがアベレージ正規化動的プロファイルである、請求項４５に記載のシステム。
平均変換型ベクトルおよび共分散行列をさらに備え、平均変換型ベクトルの要素は、既知の遺伝子型のクラス内の各既知の遺伝子型のアベレージ動的プロファイルに対する、各既知の遺伝子型の各動的プロファイルの相関係数のアベレージ値を含み、既知の遺伝子型についての共分散行列は、パラメータ行列の共分散行列を計算することによって得られる、請求項４５に記載のシステム。
アベレージ動的プロファイルがアベレージ正規化動的プロファイルである、請求項４７に記載のシステム。
相関モジュールが、各相関ベクトルを変換型ベクトルに変換することがさらにでき、変換型ベクトルの各要素は正規分布している、請求項４２に記載のシステム。
判定モジュールが、変換型ベクトルが、最大事後確率を有する遺伝子型についてのトレーニングセットから得られるもののうちで許容できる閾値内に入るかどうかを判定することがさらにできる、請求項４９に記載のシステム。
許容できる範囲が、動的プロファイル内の独立変数に対するシグナルの測定値の既定の閾値百分率を含むトレーニングセットの共分散行列の固有ベクトルによって画定される楕円体である、請求項５０に記載のシステム。
相関ベクトルをｎ球座標に転換することができる転換モジュールをさらに備え、ｎは、可能な突然変異のすべてを構成する遺伝子型の数より１小さい、請求項４２に記載のシステム。
（ａ）各遺伝子型についての平均変換型ベクトルおよびパラメータ行列を使用して、既知の遺伝子型のクラス内散乱行列を計算すること、
（ｂ）各遺伝子型についての平均変換型ベクトルおよびパラメータ行列を使用して、既知の遺伝子型のクラス間散乱行列を計算すること、
（ｃ）クラス内散乱行列の行列式と、クラス間散乱行列の行列式との比である分離比を求めること、
（ｄ）分離比を最大にするように選択される、独立変数についての分離最大化範囲を求めること
が可能である分離最大化範囲選択モジュールをさらに備える、請求項４７に記載のシステム。