JP4786904B2 - 配列変化検出及び発見用の断片化をベースとする方法及びシステム - Google Patents

配列変化検出及び発見用の断片化をベースとする方法及びシステム Download PDF

Info

Publication number
JP4786904B2
JP4786904B2 JP2004557369A JP2004557369A JP4786904B2 JP 4786904 B2 JP4786904 B2 JP 4786904B2 JP 2004557369 A JP2004557369 A JP 2004557369A JP 2004557369 A JP2004557369 A JP 2004557369A JP 4786904 B2 JP4786904 B2 JP 4786904B2
Authority
JP
Japan
Prior art keywords
sequence
nucleic acid
mass
fragment
cleavage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004557369A
Other languages
English (en)
Other versions
JP2006515987A (ja
JP2006515987A5 (ja
Inventor
デン ブーム, ディルク ファン
ボーカー,セバスチャン
Original Assignee
セクエノム,インコーポレイティド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by セクエノム,インコーポレイティド filed Critical セクエノム,インコーポレイティド
Publication of JP2006515987A publication Critical patent/JP2006515987A/ja
Publication of JP2006515987A5 publication Critical patent/JP2006515987A5/ja
Application granted granted Critical
Publication of JP4786904B2 publication Critical patent/JP4786904B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6872Methods for sequencing involving mass spectrometry
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Description

関連出願
2002年11月27日に出願された「Fragmentation-based Methods and Systems for Sequence Variation Detection and Discovery」との表題の米国仮特許出願第60/429,895号に対する優先権の利益を主張する。
2003年4月25日に出願された「Fragmentation-based Methods and Systems for de novo Sequencing」との表題の米国仮特許出願第60/466,006号及び2003年11月26日に出願された「Fragmentation-based Methods and Systems for Sequence Variation Detection and Discovery」との表題の米国出願(代理人事件番号第24736−2073号)も本出願に関連する。
許されるならば、上記の出願及び仮出願の各々の対象を参照により本明細書に全部取り入れる。
背景
すべての生物(例えば、動物、植物、及び微生物)の遺伝子情報は、デオキシリボ核酸(DNA)にコードされている。ヒトにおいて、完全なゲノムは24個の染色体上に位置する約100,000個の遺伝子からなる(The Human Genome, T. Strachan, BIOS Scientific Publishers, 1992)。各遺伝子は、転写及び翻訳を介して発現した後に生細胞内で特定の生物化学機能を果たす特異的なタンパク質をコードする。
遺伝子コードの変化(change)又は変化(variation)は、mRNAの配列又は発現レベルの変化及び潜在的にmRNAによってコードされるタンパク質の変化を生じさせることができる。多型又は変異として知られるこれらの変化は、疾患を生じさせることとなるmRNA又はタンパク質の生物活性に対する有意な悪影響を有することができる。変異には、ヌクレオチド欠失、挿入、置換、又は他の変化(alterations)(すなわち、点変異)が含まれる。
遺伝子多型によって引き起こされる多くの疾患が既知であり、血友病、サラセミア、デュシェンヌ筋ジストロフィ(DMD)、ハンチントン病(HD)、アルツハイマー病、及び嚢胞性繊維症(CF)が含まれる(Human Genome Mutations, D. N. Cooper and M.Krawczak, BIOS Publishers, 1993)。これらのような遺伝子疾患は、特定の遺伝子を形成するデオキシ核酸(DNA)中の単一ヌクレオチドの単一の付加、置換、又は欠失から生じることができる。さらに、遺伝子疾患を生ずる変異した遺伝子に加えて、ある種の先天性異常は、トリソミー21(ダウン症候群)、トリソミー13(パトー症候群)、トリソミー18(エドワーズ症候群)、モノソミーX(ターナー症候群)、及びクラインフェルター症候群(XXY)などの他の性染色体異数性などの染色体異常の結果である。さらに、ある種のDNA配列が個体を糖尿病、動脈硬化症、肥満、種々の自己免疫疾患、及び癌(例えば、大腸癌、乳癌、卵巣癌、肺癌)などの多数の疾患のいずれにもかかりやすくすることができるという、ますます増大している証拠がある。
個体の間における遺伝性変化の原因となる2つ以上の同種個体(例えば、ヒト)のゲノム間の単一ヌクレオチド変化は、「単一ヌクレオチド多型」又は「SNP」と称される。SNPがすべて、疾患を生じさせるわけではない。SNPは、その発生位置及び頻度に依存して、無害のものから致死に至るまで多岐にわたることができる。ある種の多型は、ある個体を疾患にかかりやすくすると考えられ、あるいはある種の疾患の罹患レベルに関係している。アテローム性動脈硬化症、肥満、糖尿病、自己免疫疾患、及び癌は、多型と相関(correlation)を有すると考えられているいくつかのそのような疾患である。さらに、疾患との相関に加え、多型は、疾患を治療するために与えられる治療剤に対する患者の反応の一因となるとも考えられている。例えば、多型は、薬物、照射線療法、及び他の治療形態に反応する患者の能力の一因となると考えられている。
多型を同定することによって、特定の疾患及びそのような疾患に対する潜在的に(potentially)より効果的な治療をより良く理解することができる。実は、患者の同定された多型に基づく個別的な治療の画一的管理は、救命医療行為をもたらすことができる。一度、多型が同定及び単離されれば、特定の多型を有する生成物と相互作用する新規な薬物又は化合物を発見することができる。多型に基づいてウイルス、細菌、プリオン、及び真菌を含む感染性生物の同定を行うこともでき、適切な治療反応を感染された宿主に与えることができる。
約16個のヌクレオチドの配列は統計的根拠に基づけばヒトゲノムサイズにさえ特異であるので、比較的短い核酸配列を用いて高等生物中の正常及び欠損遺伝子を検出し、感染性微生物(例えば、細菌、真菌、原生生物、及び酵母)及びウイルスを検出することができる。DNA配列は、同種内の異なる個体を検出するためのフィンガープリントとして働くことさえできる(Thompson, J. S. and M. W. Thompson, eds., Genetics in Medicine, W. B. Saunders Co., Philadelphia, PA (1991)を参照のこと)。
いくつかのDNA検出方法が用いられる。例えば、核酸配列は、増幅核酸分子の移動を既知の標準物と比較することによってゲル電気泳動により、あるいは同定した配列と相補的であるプローブとのハイブリダイゼーションによって同定される。しかしながら、核酸分子を高感度のレポーター機能(例えば、放射性(32p、35S)、蛍光、又は化学発光)を有するように標識した場合のみ、同定を行うことができる。放射性標識は有害であることができ、それらが生成するシグナルは長期にわたって減衰する。高強度レーザーを用いる場合、非同位体標識(例えば、蛍光)では感度の良さに欠けること及びシグナルのフェーディングの難儀を受ける。さらに、標識、電気泳動、及び続けて検出を行うことは、手間を要し、時間がかかり、かつ、間違いを起こしやすい手順である。電気泳動は、核酸のサイズ又は分子量がゲルマトリクス中の移動と直接に相関することができないので特に間違いを起こしやすい。配列特異的な効果、二次構造、及びゲルマトリクスとの相互作用は、人為的な結果を引き起こすことが知られている。さらに、ゲル電気泳動によって得られる分子量情報は、ゲルマトリクス中の移動などの関連パラメータの間接的測定の結果である。
生体高分子の質量分析による分析方法(Hillenkamp et al. (1991) Anal. Chem. 63:1193A-1202Aを参照のこと)及び生体高分子ラダーの作成及び分析方法(国際公開公報WO96/36732;米国特許第5,792,664号を参照のこと)を含む、生物科学での質量分析の適用が報告されている(Meth. Enzymol., Vol. 193, Mass Spectrometry (McCloskey, ed.; Academic Press, NY 1990); McLaffery et al., Acc. Chem. Res. 27: 297-386 (1994); Chait and Kent, Science 257: 1885-1894 (1992); Siuzdak, Proc. Natl. Acad. Sci., USA 91: 11290-11297 (1994)を参照のこと)。
MALDI−MSは、分析する高分子をマトリクス中に導入することを必要とし、固体(すなわち、結晶)マトリクス中で混合されたポリペプチドに対して及び核酸に対して行なわれてきた。これらの方法では、レーザーを用いてプローブ先端上で結晶化された生体高分子/マトリクス混合物を撃ち、それによって生体高分子の脱離及びイオン化を行う。さらに、MALDI−MSは、マトリクスとして水和水(すなわち、氷)又はグリセロールを用いてポリペプチドに対して行われてきた。水和水をマトリクスとして用いた場合、MALDI−MSを行う前にまずタンパク質を凍結乾燥又は空気乾燥することが必要とした(Berkenkamp et al.(1996) Proc. Natl. Acad. Sci. USA 93: 7003-7007)。この方法における質量の上限は、限定された感度で30kDaと報告された(すなわち、少なくとも10pmolのタンパク質が必要とした)。
SNPsの検出を含む配列情報を得るため、MALDI−TOF質量分析が慣用のサンガー配列決定又は同様のプライマー伸長をベースとした方法と組み合わせて用いられてきた(例えば、米国特許第5,547,835号;第6,194,144号;第6,225,450号;第5,691,141号、及び第6,238,871号; H. Koster et al, Nature Biotechnol, 14: 1123-1128, 1996; WO96/29431;WO98/20166;WO98/12355;米国特許第5,869,242号;WO97/33000;WO98/54571; A. Braun et al., Genomics, 46: 18,1997 ; D. P. Little et al., Nat. Med., 3: 1413,1997 ; L. Haff et al., Genome Res., 7: 378,1997 ; P. Ross et al., Nat. Biotechnol., 16: 1347,1998 ; K. Tang et al., Proc. Natl. Acad. Sci. USA, 96: 10016,1999を参照のこと)。本明細書中ではC、T、A、及びGとも称するDNA中の4つの天然に存在するヌクレオチド塩基であるdC、dT、dA、及びdGの各々はMC=289.2;MT=304.2;MA=313.2;MG=329.2の異なる分子量を有するので(MC、MT、MA、MGは、それぞれ、ヌクレオチド塩基デオキシシチジン、チミジン、デオキシアデノシン、及びデオキシグアノシンのダルトンによる(天然同位体分布下での)平均分子量である)、単一の質量スペクトルで配列全体を読むことが可能である。単一スペクトルを用いて、各塩基位置においてジデオキシヌクレオチドを導入することによって鎖の終結を行う慣用のサンガー配列決定反応の生成物を分析する場合、隣接ピーク間の質量の違いを計算することによって塩基配列を決定することができる。SNPs、対立遺伝子、又は他の配列変化(例えば、挿入、欠失)の検出のため、変異体特異的プライマー伸長を標的核酸分子中の多型SNP又は配列変化部位の直ぐ近くで行う。伸長生成物の質量並びに伸長された生成物及び伸長されていない生成物間の質量の違いは、対立遺伝子、SNP、又は他の配列変化のタイプを示している。
米国特許第5,622,824号は、質量分析検出に基づくDNA配列決定方法を記載している。これを行うために、保護、酵素活性の特異性、又は固定化によって、エキソヌクレアーゼ消化によってDNAを逐次形式で片側だけ分解し、ヌクレオチド又は誘導体を質量分析によって検出する。酵素分解前に、クローニングしたDNA配列の橋渡しをする規則正しい欠失の組を作成することができる。このように、エキソヌクレアーゼ及びDNA/RNAポリメラーゼの組み合わせを用いて、質量修飾ヌクレオチドを導入することができる。これによって、多重処理質量分析検出又はエキソヌクレアーゼ活性の調節のいずれかが可能となり、分解プロセスが同時進行するようになる。
米国特許第5,605,798号及び第5,547,835号は、生物試料中の特定の核酸配列の検出方法を提供する。検出する配列に依存して、該プロセスを例えば診断方法で用いることができる。
MALDI−TOF質量分析をマイクロサテライトなどの遺伝子変化、挿入及び/又は欠失変異、及び単一ヌクレオチド多型(SNPs)の分析に適用するための技術が工業的規模で開発されている。これらの技術を多数の個体試料又はプールした試料のいずれかに適用して、個体集団又は異種腫瘍試料中の対立遺伝子頻度又はSNPs頻度を研究することができる。標的核酸又はプライマーがシリコン又はシリコンコーティング基体などの固体支持体に結合されているチップをベースとした形式で、好ましくはアレイの形態で、分析を行うことができる(例えば、K. Tang et al., Proc. Natl. Acad. Sci. USA, 96: 10016,1999を参照のこと)。一般的に、質量分析、特にMALDIを用いて分析を行う場合、得られるスポットがほぼレーザースポットのサイズであるかそれより小さいように、少量のナノリットル試料体積を基体に充填する。これを行った場合、質量分析結果は定量的であることが見出されている。得られた質量スペクトル中のシグナルの下部領域は、(バックグランドに対して規格化及び修正したときに)濃度と比例する。そのようなチップの調製及び使用方法は、米国特許第6,024,925号,同時係属米国特許出願第08/786,988号,第09/364,774号,第09/371,150号、及び第09/297,575号に記載されている。WO98/20020として公開された米国特許出願第PCT/US97/20195も参照のこと。これらの分析を行うためのチップ及びキットは、セクエノム社(SEQUENOM,INC.)からマス・アレイ(Mass ARRAY)(登録商標)の商標で市販されている。マス・アレイ(登録商標)は、小型化アレイ及びMALDI−TOF(マトリクス支援レーザー脱離イオン化−飛行時間型)質量分析と組み合わせた質量スペクトル分析に依って、迅速に結果を出す。それは、標識のない遺伝変異体と関連するDNAフラグメントサイズの単一塩基変化を正確に区別する。
特に上記のDNAフラグメント由来の核酸配列情報を得るためにMALDIを使用することによって、高速でのシグナルの取得及び固体表面の自動化分析に因ったハイスループットの利点が与えられるが、その用途には制限がある。SNP若しくは変異又は他の配列変化が不明である場合、変異体質量スペクトル又はゲル電気泳動の場合には移動などの他の質量指数を配列変化を含んでいない参照配列のすべての可能な配列変化についてシミュレートしなければならない。次いで、特定の配列変化又は配列変化の組に対応するシミュレーションした各変異体スペクトルを実際の変異体質量スペクトルに対してマッチングを行い、最も起こり得そうな配列変化又は変異体スペクトルを生ずる変化を決定しなければならない。そのような純粋にシミュレーションをベースとした手法は時間がかかる。例えば、1000個の塩基の参照配列が与えらた場合、約9000個の潜在的な単一塩基配列変化が存在する。すべてのそのような潜在的な配列変化について予測されるスペクトルをシミュレートし、それらを実験測定したスペクトルに対してマッチングを行わなければならない。単一の塩基又は配列変化のみではなく複数の塩基変化又は複数の配列変化が存在する場合、問題はさらに悪化する。
したがって、SNP、変異、及び他の配列変化の検出及び発見の精度を向上させる必要性がある。したがって、本明細書での目的の1つは、SNP、変異、及び他の配列変化の検出及び発見の精度を向上させることである。さらに、本明細書での目的の中の1つは、SNP、変異、及び配列変化の検出及び発見のスピードを増すことである。
概要
非常に正確なSNP、変異、及び他の配列変化の検出及び発見用の方法及びシステムを本明細書中に提供する。本明細書での方法及びシステムによって、迅速で正確なSNP、変異、及び配列変化の検出及び発見が可能となる。
分子質量に基づく質量分析及びゲル電気泳動などの技術を用いて、核酸多型及び変異を含む配列変化の検出又は発見方法及びシステムを本明細書中に提供する。該方法及びシステムは、核酸配列変化に基づく種々の情報を提供する。例えば、そのような情報には、遺伝病又は染色体異常の同定;肥満、アテローム性動脈硬化症、又は癌を含むが限定するものではない疾患又は状態に対する素因の同定;病原菌による感染の同定;同一性、遺伝、又は組織適合性に関する情報の提供;病原体(例えば、細菌、ウイルス、及び真菌)の同定;抗生物質又は他の薬物耐性プロファイリングの提供;ハプロタイプの決定;マイクロサテライト配列及びSTR(ショートタンデムリピート)座の分析;対立遺伝子変化及び/又は頻度の決定;細胞のメチル化様式の分析;遺伝子型変化の疫学的分析;及び進化中の遺伝子変化が含まれるが、限定するものではない。
遺伝病、ある種の疾患の素因、癌、及び感染の診断における核酸配列変化の検出又は発見方法を本明細書中に提供する。
特異的開裂による既知の変異、SNPs、若しくは他の種類の配列変化(例えば、挿入、欠失、配列決定におけるエラー)の検出方法又は新たな変異、SNPs、若しくは配列変化の発見方法を提供する。これらの方法では、(i)開裂試薬の配列特異性(例えば、核酸では、単一塩基であるA、G、C、T、若しくはUなどの塩基特異性、又は修飾された単一塩基若しくはヌクレオチドの認識、又は約2〜約20塩基の間の短い非変性及び変性オリゴヌクレオチド配列の認識);又は(ii)標的生物分子の構造;又は(iii)質量分析における衝突誘起解離によるイオン化などの物理的プロセス、又は(iv)それらの組み合わせに基づき、標的生物分子配列中の特定の位置で開裂されたフラグメントが標的生物分子から生じる。全長生物分子ではなくフラグメントの分析では、決定するイオンの質量がより低い質量範囲にシフトして質量分析検出が一般的にはより容易となる。例えば、より小さい質量にシフトすることによって、質量分解、質量精度、及び特にこれらの検出感度が増す。質量分析によって決定される標的生物分子のフラグメントの実際の分子量は、配列情報(例えば、変異の存在及び/又は同一性)を提供する。標的生物分子中の複数の配列変化を検出するのに本明細書中に提供する方法を用いることができる。
フラグメントの分子量パターン、すなわち、標的生物分子から生じたフラグメントの質量シグナルを、参照配列について同じ開裂条件下で生じさせたフラグメントの実際のパターン又はシミュレーションしたパターンと比較する。標的配列中で同定される配列変化(変異、多型)が参照配列中では存在しないことを除き、参照配列は、通常、標的配列に対応する。例えば、生物分子が核酸である場合、参照核酸配列は野生型対立遺伝子に由来することができるのに対し、標的核酸配列は変異体対立遺伝子に由来することができる。別の例として、参照核酸配列はヒトゲノム由来の配列であることができるのに対し、標的核酸配列は病原体などの感染性生物由来の配列であることができる。次いで、標的配列及び参照配列間の質量シグナルの違いを分析して、標的生物分子配列中に存在する可能性が最も高い配列変化を決定する。標的配列及び参照配列間の質量シグナルの違いは、絶対的であることができるし(すなわち、一方の配列の断片化シグナルには存在するが、他方には存在しない質量シグナル)、あるいは限定するものではないがシグナルのピーク強度(高さ、面積、シグナル対ノイズ、又はそれらの組み合わせ)の違いなど相対的であることができる。
本明細書中に提供する方法を用いて、参照配列と相対的な2000個以下及び2000個の塩基より大きい核酸配列を配列変化の存在についてスクリーニングすることができる。さらに、配列変化は、塩基コーリングエラーの発生の減少に因って高い精度で検出され、5%未満の対立遺伝子頻度を通常有する、アミノ酸変化を生じさせる遺伝子コード領域中のSNPsなどの「本物の」SNPsの検出に特に有用であることが証明される(例えば、L. Kruglyak et al., Nat. Genet., 27: 234, 2001を参照のこと).
本明細書中に提供する方法では、標的核酸配列の特異的開裂によって得られるフラグメントと同じ条件下で参照核酸配列の実際の又はシミュレーションした特異的開裂によって得られるフラグメントとの間の質量シグナルの違い(標的核酸フラグメントスペクトル中の「追加」又は「消失」質量シグナル)を同定し、これらの違いに対応するフラグメントの質量を決定する。違いの組には、標的断片化パターンにおける「消失」又は「追加」シグナルに加えて、標的及び参照配列間の異なる強度のシグナル又はシグナル対ノイズ比が含ませることができる。一度、標的配列及び参照配列間の違いに対応するフラグメント(「異なる」フラグメント)の質量が決定されれば、質量が各異なるフラグメントの実際の測定質量とは十分に小さい質量の違いより小さいかそれと等しい値だけ異なる1つ以上の核酸塩基組成物(コンポマー)が同定される。これらのコンポマーをウィットネス・コンポマーと呼ぶ。この十分に小さい質量の違いの値は、限定するものではないが、異なるフラグメントの質量、質量がタイプ又は長さで単一ヌクレオチドだけ異なるフラグメント間のピーク分離、質量分光計の絶対分解能などのパラメータによって決定される。4つの核酸塩基(RNAでは、A、G、C、若しくはU、又はそれらの修飾物)の1つ以上に特異的な開裂反応を用いて、十分に小さい質量の違いより小さいかそれと等しい値だけ各異なるフラグメントの測定質量と近いか等しい特異的に開裂された各フラグメントについての可能なウィットネス・コンポマーを含むデータの組を作成することができる。
次いで、各異なるフラグメントについて作成されたウィットネス・コンポマーを用いて、標的核酸配列中のSNPs又は他の配列変化(例えば、挿入、欠失、置換)の存在を決定することができる。
異なるフラグメントに対応する可能なウィットネス・コンポマーを手動で分析して、コンポマーに対応する配列変化を得ることができる。別の態様では、異なるフラグメントの可能なウィットネス・コンポマーから標的配列変化を再構築するための数学的アルゴリズムを提供する。第1の工程では、同じ開裂条件下で他方と相対的な標的核酸又は参照核酸開裂反応のいずれかで生じる各異なるフラグメントの実際の質量とは十分に小さい質量の違いより小さいかそれと等しい値だけ質量が異なるすべての可能なコンポマーを同定する。これらのコンポマーを「コンポマー・ウィットネス」と呼ぶ。次いで、アルゴリズムにより、同定されるコンポマー・ウィットネスを生ずるであろうすべての配列変化が決定される。アルゴリズムにより、変異、多型、又は生物間の配列変化、挿入、欠失、及び置換を含むが限定するものではない他の配列変化を多くともk個含む、参照配列と相対的な標的配列のそれらの配列変化が構築される。配列変化の位数であるkの値は、限定するものではないが参照配列及び標的配列間の配列変化の予測されるタイプ及び数を含むパラメータの数に依存し、例えば、配列変化が単一塩基であるか複数塩基であるか、あるいは参照配列と相対的な配列変化が標的配列上の1つの位置で存在するか2つ以上の位置で存在するかに依存する。例えば、SNPsの検出では、kの値は、必ずしもではないが通常は1又は2である。変異の検出及び再配列決定では、kの値は、必ずしもではないが通常は3以上である。参照配列と相対的な標的配列中に含まれる可能な配列変化を表す配列を配列変化候補と呼ぶ。標的配列中に検出される可能な配列変化は、通常、特異的開裂によって各配列変化に対応するウィットネス・コンポマーが生ずる配列変化すべての合計である。
計算処理した各出力配列変化候補についてシミュレーションしたスペクトルを生じるための第2のアルゴリズムを用いる。各配列変化候補についてのシミュレーションしたスペクトルを標的核酸配列についての実際のスペクトルに対してスコア付けするための第3の(スコア付け)アルゴリズムを用いる。次いで、スコアの値(スコアが高いほど、マッチングは良好であり、最も高いスコアは、通常、存在する可能性が最も高い配列変化である)を用いて、実際の標的核酸配列に対応する配列変化候補を決定することができる。配列変化候補の出力は、特異的開裂反応で異なるフラグメントを生ずる参照配列と相対的な標的配列のすべての配列変化を含む。互いに相互作用しない標的配列中の配列変化では、すなわち、各配列変化が特異的開裂反応で(参照配列と相対的な標的配列の)区別される異なるフラグメントを生ずるのに標的配列に沿った配列変化間の分離(距離)が十分である場合、参照配列と相対的な標的配列の断片化パターンの違いは参照配列と相対的な標的配列中のすべての配列変化の合計を表す。
複数の標的配列を同じ参照配列に対して分析する場合、アルゴリズムは、同じ配列変化候補に対応するそれらの標的配列のスコアを合わせることができる。したがって、実際の配列変化を表す配列変化候補の全スコアを決定することができる。この実施態様は、例えばSNP発見に特に有用である。
配列変化候補出力は、標的配列中の追加の配列変化を検出するための反復プロセスでさらに用いることができる。例えば、標的配列中の2つ以上の配列変化の反復検出プロセスでは、最も高いスコアを有する配列変化を実際の配列変化として受け取り、この配列変化に対応するシグナル又はピークを参照フラグメントスペクトルに加えて、アップデートした参照フラグメントスペクトルを作成する。次いで、残りのすべての配列変化候補をこのアップデートした参照フラグメントスペクトルに対してスコア付けし、次に最も高いスコアを有する配列変化候補を出力する。この第2の配列変化候補も、標的配列中の第2の実際の配列変化を表すことができる。したがって、これらの第2の配列変化に対応するピークを参照フラグメントスペクトルに加えて、第2のアップデートした参照スペクトルを作成することができ、該参照スペクトルに対する第3の配列変化をスコアに従って検出することができる。標的配列中の実際の配列変化を表す配列変化候補が同定されなくなるまで、この反復プロセスを繰り返すことができる。
一実施態様では、1つ以上の特異的開裂試薬を用いて、野生型及び変異体対立遺伝子の混合物を含有する試料中の標的核酸分子の混合物をフラグメントに開裂する工程;1つ以上の同じ開裂試薬を用いて、野生型対立遺伝子を含む核酸分子をフラグメントにする開裂を行うかシミュレーションする工程;フラグメントの質量を決定する工程;野生型核酸分子と相対的な標的核酸分子の混合物中の配列変化を表す標的核酸分子及び野生型核酸分子間のフラグメントの違いを同定する工程;コンポマー・ウィットネスである異なるフラグメントを決定する工程;各コンポマー・ウィットネスに対応する配列変化位数kの有界コンポマーの組を決定する工程;有界各コンポマーについて、候補対立遺伝子である対立遺伝子変異体を決定する工程;候補対立遺伝子をスコア付けする工程;及び試料中の変異体対立遺伝子の対立遺伝子頻度を決定する工程による、試料中の対立遺伝子頻度の決定方法を本明細書中に提供する。
他の実施態様では、本明細書中に提供する方法は、生物試料中の核酸混合物中における標的核酸中の配列変化の検出に用いることができる。生物試料には、個体のプール由来のDNA、又は単一の組織型若しくは細胞型に由来する均一な腫瘍試料、又は2つ以上の組織型若しくは細胞型を含有する不均一腫瘍試料、又は一次腫瘍に由来する細胞系が含まれるが、限定するものではない。同じ遺伝子中に2つの変異が検出されるハプロタイピング法などの方法も企図する。
他の実施態様では、各標的核酸及び1つ以上の参照核酸を1つ以上の開裂試薬を用いて同じ開裂反応で断片化することにより、複数の標的核酸を単一の反応測定で多重処理する(multiplexed)ことができる。これらの方法は、1つ以上の参照核酸と相対的な1つ以上の標的核酸の間の断片化パターンの違いを1つ以上の特異的開裂試薬を用いて同時に分析する場合に特に有用である。
一実施態様では、本明細書中に提供する方法によって生じたフラグメントを参照配列と相対的な配列変化の存在について分析し、より大きい標的核酸の配列を与えるように分析されるフラグメント配列を順序付ける。単一の特異的開裂反応又は相補的な特異的開裂反応を用いて、同じ標的生物分子配列の代替フラグメントが得られるよう、部分的又は全体的な開裂によってフラグメントを生じさせることができる。開裂部位を同定できる限り、開裂手段は酵素的、化学的、物理的、又はそれらの組み合わせであることができる。
標的核酸は、一本鎖DNA、二本鎖DNA、cDNA、一本鎖RNA、二本鎖RNA、DNA/RNAハイブリッド、PNA(ペプチド核酸)、及びDNA/RNAモザイク核酸の中から選択することができる。標的核酸を生物試料から直接単離することができ、あるいは生物試料由来の核酸配列を増幅又はクローニングすることによって得ることができる。ポリメラーゼ連鎖反応(PCR)、逆転写に続いて行うポリメラーゼ連鎖反応(RT−PCR)、鎖置換増幅(SDA)、ローリングサークル増幅、及び転写をベースとしたプロセスによって増幅を行うことができる。
断片化の前に、開裂特異性が変わるように核酸、タンパク質、及びペプチドなどの標的生物分子を処理することができる。
一実施態様では、修飾したヌクレオシド三リン酸を用いて標的核酸を増幅する。修飾により、開裂試薬による標的核酸配列の開裂特異性が与されるかあるいは変わり、質量シグナル分離を増すことによって断片化スペクトルの分解能が向上する。修飾ヌクレオシド三リン酸は、同位体に富む(13C/15Nなど)又は同位体が枯渇したヌクレオチド、質量修飾デオキシヌクレオシド三リン酸、質量修飾ジデオキシヌクレオシド三リン酸、及び質量修飾リボヌクレオシド三リン酸の中から選択することができる。質量修飾三リン酸は、塩基、糖、及び/又はリン酸部分上で修飾することができ、酵素による工程によって、化学的に、あるいは双方の組み合わせによって導入される。一態様では、修飾には、ヒドロキシル基以外の2’置換基が含まれる。別の態様では、ヌクレオシド間の結合、例えば、ホスホロチオエート結合又はアルキル化剤とさらに反応させたホスホロチオエート結合を修飾することができる。さらに別の態様では、修飾ヌクレオシド三リン酸をメチル基、例えば、5−メチルシトシン又は5−メチルウリジンで修飾することができる。
別の実施態様では、天然に存在するが標的核酸の通常の前駆体ではないヌクレオシド三リン酸を用いて標的核酸を増幅する。例えば、通常のDNA前駆体ヌクレオチド(例えば、dCTP、dATP、及びdGTP)及びdUTPの存在下でDNAを増幅することよって、通常はDNA中に存在しないウリジン三リン酸を増幅するDNA分子中に導入することができる。増幅生成物をウラシル−DNAグリコシラーゼ(UDG)で処理した場合、ウラシル残基が開裂する。UDG反応からの生成物を続いて化学又は酵素処理することにより、リン酸骨格が開裂し、核酸塩基特異的フラグメントが生ずる。さらに、グリコシラーゼ処理の前に増幅生成物の相補鎖を分離することによって、相補的な断片化パターンを生じさせることが可能となる。したがって、dUTP及びウラシルDNAグリコシラーゼを使用することによって、相補鎖用のT特異的フラグメントを生じさせることが可能となり、所与の配列内のT及びA位置に関する情報が提供される。同様に、両方の(相補)鎖に対するC特異的反応(すなわち、C特異的グリコシラーゼによる)により、両方の増幅鎖の断片化パターンを別々に分析する場合には、所与の配列内のC及びG位置に関する情報が与えられるであろう。グリコシラーゼ法及び質量分析法を用いれば、A、C、G、及びT特異的断片化パターンのすべての系を分析することができる。特定の化学物質でDNAを処理することにより、該塩基が特定のDNAグリコシラーゼによって認識されるように存在する塩基を修飾するいくつかの方法が存在する。例えば、メチルニトロソ尿素などのアルキル化剤でDNAを処理することにより、アルキルプリンDNA−グリコシラーゼによって認識及び開裂されるN3−メチルアデニン及びN3−メチルグアニンを含むいくつかのアルキル化塩基が生ずる。重亜硫酸ナトリウムでDNAを処理することにより、DNA中のシトシン残基の脱アミノ化が引き起こされてDNA中のウラシル残基を形成させることができ、該ウラシル残基はウラシルN−グリコシラーゼ(ウラシルDNA−グリコシラーゼとしても知られる)によって開裂させることができる。化学試薬によっても、グアニンをその酸化形態である8−ヒドロキシグアニンに変換することもでき、該8−ヒドロキシグアニンはホルムアミドピリミジンDNA N−グリコシラーゼ(FPGタンパク質)によって開裂させることができる(Chung et al., "Anendonuclease activity of Escherichia coli that specifically removes 8-hydroxyguanine residues from DNA," Mutation Research 254: 1-12 (1991))。
別の実施態様では、ゲノムDNAの重亜硫酸塩処理を利用して、DNA内のメチル化シトシン残基の位置を分析することができる。核酸を重亜硫酸塩で処理することにより、メチル化シトシンを未修飾としたまま、シトシン残基を脱アミノ化してウラシル残基にすることができる。したがって、本明細書中に提供する方法において、重亜硫酸塩で処理しない標的核酸の配列の開裂パターンを重亜硫酸塩で処理した標的核酸の配列の開裂パターンと比較することにより、核酸中のメチル化の程度及びシトシンがメチル化された位置を推定することができる。
本明細書中に提供する方法は、核酸の断片化に依存する又は該断片化を含む任意の配列決定方法又は検出方法に適用可能である。後でさらに論じる通り、ポリヌクレオチドの断片化は当該技術分野で既知であり、多くの方法で行うことができる。例えば、DNA、RNA、DNA、及びRNAのアナログ、又はそれらの組み合わせからなるポリヌクレオチドは、物理的、化学的、酵素的に断片化することができる。フラグメントはそのサイズが種々異なることができ、好適な核酸フラグメントは典型的には約2000個未満のヌクレオチドである。好適な核酸フラグメントは、限定するものではないが約1000個未満の塩基、約100〜約500個の間の塩基、又は約25〜約200個の塩基を含むいくつかのサイズ範囲に属することができる。ある態様では、約1個のヌクレオチドのフラグメントが特異的開裂によって得られたフラグメントの組に存在していてもよい。
核酸のフラグメンテーショは、鎖終結用ヌクレオチドの存在下における鎖伸長に依存した配列決定方法と組み合わせることもできる。これらの方法には、サンガー配列決定に基づく配列決定方法、及び鎖伸長工程に依存し、かつ、該工程を含むプライマーオリゴ塩基伸長などの検出方法(例えば、米国特許出願第6,043,031号;許容されるならば米国特許出願第6,258,538号;及び第6,235,478号を参照のこと)が含まれるが、限定するものではない。
塩基特異的に終結されるフラグメントを核酸から生じる1つの方法は、適切な量の標的核酸を適切な量の特定のエンドヌクレアーゼと接触させ、それによって標的核酸を部分又は完全消化することによって行う。エンドヌクレアーゼは、反応を行って完了した場合でさえ、典型的には配列を約50〜70個以下のヌクレオチドの片に分解する。一実施態様では、核酸はリボ核酸であり、エンドヌクレアーゼはG特異的RNaseT1、A特異的RNaseU2、A/U特異的RNasePhyM、U/C特異的RNaseA、C特異的ニワトリ肝臓RNase(RNaseCL3)、又はクサビチン(cusavitin)の中から選択されるリボヌクレアーゼ(RNase)である。他の実施態様では、核酸はデオキシリボ核酸(DNA)であり、開裂試薬はDNAse又はグリコシラーゼである。別の実施態様では、エンドヌクレアーゼは、標的核酸内に含まれる少なくとも1つの部位を開裂する制限酵素である。塩基特異的に終結されるフラグメントを生ずる別の方法には、例えば、鎖終結用ヌクレオチドに対して比較的低い親和性である適切な量の第1のDNAポリメラーゼを用いて標的を数関数的に増幅し、かつ、鎖終結用ヌクレオチドに対して比較的高い親和性を有するポリメラーゼを用いて重合を塩基特異的に終結させる、増幅及び塩基特異的終結反応の組み合わせを行うことが含まれる。
開裂及び未開裂標的配列フラグメントの質量は、限定するものではないが、質量分析、及びゲル電気泳動、好ましくはMALDI/TOFを含む当該技術分野で既知である方法を用いて決定することができる。ハイスループット質量分析の分析を行うためのチップ及びキットは、セクエノム社(SEQUENOM, INC)からマス・アレイ(Mass Array)(登録商標)の商標で市販されている。マス・アレイ(登録商標)系を用いて、塩基特異的断片化によって発見され位置づけられるSNPs及び他の変異を高速かつ高精度で分析することができる。
本明細書中に提供する方法は、シグナルをスクリーニングして標的核酸内の本物の配列変化を表す可能性が高いシグナルのみを選択するアルゴリズムを用いることにより、標的核酸のプライマー伸長ではなく塩基特異的断片化によって生じたフラグメントシグナルの同定の精度及び明瞭性の向上とこれらのシグナルの分析スピードの増加を併せ持つ。
本明細書中に提供する方法は、複数のゲノム(種)又は複数の個体由来の核酸混合物を含有する試料又は組織若しくは細胞の混合物に由来する腫瘍試料などの生物試料中の配列変化を分析するようにさらに適合させることができる。そのような「試料混合物」は、通常、非常に低い頻度で標的核酸を含む配列変化又は変異又は多型を大過剰の野生型配列とともに含有する。例えば、腫瘍では、腫瘍を引き起こす変異が、通常、2つ以上の組織型又は細胞型の不均一混合物である腫瘍試料中に存在する核酸の5〜10%未満存在する。同様に、個体の集団では、例えば、疾患状態又は疾患の素因を決定付ける機能的因果関係を有するほとんどの多型は5%未満の低い対立遺伝子頻度で発生する。本明細書中に提供する方法は、約5〜10%未満の範囲で存在する低い頻度の変異、配列変化、対立遺伝子、又は多型を検出するように適合させることができる。
本明細書中に提供する方法は、配列決定エラーを検出するように適合させることもできる。例えば、本明細書中に提供する方法で用いる参照核酸の実際の配列が(例えば、公表されたデータベースで)報告された配列とは異なる場合、本明細書中に提供する方法は、報告された配列中の配列変化を検出することによって報告された配列中のエラーを検出する。
本明細書の方法によって、任意のサイズ、具体的には約4000nt未満の範囲、より典型的には約100〜約1000ntの範囲でのオリゴヌクレオチドの配列決定が可能となる。
標的核酸中の変異(挿入、欠失、置換)及び多型の検出又は発見のための構成要素を含むキットも提供する。キットは、本明細書中に記載される試薬及び任意選択により反応を行うのに必要とされる任意の他の試薬を含む。そのような試薬及び組成物は、当業者に既知である標準のパッケージング中にパッケージングされる。追加のバイアル、容器、ぺピット、シリンジ、及び他の配列決定用製品も含ませることができる。反応を行うための指示書を含ませることができる。
本明細書中に提供する方法は、参照タンパク質又はペプチド配列と相対的な標的タンパク質又はペプチド配列中の配列変化を決定するように適合させることができる。化学開裂、酵素開裂、及びイオン化による断片化を含むいくつかの技術を用いて、タンパク質を特異的開裂によって断片化することができる。次いで、参照タンパク質又はペプチドと相対的な標的タンパク質又はペプチドの断片化スペクトル中の消失又は追加シグナルに対応する断片化の違いを同定する。本明細書中に記載の通り、一度、異なるフラグメントの質量が決定されれば、質量が各異なるフラグメントの実際の測定質量とは十分に小さい質量の違いより小さいかそれと等しい値だけ異なる1つ以上のアミノ酸組成物(コンポマー)が同定される。これらのコンポマーは、標的タンパク質又はペプチドについてのウィットネス・コンポマーであろう。20個のアミノ酸のうちの1個以上又は配列モチーフに特徴的な1つ以上の構造的特徴に特異的な開裂反応を用いて、十分に小さい質量の違いより小さいかそれと等しい値だけ各異なるフラグメントの測定質量に近いかそれと等しい各々の特異的に開裂されたフラグメントについての可能なウィットネス・コンポマーを含むデータのセットを作成することができる。
次いで、参照配列と相対的な標的タンパク質又はペプチド配列の各異なるフラグメントについての可能なウィットネス・コンポマーを用いて、標的タンパク質又はペプチド配列中のSNPs又は他の配列変化(例えば、挿入、欠失、置換)の存在を決定することができる。
その他の特徴及び利点は、以下の詳細な説明及び特許請求の範囲から明らかであろう。
詳細な説明
A.定義
B.フラグメントの生成方法
C.多型、変異、及び配列変化の発見技術
D.適用
E.システム及びソフトウェア方法
F.実施例
A.定義
別に定義しない限り、本明細書中で用いる技術及び科学用語はすべて、本発明が属する当業者によって一般的に理解されるものと同じ意味を有する。本明細書中の開示全体にわたって言及される特許、特許出願、公開された出願、及び公表物、遺伝子バンク配列、ウエブサイト、並びに他の公表された資料はすべて、注記しない限り、参照により本明細書に全部取り入れる。本明細書中の用語について複数の定義がある場合には、本セクションの用語が優先する。URL又は他のそのような識別子若しくはアドレスを参照する場合、識別子は変わることができ、かつ、インターネット上の特定の情報が現れては消えることができるが、インターネットを検索することによって等価な情報を見出すことができると理解する。それらの参照は、そのような情報の有用性及び公衆への普及を立証するものである。
本明細書中で用いられる通り、分子とは、任意の分子的実体をいい、ペプチド、タンパク質、有機化合物、オリゴヌクレオチド、又はペプチド、有機物、核酸、及び他の高分子の単量体単位などの生体高分子、生物分子、高分子、又はそれらの成分若しくは前駆体を含むが、限定するものではない。単量体単位とは、得られる化合物を作っている構成物の1つをいう。したがって、単量体単位には、ヌクレオチド、アミノ酸、及びファルマコフォアが含まれ、これらから小さな有機分子が合成される。
本明細書中で用いられる通り、生物分子は天然に存在する任意の分子又はその誘導体である。生物分子には、限定するものではないが細胞、組織、プリオン、動物、植物、ウイルス、細菌、プリオン、及び他の生物を含む生物及びウイルスから単離することができる生体高分子、高分子、及びすべての分子が含まれる。生物分子には、オリゴヌクレオチド、オリゴヌクレオシド、タンパク質、ペプチド、アミノ酸、脂質、ステロイド、ペプチド核酸(PNA)、オリゴ糖及び単糖、酵素補助因子などの有機分子、ヘム、鉄硫黄クラスター、ポリフィリンなどの金属複合体及びそれらの金属複合体、銅、モリブデン、亜鉛などの金属なども含まれるが、限定するものではない。
本明細書中で用いられる通り、高分子とは、数千から数百万の分子量を有する任意の分子をいう。高分子には、ペプチド、タンパク質、ヌクレオチド、核酸、炭水化物、及び一般的には生物によって合成されるが合成によりあるいは分子生物学的組換え方法を用いて調製することができる他のそのような分子が含まれるが、限定するものではない。
本明細書中で用いられる通り、生体高分子とは、結合又は高分子によって結合された2以上の単量体サブユニット又はその誘導体からなる高分子を含む生物分子をいう。生体高分子は、例えば、ポリヌクレオチド、ポリペプチド、炭水化物、若しくは脂質、又はそれらの誘導体若しくは組み合わせであることができ、例えば、ペプチド核酸部分又は糖タンパク質を含む核酸分子である。
本明細書中で用いられる通り、「核酸」とは、デオキシリボ核酸(DNA)及びリボ核酸(RNA)などのポリヌクレオチドをいう。該用語には、等価物、誘導体、変異体、及びヌクレオチドアナログで作られたRNA又はDNAのいずれかのアナログとして、一本鎖(センス又はアンチセンス)及び二本鎖ポリヌクレオチドも含まれると理解しなければならない。デオキシリボヌクレオチドには、デオキシアデノシン、デオキシシチジン、デオキシグアノシン、及びデオキシチミジンが含まれる。RNAでは、ウラシル塩基はウリジンである。「ポリヌクレオチド」を核酸と称することは、一本鎖又は二本鎖分子を含む、共有結合で結合された2個以上のヌクレオチド又はヌクレオチドアナログを意味するために最も広い意味で用いられる。「オリゴヌクレオチド」との用語は、共有結合で結合された2個以上のヌクレオチド又はヌクレオチドアナログを意味するために本明細書中で用いるが、PCRプライマーなどのオリゴヌクレオチドは一般的に長さが約15〜100個未満のヌクレオチドであると当業者は認識している。「増幅」との用語は、核酸に関して用いる場合、特異的又は非特異的手段の使用によってDNA配列又はRNA配列を繰り返しコピーして、コピーすることが意図された特定のDNA又はRNA配列の量を増加させることを意味する。
本明細書中で用いられる通り、「ヌクレオチド」には、天然に存在するヌクレオシド一リン酸、二リン酸、及び三リン酸;デオキシアデノシン一リン酸、二リン酸、及び三リン酸、及びデオキシアデノシン三リン酸;デオキシグアノシン一リン酸、二リン酸、及び三リン酸;デオキシチミジン一リン酸、二リン酸、及び三リン酸;並びにデオキシシチジン一リン酸、二リン酸、及び三リン酸(本明細書中ではそれぞれ、dA、dG、dT、及びdC又はA、G、T、及びCとも称する)が含まれるが、限定するものではない。ヌクレオチドには、デアザプリンヌクレオチド、例えば、7−デアザ−デオキシグアノシン(7−デアザ−dG)及び7−デアザ−デオキシアデノシン(7−デアザ−dA)一リン酸、二リン酸、及び三リン酸、重水素−デオキシチミジン(重水素−dT)一リン酸、二リン酸、及び三リン酸、メチル化ヌクレオチド、例えば、5−メチルデオキシシチジン三リン酸、l3C/l5N標識ヌクレオチド、並びにデオキシイノシン一リン酸、二リン酸、及び三リン酸などの修飾ヌクレオチド及びヌクレオチドアナログも含まれるが、限定するものではない。官能基及び結合位置の種々の組み合わせを用いて、修飾ヌクレオチド、同位体に富むヌクレオチド、同位体が枯渇したヌクレオチド、又は同位体標識ヌクレオチド、及びヌクレオチドアナログを得ることができることは当業者には明らかである。
本明細書中で用いられる通り、「鎖伸長用ヌクレオチド」との句は、当該技術分野で認識される意味に従って用いられる。例えば、DNAでは、鎖伸長用ヌクレオチドには、2’デオキシリボヌクレオチド(例えば、dATP、dCTP、dGTP、及びdTTP)が含まれ、鎖終結用ヌクレオチドには、2’,3’−ジデオキシリボヌクレオチド(例えば、ddATP、ddCTP、ddGTP、ddTTP)が含まれる。RNAでは、鎖伸長用ヌクレオチドには、リボヌクレオチド(例えば、ATP、CTP、GTP、及びUTP)が含まれ、鎖終結用ヌクレオチドには、3’−デオキシリボヌクレオチド(例えば、3’dA、3’dC、3’dG、及び3’dU)及び2’,3’−ジデオキシリボヌクレオチド(例えば、ddATP、ddCTP、ddGTP、ddTTP)が含まれる。鎖伸長用ヌクレオチドの完全な組とは、DNAではdATP、dCTP、dGTP、及びdTTPをいい、RNAではATP、CTP、GTP、及びUTPをいう。「ヌクレオチド」との用語も当該技術分野で周知である。
本明細書中で用いられる通り、「ヌクレオチドターミネーター」又は「鎖終結用ヌクレオチド」との用語とは、DNA又はRNA鋳型が配列決定される又は複製される本明細書中の手順中に核酸ポリマー(鎖)伸長を終結させるヌクレオチドアナログをいう。標準の鎖終結用ヌクレオチド、すなわち、ヌクレオチドターミネーターには、2’,3’−ジデオキシヌクレオチド(本明細書中でジデオキシヌクレオチドターミネーターとも称するddATP、ddGTP、ddCTP、及びddTTP)が含まれる。本明細書中で用いられる通り、ジデオキシヌクレオチドターミネーターにはアナログも含まれる。標準のジデオキシヌクレオチドターミネーター、例えば、5−ブロモ−ジデオキシウリジン、5−メチル−ジデオキシシチジン、及びジデオキシイノシンは、それぞれ、ddTTP、ddCTP、及びddGTPのアナログである。
本明細書中で用いられる「ポリペプチド」との用語は、修飾ペプチド結合であることができるペプチド結合によって結合された少なくとも2個のアミノ酸又は質量修飾アミノ酸を含むアミノ酸誘導体を意味する。ポリペプチドは、コード配列の少なくとも一部分であるヌクレオチド配列から翻訳することができ、あるいは例えばコード枠以外の読み枠中にあることに因ってあるいはイントロン配列、3’若しくは5’非翻訳配列、又はプロモーターなどの調節配列であることに因って天然では翻訳されないヌクレオチド配列から翻訳することができる。ポリペプチドは化学合成することもでき、翻訳又は化学合成後に化学的又は酵素的方法によって修飾することができる。「タンパク質」、「ポリペプチド」、及び「ペプチド」との用語は、翻訳される核酸、例えば、遺伝子産物に言及する場合に本明細書中で互換可能に用いられる。
本明細書中で用いられる通り、生体高分子などの生物分子のフラグメントを全体より小さい部分にすることができる。フラグメントは、1個から全部に満たない構成物を含むことができる。典型的には、フラグメントは開裂された場合に複数の異なるサイズを有し、ほとんどが構成モノマーなどの構成物を2つより多く含むこととなる。
本明細書中で用いられる通り、「標的核酸のフラグメント」との用語は、標的核酸の物理的、化学的、又は酵素的な特異的開裂によって生成した開裂フラグメントをいう。本明細書中で用いられる通り、特異的開裂によって得られるフラグメントとは、開裂試薬の塩基/配列特異性(例えば、A、G、C、T、若しくはU、又は修飾塩基若しくはヌクレオチドの認識);又は標的核酸の構造;又は質量分析における衝突誘起解離によるイオン化などの物理的プロセス;又はそれらの組み合わせに基づいた標的核酸配列中の特異的位置で開裂されたフラグメントをいう。フラグメントは、1個から全部に満たない標的核酸分子の構成ヌクレオチドを含むことができる。そのような開裂から得られるフラグメントの収集物は、種々の異なるサイズのオリゴヌクレオチド及びヌクレオチドを含む。フラグメントはサイズが種々異なり、好適な核酸フラグメントは典型的には約2000個未満のヌクレオチドである。好適な核酸フラグメントは、限定するものではないが約1000個未満の塩基、約100〜約500個の間の塩基、又は約25〜約200個の塩基を含む、いくつかのサイズ範囲に属することができる。ある態様では、約1個のヌクレオチドのフラグメントが特異的開裂によって得られたフラグメントの組に存在してもよい。
本明細書中で用いられる通り、標的核酸とは試料中の任意の対象核酸をいう。これには1個以上のヌクレオチドが含まれる。標的ヌクレオチド配列とは標的核酸分子中のヌクレオチドの特定の配列をいう。そのような配列の検出又は同定によって標的が検出され、特定の変異、配列変化、又は多型の存在又は不存在を示すことができる。同様に、本明細書中で用いられる標的ポリペプチドとは、例えばポリペプチドの少なくとも一部分のアミノ酸配列を決定するために、あるいは例えば1つ以上のエンドペプチターゼによるポリペプチドの処理によって生成される標的ポリペプチドのペプチドフラグメントパターンを決定するために、質量分析を用いることによって質量が分析される任意の対象ポリペプチドをいう。「標的ポリペプチド」との用語は、本明細書中で開示される目的のために、例えば、多型又は変異の存在を同定するために質量分析が施される任意の対象ポリペプチドをいう。標的ポリペプチドは、少なくとも2個のアミノ酸、一般的には少なくとも3個又は4個のアミノ酸、特に少なくとも5個のアミノ酸を含む。標的ポリペプチドは、特定の疾患又は状態と関連することができるタンパク質又はタンパク質の一部分をコードするヌクレオチド配列によってコードされていることができる。標的ポリペプチドは、通常は翻訳されるポリペプチドをコードしていないヌクレオチド配列によってコードされていることもできる。標的ポリペプチドは、例えば、(例えば染色体のテロメア領域中の)染色体核酸、例えば遺伝子のコード領域又は非コード領域に存在することができるジヌクレオチドリピート又はヌクレオチドリピートなどの配列からコードされていることができる。本明細書中で用いられる「標的配列」との句は、標的核酸配列又は標的ポリペプチド若しくはタンパク質配列のいずれかをいう。
本明細書で開示されるプロセスは、標的ポリペプチドのペプチドフラグメントの質量分析による分析によって標的ポリペプチドを同定するための手段も提供する。本明細書中で用いられる通り、「標的ポリペプチドのペプチドフラグメント」との用語は、ポリペプチドの特異的な化学又は酵素分解によって生成される開裂フラグメントをいう。化学的及び酵素的開裂は配列特異的な様式で起こるので、標的ポリペプチドのそのようなペプチドフラグメントの生成はポリペプチドの一次アミノ酸配列によって定義される。例えば、固体支持体に固定化することができるポリペプチドをメチオニン残基ポリペプチドを開裂する臭化シアンなどの化学的剤と接触させることにより、あるいは高pHでAsp−Glyペプチド結合を開裂することができるヒドロキシルアミンと接触させることにより、あるいはLys又はArg残基でポリペプチドを開裂するトリプシンなどのエンドペプチターゼと接触させることにより、標的ポリペプチドのペプチドフラグメントを生成することができる。
標的ポリペプチドの同一性は、参照又は既知ポリペプチドのものと分子質量又は配列を比較することによって決定することができる。例えば、標的及び既知ポリペプチドの質量スペクトルを比較することができる。
本明細書中で用いられる通り、「対応する又は既知のポリペプチド又は核酸」との用語は、例えば、標的ポリペプチド又は核酸が対応する既知のポリペプチド又は核酸の対立遺伝子の変異体であるかを決定するために対照として一般的に用いられる既知のポリペプチド又は核酸である。対応する既知のタンパク質又は核酸は、標的ポリペプチドと実質的に同じアミノ酸又は塩基配列を有することができるか、実質的に異なることができると認識しなければならない。例えば、標的ポリペプチドが対応する既知のタンパク質と単一のアミノ酸の違いだけ異なる対立遺伝子変異体である場合、ポリペプチドのアミノ酸配列は単一のアミノ酸違いを除いて同じであることができる。核酸中の変異が標的ポリペプチド変化をコードする場合、例えば、コード核酸の読み枠が停止コドンを導入又は欠失している場合、標的ポリペプチドの配列は対応する既知のポリペプチドの配列と実質的に異なることができる。
本明細書中で用いられる通り、参照生物分子とは、必ずしもではないが、一般的には、標的生物分子と比較される生物分子をいう。したがって、例えば、参照核酸は、参照核酸と相対的な標的核酸中の潜在的なあるいは実際の配列変化を同定するために標的核酸と比較される核酸である。参照核酸は、典型的には、既知の配列又は決定することができる配列である。
本明細書中で用いられる通り、参照ポリペプチドは、ポリペプチドの配列決定を伴わない方法でポリペプチドを同定するために標的ポリペプチドと比較されるポリペプチドである。参照ポリペプチドは、典型的には、既知のポリペプチドである。本明細書中で用いられる参照配列とは、参照核酸又は参照ポリペプチド若しくはタンパク質配列をいう。
本明細書中で用いられる通り、転写をベースとしたプロセスには、「in vitro転写系」が含まれる。RNAポリメラーゼ並びにRNAポリメラーゼを特異的に結合するプロモーターに操作可能に結合されたDNA分子の転写に必要な他の因子及び試薬を含有する無細胞系をいう。in vitro転写系は、細胞抽出物、例えば、真核細胞抽出物であることができる。本明細書中で用いられる「転写」との用語は、RNA分子の生成がDNA鋳型に基づいて開始し、伸長し、及び終結するプロセスを一般的に意味する。さらに、当該技術分野で周知である「逆転写」のプロセスとは、本明細書中で用いられる「転写」との用語の意味の範囲内に包含されるとみなす。転写は、DNA依存性又はRNA依存性RNAポリメラーゼによって触媒される重合反応である。RNAポリメラーゼの例には、細菌RNAポリメラーゼ、SP6RNAポリメラーゼ、T3RNAポリメラーゼ、T3RNAポリメラーゼ、及びT7RNAポリメラーゼが含まれる。
本明細書中で用いられる通り、「翻訳」との用語は、ポリペプチドの生成がRNA鋳型に基づいて開始し、伸長し、終結するプロセスを表す。DNAから生成されるポリペプチドについては、DNAがRNAに転写されなければならず、次いで種々の細胞の成分との相互作用に因ってRNAがポリペプチドに翻訳されなければならない。原核細胞では、転写及び翻訳は「連動し」、DNAからRNAが転写されている際中にRNAがポリペプチドに翻訳されることを意味する。植物及び動物細胞を含む真核細胞では、DNAは細胞核中でRNAに転写され、次いでRNAはmRNAにプロセシングされ、該mRNAは細胞質に輸送され、該細胞質でポリペプチドに翻訳される。
DNA及びRNAを含む核酸に関して本明細書中で用いられる「単離された」との用語は、通常は天然状態の核酸と関連する他の高分子から実質的に分離している核酸分子をいう。単離された核酸分子は、通常は細胞中の細胞材料と関連する細胞材料から実質的に分離しているか、場合に応じては細菌又はウイルス材料から実質的に分離しているか、組換えDNA技術によって生成される場合には培地から実質的に分離しているか、あるいは核酸が化学合成される場合には化学前駆体又は他の化学物質から実質的に分離していることができる。一般的に、単離された核酸分子は、その天然状態に関して少なくとも約50%富んでおり(、一般的に約70%〜約80%富んでおり、特に約90%又は95%以上富んでいる。好ましくは、単離された核酸は、核酸を含む試料の少なくとも約50%を構成し、試料中の材料の少なくとも約70%又は80%であることができ、特に試料の少なくとも約90%〜95%以上であることができる。単離された核酸は、天然には存在しない、したがって、天然状態で見出されない核酸分子であることができる。
「単離された」との用語は、本明細書中では、通常は天然状態のポリペプチドと関連した他の高分子から実質的に分離しているポリペプチドをいうのにも用いられる。単離されたポリペプチドは、それが「単離された」核酸について先に定義したものと同程度に天然で関連する材料に関して富んでいるかポリペプチドを含有する試料分画を構成すること、すなわち、それがその天然状態に関して少なくとも約50%富んでいるかポリペプチドを含有する試料の少なくとも約50%を構成することに基づいて、同定することができる。単離されたポリペプチドは、例えば、ポリペプチドを通常発現する細胞から精製することができ、あるいは組換えDNA方法論を用いて生成することができる。
本明細書中で用いられる通り、核酸の「構造」には、非ワトソン−クリック塩基対に起因する二次構造(例えば、Seela, F. and A. Kehne (1987) Biochemistry, 26, 2232-2238を参照のこと)、並びに塩基対が形成された塩基及び塩基対が形成されないかミスマッチである塩基の組み合わせによって核酸中で形成されたヘアピン、ループ、及びバブルなどの構造が含まれるが、限定するものではない。
本明細書中で用いられる通り、後成的変化とは、天然の塩基(A、G、C、T/U)又は20個の天然アミノ酸の同一性の変化に依存しない、参照配列と相対的な標的配列(例えば、野生型配列と相対的な変異体配列)中の変化いう。そのような変化には、例えば、標的核酸配列及び参照核酸配列間の修飾塩基又はメチル化塩基の存在の違いが含まれるが、限定するものではない。後成的変化とは、遺伝機能における有糸分裂及び/又は減数分裂による遺伝性変化又は核酸配列中の変化によっては説明することができないより高次の核酸構造の変化をいう。後成的変化又は変化を受ける系の例には、動物でのDNAメチル化パターン、ヒストン修飾、及びポリコーム−トリソラックス群(Pc−G/tx)タンパク質複合体が含まれるが、限定するものではない。後成的変化は、必ずしもではないが通常は遺伝性である遺伝子発現の変化を必ずしもではないが通常もたらす。
本明細書中で用いられる通り、「プライマー」とは、ハイブリダイゼーション、鎖伸長、増幅、及び配列決定に好適なオリゴヌクレオチドをいう。同様に、プローブはハイブリダイゼーションに用いられるプライマーである。プライマーとは、十分に低い質量、典型的には約5個及び200個の間のヌクレオチド、一般的には約70個又は70個未満のヌクレオチドであり、かつ、本明細書中に提供する増幅方法並びに検出及び配列決定方法を好都合に用いるのに十分なサイズである核酸をいう。これらのプライマーには、安定的な二重鎖を形成するのに十分な数のヌクレオチド、典型的には約6〜30個のヌクレオチド、約10〜25個のヌクレオチド及び/又は約12〜20個のヌクレオチドを必要とする核酸の検出及び配列決定用のプライマーが含まれるが、限定するものではない。したがって、本明細書での目的のために、プライマーは、プライマーの配列及び用途に依存して、典型的には約6〜70個のヌクレオチド、12〜70個のヌクレオチド、又は約14個以上から上限約70個のヌクレオチドを含む、任意の好適な長さのヌクレオチド含量の配列である。
本明細書中で用いられる通り、質量分析への言及は、当業者に既知である任意の好適な質量分析の形式を包含する。そのような型式には、マトリクス支援レーザー脱離/イオン化−飛行時間型(MALDI−TOF)、エレクトロスプレー(ES)、IR−MALDI(例えば、公開された国際PCT出願第99/57318号、及び米国特許第5,118,937号を参照のこと)、イオンサイクロ(登録商標)トロン共鳴(ICR)、フーリエ変換、及びそれらの組み合わせが含まれるが、限定するものではない。MALDI、特にUV及びIRは、好ましい形式の中の1つである。
本明細書中で用いられる通り、質量スペクトルとは、生体高分子又はそのフラグメントの質量分析による分析から図式的にあるいは数値的にコードされる得られたデータの提示をいう。
本明細書中で用いられる通り、質量スペクトル又は質量分析による分析に関するパターン又は断片化パターン又は断片化スペクトルとは、シグナルの特徴的な分布及び数(そのピーク又はデジタル表示など)をいう。一般的に、本明細書中で用いられる断片化パターンとは、限定するものではないが核酸及びタンパク質などの生物分子の特異的開裂によって生じるフラグメントの組をいう。
本明細書中で用いられる通り、質量スペクトル又は任意の他の質量測定方法及びそれらの分析に関連するシグナル、質量シグナル、又は出力シグナルとは、特定の質量シグナルを有する分子の数又は相対数である出力データをいう。シグナルには、「ピーク」及びそのデジタル表示が含まれる。
本明細書中で用いられる通り、「ピーク」との用語は、フラグメントの質量及び強度に対応する質量分光計スペクトル(「質量スペクトル」)のベースラインシグナルからの隆起した上方への突出をいう。ピークは、手動のあるいは自動化された「ピーク発見」手順によって質量スペクトルから抽出することができる。
本明細書中で用いられる通り、質量スペクトル中のピークの質量とは、「ピーク発見」手順によって計算処理された質量をいう。
本明細書中で用いられる通り、質量スペクトル中のピークの強度とは、限定するものではないが質量スペクトル中のピークの高さ及びそのシグナル対ノイズ比を含む、パラメータに依存する「ピーク発見」手順によって計算処理された強度をいう。
本明細書中で用いられる通り、「分析」とは、単一のオリゴヌクレオチド若しくポリペプチド又はオリゴヌクレオチド若しくはポリペプチドの混合物のある種の性質の決定をいう。これらの性質には、ヌクレオチド又はアミノ酸の組成物及び完全な配列、単一ヌクレオチド多型及び2つ以上のオリゴヌクレオチド又はポリペプチド間での他の変異又は配列変化の存在、オリゴヌクレオチド又はポリペプチドの質量及び長さ、並びに試料中における分子又は分子内の配列の存在が含まれるが、限定するものではない。
本明細書中で用いられる通り、「多重処理」とは、単一の質量分析測定又は他の質量測定で、すなわち、単一の質量スペクトル又は他の配列読み取り方法で、2つ以上のオリゴヌクレオチド又はポリペプチド分子を同時に決定すること又2つ以上のオリゴヌクレオチド又はオリゴペプチドを同時に分析することをいう。
本明細書中で用いられる通り、増幅とは、生体高分子、特に核酸の量の増加手段をいう。選択した5’及び3’プライマーに基づいて、増幅は、分析が施されるゲノム領域を限定し、区別することにも役立つ。増幅は、ポリメラーゼ連鎖反応(PCR)などの使用を含む当業者に既知である任意の手段によることができる。多型の頻度を決定することが必要である場合、増幅、例えば、PCRを定量的に行わなければならない。
本明細書中で用いられる通り、「多型」とは、遺伝子又はその一部の形態が1つ以上同時に存在しているをことをいう。異なる形態が少なくとも2つある遺伝子の一部、すなわち、2個の異なるヌクレオチド配列を「遺伝子の多型領域」と称する。多型領域は単一ヌクレオチドであることができ、その同一性は異なる対立遺伝子において異なる。多型領域は、いくつかのヌクレオチドの長さであることもできる。したがって、多型、例えば、遺伝子変化(genetic variation)とは、生じるか観察される対立遺伝子変化及び他の変化などの集団の間におけるゲノムの遺伝子配列の変化をいう。したがって、多型とは、遺伝的に決定される代替の配列又は対立遺伝子が集団中に2つ以上存在していることをいう。これらの違いは、ゲノムのコード及び非コード部分に存在することができ、核酸配列の違い、例えば、転写、プロセシング、翻訳、輸送、タンパク質プロセシング、情報交換、DNA合成、発現タンパク質、他の遺伝子産物、又は生物化学経路の生成物若しくは翻訳後修飾での産物を含む遺伝子発現の違い、及び集団のメンバーの間で示される任意の他の違いとして明らかにすることができるか検出することができる。単一ヌクレオチド多型(SNP)とは、塩基での挿入、欠失、又は変化(置換)などの単一塩基の変化の結果として生ずる多型をいう。
多型マーカー又は部位は、多様性が起こる座である。そのような部位は、1塩基対の小ささ(SNP)であることができる。多型マーカーには、制限酵素断片長多型、可変数タンデムリピート(VNTR)、超可変領域、ミニサテライト、ジヌクレオチドリピート、トリヌクレオチドリピート、テトラヌクレオチドリピート、及び他の繰り返しパターン、単一配列リピート、及びAluなどの挿入エレメントが含まれるが、限定するものではない。多型形態は、遺伝子については異なるメンデル対立遺伝子しても明らかにされる。タンパク質、タンパク質修飾、RNA発現修飾、DNA及びRNAメチル化、遺伝子発現及びDNA複製を変える調節因子、並びにゲノム核酸又は細胞内小器官の核酸におけるその他の任意の変化の出現の違いにより、多型を観察することができる。
本明細書中で用いられる通り、「多型遺伝子」とは、少なくとも1つの多型領域を有する遺伝子をいう。
本明細書中で用いられる通り、本明細書中で「対立遺伝子変異体」と互換可能に用いられる「対立遺伝子」とは、遺伝子又はその一部の代替の形態をいう。対立遺伝子は、相同染色体上で同じ座又は位置を占める。被検体が遺伝子の2つの同一の対立遺伝子を有する場合、被検体は遺伝子の遺伝子又は対立遺伝子についてホモ接合であると言う。被検体が少なくとも2個の異なる対立遺伝子を有する場合、被検体は遺伝子についてヘテロ接合であると言う。特定の遺伝子の対立遺伝子は、単一のヌクレオチド又はいくつかのヌクレオチドで互いに異なることができ、ヌクレオチドの置換、欠失、及び挿入を含むことができる。遺伝子の対立遺伝子は、変異を含む遺伝子の形態であることもできる。
本明細書中で用いられる通り、「優性対立遺伝子」とは、所与の集団について最大頻度で表れる対立遺伝子をいう。より少ない頻度で存在する対立遺伝子は、対立遺伝子変異体と称される。
本明細書中で用いられる通り、変異として知られる核酸配列の変化によって、生物化学活性が変化したかある場合には失われさえしたタンパク質を生ずることができ、これは次いで遺伝子疾患を引き起こすことができる。変異には、ヌクレオチドの欠失、挿入、又は変化/置換(すなわち、点変異)が含まれる。点変異は、タンパク質のアミノ酸配列の変化を生じさせる「ミスセンス」であるか、停止コドンをコードし、それによって切断されたタンパク質を生じさせる「ナンセンス」のいずれかであることができる。
本明細書中で用いられる通り、配列変化は、参照核酸又はタンパク質配列と比較した場合に標的核酸又はタンパク質配列において異なる1個以上のヌクレオチド又はアミノ酸を含む。配列変化には、変異、多型、又は異なる生物に属する標的配列及び参照配列間の配列の違いが含まれるが、限定するものではない。配列変化は、一般的に、常にではないが、標的配列及び参照配列間のヌクレオチド、アミノ酸、又はその他の生体高分子単量体単位の違いの完全な組のサブセットを含む。
本明細書中で用いられる通り、追加又は消失ピーク又はシグナルは、それぞれ、同じ開裂反応条件下における参照配列の実際の又はシミュレーションした開裂によって得られるフラグメントと相対的な存在している又は存在していない標的配列のフラグメントに対応するピーク又はシグナルである。消失又は追加シグナルの他に、標的フラグメント及び参照フラグメント間の違いは、限定するものではないがシグナルのピーク強度(高さ、面積、シグナル対ノイズ、又はそれらの組み合わせ)の違いを含む他の違いとして示すことができる。
本明細書中で用いられる通り、異なるフラグメントは、同じ開裂反応条件下における参照配列の実際の又はシミュレーションした開裂によって得られるフラグメントと相対的な異なる標的配列のフラグメントである。異なるフラグメントは、参照フラグメントパターンと相対的な標的フラグメントパターンで消失しているか、あるいは参照断片化パターンと相対的な標的断片化パターンに追加的に存在するフラグメントであることができる。消失又は追加フラグメントの他に、異なるフラグメントは、限定するものではないが異なるフラグメントに対応するシグナルのピーク強度(高さ、面積、シグナル対ノイズ、又はそれらの組み合わせ)の違いを生じさせる違いを含む、標的断片化パターン及び参照断片化パターン間の定性的である違いであることもできる。
本明細書中で用いられる通り、「コンポマー」との用語とは、その単量体構成要素単位に関する配列フラグメントの組成物をいう。核酸では、コンポマーとは、単量体単位が塩基であるフラグメントの塩基組成物をいう。各タイプの塩基の数はBn(すなわち、Aacgt、A0000は「空の」コンポマー又は塩基を含まないコンポマーを表す)によって表すことができる。天然コンポマーは、すべての構成要素単量体単位(例えば、核酸では塩基、タンパク質ではアミノ酸)がゼロ以上であるコンポマーである。しかしながら、本明細書中に提供する方法においては、配列を比較して配列変化を決定する目的のため、負の数の単量体単位を含む非天然「コンポマー」をアルゴリズムによって生じさせることができる。ポリペプチドでは、コンポマーとはポリペプチドフラグメントのアミノ酸組成物をいい、各タイプのアミノ酸の数は同様に表される。配列中の塩基の数及びタイプを添えてコンポマーの組成物を得た場合、コンポマーは配列に対応する。例えば、コンポマーA23は配列AGGAGに対応する。一般的には、配列に対応するコンポマーは1つだけあるが、2つ以上の配列が同じコンポマーに対応することができる。例えば、配列AGGAG、AAGGG、GGAGAなどはすべて同じコンポマーA23に対応するが、これらの各配列について、対応するコンポマーは1つだけ、すなわち、A23である。
本明細書中で用いられる通り、ウィットネス・コンポマー又はコンポマー・ウィットネスとは、質量が同じ参照開裂反応と相対的な標的開裂反応で生じた各異なるフラグメントの実際の質量とは十分に小さい質量の違いより小さいかそれと等しい値だけ異なるすべての可能なコンポマーをいう。十分に小さい質量の違いは、必要な場合には経験的に決定することができ、一般的には質量測定の分解能である。例えば、質量分析測定において、十分に小さい質量の違いの値は、限定するものではないが、ウィットネス・コンポマーに対応する異なるフラグメントの質量(そのシグナルによって測定される)、質量がタイプ又は長さにおいて単一ヌクレオチドだけ異なるフラグメント間のピーク分離、及び質量分光計の絶対分解能を含むパラメータの関数である。可能なウィットネス・コンポマーの質量が十分に小さい質量の違いより小さいかそれと等しい値だけ各異なるフラグメントの実際の測定質量に近いかそれと等しくなるように、4個の核酸塩基(RNAではA、G、C、T、若しくはU、又はそれらの修飾物)又は20個のアミノ酸若しくはそれらの修飾物の1つ以上に特異的な開裂反応を用いて、各異なるフラグメントについての可能なウィットネス・コンポマーを含むデータの組を作成することができる。
本明細書中で用いられる通り、特異的開裂反応についての標的配列及び参照配列の断片化パターン間の違いが標的配列中の各配列変化を表す違いの単純な合計でない場合、参照配列と相対的な標的配列の2つ以上の配列変化は互いに相互作用すると言う。互いに相互作用しない標的配列中の配列変化においては、標的配列に沿った配列変化間の分離(距離)は、各配列変化が特異的開裂反応において(参照配列と相対的な標的配列の)区別される異なるフラグメントを生ずるのに十分である。参照配列と相対的な標的配列の断片化パターンの違いは、参照配列と相対的な標的配列中のすべての配列変化の合計を表す。
本明細書中で用いられる通り、十分に小さい質量の違いは、同定された異なるフラグメントの測定質量及びコンポマーの質量の間の最大の質量の違いであり、該コンポマーを同定された異なるフラグメントについてのウィットネス・コンポマーとみなすことができる。十分に小さい質量の違いは、必要な場合には経験的に決定することができ、一般的には質量測定の分解能である。例えば、質量分析測定では、十分に小さい質量の違いの値は、ウィットネス・コンポマーに対応する異なるフラグメントの質量(そのシグナルによって測定される)、質量がタイプ又は長さにおいて単一ヌクレオチドだけ異なるフラグメントの間のピーク分離、及び質量分光計の絶対分解能を含むが限定するものではないパラメータの関数である。
本明細書中で用いられる通り、副記号列又は副配列s[i,j]は、全長核酸又はタンパク質配列を表す記号列sの開裂フラグメントを表す。本明細書中で用いられる通り、i及びjは、副記号列の出発及び終結位置を表す整数である。例えば、核酸の副記号列では、i及びjはそれぞれ副記号列が開始及び終結する核酸配列中の塩基の位置を表すことができる。本明細書中で用いられる通り、c[i,j]とはs[i,j]に対応するコンポマーをいう。
本明細書中で用いられる通り、配列変化の位数であるkとは、本明細書中に提供する技術によって構築される標的配列の配列変化候補をいい、該配列変化候補は、参照配列と相対的な標的配列中に変異、多型、又は限定するものではないが生物間の配列変化、挿入、欠失、置換を含む他の配列変化を多くてもk個含む。kの値は、限定するものではないが参照配列及び標的配列間の配列変化の予測されるタイプ及び数を含む多くのパラメータに依存し、例えば、配列変化が単一塩基であるか複数塩基であるか、あるいは参照配列と相対的な配列変化が標的配列上の1つの位置で存在するか2つ以上の位置で存在するか、あるいは配列変化が標的配列中で互いに相互作用するかしないかに依存する。例えば、SNPsの検出では、kの値は、必ずしもではないが通常は1又は2である。別の例として、変異の検出及び再配列決定では、kの値は、必ずしもではないが通常は3以上である。
本明細書中で用いられる通り、記号列s中の開裂試薬によって認識される塩基、アミノ酸、又は他の特徴Xの特異的開裂反応が与えられたとき、副記号列s[i,j]又は対応するコンポマーc[i,j]の境界b[i,j]とは、記号列sの開裂が副記号列s[i,j]の直ぐ外で行われていないかを示すマーカーの組をいう。可能なマーカーは、「iの直前でsが開裂されていない」かを示すL、及び「jの直後でsが開裂されていない」かを示すRである。したがって、b[i,j]は、Xが記号列sのi−1位置に存在する場合に限りLを含み、かつ、Xが記号列sの位置j+1に存在する場合に限りRを含む、組{L,R}のサブセットである。#bは、副記号列s[i,j]が双方の直ぐ横の位置において(すなわち、i−1及びj+1の位置において)、あるいは片方の直ぐ横の位置において(すなわち、i−1又はj+1のいずれかの位置において)、あるいは直ぐ横の位置ではない位置において(すなわち、i−1又はj+1のいずれの位置でもない位置において)特異的に開裂されたかに依存して0、1、又は2であることができる組b中の要素の数を表す。
本明細書中で用いられる通り、コンポマー境界又は境界bは、b[i,j]について先に定義した組{L,R}のサブセットである。bの可能な値は、空のセット{}(すなわちb中の要素の数(#b)が0である)、{L}、{R}(すなわち#bが1である)、及び{L,R}(すなわち#bは2がある)である。
本明細書中で用いられる通り、有界コンポマーとは、開裂部位が各副配列の2つの末端に存在するか否かを示す境界を有する参照配列の副配列の組に対応するすべてのコンポマーcの組をいう。有界コンポマーの組を可能なコンポマー・ウィットネスに対して比較し、参照配列と相対的な標的配列のすべての可能な配列変化を構築することができる。例えば、(c,b)とは、コンポマーc及び境界bを含む「有界コンポマー」をいう。
本明細書中で用いられる通り、Cとは、記号列s内のすべての有界コンポマーの組をいい、すなわち、すべての可能な副記号列s[i,j]では、有界コンポマー(c[i,j],b[i,j])が見い出だされ、これらは組Cに属する。Cは、C:={(c[i,j],b[i,j]):l≦i≦j≦sの長さ}と表すことができる。
本明細書中で用いられる通り、ord[i,j]とは、副記号列s[i,j]が特定の開裂反応で開裂される回数をいう。
本明細書中で用いられる通り、フラグメントf、f’に対応する所与のコンポマーc、c’が与えられたとき、d(c,c’)は、コンポマーc,c’に対応するすべての潜在的なフラグメントf,f’を受け継ぐcをc’に変換するのに必要である配列変化、多型、又は変異(挿入、欠失、置換)の最小数を決定する関数であり、ここで、cは、参照生物分子のフラグメントsのコンポマーであり、c’は、フラグメントsの配列変化から生じる標的生物分子フラグメントs’のコンポマーである。本明細書中で用いられる通り、d(c,c’)は、d(c’,c)と等価である。
組Cから構築される有界コンポマー(c,b)について、関数D(c’,c,b)は、コンポマー・ウィットネスc’を生ずるのに必要である参照配列と相対的な配列変化の最小数を測定する。D(c’,c,b)は、D(c’,c,b):=d(c’,c)+#bと表すことができる。本明細書中で用いられる通り、D(c’,c,b)は、D(c,c’,b)と等価である。
本明細書中で用いられる通り、Ckは、k個を上回る数のカット記号列の配列変化を含む副記号列のコンポマーが組Cから除外されるようなCのサブセットである。したがって、挿入、欠失、及び置換を多くてもk個含む配列変化があり、かつ、c’がこの配列変化のピークウィットネスに対応するコンポマーである場合には、有界コンポマー(c,b)がCk中にD(c’,c,b)≦kとなるなるように存在する。Ckは、C:={(c[i,j],b[i,j]):1≦i≦j≦sの長さ、及びord[i,j]+#b[i,j]≦k}と表すことができる。本明細書中に提供するアルゴリズムは、可能な配列変化に対応したこのコンポマーの減少した組に基づく。
本明細書中で用いられる通り、Lは又はL_△は、同じ参照開裂反応と相対的な標的開裂反応が異なるフラグメントに対応するピーク又はシグナルのリストを表す。違いには、参照フラグメントシグナルと相対的な標的フラグメントシグナル中に存在する又は存在していないシグナル、並びに標的フラグメントシグナル及び参照フラグメントシグナル間の強度が異なるシグナルが含まれるが、限定するものではない。
本明細書中で用いられる通り、配列変化候補とは、1又は複数の配列変化を含む標的配列の潜在的な配列をいう。配列変化候補が1又は複数の配列変化を含む標的生物分子の実際の配列である確率は、スコアによって測定される。
本明細書中で用いられる通り、配列変化候補の減少した組とは、標的配列の特異的開裂の際に所与の組のフラグメントを生ずるであろう標的配列中のすべての可能な配列変化のサブセットをいう。配列変化候補の減少した組は、特定の特異的開裂反応において特定の断片化パターン(フラグメントの質量を測定することによって検出される)を生ずることができる標的配列のすべての可能な配列変化の組から、参照配列の実際の又はシミュレーションした同じ特異的開裂反応での開裂によって生じるフラグメントとは異なる標的配列のフラグメントを生ずるそれらの配列変化のみを含むサブセットを作り出すことにより、得ることができる。
本明細書中で用いられる通り、標的分子中の特定の配列変化と一致するフラグメントとは、1超の開裂試薬を用いた1超の反応で標的分子の開裂によって得られるそれらの異なるフラグメントであって、限定するものではないが質量、強度、又はシグナル対ノイズ比を含む特徴が本明細書中に提供する方法に従って分析した場合に標的分子中に同じ配列変化の存在を示す該フラグメントをいう。
本明細書中で用いられる通り、スコア付け又はスコアとは、特定の配列変化候補が標的核酸又はタンパク質配列中に実際に存在する確率の計算をいう。スコアの値を用いて、実際の標的配列に対応する配列変化候補を決定する。通常、標的配列の試料の組において、最も高いスコアは標的分子中の最も起こり得そうな配列変化を表すが、単一の標的配列が存在する場合には正のスコアを検出するなどの他の選択規則を用いることができる。
本明細書中で用いられる通り、シミュレーション(又はシミュレーションする)とは、核酸又はタンパク質の配列及び特異的開裂試薬についての特定の核酸又はタンパク質配列中の予測開裂部位の断片化パターンの計算をいう。断片化パターンは、数の表として(例えば、参照生物分子のフラグメントの質量シグナルに対応するピークのリストとして)、質量スペクトルとして、ゲル上のバンドのパターンとして、又は任意の質量分布測定技術の表示として、シミュレーションすることができる。シミュレーションは、ほとんどの場合、コンピュータプログラムによって行うことができる。
本明細書中で用いられる通り、開裂をシミュレーションするとは、標的分子又は参照分子を仮想的に開裂するイン・シリコ(in silico)プロセスをいう。
本明細書中で用いられる通り、イン・シリコ(in silico)とは、コンピュータを用いて行う検索及び実験をいう。イン・シリコ(in silico)方法には、分子モデリング研究、生物分子ドッキング実験、及び分子構造の仮想表示、及び/又は分子相互作用などのプロセスが含まれるが、限定するものではない。
本明細書中で用いられる通り、被検体には、動物、植物、細菌、ウイルス、寄生虫、及び核酸を有する任意の他の生物又は実体が含まれるが、限定するものではない。被検体の中の1つは、哺乳動物であり、必ずしもではないが、ヒトが好ましい。患者とは、疾患又は障害に悩んでいる被検体をいう。
本明細書中で用いられる通り、表現型とは、生物の任意の識別可能な形質を含むパラメータの組をいう。表現型は、身体的形質であることができ、被検体が動物である場合には、情動的形質などの精神的形質であることができる。
本明細書中で用いられる通り、「帰属」とは、核酸又はタンパク質フラグメントの位置が特定の分子量及び特定の末端ヌクレオチド又はアミノ酸を示す決定をいう。
本明細書中で用いられる通り、「a」とは、1つ以上をいう。
本明細書中で用いられる通り、「複数」とは、各々が異なる配列を有する2つ以上のポリヌクレオチド又はポリペプチドをいう。そのような違いは、配列の中の天然に存在する変化、例えば、ヌクレオチド又はコードされたアミノ酸中の対立遺伝子変化に起因することができ、あるいは特定の修飾が種々の配列に導入されたこと、例えば、質量修飾ヌクレオチドが各核酸又はタンパク質に差次的に複数導入されたことに起因することができる。
本明細書中で用いられる通り、アレイとは、固体支持体上の3つ以上の座などの3つ以上の区分によって生成されるパターンをいう。
本明細書中で用いられる通り、「明確な」とは、標的分子中の変異などの特定の配列変化に対応するピーク又はシグナルのたった1つの帰属をいい、分子又は変異の数が多重処理される(multiplexed)事象では、特定の配列変化を表しているピークを各変異又は各分子にたった1つ帰属することができることをいう。
本明細書中で用いられる通り、データ処理ルーチンとは、取得データの生物学的有意性(すなわち、アッセイの最終結果)を決定するソフトウェアで具現化することができるプロセスをいう。例えば、データ処理ルーチンは、収集データに基づいて遺伝子型を決定する。本明細書でのシステム及び方法では、データ処理ルーチンは、決定された結果に基づいて機器及び/又はデータ収集ルーチンを制御することができる。データ処理ルーチン及びデータ収集ルーチンは組込まれて、機器によるデータの取得を操作するためにフィードバックを与え、ゆえに本明細書中に提供するアッセイをベースとした判断方法を提供する。
本明細書中で用いられる通り、複数の遺伝子は、少なくとも2個、5個、10個、25個、50個、100個、250個、500個、1000個、2,500個、5,000個、10,000個、100,000個、1,000,000個以上の遺伝子を含む。複数の遺伝子は、生物の完全若しくは部分的なゲノム又はそれらの複数個さえ含むことができる。生物のタイプを選択することにより、ゲノムが決定され、該遺伝子調節領域が選択される。遺伝子をスクリーニングする代表的な生物には、ヒトなどの哺乳動物及びマウスなどの齧歯類を含む動物、昆虫、酵母、細菌、寄生虫、及び植物が含まれる。
本明細書中で用いられる通り、「特異的にハイブリダイゼーションする」とは、プローブ又はプライマーの標的配列だけとのハイブリダイゼーション、優先的には非標的配列とのハイブリダイゼーションをいう。当業者は、温度、プローブ又はプライマーの長さ及び組成、緩衝液の組成及び塩濃度などのハイブリダイゼーションに影響を及ぼすパラメータに精通し、核酸の標的配列への特異的ハイブリダイゼーションを達成するためにこれらのパラメータを容易に調整することができる。
本明細書中で用いられる通り、「試料」とは、検出する材料を含有する組成物をいう。好ましい実施態様では、試料は「生物試料」である。「生物試料」との用語は、例えば、ヒト又はその他の哺乳動物などの動物、植物、細菌、真菌、原生生物、又はウイルスなどの生物供給源から得られる任意の材料をいう。生物試料は、組織、細胞、細胞ペレット、細胞抽出物、若しくは生検などの固体材料、又は尿、血液、唾液、羊水、感染若しくは炎症領域由来の滲出物、又は口腔細胞を含有する口内洗浄液、尿、脳髄液、及び滑液などの生物液、及び器官を含む任意の形態であることができる。固体材料は、液体と混合することが好ましい。具体的には、本明細書中において、試料とは、質量分析による分析に用いられるマトリクス及び核酸分子の精製又は単離及び/又は増幅などの試料を加工することができる手段から得られる核酸などの生物材料の混合物をいう。
本明細書中で用いられる通り、組成物とは、任意の混合物をいう。それは、溶液、懸濁液、液体、粉末、ペースト、水性液、非水性液、又は任意のそれらの組み合わせであることができる。
本明細書中で用いられる通り、組み合わせとは、2つ以上のものの間の任意の結合をいう。
本明細書中で用いられる通り、「1と1/4カッター」との用語は、一方の塩基の位置の同一性が固定され、かつ、他方の塩基の位置の同一性が天然に存在する4つの塩基のうちの任意の3つである、核酸中の2個の塩基のストレッチを認識して開裂する制限酵素をいう。
本明細書中で用いられる通り、「1と1/2カッター」との用語は、1つの塩基の位置の同一性が固定され、かつ、他方の塩基位置の同一性が天然に存在する4つの塩基のうちの任意の2つである、核酸中の2個の塩基のストレッチを認識して開裂する制限酵素をいう。
本明細書中で用いられる通り、「2カッター」との用語は、2個の塩基の長さである特異的核酸部位を認識して開裂する制限酵素をいう。
本明細書中で用いられる通り、「AFLP」との用語は増幅断片長多型をいい、「RFLP」との用語は制限酵素断片長多型をいう。
本明細書中で用いられる通り、「単位複製配列」との用語は、複製することができるDNA領域をいう。
本明細書中で用いられる通り、「完全開裂」又は「全体開裂」との用語は、特定の開裂試薬によって認識されるすべての開裂部位が完全に切断される開裂反応をいう。
本明細書中で用いられる通り、「偽陽性」との用語は、バックグラウンドノイズに由来し、かつ、核酸又はタンパク質の実際の又はシミュレーションした特異的開裂によっては生じない質量シグナルをいう。
本明細書中で用いられる通り、「擬陰性」との用語は、実際の断片化スペクトルから消失しているが対応するシミュレーションしたスペクトル中で検出することができる実際の質量シグナルをいう。
本明細書中で用いられる通り、「部分開裂」との用語は、特定の開裂試薬の開裂部位の分画だけが開裂試薬によって実際に切断される反応をいう。
本明細書中で用いられる通り、開裂は、核酸又はタンパク質分子が切断されてより小さい片になる任意の様式を意味する。開裂認識部位は、1個又は2個以上の塩基の長さであることができる。開裂手段には、物理的開裂、酵素的開裂、化学的開裂、及びより小さい片の核酸を生ずる任意の他の方法が含まれる。
本明細書中で用いられる通り、開裂条件又は開裂反応条件とは、実際の又はシミュレーションした開裂反応を行うために用いられる1つ以上の開裂試薬の組、及び時間、温度、pH、又は緩衝液の選択を含むが限定するものではない他の反応パラメータをいう。
本明細書中で用いられる通り、未開裂開裂部位とは、既知の開裂試薬認識部位であるが、切断試薬による開裂を妨げるための反応条件下、例えば、時間、温度、又は開裂認識部位での塩基修飾の下で開裂試薬によって切断されていない開裂部位を意味する。
本明細書中で用いられる通り、相補的な開裂反応とは、異なる開裂試薬を用いて、あるいは同じ標的核酸若しくはタンパク質又は参照核酸若しくはタンパク質の代替開裂パターンを生じるように同じ開裂試薬の開裂特異性を変えることにより、同じ標的核酸若しくはタンパク質又は参照核酸若しくはタンパク質に対して行うかシミュレーションする開裂反応をいう。
本明細書中で用いられる通り、組み合わせとは、2つ以上のもの又は要素の間の任意の結合をいう。
本明細書中で用いられる通り、組成物とは、任意の混合物をいう。それは、溶液、懸濁液、液体、粉末、ペースト、水性液、非水性液、又は任意のそれらの組み合わせであることができる。
本明細書中で用いられる通り、液体とは、流動することができる任意の組成物をいう。したがって、液体は、半固体、ペースト、溶液、水性混合物、ゲル、ローション、クリーム、及び他のそのような組成物の形態の組成物を包含する。
本明細書中で用いられる通り、細胞抽出物とは、溶解又は粉砕された細胞から作られる調製物又は分画をいう。
本明細書中で用いられる通り、キットは、成分が任意選択により使用指示書及び/又は試薬及び併用される器具とともにパッケージングされた組み合わせである。
本明細書中で用いられる通り、システムとは、ソフトウェアを有する要素及び本明細書中に提供する方法を制御及び指示する任意の他の要素の組み合わせをいう。
本明細書中で用いられる通り、ソフトウェアとは、コンピュータによって実行される場合にコンピュータの操作を行うコンピュータ読み取り可能なプログラム命令をいう。典型的には、ソフトウェアは、限定するものではないが、フロッピー(登録商標)ディスク、ハードディスク、及び磁気テープを含む磁気媒体、及びCD−ROMディスク、DVDディスク、磁気光学ディスクを含む光学媒体、並びにプログラム指示を記録することができる他のそのような媒体などのコンピュータ読み取り可能媒体上に記録されたプログラム命令を含むプログラム製品で提供される。
開示を明確にするため、かつ、何ら限定するものではないが、詳細な説明を以下のサブセクションに分ける。
B.フラグメントの生成方法
核酸の断片化
核酸の断片化は当該技術分野で既知であり、多くの方法で達成することができる。例えば、標的核酸中の特異的部位における開裂によって断片化が得られる限り、DNA、RNA、DNA及びRNAのアナログ、又はそれらの組み合わせからなるポリヌクレオチドを、物理的、化学的、又は酵素的に断片化することができる。フラグメントは、(i)開裂試薬の塩基特異性(例えば、A、G、C、T、若しくはU、又は修飾された塩基若しくはヌクレオチドの認識);又は(ii)標的核酸の構造;、又は(iii)双方の組み合わせに基づき、標的核酸配列中の特異的位置で開裂することができ、標的核酸から生じる。フラグメントはサイズが種々異なることができ、好適なフラグメントは、典型的には、約2000個未満の核酸である。好適なフラグメントは、約1000未満の塩基、約100〜約500個の間の塩基、又は約25〜約200個の塩基を含むが限定するものではない、いくつかのサイズ範囲に属することができる。ある態様では、約1個の核酸のフラグメントが望ましい。
ポリヌクレオチドは、例えば、塩基及び酸加水分解を含む加水分解反応を含む化学的反応によって断片化することができる。RNAはアルカリ条件下で不安定であるので、アルカリ条件を用いてRNAを含むポリヌクレオチドを断片化することができる。例えば、Nordhoff et al (1993) ion stability of nucleic acids in infrared matrix-assisted laser desorption/ionization mass spectrometry, Nucl. Acids Res., 21 (15):3347-57を参照のこと。DNAは、酸、典型的には6M HClなどの強酸の存在下で加水分解することができる。温度を室温より高くして加水分解を促進することができる。条件及び反応時間の長さに依存して、ポリヌクレオチドを単一塩基のフラグメントを含む種々のサイズに断片化することができる。加水分解は、厳しい条件下で、デオキシリボース並びにプリン及びピリミジン塩基の間のリン酸エステル結合及びN−グリコシド結合の双方を壊すことができる。
ポリヌクレオチドフラグメントを生成するための代表的な酸/塩基加水分解プロトコルは、Sargent et al. (1988) Methods Enzymol, 152: 432に記載されている。簡単に言えば、DNA1gを0.1N NaOH50mLに溶解する。濃HCl1.5mLを添加し、溶液をすばやく混合する。DNAは直ぐに沈殿し、大きな凝集物の形成を妨げるために数秒より長く攪拌してはならない。試料を室温で20分間インキュベーションして、DNAを部分的に脱プリン化する。続いて、10N NaOH2mLを添加し(OH-濃度を0.1Nとする)、DNAが完全に再溶解するまで試料を攪拌する。次いで、試料を65℃で30分間インキュベーションし、DNAを加水分解する。典型的なサイズは、約250〜1000個のヌクレオチドの範囲であるが、加水分解条件に依存してより少なく又はより多く変動ことができる。核酸分子を塩基特異的な様式で化学的に開裂する別のプロセスは、M. Maxam and W. Gilbert, Proc. Natl. Acad. Sci. USA 74: 560-64,1977によって提供され、参照により本明細書に取り入れられる。グアニン、アデニン、シトシン及びチミン、並びにシトシンにおいて単独で優先的に開裂するように、個々の反応を工夫した。
ポリヌクレオチド、特にホスホロチオエート(phosphorothioate)が修飾されたポリヌクレオチドは、アルキル化によって開裂することもできる。K. A. Browne (2002) Metal ion-catalyzed nucleic Acid alkylation and fragmentation. J. Am. Chem. Soc. 124 (27): 7950-62。ホスホロチオネート修飾におけるアルキル化によって、ポリヌクレオチドが修飾部位における開裂に対して感受性となる。I. G. Gut及びS. Beckは、質量分析での検出のためのDNAのアルキル化方法を記載している。I. G. Gut and S. Beck (1995) A procedure for selective DNA alkylation and detection by mass spectrometry. Nucleic Acids Res. 23 (8): 1367-73。別の手法は、P3’−N5’−ホスホロアミデート含有DNAの酸の不安定性を用いる(Shchepinov et al., "Matrix-induced fragmentation of P3'-N5'-phosphoroamidate-containing DNA: high-throughput MALDI-TOF analysis of genomic sequence polymorphisms," Nucleic Acids Res. 25: 3864-3872 (2001))。dCTP又はdTTPのいずれかをそれらのアナログであるP−N修飾されたヌクレオシド三リン酸によって置き換え、PCRに続いて行うプライマー伸長反応によって標的配列に導入する。続いて行う酸性反応条件によって、塩基特異的開裂フラグメントが生成される。必要な酸性開裂条件下でのアデニン及びグアニン残基の脱プリン化を最小限に抑えるために、dA及びdGの7−デアザアナログを用いることができる。
四酸化オスミウム及びピペリジンを用いることによってDNAヘテロ二重鎖中の単一ヌクレオチドミスマッチを開裂することができ、一般的に「ミスマッチ化学開裂(Mismatch Chemical Cleavage)」(MCC)と呼ばれる単一塩基置換を検出するための代替戦略が提供される(Gogos et al., Nucl. Acids Res. , 18: 6807-6817[1990])。
ポリヌクレオチドを照射することにより、ポリヌクレオチド断片化も行うことができる。典型的には、ガンマ又はx線照射などの照射は、ポリヌクレオチドを断片化するのに十分である。照射への暴露の強度及び期間を調整することにより、フラグメントのサイズを調整することができる。紫外線照射も用いることができる。暴露の強度及び期間を調整して、ポリヌクレオチドに対する照射の望ましくない効果を最小限とすることもできる。ポリヌクレオチドをボイルさせることによってもフラグメントが生成される。典型的には、ポリヌクレオチド溶液を一定攪拌下で2〜3時間ボイルさせる。約500bpのフラグメントを得ることができる。フラグメントのサイズは、ボイル時間に伴って変化することができる。
ポリヌクレオチドフラグメントは、一本鎖又は複数鎖のポリヌクレオチドの酵素開裂から生ずることができる。複数鎖のポリヌクレオチドには、例えば、二本鎖及び三本鎖のポリヌクレオチドを含むポリヌクレオチド鎖を2つ以上含むポリヌクレオチド複合体が含まれる。使用する酵素に依存して、ポリヌクレオチドは非特異的に切断されるか、あるいは特定のヌクレオチド配列で切断される。エンドヌクレアーゼ、エキソヌクレアーゼ、リボザイム、及びDNAザイムを含む限定するものではない、ポリヌクレオチドを開裂することが可能である任意の酵素を用いることができる。ポリヌクレオチドの断片化に有用な酵素は当該技術分野で既知であり、市販されている。例えば、Sambrook, J., Russell, D. W., Molecular Cloning: A Laboratory Manual, the third edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, 2001を参照のこと(これを参照により本明細書に取り入れる)。酵素を用いて大きなポリヌクレオチドをより小さなフラグメントにすることもできる。
エンドヌクレアーゼは、ポリヌクレオチドの断片化に有用な酵素の代表的なクラスである。エンドヌクレアーゼは、ポリヌクレオチド鎖内の結合を開裂する能力を有する。エンドヌクレアーゼは、二本鎖又は一本鎖ポリヌクレオチドのいずれかに特異的であることができる。開裂は、ポリヌクレオチド内でランダムに起こることができ、あるいは特定の配列で開裂することができる。二重鎖ポリヌクレオチドをランダムに開裂するエンドヌクレアーゼは、ポリヌクレオチドの骨格としばしば相互作用する。ポリヌクレオチドの特異的断片化は、1つ以上の酵素を用いて逐次反応であるいは同時に達成することができる。相同性又は非相同性ポリヌクレオチドを開裂することができる。クレバーゼ(Cleavase)(登録商標)酵素、TaqDNAポリメラーゼ、大腸菌DNAポリメラーゼI、及び真核生物構造に特異的なエンドヌクレアーゼ、ネズミFEN−1エンドヌクレアーゼ[Harrington and Liener, (1994) Genes and Develop. 8:1344]、及び仔牛胸腺の5’から3’へのエキソヌクレアーゼ[Murante, R. S. , et al. (1994) J. Biol. Chem. 269: 1191])を含む種々の供給源から提供されるヌクレアーゼ酵素による処理によって開裂を行うことができる。さらに、DNA修復エンドヌクレアーゼファミリーのメンバー(例えば、キイロショウジョウバエ(Drosophila melanogaster)由来のRrpI酵素、酵母RAD1/RAD10複合体、及び大腸菌ExoIII)などの3’ヌクレアーゼ活性を有する酵素を酵素開裂に用いることができる。
制限エンドヌクレアーゼは、二本鎖ポリヌクレオチド内の特定の配列を認識するエンドヌクレアーゼのサブクラスであり、典型的には認識配列内の鎖又は認識配列に近い鎖を開裂する。DNA分析で汎用されている1つの酵素は、DNAを配列5’−GGCC−3’で切断するHaeIIIである。その他の代表的な制限エンドヌクレアーゼには、AccI、AflIII、AluI、Alw44I、ApaI、AsnI、AvaI、AvaII、BamHI、BanII、BclI、BglI、BglII、BlnI、BsmI、BssHII、BstEII、CfoI、ClaI、DdeI、DpnI、DraI、EclXI、EcoRI、EcoRI、EcoRII、EcoRV、HaeII、HaeIII、HindII、HindIII、HpaI、HpaII、KpnI、KspI、MluI、MluNI、MspI、NciI、NcoI、NdeI、NdeII、NheI、NotI、NruI、NsiI、PstI、PvuI、PvuII、RsaI、SacI、SalI、Sau3AI、ScaI、ScrFI、SfiI、SmaI、SpeI、SphI、SspI、StuI、StyI、SwaI、TaqI、XbaI、XhoIが含まれる。これらの酵素の開裂部位は当該技術分野で既知である。
制限酵素は、I型、II型、及びIII型に分けられる。I型及びII型酵素は、同じタンパク質中で修飾及びATP依存性開裂を行う。III型酵素は、認識部位でDNAを切断し、次いでDNAから解離する。I型酵素は、DNA内のランダムな部位を開裂する。任意のクラスの制限エンドヌクレアーゼを用いてポリヌクレオチドを断片化することができる。使用する酵素に依存して、ポリヌクレオチド中の切断は、「粘着」末端として知られる他方を突出する1つの鎖を生ずることができる。BamHIは、付着5’突出末端を生ずる。KpnIは、付着3’突出末端を生ずる。あるいは、該切断により、突出末端を有さない「ブラント」末端を生ずることができる。DraI開裂により、ブラント末端が生ずる。開裂認識部位は、必要な場合、例えばメチル化によってマスクすることができる。既知の制限エンドヌクレアーゼの多くは、4〜6塩基対の認識配列を有する(Eckstein and Lilley (eds.), Nucleic Acids and Molecular Biology, vol. 2, Springer-Verlag, Heidelberg [1988])。
8塩基対特異性を有するわずかな数の稀な切断を行う制限酵素が単離され、これらは遺伝子マッピングで広範に用いられているが、これらの酵素は数が少なく、G+C−に富む配列の認識に限定され、非常に集合する傾向がある部位で開裂する(Barlow and Lehrach, Trends Genet. , 3: 167 [1987])。最近では、12を上回る塩基対の特異性を有しているであろうI群のイントロンによってコードされるエンドヌクレアーゼが発見されている(Perlman and Butow, Science 246: 1106 [1989])。
制限エンドヌクレアーゼを用いて、種々のポリヌクレオチドフラグメントサイズを生ずることができる。例えば、CviJ1は、2個及び3個の塩基のDNA配列間で認識する制限エンドヌクレアーゼである。CviJ1による完全な消化により、平均すると長さが16〜64個のヌクレオチドであるDNAフラグメントを生じさせることができる。したがって、CviJ1による部分消化によって、剪断又は音波処理と同様の「準」ランダムな形式でDNAを断片化することができる。CviJ1は、通常、RGCY部位をG及びC間で開裂し、容易にクローニングできるブラント末端が残ることになる(ここで、Rは任意のプリンであり、Yは任意のピリミジンである)。1mM ATP及び20%ジメチルスルホキシドの存在下では、開裂の特異性は緩まり、CviJ1はRGCN及びYGCY部位も開裂する。これらの「優れた(star)」条件下では、CviJ1開裂によって準ランダムな消化が生じる。この時点で、消化又は剪断されるDNAをサイズ選択することができる。
ポリヌクレオチドを断片化するための制限エンドヌクレアーゼの使用方法は、当該技術分野で周知である。1つの代表的なプロトコルでは、DNA1〜3μg;制限酵素緩衝液1×;及びDNA1μに対して制限エンドヌクレアーゼ2単位を含有する反応混合物20〜50μlを調製する。好適な緩衝液は当該技術分野で同様に既知であり、酵素活性の最適条件を提供するための好適なイオン強度、補助因子、及び任意選択によりpH緩衝液を含む。特定の酵素は、一般的に商業的な酵素供給者から入手可能な特定の緩衝液を必要とする。代表的な緩衝液は、グルタミン酸カルシウム緩衝液(KGB)である。Hannish, J. and M. McClelland. (1988). Activity of DNA modification and restriction enzymes in KGB, a potassium glutamate buffer. Gene Anal. Tech. 5: 105; McClelland, M.et al. (1988) A single buffer for all restriction endonucleases. Nucleic Acid Res. 16: 364。反応混合物を、1時間又は所望のサイズ又はサイズ範囲のフラグメントを生成するために必要な任意の期間、37℃でインキュベーションする。必要に応じて、65℃又は80℃で混合物を加熱することにより反応を停止することができる。あるいは、Mg2+などの二価のカチオンを例えばEDTAでキレート化することによって反応を停止することができる。
2つ以上の酵素を用いてポリヌクレオチドを断片化することができる。酵素がイオン強度、温度、又はpHなどの同様の条件下で活性であるという条件下で、複数の酵素を逐次反応又は同じ反応で用いることができる。典型的には、複数の酵素をKGBなどの標準の緩衝液と一緒に用いる。ポリヌクレオチドを部分又は完全消化することができる。部分消化とは、制限部位のサブセットだけが開裂されることを意味する。完全消化とは、すべての制限部位が開裂されることを意味する。
エンドヌクレアーゼは、ある種のタイプのポリヌクレオチドに特異的であることができる。例えば、エンドヌクレアーゼは、DNA又はRNAに特異的であることができる。リボヌクレアーゼHは、RNA−DNAハイブリッド中のRNA鎖を特異的に分解するエンドリボヌクレアーゼである。リボヌクレアーゼAは、一本鎖RNAをC及びU残基で特異的に攻撃するエンドリボヌクレアーゼである。リボヌクレアーゼAは、ヌクレオチドの5’−リボース及び隣接するピリミジンヌクレオチドの3’−リボースに結合したリン酸基の間のホスホジエステル結合の開裂を触媒する。得られた2’,3’−環状ホスフェートを加水分解して対応する3’−ヌクレオシドホスフェートにすることができる。RNaseT1はRNAをGリボヌクレオチドでのみ消化し、RNaseU2はRNAをリボヌクレオチドでのみで消化する。RNaseT1などの単一特異的RNases(G特異的)及びRNaseU2(A特異的)の使用は日常的である(Donis-Keller et al., Nucleic Acids Res. 4: 2527-2537 (1977); Gupta and Randerath, Nucleic Acids Res. 4: 1957-1978 (1977); Kuchino and Nishimura, MethodsEnzymol. 180: 154-163 (1989); and Hahner et al., Nucl. Acids Res. 25 (10): 1957-1964 (1997))。別の酵素であるニワトリ肝リボヌクレアーゼ(RNaseCL3)はシチジンで優先的に開裂すると報告されているが、この塩基の酵素に対する性向は反応条件によって影響を受けると報告されている(Boguski et al., J.Biol. Chem. 255: 2160-2163 (1980))。最近の報告は、キュウリL(Cucumis sativus L)の乾燥種から単離された別のリボヌクレアーゼであるクサビチンに対するシチジン特異性も主張されている(Rojo et al., Planta 194: 328-338 (1994))。あるいは、RNasePhyM(A及びU特異的)(Donis-Keller, H. Nucleic Acids Res. 8: 3133-3142 (1980))及びRNaseA(C及びU特異的)(Simoncsits et al., Nature 269: 833- 836 (1977); Gupta and Randerath, Nucleic Acids Res. 4: 1957-1978 (1977))の使用によるピリミジン残基の同定も実証されている。配列決定における曖昧性を少なくするために、さらなるアルカリ限定加水分解を行うことができる。すべてのホスホジエステル結合がこれらの条件下で可能性として開裂されるので、省いた及び/又は非特異的な開裂に関する情報をこのようにして得ることができる((Donis-Keller et al., Nucleic Acids Res. 4: 2527-2537 (1977))。ベンゾナーゼ(Benzonase)(登録商標)、ヌクレアーゼP1、及びホスホジエステラーゼIは、200塩基対以下の範囲であるポリヌクレオチドフラグメントを生成するのに好適な非特異的エンドヌクレアーゼである。ベンゾナーゼは、多くの形態のDNA鎖及びRNA鎖の双方を分解する遺伝子操作が施されたエンドヌクレアーゼであり、米国特許第5,173,418号に記載されている(これを参照により本明細書中に取り入れる)。
DNAグリコシラーゼは、所与のDNAフラグメントからある種のタイプの核酸塩基を特異的に取り除く。それにより、これらの酵素は、塩基がない部位において露出したリン酸骨格を特異的に開裂し、かつ、配列を示す核酸塩基特異的フラグメントの組を生成する別の開裂酵素により認識することができるあるいはアルカリ溶液などの化学的手段及び/又は加熱により認識することができる塩基がない部位を生成することができる。DNAグリコシラーゼ及びその標的とされるヌクレオチドの1つの組み合わせの使用は、任意の所与標的領域の塩基特異的シグネチャーパターンを生ずるのに十分であろう。
多数のDNAグリコシラーゼが既知である。例えば、DNAグリコシラーゼは、酵素の修飾ヌクレオチド又はヌクレオチドアナログ標的に対応する、ウラシル−DNAグリコシラーゼ(UDG)、3−メチルアデニンDNAグリコシラーゼ、3−メチルアデニンDNAグリコシラーゼII、ピリミジン水和物−DNAグリコシラーゼ、FaPy−DNAグリコシラーゼ、チミンミスマッチ−DNAグリコシラーゼ、ヒポキサンチン−DNAグリコシラーゼ、5−ヒドロキシメチルウラシルDNAグリコシラーゼ(HmUDG)、5−ヒドロキシメチルシトシンDNAグリコシラーゼ、又は1、N6−エテノアデニンDNAグリコシラーゼであることができる(例えば、米国特許第5、536,649号;第5、888,795号;第5,952,176号;第6,099,553号;及び第6,190,865B1号;国際PCT出願第WO97/03210号、第WO99/54501号を参照のこと;Eftedal et al. (1993) Nucleic Acids Res 21: 2095-2101, Bjelland and Seeberg (1987) Nucleic Acids Res. 15: 2787-2801, Saparbaev et al. (1995) Nucleic Acids Res. 23: 3750-3755, Bessho (1999) Nucleic Acids Res. 27: 979-983も参照のこと)。
通常のDNA前駆体ヌクレオチド(例えば、dCTP、dATP、及びdGTP)及びdUTPの存在下でDNAを増幅することによって、例えば、ウラシルを増幅したDNA分子に導入することができる。増幅生成物をUDGで処理すると、ウラシル残基が開裂する。引き続いてUDG反応からの生成物を化学処理することによって、リン酸骨格が開裂し、核酸塩基特異的フラグメントが生ずる。さらに、グリコシラーゼ処理前に増幅生成物の相補鎖を分離することによって、相補的な断片化パターンを生じさせることが可能となる。したがって、dUTP及びウラシルDNAグリコシラーゼを用いることによって、相補鎖についてのT特異的フラグメントの生成が可能となり、したがって、所与の配列内のT及びAの位置についての情報が提供される。双方の(相補)鎖上のC特異的反応(すなわち、C特異的グリコシラーゼによる)によって、双方の増幅鎖の断片化パターンを別々が分析される場合には所与の配列内のC及びGの位置についての情報が与えられる。グリコシラーゼ方法及び質量分析により、A、C、G、及びT特異的断片化パターンのすべてのシリーズを分析することができる。
特定の化学物質が存在する塩基を修飾して該塩基が特定のDNAグリコシラーゼによって認識されるようにする、いくつかの方法が存在する。例えば、メチルニトロソ尿素などのアルキル化剤によるDNAの処理によって、アルキルプリンDNA−グリコシラーゼによって認識され開裂されるN3−メチルアデニン及びN3−メチルグアニンを含むいくつかのアルキル化塩基を生ずる。重亜硫酸ナトリウムによるDNAの処理によって、DNA中のシトシン残基の脱アミノ化が引き起こされ、ウラシルN−グリコシラーゼ(ウラシルDNA−グリコシラーゼとしても知られる)によって開裂することができるDNA中のウラシル残基が形成される。化学試薬によって、グアニンをその酸化形態であり、かつ、ホルムアミドピリミジンDNAN−グリコシラーゼ(FPGタンパク質)によって開裂することができる8−ヒドロキシグアニンに変換することもできる(Chung et al., "An endonuclease activity of Escherichia coli that specifically removes 8- hydroxyguanine residues from DNA," Mutation Research 254: 1-12 (1991))。点変異検出用にミスマッチのヌクレオチド部位でポリヌクレオチドを開裂するミスマッチのヌクレオチドグリコシラーゼの使用が報告されている(Lu, A-L and Hsu, I-C, Genomics (1992) 14, 249-255 and Hsu,I-C., et al, Carcinogenesis (1994) 14,1657-1662)。使用するグリコシラーゼには、A/Gミスマッチの誤対合アデニンを効率的に放出し、かつ、効率は劣るがA/Cミスマッチを放出する大腸菌MutY遺伝子産物、及びGfrミスマッチで開裂するヒトチミジンDNAグリコシラーゼが含まれる。フラグメントは、グリコシラーゼ処理し、引き続いて塩基がない部位を開裂することによって生成される。
本明細書中に提供する方法での核酸の断片化は、ジヌクレオチド(「2カッター」)又は緩やかなジヌクレオチド(例えば、「1と1/2カッター」)開裂特異性によって行うこともできる。ジヌクレオチド特異的開裂試薬は当業者に既知であり、参照により本明細書に取り入れる(例えば、WO94/21663;Cannistraro et al, Eur J Biochem., 181: 363-370, 1989; Stevens et al, J Bacteriol, 164: 57-62, 1985;Marotta et al, Biochemistry, 12: 2901-2904,1973を参照のこと)。ストリンジェントな又は緩やかなジヌクレオチド特異的開裂は、標的核酸の酵素及び化学修飾によっても操作することができる。例えば、対象の標的核酸の転写物を通常用いる基質及びα−チオ−基質の混合物を用いて合成することができ、ハロゲン化アルキル(例えば、ヨードアセトアミド、ヨードエタノール)又は2,3−エポキシ−1−プロパノールなどの試薬を用いてアルキル化することによってホスホロチオネートヌクレオシド内結合を引き続き修飾することができる。そのような修飾によって形成されたリン酸トリエステル結合は、RNAseの基質となることは期待されない。この手順を用い、どの基質が標的調製用にα−チオ体で用いられるかに依存して、RNAse−T1などの単一特異的RNAseに4つの可能なGpN結合のうちの任意の3つ、2つ、又は1つを開裂させることができる。RNAse−U2及びRNAse−Aなどの追加のRNAsesを用いることにより、有用なジヌクレオチド特異的開裂試薬のレパートリーをさらに広げることができる。例えば、RNAseAの場合、所望の開裂特異性に依存して適切なヌクレオチドの2’修飾体を酵素によって導入することにより、開裂特異性をCpN又はUpNジヌクレオチドに限定することができる。したがって、RNAseAをCpGヌクレオチドに特異的にするために、αS−dUTP、αS−ATP、αS−CTP、及びGTPヌクレオチドを導入することによって転写物(標的分子)を調製する。これらの選択的修飾の戦略を用いて、修飾されたヌクレオチドが開裂に対してより耐性が少なくなるかあるいはより耐性になるようにホモポリマー区域内のいくつかのヌクレオチドを選択的に修飾することによって、ホモポリマー区域のすべての塩基における開裂を妨げることもできる。
DNAsesを用いてポリヌクレオチドフラグメントを生ずることもできる。Anderson, S. (1981) Shotgun DNA sequencing using cloned DNase I-generated fragments. Nucleic Acids Res. 9: 3015-3027。DNaseI(デオキシリボヌクレアーゼI)は、二本鎖及び一本鎖DNAを消化してポリヌクレオチド及びモノヌクレオチドにするエンドヌクレアーゼである。酵素は、一本鎖及び二本鎖DNA並びにクロマチンに作用することができる。
II型デオキシリボヌクレアーゼは、DNA配列決定を含む核酸検索及び酸性pHでの消化における多くの用途に用いられる。ブタ脾臓由来のデオキシリボヌクレアーゼIIは、38,000ダルトンの分子量を有する。該酵素は、二量体構造を有する糖タンパク質エンドヌクレアーゼである。最適pH範囲は、イオン強度0.15Mにおいて4.5〜5.0である。デオキシリボヌクレアーゼIIは、ネイティブ及び変性DNA中のデオキシリボヌクレオチド結合を加水分解し、3’−ホスフェートを有する生成物を生ずる。これは、pH5.6〜5.9においてp−ニトロフェニルホスホジエステルにも作用する。Ehrlich, S. D. et al. (1971) Studies on acid deoxyribonuclease. IX. 5'-Hydroxy-terminal and penultimate nucleotides of oliaonucleotides obtained from calf thymus deoxyribonucleic acid. Biochemistry.10 (11): 2000-9。
種々の長さの塩基をポリヌクレオチドの末端から取り除くヌクレアーゼを用いて、大きな一本鎖ポリヌクレオチドを小さいポリヌクレオチドに断片化することができる。一本鎖ポリヌクレオチドの末端を取り除くための代表的なヌクレアーゼには、S1、Bal31、及び大豆ヌクレアーゼが含まれるが、限定するものではない。例えば、大豆ヌクレアーゼは、一本鎖DNAを分解して5’末端にリン酸基を有するモノヌクレオチド又はポリヌクレオチドにする。二本鎖核酸は、非常に多量のこの酵素に暴露された場合に完全消化することができる。
エキソヌクレアーゼは、ポリヌクレオチド、例えば、DNA分子の末端からヌクレオチドも開裂するタンパク質である。5’エキソヌクレアーゼ(DNAをDNA鎖の5’末端から開裂する)及び3’エキソヌクレアーゼ(DNAを鎖の3’末端から開裂する)がある。異なるエキソヌクレアーゼは、一本鎖及び/又は二重鎖DNAを加水分解することができる。例えば、エキソヌクレアーゼIIIは、5’−モノヌクレオチドをDNA鎖の3’末端から放出する3’から5’へのエキソヌクレアーゼであり;3’末端のリン酸モノエステルを加水分解するDNA3’−ホスファターゼであり;ホスホジエステル結合をアプリン酸又はアピリミジン酸部位で開裂して塩基のないデオキシリボース5’−リン酸残基である5’末端を生成するAPエンドヌクレアーゼである。さらに、該酵素は、RNaseH活性を有し;それは、DNA−RNAハイブリッド二重鎖中のRNA鎖をおそらくヌクレオチド鎖分解性で優先的に分解する。哺乳動物細胞では、主なDNA3’−エキソヌクレアーゼはDNaseIII(TREX−1とも呼ぶ)である。したがって、エキソヌクレアーゼを用いてポリヌクレオチドの末端を消化することによって、フラグメントを形成することができる。
触媒DNA及びRNAは、当該技術分野で既知であり、ポリヌクレオチドを開裂してポリヌクレオチドフラグメントを生成するのに用いることができる。Santoro, S. W. and Joyce, G. F. (1997) A general purpose RNA-cleaving DNA enzyme. Proc. Natl. Acad. Sci. USA 94: 4262-4266。一本鎖分子としてのDNAは折畳まれてRNAと類似した三次元構造になることができ、2’−ヒドロキシ基は触媒作用に不可欠である。リボザイムのように、DNAザイムを選択によって補助因子に依存させることもできる。RNA加水分解用のヒスチジン依存性DNAザイムについて、このことが実証されている。米国特許第6,326,174号及び6,194,180号は、核酸配列又は分子、特にRNAを開裂することができるデオキシリボ核酸酵素−触媒又は酵素DNA分子を開示している。米国特許第6,265,167号;第6,096,715号;第5,646,020号はリボザイム組成物及び方法を開示し、参照により本明細書に取り入れる。
DNAニッカーゼ又はDNaseを用いて、DNA二重鎖のうちの1つの鎖を認識して開裂することができる。多数のニッカーゼが既知である。これらの中の1つは、例えば、以下の開裂部位を有するニッカーゼNY2Aニッカーゼ及びNYS1ニッカーゼ(メガベース)である。
NY2A:5’...RAG...3’
3’...YTC...5’(R=又はGであり、Y=C又はTである)
NYS1:5’...CC[A/G/T]...3’
3’...GG[T/C/A]...5’
ニッカーゼ反応からの生成物を引き続き化学的処理することによって、リン酸骨格が開裂され、フラグメントが生成する。
Fen−1断片化方法では、「フラップ」エンドヌクレアーゼとして知られる部位特異的ヌクレアーゼである酵素であるFen−1酵素が関与する(米国特許第5,843,669号、第5,874,283号、及び第6,090,606号)。この酵素は、標的DNA鎖とハイブリダイゼーションした2つのオリゴヌクレオチドの重複によって作り出されるDNA「フラップ」を認識して開裂する。この開裂は非常に特異的であり、単一塩基対変異を認識することができ、一方の対象SNPにおいて個々のヘテロ接合体から単一の同族体を検出し、次いでフラグメント内に存在する他方のSNPsにおいてその同族体をジェノタイピングすることが可能になる。Fen−1酵素は、Fen−1様ヌクレアーゼ、例えば、ヒト、ネズミ、及びツメガエルXPG酵素、並びに酵母RAD2ヌクレアーゼ、又は例えばM.ジャナスキー(M. jannaschii)、P.フュリオス(P. furious)、及びP.ウォウセイ(P. woesei)由来のFen−1エンドヌクレアーゼであることができる。
結核菌(M. tuberculosis)の存在を検出するための診断ツールとして開発中の別の技術を用いて、DNAキメラを開裂することができる。三連DNA−RNA−DNAプローブを結核菌特異的配列などの標的核酸にハイブリダイゼーションする。RNAseHを添加すると、キメラのプローブのRNA部分が消化され、DNA部分が放出される[Yule, Bio/Technology 12: 1335(1994)]。
断片化方法の任意の組み合わせ及び酵素の任意の組み合わせを用いて、フラグメントを形成することもできる。特定のフラグメントの生成方法を、ランダムフラグメントの生成方法と組み合わせることができる。さらに、ポリヌクレオチドを特定の部位で開裂する1つ以上の酵素を、ポリヌクレオチドを異なる部位で特異的に開裂する1つ以上の酵素と組み合わせて用いることができる。別の例では、特定の種類のポリヌクレオチドを開裂する酵素を組み合わせて用いることができ、例えば、RNaseをDNaseと組み合わせて用いることができる。さらに別の例では、ポリヌクレオチドをランダムに開裂する酵素をポリヌクレオチドを特異的に開裂する酵素と組み合わせて用いることができる。組み合わせて用いるとは、ポリヌクレオチドに対して1又は複数の方法を1つずつあるいは同時に行うことを意味する。
ペプチド断片化
プロテオミクスへの関心が研究分野で増大するにつれ、タンパク質配列決定で使用するためのタンパク質断片化について多くの技術が開発されている。これらの中の1つは、化学的加水分解及び酵素加水分解、並びにイオン化エネルギーによる断片化である。
タンパク質のN末端の逐次的開裂は当該技術分野で周知であり、エドマン分解を用いて行うことができる。このプロセスでは、N末端アミノ酸をフェニルイソチオシアナートと反応させてPTC−タンパク質とし、トリフルオロ酢酸と接触させたときにアニリノチアゾリノン中間体が形成する。中間体を開裂して、フェニルチオヒダントイン体に変換し、続いて分離し、標準物との比較によって同定する。タンパク質開裂を促進するために、タンパク質を還元し、ビニルピリジン又はヨードアセトアミドでアルキル化することができる。
臭化シアンを用いたタンパク質の化学的開裂が当該技術分野で周知である(Nikodem and Fresco, Anal. Biochem. 97: 382-386 (1979); Jahnen et al., Biochem. Biophys. Res. Commun. 166: 139-145 (1990))。臭化シアン(CNBr)は、タンパク質の最初の開裂のための最良の方法の1つである。CNBrは、タンパク質をメチオニル残基のC末端で開裂する。タンパク質中のメチオニル残基の数は、通常、少ないので、CNBrは、通常、大きなフラグメントをわずかに生じさせる。反応は、通常、70%ギ酸又は50%トリフルオロ酢酸中で、メチオニンに対して50〜100倍モル過剰の臭化シアンを用いて行われる。開裂は、通常、10〜12時間では定量的であるが、反応は、通常、24時間進行させる。あるMet−Thr結合は開裂されず、メチオニンの酸化により開裂を妨げることができる。
単一の末端アミノ酸を除去するための部分的な酸加水分解の方法を用いて、タンパク質を開裂することもできる。(Vanfleteren et al., BioTechniques 12: 550- 557(1992)。アスパラギン酸残基を含むペプチド結合はいずれかのアスパラギン酸残基部位上での酸開裂に対して特に感受性であるが、通常、非常に厳しい条件が必要である。加水分解は、通常、密封管内の濃塩酸又は定沸点塩酸中で、高温において、2〜18時間の種々の時間間隔で行われる。Asp−Pro結合は、88%ギ酸で37℃において開裂することができる。Asp−Pro結合は、他のAsp含有結合が非常に安定的である条件下で感受性であることが見出されている。好適な条件は、タンパク質(約5mg/ml)をピリジンでpH2.5に調整された10%酢酸中で、40℃において、2〜5日間インキュベーションすることである。
ポリペプチド鎖を開裂するために、酸性媒体中の臭素化試薬が用いられている。N−ブロモスクシンイミドなどの試薬は、トリプトファン、チロシン、及びヒスチジンを含むポリペプチドを種々の部位で開裂するが、不溶性生成物を生じる副反応をしばしば与える。BNPS−スカトール[2−(2−ニトロフェニルスルフェニル)−3−メチルインドール]は、トリプトファン残基のC末端部位でポリペプチド開裂を生じさせる温和な酸化剤かつ臭素化試薬である。
チロシン及びヒスチジンとの反応が起こることができるが、反応混合物中にチロシンを含めることによってこれらの副反応を顕著に低減することができる。典型的には、約10mg/mlのタンパク質を75%酢酸に溶解し、BNPS−スカトール及びチロシン(トリプトファン及びタンパク質チロシンより100倍過剰をそれぞれ与える)の混合物を加え、18時間インキュベーションする。ペプチドを含有する上清を遠心分離によって得る。
BNPS−スカトール処理条件下においても直面するAsp−Pro結合の温和な酸開裂の問題は別として、唯一の他の潜在的な問題は、メチオニン残基がいずれもメチオニンスルホキシドに変換されてしまい、次いで該メチオニンスルホキシドを臭化シアンによって開裂することができないとの事実である。BNPS−スカトール開裂から得られるペプチドのCNBr開裂が必要である場合、15%メルカプトエタノールとともに30℃で72時間インキュベーションすることによってメチオニン残基を再生することができる。
o−ヨードソ安息香酸でタンパク質を処理することによって、非常に温和な条件下でトリプトファン−X結合が開裂される。p−クレゾールとともに暗闇において室温で24時間予めインキュベーションしておいたヨード安息香酸(約2mg/mlのタンパク質)とともに、4M 塩酸グアニジンを含有する80%酢酸中のタンパク質をインキュベーションする。ジチオエリスリトールを添加することにより、反応を終結することができる。汚染物質であるo−ヨードキシ安息香酸はチロシン−X結合及び可能性としてヒスチジン−X結合における開裂を引き起こすので、精製したo−ヨード安息香酸の使用には注意をしなければならない。反応混合物中のp−クレゾールの作用は、残留しているo−ヨードキシ安息香酸の捕捉剤として作用し、開裂の選択性を向上させることである。
システイン残基含有ペプチドの開裂を生ずる2つの試薬が利用可能である。これらの試薬は、(2−メチル)N−1−ベンゼンスルホニル−N−4−(ブロモアセチル)キノンジイミド(さもなければ、「有機試薬によるシステイン特異的切断」用のシザー(Cyssor)として知られている)及び2−ニトロ−5−チオシアノ安息香酸(NTCB)である。いずれの場合も、開裂はシステインのアミノ末端部位で起こる。
ヒドロキシルアミンとともにタンパク質をインキュベーションすることによって、ポリペプチド骨格が断片化される(Saris etal., Anal. Biochem. 132: 54-67 (1983))。ヒドロキシルアミノ分解によって、任意のアスパラギニル−グリシン結合が開裂される。pH5.4の6M 塩酸グアニジン、20mM 酢酸ナトリウム、及び1%メルカプトエタノール中で約4〜5mg/mlの濃度のタンパク質をインキュベーションし、pH9.0の6M 塩酸グアニジン中の等体積の2M ヒドロキシルアミンを添加することにより、反応が起こる。得られた反応混合物のpHを0.1N NaOHを添加することによって9.0で維持し、反応を45℃において種々の時間間隔で進行させた。該反応は、0.1体積の酢酸を添加することによって終了することができる。ヒドロキシルアミンの不存在下で、環状イミド中間体の塩基によって触媒される再調整を行うことができ、α−アスパルチルグリシン及びβ−アスパルチルグリシンの混合物がペプチドが開裂することなく生ずる。
当該技術分野で既知である加水分解酵素を用いることによるタンパク質加水分解方法が多くある(Cleveland et al., J. Biol. Chem. 252: 1102-1106 (1977))。すべてのペプチダーゼ又はプロテアーゼは、タンパク質又はその部分加水分解物に作用してペプチド結合を分解するヒドロラーゼである。ネイティブなタンパク質は、プロテアーゼの劣った基質であり、通常、酵素開裂前に尿素で処理することによって変性させる。従来技術は、ペプチダーゼ、アミノペプチダーゼ、及びその他の酵素活性を示す多数の酵素を開示し、酵素は、脊椎動物、細菌、真菌、植物、レトロウイルス、及びある植物ウイルスを含む多数の生物に由来することができる。プロテアーゼは、例えば組換えタンパク質の単離に有用なものとされている。例えば、種々のプロテアーゼ、及び融合タンパク質由来の所望成分の単離におけるそれらの使用を記載している米国特許第5,387,518号、第5,391,490号、及び第5,427,927号を参照のこと。
プロテアーゼは、2つのカテゴリーに分けることができる。カルボキシペプチダーゼ及びアミノペプチダーゼが含まれるエキソペプチダーゼは、ポリペプチドから1又は複数のアミノ末端残基を取り除く。ポリペプチド配列内で開裂させるエンドペプチターゼは、タンパク質配列中の特定の残基の間で開裂させる。種々の酵素は、イオン強度、温度、時間、及びpHを含む最適な活性のための異なる必要なものを提示する。中性エンドプロテアーゼ(ニュートラーゼ(Neutrase)(登録商標)など)及びアルカリエンドプロテアーゼ(アルカラーゼ(Alcalase)(登録商標)及びエスペラーゼ(Esperase)(登録商標)など)並びに酸耐性カルボキシペプチダーゼ(カルボキシペプチダーゼ−Pなど)がある。
プロテアーゼについて、その活性を向上させ、かつ、その基質特異性を拡張するために、精力的な調査がされてきた(例えば、米国特許第5,427,927号;第5,252,478号;及び第6,331,427B1号を参照のこと)。プロテアーゼの標的を拡張するための1つの方法は、プロテアーゼによって必要とされる開裂配列を標的タンパク質中に挿入することである。最近では、タンパク質中のユーザーが定義する認識配列を開裂することが可能な部位特異的プロテアーゼ(「デザイナー・プロテアーゼ(designer proteases)」)の製造及び選択方法が開示されている(米国特許第6,383,775号を参照のこと)。
異なるエンドペプダーゼ酵素は、多様に選択される開裂部位でタンパク質を開裂する。例えば、エンドペプチターゼであるレニンは、以下の配列中のロイシン残基間で開裂させる:Pro−Phe−His−Leu−Leu−Val−Tyr(配列番号1)(Haffey, M. L. et al., DNA 6: 565 (1987))。Xa因子プロテアーゼは、以下の配列中においてArgの後で開裂させる:Ile−Glu−Gly−Arg−X;Ile−Asp−Gly−Arg−X;及びAla−Glu−Gly−Arg−X(Xは、プロリン又はアルギニン以外の任意のアミノ酸である)(それぞれ配列番号2〜4)(Nagai, K. and Thogersen, H. C., Nature 309: 810 (1984); Smith, D.B. and Johnson, K. S. Gene 67: 31 (1988))。コラゲナーゼは、以下の配列においてX及びY残基の後で開裂させる:−Pro−X−Gly−Pro−Y−(X及びYは、任意のアミノ酸である)(配列番号5)(Germino J. and Bastis, D., Proc. Natl. Acad. Sci. USA 81: 4692 (1984))。黄色ブドウ球菌(S.aureus)V8由来のグルタミン酸エンドペプチターゼは、酸条件又はグルタミン酸アルカリ条件下でのアスパラギン酸のカルボキシ側におけるペプチド結合の開裂に特異的なセリンプロテアーゼである。
トリプシンは、アルギニン、リシン、及びS−アミノエチル−システイン残基のカルボキシ側で特異的に開裂させるが、アルギニル−プロリン又はリシル−プロリン結合での開裂は全くないかほとんどない。ペプシンは、フェニルアラニン、ロイシン、及びグルタミン酸に対してC末端側を優先的に開裂するが、バリン、アラニン、又はグリシンでは開裂しない。キモトリプシンは、フェニルアラニン、チロシン、トリプトファン、及びロイシンのC末端側で開裂させる。アミノペプチダーゼPは、プロリン残基に隣接する任意のN末端アミノ酸の放出を担う酵素である。プロリンジペプチダーゼ(プロリダーゼ)は、カルボキシル末端位置にプロピル残基を有するジペプチドを分裂させる。
ペプチド又は核酸のイオン化断片化開裂
タンパク質又は核酸のイオン化断片化は、質量分光計(MS)のイオン化区域中でより高い電圧を用いてフラグメント化することにより、あるいはイオントラップ中で衝突誘起解離を用いたタンデム型MSにより、質量分析による分析中に行われる(例えば、Bieman, Methods in Enzymology, 193: 455-479(1990)を参照のこと)。アミノ酸又は塩基配列は、MSでの個々のアミノ酸残基又はヌクレオチド残基と関連する公表された質量を用いて、ペプチド又は核酸の得られたMS断片化パターンで観察される分子量の違いから推定する。
タンパク質の完全な配列決定は、ペプチド骨格に沿ったほとんどすべての残基でペプチドを開裂することによって成される。塩基性残基がN末端及び/又はC末端に位置している場合、正電荷は一般的に塩基性部位に局在しているので、衝突誘起解離(CID)スペクトルで生成されるほとんどのイオンはその残基を含む(Zaia, J. , in: Protein and Peptide Analysis by Mass Spectrometry, J. R. Chapman, ed. , pp. 29-41, Humana Press, Totowa, N. J., 1996; and Johnson, R. S. , et al., Mass Spectrom. Ion Processes, 86: 137-154 (1988)を参照のこと。)塩基性部位は断片化を限定された系の特定の娘イオンへと導くので、典型的には、塩基性残基の存在は得られたスペクトルを簡易なものとする。塩基性残基を欠くペプチドは、配列決定をより難しくするより複雑なフラグメントイオン混合物へと断片化する傾向がある。このことは、強い正電荷をN末端に結合することによって克服することができる。Johnson, R. S., et al., Mass Spectrom. ion Processes, 86: 137-154 (1988); Vath, J. E., et al., Fresnius Z Anal. Chem., 331: 248-252 (1988); Stults, J. T., et al., Anal. Chem., 65: 1703-1708 (1993); Zaia, J., et al., J Am. Soc. Mass Spectrom., 6: 423-436 (1995); Wagner, D.S., et al., Biol. Mass Spectrom., 20: 419-425 (1991); and Huang, Z. -H., et al., Anal. Biochem. , 268: 305-317 (1999)を参照のこと。タンパク質は、その分子量を変更する標識を含むように化学修飾することもでき、それによって、イオン化断片化によって生成される質量フラグメントの区別が可能になる。タンパク質を種々の作用物質で標識することは当該技術分野で既知であり、本明細書中の方法を実施するのに有用な非常に広範な標識化試薬及び技術が当業者に容易に利用可能である。例えば、Means et al., Chemical Modification of Proteins, Holden-Day, San Francisco,1971; Feeneyet al., Modification of Proteins: Food, Nutritional and Pharmacological Aspects, Advances in Chemistry Series, Vol. 198, American Chemical Society, Washington, D. C., 1982を参照のこと)。
本明細書中で記載される方法を用いて、多型検出、SNP走査、細菌及びウイルスのタイピング、病原体検出、抗生物質プロファイリング、生物同定、疾患マーカーの同定、メチル化分析、マイクロサテライト分析、ハプロタイピング、ジェノタイピング、対立遺伝子頻度の決定、多重処理、並びにヌクレオチド配列決定及び再配列決定を含むが限定するものではない種々の目的のために先に提供した特異的開裂によって得られる標的核酸又はペプチドフラグメントを分析することができる。
C.多型、変異、及び配列変化の発見ための技術
参照配列と相対的な標的配列中の変異、多型、又は他の配列変化を検出することができるスピードを増す技術を本明細書中に提供する。参照配列と相対的な標的配列中の既知の又は未知の配列変化を発見するための従前の方法は、参照配列のすべての可能な標的配列変化(置換、挿入、欠失、多型、及び種依存性変化を含む)について、その特定の標的配列のための所与の開裂試薬又は開裂試薬の組によって生じるであろう特定の断片化スペクトルをシミュレーションすることを伴うものであった。そのような従前の方法では、次いで、参照配列と相対的な標的配列中のすべての可能な配列変化によって生じるシミュレーションの各々を標的配列について得られる実際の断片化スペクトルに対して比較し、標的配列中に存在する実際の配列変化を決定する。そのような手法での問題は、すべての可能な配列変化のシミュレーションを生ずるために費やされる時間及び供給源が法外であり得ることである。
この問題に対処する1つの方法は、標的配列の開裂によって生じる実際の断片化パターンに対して断片化パターンをシミュレートして比較する所与の標的配列の可能な配列変化の数を減らすことである。本明細書中に提供する方法では、標的配列の実際の断片化スペクトルを生じている可能性が最も高いそれらの配列変化候補のみを出力するためのアルゴリズムを用いる。次いで、第2のアルゴリズムは、実際の標的配列断片化スペクトルに対して比較するためにこのサブセットの配列変化候補のみをシミュレーションする。したがって、シミュレーション分析のための配列変化の数が劇的に減少する。
本明細書中に提供する方法では、第1の工程において、標的配列の実際の開裂を同じ条件下における参照配列の実際の又はシミュレーションした開裂と相対的にすることによって得られる絶対的な違い(参照スペクトルと相対的な標的スペクトル中のシグナルの存在又は不存在)又は定量的な違い(シグナル強度又はシグナル対ノイズ比の違い)である標的配列及び参照配列間のシグナルの違いに対応するフラグメントを同定し、これらの「異なる」標的核酸フラグメントの質量を決定する。一度、異なるフラグメントの質量が決定されれば、質量が各異なるフラグメントの実際の測定される質量とは十分に小さい質量より小さいかそれと等しい値だけ異なる1つ以上の核酸塩基組成物(コンポマー)が同定される。これらのコンポマーをウィットネス・コンポマーと呼ぶ。この十分に小さい質量の違いの値は、質量がタイプ又は長さにおいて単一ヌクレオチドと同じだけ異なるフラグメント間のピーク分離などのパラメータ、及び質量分光計の絶対分解能によって決定される。4つの核酸塩基(RNAでは、A、G、C、T、若しくはU、又はそれらの修飾物、あるいはタンパク質では、アミノ酸若しくはそれらの修飾物)の1つ以上に特異的な開裂反応を用いて、十分に小さい質量の違いより小さいかそれと等しい値だけ各異なるフラグメントの測定質量と近いかそれと等しい特異的に開裂された各フラグメントについての可能なウィットネス・コンポマーを含むデータの組を生ずることができる。
本明細書中に提供する技術は、参照核酸と相対的な標的核酸のフラグメント間の違いに対応する可能なウィットネス・コンポマーから標的配列変化を再構築することができる。
アルゴリズム1:配列変化候補の発見
これは、標的核酸配列の1つ以上の特異的開裂反応の結果を分析するために用いる基礎技術である。第1の工程は、同じ参照核酸開裂反応と相対的な標的核酸開裂反応で生じる各異なるフラグメントの実際の質量とは十分に小さい質量の違いより小さいかそれと等しい値だけ質量が異なるすべての可能なコンポマーを同定する。これらのコンポマーを「コンポマー・ウィットネス」と呼ぶ。例えば、異なるフラグメントピークが2501.3Daで検出されると仮定する。例えば、+/−2Daのピーク質量間隔内の質量を有する天然のコンポマーだけが2502.6DaでA1421である。認識される塩基(ここではT)が開裂部位で除去されない開裂反応の場合には(例えば、UDGは開裂される塩基を除去するが、RNAseAは除去しない)、該認識塩基を差し引いて、コンポマーA142となる。このようにして検出されるすべてのコンポマーをコンポマー・ウィットネスと呼ぶ。
次いで、変異、多型、又は生物間の配列変化を含むが限定するものではない他の配列変化を多くてもk個有する各コンポマー・ウィットネスc’に形質転換することができるすべてのコンポマーを基礎技術により決定する。配列変化の位数であるkの値は、ユーザーによって予め定義され、限定するものではないが参照配列及び標的配列間の配列変化の予測されるタイプ及び数を含む多くのパラメータに依存し、例えば、配列変化が単一塩基であるか複数塩基であるか、あるいは配列変化が参照配列と相対的な標的配列上の1つの位置を表すか2つ以上の位置を表すかどうか、あるいは配列変化が標的配列中で互いに相互作用するかしないかに依存する。例えば、SNPsの検出では、kの値は、必ずしもではないが、通常は1又は2である。別の例として、変異の検出及び再配列決定では、kの値は、必ずしもではないが、通常は3以上である。
開裂部位が各副配列の2つの末端で存在しているか否かを示す境界bを有する参照配列の副配列の組に対応するすべてのコンポマーcの組をいう、有界コンポマーの組を構築する。有界コンポマーの組を可能なコンポマー・ウィットネスに対して比較し、参照配列と相対的な標的配列のすべての可能な配列変化を構築することができる。次いで、コンポマー・ウィットネス及び有界コンポマーの構築された対を用いて、アルゴリズムにより、同じ開裂条件下における参照配列と相対的な標的配列の断片化パターンの得られる違いを生ずるであろうすべての配列変化候補が構築される。
配列変化候補の決定により、参照配列の変化であるすべての可能な配列の断片化パターンをシミュレーションし、かつ、シミュレーションしたパターンを標的核酸配列の実際の断片化パターンと比較する従前の手法と相対的な、標的配列中の実際の配列変化を決定するために分析される配列変化の試料の組が有意に減る。
2つの関数d+及びd-は:
c(b)>0のbではd+(c):=Σ{A、C、G、T}中のbc(b)、
c(b)<0のbではd-(c):=Σ{A、C、G、T}中のbc(b)、
と定義され、関数d(c)は、d(c):=最大{d+(c),d-(c)}、及びd(c,c’):=d(c−c’)と定義される。これは、あるフラグメント、例えば、参照フラグメントを別のもの、例えば、標的フラグメントに変異させるのに必要である挿入、欠失、置換、及び他の配列変化の数をより低い結合に与える測量用関数である。f、f’がフラグメントであり、かつ、c、c’が対応するコンポマーである場合、fをf’に変換するために少なくともd(c,c’)配列変化が必要である。
記号列s(全長配列)の副記号列(フラグメント)はs[i,j]と表され、i、jは、1≦i≦j≦sの長さを満足する副記号列の出発及び終結位置を表す整数である。
コンポマー境界又は境界は、組{L,R}のサブセットである。bの可能な値は、{}(空のセット)、{L}、{R}、{L,R}である。境界bについて、#bはb中の要素の数、すなわち、0、1、又は2を表す。有界コンポマー(c,b)は、コンポマーc及び境界bを含む。有界コンポマーとは、開裂部位が各副配列の2つの末端に存在するか否かを示す境界を有する参照配列の副配列の組に対応するすべてのコンポマーcの組をいう。有界コンポマーの組を可能なコンポマー・ウィットネスに対して比較して、参照配列と相対的な標的配列のすべての可能な配列変化を構築することができる。
コンポマーc’及び有界コンポマー(c,b)の間の距離は:
D(c’,c,b):=d(c’,c)+#b、
と定義される。関数D(c’,c,b)は、コンポマー・ウィットネスc’を生ずるために必要である参照配列と相対的な配列変化の最小数を測定する。
記号列s中の開裂試薬によって認識される塩基、アミノ酸、又は他の特徴Xの特異的開裂反応が与えられたとき、副記号列s[i,j]又は対応するコンポマーc[i,j]の境界b[i,j]とは、記号列sの開裂が副記号列s[i,j]の直ぐ外で行われていないかを示すマーカーの組をいう。可能なマーカーは、「iの直前でsが開裂されていない」かを示すL、及び「jの直後でsが開裂されていない」かを示すRである。したがって、b[i,j]は、Xが記号列sのi−1位置に存在する場合に限りLを含み、かつ、Xが記号列sの位置j+1に存在する場合に限りRを含む、組{L,R}のサブセットである。#bは、副記号列s[i,j]が双方の直ぐ横の位置において(すなわち、i−1及びj+1の位置において)、あるいは片方の直ぐ横の位置において(すなわち、i−1又はj+1のいずれかの位置において)、あるいは直ぐ横の位置ではない位置において(すなわち、i−1n又はj+1のいずれの位置でもない位置において)特異的に開裂されたかに依存して0、1、又は2であることができる組b中の要素の数を表す。b[i,j]は、組{L,R}のサブセットであり、以下によって定義されるs[i,j]の境界を表す:
・b[i,j]:={L,R}(sがiの前及びjの後で直接開裂されない場合)
・b[i,j]:={R}(sがiの前で直接開裂されるがjの後で直接開裂されない場合)
・b[i,j]:={L}(sがjの後に直接開裂されるがiの前に直接開裂されない場合)
・b[i,j]:={}(sがiの前及びjの後で直接開裂される場合)。
#b[i,j]は、組b[i,j]の要素の数を表す。
sのすべての有界コンポマーの組は、C:={(c[i,j],b[i,j]):1≦i≦j≦sの長さ}と定義され、副記号列s[i,j]に対応するコンポマーはc[i,j]と表される。
変異、多型、又は生物間の配列変化、挿入、欠失、及び置換を含むが限定するものではない他の配列変化を含む標的配列の配列変化を多くてもk個含む標的配列のすべての配列変化があり(通常、核酸では、kは配列変化中の単一塩基の変化の数を表すであろう)、かつ、c’がこの配列変化のコンポマー・ウィットネスである場合、有界コンポマー(c,b)がC中にD(c’,c,b)≦kとなるように存在する。言い換えれば、参照配列と相対的な標的配列中の異なるシグナルに対応し、かつ、コンポマー・ウィットネスc’に対応する異なるフラグメントを生ずる変異、多型、又は生物間の配列変化、挿入、欠失、及び置換を含むが限定するものではない他の配列変化を多くてもk個含む標的配列のすべての配列変化のうち(通常、核酸では、kは配列変化中の単一塩基の変化の数を表すであろう)、D(c’,c,b)≦kとの特性を有する有界コンポマー(c,b)がC中に存在する。したがって、考慮しているフラグメントの数を多くともk個の開裂点:Ck:={(c[i,j]、b[i,j]):1≦i≦j≦sの長さ、及びord[i,j]+#b[i,j]≦k}(ord[i,j]とは、フラグメントs[i,j]が開裂される回数をいう)を含む数まで頂度減らすことができる。
アルゴリズム1:配列変化候補の発見
入力:参照配列s(又は2つ以上の参照配列)、修飾ヌクレオチド又はアミノ酸を配列のすべて又は一部に導入するかの開裂反応の記載、異なるフラグメントに対応するピークのリスト(消失シグナル、又は追加シグナル、又は参照配列と相対的な標的配列の定性的違いのいずれか)、最大の配列変化位数k。
出力:挿入、欠失、及び置換を多くてもk個含み、かつ、ウィットネスとして異なるピークを有する参照配列のリスト。
・参照配列及び特異的開裂反応が与えられたとき、Ck中のすべての有界コンポマー(c[i,j]、b[i,j])を計算処理し、それらを指数i、jとともに保存する。これは、通常、分析される標的配列を含む試料に依存し、通常は1回行う。
・すべての異なるピークについて、十分に小さい質量の違いだけピーク質量に近い質量を有するすべてのコンポマーを見つけ、それをコンポマー・ウィットネスとして保存する。
・すべてのコンポマー・ウィットネスc’について、D(c’,c,b)≦kであるようなCk中のすべての有界コンポマー(c,b)を見つける。
・指数i、jを有するすべてのそのような有界コンポマー(c,b)について:
・bがLである場合には位置iの直前で開裂された塩基又はアミノ酸に直接に挿入/置換し、
・bがRである場合には位置jの直後で開裂された塩基又はアミノ酸に直接に挿入/置換するように、挿入、欠失、及び置換を多くてもk個用いて、sのすべての配列変化を計算処理して新しい参照配列s’にする。
・対応するコンポマーcを有するフラグメントf=s[i,j]を対応するコンポマーc’を有するs’のいくつかのフラグメントf’に変換する#bの挿入、欠失、及び挿入を多くてもk個用いる。
・すべてのそのような配列変化を出力する。
図1は、上記の基準を満たすそれらの配列変化候補を決定するためのデータ分析に従わるコンピュータシステムによって実行される操作を図示したフローチャートである。ボックス102によって示される第1の操作では、1つ以上の開裂試薬を用い、当業者に周知であり本明細書中に記載される技術を用いて、標的分子をフラグメントに開裂する。ボックス104によって表される次の操作では、同じ開裂試薬を1つ以上用いて、参照分子を実際に又は仮想的に(シミュレーションにより)フラグメントに開裂する。開裂反応によって生成されるフラグメントから、標的及び参照配列についての質量スペクトルなどのデータが生じる。生じたデータを用いて、標的配列及び参照配列間の違いを表すフラグメントに対応する配列データのピークのリストを抽出することができる。
次の操作は、同定された異なるフラグメントに基づいて配列変化候補の減少した組を決定することである。この操作はボックス106によって表されている。次いで、配列変化候補をスコア付けし(ボックス108)、標的配列中の実際の配列変化に対応する配列変化候補をスコアの値に基づいて同定する。通常、標的配列の試料の組で、最も高いスコアは標的分子中の最も起こり得そうな配列変化を表すが、単一の標的配列が存在する場合には、正のスコアを検出するなどの他の選択規則を用いることもできる。
本明細書中に記載される代表的な実施態様では、開裂反応から生じたデータは分子情報分析用の慣用の実験室装備の出力を含む。そのような出力は、平文など、あるいはワード処理フォーマットによる、あるいは所有コンピュータデータ表示による種々のデジタルデータフォーマットで容易に利用可能である。
上記の通り、同定された異なるフラグメントに基づいて配列変化候補の減少した組を決定するプロセスは、プログラムされたコンピュータで行うことが好ましい。図2は、配列変化候補の減少した組を決定するためにコンピュータシステムによって実行される操作を図示したフローチャートである。
ボックス202によって表される第1の操作では、上記の反応データをCk中のすべての有界コンポマー(c[i,j],b[i,j])を計算処理するように処理し、参照配列s及び上記の特異的開裂反応データに従って指数i、jと一緒に保存する。ボックス204によって表される次の操作は、すべての異なるピークについて、ピーク質量に合理的に近い十分に小さい質量の違いだけピーク質量とは異なる質量を有するすべてのコンポマーを見つけることである。十分に小さい質量の違いの値は、限定するものではないが質量がタイプ又は長さにおいて単一ヌクレオチドだけ異なるフラグメント間のピーク分離及び質量分光計の絶対分解能を含むパラメータによって決定される。これらのコンポマーをコンポマー・ウィットネスとして保存する。コンポマー・ウィットネスを同定した後、次の操作は、ボックス204から同定されるすべてのコンポマー・ウィットネスc’について、D(c’,c,b)≦kであるようなCk中のすべての有界コンポマー(c,b)を見つけることである。有界コンポマーの操作は、ボックス206により表される。ボックス208は:
・bがLである場合には位置iの直前の開裂された塩基又はアミノ酸に直接に挿入/置換し;
・bがRである場合には位置jの直後の開裂された塩基又はアミノ酸に直接に挿入/置換し;
・対応するコンポマーcを有するフラグメントf=s[i,j]を対応するコンポマーc’を有するs’のいくつかのフラグメントf’に変換する#bの挿入、欠失、及び挿入を多くてもk個用いる
ように、挿入、欠失、及び置換を多くてもk個用いて、sのすべての配列変化を計算処理して新しい参照配列s’にすることを伴う操作を表す。
ボックス210によって示される最後の操作は、システム出力としてボックス208から計算処理されたすべてのそのような配列変化候補を生じさせることである。ここで、d(c,c’)は、cをc’に変換するのに必要とされる配列変化、多型、又は変異(挿入、欠失、置換)の最小数を決定する本明細書中で定義される関数であり、cは、参照分子のフラグメントのコンポマーであり、c’は、cフラグメントの変異から生じた標的分子のコンポマーである。
記号列s(全長配列)の副記号列(フラグメント)はs[i,j]と表され、i、jは、副記号列の出発及び末端位置である。記号列s中の開裂試薬によって認識される塩基、アミノ酸、又は他の特徴Xの特異的開裂反応が与えられたとき、副記号列s[i,j]又は対応するコンポマーc[i,j]の境界b[i,j]とは、記号列sの開裂が副記号列s[i,j]の直ぐ外で行われていないかを示すマーカーの組をいう。可能なマーカーは、「iの直前でsが開裂されていない」かを示すL、及び「jの直後でsが開裂されていない」かを示すRである。したがって、b[i,j]は、Xが記号列sのi−1位置に存在する場合に限りLを含み、かつ、Xが記号列sの位置j+1に存在する場合に限りRを含む、組{L,R}のサブセットである。#bは、副記号列s[i,j]が双方の直ぐ横の位置において(すなわち、i−1及びj+1の位置において)、あるいは片方の直ぐ横の位置において(すなわち、i−1又はj+1のいずれかの位置において)、あるいは直ぐ横の位置ではない位置において(すなわち、i−1n又はj+1のいずれの位置でもない位置において)特異的に開裂されたかに依存して0、1、又は2であることができる組b中の要素の数を表す。b[i,j]は、組{L,R}のサブセットであり、以下によって定義されるs[i,j]の境界を表す:
・b[i,j]:={L,R}(sがiの前及びjの後で直接開裂されない場合)
・b[i,j]:={R}(sがiの前で直接開裂されるがjの後で直接開裂されない場合)
・b[i,j]:={L}(sがjの後に直接開裂されるがiの前に直接開裂されない場合)
・b[i,j]:={}(sがiの前及びjの後で直接開裂される場合)。
#b[i,j]は、組b[i,j]の要素の数を表す。
ord[i,j]とは、副記号列s[i,j]が特定の開裂反応で開裂される回数、すなわち、[i,j]中に存在するsカット記号列の数をいう。
D(c’,c,b):=d(c,c’)+#bとは、コンポマーc’及び有界コンポマー(c,b)’の間の距離、すなわち、必要な場合には、カット記号列中に副記号列s[i,j]の境界の配列変化を含むコンポマーcを有するフラグメントからコンポマーc’を有するフラグメントを作り出すために必要とされる変化の最小数の合計をいう。
C:={(c[i,j],b[i,j]):1≦i≦j≦sの長さ}とは、記号列s内のすべての有界コンポマーの組をいう。すなわち、すべての可能な副記号列s[i,j]について、有界コンポマー(c[i,j],b[i,j])を見つけ、これらは組Cに属する。
k:={(c[i,j],b[i,j]):1≦i≦j≦sの長さ、及び/又はd[i,j]+#b[i,j]≦k}は、カット記号列の配列変化をk個の数より多く含む副記号列についてのコンポマーが組から除外されること、すなわち、CkがCのサブセットであることを除き、上記のCと同じである。挿入、欠失、及び置換を多くてもk個含む配列変化があり、かつ、c’がこの配列変化のピークウィットネスに対応するコンポマーである場合、(c,b)がCk中にD(c’,c,b)≦kとなるように存在することを示すことができる。アルゴリズムは、コンポマー・ウィットネスに対応する可能な配列変化のこの減少した組に基づく。
このように構築されたすべての配列変化によって、異なる入力ピークのリストの中から少なくとも1つの異なるピークが作り出される。さらに、アルゴリズムによって構築されていない挿入、欠失、及び挿入を多くてもk個含むすべての配列変化は、構築された1つ以上の配列変化のまとまりのスーパーセットであるか、あるいはアルゴリズムの入力として働いた異なるピークのリストの中から異なるピークを何ら作り出さない。
アルゴリズム1を、参照断片化パターンと相対的な2つ以上の標的断片化パターンを生ずる2つ以上の特異的開裂試薬及びコンポマー・ウィットネスの2つ以上のリストについて繰り返すことができる。一実施態様では、最終出力は、各開裂反応についての配列変化候補の組のまとまりである配列変化候補の組を含む。
アルゴリズム2
第2のアルゴリズムを用いて、計算処理された各出力配列変化候補についてシミュレーションしたスペクトルを生ずる。以下に記載する第3の(スコア付け)アルゴリズムを用いて、各配列変化候補についてシミュレーションしたスペクトルを実際の標的スペクトルに対してスコア付けし、参照配列に参照スペクトルを適用する。次いで、スコアの値(スコアが高いほどマッチングが良好であり、最も高いスコアは、通常、最も存在する可能性の高い配列変化である)を用いて、標的核酸配列中に実際に存在する配列変化候補を決定する。
検出する配列変化がSNPsである場合の代表的なアルゴリズムを以下に提供する。ホモ接合又はヘテロ接合対立遺伝子変化を含む他のタイプの配列変化を検出するためのアルゴリズムは、同様の様式で実行することができる。a)各開裂反応について、シミュレーションしたスペクトルを所与の配列変化候補についてアルゴリズム1から生じる。b)シミュレーションしたスペクトルを実際の標的スペクトルに対してスコア付けする。c)所与の標的配列についてのすべての開裂反応由来のスコア、好ましくは相補的な開裂反応由来のスコアを加える。2つ以上の特異的開裂反応を用いることによって、特定の配列変化を同定することができる精度が向上する。d)すべてのスコアをすべての配列変化について計算した後、配列変化をそれらのスコアに従って保存する。
アルゴリズム2:SNPsの発見
入力:参照配列s、1つ以上の開裂反応、すべての開裂反応についてのシミュレーションした又は実際の参照断片化スペクトル、すべての開裂反応についての対応する試料スペクトル中に見出されるピークのリスト、最大の配列変化位数k。
出力:挿入、欠失、及び置換を多くてもk個含む配列変化に対応し、かつ、ウィットネスとして異なるピークを有するすべてのSNP候補のリスト、すべてのそのようなSNP候補についてのスコア。
・すべての開裂反応について、試料スペクトルをシミュレーションした参照スペクトルと比較することによって異なるピークのリストを抽出する。
・すべての開裂反応について、配列変化候補の発見(アルゴリズム1)を入力s、現在の開裂反応、異なるピークの対応リスト、及びkとともに用いる。
・配列変化候補の発見によって戻される配列変化候補のリストを合わせて単一のリストとし、重複を除く。
・すべての配列変化候補について、配列変化候補を適用し、配列s’を生ずる。
・すべての開裂反応について、所与の開裂反応下でs’の参照スペクトルをシミュレーションする。
・SNPのスコア付け(アルゴリズム3)を入力としてのs、s’のスペクトルに対応するピークリスト及び測定される試料スペクトルについてのピークリストとともに用い、開裂反応についてこの配列変化(又はSNP)候補のスコア(ヘテロ接合体及びホモ接合体)を計算する。
・すべての開裂反応のスコアを合計し、ヘテロ接合体及びホモ接合体変化についての別々のスコアを維持する。
・配列変化候補を含むSNP候補及びそのスコアを保存する。SNP候補の全スコアは、そのヘテロ接合体及びホモ接合体のスコアの最大値である。
・SNP候補をそのスコアに関して分類する。
・SNP候補をそのスコアと一緒に出力する。
スコア付け用アルゴリズムであるSNPのスコア付けの代表的な実行は、以下の通りである。
アルゴリズム3:
SNPのスコア付け
入力:参照配列に対応するピークリスト(Lと表される)、修飾参照配列に対応するピークリストs’(L’と表される)、及び試料スペクトルに対応するピークリスト(LSと表す)
出力:ヘテロ接合体スコア、ホモ接合体スコア。
・両方のスコアを0に設定する。
・違いを示すs、s’に対応するそれらのピークをリスト中に含む強度変化のリスト(Lと表される)を計算処理する。
・ピークがLに存在するがL’に存在しない場合、このピークをLに加え、それを野生型としてマークする。
・ピークがL’に存在するがLに存在しない場合、このピークをLに加え、それを変異体型としてマークする。
・ピークがL及びL’において異なる予測強度を有する場合、このピークをLからL’までの予測強度変化と一緒にLに加える。
・Lsにも見出される変異体型としてマークされたL中のすべてのピークについて、双方のスコアに+1を加える。
・Lsにも見出されない変異体型としてマークされたL中のすべてのピークについて、双方のスコアに−1を加える。
・Lsにも見出される野生型としてマークされたL中のすべてのピークについて、双方のスコアに+1を加える。
・Lsにも見出されない野生型としてマークされたL中のすべてのピークについて、双方のスコアに−1を加える。
・双方のスコアを出力する。
スコア付け機能の他の実行は、当業者に明らかである。例えば、ある実行は、変異体又は野生型のいずれかとして区別されないピークを利用するであろう。別の実行は、さらにあるいは別々の特徴として、L、L、及びLsの強度を考慮する。他の代表的なパラメータには、「野生型」に指定されたピークを用いてヘテロ接合体スコアを修正すること、又は実際の(測定された)標的配列断片化スペクトルの信頼レベルに基づいた重み関数の導入が含まれる。好ましい実行は、対数尤度手法を用いてスコアを計算することができる。
一実施態様では、潜在的なSNPs出力のスコアをアルゴリズム2によって直接に用いる代わりに、同じSNPを含むと予測されるあるいは実際に含む2つ以上の標的配列由来のスコアを合わせることができる。2つ以上の標的配列を同じ参照配列に対して同時に分析する場合、各標的配列についてSNPスコアを独立して報告する代わりに、異なる標的配列についてスコア付けした同一の配列変化のすべてのスコアを合わせてSNPについて合わせたスコアを計算してもよい。最大スコア、合計スコア、又はそれらの組み合わせが含むことができるが限定するものではない関数をスコアの組に適用することによって、合わせたスコアを計算することができる。
スコアを有するすべてのSNP又は他の配列変化候補を計算した後、閾値スコアを決定し、閾値スコアと等しいかそれより高いスコア(したがって、本物である、すなわち、標的配列中の実際の配列変化に対応する合理的な見込み)を有するそれらのSNPs又は配列変化だけを報告することができる。一般的に、最も高いスコアを有する配列変化は、標的配列中の実際の配列変化に対応する。次いで、本物として受け入れられる配列変化を用いて、最初の参照ピークリストLを修正する。次いで、修正されたピークリストを用い、スコアSNPアルゴリズムを用いてすべての他の可能性のある配列変化又はSNPsを再評価し(スコア付けし)、あるいはホモ接合SNPsの場合には新しいウィットネスの検索さえすることができる。これにより、SNP又は他の配列変化検出の反復プロセスに至る。例えば、標的配列中の2つ以上の配列変化を検出するための反復プロセスでは、最も高いスコアを有する配列変化は、実際の配列変化として受け取られ、この配列変化に対応するシグナル又はピークを参照フラグメントスペクトルに加え、アップデートした参照フラグメントスペクトルを生ずる。次いで、すべての残りの配列変化候補をこのアップデートした参照フラグメントスペクトルに対してスコア付けし、次に最も高いスコアを有する配列変化候補を出力する。この第2の配列変化候補は、標的配列中の第2の実際の配列変化を表すこともできる。したがって、第2の配列変化に対応するピークを参照フラグメントスペクトルに加えて第2のアップデートした参照スペクトルを生ずることができ、該第2のアップデートした参照スペクトルに対して第3の配列変化をそのスコアに従って検出することができる。この反復プロセスは、標的配列中の実際の配列変化を表す配列変化候補が同定されなくなるまで繰り返すことができる。提示した手法は、2、1と1/2、又は1と1/4の塩基のカッターを含む、任意のタイプ及び数の完全開裂反応に適用することができる。別の実施態様では、この手法を部分開裂実験に適用することができる。
この手法は、SNP及び変異検出に限定されるものではなく、多型、変異、及び配列決定エラーを含む任意のタイプの配列変化を検出するために適用することができる。
提示したアルゴリズムは均一な試料を取り扱うことができるので、その使用を試料混合物の分析にまで拡大することができることは当業者に明らかである。そのような「試料混合物」は、通常、非常に低い頻度で配列変化又は変異又は多型を含む標的核酸を大過剰の野生型配列とともに含む。例えば、腫瘍では、腫瘍を引き起こす変異は、通常、2つ以上の組織型又は細胞型の不均一混合物である腫瘍試料中に存在する核酸の5〜10%未満存在する。同様に、個体の集団では、例えば、疾患状態又は疾患の素因を決定付ける機能的因果関係を有するほとんどの多型は、5%未満の低い対立遺伝子頻度で発生している。本明細書中に提供する方法は、高い頻度の配列変化を検出することができ、あるいは約5〜10%未満の範囲で存在する低い頻度の変異、配列変化、対立遺伝子、又は多型を検出するように適合することができる。
D.用途
1.多型の検出
本明細書での目的は、疾患のゲノム主成分及びそれらのマーカーを同定するための改良方法を提供することである。本明細書中に提供する方法におよって同定される配列変化候補には、多型である配列変化を含む配列が含まれる。多型には、天然に存在する体細胞性配列変化及び変異から生ずるもの双方が含まれる。多型には、局在領域中の2個以上のヌクレオチドが個体ごとに種々異なる配列微小変異体、1個のヌクレオチドから数百万の塩基までサイズが種々異なる挿入及び欠失、及びマイクロサテライト又は多数のリピートによって種々異なるヌクレオチドリピートが含まれるが、限定するものではない。ヌクレオチドリピートには、ジヌクレオチドリピート、トリヌクレオチドリピート、テトラヌクレオチドリピート、又はより大きいリピートなどの同じ配列が複数回繰り返される均一なリピートが含まれ、配列モチーフが繰り返されているのが見られるへテロヌクレオチドリピートも含まれる。所与の座では、ヌクレオチドリピートの数は個体に依って種々異なる。
多型マーカー又は部位は、多様性が起こる座である。そのような部位は、1塩基対の小ささ(SNP)であることができる。多型マーカーには、制限酵素断片長多型(RFLP)、可変数タンデムリピート(VNTR)、超可変領域、ミニサテライト、ジヌクレオチドリピート、トリヌクレオチドリピート、テトラヌクレオチドリピート、及び他の繰り返しパターン、単一配列リピート、及びAluなどの挿入エレメントが含まれるが、限定するものではない。多型の形態は、遺伝子についての異なるメンデル対立遺伝子としても顕在化される。多型は、タンパク質の違い、タンパク質修飾、RNA発現修飾、DNA及びRNAのメチル化、遺伝子発現及びDNA複製を変える調節因子、並びにゲノム核酸又は細胞小器官核酸における任意の他の変化の顕在化によって観察することができる。
さらに、多数の遺伝子が多型領域を有する。個体は、多型領域のいくつかの対立遺伝子変異体の任意の1つを有するので、遺伝子の多型の領域の対立遺伝子変異体のタイプに基づいて個体を同定することができる。例えば法医学の目的のためにこれを用いることができる。他の状況において、個体が有する対立遺伝子変異体の同一性を知ることは極めて重大である。例えば、ある種の遺伝子、例えば、主要組織適合性複合体(MHC)遺伝子における対立遺伝子の違いは、骨髄移植における移植片拒絶反応又は移植片対宿主病に関与している。したがって、遺伝子の多型領域の対立遺伝子変異体又は遺伝子傷害の同一性を決定するための迅速で、高感度で、かつ正確な方法を開発することは非常に望ましい。本明細書中に提供する方法又はキットを用いて、被検体の1つ以上の遺伝子又は染色体中の1つ以上の多型領域の1つ以上の対立遺伝子変異体の同一性を決定することによって被検体をジェノタイピングすることができる。本明細書中に提供する方法を用いて被検体をジェノタイピングすることは法医学又は同一性試験の目的に用いることができ、多型領域はミトコンドリア遺伝子中に存在することができ、あるいはショートタンデムリピートであることができる。
単一ヌクレオチド多型(SNPs)は一般的に二対立遺伝子系であり、すなわち、個体が任意の特定マーカーについて有することができる2つの対立遺伝子がある。これは、10個の対立遺伝子の上流を有することができるマイクロサテライトマーカーと比較した場合に、SNPマーカーあたりの情報内容が比較的低いことを意味する。SNPsは、非常に集団特異的である傾向があり、ある集団中で多型であるマーカーは別ではあまり多型であることができない。およそキロベース毎に見出されるSNPs(Wang et al. (1998) Science 280: 1077-1082を参照のこと)は、対象遺伝子又は領域についてのハプロタイピング系の開発に非常に有用な非常に高密度の遺伝子地図をジェノタイピングする可能性を提供し、SNPsの性質に起因して、それらは、実は、研究中の疾患の表現型と関連する多型であることができる。SNPsの変異率が低いことによって、それらは複雑な遺伝子形質を研究するための優れたマーカーとなる。
ゲノムミクスの焦点はほとんど、種々の理由のために重要であるSNPsの同定に集中している。SNPsによって、(ハプロタイプの関連性の)間接試験及び(機能性変異体の)直接試験が可能となる。SNPsは、最も豊富で安定した遺伝子マーカーである。一般的な疾患は、一般的な遺伝子変化によって最も良く説明され、ヒト集団における生来的な変化は疾患、治療、及び環境的相互作用の理解を助ける。
2.病原体タイピング
微生物株の同定プロセス又は方法を本明細書中で提供する。微生物は、限定するものではないが細菌、真菌、原生動物、繊毛虫類、及びウイルスを含む種々の生物から選択される。微生物は、特定の属、種、株、又は血清型に限定されない。1又は複数の参照配列と相対的な標的微生物配列中の配列変化を決定することによって、微生物を同定することができる。参照配列は、例えば、同じ又は異なる属、種株、若しくは血清型由来の他の微生物、又は宿主原核生物若しくは真核生物から得ることができる。
細菌病原体の同定及びタイピングは、感染性疾患の臨床管理に非常に重要である。微生物の正確な同一性は、疾患状態を健康状態から区別するために用いられるだけではなく、どの抗生物質又は他の抗菌治療が治療に最も好適であるかを決定するための基礎とすることができる。病原体タイピングの伝統的方法は、増殖特性、色、細胞、又はコロニー形態、抗生物質感受性、染色、臭い、及び細菌を同定するための特異的抗体との反応性を含む種々の表現型の特徴を用いてきた。これらの方法はすべて、疑いのある病原体の培養を必要とし、材料費及び人件費が高いこと、働き手の暴露の危険性、取り扱いの誤りに起因した偽陽性、及び生存能力のある細胞の数が低いこと又は培養条件が面倒な培養での多くの病原体が必要とするものに起因した擬陰性を含む多くの深刻な欠点に苛まれる。さらに、培養方法は診断を行うために比較的長い時間を必要とし、そのような感染が生命を脅かす可能性のある性質があるために、結果が得られる前に抗菌治療をしばしば始める。
多くの場合、病原体は正常なフロラを作る生物に非常に類似し、先に引用した方法によって無害の株と区別することができない。これらの場合、病原株の存在の決定には、本明細書中に提供する分子タイピング方法によって与えられるより高い分解能が必要となる。例えば、標的核酸配列をPCR増幅し、続いて特異的開裂(例えば塩基特異的)によって断片化を行い、続いてマトリクス支援レーザー脱離/イオン化飛行時間型質量分析を行い、続いて本明細書中に提供する配列変化についてスクリーニングすることにより、ヌクレオチドがたった1つだけ異なる配列の信頼できる区別が可能となり、MALDI−TOF MSのスピードで生じる配列情報の識別力を併せ持つ。
3.感染を示すウイルス又は細菌核酸配列の存在の検出
本明細書中に提供する方法を用いて、1つ以上の参照配列と相対的なウイルス又は細菌核酸配列中に存在する配列変化を同定することより、感染を示すウイルス又は細菌核酸配列の存在を決定する。参照配列には、関連する非感染性生物から得られる配列又は宿主生物由来の配列が含まれるが、限定するものではない。
ウイルス、細菌、真菌、及び他の感染生物は、宿主細胞に含まれる配列とは異なる多型を含む区別される核酸配列を含む。標的DNA配列は、例えば、細菌及びそのファージ、ウイルス、真菌、原生動物などを含む侵入微生物のゲノムなどの外来遺伝子配列の一部であることができる。本明細書中に提供するプロセスは、例えば適切な治療介入を選ぶための微生物の異なる変異体又は株の区別に特に適用可能である。ヒト及び動物に感染し、かつ、開示したプロセスによって検出することができる疾患を引き起こすウイルスの例には、レトロウイルス科(例えば、HIV−1(HTLV−III、LAV、又はHTLV−III/LAVとも呼ばれる;Ratner et al., Nature, 313: 227-284 (1985); Wain Hobsonet al., Cell, 40: 9-17 (1985))、HIV−2(Guyader et al., Nature, 328: 662-669 (1987);欧州特許公開公報第0269520号;Chakrabarti et al., Nature, 328: 543-547(1987);欧州特許出願第0655501号)、及びHIV−LPなどの他の分離株(国際公開公報第W094/00562号)などのヒト免疫不全ウイルス;ピコルナウイルス科(Picornaviridae)(例えば、ポリオウイルス、A型肝炎ウイルス(Guste et al., Intervirology, 20: 1-7 (1983));エンテロウイルス、ヒトコクサッキーウイルス、ライノウイルス、エコーウイルス);カルシウイルス科(Calcivirdae)(例えば、胃腸炎を引き起こす株);トガウイルス科(Togaviridae)(例えば、ウマ脳炎ウイルス、風疹ウイルス};フラビウイルス科(Flaviridae)(例えば、デング熱ウイルス、脳炎ウイルス、黄熱病ウイルス);コロナウイルス科(Coronaviridae)(例えば、コロナウイルス);ラプドウイルス科(Rhabdoviridae)(例えば、水疱性口内炎ウイルス、狂犬病ウイルス);フィロウイルス科(Filoviridae)(例えば、エボラウイルス);パラミクソウイルス科(Paramyxoviridae)(例えば、パラインフルエンザウイルス、ムンプスウイルス、麻疹ウイルス、呼吸器系合胞体ウイルス);オルソミクソウイルス科(Orthomyxoviridae)(例えば、インフルエンザウイルス);ブニヤウイルス科(Bugnaviridae)(例えば、ハンターンウイルス、ブニヤウイルス、フレボウイルス、及びナイロウイルス);アレナウイルス科(Arenaviridae)(出血熱ウイルス);レオウイルス科(Reoviridae)(例えば、レオウイルス、オルビウイルス、及びロタウイルス);ビルナウイルス科(Birnaviridae);ヘパドナウイルス科(Hepadnaviridae)(B型肝炎ウイルス);パルボウイルス科(Parvoviridae)(パルボウイルス);パポバウイルス科(Papovaviridae);ヘパドナウイルス科(Hepadnaviridae)(B型肝炎ウイルス);パルボウイルス科(Parvoviridae)(ほとんどのアデノウイルス);パポバウイルス科(Pavovaviridae)(パピローマウイルス、ポリオーマウイルス);アデノウイルス科(Adenoviridae)(ほとんどのアデノウイルス);ヘルペスウイルス(Herpesviridae)(I型単純ヘルペスウイルス(HSV−1)及びHSV−2、水痘帯状疱疹ウイルス、サイトメガロウイルス、ヘルペスウイルス;ポックスウイルス科(痘瘡ウイルス、ワクシニアウイルス、ポックスウイルス);イリドウイルス科(Iridoviridae)(例えば、アフリカブタ熱ウイルス);及び未分類のウイルス(例えば、海綿様脳症の病因作用物質、デルタ型肝炎の作用物質(B型肝炎ウイルスの欠損サテライトであると考えられている)、非A型非B型肝炎の作用物質(クラス1=内部感染する;クラス2=非経口的に感染する、すなわち、C型肝炎);ノーウォーク及び関連ウイルス、及びアストロウイルスが含まれるが、限定するものではない。
感染性細菌の例には、ヘリコバクターピロリ(Helicobacter pyloris)、ボレリア・バーグドフェリ(Borelia burgdorferi)、レジオネラ・ニューモフィラ(Legionella pneumophila)、マイコバクテリア種(Mycobacteria sp.)(例えば、結核菌(M. tuberculosis)、鳥結核菌(M. avium)、M.イントラセルラー(M. intracellulare)、M.カンサイ(M. kansaii)、M.ゴルドナエ(M. gordonae))、黄色ブドウ球菌、淋菌(Neisseria gonorrhoeae)、髄膜炎菌(Neisseria meningitidis)、リステリア菌(Listeria monocytogenes)、化膿連鎖球菌(Streptococcus pyogenes)(A群連鎖球菌)、ストレプトコッカス・アガラクティー(Streptococcus agalactiae)(B群連鎖球菌)、連鎖球菌(ビリダンス群)、大便連鎖球菌(Streptococcus faecalis)、ウシ型連鎖球菌(Streptococcus bovis)、連鎖球菌種(嫌気性種)、肺炎連鎖球菌(Streptococcus pneumoniae)、病原体カンピロバクター種、腸球菌種、インフルエンザ菌(Haemophilus influenzae)、炭疽菌(Bacillus antracis)、ジフテリア菌(Corynebacterium diphtheriae)、コリネバクテリウム種(Corynebacterium sp.)、豚丹毒菌(Erysipelothrix rhusiopathiae)、ウェルシュ菌(Clostridium perfringens)、破傷風菌(Clostridium tetani)、エンテロバクター・アイロゲネス(Enterobacter aerogenes)、肺炎桿菌(Klebsiella pneumoniae)、パスツレラ・マルトシダ(Pasturella multocida)、バクテロイデス種(Bacteroides sp.)、フゾバクテリウム・ヌクレタム(Fusobacterium nucletum)、ストレプトバシラス・モニリフォルミス(Streptobacillus moniliformis)、梅毒トレポネーマ(Treponema palridium)、フランベジアトレポネーマ(Treponema peitenue)、レプトスピラ、及びイスラエル放線菌(Actinomyces israelii)が含まれるが、限定するものではない。
感染性真菌の例には、クリプトコックス・ネオフォルマンス(Cryptococcus neoformans)、ヒストプラスマ・カプスラーツム(Histoplasma capsulatum)、コクシジオイデス・イミティス(Coccidioides immitis)、ブラストミセス・デルマティティディス(Blastomyces dermatitidis)、トラコーマクラミジア(Chlamydia trachomatis)、鵞口瘡カンジダ(Candida albicans)が含まれるが、限定するものではない。その他の感染性生物には、熱帯熱マラリア原虫(Plasmodium falciparum)及びトキソプラスマ(Toxoplasma gondii)などの原生生物が含まれる。
4.抗生物質プロファイリング
本明細書中に提供する特異的開裂断片化パターンの分析は、抗生物質耐性を含む薬物耐性に関与するヌクレオチド変化の検出スピード及び精度を向上させる。イソニアジド、リファンピン、ストレプトマイシン、フルオロキノロン、及びエチオナミドに対する耐性に関与する遺伝子座が同定されている[Heym et al., Lancet 344:293 (1994) and Morris et al., J. Infect. Dis. 171:954 (1995)]。ピラジナミド及びエタンブトール又はストレプトマイシンとともに用いるイソニアジド(inh)及びリファンピン(rif)の組み合わせは、結核菌(M. tuberculosis)が確認された場合に対する最初の攻撃系として日常的に用いられる[Banerjee et al., Science 263:227 (1994)]。そのような耐性株の発生が増加しているため、それらを検出し、かつ、それにより非効率的でおそらく有害な治療を推し進める費用及び地域健康被害を減らすための迅速なアッセイの開発が必要にする。薬物耐性に関与するいくつかの遺伝子座の同定は、薬物耐性を生ずるヌクレオチド変化を迅速にスクリーニングするための変異検出技術の採用を促進している。
5.疾患マーカーの同定
疾患の予後を診断又は決定するために用いることができる疾患の遺伝子マーカーである配列変化の迅速で正確な同定方法を本明細書中に提供する。遺伝子マーカーによって特徴付けられる疾患には、アテローム性動脈硬化症、肥満、糖尿病、自己免疫疾患、及び癌が含まれるが、限定するものではない。すべての生物における疾患は、遺伝されたものであろうと環境ストレスに対する体の応答から生じたものであろうと、ウイルス及び毒素などの遺伝成分を有する。進行中のゲノム研究の最終目的は、この情報を用いてこれらの疾患を同定、治療、及び潜在的に治癒する新たな方法を開発することである。第1の工程は、疾患組織をスクリーニングし、個々の試料のレベルでゲノム変化を同定することである。これらの「疾患」マーカーの同定は、誤った遺伝子又は多型を同定するためには、ゲノムマーカーの変化を検出する能力に依存する。ゲノムマーカー(単一ヌクレオチド多型(SNPs)、マイクロサテライト及び他の非コードゲノム領域、タンデムリピート、イントロン及びエキソンを含むすべての遺伝子座)をヒトを含むすべての生物の同定に用いることができる。これらのマーカーにより、集団を同定するだけではなく、疾患に対する反応、薬物治療、環境作用因子への耐性、及び他の要因に従って集団を階層に分けることも可能とする方法が提供される。
6.ハプロタイピング
本明細書中に提供する方法を用いてハプロタイプを検出することができる。任意の二倍体細胞には、少なくとも1つの特徴的な変化を含む任意の遺伝子又は他の染色体セグメントにおいて2つのハプロタイプがある。多くのよく研究された遺伝系では、ハプロタイプは単一ヌクレオチド変化よりも強く表現型と相関している。したがって、ハプロタイプの決定は、疾患の素因又は感受性、治療介入に対する反応、並びに薬剤、動物畜産、及び農業におけるその他の対象の表現型を含む種々の表現型の遺伝の基礎の理解に有益である。
本明細書中に提供するハプロタイピング手順によって、個体の2つの相同染色体の1つから配列の一部を選択し、かつ、その配列部分上の連鎖したSNPsをジェノタイピングすることが可能となる。ハプロタイプの直接分解によって情報内容が増加し、任意の連鎖した疾患遺伝子の診断が改善され、あるいはそれらの疾患と関連する関連性が同定される。
7.マイクロサテライト
断片化をベースとした本明細書中に提供する方法により、マイクロサテライトである配列変化の迅速で明確な検出が可能となる。マイクロサテライト(可変数タンデムリピート又はVNTRと称することもある)は、1〜7個以上の塩基の直列的に反復する短いヌクレオチド単位であり、それらの中で最も著名なものはジヌクレオチドリピート、トリヌクレオチドリピート、及びテトラヌクレオチドリピートである。マイクロサテライトは、ゲノムDNA中に100,000bp毎に存在している(J. L. Weber and P. E. Can, Am. J. Hum. Genet. 44,388(1989); J. Weissenbach et al., Nature 359, 794 (1992))。CAジヌクレオチドリピートは、例えば、ヒトミトコンドリア外ゲノムの約0.5%を構成する。CT及びAGリピートは一緒に、約0.2%を構成する。CGリピートは、ほぼおそらくCpG島の調節機能が原因となって、非常に少ない。マイクロサテライトは、長さに関して非常に多型であり、非コード配列内に主に存在しつつも全体ゲノムにわたって広範に分布しており、ゲノム内でのその機能は不明である。
集団は、その集団に特徴的な種々のマイクロサテライトを維持し、同系交配していない他の集団から区別されるので、マイクロサテライトは法医学の用途に重要である。
マイクロサテライト内の多くの変化はサイレントであることができるが、遺伝子産物又は発現レベルの有意な変化をもたらすことができるものもある。例えば、遺伝子のコード領域に見出されるトリヌクレオチドリピートはある腫瘍では影響を受け(C. T. Caskey et al., Science 256,784 (1992))、マイクロサテライトの変化は癌の素因となる遺伝の不安定性を生じさせる(P. J. McKinnen, Hum. Genet 1 75,197 (1987); J. German et al., Clin. Genet. 35,57 (1989))。
8.ショートタンデムリピート
本明細書中に提供する方法を用いて、例えばSTR領域を含まないヒトゲノム中の参照配列と相対的なヒトゲノムのある標的配列中のショートタンデムリピート(STR)領域を同定することができる。STR領域は、疾患又は状態のいずれとも関連しない多型領域である。ヒトゲノム中の多くの座は、多型のショートタンデムリピート(STR)領域を含む。STR座は、長さが3〜7塩基対の短い反復配列エレメントを含む。ヒトゲノム中に15kb毎に1つの頻度で存在する200,000個の予測される三量体及び四量体STRがあると推測されている(例えば、国際PCT出願第WO9213969A1号、Edwards et al., Nucl. Acids Res. 19: 4791 (1991); Beckmann et al. (1992) Genomics 12: 627-631を参照のこと)。これらのSTR座のほぼ半分は、遺伝子マーカーの豊富な供給源を提供する多型である。特定の座における反復単位の数の変化は、可変ヌクレオチドタンデムリピート(VNTR)座(Nakamura et al. (1987) Science 235: 1616- 622);及びより長いリピート単位を含むミニサテライト座(Jeffreys et al. (1985) Nature 314: 67-73)、並びにマイクロサテライト又はジヌクレオチドリピート座(Luty et al. (1991) Nucleic Acids Res. 19: 4308; Litt et al. (1990) Nucleic Acids Res. 18: 4301; Litt et al. (1990) Nucleic Acids Res. 18 : 5921;Luty et al. (1990) Am. J. Hum. Genet. 46: 776-783; Tautz (1989) Nucl. Acids Res. 17: 6463-6471; Weber et al. (1989) Am. J. Hum. Genet. 44: 388-396; Beckmann et al. (1992) Genomics 12: 627-631)を連想させる観察される多型の原因となっている。
STR座の例には、ヒトCD4座でのペンタヌクレオチドリピート(Edwards et al.,Nucl. Acids Res. 19: 4791 (1991));ヒトアロマターゼシトクロムP−450遺伝子中のテトラヌクレオチドリピート(CYP19;Polymeropoulos et al., Nucl. Acids Res. 19: 195 (1991));ヒト凝固因子XIIIAサブユニット遺伝子中のテトラヌクレオチドリピート(F13A1;Polymeropoulos et al.,Nucl. Acids Res. 19: 4306(1991));F13B座におけるテトラヌクレオチドリピート(Nishimura et al., Nucl. Acids Res. 20: 1167 (1992));ヒトc−les/fps原腫瘍遺伝子中のテトラヌクレオチドリピート(FES;Polymeropoulos etal.,Nucl. Acids Res. 19: 4018 (1991));LFL遺伝子中のテトラヌクレオチドリピート(Zuliani et al, Nucl. Acids Res. 18: 4958 (1990));ヒト膵ホスホリパーゼA−2遺伝子中のトリヌクレオチドリピート多型(PLA2;Nucl. Acids Res. 18: 7468 (1990));VWF遺伝子中のテトラヌクレオチドリピート多型(Ploos et al., Nucl. Acids Res. 18: 4957 (1990));及びヒト甲状腺ペルオキシダーゼ(hTPO)座でのテトラヌクレオチドリピート(Anker etal., Hum. Mol. Genet. 1: 137 (1992))が含まれるが、限定するものではない。
9.生物の同定
多型STR座及び他の遺伝子多型領域は、ヒトの同定、父及び母であることの試験、遺伝子マッピング、移入及び遺伝論争、双子における接合生殖性試験、ヒトでの同系交配についての試験、ヒト培養細胞の品質管理、ヒト遺体の同定、並びに精液試料、血痕、並びに法医学における他の物質の試験に非常に有用なマーカーである配列変化である。そのような座は、商業的な動物の飼育及び血統分析並びに商業的な植物の育種において有用なマーカーでもある。植物作物及び動物における経済上重要な形質を、多型DNAマーカーを用いた連鎖分析によって同定することができる。そのような座の同一性を決定するための効率的かつ正確な方法を本明細書中に提供する。
10.対立遺伝子変化の検出
本明細書中に提供する方法により、対立遺伝子変異体の迅速かつ正確なハイスループット検出が可能となる。対立遺伝子変化の研究は、複雑なバックグランド中での特定配列の検出のみならず、数個又は単一のヌクレオチドの違いを有する配列間の区別も伴う。PCRによる対立遺伝子特異的変異体の1つの検出方法は、鎖鋳型及びプライマーの3’末端の間にミスマッチがある場合にはTaqポリメラーゼがDNA鎖を合成することは難しいとの事実に基づく。可能な対立遺伝子のうち1つだけと完全にマッチングするプライマーを用いることにより、対立遺伝子特異的変異体を検出することができる。他の対立遺伝子に対するミスマッチはプライマーの伸長を妨げるように作用し、それによりその配列の増幅が妨げられる。この方法は、ミスマッチの塩基組成がミスマッチを超える伸長を妨げる能力に影響を与え、かつ、ある種のミスマッチは伸長を妨げないか最小限の効果だけを有するという点において、実質的な制限を有している(Kwok et al., Nucl. Acids Res., 18: 999[1990]))。本明細書中に提供する断片化をベースとした方法は、プライマー伸長法の制限を克服するものである。
11.対立遺伝子頻度の決定
本明細書に記載される方法は、年齢、人種集団、性、又はある他の基準の関数として頻度が集団内で変わる1又は数個の遺伝子マーカーの同定に有益である。例えば、ApoE遺伝子型の年齢依存型の分布は当該技術分野で既知である(Schichter et al. (1994) Nature Genetics 6 : 29-32を参照のこと)。疾患とあるレベルで関連することが知られる多型の頻度を用いて、疾患状態の進行を検出又はモニタリングすることもできる。例えば、アミノ酸コドン291においてセリンがアスパラギンに置き換えられたリポタンパク質リパーゼ遺伝子のN291S多型(N291S)は、男性の動脈硬化症、特に具体的には心筋梗塞の危険性の増加と関連がある高密度リポタンパク質コレステロール(HDL−C)のレベルを減少させる。(Reymer et al. (1995) Nature Genetics 10: 28-34を参照のこと)。さらに、対立遺伝子頻度の変化を決定することによって、従前には不明であった多型の同定が可能となり、疾患の開始及び進行に関与する遺伝子又は経路の同定が最終的には可能となる。
12.後生学
本明細書中に提供する方法を用いて、配列(例えば、核酸又はタンパク質の天然に存在する単量体単位である塩基又はアミノ酸の同一性)に基づかない参照核酸又はタンパク質と相対的な標的核酸又はタンパク質の変化を研究することができる。例えば、本明細書中に提供する方法で用いる特異的開裂試薬は、メチル化パターンなどの配列に依存しない特徴の違い、修飾塩基又はアミノ酸の存在、又は標的分子及び参照分子間のより高次の構造の違いを認識し、配列に依存しない部位で開裂されるフラグメントを生じさせることができる。後生学は、遺伝子配列の違いではなく遺伝子発現の違いに基づく情報の遺伝に関する研究である。後成的変化とは、遺伝子機能の有糸分裂(mitotically)及び/又は減数分裂による遺伝性変化又は核酸配列の変化によって説明することができないより高次の核酸構造の変化をいう。後生的変化又は変化を受ける特徴の例には、動物でのDNAメチル化パターン、ヒストン修飾、及びポリコーム−トリソラックス群(Pc−G/tx)タンパク質複合体(例えば、Bird, A., GenesDev., 16: 6-21 (2002)を参照のこと)が含まれるが、限定するものではない。
後生的変化は、必ずしもではないが通常は遺伝性である遺伝子発現の変化を必ずしもではないが通常は生ずる。例えば、以下にさらに論じるように、メチル化パターンの変化は、癌及び他の疾患の発達及び進行における初期の事象である。多くの癌においては、ある種の遺伝子は、異常型のメチル化が原因で不適切にスイッチがオフ又はオンとなる。転写を抑制又は活性化するメチル化パターンの能力は遺伝できる。Pc−G/trxタンパク質複合体は、メチル化のように、転写を遺伝性の形式で抑制することができる。Pc−G/trxタンパク質アセンブリは、それが遺伝子の胚遺伝子発現状態を遺伝子が活性であろうと不活性であろうと効率的に凍結し、かつ、発達を介してその状態を安定的に遺伝していくかにかかわらず、ゲノムの特定領域を標的とする。タンパク質のPc−G/trx基のゲノムを標的とし、かつ、これに結合する能力は、ゲノムに含まれる遺伝子の発現レベルだけに影響を及ぼし、遺伝子産物の性質には影響を及ぼさない。本明細書中に提供する方法は、後生的変化などの配列に依存しない変化に基づく参照配列と相対的な標的配列中の変化を同定する特異的開裂試薬とともに用いることができる。
13.メチル化パターン
本明細書中に提供する方法を用いて、標的配列中のメチル化パターンの変化などの標的配列中の後生的変化である配列変化を検出することができる。細胞のメチル化の分析は、新たに生起した研究学問分野である。メチル基のシトシンへの共有結合による結合は、主にCpGジヌクレオチド(マイクロサテライト)に存在する。プロモーター領域に位置していないCpG島の機能は調査が継続されているが、プロモーター領域中のCpG島は、そのメチル化状態が関連する遺伝子の転写及び発現を調節するので、特に関心がある。プロモーター領域のメチル化により、遺伝子発現のサイレンシングが生じる。このサイレンシングは、永続的であり、有糸分裂プロセスを介して継続する。遺伝子発現におけるその有意な役割に起因して、DNAメチル化は、発達プロセス、インプリンティング、及びX染色体不活化、並びに腫瘍の発生、老化、及びさらに寄生虫DNAの抑制に影響を与える。メチル化は、肺癌、乳癌、及び大腸癌などの多くの広範な腫瘍の発癌性、及び白血病に関与すると考えられている。メチル化及びタンパク質機能不全(長時間Q−T症候群)又は代謝疾患(一過性新生児糖尿病、二型糖尿病)の間にも関連がある。
ゲノムDNAの重亜硫酸塩処理を利用して、DNA内のメチル化シトシン残基の位置を分析することができる。核酸を重亜硫酸塩で処理することによって、メチル化シトシンを未修飾としたまま、シトシン残基が脱アミン化されてウラシル残基となる。したがって、本明細書中に提供する方法において、重亜硫酸塩で処理していない標的核酸の配列を重亜硫酸塩で処理した核酸の配列と比較することによって、核酸中のメチル化の程度及びシトシンがメチル化される位置を推定することができる。
制限エンドヌクレアーゼ反応によるメチル化分析は、Hpall及びMSPIなどのメチル化特異的認識部位を有する制限酵素を用いることによって可能になる。基本原理は、ある種の酵素を認識配列中のメチル化シトシンによって遮断することである。一度、この区別(differentiation)が成されれば、本明細書中に提供する方法を用いて、得られるフラグメントの分析を続いて行うことができる。
これらの方法は、組み合わせた重亜硫酸塩制限分析(COBRA)で一緒に用いることができる。重亜硫酸塩による処理によって増幅されたPCR生成物中のBstUl認識部位が失くなり、未処理試料と比較して新たな検出可能なフラグメントが分析上に現れることとなる。本明細書中に提供する断片化をベースとした方法をメチル化部位の特異的開裂と組み合わせて用い、標的核酸配列中のメチル化パターンについての迅速かつ信頼できる情報を提供することができる。
14.再配列決定
種々の生物由来の利用可能なゲノム配列情報量が劇的に増大したことによって、配列情報を機能、表現型、又は同一性に関連づけるための大規模な比較配列分析を可能する技術の必要性が増している。SNP発見及び病原体の配列特異的同定を含む比較配列分析のためのそのような技術の用途は広範にわたることができる。したがって、再配列決定及びハイスループット変異スクリーニング技術は、疾患の元になる変異及び差次的な薬物反応の元になる遺伝変異性の同定に非常に重要である。
これらの必要性を満たすため、いくつかの手法が開発された。ハイスループットDNA配列決定のための現在の技術には、電気泳動及びレーザー誘起蛍光検出を用いたシーケンサーが含まれる。電気泳動をベースとする配列決定法は、異型接合体の検出に固有の制限を有し、GC圧縮により損なわれる。したがって、電気泳動を用いることなくデジタルデータを生ずるDNA配列決定プラットフォームは、これらの問題を克服する。マトリクス支援レーザー脱離/イオン化飛行時間型質量分析(MALDI−TOFMS)は、DNAフラグメントを測定し、デジタルデータ出力する。本明細書中に提供する特異的開裂断片化分析方法により、参照配列と相対的な配列変化の検出でのハイスループット、高速、及び高精度が可能になる。この手法により、乳癌の発達に関連するBRCA1及びBRCA2中の創始者変異についてのスクリーニングなどの正確な変異検出用にMALDI−TOF MS配列決定を日常的に用いることが可能になる。
15.多重処理
本明細書中に提供する方法によって、1つ又は複数の参照配列と相対的な複数の標的配列中の配列変化のハイスループット検出又は発見が可能になる。多重処理とは、2つ以上の多型又は配列変化の同時検出をいう。特に質量分析と組み合わせた多重処理反応の実施方法が既知である(例えば、米国特許第6,043,031号、第5,547,835号、及び国際PCT出願第WO97/37041号を参照のこと)。
例えば、本明細書中に提供する異なる相補的な特異的開裂反応を用いて同じ標的核酸配列について、あるいは異なる標的核酸配列について多重処理を行うことができ、次に断片化パターンを複数の参照核酸配列に対して分析することができる。各配列変化が参照核酸配列断片化パターンと相対的な異なる開裂フラグメントに対応する場合、本明細書中に提供する方法を用いることにより、1つの標的配列に対していくつかの変異又は配列変化を同時に検出することもできる。多重処理は、個々の各配列変化について別々の質量分析による分析を行わなければならないことと比較して、単一の質量スペクトルで複数の配列変化を同定することができるという利点を与える。本明細書中に提供する方法は、高速かつ高精度で配列変化を分析するためのハイスループットで高度に自動化されたプロセスとなる。
E.システム及びソフトウェア方法
標的核酸若しくはタンパク質中の配列変化の決定方法又は本明細書中に提供する検出方法を本明細書中に提供する方法に基づいて配列変化を同定するためにプログラミングされたコンピュータを用いて自動化するシステムも提供する。例えば、以下のコンピュータシステムを用い、かつ、以下の計算、システム、及び方法を用いることによって、本明細書での方法を実行ことができる。
代表的な自動化試験システムは、ゲル電気泳動機器、又は質量分光計、又は試料中の核酸分子の質量を決定するための他の機器などの分析機器、並びに該分析機器と通信可能な断片化データ分析用のコンピュータを含む、核酸ワークステーションを含む(例えば、同時係属中の米国特許出願第09/285,481号、第09/663,968号、及び第09/836,629号を参照のこと;代表的な自動化システムについては国際PCT出願第WO00/60361号も参照のこと)。代表的な実施態様では、コンピュータは、並列又はシリアルインターフェイスなどの既知の通信標準を用いて機器と通信するマイクロソフト社(Microsoft Corporation)の「マイクロソフト・ウインドウズ(Microsoft Windows(登録商標))」操作システム又は又はアップルコンピュータ社(Apple Computer, Inc.)の「マッキントッシュ(登録商標)(Macintosh(登録商標))」操作システムの制御下で操作するコンピュータなどのデスクトップコンピュータシステムである。
例えば、核酸試料の分析システムを提供する。システムは、本明細書中で記載される塩基特異的又は他の特異的開裂反応を行う処理ステーション;得られた開裂フラグメントを処理ステーションから反応生成物の質量が決定される質量測定ステーションに移すロボットシステム;及び断片化データを用いて標的核酸配列中の配列変化を同定するためにプログラミングされたコンピュータなど、質量測定ステーションからのデータを処理して1つ又は複数の試料中の1個又は複数のヌクレオチドを同定するデータ分析システムを含む。該システムは、各ステーションでいつ処理が完了したかを決定し、かつ、それに則して、試料を次の試験ステーションに移し、制御システムが停止命令を受けるまで試料を次々と継続的に処理する制御システムも含むことができる。
図3は、試料の処理を行い、かつ、図1及び図2に図示される操作を行うシステムのブロック線図である。システム300は、核酸ワークステーション302及び分析コンピュータ304を含む。核ワークステーションにおいて、1つ以上の分子試料305を受け取り、上記の開裂反応が行われる処理ステーション306での分析用に調製する。次いで、試料を質量分光計などの質量測定ステーション308に移し、ここで試料の処理をさらに行うことができる。試料は、コンピュータによって制御されるロボット装置310によって試料処理ステーション306から質量測定ステーション308に移すことが好ましい。
ロボット装置は、試料305の完全性を保持し、かつ、有効な試験結果を確実にする2つの処理ステーションである306、308の間の移動を確実にするサブシステムを含む。サブシステムは、例えば、試料を試料処理ステーション306から試料を取り上げ、質量測定ステーション308に移し、次いで質量測定操作用に処理試料を保管しておくことができる機械的ゆるめ装置又はアームを含む。次いで、ロボット装置310は、測定試料を移し、処理ステーション306から次の処理試料を移すための適切な措置をとる。
質量測定ステーション308は、測定試料305の分子成分を同定し定量化するデータを作成する。当業者は、測定データの作成に用いることができる質量分光計などの分子測定システムに精通している。データは、手動で測定結果を分析コンピュータに入力することによるかあるいは質量測定ステーション及び分析コンピュータ間の通信によるかのいずれかにより、質量測定ステーション308から分析コンピュータ304に提供される。例えば、質量測定ステーション308及び分析コンピュータ304をネットワーク312を介して相互接続して、質量測定ステーションによって作成されるデータが分析コンピュータによって得られるようにすることができる。ネットワーク312は、ローカルエリアネットワーク(LAN)、又はワイアレス通信チャンネル、又はコンピュータ間データ交換に好適な任意の他の通信チャンネルを含むことができる。
所望する場合には、分析コンピュータ304の測定処理機能及び核酸ワークステーション302の制御機能を単一のコンピュータ装置に導入することができる。その構成において、例えば、単一の多目的コンピュータを用いて、ロボット装置310を制御し、かつ、データ分析コンピュータ304のデータ処理を行うことができる。同様に、質量測定ステーションの処理操作及び試料処理ステーション306の試料処理操作を単一のコンピュータの制御下で行うことができる。
したがって、計算処理装置が任意の適切なサブユニットシステム(ロボット装置310の機械アームなど)への好適なインターフェイスを有し、かつ、システムを制御しデータ処理を行うための好適な処理力を有する場合には、ステーション及びコンピュータ302、304、306、308、310の処理及び分析機能を種々の計算処理装置によって行うことができる。
データ分析コンピュータ304は、分析機器又は別のシステム要素の一部であることができ、あるいは離れた位置にあることができる。機器と通信することができるコンピュータシステムは、例えば、広域ネットワーク、又はローカルエリア通信ネットワーク、又は他の好適な通信ネットワークを介して機器と通信することができる。コンピュータを有するシステムは、本明細書中の方法の工程及び必要な計算を自動的に行うようにプログラミングされている。使用される開裂試薬及び修飾塩基又はアミノ酸に基づく(参照又は標的配列の)予測される断片化パターンを用いる実施態様のためには、ユーザーは予測されるフラグメント質量を入力する。これらのデータは、ユーザーによって、キーボードから、あるいはネットワークに接続された他のコンピュータ又はコンピュータシステムから、あるいはデータCD、ミニディスク(MD)、DVD、フロッピー(登録商標)ディスクなどの取り外し可能な記録媒体又は他の好適な記録媒体上に直接入力することができる。次に、ユーザーは、標的核酸配列及び参照核酸配列間のフラグメントの違いを同定するシステムを操作する実行ソフトウェアを開始する。配列変化ソフトウェアにより、アルゴリズム1の工程が行われ、ある実施態様では本明細書中に記載するアルゴリズム2又は3が行われる。
図4は、ステーション及びコンピュータ302、304、306、308の機能を提供することができるコンピュータに含まれるハードウェア構成要素を図示した図3のシステム300中のコンピュータのブロック線図である。図3に図示したステーション及びコンピュータはすべて、同様のコンピュータ構成を有することができ、あるいは本明細書中に記載する能力及びそれぞれの機能に合致する代替の構成を有することができることを当業者は十分に理解している。図4の構成は、図3に図示されるデータ分析コンピュータ304に特に適している。
図4は、ステーション及び分析コンピュータs302、304、306、308の任意の操作を制御するコンピュータを含むような代表的なコンピュータ400を示す。各コンピュータ400は、インテル社(Intel Corporation)(米国カリフォルニア州サンタクララ)から入手可能な「ペンティアム(登録商標)(Pentium(登録商標))」マイクロプロセッサーなどの中央処理装置(CPU)402又は関連した集積回路チップの制御下で操作する。コンピュータユーザーは、キーボード及びコンピュータマウス404からコマンド及びデータを入力することができ、ディスプレー406で入力及びコンピュータ出力を見ることができる。ディスプレーは、典型的には、ビデオモニター又はフラットパネルディスプレーである。コンピュータ400は、ハードディスクドライブなどの直接アクセス記憶装置(DASD)408も含む。コンピュータは、典型的には揮発性半導体ランダムアクセスメモリー(RAM)を含むメモリー410を含む。各コンピュータは、プログラム製品記憶装置414を受け取るプログラム製品読取り機412を含むことが好ましく、プログラム製品読取り機は、該プログラム製品記憶装置414からデータを読み取ることができる(任意選択により、該プログラム製品記憶装置414にデータを書き込むことができる)。プログラム製品読み取り機は、例えば、ディスクドライブを含むことができ、プログラム製品記憶装置は、磁気フロッピー(登録商標)ディスク、CD−Rディスク、CD−RWディスク、又はDVDディスクなどの取り外し可能な記憶媒体を含むことができる。
各コンピュータ400は、ネットワーク420及びコンピュータ間の接続422を介して通信することができるネットワークインターフェイス418を通してコンピュータネットワーク420(例えば、ローカルネットワーク312又はインターネット又はイントラネットなど)を介し、他の図3のシステムと通信することができる。ネットワークインターフェイス418は、典型的には、例えば、種々のネットワークを介して通信を可能とするネットワークインターフェイスカード(NIC)をモデムなどのネットワークアクセスサブシステムと一緒に含むことができる。
CPU402は、コンピュータ400のメモリー410に一時的に記憶するプログラミング命令の制御下で操作する。プログラミング命令が実行されるとき、コンピュータはその働きを行う。したがって、プログラミング命令は、ワークステーション又はプロセッサーそれぞれの機能性を実行させる。プログラミング命令は、プログラム製品記憶装置414又はネットワーク接続422を介してDASD408から受け取ることができる。プログラム製品記憶装置412は、プログラム製品414を受け取り、その上に記録されているプログラミング命令を読み取り、プログラミング命令をCPU402による実行のためにメモリー410に転送することができる。上記の通り、プログラム製品記憶装置は、磁気フロッピー(登録商標)ディスク及びCD−ROM記憶ディスクを含むコンピュータ読み取り可能な記録された命令を有する複数の取り外し可能な媒体の任意の1つを含むことができる。他の好適なプログラム製品記憶装置には、磁気テープ及び半導体メモリーチップを含ませることができる。このように、本明細書中の方法及び開示に従った操作に必要な処理命令は、プログラム製品上で具現化することができる。あるいは、ネットワーク420を介して、プログラム命令を操作メモリー410中に受け取ることができる。ネットワーク方法では、当業者がさらなる説明を受けることなく理解することができる周知の方法によってネットワーク通信がネットワーク接続422を介して構築された後に、コンピュータ400は、ネットワークインターフェイス418を介してプログラム命令を含むデータをメモリー410中に受け取ることができる。次いで、プログラム命令をCPU402によって実行し、それによってコンピュータプロセスを構成する。
図3に図示するシステム300のステーション及びコンピュータはすべて、図4に図示する構成と同様の構成を有することができると理解すべきであり、図4のコンピュータ400に関して記載した詳細はシステム300のすべてのコンピュータに適用されると理解する。通信及びコンピュータはいずれも、図3に図示する他の通信ステーション及びコンピュータと通信することができ、かつ、本明細書中に記載される機能性を裏付ける限り、代替の構成を有することができることを十分に理解すべきである。例えば、ワークステーションがプログラム製品装置からプログラム命令を受け取らない場合には、そのワークステーションがその能力を含む必要はなく、そのワークステーションはその能力に関連した図4に表される構成要素を有さない。
以下の実施例は、例示目的のためだけに含めたものであり、本発明の範囲を限定することを意図していない。
実施例1
RNAの塩基特異的開裂
対象標的核酸の配列変化を分析するために、RNA転写を含む1つの管反応及び代表的なRNAseであるRNaseT1によるG特異的ヌクレオチド結合分解性開裂反応の半自動化プロトコルを本明細書中で提供する。本明細書中に提供するRNAse開裂方法によって生成されるフラグメントを本明細書中に提供する方法に従って分析することができる。RNaseT1反応を行い、標的核酸上のGヌクレオチド部位で約100%開裂させる。この開裂によって、対象標的配列中の配列変化を示すフラグメント質量の特徴的なパターンを生成する。
材料及び方法
オリゴヌクレオチドは、メタビオン社(Metabion)(ドイツ)から購入した。5−メチルシチジン5’−三リン酸リチウム塩(Me−CTP)及び5−メチルウリジン5’−三リン酸リチウム塩(Me−UTP)をトリリンク社(Trilink)(米国)から得た。
PCR増幅
PCR反応物5μlは、ゲノムDNA5ng、ホット・スター(Hot Star)TaqDNAポリメラーゼ(キアジェン社(Qiagen)、ドイツ)0.1単位、フォワード及び逆プライマー 各1pmol、0.2mM 各dNTP、及び酵素製造元(キアジェン社(Qiagen)、ドイツ;1.5mM MgCl2、Tris−HCl、KCl、及び(NH42SO4(pH8.7)を含有する)から供給される1×ホット・スター(Hot Star)TaqPCR緩衝液を含有した。酵素活性及び最初の変性を94℃で15分間行い、続いて45増幅サイクル(94℃で20秒間、56℃で30秒間、及び72℃で60秒間)を行い、及び72℃で3分間最終伸長を行った。
RNA転写及びRNaseT1開裂
PCR増幅後、PCR産物2.4μlを、1×転写緩衝液(6mM MgCl2、10mM DTT、10mM NaCl、10mM スペルミジン、及び40mM Tris−HCl(pH7.9、20℃)を含有する)中にT7(又はSP6)RNAポリメラーゼ(エピセントレ社(Epicentre))10単位、及び0.5mM 各NTPを含有する転写反応物6μl中で用いた。Me−UTP又はMe−CTPを用いて転写を行ったときに、UTP又はCTPが修飾メチルヌクレオチドに完全に置き換わった。転写反応物を37℃で2時間インキュベーションした。転写反応を行った後、RNaseT1 20単位を添加し、反応混合物を30℃で30分間インキュベーションした。30℃でのインキュベーションにより、3’−リン酸基に対する開裂反応を起こさせることが見出され、質量スペクトル中での所与の各親フラグメントについての複数の質量シグナルによって生じる複雑さを失くなった。
代替の手法は、異なるRNAエンドヌクレアーゼを用いて塩基特異的フラグメントを生じさせることである。例えば、RNaseU2によってすべてのA位置において、RNasePhyMによってすべてのA及びU位置において、あるいはRNaseAによってすべてのC及びU位置においてin vitro転写物を完全に消化することができる。
試料コンディショニング及び質量分析
転写及び開裂後、21μlのH2Oを添加することによって各試料を希釈した。スペクトロ・クリーン(Spectro CLEAN)(登録商標)カチオン樹脂(アンモニウムイオンが充填されたカチオンイオン交換樹脂;セケノム社(Sequenom)、米国)6mgにより、リン酸骨格のコンディショニングを行った。次に、得られた溶液16nlをシリコンチップ(スペクトロ・チップ(Spectro CHIP)(登録商標)、セケノム社(Sequenom))上にロボットにより分配した。すべての質量スペクトルは、ビフレックスIII(Biflex III)質量分光計(ブルカー・ダルトニック社(Bruker Daltonik)、ドイツ)により記録された。陽イオンを分析し、約50のシングルショットスペクトルを蓄積した。ディレイド・イオン・エクストラクション及び合計加速電圧20kVを用い、直線飛行時間型の形式ですべての試料を分析した。
代替方法では、増幅、転写、及び消化反応を単一の管の中での実施(均一手法)の代わりに、転写物の3’末端に相補的である固定化オリゴヌクレオチド、例えば、T7又はSP6プロモーターを含む固定化オリゴヌクレオチド上へのハイブリダイゼーションによって転写物を単離することができる。次いで、単離した転写物をMALDI−MS適合条件下でRNAseにより消化することができる。
結果及び議論
RNaseT1開裂は完全に行った。十分なRNase濃度を有する反応条件は、検体/マトリクス結晶化を妨げる低量の変性試薬(尿素又はホルムアミドなど)さえも回避するように最適化した。限定的な/不完全な消化より優れた提示した均一手法の1つの利点は、より高い質量範囲(>12000Da)でシグナルが失くなることなく500nt以上の鋳型領域までそれを伸長することができることである。完全消化では、2つのG位置間の最大距離によって決定される通り、最も高い質量のフラグメントは配列依存性であるが、最も高い質量のフラグメントはRNA転写物の長さに依存しない。
均一なアッセイの形式では洗浄又は液体の除去のいずれも用いないので、先に言及したすべての試薬及び試薬成分は下流のMALDI分析及びその評価に対して影響を与える。最良のパフォーマンスは、PCR5μlの設定において得られた。これにより、フォワード鎖及び逆鎖を分析する2つの転写反応物に十分な体積が与えられる。十分なPCR産物の収量及び品質は、ゲノムDNA5ng及び必要な各プライマー1pmolで達成される。DNA濃度の増加によって若干収率が高くなった。プライマー濃度の増加によってある場合にはプライマー二量体が有意に生成した。これらの反応条件を広範な標的領域に適用することができた。さらに、続いて行うRNA転写により、PCR産物の収率における任意の変動を補足する。個々の質量スペクトルのデータの質を損なうことなく、すなわち、フラグメントシグナルのシグナル対ノイズ比及びフラグメントシグナルの質量精度を落とさずに、各RNA転写物及び開裂反応物の全体積を最小限にした。再現性あるin vitro転写物の収率は、PCR増幅標的領域の配列に依存せずに、反応物6μlにつき野生型T7RNA又はSP6RNAポリメラーゼ8単位を用いることによって得られる。384MTPの形式での再現試験及びハイスループット分析は、自動化液体取り扱い装置を用いて行うことができる。
37℃以上の温度でのRNase開裂反応によって3’−環状ホスフェートと3’−ホスフェートとの1:3混合物がほぼ常に生じたのに対し、30℃でのインキュベーションにより、3’−リン酸基に対する開裂反応を起こさせることが見出された。これにより、質量スペクトル中での所与の各フラグメントについての複数のシグナルによる複雑さが失くなった。開裂条件に加えて、リボヌクレオシド三リン酸の濃度、転写緩衝液の組成、及びRNAポリメラーゼの量により、再現性があり、かつ、均一なRNAをベースとした開裂アッセイとなることが見出された。
試料をチップアレイ上に移すナノ分配装置による小型化MALDI試料の調製は、標準の3−HPAのマクロ調製より改良点があることが示される。3−HPAマクロ調製でほぼ常に観察され、かつ、自動化MALDI測定を妨げるMALDI試料中の均一でない検体の分布(ホットスポットの形成)は、チップアレイ上での小型化された均一な試料の結晶化によって大きく抑制された。さらに、検体質量の全スペクトルの低質量又は高質量ウインドウのみを表す試料の分配は観察されなかった。さらに、自動質量分析測定の取得時間を任意の単一試料につき5秒まで減らすことができた。
シリコンチップ(スペクトロ・チップ(Spectro CHIP)(登録商標)))上での良好な試料結晶化を試料の最終希釈物を用いて行った。希釈をしないと、緩衝液成分及び界面活性剤によってMALDI試料の結晶化プロセスが妨げられ、MALDI−TOFスペクトルで検出されるフラグメントシグナルが生じなかった。試料の希釈及びイオン交換樹脂の最終溶液への添加は、核酸フラグメントのリン酸骨格をコンディショニングするのに十分であることが証明され、これにより均一な断片化アッセイとチップアレイをベースとしたMALDI−TOFMS分析との効果的な組み合わせが可能になる。
代表的な断片化スペクトルにより、観察されたすべてのフラグメントは5’−OH及び3’−リン酸基を有し、限定的な開裂条件下で安定的な中間体である2’,3’−環状リン酸基を有するフラグメントは観察されなかったことが実証された。これにより、スペクトル中のすべての主要なシグナルを予測されるフラグメントに明確に帰属することが可能となった。したがって、記載したプロトコルに従えば、該方法により再現性が高くかつ正確な結果が提供される。
RNAをベースとした断片化手法の制限は、U及びC間の小さい質量の違い(1Da)によって生ずる。ある場合においては、同一の長さを有し、かつ、たった1個又は数個のU又はC残基だけ異なっている2つのRNAフラグメントは直線MALDI−TOF機器の現状の分解能では分離することができない。機器に関連するこの制限を回避するため、転写反応の際に1つのヌクレオチドのピリミジン残基を化学修飾された塩基に完全に置き換える代替方法を用いることができる。UTP又はCTPのいずれかを、転写収率を損なうことなく、それぞれの5−Me−修飾リボヌクレオチドアナログに置き換えることができ、これにより対応するヌクレオチドの質量が14Da増加する。
質量修飾方法の別の利点は、従前のいずれの配列情報なしに任意のRNaseT1フラグメントのA−C−U−組成を計算することができるとの事実から得られる。3つの異なるRNaseT1開裂反応を、(a)CTP、UTP(b)5−MeCTP、UTP、及び(c)CTP、5−MeUTPを含む核酸に対して別々に行うことができる。任意のRNA−フラグメントにつき、反応(a)及び(b)の所与のフラグメント間の質量の違い並びに反応(a)及び(c)間の違いを用いて、フラグメント中のU残基及びC残基の数を計算することができる。最後のフラグメントを除く各フラグメントはGをたった1つだけ含んでいるので、A残基の数も得ることができる。
部分的な塩基特異的開裂では、塩基特異的RNAseによって開裂されない修飾又は非天然ヌクレオチドを開裂される開裂部位の数を決定する比で転写反応混合物に添加する。代表的なプロトコルを以下に提供する。
PCRプライマー及び単位複製配列
フォワードプライマー(配列番号6):
5’CAGTAATACGACTCACTATAGGGAGAAGGCTCCCCAGCAAGACGGACTT−3’
逆プライマー(配列番号7):
5’−AGGAAGAGAGCGCCTCGGCAAAGTACAC−3’
単位複製配列(配列番号8):
5’−GGGAGAAGGC TCCCCAGCAA GACGGACTTC TTCAAAAACA TCATGAACTT CATAGACATT GTGGCCATCA TTCCTTATTT CATCACGCTG GGCACCGAGA TAGCTGAGCA GGAAGGAAAC CAGAAGGGCG AGCAGGCCAC CTCCCTGGCC ATCCTCAGGG TCATCCGCTT GGTAAGGGTT TTTAGAATCT TCAAGCTCTC CCGCCACTCT AAGGGCCTCC AGATCCTGGG CCAGACCCTC AAAGCTAGTA TGAGAGAGCT AGGGCTGCTC ATCTTTTTCC TCTTCATCGG GGTCATCCTG TTTTCTAGTG CAGTGTACTT TGCCGAGGCG CTCTCTTCCT−3’。
RNA転写及びRNase開裂
各反応に転写混合物2μl及び増幅DNA試料2μlが必要であった。T特異的開裂ためには、転写混合物は、40mM Tris−酢酸(pH8)、40mM 酢酸カルシウム、10mM 酢酸マグネシウム、8mM スペルミジン、1mM 各ATP、GTP、及びUTP、2.5mM dCTP、5mM DTT、及びT7R&Dポリメラーゼ(Epicentre)20単位を含有する。T特異的部分開裂のためには、dTTPとUTPと4:1の比を用いる。転写反応を37℃で2時間行った。転写後、RNaseA2μl(0.5μg)を各転写反応物に添加した。RNase開裂反応を37℃で1時間行った。
試料コンディショニング及びMALDI−TOF MS分析
RNase開裂後、ddH2O20μlを添加することにより、各反応混合物を管又は384ウェルのプレート内で希釈した。カチオン交換樹脂(スペクトロ・クリーン(Spectro CLEAN)、セケノム社(Sequenom))6mgを各ウェルに添加し、5分間回転を行い、640×gで5分間遠心分離することによって(2000rpm、遠心機IEC Centra CL3R、ローターCAT.244)、リン酸骨格のコンディショニングを行った。遠心分離後、圧電ピペットを用いて試料15nlをスペクトロ・チップ(Spectro CHIP)に移した。試料をビフレックス(Biflex)直線TOF質量分光計(ブルカー・ダルトニック社(Bruker Daltonik)、ブレーメン)上で分析した。
実施例2
DNAの塩基特異的開裂
以下の実施例は、核酸中のU残基の存在に従う標的核酸の断片化方法を記載し、ウラシルDNAグリコシラーゼ酵素による消化及びNH3を用いたリン酸骨格の開裂によって該方法を行う。本明細書中に提供する断片化方法を用いて、塩基特異的に開裂された標的DNAフラグメントを生じさせることができ、次いで、該標的DNAフラグメントを本明細書中に提供する参照DNAと相対的な標的DNA中の配列変化の同定方法によって分析することができる。
dTTに代えてdUTPの存在下でPCRを用いて、対象DNA領域を増幅した。1×ホット・スター(Hot Star)TaqPCR緩衝液中にゲノムDNA25ng、ホット・スター(Hot Star)TaqDNAポリメラーゼ(キアジェン社(Qiagen))1単位、0.2mM 各dATP、dCTP、及びdGTP、並びに0.6mM dUTPを含有するPCR反応物50μlを用いて、標的領域を増幅した。ビオチン化プライマー5pmol及び非ビオチン化プライマー15pmolの非対称な比で、PCRプライマーを用いた。温度プロフィールプログラムは、94℃で15分間の酵素の活性化、続いて45増幅サイクル(95℃で30秒間、56℃で30秒間、及び72℃で30秒間)、続いて、72℃で5分間の最終伸長を含むものであった。
マイクロサテライト分析のために、温度プロフィールを出発アニーリング温度が62℃であり、かつ、最終アニーリング温度が56℃に達するまで2サイクル毎にアニーリング温度が2℃下がるタッチダウン式のプログラムに変えた。この温度プロフィールは、マイクロサテライト座の増幅に一般的に適用可能であることが立証された。
粗製のPCR生成物に2×B/W緩衝液(10mM Tris−HCl(pH7.5)、1mM EDTA、2M NaCl)45μ1中の予め洗浄した常磁性ストレプトアビジンビーズ(ダイナル社(Dynal))50μgを添加し、室温で20分間インキュベーションした。次いで、固定化PCR生成物を担持するストレプトアビジンビーズを0.1M NaOHとともに室温で5分間インキュベーションした。非ビオチン化PCR鎖を含有する上清を除去した後、ビーズを10mM Tris−HCl(pH7.8)で3回洗浄した。
一本鎖ビオチン化PCR生成物を保持するビーズをUDG緩衝液(60mM Tris−HCl(pH7.8)、1mM EDTA)12μlに再溶解し、ウラシルDNAグリコシラーゼ(MBIフェルメンタス社(MBI Fermentas))2単位を添加し、混合物を37℃で45分間インキュベーションした。開裂反応後、ビーズを10mM Tris−HCl(pH7.8)で2回洗浄し、ddH2Oで1回洗浄した。次いで、ビーズをNH3水溶液12μlに再懸濁し、60℃で10分間インキュベーションし、4℃に冷却した。溶出された鎖を含有する上清を新しい管に移し、次いで95℃で10分間加熱し、続いて蓋を開けて80℃で11分間インキュベーションして、アンモニアを蒸発させた。
部分開裂の代表的なプロトコルを以下に提供する。
PCRプライマー及び単位複製配列
フォワードプライマー(配列番号9):
5’−BioCCCAGTCACGACGTTGTAAAACG−3’
逆プライマー(配列番号10):
5’−AGCGGATAACAATTTCACACAGG−3’
単位複製配列(配列番号11):
5’−CCCAGTCACG ACGTTGTAAA ACGTCCAGGG AGGACTCACC ATGGGCATTT GATTGCAGAG CAGCTCCGAG TCCATCCAGA GCTTCCTGCA GTCACCTGTG TGAAATTGTT ATCCGCT−3’
部分開裂を行うために、ストレプトアビジンビーズ(ダイナル社(Dynal)、オスロ)75μgを1×B/W緩衝液50μl中で2回予め洗浄し、2×B/W緩衝液45μlに再懸濁した(製造元の薦めに従うものである)。PCR反応物50μlを再懸濁したストレプトアビジンビーズに添加し、室温で20分間インキュベーションすることによって、ビオチン化PCR生成物を固定化した。次いで、固定化PCR生成物を担持するストレプトアビジンビーズを0.1M NaOHとともに室温で5分間インキュベーションし、二本鎖PCR生成物を変性させた。非ビオチン化PCR鎖を含有する上清を除去した後、ビーズを10mM Tris−HCl(pH7.8)で3回洗浄し、pHを中和した。
ビーズをUDG緩衝液(60mM Tris−HCl(pH7.8)、1mM EDTA(pH7.9))10μlに再懸濁し、ウラシルDNAグリコシラーゼ 2単位を添加し(MBIフェルメンタス社(MBI Fermentas))、混合物を37℃で45分間インキュベーションした。反応後、ビーズを10mM Tris−HCl(pH8)25μlで2回洗浄し、ddH2O10μlで1回洗浄した。500mM NH4OH12μlを添加し、60℃で10分間インキュベーションすることにより、ビオチン化された鎖を溶出した。10分間インキュベーションした後、上清をフレッシュなマイクロタイタープレート又は管に回収し、塩基がない部位におけるホスフェートを開裂し、続いて蓋を閉じて95℃で10分間インキュベーションした。アンモニアを蒸発させるために、蓋を開けて80℃で11分間インキュベーションを行う。
質量分析分析
DNA開裂後、試料15nlを圧電ピペットを用いてスペクトロ・チップ(Spectro CHIP)(登録商標)(セケノム社(Sequenom))に移した。ブルカービフレックス(Bruker Bilex)質量分光計(ブルカー・ダルトニック社(Bruker Daltonik)、ブレーメン)上で分析を行った。
実施例3
増幅DNAの塩基特異的断片化によるSNPの発見
SNPsを含有する標的配列の塩基特異的に開裂されたフラグメントを本明細書中に提供する既知SNPsの検出又は未知SNPsの発見方法によって分析することができる。商標マス・アレイ(Mass Array)(登録商標)によって表される系などの系を用い、Rodi et al, Bio Techniques, 32: S62-S69 (2002)(これを参照により本明細書に取り入れる)に従って、ハイスループット塩基特異的断片化を行い、続いて質量分析による分析を行うことができる。マス・アレイ(Mass Array)(登録商標)は、小型化アレイ及びMALDI−TOF(マトリクス支援レーザー脱離イオン化−飛行時間型)質量分析と組み合わせた質量スペクトル分析に依り、迅速に結果を出す。本明細書中に提供する方法に従って生じた及びRodi et al, Bio Techniques, 32: S62-S69 (2002)で生じたフラグメントシグナルを本明細書中に提供する方法に従って分析することができる。
標的配列の一本鎖コピーが塩基特異的断片化で作り出され、4つの別々の反応で4つの塩基の各々に対応する位置で完全に断片化される。これにより、MALDI−TOFMSの正確性、精度、及び分解能で容易に分解可能なオリゴヌクレオチドの組のまとまりまで核酸が減る。参照配列を用いることによって、得られた各ピークを確実に同定することが可能となる。配列の変化は、生成されるピークのパターンに甚大かつ容易に識別可能な影響を与える。これは、以下の配列で示される:XXXACTGXXXC/AXXXTGACXXX(配列番号12)。
この実施例では、A/C塩基転換を示す。既知(参照)配列がAを含む配列であると仮定すると、表示した配列のA特異的開裂によって、7マー及び6マーの示した2つフラグメント(末端フラグメントは無視する)が生成することが予測されるであろう。ここで、試料が2番目のA位置においてCを含む場合の結果を考慮する。A残基が2個しかなくなり、切断によって13マーの示した単一の大きなフラグメントが生じ、7マー及び6マーは現れなくなってしまうであろう(あるいは、ヘテロ接合体の場合には強度が弱くなるであろう)。C特異的開裂によっては、当然に、A対立遺伝子については13マー及びC対立遺伝子については6マーと7マーの反対の結果を生じるであろう。C対立遺伝子はA対立遺伝子よりも質量が24Da小さいので、T特異的及びG特異的開裂によってさえ、識別可能な変化である質量スペクトルの低質量部分で容易に検出されるピークシフトを生ずる。この多型を検出するためにはこれらの反応の任意の1つで十分であろうが、ほとんどの場合ではすべての4つのピークパターンを満足させるには1つの方法しかないので、合わせれば正確な位置を決定することができる。
一本鎖核酸は、信頼性が高く、経済的で、かつプロセス・フレンドリーな方法である転写によって生成される。3つのプライマー系を用いて、AT7RNAポリメラーゼプロモーターをDNA増幅中に単位複製配列のどちらかの末端に結合することができる(Rodi et al, Bio Techniques, 32: S62-S69 (2002)を参照のこと)。5’末端に若干異なる配列標識を各々が有する標的特異的増幅プライマーを用いる。ユニバーサルフォワードT7プライマーを反応物中に含めることによって+転写物を生成する単位複製配列が作られ、ユニバーサル逆T7プライマーを反応物中に代入することによって−転写物を生成する単位複製配列が作られる。ハイスループット型式では、転写物を生成後に分配する(distribute)のではなく、2つの+鎖反応及び2つの−鎖反応を単に行うことが薦められている。一方のウェル中でC残基に特異的なRNase反応を用い、かつ、他方のウェル中でU残基に特異的な第2の反応を用いて、2つの+鎖を断片化する。G特異的及びA特異的開裂はそれぞれ、−鎖に対してC特異的及びU特異的反応を単に行うことにより推定する。
遺伝子変化を発見するための断片化手法の大きな利点の1つは、生成されるシグナルの明瞭性である。これにより、単位複製配列(クローンではない)及び完全に自動化された結果の解釈を用いて標的とする発見が可能となる。この実施例をCETP遺伝子で示す(Rodi et al, Bio Techniques, 32: S62-S69 (2002)を参照のこと)。CETP遺伝子(配列番号13)のイントロン10由来の500bpの単位複製配列を12個の個体の各々から生成し、転写し、T特異的断片化を施した。部分スペクトルは、Ensembl配列に基づいた予測ピークパターンに正確に対応し、すべての予測ピークが存在し、予想外のピークは何も見られなかった。12個の個体のうち2個は、3159Daにおいて予想外のピークを示す異なるパターンを示し、さらに、2830.7Daにおけるピークは有意に減少したシグナル強度を有していた。予測ピークが存在していないということではなかったゆえに、これはT残基にヌクレオチド置換を有するこの個体の同族体の1つと一致し、該置換によって該同族体は開裂に対して抵抗性になり、より高い質量において新しいシグナルを生じた。第2の個体は、3159Daにおいて同じ予想外の予測ピークを有していたが、その相対強度はより大きく、2830.7Daにおけるピークは完全に存在していなかった。したがって、この個体は、今までに知られていないSNPについてのホモ接合体である。フラグメントシグナルが前述の断片化方法によって生じる際の明瞭性、精度、及び速さにより、該フラグメントシグナルは本明細書中に提供する方法による分析のための好ましいシグナルの中の1つとなる。
B.塩基特異的断片化によるSNPの発見の評価
本明細書中に提供する配列変化候補の減少した組の分析方法(「自動化」方法)をC++で実行した。該実行には、本明細書中に提供する方法による洗練されたSNPスコア付けスキーム及び反復SNP選択プロセスが含まれる。ある場合では、以下に提供する通り、C++で実行されるアルゴリズムによる分析を候補SNPsリストの手動アセンブリと比較した。手動アセンブリは、相補的な開裂反応物の間の一致性及び/又は試料の組の中の表示フラグメントの回復(recurrence)を調べ、次いで、配列変化を含まない参照配列のすべての可能な配列変化について変異体質量スペクトル又は他の質量指数(ゲル電気泳動の場合には移動性など)をシミュレーションする(本明細書中に提供する方法に従って配列変化候補の減少した組を得るということではない)ことにより行った。手動による手法においては、次いで、特定の配列変化又は配列変化の組に対応するシミュレーションした各変異体スペクトルを実際の変異体質量スペクトルに対してマッチングし、最も起こり得そうな配列変化又は変異体スペクトルを生ずる変化を決定する。
ヒトゲノムの種々の領域に由来する500bpの平均長さの10個の単位複製配列(単位複製配列1〜単位複製配列10;配列番号45〜54)の第1組及び30個の単位複製配列(単位複製配列2.1〜2.30;配列番号55〜84)の第2組の2組の試料を分析した。各単位複製配列について、12人の白色人種の個体由来のDNA試料(Daussetet al., Genomics, 6 (3): 575-577 (1990))を分析し、単位複製配列によって橋架けされている領域内のSNPsの存在について、対応する参照配列に対して比較した。
方法
T7RNAポリメラーゼによるRNA転写を行い、続いて本明細書中に提供するRNAse開裂を用いて塩基特異的開裂を行った。すべてのPCRプライマーをその5’末端にいてT7プロモーターで標識した。40個の単位複製配列(その配列は、配列リスト中で配列番号45〜84として提供される)の5’末端及び3’末端における18〜22塩基と同一又は相補的な配列を有する2組のPCRプライマーを各単位複製配列がセンス又はアンチセンス鎖のいずれかの転写が可能となるようした。センス転写物を用いてT特異的及びC特異的開裂を得るためにRNaseAを用い、アンチセンス転写物を用いてA特異的及びG特異的開裂を得るためにその等量を用いた(C(T)残基に対するRNaseAの活性は、dCTP(dTTP)を転写物に導入することでRNaseAをU又はC残基のいずれかに特異的にすることにより遮断した)。このようにして、等量のすべての4つの塩基特異的開裂を分析した。
384ウェルプレート中においてPCR反応物5μlを設定した。本明細書中に提供する通り、均一なPCR条件を用いた。PCR後、転写混合物をマイクロタイタープレートの各ウェルに添加し、転写を37℃で2時間行った。転写に続き、RNaseAを各ウェルに添加し、開裂を37℃で60分間進行させた。スペクトロ・クリーン(Spectro CLEAN)(登録商標)6mgを各ウェルに添加することにより、MALDI−TOF MS分析のためのRNAフラグメントのコンディショニングを行った。
MALDI−TOFMS分析のために、検体10nlをピンツール装置によって384アレイチップ上に自動で分配した。PCR後のピペット処理工程はすべて、ベックマン・マルチメク・ペピッター(Beckman Multimek pipettor)を用いて行った。
結果
配列変化候補の減少した組を生じさせ、減少した組をシミュレーションし、本明細書中に提供する方法に従ってスコア付けする自動化分析により、SNPsを同定した。ソフトウェアにおいて報告されている追加及び消失シグナルの手動分析により、結果をさらに検証した。同定したSNPsはすべて、続いて行われた鎖終結用プライマーの伸長反応によって有効であることが確認された。塩基特異的反応でSNPの位置を正確に位置づけできなかった場合には、プライマー伸長反応を用いてSNPの位置づけを行った。
A.第1組:10個の単位複製配列
以下の表は、第1組の10個の単位複製配列中で同定されたSNPs(単位複製配列中の塩基の変化及び位置)を提供する。
Figure 0004786904
本明細書中に提供する自動化方法によって同定された上記の19個のSNPsのうち、確認用のプライマー伸長反応によって検出されなかった2つだけ(*でマークされるもの)が本物の偽陽性であると決定された。さらに、2つの擬陽性は、ソフトウェアによって信頼性が非常に低いと報告された。
B.第2組:30個の単位複製配列
SNPs(単位複製配列中の塩基の変化及び位置)を第2組の30個の単位複製配列中で度同様に同定した。さらに、本明細書中に提供する方法に従って配列変化候補の減少した組を生じさせて分析する自動化によって同定されたSNPsを、4つの相補的な塩基特異的開裂反応によって得られた開裂パターンの手動検査及び分析(すべての可能な配列変化候補の構築、シミュレーション、及びスコア付け)によって同定したSNPsと比較した。すべてSNPsは、手動分析により検出するかあるいは自動分析により検出するかに関わらず、鎖終結用プライマーの伸長反応によって本物の陽性であるか偽陽性であるかを検証した。
328〜790塩基対の長さの30個の「連結していない」単位複製配列(PCRによって増幅されたDNAの非重複小領域)をヒト染色体22上の種々の領域から増幅し(Dunhamet al., Nature, 402 (6761): 489-495 (1999))、該単位複製配列の平均の長さは433塩基対であった。全部で、11793塩基対を分析した。質量分析による分析のために、RNAseAを用いて4つの塩基特異的開裂反応を行い、質量分析によって独立して測定した。
質量分析データを手動で分析すると、50個のSNPsが発見され、鎖終結用プライマーの伸長によって検証した。これらの50個のSNPsのうち6個については、開裂質量分析データから正確な位置を決定することができなかった。質量分析データの手動分析は、非常に時間がかかり、完全な分析には数週間かかった。さらに、質量分析データの手動分析では無かった1つのSNPが電気泳動データを用いて見出された。
質量分析データの手動分析又は電気泳動データによって、全部で51個のSNPs(平均で231塩基対ごとに1個のSNP)が発見された。これは、SNP発見用途の場合に達成される所望の閾値は必ずしもではないが通常は1又は2である配列変化の位数kであることを示している(位数2は、互いにより近接しているSNPsを包含する)。変異の発見又は再配列決定の場合、互いに近接している複数の塩基変化が観察される可能性がより高いので、kの値は必ずしもではないが通常は3又は4以上である。
次いで、本明細書中に提供する自動化方法を実行することにより、開裂質量分析データを分析した。51個のSNPsはすべて、本明細書中に提供する方法によって実行されたアルゴリズムを用いて構築された22,447個の潜在的な配列変化候補の減少した組中に含まれていた。平均で試料あたり1871個の配列変化がスコア付けされるように、すべての試料について個々に分析を行った。自動化方法によって同定された53個のSNPsのうち、7個は偽陽性であると検証され、46個が本物の陽性であると検証された。ここでも、46個の本物の陽性のSNPsのうち6個については、正確な位置を決定することができなった。
自動化方法によって手動方法により5個少ないSNPsが同定されたが、この感度及び特異性レベルは、パッケージのパラメータを本実施例に適合させたものではなく、デフォルトのスコア付けスキーム及び閾値の分析パッケージを用いて行ったことに留意する。さらに、手動分析を完了するのに必要な数週間の時間とは対照的に、22,447個の配列変化候補の減少した組を構築してスコア付けする自動化方法では、手動シミュレーションでは1132128個の配列変化候補の合計の組であることと比較して、分析データを処理するのに必要となる実行時間が有意に減少し、ゆえに合計の分析時間が減少した。
1.0GHz ペンティアム(登録商標)IIIプロセッサーを用いた単一プロセッサーデスクトップコンピュータ上で、配列変化位数k=1、2、又は3に対応する実行時間測定を行った。k=1では、手動の実行時間は62.6秒であったことと比較して、自動化実行時間は1.5秒であった。配列変化の位数が増すにつれ、実行時間の違いが大きく増した。したがって、k=2では、自動化実行時間は32.2秒であったのに対し、手動実行時間は91.9分であった。k=3では、自動化実行時間は467秒であったのに対し、手動実行時間は57時間であった。したがって、本明細書中に提供する方法に従って実行されるアルゴリズムを用いることにより、さらにより高い位数の変化(k=3)についての配列変化分析を分析する質量スペクトルあたり0.33秒で行うことができ、したがって、質量分析データのリアル・タイム分析に非常に適している。
実施例4
塩基特異的断片化による細菌タイピング
この実施例は、細菌株の塩基特異的断片化方法を提供する。本明細書中に提供する断片化方法に従って及びvon Wintzingerode et al. (Proc. Natl. Acad. Sci. U.S. A. 99(10): 7039-7044(2002)(これを参照により本明細書に取り入れる)で生成されるフラグメントを本明細書中に提供する方法によって分析し、標的細菌株を同定することができる。
材料及び方法
細菌株
ジャーマン・コレクション・オブ・マイクロオーガニズム・アンド・セル・カルチャー(German Collection of Microorganisms and Cell Cultures)(DSMZ、ブラウンシュワイク、ドイツ)及びインスティチュート・フォー・スタンダライゼーション・アンド・ドキュメンターション・イン・メディカル・ラボラトリー(Institute for Standardization and Documentation in Medical Laboratory reg. ass)(Instand e. V.、デュッセルドル、ドイツ)によって提供されるマイコバクテリウム種の12個の参照株(「基準」株)、及び24個のマイコバクテリアの臨床分離株を本研究に用いた。強化サプリメント(MGIT系オレイン酸−アルブミン−デキストロース−クエン酸)及び抗菌サプリメント(MGIT系PANTA(ポリミキシンB、ナリジクス酸、トリメトプリム、及びアズロシリン))を有する液体培地(MGIT液体培地;ベクトン・ディッキンソン・ヨーロッパ社(Becton Dickinson Europe)、フランス)中でマイコバクテリアを増殖させた。30℃で培養したマイコバクテリウム・マリナム(Mycobacterium marinum)を除き、マイコバクテリアを37℃で培養した。細菌の増殖が示されたとき、3300×gで20分間遠心分離することによってマイコバクテリアをブロス0.5ml中で濃縮した。
DNA抽出
市販のキット(呼吸性検体調製キット(Respiratory Specimen Preparation Kit)、AMPLICOR:ロッシュ・モレキュラー・システムズ社(Roche Molecular Systems, Inc.)、ブランチバーグ(Branchburg)、ニュージャージー州、米国)を用いてDNAを抽出した。簡単に言えば、再懸濁したマイコバクテリアのペレット100μlをポリプロピレン管1.5mlに移し、キットによって提供される洗浄溶液(500μl)で洗浄し、10分間遠心分離した(14,000×g)。上清を捨て、細菌ペレットを溶解試薬(100μl)に再懸濁した。60℃の加熱区画中で45分間インキュベーションした後、溶解物を与えられた中和試薬(100μ1)で中和し、得られたDNA溶液を4℃で保存した。
PCRによる同定及び配列決定
12個のマイコバクテリウム参照株(配列番号14〜25を参照のこと)由来の全長16SrRNA遺伝子の配列決定を記載の通りにして分析した(von Wintzingerode et al., Appl. Environ. Microbiol. 65: 283-286 (1999)を参照のこと)。簡単に言えば、真正細菌のプライマーTPU1(大腸菌の位置8〜27に対応するAGA GTT TGA TCM TGG CTC AG(配列番号39)及びRTU8(大腸菌の位置1541〜1522に対応するAAG GAG GTG ATC CAK CCR CA(配列番号40)(大腸菌由来の16SrRNA遺伝子配列についての配列番号29を参照のこと))を用いて16SrDNAをPCR増幅した。PCR生成物をベクターpCR2.1(TAクローニングキット、インビトロゲン社(Invitrigen)、デ・シェルプ(de Schelp)、ネザーランド(Netherlands))と連結し、製造元の指示に従って大腸菌に形質転換した。GFXプラスミド調製キット(アマシャム・ファルマシア社(Amersham Pharmacia)、フライブルク、ドイツ)を用いて、組換えプラスミドDNAを精製し、テルモセキエナーゼ(Thermosequenase)蛍光標識プライマーサイクル配列決定キット(アマシャム・ファルマシア社(Amersham Pharmacia)、フライブルク、ドイツ)によるサイクルシーケンシングに直接用いた。配列決定反応物をLICOR4000L自動化DNAシーケンサー(MWG−バイオテック社(MWG-Biotech)、エーバースベルク、ドイツ)上で分析し、アラインメントをARB−ソフトウェア(http://www.arb-home.de//)を用いて生成した。12個の参照株の全長16SrRNA遺伝子配列をEMBLヌクレオチド配列データベースに寄託し(EMBL受託番号第AJ536031−AJ536042を参照のこと)、配列番号14〜25として配列リスト中に提供した。
Springerら(J. Clin. Microbial 34: 296-303 (1996))のプロトコルに従い、部分16SrDNAのPCR増幅及び腸菌16SrDNA(配列番号29)位置129〜267及び430〜500にそれぞれ対応する超可変領域A及びB上に焦点を当てた直接配列決定により、臨床供給源由来のマイコバクテリアの同定を行った。Husarプログラムパッケージ(バージョン4.0;ハイデルベルグ・ユニックス配列分析リソース(Heidelberg Unix(登録商標) Sequence Analysis Resources)、DKFZ、ハイデルベルグ、ドイツ)のBLASTN及びFASTAプログラムを用いることにより、得られた配列をEMBL及び遺伝子バンクデータベース中のすべての16SrRNA実体の配列と比較した。データベースにエントリーされている両方の超可変領域中の配列同一性に基づいて種レベルまで臨床分離株を同定し、全体の配列同一性は99%を上回った。
PCR及びMALDI−TOFよる同定
すべてのマイコバクテリア株について3ッ組でPCR及びMALDI−TOF分析を行った。PCR増幅混合物は、全体積50μl中に最終MgCl2濃度2.5mM、200μM (各)デオキシヌクレオシド三リン酸、ホット・スター(Hot Star)Taq(キアジェン社(Qiagen)GmbH、ヒルデン、ドイツ)1単位、プライマーMyko109−T7(5’−gtaatacgactcactatagggACG GGT GAG TAA CAC GT−3’(配列番号41)10pmol;大腸菌16SrRNAの位置105〜121に対応する)、プライマーR259−SP6(5’−atttaggtgacactatagaaTTT CAC GAA CAA CGC GAC AA−3’(配列番号42)10pmol;大腸菌16SrRNAの位置609〜590に対応する)、及びDNA5μlを有するPCR緩衝液(Tris−HCl、KCl、(NH42SO4、MgCl2(pH8.7))を含有した。ホット・スター(Hot Star)Taq活性(15分、95℃)の最初の工程後における40サイクルの変性(1分、95℃)、アニーリング(1分、58℃)、及び伸長(1分30秒、72℃)のサーマルサイクラー(ゴールドブロック(Goldblock);バイオメトラ社(Biometra)、ゲッティンゲン、ドイツ)を用いて、PCR増幅を行った。増幅をアガロースゲル電気泳動によって検証した。
RNA転写及びRNaseT1開裂
1×転写緩衝液(6mM MgCl2、10mM DTT、10mM NaCl、10mM スペルミジン、40mM Tris)(pH7.9)20℃)中のPCR生成物2.4μl、T7(又はSP6)RNAポリメラーゼ(エピセントレ社(Epicentre))10単位、0.5mM 各ATP、GTP、UTP、及び5−メチルリボ−CTPを37℃で2時間インキュベーションすることにより、フォワード鎖RNA転写を行った。リボ−CTPを化学修飾されたアナログである5−メチルリボ−CTP(Trilink、USA)に置き換えて、U及びC間の質量の違いを生じさせた。転写を行った後、RNaseT1 20単位及びエビアルカリホスファターゼ(SAP)1単位を添加し、30℃で30分間インキュベーションすることにより、完全なG特異的開裂が達成された。
試料コンディショニング及びMALDI−TOFMS分析
水21μlを添加することによって各試料を希釈した。スペクトロ・クリーン(Spectro CLEAN)TM樹脂(アンモニウムイオンが充填されたカチオンイオン交換樹脂;セケノム社(Sequenom)、米国)6mgを添加することによって、リン酸骨格のコンディショニングを行った。コンディショニング後、試料10nlを、3−HPAマトリクスで予め充填したスペクトロ・チップ(Spectro CHIP)(登録商標)シリコンチップ(セケノム社(Sequenom)、米国)上にピンツール装置を用いて自動的に移した。質量スペクトルはすべて、ビフレックスIII(Biflex III)質量分光計(ブルカー・ダルトニック社(Bruker Daltonik)、ブレーメン、ドイツ)を用いて記録した。専ら正に荷電したイオンを分析し、試料あたり約50のシングルショットスペクトルを蓄積した。ディレイド・イオン・エクストラクション及び合計加速電圧20kVを用いた直線飛行時間型式で、すべての試料を分析した。スペクトル処理及びピーク評価は、製造元(ブルカー・ダルトニック社(Bruker Daltonik))によって提供されるソフトウェアパッケージXMASS5.0、又は検出された質量シグナルパターンを参照配列に由来する基準株のイン・シリコ(in silico)パターンと比較し、かつ、公表された16SrDNA配列のイン・シリコ(in silico)質量パターンと比較することによって臨床分離株の株を同定するためのベースライン修正、ピークの同定、及び校正のための社内ソフトウェアを用いて行った。
結果
マイコバクテリウムの単離
大腸菌16SrDNAの位置105〜609(配列番号29)に対応する16SrRNA遺伝子の約500bpの領域をすべての基準株及び臨床分離株からPCR増幅した。RNA転写及び塩基特異的開裂によって、すべての試験した基準株について特有のMALDI−TOF質量スペクトルが生じた。
結核菌H37Rv(配列番号24)の代表的な質量スペクトルを評価した。主開裂主成物はピーク番号1〜27に帰属され、その核酸組成及び開裂されたPCR単位複製配列内の正確な位置を決定した。参照質量シグナルは、すべてのグアニン位置におけるイン・シリコ(insilico)開裂によって参照配列から計算し、MALDI−TOFMSによって検出される質量シグナルと相関していた。4Da未満の質量の違いを有する計算されたフラグメントは、直線かつ軸型(axial)MALDI−TOFMSによって分離することができなかった。対応する検出された開裂生成物は、1つのフラグメントだけであると評価された(ピーク番号2、3、4、8、9、11、12、18)。
質量シグナルは、「主」開裂生成物(単位複製配列の3’末端の前のもの)又は「最終」開裂生成物(単位複製配列の3’末端にあるもの)のいずれかに分類された。質量シグナル番号22、24、及び25は、それぞれ1つの5−メチル−CTP(3’フラグメント+319.2Da)又は1つのATP(3’フラグメント+329.2Da)を添加することによって異なる転写物の3’末端における(すべて位置510における)開裂生成物を表しているので、「最終」に分類した。ヌクレオチドのRNA転写物の3’末端への鋳型なしでの付加は、TaqDNAポリメラーゼについて周知の特徴であるT7−RNAポリメラーゼのターミナルトランスフェラーゼ活性を示すものであった。ヌクレオチドの末端フラグメントへの鋳型なしの付加は、すべてのマイコバクテリア種についてソフトウェアによる自動化されたフラグメント同定に含まれ、解釈の誤りを回避するものであった。
1500〜2600Daの質量範囲における5つの代表のマイコバクテリア基準株の特徴的な質量スペクトルを分析した。結核菌(M. tuberculosis)(配列番号24)、鳥結核菌(M. avium)(配列番号15)、M.イントラセルラー(M. intracellulare)(配列番号19)、M.カンサイ(M. kansaii)(配列番号20)、及びM.セラタム(M.celatum)(配列番号16)は、それらの特有の質量スペクトルによってはっきりと区別された。結核菌は、1828Daでフラグメントを欠失している唯一の種であった。M.セラタム(M.celatum)は、すべての他の質量パターン内に存在しない1884Daでシグナルを示した。M.カンサイ(M. kansaii)のスペクトルは、2180Daでシグナルを示さなかった。鳥結核菌(M. avium)及びM.イントラセルラー(M. intracellulare)の質量スペクトルはそれぞれ、2532Da及び2157Daでのフラグメントが他の種とは異なる。
この研究で用いられるすべてのマイコバクテリア種のイン・シリコ(in silico)識別ピークパターンを編集した。結核菌(M. tuberculosis)の質量スペクトルと比較した消失及び追加ピークの数に従い、ランク付けを行った。すべてのマイコバクテリア種全体を通して存在しない識別ピークだけが含まれていた。結核菌(M. tuberculosis)は、複数の追加又は消失質量シグナルに基づいて他の種とはっきりと区別することができた。1つの消失ピーク及び3つの追加ピーク又は2つの消失ピーク及び2つの追加のピークをそれぞれ示すM.セラタム(M.celatum)及びM.カンサイ(M. kansaii)は、結核菌(M. tuberculosis)と比較して、最も近い種であった。M.マリナム(M. marinum)(配列番号24)及びM.スクロフラセウム(M. scrofulaceum)(配列番号22)は、2つのフラグメント(2453.5Da、2795.8Da)だけが異なっていた。すべての計算された質量パターンを実験によって確認した。すべての質量スペクトルを比較することによって、すべてのマイコバクテリア種が明確に同定された。
M.キセノピ(M. xenopi)基準株DSM43995の場合、実験による及び計算された質量パターンの比較によって4408.8Daでの追加質量ピークがMALDITOF分析で明らかになった。それぞれのM.キセノピ(M. xenopi)16SrDNA単位複製配列(配列番号25)をクローニングし、いくつかのプラスミドの配列決定を繰り返し行うことによって、大腸菌位置198(T/C)及び434(T/C)における1〜2塩基対が異なる3つの配列変異体が検出された。大腸菌位置198における配列変化は、G特異的開裂反応では検出されない。得られた二量体フラグメント(50H−TG−3p及び50H−CG−3p)は、単位複製配列中の異なる位置に由来する同じ組成の開裂生成物と共通していた。約500bpの単位複製配列の塩基特異的開裂によって、二量体のすべての可能な組み合わせが統計的に生じ、複数回示された。さらに、1000Da未満の質量範囲は、マトリクス支援レーザー脱離/イオン化飛行時間型質量分析における3−ヒドロキシピコリン酸マトリクス(3−HPA)の使用に特異的な特徴であるマトリクス分子によって生じるバックグラウンドノイズシグナルによって影響され得ることができる。
大腸菌位置434(T/C)における配列変化は、14bpのG特異的開裂生成物に影響を与える。T(開裂されたRNA中のUに対応する)及びCの間のヌクレオチド質量の違いによって、予測フラグメントの質量は13Da小さくなる。4408.8Da及び4421.8Daにおいて双方の質量シグナルが検出されることは、分析される基準株の単位複製配列が両方の配列変異体の混合物からなることを示している。
12個のマイコバクテリア基準株を含むデータベースを構築した後、24個の臨床分離株をMALDI−TOF質量分析で自動的に分析した。RNA転写される16SrDNA増幅生成物のG特異的開裂及び質量分析によって、21個の分離株が明瞭に同定された。21個の分離株のうち、8個が結核菌(M. tuberculosis)(配列番号24)と同定され、鳥結核菌(M. avium)(配列番号15)、M.ゴルドナエ(M. gordonae))(配列番号18)、M.イントラセルラー(M. intracellulare)(配列番号19)、及びM. キセノピ(M. xenopi)(配列番号25)の各々から2個の分離株が同定された。残りの5個の分離株は、M.シェロナエ)(M.chelonae)(配列番号85)、M.フォルティウム(M. fortuitum)(配列番号17)、M.カンサイ(M. kansaii)(配列番号20)、M.マリナム(M. marinum)(配列番号21)、及びスメグマ菌(M. smegmatis)(配列番号23)と同定された。
基準株データベース由来の種を表すすべての分離株は、繰り返し行った実験で正確に同定された。3個の臨床分離株であるM.アウラム(M. aurum)(MT1323)、M.パラフィニウム(M. paraffinicum)(MT1423)、及びM.インタージェクタム(M. interjectum)(MT1223)は、それらのRNA開裂生成物のMALDI−TOF分析後には同定することができなかった。データベースは、対応する3種のすべてのイン・シリコ(in silico)質量パターンを欠いていた。M.パラフィニウム(M. paraffinicum)(配列番号26)、M.インタージェクタム(M. interjectum)(配列番号27)、及びM.アウラム(M. aurum)(配列番号28)の公表された16SrDNA配列から計算される種特異的質量シグナルパターンを有するデータベースの拡大によって、すべての対応する実験で正しく同定された。
ボルデテラ株
3個の既知のボルデテラ種であるボルデテラ・アビウム(Bordetella avium)、ボルデテラ・テレマタム(Bordetella trematum)、及びボルデテラ・ペトリ(Bordetella petrii)、及びさらに嫌気性かつ有機塩素によって減少する微生物共同体の6個の未だ培養していない細菌(von Wintzingerode et al (Proc. Natl. Acad. Sci. USA. 99(10) : 7039-7044 (2002)を参照のこと)を、真正細菌のプライマーTPU1(配列番号39)及びRTU8(配列番号40)を用いてそれらの可変16SrRNA遺伝子領域(配列番号30〜38を参照のこと)を増幅することにより、上記の方法によって分析した。記載の通り、リボ−CTP及びリボ−UTPヌクレオチドの間の1Daの質量の違いは、転写収率の検出可能な損失なく、いずれかのピリミジン塩基をその5Me−アナログに置き換えることによって増した。RNAseT1によるG特異的開裂により、個々の16SrRNA遺伝子標的配列を示すフラグメント質量の特徴的なパターンが生じた。未だ培養してない6個のボルデテラ株すべてが明瞭に同定され、結果は標準の蛍光ジデオキシ配列決定によって得られるものと一致した。
実施例5
塩基特異的断片化によるメチル化パターンの検出
メチル基のシトシンへの共有結合による結合が、CpGジヌクレオチドで主に観察される。これらのCpG島は、他のジヌクレオチドよりも観察される頻度が少なく、ランダム核酸配列について予測されるよりも観察される頻度が少ない。多数のCpGジヌクレオチドが、プロモーター領域及び遺伝子の5’末端で観察される。配列中のメチル化パターン標的を研究するための断片化分析の使用のための代表的なプロトコルを本明細書中に提供する。本明細書中での代表的なプロトコルに従って生じたフラグメントを、参照配列と相対的な標的配列メチル化パターンの変化を研究するための本明細書中に提供する方法に従って分析することができる。
メチル化シトシンを含むゲノムDNAを重亜硫酸ナトリウムで処理することができ、この場合、非メチル化シトシンはウラシルに変換されるが、メチル化シトシンはシトシンのままである。重亜硫酸塩処理後には、上部及び下部の鎖はもはや相補的ではない。このメチル化に依存した配列変化は、メチル化パターンの分析の基礎として役立つことができる。メチル化が影響を受けるフラグメントの質量シフトをもたらす場合には、質量分析を用いた関連する配列変化のメチル化の検出は定義されるフラグメントを作ることによって行うことができる。
染色体11.p15.5(配列番号43)のIgf2/H19座において、シトシンメチル化の検出を試験した。インプリンティング制御領域(ICR)として知られるH19及びIgf2間の配列を精液では完全にメチル化し、卵母細胞では完全に非メチル化した。成人血液試料では、IGF2/H19領域を一方の親対立遺伝子上のみでメチル化した。Igf2は、必要不可欠な胎児成長因子であり、その誤った調節はベックウィズ−ヴィーデマン症候群及びウィルムス腫瘍の一因となる。H19は、機能が未だ不明である謎の非翻訳RNAである。Igf2/H19については、区別してメチル化されるICRが双方の遺伝子のインプリンティングされる転写に必要である。
ゲノムDNAの重亜硫酸塩処理に続いてPCRを行った。PCR用のプライマーは、T7又はSP6ポリメラーゼのために5’末端で転写標識を含んでいるものとした。ある場合では、6個の塩基(agaagg)を含む転写標識をポリメラーゼ標識及びオリゴのDNA結合部位の間に置く。このことは、転写反応を改善し、時期尚な終結の効果を抑制するのに役立つ。
RNA転写を384ウェルプレートフォーマット中で行った。転写マスターミックスをPCR生成物に添加した後、転写を37℃で2時間行った。次に、開裂酵素混合物を転写反応物に添加した。その後、イオン交換体を添加し、反応溶液をチップ上にスポットで移し、MALDI−TOF MSによって分析した。
2個の異なる酵素であるエンドリボヌクレアーゼRNaseT1及びRNaseAにより、RNA開裂を行うことができる。両者は、ホスホジエステル結合を開裂することによって一本鎖RNAに対して作用するが、それらの標的ヌクレオチドにおいて異なる。RNaseT1は、隣接するヌクレオチドの3’−グアニル残基及び5’−ヒドロキシ残基の間を開裂する。この反応により、末端3’−GMPを有するオリゴヌクレオチドが生ずる。RNaseAは、RNAをC及びU残基において特異的に攻撃する。RNaseAは、ヌクレオチドの5’−リボース及び隣接するピリミジンヌクレオチドの3’−リボースに結合したリン酸基の間の開裂を触媒する。
RNase処理後、SAPを開裂反応物に添加して環状一リン酸副生成物の量を減少させた。
変異体ポリメラーゼT7を用いてdCTP又はdTTPのいずれかを転写物に導入した。これにより、dCTP又はdTTPがそれぞれ導入されたときにU又はC残基における塩基特異的開裂が可能となり、ほとんど同一の質量のrCTP及びrTTPから生ずる問題も解決した。
したがって、1つの配列について6個の理論的に可能な開裂スキームがある。
Figure 0004786904
一例では、TAAAC(5’Me)GCATなどの重亜硫酸塩で処理したDNA配列は、5番目の位置のシトシンでメチル化された場合にはTAAACGTATのままであり、メチル化されない場合にはTAAATGTATへと変換する。
M32053標的領域の転写産物は、ggg転写開始点及びagaagg標識並びに長さが421個のヌクレオチドの転写産物の双方を含む、長さが430個のヌクレオチドのフラグメントである。塩基特異的開裂後における得られたフラグメントの数は、開裂スキーム、転写方向、及びメチル化状態に依存する。
結果
RNAseA開裂
フォワード転写物:
メチル化試料のスペクトルは、非メチル化試料とはっきりと区別された。CpGメチル化のすべての場合で、それらのフラグメント中のメチル化に帰属することができる新たなフラグメントが作り出された。それらのフラグメントのうち5つは2CpG部位を含み、2つのシグナルがCpG部位を1つ含む2つのフラグメントによって作り出された。ある場合には、CpG部位のどちらの1つが検出シグナルの原因であるかをはっきりと区別できず、それらの場合において、非メチル化CpG島から生じるシグナルが存在していないことは、メチル化状態の同定に役立った。
逆転写物:
メチル化及び非メチル化試料は、はっきりと区別できた。フォワード転写とは対照的に、すべてのメチル化事象によって、対応するシグナルの質量がシフトした。シグナル強度は、フォワード反応物と比較してわずかに良好であった。
RNASE T1開裂:
全シグナル強度は、RNAseA開裂試料の場合より低かった。転写の結果は、野生型T7ポリメラーゼを用いたときが最良であった。SAPを開裂反応に添加すること及びagaagg標識をプライマーに組み入れることによって、効率は改善しなかった。
フォワード転写物:
フォワード反応物では、メチル化試料は非メチル化試料とはっきり区別できた。メチル化試料での13dの質量シフトは、ピークが互いに近いゆえにシグナル群中で検出することが時々困難であった。
逆転写物:
逆反応物は、他の転写と比較して、非メチル化試料においてより複雑であった。フォワード鎖中にシトシンがないので、逆転写物中にグアノシンがなく、したがって、酵素が切断する認識部位がなかった。したがって、シグナル強度は弱かった。
IGF2/H19インプリンティング領域であるM32053のメチル化パターン
m32053領域のメチル化パターンは、メチル化及び非メチル化DNAではっきり区別できた。分析試料は、完全にメチル化したかあるいはメチル化しないかのいずれかとした。先行文献は、生殖系列でのメチル化及び非メチル化DNAの完全な分離及びさらに成熟段階を記載している。位置470におけるDNAのCpG部位は、メチル化とはっきりタイピングされた。データにより、位置347におけるCpNpG部位のメチル化も確認された。
メチル化の割合
DNA試料中のメチル化の割合を決定するために、異なる量のメチル化及び非メチル化DNAをプールした。プラスミドDNAの濃度の決定をピコ・グリーン(Pico Green)蛍光アッセイで行った。
分析試料は、メチル化DNAの濃度が増加していくものとした。0%、0.5%、1%、5%、10%、20%...90%、95%、99%、99.5%、及び100%のメチル化DNAを含むDNAプールを分析した。RNAseA開裂を両方の転写方向で行った。フォワード及び逆反応を比較して、精度又は信頼性に有意な違いはなかった。ピーク面積を測定し、非メチル化に対するメチル化の割合を調べた。
メチル化の割合は、10〜90%のメチル化DNAの範囲において±2%の精度で決定された。メチル化DNAの高い範囲及び低い範囲では精度は減少した。メチル化DNAの濃度が5%以内である試料では、対応するピークをバックグラウンドから分解するのは困難となる。したがって、検出限界は約1〜5%のメチル化DNAであった。
ゲノムDNA
分析によって、メチル化及び非メチル化クローンが50/50の割合であることが示された。これは、ゲノムDNA中のメチル化及び非メチル化対立遺伝子のPCR増幅が等しいことを示している。
適用範囲及び重複性
理論では、各メチル化CpGは、同じ質量スペクトルにおいて少なくとも1つの表示質量シグナルを生ずる特異的フラグメントを生ずることができる。これらのシグナルのいくつかは、それらの質量が高い又は低い質量カットオフに属するので、検出可能ではないであろう。MALDI−TOF装置により、長さがフラグメント約3〜35個のヌクレオチドに等しい1000〜11000Daの質量を有する開裂生成物の検出が可能となる。標的核酸配列に依存して、1つの反応のみで、例えば、標的核酸内のすべてのCpG部位の約75%のメチル化状態の決定が可能となる。ほぼすべてのCpG部位に関する情報を得るため、反応がフォワード又は逆転写産物のC又はT特異的開裂を含むことができる2〜4つの反応を用いることができる。逆鎖上のC特異的開裂はフォワード鎖上のG特異的開裂と等しく、逆鎖上のT特異的開裂はフォワード鎖上のA特異的開裂と等しいので、この組み合わせによってフォワード鎖上のすべてのヌクレオチドにおいて塩基特異的開裂が可能となる。2〜4つの開裂反応からの情報を合わせることによって、正確なメチル化パターンを編集すること可能となる。IGF2/H19領域については、各CpG部位についてのメチル化状態を得るのに2つ反応でも十分である。4つの反応を用いることにより、すべてのCpG部位の92%が2超のシグナルによって表される重複した情報が提供された。したがって、各メチル化の事象は、1つ以上の観察によって独立して確認された。
RNA断片化とMALDI−TOFMS検出とを組み合わせて用いるメチル化分析は、ハイスループット分析と質の劣ったDNAを少量使用することとを組み合わる可能性を与える成功的な技術である。それは、定量的だけではなく、定量的方法でもある。代表的なプロトコルに従って生じたフラグメントを本明細書中で提供する方法による分析に用いることができる。
実施例6
試料混合物中の配列変化の分析
この研究の目的は、異なるDNA比の野生型及び変異体DNAを有する試料での塩基特異的断片化により参照配列と相対的な標的配列中の配列変化の分析を行い、検出感度を評価することであった。
材料及び方法
DNAは、腫瘍遺伝子K−Ras(配列番号44)に由来する269bp単位複製配列であった。DNA試料は、野生型配列又は腫瘍細胞系に由来するK−Ras変異体配列のいずれかを含有していた。DNA試料(試料A、B、C、D、及びE)を野生型及び異型接合変異DNAの異なる比で混合した。以下の表に示す通り、混合物中の変異DNAの比は試料あたり0%〜50%で変動した。
Figure 0004786904
各DNA試料は、50ng(10ng/μl・5μl)を含有した。実施例1に提供されるプロトコルに従った均一な塩基特異的開裂反応を異なる4日の間に4回行った。野生型単位複製配列と相対的な変異体単位複製配列の異なる開裂によって得られたフラグメントを、本明細書中に提供する方法に従い、質量分析に続いて質量スペクトルフラグメントピークの分析よって分析した。
結果
位置216におけるG/A置換を変異体単位複製配列中で検出した。G対立遺伝子中の2313dからA対立遺伝子中の2297dへのC特異的フォワード反応物での質量シフトによって、変異を確認した。このシグナルの検出は、変異体配列中のSNPの存在を同定するのに必要であった。2297d(A対立遺伝子に対応する)におけるシグナルは、変異体対立遺伝子がたった5%のレベルで存在するときでさえ(DNA試料B)、すべてのDNA試料A、B、C、及びDで検出された。
変更は当業者に明らかであるゆえに、本発明は付随の特許請求の範囲によってのみ限定されないことを意図している。
図1は、本明細書に記載される方法及びプロセスによってデータ分析を行うコンピュータシステムによって実行される操作を図示したフローチャートである。 図2は、配列変化候補の減少した組を決定するためにコンピュータシステムによって実行される操作を図示したフローチャートである。 図3は、試料の処理を行い、かつ、図1及び図2に図示した操作を行うシステムのブロック線図である。 図4は、図3に図示するデータ分析コンピュータのブロック線図である。

Claims (12)

  1. 標的核酸中の1又は複数の配列変化のある配列を決定する方法であって:
    a)(i)標的核酸及び参照核酸をフラグメントに開裂し、(ii)フラグメントの質量シグナルを決定することに起因するフラグメントの質量シグナルを提供する工程;
    b)標的核酸フラグメントと参照核酸フラグメントとの間の質量シグナルの差を同定し、それにより異なるフラグメントを決定する工程;
    c)工程b)において同定された各異なるフラグメントに対応する1又は複数のコンポマー・ウィットネスを生じさせる工程;
    d)コンポマー・ウィットネスに対する、参照配列と相対的な標的配列中に含まれる可能な配列変化を表す全ての配列を決定することによって配列変化候補の減少した組を同定する工程;及び
    e)標的配列に対応する候補配列変化を決定するための候補配列変化をスコア付けし、標的核酸における1又は複数の配列変化を決定する工程
    を含む方法。
  2. 工程b)における質量シグナルの違いが、消失シグナル、追加シグナル、強度が異なるシグナル、及び異なるシグナル対ノイズ比を有するシグナルからなる群から選択される、請求項1に記載の方法。
  3. 前記質量シグナルを質量分析によって決定する、請求項1に記載の方法。
  4. (i)標的核酸及び参照核酸を提供する工程;(ii)特異的開裂によって標的核酸及び参照核酸のフラグメントを生じさせる工程;及び(iii)前記フラグメントの質量シグナルを決定する工程をさらに含み、ここで、(iii)の質量シグナルが(a)において提供される、請求項1に記載の方法。
  5. 1つの特異的開裂試薬が、フラグメントを生じさせるために利用される、請求項4に記載の方法。
  6. コンポマー・ウィットネスが、異なるフラグメントの質量、質量がタイプ又は長さで単一ヌクレオチドだけ異なるフラグメント間のピーク分離、及び質量分光計の分解能からなる群から選択されるパラメータに基づいて生じる、請求項3に記載の方法。
  7. 標的及び参照核酸をフラグメントに切断することが、特異的開裂試薬との接触によって生じる、請求項1に記載の方法。
  8. 配列変化候補の減少した組からの配列が、スコア付けアルゴリズムによって同定される、請求項1に記載の方法。
  9. 標的核酸中の1又は複数の配列変化を決定する方法であって:
    (a)(i)複数の開裂反応によって、核酸混合物中にある標的核酸を含む試料の特異的開裂、及び同じ開裂反応によって参照核酸の特異的開裂;ならびに(ii)該断片の質量シグナルを決定すること、に起因する複数の断片化パターンを提供する工程;
    (b)標的核酸フラグメントの複数の断片化パターンと参照核酸フラグメントの複数の断片化パターンとの間の質量シグナルにおける違いを同定し、それにより異なるフラグメントを同定する工程;
    (c)標的核酸中の特定の配列変異と一致する異なるフラグメントを同定する工程;
    (d)(c)の一致した異なるフラグメントを組み合わせて、異なるフラグメントのスペクトルを得る工程;
    (e)(d)の異なるフラグメントのスペクトルから、異なるフラグメントの各々に対応する1又は複数のコンポマー・ウィットネスを生じさせる工程;
    (f)コンポマー・ウィットネスに対応する、参照配列と相対的な標的配列中に含まれる可能な配列変化を表す全ての配列を決定することによって候補配列である配列変化を決定する工程;
    (g)(f)の候補配列をスコア付けする工程;及び
    (h)標的核酸における1又は複数の配列変化を決定する工程
    を含む方法。
  10. コンポマー・ウィットネスが、異なるフラグメントの質量、質量がタイプ又は長さで単一ヌクレオチドだけ異なるフラグメント間のピーク分離、及び質量分光計の分解能からなる群から選択されるパラメータに基づいて生じる、請求項に記載の方法。
  11. (f)の配列変化が、多くともk個の配列変化を有する1又は複数の候補配列に従って決定され、ここで、kは、1、2、3又はそれ以上である、請求項に記載の方法。
  12. 各異なるフラグメントについての1又は複数のコンポマー・ウィットネスが、異なるフラグメントの実際の質量との質量差の範囲内の質量を有する、請求項に記載の方法。
JP2004557369A 2002-11-27 2003-11-26 配列変化検出及び発見用の断片化をベースとする方法及びシステム Expired - Fee Related JP4786904B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US42989502P 2002-11-27 2002-11-27
US60/429,895 2002-11-27
PCT/US2003/037931 WO2004050839A2 (en) 2002-11-27 2003-11-26 Fragmentation-based methods and systems for sequence variation detection and discovery

Publications (3)

Publication Number Publication Date
JP2006515987A JP2006515987A (ja) 2006-06-15
JP2006515987A5 JP2006515987A5 (ja) 2007-01-18
JP4786904B2 true JP4786904B2 (ja) 2011-10-05

Family

ID=32469386

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004557369A Expired - Fee Related JP4786904B2 (ja) 2002-11-27 2003-11-26 配列変化検出及び発見用の断片化をベースとする方法及びシステム

Country Status (8)

Country Link
US (1) US7820378B2 (ja)
EP (1) EP1613723B1 (ja)
JP (1) JP4786904B2 (ja)
CN (1) CN1774511B (ja)
AU (1) AU2003298733B2 (ja)
CA (1) CA2507189C (ja)
HK (1) HK1087436A1 (ja)
WO (1) WO2004050839A2 (ja)

Families Citing this family (147)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6994969B1 (en) * 1999-04-30 2006-02-07 Methexis Genomics, N.V. Diagnostic sequencing by a combination of specific cleavage and mass spectrometry
CA2386791A1 (en) * 1999-10-08 2001-04-19 Protogene Laboratories, Inc. Method and apparatus for performing large numbers of reactions using array assembly
US7332275B2 (en) * 1999-10-13 2008-02-19 Sequenom, Inc. Methods for detecting methylated nucleotides
CA2507189C (en) 2002-11-27 2018-06-12 Sequenom, Inc. Fragmentation-based methods and systems for sequence variation detection and discovery
AU2004235331B2 (en) * 2003-04-25 2008-12-18 Sequenom, Inc. Fragmentation-based methods and systems for De Novo sequencing
WO2005024068A2 (en) * 2003-09-05 2005-03-17 Sequenom, Inc. Allele-specific sequence variation analysis
US20050149272A1 (en) * 2003-09-10 2005-07-07 Itshack Pe' Er Method for sequencing polynucleotides
US20050196809A1 (en) * 2004-03-05 2005-09-08 Kelleher Neil L. Identification and characterization of proteins using new database search modes
WO2005093095A1 (de) * 2004-03-24 2005-10-06 Epigenomics Ag Verfahren zur analyse von cytosinmethylierungen
CA2561381C (en) 2004-03-26 2015-05-12 Sequenom, Inc. Base specific cleavage of methylation-specific amplification products in combination with mass analysis
US7785843B2 (en) * 2004-06-23 2010-08-31 Sequenom, Inc. Target-specific compomers and methods of use
WO2006031745A2 (en) * 2004-09-10 2006-03-23 Sequenom, Inc. Methods for long-range sequence analysis of nucleic acids
EP1836213A4 (en) * 2004-12-13 2009-06-10 Autogenomics Inc COMPOSITIONS AND METHODS FOR NUCLEIC ACID ANALYSIS OF SEQUENCES HAVING INSERTIONS OR DELETIONS
US7765068B2 (en) 2005-01-31 2010-07-27 The Board Of Trustees Of The University Of Illinois Identification and characterization of protein fragments
EP1762629B1 (en) 2005-09-12 2009-11-11 Roche Diagnostics GmbH Detection of biological DNA
DE102006003415A1 (de) * 2006-01-24 2007-08-02 Siemens Ag Verfahren zur Analyse einer Probe
EP2029777B1 (en) 2006-05-31 2017-03-08 Sequenom, Inc. Methods and compositions for the extraction of nucleic acid from a sample
US7902345B2 (en) 2006-12-05 2011-03-08 Sequenom, Inc. Detection and quantification of biomolecules using mass spectrometry
WO2009032781A2 (en) 2007-08-29 2009-03-12 Sequenom, Inc. Methods and compositions for universal size-specific polymerase chain reaction
US7888127B2 (en) 2008-01-15 2011-02-15 Sequenom, Inc. Methods for reducing adduct formation for mass spectrometry analysis
WO2009092035A2 (en) * 2008-01-17 2009-07-23 Sequenom, Inc. Methods and compositions for the analysis of biological molecules
EP3699291A1 (en) 2008-01-17 2020-08-26 Sequenom, Inc. Single molecule nucleic acid sequence analysis processes and compositions
AU2009223671B2 (en) * 2008-03-11 2014-11-27 Sequenom, Inc. Nucleic acid-based tests for prenatal gender determination
US20100063742A1 (en) * 2008-09-10 2010-03-11 Hart Christopher E Multi-scale short read assembly
US8962247B2 (en) 2008-09-16 2015-02-24 Sequenom, Inc. Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non invasive prenatal diagnoses
US8476013B2 (en) * 2008-09-16 2013-07-02 Sequenom, Inc. Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
CN102203292B (zh) * 2008-10-29 2014-06-25 南克森制药公司 通过质谱分析法测序核酸分子
US10533215B2 (en) 2008-11-24 2020-01-14 Sequenom, Inc. Nucleic acid quantification products and processes
EP2358905A1 (en) * 2008-12-19 2011-08-24 Abbott Laboratories Diagnostic test for mutations in codons 12-13 of human k-ras
DE102009005845A1 (de) * 2009-01-21 2010-07-22 Friedrich-Schiller-Universität Jena Verfahren zur Indentifizierung insbesondere unbekannter Substanzen durch Massenspektrometrie
WO2010091023A2 (en) * 2009-02-03 2010-08-12 Complete Genomics, Inc. Indexing a reference sequence for oligomer sequence mapping
EP2394165A4 (en) * 2009-02-03 2013-12-11 Complete Genomics Inc ASSIGNMENT OF OLIGOMER SEQUENCES
WO2010091021A2 (en) * 2009-02-03 2010-08-12 Complete Genomics, Inc. Oligomer sequences mapping
EP2408936A4 (en) * 2009-03-18 2013-01-30 Sequenom Inc USE OF HEAT-STAINED ENDONUCLEASES FOR THE PREPARATION OF REPORTER MOLECULES
EP3211095B1 (en) 2009-04-03 2019-01-02 Sequenom, Inc. Nucleic acid preparation compositions and methods
DK2511843T3 (en) * 2009-04-29 2017-03-27 Complete Genomics Inc METHOD AND SYSTEM FOR DETERMINING VARIATIONS IN A SAMPLE POLYNUCLEOTIDE SEQUENCE IN TERMS OF A REFERENCE POLYNUCLEOTIDE SEQUENCE
AU2010242073C1 (en) 2009-04-30 2015-12-24 Good Start Genetics, Inc. Methods and compositions for evaluating genetic markers
CN102482638A (zh) 2009-07-02 2012-05-30 微德赞股份有限公司 制备己二酸的生物学方法
CA2767259A1 (en) * 2009-07-09 2011-01-13 Verdezyne, Inc. Engineered microorganisms with enhanced fermentation activity
US8889394B2 (en) * 2009-09-07 2014-11-18 Empire Technology Development Llc Multiple domain proteins
WO2011041695A1 (en) * 2009-10-02 2011-04-07 Ibis Biosciences, Inc. Determination of methylation status of polynucleotides
ES2577017T3 (es) 2009-12-22 2016-07-12 Sequenom, Inc. Procedimientos y kits para identificar la aneuploidia
ES2609669T3 (es) * 2010-02-18 2017-04-21 F. Hoffmann-La Roche Ag Método para la determinación de variantes de secuencia de polipéptidos
JP5738027B2 (ja) 2010-03-30 2015-06-17 キヤノン株式会社 質量分析法
US8412462B1 (en) 2010-06-25 2013-04-02 Annai Systems, Inc. Methods and systems for processing genomic data
JP5838557B2 (ja) 2010-07-05 2016-01-06 ソニー株式会社 生体情報処理方法および装置、並びに記録媒体
JP6222202B2 (ja) * 2010-07-05 2017-11-01 ソニー株式会社 生体情報処理方法および装置、並びに記録媒体
WO2012031036A2 (en) 2010-08-31 2012-03-08 Lawrence Ganeshalingam Method and systems for processing polymeric sequence data and related information
US9163281B2 (en) 2010-12-23 2015-10-20 Good Start Genetics, Inc. Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction
JPWO2012111249A1 (ja) * 2011-02-14 2014-07-03 学校法人麻布獣医学園 質量分析法における質量変化を検出する方法及び安定同位体標識タンパク質の絶対量の定量方法
WO2012122546A2 (en) 2011-03-09 2012-09-13 Lawrence Ganeshalingam Biological data networks and methods therefor
AU2012249531B2 (en) 2011-04-29 2017-06-29 Sequenom, Inc. Quantification of a minority nucleic acid species
US8343752B2 (en) 2011-05-03 2013-01-01 Verdezyne, Inc. Biological methods for preparing adipic acid
US8728798B2 (en) 2011-05-03 2014-05-20 Verdezyne, Inc. Biological methods for preparing adipic acid
US20140235474A1 (en) 2011-06-24 2014-08-21 Sequenom, Inc. Methods and processes for non invasive assessment of a genetic variation
MY165893A (en) 2011-07-06 2018-05-18 Verdezyne Inc Biological methods for preparing a fatty dicarboxylic acid
EP2764459B1 (en) 2011-10-06 2021-06-30 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10196681B2 (en) 2011-10-06 2019-02-05 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10424394B2 (en) 2011-10-06 2019-09-24 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
WO2013052907A2 (en) 2011-10-06 2013-04-11 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9367663B2 (en) 2011-10-06 2016-06-14 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9984198B2 (en) 2011-10-06 2018-05-29 Sequenom, Inc. Reducing sequence read count error in assessment of complex genetic variations
EP3243908B1 (en) 2011-10-11 2019-01-02 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US8688388B2 (en) 2011-10-11 2014-04-01 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
CA2852665A1 (en) 2011-10-17 2013-04-25 Good Start Genetics, Inc. Analysis methods
JP5750676B2 (ja) 2011-10-18 2015-07-22 株式会社島津製作所 細胞識別装置及びプログラム
CA2861856C (en) 2012-01-20 2020-06-02 Sequenom, Inc. Diagnostic processes that factor experimental conditions
EP2820129A1 (en) 2012-03-02 2015-01-07 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US8209130B1 (en) 2012-04-04 2012-06-26 Good Start Genetics, Inc. Sequence assembly
US8812422B2 (en) 2012-04-09 2014-08-19 Good Start Genetics, Inc. Variant database
US10227635B2 (en) 2012-04-16 2019-03-12 Molecular Loop Biosolutions, Llc Capture reactions
US10504613B2 (en) 2012-12-20 2019-12-10 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
ES2902401T3 (es) 2012-05-21 2022-03-28 Sequenom Inc Métodos y procesos para la evaluación no invasiva de variaciones genéticas
US9920361B2 (en) 2012-05-21 2018-03-20 Sequenom, Inc. Methods and compositions for analyzing nucleic acid
US10497461B2 (en) 2012-06-22 2019-12-03 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9491236B2 (en) 2012-06-22 2016-11-08 Annai Systems Inc. System and method for secure, high-speed transfer of very large files
US20140004105A1 (en) 2012-06-29 2014-01-02 Sequenom, Inc. Age-related macular degeneration diagnostics
CA2878979C (en) 2012-07-13 2021-09-14 Sequenom, Inc. Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
US10482994B2 (en) 2012-10-04 2019-11-19 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
WO2014055790A2 (en) 2012-10-04 2014-04-10 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9850493B2 (en) 2012-12-19 2017-12-26 Verdezyne, Inc. Biological methods for preparing a fatty dicarboxylic acid
US9909151B2 (en) 2012-12-19 2018-03-06 Verdezyne, Inc. Biological methods for preparing a fatty dicarboxylic acid
US20130309666A1 (en) 2013-01-25 2013-11-21 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US20130189684A1 (en) 2013-03-12 2013-07-25 Sequenom, Inc. Quantification of cell-specific nucleic acid markers
US9305756B2 (en) 2013-03-13 2016-04-05 Agena Bioscience, Inc. Preparation enhancements and methods of use for MALDI mass spectrometry
US11060145B2 (en) 2013-03-13 2021-07-13 Sequenom, Inc. Methods and compositions for identifying presence or absence of hypermethylation or hypomethylation locus
US8778609B1 (en) 2013-03-14 2014-07-15 Good Start Genetics, Inc. Methods for analyzing nucleic acids
US10930368B2 (en) 2013-04-03 2021-02-23 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
CA2910205C (en) 2013-05-24 2023-04-04 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US8847799B1 (en) 2013-06-03 2014-09-30 Good Start Genetics, Inc. Methods and systems for storing sequence read data
IL303830A (en) 2013-06-21 2023-08-01 Sequenom Inc Methods and processes for non-invasive evaluation of genetic variations
JP2015035212A (ja) * 2013-07-29 2015-02-19 アジレント・テクノロジーズ・インクAgilent Technologies, Inc. ターゲットシークエンシングパネルから変異を見つける方法
US10726942B2 (en) 2013-08-23 2020-07-28 Complete Genomics, Inc. Long fragment de novo assembly using short reads
DK3053071T3 (da) 2013-10-04 2024-01-22 Sequenom Inc Fremgangsmåder og processer til ikke-invasiv bedømmelse af genetiske variationer
JP6680680B2 (ja) 2013-10-07 2020-04-15 セクエノム, インコーポレイテッド 染色体変化の非侵襲性評価のための方法およびプロセス
EP3058096A1 (en) 2013-10-18 2016-08-24 Good Start Genetics, Inc. Methods for assessing a genomic region of a subject
US10851414B2 (en) 2013-10-18 2020-12-01 Good Start Genetics, Inc. Methods for determining carrier status
EP3117011B1 (en) 2014-03-13 2020-05-06 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
TWI638047B (zh) 2014-04-09 2018-10-11 史基普研究協會 藉由核酸三磷酸酯轉運子將非天然或經修飾的核苷三磷酸酯輸入至細胞中
WO2015175530A1 (en) 2014-05-12 2015-11-19 Gore Athurva Methods for detecting aneuploidy
EP3598452B1 (en) 2014-05-30 2023-07-26 Sequenom, Inc. Chromosome representation determinations
EP3175000B1 (en) 2014-07-30 2020-07-29 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10910086B2 (en) * 2014-08-15 2021-02-02 Life Technologies Corporation Methods and systems for detecting minor variants in a sample of genetic material
US11408024B2 (en) 2014-09-10 2022-08-09 Molecular Loop Biosciences, Inc. Methods for selectively suppressing non-target sequences
WO2016040602A1 (en) * 2014-09-11 2016-03-17 Epicentre Technologies Corporation Reduced representation bisulfite sequencing using uracil n-glycosylase (ung) and endonuclease iv
WO2016048829A1 (en) 2014-09-24 2016-03-31 Good Start Genetics, Inc. Process control for increased robustness of genetic assays
WO2016057901A1 (en) 2014-10-10 2016-04-14 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10000799B2 (en) 2014-11-04 2018-06-19 Boreal Genomics, Inc. Methods of sequencing with linked fragments
JP6694635B2 (ja) * 2014-12-26 2020-05-20 国立大学法人大阪大学 マイクロrnaにおけるメチル化修飾部位を計測する方法
EP3271480B8 (en) 2015-01-06 2022-09-28 Molecular Loop Biosciences, Inc. Screening for structural variants
US20180148744A1 (en) 2015-03-20 2018-05-31 Verdezyne, Inc. Biological methods for preparing 3-hydroxypropionic acid
US10395759B2 (en) 2015-05-18 2019-08-27 Regeneron Pharmaceuticals, Inc. Methods and systems for copy number variant detection
WO2016203267A2 (en) * 2015-06-19 2016-12-22 Cambridge Enterprise Limited Diagnosis and treatment of infectious disease
CA3002449A1 (en) 2015-11-16 2017-05-26 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
WO2017168332A1 (en) 2016-03-28 2017-10-05 Boreal Genomics, Inc. Linked duplex target capture
US10961573B2 (en) 2016-03-28 2021-03-30 Boreal Genomics, Inc. Linked duplex target capture
CN107423534B (zh) * 2016-05-24 2021-08-06 郝柯 基因组拷贝数变异的检测方法和系统
EP4043581A1 (en) 2016-05-27 2022-08-17 Sequenom, Inc. Method for generating a paralog assay system
US10274440B2 (en) 2016-06-22 2019-04-30 International Business Machines Corporation Method to facilitate investigation of chemical constituents in chemical analysis data
US11200963B2 (en) 2016-07-27 2021-12-14 Sequenom, Inc. Genetic copy number alteration classifications
US11515003B2 (en) 2016-07-27 2022-11-29 Sequenom, Inc. Copy number alteration and reference genome mapping
CN106355045B (zh) * 2016-08-30 2019-03-15 天津诺禾致源生物信息科技有限公司 一种基于扩增子二代测序小片段插入缺失检测的方法及装置
CN106611106B (zh) * 2016-12-06 2019-05-03 北京荣之联科技股份有限公司 基因变异检测方法及装置
EP3551769A4 (en) 2016-12-09 2020-10-28 Boreal Genomics, Inc. LINKED LIGATURE
WO2018136882A1 (en) 2017-01-20 2018-07-26 Sequenom, Inc. Methods for non-invasive assessment of copy number alterations
CA3198931A1 (en) 2017-01-20 2018-07-26 Sequenom, Inc. Methods for non-invasive assessment of genetic alterations
EP3571317A1 (en) 2017-01-20 2019-11-27 Sequenom, Inc. Sequencing adapter manufacture and use
US11694768B2 (en) 2017-01-24 2023-07-04 Sequenom, Inc. Methods and processes for assessment of genetic variations
WO2018170511A1 (en) 2017-03-17 2018-09-20 Sequenom, Inc. Methods and processes for assessment of genetic mosaicism
AU2018300069A1 (en) 2017-07-11 2020-02-27 Synthorx, Inc. Incorporation of unnatural nucleotides and methods thereof
WO2019014309A1 (en) 2017-07-13 2019-01-17 Verdezyne (Abc), Llc BIOLOGICAL METHODS FOR MODIFYING A CELL CARBON FLOW
TWI757528B (zh) 2017-08-03 2022-03-11 美商欣爍克斯公司 用於增生及感染性疾病治療之細胞激素結合物
WO2019051103A1 (en) * 2017-09-06 2019-03-14 Lawrence Livermore National Security, Llc METHODS AND SYSTEMS FOR EXECUTING GENETICALLY MODIFIED PROTEIN ANALYSIS, AND ASSOCIATED MARKER PROTEIN GENETIC VARIATIONS AND DATABASES
US10426424B2 (en) 2017-11-21 2019-10-01 General Electric Company System and method for generating and performing imaging protocol simulations
WO2019232520A1 (en) 2018-06-01 2019-12-05 Cerno Bioscience Llc Mass spectral analysis of large molecules
WO2020060948A1 (en) 2018-09-17 2020-03-26 Levadura Biotechnology, Inc. Production of cannabinoids in yeast using a fatty acid feedstock
CN109920485B (zh) * 2018-12-29 2023-10-31 浙江安诺优达生物科技有限公司 对测序序列进行变异模拟的方法及其应用
US11473136B2 (en) 2019-01-03 2022-10-18 Ncan Genomics, Inc. Linked target capture
WO2020146741A1 (en) 2019-01-10 2020-07-16 Selim Olcum Calibration of a functional biomarker instrument
AU2020218203A1 (en) 2019-02-06 2021-08-26 Synthorx, Inc. IL-2 conjugates and methods of use thereof
EP3966738A4 (en) * 2019-05-10 2023-05-31 Academia Sinica DYNAMIC DATA CORRECTION METHOD AND APPARATUS FOR GENERATE HIGH RESOLUTION SPECTRUM
CA3159786A1 (en) 2019-10-31 2021-05-06 Sequenom, Inc. Application of mosaicism ratio in multifetal gestations and personalized risk assessment
CN111304345A (zh) * 2020-02-27 2020-06-19 中国人民解放军军事科学院军事医学研究院 幽门螺旋杆菌23S rRNA基因耐药突变的检测方法及其应用
EP4110043A1 (en) * 2020-02-27 2023-01-04 Monsanto Technology LLC Methods for selecting inheritable edits
CN111477276B (zh) * 2020-04-02 2020-12-15 上海之江生物科技股份有限公司 微生物的种特异共有序列的获得方法、装置及应用
CN111662990A (zh) * 2020-07-10 2020-09-15 内蒙古农业大学职业技术学院 一种用于定量检测猪瘟抗体不同水平的方法和引物对
CN114974416B (zh) * 2022-07-15 2023-04-07 深圳雅济科技有限公司 一种检测相邻多核苷酸变异的方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07507394A (ja) * 1992-05-29 1995-08-10 ザ ロックフェラー ユニバーシティ 質量スペクトロメータを用いてペプチドの配列決定を行う為の方法及び物質
JP2000509241A (ja) * 1995-07-11 2000-07-25 フォーファス グリコシラーゼによる候補座位のヌクレオチド配列の検出
WO2000066771A2 (en) * 1999-04-30 2000-11-09 Methexis N.V. Diagnostic sequencing by a combination of specific cleavage and mass spectrometry

Family Cites Families (155)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US42112A (en) * 1864-03-29 Improvement in grain-drills
US4683202A (en) * 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US5173418A (en) 1985-05-10 1992-12-22 Benzon Pharma, A/S Production in Escherichia coli of extracellular Serratia spp. hydrolases
US4762823A (en) 1985-10-16 1988-08-09 Sloan-Kettering Institute For Cancer Research Nucleosides of 5-monofluoromethyluracil and 5-difluoromethyluracil
US5079342A (en) 1986-01-22 1992-01-07 Institut Pasteur Cloned DNA sequences related to the entire genomic RNA of human immunodeficiency virus II (HIV-2), polypeptides encoded by these DNA sequences and use of these DNA clones and polypeptides in diagnostic kits
US4826360A (en) 1986-03-10 1989-05-02 Shimizu Construction Co., Ltd. Transfer system in a clean room
EP0269520A3 (fr) 1986-11-21 1988-08-24 Institut Pasteur Rétrovirus du type HIV-2 susceptible de provoquer le sida, et ses constituants antigéniques et nucléiques
FR2620049B2 (fr) 1986-11-28 1989-11-24 Commissariat Energie Atomique Procede de traitement, stockage et/ou transfert d'un objet dans une atmosphere de haute proprete, et conteneur pour la mise en oeuvre de ce procede
US4837726A (en) 1987-06-19 1989-06-06 Applied Biosystems, Inc. Quantitation of chromatographic information
US4802102A (en) 1987-07-15 1989-01-31 Hewlett-Packard Company Baseline correction for chromatography
IE61148B1 (en) 1988-03-10 1994-10-05 Ici Plc Method of detecting nucleotide sequences
US5003059A (en) 1988-06-20 1991-03-26 Genomyx, Inc. Determining DNA sequences by mass spectrometry
EP0395481A3 (en) 1989-04-25 1991-03-20 Spectra-Physics, Inc. Method and apparatus for estimation of parameters describing chromatographic peaks
GB2236186B (en) 1989-08-22 1994-01-05 Finnigan Mat Gmbh Process and device for laser desorption of analyte molecular ions, especially of biomolecules
JPH05503423A (ja) 1990-01-12 1993-06-10 スクリップス クリニック アンド リサーチ ファウンデーション Dna切断用核酸酵素
NZ236819A (en) 1990-02-03 1993-07-27 Max Planck Gesellschaft Enzymatic cleavage of fusion proteins; fusion proteins; recombinant dna and pharmaceutical compositions
IT1239733B (it) 1990-02-23 1993-11-15 Eniricerche Spa Mutanti della proteasi neutra termostabili e mezzi e metodi per la loro preparazione
US5288644A (en) 1990-04-04 1994-02-22 The Rockefeller University Instrument and method for the sequencing of genome
ATE121454T1 (de) 1990-05-09 1995-05-15 Massachusetts Inst Technology Ubiquitinspezifische protease.
US5264563A (en) 1990-08-24 1993-11-23 Ixsys Inc. Process for synthesizing oligonucleotides with random codons
US5210412A (en) 1991-01-31 1993-05-11 Wayne State University Method for analyzing an organic sample
WO1992013629A1 (en) 1991-01-31 1992-08-20 Wayne State University A method for analyzing an organic sample
US5364759B2 (en) 1991-01-31 1999-07-20 Baylor College Medicine Dna typing with short tandem repeat polymorphisms and identification of polymorphic short tandem repeats
US5578443A (en) 1991-03-06 1996-11-26 Regents Of The University Of Minnesota DNA sequence-based HLA typing method
CA2066556A1 (en) 1991-04-26 1992-10-27 Toyoji Sawayanagi Alkaline protease, method for producing the same, use thereof and microorganism producing the same
US5846717A (en) 1996-01-24 1998-12-08 Third Wave Technologies, Inc. Detection of nucleic acid sequences by invader-directed cleavage
US5436150A (en) 1992-04-03 1995-07-25 The Johns Hopkins University Functional domains in flavobacterium okeanokoities (foki) restriction endonuclease
US5646020A (en) 1992-05-14 1997-07-08 Ribozyme Pharmaceuticals, Inc. Hammerhead ribozymes for preferred targets
US5792664A (en) 1992-05-29 1998-08-11 The Rockefeller University Methods for producing and analyzing biopolymer ladders
US5440119A (en) 1992-06-02 1995-08-08 Labowsky; Michael J. Method for eliminating noise and artifact peaks in the deconvolution of multiply charged mass spectra
WO1994000562A1 (en) 1992-06-24 1994-01-06 The Mt. Sinai School Of Medicine Of The City University Of New York A novel human immunodeficiency virus
US5700672A (en) 1992-07-23 1997-12-23 Stratagene Purified thermostable pyrococcus furiousus DNA ligase
EP0596205A3 (en) 1992-11-03 1996-02-21 Hewlett Packard Co Bench supervisor system.
US6436635B1 (en) 1992-11-06 2002-08-20 Boston University Solid phase sequencing of double-stranded nucleic acids
US5503980A (en) 1992-11-06 1996-04-02 Trustees Of Boston University Positional sequencing by hybridization
US5795714A (en) 1992-11-06 1998-08-18 Trustees Of Boston University Method for replicating an array of nucleic acid probes
US5422253A (en) 1992-12-07 1995-06-06 Wisconsin Alumni Research Foundation Method of site specific nucleic acid cleavage
US5547835A (en) 1993-01-07 1996-08-20 Sequenom, Inc. DNA sequencing by mass spectrometry
US5605798A (en) 1993-01-07 1997-02-25 Sequenom, Inc. DNA diagnostic based on mass spectrometry
US6194144B1 (en) 1993-01-07 2001-02-27 Sequenom, Inc. DNA sequencing by mass spectrometry
US6074823A (en) 1993-03-19 2000-06-13 Sequenom, Inc. DNA sequencing by mass spectrometry via exonuclease degradation
CA2158642A1 (en) 1993-03-19 1994-09-29 Hubert Koster Dna sequencing by mass spectrometry via exonuclease degradation
US5604098A (en) 1993-03-24 1997-02-18 Molecular Biology Resources, Inc. Methods and materials for restriction endonuclease applications
AU681650B2 (en) 1993-03-24 1997-09-04 Molecular Biology Resources, Inc. Dinucleotide restriction endonuclease preparations and methods of use
CA2122203C (en) 1993-05-11 2001-12-18 Melinda S. Fraiser Decontamination of nucleic acid amplification reactions
US5837832A (en) 1993-06-25 1998-11-17 Affymetrix, Inc. Arrays of nucleic acid probes on biological chips
US5861242A (en) 1993-06-25 1999-01-19 Affymetrix, Inc. Array of nucleic acid probes on biological chips for diagnosis of HIV and methods of using the same
FR2710075B1 (fr) * 1993-09-15 1995-10-27 Bio Merieux Réactif et procédé pour la détection d'une séquence nucléotidique avec amplification de signal.
EP0765401B1 (en) 1993-11-17 2001-02-21 Amersham Pharmacia Biotech UK Limited Primer extension mass spectroscopy nucleic acid sequencing method
US5908779A (en) 1993-12-01 1999-06-01 University Of Connecticut Targeted RNA degradation using nuclear antisense RNA
US5714330A (en) 1994-04-04 1998-02-03 Lynx Therapeutics, Inc. DNA sequencing by stepwise ligation and cleavage
US5807522A (en) 1994-06-17 1998-09-15 The Board Of Trustees Of The Leland Stanford Junior University Methods for fabricating microarrays of biological samples
US5853979A (en) 1995-06-30 1998-12-29 Visible Genetics Inc. Method and system for DNA sequence determination and mutation detection with reference to a standard
US5498545A (en) 1994-07-21 1996-03-12 Vestal; Marvin L. Mass spectrometer system and method for matrix-assisted laser desorption measurements
US5453613A (en) 1994-10-21 1995-09-26 Hewlett Packard Company Mass spectra interpretation system including spectra extraction
US5807718A (en) 1994-12-02 1998-09-15 The Scripps Research Institute Enzymatic DNA molecules
US6428955B1 (en) 1995-03-17 2002-08-06 Sequenom, Inc. DNA diagnostics based on mass spectrometry
US5858705A (en) 1995-06-05 1999-01-12 Human Genome Sciences, Inc. Polynucleotides encoding human DNA ligase III and methods of using these polynucleotides
AU758454B2 (en) 1995-04-11 2003-03-20 Sequenom, Inc. Solid phase sequencing of biopolymers
US5869240A (en) 1995-05-19 1999-02-09 Perseptive Biosystems, Inc. Methods and apparatus for sequencing polymers with a statistical certainty using mass spectrometry
US5753439A (en) 1995-05-19 1998-05-19 Trustees Of Boston University Nucleic acid detection methods
US5874283A (en) 1995-05-30 1999-02-23 John Joseph Harrington Mammalian flap-specific endonuclease
US6146854A (en) 1995-08-31 2000-11-14 Sequenom, Inc. Filtration processes, kits and devices for isolating plasmids
US5869242A (en) 1995-09-18 1999-02-09 Myriad Genetics, Inc. Mass spectrometry to assess DNA sequence polymorphisms
US6190865B1 (en) 1995-09-27 2001-02-20 Epicentre Technologies Corporation Method for characterizing nucleic acid molecules
US6090549A (en) 1996-01-16 2000-07-18 University Of Chicago Use of continuous/contiguous stacking hybridization as a diagnostic tool
US6090606A (en) 1996-01-24 2000-07-18 Third Wave Technologies, Inc. Cleavage agents
US5830712A (en) 1996-02-06 1998-11-03 Allelix Biopharmaceuticals Inc. Selective template deletion method
US5686656A (en) 1996-02-27 1997-11-11 Aviv Amirav Method and device for the introduction of a sample into a gas chromatograph
EP0886681A1 (en) 1996-03-04 1998-12-30 Genetrace Systems, Inc. Methods of screening nucleic acids using mass spectrometry
AU2217597A (en) 1996-03-18 1997-10-22 Sequenom, Inc. Dna sequencing by mass spectrometry
EP0863858B1 (en) 1996-04-08 2004-02-04 Glaxo Group Limited Mass-based encoding and qualitative analysis of combinatorial libraries
US5928906A (en) 1996-05-09 1999-07-27 Sequenom, Inc. Process for direct sequencing during template amplification
US6022688A (en) 1996-05-13 2000-02-08 Sequenom, Inc. Method for dissociating biotin complexes
US5786146A (en) 1996-06-03 1998-07-28 The Johns Hopkins University School Of Medicine Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids
US6017704A (en) 1996-06-03 2000-01-25 The Johns Hopkins University School Of Medicine Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids
AU3382097A (en) * 1996-06-10 1998-01-07 Novo Nordisk Biotech, Inc. Aspergillus oryzae 5-aminolevulinic acid synthases and nucleic acids encoding same
FR2749662B1 (fr) 1996-06-11 1998-08-28 Elf Aquitaine Laboratoire robotise d'analyses d'echantillons
WO1998003532A1 (en) 1996-07-24 1998-01-29 Hanna Michelle M Base-protected nucleotide analogs with protected thiol groups
US5928870A (en) 1997-06-16 1999-07-27 Exact Laboratories, Inc. Methods for the detection of loss of heterozygosity
GB9618960D0 (en) 1996-09-11 1996-10-23 Medical Science Sys Inc Proteases
US5885841A (en) 1996-09-11 1999-03-23 Eli Lilly And Company System and methods for qualitatively and quantitatively comparing complex admixtures using single ion chromatograms derived from spectroscopic analysis of such admixtures
WO1998012355A1 (en) 1996-09-19 1998-03-26 Genetrace Systems Methods of preparing nucleic acids for mass spectrometric analysis
US5965363A (en) 1996-09-19 1999-10-12 Genetrace Systems Inc. Methods of preparing nucleic acids for mass spectrometric analysis
US5777324A (en) 1996-09-19 1998-07-07 Sequenom, Inc. Method and apparatus for maldi analysis
US5864137A (en) 1996-10-01 1999-01-26 Genetrace Systems, Inc. Mass spectrometer
DK0937096T3 (da) 1996-11-06 2004-06-14 Sequenom Inc Fremgangsmåde til massespektrometri-analyse
US5900481A (en) 1996-11-06 1999-05-04 Sequenom, Inc. Bead linkers for immobilizing nucleic acids to solid supports
DE19782095T1 (de) 1996-11-06 2000-03-23 Sequenom Inc DNA-Diagnose auf der Basis von Massenspektrometrie
US6140053A (en) 1996-11-06 2000-10-31 Sequenom, Inc. DNA sequencing by mass spectrometry via exonuclease degradation
US6024925A (en) 1997-01-23 2000-02-15 Sequenom, Inc. Systems and methods for preparing low volume analyte array elements
US6133436A (en) 1996-11-06 2000-10-17 Sequenom, Inc. Beads bound to a solid support and to nucleic acids
US6297006B1 (en) 1997-01-16 2001-10-02 Hyseq, Inc. Methods for sequencing repetitive sequences and for determining the order of sequence subfragments
US6059724A (en) 1997-02-14 2000-05-09 Biosignal, Inc. System for predicting future health
CA2292039A1 (en) * 1997-05-28 1998-12-03 The Walter And Eliza Hall Institute Of Medical Research Nucleic acid diagnostics based on mass spectrometry or mass separation and base specific cleavage
US5976806A (en) 1997-06-25 1999-11-02 Pioneer Hi-Bred International, Inc. DNA ligase assay
US5975492A (en) 1997-07-14 1999-11-02 Brenes; Arthur Bellows driver slot valve
US6207370B1 (en) 1997-09-02 2001-03-27 Sequenom, Inc. Diagnostics based on mass spectrometric detection of translated target polypeptides
US5888795A (en) 1997-09-09 1999-03-30 Becton, Dickinson And Company Thermostable uracil DNA glycosylase and methods of use
US6112161A (en) 1997-09-17 2000-08-29 Hewlett-Packard Method, apparatus, and article of manufacture for enhanced intergration of signals
AU9400398A (en) 1997-09-19 1999-04-05 Genetrace Systems, Inc. Dna typing by mass spectrometry with polymorphic dna repeat markers
US6485944B1 (en) 1997-10-10 2002-11-26 President And Fellows Of Harvard College Replica amplification of nucleic acid arrays
US5932451A (en) 1997-11-19 1999-08-03 Incyte Pharmaceuticals, Inc. Method for unbiased mRNA amplification
US5948902A (en) 1997-11-20 1999-09-07 South Alabama Medical Science Foundation Antisense oligonucleotides to human serine/threonine protein phosphatase genes
DE19754482A1 (de) 1997-11-27 1999-07-01 Epigenomics Gmbh Verfahren zur Herstellung komplexer DNA-Methylierungs-Fingerabdrücke
AU746786B2 (en) 1997-12-08 2002-05-02 California Institute Of Technology Method for creating polynucleotide and polypeptide sequences
US6268131B1 (en) 1997-12-15 2001-07-31 Sequenom, Inc. Mass spectrometric methods for sequencing nucleic acids
DE19803309C1 (de) 1998-01-29 1999-10-07 Bruker Daltonik Gmbh Massenspektrometrisches Verfahren zur genauen Massenbestimmung unbekannter Ionen
US6054276A (en) 1998-02-23 2000-04-25 Macevicz; Stephen C. DNA restriction site mapping
NO311111B1 (no) 1998-04-03 2001-10-08 Geir H Soerland Metode for bestemmelse av mengden av fett og vann i en biologisk pröve
JP3575295B2 (ja) 1998-04-15 2004-10-13 住友電装株式会社 電気接続用コネクタのプラグ
CA2325854C (en) 1998-04-22 2005-12-06 Enterprise Ireland Trading As Bioresearch Ireland A method for the characterisation of nucleic acid molecules involving generation of extendible upstream dna fragments resulting from the cleavage of nucleic acid at an abasic site
US6723564B2 (en) 1998-05-07 2004-04-20 Sequenom, Inc. IR MALDI mass spectrometry of nucleic acids using liquid matrices
US20030017483A1 (en) 1998-05-12 2003-01-23 Ecker David J. Modulation of molecular interaction sites on RNA and other biomolecules
US6099553A (en) 1998-05-21 2000-08-08 Applied Medical Resources Corporation Suture clinch
US6104028A (en) 1998-05-29 2000-08-15 Genetrace Systems Inc. Volatile matrices for matrix-assisted laser desorption/ionization mass spectrometry
GB9827152D0 (en) 1998-07-03 1999-02-03 Devgen Nv Characterisation of gene function using double stranded rna inhibition
JP2000067805A (ja) * 1998-08-24 2000-03-03 Hitachi Ltd 質量分析装置
IL142323A0 (en) 1998-10-01 2002-03-10 Variagenics Inc A method for analyzing polynucleotides
US6440705B1 (en) 1998-10-01 2002-08-27 Vincent P. Stanton, Jr. Method for analyzing polynucleotides
US6270835B1 (en) 1999-10-07 2001-08-07 Microcoating Technologies, Inc. Formation of this film capacitors
US6331427B1 (en) 1999-03-26 2001-12-18 Millennium Pharmaceuticals, Inc. Protease homologs
US20020009394A1 (en) 1999-04-02 2002-01-24 Hubert Koster Automated process line
US6309833B1 (en) 1999-04-12 2001-10-30 Nanogen/Becton Dickinson Partnership Multiplex amplification and separation of nucleic acid sequences on a bioelectronic microchip using asymmetric structures
US6994969B1 (en) 1999-04-30 2006-02-07 Methexis Genomics, N.V. Diagnostic sequencing by a combination of specific cleavage and mass spectrometry
US7332275B2 (en) 1999-10-13 2008-02-19 Sequenom, Inc. Methods for detecting methylated nucleotides
US6475736B1 (en) 2000-05-23 2002-11-05 Variagenics, Inc. Methods for genetic analysis of DNA using biased amplification of polymorphic sites
EP1179589A1 (en) 2000-08-08 2002-02-13 F. Hoffmann-La Roche Ag MMX-1, a member of the family of human cancer/testis antigens, a protein encoded thereby and a process for determining whether a tumor sample has metastatic potential
US20030027169A1 (en) 2000-10-27 2003-02-06 Sheng Zhang One-well assay for high throughput detection of single nucleotide polymorphisms
DE10061348C2 (de) 2000-12-06 2002-10-24 Epigenomics Ag Verfahren zur Quantifizierung von Cytosin-Methylierungen in komplex amplifizierter genomischer DNA
DE10112515B4 (de) 2001-03-09 2004-02-12 Epigenomics Ag Verfahren zum Nachweis von Cytosin-Methylierungsmustern mit hoher Sensitivität
US20030013099A1 (en) 2001-03-19 2003-01-16 Lasek Amy K. W. Genes regulated by DNA methylation in colon tumors
US7056663B2 (en) 2001-03-23 2006-06-06 California Pacific Medical Center Prognostic methods for breast cancer
US6522477B2 (en) 2001-04-17 2003-02-18 Karl Storz Imaging, Inc. Endoscopic video camera with magnetic drive focusing
US20020155587A1 (en) 2001-04-20 2002-10-24 Sequenom, Inc. System and method for testing a biological sample
US20050064406A1 (en) 2001-04-20 2005-03-24 Eugene Zabarovsky Methods for high throughput genome analysis using restriction site tagged microarrays
DE10130800B4 (de) 2001-06-22 2005-06-23 Epigenomics Ag Verfahren zum Nachweis von Cytosin-Methylierung mit hoher Sensitivität
AU2002367466A1 (en) 2001-07-15 2003-10-08 Keck Graduate Institute Amplification of nucleic acid fragments using nicking agents
JP2003245087A (ja) 2001-11-22 2003-09-02 Sankyo Co Ltd 遺伝子診断方法
DE10201138B4 (de) 2002-01-08 2005-03-10 Epigenomics Ag Verfahren zum Nachweis von Cytosin-Methylierungsmustern durch exponentielle Ligation hybridisierter Sondenoligonukleotide (MLA)
EP1487999B1 (en) 2002-03-15 2006-12-27 Epigenomics AG Discovery and diagnostic methods using 5-methylcytosine dna glycosylase
JP2005532043A (ja) 2002-04-11 2005-10-27 シークエノム, インコーポレイテッド 固相支持体上で化学反応を実行するための方法および装置
US20040014101A1 (en) 2002-05-03 2004-01-22 Pel-Freez Clinical Systems, Inc. Separating and/or identifying polymorphic nucleic acids using universal bases
CA2507189C (en) 2002-11-27 2018-06-12 Sequenom, Inc. Fragmentation-based methods and systems for sequence variation detection and discovery
AU2004235331B2 (en) 2003-04-25 2008-12-18 Sequenom, Inc. Fragmentation-based methods and systems for De Novo sequencing
US20050009059A1 (en) 2003-05-07 2005-01-13 Affymetrix, Inc. Analysis of methylation status using oligonucleotide arrays
US8150626B2 (en) 2003-05-15 2012-04-03 Illumina, Inc. Methods and compositions for diagnosing lung cancer with specific DNA methylation patterns
US20050026183A1 (en) 2003-05-15 2005-02-03 Jian-Bing Fan Methods and compositions for diagnosing conditions associated with specific DNA methylation patterns
US20040253141A1 (en) 2003-06-16 2004-12-16 Schembri Carol T. Apparatus and method for nucleic acid spatial ordering
WO2005024068A2 (en) 2003-09-05 2005-03-17 Sequenom, Inc. Allele-specific sequence variation analysis
US7901880B2 (en) 2003-10-21 2011-03-08 Orion Genomics Llc Differential enzymatic fragmentation
US7608394B2 (en) 2004-03-26 2009-10-27 Sequenom, Inc. Methods and compositions for phenotype identification based on nucleic acid methylation
CA2561381C (en) 2004-03-26 2015-05-12 Sequenom, Inc. Base specific cleavage of methylation-specific amplification products in combination with mass analysis
WO2006031745A2 (en) 2004-09-10 2006-03-23 Sequenom, Inc. Methods for long-range sequence analysis of nucleic acids

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07507394A (ja) * 1992-05-29 1995-08-10 ザ ロックフェラー ユニバーシティ 質量スペクトロメータを用いてペプチドの配列決定を行う為の方法及び物質
JP2000509241A (ja) * 1995-07-11 2000-07-25 フォーファス グリコシラーゼによる候補座位のヌクレオチド配列の検出
WO2000066771A2 (en) * 1999-04-30 2000-11-09 Methexis N.V. Diagnostic sequencing by a combination of specific cleavage and mass spectrometry

Also Published As

Publication number Publication date
CA2507189A1 (en) 2004-06-17
EP1613723B1 (en) 2013-05-15
EP1613723A4 (en) 2010-06-09
CN1774511A (zh) 2006-05-17
AU2003298733B2 (en) 2009-06-18
EP1613723A2 (en) 2006-01-11
CA2507189C (en) 2018-06-12
WO2004050839A2 (en) 2004-06-17
WO2004050839A3 (en) 2006-02-09
US20050112590A1 (en) 2005-05-26
JP2006515987A (ja) 2006-06-15
AU2003298733A1 (en) 2004-06-23
HK1087436A1 (en) 2006-10-13
US7820378B2 (en) 2010-10-26
CN1774511B (zh) 2013-08-21

Similar Documents

Publication Publication Date Title
JP4786904B2 (ja) 配列変化検出及び発見用の断片化をベースとする方法及びシステム
AU2004235331B2 (en) Fragmentation-based methods and systems for De Novo sequencing
AU2008240143B2 (en) Comparative sequence analysis processes and systems
US20060073501A1 (en) Methods for long-range sequence analysis of nucleic acids
EP2395098B1 (en) Base specific cleavage of methylation-specific amplification products in combination with mass analysis
JP2014221072A (ja) 特異的切断および質量分析法の組合せによる診断的配列決定
US6994969B1 (en) Diagnostic sequencing by a combination of specific cleavage and mass spectrometry
US9394565B2 (en) Allele-specific sequence variation analysis

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061124

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090915

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091214

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100817

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101116

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110614

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110714

R150 Certificate of patent or registration of utility model

Ref document number: 4786904

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140722

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees