JP2019521713A - 核酸配列の増幅方法 - Google Patents

核酸配列の増幅方法 Download PDF

Info

Publication number
JP2019521713A
JP2019521713A JP2019524487A JP2019524487A JP2019521713A JP 2019521713 A JP2019521713 A JP 2019521713A JP 2019524487 A JP2019524487 A JP 2019524487A JP 2019524487 A JP2019524487 A JP 2019524487A JP 2019521713 A JP2019521713 A JP 2019521713A
Authority
JP
Japan
Prior art keywords
nucleic acid
primer
acid sequences
taggant
target nucleic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019524487A
Other languages
English (en)
Inventor
アレクサンダー オーウェン ニコラス
アレクサンダー オーウェン ニコラス
Original Assignee
ヌクレオトレイス プロプライアタリー リミティド
ヌクレオトレイス プロプライアタリー リミティド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from AU2016902892A external-priority patent/AU2016902892A0/en
Application filed by ヌクレオトレイス プロプライアタリー リミティド, ヌクレオトレイス プロプライアタリー リミティド filed Critical ヌクレオトレイス プロプライアタリー リミティド
Publication of JP2019521713A publication Critical patent/JP2019521713A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6848Nucleic acid amplification reactions characterised by the means for preventing contamination or increasing the specificity or sensitivity of an amplification reaction

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本発明は、概して、核酸配列の増幅方法に関し、より具体的には、標的核酸配列の増幅及び識別方法に関する。

Description

本発明は、概して、核酸配列の増幅方法に関し、より具体的には、標的核酸配列の増幅及び識別方法に関する。
過去20年間で偽造品及び海賊版が大幅に増加しており、偽造品及び海賊版製品は世界中のほぼすべての国で、事実上すべての経済部門で発見されている。偽造レベルの見積もり及びそのような製品の価値は様々である。しかしながら、2013年の偽造品及び海賊版製品の世界貿易の価値は、4,610億ドルと推定されている(OECD and EUIPO,2016,Trade in Counterfeit and Pirated Goods:Mapping the Economic Impact)。偽造の影響を最小限に抑えるために、多くの製造業者が偽造防止対策を採用している。このような対策には、特殊な透かし、インクと染料、ホログラム、不正開封防止ラベル、レーザー表面認証、及び磁気及び無線周波数識別(RFID)タグを使用したセキュリティ印刷が含まれる。これらの方法はすべて、ある程度効果的であるが、一般的には偽造防止策ではなく、偽造によって克服される可能性がある。対照的に、分子「タガント」とも呼ばれる核酸分子を用いた製品の分子タグ付けは、製品を認証し追跡するための事実上偽造防止手段であることが証明されている。典型的な例には、汚染物質追跡(例えば炭化水素)、製品認証(例えばアートワーク、電気製品)、及びセキュリティ用途(例えば紙幣及び文書認証)が含まれる。
核酸分子は、本質的に安定、情報密度が高く、非毒性であり、商業的に成熟した技術を用いて合成及び配列決定されるため、核酸分子は理想的な分子タグ(「タガント」とも呼ばれる)である。非生物学的情報は、核酸塩基対(bp)「アルファベット」を使用してDNAのフラグメントにコード化することができ、この場合、利用可能な文字のセットは、DNAについてS={A(アデニン)、T(チミン)、G(グアニン)及びC(シトシン)}、RNAについて{A(アデニン)、U(ウラシル)、G(グアニン)及びC(シトシン)}であり、セットサイズはs=4(文字長=1bpの場合)である。この塩基−4システムでは、膨大な量の情報を比較的短いDNAのフラグメントに格納することができ、列長n記号(「文字」)を利用可能な固有のコードワード(タガント)の数はw=sである。合成ヌクレオチドタグ付けシステムは新しいものではないが、タガント、又はタガントの混合セットを効率的に識別及びデコード化するための方法論はまだ不足している。認証とは異なり、識別とは、すべての可能なタガントのセットをスクリーニングして、未知のタガントのサブセットを決定することである(W⊆W)。これとは対照的に、認証とは、特定の1組又は複数組のプライマー「鍵」を使用して、既知のタガントのサブセットの存在を試験する(すなわち、W⊆W)ことである。識別能力を必要とする用途に関して、個々のタガントを回収するのに必要とされるプライマーに関する以前の知識は定義により欠如している。何百万ものプールから1つの対象物を識別するために従来の技術を使用することは、何百万対ものプライマーを用いてサンプルをスクリーニングすることを必要とするので明らかに実行不可能である。未知のタガントのサブセットを同時にデコード化する機能は、製造物の要素がマークされ、組み合わされ、その後、最終製品からデコード化されるというタガントな「階層化」機能をさらに提供する。
既存のタガントテクノロジーは認証アプリケーションにはかなり適しているが、識別及び階層化の目的には非常に非効率的である。「識別対認証」のこの問題に取り組む一つの方法は、ユニバーサルフォワード及びリバースプライマー部位配列と、フラグメント長分離又は配列決定によって解読される可変コード領域とを有するタガントライブラリーを設計することである。しかしながら、ユニバーサルプライマー部位配列の使用は、回収及び増幅工程(通常はポリメラーゼ連鎖反応、PCRを含む)の間にクロスフラグメントハイブリダイゼーションを必ずもたらす。タグ付きコードワードが一般的な文字シーケンスのライブラリーから生成される場合、これは特に難しい問題である。この場合、2つの異なるコードワードで使用されているのと同じ文字が、混合タガントの溶液中でヘテロ二量体を形成し、クロスハイブリダイズしたPCR産物を生成する可能性がある。この事実から多くの問題が生じる:(1)各タガントは回収及び増幅のための独特な組の識別プライマー対を含まなければならない、(2)ライブラリー中の各タガントは実質的に異なる配列を用いて、同じ記号をコード化しなければならない、(3)製造物中に存在するタガントについて従来の知識なしに(定義により、識別である)、ライブラリーW中の全ての可能なプライマー対についてサンプルをスクリーニングしなければならない、(4)ラージスケール(例えば、>300PCR反応)は実用的ではなく、高価であり、低いフラグメントコピー数回復を助長しない、(5)これらの制約は現在の技術を実用的なタガントライブラリーサイズ限界w<3000及び層状化限界20タガントに制限する(US8,735,327)。これは、既存のタガント技術の階層化能力、ひいては潜在的用途を厳しく制限してきた。
WO2004/063856(Connolly、2004)は、結合した捕捉プローブを有する導電体を用いて標的核酸分子を検出するための装置を記載している。捕捉プローブは、標的核酸分子の1つに相補的であり、これはプローブ間で電気が伝導されたときに核酸分子の検出を可能にする。この方法は、既知の標的核酸分子の存在について試験するために(すなわち、認証のために)設計されており、したがって、未知の標的核酸分子又は1を超える標的核酸分子の混合物の識別には適していない。
分子タガントの増幅及び検出のための代替方法は、米国特許第8,735,327号によって提供され、これは、組み合わせ数学的アプローチを適用するプライマー部位コード化システムを使用して、増幅反応製造物をデコード化するタガント層及び識別の問題に対処することを試みるDNAタガントシステムを記載する。したがって、プライマー部位は、ビット値及び列位置に対応するハイブリダイズしない配列のライブラリーから選択される。タガントはライブラリー中の全てのプライマー対の組み合わせでスクリーニングすることによりデコード化され、Wは、得られた陽性PCR反応のネットワークグラフ(G)からデコード化される。しかしながら、サンプルは、Guが、サンプルに存在するタガントのセットWに含まれていない重複するサブグラフクリークを含む場合、デコード不可能になる。
米国特許第8,735,327号では、情報をデコード化するためにプライマー部位の列を使用することは、コーディング列長に対する制約のために情報記憶容量を制限する。さらに、情報をコードするためのプライマー部位への依存は、多数の非ハイブリダイズプライマー配列が必要とされ、タガント内の情報をデコード化するために何百ものスクリーニング反応を行わなければならないことを意味する。例えば、長さn=5のバイナリシステム(s=2)は、ライブラリーサイズがs=2=32であり、タガントは、デコードするのに(n(n−1)s)/2=40の反応を必要とする(すなわち、40個のプライマー対の組み合わせ)。さらに、Maculaの方法はまた、混合して、後にデコード化することができるタガントの数に制限があるため、深層アプリケーションとの互換性がない。例えば、n5−s2バイナリシステムは、ns−n+1=6の最大層状化深度を有する。層状化深度(すなわち、混合容量)は、複数のライブラリーの使用、又は3進若しくは4進コード化システムを介して増加し得る。しかしながら、これら両方のアプローチは、必要とされるスクリーニング反応の数を劇的に増加させる。例えば、n5−s5システムは、ライブラリーサイズが3,125タガントであるが、デコードには625反応が必要であり、最大混合限度は21タガントである。そのため、既存のすべてのタガントシステムは、約20タガントを超える混合制限を必要とする識別アプリケーションに到達しないままである。Maculaのアプローチで要求されるように、必要とされる多数のサンプルもまた法医学的及び微量DNA回収用途と互換性がない。
分子タガントを用いて物質をタグ付けすることは比較的簡単であるが、タガントは、核酸配列を増幅し、続いてタガントを識別及び/又は認証するためにデコード化することができる場合にのみ価値がある。しかしながら、既存のヌクレオチドタガントシステムは、識別のために扱いにくく、実用的でなく、高価なままであり、未知のタガントのサブセットの識別(及びタガント層状化)を可能にする方法で効率的にデコード化されるようにはなっていない。製造物を識別するために必要とされる多数のサンプルはまた、低コピー数及び法医学的用途には役立たない。
したがって、分子タガントの識別及びタガント層状化を可能にする方法が依然として必要とされている。
本明細書に開示される一態様では、混合物中の2つ以上の標的核酸配列の高忠実度増幅のための方法が提供される。ここで、2つ以上の核酸配列の各々は第1のプライマー部位及び第2のプライマー部位によって隣接され、増幅は、融解段階、アニーリング段階及び伸長段階を含む熱サイクリングを含む。本方法は、第1のプライマー部位のそれぞれに相補的な第1のプライマー、及び第2のプライマー部位のそれぞれに相補的な第2のプライマーを用いることを含み、第1及び第2のプライマーのそれぞれは、少なくとも1つのロックド核酸(LNA)を含み、アニーリング段階中に、それぞれ第1及び第2のプライマー部位に対する第1及び第2のプライマー以外の核酸配列のアニーリングが実質的にないように、高温が熱サイクリングのアニーリング段階中に使用される。
ここで、以下のうちの1つ以上又はすべてが適用される:
i)2つ以上の標的核酸配列が単一の熱サイクリング反応で増幅される;
ii)2つ以上の標的核酸配列が非生物学的情報をコードする;又は
iii)2つ以上の標的核酸のそれぞれが、共通の第1のプライマー部位及び共通の第2のプライマー部位に隣接している。
本明細書に開示される別の態様では、製造物をその起源まで追跡する方法が提供され、該方法は、以下:
(a)少なくとも1つの核酸配列が組み込まれている製造物を提供すること、ここで、少なくとも1つの核酸配列は、第1のプライマー部位と第2のプライマー部位とに隣接している;
(b)必要に応じて、製造物から少なくとも1つの核酸配列を回収すること;
(c)第1のプライマー部位に相補的な第1のプライマー、及び第2のプライマー部位に相補的な第2のプライマーを用いた熱サイクリングを含む高忠実度増幅によって、少なくとも1つの核酸配列を増幅すること、ここで、第1及び第2のプライマーはそれぞれ、少なくとも1つのロックド核酸(LNA)を含み、ここで、熱サイクリングは、融解段階、アニーリング段階及び伸長段階を含み、ここで、アニーリング段階中に、それぞれ第1及び第2のプライマー部位に対する第1及び第2のプライマー以外の核酸配列のアニーリングが実質的にないように、高温が熱サイクリングのアニーリング段階中に使用される;
(d)工程(c)で増幅された少なくとも1つの核酸配列を識別すること
を含み、ここで、工程(d)において識別された少なくとも1つの核酸配列の配列及び/又は長さは製造物の起源を示す。
本明細書に開示される別の態様では、第1の成分及び第2の成分を含むキットが提供され、ここで、第1の成分は、2つ以上の核酸配列のライブラリーを含み、ここで、2つ以上の核酸配列のそれぞれが、共通の第1のプライマー部位及び共通の第2のプライマー部位に隣接し、ここで、第2の成分は、第1のプライマー部位に相補的な第1のプライマー、及び第2のプライマー部位に相補的な第2のプライマーを含み、ここで、第1及び第2のプライマーはそれぞれ少なくとも1つのロックド核酸(LNA)を含む。
本明細書に開示される別の局面において、第1のプライマー部位及び第2のプライマー部位により隣接された標的核酸配列の高忠実度増幅のための方法が提供され、ここで、増幅が、融解段階、アニーリング段階及び伸長段階を含む熱サイクリングを含み、該方法は、第1のプライマー部位に相補的な第1のプライマー、及び第2のプライマー部位に相補的な第2のプライマーを使用することを含み、ここで、第1及び第2のプライマーはそれぞれ、少なくとも1つのロックド核酸(LNA)を含み、ここで、アニーリング段階中に、それぞれ第1及び第2のプライマー部位に対する第1及び第2のプライマー以外の核酸配列のアニーリングが実質的にないように、高温が熱サイクリングのアニーリング段階中に使用される。
本明細書に開示される別の態様では、混合物中の2つ以上の標的核酸配列の高忠実度増幅のための方法が提供され、ここで、2つ以上の標的核酸配列は、第1のプライマー部位と第2のプライマー部位とに隣接していて、ここで、増幅は、融解段階、アニーリング段階及び伸長段階を含む熱サイクリングを含み、該方法は、第1のプライマー部位のそれぞれに相補的な第1のプライマー、及び第2のプライマー部位のそれぞれに相補的な第2のプライマーを用いることを含み、第1及び第2のプライマーのそれぞれが少なくとも1つのロックド核酸(LNA)を含み、ここで、アニーリング段階中に、それぞれ第1及び第2のプライマー部位に対する第1及び第2のプライマー以外の核酸配列のアニーリングが実質的にないように、高温が熱サイクリングのアニーリング段階中に使用される。
本明細書に開示される別の態様では、製造物をその起源まで追跡する方法が提供され、該方法は、以下:
(a)少なくとも1つの核酸配列が組み込まれている製造物を提供すること、ここで、少なくとも1つの核酸配列は、第1のプライマー部位と第2のプライマー部位とに隣接している;
(b)製造物から少なくとも1つの核酸配列を回収すること;
(c)第1のプライマー部位に相補的な第1のプライマー、及び第2のプライマー部位に相補的な第2のプライマーを用いた熱サイクリングを含む高忠実度増幅によって、回収された少なくとも1つの核酸配列を増幅すること、ここで、第1及び第2のプライマーはそれぞれ、少なくとも1つのロックド核酸(LNA)を含み、ここで、熱サイクリングは、融解段階、アニーリング段階及び伸長段階を含み、ここで、アニーリング段階中に、それぞれ第1及び第2のプライマー部位に対する第1及び第2のプライマー以外の核酸配列のアニーリングが実質的にないように、高温が熱サイクリングのアニーリング段階中に使用される;
(d)工程(c)で増幅された少なくとも1つの核酸配列を識別すること
を含み、ここで、工程(d)において識別された少なくとも1つの核酸配列の配列及び/又は長さは製造物の起源を示す。
図1は、サプライチェーンのトレーシング及び製造物の識別のためのタガント層状化(混合)の使用例の概略図である。この例では、7つの製造物前駆体が7つのオリゴヌクレオチドタガント(1〜7)でマークされている。中間製品と最終製造物の組み合わせには、製造物の由来を示す複数のオリゴヌクレオチドタグが含まれている。本明細書に開示されているUniKey−Tagの実施形態では、階層化深さ/混合制限(数百万)に本質的に制限はない。いずれのサンプルにおいても、アニーリング温度識別ポリメラーゼ連鎖反応(ATD PCR)を用いた1回の反応で、全てのオリゴヌクレオチドタガントを回収及び増幅することができる。 図2は、オリゴヌクレオチドベースのアーカイブデータ保存システムにおけるランダムアクセス能力に使用されるATD PCRの実験手順の略図である。アーカイブデータは、3つの画像ファイル(a、b、c)をコードするオリゴヌクレオチドフラグメント(τ)のプール(P)で構成される。この例では、特定の画像ファイルをコード化するために使用される各組のフラグメントは、そのファイルに共通の一対のプライマー部位配列を含む。ランダムアクセスデータの回収は、興味のあるファイルを回収するためにLNAプライマーのユニバーサルセットを使用して実施される。例えば、UPFb及びUPRbは画像(b)を回収する。ATD PCRのより高い結合温度はまた、ヘテロ二量体形成及びクロスハイブリダイズしたPCR産物をもたらし得るワトソン−クリック結合の制約を減らすことによって可変領域におけるより大きなコード化柔軟性を可能にする。 図3は、プライマー部位コード化システム(UniKey−Tag2システム)において、どのようにLNA−プライマーを使用して文字長(l)を減少させ、したがってコードワード列長(n)を増加させることができるかを示す。プライマー部位コード化系において、ワトソン−クリックDNA結合生化学は典型的には(a)文字長が約20〜30bpであり、これは100bpの可変コード領域について列長を最大n=5に制限する。LNA−プライマーの高い結合親和性は、(b)プライマー長、したがって文字長の減少を可能にし、それは任意の設定された可変領域長vに対して列長nの逆比例増加を可能にする。nの増加は、可変領域の情報記憶容量、及び利用可能なタガントライブラリーのサイズw(すなわち、利用可能なコードワードの数)を増加させる。 図4は、アニーリング温度識別PCR(ATD PCR)がクロスフラグメントハイブリダイゼーションをどのように最小化するかを示すグラフ図である。図は、従来のPCR及びATD PCRを用いた共通のプライマー部位配列を含むフラグメントの増幅反応生成物を示す。(a)において、共通のプライマー部位を有するが異なる可変領域(V 1及びV 2)を有する変性された一本鎖フラグメントの混合物が示される。PCR中、ssDNAフラグメントは冷却されてプライマーが曝露鎖に結合することを可能にする。 従来のPCR(b)において、プライマー−フラグメント及びフラグメント−フラグメントアニーリングは同様の温度で起こり、それは(bi)クロスフラグメントプライミング、(bii)クロスフラグメントハイブリダイゼーション、及び(biii)非特異的ハイブリッドフラグメントアニーリング及び伸長をもたらす。これらのプロセスは、最終的に、(biv)可変起源及び長さのフラグメントハイブリッドを含むPCR産物をもたらす。 反対に、ATD PCR(登録商標)では、増幅反応アニーリング温度は、LNAプライマー−フラグメント相互作用を許容するが、フラグメント−フラグメント相互作用を妨げるように設定される。LNAプライマー−フラグメント複合体は、フラグメント−フラグメント相補的プライマー部位相互作用よりも>5℃高い温度でアニールするように理想的に設計されている。これはクロスタグハイブリダイゼーションを防ぐ。略語には、キャップ領域(Cp)、ユニバーサルフォワードプライマー配列(PF)、ユニバーサルフォワードプライマー相補配列(PFc)、ユニバーサルリバースプライマー配列(PR)、ユニバーサルリバースプライマー相補配列(PRc)、可変領域x(V x)、可変領域x相補配列V x(Vc x)が含まれる。 図5は、異なるコードワードで使用される共通の記号配列が、従来のPCRの間にどのようにヘテロ二量体形成及びクロスフラグメントハイブリダイゼーションをもたらし得るかを示す。(a)において、記号27のためのクラム配列(2進バイトに等しい)は、2つの異なるコードワードにおいて使用され、それは(b)においてクロスフラグメントプライミング及びハイブリダイゼーションを可能にする。ATD PCRは、これらの相互作用を区別するためにアニーリング温度を十分に高く設定することを可能にする。これにより、ワトソンクリックのDNA結合の制約が緩和され、ほぼすべてのコード化システムが共通の記号配列を使用するので、非生物学的情報をDNAにコード化するのに特に有利であるより大きなコード化柔軟性が可能になる。 図6は、従来のPCR及びATD PCRの熱サイクルを示す。示されるPCR熱サイクル工程は、(a)ホットスタートポリメラーゼのための初期活性化工程、(b)dsDNA鎖変性、(c1)ATD PCRにおいて使用される高温LNA−プライマーフラグメントアニーリング、(c2)低温従来プライマー(及びフラグメント−フラグメント)アニーリング、(d)ポリメラーゼ媒介鎖伸長を含む。指数関数的増幅のために工程(b)〜(d)をn回繰り返し、工程(e)は最終伸長期であり、工程(f)ではPCR産物を貯蔵のために冷却する。LNA含有プライマーは、クロスフラグメントハイブリダイゼーションを防ぐために、ATD PCR実験において(c1)と(c2)との間の温度差(ΔTA)が少なくとも5℃であるように設計された。 図7は、二本鎖タガントの一般的な設計である。この図は、鋳型と相補鎖からなる一般的なdsDNAタガントを示す。鋳型鎖上にマークされた位置は(左から右へ):オプションのキャッピング領域(Cp)、フォワードプライマー配列と同一の領域(PF)、可変コード領域(V x)、リバースプライマーと相補的な領域(PR)、及び反対側の相補鎖上のキャッピング領域に相補的なオプション領域(Cp)である。下付き文字「c」は「相補性」を示します。小文字で識別される領域は、塩基対(bp)の長さ単位を有し、以下を含む:フラグメント長(k)、キャッピング長(j)、プライマー部位長(p)、可変領域長(v)及び記号/文字長(l)。可変領域列の文字数はnであり、この場合、n=v/lである。 図8は、(a)ヌクレオチド配列が起源を示す標的核酸配列(UniKey−Tag1システム)の概略図である。UniKey−Tag1システムでは、(a)、コードワード列n中の各文字Lは1ヌクレオチド以上(l≧1)でコード化され、nは配列決定によってデコード化される。コードワードnは、ATD PCR増幅及び産物長分離によってデコード化される。すべてのタガントタイプについて:kはオリゴヌクレオチドフラグメントの長さ(bp)、jは任意の3’及び5’キャップの長さ(bp)、pはフォワード及びリバースプライマーの長さ(bp)、vは可変領域の長さ(bp)、lはn文字のコードワード列内の各文字の長さ(bp)である。タガント内の領域は、キャッピング領域(Cp)、ユニバーサルフォワードプライマー部位(UPF)、ユニバーサルリバースプライマー部位(UPR)、及び可変領域(V x)である。(b)において、PF(A、B、C)は、文字A、B、Cに特異的なプライマー部位である。下付き文字「c」は、それに対して相補的であることを示す。 図8は、(b)標的配列の長さが起源を示す標的核酸(UniKey−Tag2システム)の概略図である。niKey−Tag2システムでは、(b)、各プライマー対は特定の文字L、L、L(すなわちPF(A)、PF(B)、PF(C))をコードし、列n中のLの位置は可変長(v)の長さによって決定される(//)。コードワードnは、ATD PCR増幅及び産物長分離によってデコード化される。すべてのタガントタイプについて:kはオリゴヌクレオチドフラグメントの長さ(bp)、jは任意の3’及び5’キャップの長さ(bp)、pはフォワード及びリバースプライマーの長さ(bp)、vは可変領域の長さ(bp)、lはn文字のコードワード列内の各文字の長さ(bp)である。タガント内の領域は、キャッピング領域(Cp)、ユニバーサルフォワードプライマー部位(UPF)、ユニバーサルリバースプライマー部位(UPR)、及び可変領域(V x)である。(b)において、PF(A、B、C)は、文字A、B、Cに特異的なプライマー部位である。下付き文字「c」は、それに対して相補的であることを示す。 図9は、合成による配列決定のためのADT PCR産物調製を示す(イルミナプラットフォーム)。これらの図は、次世代シーケンスのためのサンプル調製ステップを示す。第1段階(a)において、ATD PCRからのLNAを含むプライマー領域を用いてアダプター配列をオリゴヌクレオチドタグに連結する。鋳型と相補鎖が5’と3’の両方のアダプター配列を含むように、2番目のアダプター配列が各鎖(b)の反対側の端に追加される。LNA含有領域はライゲーション工程中に除去されるので、イルミナシークエンシング(c)の最終産物は従来のヌクレオチドのみを含有する。これは、アダプター配列がLNAを含まないために起こる。略語は以下の通りである:ln(ロックドヌクレオチド)、cv(従来のヌクレオチド)、UPF(ユニバーサルフォワードプライマー)、UPR(ユニバーサルリバースプライマー)、V 1(可変領域1)、下付き文字「c」は相補的領域を表し、P7とP5は、Illuminaプロトコルで与えられているアダプター配列である。
図10は、並列配列決定のために、どのようにして複数の試料をLNAプライマー及びATD PCRでバーコード化することができるかを示す。この例では、サンプルを識別するためにLNAプライマーの5’末端に固有なバーコード識別配列が追加されている(フォワード又はリバースプライマーのどちらでも使用可能である)。試料をATD PCRにより増幅し、一緒にプールし、並行して配列決定し、そして次にデコード化する。この例では、(a)サンプル1はバーコード1でラベル付けされ、可変領域1(V 1)でコード化されたフラグメントを含み、(b)において、サンプル2はバーコード2でラベル付けされ、可変領域2及び3(V 2、V 3)でコード化されたフラグメントを含む。 (c)は、並行配列決定のために調製され、プールされたバーコードサンプルを示す。 図11は、UniKey−Tag2システムの別の例であり、(a)可変長の複数のタガントがコーディング列n中の各文字Lをエンコードする。図(a)は、8個のn−sオリゴヌクレオチドタガントのグループを示し、ここで、各タガントの長さは、列n中の記号の位置をコードし、各プライマー対はセットS={A、B、C}の文字Lをコードし、すなわちs=3である。 図11は、UniKey−Tag2システムの別の例であり、(b)ゲル電気泳動フラグメント長分離によってデコードされた増幅産物の図である。最終の組み合わせ製造物(b)は、個々のタガントτのレベル、各文字Lのタガントの組、及びアルファベットS内の文字の組で、2組以上の層状タガントを付けることができる。図(c)は、ゲル電気泳動によって分離された(b)の組み合わせ産物から生成される増幅産物を示す。フラグメントは、移動距離(フラグメント長に反比例する)及びゲルレーン(文字)に注目することによってデコード化される。これにより、ゲル上に効果的に二次元コードワードが形成され、ここで、各レーンは異なる文字(x軸)を表し、DNAバンドの移動距離(y軸)はコードワード中の文字の位置を表す。2つの異なる文字がコードワード内の同じ位置を占める可能性があることに留意されたい。セットS中の各LはATD PCRを用いて同時に復号されるので、この例では11個のタガントについて3つのスクリーニング反応のみが必要とされる。 図12は、可変アニーリング温度範囲(設計温度より4、2、及び0℃下回る)で、(a)ATD PCR、及び(b)従来のプライマーPCRの増幅産物を比較する電気泳動ゲルの写真を示す。両方のプロトコルについて、表1の25μMのOligoTag 1−4 Ser1タガントを含有する調製済み標準溶液で増幅を行った。これらのタガントは、74bpの同じポストPCR増幅長、ならびに同一のフォワード及びリバースプライマー部位を有する。UniKey−Tagプロトコル(a)は、クロスフラグメントハイブリダイゼーションの視覚的証拠を示さず、65〜69℃のアニーリング温度(AT)に対して単一の明確なバンドが存在する。対照的に、従来の回収及び増幅技術(b)は、49〜53℃のアニーリング温度(AT)範囲にわたってスミアリング及びストライエーションを示し、これはクロスタガントプライミング及び増幅を示す。20bpのかすかなバンドは、PCR産物に取り込まれていない過負荷プライマーである。(a)と(b)の両方について、レーンは以下の通りである:(1)ハイパーラダー25、(2)設計Tより4℃下のAT、(3)設計Tより2℃下のAT、及び(4)設計TのAT。 図13は、サイクル時間が可変である、ATD PCRプロトコル(レーン3及び5)及び従来のPCR(レーン2及び4)を用いた、異なる長さのユニバーサルプライマー部位コード化 フラグメントの混合物の増幅産物を示す電気泳動ゲルの写真である。両方のプロトコルについて、25μMのOligoTags 1−4 Ser1、OligoTags 9−12 Ser1、及びOligoTags 17−20 Ser1を含む調製済み標準溶液で増幅を実施した(配列を表1に提供する)。これらの フラグメントは、それぞれ74、64、及び54bpの増幅後の長さを有する。レーン2及び3について、より長いアニーリング及び伸長時間(それぞれ15秒及び20秒)で増幅を行い、レーン4及び5では標準的な熱サイクルプロトコル(それぞれ5秒及び10秒)を用いた。レーン1及び3はアニーリング温度(AT)=51℃での従来のPCRの産物を示し、レーン3及び5は設計されたAT=69℃(ΔAT=18℃)でのATD PCRの産物を示す。レーン2及び4におけるスミア及びストライエーションは、従来のPCRが使用されたときにクロスフラグメントハイブリダイゼーションが生じたことを示す。対照的に、レーン3及び5は3つの異なるバンドを示し、ATDがクロスフラグメントハイブリダイゼーションを妨げたことを示している。UniKey−Tagプロトコルのコントロールはレーン6に示されている。20bpのかすかなバンドは、PCR産物に取り込まれなかった過剰のプライマーである。 図14は、ATD PCR方法論を使用して焼成後に回収された弾丸から採取されたサンプルの増幅産物を示す電気泳動ゲルの写真である(実施例4)。弾薬カートリッジを3つのグループに分け、UniKey−Tags:OligoTag 4、12、及び20 Ser1でマークした(例1を参照)。これらのタガントは、共通のフォワード及びリバースプライマー配列、ならびにそれぞれ74、64、又は54bpの増幅後の長さを有する。複数の定義されたバンドの存在は、(a)マガジンに装填された連続カートリッジへのタガントの移動、(b)増幅中にクロスタグハイブリダイゼーションが起こらなかったこと、及び(c)弾薬の追跡を目的として、現場でのUniKey−Tag技術の実行可能性を示す。レーンは以下の通りである:(1)ハイパーラダー25;以下(2)OligoTag Ser1、(3)OligoTag 12 Ser1、(4)OligoTag Ser1、(6)OligoTag 12 Ser1、(7)OligoTag 20 Ser1、(8)OligoTag Ser1、OligoTag Ser1、OligoTag Ser1、OligoTag Ser1、OligoTag Ser1、OligoTag Ser1、OligoTag Ser1、OligoTag Ser1、OligoTag Ser1 、(11)OligoTag Ser1、(12)OligoTag 12 Ser1、(13)OligoTag 20 Ser1、(14)OligoTag Ser1、及び(15)ハイパーラダー25でタグ付けされた回収銃弾。 図15は、シリーズ2の実験のためにハミング(8,4,4)コード化フラグメントがどのように調製されたかを示す図である。各Ham(8,4,4)クラムは、データヌクレオチド(青のd−d)とパリティヌクレオチド(黒のp−p)で構成されている。ユニバーサルフォワード及びリバース相補的プライマー部位(それぞれUFPS及びURCPS)が隣接するピンク色のクラムライブラリー(表3)から長さn6のコードワードをアセンブルした(表4に提供される配列)。後生動物界に対する高い相補性(E≦0.1)及びCGに富む領域についてスクリーニングした後、候補コードワードを選択した。 図16は、5点タガント回収分析のための弾薬追跡実験配置の略図である。射手は、合板と土のうで裏打ちされた生物学的材料(スーパーマーケットの豚の脇腹肉)の部分からなる標的から10mのところに配置された。ラベル付けされた5つのタガント回収ポイントは、(a)手;(b)銃器;(c)使用済みカートリッジケース;(d)弾丸のエントリーポイント;及び(e)土のうから回収された弾丸である。UniKey−Tag2システムについての組み合わせたシリーズ1実験(a及びb)の結果を示す( フラグメント長分離結果)。y軸の単位はパーセントで、n=70である。 図17は、シリーズ1(UniKey−Tag2システム)弾薬追跡実験(a)及び(b)についての組み合わせた結果のグラフ図である。y軸は、x軸にリストされている5つのリカバリーポイントのそれぞれについて、予想されるフラグメントが検出された頻度(%)を示す。 図18は、表10に与えられたDNA−タガント固定溶液についての加速分解実験の結果を示す。 図19は、シリーズ1(9mm拳銃)及びシリーズ2(0.22及び0.207口径の銃器)の弾薬追跡実験の結果を示し、ここで、サンプルは配列決定(すなわち、UniKey−Tag1システム)によってデコード化された。これには、(A)すべてのサンプルで予想されるDNA追跡が検出された頻度が含まれる。 配列決定記録カウントに基づく、予想されるシグナル(ES)対ノイズ(N)比は、それぞれ(B)ケース、(C)エントリーポイントについて与えられる。左のy軸は平均ESに正規化されたES及びNの値を示し、右のy軸は平均ES/Nを示す。 配列決定記録カウントに基づく、予想されるシグナル(ES)対ノイズ(N)比は、(D)回収した弾丸サンプルについて与えられる。左のy軸は平均ESに正規化されたES及びNの値を示し、右のy軸は平均ES/Nを示す。レコードランクの関数としてのESの確率を(E)に示す。ここで、n=サンプル数、n=配列決定記録数、n=追跡数。 シリーズ1(a)実験a及び(b)実験b(UniKey−Tag2)についての弾薬カートリッジケースからのATD PCR産物を示す電気泳動ゲルの写真である。 図21は、シリーズ1(a)実験a及び(b)実験b(UniKey−Tag2)についてのエントリー部位サンプルからのATD PCR産物を示す電気泳動ゲルの写真である。 図22は、シリーズ1(a)実験a及び(b)実験b(UniKey−Tag )についての弾丸からのATD PCR産物を示す電気泳動ゲルの写真である。
配列表の鍵
配列番号1 OligoTag 1T Ser1
配列番号2 OligoTag 1C Ser1
配列番号3 OligoTag 2T Ser1
配列番号4 OligoTag 2C Ser1
配列番号5 OligoTag 3T Ser1
配列番号6 OligoTag 3C Ser1
配列番号7 OligoTag 4T Ser1
配列番号8 OligoTag 4C Ser1
配列番号9 OligoTag 5T Ser1
配列番号10 OligoTag 5C Ser1
配列番号11 OligoTag 6T Ser1
配列番号12 OligoTag 6C Ser1
配列番号13 OligoTag 7T Ser1
配列番号14 OligoTag 7C Ser1
配列番号15 OligoTag 8T Ser1
配列番号16 OligoTag 8C Ser1
配列番号17 OligoTag 9T Ser1
配列番号18 OligoTag 9C Ser1
配列番号19 OligoTag 10T Ser1
配列番号20 OligoTag 10C Ser1
配列番号21 OligoTag 11T Ser1
配列番号22 OligoTag 11C Ser1
配列番号23 OligoTag 12T Ser1
配列番号24 OligoTag 12C Ser1
配列番号25 OligoTag 13T Ser1
配列番号26 OligoTag 13C Ser1
配列番号27 OligoTag 14T Ser1
配列番号28 OligoTag 14C Ser1
配列番号29 OligoTag 15T Ser1
配列番号30 OligoTag 15C Ser1
配列番号31 OligoTag 16T Ser1
配列番号32 OligoTag 16C Ser1
配列番号33 OligoTag 17T Ser1
配列番号34 OligoTag 17C Ser1
配列番号35 OligoTag 18T Ser1
配列番号36 OligoTag 18C Ser1
配列番号37 OligoTag 19T Ser1
配列番号38 OligoTag 19C Ser1
配列番号39 OligoTag 20T Ser1
配列番号40 OligoTag 20C Ser1
配列番号41 OligoTag 1T Ser2
配列番号42 OligoTag 1C Ser2
配列番号43 OligoTag 2T Ser2
配列番号44 OligoTag 2C Ser2
配列番号45 OligoTag 3T Ser2
配列番号46 OligoTag 3C Ser2
配列番号47 OligoTag 4T Ser2
配列番号48 OligoTag 4C Ser2
配列番号49 OligoTag 5T Ser2
配列番号50 OligoTag 5C Ser2
配列番号51 OligoTag 6T Ser2
配列番号52 OligoTag 6C Ser2
配列番号53 OligoTag 7T Ser2
配列番号54 OligoTag 7C Ser2
配列番号55 OligoTag 8T Ser2
配列番号56 OligoTag 8C Ser2
配列番号57 OligoTag 9T Ser2
配列番号58 OligoTag 9C Ser2
配列番号59 OligoTag 10T Ser2
配列番号60 OligoTag 10C Ser2
配列番号61 FwdPrimer Ser1
配列番号62 RevPrimer Ser1
配列番号63 LNA FwdPrimer Ser1
配列番号64 LNA RevPrimer Ser1
配列番号65 FwdPrimer Ser2
配列番号66 RevPrimer Ser2
配列番号67 LNA FwdPrimer Ser2
配列番号68 LNA RevPrimer Ser2
詳細な説明
本明細書を通じて、文脈上別段の要求がない限り、用語「含む(comprise)」、又は「含む(comprises)」又は「含んでいる(comprising)」などの変形は、記述された要素又は整数又は要素のグループ又は整数の包含を意味すると理解されるであろう。ただし、他の要素や整数、あるいは要素や整数のグループを除外するものではない。
本明細書における任意の先行刊行物(又はそれから派生する情報)、又は既知であるか、知られていない、またそのような先行刊行物についての承認又は承認と見なされるべきではないすべての事項への言及(又はそれから派生する情報)又は既知の事項は、本明細書が関連する努力の分野における共通の一般的な知識の一部を形成する。
本出願は、2016年7月22日に出願されたAU2016902892からの優先権を主張し、その全内容は参照により本明細書に組み込まれる。
特に断らない限り、本明細書に記載の分子生物学的技術は標準的な手順であり、当業者には周知である。このような技術は、J.Perbal,A Practical Guide to Molecular Cloning,John Wiley and Sons(1984),J.Sambrook et al.,Molecular Cloning:A Laboratory Manual,Cold Spring Harbour Laboratory Press(1989),T.A.Brown(editor),Essential Molecular Biology:A Practical Approach,Volumes 1 and 2,IRL Press(1991),D.M.Glover and B.D.Hames(editors),DNA Cloning:A Practical Approach,Volumes 1−4,IRL Press(1995及び1996)、F.M.Ausubel et al.(editors),Current Protocols in Molecular Biology,Greene Pub.Associates and Wiley−Interscience(1988,現在までの全てのアップデートを含む)などの供給源における文献を通じて記載され、説明されている。
本明細書で言及された全ての刊行物は、その全体が参照により本明細書に組み入れられる。
本明細書で使用されるとき、単数形「a」、「an」、及び「the」は、文脈が明らかにそうでないことを指示しない限り、複数の態様を含むことに留意されたい。したがって、例えば、「1つのフラグメント」への言及は、単一のフラグメント、ならびに2つ以上のフラグメントを含む。
核酸は、それらの固有の安定性、情報密度及び合成の容易さのために理想的な分子タグである。非生物学的情報はまた、核酸配列にコード化され得、当該技術分野で公知の日常的な分子生物学技術を使用してデコードされ得る。核酸を含む分子タグは、製造物又はその包装の識別、認証及び追跡を可能にするために、製造物又はその包装に組み込まれてもよい。分子タガントによってコード化された情報は任意の適切な目的のために使用することができ、その例示的な例には原産地及び製造年月日が含まれる。
分子タグを用いて物質にタグを付けることは比較的簡単であるが、識別することができない限り、タグは限られた価値しかない。以前に開発された核酸タガントシステムは、タグのより大きなプールから未知のタグ又は未知のタグの混合された部分集合を効率的に検出及びデコード化することができない。これは、そのようなタグを認証するために独立した増幅反応を必要とする特定のプライマー−タグの組み合わせへの依存によるところが大きい。
本開示は、LNA含有プライマーが、(a)共通のプライマー部位配列、及び/又は(b)プライマー部位間の共通部分配列を有する複数の核酸の増幅中にフラグメント−フラグメント相互作用を区別し、したがってクロスフラグメントハイブリダイゼーションを防止するための選択的パラメーター「アニーリング温度」を導入するために使用され得るという本発明者の知見に基づいている。
LNAプライマーを使用することにより、熱サイクリング増幅反応のアニーリング温度を上昇させてLNAプライマー−フラグメント複合体の形成を可能にするが、相補的な従来のヌクレオチド複合体(ユニバーサルプライマー部位又は共通の記号部分配列による)、及びそうでなければより低いアニーリング温度で生じるであろう非特異的複合体の形成に対して区別することができる。この方法は、望ましくない特異的及び非特異的なフラグメント−フラグメントクロスハイブリダイゼーションが問題となる、異なる核酸配列を含む複数のタグの同時増幅に特に有用である。例えば、核酸の標的プールが(a)共通のプライマー配列、又は(b)プライマー部位間の共通の部分配列を含む場合、特異的クロスハイブリダイゼーションが問題となる(図4及び5も参照)。ここで、特定とは、望ましくない相互作用が実質的に相補的である2つの部分配列の間で起こることを意味する。
したがって、本明細書に開示される一態様では、第1のプライマー部位と第2のプライマー部位とが隣接する標的核酸配列の高忠実度増幅のための方法が提供され、ここで、増幅は、融解段階、アニーリング段階及び伸長段階を含む熱サイクリングを含む。該方法は、第1のプライマー部位に相補的な第1のプライマー及び第2のプライマー部位に相補的な第2のプライマーを使用することを含み、ここで、第1及び第2のプライマーがそれぞれ少なくとも1つのロックド核酸(LNA)を含み、アニーリング段階中に、第1及び第2のプライマー以外の核酸配列をそれぞれ第1及び第2のプライマー部位に実質的にアニーリングしないように、熱サイクリングのアニーリング段階中に高温を用いる。
標的核酸配列及びタグ
本明細書に開示される方法は、任意の標的核酸配列の高忠実度増幅に適していることを理解されたい。用語「標的核酸」、「標的核酸配列」、「標的ヌクレオチド配列」、「標的核酸分子」、「核酸」、「核酸配列」、「ヌクレオチド配列」、「核酸分子」、「オリゴ」、「オリゴヌクレオチド」、「核酸フラグメント」、「フラグメント」などは、1つのヌクレオチドのリン酸化五糖の3’位がホスホジエステル基によって、次のヌクレオチドの五糖の5’位に接続されている共有結合したヌクレオチドの配列を意味すると理解され、ここで、ヌクレオチド残基は、特定の配列、すなわち、ヌクレオチドの線形順序で連結されている。標的核酸は一本鎖又は二本鎖であり得る。
標的核酸配列は、天然に存在してもよく(例えば、天然又はトランスジェニック生物から単離されてもよく)、人工のもの(すなわち合成されたもの)であってもよい。標的核酸は、天然若しくは非天然ヌクレオチド、又は両方の組み合わせを含み得る。天然ヌクレオチドは、典型的には5つの天然に存在する塩基−アデニン、チミン、グアニン、シトシン及びウラシルを指す。本明細書に開示される実施形態では、標的核酸配列は合成ヌクレオチドを含む。合成ヌクレオチドは、安定性、溶解性、及びヌクレアーゼ活性に対する耐性、熱及び/又は紫外線(UV)に対する耐性など、天然に存在するヌクレオチドを超えるいくつかの利点を有する。いくつかの実施形態において、非天然又は合成核酸は、イノシン塩基及び誘導体化ヌクレオチド、例えば7−デアザ−2’−デオキシグアノシン、メチル−又はより長いアルキル−ホスホネートオリゴデオキシヌクレオチド、ホスホロチオエートオリゴデオキシヌクレオチド、及びα−アノマーオリゴデオキシヌクレオチドを含むものを含む。
一実施形態では、1つ以上の標的核酸は、配列番号1〜60から選択される核酸配列を含む。
本明細書の他の箇所で述べたように、核酸は、それらの固有の安定性、情報密度及び合成の容易さのために理想的な分子タグである。「タグ」及び「タガント」という用語は、本明細書において互換的に使用されて、タグが、それが付着され、適用され、若しくは他には組み込まれた製造物、又はタグ付き製造物が接触した表面(例えば、拳銃やライフルから発射された弾丸のようなタグ付き発射体のエントリーポイントの表面)上で検出されるかどうか、核酸のタグの検出によって製造物のその後の識別、認証及び/又は追跡を可能にするための、製造物に又はその上に付着、適用又は他には組み込まれ得る核酸分子を意味する。
したがって、「タグ」及び「タガント」という用語は、本明細書では「核酸」、「核酸配列」、「ヌクレオチド配列」、「核酸分子」、「標的核酸」、「標的核酸配列」、「標的ヌクレオチド配列」、「標的核酸分子」、「オリゴ」、「オリゴヌクレオチド」、「核酸フラグメント」、「フラグメント」などと互換的に使用される。これらの用語は、まとめて、上記の一本鎖(ss)及び二本鎖(ds)形態の両方を含むと理解されるべきである。
標的核酸配列が、製造物、物品又は物質に適用、付着又はその他の方法で組み込まれた核酸タグである場合、いくつかの実施形態では、本明細書に開示される方法によるその後の増幅のために少なくとも核酸のサンプルを回収する必要がある。いくつかの実施形態では、製造物からの核酸タグの回収は必要ではない。例えば、製造物が医薬品の場合、製造物は増幅反応混合物に直接溶解することができる。製造物又は物質から核酸タグを回収するための適切な方法は当業者によく知られており、その具体例は蒸留水又は緩衝溶液のいずれかを用いて製造物からタグを抽出することを含む。酸性又は塩基性のpHレベルが核酸タグを劣化させる可能性があるので、生理学的pHが典型的には好ましい。核酸タグを荷電した製造物又は物質に付着、適用又はその他の方法で組み込む場合、静電的に結合した核酸タグとのイオン交換体として作用するために、製造物又は物質を高モル濃度の塩緩衝液中で洗浄する必要がある。イオン性又は非イオン性界面活性剤もまた、表面から又は複雑な混合物から核酸を除去するのに役立ち得る。フェノールベースの抽出又はフェノール/クロロホルム抽出もまた、複雑な生物学的物質又は油性物質から核酸を回収するために使用することができる。
いくつかの実施形態において、回収された核酸タグは、アルコールによる沈殿、蒸発、又は精密濾過などの当業者に知られている標準的な技術によって濃縮することができる。
情報をコードした核酸配列
本明細書に記載の方法によれば、熱サイクル中のアニーリング温度の上昇は、混合物中のユニバーサルプライマー部位をコード化したタガント間の相互作用の発生を実質的に減少させる。いくつかの実施形態では、第1及び第2のプライマー以外の核酸配列をそれぞれ第1及び第2のプライマー部位にアニーリングすることは実質的にない。したがって、高いアニーリング温度は、クロスタガントヘテロ二量体形成の可能性を減少させる。これは、本明細書に記載の用途に特有の3つの課題に対処するために特に重要である。(1)ユニバーサルプライマー部位をコードしたライブラリーの従来の伸長サイクルPCR増幅(>20サイクル)は、配列決定に十分な量の産物を産生するために必要であるがフラグメントハイブリッド形成をもたらす。(2)(図5のような)共通部分配列によってコードされた同じ記号を含む異なるタガントコードワードは、従来のPCRが使用される場合、クロスハイブリダイズ産物を形成する可能性が高い。(3)従来のPCRの低アニーリング温度は、非特異的ヘテロ二量体形成のために情報をコードするのに利用可能な配列に対してより厳密な生化学的制約を課す(例えば、GCリッチ配列は問題が多い)。
本明細書に開示される実施形態では、標的核酸配列は非生物学的情報をコードする。句「非生物学的情報」は、典型的には、その配列が生細胞中で発現されたときに機能を果たすように設計されていないことを意味する。したがって、非生物学的情報をコードする核酸配列は、機能的ポリペプチドをコードするオープンリーディングフレームを含まない。したがって、いくつかの実施形態では、タグは、天然に存在する生物には存在しない核酸配列を含む、それからなる、又は本質的にそれからなる。
いくつかの実施形態において、情報は、文字又は記号(すなわち、英数字、特殊文字など)又は2進コード(すなわち、1及び0)として、ヌクレオチド又はヌクレオチドの部分集合を用いて標的核酸配列にコード化され得る。例えば、DNAについては塩基性ヌクレオチドA(アデニン)、G(グアニン)、C(シトシン)及びT(チミン)(又はRNAについてはA、G、C及びU(ウラシル))により、膨大な量の情報を得ることができる。ここで、各ヌクレオチド塩基、又はヌクレオチド塩基の列は、アルファベットの文字などの文字又は記号(すなわち、l=1bp)、又は2進コードの文脈では1及び0を表す。
本明細書に開示される実施形態では、標的核酸によってコードされた情報は、追加の情報が記憶されているディレクトリ(例えば、コンピュータデータベース)内のアドレスを提供する。別の実施形態では、情報は、使用されたコード化/暗号化の方法を知っている人なら誰でもデコード化/解読できるように標的核酸に直接コード化される。
一実施形態では、タガントは、各ヌクレオチドA、G、C及びT(又はU)が「0」又は「1」を表す2進コードをコードする。典型的な例では、ヌクレオチドA及びGは「1」を表し、ヌクレオチドC、T及びUは「0」を表す。したがって、2進コードは、ヌクレオチドの適切な配置によってタガントにコード化され得る。したがって、2進コード「010011010」は、核酸配列「CATTAGTAC」、「TGCCGGCAT」、「AGCTGAUAC」などによってコードされ得る。逆に、ヌクレオチドA及びGは「ゼロ」を表し、そしてヌクレオチドC、T及びUは「1」を表す。
一実施形態では、一組のヌクレオチド{A、C、G、T}は、一組の2進数{00、01、10、11}の任意の組み合わせにマッピングされる。例えば、{A、C、G、T}がそれぞれ{00、01、10、11}にマッピングされている場合、ヌクレオチドの列GATTACAは2シン列10001111000100をコードする。
一実施形態では、2進数の短い列がバイトをコードし、各バイトは、コードワードを形成するために記号の列を構成するのに使用できる記号(「文字」とも呼ばれる)に対応する。コードワード内の記号には、j#n5@$$mc*&!mなどの英数字と特殊文字を含めることができる。
別の実施形態において、ヌクレオチドA、G、C、T及びUは、2つ以上のヌクレオチドの部分集合に配置され、各部分集合は文字又は記号を表す。したがって、単語は、ヌクレオチド部分集合の適切な配置によってタガントの核酸配列にコード化され得る。典型的な例では、部分集合「AGC」は文字Tを表し、部分集合「GCT」は文字Aを表し、部分集合「CTU」は文字Gを表し、そして部分集合「ACC」は文字Nを表す。したがって、単語TAGGANTは、核酸配列「AGCGCTCTUCTUGCTACCAGC」によってタガントにコードされ得る。
別の実施形態において、ヌクレオチドA、G、C、T及びUは、個々に又は2つ以上のヌクレオチドの部分集合において、記号中のn進ビットに対して2進、3進、4進などを表す。典型的な例では、4進コード化システムでは、部分集合「AGC」は数0を表し、部分集合「GCT」は数1を表し、部分集合「CTU」は数2を表し、部分集合「ACC」は数3を表す。したがって、数1230は核酸配列「GCTCTUACCGCT」によってタガントにコード化することができ、数133102は核酸配列「GCTACCACCGCTAGCCTU」によってタガントにコード化することができ、以下同様である。4進コードの場合、2つ以上の4進数字の列、例えば133102は「クラム」を含むことができる。4進コードの「クラム」は、2進コードの「バイト」に相当する。クラムは、任意の文字又は記号(文字)をコードすることができるので、クラムの列はコードワード内の記号の列をコードする。当業者にはよく知られているように、各バイト、クラムなどをコード化するために使用されるn進数字の列は、指定された相互最小ハミング距離又はレーベンシュタイン距離で設計されるべきである。
本明細書に開示される一実施形態では、標的核酸配列は、アデニン、チミン、グアニン、シトシン及びウラシルからなる群から選択されるヌクレオチドを含み、核酸配列は2進コードであり、各ヌクレオチドは、長さが≧1bpである1’又は0’の列を表す。
本明細書に開示される実施形態では、標的核酸配列は、アデニン、チミン、グアニン、シトシン及びウラシルからなる群から選択される部分集合ヌクレオチドを含み、部分集合は文字をコードする。
本明細書に開示される実施形態では、標的核酸コードワード配列は、長さ2bp以上(2進バイトに相当する)の一連の部分配列から組み立てられる。部分配列は、英数字又は特殊文字記号(例えば、j#n5@$$mc*&!m)をコード化し、その結果、タガントの可変領域は、コードワードを形成する英数字及び/又は特殊文字の文字列をコード化する。次に、コードワードは、データベース上の商品、アイテム、又はオブジェクトに関連付けられている情報を検索するために使用することができる。
タガントにコード化することができる情報は、タガントのサイズ及びヌクレオチドの配置、又はヌクレオチドの部分集合によってのみ制限され、2進、3進、4進、…、n進コードを表すことが理解されるべきである。いくつかの例では、冗長性を導入することは、配列決定及び合成エラーの観点から望ましいだろう。したがって、冗長性及びエラー検出及び訂正能力を組み込むことは、デコード化の信頼性を高めるためにコード化設計に組み込まれ得る。これらの場合、各クラムは、エラー検出及び訂正能力を与える記号及びパリティヌクレオチドをコードするデータヌクレオチドを含む。例えば、タガントコードワードは、4つのデータヌクレオチドと4つのパリティヌクレオチドとを含むハミング(8,4,4)コード化された≧ルから構成することができる。冗長性及び/又はエラー検出及び訂正能力を組み込んだコード化システムの他の例としては、ハフマンコード化、リードソロモンコード化、レーベンシュタインコード化、差分コード化、単一パリティ検査コード化、ゴールドマンコード化及びXORコード化がある1-8
タガント中のヌクレオチドの列は、例えば、有効期限、製造者、製造施設、及び医薬品の各前駆体のバッチ番号などの情報を含むように細分することができる。最も単純な形では、直接コード化は各ヌクレオチドが文字をコード化することを必要とする(例えば、図8(a)参照、ここでl≧1bp)。
一実施形態では、タガントは、データベースに記憶されている製造物、物体、又は識別情報を指す固有の識別英数字及び/又は特殊記号コードでコード化される。例えば、タガントは、例えば、製造者、製造物タイプ、製造施設、製造物バッチ番号、製造日、及び有効期限を含むことができるデータベース内の情報を検索するために使用されるコードワード記号134−12−145−8−255−89でコード化することができる。
一実施形態では、タガントにコード化された情報は製造日を示す。例えば、製造者は、製造日の情報をコードする核酸配列を含む独自のタガントをその製造物に適用することができる。たとえば、「2016年6月11日」である。次に、製造物の製造日は、タガントを取得するように(例えば、スワブを介して)製造物をサンプリングし、本明細書に開示されているタガントを増幅するために本明細書に開示される方法を実行することによって確かめられ得る。ここで、タガントによってコード化された情報が製造日を示す。
本明細書に開示される一実施形態では、タガントにコード化された情報は出所を示す。したがって、そのような方法は、製造物をそれらの場所又は起源まで追跡するために使用することができる。例えば、製造者は、製造者の名前、製造者の住所などの製造者を示す文字に対応する専有のn進コードをコード化する核酸配列を含む専有のタガントをその製造物に適用することができる。次に、タガントを得るように(例えば、スワブを介して)製造物をサンプリングし、本明細書に開示される方法を実行して専有のタガントを増幅することによって場所又は起源を確認することができる。ここで、タガントの存在は、製造業者を起源とする製造物を示し、一方、専有のタガントが存在しないことは偽造品を示している可能性がある。
標的核酸配列によってコードされる情報は、当業者に知られている日常的な方法を用いてデコード化することができる。本明細書中で使用される場合、用語「デコード化」又は「デコード化する」は、核酸配列の理解可能な形態(例えば、英数字及び/又は特殊文字記号からなるn長コードワード)への変換を意味する。
一実施形態では、標的配列はアーカイブデータ記憶のための手段を提供する。核酸は本質的に安定であるので、分子タグ付け剤はデータのアーカイブ保存に非常に適しており、ここで、データは、例えば、テキスト、画像、又はビデオファイルをコード化するために使用され得るn進コードの代表として、そこにヌクレオチドの配列又はヌクレオチドの部分集合によってコード化される。合成DNA配列は、データを記憶するための有効な手段を提供することが実証されている。例えば、Bornholtら(2016)は、キー・バリューストアとしてモデル化されているDNAベースのアーカイブ記憶システムのためのアーキテクチャフレームワークを記載する。一実施形態では、DNAベースのアーカイブデータは配列決定によってデコード化される。例えば、図2は、特定のフラグメントのライブラリーによってコード化されている3つのイメージファイルを示す。各ライブラリーは、ファイルに普遍的な特定の組のフォワード及びリバースプライマー部位(例えば、UPFb、UPRb)によって定義される。ファイルは、標的配列内にコード化された3つすべての画像についてのデータを含むDNAフラグメント(P)の混合プールとしてアーカイブされる。
本明細書に開示される方法はまた、DNAベースのアーカイブデータのデコード化を妨害する可能性があるフラグメント−フラグメントクロスフラグメントハイブリダイゼーションを最小化又は回避しながら、単一の増幅反応で特定のファイルにランダムにアクセスすることを可能にする。本明細書に開示された方法によって生成された増幅産物は、続いて配列決定され得て、そして得られた配列から画像がデコード化され得る。ファイルはまた、例えば、ファイルの特定の部分にアクセスするためのより大きなランダムアクセス機能を可能にするために、より小さなライブラリセットに分割することもできる。
本明細書の他の箇所で述べたように、タガントにコード化することができる情報は、2進、3進、4進、…、又はn進コードの代表としてタガントのサイズ及びヌクレオチドの配置、又はヌクレオチドの部分集合によってのみ制限される。
サンプルがフラグメント長分離及び/又はPCR産物の存在、及び非配列決定によってデコード化されるプライマー部位コード化システム(UniKey−Tag 2)の場合、LNA含有プライマーを使用する利点は、タガント内のコード文字長が、結合親和性を犠牲にすることなく、約10〜15bpの長さlに圧縮することができる。したがって、LNAプライマーはタガントのデザインを変えることができる。このlの減少は、以下の式1に従ってワードスティング長nの逆比例増加を可能にし、それは情報記憶容量及びタガントライブラリーサイズに対して重要な意味を有する。サイズs=5のアルファベットを考慮すると、nが5から10に倍増される場合、利用可能な固有のタガントの数は、式3に従って、w=3,125からw10≒980万まで増加する。LNAプライマーはまた、各LをSにコード化するために、ユニバーサルフォワードプライマーと階層的なリバースプライマーセットの使用を介して、プライマー対に基づくシステムをより効率的にデコード化するために使用され得る。
コード化単位長圧縮はまた、文字長l(bp)を減少させ、それによってタガントのコードワード列長nを増加させる。例えば、タガントの可変領域は、アルファベットの文字の組からの文字をコードする一連のヌクレオチド又はヌクレオチド部分集合の列から構成されてもよい。S.ワトソン−クリックDNA生化学は、結合させるための従来の核酸プライマーについてはl=約20〜30bpであり、同時に、いくつかの実施形態では、オリゴヌクレオチド合成制限は、約k=100bpに全フラグメント長を制限し得ることを示す。図3(a)は、これが最大コード化列長をn=v/l=100/20=5文字(ここでv=k)に制限することを示し、次に、式w=sn(以下の式3も参照)にしたがって、利用可能なタガントライブラリーのサイズwを厳しく制限する。現在のタガントコード化技術では、Wはまた、Wをスクリーニングするのに必要な増幅反応の数のためにsによっても制限され、これはコスト及び低コピー数のサンプリングにとってフロー上の影響を有する。例えば、n5−s5システムのタガントライブラリーサイズは、w=5=3,125であり、識別目的に必要な増幅スクリーニング反応の数は250である。
式1
コーディング列nの長さは、可変領域の長さv bpと文字の長さl bpの関数である。
式2
すべての記号の集合S上のすべてのコードワードの集合(単語列など)wのサイズは、文字列の長さnと記号sの集合のサイズの関数である。
式3
定義された文字列長nに対するタグライブラリーサイズwは、次のように与えられる。
御布施
本明細書の他の箇所で述べたように、標的核酸配列(タグ)は第1のプライマー部位及び第2のプライマー部位を含む。いくつかの実施形態において、タグによってコードされる情報は、第1及び第2のプライマー部位の間の核酸配列中に見出され、したがって、第1及び第2のプライマー部位の核酸配列を除外する。他の例では、タグによってコードされた情報は、第1及び/又は第2のプライマー部位を含む核酸配列中に見出すことができる。一実施形態では、情報は第1のプライマー部位の核酸配列及び可変配列によってコードされている。別の実施形態では、情報は可変領域内の核酸配列及び第2のプライマー部位によってコードされる。さらに別の態様において、情報は第1のプライマー部位の核酸配列、可変配列及び第2のプライマー部位によりコードされる。
タグ付け
本明細書で使用される「タグ付け」という用語は、核酸タグの検出による製造物のその後の識別、認証及び/又は追跡を可能にする、製造物又は物品の中又は上に核酸タグを付着させる、適用する、又は組み込むプロセスを意味する。用語「製造物」及び「物品」は、本明細書において互換的に使用されて、核酸タグを適用、付着又は他の方法で組み込むことができる物質を意味する。核酸タグは、上記製造物又は物品の製造中に製造物に適用され、付着され、又はそうでなければ組み込まれることができる。あるいは、又はそれに加えて、核酸タグは、その製造後に製造物に適用する、付着させる、又はそうでなければ組み込むことができる。
製造物又は物品を核酸タグでタグ付けする適切な方法は当業者にはよく知られており、その具体例はSheuらの米国特許第2005/0008762号に記載されている。一実施形態では、製造物が液体、気体又はエマルジョンである場合、タガントは単なる混合によって液体、気体又はエマルジョン全体に分布させることができる。別の実施形態では、製造物が固体である場合、タガントを溶液中で製造物又は物品に塗布し、続いてその上で乾燥させることができる。
核酸タガントを適用、付着又は他の方法で組み込むことができる製造物又は物品の他の典型的な例には、植物及び植物製造物(例えば、果物、野菜及び穀物)、動物及び動物製造物(例えば、肉、ミルク、チーズ)、爆薬(例:プラスチック爆薬及び火薬)、エアロゾル(例えば、自動車又は工業用汚染物質)、有機溶剤(例えば、化学処理工場由来)、紙製造物(例えば、新聞用紙、金銭、及び法的文書)、インク、香料、及び医薬品又はその前駆体が挙げられる。例えば、医薬品の前駆体は多成分医薬組成物の一成分であり得る。例えば、前駆体は、活性成分又は賦形剤であり得る。したがって、医薬品が2つ以上の活性成分及び/又は2つ以上の賦形剤を含む場合、最終医薬品を処方する前に、異なる核酸タグを各活性成分又は賦形剤に付けることができる。
本明細書の他の箇所で述べたように、核酸タグを適用、付着又は他の方法で組み込むことができる製造物は、不活性又は化学的活性を問わず、固体、液体又は気体とすることができる。不活性固体の典型的な例には、紙、医薬品又はそれらの前駆体、木材、食品及びポリマー化合物(例えばプラスチック)が含まれる。
いくつかの実施形態では、核酸タグを固体製造物の表面に(例えば噴霧によって)付着させることができる。他の実施形態では、核酸タグを液体又は気体製造物と混合することができる。気体の場合、タグは単にガスと混合することができる。例えば、コンテナ化された気体はタグを容器に配置する。気体が大気中に放出される場合、タグは放出前又は放出時に混合され得る。例えば、産業界から放出された気体の拡散パターンを追跡するために、エアロゾル送出装置を排気口に取り付け、気体が放出されるときに計量された量のタグを導入することができる。別の実施形態では、核酸タグ又は複数のタグを微粒子又はナノ粒子に付着させ、続いて気体状又は液体状の物質全体に分散させることができる。
いくつかの実施形態では、製造物は、ヌクレアーゼ活性、熱、圧力及びUV光などの核酸タグを劣化させる可能性がある条件にさらされるか、又はさらされる危険性がある。したがって、製造物への適用中又はその後に、核酸タグに保護組成物をさらに提供することが有利であり得る。適切な保護組成物は当業者によく知られており、その具体例としては、酵素的又は化学的分解、ポリマー物質(例えばタンパク質)及び固定剤からそれらを保護するために核酸タグ(例えばリポソーム、ミセル本体、シリカ内)をカプセル化することが挙げられる。本明細書に開示される実施形態において、核酸タグは、固定剤(例えば、タグを製造物又は物品に固定することができ、及び/又は高温、高圧、紫外線及びヌクレアーゼ活性などの悪条件からタガントを保護することができる薬剤)を含む溶液とともに適用される。適切な固定剤は当業者によく知られているであろう。いくつかの実施形態では、固定剤は、ポリビニルアルコール、D−(+)−トレハロース二水和物及びα,β−トレハロースからなる群から選択される。
核酸の増幅
本明細書で使用されるとき、語句「高忠実度増幅」は、典型的には、例えば、標的配列ヘテロ二量体形成を介して、非特異的フラグメント−フラグメントクロスハイブリダイゼーションによって形成され得る産物の増幅を最小化又は回避しながら、標的核酸配列の増幅を意味する。ここで、このような生成物は、そうでなければ標的核酸配列の増幅及び/又は識別に影響を与えるであろう。非特異的ハイブリッド増幅産物はまた、本明細書において「非特異的アンプリコン」とも呼ばれる。本明細書中で使用される場合、「クロスハイブリダイゼーション」とは、熱サイクリング中、特に熱サイクリングのアニーリング段階中の標的核酸フラグメントと他の標的核酸フラグメントとのハイブリダイゼーションをいい、混合起源及び長さのハイブリッドフラグメントを生じる。クロスハイブリダイゼーションは、増幅中のフラグメント−フラグメントプライミング及び鎖伸長の結果である。
クロス−ハイブリダイゼーションは、プライマー−フラグメントハイブリダイゼーションと同様のアニーリング温度で起こる、異なる標的配列にわたる相補鎖のクロス−ハイブリダイゼーションの可能性のために、異なる核酸配列を含む複数のタガントを増幅するときに特に問題である。クロス−ハイブリダイゼーションは、共通のフォワード及びリバースプライマー部位を有する異なる核酸配列を含む複数の核酸の増幅中に特に問題となる。相補鎖のクロス−ハイブリダイゼーションが起こると、得られたフラグメントは続いて増幅され、起源と長さが混在する増幅産物を生成し、それは不可能ではないにしても標的配列を識別することを困難にする。他に記載されているように、本明細書に開示されている方法は、それぞれ少なくとも1つのロックド核酸(LNA)を含むフォワード及びリバースプライマーを使用することによってフラグメント−フラグメントクロスハイブリダイゼーションを最小化又は回避する。これにより、熱サイクリング増幅反応のアニーリング段階を、LNAプライマー−フラグメントハイブリダイゼーションの形成を可能にするより高い温度で実施することが可能になるが、そうでなければより低いアニーリング温度で起こるフラグメント−フラグメント複合体の形成とは区別される。
クロスフラグメントハイブリダイゼーションは、典型的には、フラグメント−フラグメント相互作用がプライマー−フラグメント相互作用と同じ又は類似の条件で起こるときの増幅反応中に起こる。これは、共通のフォワード及びリバースプライマー部位を有する標的核酸配列を増幅するとき(図4参照)及び/又はフラグメントがシンボルをコードする共通の部分配列を含むとき(図5参照)、大きな問題を提示する。本書の他の部分で説明されているように、一般的なプライマーを使用する利点は、ユニバーサルな一連のプライマー「キー」によって、サンプル数とサンプルのスクリーニングに必要な反応が劇的に減少することである。酵素フラグメントハイブリダイゼーションが起こり得るメカニズムの例は、図4及び図5のフラグメントプライミング図を参照して記載される。
図4は、異なる可変領域を有するが同じフォワード及びリバースプライマー部位を有するオリゴヌクレオチドフラグメントのプールを示す。PCRの最初のステップで、dsDNAフラグメントは高温で変性し(図6a)、露出した塩基対を持つssDNAフラグメントの混合物を形成する(図4a)。次に反応物を冷却してプライマーを露出した鎖に結合させ、DNAポリメラーゼ媒介鎖伸長のための二本鎖鋳型を提供する。プライマーが鋳型に結合する温度は、アニーリング温度と呼ばれる(図6;c1とc2)。共通のプライマー部位を共有する異なるオリゴヌクレオチド間のクロスフラグメントハイブリダイゼーションは、これらの相補的部位間の相互作用がプライマー−フラグメント相互作用と同じ又は類似のアニーリング温度条件で起こるために生じる。
クロスフラグメントハイブリダイゼーションのメカニズムを図4(b、i〜iv)に示す。最初の(i)クロスフラグメントプライミング及び伸長は、共通のプライマー部位間で起こり、それは(ii)ハイブリダイズした可変領域を有するフラグメントの最初の世代をもたらす。クロスプライミングの連続した世代は、各PCR熱サイクルで継続し、さらに可変領域を「シャッフル」する。ハイブリッドフラグメント間の非特異的結合は、暴走的なプライミング及び伸長をもたらし(iii)、そして最終的には混合起源及び長さの産物を産生する(iv)。大部分の場合、クロスフラグメントハイブリダイゼーションは、元のフラグメント/タガントの配列を決定することを不可能にする。
図5は、異なるタガントコードワードにおける共通の記号配列間のクロスフラグメントハイブリダイゼーションのメカニズムを示す。クロス記号プライミングは、同じ記号配列(2進コードでは「バイト」、4進コードでは「クラム」と呼ばれます)が異なるコードワードで使用されている場合に特に問題になる。同じコード化化方式を使用して、後に混合されるタガントコードワードを生成すると、クロス記号プライミングが発生する可能性があある。同様に、クロスフラグメントハイブリダイゼーションは、ワトソンクリックDNA結合生化学によれば、GCに富む可変領域間で起こりやすい。
標的核酸配列の熱サイクリング増幅のための適切な技術は、当業者に知られており、その例示的な例としては、ポリメラーゼ連鎖反応(PCR)、リガーゼ連鎖反応(LCR)、ギャップフィリングLCR(GLCR)、Qβレプリカーゼ、鎖置換増幅(SDA)、自立配列複製(3SR)、核酸配列に基づく増幅(NASBA)、及びそれらの変法が含まれる。
一実施形態では、増幅はPCRによって行われ、その具体例は米国特許第4,683,195号及び関連米国特許第4,683,202号;第4,800,159号及び第4,965,188号に記載されている。一実施形態において、PCRは、標的核酸配列(本明細書で核酸「鋳型」とも呼ばれる)を含むと疑われるサンプル、2つのプライマー配列(フォワード及びリバース)、PCR緩衝液、遊離デオキシヌクレオシド三リン酸(dNTP)、及びTaqポリメラーゼなどの熱安定性DNAポリメラーゼを合わせることによって開始される。その後、混合物を加熱して二本鎖DNA鋳型を分離するか又は「融解」させる(本明細書では「融解段階」とも呼ぶ)。その後の「アニーリング段階」は、プライマーが、増幅されるべき一本鎖鋳型又は標的配列上の相補的配列にアニーリングすることを可能にする。標的配列の複製は「伸長段階」中で起こり、それによってDNAポリメラーゼは鋳型に相補的なDNA鎖を生成する。このプロセスを繰り返すと、関心のある配列のコピー数が2倍になり、複数のサイクルでコピー数が指数関数的に増加する。一実施形態では、増幅は少なくとも10サイクルの融解、アニーリング及び伸長を含む。一実施形態では、増幅は少なくとも20サイクルの融解、アニーリング及び伸長を含む。一実施形態では、増幅は少なくとも30サイクルの融解、アニーリング及び伸長を含む。一実施形態では、増幅は少なくとも40サイクルの融解、アニーリング及び伸長を含む。一実施形態では、増幅は少なくとも50サイクルの融解、アニーリング及び伸長を含む。一実施形態では、増幅は10〜50サイクルの融解、アニーリング及び伸長を含む。一実施形態では、増幅は20〜50サイクルの融解、アニーリング及び伸長を含む。一実施形態では、増幅は30〜50サイクルの融解、アニーリング及び伸長を含む。
本明細書に開示された方法は、有限サイズの標的核酸配列の増幅に限定されないことを理解すべきである。しかしながら、当業者は、増幅効率が少なくとも部分的には標的核酸配列のサイズに依存することを認識するであろう。一実施形態では、タガントは、長さが2000塩基対(bp)以下である。一実施形態では、タガントは、長さが1000塩基対(bp)以下である。一実施形態では、タガントは、長さが500塩基対(bp)以下である。一実施形態では、タガントは、長さが300塩基対(bp)以下である。一実施形態では、タガントは、長さが200塩基対(bp)以下である。別の実施形態では、タガントは、長さが100塩基対(bp)以下である。一実施形態では、タガントは、長さが50塩基対(bp)以下である。本発明による増幅に適したタガントの典型的な例を図7及び図8に提供する。本発明による使用に適したタガントは、好適には第1のプライマー部位、第2のプライマー部位、及び第1と第2のプライマー部位の間の可変領域を含む。一実施形態では、タガントは、5’及び3’のキャッピング領域をさらに含む。
LNAプライマー
本明細書で使用されるとき、用語「プライマー」は、熱サイクリングによる増幅に適した条件下で目的の別の核酸にアニーリングすることができるオリゴヌクレオチドを意味する。プライマーがプライマー部位にアニールする能力は、少なくとも部分的には、プライマーのヌクレオチド配列とプライマー部位のヌクレオチド配列との間の相補性の程度に依存する。
プライマーは、典型的には、約8〜約60塩基、好ましくは約8〜約30ヌクレオチドの短い核酸配列である。いくつかの態様において、プライマーは15〜25ヌクレオチド長である。いくつかの実施形態において、第1及び/又は第2のプライマー(フォワード及び/又はリバースプライマー)は、5’末端にさらなる核酸を含み得る。これは、標的核酸(タグ)の長さがそうでなければ検出には小さすぎる場合(例えば、配列決定プロトコルの最小読み取り長制限未満)に有利であり得る。したがって、フォワード及び/又はリバースプライマーの5’末端に追加の核酸を組み込むと、その後の検出に適したより大きなフラグメントが生成される可能性がある。フォワード及び/又はリバースプライマーの5’末端に追加の核酸を組み込むことが望ましい場合、LNAをフォワード及び/又はリバースプライマーの伸長部分(すなわち5’テール)に組み込むことは不要であることを理解されたい。
本明細書で使用されるとき、用語「相補的」又は「相補性」は、AがT又はUと対になり、CがGと対になるという周知の塩基対合則によって関連する核酸(すなわちヌクレオチドの配列)を意味する。すなわち、配列5’−AGT−3’は、DNA中の配列3’−TCA−5’、及びRNA中の3’−UCA−5’に相補的である。相補性は、塩基対合則に従ってヌクレオチド塩基のいくつかのみが一致する「部分的」であり得る。他方、全ての塩基が塩基対合則に従って一致する場合、核酸鎖間に「完全」又は「全」相補性が存在し得る。核酸鎖間の相補性の程度は、当該技術分野において周知のように、核酸鎖間のハイブリダイゼーションの効率及び強度に大きな影響を与える。これは、標的配列がタガントの可変コード領域に共通のプライマー部位及び/又は共通の記号配列を含む実施形態において特に重要である。
本明細書で使用されるとき、用語「ロックド核酸」又は「LNA」は、リボース単糖の2’−O及び4’−C原子を連結するメチレン架橋を含む核酸類似体を意味する。
本明細書中に記載されるように、本発明者は、そうでなければより低いアニーリング温度で起こるであろうフラグメント−フラグメント複合体の形成に対して識別しながら、第1及び/又は第2のプライマーへの少なくとも1つのLNAの組み込みが増幅反応のアニーリング温度を上昇させてLNAプライマー−フラグメント複合体の形成を可能にすることを示した。本明細書で使用されるとき、用語「LNAプライマー」及び「LNAプライマー」は、少なくとも1つのLNAを含むプライマーを指す。
本発明によって用いられる熱サイクリング増幅反応はまた、本明細書において「アニーリング温度識別PCR」又は「ATD PCR」とも呼ばれる。この方法は、(1)プライマー−フラグメント相互作用のアニーリング温度を人為的に上昇させ、(2)プライマー−フラグメント複合体の形成を促進するが(図6;c1参照)、より低い温度で起こるフラグメント−フラグメント複合体に対して区別する(図6;c2参照)ようにPCRアニーリング温度を設定することによってクロスフラグメントハイブリダイゼーションを排除する。クロスハイブリダイゼーションに対して区別するために、プライマー−フラグメントアニーリング温度は、フラグメント−フラグメントアニーリング温度よりも高い(例えば、少なくとも5℃)(すなわち、ΔATは少なくとも5℃である)。これは、少なくとも1つのロックド核酸(LNA)モノマーをフォワード及び/又はリバースプライマー、好ましくはフォワード及びリバースプライマーの両方に組み込むことによって達成される。
したがって、アニーリング温度が上昇すると、標的フラグメント中の相補的又はほぼ相補的な配列間の相互作用(すなわち、フラグメント−フラグメント相互作用)の親和性が低下する。したがって、ATD PCRのより高いアニーリング温度は、(1)共通プライマー配列及び/又は(2)共通記号配列間のクロスフラグメント相互作用を排除するために熱サイクルアニーリング温度を十分に高く設定することを可能にする選択条件として使用できる。
したがって、ATD PCRは、少なくとも1つのLNAを含む第1及び第2のプライマーの使用を含み、ここで、LNAプライマー−フラグメント複合体の形成を可能にするが、そうでなければより低いアニーリング温度で起こるであろうフラグメント−フラグメント複合体のその形成に対しては区別するようにアニーリン段階の温度が上昇する。熱サイクリング反応のアニーリング温度を上昇させることにより、ATD PCRは、少なくとも1つのLNAを含まない核酸配列(例えば、フラグメント−フラグメント複合体)のアニーリングが実質的にないことを確実にしながら、LNAプライマー− ラグメント複合体の形成を可能にする。一実施形態では、標的核酸配列の第1のプライマー部位と第2のプライマー部位との間に実質的に核酸のアニーリングが起こらないように、アニーリング段階の温度を上げる。
本明細書中で使用される場合、語句「実質的にアニーリングしない」とは、例えばゲル電気泳動及び臭化エチジウムで標識することによって検出可能な増幅産物を生成するのに不十分であろうレベルのアニーリングをいう。したがって、「少なくとも1つのLNAを含まない核酸配列の実質的にアニーリングしない」という句は、検出可能な増幅産物の少なくとも90%、少なくとも95%、又は好ましくは少なくとも99%が、少なくとも1つのLNAを含む核酸配列アニーリングの結果であることを意味する。
第1及び第2のプライマーのそれぞれにおけるLNAの数は、少なくとも1つのLNAを含まない核酸配列のアニーリングが実質的に存在しない高温で(すなわち、フラグメント−フラグメントのクロスハイブリダイゼーションを区別する温度で)、標的核酸配列の対応するプライマー部位へのプライマーのアニーリングを可能にするようなものであるべきである。
本明細書に開示される実施形態では、第1又は第2のプライマー中のLNAの数は、アニーリング段階の間に、LNAの非存在下で第1及び/又は第2のプライマーがそれらのそれぞれのプライマー部位にハイブリダイズするであろう温度よりも少なくとも5℃高い温度で(すなわち、少なくとも1つのLNAを含まない核酸配列がアニーリングする温度よりも少なくとも5℃高い温度で)、プライマーがそれらのそれぞれのプライマー部位にハイブリダイズすることを可能にするように選択される。一実施形態では、アニーリング温度は、LNAの非存在下で第1及び/又は第2のプライマーがそれらのそれぞれのプライマー部位にハイブリダイズするであろう温度よりも少なくとも6℃高く、好ましくは少なくとも7℃高く、好ましくは少なくとも8℃高く、好ましくは少なくとも9℃高く、より好ましくは少なくとも10℃高い、又は5℃〜10℃高い。すなわち、少なくとも1つのLNAを含まない核酸配列がアニーリングする温度よりも高い。
当業者は、PCRなどの熱環式増幅反応の最適又は最適に近いアニーリング温度がプライマーの長さ及び組成に大きく依存することを理解する。一実施形態では、アニーリング段階中に使用される温度は、約50℃〜72℃の間である。別の実施形態では、アニーリング段階中に使用される温度は、約65℃〜72℃の間である。他の実施形態では、アニーリング段階中に使用される温度は、約67℃〜72℃の間である。別の実施形態では、アニーリング段階中に使用される温度は、約67℃〜69℃の間である。
本明細書に開示される実施形態では、第1及び/又は第2のプライマーはそれぞれ1〜14個のLNAを含む。一実施形態では、第1のプライマーは1〜8個の間のLNAを含む。一実施形態では、第1のプライマーは2〜10個のLNAを含む。一実施形態では、第1のプライマーは2〜8個のLNAを含む。好ましい態様において、第1のプライマーは3〜7個のLNAを含む。一実施形態では、第1のプライマーは、少なくとも1個のLNA、少なくとも2個のLNA、少なくとも3個のLNA、少なくとも4個のLNA、少なくとも5個のLNA、少なくとも6個のLNA、少なくとも7個のLNA、少なくとも8個のLNA、少なくとも9個のLNA、少なくとも10個のLNA、少なくとも11個のLNA、少なくとも12個のLNA、少なくとも13個のLNA、又は少なくとも14個のLNAを含む。一実施形態では、第2のプライマーは1〜8個のLNAを含む。一実施形態では、第2のプライマーは2〜10個のLNAを含む。一実施形態では、第2のプライマーは2〜8個のLNAを含む。好ましい態様において、第2のプライマーは3〜7個のLNAを含む。一実施形態では、第2のプライマーは、少なくとも1個のLNA、少なくとも2個のLNA、少なくとも3個のLNA、少なくとも4個のLNA、少なくとも5個のLNA、少なくとも6個のLNA、少なくとも7個のLNA、少なくとも8個のLNA、少なくとも9個のLNA、少なくとも10個のLNA、少なくとも11個のLNA、少なくとも12個のLNA、少なくとも13個のLNA、又は少なくとも14個のLNAを含む。
一実施形態では、第1及び第2のプライマーは同数のLNAを含む。しかしながら、第1及び第2のプライマーが同数のLNAを含むこと、及び第1及び第2のプライマーが異なる数のLNAを含む場合に本明細書に開示された方法を実施できることの要件はないことを理解されたい。典型的な例として、第1のプライマーは1個のLNAを含み、第2のプライマーは2個のLNAを含み;第1のプライマーは2個のLNAを含み、第2のプライマーは1個のLNAを含み;第1のプライマーは1個のLNAを含み、第2のプライマーは3個のLNAを含み;第1のプライマーは3個のLNAを含み、第2のプライマーは1個のLNAを含み;第1のプライマーは4個のLNAを含み、第2のプライマーは2個のLNAを含み;第1のプライマーは4個のLNAを含み、第2のプライマーは1個のLNAを含む、などである。
LNAは、任意の適切な位置で第1及び第2のプライマーに組み込まれてもよい。一実施形態では、第1のプライマー及び/又は第2のプライマーは少なくとも1対の隣接するLNAを含む。一実施形態では、LNAの少なくとも1対の隣接するLNAはアデニン(A)又はチミン(T)である。
第1のプライマー及び第2のプライマーへの少なくとも1つのLNAの組み込みは、それぞれ第1及び第2のプライマー部位に特異的にアニールするのに必要とされるプライマーの長さを減少させるというさらなる利点を有する。従来の核酸プライマーは、生化学的制限のため、一般的には20〜30bpの間に制限される。しかしながら、LNA−プライマーは、第1及び第2のプライマー部位の相補鎖にハイブリダイズする(すなわち、アニールする)それらの能力を実質的に減少させることなく、5〜15ヌクレオチド長に減少させることができる。
一実施形態では、第1及び第2のプライマーはそれぞれ、5〜30個のヌクレオチドを含む。他の実施形態では、第1及び第2のプライマーはそれぞれ、8〜20個のヌクレオチドを含む。別の実施形態では、第1及び第2のプライマーはそれぞれ、5〜10個のヌクレオチドを含む。一実施形態では、第1及び/又は第2のプライマーは、配列番号61〜68から選択される核酸配列を含む。
タガント層状化
本明細書の他の箇所で述べたように、本発明はタガント層状化に特に適している。すなわち、熱サイクリング増幅のアニーリング段階中の異なる標的配列間のフラグメント−フラグメントクロスハイブリダイゼーションの可能性を回避又は最小化するため、それらの混合物中の複数の標的核酸配列を識別することに適している。これは、コードワード中に共通の記号配列を含み得る可変領域に隣接する共通のプライマー配列を有する標的核酸配列の増幅に関する、本明細書中に開示される発明にとって特に重要である。
したがって、本明細書に開示される別の態様では、2つ以上の標的核酸配列のそれぞれが第1のプライマー及び第2のプライマー部位に隣接している、それらの混合物中の2つ以上の標的核酸配列の高忠実度増幅法が提供される。ここで、増幅は、融解段階、アニーリング段階及び伸長段階を伴う熱サイクリングを含み、この方法は、第1のプライマー部位のそれぞれに相補的な第1のプライマー及び第2のプライマー部位のそれぞれに相補的な第2のプライマーを使用することを含む。ここで、第1及び第2のプライマーのそれぞれが少なくとも1つのロックド核酸(LNA)を含み、アニーリング段階中に、それぞれ第1及び第2のプライマー部位に対する第1及び第2のプライマーのアニーリング以外の核酸配列のアニーリングが実質的にないように熱サイクリングのアニーリング段階中に高温が使用される。
本明細書に開示される別の態様では、それらの混合物中の2つ以上の標的核酸配列の高忠実度増幅のための方法が提供され、ここで、増幅は、融解段階、アニーリング段階及び伸長段階を含む熱サイクリングを含み、該方法は、第1のプライマー部位のそれぞれに相補的な第1のプライマー、及び第2のプライマー部位のそれぞれに相補的な第2のプライマーを用いることを含み、ここで、第1及び第2のプライマーのそれぞれが少なくとも1つのロックド核酸(LNA)を含み、アニーリング段階中に、それぞれ第1及び第2のプライマー部位に対する第1及び第2のプライマーのアニーリング以外の核酸配列のアニーリングが実質的にないように熱サイクリングのアニーリング段階中に高温が使用され、
ここで、以下のうちの1つ以上又はすべてが適用する:
i)2つ以上の標的核酸配列が単一の熱サイクリング反応で増幅される;
ii)2つ以上の標的核酸配列が非生物学的情報をコードする;又は
iii)2つ以上の標的核酸のそれぞれは、共通の第1のプライマー部位及び共通の第2のプライマー部位に隣接している。
一実施形態において、本明細書に記載の方法は、第1及び第2のプライマー部位とは異なる、第3のプライマー部位及び第4のプライマー部位に隣接するさらなる2つ以上の標的核酸配列の高忠実度増幅をさらに含む。
用語「タガント層状化」は、本明細書において、各エレメントの真正性又は同一性が、組み合わされた物質から確立され得るように、異なるタガントで物質のエレメント(すなわち生成物前駆体)を意図的にマーキングするプロセスを示すために使用される。例えば、医薬品の前駆体は、各前駆体の起源、製造日、製造者又は他の関連情報を識別するタガントでマークされてもよい。認証とは対照的に、識別は未知の物質の起源を確立することを目的とする。認証は、未知の物質が特定の原因であり、結果が「はい」又は「いいえ」であるという仮説を検証することを目的とする。例えば、認証では「この製造物はXですか?」という質問が表示され、「はい」又は「いいえ」が表示される。識別は、「これはどんな製造物ですか?」という質問に対して、「これは、製造物X、Y又はZである」と答える。
例えば、弾薬は、タガントサインがユーザー、銃、ケーシング、弾丸のエントリーポイント及び弾丸に残されるようにマークされてもよい。箇条書きに存在するタガントの従来の知識がなくても、部分集合を識別するために本明細書に開示される増幅方法を使用して、数百万又は数十億の可能な候補タガントのライブラリー全体を同時にスクリーニングすることができる。タガント階層化と識別の両方はともに、何十億ものタガントのライブラリーから未知のタガントの部分集合をスクリーニングしてデコードする能力を必要とする。
本明細書で使用されるとき、用語「階層化深さ」は、混合されデコード化され得る、定義済みタガントライブラリー内のタガントの部分集合のサイズを意味する。
本明細書で使用されるとき、用語「深層化」は、混合されデコード化され得る100以上の要素事項のマーキングを意味する。
本明細書中に開示された方法がタガント層化及び識別(すなわち、2つ以上の標的核酸配列の増幅)のために使用される場合、各タガントはそれ自体の一組の第1及び第2(フォワード及びリバース)のプライマー部位を含み得ることが理解される。したがって、一実施形態では、2つ以上の標的配列のうちの第1のものは第1のプライマー部位及び第2のプライマー部位に隣接し、2つ以上の標的配列のうちの第2のものは第3のプライマー部位及び第4のプライマー部位に隣接する、などである。
しかしながら、本明細書に開示されている方法は、クロスフラグメントハイブリダイゼーションを最小にするか、又は他の方法で回避しながら標的核酸配列の増幅を提供するため、ユニバーサルセットのプライマー(本明細書においてプライマー「キー」とも呼ぶ)を用いて、1回の増幅反応で数百万のフラグメントを「ロック解除」することができる。従来技術に対する利点は、情報記憶容量、情報デコード効率、及びタガントレイヤリング容量における桁違いの改善を含む。本明細書に開示された方法はまた、未知の部分集合のタグ付け対象を数十億のタグ付け対象の集団から識別することを可能にする。
2つ以上の標的核酸配列のうちの少なくとも2つが共通のフォワード又はリバースプライマー部位を共有してもよいこともまた理解されるべきである。典型的な例として、2つ以上の標的配列のうちの第1のものは第1のプライマー部位及び第2のプライマー部位に隣接し、2つ以上の標的配列のうちの第2のものは第1の標的配列の第1のプライマー部位及び第三のプライマー部位に隣接する。
本明細書に開示される実施形態では、2つ以上の標的核酸配列は、共通の第1のプライマー部位及び共通の第2のプライマー部位に隣接している。「共通」という用語は、本明細書において「普遍的」という用語と互換的に使用され、2つ以上の標的配列にわたる第1のプライマー部位及び第2のプライマー部位が同じ又は実質的に同じ核酸配列を有することを意味する。理想的には、第1の標的核酸配列の第1のプライマー部位(例えばフォワードプライマー部位)の配列は、第2の標的核酸配列の第1のプライマー部位の配列と同一である。しかしながら、本明細書に開示された方法は、プライマー部位が完全に(すなわち100%)同一ではなく、むしろ実質的に同一又は実質的に同一である場合にも実施できることを理解すべきである。用語「実質的に同じ」及び「実質的に同一」は、熱サイクリング反応のアニーリング段階の間、プライマーが第1及び第2の標的核酸配列の第1のプライマー部位にハイブリダイズすることを可能にする相補性の程度をなお保持しながら、第1の標的核酸配列の第1のプライマー部位(例えばフォワードプライマー部位)の配列は、第2の標的核酸配列の第1のプライマー部位の配列と1塩基以上(例えば1塩基、2塩基、3塩基、4塩基など)なることを意味する。
用語「実質的に同じ」及び「実質的に同一」は、熱サイクリング反応のアニーリング段階の間、プライマーが第1及び第2の標的核酸配列の第2のプライマー部位にハイブリダイズすることを可能にする相補性の程度をなお保持しながら、第1の標的核酸配列の第2のプライマー部位(例えばリバースプライマー部位)の配列は、第2の標的核酸配列の第2のプライマー部位の配列と1塩基以上(例えば1塩基、2塩基、3塩基、4塩基など)なることを意味する。
一実施形態において、2つ以上の標的核酸は共通の第1のプライマー部位に隣接される。一実施形態では、2つ以上の標的核酸は、共通の第2のプライマー部位に隣接している。好ましい実施形態では、2つ以上の標的核酸は、共通の第1のプライマー部位及び共通の第2のプライマー部位に隣接している。
共通の第1及び第2のプライマー部位の使用は、単一の熱サイクリング反応における複数のタガントの増幅を可能にする。したがって、一実施形態では、2つ以上の標的核酸配列は単一の熱サイクリング反応で増幅される。一実施形態では、1つ以下の第1のプライマー及び1つの第2のプライマーが使用される。したがって、追加のプライマー、試薬、又は熱サイクル条件を必要とせずに、核酸の増幅を単一工程で達成することができる。これは、深層アプリケーション、たとえば医薬品や化粧品業界のサプライチェーンの追跡に特に役立つ。何十億ものタグ付け剤を同時にスクリーニングする能力は、タグ付けされた生成物前駆体を単一の反応で最終生成物から混合し、デコード化することを可能にする。タガント層状化/混合の図を図1に示す。図1は最終製造物に組み合わされる7つのタグ付き製造物前駆体を示すが、本発明において層状化/混合することができるタガントの数に実際的制限はない。一実施形態では、製造業者は、一組の共通プライマー部位を使用して医薬品のクラス又はバッチを定義することができる。あるいは、異なる医薬品にわたって使用され得る個々の前駆体を規定するために、複数組の共通のプライマー部位を使用することが可能であり得る。
共通プライマー部位を使用することによって、本明細書に開示された方法は、各タガントライブラリーについて1対のプライマー「キー」を使用することによってタガント層形成及び識別の対決課題を解決する。これは、フラグメント−フラグメント相互作用を区別する新規な増幅プロトコルの開発、及び合成及びナノポア技術による配列決定の全能力を活用するタガントの設計を通して達成される。既存の技術に対して共通のプライマー部位及び1つのユニバーサルなプライマー「キー」のセット(本明細書ではUniKey−Tagシステムとも呼ばれる)を使用する利点は、利用可能なタガントライブラリーのサイズ、階層化容量、及び(反応数の観点から)ライブラリーのスクリーニングに使用される効率における桁違いの改善を含む。例えば、UniKey−Tag 1システムは、何十億ものタガントのライブラリーをスクリーニングするためにただ1つの反応しか必要としないのに対し、現在の最先端技術は、わずか数千のライブラリーをスクリーニングするために数百の反応を必要とする(US8,735,327)。
UniKey−Tagシステムが(数十億の)混合された不確実な起源の問題を追跡し識別するための能力は、例えば、違法及び偽造品、医薬品前駆体、バンクノート、化粧品、電気製品、食材、衣類を含む広範囲の新しい用途を開く。本明細書の他の箇所に記載されているように、追跡可能な化学的サインが使用者、銃、使用済みカートリッジケース、弾丸進入点及び発砲後の弾丸から回収可能であるように、UniKey−Taggantsは弾薬をマークすることに成功した。本出願では、この技術は、違法で闇市場での武器譲渡を追跡し、武器禁輸違反を検出し、備蓄管理の弱点を露呈し、3Dプリントされたモジュール式の武器を追跡し、違法な野生生物取引に関与するグループを特定し、法医学的能力を高め、そして銃犯罪の抑止力としてび明確な利益をもたらす。
タガントレイヤリングの目的は、タガントのライブラリー全体から未知のタガントの部分集合を識別することである。層を重ねる深さを増すことは、例えば、製造物前駆体追跡及び規制又は闇市場商品識別を含むように用途の範囲を拡大することができる。一実施形態では、2つ以上の標的核酸配列は医薬品又はその前駆体から回収される。一実施形態では、2つ以上の標的核酸配列は、銃器、弾薬、発射体、銃器の残留物、ならびに2つ以上の標的核酸配列が適用される銃器、弾薬及び/又は発射体と接触した表面からなる群から選択される製造物から回収される。
識別
一実施形態において、本明細書に開示される方法は、増幅された標的核酸配列を検出又は識別する工程をさらに含む。増幅された標的核酸配列を検出又は識別する適切な方法は、当業者にはよく知られており、その具体例としては、配列決定(UniKey−Tag 1)及びフラグメントサイズ識別(UniKey−Tag 2)が挙げられる。増幅産物をアガロース又はポリアクリルアミドゲルに通し、アンプリコンを臭化エチジウムなどの適切な検出可能な標識で標識する。
本明細書に開示されている方法が、2つ以上の標的核酸配列を識別するために、例えばそれらの混合物中で使用される場合、識別工程は2つ以上の標的配列を識別するのに十分である必要がある。例えば、2つ以上の標的核酸配列のそれぞれは異なる核酸配列を有してもよく、それによって増幅された標的を配列決定によって識別することが可能になる。したがって、一実施形態では、本明細書に開示される方法は、増幅された2つ以上の標的核酸配列を配列決定によって識別する工程をさらに含む。あるいは、又はさらに、2つ以上の標的核酸配列のそれぞれは異なる長さを有することができ、増幅された標的をサイズ識別によって識別することを可能にする。したがって、一実施形態では、2つ以上の標的核酸配列のそれぞれは異なる長さを有する。一実施形態において、本明細書に開示される方法は、サイズ分離によって増幅された2つ以上の標的核酸配列を識別する工程をさらに含む。
本明細書で使用される「識別」という用語は、典型的には、本明細書で開示されている方法に従って配列の増幅後に標的核酸配列の同一性を決定することを意味する。これは、「認証」とは対照的であり、典型的には、既知のタガント又は一群の既知のタガントの存在について試験することを意味する。タガントは、スクリーニング及びデコード化前に既知の核酸配列を含む。
増幅産物の識別は、当業者に公知の任意の適切な手段によって達成され得る。
実例として、検出可能な標識を含むヌクレオチドは、熱サイクリング反応の伸長段階の間にアンプリコンに組み込まれてもよく、その結果、検出可能な標識の存在に基づいてアンプリコンが検出され得る。適切な検出可能な標識は当業者によく知られており、その具体例には放射性同位体、フルオロフォア及びビオチンが含まれる。別の実施形態では、標的核酸配列はフラグメントの大きさに基づいて識別される。例えば、増幅後、反応混合物を、場合により既知のサイズ(塩基対)のヌクレオチドマーカーと一緒にアガロースゲル電気泳動にかける。ヌクレオチド長に基づいて所定のサイズを有する標的アンプリコン、及びマーカーはアガロースゲルを通って移動し、続いて臭化エチジウムなどの検出可能な試薬で染色される。次に、標的核酸配列の存在は、隣接するマーカーと比較して決定されるように、標的核酸配列の長さに対応するサイズを有するアンプリコンの存在によって確認される。
あるいは、又はさらに、標的核酸配列の同一性は、増幅反応からのアンプリコンを配列決定し、標的配列と同じ配列を有するアンプリコンの存在を確認することによって決定される。アンプリコンを配列決定する適切な手段は当業者によく知られており、その具体例としては、サンガー配列決定、次世代の「合成による配列決定」及びナノ細孔配列決定が挙げられる。
本明細書に開示されている方法が2つ以上の標的核酸配列を増幅するために使用される場合、2つ以上のアンプリコンは配列決定及び/又はサイズによって識別され得る。一実施形態において、本明細書に開示される方法が2つ以上の標的核酸配列を増幅するために使用される場合、各標的核酸配列は異なる長さを有する。したがって、2つ以上の標的配列の存在はサイズ(例えば、アガロースゲル電気泳動)によって決定され得る。別の実施形態において、本明細書に開示される方法が2つ以上の標的核酸配列を増幅するために使用される場合、各標的核酸配列は、各標的配列が同じ長さを有するか否かにかかわらず異なる配列を有する。したがって、2つ以上の標的配列の存在は、サイズ(例えば、アガロースゲル電気泳動)又は配列によって決定され得る。
サイズによるフラグメント識別(UniKey−Tag 2)の場合、標的配列の存在及び長さは起源を示す(例えば、図11参照)。例えば、ATD PCR産物の存在は(特定のプライマー対についての)記号タイプを示し、サンプル中に観察されるフラグメント長はコードワードストリング中の記号の位置を示す。したがって、標的配列長によるタガントのデコード化に必要とされる増幅スクリーニング反応の数は、使用される文字セットのサイズs(すなわち、記号の数/アルファベット中の「文字」)に等しい。これは、アルファベットの各文字が、クロスフラグメントハイブリダイゼーションなしで単一の反応で増幅される固有のプライマーセットで識別されるためである。そのようにして、各追加文字は、100bp未満のフラグメントに対するポリアクリルアミド又はアガロースゲルのフラグメント長分離分解能によって定義されるように、最大30の増分で層の深さを増加させ、デコード化するための追加のスクリーニング反応を1回だけ必要とする。
タガントライブラリー及びキット
本明細書の他の箇所で述べたように、本明細書に記載の核酸タグを用いた製造物のタグ付けは、タガントが適用、付着、又は他の方法で組み込まれている製造物を識別、認証、追跡及び追跡する有効な手段となり得る。核酸タグはその製造中に製造物に付着、適用又は他の方法で組み込むことができるが、製造後に製造物に核酸タグを付着、適用又はその他の方法で組み込むことがより便利であり得る。したがって、本開示は、その製造中又は製造後に製造物に付着、適用又は他の方法で組み込むことができる2つ以上の核酸タグのライブラリーに及ぶ。したがって、単一の核酸タグ又は複数の核酸タグをライブラリーから選択して適用するか、又は他の方法で製造物に組み込むことができる。
したがって、本明細書に開示される別の態様では、2つ以上の核酸タグのそれぞれが共通の第1のプライマー部位及び共通の第2のプライマー部位に隣接する、2つ以上の核酸タグのライブラリーが提供される。本明細書の他の箇所に記載されているように、共通の第1及び第2のプライマー部位の使用は、単一の熱サイクリング反応における複数のタガントの増幅を可能にする。一実施形態では、2つ以上の核酸タグのそれぞれは、ライブラリー中の他のタグと比べて異なる核酸配列を有する。
本明細書に開示される別の態様において、第1の成分及び第2の成分を含むキットが提供され、ここで第1の成分は2つ以上の核酸タグのライブラリーを含み、2つ以上の核酸タグの各々は隣接する。第2の成分は、第1のプライマー部位に相補的な第1のプライマー及び第2のプライマー部位に相補的な第2のプライマーを含み、第1及び第2のプライマーはそれぞれ少なくとも1つのロックド核酸(LNA)を含む。一実施形態では、2つ以上の核酸タグのそれぞれは、ライブラリー中の他のタグと比べて異なる核酸配列を有する。
一実施形態では、ライブラリーは、配列番号1〜60から選択される1つ又は複数の核酸配列を含む。
一実施形態では、2つ以上の核酸配列は、本明細書に記載されるように非生物学的情報をコードする。別の実施形態では、本明細書に記載されるように、第1及び第2のプライマーのそれぞれは1から14の間のLNAを含む。一実施形態では、第1及び第2のプライマーのそれぞれは、1〜8個のLNAを含む。一実施形態では、第1及び第2のプライマーのそれぞれは、2〜10個のLNAを含む。一実施形態では、第1及び第2のプライマーのそれぞれは、2〜8個のLNAを含む。好ましい態様において、第1及び第2のプライマーのそれぞれは、3〜7のLNAを含む。さらに別の態様において、第1及び第2のプライマーのそれぞれは、アデニン及びチミンLNAの少なくとも1つの隣接する対を含む。
一実施形態では、第1及び/又は第2のプライマーは、配列番号61〜68から選択される核酸配列を含む。
一実施形態では、キットは、本明細書に記載される方法に従って2つ以上の核酸タグを高忠実度で増幅するための説明書をさらに含む。
別の実施形態では、キットは、本明細書に記載の固定剤を含んでもよい、2つ以上の核酸タグのライブラリーで製造物をタグ付けするための試薬をさらに含む。
一実施形態では、キットは、2つ以上の標的核酸配列が適用される銃器、弾薬及び発射体からなる群から選択される製造物をさらに含む。一実施形態では、キットは、2つ以上の標的核酸配列が適用される医薬品又はその前駆体をさらに含む。
別の実施形態において、キットは、本明細書に記載される方法に従って2つ以上の核酸タグを高忠実度に増幅するための試薬、例えばDNA(例えば、Taq)ポリメラーゼ、緩衝液及びヌクレオチド塩基をさらに含む。
キットの第1及び第2の成分は、典型的には別々の容器又は包装で提供される。しかしながら、いくつかの実施形態では、ライブラリーからの1つ又は複数の核酸タグはすでに適用されているか、付着しているか、そうでなければ製造物に組み込まれている。例えば、2つ以上の核酸タグのライブラリーは、銃器、弾薬及び発射体からなる群から選択される製造物に適用、付着又は他の方法で組み込まれる。
追跡
本明細書の他の箇所で述べたように、本明細書に記載の核酸タグを用いた製造物又は物品の分子タグ付けは、タガントが適用、付着又は他の方法で組み込まれた製造物及び物品を識別、認証、追跡及び追跡する有効な手段であり得る。したがって、本明細書に開示されている別の態様では、製造物をその起源まで追跡する方法が提供される。該方法は、以下を含む:
(a)少なくとも1つの核酸配列が組み込まれている製造物を提供する。ここで、少なくとも1つの核酸配列は、第1のプライマー部位と第2のプライマー部位に隣接している。
(b)必要に応じて、製造物から少なくとも1つの核酸配列を回収する;
(c)第1のプライマー部位に相補的な第1のプライマー及び第2のプライマー部位に相補的な第2のプライマーを用いた熱サイクリングを含む高忠実度増幅によって回収された少なくとも一つの核酸配列を増幅する。ここで、第1及び第2のプラモデルは各々、少なくとも1つのロックド核酸(LNA)を含み、熱サイクリングは、融解段階、アニーリング段階及び伸長段階を含み、高温が熱サイクリングのアニーリング段階の間に使用され、それにより、アニーリング段階の間に、それぞれ第1及び第2のプライマー部位に第1及び第2のプライマー以外に、核酸の実質的にアニーリングがない;
(d)工程(c)で増幅された少なくとも1つの核酸配列を識別する。ここで、工程(d)において識別された少なくとも1つの核酸配列の配列及び/又は長さは、製造物の起源を示す。
一実施形態では、製造物は、銃器、弾薬、発射体及び銃器の残余からなる群から選択される。一実施形態では、製造物は医薬品又はその前駆体である。一実施形態では、製造物は化粧品又はその前駆体である。
一実施形態では、少なくとも1つの核酸配列は製造物から回収される。したがって、一実施形態では、ステップ(b)が実行される。
一実施形態では、ステップ(c)のアニーリング段階中に使用される温度は、少なくとも1つのLNAを含まない核酸配列のアニーリングが実質的にないようなものである。別の実施形態では、工程(c)のアニーリング段階中に使用される温度は、第1及び第2のプライマー以外の核酸配列がアニーリングする温度よりも少なくとも5℃高い。一実施形態では、工程(c)のアニーリング段階中に使用される温度は、第1及び第2のプライマー以外の核酸配列がアニーリングする温度よりも少なくとも10℃高い。一実施形態では、アニーリング段階中に使用される温度は、約50℃から72℃の間である。他の実施形態では、アニーリング段階中に使用される温度は、約67℃〜72℃の間である。
一実施形態では、第1及び第2のプライマーのそれぞれは、1〜8の間、又は1〜14の間のLNAを含む。好ましい態様において、第1及び第2のプライマーは3〜7のLNAを含む。一実施形態では、第1及び第2のプライマーのそれぞれは、少なくとも1対の隣接するLNAを含む。一実施形態では、LNAの隣接対の少なくとも1つはアデニン(A)又はチミン(T)である。
一実施形態では、この方法は、2つ以上の核酸配列を回収、増幅及び識別することを含む。一実施形態では、2つ以上の核酸配列のそれぞれは、共通の第1のプライマー部位に隣接している。一実施形態では、2つ以上の核酸配列のそれぞれは、共通の第2のプライマー部位に隣接している。一実施形態では、2つ以上のオリゴヌクレオチドタガントのそれぞれは異なる核酸配列を有する。一実施形態では、ステップ(d)は、配列決定によって増幅された2つ以上の核酸配列を識別することを含む。
別の実施形態では、2つ以上の核酸配列のそれぞれは異なる長さを有する。一実施形態では、ステップ(d)は、サイズ分離によって増幅された2つ以上の核酸配列を識別することを含む。一実施形態では、2つ以上の核酸配列のそれぞれは、非生物学的情報をコードする。
本明細書の他の場所に記載されるように、本明細書に開示される方法及び核酸タグは、違法銃器の追跡、武器禁輸違反の検出、備蓄管理の弱点の露出、3Dプリント及びモジュール式武器の追跡、及び違法野生生物取引に関与するグループの識別に使用できる。例えば、核酸タグを弾薬カートリッジの表面に適用、付着、又は他の方法で組み込んで、タグをユーザー、銃器、カートリッジケース、弾丸及び/又は弾丸エントリーポイントに結び付ける切れ目のない一連の識別を提供することができる。代表的な例は、本明細書に開示の実施例に示されている。例えば、1つ以上の核酸タグを弾薬又は銃器に適用して、例えばユーザー、銃、ケーシング、弾丸(発射体)、銃器の残余物及び/又は発射体のエントリーポイントにタガントサインを残すことができる。弾丸上に存在するタグについての従来の知識がなくても、可能性のある候補タグのライブラリー全体をスクリーニングして、存在するタグ又はタグの部分集合を識別することができる。共通のプライマー部位が使用される場合、可能性のある候補タガントの全ライブラリーは、本明細書中に開示される方法に従って、存在するタグ又はタグの部分集合を識別するためにフォワード及びリザーブプライマーの共通セットと同時にスクリーニングされ得る。
したがって、本明細書に開示される方法の一実施形態では、標的核酸配列は、銃器、弾薬、発射体、銃器残渣、銃弾、及び標的核酸配列が適用される銃器、弾薬及び/又は発射体と接触されるようになる表面からなる群から選択される製造物から回収される。別の実施形態では、標的核酸配列は銃器から発射された発射体のエントリーポイントの表面から回収される。
本明細書に開示されたタガント識別及びデコード化システムは、ライブラリーのサイズ、回復効率、及び階層化の深さに関して、既存の技術よりも桁違いに改善されている。既存のタガント識別及びデコード化システムと比較して、本明細書に開示された方法は、以下の分野のうちの1つ以上において重要な利点を提供する:
●範囲、タガントライブラリーの規模:数十億(無制限)対数千;
●範囲、タガントレイヤリング容量:数百万対約。20;
●効率的なデコード反応が必要である:1対約300;
●合成DNAタガントを使用してさらに効率を向上させることはできない:デコードする1つの反応、DNAの最小不可分単位であるヌクレオチド配列でエンコードされた情報;
●過去10年間でムーアの法則をはるかに超えた、次世代シーケンシング技術の急速な学習曲線を活用する;
●アプリケーション:識別、深い階層化、認証。混合起源及び不確実起源の物質を追跡する能力;
●新規深層アプリケーション:サプライチェーンモニタリング(追跡)、製薬前駆体追跡、弾薬追跡、偽造品の識別。
当業者は、本明細書に記載された発明が具体的に記載されたもの以外の変形及び修正を受けやすいことを理解するであろう。本発明は、その精神及び範囲内にあるすべてのそのような変形形態及び修正形態を含むことも理解されたい。本発明はまた、本明細書において個々に又はまとめて参照又は示されるすべてのステップ、特徴、組成物及び化合物、ならびに任意の2つ以上の上記ステップ又は特徴の任意の又はすべての組合せを含む。
他に定義されない限り、本明細書中で使用される全ての技術的及び科学的用語は、本発明が属する分野の当業者によって一般的に理解されるのと同じ意味を有する。
本発明の特定の実施形態の態様は、以下の非限定的な実施例を参照することによってさらに説明される。
実施例1:シリーズ1実験(9mm拳銃)のための分子タガント設計及び調製
本明細書に記載のシリーズ1実験について、一本鎖DNAオリゴヌクレオチド(ssDNA)をSigma−Aldrichによって合成し、高速液体クロマトグラフィー(HPLC)を用いて精製した。製造施設でのクロスコンタミネーションを防ぐために、製造は複数の異なる場所にまたがって数週間にわたって行われた。ssDNAオリゴヌクレオチドは、5’及び3’末端キャッピング領域(3bp)、ユニバーサルフォワード及びリバースプライマー部位(20bp)、ならびに可変長のコードワード領域(14、20、24、28、32bp)を用いて設計された。
合計で40個の相補的ssDNAオリゴヌクレオチドを発注し、続いてアニールして20個のdsDNAタガント二重鎖を形成した(表1のオリゴタグ Ser1からオリゴタグ 20 Ser1)。これらの20個のタガントは、以下の長さ:80、76、70、66及び60bpのそれぞれ4つを含み、そのため識別はフラグメント長分離によって実施することができた(UniKey−Tag 2)。シリーズ1の実験で使用されたタガントライブラリーは、各タガントの可変領域(表1のオリゴタグ Ser1からオリゴタグ 20 Ser1)が、ライブラリーにおいて他のすべてのタガントから可変領域の長さの少なくとも50%の相互距離で分離されるように設計された。
シリーズ1の実験で使用したタガントの設計及び仕様を表1に示す。本明細書で使用した命名法は、オリゴタグ 1(タグ 1)T/C(それぞれ鋳型/相補鎖) Ser1(実験シリーズ)である。表1において、キャッピング領域をイタリック体で示し、プライマー部位を標準テキストで示し、コードワード配列を太字で角括弧で囲む。
表1.シリーズ1の実験で使用されたフラグメント配列と仕様(9mm拳銃弾薬フィンガープリント)。
表2は、表1中のすべてのシリーズ1タガントのテンプレート(T)と相補鎖(C)との間のフラグメント−フラグメント相互作用のギブス自由エネルギー(ΔG)マトリックスを組み合わせて示す。反応のギブス自由エネルギーは、エンタルピーの変化から温度とエントロピーの変化の積を引いたものである。ΔGが負であるほど、クロスフラグメントハイブリダイゼーションへの傾向が大きくなり、アニーリング温度が高くなる。完全な相補性を有する長さ60〜80bpのdsDNAタガント二本鎖のΔGは、−104.1〜−144.4kcal/molの範囲である(表2に太字で示す)。鋳型と同じタガントの相補鎖との間の結合はPCR効率を低下させるが、完全な相補性は鎖伸長をもたらさないため、これは問題ではない。
表2はまた、20個のタガントのクロスフラグメント相互作用のΔGが−44.5〜−37.9kcal/molの範囲であることを示している。この範囲は、共通のフォワード及びリバースプライマー部位を共有する60〜80bpのオリゴヌクレオチドフラグメントに典型的であるが、従来のプライマー−タガント結合が−32.7kcal/molのより少ない負のΔGで生じるため、また問題がある。設計仕様は、一般的に、自己二量体、ヘアピン、及びヘテロ二量体形成は、−9kcal/molよりも弱い(すなわち、より陰性が低い)ことを推奨している。ブラウン運動によるこれらの短い60〜80bpフラグメントの拡散性もプライマーのそれと同様であり、これはクロスフラグメントプライミング及び溶液中でのハイブリダイゼーションの可能性を増大させる。表2に示されたΔG値に基づいて、表1の混合集団タガントの従来のPCR増幅中に広範囲のクロスフラグメントハイブリダイゼーションが予測され観察される。これは図12及び図13に示されている。共通のプライマー配列及びΔG≧−9kcal/mol(すなわち、より陰性が低い)を有する60〜100bpのフラグメントを設計することは不可能であるため、本発明者は、LNAプライマー及びATD PCRを使用して、フラグメント−フラグメント相互作用と比較して、プライマー−フラグメント相互作用のΔGを減少させた(すなわち、より陰性)。
表2−一般的なフォワード及びリバースプライマー配列を有する一本鎖フラグメントの混合集団間の反応のギブス自由エネルギー(ΔG、kcal/mol)。
データは、一本鎖オリゴタグ 1−20 Ser1間のフラグメント−フラグメント相互作用のΔGを示す。略語は、テンプレート鎖(T)、相補鎖(C)を含む。
実施例2−シリーズ2実験用の分子タガント設計ン及び調製(0.22口径ライフル、0.207口径ライフル、及び医薬品標識)。
シリーズ2実験(0.22及び0.207口径ライフルの弾薬の追跡及び医薬品標識)において、タガントはUniKey−Tag実施形態1に従って同様に設計された。具体的には、タガントは、エンドキャッピング領域なく(すなわち、0〜3bp)、ならびに長さ46bpの可変コード領域に隣接するユニバーサルフォワード及びリバースプライマー部位(22bp)を有するように設計された。シリーズ1実験と比較して1つの違いはあるが、それでもUniKey−タグの実施形態1と一致し、可変領域は6つのハミング(l,d,p)コード化ブロック(略してHam(l,d,p))から組み立てた。
具体的には、シリーズ2実験におけるタガントの可変領域は、d=4データ及びp=4パリティヌクレオチドを含む、記号長l=8の6つのハミング(l,d,p)コード化クラム(バイナリバイトに相当)から構築された(すなわち、ハム(8,4,4)コード)。シリーズ2のコードワードを構成するために使用されたハム(8,4,4)クラムのライブラリーを表3に与え、コードワード集合のプロセスは図15に示す。この場合、垂直ブロックは、n長のコードワードを含むクラムストリングにおける各l長の4次クラムにおけるデータ位置とパリティヌクレオチドを示す。ヌクレオチドセットQ={A、C、G、T}は、数字セットQ={0、1、2、3}にマッピングされ、その結果、例えば、DNAデータ四重項TGTTは、四次数X4=3233をコードし、これは、10進数X10=239に等しい。Ham(8,4,4)クラムは、表3に示される0から255まで(すなわち、{0、1、2、…、255})の10進数をコードした256のクラムのライブラリーから選択された。表3の各クラムは、4ヌクレオチドの相互距離で隔てられている。
この設計では、可変領域は、別のデータベース上のコードワードに関連する情報を検索するために使用された6個の記号のストリングでコード化された。実際の状況では、この情報には、免許証番号、許可番号、購入場所の情報(弾薬指紋の場合)などの個人識別情報、又はバッチ番号、バーコード番号、製造日、有効期限、製造施設、製造業者、製品タイプなど(製品追跡用、すなわち医薬品)などがある。このn6−Ham(8,4,4)コード化設計は、各ユニバーサルプライマー部位コード化ライブラリーについて2.81×1014個の固有のタガント配列(s=256)を可能にし、これはほとんどの実用的用途にとって本質的に無制限である。
シリーズ2実験では、256個のクラムライブラリーから無作為に選択された6個のハム(8,4,4)クラムから10個のdsDNAタガントが構築された。これらのブロックは、表4に示される長さn=6のコードワードにアセンブルされた。これは、各タガントのコード領域が48bpの長さであることを意味した(すなわち、6×8=48bp)。
10セットの相補的ssDNAオリゴヌクレオチド(すなわち合計20個)をアニールして、10個のdsDNAタガント二本鎖(オリゴタグ Ser2からオリゴタグ 10 Ser2)を形成した。ssDNAオリゴヌクレオチドをSigma−Aldrichにより合成し、高速液体クロマトグラフィー(HPLC)を用いて精製した。製造施設でのクロスコンタミネーションを防ぐために、製造はいくつかの異なる場所で行われ、数週間にわたって行われた。
Ham(8,4,4)クラムライブラリーを表3に示す。シリーズ2実験に使用したHam(8,4,4)にコードされたタガントの配列及び仕様を表4に示す。シリーズ2実験は、弾薬の追跡(口径0.22及び0.207の銃器用)、及び医薬品の表示が含まれる。シリーズ2実験で使用したユニバーサルプライマー配列を表6に示す。
表3.シリーズ2実験で使用されたタガントをエンコードするために使用されるハミング(8,4,4)クラムライブラリー
表4.シリーズ2実験において使用されるフラグメント配列及び仕様
実施例3−塩基対コード化タガント(UniKey−Tag 1)の設計
UniKey−Tag 1システムでは、記号のセット(S)における各記号(L)は、核酸配列によってエンコード化され、コードワードはATD PCR及び配列決定によってデコードされる。
図8(a)に示されるUniKey−Tag 1システムでは、可変領域v内のヌクレオチドの配列を用いて、配列決定によって解読されるストリングnをコード化する。鋳型鎖について、フラグメント長k=100bpは、キャッピング領域ならびに5’及び3’末端(Cp、0〜3bp)、ユニバーサルフォワードプライマー部位(UPF、10〜30bp)、相補的ユニバーサルリバースプライマー部位(UPRc、10〜30bp)、及び可変領域(V x、20〜160bp)で構成される。コードワード内の文字は、核酸の集合{A、T、C、G、U}からなるが、より一般的には、集合{A、C、G、T}が使用される(すなわち、DNA中にUは存在しない)。コードワード内の各記号の長さは、l=1からv bpであう。図8(a)に示す例では、v=27bp及びl=3bpであり、長さn=文字のコードワードを許容する。
コードワードは、製品、アイテム、又はオブジェクトに関連付けられている情報を検索するために使用される英数字又は特殊文字の記号の文字列で構成され得る。この情報には、製品の種類、製造日、有効期限、製造施設、及びバッチ番号などが含まれ得る。使用されるコード化システムは、デコードの信頼性と情報密度との間の妥協点に依存している。最も単純な形では、各ヌクレオチドは、式:
UK1=v(ダイレクトエンコーディング用)
に従って、l=1bp及びn=vであるLの文字を直接コード化するために使用される。
各プライマー対について可能性のある固有のコードワードの最大データセットは、式によって与えられる。
これはすべての実用的な目的にとって本質的に無限である。例えば、s=4及びn=40の場合のみを考慮すると、W40=440≒1024個の固有のタガントワードである。文脈のために、この数は、世界中のすべての人に1000億以上の固有のタガントを提供するのに十分である。「*」は、可変領域長が異なる一連のタガントを表す。
しかしながら、配列決定及び合成の誤りは、各文字を単一のヌクレオチドでコード化することが望ましくない場合があることを意味する。デコード化の信頼性を高めるためには、制御された冗長性及び誤り訂正能力を組み込むことが必要であり得る。前述のように、信頼性はデータ密度とトレードオフの関係にある。制御された冗長性を有するDNAコード化システムの設計は、本発明の開示の範囲を超えているが、デジタルアーカイブ記憶用途のために異なるシステムが開発されてきた。これらのコードシステムは、情報をコード化するデータビットと、誤り検出及び訂正能力を可能にするパリティビットとを含む。冗長性が制御されたシステムの例には、ハミング、ハフマン、リードソロモン、レーベンシュタイン、差動、シングルパリティチェック、ゴールドマン、及びXORコード1〜8が含まれます。シリーズ2実験では、例えば、ハミング(8,4,4)コード化記号が使用された。これらの記号は、l=8のヌクレオチドを含み、これは、50%の冗長度を与える、4つがデータビットであり、4つがパリティビットである。4値コードの4つのデータビットは、s=4=256の異なる記号の生成を可能にする。長さn=6記号のコードワードの場合、Ham(8,4,4)4値コードを用いて生成され得る異なるコードワードの総数(すなわち、タガントライブラリサイズ)は、w=256=2.8×1014である。
コードワードの集合W*に対するユニバーサルプライマーシーケンスの使用は、W*内のフラグメントの任意の部分集合(Wu⊆W*)が、式:
に従って、1つの反応でスクリーニングされることを意味する。
そのため、UniKey−Tag 1システムでは、必要なスクリーニング反応の数はnとsの両方に依存しない。
UniKey−Tag 1について、ATD PCR産物は、サンガー配列決定、次世代の「合成による配列決定」、又は携帯可能なナノポア技術によって配列決定され得る。短い増幅産物の配列決定は、イルミナのプラットフォームを用いて日常的に行われ、ナノポア技術を用いたシリーズ1及び2の実験(すなわちオックスフォードナノポアプラットフォーム)においても実証された。合成による配列決定の場合、PCRによるアダプター配列ライゲーション(合成技術による配列決定に必要とされる)の過程で、調製サンプルからこれらのLNAが除去されるため、ATD PCR中の増幅産物へのLNAの取り込みは問題にならない(図9)。これは、配列決定用に調製された製造物中に従来のヌクレオチドのみを残す。したがって、UniKey−タグの回収及び増幅と既存のシーケンス技術との間に互換性の問題は予想されない。
ナノポア配列決定の場合、ATD PCR中のサンプルへのLNAの組み込みは、本明細書に開示されるシリーズ1及びシリーズ2の研究における配列決定誤差に寄与することは観察されなかった。
図10は、ATD PCRにおいて使用されるLNAプライマーの5’末端に特定のサンプルを識別するバーコード配列を組み込むことによって、多数のサンプルが一緒に配列決定及びデコード化され得ることを示す。これにより、複数のサンプルをまとめて並行して配列決定することが可能になり、それによってサンプリング、配列決定及びデコード効率が向上する。UniKey−Tag 1システムの場合、特定の産業(例えば、医薬)のために、固有の5’バーコード識別子配列を有するユニバーサルペアのプライマー対を使用して、複数の製品サンプルを並行して配列決定及びデコード化することができる。
UniKey−Tag 1システムのいくつかの利点は以下を含む。
1.識別と認証の両方の目的に適している;
2.各プライマー対に利用可能な何十億もの固有配列;
3.何十億という層になっている;及び
4.高いデコード効率。
実施例4−フラグメントサイズコード化したタガント(UniKey−Tag 2タガント)の設計
図8(b)及び図11のUniKey−Tag 2システム(フラグメント長コード化)では、集合S内の各Lは全長タガントによってコード化され、nはATD PCR及びフラグメント長分離によってコード化される。
図8(b)及び図11に示すUniKey−Tag 2システムでは、各タガントは、記号とコードワード文字列内のその記号の位置をコード化する。記号タイプを識別するために使用される集合S内の各Lに固有のプライマー対が割り当てられ、各タガントτの長さがコードワード文字列内の記号の位置を決定する。集合Lのサイズはコードワード長であり、次式に従ってvをゲル電気泳動の解像限界(f)で割ったもので決定される。
ポリアクリルアミドゲル電気泳動の最大フラグメントサイズ分解能が約2bpであり、最大タガント長100bp及び順方向及び逆方向プライマー長を20bpと仮定すると、nUK2(最大)=60/2=30である。同様に、特定の記号が占めることができる様々な位置の最大数は30である。
UniKey−Tag 2システムでは、コード化はフラグメントサイズ分離(例えばゲル電気泳動による)によって行われ、ここで特定のプライマー対についての産物の存在は記号タイプ、及び各産物バンドのサイズ(すなわち、移動距離)は次式に従って、コードワード内の各文字の位置を決定する。
UniKey−Tag 2システムに必要とされる増幅スクリーニング反応の数は、アルファベットサイズ、rUK2=sに等しい。これは、各セットLが、その特定の文字に固有の一対のLNAプライマーを用いて識別され、ATD PCRを用いた1つの反応においてクロスフラグメントハイブリダイゼーションなしに増幅されるためである。そのため、それぞれの追加の文字は30の増分で階層化の深さを増やし、デコードに追加のスクリーニング反応を1つだけ必要する。
図11(a)に示されるn8−s3 UniKey−Tag 2の例では、S={A、B、C}、ここで、LA={τA1、τA2、τA3}、LB={τB1、τB2、τB3}、及びLC={τC1、τC2、τC3、τC4、τC5}である。図11(b)は、これらのタガントを使用して商品にマークを付ける方法を示す。まず、各前駆体は特定のタガントτで印を付けられ、中間産物は同じ文字セットLの層状タガントを含む。間製品は組み合わされてアルファベットセットSのメンバーである層状タガントを含む最終製品を形成する。この例では、タガント層化は2つのレベル、L及びSで実行される。Sのセットは3つの異なる記号のみを含むため、すべてのタガント要素をデコード化するために3つの反応のみが必要とされる。
図11(c)は、UniKey−Tag 2タガントが、電気泳動ゲル上の各バンドの列(文字)及び行(位置)を単に記録することによってデコード化されることを示す。例えば、図11(a)の可変長タガントは、図11(c)の電気泳動ゲル図に示されるバンドを生成し、それはn8−s3コードワードL={1A、6A、7A};L={2B、4B、6B};L={2C、3C、5C、6C、8C}として容易にデコード化される。異なる文字の位置が重なること、すなわち{6A、6B、6C}が許容されることに留意されたい。タガントシステム2は、低レベルのタガント階層化が必要であり、シーケンス処理が利用できない製品認証アプリケーションに最も適している。見当たらない文字は、特定の前駆物質が存在しないか、又は製品が偽造品であることを示唆する。次に、前駆体を直接再試験して真正性を判定することができる。
また、図11に示すUniKey−Tag 2システムは、2次元コードワード(すなわち、2つの異なる文字がゲル上のサンプル位置を占めることができる)を効果的に生成し、それによって識別能力を大幅に拡大することができることに留意すべきである。例えば、サイズs=3文字のアルファベットと、30の異なるバンドを許容するゲル解像度限界とが、製造物を識別するために使用され得る3×230=3.2×10の異なる2D電気泳動ゲル画像を生成し得る。
米国特許第8,735,327号のような先行技術に対するUniKey−Tag 2システムのいくつかの利点は、以下を含む:
1.低コピー数の回復に役立つ:必要なサンプル数=s。
2.深い階層化可能:アルファベットS内の各記号は、(バンドの有無に基づいて)長さn=30の一次元コードワードをコードする。他の文字と組み合わせると、2次元電気泳動ゲルは効果的に2Dの「コードワード」を形成し、大幅に拡張した階層化能を可能にする。
3.デコードに効率的である:各記号Lを増幅するのに1つのATD PCR反応のみが必要であり、1記号当たり1つの電気泳動ゲルレーンのみが必要であり、二次元「コードワード」をデコードする。
実施例5−アニーリング温度識別(ATD)ポリメラーゼ連鎖反応(PCR)
ATD PCRプロトコルは、ロックド核酸(LNA)モノマーをユニバーサルフォワード(UFP)及びリバース(URP)プライマーに組み込むことによって、プライマーのアニーリング温度を人為的に上昇させることによりクロスハイブリダイゼーションを排除する。それ故、PCRアニーリング温度は、LNAプライマー−フラグメント複合体の形成を促進するが、より低い温度で起こり得るクロスハイブリダイゼーションに対して区別する温度に設定され得る。
LNAプライマーのアニーリング温度が、LNAモノマーを含まない同じ従来のプライマー配列よりも少なくとも5℃高いように、Exiqonによって提供されるオンラインツールを使用してLNAプライマーを設計した。LNAプライマーの自己二量体(UFP−UFP及びURP−URP)及びヘテロ二量体(UFP−URP)融解温度は、LNAプライマーアニーリング温度より少なくとも30℃低くなるように設計された。ここで、UFP及びURPは、それぞれユニバーサルフォワードプライマー及びユニバーサルリバースプライマーである。
増幅は、ポリアクリルアミドゲル電気泳動を使用して、LNA−プライマー、低コピー数のタガント回収及び短いフラグメント長の可視化に適応するように最適化されたダイレクトPCR(Thermo Scientific Phire動物組織ダイレクトPCRキット、F−140WH)によって実施した。
表1のオリゴヌクレオチドタガントOligoTag 1−20 Ser1を使用することによるPCRアニーリング温度識別の有効性は、図12〜14に示されている。写真は、ポリアクリルアミドゲル電気泳動を使用してフラグメントサイズによって分離されたPCR増幅産物を示す。明瞭な区別されるバンドは個々のフラグメントの複製を示し、ストライエーション及び塗抹標本は可変長産物の存在及びクロスフラグメントハイブリダイゼーションを示す。例えば、図12(a)は、65〜69℃のアニーリング温度(AT)範囲にわたってクロスタガントハイブリダイゼーションの証拠を示さないが、図12(b)は、アニーリング温度範囲49〜53℃(デザインATは53℃)で従来のプライマーを使用した同等物実験についての広範なタガント−タガントハイブリダイゼーションを示す。図13は、ATD PCRが可変長フラグメントのハイブリダイゼーションを、異なる熱サイクル時間間隔の下で妨げることを実証する。最後に、図14は、弾薬追跡の適用フィールドにおけるATD PCRの有効性を確認する(実施例6も参照)。
実施例6−弾薬散布タガントを介して銃器犯罪を追跡するためのUniKey−Tag技術(識別)
UniKey−Tagシステムを使用して、識別情報を合成オリゴヌクレオチドにコード化し、続いてこれを固定溶液中に保存し、弾薬カートリッジの表面上に堆積させた。タガント増幅に必要な下流の酵素プロセスを阻害することなく、高温、高圧、紫外線(UV)及びヌクレアーゼ活性から保護するために固定剤をスクリーニングした。UniKey−Tagシステムは、0.22口径の銃器(衝撃エネルギー、E=420J)、Browning 9mm拳銃(E=470J)及び0.270口径の銃器(E=3,660J)を用いて試験した。9mmの拳銃が選択された。これは、2014年に米国で5,562件の殺人事件で同様の銃が使用されたため、それぞれ銃関連殺害の68%、全殺人の47%に相当するためである。0.270銃器は、軍事用途で使用される同等の高衝撃エネルギーアサルトライフルで本プロトコルを実証するために選ばれた。標識された弾薬は、ヒト組織の類似物として、Sus scrofa domesticus(スーパーマーケットの豚の腹)の腹側部分からなる標的で発射され、破片の回収は5つのポイントでテストされた:射手の手、銃器、カートリッジケース、弾丸の入り口、そして弾丸を回収した。結果は、ラベル付き弾薬を射手、銃、ケース、回収された弾丸、及び弾丸のエントリーポイントに結びつけるすべての銃に対してほぼすべての試験で破壊のない一連の識別が確立されたことを示す(図16、17、19〜22参照)。これら5つの回収ポイントのうちいずれか1つは、疑わしい識別に十分なものである。この技術は、違法で闇市場での武器譲渡の追跡、武器禁輸違反の検出、備蓄管理の弱点の露出、3Dプリント及びモジュール式武器の追跡、そして違法な野生生物取引に関与する集団の特定に明確な応用がある。
モジュール式、ポリマー製、及び3次元(3D)プリントガンの出現は、銃器の追跡及び登録に新たな課題をもたらした。完全なモジュール方式により、ユーザーは武器の口径の変更を含む、異なる運用上のニーズを満たすために、同じ又は関連するモデルのパーツから銃を再構成することができる。軽量のポリマーフレームの銃器は、改ざん防止用のシリアル番号や製造後の輸入スタンプでマーキングするのが難しく、従来のスクリーニング技術による検出を回避する可能性がある。3Dプリンティングの進歩はプロの銃器製造業者に明らかな利益をもたらすが、この技術はすぐに個人や犯罪組織が銃器を自宅で製造することを可能にするかもしれないというかなりの不安がある。一部の国では、3D銃の販売を制限又は禁止する法律が最近導入されたにもかかわらず、オンラインの違法市場及びファイル共有Webサイトでは、銃と計画の両方が自由に利用可能である。
銃器の登録及び追跡能力が銃器技術の進歩に遅れを取っているという懸念は、多数の報告書及び国際武器及び弾薬取引を監視するイニシアチブによって強調されてきた。これらの課題に取り組む一つの方法は、弾薬を使用時に散在する識別可能な分子「バーコード」でマークすることである。そのようなシステムは、理想的には、銃器、使用者、弾丸及び犠牲者又は標的に壊れていない分子サインを残すだけでなく、銃器で以前に使用された弾薬の歴史を提供する。民間及び法執行機関の弾薬の登録は、法医学的調査を支援し、銃関連の犯罪に対する強力な抑止力を提供する可能性がある。タグ付き弾薬はまた、違法で闇市場での武器移転を追跡し、武器禁輸違反を検出し、備蓄管理の弱点を明らかにし、そして野生生物の違法取引に関与する集団を特定する能力を提供することができる。今までのところ、弾薬タギング技術への注意の欠如は、アプリケーションの欠如の認識不足(モジュール式及び3Dプリント銃器の出現前)、市場参入の障壁(最も顕著には政策介入の要件)、又は認識される技術的障壁によるものである(合成核酸技術とDNA配列決定における最近のいくつかの進歩の後に)ほとんどの部分がもはや存在しないということである。
この実験では、タグ付き弾薬を使用して銃器及び銃器犯罪を追跡するためのUniKey−Tag技術が実証される。弾薬フィンガープリンティングの基本的な概念は、弾薬が射手、銃器及び犠牲者と接触しているので、犯罪現場に情報を伝達するための最良の手段を提供するということである。各UniKeyタガントは、ユニバーサルフォワード及びリバースプライマー配列に隣接する可変コード領域を含む。これにより、1回の増幅反応で基本的に無制限の数(1,000億)のタガントをスクリーニングすることができる。既存のタガント技術は、弾薬追跡のような大規模な識別及び深層アプリケーションには適していない。
UniKey−Tagシステムはまた、消耗品の弾薬追跡及びサプライチェーンモニタリングに必要な他の設計基準を満たす。
●識別と認証の目的に適している(用語と略語で与えられている正確な定義を参照);
●広範囲のもの:何十億もの固有の識別子配列を安価にかつ効率的に生成、回復、デコードする能力;
●高度に内密:「化学キー」(プライマー配列)に関する従来の知識がないと、見えず、検知されないものでなければならない;
●非毒性:ヒトの消費及び/又は血流への侵入に対して安全である(少量);
●耐性:高温、高圧、紫外線、ヌクレアーゼ曝露、及び不正開封防止に耐性がある必要がある;
●接触によって分散される(タグ付き弾薬は、理想的には、銃、使用者、犠牲者/標的及び弾丸に追跡可能なサインを残さなければならない);
●分散後の非常に少ないコピー数で回復可能;
●安価:製品の価値のごく一部(つまり、コストの1%未満)を占め、市場全体に浸透して効果的な抑止力として機能するのに十分なほど安価でなければならない;
●既存の弾薬製造プロセスに簡単に統合できる(理想的には製造後工程として);
●ナノスケール:表面に付着したタグは、製造元によって定義された安全許容範囲内でなければならない;
●環境的に安全で無毒である。
この実験の目的は、弾薬散布/移動タガントとしてUniKey−Tag技術をこの分野でテストすることであった。本明細書に記載の方法論は、オリゴヌクレオチド分解を低減し、低コピー数のタグ回収を助けるように設計された新規プロトコルと組み合わせて、核酸技術におけるいくつかの最近の進歩を利用する。方法論は、銃関連の犯罪を追跡するためのより優れた法医学的能力を提供することを目的として、弾薬カートリッジから銃、使用者、標的又は犠牲者へのタガントな拡散のために最適化された。プロトコルは、0.22口径のライフル銃(ME=420J)、9mmのブラウニング拳銃(ME=470J)、及び0.270口径のライフル銃(ME=3,660J)を含む低及び高マズルエネルギー(ME)銃器を使用してテストされたタガント回収は5つのポイントでテストされた:銃器、カートリッジケース、ユーザー、弾丸、及び侵入創傷(ブタ組織の切片が使われた)。
方法論
この実験は2つの主要部分で構成された。第1に、高温、高圧、紫外線(UV)及びヌクレアーゼ活性からタガントを保護するための候補固定剤の能力を試験するために加速分解試験を行った。これらの固定剤はまた、タガント回収及び増幅に必要とされる下流の酵素プロセスに対する可能性のある阻害効果に対して確実にするためにスクリーニングされた。
実験の第2部では、弾薬カートリッジに、選択された固定溶液中に懸濁されたタガントで印を付け、標的に向けて発砲した。タガントの回収は、射手の手、銃器、弾薬箱、弾丸のエントリーポイント、回収された弾丸の5点でテストされた。
(A)UniKey−Tagの設計と調製
2つの異なるタガントコード化システムがシリーズ1及びシリーズ2実験で試験された。シリーズ1実験(9mm拳銃弾薬追跡)では、表1に与えられたタガントを使用した。これらのタガントは、UniKey−Tag 1及び2に従って設計された。具体的には、タガントは、5’及び3’末端キャッピング領域(0〜3bp)、ユニバーサルフォワード及びリバースプライマー部位(20bp)、ならびに可変長コードワード領域(10〜40bp)を用いて設計された。全部で40個の相補的ssDNAオリゴヌクレオチドを注文し、続いてアニールして20個のdsDNAタガント二本鎖を形成した。これらの20個のタガントは、以下の長さ:80、76、70、66、及び60bpの各々の4つを含んだ。それにより、識別は、UniKey−Tag2システムによるフラグメント長分離、ならびにUniKey−Tag 1システムによる配列決定により行うことができた。これら20個のタガントの設計仕様及び配列を実施例1及び表1に示す。これらのタガントの全ては同一のフォワード及びリバースプライマー部位を用いて設計された。
シリーズ2実験(0.22及び0.207口径の銃器弾薬追跡及び医薬品標識)において、タガントは、UniKey−Tag 1に従って同様に設計された:タガントは5’及び3’末端キャッピング領域(0〜3bp)、ユニバーサルフォワード及びリバースプライマー部位(22bp)、ならびに可変長の可変コード領域(46bp)を用いて設計された。シリーズ1の実験と比較して1つの違いはあるが、それでもUniKey−Tag 1システムと一致しているが、可変領域は256個のクラムのライブラリーから選択された6個のハミング(8,4,4)クラムでコード化された(表4及び図15参照)。シリーズ2の実験では、デコード化は配列決定のみによって行われた。
タガントをSigma−Aldrichによって合成し、高速液体クロマトグラフィー(HPLC)を用いて精製した。クロス汚染を防ぐために、製造は複数の異なる場所で行われ、数週間にわたって行われました。
(B)一本鎖二重鎖化
一本鎖オリゴヌクレオチド鋳型を400μLの10mM Tris−EDTA(10mM Tris、50mM NaCl、1mM EDTA、pH7.5〜8.0、Sigma 93284)に再懸濁し、場合により10秒間ボルテックスし、1分間遠心分離した。再懸濁した鋳型鎖を、それぞれの相補的一本鎖タガントを含むチューブに移した。400μL及び200μLのTris−EDTAアリコートについてこのプロセスをさらに2回繰り返し、合わせた鋳型−相補鎖鎖溶液を1000μLにした。溶液を95℃のヒートブロック上に5分間置き、次いで1時間かけて25℃までランプ冷却して二本鎖形成を促進した。dsDNAタガントをさらなる使用のために−20℃で保存した。
(C)ユニバーサルプライマー設計アニーリング温度識別(ATD)ポリメラーゼ連鎖反応
これらの実験で行われたアニーリング温度識別(ATD)ポリメラーゼ連鎖反応(PCR)方法論は、プライマー−フラグメント相互作用が、フラグメント−フラグメント相互作用のアニーリング温度より少なくとも5℃高いアニーリング温度で起こるように設計された(例えば、ΔAT≧5℃)。これは、タガント回収及び増幅に使用されるユニバーサルフォワード(UFP)及びリバースプライマー(URP)にロックド核酸(LNA)を組み込むことによって達成された。LNA−プライマーは、Exiqonによって提供されたオンラインツールを使用して、ΔAT≧5℃となるように設計した。自己二量体(UFP−UFP及びURP−URP)及びヘテロ二量体(UFP−URP)融解温度は、LNA−プライマー−フラグメント結合温度より少なくとも30℃低い。
シリーズ1及び2の実験で使用したユニバーサルセットのLNAプライマーの設計仕様をそれぞれ表5及び6に示す。ロックドされた核酸の前には記号「+」が付される。同等の従来のプライマーのアニーリング特性もまた比較のために与えられている。
(D)アニーリング温度識別PCRプロトコル
LNA含有プライマー、低コピー数タガント回収、及びポリアクリルアミドゲル電気泳動を用いた短いフラグメント長の視覚化に対応するためのさらなる改良を加えて、確立された直接ポリメラーゼ連鎖反応(PCR)方法論(Thermo Scientific Phire動物組織直接PCRキット、F−140WH)を用いてタガント増幅を行った。直接PCRを使用して、サンプルの損失を招く可能性がある追加の精製ステップを回避した。
シリーズ1及び2の実験で使用したPCR試薬を表7に示し、熱サイクルプロトコルを表8及び9に示す。シリーズ1の実験では熱サイクルアニーリング温度を67℃(ΔAT≧16℃)に設定し(表8)、クロスタガントプライミング及びハイブリダイゼーションに対して確実にするためのシリーズ2実験において70℃(ΔAT≧16℃)(表9)に設定した。標準的なプロトコルと比較してより高濃度のプライマーとより多数の熱サイクルが、配列決定のための十分な長さの短い産物(増幅後の長さ54〜80bp)の生成とフラグメント長分離ゲル電気泳動によるバンドの識別とデコード化に必要であった。
PCR産物は、ポリアクリルアミドゲル(12%)電気泳動を用いてフラグメントサイズによって分割された。ゲルを臭化エチジウムで染色し、高UV下で検査した。サンガー配列決定のために選択されたバンドを切り出した。
(E)固定液のスクリーニング:高温高紫外線下での促進劣化実験
候補固定液のリストを識別し、そして高温、高圧、紫外線(UV)及びヌクレアーゼ活性からタガントを保護するそれらの能力についてスクリーニングした。固定剤は、物理的接着剤として機能することも必要とされ、フラグメント回収及び直接ATD PCRを用いた増幅に必要とされる下流の酵素プロセスに対して全く又は低い阻害効果を有する。
以下の表10に示す固定液は、0.1、0.3及び0.6MのD−(+)−トレハロース二水和物溶液(Sigma 90210)、0.1Mのα,β−トレハロース溶液(Sigma T0299)を含む。10mM Tris−EDTA(Sigma 93284)に溶解したポリビニルアルコール(Sigma 360627)の1%m m溶液。各溶液は、OligoTag 1 Ser1の0.8μM dsDNAを含むように調製した(実施例1参照)。対照溶液は100%10mM Tris−EDTAであった。
タガント溶液C1、T1、T2、T3、Tab、及びPVA(表10)を、エアブラシガンを使用して8×12mmの真鍮プレート上に堆積させた。堆積層の厚さは50μm未満であり、これは弾薬カートリッジの設計公差のかなり内側にある。弾薬カートリッジの表面をシミュレートするために真鍮板を使用した。固定されたタガントを4ヶ月間にわたって連続的な高光(UVA及びUVB、1,000μmol m-2-1)及び高温(50℃)条件に曝露した。タガントを5、8、13、21、34、55日目にプレートから回収し(各固定溶液について回収サイクル当たりn=3)、存在するdsDNAの量及びタガント増幅生存率について試験した。
タガントは、500μLの10mM Tris−EDTA緩衝液に浸すことによって真鍮プレートから回収し、3〜4分間50℃に加熱してボルテックスした。真鍮プレートを取り外す前に、この工程を3回繰り返した。残りの溶液の5μLアリコートを予め調製した試薬を含むPCRウェルに直接導入した。
各時間間隔でプレート上に残っているdsDNAの量を、Qubit蛍光定量法(Invitrogen、Q32854)を用いて定量した。人為的な読み取りに対して確実にするために、各溶液の参照サンプルは10mM Tris−EDTAに懸濁された固定剤のみを含んでいた。
(F)銃器トレースのための弾薬タグ化
オリゴヌクレオチドタガントを固定液に懸濁し、0.22口径、9mm及び0.207口径の弾薬カートリッジの表面に付着させた。シリーズ1の実験では、実施例1に示した20個のタガントのそれぞれで4個のカートリッジに印を付けた。シリーズ2の実験では、5個の0.22口径及び4個の0.207口径の弾薬カートリッジにそれぞれ表3に示す10個のタガントで印を付けた。印を付された弾薬は15mの距離からの豚組織(スーパーマーケットの豚の腹)の部分から成るターゲットで発射されました。ブタ組織は、ヒト組織のための類似体として、そしてヌクレアーゼ媒介タガント分解に寄与し得る条件をシミュレートするために使用された。弾丸の回収を容易にするために、標的を土のうの前に置いた。タガント回収は、図16、17、19に示す5つのポイントでテストされました。これらの5つのポイントは、(a)射手の手、(b)銃器、(c)弾薬ケーシング、(d)弾丸進入点、及び(e)回収弾丸である。
(G)タガント回収:
3つのタガント回収プロトコル、すなわち(1)軟組織、(2)硬表面と皮膚、及び(3)フラグメント化材料を開発した。これらのプロトコルは、過剰な取り扱い(低コピー数タグ回収用に最適化)を回避し、直接PCR法と互換性があるように、5点回収場所からのタガント回収を最適化するように設計された。
プロトコル1:軟組織:侵入創傷からのタグ回収
侵入創傷からのタグ回収の2つの方法を試験した:(1)Williamsら(2013、Journal of Forensic Research、4:4−6)及び(2)直接PCRプロトコルへの導入のための創傷からの組織の切除。
第1の方法では、口腔スワブ(Isohelix、MS−001:1)を0.1mM Tris−EDTAのエアロゾルで湿らせた。スワブは、スワブ頭の上部4分の1とのみ接触するように注意しながら、弾丸の進入場所を中心に回転させた。第2の乾いた口腔スワブを使用してその部位及び周囲の組織を再度スワブした。サンプルを直ちに氷上に置き、−20℃で保存した。
スワブからDNAタガントを回収するために、スワブを0.1mM Tris−EDTAのエアロゾルで再び湿らせ、スワブ頭を100μLのピペットチップに挿入して液体を絞り出した。チップに集めた液体の5μLアリコートを表3に示す直接PCR試薬を含むウェルに導入した。PCR増幅が失敗した場合、スワブチップを切り取り、直接PCR試薬を含むウェルに直接「バックアップ」として導入した。両方の湿ったスワブが失敗した場合、乾いたスワブを試験した。
第2のアプローチでは、少量の組織を弾丸エントリー部位から切除し、2mLのエッペンドルフチューブに入れた。組織を600μLの0.1M Tris−EDTA溶液に懸濁し、2分間82℃に加熱し、2回ボルテックスした。液体画分(上清)の5μLアリコートを表2に示す直接PCR試薬を含むウェルに導入した。
プロトコル2:硬い表面と皮膚:銃器とユーザーからのタグ回収
ポリビニルアルコールベースのゲルを使用して、銃器及び射手の手からタガントを回収した。ゲルは、PVA(10%)をエタノール(10%)及び水に70℃で3〜4時間(又はすべてのPVA結晶が溶解するまで)溶解することによって調製した。 ゲルの薄いフィルムをサンプリング領域に適用し、硬化させ、次いで剥がし、−20℃で保存した。
PVAフィルムからタガントを回収するために、フィルムを0.1mM Tris−EDTAに60℃で2分間溶解した。フィルムを溶解させるためには、典型的には約200μL/cmのトリスで十分であった。得られた溶液の5μLアリコートをPCR試薬を含有するウェルに直接導入した。
プロトコル3:弾薬ケーシングと弾丸
フラグメント化した材料(弾丸のフラグメント又はカートリッジのケーシングなど)からのタガント回収は、Tris−EDTA緩衝液に浸すことによって行った。浸漬した材料を2〜3分間50℃に加熱し、短時間ボルテックスした。この加熱−ボルテックスサイクルを3回繰り返した後、ケーシング又は弾丸の破片を溶液から取り出し、−20℃で保存した。溶解した金属イオンは下流PCR反応を阻害する可能性があるため、金属フラグメントは30分以上溶液中に放置しないように留意されたい。例えば、真鍮製カートリッジを一晩溶液中に放置した場合、懸濁液は青色に変わり、高濃度の溶解銅イオンを示した。
(H)ナノ細孔配列決定プロトコル
PVAフィルムからタガントを回収するために、フィルムを0.1mMのTris−EDTAに60℃で2分間溶解した。フィルムを溶解させるためには、典型的には約200μL/cmのTrisで十分であった。得られた溶液の5μLアリコートをPCR試薬を含有するウェルに直接導入した。
試料を調製し、アンプリコン用の1D、96PCRバーコードプロトコル(Oxford Nanoporeプロトコル番号:SQK−LSK108)に従って配列決定した。Phire HotStart IIポリメラーゼを用いて、このプロトコルに従ってPCRバーコードを行った。すべてのUniKey−Tag 1実験において、FLO−MIN106(R9.4)フローセルを用いて配列決定を行い、セミグローバル配列アラインメント用に修正したNeedleman−Wunschアルゴリズムを用いてサンプルをデコード化した。
結果
保存されたDNAタガントの分解促進加速分解実験では、タガントを表10の固定溶液中に懸濁させ、真鍮プレート上に堆積させた。プレートを55日間にわたって持続的な高温(50℃)及び電磁放射線条件(すなわち、UVA及びUVBを含む光、1,000μmol m-2-1)に曝露した。ポリビニルアルコールは、以前はDNA保存プロトコルで使用されているので、候補固定剤として試験された。トレハロースはまた、乾燥する生物におけるDNA損傷から保護すると考えられており、また商業目的のためのDNA固定剤として以前に試験されたこともある。
図18に提示された結果は、Qubit蛍光定量化によって決定されるように、55日間にわたって様々な時間間隔で回収されたDNAの量を示す。回収されたdsDNAの量は、約0.5〜3.0pmol/プレートの範囲であり、全ての固定液について0.03pmol/dの同様の分解速度を示した。図18によると、55日目の固定化溶液の性能は、回収されたdsDNAの大部分から最小の順にTab、T1、PVA、T3、T2、及びC1であった。しかしながら、これらのデータは、フラグメントを保存するために試験された溶液の容量間に決定的な違いを示さない。詳細に調べると、Tab及びT1溶液から回収されたdsDNAの量は、1日目からのPVA、T3、T2、及びC1溶液よりも高く、実験期間にわたって、比例して高いままであったことがデータから示されている。dbDNA回収率はTab及びT1溶液について一貫して最高であったが、C1を含む試験した全ての溶液間で分解の変化率の間に有意差は観察されなかった。
PCR産物は、各サンプリング時間間隔で、対照を含む全ての固定液から首尾よく得られた。それ故、DNA保存及びPCR適合性に関して、試験した固定液と対照との間に有意差は観察されなかった。これらの結果はDNAの耐久性を証明するものである。
この加速分解実験の重要な知見は、トレハロースとポリビニルアルコールの両方がPhire Hot Start IIポリメラーゼ活性に対して有意な阻害効果を示さないことである。ポリビニルアルコールは、D−(+)−トレハロース脱水物が大気から湿気を吸収してプレート上に粘着層を形成するため、好ましい固定剤であり、α、β−トレハロースは実用的用途には高価すぎた(USD 16,300/g)。
UniKey−Tag 1システム(0.22、0.207、9mm銃器)とUniKey−Tag 2システム(9mm銃器のみ)による弾薬のフィンガープリント:dsDNAタガントは発射後にユーザー、銃器、ケーシング、エントリーポイント及び弾丸に分散して回収できる
このセクションでは、UniKey−Tag 1システムを用いた弾薬追跡実験の結果を最初に提示する。これらの実験では、シリーズ1のタガント(表1)を使用して9mmの弾薬カートリッジをマーキングし、シリーズ2のタガント(表4)を使用して0.22と0.207の口径の弾薬カートリッジをマーキングした。UniKey−Tag 1システムに従って、試料をATD PCRによって増幅し、(ナノポア技術を使用して)配列決定し、デコード化した。
第2に、UniKey−Tag 2システムを使用した弾薬追跡実験の結果が示されている。これらの実験は9mm銃器でのみ行われ、可変長のシリーズ1タガントのみを使用した(表1に示す)。UniKey−Tag 2に従って、サンプルをATD PCRによって増幅し、フラグメント長分離によってコード化した。
UniKey−Tag 1及び2実験の両方について、サンプルは手、銃器、使用ケース、弾丸エントリーポイント、及び回収された弾丸から採取された。
(1)シリーズ1タガント(9mm拳銃)及びシリーズ2タガント(0.22及び0.207口径の銃器)を用いたUniKey−Tag 1弾薬フィンガープリント実験:配列決定によるデコード化
9mm拳銃(シリーズ1タガント)ならびに0.22及び0.207口径の銃器(シリーズ2タガント)を用いたUniKey−Tag 1実験の結果を図19(a〜e)に示す。UniKey−Tag 1システムでは、DNAタガントはADT PCRによって増幅され、配列決定されてデコード化される。本明細書に記載の実験の場合、試料をATD PCRを使用して増幅し、試料識別配列でバーコード化し、一緒にプールし、携帯型ナノポア技術を使用して配列決定した。次に、セミグローバルシーケンスアラインメント用に修飾されたNeedleman−Wunschアルゴリズムを使用して、結果をデコード化した。
弾薬追跡実験の結果を図19(a〜e)に示す。図19(a)は、予想されるDNA追跡が検出された頻度を示し、(b〜d)は、ケース、エントリー及び弾丸試料についてそれぞれ予想されるシグナル(ES)及びノイズ(N)記録を示し、(e)は、登録ランクの関数として正しい識別の確率を示す。ES及びNメトリックは、ESに対して正規化されたサンプルで検出された各フラグメントレコードの読み取り数である。ランクは、最高から最低までの各記録の読み取り数である。本発明者らはこのアプローチを選択した。それは、同じ銃をすべての試験で使用したためである。これにより、銃に連続的に装填されたラベル付き弾薬の異なるセット間でのフラグメント転送が可能になった。この実験計画は、民間銃の使用パターンを反映し、確率的にESをランク付けすることができるかどうかをテストするために使用された。(E)に示したPr(ランク=ES)の結果には、集計されたケース、エントリー、及び銃弾サンプルに対する予測非線形回帰(NLR)モデルが含まれる。例えば、ランク1(R1)の値は、複数の記録が検出されたサンプルで最もランクの高い記録が、その特定の試行で使用された弾薬を正しく識別しているという信頼度である。
図19(a)は、識別の破壊されていない鎖が、ほぼ全てのケース、エントリーポイント及び弾丸試料において検出されたことを示す。2つの例外は、0.207エントリポイント(97%)と9mm弾丸サンプル(85.2%)であった。実験の終わりに、射手と銃の手からサンプルを回収した。ほとんどすべての射手と銃のサンプルで、ラベル付き弾薬の各セットが検出されました。唯一の例外は9mm拳銃で、実験の終わりに20セットのラベル付き弾薬のうち19個が銃で検出さた(図19(a)参照)。各試験のES及びN値を図19(b〜d)に示す。
登録ランクと予想されるシグナルの関係
記録ランクと予想されるシグナルの関係を図19(e)に示す。ケースサンプルの場合、ランク1(R1)の記録は、9mm及び0.207口径の銃器のそれぞれ97%(n=67試行)及び100%(n=100%試行)の特定の試行で使用された弾薬カートリッジを正しく識別した。ケースからのサンプルは、0.22口径の銃器実験では採取されなかった。
エントリーポイントのサンプルでは、R1記録が特定のトライアルで使用された弾薬カートリッジを正しく識別した確率は、0.22銃器で0.98(n=46)、9mm拳銃で0.86(n=64)0.207銃器で0.79(n=38)であった。回収された弾丸のサンプルの場合、R1記録が特定の試験で使用された弾薬カートリッジを正しく識別した確率は0.15、9mmの拳銃、0.207銃器で0.16であった。銃弾のサンプルは口径0.22の銃器実験では採取されなかった。
すべての銃器の種類にわたって集計した場合、正しいカートリッジがランク1〜3の記録(R1〜R3)で識別された確率は、ケースサンプルでは0.99、エントリーポイントサンプルでは0.96、回収弾丸サンプルでは0.44であって。これらの実験は、合成DNAが、低及び高マズルエネルギー(ME)銃器の両方における弾薬のラベル付け及び銃犯罪の追跡に適した媒体であることを実証している。テストされた銃器のMEは440J(0.22口径の銃器)から3,660J(0.207口径の銃器)の範囲であった。
結果は、合成DNAで標識された弾薬が射手、銃、ケース、エントリーポイント、及びマークされた弾薬の起源を決定するのに十分なこれらのポイントのいずれかでの発砲後の回収された弾丸における識別の切れ目のない連鎖を残すことを示した。シグナル/ノイズアプローチは、以前の試験の銃器で異なるDNAタガントでマークされた弾薬が使用された後でさえも、記録読み取りカウントを特定の試験で使用された正しい弾薬を確率的に識別するために使用できることを示した。これらの能力は、異なる組のラベル付き弾薬を同じ銃の中で使用することができる民間銃器の追跡及び弾薬備蓄管理にとって重要である。したがって、記録的ランクを使用される弾薬に確率的に関連付ける能力は、本明細書に開示される技術の特に重要な側面である。
(2)シリーズ1のタガント(9mm拳銃)を用いたUniKey−Tag 2弾薬フィンガープリンティング実験:フラグメント長分離によるデコード化
UniKey−Tag 2システムでは、試料をATD PCRによって増幅し、フラグメント長分離ゲル電気泳動によってデコード化した。ポリアクリルアミド電気泳動ゲルの写真を図20〜22に示し、結果を表11及び12に要約する。弾薬追跡実験は、9mmの拳銃を使用して2つの実験段階(Ser1 a及びSer1 b)にわたって行った。実験(a)では、2つの9mmカートリッジに表1に示すdsDNAタガントOligoTags 1−20 Ser1のそれぞれを付けた。第2の実験(b)では、10個のカートリッジをOligoTags 4,12,20 Ser1で付けた。シリーズ1(a)の実験では、増幅後の長さが74、70、64、60、54bpの5つのタガント基をポリアクリルアミドゲル電気泳動を用いて分離するのが困難なことがあった。これは、長さ74、64、及び54の3つの異なるサイズのタガントグループがより優れた帯域分解能を提供するシリーズ1(b)の実験で対処された。
UniKey−Tag 2(シリーズ1、9mm)実験の主な結果を以下に提示する。
(A)UniKey−Tagシステム及びATD PCRの実現可能性がこの分野で実証された
UniKey−Tag 2の弾薬追跡実験の結果を表11及び表12にまとめ、図20〜22の電気泳動ゲルの写真に示す。電気泳動ゲルは、実験(a)及び(b)の両方において、クロスフラグメントハイブリダイゼーションの証拠を伴わずに明瞭な区別されるバンドを示す。ssDNAタガント間のギブス自由エネルギー(ΔG)が、従来のプライマーアニーリング(−32.7kcal/mol)よりもクロスフラグメントハイブリダイゼーション(ΔG=−44.5及び−37.9kcal/mol)を強く支持し、推奨設計限界である−9.0kcal/molよりも約4倍マイナスであることを考えると、これは特に好ましい結果である。ssDNAタガント間のギブス反応エネルギーを表2に示した。これらの結果は、この分野におけるUniKey−Tagシステムの実行可能性を実証している。
(B)合成DNAは弾薬の追跡に適した媒体である
図19〜22に提示された結果は、合成DNAが発砲後も弾丸上で無傷のままであること、合成DNAが弾薬をマーク及び追跡するための適切な媒体であることを示す。
(C)発砲後、使用者、銃器、ケーシング、侵入口及び弾丸に標識剤が分散され、そこから回収可能−電気泳動ゲルの結果
UniKey−Tag 2の弾薬追跡実現可能性試験(Exp Ser1 a、Ser1 b)の総合結果を表11及び12に示し、図16にまとめた。これらの結果は、ほぼすべての試験で切れ目のない一連の識別が確立されたことを示している。9mm拳銃(n=70)の場合、タガントをユーザー(80%)、銃(100%)、ケーシング(100%)、弾丸(97%)、侵入傷(99%)にリンクする。これらの復旧ポイントは、ユーザーの識別には十分である。合計で、1つの弾薬事件と8つの弾丸が回収されず、3つの弾丸のエントリー部位が以前のエントリー部位と重なった。
表11及び12、ならびに図20〜22の結果は、それぞれ43%、33%、及び92%の場合に、症例、侵入創傷、及び弾丸のサンプルで多重バンディングが発生したことを示している。多重バンディングは、マガジンをロードするときに他の弾丸にタガントを移動させることを示す。使用できる銃は1本だけであるため、ある程度の移動が生じたはずである。この移動は、これまで銃器で使用されていた弾薬の分子的な歴史を提供することによって法医学的調査を助けることができ、それ故にこの技術の悪い面とは見なされていない。
弾薬事件のサンプルの複数のバンドは、マガジンをロードしている間の連絡先の移動に起因している。生物学的標的物質上の弾丸進入部位から回収されたサンプル(ブタの屠殺体の切片を用いてヒト組織をシミュレートした)については、スワブ回収技術を実験(a)で使用した場合にのみ多重バンディングが観察された。実験(b)において、侵入創傷から少量の組織を切除し、緩衝液中でインキュベートし、そしてPCRウェルに直接導入した。この第2の技術を使用して、各試験で観察された予想されるバンドのみを用いて100%の回収率を達成した。これらの実験は、生物学的材料中に存在するヌクレアーゼがタガント回収及び増幅に悪影響を及ぼさないことを示した。銃器犯罪は常に何か又は誰かの弾痕を伴うため、エントリー部位でのタガント回復はこの研究の究極の目標であった。エントリー部位だけからユーザーを識別できることは、非常に有用な法医学的ツールになり得る。
手と銃からのタガントの回復は、それぞれ80%(n=5)と100%(n=6)の試験で成功した。手と銃からの回復は10ショット間隔で行われたことに注意されたい。このフィージビリティスタディは、UniKey−Tag技術が銃器の分野を追跡するための実行可能性を証明した。回収プロトコルのさらなる改良により、手と銃による明確な識別率は大幅に向上すると予想される。
(E)PVAゲルリフトは従来のバッカルスワブ及びテープリフト技術よりも優れている
1つの重要な結果は、皮膚及び銃器の硬い表面からタガントを回収及び増幅するためのPVAベースのゲルの使用が成功したことである。従来の法医学プロトコルは、犯罪現場からゲノムDNAを回収するために口腔スワブを使用している。しかしながら、制御された実験室条件下で微量レベルのDNAタガントを回収するためのこの技術の成功率は約50%に過ぎないことが見出された。テープリフトもまた簡単に試験されたが、テープ接着剤からDNAを精製するのに必要とされる追加の工程は、低コピー数回収には不適当であると考えられた。
他の従来技術を超えるPVA−ゲルリフトの成功は、3つの主な要因に起因していた。第1に、液体ゲルの適用は、テープよりも表面の亀裂及び不規則性によく浸透すると考えられる。第2に、手や銃からPVAの「皮膚」を引き裂くという機械的な動作は(テープリフトと同じように)回復結果を改善する場合がある。第三に、PVAリフトと直接PCRプロトコルとの互換性、及びポリメラーゼに対するPVAの低い阻害効果(Phire Hot Start IIのみを試験した)により、PVA「スキンリフト」をPCRウェルに直接添加することができた。これは必然的にサンプルの損失を招くいくつかの追加の精製工程の必要性を回避した。
表11−弾薬追跡実験(a)の結果、UniKey−Tag 2
表12−弾薬追跡実験(b)の結果、UniKey−Tag 2
実施例7−偽造医薬品を追跡するための分子タガント技術
UniKeyタガント及びLNAプライマーを用いたATD PCRは、製薬業界におけるサプライチェーンの追跡などの深層アプリケーションに適している。何十億ものタガントを同時にスクリーニングする能力は、タグ付けされた製造物前駆体を混合して、1つの反応で最終製造物から解読することを可能にする。この深層化能力は、本発明に特有のものであり、図1に示されている。すべての前駆体に対してタガントの部分集合が以下の情報を含むように、タガントは有効期限、製造者、製造施設、バッチ番号などの製品情報を含むことができる。あるいは、タガントは、中央化データベース上で製品情報を検索するために使用される固有のシリアル番号をコード化することができる。概念的には、業界全体が1セットのユニバーサルプライマー(すなわち同じライブラリー)を使用することができ、それによって医薬品のあらゆる混合物が1つの反応で解読され得る。しかしながら、安全上の理由から、複数組のユニバーサルプライマーを使用することが望ましい場合がある。
UniKey−Tag 1システムは、医薬品を標識する目的でさらに試験された。これらの実験では、シリーズ1Hum(8,4,4)コード化タガント(表4に示す)を使用して、5つの一般的に偽造された薬、すなわちリアメット(マラリア抗寄生虫)、イソニアジド(結核抗生物質)、アモキシシリン及びクラブラン酸(広域抗生物質)とシアリス(勃起不全)を標識した。0.001、0.01、0.1、1、及び10ng/gの錠剤の濃度で異なるdsDNAタガントを薬物に混合した(表13参照)。図1に示すように、複数のタガントを使用してこれらの薬物を標識し、複数の前駆体ラベリングをシミュレートした。タガントを回収し、配列決定し、弾薬UniKey−Tag 1追跡実験について前述した直接PCRプロトコルを使用してデコードした。
医薬品標識実験の結果を表13に示す。全ての薬物タイプについて、試験したほぼ全ての濃度にわたって、DNAタガントを首尾よく回収し、デコードした。
実施例8−DNAベースのアーカイブ記憶のための分子タガント技術
既存のデータ記憶媒体の容量は、新しいデータが生成される速度より遅れている。アーカイブデータ記録のためにDNAを使用することは、情報密度が高く(10GB/mm、テープよりも8桁大きい)、半減期が長い(ほとんどの条件下で100bpフラグメントで約500年)ため魅力的であり、商業的に成熟した技術を用いて合成されそして配列決定される。一方、従来の光学、磁気及びフラッシュ技術は、5〜30年の寿命を持ち、絶え間ない更新を必要とする。したがって、長期記憶媒体としてのDNAは、従来のデータ記憶技術の限界に鑑みて大きな関心を集めている。
DNAベースの保存はまた、永遠の関連性という利点がある:DNAベースの生活がある限り、DNAを読んで操作する強力な理由がある。DNA記憶の書き込みプロセスでは、デジタルデータをDNAヌクレオチド配列(ヌクレオチドはDNAの基本的な構成要素である)にマッピングし、対応するDNA分子を合成(製造)して、それらを保存する。データを読み取ることは、DNA分子を配列決定し、情報を元のデジタルデータにデコードすることを含む。合成から塩基配列決定まで、バイオテクノロジーの研究から診断、治療まで、標準的な方法である。
DNAベースの保存が23文字のメッセージをエンコードして回復していた1999年以来、DNA保存の進歩は急速であった。今日合成できるデータ量は、主に合成とシーケンシングのコストによって制限されているが、バイオテクノロジー業界の成長は、桁違いのコスト削減と効率の向上をもたらしている。
Bornholtらによる論文(2016年;DNAベースのアーカイブ保管システム、APLOS)は、キー・バリューストアとしてモデル化された、DNAで裏付けされたアーカイブ記憶システムのためのアーキテクチャを提示する。この論文は克服する必要があるいくつかの課題を強調している。第1に、DNA合成と配列決定は完全に程遠いもので、エラー率は1%のオーダーである。配列はまた、記憶中に劣化する可能性もあり、データの整合性がさらに低下する。DNA記憶の重要な側面は、冗長性を追加することでエラーを許容できる適切なエンコード方式を考案することである。既存のアプローチは冗長性に焦点を当てているが、密度の影響を無視している。この研究は、制御可能な冗長性を提供し、異なるタイプのデータ(例えば、テキスト及び画像)が異なるレベルの信頼性及び密度を有することを可能にする新しいコード化方式を提案する。識別された2番目の問題は、DNAベースの記憶内のデータにランダムにアクセスすることには問題があることである。その結果、全体の読み取り待ち時間が書き込み待ち時間よりはるかに長くなる。さらに、ファイルをコード化するために使用されるDNAのフラグメントは溶液中に記憶されるため、従来の媒体内のデータにアクセスするために使用される座標系は使用することができない。既存の研究はラージブロックアクセスのみを提供してきた。記憶から1バイトでさえ読むためには、DNAプール全体を配列決定し、デコードしなければならない。
ランダムアクセスアーカイブデータ回復のためのアニーリング温度識別PCR
前述のように、アニーリング温度識別PCR(ATD PCR)は、クロスフラグメントハイブリダイゼーションの発生なしに、タガントの部分集合をタガントのプールから同時に選択し増幅することを可能にする。この能力は、DNAベースのアーカイブ記憶システムにおけるランダムアクセス又は小規模ブロックアクセスのデータ回復に完全に変換される。例えば、図2は、フラグメントの特定のライブラリー(W、W、及びW)によってエンコードされている3つのイメージファイルを示す。各ライブラリーは、ファイルに普遍的な特定の組のフォワード及びリバースプライマー部位(例えば、UPFb、UPRb)によって定義される。これらのファイルは、3枚の写真すべてについて、DNA形式のデータを含むDNAフラグメント(P)の混合プールとしてアーカイブされる。ATD PCRは、クロスフラグメントハイブリダイゼーションなしに、1回の反応で特定の写真ファイルにランダムにアクセスすることを可能にする。ATD PCRはまた、可変領域ヘテロ二量体形成の発生率を低下させることによって、はるかに高いコード化柔軟性を可能にする。これは、2つの異なるDNAフラグメントが前述のようにコードワード内に同じ記号部分配列を含む場合に特に問題となる(図5も参照)。次に、ATD PCR増幅産物を配列決定のために送り、得られた配列から写真をデコードする。ファイルはまた、より高い解像度のアクセス機能を可能にするために、より小さなライブラリセットに分割することもできる。例えば、ファイルの特定の部分にアクセスする場合などである。各ライブラリー内のフラグメント(τ)は、ファイルを再構築できるように可変領域内にインデックスシーケンスを必要とすることに留意されたい。実際には、各画像ファイルは何千ものフラグメントでエンコードされ、何千もの画像ファイルが混在して一緒に記憶されることがある。
このシステムは書き換え機能を持たないが、フラグメントを最新のバージョンとして識別する可変領域内の追加のコードと共にフラグメントの更新されたセットをプールに単に追加することによって、ファイルの特定の部分を変更することができる。いずれにせよ、書き換え能力はアーカイブデータストレージの重要な要素とは見なされない。
参考文献
1. Bornholt, J. et al. A DNA-based archival storage system. ASPLOS ’16 - Proc. Twenty-First Int. Conf. Archit. Support Program. Lang. Oper. Syst. 637-649 (2016). doi:10.1145/2872362.2872397.
2. Bystrykh, L. V. Generalized DNA barcode design based on Hamming codes. PLoS One 7, 1-8 (2012).
3. Church, G. M., Gao, Y. & Kosuri, S. Next-Generation Digital Information Storage in DNA. Science (80-. ). 399, 533-534 (2013).
4. Goldman, N. et al. Toward practical high-capacity low-maintenance storage of digital information in synthesised DNA. Nature 494, 77-80 (2013).
5. Hamming, R. W. Error detecting and error correcting codes. Bell Syst. Tech. J. 29, (1950).
6. Levenshtein, V. I. Binary codes capable of correcting deletion, insertions and reversals. Sov. Physics-Doklady 10, 707-710 (1966).
7. Reed, I. S. & Solomon, G. Polynomial codes over certain finite fields. J. Soc. Ind. Appl. Math. 8.2 300-304 (1960).
8. Tabatabaei Yazdi, S. M. H., Yuan, Y., Ma, J., Zhao, H. & Milenkovic, O. A Rewritable, Random-Access DNA-Based Storage System. Nature 5, 14138 (2015).
9. Clelland, C. T., Risca, V. & Bancroft, C. Hiding messages in DNA microdots. Nature 399, 533-534 (1999).

Claims (41)

  1. 混合物中の2つ以上の標的核酸配列の高忠実度増幅のための方法であって、ここで、2つ以上の標的核酸配列のそれぞれが第1のプライマー部位と第2のプライマー部位に隣接し、増幅が、融解段階、アニーリング段階及び伸長段階を含む熱サイクリングを含み、前記方法は、第1プライマー部位のそれぞれに相補的な第1プライマー及び第2プライマー部位のそれぞれに相補的な第2プライマーを使用することを含み、第1プライマー及び第2プライマーが少なくとも1つのロックド核酸(LNA)を含み、アニーリング段階中、第1及び第2のプライマー部位のそれぞれに対する第1及び第2のプライマー以外の核酸配列のアニーリング段階が実質的に存在しないように、熱サイクリングのアニーリング段階中に高温が使用され、
    ここで、以下:
    i)2つ以上の標的核酸配列が単一の熱サイクリング反応で増幅され;
    ii)2つ以上の標的核酸配列が非生物学的情報をコードし;又は
    iii)2つ以上の標的核酸のそれぞれが、共通の第1のプライマー部位及び共通の第2のプライマー部位に隣接している、
    の1つ以上又は全てが適用される方法。
  2. 2つ以上の標的核酸のそれぞれが、共通の第1のプライマー部位に隣接している、請求項1に記載の方法。
  3. 2つ以上の標的核酸のそれぞれが、共通の第2のプライマー部位に隣接している、請求項1又は2に記載の方法。
  4. 2つ以上の標的核酸配列のそれぞれが異なる核酸配列を有する、請求項1〜3のいずれか1項に記載の方法。
  5. 2つ以上の標的核酸配列が単一の熱サイクリング反応で増幅される、請求項1〜4のいずれか1項に記載の方法。
  6. 第1及び第2のプライマー部位とは異なる、第3のプライマー部位及び第4のプライマー部位により隣接された追加の2つ以上の標的核酸配列の高忠実度増幅をさらに含む、請求項1〜5のいずれか1項に記載の方法。
  7. 増幅された2つ以上の標的核酸配列を配列決定によって識別する工程をさらに含む、請求項1〜6のいずれか1項に記載の方法。
  8. 2つ以上の標的核酸配列のそれぞれが異なる長さを有する、請求項1〜7のいずれか1項に記載の方法。
  9. サイズ分離によって増幅された2つ以上の標的核酸配列を識別する工程をさらに含む、請求項8に記載の方法。
  10. 2つ以上の標的核酸配列が非生物学的情報をコードする、請求項1〜9のいずれか1項に記載の方法。
  11. 2つ以上の標的核酸配列が、2つ以上の標的核酸配列が、銃器、弾薬、発射体、銃器残留物、ならびに銃器、弾薬及び/又は発射体と接触するようになる表面からなる群から選択される製造物から回収される、請求項1〜10のいずれか1項に記載の方法。
  12. 2つ以上の標的核酸配列が、銃器から発射された発射体の進入点の表面から回収される、請求項11に記載の方法。
  13. 2つ以上の標的核酸配列が医薬品又はその前駆体から回収される、請求項1〜10のいずれか1項記載の方法。
  14. 製造物をその起源まで辿る方法であって、前記方法は、
    (a)少なくとも1つの核酸配列が組み込まれている製造物を用意し、ここで、少なくとも1つの核酸配列は、第1のプライマー部位と第2のプライマー部位に隣接していて;
    (b)場合により、製造物から少なくとも1つの核酸配列を回収し;
    (c)第1のプライマー部位に相補的な第1のプライマー及び第2のプライマー部位に相補的な第2のプライマーを用いる熱サイクリングを含む高忠実度増幅によって少なくとも1つの核酸配列を増幅し、ここで、第1及び第2のプライマーはそれぞれ少なくとも1つのロックド核酸(LNA)を含み、熱サイクリングは融解段階、アニーリング段階及び伸長段階を含み、及びアニーリング段階中に、第1及び第2のプライマー部位に対する第1及び第2のプライマー以外の核酸配列のアニーリングが実質的に存在しないように、熱サイクリングのアニーリング段階中に高温が使用され、ならびに
    (d)工程(c)で増幅された少なくとも1つの核酸配列を識別する、
    ことを含み、ここで、工程(d)において識別された少なくとも1つの核酸配列の配列及び/又は長さは製造物の起源を示す方法。
  15. 製造物が、銃器、弾薬、発射体及び銃器残留物からなる群より選択される、請求項14に記載の方法。
  16. 製造物が医薬品又はその前駆体である、請求項14に記載の方法。
  17. 2つ以上の核酸配列を増幅及び識別することを含む、請求項14〜16のいずれか1項に記載の方法。
  18. 2つ以上の核酸配列のそれぞれが、共通の第1のプライマー部位に隣接している、請求項17に記載の方法。
  19. 2つ以上の核酸配列のそれぞれが、共通の第2のプライマー部位に隣接している、請求項17又は18に記載の方法。
  20. 2つ以上の核酸配列のそれぞれが異なる核酸配列を有する、請求項17〜19のいずれか1項に記載の方法。
  21. ステップ(d)が、増幅された少なくとも1つの核酸配列を配列決定によって識別することを含む、請求項14〜20のいずれか1項に記載の方法。
  22. 2つ以上の核酸配列のそれぞれが異なる長さを有する、請求項17〜20のいずれか1項に記載の方法。
  23. 工程(d)が、増幅された少なくとも1つの核酸配列をサイズ分離によって識別することを含む、請求項14〜22のいずれか1項に記載の方法。
  24. 少なくとも1つの核酸配列が非生物学的情報をコードする、請求項14〜23のいずれか1項に記載の方法。
  25. 少なくとも1つの核酸配列が、単一の熱サイクリング反応において増幅される、請求項14〜24のいずれか1項に記載の方法。
  26. 1つ以下の第1のプライマー及び1つの第2のプライマーが使用される、請求項1〜25のいずれか1項に記載の方法。
  27. 第1及び第2のプライマーがそれぞれ8〜30個のヌクレオチドを含む、請求項1〜26のいずれか1項記載の方法。
  28. 第1及び第2のプライマーがそれぞれ15〜25個のヌクレオチドを含む、請求項1〜27のいずれか1項に記載の方法。
  29. アニーリング段階中に使用される温度は、第1及び第2のプライマー以外の核酸配列がアニーリングする温度より少なくとも5℃高い、請求項1〜28のいずれか1項に記載の方法。
  30. アニーリング段階中に使用される温度は、第1及び第2のプライマー以外の核酸配列がアニーリングする温度より少なくとも10℃高い、請求項29記載の方法。
  31. アニーリング段階中に使用される温度が約50℃〜72℃である、請求項1〜30のいずれか1項に記載の方法。
  32. アニーリング段階中に使用される温度が約67℃〜72℃である、請求項31に記載の方法。
  33. 第1及び第2のプライマーのそれぞれが1〜8個のLNAを含む、請求項1〜32のいずれか1項記載の方法。
  34. 第1及び/又は第2のプライマーが、配列番号61〜68から選択される核酸配列を含む、請求項1〜33のいずれか1項に記載の方法。
  35. 第1成分及び第2成分を含むキットであって、第1成分は2つ以上の核酸配列のライブラリーを含み、2つ以上の核酸配列のそれぞれが共通の第1のプライマー部位及び共通の第2のプライマー部位に隣接し、第2の成分は、第1のプライマー部位に相補的な第1のプライマー、及び第2のプライマー部位に相補的な第2のプライマーを含み、第1及び第2のプライマーはそれぞれ少なくとも1つのロックド核酸(LNA)を含むキット。
  36. 2つ以上の核酸配列のそれぞれが非生物学的情報をコードする、請求項35に記載のキット。
  37. 第1及び第2のプライマーのそれぞれが1〜8個のLNAを含む、請求項35又は請求項36に記載のキット。
  38. ライブラリーが、配列番号1〜60から選択される1つ以上の核酸配列を含む、請求項35〜37のいずれか1項に記載のキット。
  39. 第1及び/又は第2のプライマーが、配列番号61〜68から選択される核酸配列を含む、請求項35〜38のいずれか1項に記載のキット。
  40. ライブラリー由来の1つ以上の核酸配列が適用される銃器、弾薬及び発射体からなる群から選択される製造物をさらに含む、請求項35〜39のいずれか1項に記載のキット。
  41. 2つ以上の核酸配列が適用される製造物又はその前駆体をさらに含む、請求項35〜40のいずれか1項に記載のキット。
JP2019524487A 2016-07-22 2017-07-21 核酸配列の増幅方法 Pending JP2019521713A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
AU2016902892 2016-07-22
AU2016902892A AU2016902892A0 (en) 2016-07-22 A method for high-fidelity amplification of a nucleic acid sequence
PCT/AU2017/050757 WO2018014090A1 (en) 2016-07-22 2017-07-21 A method for amplification of nucleic acid sequences

Publications (1)

Publication Number Publication Date
JP2019521713A true JP2019521713A (ja) 2019-08-08

Family

ID=60991706

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019524487A Pending JP2019521713A (ja) 2016-07-22 2017-07-21 核酸配列の増幅方法

Country Status (7)

Country Link
US (1) US20190271032A1 (ja)
EP (1) EP3488016A4 (ja)
JP (1) JP2019521713A (ja)
CN (1) CN110352253A (ja)
AU (1) AU2017298017A1 (ja)
CA (1) CA3031415A1 (ja)
WO (1) WO2018014090A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10650312B2 (en) 2016-11-16 2020-05-12 Catalog Technologies, Inc. Nucleic acid-based data storage
CA3043887A1 (en) 2016-11-16 2018-05-24 Catalog Technologies, Inc. Nucleic acid-based data storage
KR20200132921A (ko) 2018-03-16 2020-11-25 카탈로그 테크놀로지스, 인크. 핵산-기반 데이터를 저장하기 위한 화학적 방법들
EP3794598A1 (en) 2018-05-16 2021-03-24 Catalog Technologies, Inc. Compositions and methods for nucleic acid-based data storage
KR20220017409A (ko) 2019-05-09 2022-02-11 카탈로그 테크놀로지스, 인크. Dna 기반 데이터 저장소에서 검색, 컴퓨팅 및 인덱싱하기 위한 데이터 구조 및 동작
US10956806B2 (en) * 2019-06-10 2021-03-23 International Business Machines Corporation Efficient assembly of oligonucleotides for nucleic acid based data storage
AU2020296430A1 (en) * 2019-06-21 2022-02-17 Asahi Group Holdings, Ltd. Method for preparing DNA library
KR20220080172A (ko) 2019-10-11 2022-06-14 카탈로그 테크놀로지스, 인크. 핵산 보안 및 인증
KR20230008877A (ko) 2020-05-11 2023-01-16 카탈로그 테크놀로지스, 인크. Dna 기반 데이터 스토리지의 프로그램 및 기능
CN113380322B (zh) * 2021-06-25 2023-10-24 倍生生物科技(深圳)有限公司 人工核酸序列水印编码系统、水印字符串及编码和解码方法
CN115131784B (zh) * 2022-04-26 2023-04-18 东莞博奥木华基因科技有限公司 一种图像处理方法、装置、电子设备及存储介质
CN115725570B (zh) * 2022-11-02 2023-10-03 北京金匙医学检验实验室有限公司 基于纳米孔测序的血液样本耐药/毒力基因检测方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3082942B2 (ja) * 1989-05-22 2000-09-04 エフ・ホフマンーラ ロシュ アーゲー 核酸による物質の標識及び追跡方法
US8679788B2 (en) * 2004-03-22 2014-03-25 The Johns Hopkins University Methods for the detection of nucleic acid differences
US8735327B2 (en) * 2010-01-07 2014-05-27 Jeansee, Llc Combinatorial DNA taggants and methods of preparation and use thereof
SG194722A1 (en) * 2011-05-09 2013-12-30 Fluidigm Corp Probe based nucleic acid detection
EP2710172B1 (en) * 2011-05-20 2017-03-29 Fluidigm Corporation Nucleic acid encoding reactions
EP2850381A1 (en) * 2012-05-15 2015-03-25 Selectamark Security Systems PLC Tagging system
AU2013286813A1 (en) * 2012-07-06 2015-02-26 Geneworks Technologies Pty Ltd Method of identification using nucleic acid tags
US20140272097A1 (en) * 2013-03-12 2014-09-18 Applied Dna Sciences, Inc. Dna marking of previously undistinguished items for traceability
US9297032B2 (en) * 2012-10-10 2016-03-29 Apdn (B.V.I.) Inc. Use of perturbants to facilitate incorporation and recovery of taggants from polymerized coatings
US9222122B2 (en) * 2012-11-20 2015-12-29 Src, Inc. System and method for rapid detection and identification of nucleic acid labeled tags

Also Published As

Publication number Publication date
CA3031415A1 (en) 2018-01-25
WO2018014090A1 (en) 2018-01-25
EP3488016A4 (en) 2020-04-01
EP3488016A1 (en) 2019-05-29
AU2017298017A1 (en) 2019-02-21
US20190271032A1 (en) 2019-09-05
CN110352253A (zh) 2019-10-18

Similar Documents

Publication Publication Date Title
JP2019521713A (ja) 核酸配列の増幅方法
US20190241888A1 (en) Combinatorial dna taggants and methods of preparation and use thereof
KR102415404B1 (ko) 핵산 타간트를 사용한 물품의 인증
WO2016164779A1 (en) Integrated system for nucleic acid-based storage of digital data
JP2021524229A (ja) 核酸ベースのデータ記憶のための組成物および方法
WO2015002677A1 (en) Alkaline activation for immobilization of dna taggants
Song et al. Orthogonal information encoding in living cells with high error-tolerance, safety, and fidelity
KR20230065357A (ko) 시료의 식별 방법
JP2022551186A (ja) 核酸セキュリティーおよび認証
US20230308275A1 (en) Nucleic acid storage for blockchain and non-fungible tokens
US20230125457A1 (en) Synthetic molecular tags for supply chain tracking
AU2013257487B2 (en) System and method for rapid detection and identification of nucleic acid labeled tags
EP4212653A1 (en) Molecular tagging using position-oriented nucleic acid encryption
US20230101083A1 (en) Anti-counterfeit tags using base ratios of polynucleotides
WO2023200573A1 (en) Non-amplifiable polynucleotides for encoding information
US20230101409A1 (en) Anti-counterfeit tags using high-complexity polynucleotides
Meiser Advancing Information Technology Using Synthetic DNA as an Alternative to Electronic-Based Media
Wang et al. DNA Digital Data Storage based on Distributed Method
CA3214604A1 (en) Fixed point number representation and computation circuits
최영재 High Information Capacity and Low Cost DNA-based Data Storage through Additional Encoding Characters
Patwardhan Massively parallel functional dissection of regulatory elements
Hayward et al. Employing Botanical DNA to Forensically Tag and Authenticate Objects for Security Purposes

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190405