JP7332733B2 - 次世代シークエンシングのための高分子量dnaサンプル追跡タグ - Google Patents
次世代シークエンシングのための高分子量dnaサンプル追跡タグ Download PDFInfo
- Publication number
- JP7332733B2 JP7332733B2 JP2022030634A JP2022030634A JP7332733B2 JP 7332733 B2 JP7332733 B2 JP 7332733B2 JP 2022030634 A JP2022030634 A JP 2022030634A JP 2022030634 A JP2022030634 A JP 2022030634A JP 7332733 B2 JP7332733 B2 JP 7332733B2
- Authority
- JP
- Japan
- Prior art keywords
- tag
- nucleic acid
- tags
- sequence
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1065—Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Plant Pathology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Description
本出願は、2015年9月29日に出願された米国仮出願番号第62/234,630号、および2016年5月12日に出願された米国仮出願番号第62/335,364号に基づき、それらの利益を主張している。
政府支援による研究に関する陳述
適用なし。
「RMSI-006001WO_SeqList.txt」という名称のテキストファイル(2016年9月27日付けで作成、サイズは20KB)の内容は、それらの全体において参考として援用される。
DNAシークエンシング技術の継続している革命は、医療、農業、および法科学を変容させ、莫大な数のサンプルが制限された時間において処理されるという予測および要求の両方を作り出している。近年の技術総説は、以下の現在のプロジェクトを記載している(例えば、ロードマップ・エピゲノミクス・コンソーシアム(Roadmap Epigenomics Consortium)(これは、ハイスループットDNAシークエンシング技術を使用して、ヒト細胞タイプのエピゲノムを記載する)、マウス脳の単一細胞トランスクリプトミクスを分析する研究、および「以前は想像を絶する」としてニューヨーク市地下鉄のメタゲノミクスを詳細に記録する活動(Perkel, JM, Next-Gen DNA Sequencing: 2015 Update posted at Biocompare on 24 February 2015)。
本開示は、とりわけ、核酸サンプルを追跡するための技術に関するある特定の見通しを提供する。一局面において、本開示は、多くの既存の核酸管理および/または分析システムと関連する問題の出所を同定する。例えば、本開示は、多くのハイスループット設備(例えば、臨床検査室およびコアラボが、サンプルを混同するかまたは二次汚染するリスクを冒すという見通しを包含する。多くの状況では、これらのタイプのエラーは、標準的な品質コントロールワークフローによって検出不能であり、特に、臨床上の背景(例えば、体細胞変異検出)、法医学検査におけるDNA分析のエラーなどでは、潜在的に重大な結論を伴う。本開示は、従って、このようなエラーの検出が重要であり、サンプル取り扱いおよび分析における必要性が満たされていないことを認識している。
めに使用され得る。いくつかの実施形態において、反復性のタグ構造は、標的とされたシークエンシング適用(例えば、ハイブリッド捕捉およびアンプリコンシークエンシング)において提供されるタグの使用を可能にする。コンビナトリアルサンプルタグ化は、特有のタグ配列の比較的小さなセットを使用して、多くの特有のサンプルタグ組み合わせの生成を可能にする。とりわけ、提供されるサンプルタグ化方法論は、サンプルセキュリティー(特に、ハイスループット、例えば、NGSサンプルのために)およびサンプル収集から配列分析までのプロセス制御を確実にするための単純かつ強力な手段を提供する。
本出願において、文脈から別段明らかでなければ、(i)用語「1つの、ある(a)」は、「少なくとも1」を意味すると理解され得る;(ii)用語「または(or)」は、「および/または」を意味すると理解され得る;(iii)用語「含む、包含する(comprising)」および「含む、包含する(including)」は、単独で示されていようが、1もしくはこれより多くのさらなる成分もしくは工程と一緒に提示されていようが、箇条書きにした成分または工程を包含すると理解され得る;そして(iv)用語「約」および「およそ」は、当業者によって理解されるとおりの標準的変動を許容すると理解され得る;そして(v)範囲が提供される場合、端点は包含される。
、5%、4%、3%、2%、1%、もしくはこれより小さい範囲内に入る値の範囲に言及する。
分の単離および/または精製などのような技術に一次サンプルを供することによって得られる核酸またはタンパク質を含み得る。
況において本明細書で使用される場合、例えば、プライマーダイマーの形成またはゲノムDNA配列もしくはサンプルDNA配列への結合を含む、有害な効果なしに同じ反応において使用され得る、ある反応内の例えば2つのプライマーの特徴をいう。適合性のプライマーは、例えば、%GC含有量、融解温度および結合特異性を含む類似の特徴を有し得る。その結果それらは、互いに対してより、意図した標的に結合する可能性がより高い。
consists essentially of)」)より限定された組成物または方法を記載し、その組成物または方法がその指定された本質的なエレメントもしくは工程を含み、そしてまた、その組成物または方法の基本的かつ新規な特徴に本質的に影響を及ぼさないさらなるエレメントもしくは工程を含み得ることを意味することは、理解されるべきである。もしくはこれより多くの指定されたエレメントまたは工程を「含む」かまたはこれら「から本質的になる」と本明細書で記載される任意の組成物または方法はまた、その相当する、その指定されたエレメントまたは工程「からなる(consisting
of)」(または「からなる(consists of)」、いかなる他の指定されていないエレメントまたは工程の排除へとより限定されかつ閉鎖系の組成物または方法を記載することはまた、理解される。本明細書で開示される任意の組成物または方法において、任意の指定された本質的なエレメントまたは工程の、公知のまたは開示された均等物は、そのエレメントまたは工程の代わりに使用され得る。
し得る1もしくはこれより多くの調節エレメントを含み得る。
も約500ベース、少なくとも約600ベース、少なくとも約700ベース、少なくとも約800ベース、少なくとも約900ベース、少なくとも約1キロベース、少なくとも約2キロベース、少なくとも約3キロベース、少なくとも約4キロベース、少なくとも約5キロベース、少なくとも約6キロベース、少なくとも約7キロベース、少なくとも約8キロベース、少なくとも約9キロベース、少なくとも約10キロベース、少なくとも約11キロベース、少なくとも約12キロベース、少なくとも約13キロベース、少なくとも約14キロベース、少なくとも約15キロベース、少なくとも約16キロベース、少なくとも約17キロベース、少なくとも約18キロベース、少なくとも約19キロベース、少なくとも約20キロベース、少なくとも約30キロベース、少なくとも約40キロベース、少なくとも約50キロベース、少なくとも約60キロベース、少なくとも約70キロベース、少なくとも約80キロベース、少なくとも約90キロベース、少なくとも約100キロベースまたは100キロベースよりも多くを含むかまたはそれからなる。
よび/またはポリペプチド分子間の全体の関連性をいう。いくつかの実施形態において、ポリマー分子は、これらの配列が、少なくとも25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、または99%同一である場合に、互いに対して「実質的に同一」であると考えられる。例えば、2つの核酸配列またはポリペプチド配列の%同一性の計算は、最適な比較目的でその2つの配列を整列させることによって行われ得る(例えば、ギャップは、最適なアラインメントのために第1のおよび第2の配列のうちの一方または両方において導入され得、同一でない配列は、比較目的のために無視され得る)。ある特定の実施形態において、比較目的で整列される配列の長さは、参照配列の長さのうちの少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、または実質的に100%である。次いで、相当する位置でのヌクレオチドが比較される。第1の配列中の位置を、第2の配列中の相当する位置と同じ残基(例えば、ヌクレオチドまたはアミノ酸)が占めている場合、その分子は、その位置で同一である。その2つの配列間の%同一性は、ギャップの数、および各ギャップの長さ(これは、その2つの配列の最適なアラインメントのために導入される必要がある)を考慮して、配列によって共有される同一の位置の数の関数である。配列の比較および2つの配列間の%同一性の決定は、数学的アルゴリズムを使用して達成され得る。例えば、2つのヌクレオチド配列間の%同一性は、MeyersおよびMillerのアルゴリズム(CABIOS, 1989, 4: 11-17)(これは、ALIGNプログラム(バージョン2.0)に組み込まれた)を使用して決定され得る。いくつかの例示的実施形態において、ALIGNプログラムで行われる核酸配列比較は、PAM120重み付け残基表、ギャップ長ペナルティー12およびギャップペナルティー4を使用する。2つのヌクレオチド配列間の%同一性は、代わりに、NWSgapdna.CMPマトリクスを使用するGCGソフトウェアパッケージ中のGAPプログラムを使用して、決定され得る。
されるかまたは天然において核酸分子を生成する細胞系とは異なる細胞系において合成される核酸分子は、「単離された」核酸分子であると考えられる。代わりにまたはさらに、いくつかの実施形態において、1もしくはこれより多くの精製技術に供された核酸分子は、a)この核酸分子が天然に関連付けられている他の成分;および/またはb)最初に生成されたときにこの核酸分子が関連付けられている他の成分とは分離されている程度まで、「単離された」核酸分子であると考えられ得る。
Poljak, R. J.ら (1994) Structure 2: 1 121-1123を参照のこと).
デノシン、デオキシチミジン、デオキシグアノシン、およびデオキシシチジン)であるか、これらヌクレオシドを含むか、またはこれらヌクレオシドからなる。いくつかの実施形態において、核酸は、1もしくはこれより多くのヌクレオシドアナログ(例えば、2-アミノアデノシン、2-チオチミジン、イノシン、ピロロ-ピリミジン、3-メチルアデノシン、5-メチルシチジン、C-5 プロピニル-シチジン、C-5 プロピニル-ウリジン、2-アミノアデノシン、C5-ブロモウリジン、C5-フルオロウリジン、C5-ヨードウリジン、C5-プロピニル-ウリジン、C5-プロピニル-シチジン、C5-メチルシチジン、2-アミノアデノシン、7-デアザアデノシン、7-デアザグアノシン、8-オキソアデノシン、8-オキソグアノシン、0(6)-メチルグアニン、2-チオシチジン、メチル化塩基、インターカレートされた塩基(intercalated base)、およびこれらの組み合わせ)であるか、これらヌクレオシドアナログを含むか、またはこれらヌクレオシドアナログからなる。いくつかの実施形態において、核酸は、天然の核酸の中にあるものと比較した場合、1もしくはこれより多くの改変糖(例えば、2’-フルオロリボース、リボース、2’-デオキシリボース、アラビノース、およびヘキソース)を含む。いくつかの実施形態において、核酸は、RNAまたはタンパク質のような機能的遺伝子生成物をコードするヌクレオチド配列を有する。いくつかの実施形態において、核酸は、1もしくはこれより多くのイントロンを含む。いくつかの実施形態において、核酸は、天然供給源からの単離、相補的テンプレートに基づく重合による酵素的合成(インビボまたはインビトロ)、組換え細胞もしくは系における再現、および化学合成のうちの1もしくはこれより多くによって調製される。いくつかの実施形態において、核酸は、少なくとも、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、20、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000またはより多くの残基の長さである。いくつかの実施形態において、核酸は、1本鎖である;いくつかの実施形態において、核酸は、2本鎖である。いくつかの実施形態において、核酸は、ポリペプチドをコードするか、またはそのポリペプチドをコードする配列の相補体である少なくとも1つのエレメントを含むヌクレオチド配列を有する。いくつかの実施形態において、核酸は、酵素活性を有する。
形態において、薬剤または実体は、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%純粋である。
left)、結合部位)の存在に依存する。特異性は、絶対的である必要はないことは理解されるべきである。いくつかの実施形態において、特異性は、1もしくはこれより多くの他の潜在的標的実体(例えば、競合相手)に関する結合剤の特異性に対して評価され得る。いくつかの実施形態において、特異性は、参照特異的結合薬剤のものと比較して評価される。いくつかの実施形態において、特異性は、参照非特異的結合薬剤のものと比較して評価される。いくつかの実施形態において、上記薬剤または実体は、その標的実体への結合の条件下で、競合する代わりの標的には検出可能に結合しない。いくつかの実施形態において、結合薬剤は、その競合する代わりの標的と比較した場合に、その標的実体へのより高い結合速度(on-rate)、より低い解離速度(off-rate)、増大した親和性、低下した解離、および/または増大した安定性で結合する。
Vol. 132), Humana Press, 1999に記載される。同一の配列を同定することに加えて、上述のプログラムは、代表的には、同一性の程度の表示を提供する。いくつかの実施形態において、2つの配列は、これらの相当する残基のうちの少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%もしくはこれより多くが、残基の直接関連する伸長部にわたって同一である場合に、実質的に同一であると考えられる。いくつかの実施形態において、その直接関連する伸長部は、完全な配列である。いくつかの実施形態において、その直接関連する伸長部は、少なくとも、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500またはより多くの残基である。
: 語句「実質的相同性」は、アミノ酸配列または核酸配列の間の比較に言及するために本明細書で使用される。当業者によって認識されるように、2つの配列は一般に、これらが相当する位置において相同な残基を含む場合に、「実質的に相同」であると考えられる。相同な残基は、同一な残基であってもよい。代わりに、相同な残基は、適切に類似の構造および/または機能的特徴を有する同一でない残基であってもよいこの分野で周知であるように、アミノ酸配列または核酸配列は、種々のアルゴリズム(市販のコンピュータープログラム(例えば、ヌクレオチド配列に関してはBLASTN、ならびにアミノ酸配列に関してはBLASTP、gapped BLAST、およびPSI-BLAST)の中で利用可能なものが挙げられる)のうちのいずれかを使用して比較され得る。例示的なこのようなプログラムは、Altschulら, Basic local alignment search tool, J. Mol. Biol., 215(3): 403-410, 1990; Altschulら, Methods in Enzymology; Altschulら,「Gapped BLAST and PSI-BLAST: a new generation of protein database search programs」, Nucleic Acids Res. 25:3389-3402, 1997; Baxevanisら, Bioinformatics : A Practical Guide to the Analysis of Genes and Proteins, Wiley, 1998;およびMisenerら, (編), Bioinformatics Methods
and Protocols (Methods in Molecular Biology, Vol. 132), Humana Press, 1999に記載される。相同な配列を同定することに加えて、上述のプログラムは、代表的には、相同性の程度の表示を提供する。いくつかの実施形態において、2つの配列は、これらの相当する残基のうちの少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%もしくはこれより多くが、残基の直接関連する伸長部にわたって相同である場合に、実質的に相同であると考えられる。いくつかの実施形態において、その直接関連する伸長部は、完全な配列である。いくつかの実施形態において、その直接関連する伸長部は、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、少なくとも70、少なくとも75、少なくとも80、少なくとも85、少なくとも90、少なくとも95、少なくとも100、少なくとも125、少なくとも150、少なくとも175、少なくとも200、少なくとも225、少なくとも250、少なくとも275、少なくとも300、少なくとも325、少なくとも350、少なくとも375、少なくとも400、少なくとも425、少なくとも450、少なくとも475、少なくとも500またはより多くの残基である。
」の配列は、可変である。本明細書で使用される場合、可変のはまた、縮重オリゴヌクレオチド混合物の限界希釈を生じることによって、本発明のタグを設計するという概念に適用される。
またはさもなければ「変異体」と考えられ得る。いくつかの実施形態において、その親または参照ポリペプチドは、天然に見出されるものである。当業者によって理解されるように、目的の特定のポリペプチドの複数の改変体は、天然において、特に、その目的のポリペプチドが感染性因子のポリペプチドである場合に、一般に見出され得る。
本出願は、とりわけ、タグを提供する。一局面において、タグは、サンプルを同定する、サンプルを追跡する、サンプルを分析するなど、およびこれらの組み合わせのために有用である。
反応内で各サンプルを明白に同定するという同じ結果を提供する。各別個のサンプルは、各サンプルに関する識別コードを提供する1種もしくはこれより多くのタグを含み得る。そのサンプル内の任意の所定のサンプルに関して指定されたコードに属しない任意のタグの同定は、汚染を示す。各コードが各サンプルに特有であるので、その汚染源は、汚染タグが一旦同定された後に直ぐに知られる。ハイスループット適用のために、特有の配列を有すると同時に、サンプル(DNAポリマー)と同じ物質から構成されるタグを使用すると、サンプル配列の同定、追跡、分析などのために有意に増大した効率が可能になる。
いくつかの実施形態において、本発明に従って分析されるべきサンプル(例えば、このサンプルに1種もしくはこれより多くのタグが付加され得る)は、核酸を含む。いくつかの実施形態において、サンプルは、核酸配列分析に反応しやすいという点で特徴付けられる。例えば、いくつかの実施形態において、サンプルは、核酸シークエンシング酵素または試薬の1もしくはこれより多くの特定のインヒビターを実質的に含まない可能性がある。いくつかの実施形態において、サンプルは、このような分析が成功裡に行われ得る分析されるべき核酸に関して、十分に純粋であり得る。
ge)(例えば、導管洗浄液または気管支肺胞洗浄液);吸引物;擦過物;骨髄標本;組織生検標本;摘出標本;他の体液、分泌物、および/または排出物;ならびに/あるいはこれらに由来する細胞などを含み得るか、またはこれらからなり得る。いくつかの実施形態において、生物学的サンプルは、個体から得られる細胞を含むかまたはこの細胞からなる。いくつかの実施形態において、得られる細胞は、そのサンプルが得られる個体に由来する細胞であるかまたはこの細胞を含む。
ような「処理されたサンプル」は、サンプルから抽出されるかまたは一次サンプルを、mRNAの増幅もしくは逆転写、ある特定の成分の単離および/もしくは精製などのような技術に供することによって得られる、例えば、核酸またはタンパク質を含み得る。いくつかの実施形態において、粗製サンプルに適用される処理は、分析用のサンプルが提供されるように、粗製サンプルに存在した核酸を精製するという効果を有する。
本開示は、例えば、分析を受けている核酸サンプルの追跡、同定および/またはさもなければ処理の改善において使用するためのタグを提供する。提供されるタグは、例えば、核酸サンプルを同定および/または二次汚染を検出するために使用される場合、公知のタグまたはタグ化システムと比較して種々の利点を付与する。
ailによって記載されるとおりの核酸マーカー分子が粗製サンプルに添加される場合、それらは、おそらく、その後の処理工程の間に(例えば、剪断工程の間に)壊れやすいことを認識する。
有用なこのようなタグは、配列A(不変)、配列B(各タグに特有)および配列C(不変)の反復ユニットを含むかまたはその反復ユニットからなり、1タグあたりA-B-Cの少なくとも2個の反復ユニットを有するヌクレオチド配列を有するように設計および/または構築され得ることが企図される。いくつかの実施形態において、タグは、X-[A-B-C]n-Yを含む式に従って配置され、ここでnは、少なくとも2であり、そしてA、B、およびCの各々は、2個もしくはこれより多くの残基の規定された長さを有する。いくつかの実施形態において、Xは、必要に応じて存在するかまたは非存在であり、存在する場合、-C-の1もしくはこれより多くの例からなり得るかまたはこれら例を含み得るか、あるいはさもなければ、別のエレメントからなり得るかまたは別のエレメントを含み得る。いくつかの実施形態において、Yは、必要に応じて存在するかまたは非存在であり、存在する場合、-A-の1もしくはこれより多くの例からなり得るかまたはこれら例を含み得るか、あるいはさもなければ、別のエレメントからなり得るかまたは別のエレメントを含み得る。いくつかの実施形態において、そのエレメントは、核酸、5’プライマー改変もしくは3’プライマー改変(例えば、ホスホロチオエート化、内部改変、メチル化シトシンなど)を含むかまたはこれらからなる。
子量であると考えられる。いくつかの実施形態において、タグは、処理手順(例えば、剪断)を通じて残る場合に、高分子量であると考えられる。
キロベース、約15キロベース、約16キロベース、約17キロベース、約18キロベース、約19キロベース、約20キロベース、約30キロベース、約40キロベース、約50キロベース、約60キロベース、約70キロベース、約80キロベース、約90キロベース、約100キロベースおよび100キロベース超である。いくつかの実施形態において、高分子量タグは、約400ベース~約100キロベース超の間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約500ベース~約100キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約600ベース~約90キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約700ベース~約80キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約800ベース~約70キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約900ベース~約60キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約1キロベース~約50キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約2キロベース~約40キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約3キロベース~約30キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約4キロベース~約20キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約5キロベース~約19キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約6キロベース~約18キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約7キロベース~約17キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約7キロベース~約16キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約8キロベース~約15キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約9キロベース~約14キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約10キロベース~約13キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約11キロベース~約12キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約500ベース~約5キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約600ベース~約6キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約700ベース~約7キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約800ベース~約8キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約900ベース~約9キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約1キロベース~約50キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約2キロベース~約40キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約2キロベース~約30キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約2キロベース~約20キロベースの間の範囲内の長さを有する。いくつかの実施形態において、高分子量タグは、約1キロベース~約5キロベースの間の範囲内の長さを有する。
、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、2000、300、4000、5000、6000、7000、8000、9000、10000、11000、12000、13000、14000、15000、16000、17000、18000、19000、20000、21000、22000、23000、24000、25000、26000、27000、28000、29000、30000、31000、32000、33000、34000、35000、36000、37000、38000、39000、40000、41000、42000、43000、44000、45000、46000、47000、48000、49000、50000、60000、70000、80000、90000、100000、110000、120000、130000、140000、150000、160000、170000、180000、190000、200000、210000、220000、230000、240000、250000、260000、270000、280000、290000、または300000ベースを含み得るかまたはそれからなり得る。
ットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約3~約290のユニットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約24~約280のユニットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約5~約270のユニットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約6~約260のユニットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約7~約250のユニットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約8~約240のユニットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約9~約230のユニットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約10~約220ユニットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約11~約210のユニットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約12~約200のユニットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約13~約190のユニットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約14~約180のユニットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約15~約170のユニットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約16~約180のユニットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約17~約190のユニットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約18~約180のユニットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約19~約170のユニットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約20~約160のユニットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約21~約150のユニットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約22~約140のユニットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約23~約130ユニットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約24~約120ユニットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約25~約110ユニットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約26~約100のユニットを含むかまたはそれからなる。いくつかの実施形態において、タグは、少なくとも約27~約90のユニットを含むかまたはそれからなる。
%、10%、15%、20%、25%、30%、35%、40%、45%、50%、またはその間の任意のパーセンテージの値に等しいかまたはこれらの値未満の相同性または同一性を有するように設計および/または選択された配列を有する。いくつかの実施形態において、エレメントBは、任意のおよび全ての公知の植物配列(例えば、配列情報の利用可能なデータベースへの参照によって決定される場合)から別個であるように設計および/または選択された配列を有する。例えば、いくつかの実施形態において、エレメントBは、任意のおよび全ての公知の植物配列(例えば、配列情報の利用可能なデータベースを参照することによって決定される場合)に対して1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、またはその間の任意のパーセンテージの値に等しいかまたはこれらの値未満の相同性または同一性を有するように設計および/または選択された配列を有する。いくつかの実施形態において、エレメントBは、任意のおよび全ての公知の脊椎動物配列(例えば、配列情報の利用可能なデータベースへの参照によって決定される場合)から別個であるように設計および/または選択された配列を有する。例えば、いくつかの実施形態において、エレメントBは、任意のおよび全ての公知の脊椎動物配列(例えば、配列情報の利用可能なデータベースを参照することによって決定される場合)に対して1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、またはその間の任意のパーセンテージの値に等しいかまたはこれらの値未満の相同性または同一性を有するように設計および/または選択された配列を有する。いくつかの実施形態において、エレメントBは、任意のおよび全ての公知の無脊椎動物配列(例えば、配列情報の利用可能なデータベースへの参照によって決定される場合)から別個であるように設計および/または選択された配列を有する。例えば、いくつかの実施形態において、エレメントBは、任意のおよび全ての公知の無脊椎動物配列(例えば、配列情報の利用可能なデータベースを参照することによって決定される場合)に対して1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、またはその間の任意のパーセンテージの値に等しいかまたはこれらの値未満の相同性または同一性を有するように設計および/または選択された配列を有する。いくつかの実施形態において、エレメントBは、任意のおよび全ての公知の哺乳動物配列(例えば、配列情報の利用可能なデータベースへの参照によって決定される場合)から別個であるように設計および/または選択された配列を有する。例えば、いくつかの実施形態において、エレメントBは、任意のおよび全ての公知の哺乳動物配列(例えば、配列情報の利用可能なデータベースを参照することによって決定される場合)に対して1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、またはその間の任意のパーセンテージの値に等しいかまたはこれらの値未満の相同性または同一性を有するように設計および/または選択された配列を有する。いくつかの実施形態において、エレメントBは、任意のおよび全ての公知のヒト配列(例えば、配列情報の利用可能なデータベースへの参照によって決定される場合)から別個であるように設計および/または選択された配列を有する。例えば、いくつかの実施形態において、エレメントBは、任意のおよび全ての公知のヒト配列(例えば、配列情報の利用可能なデータベースを参照することによって決定される場合)に対して1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、またはその間の任意のパーセンテージの値に等しいかまたはこれらの値未満の相同性または同一性を有するように設計および/または選択された配列を有する。いくつかの実施形態において、エレメントBは、任意のおよび全ての公知のウイルス、細菌、微生物および/または酵母の配列(例えば、配列情報の利用可能なデータベースへの参照によって決定される場合)から別個であるように設計および/または選択された配列を有する。例えば、いくつかの実施形態において、エレメントBは、任意のおよび全ての公知のウイルス、細菌、微生物および/または酵母の配列(例えば、配列情報の利用可能なデータベースを参照することによって決定される場合)に対して1%、2%、3%、4%
、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、またはその間の任意のパーセンテージの値に等しいかまたはこれらの値未満の相同性または同一性を有するように設計および/または選択された配列を有する。配列情報の公的に利用可能なデータベースとしては、例えば、GenBank(ncbi.nlm.nih.gov/genbank)が挙げられるが、これらに限定されない。代わりにまたはさらに、いくつかの実施形態において、エレメントBは、およそ35~65%、およそ40~60%、およそ45~55%、またはおよそ50%のG/C含有量によって特徴付けられる配列を有するように設計および/または選択された配列を有する。
の高分子量核酸タグの有用性および予測外の利点を教示し、示す。ここでXおよびYは、選択肢的であり、A、B、およびCは、本明細書で記載されるとおりである。多くの実施形態において、タグ内の各「A」は、そのタグ内の互いの「A」と同一である;タグ内の各「B」は、タグ内の互いの「B」と同一である;そしてタグ内の各「C」は、タグ内の互いの「C」と同一である。その結果、そのタグは、真に同一の反復ユニットの構造を有する。しかし、本明細書で記載される場合、本開示の一局面は、エレメント内の正確な配列同一性の厳格な定義が本明細書で記載されるとおりの有効なかつ有用なタグ化のために必要とされなくてもよいという見通しである。いくつかの実施形態において、本明細書で記載されるとおりのタグは、各々のおよびあらゆる反復ユニットが、あらゆる他の単位と完全に同一でない場合ですら、なお有効であり得る。例えば、いくつかの実施形態において、タグ内の1もしくはこれより多くの「B」エレメントは、変動し得る。いくつかの実施形態において、1もしくはこれより多くのAまたはCエレメントは、変動し得るが、一般に、単一のタグ内の全てのAおよびCエレメントは、これらが匹敵するかまたは同一の長さの増幅生成物を生成するために、同じプライマーセットとハイブリダイズして伸長を可能にし得る(それらの間のBエレメントが、このような匹敵することまたは同一性を担保するために適切な長さのものであることをも要求する)という点で適合性であることは好ましい。従って、例えば、本明細書で記載されるとおりの有用なタグが、構造:
X-Ai-Bi-Ci-Aii-Bii-Cii-Aiii-Biii-Ciii- ... -An-Bn-Cn-Y、および/または
X-[Ai-Bi-Ci]ni-[Aii-Bii-Cii]nii-[Aiii-Biii-Ciii]niii- ... [An-Bn-Cn]nn
を有し得ることは考えられる。
、タグがバーコードモチーフ、好ましくは、明確に同定可能であるために十分長いが、少なくとも1個の完全タグ(full tag)、例えば、約100bpよみとりあたりを担保するために十分短いバーコードモチーフを含むことは、望ましい;本明細書で例示されるある特定の実施形態において、20塩基対のバーコードモチーフを利用した。いくつかの実施形態において、バーコードモチーフは、少なくとも約6~少なくとも約10000ヌクレオチドである。いくつかの実施形態において、バーコードモチーフは、少なくとも、約6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、2000、300、4000、5000、6000、7000、8000、9000、10000ヌクレオチドである。いくつかの実施形態において、バーコードモチーフは、少なくとも約6~少なくとも約100個のヌクレオチドである。いくつかの実施形態において、バーコードモチーフは、少なくとも約8~少なくとも約80ヌクレオチドである。いくつかの実施形態において、バーコードモチーフは、少なくとも約8~少なくとも約60ヌクレオチドである。いくつかの実施形態において、バーコードモチーフは、少なくとも約10~少なくとも約50ヌクレオチドである。いくつかの実施形態において、バーコードモチーフは、少なくとも約10~少なくとも約40ヌクレオチドである。いくつかの実施形態において、バーコードモチーフは、少なくとも約10~少なくとも約30ヌクレオチドである。いくつかの実施形態において、バーコードモチーフは、少なくとも約10~少なくとも約20ヌクレオチドである。
いくつかの実施形態において、本開示は、例えば、複数の別個のサンプルを個々にマークする/標識するために、一緒に(例えば、多重化シークエンシング分析において)利用され得る場合、本明細書で記載されるとおりのタグのセットを提供する。いくつかの実施形態において、セット内の異なるタグは、関連する構造を有する。一例を挙げると、いくつかの実施形態において、セットの中の全てのタグは、共通するAおよび/またはCエレメントを有し得るが、それらのBエレメントにおいて互いとは異なり得る。いくつかのこのような実施形態において、セット内の全てのタグが、匹敵するかまたは同一の長さおよび/またはGC含有量などであるが、異なる正確な配列のBエレメントを有し得る。
セット1: タグ1、タグ2、 …、タグN
タグ1: X1-[A1-B1-C1]n1-Y1
タグ2: X2-[A2-B2-C2]n2-Y2
タグN: X3-[AN-BN-CN]nN-YN;
によって表され得る。いくつかの実施形態において、n1、n2、およびnNは、全て同じである(すなわち、セットの中の全てのタグは、同じ長さを有する);いくつかの実施形態において、n1、n2、およびnNは、匹敵する(すなわち、セットの中の全てのタグは、匹敵する長さを有する)。いくつかの実施形態において、セットの中の異なるタグは、異なる長さを有し得る。
において下限による境界がある範囲内のある特定の実施形態において、例えば、AおよびCがタグ間で不変であり、Bが異なるようにされているタグのセットは、有利な特徴としての編集距離の使用が企図される。
本発明に従うタグは、いくつかの方法論を使用して生成され得る。いくつかの実施形態において、タグは、2本鎖DNA環のライゲーション、続いて、多重置換増幅(MDA)を介して生成される。いくつかの実施形態において、タグは、図2~5に示される例示的方法に従って生成される。
2)を表し、XおよびYは、タグ212の末端に対して作製されたさらなる核酸または核酸改変を表す。
ゴ328は、次いで、マルチウェルプレート326のウェルの各々へと添加され得る。そのブリッジオリゴ328は、モノマー324の各々にアニールして、環状構築物330を形成し得る。本例において、例となる環状構築物330は、モノマー316を含み、ここでモノマー316の末端は、ブリッジオリゴ328の配列と比較して、モノマー316の末端の間にニックは存在するがヌクレオチドギャップは存在しないように、ブリッジオリゴ328に各々ハイブリダイズされる。この構成において、モノマー316の末端は、一緒に連結されて、環状テンプレート332を提供し得る。そのテンプレート332は、次いで、テンプレート332の配列に相補的な複数の連続する反復配列を有する長いssDNA 334を提供するために、例えば、MDAを使用して増幅され得る。第2鎖合成およびssDNA 334のその後の増幅は、本開示に従う高分子量2本鎖DNA(dsDNA)を提供するために、逆方向プライマー336および正方向プライマー338を通じて達成され得る。一局面において、その得られたタグは、式Xi-[A-B-C]n-Yjを有し、ここでnは、モノマーまたは特定のモノマー配列の反復ユニットの数(代表的には、少なくとも2)を表し、XおよびYは、タグの末端に対して作製されるさらなる核酸または核酸改変を表す。
例えば、ACGCGACGNNNNNNTGGGACGAは、縮重として特徴付けられるべき基準を満たす。例示された配列でのオリゴヌクレオチド合成は、6個の連続する縮重ヌクレオチドの存在および4種の異なる塩基(すなわち、A、T、G、およびC)の使用に起因して、46のオリゴヌクレオチドを生じる。
たはこの工程からなる。いくつかの実施形態において、第3の工程は、MDAを鎖置換ポリメラーゼ(例えば、phi29(φ29)DNAポリメラーゼまたはBst DNAポリメラーゼ)で行う工程を含むかまたはこの工程からなる。このようなポリメラーゼの使用は、このようなポリメラーゼの校正特徴および高信頼性の性能に起因して有利であることが企図される。いくつかの実施形態において、第4の工程は、少なくとも1種のMDA生成物の次世代シークエンシングによってタグ同一性および純度を確認する工程を含むかまたはこの工程からなる。
直接合成され得る。
いくつかの実施形態において、コンビナトリアルサンプルタグ化は、本発明に従って使用される。いかなる特定の理論にも拘束されることは望まないが、384程度の少なさのタグとともに、およびサンプルあたり3種もしくは4種のタグを使用すると、サンプルあたり3種および4種のタグの各々が可能にした特有の組み合わせは、C(384,3)=9,363,584およびC(384,4)=891,881,376の特有の組み合わせであることは、可能である。いくつかの実施形態において、このような組み合わせは、その施設を通じて移動するあらゆるサンプルを特有にタグ化するためのシークエンシングコアを可能にする。さらに、384種のタグの別のセットと組み合わせると、地球上のあらゆる個体を特有にタグ化することが可能である。
本発明はまた、本発明に従う少なくとも1種のタグを含む1もしくはこれより多くの容器を有するパッケージユニットを含むキット形式を企図する。いくつかの実施形態において、キットは、タグ再構成または希釈に使用される種々の試薬の容器を含む。いくつかの実施形態において、キットは、例えば、PCR、処理および/またはシークエンシング分析のために使用される種々の試薬の容器を含む。いくつかの実施形態において、キットはまた、緩衝液、説明書、およびコントロールのうちの少なくとも1もしくはこれより多くを含み得る。
本発明に従うタグのための種々の使用は、企図される。いくつかの実施形態において、サンプルは、サンプルと少なくとも1種もしくはこれより多くのタグとを接触させることによってタグ化される。いくつかの実施形態において、ゼロまたは少なくとも1種もしくはこれより多くのタグが、サンプル収集の前、間、または直後に、サンプルを含む容器へとスパイクインされる。いくつかの実施形態において、ゼロまたは少なくとも1種もしくはこれより多くのタグが、処理の前、間、または後に、サンプルへとスパイクインされる。いくつかの実施形態において、0、1種もしくはこれより多くのタグが、分離前または分離後にサンプルへとスパイクインされる。いくつかの実施形態において、0、1種もしくはこれより多くのタグが、精製前または精製後にサンプルへとスパイクインされる。いくつかの実施形態において、0、1種もしくはこれより多くのタグが、下流の処理および/または分析が起こっている容器へとスパイクインされる。いくつかの実施形態が、シークエンシングエラーを決定および較正するための手段として、合成のスパイクインタグの使用を可能にし得ることは、認識される。このような決定および較正は、例えば、公知配列および可変配列の高い信頼性の生成に基づき、ここでミスマッチが配列の後ろに、観察された配列アラインメントと予測された配列アラインメントとの間に観察される場合、このようなミスマッチが、サンプルを分析するために使用されるシークエンシングプロセスの化学および/または塩基コーリングに起因し得ると高い信頼度で決定され得ることを合理的に確信し得る。
ば、反復、ヘアピンなど)をシークエンシングする際にシークエンシングプロセスがどの程度良好か、または分析プラットフォームにおける参照配列(例えば、IlluminaシークエンシングにおけるphiXゲノム)の使用を評価するために使用され得る。本発明の合成配列が、既知の生物のゲノムに由来するコントロールを使用するプラットフォームに対する比較において使用することに関する利点を提供することは、認識される。
高分子量2本鎖DNAタグを、以下で記載される成分および方法論を使用して生成した。
RCA_タグ_2:
この第2のオリゴ(配列番号5)は、上記第1のオリゴ(配列番号1)のA領域(配列番号2)およびC領域(配列番号4)を含んだ。しかし、この第2のオリゴは(配列番号5)は、タグ2配列を有する異なるB領域を含んだ:
B領域(タグ2):
正方向プライマー(RCA_PCR_F):
逆方向プライマー(RCA_PCR_R):
dNTPs(各々、0.4μl~200μM)、1μl 20×KAPA SYBR GREEN染料、水を20μlになるまで。増幅のために、その反応混合物を、合計200読み取りのためのグリーンチャネルを使用して、2分ごとに蛍光測定値を集めながら、30℃で400分間維持した。
実施例1の既知質量のタグ1を、Bordetella pertussis由来の既知質量のゲノムDNA(gDNA)へとスパイクし、Illumina適合ライブラリーを、KAPA Hyper Plusライブラリー調製キットで作製した。
ライブラリー1: 4000読み取り(合計のうちの0.8%)
ライブラリー2: 6500読み取り(合計のうちの1.3%)
ライブラリー3: 0読み取り(合計のうちの0%)
ライブラリー4: 0読み取り(合計のうちの0%)
一局面において、タグ1 HMW DNAのスパイクインは、配列分析の後にタグ化ライブラリーの同定を可能にした。さらに、タグ1 HMW DNAのスパイクインは、非常に少量(1ng)および多量(50ng)のテンプレートDNAにおいて有効であった。別の局面において、タグ1 DNAを、PCR増幅したNGSライブラリーにおいて保持した。さらに別の局面において、スパイクイン 対 サンプルDNAの質量比は、タグ1
HMW DNAでスパイクしたライブラリーにおいてタグ1に対してマッピングしたIlluminaの短い読み取りのパーセンテージによって反映された。
HMW DNAスパイクインタグを、実施例1に記載されるプロトコルに従ってRCA_タグ_1(配列番号1)およびRCA_タグ_2(配列番号5)から調製し、それによって、それぞれ、スパイクインタグであるタグ1およびタグ2を生じた。タグ1およびタグ2のライブラリーグリッドへのスパイクインは、表1に詳述される実験設計に従って試験した。
さらに14種のタグを設計した。これらタグは、可変領域において>8の編集距離を有する。HMW DNAタグを、φ29 DNAポリメラーゼおよびBst DNAポリメラーゼを使用して、これらタグの部分セットから合成した。これらHMW タグを、Illumina MiSeqプラットフォームを使用してシークエンシングして、純度および配列一致を検証した。それらタグは、以下のモノマー(すなわち、[A-B-C]1)配列(B領域には下線を付す)を有した:
LF DNAポリメラーゼで生成したHMWタグは、純粋であり(表4)、HMW DNAタグ1、2、4、5、7、11、および13のディープシークエンシング(deep
sequencing)は、その推定される配列に対して非常に良好な一致を示した(図11)。
さらなる80種のssDNAオリゴを設計した。これらは、可変領域において>8の編集距離を有する。
一局面において、メチル化ヌクレオチドは、タグ配列へと組み込まれ得、これは、種々の適用に有用である。1もしくはこれより多くのメチル化ヌクレオチドを有するタグの一適用は、重亜硫酸シークエンシング(bisulfite sequencing)実験、メチル化DNA免疫沈降(MeDIP)実験、またはこれらの組み合わせに関するスパイクインコントロールを含む。一般に、MeDIPは、精製技術であり、この技術では、サンプルがメチル化DNA配列に関して富化される。従って、1もしくはこれより多くのメチル化ヌクレオチドを有するタグは、メチル化タグの富化と一緒にサンプル中の任意のメチル化配列を提供するために、富化の前にサンプルに添加され得る。
りに)、重亜硫酸シークエンシング実験に有用であり得る。一例では、タグにおけるメチル化ヌクレオチド 対 非メチル化ヌクレオチドの比(すなわち、メチル化比)は、重亜硫酸変換の程度を追跡するために変動され得る。さらに、そのメチル化比は、異なるレベルのメチル化を検出するために必要とされる重亜硫酸変換の量を同定するために、変動され得る。別の例では、異なるタグの組み合わせが提供され得、この場合、その異なるタグの各々は、別個のメチル化比またはメチル化ヌクレオチドの数を有する。一実施形態において、異なるタグの組み合わせは、少なくとも1個のメチル化dCTPを有する第1のタグおよび非メチル化dCTPのみを有する第2のタグ(すなわち、この第2のタグは、メチル化dCTPを含まない)を含む。別の実施形態において、異なるタグの組み合わせは、第2のタグと比較した場合に、少なくとももう1個のメチル化dCTPを有する第1のタグを含み得る。さらに別の実施形態において、異なるタグの組み合わせは、第2のタグと比較した場合に、等しい数のメチル化dCTPを有する第1のタグを含み得る。この場合、その第1のタグは、その第2のタグとは異なるメチル化パターンを有する。その第1のタグおよびその第2のタグが、同じ核酸配列を(しかし異なるメチル化パターンを)有する場合には、その2種のタグの組み合わせは、単一の遺伝子座におけるメチル化の異なるレベルをまね得る。そのメチル化タグは、5-メチル-dCTPを、鎖置換DNAポリメラーゼでの重合工程の間に、dCTPの代わりに(またはこれに加えて)含めることによって本明細書で記載されるように生成できた。
別の実施形態において、1もしくはこれより多くのビオチン化dNTPは、ここで記載されるように、タグへと(例えば、重合工程の間に)組みこまれ得る。例えば、ビオチン-16-dUTPは、ビオチン化塩基を含むプライマーを使用することによって、そのタグの合成の間にあるパーセンテージのビオチン化ヌクレオチドを含めることによってなど、およびこれらの組み合わせによって、タグ配列へと組み込まれ得る。ビオチン化タグは、ビオチン-ストレプトアビジンベースの捕捉(例えば、溶液中ハイブリッド捕捉(例えば、米国特許出願公開番号2012/0046175(Rodeschら)を参照のこと)を要するワークフロー中で有用であり得る。別の局面において、ビオチン化塩基をタグに付加することは、タグ精製または操作のために一般に有用であり得る。ビオチン化に加えて(または代わりとして)、タグは、別の同様な結合部分(例えば、ジゴキシゲニン)、または適切な結合部分とともに提供され得る。
一実施形態において、タグは、タグの保存された領域のうちの少なくとも1つの中にRNAポリメラーゼプロモーター配列を含むように設計され得る。RNAポリメラーゼプロモーター配列は、真核生物プロモーター配列、原核生物プロモーター配列、古細菌プロモーター配列、合成プロモーター配列、別の同様のプロモーター配列、またはこれらの組み合わせから選択され得る。プロモーター配列を含めることによって、DNAベースのタグをテンプレートとして使用してランオフ転写物を生成するために、RNAポリメラーゼでのRNAベースのタグの合成が可能になり得る。RNAポリメラーゼプロモーター配列を有するタグの一例としては、以下の一般的構造を有するタグが挙げられる:
、可変配列
、および不変配列
(以下のとおり:
)。
一局面において、本開示に従うタグは、別個に、またはサンプル収集システムの成分として提供され得る。タグがサンプル収集システムの成分として含められる場合、ライブラリー調製前の核酸サンプルへの添加のために、または核酸抽出前に粗製組織サンプルへの添加のために別個の成分としてタグを供給する代わりに、そのタグは、容器(例えば、サンプル収集チューブまたはバイアル)の中に提供され得る。一例では、タグは、収集バイアル(例えば、唾液収集バイアル、血液収集バイアルなど)の中に含められ得る。その収集バイアルは、この中に配置される組成物を既に含む、特有にラベルが付けられた(例え
ば、バーコード付加した)サンプル収集チューブとして提供され得る。この場合、その組成物は、収集バイアル上のラベルに特有または特異的である具体的なタグを含む。サンプル(例えば、血液、組織、唾液など)がそのタグを含む収集バイアルに添加される場合、そのサンプル、および従ってこの中に含まれる任意の核酸物質は、収集時点で消えないように混合され得る。収集時点でそのタグを含めることは、抽出、ライブラリー調製、およびシークエンシングワークフローの間の二次汚染または不正確なタグ割り当ての可能性を低減し得る。さらに別の例では、そのタグは、そのタグを固体収集表面(例えば、血液スポット(ガスリー)カード、口腔スワブ器具など)上に吸着させることによって、収集器具と組み合わせて提供される。
当業者は、慣用的実験法のみを使用して、本明細書で記載される発明の具体的実施形態に対する多くの均等物を認識するかまたは確かめ得る。本発明の範囲は、上記の説明に限定されるとは意図されないが、むしろ以下の特許請求の範囲に示されるとおりである。
Claims (15)
- 合成核酸タグを作製する方法であって、
前記合成核酸タグを設計する工程:
ここで該タグの核酸配列は、構造A-B-Cの複数の反復ユニットを含み、
該合成核酸タグは、式:Xi-[A-B-C]n-Yjによって表される全体構造を有し、
ここで該合成核酸タグは、該構造A-B-Cのn回反復を含み、該nは、少なくとも2であり、
ここで該Aおよび該Cは、各々少なくとも8個の核酸の長さであり、かつ該Aおよび該Cは、同じ長さおよび異なる長さのうちの一方であり、
ここで該Bは、少なくとも8個の核酸を含むものであり、
ここで該合成核酸タグは、Xのi回反復を含み、
ここで該合成核酸タグは、Yのj回反復を含み、
ここで該Xは、該C、別の核酸、および核酸改変のうちの少なくとも1つであり、
ここで該Yは、該A、別の核酸、および核酸改変のうちの少なくとも1つであり、
ここで該Bは、BLASTNを参照することによって決定される、分析のための直接関連するサンプル中で見出される任意の配列とハイブリダイズしない配列を有し、そして、
該Bは、前記タグ中の個々のBエレメント間に少なくとも8の編集距離を担保するために十分な長さを有するものであり、
該Bは、配列番号3もしくは6で示される下記の核酸配列:
ここで該iおよび該jは、1~100から独立して選択される整数であり、
AおよびCの各々は、そこにハイブリダイズされるプライマーが伸長され得るという点で、少なくとも1個のプライマーランディングパッド配列エレメントを含み、
さらにここでAおよびCは、逆方向性のプライマーが、AおよびCの両方に同時にハイブリダイズし得、その結果増幅生成物が、該ハイブリダイズしたプライマーの伸長によって生成されるという点で、互いと適合性であるヌクレオチド配列を有する、
を含む、前記方法。 - 該タグのうちの少なくとも一部は、2本鎖である、請求項1に記載の方法。
- 前記タグは、少なくとも1個のメチル化ヌクレオチドを含む、請求項1または2のいずれか1項に記載の方法。
- 前記タグは、少なくとも1個の結合部分を含む、請求項1~3のいずれか1項に記載の方法。
- 前記タグは、RNAポリメラーゼのための少なくとも1個のプロモーター配列を含む、請求項1~4のいずれか1項に記載の方法。
- 前記タグは、収集容器の中に配置されるか、および収集器具の表面上に吸着されるかのうちの一方である、請求項1~5のいずれか1項に記載の方法。
- 複数の核酸分子タグを含むキットを作製する方法であって、
前記核酸分子タグを設計する工程:
ここで該タグの各々は、式:Xi-[A-B-C]n-Yjによって表される核酸配列を有し、
ここで該合成核酸タグは、構造A-B-Cのn回反復を含み、該nは、少なくとも2であり、
ここで該Aおよび該Cは、各々少なくとも8個の核酸の長さであり、かつ該Aおよび該Cは、同じ長さおよび異なる長さのうちの一方であり、
ここで該Bは、少なくとも8個の核酸を含むものであり、
ここで該合成核酸タグは、Xのi回反復を含み、
ここで該合成核酸タグは、Yのj回反復を含み、
ここで該Xは、該C、別の核酸、および核酸改変のうちの少なくとも1つであり、
ここで該Yは、該A、別の核酸、および核酸改変のうちの少なくとも1つであり、
ここで該Bは、BLASTNを参照することによって決定される、分析のための直接関連するサンプル中で見出される任意の配列とハイブリダイズしない配列を有し、そして、
該Bは、前記タグ中の個々のBエレメント間に少なくとも8の編集距離を担保するために十分な長さを有するものであり、
該Bは、配列番号3もしくは6で示される下記の核酸配列:
ここで該iおよび該jは、1~100から独立して選択される整数であり、
AおよびCの各々は、そこにハイブリダイズされるプライマーが伸長され得るという点で、少なくとも1個のプライマーランディングパッド配列エレメントを含み、
さらにここでAおよびCは、逆方向性のプライマーが、AおよびCの両方に同時にハイブリダイズし得、その結果増幅生成物が、該ハイブリダイズしたプライマーの伸長によって生成されるという点で、互いと適合性であるヌクレオチド配列を有する、
を含む、前記方法。 - 前記キット中の異なるタグは、
各タグは、同一なA配列エレメントを有し;
各タグは、同一なC配列エレメントを有し;そして
各タグは、該キット中の他のタグの各々のものとは異なるB配列エレメントを有する、
という点で互いに構造的に関連している、請求項7に記載の方法。 - サンプル収集チューブをさらに含む、請求項7または8に記載の方法。
- 前記複数の核酸分子タグのうちの少なくとも一部は、少なくとも1個のメチル化ヌクレオチドを含む、請求項7~9のいずれか1項に記載の方法。
- 前記複数の核酸分子タグのうちの少なくとも一部は、少なくとも1個の結合部分を含む、請求項7~10のいずれか1項に記載の方法。
- 前記結合部分は、ビオチンである、請求項11に記載の方法。
- 前記複数の核酸分子タグのうちの少なくとも一部は、RNAポリメラーゼのための少なくとも1個のプロモーター配列を含む、請求項7~12のいずれか1項に記載の方法。
- 前記プロモーター配列は、真核生物プロモーター配列、原核生物プロモーター配列、古細菌プロモーター配列、合成プロモーター配列のうちの少なくとも1つから選択される、請求項13に記載の方法。
- 前記複数の核酸分子タグは、収集容器の中に配置されるか、または収集器具の表面上に吸着されるか、のうちの一方である、請求項7~14のいずれか1項に記載の方法。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562234630P | 2015-09-29 | 2015-09-29 | |
US62/234,630 | 2015-09-29 | ||
US201662335364P | 2016-05-12 | 2016-05-12 | |
US62/335,364 | 2016-05-12 | ||
PCT/US2016/054210 WO2017058936A1 (en) | 2015-09-29 | 2016-09-28 | High molecular weight dna sample tracking tags for next generation sequencing |
JP2018510714A JP7051677B2 (ja) | 2015-09-29 | 2016-09-28 | 次世代シークエンシングのための高分子量dnaサンプル追跡タグ |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018510714A Division JP7051677B2 (ja) | 2015-09-29 | 2016-09-28 | 次世代シークエンシングのための高分子量dnaサンプル追跡タグ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022071064A JP2022071064A (ja) | 2022-05-13 |
JP7332733B2 true JP7332733B2 (ja) | 2023-08-23 |
Family
ID=57138134
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018510714A Active JP7051677B2 (ja) | 2015-09-29 | 2016-09-28 | 次世代シークエンシングのための高分子量dnaサンプル追跡タグ |
JP2022030634A Active JP7332733B2 (ja) | 2015-09-29 | 2022-03-01 | 次世代シークエンシングのための高分子量dnaサンプル追跡タグ |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018510714A Active JP7051677B2 (ja) | 2015-09-29 | 2016-09-28 | 次世代シークエンシングのための高分子量dnaサンプル追跡タグ |
Country Status (6)
Country | Link |
---|---|
US (1) | US11001834B2 (ja) |
EP (1) | EP3356552A1 (ja) |
JP (2) | JP7051677B2 (ja) |
CN (1) | CN108138228B (ja) |
CA (1) | CA2996735A1 (ja) |
WO (1) | WO2017058936A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6557151B2 (ja) | 2013-02-20 | 2019-08-14 | エモリー ユニバーシティー | 混合物中の核酸を配列決定する方法およびそれに関する組成物 |
WO2019226648A1 (en) | 2018-05-21 | 2019-11-28 | Battelle Memorial Institute | Methods and control compositions for sequencing and chemical analyses |
SG11202103486YA (en) * | 2018-10-31 | 2021-05-28 | Guardant Health Inc | Methods, compositions and systems for calibrating epigenetic partitioning assays |
US20210395813A1 (en) * | 2018-11-14 | 2021-12-23 | Foresee Genomic Ltd | Multimer for sequencing and methods for preparing and analyzing the same |
WO2020124003A1 (en) | 2018-12-13 | 2020-06-18 | Battelle Memorial Institute | Methods and control compositions for a quantitative polymerase chain reaction |
CN111455092B (zh) * | 2020-05-27 | 2022-02-18 | 中国农业大学 | 用于大丽轮枝菌定量pcr检测的内参菌株及其应用 |
GB2613500A (en) * | 2020-09-26 | 2023-06-07 | Univ California | Hybrid protocols and barcoding schemes for multiple sequencing technologies |
CN118389511A (zh) * | 2024-05-16 | 2024-07-26 | 上海伯杰医疗科技股份有限公司 | 用于样本识别和样本内核酸物质定量的分子序列标签 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011147415A (ja) | 2010-01-25 | 2011-08-04 | Hitachi Ltd | 核酸の均一増幅方法および高感度検出方法 |
US20130072390A1 (en) | 2011-03-21 | 2013-03-21 | Affymetrix, Inc. | Methods for Synthesizing Pools of Probes |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2091243T3 (es) | 1989-05-22 | 1996-11-01 | Hoffmann La Roche | Metodos de señalizacion y rastreo de materiales mediante acidos nucleicos. |
US5648245A (en) | 1995-05-09 | 1997-07-15 | Carnegie Institution Of Washington | Method for constructing an oligonucleotide concatamer library by rolling circle replication |
AU714486B2 (en) | 1995-11-21 | 2000-01-06 | Yale University | Unimolecular segment amplification and detection |
CN1344808A (zh) * | 2000-09-29 | 2002-04-17 | 上海博德基因开发有限公司 | 一种利用dna长度多态性分析技术将核酸应用于防伪的方法 |
JP2003157004A (ja) * | 2001-11-21 | 2003-05-30 | Id Technica:Kk | 識別手段を付加する添加物及びその添加物を含有する識別情報保持物 |
US20060073506A1 (en) * | 2004-09-17 | 2006-04-06 | Affymetrix, Inc. | Methods for identifying biological samples |
JP2006094814A (ja) * | 2004-09-30 | 2006-04-13 | Nissan Motor Co Ltd | 情報化核酸及びこれを用いた情報化核酸組成物 |
US8785130B2 (en) * | 2005-07-07 | 2014-07-22 | Bio-Id Diagnostic Inc. | Use of markers including nucleotide sequence based codes to monitor methods of detection and identification of genetic material |
EP3424598B1 (en) * | 2006-06-14 | 2022-06-08 | Verinata Health, Inc. | Rare cell analysis using sample splitting and dna tags |
EP2053132A1 (en) | 2007-10-23 | 2009-04-29 | Roche Diagnostics GmbH | Enrichment and sequence analysis of geomic regions |
GB2472371B (en) * | 2009-04-24 | 2011-10-26 | Selectamark Security Systems Plc | Synthetic nucleotide containing compositions for use in security marking of property and/or for marking a thief or attacker |
EP2464753A4 (en) * | 2009-08-12 | 2013-12-11 | Harvard College | BIO RECOGNITION METHOD AND COMPOSITIONS |
CN102443628B (zh) * | 2011-11-01 | 2014-12-17 | 重庆出入境检验检疫局检验检疫技术中心 | 嵌合外源无关序列的核酸质控的制备方法 |
CA2875666A1 (en) * | 2012-06-14 | 2013-12-19 | Fred Hutchinson Cancer Research Center | Compositions and methods for sensitive mutation detection in nucleic acid molecules |
WO2014018460A1 (en) * | 2012-07-24 | 2014-01-30 | Sequenta, Inc. | Single cell analysis using sequence tags |
CN102978283B (zh) * | 2012-11-20 | 2015-09-23 | 天昊生物医药科技(苏州)有限公司 | 用于生物样本核酸检测的分子内标质控方法及其试剂盒 |
JP2014147415A (ja) * | 2013-01-30 | 2014-08-21 | Daiichi Shokai Co Ltd | 遊技機 |
GB201302900D0 (en) * | 2013-02-19 | 2013-04-03 | Genome Res Ltd | Nucleic acid marker molecules for identifying and detecting cross contaminationof nucleic acid samples |
CN105745334B (zh) * | 2013-09-30 | 2019-12-10 | 吴迪 | 通过使用邻近条形编码分析分子复合物的概况的方法 |
-
2016
- 2016-09-28 JP JP2018510714A patent/JP7051677B2/ja active Active
- 2016-09-28 CN CN201680043622.XA patent/CN108138228B/zh active Active
- 2016-09-28 US US15/279,170 patent/US11001834B2/en active Active
- 2016-09-28 CA CA2996735A patent/CA2996735A1/en active Pending
- 2016-09-28 EP EP16782138.8A patent/EP3356552A1/en active Pending
- 2016-09-28 WO PCT/US2016/054210 patent/WO2017058936A1/en active Application Filing
-
2022
- 2022-03-01 JP JP2022030634A patent/JP7332733B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011147415A (ja) | 2010-01-25 | 2011-08-04 | Hitachi Ltd | 核酸の均一増幅方法および高感度検出方法 |
US20130072390A1 (en) | 2011-03-21 | 2013-03-21 | Affymetrix, Inc. | Methods for Synthesizing Pools of Probes |
Non-Patent Citations (3)
Title |
---|
DAUBENDIEK, S.L., et al.,"Rolling-circle RNA synthesis: circular oligonucleotides as efficient substrates for T7 RNA polymerase.",J. AM. CHEM. SOC.,1995年,Vol.117, No.29,pp.7818-7819 |
FIRE, A. and XU, S.,"Rolling replication of short DNA circles.",PROC. NATL. ACAD. SCI. USA,1995年,Vol.92,pp.4641-4645 |
QUAIL, M.A., et al.,"SASI-Seq: sample assurance spike-ins, and highly differentiating 384 barcoding for illumina sequencing.",BMC GENOMICS,2014年,Vol.15,110(pp.1-12) |
Also Published As
Publication number | Publication date |
---|---|
CN108138228A (zh) | 2018-06-08 |
US20170088832A1 (en) | 2017-03-30 |
EP3356552A1 (en) | 2018-08-08 |
JP2018527928A (ja) | 2018-09-27 |
JP7051677B2 (ja) | 2022-04-11 |
US11001834B2 (en) | 2021-05-11 |
CN108138228B (zh) | 2022-05-27 |
CA2996735A1 (en) | 2017-04-06 |
WO2017058936A1 (en) | 2017-04-06 |
JP2022071064A (ja) | 2022-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7332733B2 (ja) | 次世代シークエンシングのための高分子量dnaサンプル追跡タグ | |
US20190005193A1 (en) | Digital measurements from targeted sequencing | |
CN110036117B (zh) | 通过多联短dna片段增加单分子测序的处理量的方法 | |
AU2015296029B2 (en) | Tagging nucleic acids for sequence assembly | |
JP7033602B2 (ja) | ロングレンジ配列決定のためのバーコードを付けられたdna | |
US20140243242A1 (en) | Compositions and methods for co-amplifying subsequences of a nucleic acid fragment sequence | |
EP3612641A1 (en) | Compositions and methods for library construction and sequence analysis | |
US20160194699A1 (en) | Molecular coding for analysis of composition of macromolecules and molecular complexes | |
MX2013003349A (es) | Captura directa, amplificacion y secuenciacion de objetivo adn usando cebadores inmovilizados. | |
CN110869515B (zh) | 用于基因组重排检测的测序方法 | |
WO2014152937A1 (en) | Nucleic acid control panels | |
US10927405B2 (en) | Molecular tag attachment and transfer | |
WO2023220142A1 (en) | Methods and compositions for sequencing library preparation | |
CN117222737A (zh) | 用于测序文库制备的方法和组合物 | |
WO2005038026A1 (ja) | 変異のタイピング方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220301 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220301 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230501 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230731 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230810 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7332733 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |