JP2020527033A - 核酸識別子の夾雑を検出するためのアッセイ方法および組成物 - Google Patents

核酸識別子の夾雑を検出するためのアッセイ方法および組成物 Download PDF

Info

Publication number
JP2020527033A
JP2020527033A JP2019572006A JP2019572006A JP2020527033A JP 2020527033 A JP2020527033 A JP 2020527033A JP 2019572006 A JP2019572006 A JP 2019572006A JP 2019572006 A JP2019572006 A JP 2019572006A JP 2020527033 A JP2020527033 A JP 2020527033A
Authority
JP
Japan
Prior art keywords
identifier
assay
sample
oligonucleotide
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2019572006A
Other languages
English (en)
Inventor
ゾベック,ケイティ・リー
アンダーソン,ペイジ
チー,ジャヴェリン
ヨハンソン,ヘンリク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agilent Technologies Inc
Original Assignee
Agilent Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agilent Technologies Inc filed Critical Agilent Technologies Inc
Publication of JP2020527033A publication Critical patent/JP2020527033A/ja
Priority to JP2023012722A priority Critical patent/JP2023061989A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/55Controlling game characters or game objects based on the game progress
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6848Nucleic acid amplification reactions characterised by the means for preventing contamination or increasing the specificity or sensitivity of an amplification reaction
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • General Chemical & Material Sciences (AREA)

Abstract

本発明は、超並列配列決定のための核酸サンプルに関する。より詳細には、本発明は、サンプルバーコード等の核酸識別子の夾雑を検出するためのアッセイ方法、組成物、およびキットに関する。

Description

[関連出願の相互参照]
本出願は、2017年7月10日出願の米国非仮特許出願第15/645,085号明細書の利益を主張し、この出願の内容は、その全体が参照によって本明細書の一部をなすものとする。
[発明の分野]
本発明は、分子生物学の分野に関する。特に、本発明は、サンプルバーコード等の核酸識別子の夾雑を検出するためのアッセイ方法および組成物に関する。
識別子(例えば、サンプルバーコードまたは分子バーコード)は、種々の目的のために核酸中に存在し得る。最も一般的には、サンプルバーコードは、配列情報の起源またはソースを同定することができるようにするために、標的核酸分子の増幅および/または配列決定(シークエンシング)の前に当該分子に加えられる。様々なサンプル由来の核酸分子が、一緒にプールされて、超並列配列決定にかけられて、多数の様々なサンプル由来の配列情報が効率的に決定され得る。配列決定の前に、サンプル識別子(多くの場合、サンプルバーコードと呼ばれる)が、核酸分子に加えられてよく、これは、情報のグループ化、分析、および解釈を容易にする。別の例として、分子バーコードが、増幅の前に、標的核酸分子に加えられて、その後、最初の標的分子の複製を同定し、かつ一緒にグループ化することができる。
サンプルバーコードは、様々なサンプル由来の核酸分子を、配列決定のためにプールし、かつ、配列情報をサンプルに割り当てることができるように、超並列配列決定によって分析されることとなる標的分子に頻繁に用いられる。超並列配列決定を実行する科学者およびラボは、サンプルバーコードが配列決定プール内に含まれなかった場合であっても、プール内にこのサンプルバーコードを時折検出する。これは、夾雑サンプルバーコードが、プールされた核酸中に存在することを示しており、当該夾雑サンプルコードは、複数のサンプルバーコード配列を含有するサンプルバーコードアリコート、すなわち、予想されるバーコード配列および夾雑バーコード配列によってもたらされている可能性がある。夾雑バーコードは、最も初期のステージに始まり、サンプルバーコードアリコートの調製のいかなるステージ(DNAオリゴの合成および精製が挙げられる)においても、またはサンプルバーコード配列を希釈かつ分注するプロセスにおけるハンドリング工程を通しても導入される可能性があった。低い頻度、例えば1%以下で存在する場合であっても、夾雑サンプルバーコードの存在は、配列情報の信頼性および解釈に関して、問題を引き起こす虞がある。
サンプルバーコードは、多くの場合、一セットのコンテナ、例えばウェルプレート内に用意され、各コンテナは、異なるサンプルバーコードを保持する。サンプルバーコードが、例えば、サンプルバーコードをコンテナから、分析されることとなる種々のサンプルにピペットで移すことによって、ラボ分析に用いられる場合、コンテナまたはサンプルが夾雑されてしまうリスクが存在する。
サンプルバーコードの夾雑は、サンプルバーコード毎に個々の配列決定ライブラリを調製して、これらを個々に配列決定することよって検出することができた。これ以外にも、夾雑は、プーリングスキームで検出することができた。これは、プールの少なくとも1つにおいて、サンプルバーコードと別のサンプルバーコードの夾雑とを比較する能力を提供するものである。しかしながら、サンプルバーコードを多数のサンプル、例えば48サンプルまたは96サンプルから単離するには、多数のプールが、別個の配列決定ランにおいて調製され、かつ配列決定されなければならなかった。これは、高価であり、効率が悪く、かつ時間を浪費することとなった。また、チューブ内に存在しなかったが、その代わりに、多くのライブラリ調製工程の1つにおいて導入されたサンプルバーコード中に夾雑を誤って見出して、偽陽性に至る可能性もある。
本発明の一態様として、アッセイ識別子(例えば品質制御バーコード)を、オリゴヌクレオチドを含む一セットのオリゴヌクレオチドサンプルに取り付ける方法であって、各オリゴヌクレオチドは、5’定常領域、サンプル識別子(例えばサンプルバーコード)、および3’定常領域を含み、各サンプル識別子は、夾雑の不在下で、セット内で固有である、方法が提供される。一部の実施形態において、定常領域は、配列決定プラットフォーム用の標準増幅領域、またはその逆相補体を含む。例えば、一部の実施形態において、5’定常領域は、Illumina Index 1配列であり、3’定常領域は、Illumina P7配列の逆相補体(P7’)である。他の実施形態において、向きは逆であり、5’定常領域がIllumina P7配列であり、そして3’定常領域がIllumina Read 2配列とされる。本方法は、サンプルの1つまたは複数が夾雑されていない限り各ベッセルがたった1つのサンプル識別子を含むように、別個のベッセル内に当該セットのオリゴヌクレオチドサンプルのそれぞれを用意するステップを含む。本方法はまた、アッセイプライマーおよび第2のプライマーを用いて、各ベッセル内でオリゴヌクレオチドを増幅するステップを含む。アッセイプライマーは、1つまたは複数の定常領域(例えば、P5およびRead 1プライマー配列)、アッセイ識別子、および、オリゴヌクレオチドの定常領域の1つと同じである、または相補的であるプライミング部分を含む。各ベッセルは、アッセイプライマーの1つまたは複数が夾雑されていない限り、たった1つのアッセイ識別子を含む。ゆえに、本方法は、アッセイ識別子およびサンプル識別子を含むオリゴヌクレオチドアンプリコンを提供する。
別の態様として、サンプル識別子を含む一セットのオリゴヌクレオチド内の夾雑を検出する方法が提供される。本方法は、オリゴヌクレオチドを含む一セットのオリゴヌクレオチドサンプルを用意するステップを含み、各オリゴヌクレオチドは、5’定常領域、サンプル識別子(例えばサンプルバーコード)、および3’定常領域を有する。サンプル内のオリゴヌクレオチドは、同じサンプル識別子を有し、そしてセット内のサンプルのそれぞれは、サンプルの1つまたは複数が夾雑されていない限り、異なるサンプル識別子を有する。本方法はまた、オリゴヌクレオチド、またはオリゴヌクレオチドの相補体を、アッセイプライマーおよび第2のプライマーで増幅するステップを含む。サンプル毎に異なるアッセイプライマーが用いられ、そして各アッセイプライマーは、プライミング部分およびアッセイ識別子(例えばQCバーコード)を含むことによって、一セットのオリゴヌクレオチドアンプリコンを生成する。各オリゴヌクレオチドアンプリコンは、アッセイ識別子の1つ、5’定常領域、サンプル識別子の1つ、および3’定常領域を含む。本方法はまた、オリゴヌクレオチドアンプリコンを、1つまたは複数のプール内にプールするステップと;オリゴヌクレオチドアンプリコンの少なくともサンプル識別子およびアッセイ識別子についての配列情報を決定するために、1つまたは複数のプールについて配列決定を行うステップと;第1のプール内のサンプル識別子が夾雑サンプル識別子を含むかどうかを判定するステップと;第1のプール内のアッセイ識別子が夾雑アッセイ識別子を含むかどうかを判定するステップとを含む。
一部の実施形態において、本方法は、オリゴヌクレオチドアンプリコンを、少なくとも2つのプール内にプールするステップと、オリゴヌクレオチドアンプリコンの少なくともサンプル識別子およびアッセイ識別子について配列を決定するために、第1のプールおよび第2のプールについて別個に配列決定を行うステップとを含む。本方法はまた、第2のプール内のサンプル識別子が夾雑サンプル識別子を含むかどうかを判定するステップを含んでもよい。一部の実施形態において、本方法はまた、第2のプール内のアッセイ識別子が夾雑アッセイ識別子を含むかどうかを判定するステップを含む。一部の実施形態において、本方法はさらに、第1のプール内の夾雑サンプル識別子を、その夾雑サンプル識別子が第2のプール由来のものであることを判定することによって同定するステップを含む。一部の実施形態において、本方法はさらに、第1のプール内の夾雑サンプル識別子を、第2のプールが夾雑アッセイ識別子を含んでいないことを判定することによって同定するステップを含む。一部の実施形態において、本方法はさらに、第1のプール内の夾雑アッセイ識別子を、第2のプールが夾雑アッセイ識別子を含んでいることを判定することによって同定するステップを含む。一部の実施形態において、夾雑サンプル識別子は、(i)複数のアッセイ識別子と関連するサンプル識別子の1つまたは複数を同定するステップと、(ii)複数のサンプル識別子と関連するアッセイ識別子を同定するステップとの一方または双方によって判定される。
別の態様として、サンプル識別子を含む一セットのオリゴヌクレオチド内の夾雑を判定するように適合したアッセイに有用である組成物が提供される。本組成物は、5’定常領域、サンプル識別子(例えばサンプルバーコード)、および3’定常領域を有する少なくとも1つのオリゴヌクレオチド、ならびにプライミング部分およびアッセイ識別子を含む少なくとも1つのアッセイプライマーを含む。一部の実施形態において、組成物はさらに、DNAポリメラーゼおよびデオキシヌクレオチドの1つまたは複数を含む。
さらに別の態様として、サンプル識別子を含む一セットのオリゴヌクレオチド内の夾雑を判定するように適合したアッセイ用のキットが提供される。本キットは、少なくとも8個のアッセイプライマー、代わりに少なくとも16個のアッセイプライマー、代わりに少なくとも32個のアッセイプライマー、代わりに少なくとも48個のプライマー、または少なくとも96個のプライマーを、別個のベッセル内に含む。各アッセイプライマー識別子は、プライミング部分およびアッセイ識別子を含む。
上述の態様の一部の実施形態において、オリゴヌクレオチドサンプルのセットまたはプールは、少なくとも8個のサンプル、代わりに少なくとも16個のサンプル、代わりに少なくとも32個のサンプル、代わりに少なくとも48個のサンプル、代わりに少なくとも96個のサンプルを含み、各サンプルは、セットまたはプール内に固有のサンプル識別子を有する。一部の実施形態において、一セットのアッセイプライマーは、少なくとも32個のアッセイ識別子、代わりに少なくとも48個のアッセイ識別子、代わりに少なくとも96個のアッセイ識別子を含み、各アッセイプライマーは、セットまたはプール内につき固有であるアッセイサンプル識別子を有する。
サンプル識別子を有するオリゴヌクレオチドにアッセイ識別子を取り付ける本方法の実施形態を示す図である。 サンプル識別子を有するオリゴヌクレオチドにアッセイ識別子を取り付ける本方法の実施形態を示す図である。 サンプル識別子を有するオリゴヌクレオチドにアッセイ識別子を取り付ける本方法の実施形態を示す図である。 本開示に従うアッセイプライマーの2つの異なる実施形態の配列を示す図である。2つの実施形態は、多くの同じ領域を含有するが、5’定常領域が異なる。バージョン2において、5’定常領域と3’定常領域との重複は、より少ない。 図2における第1の実施形態のアッセイプライマーを用いたオリゴヌクレオチドの増幅由来のアンプリコンのサイズの分布を示す図である。 図2における第2の実施形態のアッセイプライマーを用いたオリゴヌクレオチドの増幅由来のアンプリコンのサイズの分布を示す図である。 アッセイ識別子を、サンプル識別子を有するオリゴヌクレオチドに取り付ける本方法の別の実施形態を示す図であり、識別子は、サンプル識別子に対して3’の位置に取り付けられる。 アッセイ識別子を、サンプル識別子を有するオリゴヌクレオチドに取り付ける本方法の別の実施形態を示す図であり、オリゴヌクレオチドの定常領域は、所望の配列決定プラットフォームと適合しない。 本方法および本組成物を用いてサンプル識別子の夾雑を検出するプーリングスキームを示す図である。
本方法、本組成物、および本キットは、核酸サンプルについての一セットのオリゴヌクレオチド内の夾雑を検出するのに有用であり、これは、夾雑が実質的にないサンプル識別子セットの生成を可能とする。これは大きな進歩、そして利益である。というのも、サンプルバーコード夾雑の存在は、遺伝的変異体の偽コーリング(false calling)を生じさせる場合があり、これが研究および臨床用途について深刻な結果をもたらす虞があるからである。
本方法、本組成物、および本キットは、5’定常領域、サンプル識別子、および3’定常領域を有するオリゴヌクレオチドを使用する。サンプルの1つまたは複数が、夾雑サンプル識別子によって夾雑されていない限り、サンプル内のオリゴヌクレオチドのそれぞれが同じサンプル識別子を有し、そしてセット内のサンプルのそれぞれが異なるサンプル識別子を有する。一部の実施形態において、セット内のサンプルのそれぞれがセットに固有のサンプル識別子を有し、このことは、夾雑がない場合に固有であることが意図され、かつ固有となることを意味する。
「サンプル識別子」は、サンプルを同定するのに用いることができるサンプルバーコード、またはあらゆる縮重(degenerate)配列もしくはランダム配列を含む。サンプル識別子は、定常領域が側面に(直接的または間接的に)位置してよい。一部の実施形態において、サンプル識別子は、6つ以上のランダムヌクレオチドまたは縮重ヌクレオチドを含むサンプルバーコードであってよい。これ以外にも、サンプル識別子は、8つ以上のランダムヌクレオチドもしくは縮重ヌクレオチド、または10個以上のランダムヌクレオチドもしくは縮重ヌクレオチドを含むサンプルバーコードであってよい。一部の実施形態において、サンプル識別子は、8つの既知の塩基を含み、そしてアッセイ識別子は、10個の縮重塩基を含む。他の実施形態において、サンプル識別子は、4つの既知の塩基または6つの既知の塩基を含む。一部の実施形態において、サンプル識別子中の塩基の数は、識別されることとなるサンプルの数に基づいて選択されてよい。より長いサンプル識別子およびサンプルバーコードも可能である。例えば、18塩基(8つの既知の塩基および10個の縮重塩基)を含むサンプル識別子が、Ion Torrent配列決定プラットフォーム用のオリゴヌクレオチドのライブラリを調製するのに使用されている。とりわけ、アッセイが、他の配列決定プラットフォームおよび用途に用いられるならば、19塩基を超えるサンプル識別子もまた実行可能であり、所望されてもよい。一部の実施形態において、最初のサンプルバーコードの相補体は、オリゴヌクレオチドアンプリコン内にあり、そしてこの相補体もまた、サンプル識別子とみなされる。
「定常」領域は、既知の配列を含む領域である。定常領域は既知であるので、所望の機能を提供することができる。定常領域は、通常、セットのオリゴヌクレオチド間で、同じ、または実質的に同じであろう。既知の配列は、増幅またはプライマー伸長用のプライミング部位(領域)として機能することができ、かつ/または支持体に取り付けられた核酸にハイブリダイズすることができる。一部の実施形態において、定常領域は、一連の標準領域、例えば、配列決定プラットフォームに用いられる標準増幅領域を含む。定常領域は、標準領域の機能にとって十分な数の、既知の、または標準領域由来のヌクレオチド、例えば、増幅用の標準プライマーにハイブリダイズするのに十分な数のヌクレオチドを含み得る。
「夾雑」分子または配列は、何らかの夾雑がある場合を除き、セットまたはプール中にあるように設計されている分子もしくは配列ではなく、セット、プール、またはサンプル中に存在するべき分子もしくは配列でもない。例えば、配列の第1のセットまたはプール中のバーコードは、第1のセットもしくはプール中に存在するべきでない、かつ/または、第2のセットもしくはプール中にのみ存在するべきであるならば、夾雑バーコードである。
本方法および本組成物は、サンプルバーコード等のサンプル識別子を含むオリゴヌクレオチドのセット内に夾雑を認める問題の解決策を提供する。本技術は、比較的少数のハンドリング工程しかなく、このことは望ましい。なぜなら、ハンドリング工程は、夾雑のリスクを増大させるからである。加えて、サンプル間の夾雑を検出するのに必要とされるプール数および配列決定ラン数を少なくするプーリングスキームおよび分析法が提供される。多数のプールの代わりに、本方法は、用いられるプールを少なくして、一セットの96サンプル識別子内の夾雑を検出することができる。一部の実施形態において、一セットの96サンプル識別子中のサンプル識別子夾雑を検出するのに、2つの配列決定プールが用いられる。
本方法および本組成物はまた、オリゴヌクレオチド(例えば、タンパク質またはペプチドを標的とするのに用いられる、ライブラリ分子、アダプター、アプタマー、または他のssDNA分子)を増幅するのに用いることができ、これは、分子バーコードを検出することを含む、配列多様性を検出するための一連のランダムなヌクレオチド(本明細書中でサンプル識別子とみなされる)を、2つの定常領域間に有する。また、DNAの既知の領域において、突然変異誘発の単一ヌクレオチド多型(SNP)または部位を同定するのに用いることができる。
本方法によってアッセイすることができるオリゴヌクレオチドとしては、標準アダプター由来の核酸分子または領域、例えば配列決定プラットフォーム用の標準アダプター由来の増幅領域用のアダプターが挙げられる。また、オリゴヌクレオチドとしては、標識、タグ、または他の部分が挙げられ得る。一例として、オリゴヌクレオチドとしては、ビオチン部分が挙げられ、これは、アビジンまたはストレプトアビジンへの結合によってオリゴヌクレオチドを濃縮することを可能とする。このアプローチは、市販のHaloplexキット(Agilent Technologies)に用いられている。本方法によってアッセイすることができるオリゴヌクレオチドとしては、ライブラリ分子が挙げられ、これは、配列決定プラットフォーム用のライブラリの一部となるべくして調製された分子である。ライブラリ分子は、通常、プラットフォームを配列決定するためのサンプル識別子および1つまたは複数の標準領域が取り付けられる挿入部を含む。他の領域が、ライブラリ分子中に含まれてもよい。ライブラリ分子により、サンプル識別子は、分子バーコードとなり得、または、第1のサンプルバーコードに加えて、第2のサンプルバーコードとなり得る。
本方法はまた、アッセイプライマーおよび第2のプライマーにより、オリゴヌクレオチド、またはオリゴヌクレオチドの相補体を増幅するステップを含む。サンプル毎に異なるアッセイプライマーが用いられ、そして各アッセイプライマーは、プライミング部分およびアッセイ識別子(例えばQCバーコード)を備えることによって、一セットのオリゴヌクレオチドアンプリコンを生成する。各オリゴヌクレオチドアンプリコンは、アッセイ識別子の1つ、5’定常領域、サンプル識別子の1つ、および3’定常領域を含む。本アッセイ法は、種々の標準化された配列決定プラットフォーム(例えば、Illumina配列決定プラットフォームおよびIon Torrent配列決定プラットフォーム)にとって標準である定常領域を選択することによって、それらのプラットフォームに容易に適合し得る。
一部の実施形態において、本方法は、アッセイによって誘導される夾雑を回避または防止するために少数のハンドリング工程を用いて、1%未満、代わりに0.5%未満、あるいは0.1%未満のレベルのサンプル識別子夾雑を検出して、少数の配列決定ランが実行されるようなプーリングおよび分析の方法を提供する。本開示は、サンプル識別子を有する、潜在的に夾雑されたオリゴヌクレオチド由来のライブラリを調製するための、高速かつ比較的安価な方法を提供する。ライブラリは、1つまたは複数の所望の配列決定プラットフォームでの配列決定、とりわけ超並列配列決定に適合する。
一部の実施形態において、オリゴヌクレオチドアンプリコンは、5’定常領域および3’定常領域を含む。さらに、5’定常領域は、配列決定プラットフォームおよび配列決定プライミング領域のための標準5’アダプター、アッセイ識別子、配列決定プライミング領域を含む中央の定常領域、ならびにサンプル識別子を含み、そして3’定常領域は、配列決定プラットフォームのための標準3’アダプターを含む。一部の実施形態において、オリゴヌクレオチドアンプリコンは、(i)配列決定プラットフォームおよび配列決定プライミング領域のための標準5’アダプターを含む5’定常領域、(ii)アッセイ識別子、(iii)配列決定プライミング領域を含む中央の定常領域、(iv)サンプル識別子、ならびに(v)配列決定プラットフォームのための標準3’アダプターを含む3’定常領域を含む。例えば、標準5’アダプターは、Illumina P5またはP5’配列を含んでよく、そして標準3’アダプターは、Illumina P7またはP7’配列を含んでよい。P7’は、P7の相補体を示す。同様に、P5’は、P5の相補体を示す。他の実施形態において、オリゴヌクレオチドアンプリコンは、標準5’アダプターを含む5’定常領域、サンプル識別子、中央の定常領域、アッセイ識別子、および標準3’アダプターを含む3’定常領域を含む。
本方法、本組成物、および本キットはまた、第1の配列決定プラットフォーム用の標準領域(例えば、増幅領域または配列決定プライマー部位(領域))を含むオリゴヌクレオチドを修飾して、異なる配列決定プラットフォーム用の標準領域を含ませるのに用いることができる。一部の実施形態において、第2のプライマーは、オリゴヌクレオチドの3’定常領域と相補的な3’領域を含み、そして第2のプライマーはさらに、標準増幅領域を含む5’領域を含み、オリゴヌクレオチドの3’定常領域は、第2のプライマーの5’領域の標準増幅領域とは異なる配列決定プラットフォーム用の標準増幅領域を含む。
本開示はまた、サンプル識別子およびアッセイ識別子の夾雑を同定する新規のプーリングスキームおよび配列決定スキームを提供する。一部の実施形態において、本方法は、オリゴヌクレオチドアンプリコンを、少なくとも2つのプール内にプールするステップと;サンプル識別子およびアッセイ識別子を含むオリゴヌクレオチドアンプリコンの少なくとも一部の配列を決定するために、2つのプールについて配列決定を行うステップと;第2のプール内のサンプル識別子が夾雑サンプル識別子を含むかどうかを判定するステップと;第2のプール内のアッセイ識別子が夾雑アッセイ識別子を含むかどうかを判定するステップとを含む。一部の実施形態において、本方法はさらに、夾雑サンプル識別子を、その夾雑サンプル識別子が第2のプールに由来すると判定することによって判定するステップを含む。一部の実施形態において、本方法はさらに、夾雑サンプル識別子を、第2のプールが夾雑アッセイ識別子を含んでいないことを判定することによって同定することを含む。一部の実施形態において、本方法はさらに、夾雑アッセイ識別子を、第2のプールが夾雑アッセイ識別子を含んでいないことを判定することによって同定することを含む。
一部の実施形態において、本方法はさらに、アッセイグループを形成するために、アッセイ識別子に従ってオリゴヌクレオチドアンプリコンの配列をグループ化するステップと;アッセイグループのそれぞれにおいて複数のサンプル識別子配列が存在するかを判定するステップとを含む。一部の実施形態において、本方法はさらに、サンプルグループを形成するために、サンプル識別子に従ってオリゴヌクレオチドアンプリコンの配列をグループ化するステップと;サンプルグループのそれぞれにおいて複数のアッセイ識別子配列が存在するかを判定するステップとを含む。一部の実施形態において、本方法は、オリゴヌクレオチドアンプリコンから少なくとも2つのプールを形成するステップと;オリゴヌクレオチドアンプリコンの配列情報を得るために、アンプリコンの少なくとも2つのプールについて配列決定を行うステップとを含み;個々のオリゴヌクレオチドアンプリコンについての配列情報は、少なくとも、アッセイ識別子およびサンプル識別子の配列を含む。一部の実施形態において、本方法は、アッセイ識別子に従ってアンプリコン配列情報をグループ化するステップと;グループ化されたアンプリコン配列情報が複数のサンプル識別子を含有するかを判定するステップとを含んでよい。
本方法は、例えば、サンプル識別子の少なくとも1つが、関連するはずのないアッセイ識別子と関連する場合、かつ/またはアッセイ識別子の少なくとも1つが、関連するはずのないサンプル識別子と関連する場合、アッセイ識別子とサンプル識別子間のミスマッチが存在するかを判定するステップを含んでよい。
本方法は、NGS用のサンプル調製キットとともに用いることができる。また、ライブラリ調製試薬に用いることができる。本方法はまた、SureSelect試薬キットなどの、サンプルバーコードまたは他の識別子を含有するアッセイ標的濃縮キットおよびセットに用いることができる。SureSelectキット(Agilent Technologiesから入手可能)は、サンプル識別子を有し、かつサンプル識別子に対する1つまたは複数の定常領域5’および3’を有するオリゴヌクレオチド、すなわちPCRプライマーを含有する。
本開示は、夾雑が実質的にない、例えば、夾雑サンプル識別子が0.1%未満、または0.01%未満であるサンプル識別子セットまたはキットの製造を可能にする。
図1Aにおいて、オリゴヌクレオチド102は、5’定常領域110、サンプル識別子112、および3’定常領域114を含む。例えば、5’定常領域110は、標準配列、例えばIllumina Index 1配列を含んでよく、サンプル識別子112、および3’定常領域114は、標準増幅配列、例えばIllumina P7’配列を含んでよい。定常領域は、増幅または配列決定用のあらゆる標準プライミング部位(領域)を含んでよい。オリゴヌクレオチド102は、3’定常領域114の少なくとも一部と相補的なプライミング領域115を有するプライマー104を用いて増幅される。例えば、プライマー104は、P7プライマーであってよい。同じ工程または以降の工程において、オリゴヌクレオチド102またはその相補体は、5’定常領域110またはその相補体111の少なくとも一部と相補的なプライミング領域120を有するプライマー106で増幅される。プライマーはまた、アッセイ識別子122および1つまたは複数の定常領域126、124(例えば、Illumina P5配列126およびread 1配列決定プライマー124)を含む。増幅の更なるラウンドにより、1つまたは複数の定常領域126、124、アッセイ識別子122、最初のオリゴヌクレオチドの5’定常領域120の配列、サンプル識別子配列128、および最初のオリゴヌクレオチドの3’定常領域130を含むオリゴヌクレオチドアンプリコン108が生じる。アンプリコン108内のサンプル識別子配列128は、通常、オリゴヌクレオチド102のサンプル識別子112の同一コピーである。アンプリコン108の定常領域120は、ほとんどの場合、オリゴヌクレオチド102の定常領域110と同一であろう。しかしながら、いずれかが部分的にトランケートされている場合がある。例えば、定常領域110は、5’末端上でトランケートされている場合があり、そして定常領域120は、3’末端上でトランケートされている場合がある。同様に、定常領域114は、3’末端上で部分的にトランケートされている場合があり、そして定常領域130は、5’末端上で部分的にトランケートされている場合があるが、アンプリコン108の定常領域130およびオリゴヌクレオチド102の定常領域114は、通常、同じであろう。オリゴヌクレオチドアンプリコン108は、定常領域により、超並列配列決定用の標準プラットフォームでの配列決定に適合する。
図1Bは、本方法の別の実施形態を示す。この実施形態において、オリゴヌクレオチド103は、3’定常領域111、サンプル識別子113、および5’定常領域115を含む。例えば、3’定常領域111は、Illumina Read 2配列(または配列決定プラットフォーム用の別の標準領域)であってよく、そして5’定常領域115は、増幅または配列決定用のIllumina P7配列またはあらゆる標準プライミング部位(領域)であってよい。増幅により、1つまたは複数の定常領域127、125、アッセイ識別子123、3’定常領域111、サンプル識別子配列113、および5’定常領域115の配列を含むオリゴヌクレオチドアンプリコン109が生じる。増幅の更なるラウンドが、プライマー131で行われてよく、これは、プライマーとして機能するのに十分な定常領域115の部分と同じ配列を有する。
図1Cは、最初のオリゴヌクレオチドが、配列決定プラットフォーム用のサンプル識別子および標準領域が取り付けられている挿入部を含む分子であるライブラリ分子である場合に、いかにアッセイ方法が実行され得るかを実証している。この実施形態において、アッセイ方法は、ライブラリ調製中に起こった夾雑を検出することができる。オリゴヌクレオチド102は、第1の5’定常領域110、サンプル識別子112、3’定常領域114を含み、そしてさらに挿入部140、第2の5’定常領域142(例えば、Read 1プライミング部位)、任意選択の第2のサンプル識別子144、および第3の5’定常領域146(例えば、増幅プライミング部位)を含む。挿入部140は、研究され、分析され、または追加試験、例えば超並列配列決定プラットフォームでの配列決定にかけられることとなる標的配列を含む。第2のサンプル識別子144は、場合によっては、多くのライブラリ調製物内に含まれる。オリゴヌクレオチド103(オリゴヌクレオチド102の相補鎖である)は、第1の3’定常領域111、サンプル識別子113、5’定常領域115を含み、そしてさらに、挿入部141、第2の3’定常領域143(例えば、Read 1プライミング部位)、任意選択の第2のサンプル識別子145、および第3の3’定常領域147(例えば、増幅プライミング部位)を含む。オリゴヌクレオチド102は、3’定常領域111の少なくとも一部と相補的なプライミング領域115を有するアッセイプライマー104を用いて増幅される。例えば、プライマー104は、P7プライマーであってよい。同じ工程または以降の工程において、オリゴヌクレオチド102またはその相補体は、5’定常領域110またはその相補体111の少なくとも一部と相補的なプライミング領域120を有するプライマー106で増幅される。プライマーはまた、アッセイ識別子122および1つまたは複数の定常領域126、124(例えば、Illumina P5配列126およびRead 1配列決定プライマー領域124)を含む。増幅の更なるラウンドは、1つまたは複数の定常領域126、124、アッセイ識別子122、最初のオリゴヌクレオチドの5’定常領域120の配列、サンプル識別子配列128、および最初のオリゴヌクレオチドの3’定常領域130を含むオリゴヌクレオチドアンプリコン108を生成する。示される実施形態において、オリゴヌクレオチドアンプリコン108は、挿入部140を含まないが、一部の実施形態において、プライマー106は、領域3’を挿入部140に結合させ、そしてそれによって、挿入部140はアンプリコン内に含まれる。プーリング方法(実施例4に記載される)が、2つ以上のサンプルバーコード(バーコードが、ライゲーションまたは増幅のいずれかを介して取り付けられている場合)で調製されたライブラリに使用することができ、そして当該プーリング方法は、ライブラリ調製が実行された後にサンプルバーコード夾雑が起こったかを同定するのに用いることができる。
アッセイプライマー上の定常領域およびプライミング領域の選択によって、本方法は、様々なライブラリ調製方法(Haloplex XTHS、Haloplex HS、SureSelect XT、およびSureSelect QXT(全てAgilent由来)が挙げられる)、および様々な標準化された配列決定プラットフォーム(IlluminaおよびIon Torrentが挙げられる)に適合性がある。超並列配列決定用の配列決定プラットフォームとして、Ion Torrent PGMおよび陽子半導体シーケンサー、ならびにIllumina MiSeq、HiSeq、MiniSeq、およびNextSeqが挙げられる。他の配列決定プラットフォームが開発中であり、そして本組成物および方法は、それらのプラットフォーム用の標準増幅領域に用いることができる。
一部の実施形態において、オリゴヌクレオチド上の定常領域および/またはアッセイ識別子は、標準化された配列決定プラットフォームでの使用に適した配列を含む。例えば、定常領域は、Illumina配列決定プラットフォーム用の増幅領域の配列、例えばIllumina P5配列もしくはIllumina P7配列、または例えばIon TorrentアダプターA配列もしくはIon TorrentアダプターP1配列、または例えば配列決定プライマー領域、例えばIllumina Read1、Index1、Read2、もしくはIndex2を有してよい。他の増幅領域または配列決定プライマー領域を、様々なプラットフォームに用いることができる。表1は、IlluminaおよびIon Torrent配列決定プラットフォームに現在用いられている標準領域の配列を示す。
一部の実施形態において、オリゴヌクレオチドの定常領域は、表1に示される配列から選択される配列を含む。
図5は、本方法および本組成物が、サンプル識別子に対して3’の位置にアッセイ識別子を加えるためにどのように用いられ得るかを示す。このアプローチは、とりわけ、配列決定されることとなる標的分子の5’末端への取付け用に構成されるアダプター、または標的分子の5’末端を増幅することが意図されるプライマーであるオリゴヌクレオチドに適している。ゆえに、この実施形態において、本方法は、5’アダプター(図1に示される3’アダプターに代わるものである)内に存在する識別子を検出するのに特に適している。
図5において、オリゴヌクレオチド502は、5’定常領域510、サンプル識別子512、および3’定常領域514を含む。例えば、5’定常領域510は、Illumina P5配列であってよく、サンプル識別子512は、サンプルバーコードであってよく、そして3’定常領域514は、Illumina Read 1配列であってよい。オリゴヌクレオチド502は、3’定常領域514の少なくとも一部と相補的なプライミング領域515を有するプライマー504を用いて増幅される。例えば、プライミング領域515は、3’定常領域514の逆相補体、すなわちIllumina Read 1配列の逆相補体であってよい。プライマー504はまた、配列決定プラットフォームまたはその相補体、例えばIllumina P7の逆相補体(P7’)用のアッセイ識別子517およびアダプター519を含む。オリゴヌクレオチド502またはその相補体は、5’定常領域510またはその相補体の少なくとも一部と相補的なプライミング領域520を有するプライマー506で増幅される。増幅の更なるラウンドは、3’アダプター518、アッセイ識別子522、516、3’定常領域514、サンプル識別子512、および5’定常領域520を含むオリゴヌクレオチドアンプリコン508を生成する。オリゴヌクレオチドアンプリコン508は、超並列配列決定用の標準プラットフォームでの配列決定に適合する。なぜなら、少なくとも1つの定常領域、そして多くの場合、双方の定常領域が、そのようなプラットフォーム用のアダプターを含むからである。
図6は、本アッセイ方法および組成物が、2つの定常領域によって囲まれるオリゴヌクレオチドであって、当該定常領域のどちらもアッセイに用いられることとなる配列プラットフォームと適合しない場合に、そのオリゴヌクレオチド内の夾雑を検出するのにいかに用いられ得るかを示す。これ以外にも、このアプローチは、アダプターおよびプライマーを、ある配列決定プラットフォームから変換して、別のプラットフォームで配列決定できるようにするのに用いることができる。例えば、Ion Torrent HaloPlexアッセイに用いられるアダプター等のオリゴヌクレオチドは、Illumina P5、QXT Read1、QCインデックス、IonTorrent Readプライマーを含むアッセイプライマー、ならびにIllumina P7およびHaloplexダーク塩基(dark base)(ダーク塩基は、配列決定中のヌクレオチド組込みと関連する蛍光を生じさせないものである)に対する逆相補体を含む増幅プライマーを用いてアッセイすることができる。これにより、これらのプライマーを、Illuminaシーケンサーで夾雑についてアッセイすることができる。このアプローチはまた、配列決定が意図されていない、そしてプラットフォームを配列決定するための増幅領域を含まないオリゴヌクレオチドの配列決定を可能にするのにも用いることができる。ただし、当該オリゴヌクレオチドが、5’定常領域、知られていない領域、および3’定常領域を含む場合である。
図6において、オリゴヌクレオチド602は、5’定常領域610、サンプル識別子612、および3’定常領域614を含む。この実施形態において、オリゴヌクレオチド602の定常領域610、614は、第1の配列決定プラットフォーム、例えばIon Torrent配列決定プラットフォーム用であるが、第2の配列決定プラットフォーム、例えばIllumina配列決定プラットフォームでオリゴヌクレオチド602を配列決定することが所望される。例えば、5’定常領域610は、Ion TorrentアダプターA配列であってよく、サンプル識別子612は、サンプルバーコードであってよく、そして3’定常領域614は、ライゲーションおよび品質制御を可能とするために提供されるダーク塩基であってよい。オリゴヌクレオチド602は、3’定常領域614の少なくとも一部と相補的な(すなわち、ダーク塩基の少なくとも一部と相補的な)プライミング領域615を有するプライマー604を用いて増幅される。プライマー604はまた、配列決定プラットフォーム用の標準増幅領域、例えばIllumina P7配列に相当する領域を含む領域617を含む。オリゴヌクレオチド602またはその相補体は、5’定常領域610またはその相補体611の少なくとも一部と相補的なプライミング領域620を有するプライマー606で増幅される。プライマー606はまた、アッセイ識別子622および1つまたは複数の定常領域(例えば、Illumina P5配列626およびIllumina Read 1配列624)を含む。増幅が、適切な増幅サイクルを用いて、プライマー606およびプライマー604で続けられて、Illumina配列決定プラットフォームでの配列決定に適したオリゴヌクレオチドアンプリコンを提供する。増幅の更なるラウンドにより、1つまたは複数の定常領域626、624、アッセイ識別子622、最初のオリゴヌクレオチド620の5’定常領域610の配列620、サンプル識別子612、3’定常領域614の配列、および増幅領域628を含むオリゴヌクレオチドアンプリコン608が生じる。オリゴヌクレオチドアンプリコン608は、定常領域626および/または増幅領域628により、超並列配列決定用の標準プラットフォームでの配列決定に適合する。
一部の実施形態において、(アダプターの場合のような)相補的DNA鎖の存在は、相補的アダプター鎖が増幅プライマー用の結合領域の双方を含有するならば、夾雑または配列変化の検出に関する問題を引き起こす虞がある。そのような状況では、双方の鎖が増幅されることとなり、検出されるあらゆる夾雑/配列変化が、2本の鎖上に存在するバーコード配列の配列差異に起因し得た。多くの場合において、アダプター設計は、こうしたことが起こらないようになされる。
[実施例1]
本方法の実施形態は、サンプルバーコード夾雑が、Illuminaアダプター配列を有するキット内に存在するかを判定するのに使用される。図1Aに示すように、オリゴヌクレオチド102は、サンプル識別子112を有し、Illumina Index1配列がその5’定常領域110として、そしてIllumina P7’配列がその3’定常領域114として、側面に位置する。P7’は、P7の相補体を示す。同様に、P5’は、P5の相補体を示す。図1は、このオリゴヌクレオチド102の夾雑を、様々なサンプル識別子を有するオリゴヌクレオチドで検出する方法を示す。増幅は、標準的なDNAポリメラーゼ、P7プライマー、およびP5を含む別のプライマー、Read 1プライマー配列、QCバーコード、およびIndex 1配列(それぞれ5’から3’)を用いて実行することができる。高フィデリティ(high fidelity)DNAポリメラーゼを用いて、PCRエラーに起因する誤った夾雑検出を引き下げ、または最小にすることができる。
アッセイプライマーの2つのバージョンまたは実施形態を用いて、アッセイを開発した。当該2つのバージョンの配列を、図2に示す。Illumina Read 1プライマー、およびIllumina Read 2(Index 1)プライマー配列の逆相補体の双方をアッセイプライマー内に含むアッセイプライマーのバージョン1を用いた最初の試みにより、少量の予想される130bpのアンプリコンおよび大量のより短い増幅産物が生じた(図3のレーンB1)。これらの産物は、潜在的に、Read 1の3’末端とIndex 1の5’末端間の13bpの相補性に起因して生じる二次増幅産物に由来する。Read 1の配列をIllumina配列からQXT Read 1配列(アッセイプライマーのバージョン2)に変えることによって、これらの二次増幅産物は、大部分が除外された(図4のレーンB1)。
[実施例2]
HaloplexおよびHaloplex HSキットを試験して、サンプルバーコードを含有するオリゴヌクレオチドが、キット内に供給される供給インデックス溶液内で増幅し得るかを見た。オリゴヌクレオチドは、きれいに増幅し得ることが判明した。というのも、アッセイプライマーを用いた場合に、強い増幅産物が生じたからである(図4、レーンB1(供給したインデックス溶液))。
[実施例3]
アッセイプライマーを、SureSelect XTおよびSureSelect XT2試薬キットで試験して、オリゴヌクレオチドが首尾よく増幅された。また、本アッセイプライマーを用いて、重複配列に修飾があるSureSelect XTHS試薬キットを試験して、オリゴヌクレオチドが首尾よく増幅された。
これらのライブラリの増幅は、オリゴヌクレオチドが伸長を防止するように修飾されている場合ですら、起こり得る。というのも、最初の2ラウンド後以降のラウンドが、合成された分子を鋳型として用いるからである。増幅方法もまた、5’ビオチン修飾の存在下で機能する。
[実施例4]
96個以上のサンプル識別子の一セットを用意する。当該セットは、配列決定前の増幅に先立って、かつ/またはプーリングに先立って、サンプル識別子を核酸に加えるのに用いることができる。しかしながら、キットのアセンブリまたは試薬の調製中に、これらのサンプル識別子の1つにおいて夾雑が生じたならば、サンプル中の低い対立遺伝子変異体の検出が生じる場合がある。夾雑の欠如について確信を持つために、多数の配列決定ランを実施して、全てのサンプル識別子に夾雑がないと確認することができることを確実にした。
以下のスキームは、この制限を克服し、そして以下のスキームを用いて、サンプル識別子(この実施例においてサンプルバーコードまたはSBCとも呼ばれる)および/またはアッセイ識別子(この実施例においてQCバーコードまたはQCBCとも呼ばれる)の夾雑を判定することができる。様々なサンプル識別子を含有する96個のオリゴヌクレオチドの一セットを、2つのグループ、グループ1およびグループ2に分割する。それぞれは48個のオリゴヌクレオチドを含有する。グループ1は、SBC1〜SBC48を有し、グループ2は、SBC49〜SBC96を有する。グループ1内の各サンプル識別子を、48個の様々なアッセイ識別子(QCBC1〜QCBC48)の1つを含有するアッセイプライマーで増幅する。グループ2内の各サンプル識別子を、グループ1に用いた同じ48個のアッセイ識別子の1つで、全てのアッセイ識別子(QCBC1〜QCBC48)が双方のグループに、かつ2つの増幅反応に存在するように、そして全てのサンプル識別子(SBC1〜SBC96)が、1つのグループにのみ、かつ1つの増幅反応にのみ存在するように、増幅する。スキームに従うサンプル識別子(SBC)とのアッセイ識別子(QCBC)の関連を、図7に示す。説明目的で、SBCを、96ウェルプレート内に配置するように示すが、ウェルプレート内に用意する必要もなければ、ウェルプレートに用いる必要もない。
PCR増幅は、QCBCおよびSBCを有するオリゴヌクレオチドアンプリコンを生成する。夾雑がない場合、各SBCは、一つのQCBCと関連する。言い換えると、配列決定した場合、SBC毎の配列情報は、それと関連する単一のQCBCを有するはずである。図7は、このスキームを用いて生じることとなる関連を示す。しかしながら、超並列配列決定を用いて、個々にではなくプールでアンプリコンを配列決定することによって、配列決定に必要とされる時間、費用、および努力を引き下げることが所望される。ゆえに、グループ1において生じるオリゴヌクレオチドアンプリコンを、一緒にプールして配列決定し、そしてグループ2由来のオリゴヌクレオチドアンプリコンを、一緒にプールして配列決定する。プールの配列決定は、プール内に含まれる種々のアンプリコンについての配列情報を生じさせ、そして所定のアンプリコンについての配列決定情報は、サンプル識別子、およびそれと関連するアッセイ識別子を有することとなる。
こうした配列決定により、配列情報の分析後に同定される関連に基づいた、サンプル識別子またはアッセイ識別子に起因する夾雑の検出が可能となることとなる。この分析のために、全ての潜在的サンプル識別子(プール内に存在することが意図されるか否かに拘らない)を、配列決定情報の分析に含めることが有益である。夾雑が起こるならば、夾雑は、サンプル識別子またはアッセイプライマーに由来し得る。サンプル識別子およびアッセイ識別子が(グループ1およびグループ2由来の)2つの配列決定プールにおいて現れるパターンは、夾雑がサンプル識別子夾雑またはアッセイ識別子夾雑のいずれであるかを判定することとなる。本スキームにより、どちらが夾雑の源であるかを判定することができる。
グループ2由来のサンプル識別子が、グループ1において観察されるならば(例えば、SBC66の配列が、グループ1についての配列決定情報において見出されるならば)、これは、グループ1内における一つのサンプルバーコードの夾雑を示す。というのも、予想される48個ではなく49個のサンプル識別子が存在するからである。しかしながら、この知識のみでは、グループ1内のどのサンプル識別子にSBC66が夾雑したかを示せない。どのアッセイ識別子が夾雑SBC66と関連するかに基づいて、夾雑した具体的なサンプルバーコードを判定する。第1のプール内に見出されたSBC66がQCBC10と関連するならば、SBC10は、SBC66が夾雑したサンプル識別子である。グループ1内のいずれのサンプル識別子も、それと関連する、夾雑サンプル識別子と同じアッセイ識別子を有するならば、サンプル識別子は夾雑している。
加えて、本方法、本組成物、および本キットはまた、複数のアッセイ識別子と関連するサンプル識別子を同定することによって、かつ/または複数のサンプル識別子と関連するアッセイ識別子を同定することによって、プール内の夾雑を検出することもできる。配列情報がSBC13およびQCBC13を有するアンプリコン、ならびにSBC13およびQCBC29を有するアンプリコンの存在を示す(すなわち、SBC13は、QCBC13と、そしてQCBC29と関連する)ならば、これは、何らかの夾雑が存在することを示す。しかしながら、この知識のみでは、SBC29にSBC13が夾雑したのか、QCBC13にQCBC29が夾雑したのかを示せない。同じアッセイ識別子の夾雑が第2のプール内に存在するか同定することによって、夾雑の源を同定することができる。第2のプールにおいて、SBC61は、夾雑の不在下で、QCBC13とのみ関連することとなる。しかしながら、SBC61が、QCBC29とも関連するならば、これは、QCBC13が夾雑されたことを示す。なぜなら、夾雑が双方のプールにおいて生じたからである。SBC61がQCBC29と関連しないならば、QCBC13は夾雑されておらず、SBC29が、第1のプールにおける夾雑の源であった。また、同じアプローチが、グループ2のプール内に存在するグループ1サンプル識別子について機能する。本方法は、2つの配列決定プールを用いて、サンプル識別子の夾雑と、アッセイ識別子の夾雑との間に差異を認める能力を提供する。
本方法および本組成物はまた、2つの定常領域間で見出されるランダムなヌクレオチドの配列変異を判定するのに用いることもできる。アッセイ識別子は、配列決定出力が、所望される夾雑のレベルを検出するのに十分であると仮定して、標準サンプルバーコードとして作用することができ、そしてサンプルの1つのみのプールが必要とされることとなる。例えば、このアッセイは、小さな可変領域が2つの定常領域間に存在する場合、配列内に生じる夾雑の低いレベル量を同定するのに用いることができ、そして意図されるあらゆる用途に用いられるオリゴヌクレオチド内の夾雑または変異を同定するのに有益であり得る。
例示的な、または好ましい実施形態の上述の説明は、特許請求の範囲によって定義される本発明を限定するのではなく、具体的に説明するものととられるべきである。容易に理解されるように、先に記載した特徴の多数の変異および組合せを、特許請求の範囲に記載される本発明を逸脱しない範囲で利用することができる。そのような変形は、本発明の範囲からの逸脱とみなされず、そしてそのような変形は全て、以下の特許請求の範囲の範囲内に含まれることが意図される。本明細書中で引用される参考文献は全て、その全体が参照によって組み込まれる。

Claims (20)

  1. アッセイ識別子を、オリゴヌクレオチドを含む一セットのオリゴヌクレオチドサンプルに取り付ける方法であって、各オリゴヌクレオチドが、5’定常領域、サンプル識別子、および3’定常領域を含み、前記方法が、
    前記セットの前記オリゴヌクレオチドサンプルのそれぞれを、別個のベッセル内に用意するステップと、ここで、各ベッセルが、前記サンプルの1つまたは複数が夾雑していない限り、たった1つのサンプル識別子を含み;
    各ベッセル内で前記オリゴヌクレオチドをアッセイプライマーおよび第2のプライマーで増幅するステップと、ここで、前記アッセイプライマーが、1つまたは複数の定常領域、アッセイ識別子、および、前記オリゴヌクレオチドの前記定常領域の1つと同じであるまたは相補的であるプライミング部分を含み、各ベッセルが、前記アッセイプライマーの1つまたは複数が夾雑していない限り、たった1つのアッセイ識別子を含み;
    これらのステップによって、アッセイ識別子およびサンプル識別子を含むオリゴヌクレオチドアンプリコンを用意するステップと
    を含む方法。
  2. オリゴヌクレオチドサンプルの前記セットが、少なくとも8つのサンプルを含む、請求項1に記載の方法。
  3. 前記オリゴヌクレオチドアンプリコンが、
    配列決定プラットフォームおよび配列決定プライミング領域のための標準5’増幅領域を含む5’定常領域と、
    アッセイ識別子と、
    配列決定プライミング領域を含む中央の定常領域と、
    サンプル識別子と、
    配列決定プラットフォームのための標準3’増幅領域を含む3’定常領域と
    を含む、請求項1または2に記載の方法。
  4. 前記標準5’増幅領域がP5配列を含み、かつ、前記標準3’増幅領域がP7’配列を含む、または前記標準5’増幅領域がP7配列を含み、かつ、前記標準3’増幅領域がP5’配列を含む、請求項3に記載の方法。
  5. 前記オリゴヌクレオチドアンプリコンが、
    標準5’増幅領域を含む5’定常領域と、
    サンプル識別子と、
    中央の定常領域と、
    アッセイ識別子と、
    標準3’増幅領域を含む3’定常領域と
    を含む、請求項1〜4のいずれか1項に記載の方法。
  6. 前記第2のプライマーが、前記オリゴヌクレオチドの前記定常領域の1つと同じ、または相補的な3’領域を含み、前記第2のプライマーがさらに、配列決定プラットフォームのための標準増幅領域を含む5’領域を含み、前記第2のプライマーの前記5’領域が、前記オリゴヌクレオチドの前記定常領域の前記配列によって以前支持されていない配列決定プラットフォームでの配列決定を可能にする、請求項1〜5のいずれか1項に記載の方法。
  7. 前記オリゴヌクレオチドが、ライブラリ分子である、請求項1〜6のいずれか1項に記載の方法。
  8. 核酸サンプルについて一セットのオリゴヌクレオチド内の夾雑を検出する方法であって、
    オリゴヌクレオチドを含む一セットのオリゴヌクレオチドサンプルを用意するステップと、ここで、各オリゴヌクレオチドが、5’定常領域、サンプル識別子、および3’定常領域を有し、サンプル内の前記オリゴヌクレオチドのそれぞれが、同じサンプル識別子を有し、前記セット内の前記サンプルのそれぞれが、前記サンプルの1つまたは複数が夾雑されていない限り、異なるサンプル識別子を有し;
    前記オリゴヌクレオチドまたは前記オリゴヌクレオチドの相補体を、アッセイプライマーおよび第2のプライマーで増幅するステップと、ここで、サンプル毎に前記アッセイプライマーが異なっており、各アッセイプライマーが、プライミング部分およびアッセイ識別子を含むことによって、一セットのオリゴヌクレオチドアンプリコンを生成し、各オリゴヌクレオチドアンプリコンが、前記アッセイ識別子の1つ、前記5’定常領域、前記サンプル識別子の1つ、および前記3’定常領域を含み;
    前記オリゴヌクレオチドアンプリコンを、1つまたは複数のプール内にプールするステップと;
    前記オリゴヌクレオチドアンプリコンの少なくとも前記サンプル識別子および前記アッセイ識別子についての配列を決定するために、前記1つまたは複数のプールについて配列決定を行うステップと;
    前記1つまたは複数のプール内の前記サンプル識別子が夾雑サンプル識別子を含むかどうかを判定するステップと
    を含む方法。
  9. 前記第1のプール内の前記アッセイ識別子が夾雑アッセイ識別子を含むかどうかを判定するステップをさらに含む、請求項8に記載の方法。
  10. 前記夾雑サンプル識別子が、(i)複数のアッセイ識別子と関連する前記サンプル識別子の少なくとも1つを同定するステップと、(ii)複数のサンプル識別子と関連するアッセイ識別子の少なくとも1つを同定するステップのいずれかまたは双方によって判定される、請求項8または9に記載の方法。
  11. 前記1つまたは複数のプールが、第1のプールおよび第2のプールを含み;
    前記オリゴヌクレオチドアンプリコンの、少なくとも前記サンプル識別子および前記アッセイ識別子について配列を決定するために、前記第1のプールおよび前記第2のプールを別個に配列決定するステップと;
    前記第2のプール内の前記サンプル識別子が夾雑サンプル識別子を含むかどうかを判定するステップと
    を含む、請求項8〜10のいずれか1項に記載の方法。
  12. 前記第2のプール内の前記アッセイ識別子が夾雑アッセイ識別子を含むかどうかを判定するステップをさらに含む、請求項11に記載の方法。
  13. 夾雑サンプル識別子を、前記夾雑サンプル識別子が第2のプール由来であることを判定することによって同定するステップ
    をさらに含む、請求項11に記載の方法。
  14. 夾雑サンプル識別子を、前記第2のプールが夾雑アッセイ識別子を含まないことを判定することによって同定するステップ
    をさらに含む、請求項11に記載の方法。
  15. 夾雑アッセイ識別子を、前記第2のプールが夾雑アッセイ識別子を含むことを判定することによって同定するステップ
    をさらに含む、請求項11に記載の方法。
  16. オリゴヌクレオチドの前記セットは、少なくとも8つのオリゴヌクレオチドを含む、請求項8から15のいずれか1項に記載の方法。
  17. アッセイグループを形成するために、前記アッセイ識別子に従って前記オリゴヌクレオチドアンプリコンの配列をグループ化し、前記アッセイグループのそれぞれに複数のサンプル識別子配列が存在するかを判定するステップと;
    サンプルグループを形成するために、前記サンプル識別子に従って前記オリゴヌクレオチドアンプリコンの配列をグループ化し、前記サンプルグループのそれぞれに複数のアッセイ識別子配列が存在するかを判定するステップ
    のいずれかまたは双方をさらに含む、請求項8〜16のいずれか1項に記載の方法。
  18. 前記アッセイ識別子の少なくとも1つと前記サンプル識別子の少なくとも1つとの間のミスマッチを判定するステップを含む、請求項8に記載の方法。
  19. 5’定常領域、サンプル識別子(例えばサンプルバーコード)、および3’定常領域を有する少なくとも1つのオリゴヌクレオチドと、
    プライミング部分およびアッセイ識別子を含む少なくとも1つのアッセイプライマーと
    を含む組成物。
  20. DNAポリメラーゼ、および
    デオキシヌクレオチド
    の1つまたは複数をさらに含む、請求項19に記載の組成物。
JP2019572006A 2017-07-10 2018-05-10 核酸識別子の夾雑を検出するためのアッセイ方法および組成物 Withdrawn JP2020527033A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023012722A JP2023061989A (ja) 2017-07-10 2023-01-31 核酸識別子の夾雑を検出するためのアッセイ方法および組成物

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/645,082 2017-07-10
US15/645,085 US10633651B2 (en) 2017-07-10 2017-07-10 Assay methods and compositions for detecting contamination of nucleic acid identifiers
PCT/US2018/032012 WO2019013860A1 (en) 2017-07-10 2018-05-10 METHODS AND TEST COMPOSITIONS FOR DETECTING THE CONTAMINATION OF NUCLEIC ACID IDENTIFIERS

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023012722A Division JP2023061989A (ja) 2017-07-10 2023-01-31 核酸識別子の夾雑を検出するためのアッセイ方法および組成物

Publications (1)

Publication Number Publication Date
JP2020527033A true JP2020527033A (ja) 2020-09-03

Family

ID=64904194

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019572006A Withdrawn JP2020527033A (ja) 2017-07-10 2018-05-10 核酸識別子の夾雑を検出するためのアッセイ方法および組成物

Country Status (4)

Country Link
US (3) US10633651B2 (ja)
EP (1) EP3652346A4 (ja)
JP (1) JP2020527033A (ja)
WO (1) WO2019013860A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11514331B2 (en) 2016-04-27 2022-11-29 Massachusetts Institute Of Technology Sequence-controlled polymer random access memory storage
US11905532B2 (en) 2019-06-25 2024-02-20 Massachusetts Institute Of Technology Compositions and methods for molecular memory storage and retrieval

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013528058A (ja) * 2010-06-09 2013-07-08 キージーン・エン・フェー 高処理スクリーニング用の組合せ配列バーコード
US20140378349A1 (en) * 2012-08-14 2014-12-25 10X Technologies, Inc. Compositions and methods for sample processing

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK1929039T4 (en) 2005-09-29 2014-02-17 Keygene Nv High throughput-screening af mutageniserede populationer
CA2697640C (en) * 2007-09-21 2016-06-21 Katholieke Universiteit Leuven Tools and methods for genetic tests using next generation sequencing
US20120252686A1 (en) * 2011-03-31 2012-10-04 Good Start Genetics Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction
AU2013337280B2 (en) 2012-11-05 2018-11-08 Takara Bio Usa, Inc. Barcoding nucleic acids
EP2746405B1 (en) * 2012-12-23 2015-11-04 HS Diagnomics GmbH Methods and primer sets for high throughput PCR sequencing
WO2015057319A1 (en) 2013-10-17 2015-04-23 Clontech Laboratories, Inc. Methods for adding adapters to nucleic acids and compositions for practicing the same
US10428373B2 (en) 2013-11-15 2019-10-01 The Regents Of The University Of California Duplicating DNA with contiguity barcodes for genome and epigenome sequencing

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013528058A (ja) * 2010-06-09 2013-07-08 キージーン・エン・フェー 高処理スクリーニング用の組合せ配列バーコード
US20140378349A1 (en) * 2012-08-14 2014-12-25 10X Technologies, Inc. Compositions and methods for sample processing

Also Published As

Publication number Publication date
US20200181602A1 (en) 2020-06-11
CN110892079A (zh) 2020-03-17
EP3652346A1 (en) 2020-05-20
US20190010488A1 (en) 2019-01-10
EP3652346A4 (en) 2021-04-14
WO2019013860A1 (en) 2019-01-17
US10633651B2 (en) 2020-04-28
US20210317442A1 (en) 2021-10-14

Similar Documents

Publication Publication Date Title
Meyer et al. Illumina sequencing library preparation for highly multiplexed target capture and sequencing
Wong et al. Multiplex Illumina sequencing using DNA barcoding
CA2873585C (en) Method for increasing accuracy in quantitative detection of polynucleotides
US20160194699A1 (en) Molecular coding for analysis of composition of macromolecules and molecular complexes
Kozarewa et al. 96-plex molecular barcoding for the Illumina Genome Analyzer
JP7332733B2 (ja) 次世代シークエンシングのための高分子量dnaサンプル追跡タグ
US20090305237A1 (en) Quantification of nucleic acids and proteins using oligonucleotide mass tags
Ma et al. Microfluidics for genome-wide studies involving next generation sequencing
US9334532B2 (en) Complexity reduction method
CA2372698A1 (en) Microarray-based subtractive hybridization
US20240158850A1 (en) Method and kit for the generation of dna libraries for massively parallel sequencing
CN113293205A (zh) 测序方法
US20210363517A1 (en) High throughput amplification and detection of short rna fragments
US20230265500A1 (en) High-compatibility pcr-free library construction and sequencing method
US20210317442A1 (en) Assay methods and compositions for detecting contamination of nucleic acid identifiers
US10941453B1 (en) High throughput detection of pathogen RNA in clinical specimens
US20210010060A1 (en) Highly Multiplexed PCR with Bioinformatically Optimized Primers to Prepare Targeted Libraries for Next-Generation Sequencing
Veeranagouda et al. RNA Fragmentation and Sequencing (RF‐Seq): Cost‐Effective, Time‐Efficient, and High‐Throughput 3′ mRNA Sequencing Library Construction in a Single Tube
JP2023061989A (ja) 核酸識別子の夾雑を検出するためのアッセイ方法および組成物
CN110892079B (zh) 用于检测核酸标识符污染的测定方法和组合物
US20230031082A1 (en) Method for whole genome sequencing of picogram quantities of dna
KR20230041808A (ko) 고체 지지체에 핵산 분자를 로딩하는 방법
Szelinger et al. Bar-coded, multiplexed sequencing of targeted DNA regions using the Illumina Genome Analyzer
US20220411861A1 (en) A Multiplex Method of Preparing a Sequencing Library
Flood Novel Fragmentation Method for Automated Next Generation Sequencing Exome Library Preparation

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200402

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210507

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220225

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220225

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220524

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220930

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230131

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20230131

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20230207

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20230210

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20230414

C211 Notice of termination of reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C211

Effective date: 20230418

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20240815