JP6664575B2 - 核酸分子数計測法 - Google Patents

核酸分子数計測法 Download PDF

Info

Publication number
JP6664575B2
JP6664575B2 JP2017019549A JP2017019549A JP6664575B2 JP 6664575 B2 JP6664575 B2 JP 6664575B2 JP 2017019549 A JP2017019549 A JP 2017019549A JP 2017019549 A JP2017019549 A JP 2017019549A JP 6664575 B2 JP6664575 B2 JP 6664575B2
Authority
JP
Japan
Prior art keywords
sequence
barcode
nucleic acid
base
reads
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017019549A
Other languages
English (en)
Other versions
JP2017099400A (ja
Inventor
菊也 加藤
菊也 加藤
洋児 久木田
洋児 久木田
亮 的場
亮 的場
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DNA Chip Research Inc
Osaka Prefectural Hospital Organization
Original Assignee
DNA Chip Research Inc
Osaka Prefectural Hospital Organization
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DNA Chip Research Inc, Osaka Prefectural Hospital Organization filed Critical DNA Chip Research Inc
Publication of JP2017099400A publication Critical patent/JP2017099400A/ja
Application granted granted Critical
Publication of JP6664575B2 publication Critical patent/JP6664575B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Plant Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

本発明は、核酸分子混合物における核酸分子の数を計測する方法に関する。具体的には、本発明は、複数の核酸分子の混合物の核酸塩基配列に各分子を識別する配列を付加し、塩基配列決定する際に生じる識別配列内のリードエラーを検出することによって高精度に核酸分子数を計測する方法に関する。
現在までに、血液をサンプリングすることによって体内の腫瘍の情報を得ることができる手法として、死亡癌細胞から血中に放出されたセルフリーDNA(cfDNA)である循環腫瘍DNA(ctDNA)が利用されるようになっている。このctDNAは固形腫瘍の遺伝情報を末梢血に運ぶキャリアと考えられており、ctDNAを利用することにより、遺伝的な腫瘍の不均一性(例えば疾病経過による癌細胞の進化)の分析を容易にすることが期待されている。このcfDNAの大きさは平均して170塩基対であり、その半減期は16.5分である。また血液1ミリリットル中に1〜数千ゲノムのcfDNAが含まれている。
ところで、このctDNAを検出するために種々の技術が開発されているが、デジタルPCRおよびその関連技術、特に超並列DNAシーケンサーがその筆頭技術となっている。しかし、このような次世代シーケンサーは高頻度で出現するリードエラーが問題となっており、塩基配列を決定する領域が多くなればなるほど、その誤判定数や偽陽性の数が増加してしまう。また別の問題として、大規模並列シーケンスのためのテンプレート準備段階で対象DNA全体を増幅する工程があり、これにより最終的なシーケンスリードは最初のDNA分子の割合を反映しないものとなってしまう。通常、リード数は対象のDNA分子数を上回ってしまい、突然変異のアレルの計測に影響がでてしまう。
これらの問題の解決策として用いられている手法がバーコード配列である(非特許文献1及び2)。これは多くの場合10から15塩基のランダムな配列でDNA断片をラベルし、個々の分子由来のリードを見分け、各分子由来のリードのグループ化を可能にするものである。つまり、リードのコンセンサスを作ることにより、高品質のDNAシーケンシングを提供し、配列決定した分子を計数することができるようになる。
Casbon, J. A., Osborne, R. J., Brenner, S. and Lichtenstein, C. P. 2011, A method for counting PCR template molecules with application to next-generation sequencing. Nucleic Acids Res., 39, e81. Kinde, I., Wu, J., Papadopoulos, N., Kinzler, K. W. and Vogelstein, B. 2011, Detection and quantification of rare mutations with massively parallel sequencing. Proc. Natl. Acad. Sci. USA, 108, 9530-9535.
しかしながら、このバーコード配列を用いた手法にも問題はあり、その主なものとしては、バーコード配列自体にもたらされるリードエラーである。つまりこの問題は、単一の固有のバーコードを各分子にラベルするという基本的な原則に影響を及ぼしてしまう。そのため、小さな集団のバーコード配列を設計してエラーを検出し、除外することが試みられているが、このアプローチでは、各バーコード配列を個別に製造することを必要とするため、多数の配列に対応することができない。そこで、複数の核酸分子の混合物における分子数を計測するために、より高精度な方法の開発が望まれている。
本発明は、このような状況を鑑みてなされたものであり、核酸塩基配列を決定する際に生じるリードエラーを検出することにより、高精度に核酸分子数を計測する方法を提供することを目的とする。
本発明者らは、このような課題を解決するために、核酸分子の塩基配列決定の際に生じるリードエラーの特徴に着目した結果、シーケンサーの種類に応じて主なリードエラーが異なることを観察した。そこで鋭意研究を重ねた結果、リードエラーの特徴ごとに適切なバーコード配列を設計し、このバーコード配列を解析することによりリード数毎にエラーのないものの割合を算出できることを見出し、リードエラーを適切に除去できることを見出した。
具体的には、本発明の第一の主要な観点によれば、核酸塩基配列を決定する際に生じるリードエラーを検出することによって高精度に核酸分子数を計測する方法であって、複数の核酸分子の混合物にバーコード配列生成オリゴヌクレオチドを加えることにより、各核酸分子を構成する塩基配列に、当該核酸分子に固有のバーコード配列を連結する工程と、前記バーコード配列を連結した核酸分子の塩基配列を決定する工程と、塩基配列を決定したバーコード配列のリードエラーを検出する工程と、前記塩基配列を決定したバーコード配列のリード数に基いて、塩基配列を決定した全バーコード配列のうち、当該バーコード配列にリードエラーが存在しないものの割合を算出する工程と、を有し、前記バーコード配列生成オリゴヌクレオチドは最多で5種類の塩基からなり、リードエラーが存在しないバーコード配列の数が前記混合物における核酸分子数を示す、方法が提供される。
このような構成によれば、塩基配列を決定したバーコード配列におけるリードエラーを取り除くことができるため、核酸分子1つにつき1つのバーコード配列が結合しているという大前提を保障することができ、塩基配列を決定する前の核酸分子の混合物における核酸分子数を正確に計測することができる。
またこのような構成によれば、ある特定のバーコード配列が連結している塩基配列はそれが複数あったとしてもいずれも同じ配列であるという推定が高い確率で成り立つため、塩基配列決定の精度を高めることができる。
また本発明の一実施形態によれば、上述の方法であって、さらに、前記塩基配列を決定したバーコード配列のリード数毎に前記算出した割合をプロットする工程を有する、方法が提供される。
またこの場合、本発明の他の一実施形態によれば、上述の方法であって、さらに、前記プロットする工程によって得られたグラフに基いて、所定の閾値以下のリード数を有するバーコード配列を除去する工程を有する、方法が提供される。
さらに本発明の他の一実施形態によれば、前記検出する工程は、塩基配列を決定したバーコード配列毎の塩基長または塩基配列を解析することによって行われることができる。
また本発明の別の一実施形態によれば、前記バーコード配列生成オリゴヌクレオチドの長さは5〜20塩基であってもよく、また12塩基とすることもできる。
さらに本発明の他の一実施形態によれば、前記バーコード配列生成オリゴヌクレオチドは、その配列中に1またはそれ以上の他の塩基配列を有することができる。
また本発明の別の一実施形態によれば、前記バーコード配列生成オリゴヌクレオチド中の塩基は、塩基部位毎に独立して2つまたは3つの種類の塩基から選択されることができる。またこのような場合、前記検出する工程は、塩基配列を決定したバーコード配列の塩基部位毎に、前記バーコード配列を構成しない塩基を検出することによって行われることができる。
さらに本発明の他の一実施形態によれば、前記バーコード配列は、前記バーコード配列生成オリゴヌクレオチドを含むアダプターを、アダプターライゲーションにより前記核酸分子を構成する塩基配列に付加し、その後バーコード配列生成オリゴヌクレオチドの外側のアダプタープライマーと前記核酸分子を構成する塩基配列に特異的なプライマーとを用いて前記アダプターを付加した核酸分子を増幅させることによって、前記核酸分子を構成する塩基配列に連結されることができる。
また本発明の別の一実施形態によれば、前記核酸分子を構成する塩基配列、または前記核酸分子を構成する塩基配列を持つアダプターは粘着末端を有することもでき、または平滑末端を有することもできる。
さらに本発明の他の一実施形態によれば、前記リードエラーは塩基配列の挿入、欠失または塩基置換であってもよい。
また本発明の別の一実施形態によれば、上述の方法であって、さらに、塩基配列を決定したバーコード配列に基いて、同じバーコード配列を有する核酸分子のコンセンサス配列を決定する工程と、前記コンセンサス配列に基いて、塩基配列を決定した核酸分子の塩基配列におけるリードエラーを検出する工程と、前記リードエラーを有する核酸分子を除外する工程とを有する、方法が提供される。
またこの場合、さらに、前記コンセンサス配列に基いて、塩基配列を決定した核酸分子の塩基配列における突然変異を検出することにより、突然変異を有する核酸分子数を計測する工程を有する、方法が提供される。
さらに、本願発明の第二の主要な観点によれば、上述の方法において用いられるバーコード配列生成オリゴヌクレオチドであって、当該バーコード配列生成オリゴヌクレオチド中の塩基が、塩基部位毎に独立して2つまたは3つの種類の塩基から選択されるものが提供される。
また本発明の一実施形態によれば、上記のバーコード配列生成オリゴヌクレオチドは、その配列中に1またはそれ以上の他の塩基配列を有することができる。
なお、上記した以外の本発明の特徴及び顕著な作用・効果は、次の発明の実施形態の項及び図面を参照することで、当業者にとって明確となる。
図1Aは、本願発明の一実施形態に係るバーコード配列のライブラリを構築する際のスキーム図である。 図1Bは、ヒトTP53の標的領域を示す模式図である。ヒトTP53遺伝子のコード領域のcDNA構造は、COSMIC v63(http://cancer.sanger.ac.uk/)に見られる突然変異の分布の棒グラフで示した。縦の点線はDNA結合領域のエキソンの境界を示す。横の黒い太いラインは、本願発明に係る一実施形態において用いた標的領域を示す。 図2は、本願発明の一実施形態に係るバーコード配列タグにおけるエラーの観測、および標的分子の絶対定量を示すグラフ群である。Protonシーケンサーでの結果であり、図2F以外の標的領域はTK102Uである。また結果は40ngのゲノムDNAを使用して得た。 図2Aはバーコードタグあたりのリード数の分布を示すグラフである。縦軸は異なるバーコードタグの数であり、横軸は常用対数で示した場合のバーコードタグあたりのリード数である。 図2Bは累積リード数を示すグラフである。 図2Cはサイズ毎のバーコードタグの割合を示すグラフである。 図2Dは、12bpバーコードタグの割合の平均を示すグラフである。適合する12bpタグに対して単一の挿入または欠失塩基が存在する以外は12bpタグの配列と合致する11bpおよび13bpタグを12bpタグにまとめて分類している。割合の平均は周りの11ビンの割合の平均を表す。 図2Eは、エラーのあるタグを除去した後の標的分子の推計値である。横軸は推計に用いたリード数であり、リードは全リードからランダムに選択した(全リード数 5ng:1,457,760リード、10ng:2,251,133リード、20ng:2,245,038リード、40ng:2,395,763リード)。 図2Fは、分子数とエラーのあるタグを除去した後のインプットDNAの量との間の相関を示すグラフである。 図3は、本願発明の一実施形態に係る、Protonシーケンサーを用いた場合のリードの解析結果を示すグラフ群である。適合する12bpタグに対して単一の挿入または欠失塩基が存在する以外は12bpタグの配列と合致する11bpおよび13bpタグを12bpタグにまとめて分類している。
図3Aはバーコードタグあたりのリード数の分布を示すグラフである。縦軸は異なるバーコードタグの数であり、横軸は常用対数で示した場合のバーコードタグあたりのリード数である。
図3Bは累積リード数を示すグラフである。矢印はエラーのあるタグを持つリードを除去する際の閾値を示す。解析した領域はTK102Uであり、結果は40ngのゲノムDNAを使用して得た(全リード数:2,395,763リード)。
図4は、本願発明の一実施形態に係る、MiSeqシーケンサーを用いた場合のリードの解析結果を示すグラフ群である。
図4Aはバーコードタグあたりのリード数の分布を示すグラフである。縦軸は異なるバーコードタグの数であり、横軸は常用対数で示した場合のバーコードタグあたりのリード数である。
図4Bは累積リード数を示すグラフである。矢印はエラーのあるタグを持つリードを除去する際の閾値を示す。
図4Cは、エラーを持つバーコードタグおよびエラーを持たないバーコードタグの推計割合を示すグラフである。解析した領域はTK102Uであり、結果は40ngのゲノムDNAを使用して得た(全リード数:594,719リード)。
図4D及び図4Eは、エラーをもつバーコードタグを除去した後の標的分子数の推計値である。図4Dが本願発明の一実施形態に係る方法を用いた場合の結果であり、図4Eが1リードおよび2リードのタグを除去した場合の結果である。解析は全リードからランダムに選択したリードを用いて行った(全リード数 5ng:343,932リード、10ng:404,900リード、20ng:548,809リード、40ng:594,719リード)。
図5は、本願発明の一実施形態に係るバーコード配列タグにおけるエラーの観測、および標的分子の絶対定量を示すグラフ群である。結果はMiSeqシーケンサーによるものである。 図5Aは、エラーのないバーコードタグの推計平均割合を示すグラフである。平均割合は図2Dと同様に計算した。 図5Bは、分子数とエラーのあるタグを除去した後のインプットDNAの量との間の相関を示すグラフである。 図6は、本願発明の一実施形態に係る標的領域のシーケンシングのエラーレートを示すグラフである。バーコードタグを使用した場合の置換エラーレートを各列の左に黒色で、ない場合の置換エラーレートを各列の右に灰色で示した。またQ5はQ5 DNAポリメラーゼでPCR増幅した一本鎖ラベルを、PtはPlatinum Taq DNAポリメラーゼHigh FidelityキットでPCR増幅した一本鎖ラベルを、DSは二本鎖ラベルをそれぞれ示す。30ナノグラムのゲノムDNAを用いている。また計算はIon Protonシーケンサーを用いて得られた7つ(Q5、Pt)または5つ(TK102およびTK103Uを除いてDS)の領域から得られたシーケンスデータに基づいている。エラーレートの95%信頼区間は次の通りである:Q5 タグ(+)、2.8×10−6〜8.8×10−6;Pt タグ(+)、6.9×10−6〜1.3×10−5;DS タグ(+)、3.3×10−6〜1.6×10−5;Q5 タグ(−)、9.0×10−5〜9.3×10−5;Pt タグ(−)、5.7×10−4〜5.7×10−4;DS タグ(−)、3.7×10−4〜3.7×10−4
以下に、本願発明に係る一実施形態および実施例を、図面を参照して説明する。
本実施形態に係る核酸塩基配列を決定する際に生じるリードエラーを検出することによって高精度に核酸分子数を計測する方法は、上述したように、複数の核酸分子の混合物にバーコード配列生成オリゴヌクレオチドを加えることにより、各核酸分子を構成する塩基配列に、当該核酸分子に固有のバーコード配列を連結する工程と、前記バーコード配列を連結した核酸分子の塩基配列を決定する工程と、塩基配列を決定したバーコード配列のリードエラーを検出する工程と、前記塩基配列を決定したバーコード配列のリード数に基いて、塩基配列を決定した全バーコード配列のうち、当該バーコード配列にリードエラーが存在しないものの割合を算出する工程と、前記塩基配列を決定したバーコード配列のリード数毎に前記算出した割合をプロットする工程と、を有し、前記バーコード配列生成オリゴヌクレオチドは最多で5種類の塩基からなり、リードエラーが存在しないバーコード配列の数が前記混合物における核酸分子数を示すことを特徴とするものである。
本願発明において、「リードエラー」とは、塩基配列決定の際に生じる読み取りエラーを指す。次世代シーケンサーを用いて特定の配列における変異や置換を検出するために行われるシーケンシングでは、シーケンシング結果として得られるリードと呼ばれる一つ一つの配列のデータを既知のゲノム配列であるリファレンス配列にマッピングする。この際、その一つ一つのリードに読み取り間違いが入ることがあり、次世代シーケンサーの製品や読み取り配列の特性等によって異なるがおよそ塩基配列全体の0.1%以上のエラーが存在すると言われている。また頻出するまたは優位となるリードエラーの種類は製品によって異なることも知られており、例えばIon Torrent製品では挿入または欠失エラーが優位となり、Illumina製品では塩基置換エラーが優位となる。本願発明における「リードエラー」とはこのようなシーケンシングの際に生じるあらゆるエラーを含み、そのエラーの態様としては、塩基の挿入、欠失または塩基置換等が含まれる。またリードエラーの中には頻度は低いが鋳型調製のときのPCRエラーによるものも含まれる。
また本願発明において、「複数の核酸分子の混合物」とは、複数のDNA分子またはRNA分子の混合物であり、各核酸分子の長さや配列はどのようなものであっても良い。また核酸プールとして特定の組織や生物種由来のものを使用することもできる。
また本願発明において、「バーコード配列生成オリゴヌクレオチド」とは、各塩基部位が任意の塩基(A、T、G、C、U)の混合物から構成される配列である。好ましくはN(A、T、G、Cの混合物)を用いる。その塩基配列の長さは後述するバーコード配列として識別可能であれば特に定めはないが、好ましくは5〜20塩基であり、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20塩基として、塩基配列を決定する対象となる塩基配列の種類や長さ、核酸分子混合物の由来など、各実験の環境に応じて適宜選択可能である。
また、このバーコード配列生成オリゴヌクレオチドは、当該バーコード配列生成オリゴヌクレオチドの間に任意の塩基を挿入することができ、バーコード配列生成オリゴヌクレオチドが一連の配列とならなくても良い。例えば、バーコード配列生成オリゴヌクレオチドの長さを5とした場合、ACGAAGT(下線部がバーコード配列生成オリゴヌクレオチド)のような配列としても良く、この場合はNの位置を把握しておくことにより、一分子につき固有のバーコード配列として連結した後でも、当該バーコード配列を認識し、他のものと区別し得る。
さらに、このバーコード配列生成オリゴヌクレオチドを構成する塩基は、全体としては核酸を構成する5種類の塩基(A、T、G、C、U)を用いるものの、塩基部位毎でみると独立して2つまたは3つの種類の塩基を選択することができる。例えば、DHVBDHVBDHVBDHVのような配列を採用することができる。ここで、DはA、G、またはTであり、HはA、T、またはCであり、VはA、G、またはCであり、BはG、T、またはCである。またDHVB以外にも、R(プリン塩基)、Y(ピリミジン塩基)、M(AまたはC)、K(GまたはT)、S(GまたはC)、W(AまたはT)を、バーコード配列生成オリゴヌクレオチドを構成する塩基として採用することができる。またRNAの場合にはUも採用することができる。
また本願発明において、「バーコード配列」とは上述のバーコード配列生成オリゴヌクレオチドがシーケンシングの対象となる塩基配列に結合し、当該塩基配列のそれぞれに固有の配列として結合した具体的なATGCUの配列が定まったものをいう。
このバーコード配列を用いて各分子を識別する技術を分子バーコード技術と呼ぶ。この分子バーコード技術は、実験操作、特にPCR増幅及び塩基配列決定前に、各分子に固有の別々の塩基配列を連結し、実験操作後の分子を識別する技術である。超並列(次世代)シーケンサーの使用を前提とした方法であり、バーコード配列生成オリゴヌクレオチドを実験操作前のDNAまたはRNAに連結することによって達成する。分子バーコード技術によって決定された塩基配列を個々のバーコード配列ごとにグループ化し、コンセンサス配列を作ることにより操作中のアーティファクトによる誤りを除去し、またバーコード配列の数を数えることにより、実験操作前のもとのDNAあるいはRNA分子数を計測することができる。
シーケンシングの対象となる塩基配列へのバーコード配列生成オリゴヌクレオチドの結合は、任意の手法によって達成することができる。例えば、シーケンシングの対象となる塩基配列特異的なフォワードおよびリバースプライマーを用意し、当該プライマーにバーコード配列生成オリゴヌクレオチドを連結させ、核酸増幅させることによって連結することができる。
またシーケンシングの対象領域近傍の制限酵素あるいはDNA分解酵素切断末端やその他物理的生化学的手法によって生成した末端(平滑末端および粘着末端を含む)にバーコード配列生成オリゴヌクレオチドを連結したアダプターをライゲーションにより付加することでも達成できる。この場合プライマーの一方としてバーコード配列外側のアダプタープライマーをPCR増幅に使用する。
本願発明の一実施形態において、上述のリードエラーの検出はバーコード配列の長さと当該バーコード配列における塩基の解析によって行うことができる。例えば、上記のとおり、次世代シーケンサーとしてIon Torrent製品を用いた場合、そのリードエラーは挿入または欠失エラーが優位となる。そのため、バーコード配列におけるリードエラーの検出はバーコード配列の長さを計測することにより検出可能である。例えばバーコード配列生成ヌクレオチドとしてN12を用いた場合、シーケンシングの対象となる塩基配列に実際に連結したバーコード配列の長さを計測し、その長さが12塩基以外のものはリードエラーが生じていると判断することができる。
同様に、Illumina製品を用いた場合には塩基置換エラーが優位となる。そこでこの場合には、上述のように、バーコード配列生成オリゴヌクレオチドを構成する塩基について、塩基部位毎に独立して2つまたは3つの種類の塩基を選択したものを使用することでバーコード配列のエラーを検出することが可能である。例えば、DHVBDHVBDHVBDHVをバーコード配列生成オリゴヌクレオチドとして用いた場合には、1番目の塩基部位のDはCではあり得ないため、仮にシーケンシングの対象となる塩基配列に実際に連結したバーコード配列のバーコード配列の1番目の塩基がCであった場合、そのバーコード配列にはリードエラーが生じていると判断することができる。
これまでの研究により、バーコード配列あたりの塩基配列のリード数が少ないものに、エラーが入ったバーコード配列が多いことがわかっている。そこで、塩基配列のリード数ごとにバーコード配列をグループ化し、そのなかでリードエラーがないバーコード配列の比率を計算し、所定の閾値以上のグループを回収し、その他を除去することにより、エラーが存在している配列、つまり見かけ上、異なる核酸分子であると判断されてしまうものを除外することができる。
例えば、エラーの特徴として、塩基配列の挿入または欠失エラーが優位のシーケンサーの場合には、上述の通りエラーはバーコード配列の長さで判断できるため、塩基配列あたりのリード数ごとにバーコード配列をグループ化し、例えばバーコード配列生成ヌクレオチドの長さが12の場合、当該グループ化したリード数のバーコード配列において、12塩基のものの割合を算出し、そのリード数ごとにプロットする。これにより、所定の閾値以下のリード数しかもたないバーコード配列を除去することができ、またリードエラーが存在しないバーコード配列の数がもとの核酸分子集団における核酸分子数を正確に示すこととなる。
一方、エラーの態様として塩基置換エラーが優位のシーケンサーの場合には、まず上述の通り、各塩基部位において、バーコード配列生成オリゴヌクレオチドを構成する塩基として採用していないものを検出する。これによりエラーが入ったバーコード配列を割り出し、塩基配列あたりのリード数ごとにバーコード配列をグループ化し、このグループ内でのエラーが入ったバーコード配列の総数を算出する。ここで、リードエラーが入っているバーコード配列の総数における実際に検出されたリードエラーが入ったバーコード配列の数の比率は、バーコード配列生成オリゴヌクレオチドの各塩基部位における塩基が2種類のものの場合は3分の2、3種類のものの場合は3分の1である。そこで、この比率を元にバーコード配列生成オリゴヌクレオチド全体での比率を計算できる。例えば、DHVBDHVBDHVBDHVをバーコード配列生成オリゴヌクレオチドとして用いた場合には、リードエラーを有するバーコード配列の総数は、各塩基部位において取り得ない塩基を有するバーコード配列の数を3倍することによって得られる。これにより、各リード数のグループ内でのエラーが入ったバーコード配列の総数を推定することが可能となる。そして、このようにしてエラーの総数を推定した後、上述のようにリード数ごとにエラーの入っていないものの割合をプロットして、エラーをもつバーコード配列を除去することができる。
以上のように、核酸塩基配列を決定する際に生じるリードエラーを検出し、バーコード配列(塩基配列)あたりのリード数でバーコード配列をグループ化し、そのリード数毎に、塩基配列を決定したバーコード配列全体におけるリードエラーがないバーコード配列の割合をプロットしてグラフを作ることができる。そしてこのグラフに基づいて、実験毎にエラーのないバーコード配列の所定の割合を定め、その割合となるリード数を閾値として割り出し、その閾値以下のリード数しかもたないバーコード配列を除去することができる。またこれにより、リードエラーが存在しないバーコード配列の数が正確に計測できるため、もとの核酸分子の混合物における核酸分子数を正確に示すことができる。
さらに本願発明においては、上述のようにしてリードエラーが存在するものを除外することができるため、同じバーコード配列を持つ塩基配列は同じ核酸分子由来の塩基配列である蓋然性が高まる。そこで、塩基配列を決定したバーコード配列に基いて、同じバーコード配列を有する核酸分子のコンセンサス配列を決定し、このコンセンサス配列に基いて、塩基配列を決定した核酸分子の塩基配列におけるリードエラーを検出し、このリードエラーを有する塩基配列を除外することにより、シーケンシング自体の精度を高めることができる。
またこのようにして核酸分子のコンセンサス配列を決定することで、大部分のリードにおいて、特定の位置の塩基が変化していることを検出することができる。このように特定の塩基部位において変化した塩基が優位となり、且つその変化した塩基が単一の塩基となっている場合には、その変化は突然変異とみなすことができる。そのため、この突然変異を持つ塩基配列が連結したバーコード配列のグループ数を計測することにより、突然変異をもつ核酸分子の数を計測することも可能となる。
以下に、実施例を用いて、本発明をより詳細に説明するが、本発明はこれらの実施例に限定されるものではない。
(DNAサンプル)
DNAサンプルとして100人の健常白色人種の男性由来のDNAプールであるMegapool Reference male DNA(Kreatech Biotechnology社、アムステルダム、オランダ)を使用した。健常者由来およびTP53遺伝子中にR280Wの突然変異を持つMIA PaCa−2膵癌細胞株由来の白血球のゲノムDNAを標準的なフェノール/クロロホルムプロトコルを用いて抽出した。肺癌組織中に活性EGFR突然変異を有する患者については大阪府立成人病センターから、胃癌患者については大阪大学病院から集め、書面でのインフォームドコンセントを本実験に参加するすべての患者から得た。また本実験は、大阪府立成人病センターおよび大阪大学病院の倫理委員会の承認を得た。
4〜5mLのEDTA処理済血液を室温で10分間、800gで遠心分離して血漿を準備し、その血漿を新しいチューブに移し、室温で10分間、15100gで再遠心分離した。遠心分離後、血漿の上清を新しいチューブに移した。遠心分離した液体サンプルはDNA抽出まで−80℃で凍結した。DNAはQIAamp circulating nucleic acid kit(Qiagen社、ヒルデン、ドイツ)を用いて説明書に従って1.5〜2.0mLの液体サンプルから採取した。DNA濃度はQubit dsDNA HS Assay Kit(Life Technologies社、米国カルフォルニア州)を用いて決定した。
(標的領域、アダプター、及び領域特異的プライマー)
ゲノム領域を分析するため、TP53のDNA結合ドメイン、並びにKRASおよびCTNNB1の突然変異ホットスポットをコードするアダプターおよびプライマーを設計した。
(バーコード鎖の線形増幅によるライブラリ構築)
ゲノムDNA(5〜40ng)またはセルフリーDNA(全血の〜1ml)をマルチプル制限酵素(Set1:AlwNIおよびAlw26I;Set2:EarIおよびNcoI;SetKC:EarIおよびNmuCI(FastDigest enzymes、Thermo Scientific社、米国マサチューセッツ州))で処理した。大腸菌DNAリガーゼ(タカラバイオ、滋賀、日本)を用いてN12バーコード配列タグを有するアダプターのライゲーションを行った。1.2×量のAMPureXP beads(Beckman Coulter社、米国カルフォルニア州)により、ライゲーション産物を2回精製した。領域特異的プライマーミクスチャーおよびQ5 Hot Start High−Fidelity DNAポリメラーゼ(NEB)を用いて10サーマルサイクルで精製産物の線形増幅を行った。精製した線形増幅産物をPGM/ProtonプライマーおよびPlatinum Taq High Fidelity(Life Technologies社)によって増幅した。この増幅産物をAMPureXP beadsによって、またはMinElute Gel Extraction Kit(Qiagen)でアガロースゲル電気泳動することによって精製した。
(大規模並列シーケンシング)
Ion Torrentシーケンシングシステム用に、Ion PI Template OT2 200 Kit v2またはv3(Life Technologies社)およびIon OneTouch system(Ion OneTouch InstrumentおよびIon OneTouch ES、Life Technologies社)を用いて、説明書に従ってシーケンシングライブラリからシーケンシングテンプレート(エマルジョンPCRおよびビーズ濃縮)を用意した。この用意したテンプレートをIon PI Sequencing 200 Kit v2またはv3およびProton sequencer(Life Technologies社)を用いてシーケンスした。Torrent Suite 4.0または4.2(Life Technologies社)を使用して、生シグナルを塩基コールに変換し、FASTQファイルのシーケンシングリードを抽出した。またMiSeqシステム(Illumina社、米国カルフォルニア州)を用いて、説明書に従ってIlluminaシステムのシーケンシングデータを生成し、FASTQファイルのシングルエンドリードを抽出した。
(データ解析)
FASTQフォーマットのリードを個々の割り当てのために5bpインデックスを用いて分類した。5bpインデックスおよびスペーサー配列間の配列をバーコードタグとした。スペーサーおよびその後に続く配列の全長が70塩基より大きい場合、整列長の長いリード用のbwaswモードと「−b5−q2−r1−z10」のパラメータを用いて、bwa(バージョン0.6.2)で標的配列(スペーサ+標的領域)にリードを整列させた。
長い未測定末端(全リード長の10%以上)をもつリードは破棄した。
マップしたリードのバーコードタグを各標的領域で分析したところ、12bpバーコードタグを設計したにもかかわらず、シーケンシングの際の挿入・欠失エラーによって、12bp長になっていないタグを得た。そこで、9bpより短いタグについては破棄した。リードの最大値を正常値に修正するため、1塩基の挿入または欠失によって12bpタグではなくなっている11bpおよび13bpタグについては、その対応する12bpタグでまとめて分類した。例えば、「TGCATGATACG」や「TGCATGGATTACG」は、バーコード「TGCATGATTACG」でまとめた。
同じバーコード配列をもつリードをグループ化して集め、そのバーコードタグを、タグあたりのリード数に従って、2つのリード数ごとにビンとして割り当てた。その後、各ビンの12bpタグの比率を算出し、各ビンの値(割合)を当該ビンの周りの11ビンで平均化した。90%以上の平均割合を有する最小値のビンを、エラーのあるバーコードタグを除去するための閾値として用いた。
閾値よりも少ないリードをもつエラーのあるバーコードタグを除去した後、同じバーコードを有するタグのリードをsamtools(バージョン0.1.18)で組み合わせ、VarScan(v2.2.11)でコンセンサス配列を作成した。50リード以上となる場合には最も長い50リードを分析した。80%以上のリードが特定の位置で代替の塩基をもつ場合には変異型とした。コンセンサス配列のセットをFASTQファイルに変換し、すべての塩基に対してquality scoreとして「57」を割り当てた。FASTQファイルは上述の標的領域の配列に整列させ、samtoolsを用いて、生成したマッピングデータを処理してper base coverage(pileupファイル)を得た。その後、塩基の位置ごとに塩基数をまとめた。
シーケンスのエラー率は、ヒトゲノム参照配列と合致しないシーケンス塩基数を標的領域におけるシーケンスしたすべての塩基数で割ることによって算出した。バーコードタグを用いる場合、個々の分子由来の複数のリードのコンセンサス配列を分析した。コンセンサスを作る前のリードが通常の塩基配列のエラー率算出に用いられた。
(結果)
(アダプターライゲーションによるバーコード配列を結合する標的配列法)
アダプターライゲーションによってバーコード配列をゲノムDNAおよびトランスクリプトームに取り付けることが可能である。標的配列決定のため、またはアンプリコン配列決定のため、バーコード配列をPCRプライマーに埋め込む方法もある。
アダプターの制限酵素部位への結合、およびその後のアダプタープライマーと単一遺伝子特異的プライマーによるPCR増幅は、本発明者らによりゲノムDNAおよびRNAに対して大規模に適用されている強力な技術である。本発明者らは、バーコードによる標的配列決定にもこの方法を用いた。この方法では、5、4、または3塩基の突出末端をもつ制限酵素を使用することができ、これらの集団は大部分のヒトゲノムをカバーしている。本発明者らは、IIS型制限酵素によって生成する粘着末端の配列特異的ライゲーションを可能にする大腸菌DNAリガーゼを使用した。使用したアダプター配列は、個々の指標となる5つの塩基と、分子の指標となるN12(最大で1.7×10の分子を区別する)を含む。図1Aに2種類の結合方法を示す。1つ目の方法(左のルート)はバーコード鎖の線形増幅と、その後のPCR増幅を含む。線形増幅は、PCRの最初のラウンドにおけるエラーを最小化することが期待される。2つ目の方法(右のルート)では、付加されたバーコードの相補鎖を置換合成することにより、両方の鎖を同じバーコードで標識する。その後の分析には、本発明者らはまずIon Protonシーケンサーを用いて1つ目の方法を実施した。また本発明者らは、標的領域として7つの領域によりカバーされるTP53のDNA結合ドメインを選択した(図1B)。
(Ion Torrentシステムにおけるエラーバーコードタグのモニタリングおよび除去)
5〜40ngのゲノムDNAを使用して、TP53の7領域のうちの4つをシーケンスした。バーコード配列タグの数と、同じバーコード配列タグによってグループ化したリード数(タグあたりのリード)との関係の例を図2Aに示した。この実験では、インプットDNAはゲノムの約10,000コピーに相当するが、タグの総数は400,000を超えた。これらのタグの大部分は単一のリードを含むリード数の小さいものであった。しかし、この対応するリード数は、得られたリード全体のごくわずかな量でしかない(図2B)。このような現象は以前の研究でも観察されている。
挿入/欠失エラーは、Ion Torrent PGM/Protonによるシーケンスにおけるエラーの大多数(>90%)を占める。従って、リードエラーによって生成したタグは、タグの大きさを用いて検出することが可能である。観察されたタグの割合を大きさによって分類したものを図2Cに示した。12bpではないタグ(つまり、エラーのあるタグ)はタグあたりのリード数の小さいタグの大多数を占め、タグあたりのリード数が増加するにつれて、12bpタグの割合は段階的に増加した。この動態は、エラータグがリード数の小さい分画にあつまり、適切な閾値を決めることにより除外し得ることを示唆している。リード数の利用率を向上させるため、適合する12bpタグに対して単一の挿入または欠失塩基が存在する以外は12bpタグの配列と合致する11bpおよび13bpタグを12bpタグにまとめて分類した。リード数に対して12bpタグの割合をプロットしたものを図2Dに示す。その付近の11ビンにおける12bpタグの割合の平均が90%を超える最小値のビンを、エラータグを除外するための閾値として定めた。得られた12bpタグの割合は修正した割合の95%を超え、より厳しい閾値を設定した場合でもほとんど改善しなかった。図3Aに示す通り、この閾値は2つのピークを分断している。また選択する閾値は、全リード数や標的領域(11〜249(図2Eのデータポイントについて))および57〜485(図2Fのデータポイントについて))などの要因に応じて変化し得るものである。このプロセスにより全リードの10〜20%を破棄する(図3B)。
タグあたりリード数の小さい領域における12bpタグの中には複数の挿入/欠失エラーにより12bpに戻った配列を含むことがあるため、12bpタグをカウントすることによって、除去されたエラーのないタグの数を推定することはできなかった。図2Aの右側のピークがエラーのないタグの分布のピークを表すため、その分布の尾部に対応する分画を除去していることになる。Mを閾値として定めた場合、閾値と0の間のエラーのないタグの数は、Mと2Mの間のタグ数を超えない。そのためMと2Mの間の12bpタグの数に基づく、除去されたエラーのないタグの予想最大数は、全てのエラーのないタグの5〜10%となった。
標的分子の数は網羅的なシーケンシングにより計測することが可能である。得られたタグ数は、500,000リードで飽和に達した(図2E)。推定標的分子数とインプットDNA量の間には相関関係が観察され、相関係数は0.98より大きくなった(図2F)。TK103Dを除いてインプットDNAの約40%が回収され、TK103Dでは15%の回収を示した。この算出は配列決定した分子の数に基いて行った。この算出結果の相違はライゲーションサイトにおけるライゲーション効率の違いによるものと思われる。
従来の研究では、リード数の小さいタグを除去するために任意の基準が採用されており、例えば単一のリードのタグを除去したりしていた。しかし、1または2リードタグを除去した場合かなりの量のエラータグの割合が残り、タグ数がインプットDNAの量から推定される標的分子数を上回ってしまう。タグ数はリードの追加によって増加し、飽和に達せず、これは新しいエラータグの生成を示唆している。
(Illuminaシステムにおけるエラーバーコードタグのモニタリングおよび除去)
IlluminaシーケンサーのリードエラーはIon Torrent PGM/Protonシーケンサーのものとは異なり、Illuminaの場合には塩基置換がその主なエラーとなっている。しかし、バーコードタグの分布パターンはいずれのシーケンシングシステムを用いた場合であっても同様のものとなった(図4A)。そこでIlluminaシーケンサーに対応するため、本発明者らは、エラー検出用バーコードとして配列「BDHVBDHVBDHVBDH」を用いた。つまり、各塩基部位は4種類の塩基のうちの1つを欠いており、その存在しないはずの塩基が出現する場合にはそれはリードエラーを示すこととなる。エラーのあるタグの総数は、存在しないはずの塩基を有するタグの数を3倍することによって得られる(図5A、図4C)。そして、上述したようにエラーのないタグの分布から、エラーのあるタグを除去するための閾値を決定した。Illuminaシーケンサーで得られた結果は、Ion Protonシーケンサーを使用して得られた結果と同様のものとなった。つまり、10%のリードが除去され(図4B)、閾値は15〜65の間で変化した(図5Bのデータポイントについて)。この場合タグの数は網羅的なシーケンシングにより飽和したが(図4D)、1または2リードタグを除去する従来の基準では連続的に増加した(図4E)。標的分子数の推定値とインプットDNAの量との間に相関関係が観察された(図5B)。
(個々の分子由来のリードのコンセンサスを構築することによる精度の向上)
バーコードタグを使用して、単一分子から生成した複数の配列のコンセンサスをグループ化および構築することにより、高精度のシーケンシングが可能となる。この方法の精度を図6に示した。2つのDNAポリメラーゼ(NEBのQ5 DNAポリメラーゼおよびLife TechnologiesのPlatinum Taq DNAポリメラーゼHigh Fidelity)を比較したが、バーコードタグを用いた場合には顕著な差異は確認できなかった(図6)。両方の鎖を同じバーコード配列でラベルする2つ目の方法では、1つの鎖をラベルする方法と比べて精度が改善することはなかった(図6)。1つ目の方法はPCRの前に線形増幅サイクルを施しており、これによりPCRサイクルの初期におけるエラーを最小化させている。1つ目の方法のほうが実験操作が単純であることから、2つ目のバーコード連結方法よりも1つ目のバーコード連結方法のほうが有用なものとなっていると考えられる。
Illuminaシステムを用いた1つ目のバーコード連結方法の精度は、1.8×10−6(95%信頼区間、3.5×10−8〜6.9×10−6)であった。
その他、本発明は、さまざまに変形可能であることは言うまでもなく、上述した一実施形態に限定されず、発明の要旨を変更しない範囲で種々変形可能である。

Claims (2)

  1. 核酸分子数を高精度に計測するために使用するバーコード配列を生成する方法であって、
    複数の核酸分子の混合物にバーコード配列生成オリゴヌクレオチドを添加する工程であって、これにより当該核酸分子に固有のバーコード配列が、各核酸分子を構成する塩基配列に連結される、前記添加する工程と、
    前記バーコード配列を連結した核酸分子の塩基配列を決定する工程と、
    塩基配列を決定したバーコード配列のリードエラーを検出する工程と、
    リードエラーが存在するバーコード配列を除去する工程と、
    を有し、前記バーコード配列生成オリゴヌクレオチドは最多で5種類の塩基からなり、前記バーコード配列生成オリゴヌクレオチド中の塩基は、塩基部位毎に独立して2つまたは3つの種類の塩基から選択される、方法
  2. 前記バーコード配列生成オリゴヌクレオチドは、その配列中に1またはそれ以上の他の塩基配列を有する、請求項1記載の方法
JP2017019549A 2014-07-02 2017-02-06 核酸分子数計測法 Active JP6664575B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201462020210P 2014-07-02 2014-07-02
US62/020,210 2014-07-02

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2016531441A Division JP6125731B2 (ja) 2014-07-02 2015-07-02 核酸分子数計測法

Publications (2)

Publication Number Publication Date
JP2017099400A JP2017099400A (ja) 2017-06-08
JP6664575B2 true JP6664575B2 (ja) 2020-03-13

Family

ID=55019402

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2016531441A Active JP6125731B2 (ja) 2014-07-02 2015-07-02 核酸分子数計測法
JP2017019549A Active JP6664575B2 (ja) 2014-07-02 2017-02-06 核酸分子数計測法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2016531441A Active JP6125731B2 (ja) 2014-07-02 2015-07-02 核酸分子数計測法

Country Status (4)

Country Link
US (2) US10584331B2 (ja)
EP (1) EP3165612B1 (ja)
JP (2) JP6125731B2 (ja)
WO (1) WO2016002875A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10584331B2 (en) * 2014-07-02 2020-03-10 Dna Chip Research Inc. Method for counting number of nucleic acid molecules
WO2017205691A1 (en) 2016-05-26 2017-11-30 Cellular Research, Inc. Molecular label counting adjustment methods
WO2018089377A1 (en) 2016-11-08 2018-05-17 Cellular Research, Inc. Methods for cell label classification
EP3539035B1 (en) 2016-11-08 2024-04-17 Becton, Dickinson and Company Methods for expression profile classification
JP7160349B2 (ja) * 2017-06-23 2022-10-25 国立研究開発法人理化学研究所 核酸をシークエンシングする方法および解析する方法
WO2019060804A1 (en) * 2017-09-25 2019-03-28 Cellular Research, Inc. IMMUNE BAR CODE RECEIVER ERROR CORRECTION
JPWO2019132010A1 (ja) * 2017-12-28 2021-01-21 タカラバイオ株式会社 塩基配列における塩基種を推定する方法、装置及びプログラム
EP3670670A1 (en) 2018-12-18 2020-06-24 Ricoh Company, Ltd. Nucleic acid analysis method, nucleic acid analysis program, and device for library preparation
CA3104153A1 (en) * 2019-01-24 2020-07-30 Illumina, Inc. Methods and systems for monitoring organ health and disease

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9315857B2 (en) * 2009-12-15 2016-04-19 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse label-tags
EP3115468B1 (en) * 2010-09-21 2018-07-25 Agilent Technologies, Inc. Increasing confidence of allele calls with molecular counting
WO2012129363A2 (en) * 2011-03-24 2012-09-27 President And Fellows Of Harvard College Single cell nucleic acid detection and analysis
US10704164B2 (en) * 2011-08-31 2020-07-07 Life Technologies Corporation Methods, systems, computer readable media, and kits for sample identification
WO2013033721A1 (en) * 2011-09-02 2013-03-07 Atreca, Inc. Dna barcodes for multiplexed sequencing
US10584331B2 (en) * 2014-07-02 2020-03-10 Dna Chip Research Inc. Method for counting number of nucleic acid molecules

Also Published As

Publication number Publication date
JPWO2016002875A1 (ja) 2017-05-25
JP6125731B2 (ja) 2017-05-10
EP3165612A1 (en) 2017-05-10
JP2017099400A (ja) 2017-06-08
US20170204406A1 (en) 2017-07-20
US11332737B2 (en) 2022-05-17
EP3165612B1 (en) 2021-08-18
US20200385708A1 (en) 2020-12-10
EP3165612A4 (en) 2018-01-03
WO2016002875A1 (ja) 2016-01-07
US10584331B2 (en) 2020-03-10

Similar Documents

Publication Publication Date Title
JP6664575B2 (ja) 核酸分子数計測法
US11091797B2 (en) Systems and methods to detect rare mutations and copy number variation
JP7256748B2 (ja) エラーが訂正された核酸配列決定への適用を伴う標的化核酸配列濃縮のための方法
ES2769241T5 (es) Sistemas y métodos para detectar variación en el número de copias
ES2877088T3 (es) Procedimiento para detectar cáncer
Kivioja et al. Counting absolute number of molecules using unique molecular identifiers
CN107002120B (zh) 测序方法
JP2018527928A (ja) 次世代シークエンシングのための高分子量dnaサンプル追跡タグ
WO2018144159A1 (en) Capture probes using positive and negative strands for duplex sequencing
US20240026440A1 (en) Methods of labelling nucleic acids
JP5926189B2 (ja) Rna分析方法
CN115867665A (zh) 嵌合扩增子阵列测序
EP3847276A2 (en) Methods and systems for detecting allelic imbalance in cell-free nucleic acid samples
US20230399687A1 (en) Quantitative Multiplex Amplicon Sequencing System
WO2021192395A1 (ja) 塩基のメチル化度の算出方法及びプログラム
Mondal et al. High throughput DNA sequencing and its implication in plant science research

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20170925

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190507

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190419

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190426

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190708

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190910

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191008

R150 Certificate of patent or registration of utility model

Ref document number: 6664575

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250