JP7047373B2 - 次世代シーケンサー用プライマー並びにその製造方法、次世代シーケンサー用プライマーを用いたdnaライブラリー並びにその製造方法、及びdnaライブラリーを用いたゲノムdna解析方法 - Google Patents

次世代シーケンサー用プライマー並びにその製造方法、次世代シーケンサー用プライマーを用いたdnaライブラリー並びにその製造方法、及びdnaライブラリーを用いたゲノムdna解析方法 Download PDF

Info

Publication number
JP7047373B2
JP7047373B2 JP2017247826A JP2017247826A JP7047373B2 JP 7047373 B2 JP7047373 B2 JP 7047373B2 JP 2017247826 A JP2017247826 A JP 2017247826A JP 2017247826 A JP2017247826 A JP 2017247826A JP 7047373 B2 JP7047373 B2 JP 7047373B2
Authority
JP
Japan
Prior art keywords
primer
generation sequencer
sequence
base
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017247826A
Other languages
English (en)
Other versions
JP2019110840A (ja
Inventor
宏征 榎
由枝 竹内
稔 稲森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2017247826A priority Critical patent/JP7047373B2/ja
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to EP18897836.5A priority patent/EP3676401B1/en
Priority to KR1020207016876A priority patent/KR102404104B1/ko
Priority to PCT/JP2018/047136 priority patent/WO2019131470A1/en
Priority to CN201880083369.XA priority patent/CN111542618B/zh
Priority to US16/769,859 priority patent/US11795451B2/en
Priority to EP22168008.5A priority patent/EP4105341B1/en
Priority to TW107146389A priority patent/TWI715900B/zh
Publication of JP2019110840A publication Critical patent/JP2019110840A/ja
Application granted granted Critical
Publication of JP7047373B2 publication Critical patent/JP7047373B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Plant Pathology (AREA)
  • Medical Informatics (AREA)
  • Immunology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Epidemiology (AREA)
  • Artificial Intelligence (AREA)

Description

本発明は、複数検体の同時解析を可能とするインデックスを有する次世代シーケンサー用プライマー並びにその製造方法、当該次世代シーケンサー用プライマーを用いたDNAライブラリー並びにその製造方法、及びDNAライブラリーを用いたゲノムDNA解析方法に関する。
次世代シーケンサー(Next Generation Sequencer:NGS)は、多数のDNA断片に関する塩基配列を並列に読み出すことができる装置である。一例として、イルミナ社の次世代シーケンサーでは、ランダムに切断された数千万~数億のDNA断片の両端部にそれぞれアダプターを連結し、アダプターを介して5’末端側をフローセル上に固定させる。次に、フローセル上に予め固定された5’末端側のアダプターと、DNA断片の3’末端側のアダプター配列とをアニールさせて、ブリッジ状のDNA断片を形成させる。この状態でDNAポリメラーゼによる核酸増幅反応を行うことで、多数の1本鎖DNA断片を局所的に増幅して固定することができる。そして、次世代シーケンサーでは、得られた1本鎖DNAを鋳型として、シーケンシングを行うことで、1回の解析において40~200Gbという膨大な配列情報を得ることができる。
次世代シーケンサーにおけるシーケンシングは、蛍光標識したdNTPの取り込みを蛍光顕微鏡により解析するという方法を採用している。具体的には、3’末端側が保護基でブロックされるとともに蛍光標識されたdNTPを用いる。DNAポリメラーゼにより、1本鎖DNA断片に対して相補的なdNTPが取り込まれ、これをレーザー光により励起し、蛍光顕微鏡により蛍光を読み取る。そして、dNTPから保護基を除去し、同様にして次の塩基を解析する。このように、次世代シーケンサーでは、フローセルに固定された1本差DNAについて1塩基ずつ連続して解析する。
特に、次世代シーケンサーでは、解析対象のDNA断片に連結するアダプターにインデックス(インデックス配列やバーコード配列とも称する)を付与することで、複数サンプル由来のDNA断片を識別することができる。すなわち、上述のように、一回の解析において膨大な配列情報を得ることができるが、配列情報に含まれるインデックス配列を指標して如何なるサンプルに由来するDNA断片に関する配列情報であるか判断することができる。
ところが、非特許文献1に記載されるように、インデックス配列を利用した次世代シーケンサーによる解析では、インデックス配列によっては、リード数が大きくばらつくことがあるといった問題があった。しかし、非特許文献1では、インデックス配列の性能に関する相違について体系的に解析されておらず、インデックス配列を利用した次世代シーケンサーによる解析精度が不十分であるといった問題があった。
これまで、一対のプライマーにそれぞれ異なる塩基配列からなるユニバーサル・テール配列を付与し、これら一対のプライマーを用いてマルチプレックスPCRを行い、次世代シーケンサーに供するアンプリコン群(同じインデックス配列を有する)を得る方法が知られている(特許文献1)。また、大量の試料を分析する際の効率化を図る目的で、アダプターとインデックスと標的DNA特異的配列を全て含む一対のプライマーを用いて、次世代シーケンサー用のDNAライブラリーを作製する方法が知られている(特許文献2)。特許文献2に開示されるプライマーは、ヒトミトコンドリアDNAの超可変領域等の標的DNAに特異的に結合するプライマーとNGSライブラリーの作製に必須なアダプタープライマー、インデックスプライマー及びシーケンシングプライマーを全て含む統合プライマーである。
David W. Craig et al., Nat Methods. 2008 October; 5(10): 887-893
米国特許公開公報 US 2016/0326572 A1 特開2017-97935号公報
しかしながら、インデックスを含む次世代シーケンサー用プライマーを使用したときに、インデックスの配列によってリード数が著しく減少するといった問題点は未解明のままであり、当該問題点を解決する技術は知られていないのが現状である。そこで、本発明は、このような実情に鑑みて、インデックスの塩基配列とリード数との関係を解明することで、多くのリード数を得られる次世代シーケンサー用プライマー及びその製造方法を提供することを目的とする。また、本発明は、多くのリード数を得られる次世代シーケンサー用プライマーを用いたDNAライブラリー並びにその製造方法、及びDNAライブラリーを用いたゲノムDNA解析方法を提供することを目的とする。
本発明者らは、上述した目的を達成するため鋭意検討した結果、インデックスを含む次世代シーケンサー用プライマーにおけるインデックス配列とリード数との関係を明らかにし、インデックスの塩基配列からリード数を推定できることを明らかにした。そして、推定されたリード数が所定の値を超えるインデックス配列を設計することで、多くのリード数を得られる次世代シーケンサー用プライマーを製造できることを見いだし、本発明を完成するに至った。
本発明は以下を包含する。
(1)5’-CAAGCAGAAGACGGCATACGAGAT(配列番号1)-N5~15-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG(配列番号2)-3’(N5~15は5~15塩基のインデックス配列)の塩基配列を含み、リード数を目的変数としインデックス配列における塩基の種類を説明変数とする推定式に基づいて算出したリード数の推定値が所定の値を超える塩基配列として設計されたインデックス配列を含む次世代シーケンサー用プライマー。
(2)上記インデックス配列は8塩基(N=8、配列番号67)であることを特徴とする(1)記載の次世代シーケンサー用プライマー。
(3)上記推定式は、インデックス配列を構成するN個の塩基について、塩基の種類とそれに応じた係数とからなる項を含むことを特徴とする(1)記載の次世代シーケンサー用プライマー。
(4)上記所定の値は、15000~25000の値とすることを特徴とする(1)記載の次世代シーケンサー用プライマー。
(5)配列番号262~963からなる群から選ばれる1つの塩基配列からなることを特徴とする(1)記載の次世代シーケンサー用プライマー。
(6)5’-CAAGCAGAAGACGGCATACGAGAT(配列番号1)-N5~15-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG(配列番号2)-3’(N5~15は5~15塩基のインデックス配列)の塩基配列を含む次世代シーケンサー用プライマーについて、リード数を目的変数としインデックス配列における塩基の種類を説明変数とする推定式に基づいて、インデックス配列の塩基配列からリード数の推定値を算出し、算出したリード数の推定値が所定の値を超える塩基配列をインデックス配列の塩基配列として設計する工程と
上記工程で設計したインデックス配列を含むヌクレオチドを合成する工程とを含む次世代シーケンサー用プライマーの製造方法。
(7)上記インデックス配列は8塩基(N=8、配列番号67)であることを特徴とする(6)記載の次世代シーケンサー用プライマーの製造方法。
(8)上記推定式は、インデックス配列を構成するN個の塩基について、塩基の種類とそれに応じた係数とからなる項を含むことを特徴とする(6)記載の次世代シーケンサー用プライマーの製造方法。
(9)上記所定の値は、15000~25000の値とすることを特徴とする(6)記載の次世代シーケンサー用プライマーの製造方法。
(10)配列番号262~963からなる群から選ばれる1つの塩基配列における25~32番目をインデックス配列の塩基配列として設計することを特徴とする(6)記載の次世代シーケンサー用プライマーの製造方法。
(11)上記(1)~(5)いずれか記載の次世代シーケンサー用プライマーの塩基配列を、解析対象DNAの一方端部に有するDNA断片を含むDNAライブラリー。
(12)上記解析対象DNAは、核酸増幅反応により得られた断片或いはゲノムDNAを断片化して得られた断片であることを特徴とする(11)記載のDNAライブラリー。
(13)上記解析対象DNAは、ゲノムDNA及び高濃度のランダムプライマーを含む反応液にて核酸増幅反応することで得られる断片であって、当該ランダムプライマーは、上記次世代シーケンサー用プライマー3’末端側の塩基配列に対して相補的な塩基配列を5’末端側に有することを特徴とする(11)記載のDNAライブラリー。
(14)上記(1)~(5)いずれか記載の次世代シーケンサー用プライマーと、上記次世代シーケンサー用プライマー3’末端側の塩基配列に対して相補的な塩基配列を5’末端側に有する解析対象DNAとを用いて核酸増幅反応を行う工程を含むDNAライブラリーの製造方法。
(15)上記解析対象DNAは、核酸増幅反応により得られた断片或いはゲノムDNAを断片化して得られた断片であることを特徴とする(14)記載のDNAライブラリーの製造方法。
(16)上記解析対象DNAは、ゲノムDNA及び高濃度のランダムプライマーを含む反応液にて核酸増幅反応することで得られる断片であって、当該ランダムプライマーは、上記次世代シーケンサー用プライマー3’末端側の塩基配列に対して相補的な塩基配列を5’末端側に有することを特徴とする(14)記載のDNAライブラリーの製造方法。
(17)上記(11)~(13)いずれか記載のDNAライブラリーを次世代シーケンサーにより解析し、当該DNAライブラリーに含まれるDNA断片の塩基配列を決定することを特徴とするDNA解析方法。
本発明によれば、インデックス配列に起因してリード数が減少するといった不都合を回避でき、多くのリード数を得ることができ次世代シーケンサー用プライマー及びその製造方法、並びに当該次世代シーケンサー用プライマーを用いて作製したDNAライブラリー及びその製造方法を提供することができる。
また、本発明に係る次世代シーケンサー用プライマーを利用して作製したDNAライブラリーを利用することで、サンプル毎のデータ量(リード数)がばらつくことを防止し、高精度なDNA解析を行うことができる。
次世代シーケンサー用プライマーを用いた次世代シーケンサーによる解析スキームを模式的に示す特性図である。 次世代シーケンサー用プライマーP7におけるインデックス配列の種類と、リード数との関係を示す特性図である。 次世代シーケンサー用プライマーP5におけるインデックス配列の種類と、リード数との関係を示す特性図である。 次世代シーケンサー用プライマーP7におけるインデックス配列を構成する塩基の種類に基づいて推定式で算出した推定リード数と、実際に測定したリード数との関係を示す特性図である。 次世代シーケンサー用プライマーP5におけるインデックス配列を構成する塩基の種類に基づいて推定式で算出した推定リード数と、実際に測定したリード数との関係を示す特性図である。
以下、本発明を詳細に説明する。
本発明に係る次世代シーケンサー用プライマーは、5’-CAAGCAGAAGACGGCATACGAGAT(配列番号1)-N5~15-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG(配列番号2)-3’(N5~15は5~15塩基のインデックス配列)の塩基配列を含んでいる。上記塩基配列の表記において、N5~15で示されるインデックス配列とは、詳細を後述するように設計された配列であり、例えば、サンプルを識別するための索引として利用できる配列である。すなわち、インデックス配列を後述のように設計すれば、インデックス配列は如何なる配列であっても良い。例えば、複数のサンプルに対してそれぞれ異なるインデックス配列を設計することによって、次世代シーケンサーで解析した結果の塩基配列データについて、インデックス配列に基づいてサンプルへの帰属を明確に理解することができる(マルチプレックス解析)。
ここで、次世代シーケンサー用プライマーを用いた次世代シーケンサーによる解析スキームを模式的に図1に示す。本発明に係る次世代シーケンサー用プライマーは、所謂、イルミナ社が提供する次世代シーケンサー(NGS)においてP7と呼称されるプライマーに基づいている。次世代シーケンサーに供するDNAライブラリーを調製する際、次世代シーケンサー用プライマーP7と次世代シーケンサー用プライマーP5とを用いてPCRを行う。なお、次世代シーケンサー用プライマーP5は、図1においてインデックス配列を有する構成を示したが、インデックス配列を有しない構成であっても良い。
図1に示すように、次世代シーケンサー用プライマーP7と次世代シーケンサー用プライマーP5とを用いたPCRにより、次世代シーケンサー用プライマーP7と次世代シーケンサー用プライマーP5との間に解析対象DNAが配置されたDNA断片を得ることができる。当該PCRにより得られたDNA断片の群をDNAライブラリー又は次世代シーケンサー用DNAライブラリーと称する。
図1に示すように、上述のように得られたDNAライブラリーは、イルミナ社の次世代シーケンサーにて解析される。次世代シーケンサーは、DNAライブラリーを解析した結果として多数のリードに関する塩基配列データ(すなわち、解析対象DNAの塩基配列を含む塩基配列データ)を出力する。
ここで解析対象DNAとは、特に限定されず、ゲノム解析の対象である生物由来のゲノムDNA、エピゲノム解析のために調製したDNA又はトランスクリプト解析のたに調製されたDNA等に由来するDNA断片、若しくはゲノムDNA等を鋳型として得られる増幅産物(アンプリコン)とすることができる。
〔インデックス配列の設計〕
本発明に係る次世代シーケンサー用プライマーにおけるインデックス配列は、次世代シーケンサーを用いてDNAライブラリーの塩基配列を解析する際に十分に多くのリード数を得ることができるように設計される。具体的に、インデックス配列を設計する際には、リード数を目的変数とし、インデックス配列における塩基の種類を説明変数とする推定式を準備する。当該推定式を準備するには、先ず、特定の塩基配列からなるインデックス配列を有する次世代シーケンサー用プライマーを実際に合成し、この次世代シーケンサー用プライマーを使用したときのリード数を解析する。そして、インデックス配列の塩基配列と得られたリード数とから上記推定式を算出することができる。
具体的に、推定式を算出する際には、特に限定されないが、一般的に相関解析に利用される各種のアルゴリズムを適用することができる。具体的には、Lasso(Least Absolute Shrinkage and Selection Operator)等のスパースモデリング方法を適用することができる。スパースモデリング方法のうちL1型正則化推定法によれば、重要でないパラメータの係数をOに推定することができ、適切なパラメータのみからなる推定式を得ることができる。
例えば、推定式は、インデックス配列における所定の位置について塩基毎に算出された係数を含む項と切片とを含み、インデックス配列の全ての位置について特定の塩基を指定するとリード数の推定値を算出できる。このとき、LASSO等のスパースモデリング方法を適用することで、重要でないパラメータ、すなわちリード数の増減に対する関与の低い塩基については係数を0とした推定式を算出することができる。
更に具体的に、例えば、8塩基長のインデックス配列(N=8)、すなわち5’末端側から3’末端側に向かって1番目から8番目の塩基で構成されるインデックス配列を設計する場合、推定式は、1番目の塩基がアデニン或いはグアニンの場合に推定リード数が低減し、シトシンの場合に推定リード数が増加するような式とすることができる。同様に、推定式は、2番目の塩基がアデニン又はチミンの場合に推定リード数が増加し、グアニンの場合に推定リード数が低減するような式とすることができる。同様に、推定式は、3番目の塩基がアデニン又はチミンの場合に推定リード数が増加し、グアニンの場合に推定リード数が低減するような式とすることができる。同様に、推定式は、4番目の塩基がアデニンの場合に推定リード数が増加し、シトシン又はグアニンの場合に推定リード数が低減するような式とすることができる。同様に、推定式は、5番目の塩基がアデニンの場合に推定リード数が増加し、グアニンの場合に推定リード数が低減するような式とすることができる。同様に、推定式は、6番目の塩基がシトシンの場合に推定リード数が減少し、チミンの場合に推定リード数が増加するような式とすることができる。同様に、推定式は、7番目の塩基がアデニンの場合に推定リード数が減少し、グアニンの場合に推定リード数が増加するような式とすることができる。同様に、推定式は、8番目の塩基がグアニンの場合に推定リード数が減少し、チミンの場合に推定リード数が増加するような式とすることができる。
なかでも、推定式は、1番目の塩基がアデニン又はグアニンである場合、2番目の塩基がグアニンである場合及び8番目の塩基がグアニンである場合に、特に推定リード数が大きく減少するような式とすることができる。また、推定式は、2番目の塩基がアデニン又はチミンである場合、3番目の塩基がアデニンである場合、5番目の塩基がアデニンである場合に、特に推定リード数が大きく増加するような式とすることができる。
より具体的には、インデックス配列における塩基の種類毎の係数及び切片を下記表のように設定することができる。
Figure 0007047373000001
表1において、A1は、インデックス配列の5’末端側から3’末端側の方向において1番目の塩基がアデニンである場合を意味している。他の表記も同様に、インデックス配列の5’末端側から3’末端側の方向における位置と塩基の種類とを意味している。
一例として上記表に示した推定式を用いることで、インデックス配列を所定の塩基配列としたときに得られるリード数の推定値を算出することができる。上述したように得られた推定式は、表1に具体的に示した推定式に限定されず、実測値との相関が非常に高いといった特徴を有する(相関係数が0.9以上)。したがって、当該推定式を使用してインデックス配列の塩基配列毎に推定リード数を計算し、推定リード数が所定の値以上になるような塩基配列を選択することで、実際に多くのリード数を得ることができる。
ここで、インデックス配列を設計するにあたり、閾値とする推定リード数は、特に限定されず、目的とするデータ解析に応じて適宜設定することができる。例えば、推定リード数の閾値として15000~25000の値を設定することができ、17000~23000の値を設定することが好ましく、19000~21000の値を設定することがより好ましく、19500~20500の値を設定することが更に好ましい。詳細を後述する実施例に示すように、インデックス配列の塩基配列に関して、リード数が著しく低い一群の塩基配列が同定されている。この一群の塩基配列について推定リード数を計算したところ、最大でリード数が20000程度、具体的には20051.8であることが判明している。したがって、上述した閾値を20000程度、例えば20052とすることで、実際に多くのリード数を得ることができるインデックス配列を設計することができる。
上記表1に示した推定式を用いて、推定リード数が20052を超えるインデックス配列を有する次世代シーケンサー用プライマーの塩基配列を特定している(詳細は後述の実施例参照)。すなわち、本発明に係る次世代シーケンサー用プライマーとしては、例えば、配列番号262~963からなる群から選ばれる1つの塩基配列からなるものを挙げることができる。
〔次世代シーケンス技術への応用〕
以上で説明した本発明に係る次世代シーケンサー用プライマーを用いた核酸増幅反応により、次世代シーケンサーで使用するDNAライブラリー(次世代シーケンサー用DNAライブラリー)を作製することができる。具体的には、図1に示すように、本発明に係る次世代シーケンサー用プライマーP7、解析対象DNA及び次世代シーケンサー用プライマーP5を含む反応液でPCRを行う。解析対象DNAの両末端は、それぞれ次世代シーケンサー用プライマーP7と共通する配列及び次世代シーケンサー用プライマーP5と共通する配列を有する。このため、核酸増幅反応においては、次世代シーケンサー用プライマーP7及びP5が解析対象DNAの両末端にアニールして解析対象DNAを鋳型とした核酸増幅反応が進行する。その結果、図1に示すように、次世代シーケンサー用プライマーP5、解析対象DNA及び次世代シーケンサー用プライマーP7をこの順で有する核酸断片の群(DNAライブラリー)を得ることができる。
得られたDNAライブラリーは、その両末端に次世代シーケンサー用プライマーP5及びP7を有するため、イルミナ社の次世代シーケンサーに供することができる。そして、得られたDNAライブラリーは、上述した本発明に係る次世代シーケンサー用プライマーP7を有するため、次世代シーケンサーにより多くのリード数を解析することができる。具体的には、上述した推定式で算出される推定リード数に近い値のリード数の解析が可能となる。
なお、使用される次世代シーケンサーは、ブリッジPCR法とSequencing-by-synthesis法により、フローセル上で目的DNAを増幅させ、合成しながらシーケンシングを行うといった原理である。
本発明に係る次世代シーケンサー用プライマーP7、解析対象DNA及び次世代シーケンサー用プライマーP5を含む反応液を用いた核酸増幅反応は、特に限定されず、通常の核酸増幅反応の条件を適用することができる。例えば、この反応液は、鋳型となる解析対象DNA、上述した次世代シーケンサー用プライマーP5及びP7、DNAポリメラーゼ、基質となるデオキシヌクレオチド三リン酸(dNTP、すなわちdATP、dCTP、dTTP及びdGTPの混合物)及びバッファーを含む。
特に次世代シーケンサー用プライマーP5及びP7の濃度としては、0.01~5.0μMとすることができ、0.1~2.5μMとすることが好ましく、0.3~0.7μMとすることが最も好ましい。
また、核酸増幅反応において鋳型となる解析対象DNAは、特に限定されないが、反応液の量を50μlとしたときに、0.1~1000ngとすることが好ましく、1~500ngとすることがより好ましく、5~200ngとすることが更に好ましく、10~100ngとすることが最も好ましい。
鋳型となる解析DNA断片の調整方法は、特に限定されず、詳細を後述するランダムプライマーを用いた核酸増幅反応が終わった後の反応液をそのまま使用しても良いし、当該反応液から解析DNAを精製したものを使用しても良い。
また、核酸増幅反応に使用するDNAポリメラーゼの種類、基質となるデオキシヌクレオチド三リン酸(dNTP、すなわちdATP、dCTP、dTTP及びdGTPの混合物)の濃度、バッファー組成、温度サイクル条件については、通常の核酸増幅反応に採用される条件とすることができる。また、次世代シーケンサー用プライマーを用いた核酸増幅反応において、ホットスタート法を採用しても良いし、核酸増幅反応によって増幅断片を取得するものでも良い。
以上のように、ランダムプライマーを用いて取得した第1のDNA断片を鋳型とし、次世代シーケンサー用プライマーを用いて増幅した第2のDNA断片を使用することで、次世代シーケンス装置に適用可能なDNAライブラリーを簡便に作製することができる。
〔解析対象DNA〕
解析対象DNAの一例として、ゲノムDNA等を鋳型として得られる増幅産物(アンプリコン)を挙げることができる。ここで、増幅産物を得るには、例えば、任意の塩基配列を有するプライマー(以下、ランダムプライマー)を高濃度となるように調整した反応液で核酸増幅反応を行う方法を挙げることができる。ここで、高濃度とは、通常の核酸増幅反応におけるプライマー濃度と比較して高濃度であることを意味する。すなわち、本方法は、通常の核酸増幅反応におけるプライマー濃度と比較して高濃度のランダムプライマーを使用することに特徴を有している。ここで、反応液に含まれる鋳型としては、解析対象の生物から調整したゲノムDNAを使用することができる。
なお、本方法において、対象の生物種には何ら限定されず、ヒトを含む動物、植物、微生物、ウイルス等いかなる生物種も対象とすることができる。すなわち、本方法によれば、如何なる生物種からも解析対象DNAとして多数の増幅産物を得ることができる。
本方法では、ランダムプライマーの濃度を上記のように規定することによって、高い再現性で核酸断片(核酸断片群)を増幅することができる。ここで、再現性とは、同一の鋳型及び同一のランダムプライマーを用いて複数回の核酸増幅反応を行った場合に、複数回の核酸増幅反応の間で増幅される核酸断片が一致する程度を意味する。つまり、高い再現性(再現性が高い)とは、同一の鋳型及び同一のランダムプライマーを用いて複数回の核酸増幅反応を行った場合に、複数回の核酸増幅反応の間で増幅される核酸断片の一致度が高いことを意味する。
再現性の高低については、例えば、同一の鋳型及び同一のランダムプライマーを用いて複数回の核酸増幅反応を行い、各回で得られた増幅断片を電気泳動し得られた蛍光ユニット(Fluorescence Unit: FU)についてスピアマンの順位相関係数を算出し、当該係数に基づいて評価することができる。スピアマンの順位相関係数とは、一般的にρで表され、一例としてはρ>0.9をもって再現性有りと評価することができる。
本方法に使用できるランダムプライマーとしては、その配列には何ら限定されず、例えば9~30塩基長のヌクレオチドを使用することができる。特に、ランダムプライマーとは、任意の配列を有する、9~30塩基長のヌクレオチドであって、ヌクレオチドの種類(配列の種類)は特に限定されず、1種類以上のヌクレオチド、好ましくは1~10000種類のヌクレオチド、より好ましくは1~1000種類のヌクレオチド、より好ましくは1~100種類のヌクレオチド、最も好ましくは1~96種類のヌクレオチドを意味する。ランダムプライマーとして上述の範囲のヌクレオチド(ヌクレオチド群)を使用することによって、より高い再現性で増幅核酸断片を得ることができる。なお、ランダムプライマーとして、複数のヌクレオチドを含む場合、全てのヌクレオチドが同じ塩基長(9~30塩基長)である必要はなく、異なる塩基長の複数のヌクレオチドを含んでいても良い。
通常、核酸増幅反応を用いて特定のアンプリコンを得るためには、当該アンプリコンに応じてプライマーの塩基配列を設計する。例えば、ゲノムDNA等の鋳型DNAにおけるアンプリコンに対応する位置を挟み込むように一対のプライマーを設計する。この場合、プライマーは、鋳型に含まれる特定の領域にハイブリダイズするように設計されるため「特異的プライマー」と呼称することができる。
これに対して、ランダムプライマーは、特定のアンプリコンを得る目的で設計されるプライマーとは異なり、鋳型DNAにおける特定の領域にハイブリダイズするように設計されるのではなく、ランダムなアンプリコンを得るために設計される。ランダムプライマーは、その塩基配列が如何なる配列であってもよく、鋳型DNAに含まれる相補的な領域に偶発的にハイブリダイズすることでランダムなアンプリコン増幅に関与できる。
すなわち、ランダムプライマーとは、上述のように、ランダムなアンプリコン増幅に関与する任意配列を有するヌクレオチドということができる。ここで任意配列とは、何ら限定されないが、例えば、アデニン、グアニン、シトシン及びチミンの群から無作為に選択された塩基配列として設計しても良いし、特定の塩基配列として設計しても良い。特定の塩基配列としては、例えば、制限酵素認識配列を含む塩基配列や、次世代シーケンサーに使用するアダプター配列を有する塩基配列を挙げることができる。
ランダムプライマーとして複数種類のヌクレオチドを設計する場合、アデニン、グアニン、シトシン及びチミンの群から無作為に選択して所定の長さの塩基配列を複数設計する方法が適用できる。また、ランダムプライマーとして複数種類のヌクレオチドを設計する場合、特定の塩基配列からなる共通部分と、任意の塩基配列からなる非共通部分とからなる塩基配列を複数設計する方法も適用できる。ここで、非共通部分は、アデニン、グアニン、シトシン及びチミンの群から無作為に選択された塩基配列としても良いし、アデニン、グアニン、シトシン及びチミンからなる4種類の塩基の全ての組み合わせ、又はこれら全ての組み合わせから選ばれる一部の組み合わせとすることができる。共通部分は、特に限定されず如何なる塩基配列でもよいが、例えば、制限酵素認識配列を含む塩基配列や、次世代シーケンサーに使用するアダプター配列を有する塩基配列、特定の遺伝子ファミリーに共通する塩基配列とすることができる。
複数のランダムプライマーとして、4種類の塩基から無作為に選択して所定の長さの塩基配列を複数設計する場合、全体の30%以上、好ましくは50%以上、より好ましくは70%以上、更に好ましくは90%以上が、70%以下の同一性、好ましくは60%以下の同一性、より好ましくは50%以下の同一性、最も好ましくは40%以下の同一性となるように設計することが好ましい。複数のランダムプライマーとして、4種類の塩基から無作為に選択して所定の長さの塩基配列を複数設計する場合であって、上述の範囲のヌクレオチドについて上記範囲の同一性となるように設計することで、対象生物種のゲノムDNA全体に亘って増幅断片を得ることができる。すなわち、増幅断片の均一性を高めることができる。
複数のランダムプライマーとして、特定の塩基配列からなる共通部分と、任意の塩基配列からなる非共通部分とからなる塩基配列を複数設計する場合、例えば、3’末端側の数塩基を非共通部分とし、残りの5’末端側を共通部分とするように設計することができる。3’末端側のn個の塩基を非共通部分とすれば、4種類のランダムプライマーを設計することができる。ここで、n個としては、1~5個とすることができ、好ましくは2~4個、より好ましくは2~3個である。
例えば、共通部分と非共通部分とからなるランダムプライマーとしては、5’末端側を次世代シーケンサーに使用するアダプター配列(共通部分)とし、3’末端側を2塩基(非共通部分)とした、合計16種類のランダムプライマーを設計することができる。なお、3’末端側を3塩基(非共通部分)とすれば、合計64種類のランダムプライマーを設計することができる。ランダムプライマーの種類が多くなるほど、対象生物種のゲノムDNA全体に亘って増幅断片をより網羅的に得ることができる。したがって、共通部分と非共通部分とからなるランダムプライマーを設計する場合、3’末端側の塩基は3塩基とすることが好ましい。
ただし、例えば、共通部分と3塩基の非共通部分とからなる64種類の塩基配列を設計した後、これら64種類の塩基配列から選ばれる63種類以下のランダムプライマーを使用してもよい。言い換えると、64種類のランダムプライマーの全てを使用した場合と比較して、63種類以下のランダムプライマーを使用した場合のほうが核酸増幅反応や、次世代シーケンサーを用いた解析において優れた結果を示す場合がある。具体的には、64種類のランダムプライマーを使用した場合、特定の核酸増幅断片のリード数が著しく多くなるような場合がある。この場合には、64種類のランダムプライマーのなかから当該特定の核酸増幅断片の増幅に関与する1又は複数のランダムプライマーを除いた残りの63種類以下のランダムプライマーを使用したほうが良好な解析結果が得られることになる。
なお、共通部分と2塩基の非共通部分とからなる16種類のランダムプライマーを設計した場合も同様に、16種類のランダムプライマーから選ばれる15種類以下のランダムプライマーを使用した場合に、核酸増幅反応や次世代シーケンサーを用いた解析において優れた結果を示す場合がある。
一方、ランダムプライマーとして使用するヌクレオチドは、特に、GC含量が5~95%の範囲となるように設計することが好ましく、10~90%の範囲となるように設計することがより好ましく、15~80%の範囲となるように設計することが更に好ましく、20~70%の範囲となるように設計することが最も好ましい。ランダムプライマーとしてGC含量が上述の範囲のヌクレオチドの集合を使用することによって、より高い再現性で増幅核酸断片を得ることができる。なお、GC含量とは、ヌクレオチド鎖全体に含まれるグアニン及びシトシンの割合である。
さらに、ランダムプライマーとして使用するヌクレオチドは、特に、全体の長さに対して連続塩基が80%以下となるように設計することが好ましく、70%以下となるように設計することがより好ましく、60%以下となるように設計することが更に好ましく、50%以下となるように設計することが最も好ましい。或いは、ランダムプライマーとして使用するヌクレオチドは、特に、連続塩基の数が8個以下となるように設計することが好ましく、7個以下となるように設計することがより好ましく、6個以下となるように設計することが更に好ましく、5個以下となるように設計することが最も好ましい。ランダムプライマーとして連続塩基数が上述の範囲のヌクレオチドの集合を使用することによって、より高い再現性で増幅核酸断片を得ることができる。
さらにまた、ランダムプライマーとして使用するヌクレオチドは、特に、分子内に6塩基長以上、好ましくは5塩基以上、より好ましくは4塩基以上の相補領域を有しないように設計することが好ましい。ヌクレオチドに上記範囲の相補領域を有しないように設計することで分子内における二本鎖形成を防止でき、より高い再現性で増幅核酸断片を得ることができる。
さらにまた、ランダムプライマーとして複数種類のヌクレオチドを設計する場合、特に、複数のヌクレオチド間において6塩基長以上、好ましくは5塩基以上、より好ましくは4塩基以上の相補領域を有しないように設計することが好ましい。複数のヌクレオチド間に上記範囲の相補領域を有しないように設計することでヌクレオチド間の二本鎖形成を防止でき、より高い再現性で増幅核酸断片を得ることができる。
さらにまた、ランダムプライマーとして複数種類のヌクレオチドを設計する場合、特に、3’末端側の6塩基以上、好ましくは5塩基以上、より好ましくは4塩基以上が相補的な配列にならないように設計することが好ましい。複数のヌクレオチドの3’末端側の上記範囲において相補的な配列を有しないように設計することでヌクレオチド間の二本鎖形成を防止でき、より高い再現性で増幅核酸断片を得ることができる。
なお、相補領域及び相補的な配列とは、例えば80~100%の同一性を有する領域及び配列(例えば5塩基長の領域であれば、4塩基又は5塩基が相補的である領域及び配列)、或いは90~100%の同一性を有する領域及び配列(例えば5塩基長の領域であれば5塩基が相補的である領域及び配列)を意味する。
さらにまた、ランダムプライマーとして使用するヌクレオチドは、核酸増幅反応における温度サイクル条件(特に、アニーリング温度)に適したTm値となるように設計することが好ましい。特に限定されないが、Tm値は、最近接塩基対法、Wallace法及びGC%法等の公知の計算方法により算出することができる。具体的に、ランダムプライマーとして使用するヌクレオチドは、特にTm値が10~85℃、好ましくは12~75℃、より好ましくは14~70℃、最も好ましくは16~65℃となるように設計することが好ましい。ヌクレオチドのTm値を上記範囲となるように設計することで、核酸増幅反応における所定の温度サイクル条件(特に、所定のアニーリング温度)下において、より高い再現性で増幅核酸断片を得ることができる。
さらにまた、ランダムプライマーとして複数種類のヌクレオチドを設計する場合、特に、複数のヌクレオチド間において各ヌクレオチドのTm値のばらつきが50℃以下、好ましくは45℃以下、より好ましくは40℃以下、最も好ましくは35℃以下となるように設計することが好ましい。複数のヌクレオチド間でTm値のばらつきが上記範囲となるように設計することで、核酸増幅反応における所定の温度サイクル条件(特に、所定のアニーリング温度)下において、より高い再現性で増幅核酸断片を得ることができる。
本方法では、上述したランダムプライマー及び鋳型としてのゲノムDNAを用いた核酸増幅反応によって、多数の増幅断片を取得する。特に、核酸増幅反応において、反応液中のランダムプライマーの濃度を、通常の核酸増幅反応におけるプライマー濃度と比較して高濃度とする。これにより、高い再現性を達成しながら多数の増幅断片をゲノムDNAを鋳型として得ることができる。
ここで、核酸増幅反応とは、鋳型となるゲノムDNA、上述したランダムプライマー、DNAポリメラーゼ、基質となるデオキシヌクレオチド三リン酸(dNTP、すなわちdATP、dCTP、dTTP及びdGTPの混合物)及びバッファーからなる反応液で、所定の温度サイクル条件を加えることで増幅断片を合成する反応である。なお、核酸増幅反応には、反応液中に所定濃度のMg2+が必要であり、上述した組成においてバッファーにMgCl2が含まれている。バッファーにMgCl2が含まれていない場合、上記組成に加えてMgCl2が含まれることとなる。
特に核酸増幅反応において、ランダムプライマーの濃度は、ランダムプライマーの塩基長に応じて適宜設定することが好ましい。ここで、ランダムプライマーの塩基長は、異なる塩基長の複数種類のヌクレオチドをランダムプライマーとして使用する場合には、その平均値(単純平均でもよいし、ヌクレオチド量を加味した加重平均でもよい)とすることができる。
具体的には、9~30塩基長のランダムプライマーを用い、当該ランダムプライマー濃度を4~200μMとする条件、好ましくは4~100μMとする条件で核酸増幅反応を行う。この条件であれば、核酸増幅反応により、高い再現性を達成しながら多数の増幅断片、特に100~500塩基長の多数の増幅断片を得ることができる。
また、核酸増幅反応において鋳型となるゲノムDNAは、特に限定されないが、反応液の量を50μlとしたときに、0.1~1000ngとすることが好ましく、1~500ngとすることがより好ましく、5~200ngとすることが更に好ましく、10~100ngとすることが最も好ましい。鋳型となるゲノムDNAの量をこの範囲とすることで、ランダムプライマーからの増幅反応が阻害されることなく、高い再現性を達成しながら多数の増幅断片を得ることができる。
ゲノムDNAの調整方法は、特に限定されず、従来公知の方法を適用することができる。また、市販されているキットを利用することで、対象の生物種から簡便にゲノムDNAを調整することができる。なお、ゲノムDNAとしては、従来公知の方法や市販のキットにより生物から抽出されたものをそのまま使用しても良いし、生物から抽出したものを精製したものでも良いし、制限酵素処理や超音波処理した後のものを使用しても良い。
また、核酸増幅反応においてDNAポリメラーゼとしては、特に限定されず、核酸増幅反応のための温度サイクル条件下でDNAポリメラーゼ活性を有する酵素を使用することができる。具体的には、通常の核酸増幅反応に使用される耐熱性DNAポリメラーゼを使用することができる。例えば、DNAポリメラーゼとしては、Taq DNAポリメラーゼ等の好熱細菌由来DNAポリメラーゼ、KOD DNAポリメラーゼやPfu DNAポリメラーゼ等の超好熱Archaea由来DNAポリメラーゼを挙げることができる。特に、核酸増幅反応においては、上述したランダムプライマーとともに、DNAポリメラーゼとしてはPfu DNAポリメラーゼを使用することが好ましい。これらDNAポリメラーゼを使用することで、高い再現性を達成しながら多数の増幅断片をより確実に得ることができる。
さらに、核酸増幅反応において、基質となるデオキシヌクレオチド三リン酸(dNTP、すなわちdATP、dCTP、dTTP及びdGTPの混合物)の濃度は、特に限定されないが、5μM~0.6mMとすることができ、10μM~0.4mMとすることが好ましく、20μM~0.2mMとすることがより好ましい。基質となるdNTPの濃度をこの範囲とすることで、DNAポリメラーゼによる誤った取り込みによるエラーの発生を防止し、高い再現性を達成しながら多数の増幅断片を得ることができる。
さらに、核酸増幅反応において、バッファーとしては、特に限定されないが、上述のようにMgCl2を含み、例えばTris-HCl(pH8.3)及びKClを含む溶液を挙げることができる。ここで、Mg2+の濃度としては、特に限定されないが、例えば0.1~4.0mMとすることができ、0.2~3.0mMとすることが好ましく、0.3~2.0mMとすることがより好ましく、0.5~1.5mMとすることが更に好ましい。反応液中のMg2+濃度をこの範囲に設定することで、高い再現性を達成しながら多数の増幅断片を得ることができる。
さらにまた、核酸増幅反応における温度サイクル条件としては、特に限定されず、通常の温度サイクルを採用することができる。具体的に温度サイクルとは、先ず、鋳型のゲノムDNAを一本鎖に乖離するための最初の熱変性温度、その後、「熱変性温度→アニーリング温度→伸長反応温度」を複数回(例えば、20~40回)行い、最後に必要であれば、所定時間伸長反応温度とし、最後に保存のための温度とするサイクルを例示することができる。
熱変性温度としては、例えば93~99℃、好ましくは95~98℃、より好ましくは97~98℃とすることができる。アニーリング温度としては、上述したランダムプライマーのTm値にもよるが、例えば30~70℃、好ましくは35~68℃、より好ましくは37~65℃とすることができる。伸長反応温度としては、例えば70~76℃、好ましくは71~75℃、より好ましくは72~74℃とすることができる。また、保存のための温度としては例えば4℃とすることができる。
また、最初の熱変性は、上述した温度範囲において、例えば5秒~10分、好ましくは10秒~5分、より好ましくは30秒~2分とすることができる。「熱変性温度→アニーリング温度→伸長反応温度」のサイクルにおける熱変性は、上述した温度範囲において、例えば2秒~5分、好ましくは5秒~2分、より好ましくは10秒~1分とすることができる。「熱変性温度→アニーリング温度→伸長反応温度」のサイクルにおけるアニーリングは、上述した温度範囲において、例えば1秒~3分、好ましくは3秒~2分、より好ましくは5秒~1分とすることができる。「熱変性温度→アニーリング温度→伸長反応温度」のサイクルにおける伸長反応は、上述した温度範囲において、例えば1秒~3分、好ましくは3秒~2分、より好ましくは5秒~1分とすることができる。
また、本方法としては、ホットスタート法を採用した核酸増幅反応によって増幅断片を取得するものでも良い。ホットスタート法とは、「熱変性温度→アニーリング温度→伸長反応温度」のサイクル前のミスプライミングやプライマーダイマーに由来する非特異増幅を防ぐ方法である。ホットスタート法では、抗DNAポリメラーゼ抗体を結合させたり、化学修飾を行うことで、DNAポリメラーゼ活性を抑制させた状態の酵素を使用する。この状態では、DNAポリメラーゼ活性が抑制され、温度サイクル前の非特異的な反応を防止することができる。ホットスタート法では、最初の温度サイクル時に温度を高く設定することでDNAポリメラーゼ活性が回復し、その後の核酸増幅反応が進行することとなる。
以上のように、上述した9~30塩基長のランダムプライマーを使用し、反応液中の当該ランダムプライマー濃度を4~200μMとして核酸増幅反応を行うことで、ゲノムDNAを鋳型としてランダムプライマーが多数の増幅断片を得ることができる。上述した9~30塩基長のランダムプライマーを使用し、反応液中の当該ランダムプライマー濃度を4~200μMとした場合、非常に再現性の高い核酸増幅反応となる。すなわち、上述した核酸増幅反応によれば、非常に高い再現性を達成しながら多数の増幅断片を得ることができる。
また、上述した9~30塩基長のランダムプライマーを使用し、反応液中の当該ランダムプライマー濃度を4~200μMとして核酸増幅反応を行うことで、特に、ゲノムDNAを鋳型として約100~500塩基長の多数の増幅断片を得ることができる。この約100~500塩基長の多数の増幅断片は、例えば次世代シーケンサーによる塩基配列の大量解析に適したサイズであり、高精度な配列情報を得ることができる。すなわち、本発明によれば、約100~500塩基長といったDNA断片を作製することができる。
さらに、上述した9~30塩基長のランダムプライマーを使用し、反応液中の当該ランダムプライマー濃度を4~200μMとして核酸増幅反応を行うことで、特に、ゲノムDNAの全体に亘って均一に増幅断片を得ることができる。言い換えると、当該ランダムプライマーを用いた核酸増幅反応では、ゲノムDNAの所定の領域に偏ってDNA断片が増幅されるのではなく、ゲノム全体に分散してDNA断片が増幅される。
なお、上述したランダムプライマーを使用して核酸増幅反応を行った後、得られた増幅断片に対して制限酵素処理、サイズセレクション処理及びシーケンスキャプチャー処理等を行うことができる。増幅断片に対してこれら制限酵素処理、サイズセレクション処理及びシーケンスキャプチャー処理を行うことで、得られた増幅断片のなかから特定の増幅断片(特定の制限酵素部位を有する断片、特定のサイズ範囲の増幅断片、特定の配列を有する増幅断片)を得ることができる。
〔ゲノムDNA解析方法〕
上述のように作製されたアンプリコンを使用することで、遺伝子型解析等のゲノムDNA解析を行うことができる。上述のように作製したアンプリコンは、非常に高い再現性を有しており、次世代シーケンサーに適したサイズを有しており、ゲノム全体に亘って均一性を有している。したがって、上述のように作製したアンプリコンは、DNAマーカー(遺伝マーカー、遺伝子マーカーとも称される)として使用することができる。ここで、DNAマーカーとは、ゲノムDNA内に存在する特徴的な塩基配列を広く意味する。また、DNAマーカーとしては、特に、遺伝的形質に関連する目印となるゲノム上の塩基配列とすることもできる。DNAマーカー、例えば遺伝子型同定、連鎖地図、遺伝子マッピング、マーカーを利用した選抜工程を含む育種、マーカーを利用した戻し交配、量的形質遺伝子座のマッピング、バルクセグリガント分析、品種識別、又は連鎖不均衡マッピング等に利用することができる。
特に、本発明に係る次世代シーケンサー用プライマーを使用することで、次世代シーケンサー等を使用して、上述のように作製されたアンプリコンの塩基配列を決定し、得られた塩基配列に基づいてDNAマーカーの存否を確認することができる。
一例としては、得られた塩基配列のリード数からDNAマーカーの存否を確認することができる。ここで、次世代シーケンサーとは、特に限定されないが、上述した本発明に係る次世代シーケンサー用プライマーを利用することができ、第2世代シーケンサーとも呼称され、数千万のDNA断片の塩基配列を同時並行的に決定できる塩基配列決定装置を意味する。次世代シーケンサーにおけるシーケンシング原理としては、特に限定されず、例えばブリッジPCR法とSequencing-by-synthesis法により、フローセル上で目的DNAを増幅させ、合成しながらシーケンシングを行うといった原理を挙げることができる。より具体的に、次世代シーケンサーとしては、イルミナ社(Illumina)のMiniSeq、MiSeq、NextSeq、HiSeq及びHiSeq Xシリーズを挙げることができる。
また、他の例としては、上述のように作製されたアンプリコンについて得られた塩基配列を参照用の塩基配列と比較することでDNAマーカーの存否を確認することができる。ここで、参照用の塩基配列とは、基準となる既知の配列を意味し、例えば、データベースに格納された既知配列とすることができる。すなわち、所定の生物について、上述のようにアンプリコンを作製し、その塩基配列を決定し、参照用の塩基配列と比較する。そして、参照用の塩基配列と相違する塩基配列を、当該所定の生物に関するDNAマーカー(ゲノムDNA内に存在する特徴的な塩基配列)とすることができる。また、特定したDNAマーカーについては、定法に従って更に解析することによって、遺伝的形質(表現型)に関連性を決定することができる。すなわち、上述のように特定したDNAマーカーの中から、表現型に関連するDNAマーカー(選抜マーカーと称する場合もある)を特定することができる。
さらに、他の例としては、上述のように作製されたアンプリコンについて得られた塩基配列を、他の生物由来のゲノムDNA又は他の組織由来のゲノムDNAを用いて作製したアンプリコンの塩基配列と比較することでDNAマーカーの存否を確認することができる。すなわち、2以上の生物又は2つの異なる組織について、それぞれ上述のようにアンプリコンを作製し、それらの塩基配列を決定し、塩基配列同士を比較する。そして、相違する塩基配列を、供試した生物又は組織に関するDNAマーカー(ゲノムDNA内に存在する特徴的な塩基配列)とすることができる。また、特定したDNAマーカーについては、定法に従って更に解析することによって、遺伝的形質(表現型)に関連性を決定することができる。すなわち、上述のように特定したDNAマーカーの中から、表現型に関連するDNAマーカー(選抜マーカーと称する場合もある)を特定することができる。
或いは、上述のように本発明に係る次世代シーケンサー用プライマーを用いて解析された塩基配列データは、微生物等の多種多様性を調べるメタゲノム解析や腫瘍組織などの体細胞ゲノム変異解析、マイクロアレイを利用した遺伝子型解析、倍数性の判定解析、染色体数の算出解析、染色体の増減解析、染色体の部分的挿入・欠失・複製・転座解析、外来ゲノムの混入解析、親子判別解析、交配種子純度検定解析といった解析に利用することができる。
以下、実施例を用いて本発明を更に詳細に説明するが、本発明の技術的範囲は以下の実施例に限定されるものではない。
〔実施例1〕
本実施例では、イルミナ社の次世代シーケンサーに使用される次世代シーケンサー用プライマーP7及びP5について、インデックス配列と次世代シーケンサーから得られるデータ量との関係を明らかにし、次世代シーケンサーを用いた解析に適した次世代シーケンサー用プライマーを開発した。
1.材料
本実施例では、イネ品種日本晴からDNeasy Plant Mini kit(QIAGEN)を用いてゲノムDNAを抽出及び精製したものを使用した。
2.方法
2.1.ランダムプライマーの設計
ランダムプライマーは、イルミナ社の次世代シーケンサー用のアゲプターNextera adapterにおける3'末端の10塩基(GTTACACACG)と、当該10塩基の3'末端にTGCを除く3塩基の任意の配列を付加した全長13塩基からなる63種類の塩基配列を設計した(表2)。
Figure 0007047373000002
3.2.解析対象DNAの作製
〔1.材料〕で説明したイネのゲノムDNA(30ng)に最終濃度0.2mM dNTP mixture、10mM MgC12及び1.25unitのDNA Polymerase(TAKARA、PrimeSTAR)に、40μMのランゲムプライマーをそれぞれ加え、最終反応量50μlでPCRを行った。PCRの温度条件は、98℃を2分の後、98℃を10秒間、50℃を15秒間、72℃を20秒間を1サイクルとして30サイクル行い、その後、4℃で保存する条件とした。このPCRにより、ランダムプライマーによってイネゲノムDNAを鋳型として多数の解析対象DNAを作製した。
3.3.次世代シーケンサー用DNAライブラリーの作製
上記3.2で作製した解析対象DNA(1μl)に最終濃度0.2mM dNTP mixture、1.0mM MgC12及び1.25unitnDNAPolymerase(TAKARA、PrimeSTAR)を加え、更に、0.25μMの次世代シーケンサー用プライマーP7及びP5をそれぞれ加えた反応液(50μl)を準備した。
次世代シーケンサー用プライマーP7及びP5は、表3に示したイルミナ社のNextera adaptorの配列情報をもとに作製した。なお、下記表においてアスタリスクで示した8塩基がインデックス配列である。ただし、P5のインデックス配列に対して、P7のインデックス配列は逆相補鎖である。
Figure 0007047373000003
詳細には、次世代シーケンサー用プライマーP7において、96種のインデックス配列を有する次世代シーケンサー用プライマーP7を設計した(表4)。表4に示した次世代シーケンサー用プライマーP7を使用する場合、次世代シーケンサー用プライマーP5としてはAATGATACGGCGACCACCGAGATCTACACCGCGCAGATCGTCGGCAGCGTCAGATGTGTATAAGAGACAGを用いた。表4に示した次世代シーケンサー用プライマーP7を用いて作製したDNAライブラリーをDNAライブラリー1と称する。
Figure 0007047373000004
Figure 0007047373000005
Figure 0007047373000006
一方、次世代シーケンサー用プライマーP5において、98種のインデックス配列を有する次世代シーケンサー用プライマーP5を設計した(表5)。表5に示した次世代シーケンサー用プライマーP5を使用する場合、次世代シーケンサー用プライマーP7としてはCAAGCAGAAGACGGCATACGAGATTCGTCAGAGTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGを用いた。表5に示した次世代シーケンサー用プライマーP5を用いて作製したDNAライブラリーをDNAライブラリー2と称する。
Figure 0007047373000007
Figure 0007047373000008
Figure 0007047373000009
DNAライブラリー1及び2を作製するための核酸増幅反応における温度条件は、95℃を2分間の後、98℃を15秒間、55℃を15秒間及び72℃を20秒間を1サイクルとして25サイクル行い、その後、72℃を1分後とし、4℃で保存する条件とした。そして、核酸増幅反応により作製したDNAライブラリーはMinElute PCR Purification Kit(QIAGEN)で精製した。
3.4.次世代シーケンサーによる解析
上記3.3で作製したDNAライブラリー1及び2については、MiSeq Reagent Kit V2 500 Cycte(イルミナ)を用いてリード長100塩基のペアエンド条件のもと、それぞれMiSeqにより解析した。DNAライブラリー1及び2について解析の結果として得られたリード数をそれぞれ表4及び5に示した。
3.5.インデックスとデータ量の解析
上記3.4で解析した結果として得られた次世代シーケンサー用プライマー毎のリード数をもとに、次世代シーケンサー用プライマーに含まれるインデックス配列の8塩基とデータ量の関係をGLMNET LASSO法により解析し、インデックス配列に含まれる塩基の種類とによるリード数の推定式を作成した。作成した推定式より算出した推定リード数と、実際の測定されたリード数との相関係数を算出した。
4.結果
4.1.次世代シーケンサー用プライマー毎のリード数の分布
次世代シーケンサー用プライマーのインデックスの違いによるデータ量への影響を評価するため、インデックス配列が異なる次世代シーケンサー用プライマーP7及びP5について、プライマー毎のリード数の分布を調査した。次世代シーケンサー用プライマーP7のインデックス配列が異なるDNAライブラリー1では、全体のリード数の平均値66,9617に対し、リード数が15,000以下のインデックスが9種(94%)存在し、その平均値は2,492.2と全体平均値の3.7%だった(図2)。また、リード数が40,000以下のインデックスが22種(220%)存在し、その平均値は16,2376と全体平均値の24.3%だった。一方、次世代シーケンサー用プライマーP5のインデックス配列が異なるDNAライブラリー2では、全体のリード数の平均値191,5231で、すべて100,000以下のリード数を示した(図3)。
4.2.インデックス配列とリード数の関係
上述したDNAライブラリー1及び2それぞれを次世代シーケンサーで解析して得られたデータをもとに、インデックス配列とリード数との関係をGLMNET LASSO法で解析し、インデックス配列における塩基の種類とリード数との推定式を作成した。すなわち、リード数を目的変数とし、インデックス配列における塩基の種類を説明変数とする推定式を作成した。DNAライブラリー1について作成した推定式により算出した推定リード数と実測したリード数との関係を図4に示した。図4に示すように、インデックス配列を構成する塩基の種類に基づいて推定式で算出した推定リード数と、実際に測定したリード数との相関係数は
r=0.94069だった。また、図4に示しように、推定リード数と実測したリード数のプロットは、リード数が極めて少ないグループ1、リード数が多いグループ3、その中間のグループ2の3グループに分類できた。グループ1に属する次世代シーケンサー用プライマーP7のインデックス配列に基づいて算出した推定リード数の最大値は20,051.8だった。また、グループ3に属する次世代シーケンサー用プライマーP7のインデックス配列に基づいて算出した推定リード数は、いずれも50,000以上であった。
一方、同様に、DNAライブラリー2についても推定式を算出し、インデックス配列を構成する塩基の種類に基づいて算出した推定リード数と、実測したリード数との相関係数を算出した結果、相関係数はr=0.57295であった(図5)。すなわち、次世代シーケンサー用プライマーP5については、インデックス配列を構成する塩基の種類と、リード数との間に相関が見られなかった。
4.3次世代シーケンサー用プライマーP7におけるインデックス配列の設計
次世代シーケンサー用プライマーP7のインデックスが異なるDNAライブラリー1では、リード数とGLMNET LASSO法で得られた推定値との間での相関係数が0.9以上を示した。この結果から、ライブラリー1についてGLMNET LASSO法により作成した推定式は、インデックス配列を構成する塩基の種類からリード数の推定値を高精度に算出できるものと評価できた。具体的に、GLMNET LASSO法により作成した推定式は、以下のように、インデックス配列における所定の位置について塩基毎に算出された係数を含む項と切片とを含んだ式である。
推定値=-65033.1×(A1)+1326.4×(C1)-16997×(G1)+10936.3×(A2)-12399.2×(G2)+11712.9×(T2)+12112.2×(A3)-623.5×(G3)+5964.4×(T3)+6884.5×(A4)-5664.4×(C4)-6049.9×(G4)+9257×(A5)-6210.8×(G5)-644×(C6)+3.2×(T6)-3575.9×(A7)+1013.l×(G7)-8607.7×(G8)+6490.3×(T8)+81720.7
上記推定式において(A1)は、インデックス配列の5’末端側から3’末端側の方向において1番目の塩基がアデニンである場合に"1"を代入し、それ以外は"0"を代入するパラメータである。他の表記も同様に、インデックス配列の5’末端側から3’末端側の方向における位置と塩基の種類とを意味し、"1"又は"0"が代入されるパラメータである。
以上のように作成した推定式を用い、推定値が20,052以上(グループ2又は3と推定される)を示す次世代シーケンサー用プライマーP7と、推定値が50,000以上(グループ3と推定される)を示す次世代シーケンサー用プライマーP7とを選抜した(それぞれ表6及び7)。なお、表6及び7中の塩基配列において、Nは、アデニン、シトシン、グアニン及びチミンのいずれか任意の塩基を意味する。
Figure 0007047373000010
Figure 0007047373000011
Figure 0007047373000012
Figure 0007047373000013
Figure 0007047373000014
Figure 0007047373000015
Figure 0007047373000016
Figure 0007047373000017
Figure 0007047373000018
Figure 0007047373000019
Figure 0007047373000020
Figure 0007047373000021
Figure 0007047373000022
Figure 0007047373000023
Figure 0007047373000024
Figure 0007047373000025
Figure 0007047373000026
Figure 0007047373000027
Figure 0007047373000028
Figure 0007047373000029
Figure 0007047373000030
Figure 0007047373000031
Figure 0007047373000032
Figure 0007047373000033
Figure 0007047373000034
Figure 0007047373000035
Figure 0007047373000036
Figure 0007047373000037
Figure 0007047373000038
Figure 0007047373000039
Figure 0007047373000040
Figure 0007047373000041
Figure 0007047373000042
Figure 0007047373000043
5.考察
本実施例では、イルミナ社の次世代シーケンサー用プライマーにおけるインデックス配列とリード数について解析した結果、次世代シーケンサー用プライマーP5では明確な関係は見られなかったものの、次世代シーケンサー用プライマーP7では相関係数0.9以上と明確な相関関係が見られた。特に、GLMNET LASSO法により作製した推定式を用いてインデックス配列を構成する塩基の種類から推定リード数を算出し、推定リード数と実際のリード数とから、インデックス配列の異なる次世代シーケンサー用プライマーP7は、3つのグループに分類できることが明らかとなった。すなわち、リード数が15,000以下と極めて少なく、次世代シーケンサーを用いた解析への利用が困難と考えられるグループ1を特定することができた。このグループ1に属する次世代シーケンサー用プライマーP7の推定リード数の最大値が20,051.8であった。したがって、本実施例では、インデックス配列を構成する塩基の種類をパラメータとする推定式にて算出した推定リード数が20,052以上となる全てのインデックス配列を選抜した(表6)。選抜したインデックス配列を有する次世代シーケンサー用プライマーP7(表6)は、次世代シーケンサーに利用したときに多くのリード数を得ることができると考えられる。
また、グループ3に属する次世代シーケンサー用プライマーP7の推定リード数は50,000以上であったことから、インデックス配列を構成する塩基の種類をパラメータとする推定式にて算出した推定リード数が50,000以上となる全てのインデックス配列を選抜した(表7)。選抜したインデックス配列を有する次世代シーケンサー用プライマーP7(表7)は、次世代シーケンサーに利用したときに更に多くのリード数を得ることができると考えられる。
本実施例で設計された次世代シーケンサー用プライマーP7を利用することで、次世代シーケンサーからより安定したデータが得られることが期待できる。

Claims (2)

  1. 5’-CAAGCAGAAGACGGCATACGAGAT(配列番号1)-N 8 -GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG(配列番号2)-3’( N 8 は8塩基のインデックス配列)の塩基配列を含む次世代シーケンサー用プライマーについて、リード数を目的変数としインデックス配列における塩基の種類を説明変数とする推定式であって、上記インデックス配列における1番目の塩基がアデニン又はグアニンである場合、2番目の塩基がグアニンである場合及び8番目の塩基がグアニンである場合にリード数が減少する推定式に基づいて、インデックス配列の塩基配列からリード数の推定値を算出し、算出したリード数の推定値が所定の値を超える塩基配列をインデックス配列の塩基配列として設計する工程と
    上記工程で設計したインデックス配列を含むヌクレオチドを合成する工程とを含む次世代シーケンサー用プライマーの製造方法。
  2. 上記推定式は以下であり、
    推定値=-65033.1×(A1)+1326.4×(C1)-16997×(G1)+10936.3×(A2)-12399.2×(G2)+11712.9×(T2)+12112.2×(A3)-623.5×(G3)+5964.4×(T3)+6884.5×(A4)-5664.4×(C4)-6049.9×(G4)+9257×(A5)-6210.8×(G5)-644×(C6)+3.2×(T6)-3575.9×(A7)+1013.l×(G7)-8607.7×(G8)+6490.3×(T8)+81720.7
    ここで上記式における括弧内は、インデックス配列の5’末端側から3’末端側の方向における位置と塩基の種類(A:アデニン、C:シトシン、G:グアニン、T:チミン)とを表しており、推定値を求めるインデックス配列の当該位置における塩基が存在する場合に"1"が代入され当該塩基が存在しない場合に"0"が代入され、
    上記推定式で求めた推定値が50000以上である塩基配列をインデックス配列の塩基配列として設計することを特徴とする請求項記載の次世代シーケンサー用プライマーの製造方法。
JP2017247826A 2017-12-25 2017-12-25 次世代シーケンサー用プライマー並びにその製造方法、次世代シーケンサー用プライマーを用いたdnaライブラリー並びにその製造方法、及びdnaライブラリーを用いたゲノムdna解析方法 Active JP7047373B2 (ja)

Priority Applications (8)

Application Number Priority Date Filing Date Title
JP2017247826A JP7047373B2 (ja) 2017-12-25 2017-12-25 次世代シーケンサー用プライマー並びにその製造方法、次世代シーケンサー用プライマーを用いたdnaライブラリー並びにその製造方法、及びdnaライブラリーを用いたゲノムdna解析方法
KR1020207016876A KR102404104B1 (ko) 2017-12-25 2018-12-21 차세대 시퀀서를 위한 프라이머 및 이의 제조방법, 차세대 시퀀서를 위한 프라이머의 사용을 통해 수득한 dna 라이브러리 및 이의 제조방법, 및 dna 라이브러리를 사용한 dna 분석 방법
PCT/JP2018/047136 WO2019131470A1 (en) 2017-12-25 2018-12-21 A primer for next generation sequencer and a method for producing the same, a dna library obtained through the use of a primer for next generation sequencer and a method for producing the same, and a dna analyzing method using a dna library
CN201880083369.XA CN111542618B (zh) 2017-12-25 2018-12-21 用于下一代测序仪的引物及其制备方法
EP18897836.5A EP3676401B1 (en) 2017-12-25 2018-12-21 A primer for next generation sequencer and a method for producing the same, a dna library obtained through the use of a primer for next generation sequencer and a method for producing the same, and a dna analyzing method using a dna library
US16/769,859 US11795451B2 (en) 2017-12-25 2018-12-21 Primer for next generation sequencer and a method for producing the same, a DNA library obtained through the use of a primer for next generation sequencer and a method for producing the same, and a DNA analyzing method using a DNA library
EP22168008.5A EP4105341B1 (en) 2017-12-25 2018-12-21 A primer for next generation sequencer and a method for producing the same, a dna library obtained through the use of a primer for next generation sequencer and a method for producing the same, and a dna analyzing method using a dna library
TW107146389A TWI715900B (zh) 2017-12-25 2018-12-21 次世代定序儀用引子以及其製造方法、使用次世代定序儀用引子之dna庫以及其製造方法,及使用dna庫之基因體dna解析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017247826A JP7047373B2 (ja) 2017-12-25 2017-12-25 次世代シーケンサー用プライマー並びにその製造方法、次世代シーケンサー用プライマーを用いたdnaライブラリー並びにその製造方法、及びdnaライブラリーを用いたゲノムdna解析方法

Publications (2)

Publication Number Publication Date
JP2019110840A JP2019110840A (ja) 2019-07-11
JP7047373B2 true JP7047373B2 (ja) 2022-04-05

Family

ID=67063674

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017247826A Active JP7047373B2 (ja) 2017-12-25 2017-12-25 次世代シーケンサー用プライマー並びにその製造方法、次世代シーケンサー用プライマーを用いたdnaライブラリー並びにその製造方法、及びdnaライブラリーを用いたゲノムdna解析方法

Country Status (7)

Country Link
US (1) US11795451B2 (ja)
EP (2) EP4105341B1 (ja)
JP (1) JP7047373B2 (ja)
KR (1) KR102404104B1 (ja)
CN (1) CN111542618B (ja)
TW (1) TWI715900B (ja)
WO (1) WO2019131470A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110628889A (zh) * 2019-08-12 2019-12-31 远辰生物科技(苏州)有限公司 Illumina二代测序平台文库构建引入分子标签的方法、接头序列及应用
US20230375538A1 (en) * 2020-07-24 2023-11-23 Arizona Board Of Regents On Behalf Of Arizona State University Dual barcode indexes for multiplex sequencing of assay samples screened with multiplex insolution protein array
WO2023025784A1 (en) * 2021-08-24 2023-03-02 Ecole Polytechnique Federale De Lausanne (Epfl) Optimised set of oligonucleotides for bulk rna barcoding and sequencing
WO2023122237A1 (en) * 2021-12-22 2023-06-29 St. Jude Children's Research Hospital, Inc. Kit and method for analyzing t cell receptors from single t cells
WO2023237180A1 (en) * 2022-06-07 2023-12-14 Alithea Genomics Sa Optimised set of oligonucleotides for bulk rna barcoding and sequencing

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016083933A1 (en) 2014-11-26 2016-06-02 Population Genetics Technologies Ltd. Method for fragmenting a nucleic acid for sequencing
WO2016115550A1 (en) 2015-01-16 2016-07-21 Seqwell, Inc. Normalized iterative barcoding and sequencing of dna collections
WO2017123758A1 (en) 2016-01-12 2017-07-20 Seqwell, Inc. Compositions and methods for sequencing nucleic acids

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4255630B2 (ja) 2001-09-10 2009-04-15 独立行政法人農業・食品産業技術総合研究機構 米のdna食味判定技術及び籾/玄米半粒による良食味米選抜方法
US8206913B1 (en) 2003-03-07 2012-06-26 Rubicon Genomics, Inc. Amplification and analysis of whole genome and whole transcriptome libraries generated by a DNA polymerization process
JP3972106B2 (ja) 2004-03-03 2007-09-05 大学共同利用機関法人情報・システム研究機構 ゲノムライブラリー作製方法、および同方法により作製されたゲノムライブラリー
CN101641449B (zh) 2005-06-23 2014-01-29 科因股份有限公司 用于多态性的高通量鉴定和检测的策略
EP2002017B1 (en) 2006-04-04 2015-06-10 Keygene N.V. High throughput detection of molecular markers based on restriction fragments
WO2010039991A2 (en) 2008-10-02 2010-04-08 The Texas A&M University System Method of generating informative dna templates for high-throughput sequencing applications
ES2720282T3 (es) 2009-11-05 2019-07-19 Univ Hong Kong Chinese Análisis genómico fetal a partir de una muestra biológica materna
US9247720B2 (en) 2010-03-24 2016-02-02 Institut National de la Santé et de la Recherche Médicale Primate model from the family cercopithecidae infected by a HBV strain of human genotype
US20140357497A1 (en) * 2011-04-27 2014-12-04 Kun Zhang Designing padlock probes for targeted genomic sequencing
CN103060924B (zh) * 2011-10-18 2016-04-20 深圳华大基因科技有限公司 微量核酸样本的文库制备方法及其应用
DK3428290T3 (da) 2012-07-26 2022-07-04 Illumina Inc Sammensætninger og fremgangsmåder til amplifikation af nukleinsyrer
JP6587544B2 (ja) 2013-03-15 2019-10-09 シグニス バイオテク エセ.エレ.ウ.Sygnis Biotech S.L.U. 熱安定なTthPrimPolを用いた増幅及び配列決定方法
WO2015070187A2 (en) 2013-11-11 2015-05-14 The Translational Genomics Research Institute Systems and methods for universal tail-based indexing strategies for amplicon sequencing
US10465241B2 (en) * 2015-06-15 2019-11-05 The Board Of Trustees Of The Leleand Stanford Junior University High resolution STR analysis using next generation sequencing
KR101651817B1 (ko) 2015-10-28 2016-08-29 대한민국 Ngs 라이브러리 제작용 프라이머 세트 및 이를 이용한 ngs 라이브러리 제작방법 및 키트
JP6654780B2 (ja) 2015-11-25 2020-02-26 国立研究開発法人物質・材料研究機構 磁気抵抗素子の製造方法
EP3397379A4 (en) * 2015-12-30 2019-05-29 Bio-Rad Laboratories, Inc. PREPARATION OF SEPARATE PCR BANK IN DROPLETS
KR101969905B1 (ko) 2016-06-20 2019-04-17 한국표준과학연구원 염기서열분석을 위한 라이브러리용 프라이머 세트 및 라이브러리 제조방법
JP6515884B2 (ja) 2016-06-29 2019-05-22 トヨタ自動車株式会社 Dnaプローブの作製方法及びdnaプローブを用いたゲノムdna解析方法
JP7343264B2 (ja) 2016-06-29 2023-09-12 トヨタ自動車株式会社 Dnaライブラリーの作製方法及びdnaライブラリーを用いたゲノムdna解析方法
JP7056012B2 (ja) 2017-05-19 2022-04-19 トヨタ自動車株式会社 ランダムプライマーセット、及びこれを用いたdnaライブラリーの作製方法
CN107513576A (zh) 2017-10-18 2017-12-26 北京生命科学研究所 一种用于检测遗传性心肌疾病的试剂盒及其应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016083933A1 (en) 2014-11-26 2016-06-02 Population Genetics Technologies Ltd. Method for fragmenting a nucleic acid for sequencing
WO2016115550A1 (en) 2015-01-16 2016-07-21 Seqwell, Inc. Normalized iterative barcoding and sequencing of dna collections
WO2017123758A1 (en) 2016-01-12 2017-07-20 Seqwell, Inc. Compositions and methods for sequencing nucleic acids

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Illumina,Illumina Adapter Sequences,2015年,[retrieved on 2019.01.09],Internet: <URL:https://dnatech.genomecenter.ucdavis.edu/wp-content/uploads/20 13/06/illumina-adapter-sequences_1000000002694-00.pdf>
Illumina,New method of NGS, Library preparation for use with Tailed PCR method,2014年06月13日,[retrieved on 2019.01.09],Internet:<URL:https://jp.illumina.com/content /dam/illumina-marketing/apac/japan/documents/ pdf/2014_techsupport_session5.pdf>
LAMBLE S et al.,BMC BIOTECHNOLOGY,2013年,vol. 13: 104,1-10
SEQanswers,2012年04月07日,[retrieved on 2019.04.04], Internet: <URL:https://seqanswers.com/forums/showthread.php?p=72834>, pages 5-6, ThePhotosyntheticMan

Also Published As

Publication number Publication date
EP3676401A1 (en) 2020-07-08
US11795451B2 (en) 2023-10-24
TWI715900B (zh) 2021-01-11
EP3676401B1 (en) 2022-04-13
US20210171941A1 (en) 2021-06-10
EP3676401A4 (en) 2020-07-29
TW201936921A (zh) 2019-09-16
CN111542618B (zh) 2024-03-01
CN111542618A (zh) 2020-08-14
KR102404104B1 (ko) 2022-05-31
KR20200081488A (ko) 2020-07-07
WO2019131470A1 (en) 2019-07-04
EP4105341B1 (en) 2024-05-01
EP4105341A1 (en) 2022-12-21
JP2019110840A (ja) 2019-07-11

Similar Documents

Publication Publication Date Title
JP7047373B2 (ja) 次世代シーケンサー用プライマー並びにその製造方法、次世代シーケンサー用プライマーを用いたdnaライブラリー並びにその製造方法、及びdnaライブラリーを用いたゲノムdna解析方法
JP6100933B2 (ja) アレリックラダー遺伝子座
CN109715798B (zh) Dna文库的制作方法和使用dna文库的基因组dna分析方法
BR112022006939B1 (pt) Detecção de sequências unicamente associadas a uma região alvo de dna
JP2022044587A (ja) Dnaライブラリーの作製方法及びdnaライブラリーを用いたゲノムdna解析方法
JP2022051750A (ja) ランダムプライマーセット、及びこれを用いたdnaライブラリーの作製方法
JP7362054B2 (ja) High Resolution Melting(HRM)解析によるマグロ類の遺伝的性判別方法
KR102319859B1 (ko) 토종닭 개체 식별을 위한 초위성체 마커 기반 멀티플렉스용 프라이머 세트 및 이의 용도
KR20240072342A (ko) 무의 근피 색상 판별용 snp 마커 및 이의 용도
BR112018077489B1 (pt) Métodos para analisar o dna genômico que compreende o uso de uma biblioteca de dna
NZ749198B2 (en) Method for producing dna library and method for analyzing genomic dna using the dna library
Mohamed DNA markers and their application in animal genetics: an overview
Moton-Redding Investigation and Validation of Whole Genome Amplification Processes Using DNA from Bovine Blastocyst Biopsies
KR20170018994A (ko) Str 유전좌위의 분별 선행 증폭을 통한 유전자 감식 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211015

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220307

R151 Written notification of patent or utility model registration

Ref document number: 7047373

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151