JP6980907B2 - 無細胞核酸から得られた配列分析データに係わる背景対立因子の頻度分布を生成する方法、及びそれを利用して無細胞核酸から変異を検出する方法 - Google Patents

無細胞核酸から得られた配列分析データに係わる背景対立因子の頻度分布を生成する方法、及びそれを利用して無細胞核酸から変異を検出する方法 Download PDF

Info

Publication number
JP6980907B2
JP6980907B2 JP2020515641A JP2020515641A JP6980907B2 JP 6980907 B2 JP6980907 B2 JP 6980907B2 JP 2020515641 A JP2020515641 A JP 2020515641A JP 2020515641 A JP2020515641 A JP 2020515641A JP 6980907 B2 JP6980907 B2 JP 6980907B2
Authority
JP
Japan
Prior art keywords
nucleic acid
sequence analysis
analysis data
background
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020515641A
Other languages
English (en)
Other versions
JP2020520679A (ja
Inventor
ウンヤン パク,
ドンヒョン パク,
テスン ソン,
Original Assignee
ジニナス株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ジニナス株式会社 filed Critical ジニナス株式会社
Publication of JP2020520679A publication Critical patent/JP2020520679A/ja
Application granted granted Critical
Publication of JP6980907B2 publication Critical patent/JP6980907B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/30Characterised by physical treatment
    • C12Q2523/301Sonication

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Immunology (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physiology (AREA)
  • Signal Processing (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

本発明は、無細胞核酸から得られた配列分析データに係わる背景対立因子の頻度分布を生成する方法及びその装置、前記方法による背景対立因子の頻度分布マトリックス、及びそれを利用して無細胞核酸から変異を検出する方法及びその装置に関する。
遺伝体(genome)とは、一生物が有する全ての遺伝情報を言う。ある一個人の遺伝体のシーケンシング(sequencing)または配列分析のために、DNAチップ及び次世代配列分析(NGS:next generation sequencing)、次々世代配列分析(NNGS:next next generation sequencing)のような多くの技術が開発されている。該NGSは、研究及び診断の目的に広く活用されている。該NGSは、装備の種類によって異なるが、大きく見れば、試料の採取、ライブラリーの製造、及び核酸配列分析の遂行の総3段階に区分することができる。該核酸配列分析後には、生産された配列分析データに基づいて、遺伝子変異いかんを検出する。
現在のNGSは、重合酵素連鎖反応(PCR:polymerase chain reaction;PCR)時、重合酵素によって発生するエラー、核酸配列分析過程中、蛍光感知過程で発生するエラーなどにより、配列分析エラー率が0.1ないし1%に達するが、そのようなエラーは、配列分析エラー率以下の頻度に存在するまれな変異感知を阻害するという問題点がある。そのような問題点を克服するためには、配列分析時、変異分析が必要な試料の数を増やすか、あるいは何回か配列分析を進めなければならない。しかし、そのような方法は、配列分析コストが非常にかかり、多量の試料が要求される。
一方、ライブラリーを制作する方法において、アダプダー配列及び/またはバーコード配列を改良し、リードの数を顕著に高めることにより、まれな変異を検出する方法が知られている(大韓民国公開番号10−2016−0141680A)。しかし、ライブラリー制作段階及び配列分析段階以外の段階で発生しうるエラーを低減させることができる方法については、知られたところが不十分である。
従って、コスト消耗を最小化させながら、まれな変異を正確に検出することができる方法が要求される。
一様相は、無細胞核酸から得られた配列分析データに係わる背景対立因子の頻度分布を生成する方法を提供する。
他の様相は、無細胞核酸から得られた配列分析データに係わる背景対立因子の頻度分布を生成する装置を提供する。
他の様相は、無細胞核酸から得られた配列分析データに係わる背景対立因子の頻度分布マトリックスを提供する。
他の様相は、無細胞核酸から変異を検出する方法を提供する。
他の様相は、無細胞核酸から変異を検出する装置を提供する。
無細胞核酸から得られた配列分析データに係わる背景対立因子の頻度分布を生成する方法及びその装置、前記方法による背景対立因子の頻度分布マトリックス、及びそれを利用して無細胞核酸から変異を検出する方法及びその装置によれば、正常人において、血液、細胞または無細胞核酸から、配列分析データを得る過程を省略することができ、時間及びコストが節約されるという利点がある。また、前記背景対立因子の頻度分布を利用し、無細胞核酸から変異を検出する場合、極少量存在する変異の検出において、検出結果に対する信頼度及び正確度が向上する。
PBL DNA試料及び血漿DNA試料において、背景対立因子の塩基、及び全体対立因子の塩基それぞれのフレッド(Phred)塩基品質点数(quality score)に係わる分布を示す。 品質点数30未満の塩基を除去した後、PBL DNA試料において、参照対立因子の塩基、及び背景対立因子の塩基それぞれに係わる塩基品質点数分布を示す。 品質点数30未満の塩基を除去した後、血漿DNA試料において、参照対立因子の塩基、及び背景対立因子の塩基それぞれに係わる塩基品質点数分布を示す図面である。 19個の血漿DNA試料、及び19個のPBL DNA試料において、背景対立因子の頻度、すなわち、試料別平均背景対立因子エラーの比率を示す。バーは、標準偏差を示す。 血漿DNA試料及びPBL DNA試料において、背景対立因子エラーがない位置(error-free position)の比率を示す。バーは、標準偏差を示す。 血漿DNA試料及びPBL DNA試料において、12種の塩基置換に対し、背景対立因子が発生する頻度分布を示す。y軸は、前処理されたPBL DNA試料及び血漿DNA試料において、各塩基置換に係わる背景対立因子の頻度を示す。 血漿DNA試料及びPBL DNA試料において、12種の塩基置換について、背景対立因子エラーの比率を示す。 血漿DNA試料及びPBL DNA試料において、12種の塩基置換について、背景対立因子エラーの比率を示す。 多様な断片化条件において、ゲノムDNAを断片化させ、前記断片化されたゲノムDNAを投入(input)DNAとして利用して生成された配列分析データから、背景対立因子エラーの比率を示す。 図3Aに使用された断片化条件の細部条件、及びそれによって生成された断片の大きさを示す。 被検個体である患者の末梢血液白血球から得られた配列分析データを利用し、生殖細胞変異を除去し、背景対立因子エラーの比率分布マトリックスを生成した後、血漿内無細胞核酸から変異を検出する方法を示したフローチャートである。
一様相は、無細胞核酸から得られた配列分析データに係わる背景対立因子の頻度分布を生成する方法を提供する。
前記方法は、無細胞核酸から、染色体内1以上の位置に係わる第1配列分析データを得る段階と、細胞から分離された核酸から、前記染色体内1以上の位置に係わる第2配列分析データを得る段階と、第2配列分析データに基づいて、前記染色体内1以上の位置に係わる背景対立因子の頻度分布を生成する段階と、前記背景対立因子の頻度分布を、第1配列分析データに係わる背景対立因子の頻度分布として予測する段階と、を含むものでもある。
前記方法は、無細胞核酸から、染色体内1以上の位置に係わる第1配列分析データを得る段階と、細胞から分離された核酸から、前記染色体内1以上の位置に係わる第2配列分析データを得る段階と、を含むものでもある。前記方法は、細胞から分離された核酸、及び無細胞核酸から、染色体内1以上の位置に係わる配列分析データを得る段階を含むものでもある。前記第1配列分析データを得る段階、及び第2配列分析データを得る段階は、同時にまたは順次に遂行されるものでもある。
前述の「シーケンシング(sequencing)または配列分析」は、次世代配列分析(NGS:next generation sequencing)でもある。前記次世代配列分析は、大規模並列配列分析(massive parallel sequencing)または2世代配列分析(second-generation sequencing)と相互交換的に使用されるものでもある。前記NGSは、大量の断片の核酸を同時多発的に配列分析する技法であり、チップ(chip)基盤であり、重合酵素連鎖反応(PCR:polymerase chain reaction)基盤の対末端(paired end)形式で、全長遺伝体を切り、前記切片とに対して、混成化反応(hybridization)に基づいて、超高速で配列分析を行うものでもある。前記NGSは、NGS基盤の標的配列分析(targeted sequencing)、標的ディープ配列分析(targeted deep sequencing)またはパネル配列分析(panel sequencing)を含むものでもある。前記NGSは、例えば、454プラットホーム(Roche)、GS FLXチタン、Illumina MiSeq、Illumina HiSeq、Illumina HiSeq 2500、Illumina Genome Analyzer、Solexa platform、SOLiD System(Applied Biosystems)、Ion Proton(Life Technologies)、Complete Genomics、Helicos Biosciences Heliscope、Pacific Biosciencesの単一分子実時間(SMRTTM)技術、またはそれらの組み合わせによっても遂行される。
前記配列分析データは、前記シーケンシングまたは配列分析によって得られたデータを意味し、配列分析対象になる染色体内1以上の位置、または全ての位置に係わる、対立因子及びその頻度を含むものでもある。第1配列分析データは、無細胞核酸において、染色体内1以上の位置について得られた配列分析データを意味し、第2配列分析データは、細胞から分離された核酸において、染色体内1以上の位置について得られた配列分析データを意味する。前記配列分析データは、例えば、BAM(binary version of SAM)フォーマット及び/またはSAM(Sequence Alignment/Map)フォーマットのデータから得られたものでもある。当該のBAMフォーマット及び/またはSAMフォーマットは、一般的に短いリード(short reads)に係わるデータを敍述するフォーマットに利用されるものでもある。BAMフォーマット及び/またはSAMフォーマットのデータには、リード(read)の開始ポイント、リードの方向(direction)、マッピング(mapping)品質、整列(alignment)の次数を示すFLAG、CIGAR(compact idiosyncratic gapped alignment report)ストリングなどに係わるテキストデータが含まれる。多様な整列対を生成することにより、多様なサポーティングリード(supporting reads)を確保することができる。
前記核酸は、遺伝体(genome)、またはその断片でもある。用語「遺伝体(genome)」は、染色体、染色質または遺伝子の全体を意味する。前記核酸は、DNA(deoxyribonucleic acid)、RNA(ribonucleic acid)、またはそれらの組み合わせでもある。
前記細胞から分離された核酸は、細胞、または細胞株から分離された核酸でもある。前記細胞から分離された核酸は、血液、血清、尿、唾液、粘膜分泌物、喀痰、大便、涙、またはそれらの組み合わせに存在する細胞から分離されたものでもある。前記細胞から分離された核酸は、血球細胞、口腔上皮細胞、毛嚢細胞、皮膚線維芽細胞、またはそれらの組み合わせから分離されたものでもある。前記血球細胞は、例えば、白血球、具体的には、末梢血液白血球(PBL:peripheral blood leukocyte)、さらに具体的には、末梢血液単核球及び/または末梢血液リンパ球を含む末梢血液単核細胞(PBMC:peripheral blood mononuclear cell)、及び/または多形核白血球(PML:polymorphonuclear leukocyte)でもある。前記無細胞核酸(cell free nucleic acid)は、細胞で遊離された核酸でもある。前記無細胞核酸は、血液、血漿、血清、尿、唾液、粘膜分泌物、喀痰、大便、涙、またはそれらの組み合わせに存在するものでもある。前記無細胞核酸は、循環腫瘍核酸(ct nucleic acid:circulating tumor nucleic acid)でもある。前記無細胞核酸は、例えば、無細胞DNA(cf DNA:cell free DNA)でもある。核酸を抽出または分離する方法は、当業者に公知された方法によっても遂行される。
前記染色体内1以上の位置は、遺伝子変異が存在するか否かということを検出する染色体内位置(position)を意味する。前記染色体内位置は、例えば、変異が存在すると予測される位置であり、標的配列分析において、標的領域になるものでもある。染色体内1以上の位置に係わる配列分析データを得て、染色体内位置ごとに、対立因子、対立因子の頻度、及び対立因子の頻度分布を得ることができる。前記染色体内位置は、染色体番号、例えば、chr8:19,939,070−19,967,258または17p13.1のような形式で表記されるものでもある。
前記方法は、第2配列分析データに基づいて、前記染色体内1以上の位置に係わる背景対立因子の頻度分布を生成する段階を含むものでもある。前記方法は、細胞から分離された核酸から得られた配列分析データに基づいて、前記染色体内1以上の位置に係わる背景対立因子の頻度分布を生成する段階を含むものでもある。
前記背景対立因子(background allele)は、(1)参照遺伝体の対立因子ではないもの、(2)生殖細胞変異による対立因子ではないもの、及び/または(3)被検個体自身の遺伝子型ではないことでもある。前記背景対立因子は、背景対立因子エラーと相互交換的に使用されるものでもある。前記背景対立因子は、技術的なエラーによって誤って分析された塩基でもあり、例えば、配列分析を行うための全般的な過程で発生するエラーにより、誤って分析された塩基でもある。
前記背景対立因子頻度は、背景対立因子が検出される頻度、背景対立因子が発生する頻度、背景対立因子エラーの比率、または背景対立因子エラーが発生する比率を意味する。前記背景対立因子頻度分布は、背景対立因子が検出された頻度の最小及び最大を含む範囲を意味する。前記背景対立因子の比率は、各対立遺伝子の個数を計数することによって計算されるものでもある。
参照遺伝体データは、NCBI(National Center for Biotechnology Information)、GEO(Gene Expression Omnibus)、FDA(Food and Drug Administration)、My Cancer Genome、TCGA(The Cancer Genome Atlas)のような、当該技術分野においてすでに公知されたデータベースから獲得されるか、あるいは対照群、すなわち、正常人の生物学的サンプルから獲得されたものでもある。前記正常人は、特定疾病、例えば、腫瘍などが発見されていない健康人でもある。前記参照遺伝体は、ヒト参照遺伝体でもあり、hg18またはhg19でもある。
前記方法は、前記背景対立因子の頻度分布を、第1配列分析データに係わる背景対立因子の頻度分布として予測する段階を含むものでもある。前記段階は、細胞から分離された核酸から生成された背景対立因子の頻度分布を、無細胞核酸から得られた配列分析データに係わる背景対立因子の頻度分布として適用する段階を含むものでもある。図4は、被検個体である患者の末梢血液白血球から得られた配列分析データを利用し、生殖細胞変異を除去し、背景対立因子エラーの比率分布マトリックスを生成した後、血漿内無細胞核酸から変異を検出する方法を示したフローチャートである。従来、被検個体に由来する無細胞核酸から変異を検出する場合、対照群である正常人の核酸から得られた配列分析データに基づいて、染色体内1以上の位置に係わる背景対立因子の頻度分布を生成し、被検個体に由来する無細胞核酸から得られた配列分析データにおいて、任意の対立因子の頻度と、正常人の核酸から生成された背景対立因子の頻度との分布を比較し、それより大きい場合、前記対立因子は、有意味な変異であると決定し、そうではない場合、前記対立因子は、有意味な変異ではないと定めた。その場合、従来の被検個体が変異を有するか否かということを検出するために、対照群である正常人の核酸から得られた配列分析データが要求されたので、時間及びコストが追加して消耗された。しかし、生殖細胞変異を除去するために、被検個体に由来する細胞から分離された核酸から、配列分析データを得て変異を検出する過程が要求され、前記方法によれば、すでに得られた被検個体自身の細胞から分離された核酸から得られた配列分析データに基づいて、無細胞核酸から得られた配列分析データに係わる背景対立因子の頻度分布を生成することができるので、コスト及び時間を節約することができるという利点がある。
前記方法は、前記第2配列分析データを得る段階前、細胞から分離された核酸を断片化する段階を含むものでもある。前記断片化(fragmentation)は、遺伝体を、物理的、化学的、熱的、光的、超音波的または酵素的に切断するものでもある。例えば、前記化学的に切断するということは、制限酵素と反応させて切断するものでもある。前記超音波的に切断するということは、超音波を加えるものでもある。前記超音波的に切断するということは、約50Wないし約160W、約60Wないし約160W、約70Wないし約160W、約80Wないし約160W、約90Wないし約160W、または約100Wないし約150Wで超音波を加えるものでもある。前記超音波的に切断するということは、約10秒ないし約300秒、約20秒ないし約250秒、約20秒ないし約200秒、約30秒ないし約150秒、約40秒ないし約100秒、または約45秒ないし約90秒間超音波を加えるものでもある。
前記断片化は、遺伝体に、物理的、化学的、熱的、光的、超音波的または酵素的に加えるエネルギーを減少させながら切断するものでもある。前記エネルギーが、所定臨界値以上である場合、核酸断片の塩基対形成にあたり、プリン系(purine)塩基がプリン系塩基と塩基対を形成したり、ピリミジン系(primidine)塩基がピリミジン系塩基と塩基対を形成したりしてしまう。例えば、前記断片化に加えるエネルギーが過度である場合、グアニン(G)に酸化的損傷が起こり、チミン(T)に転換され、転換されたチミン(T)は、アデノシン(A)と塩基対を形成してしまう。そのような誤った塩基対が形成されることを防止するために、断片化に加えるエネルギーを低下させることにより、酸化的損傷を低減させることができる。断片化された核酸の大きさが200bp以上になるように、物理的、化学的、熱的、光的、超音波的または酵素的に加えるエネルギーを低下させながら切断する場合、酸化的損傷を低減させ、誤った塩基対の形成を防止することができる。その結果、無細胞核酸から得られた配列分析データに係わる背景対立因子の頻度分布と、細胞から分離された核酸から得られた配列分析データに係わる背景対立因子の頻度分布とが類似した様相を示し、細胞から分離された核酸から得られた配列分析データに係わる背景対立因子の頻度分布を、無細胞核酸から得られた配列分析データに係わる背景対立因子の頻度分布として予測して適用することができる。
前記方法は、断片化された核酸の大きさを選別する段階をさらに含むものでもある。前記断片化された核酸の大きさは、200bp以上のものでもある。前記断片化された核酸の大きさは、200bp以上、250bp以上、300bp以上、310bp以上、320bp以上、330bp以上、340bp以上、350bp以上、360bp以上、370bp以上、380bp以上、390bp以上、400bp以上、410bp以上、420bp以上、430bp以上、440bp以上、450bp以上、460bp以上、470bp以上、480bp以上、490bp以上または500bp以上のものでもある。無細胞核酸の大きさは、一般的に、150ないし200bpであるが、細胞から分離された断片化された核酸の大きさは、200bp以上のものでもあり、例えば、無細胞核酸の大きさより大きいものでもある。
前記細胞から分離された核酸、及び無細胞核酸は、同一個体または異なる個体に由来するものでもある。前述のように、無細胞核酸から得られた配列分析データに係わる背景対立因子の頻度分布は、被検個体自身、または同一種(species)に属する他個体の核酸から得られた配列分析データに基づいて生成されたものでもある。前記個体は、疾患を有している個体、腫瘍を有している個体、正常人、またはそれらの組み合わせでもある。前記個体は、ヒト、牛、馬、豚、羊、山羊、犬、猫及び齧歯 類を含んだ哺乳類でもある。
他の様相は、前記方法による無細胞核酸から得られた配列分析データに係わる背景対立因子の頻度分布マトリックスを提供する。前記背景対立因子の頻度分布マトリックスは、配列分析対象になる染色体内1以上の位置、または全ての位置に係わる対立因子、対立因子の頻度、及び対立因子の頻度分布を統合的に示すものでもある。
他の様相は、無細胞核酸から変異を検出する方法を提供する。
前記方法は、無細胞核酸から、染色体内1以上の位置に係わる第1配列分析データを得る段階と、細胞から分離された核酸から、前記染色体内1以上の位置に係わる第2配列分析データを得る段階と、第2配列分析データに基づいて、前記染色体内1以上の位置に係わる背景対立因子の頻度分布を生成する段階と、前記第1配列分析データにおいて、前記染色体内1以上の位置に係わる任意の対立因子の頻度と、それと対応する位置に係わる前記背景対立因子の頻度との分布を比較し、変異を検出する段階と、を含むものでもある。
前記無細胞核酸から、染色体内1以上の位置に係わる第1配列分析データを得る段階と、細胞から分離された核酸から、前記染色体内1以上の位置に係わる第2配列分析データを得る段階と、第2配列分析データに基づいて、前記染色体内1以上の位置に係わる背景対立因子の頻度分布を生成する段階と、については、前述の通りである。
前記変異は、染色体の構造的変異(structure variation)であり、遺伝子変異を意味し、共通変異(common and/or polygenic variant)、まれな変異(rare variant)、またはそれらの組み合わせを含むものでもある。前記遺伝子変異は、疾患の危険度、または疾患の誘発性について説明する指標またはマーカーにもなる。前記まれな変異は、変異を示す対立因子の頻度が、5%以下、4.5%以下、4%以下、3.5%以下、3%以下、2.5%以下、2%以下、1.5%以下、1%以下、0.9%以下、0.8%以下、0.7%以下、0.6%以下、0.5%以下、0.4%以下、0.2%以下、0.1%以下、0.09%以下、0.08%以下、0.07%以下、0.06%以下、0.05%以下、0.04%以下、0.03%以下、0.02%以下または0.01%以下の変異を意味するものでもある。
前記変異は、塩基、ヌクレオチド、ポリヌクレオチドまたは核酸の変更(alteration)を含むものでもあり、塩基、ヌクレオチド、ポリヌクレオチドまたは核酸の、置換(substitution)、挿入(insertion)、重複(duplication)、欠失(deletion)(挿入及び欠失を「InDel(insertion and deletion)」とする)などを含むものでもある。前記変異は、単一ヌクレオチド変異(SNV:single nucleotide variant)、単一ヌクレオチド多形成(SNP:single nucleotide polymorphism)、またはそれらの組み合わせでもある。
前記方法は、前記第1配列分析データにおいて、前記染色体内1以上の位置に係わる任意の対立因子の頻度と、それと対応する位置に係わる前記背景対立因子の頻度との分布を比較し、変異を検出する段階を含むものでもある。
前記方法は、前記第1配列分析データにおいて、前記染色体内1以上の位置に係わる任意の対立因子の頻度が、それと対応する位置に係わる前記背景対立因子の頻度の分布より大きい場合、前記対立因子は、有意味な変異であると決定し、前記第1配列分析データにおいて、前記染色体内1以上の位置に係わる任意の対立因子の頻度が、それと対応する位置に係わる前記背景対立因子の頻度の分布より小さいか、あるいはそれと同じである場合、前記対立因子は、有意味な変異ではないと決定する段階を含むものでもある。
すなわち、前記無細胞核酸から得られた配列分析データにおいて、前記染色体内1以上の位置に係わる任意の対立因子の頻度が、細胞から分離された核酸から得られた配列分析データにおいて、それと対応する位置に係わる背景対立因子の頻度分布より大きい場合、前記対立因子は、有意味な変異であると決定し、そうではない場合、前記対立因子は、有意味な変異ではないと決定する段階を含むものでもある。前記方法によれば、無細胞核酸から得られた配列分析データにおいて、前記染色体内1以上の位置に係わる任意の対立因子の頻度が有意味な変異であるか、あるいはエラーであるかということを正確に区分することができる。
一様相による、無細胞核酸から得られた配列分析データに係わる背景対立因子の頻度分布を生成する方法、及び前記無細胞核酸から変異を検出する方法は、個人誂え診断、または治療する方法、または精密治療する方法にも使用される。具体的には、本明細書は、前記方法により、背景対立因子の頻度分布を生成するか、あるいは核酸変異を検出した後、検出された変異の種類により、個人誂え診断を行うか、あるいは治療(例えば、精密治療)を行う段階をさらに含む個人誂え診断、または治療する方法、または精密治療する方法を追加して提供する。
他の様相は、無細胞核酸から得られた配列分析データに係わる背景対立因子の頻度分布を生成する装置を提供する。
前記装置は、メモリとプロセッサとを含む。
前記メモリは、コンピュータ装置内で処理されるデータ、及び処理が完了した結果を保存するためのハードウェアであり、RAM(random access memory)、ROM(read-only memory)のようなメモリチップ、またはHDD(hard disk drive)、SSD(solid state drive)などのストレージを含む。すなわち、該メモリは、プロセッサによって得られた第1配列分析データ、第2配列分析データ、背景対立因子の頻度分布データを保存することができる。
前記プロセッサは、無細胞核酸から、染色体内1以上の位置に係わる第1配列分析データを得るように構成された第1収得部と、細胞から分離された核酸から、前記染色体内1以上の位置に係わる第2配列分析データを得るように構成された第2収得部と、第2配列分析データに基づいて、前記染色体内1以上の位置に係わる背景対立因子の頻度分布を生成するように構成された生成部と、前記背景対立因子の頻度分布を、第1配列分析データに係わる背景対立因子の頻度分布として予測するように構成された予測部と、を含んでもよい。
前記プロセッサの収得部は、シーケンシングまたは配列分析装置から得られるものでもある。
また、前記プロセッサの遂行は、前述の方法のように遂行される。
前記プロセッサは、1以上のプロセッシングユニットによって具現されたモジュールであり、多数の論理ゲートのアレイを有するマイクロプロセッサと、該マイクロプロセッサによって実行されるプログラムが保存されたメモリモジュールとの組み合わせによっても具現される。該プロセッサは、応用プログラムのモジュール形態にも具現される。
他の様相は、無細胞核酸から変異を検出する装置を提供する。
前記装置は、メモリとプロセッサとを含む。
前記メモリについては、前述の通りである。
前記プロセッサは、無細胞核酸から、染色体内1以上の位置に係わる第1配列分析データを得るように構成された第1収得部と、細胞から分離された核酸から、前記染色体内1以上の位置に係わる第2配列分析データを得るように構成された第2収得部と、第2配列分析データに基づいて、前記染色体内1以上の位置に係わる背景対立因子の頻度分布を生成するように構成された生成部と、前記第1配列分析データにおいて、前記染色体内1以上の位置に係わる任意の対立因子の頻度と、それと対応する位置に係わる前記背景対立因子の頻度との分布を比較し、変異を検出するように構成された検出部と、を含むものでもある。
以下、本発明を実施例を介して、さらに詳細に説明する。しかし、それら実施例は、本発明について例示的に説明するためのものであり、本発明の範囲は、それら実施例に限定されるものではない。
実施例1.無細胞核酸から得られた配列分析データに係わる背景対立因子の頻度分布の生成
1.細胞から分離された核酸、及び無細胞核酸から得られた配列分析データに係わる背景対立因子の頻度分布の生成及び比較
(1)血漿及び末梢血液リンパ球(PBL:peripheral blood lymphocytes)収集及びDNA抽出
健康な正常人2人及び膵臓癌患者17人から血液を採取した。血液試料を、無細胞DNATM BCTチューブ(Streck Inc.,Omaha,NE,米国)に収集した。収集された血液試料は、採取6時間以内に、25℃で、840gで10分間、1,040gで10分間、続いて、5,000gで10分間、3段階で遠心分離した。末梢血液リンパ球(PBL:peripheral blood lymphocytes)は、遠心分離1段階で得た。血漿は、遠心分離各段階ごとに新たなチューブに移した。血漿試料及びPBL試料は、無細胞DNA(cfDNA:cell free DNA)を抽出するまで−80℃で保管した。
生殖細胞DNA(germline DNA)は、QIAamp DNAミニプレップキット(Qiagen,Santa Clarita,CA,米国)を利用し、末梢血液単核細胞(PBMC:peripheral blood mononuclear cell)から分離された。循環DNAは、QIAamp循環核酸キットKit(Qiagen)を利用し、1ないし5mlの血漿から分離した。DNAの濃度と純度は、Qubit 2.0蛍光光度計(Life Technologies,Grand Island,NY,米国)と、Qubit dsDNA HS分析キット及びBR分析キット(Thermo Fisher Scientific,Waltham,MA,米国)とを利用し、PicoGreen蛍光分析法で分析した。DNAの濃度と純度は、ナノドロップ8000 UV−Vis分光器(Thermo Fisher Scientific)及びPicogreen蛍光分析法を利用して定量した。断片の大きさ分布は、2200 TapeStation Instrument(Agilent Technologies,Santa Clara,CA,米国)及びリアルタイム重合酵素連鎖反応(real-time PCR)Mx3005p(Agilent Technologies)を利用し、製造社の指示に従って測定した。
(2)ライブラリー制作
PBL試料中のゲノムDNAは、Covaris S220(Covaris Inc.Woburn,MA,米国)を、製造社の指示に従って使用し、衝撃係数(duty factor)10%、ピーク入射電力(peak incident power)175W、200回/burstの条件で、6分間超音波を加えた。血漿試料中にあるDNAは、断片化されていないものを使用した。
配列分析ライブラリーを制作するために、PBL DNA試料は、200ng、血漿DNA試料は、37.30ngを利用した。PBL DNA試料及び血漿DNA試料のライブラリーは、KAPA Hyperプレップキット(Kapa Biosystems,Woburn,MA,米国)を利用して制作した。各DNAに対し、製造社の指示により、末端修繕(end-repair)、アデノシンテイリング(A tailing)及びアダプダリゲーション(adapter ligation)の過程を遂行し、重合酵素連鎖反応で増幅した。このとき、各過程を終え、AMPureビード(Beckman Coulter,Indiana,米国)を利用し、精製過程を遂行した。アダプダリゲーションは、あらかじめ標識化された(pre-indexed)PentAdapterTM(PentaBase ApS,Denmark)を利用し、4℃で一晩遂行した。
(3)標的領域増幅、配列分析及び配列分析データ加工
下記表1に記載された83種の腫瘍と関連ある遺伝子のエクソンを含み、およそ〜499kbのヒトゲノムを標的にするRNAベイト(bait)プールを制作した。8種の精製されたライブラリーを集め(pooling)、最終的に750ngに調整し、混成化選別反応(hybrid selection reaction)に使用した。標的領域は、あらかじめ標識化された(pre-indexed)アダプダに対して、ブロッキングオリゴヌクレオチドを、IDTxGenブロッキングオリゴヌクレオチド(IDT,Santa Clara,CA,米国)で代替する変形を有するSureSelectベイト混成化プロトコルにより、標的濃縮(target enrichment)した。
該標的領域を濃縮した後、キャプチャDNA断片を、P5及びP7のオリゴヌクレオチドを使用し、PCR反応を介して増幅した。増幅されたライブラリーは、AMPureビードに精製し、dsDNA HS分析キットとQubit 2.0蛍光光度計とを利用し、PicoGreen蛍光分析法で定量した。断片の大きさ分布は、2100Bioanalyzer(Agilent Technologies)を利用して分析した。DNA濃度及び平均断片サイズに基づいて、ライブラリーを2nMの濃度になるように標準化させ、同一体積に合わせた。0.2NのNaOHを利用し、DNAを変性させた後、変性されたライブラリーを混成化バッファ(Illumina,SanDiego,CA,米国)に希釈し、20pMになるようにした。変性されたテンプレートは、製造社(Illumina)の指示に従り、クラスタ増幅(cluster amplification)した。フローセル(flow cells)を、HiSeq 2500 v3 Sequencing-by-Synthesisキット(Illumina)を利用し、100bpの対・末端モードで配列分析し、RTAソフトウェア(v.1.12.4.2以上)を使用して分析した。BWA−mem(v0.7.5)を使用し、全ての原データを、hg19ヒト参照遺伝体に整列させ、BAMファイルを生成した。SAMTOOLS(v0.1.18)、Picard(v1.93)及びGATK(v3.1.1)を使用し、SAM/BAMファイルを分類し、ローカル再整列(local realignment)を行い、重複を表示した。前記加工過程を介して、重複、不一致対、及び標的から脱したリードを除去した。
Figure 0006980907
血漿DNA試料及びPBL DNA試料で生成された総リードの平均は、それぞれ56.3x10及び2,000x10個であった。また、血漿DNA試料及びPBL DNA試料において、リード整列の比率(alignment rate)は、それぞれ87.3%及び93.7%であった。配列分析データからPCR複製を除外した後、血漿DNA試料及びPBL DNA試料において、デプスの平均は、それぞれ1,964x(1,210−3,069x)及び1,717x(1,042−2,361x)であった。
(4)配列分析データからの、標的領域内位置における背景対立因子(background allele)確認
PBL DNA試料と血漿DNA試料との1セットに対し、次の条件が満足される場合、全体標的領域内位置での塩基を、背景対立因子と決定した:(1)塩基は、参照遺伝体の対立因子ではないこと、(2)1対のPBL DNA試料及び血漿DNA試料において、前記位置は、十分なデプスのカバレージを有すること(>500x)、(3)PBL DNA試料及び血漿DNA試料における塩基の頻度は、生殖細胞変異を示さないこと(<5%)。癌患者の試料を使用したので、体細胞腫瘍変異に係わる対立因子候補を除去した。前記除去過程は、癌患者が治療を始める前、癌患者から血液を採取する時点と近いとき、癌患者から得られた細針吸引(FNA:fine-needle aspiration)生検結果とマッチングする配列分析データを生成して遂行した。原発腫瘍(primary tumor)に係わる配列分析ライブラリーを制作するために、原発腫瘍投入(input)DNAは、200ngを利用し、(3)において述べたように、HiSeq 2500を使用して分析した。FNA試料からの重複除去後、FNA DNA試料のデプスは、平均987.15(790.32−1476.55x)であった。PBL DNA試料及び血漿DNA試料セットにおいて、FNA DNA試料の配列分析結果、1)当該位置でのデプスが250x以下である場合、その位置を除き、2)対立因子が2.5%より高い頻度で存在する場合、その対立因子を除いた。
(5)背景対立因子の塩基品質点数分析
腫瘍由来単一ヌクレオチド変異(SNV:single nucleotide variant)及び生殖細胞単一ヌクレオチド多形成(SNV:single nucleotide polymorphisms)を除いた後、非参照背景対立因子のフレッド(Phred)塩基品質点数を分析して配列分析を行う間に発生する背景対立因子エラーを分析した。
図1Aは、PBL DNA試料及び血漿DNA試料において、背景対立因子の塩基、及び全体対立因子の塩基それぞれのフレッド(Phred)塩基品質点数に係わる分布を示す。図1Bは、品質点数30未満の塩基を除去した後、PBL DNA試料において、参照対立因子の塩基、及び背景対立因子の塩基それぞれに係わる塩基品質点数分布を示す。図1Cは、品質点数30未満の塩基を除去した後、血漿DNA試料において、参照対立因子の塩基、及び背景対立因子の塩基それぞれに係わる塩基品質点数分布を示す。図1Aないし図1Cに示されているように、ほとんどの背景対立因子は、20未満塩基品質点数を示したが、少数の背景対立因子は、参照対立因子と区別することができないほどの塩基品質点数を示した。原配列分析データ(raw sequencing data)において、PBL DNA試料及び血漿DNA試料セットにおいて、塩基品質点数が30以上である塩基の比率は、それぞれ87±3.3%及び87±2.5%であった(平均±SD)。塩基品質点数が30未満である塩基を除いた結果、全般的な塩基品質点数の分布は、対立対立因子と参照対立因子との間において、有意な違いを示していない。ただし、A>C及びT>Gの転換によるC及びGの塩基品質点数は、若干の違いを示した。そのような結果は、背景対立因子エラーは、配列分析を行う間に発生するエラー以外の他要因によって発生しうるということを意味する。
(6)背景対立因子エラーの様相分析
(5)で説明した通り、塩基品質点数が30未満である塩基を除き、配列分析を行う間に発生するエラーを除いて分析した。
19対の血漿DNA試料及びPBL DNA試料に対し、全体標的領域にわたる背景対立因子の頻度を計算した。図2Aは、19個の血漿DNA試料、及び19個のPBL DNA試料において、背景対立因子の頻度、すなわち、試料別平均背景対立因子エラーの比率を示す。図2Aに示されているように、血漿DNA試料及びPBL DNA試料において、試料別平均背景対立因子の頻度は、それぞれ0.007%及び0.008%であった。図2Bは、血漿DNA試料及びPBL DNA試料において、背景対立因子エラーがない位置(error-free position)の比率を示す。図2Bに示されているように、全体標的領域にわたり、血漿DNA試料及びPBL DNA試料において、エラーがない位置の比率は、それぞれ77.2±1.4%及び78.7±1.0%であった(平均±SD)。図2Cは、血漿DNA試料及びPBL DNA試料において、12種の塩基置換について、背景対立因子が発生する頻度分布を示す。y軸は、前処理されたPBL DNA試料及び血漿DNA試料において、各塩基置換が発生する背景対立因子の頻度を示す。図2D及び図2Eは、血漿DNA試料及びPBL DNA試料において、12種の塩基置換について、背景対立因子エラーの比率を示す。図2Cないし図2Eに示されているように、血漿DNA試料及びPBL DNA試料において、C:G>A:Tヌクレオチド置換は、明確な違いを示した。特に、全てのヌクレオチド置換において、C:G>A:TとC:G>G:Cとの転換エラーは、PBL DNA試料において、血漿DNA試料に比べて有意に増加した。
2.細胞から分離された核酸の断片化条件の変更、及び核酸の断片化条件が背景対立因子エラーの比率に及ぼす影響の確認
DNA断片化が、背景対立因子エラーの比率に影響を及ぼす否かということを確認するために、DNA断片化段階において、エネルギーを加える強度(intensity)及び/または時間(duration)を多様に調節したことを除き、1で述べたように、背景対立因子エラーの比率を分析した。具体的な断片化条件は、下記表の通りである。
Figure 0006980907
図3Aは、多様な断片化条件で、ゲノムDNAを断片化させ、前記断片化されたゲノムDNAを、投入(input)DNAとして利用して生成された配列分析データから、背景対立因子エラーの比率を示す。図3Bは、図3Aに使用された断片化条件の細部条件、及びそれによって生成された断片の大きさを示す。図3Aに示されているように、断片化時、相対的に低いエネルギーを加えるほど、PBL DNA試料において、C:G>A:T及びC:G>G:Cの転換比率が低下し、血漿DNA試料のC:G>A:T及びC:G>G:Cの転換比率と類似したレベルに逹した。図3Bに示されているように、断片化時、相対的に低いエネルギーを加えるほど、投入DNAの大きさは、増大した。ただし、配列分析のために挿入されたDNAの大きさは、投入DNAの大きさが増大した程度に比べ、増大した程度が小さかった。
すなわち、DNA断片化過程は、損傷を誘発し、C:G>A:T及びC:G>G:Cの転換を誘発しうるが、細胞から分離された核酸の断片化に消耗さえるエネルギーを低減させることにより、背景対立因子エラーが発生する比率を低下させ、細胞から分離された核酸と無細胞核酸とから、背景対立因子の頻度分布を類似して生成することができる。それを介して、正常人の核酸から得られた配列分析データを利用せずに、まれな変異を正確に検出することができると判断される。
以上、本発明について、その望ましい実施例を中心に説明した。本発明が属する技術分野において当業者であるならば、本発明の本質的な特性から外れない範囲で変形された形態に具現されるということを理解することができるであろう。従って、開示された実施例は、限定的な観点ではなく、説明的な観点から考慮されなければならない。本発明の範囲は、前述の説明ではなく、特許請求の範囲に示されており、それと同等な範囲内にある全ての差異は、本発明に含まれるものと解釈されなければならないのである。

Claims (11)

  1. 無細胞核酸から得られた配列分析データに係わる背景対立因子の頻度分布を生成する方法であって、
    無細胞核酸から、染色体内1以上の位置に係わる第1配列分析データを得る段階と、
    細胞から分離された核酸から、前記染色体内1以上の位置に係わる第2配列分析データを得る段階と、
    第2配列分析データに基づいて、前記染色体内1以上の位置に係わる背景対立因子の頻度分布を生成する段階と、
    前記背景対立因子の頻度分布を、第1配列分析データに係わる背景対立因子の頻度分布として予測する段階と、を含み、
    前記背景対立因子は、(1)参照遺伝体の対立因子ではないもの、(2)生殖細胞変異による対立因子ではないもの、または(3)被検個体自身の遺伝子型ではないものである、方法。
  2. 前記第2配列分析データを得る段階前に、細胞から分離された核酸を断片化することを含む、請求項1に記載の方法。
  3. 前記断片化することは、細胞から分離された核酸を、物理的、化学的、熱的、光的、超音波的または酵素的に切断することである、請求項2に記載の方法。
  4. 前記超音波的に切断することは、50ないし160Wで、10秒ないし300秒間、超音波を加えることである、請求項3に記載の方法。
  5. 断片化された核酸の大きさは、200bp以上である、請求項2に記載の方法。
  6. 細胞から分離された核酸、及び無細胞核酸は、同一被検個体または異なる被検個体に由来するものである、請求項1に記載の方法。
  7. 前記細胞から分離された核酸は、血球細胞、口腔上皮細胞、毛嚢細胞、皮膚線維芽細胞、またはそれらの組み合わせから分離されたものである、請求項1に記載の方法。
  8. 前記無細胞核酸は、血液、血漿、血清、尿、唾液、粘膜分泌物、喀痰、大便、涙、またはそれらの組み合わせに存在するものである、請求項1に記載の方法。
  9. 前記無細胞核酸は、循環腫瘍核酸である、請求項1に記載の方法。
  10. 無細胞核酸から変異を検出する方法であって、
    無細胞核酸から、染色体内1以上の位置に係わる第1配列分析データを得る段階と、
    細胞から分離された核酸から、前記染色体内1以上の位置に係わる第2配列分析データを得る段階と、
    第2配列分析データに基づいて、前記染色体内1以上の位置に係わる背景対立因子の頻度分布を生成する段階と、
    前記第1配列分析データにおける前記染色体内1以上の位置に係わる任意の対立因子の頻度と、それと対応する位置に係わる前記背景対立因子の頻度分布とを比較し、変異を検出する段階と、を含む、無細胞核酸から変異を検出する方法。
  11. 前記第1配列分析データにおける前記染色体内1以上の位置に係わる任意の対立因子の頻度が、それと対応する位置に係わる前記背景対立因子の頻度分布より大きい場合、前記対立因子は、有意な変異であると決定し、
    前記第1配列分析データにおける前記染色体内1以上の位置に係わる任意の対立因子の頻度が、それと対応する位置に係わる前記背景対立因子の頻度分布より小さいか、あるいはそれと同じである場合、前記対立因子は、有意な変異ではないと決定する段階を含む、請求項10に記載の方法。
JP2020515641A 2017-05-24 2018-04-17 無細胞核酸から得られた配列分析データに係わる背景対立因子の頻度分布を生成する方法、及びそれを利用して無細胞核酸から変異を検出する方法 Active JP6980907B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2017-0064387 2017-05-24
KR1020170064387A KR102145417B1 (ko) 2017-05-24 2017-05-24 무세포 핵산으로부터 수득된 서열 분석 데이터에 대한 배경 대립인자의 빈도 분포를 생성하는 방법 및 이를 이용하여 무세포 핵산으로부터 변이를 검출하는 방법
PCT/KR2018/004405 WO2018216905A2 (ko) 2017-05-24 2018-04-17 무세포 핵산으로부터 수득된 서열 분석 데이터에 대한 배경 대립인자의 빈도 분포를 생성하는 방법 및 이를 이용하여 무세포 핵산으로부터 변이를 검출하는 방법

Publications (2)

Publication Number Publication Date
JP2020520679A JP2020520679A (ja) 2020-07-16
JP6980907B2 true JP6980907B2 (ja) 2021-12-15

Family

ID=64396671

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020515641A Active JP6980907B2 (ja) 2017-05-24 2018-04-17 無細胞核酸から得られた配列分析データに係わる背景対立因子の頻度分布を生成する方法、及びそれを利用して無細胞核酸から変異を検出する方法

Country Status (5)

Country Link
US (1) US20210174897A1 (ja)
JP (1) JP6980907B2 (ja)
KR (1) KR102145417B1 (ja)
CN (1) CN110870017B (ja)
WO (1) WO2018216905A2 (ja)

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5854464B2 (ja) * 2009-10-16 2016-02-09 国立研究開発法人理化学研究所 メチル化dna結合ペプチド
FI3783110T3 (fi) * 2009-11-05 2023-03-02 Fetaalisen genomin analyysi maternaalisesta biologisesta näytteestä
CN105243295B (zh) * 2010-11-30 2018-08-17 香港中文大学 与癌症相关的遗传或分子畸变的检测
SI3078752T1 (sl) * 2011-04-12 2018-12-31 Verinata Health, Inc Razreševanje frakcij genoma z uporabo števila polimorfizmov
US10424394B2 (en) * 2011-10-06 2019-09-24 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US11261494B2 (en) * 2012-06-21 2022-03-01 The Chinese University Of Hong Kong Method of measuring a fractional concentration of tumor DNA
IL269097B2 (en) * 2012-09-04 2024-01-01 Guardant Health Inc Systems and methods for detecting rare mutations and changes in number of copies
CN105518151B (zh) * 2013-03-15 2021-05-25 莱兰斯坦福初级大学评议会 循环核酸肿瘤标志物的鉴别和用途
US9116866B2 (en) * 2013-08-21 2015-08-25 Seven Bridges Genomics Inc. Methods and systems for detecting sequence variants
RU2717641C2 (ru) * 2014-04-21 2020-03-24 Натера, Инк. Обнаружение мутаций и плоидности в хромосомных сегментах
CN109476731A (zh) * 2016-02-29 2019-03-15 基础医药有限公司 治疗癌症的方法
JP7457457B2 (ja) * 2016-05-16 2024-03-28 ナノストリング テクノロジーズ,インコーポレイティド サンプル中の標的核酸を検出する方法

Also Published As

Publication number Publication date
KR102145417B1 (ko) 2020-08-19
CN110870017B (zh) 2023-09-08
WO2018216905A2 (ko) 2018-11-29
WO2018216905A3 (ko) 2019-01-03
US20210174897A1 (en) 2021-06-10
JP2020520679A (ja) 2020-07-16
CN110870017A (zh) 2020-03-06
KR20180128801A (ko) 2018-12-04

Similar Documents

Publication Publication Date Title
US11773453B2 (en) Systems and methods to detect rare mutations and copy number variation
CN107708556B (zh) 诊断方法
CN114574581A (zh) 检测稀有突变和拷贝数变异的系统和方法
US20210238668A1 (en) Biterminal dna fragment types in cell-free samples and uses thereof
JP2020521216A (ja) 挿入および欠失を検出するための方法およびシステム
US20240029890A1 (en) Computational modeling of loss of function based on allelic frequency
JP6980907B2 (ja) 無細胞核酸から得られた配列分析データに係わる背景対立因子の頻度分布を生成する方法、及びそれを利用して無細胞核酸から変異を検出する方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210216

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210514

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210608

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211102

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211117

R150 Certificate of patent or registration of utility model

Ref document number: 6980907

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150