JP6983307B2 - 遺伝子パネルに基づいた塩基配列の変異検出方法およびこれを用いた塩基配列の変異検出デバイス - Google Patents

遺伝子パネルに基づいた塩基配列の変異検出方法およびこれを用いた塩基配列の変異検出デバイス Download PDF

Info

Publication number
JP6983307B2
JP6983307B2 JP2020506731A JP2020506731A JP6983307B2 JP 6983307 B2 JP6983307 B2 JP 6983307B2 JP 2020506731 A JP2020506731 A JP 2020506731A JP 2020506731 A JP2020506731 A JP 2020506731A JP 6983307 B2 JP6983307 B2 JP 6983307B2
Authority
JP
Japan
Prior art keywords
mutation
base sequence
analysis
base
locus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020506731A
Other languages
English (en)
Other versions
JP2020529851A (ja
Inventor
キム,サンウ
キム,ジュンホ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industry Academic Cooperation Foundation of Yonsei University
University Industry Foundation UIF of Yonsei University
Original Assignee
Industry Academic Cooperation Foundation of Yonsei University
University Industry Foundation UIF of Yonsei University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industry Academic Cooperation Foundation of Yonsei University, University Industry Foundation UIF of Yonsei University filed Critical Industry Academic Cooperation Foundation of Yonsei University
Publication of JP2020529851A publication Critical patent/JP2020529851A/ja
Application granted granted Critical
Publication of JP6983307B2 publication Critical patent/JP6983307B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Analytical Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Immunology (AREA)
  • Software Systems (AREA)
  • Microbiology (AREA)
  • General Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Public Health (AREA)
  • Pure & Applied Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Epidemiology (AREA)

Description

本発明は、遺伝子パネルに基づいた塩基配列の変異検出方法およびこれを用いた塩基配列の変異検出デバイスに関するものである。
遺伝子パネル(gene panel)は複数個の目的遺伝子に対する突然変異が一つのパネルに構成された、遺伝子変異検査方法であって、疾患の診断または治療に関連して活用できる。このような遺伝子パネルを用いて次世代塩基配列分析(NGS、next generation sequencing)に基づいて遺伝子変異を検出することができる。
次世代塩基配列分析技術は、多数の塩基配列分析結果物を算出することができる高処理量塩基配列分析法(high−throughput sequencing)である。このような高い密度の並行塩基配列分析(parallel sequencing)は遺伝子パネルと共に、効果的な塩基配列変異検出に使用できる。
しかし、同一な遺伝子パネルを用いても、次世代塩基配列分析のプラットフォーム、さらには塩基配列分析データの分析方法によって検出可能な塩基配列変異頻度の範囲は異なることがある。また、ライブラリー製作のための重合酵素連鎖反応途中に発生する偏向現象によって、1%以下の低い比率の塩基配列変異を有する遺伝子は、次世代塩基配列分析段階で99%以上の正常遺伝子で現れた偽陽性(false positive)に遮られて検出が難しいこともある。
これにより、遺伝子パネルに適用可能であり、疾患に関連した低頻度の突然変異を敏感度高く検出することができる、新たな塩基配列の変異検出方法が要求されているのが実情である。
発明の背景になる技術は、本発明に対する理解をより容易にするために作成された。発明の背景になる技術に記載された事項が先行技術として存在すると認めることと理解されてはいけない。
本発明の研究者らは、遺伝子パネルに適用される次世代塩基配列分析方法の問題点を解決するために同一な遺伝子座を数回読む、デプス(depth)を高める方法を提案した。これを通じて、研究者らは、低頻度の塩基配列変異検出の限界数値を高めようとしたが、これによって偽陽性比率(false positive rate)、即ち、検出のための分析のエラーも共に増加するということを認知した。
特に、遺伝子パネルを用いて癌に関連した塩基配列の変異を探索しようとする時、敏感度高く塩基配列変異を検出することによって正確な情報を獲得することは癌の治療、特に効果的な抗ガン剤の選定において重要なものであり得る。癌は多様なゲノム変異を同伴することがあり、ゲノム変異のうちの体細胞突然変異(somatic mutation)は癌の発生または癌の進行に影響を与えることがある。このような体細胞突然変異は胚性突然変異(germline mutation)と異なり、その発現比率が1%未満である場合も多いため突然変異を探し出すのに困難が多い。さらに、同一な癌を有する患者でも、患者らそれぞれは異なるゲノム突然変異を有していることがある。このような理由で、敏感度および正確度高く突然変異を検出する方法、特に、遺伝子パネルに適用可能な新たな突然変異検出方法に対する開発は持続的に要求された。
一方、本発明の発明者らは、レプリケート(replicate)を用いて突然変異確率値を補正することによって偽陽性比率を減らし、敏感度高い低頻度の突然変異検出が可能な塩基配列の変異検出方法を提供することができるのを認識した。その結果、本発明の発明者らは、以上の検出方法を遺伝子パネルに適用することによって、疾患に関連した低頻度の突然変異を敏感度高く検出することができる、新たな塩基配列の変異検出方法を発明した。
よって、本発明の解決しようとする課題は、遺伝子パネルが提供する目的遺伝子に対するプローブを用いて、一つの対象サンプルに対して目的遺伝子を獲得し、これを複数回塩基配列分析して獲得した複数個の塩基配列の統計的分析によって補正された、突然変異確率値を提供することによって、分析のエラーを減らして低頻度塩基配列の変異を検出することができる、塩基配列の変異検出方法およびこれを用いたデバイスを提供することである。
また、本発明の発明者らは、遺伝子パネルに適用可能であり敏感度が向上した塩基配列変異検出方法を提供することによって、疾患に関連した新たな低頻度の突然変異も探索することができるのを認識した。
よって、本発明の解決しようとする他の課題は、本発明の一実施形態による塩基配列の変異検出方法で決定された、塩基配列変異候補と疾患に関連した塩基配列変異をマッチングし、これに対する一致有無の情報をさらに提供する塩基配列の変異検出方法およびこれを用いたデバイスを提供することである。
本発明の課題は以上で言及した課題に制限されず、言及されていないまた他の課題は以下の記載から当業者に明確に理解されるはずである。
前述のような課題を解決するために、本発明の一実施形態による塩基配列の変異検出方法は、複数の目的遺伝子に対するプローブ(probe)を含む遺伝子パネル(gene panel)を用いて、一つの対象サンプルに対して複数の目的遺伝子を獲得する段階、次世代塩基配列分析(NGS、next generation sequencing)を用いて、複数の目的遺伝子それぞれを複数回塩基配列分析して、複数の目的遺伝子それぞれに対する同一な塩基配列または同一でない塩基配列を含む、複数個の塩基配列を収集する段階、参照塩基配列と複数個の塩基配列をマッチング(matching)する段階、複数個の塩基配列のうち、複数の目的遺伝子に対して参照塩基配列とマッチングされない塩基配列を決定する段階、およびマッチングされない塩基配列の統計的分析によって補正された算出方式で算出された、マッチングされない塩基配列内の一致しない遺伝子座(locus)に対する突然変異確率値に基づいて、対象サンプル内の複数の目的遺伝子に対する塩基配列変異候補を決定する段階を含む。
本発明の他の特徴によれば、予め決定された塩基配列変異を獲得する段階、および塩基配列変異候補と予め決定された塩基配列変異をマッチングすることによって、塩基配列変異候補と前記予め決定された塩基配列変異の一致有無の情報を提供する段階をさらに含むことができる。
本発明のまた他の特徴によれば、塩基配列変異候補が予め決定された塩基配列変異と異なり、塩基配列変異候補の遺伝子座が予め決定された塩基配列変異の遺伝子座と異なる場合、予め決定された塩基配列変異と異なる塩基配列変異候補およびその遺伝子座に関する情報を提供する段階をさらに含むことができる。
本発明のまた他の特徴によれば、次世代塩基配列分析は複数の分析プラットフォームによる次世代塩基配列分析であり、複数個の塩基配列を収集する段階は、複数の分析プラットフォームによって行われ、同一な塩基配列または同一でない塩基配列それぞれは互いに異なる分析プラットフォームで分析された、複数個の塩基配列を収集する段階を含むことができる。
本発明のまた他の特徴によれば、目的遺伝子が癌連関遺伝子である場合、前記塩基配列変異候補を決定する段階は、癌治療効果に対する前記塩基配列変異候補と抗ガン剤の相関関係を確認する段階をさらに含むことができる。
本発明のまた他の特徴によれば、相関関係を確認する段階は、抗ガン剤の作用の対象になる標的塩基配列変異を確認する段階を含むことができる。
本発明のまた他の特徴によれば、塩基配列変異候補を決定する段階は、マッチングされない塩基配列の統計的分析によって補正された算出方式で算出された、マッチングされない塩基配列内の一致しない遺伝子座に対する突然変異確率値および分析エラー確率値に基づいて、前記対象サンプル内の前記目的遺伝子に対する塩基配列変異候補を決定する段階をさらに含むことができる。
本発明のまた他の特徴によれば、分析エラー確率値は遺伝子パネルの分析プラットフォーム類型によって塩基配列の変異類型別分析エラーおよび分析エラーのbase call quality点数を含む分析エラープロファイルを決定し、分析エラープロファイルに基づいて、少なくとも一つの塩基配列の変異類型に対する分析エラー確率値が補正できる。
本発明のまた他の特徴によれば、分析エラープロファイルは、前記一致しない遺伝子座の前、後に存在する塩基配列の情報をさらに含むことができる。
本発明のまた他の特徴によれば、分析パネル類型がIllumina SureSelectである場合、Illumina hybrid−captureまたはIllumina Ampliconを用いることができる。この時、Illumina hybrid−captureで塩基配列分析される場合、塩基配列の変異類型別分析エラーのうちのCからAへの変異およびGからTへの変異類型に対する分析エラーの確率は、残り塩基配列の変異類型の分析エラーの確率より高くてもよい。
本発明のまた他の特徴によれば、Illumina Ampliconで塩基配列分析される場合、塩基配列の変異類型のうちのGからAへの変異、CからTへの変異、TからAへの変異、AからTへの変異、TからCへの変異およびAからGへの変異類型に対する分析エラーの確率は、残り塩基配列の変異類型の分析エラーの確率より高くてもよい。
本発明のまた他の特徴によれば、分析パネル類型がAmpliSeq cancer panelである場合、IonTorrent Ampliconを用いることができる。この時、IonTorrent Ampliconで塩基配列分析される場合、塩基配列の変異類型のうちのGからAへの変異、CからTへの変異、AからCへの変異、TからGへの変異、TからCへの変異およびAからGへの変異類型に対する分析エラーの確率は、残り塩基配列の変異類型の分析エラーの確率より高くてもよい。
本発明のまた他の特徴によれば、塩基配列変異候補を決定する段階は、一致しない遺伝子座の分析エラー確率値に対する突然変異確率値の比率に基づいて、対象サンプル内の目的遺伝子に対する塩基配列変異候補を決定する段階をさらに含むことができる。
本発明のまた他の特徴によれば、比率は、下記数式1で算出できる。
[数式1]
Figure 0006983307
(ここで、kは複数個の塩基配列の個数であり、Xはi番目遺伝子座に対するBAF(B allele frequency)値であり、Mutは突然変異であり、TEは分析エラーである。)
本発明のまた他の特徴によれば、目的遺伝子は、ABL1、AKT1、ALK、APC、ATM、BRAF、CDH1、CDKN2A、CSF1R、CTNNB1、EGFR、ERBB2、ERBB4、FBXW7、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、KRAS、MET、MLH1、MPL、NOTCH1、NPM1、NRAS、PDGFRA、PIK3CA、PTEN、PTPN11、RB1、RET、SMAD4、SMARCB1、SMO、SRC、STK11、TP53またはVHL遺伝子のうちの少なくとも一つであってもよい。
本発明のまた他の特徴によれば、塩基配列変異は、低頻度体細胞突然変異であってもよい。
本発明のまた他の特徴によれば、参照塩基配列は、前記対象サンプルと同一な目的遺伝子座に対して、塩基配列変異を含まない塩基配列であってもよい。
本発明のまた他の特徴によれば、統計的分析は、複数個の塩基配列それぞれに対する一致しない遺伝子座のBAF値の標準偏差および平均値のうちの少なくとも一つを用いることができる。
前述のような課題を解決するために本発明の一実施形態による塩基配列の変異検出デバイスは通信部と動作可能に連結されたプロセッサーを含み、プロセッサーは通信部を通じて複数の目的遺伝子に対するプローブを含む遺伝子パネルを用いて、一つの対象サンプルに対して複数の目的遺伝子を獲得し、次世代塩基配列分析を用いて、複数の目的遺伝子それぞれを複数回塩基配列分析して、複数の目的遺伝子それぞれに対する同一な塩基配列または同一でない塩基配列を含む、複数個の塩基配列を収集し、参照塩基配列と複数個の塩基配列をマッチングし、複数個の塩基配列のうち、複数の目的遺伝子に対して参照塩基配列とマッチングされない塩基配列を決定し、マッチングされない塩基配列の統計的分析によって補正された算出方式で算出された、マッチングされない塩基配列内の一致しない遺伝子座に対する突然変異確率値に基づいて、対象サンプル内の目的遺伝子に対する塩基配列変異候補を決定するように構成される。
本発明の他の特徴によれば、プロセッサーは、塩基配列変異候補と予め決定された塩基配列変異をマッチングすることによって、塩基配列変異候補と予め決定された塩基配列変異の一致有無の情報をさらに提供するように構成できる。
本発明の他の特徴によれば、プロセッサーは、塩基配列変異候補が予め決定された塩基配列変異と異なり、塩基配列変異候補の遺伝子座が予め決定された塩基配列変異の遺伝子座と異なる場合、予め決定された塩基配列変異と異なる塩基配列変異候補およびその遺伝子座に関する情報をさらに提供するように構成できる。
本発明の他の特徴によれば、プロセッサーは、マッチングされない塩基配列の統計的分析によって補正された算出方式で算出された、マッチングされない塩基配列内の一致しない遺伝子座に対する突然変異確率値および分析エラー確率値に基づいて、対象サンプル内の前記複数の目的遺伝子に対する塩基配列変異候補を決定するように構成できる。
本発明のまた他の特徴によれば、プロセッサーは、一致しない遺伝子座の分析エラー確率値に対する突然変異確率値の比率に基づいて、対象サンプル内の目的遺伝子に対する塩基配列変異候補を決定するようにさらに構成できる。
本発明のまた他の特徴によれば、比率は、前記数式1で算出できる。
本発明は、一つの対象サンプルに対して遺伝子パネルが提供する目的遺伝子を獲得し、これを複数回塩基配列分析して獲得した、複数個の塩基配列の統計的分析によって補正された、突然変異確率値を提供することによって、分析エラーを減らすことができる。これを通じて、本発明は、低頻度塩基配列の変異を検出することができる効果がある。これによって、本発明は、敏感度向上した塩基配列の変異検出方法を遺伝子パネルに適用することによって、低頻度で存在する、疾患に関連した多様な塩基配列の変異を効果的に検出することができる効果がある。
また、本発明の一実施形態による塩基配列変異検出方法は、遺伝子パネルに基づいた塩基配列分析においてプラットフォーム類型に制限されず、分析された塩基配列データに従って適当に補正された方法で算出された突然変異確率値を提供することができる。これにより、本発明は、向上した敏感度で塩基配列を検出することができる効果がある。
さらに、本発明の一実施形態による塩基配列変異検出方法は敏感度向上によって、遺伝子パネルが提供する突然変異情報以外に、疾病に関連した新たな低頻度の突然変異を探索することができ、これに関する情報を提供することができる効果がある。
本発明による効果は以上で例示された内容によって制限されず、さらに多様な効果が本明細書内に含まれている。
本発明の一実施形態による塩基配列の変異検出デバイスの概略的な構成を示したブロック図である。 本発明の一実施形態による塩基配列の変異検出方法を説明するためのフローチャートである。 次世代塩基配列分析による、目的遺伝子に対する複数個の塩基配列を示したものである。 次世代塩基配列分析による、目的遺伝子に対する複数個の塩基配列を示したものである。 本発明の一実施形態による塩基配列の変異検出方法で提供する分析エラー確率値の補正を説明するためのフローチャートである。 本発明の一実施形態による塩基配列の変異検出方法で提供する突然変異確率モデルおよび分析エラー確率モデルを示したものである。 本発明の一実施形態による塩基配列の変異検出方法および従来の検出方法をIllumina SureSelect癌パネルに適用することによって評価された結果を示したものである。 本発明の一実施形態による塩基配列の変異検出方法および従来の検出方法をIon AmpliSeq癌パネルに適用することによって評価された結果を示したものである。 本発明の一実施形態による、塩基配列変異検出方法を適用して検出した新たな低頻度の変異に対する評価結果を示したものである。 複数の分析プラットフォームで塩基配列分析されたデータを、本発明の一実施形態による塩基配列の変異検出方法および従来の検出方法を適用して評価された結果を示したものである。 従来の塩基配列の変異検出方法をIllumina hybrid−captureに適用することによって測定された、変異検出の敏感度および偽陽性比率の結果を示したものである。 従来の塩基配列の変異検出方法をIllumina Ampliconに適用することによって測定された、変異検出の敏感度および偽陽性比率の結果を示したものである。 従来の塩基配列の変異検出方法をIonTorrent Ampliconに適用することによって測定された、変異検出の敏感度および偽陽性比率の結果を示したものである。
発明の利点、そしてそれらを達成する方法は、添付される図面と共に詳細に後述されている実施例を参照すれば明確になるはずである。しかし、本発明は以下に開示される実施例に限定されるのではなく、互いに異なる多様な形態で実現でき、ただ本実施例は本発明の開示が完全なようにし、本発明の属する技術分野における通常の知識を有する者に発明の範疇を完全に知らせるために提供されるものであり、本発明は請求項の範疇によって定義されるだけである。
本発明の実施例を説明するための図面に開示された形状、大きさ、比率、角度、個数などは例示的なものであるので、本発明が図示された事項に限定されるのではない。また、本発明を説明することにおいて、関連する公知技術に関する具体的な説明が本発明の要旨を不必要に濁すことがあると判断される場合、その詳細な説明は省略する。本明細書上で言及された‘含む’、‘有する’、‘行われる’などが使用される場合、‘〜のみ’が使用されない以上、他の部分が追加できる。構成要素を単数で表現した場合に特に明示的な記載事項がない限り、複数を含む場合を含む。
構成要素を解釈することにおいて、別途の明示的記載がなくても誤差範囲を含むと解釈する。
本発明の様々な実施例のそれぞれ特徴が部分的にまたは全体的に互いに結合または組み合わせ可能であり、当業者が十分に理解できるとおり技術的に多様な連動および駆動が可能であり、各実施例が互いに対して独立的に実施可能なこともあり、連関関係で共に実施可能なこともある。
本明細書の解釈の明確さのために、以下では本明細書で使用される用語を定義する。
本明細書で使用される用語、“目的遺伝子”は、全体DNA塩基配列中、塩基配列分析しようとする遺伝子領域(genetic region)を含む遺伝子を意味することができる。この時、目的遺伝子座は、特定の塩基配列変異を含むことができる。これにより、目的遺伝子を塩基配列分析することによって、これに対する塩基配列変異遺伝子領域を探索することができる。
本明細書で使用される用語、“塩基配列変異”は、様々な要因によって、遺伝子で起こる塩基配列の変異を意味することができる。例えば、塩基配列の変異は、疾患に関連した突然変異、特に体細胞突然変異であることもあり、さらには、遺伝病による塩基配列の変異であることもある。しかし、塩基配列変異は前述のものに制限されるわけではない。例えば、塩基配列変異は、サンプルの汚染による塩基配列の変異、産婦の血液内で、母体DNAと共に少量で存在する胎児のDNAによって現れることがある、対立遺伝子による塩基配列変異、脳細胞内で少量で存在する突然変異をさらに含むことができる。
一方、体細胞突然変異は癌に関連することもある。同一な癌を有する患者でも、患者らそれぞれは異なるゲノム突然変異を有する、体細胞突然変異を有していることもある。よって、目的遺伝子に対する突然変異を検出することによって突然変異に関する正確な情報を獲得することは癌の治療、特に効果的な抗ガン剤の選定において重要なものであり得る。このように、疾患関連した突然変異は個体内で低頻度で存在することもある。これにより、低頻度の突然変異を敏感度高く検出することは疾患の診断、さらには効果的な治療方向設定において重要なものであり得る。
本明細書で使用される用語、“遺伝子パネル(gene panel)”は、複数の目的遺伝子に対する突然変異が一つのパネルに構成された、遺伝子変異検査方法である。このような遺伝子パネルは次世代塩基配列分析(NGS、next generation sequencing)に基づいてもよく、これは癌に関連した遺伝子変異を探索することに用いられるか、自己免疫疾患、遺伝子疾患の診断または治療に関連して活用できる。遺伝子パネルを通じて使用者は塩基配列分析しようとする領域、さらには塩基配列変異を探索しようとする領域に対する分析を行うことができる。また、使用者は遺伝子パネルを通じて一つの分析で複数の目的遺伝子に対する同時分析を行うことができる。遺伝子パネルは目的遺伝子それぞれに対する相補的塩基配列を有するプローブ(probe)を含むことができ、それぞれのプローブは対象サンプル内の目的遺伝子領域に対して混成化反応(hybridization)によって特異的に結合することができる。例えば、癌遺伝子パネルは、ABL1、AKT1、ALK、APC、ATM、BRAF、CDH1、CDKN2A、CSF1R、CTNNB1、EGFR、ERBB2、ERBB4、FBXW7、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、KRAS、MET、MLH1、MPL、NOTCH1、NPM1、NRAS、PDGFRA、PIK3CA、PTEN、PTPN11、RB1、RET、SMAD4、SMARCB1、SMO、SRC、STK11、TP53またはVHL遺伝子に対するプローブを含むことができる。以上のプローブは、目的遺伝子に対する塩基配列変異を探索するのに用いることができる。このように、プローブが付着された目的遺伝子はPCRを通じて増幅されることによって、塩基配列分析のためのライブラリーに製作でき、次世代塩基配列分析を通じて最終的に目的遺伝子に対する塩基配列変異候補が決定できる。
本明細書で使用される用語、“次世代塩基配列分析”は、ゲノムの塩基配列分析技術の一つであって、DNA片を並列に処理することによって塩基配列を高速で分析することができる。このような特徴によって、次世代塩基配列分析は、高処理率シークエンシング(high−throughput sequencing)、大容量並列シークエンシング(massive parallel sequencing)または2世代シークエンシング(second−generation sequencing)と呼ばれることもある。次世代塩基配列分析は、目的によって多様な分析プラットフォームが使用できる。例えば、次世代塩基配列分析の分析プラットフォームは、Roche454、GS FLX Titanium、Illumina MiSeq、Illumina HiSeq、Illumina Genome Analyzer IIX、Life Technologies SOLiD4、Life Technologies Ion Proton、Life Technologies Ion Proton、Complete Genomics、Helicos Biosciences Heliscope、Pacific Biosciences SMRTなどが挙げられる。このような次世代塩基配列分析技術は、前述のように遺伝子パネルと共に塩基配列の変異検出に使用できる。例えば、疾患に関連する塩基配列の変異検出のために用いられた遺伝子パネルがIlluminaである場合、分析プラットフォームはIllumina hybrid−capture、Illumina Ampliconであってもよく、用いられた遺伝子パネルがIonTorrentである場合、分析プラットフォームはIonTorrent Ampliconであってもよい。しかし、これに制限されるわけではない。
一方、同一な遺伝子パネル、塩基配列分析プラットフォームに対して、検出可能な塩基配列変異頻度の範囲は塩基配列分析されたデータの分析方法によって変わることがある。即ち、低頻度で存在する塩基配列変異の検出は遺伝子パネル、分析プラットフォームの種類だけでなく、最終的に塩基配列分析されたデータの分析方法に依存することもある。これにより、遺伝子パネルに適用することによって、低頻度で存在する、疾患に関連した多様な塩基配列の変異を効果的に検出することができる新たな塩基配列の変異検出方法が要求されることがある。
本明細書で使用される用語、“対象サンプル”は塩基配列の変異を確認しようとする患者から得られた生物学的試料であってもよく、本明細書で使用される用語、“参照塩基配列”は対象サンプルと対照的に目的遺伝子に対して塩基配列の変異が現れない塩基配列であってもよい。例えば、対象サンプルは、体細胞突然変異を有することができる、腫瘍細胞であってもよい。さらに、参照塩基配列は正常の細胞に対して予め塩基配列分析されたデータが使用できるが、これに制限されるわけではない。
対象サンプルに対する目的遺伝子内の塩基配列の変異は、目的遺伝子に対する参照塩基配列と比較することによって検出することができる。例えば、対象サンプルの塩基配列を分析した後、参照サンプル塩基配列とマッチングする。その後、参照サンプルの塩基配列と一致しない対象サンプルの遺伝子座を選別し、一致しない遺伝子座に対する突然変異確率値に基づいて対象サンプル内の塩基配列の変異候補を決定することができる。
ここで、“遺伝子座”は、分析されたゲノムの塩基配列中の特定の位置の塩基配列を意味することができる。遺伝子座の塩基配列は、単一塩基配列であってもよいが、これに制限されず、連続した2つ以上の塩基配列であってもよい。また、“突然変異確率値”は参照サンプルと一致しない対象サンプルの遺伝子座が塩基配列分析のエラーなのか、本当の塩基配列変異なのか決定できる指標になり得る。対象サンプル内の目的遺伝子に対する塩基配列変異候補の決定は、複数個の塩基配列の統計的分析によって補正された算出方式で算出された一致しない対象サンプルの遺伝子座に対する突然変異確率値に基づいて行うことができる。
本明細書で使用される用語、“複数個の塩基配列”は、対象サンプル内の同一な目的遺伝子に対して複数回塩基配列分析して収集した複数個の塩基配列を意味することができる。この時、選択的に複数個の塩基配列はそれぞれ異なる分析プラットフォームによって行うことができる。さらに、複数個の塩基配列それぞれは、デプス(depth)が高まることによって生成された複数個のリードを含むことができる。即ち、複数個の塩基配列それぞれは、同一な目的遺伝子の塩基配列を含むことができる。さらに、複数個の塩基配列は、同一でない塩基配列であってもよい。即ち、ゲノムの塩基配列を分析しようとするサンプル、さらに遺伝子に対する一回の塩基配列分析結果は分析のエラーを含むことができる。これにより、一つの目的遺伝子に対して複数回の塩基配列分析を行って収得した複数個の塩基配列を考慮する場合、一回の塩基配列分析を行った時より塩基配列変異検出の正確度が高くなり得る。具体的に、一つの目的遺伝子に対して分析された複数個の塩基配列の結果によって突然変異確率が変わることがある。例えば、一つの目的遺伝子の塩基配列を複数回分析し、これを通じて獲得した複数個の塩基配列それぞれを参照サンプルの塩基配列とマッチングした時、複数個の塩基配列間の参照サンプルと一致しない遺伝子座が一定に現れることがある。このような場合、この一致しない遺伝子座はそうでない遺伝子座より塩基配列の変異である確率が高いことがある。これと対照的に、複数個の塩基配列間の参照サンプルと一致しない遺伝子座が一定でないように現れる場合、一致しない遺伝子座はそうでない遺伝子座より分析エラーである確率が高いことがある。
本明細書で使用される用語、“BAF(B allele frequency)”は、一つの遺伝子座に対して複数個のリードで分析されることによって得られた、塩基の全体個数に対する参照サンプルの塩基配列と一致しない塩基(B allele)の頻度を意味することができる。よって、複数個の塩基配列それぞれが有する複数個の塩基配列内の参照サンプルと一致しない遺伝子座に対するBAF値によって突然変異確率は変わることもある。例えば、それぞれの複数個の塩基配列が参照サンプルと一致しない、一つの遺伝子座に対して一定のBAF値を有する場合、この一致しない遺伝子座は複数個の塩基配列間のBAF値が一定でない遺伝子座より、突然変異である確率が高いことがある。即ち、一致しない遺伝子座に対する突然変異確率は複数個の塩基配列間の一致しない遺伝子座に対するBAF値の偏差に関連していることがある。
本明細書で使用される用語、“複数個の塩基配列の統計的分析によって補正された算出方式”は、複数個の塩基配列それぞれの、複数個の塩基配列内に存在する一つの一致しない遺伝子座に対するBAF値に基づいて補正された突然変異確率値の算出方式であり得る。具体的に、BAF値に基づいて補正された算出方式は、複数個の塩基配列間の参照サンプルと一致しない遺伝子座に対するBAF値の標準偏差が小さくてもよい。このような場合の突然変異確率値の算出方式は参照サンプルと一致しない遺伝子座に対するBAF値の標準偏差が大きい遺伝子座より高い突然変異確率値を有するように補正できる。しかし、これに制限されず、BAF値に基づいて補正された算出方式は多様な方式で突然変異確率値を補正することができる。例えば、BAF値に基づいて補正された算出方式は、複数個の塩基配列間の参照サンプルと一致しない遺伝子座に対するBAF値の標準偏差が大きい場合、参照サンプルと一致しない遺伝子座に対するBAF値の標準偏差が小さい遺伝子座より低い突然変異確率値を有するように補正された方式であり得る。
さらに、本発明の一実施形態による、塩基配列変異検出方法は、複数個の塩基配列それぞれが互いに異なる分析プラットフォームによって塩基配列分析された場合、プラットフォーム類型に制限されず正確度高く塩基配列変異を検出することができる。具体的に、本発明の一実施形態による、塩基配列変異検出方法は、分析された塩基配列データによって適当に補正された方法で算出された突然変異確率値および分析エラー確率値に基づいて塩基配列変異候補を決定することができる。特に、分析エラー確率値は、塩基配列の変異類型を考慮して補正された分析エラー確率値であり得る。具体的に、塩基配列の変異類型を考慮して補正された分析エラー確率値は、分析プラットフォーム類型によって塩基配列の変異類型別分析エラーおよびこれらのbase call quality点数を含む分析エラープロファイルに基づいて補正できる。より具体的に、一つの遺伝子座はbase call quality点数が高まることによってその突然変異確率が高くなり得る。これにより、塩基配列の変異類型を考慮した分析エラー確率値は分析プラットフォームによるbase call quality点数が高い分析エラーの塩基配列の変異類型を選別し、これに関する情報を含む分析エラープロファイルを決定する。その後、決定された分析エラープロファイルに基づいて塩基配列の変異類型に対する分析エラー確率値が補正できる。このような補正を通じて本発明の一実施形態による塩基配列変異検出方法は互いに異なる分析プラットフォームで分析された複数個の塩基配列データを用いても、敏感度向上した塩基配列変異の検出を提供することができる。
目的遺伝子に対して塩基配列分析された複数のデータを活用して検出の敏感度が向上した塩基配列変異の検出方法で決定された、塩基配列変異候補は予め決定された塩基配列変異とマッチングできる。これを通じて、塩基配列変異候補と前記予め決定された塩基配列変異の一致有無を確認することができる。“予め決定された塩基配列変異”は、目的遺伝子内に存在可能な全ての塩基配列変異を含むことができる。例えば、遺伝子パネルが癌遺伝子パネルである場合、予め決定された塩基配列変異は癌に関連した突然変異であり得る。
決定された塩基配列変異候補は、特定疾患に対して新しく明らかになった塩基配列変異であり得る。これにより、決定された塩基配列変異候補は予め決定された塩基配列変異と異なり、塩基配列変異候補の遺伝子座が予め決定された塩基配列変異の遺伝子座と異なることもある。以上の場合、本発明の一実施形態による塩基配列変異検出方法は、目的遺伝子に対する新たな塩基配列変異候補とその遺伝子座に関する情報をさらに提供することができる。
また、対象サンプルが腫瘍細胞である場合、目的遺伝子は癌連関遺伝子であり得る。この時、対象サンプルが有する塩基配列変異候補によって、個体に対して効果的な抗ガン剤が異なることもある。これにより、本発明の一実施形態による塩基配列変異検出方法は、癌治療効果に対する塩基配列変異候補と抗ガン剤の相関関係の確認をさらに提供することができる。これを通じて、特定抗ガン剤の作用の対象になる標的塩基配列変異が決定でき、さらには、塩基配列変異候補に対して効果的な抗ガン剤が決定できる。
以下では、図1を参照して、本発明の一実施形態による塩基配列の変異検出デバイスを説明する。
図1は、本発明の一実施形態による塩基配列の変異検出デバイスの概略的な構成を示したブロック図である。図1を参照すれば、塩基配列の変異検出デバイス100は、通信部110、入力部120、表示部130、保存部140およびプロセッサー150を含む。
通信部110を通じて、塩基配列の変異検出デバイス100は次世代塩基配列分析方法で、一つの対象サンプルを複数回塩基配列分析して獲得した複数個の塩基配列を獲得することができる。選択的に、塩基配列の変異検出デバイス100は予め決定された塩基配列変異を獲得することができる。
入力部120は、キーボード、マウス、タッチスクリーンパネルなど制限されない。使用者は入力部120を通じて塩基配列の変異検出デバイス100を設定し、その動作を指示することができる。
表示部130は、使用者から容易に塩基配列の変異検出デバイス100の設定が可能なメニューさらには、表示部130を通じて予め決定された塩基配列変異と決定された塩基配列変異候補が異なる場合、これに関する情報を使用者にさらに提供することができる。この時、表示部130は液晶表示装置、有機発光表示装置などを含む表示装置であって、メニューが使用者にディスプレイされるようにすることができる。また、表示部130は、前述されたもの以外に本発明の目的を達成できる範囲内で多様な形態または方法で実現できる。
保存部140は、通信部110を通じて獲得した複数個の塩基配列を保存することができる。また、一致しない遺伝子座に対する突然変異確率値に基づいて決定された対象サンプル内の目的遺伝子に対する塩基配列変異候補を保存することができる。選択的に、保存部140は決定された塩基配列変異候補と予め決定された塩基配列変異の一致有無の情報を保存することができ、決定された塩基配列変異候補が予め決定された塩基配列変異と異なる場合、新たな塩基配列変異候補とその遺伝子座に関する情報をさらに保存することができる。
プロセッサー150は、本発明の一実施形態による塩基配列の変異検出デバイス100を動作させるための多様な命令を行う。プロセッサー150はまず、通信部110と連結されて、通信部110を通じて複数の目的遺伝子に対するプローブを含む遺伝子パネルを用いて、一つの対象サンプルに対して複数の目的遺伝子を獲得する。その後、次世代塩基配列分析を用いて、複数の目的遺伝子それぞれを複数回塩基配列分析して、複数の目的遺伝子それぞれに対する同一な塩基配列または同一でない塩基配列を含む、複数個の塩基配列が収集される。その次に、参照塩基配列と複数個の塩基配列をマッチングし、複数個の塩基配列のうち、複数の目的遺伝子に対して参照塩基配列とマッチングされない塩基配列が決定される。最後に、プロセッサーはマッチングされない塩基配列の統計的分析によって補正された算出方式で算出された、マッチングされない塩基配列内の一致しない遺伝子座に対する突然変異確率値に基づいて、対象サンプル内の目的遺伝子に対する塩基配列変異候補を決定するように構成される。
以下では、図2を参照して、本発明の一実施形態による塩基配列の変異検出方法について具体的に説明する。
図2は、本発明の一実施形態による塩基配列の変異検出方法を説明するためのフローチャートである。
まず、複数の目的遺伝子に対するプローブを含む遺伝子パネルを用いて、一つの対象サンプルに対して目的遺伝子を獲得する(S210)。この時、それぞれのプローブは、対象サンプル内の目的遺伝子領域に対して混成化結合によって特異的に結合することができる。例えば、獲得する段階(S210)では、癌遺伝子パネルが提供するABL1、AKT1、ALK、APC、ATM、BRAF、CDH1、CDKN2A、CSF1R、CTNNB1、EGFR、ERBB2、ERBB4、FBXW7、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、KRAS、MET、MLH1、MPL、NOTCH1、NPM1、NRAS、PDGFRA、PIK3CA、PTEN、PTPN11、RB1、RET、SMAD4、SMARCB1、SMO、SRC、STK11、TP53またはVHL遺伝子に対するプローブを用いて、PCRを通じてそれぞれの目的遺伝子を増幅することによって、これら目的遺伝子に対する塩基配列分析のためのライブラリー製作が行われる。
その後、次世代塩基配列分析方法で、複数の目的遺伝子それぞれを複数回塩基配列分析して、複数の目的遺伝子それぞれに対する同一な塩基配列または同一でない塩基配列を含む、複数個の塩基配列を収集する(S220)。例えば、対象サンプルは複数個のリードを含むことができ、この複数個のリードはマッピング(mapping)され複数の目的遺伝子それぞれに対する塩基配列が収集できる。選択的に、収集する段階(S220)では、参照塩基配列がない場合、参照サンプルに対する塩基配列分析が対象サンプルの塩基配列分析と共に行われる。また、収集する段階(S220)は複数の分析プラットフォームによって行われ、その結果として互いに異なる分析プラットフォームで分析された、複数の塩基配列が収集できる。
その後、参照塩基配列と複数個の塩基配列をマッチングする(S230)。マッチングする段階(S220)では、参照塩基配列と一つの目的遺伝子に対する複数個の塩基配列それぞれがマッチングされる。例えば、マッチングする段階(S220)では、参照塩基配列と目的遺伝子に対する複数個の塩基配列が遺伝子座別に比較できる。
その次に、複数個の塩基配列のうち、複数の目的遺伝子に対して参照塩基配列とマッチングされない塩基配列を決定する(S240)。例えば、マッチングされない塩基配列を決定する段階(S240)では、複数個の塩基配列のうちの少なくとも一つの塩基配列で参照塩基配列と一致しない遺伝子座を探索することができる。この時、目的遺伝子に対する参照塩基配列と一致しない遺伝子座は、塩基配列変異または塩基配列分析のエラーであり得る。
最後に、マッチングされない塩基配列の統計的分析によって補正された算出方式で算出された、マッチングされない塩基配列内の一致しない遺伝子座(locus)に対する突然変異確率値に基づいて、対象サンプル内の前記複数の目的遺伝子に対する塩基配列変異候補を決定する(S250)。塩基配列変異候補を決定する段階(S250)では、選択的に、マッチングされない塩基配列内の一致しない遺伝子座に対する突然変異確率値および分析エラー確率値に基づいて、複数個の塩基配列内の一致しない遺伝子座を対象サンプルの塩基配列変異候補と決定することができる。具体的に、一致しない座の分析エラー確率値に対する突然変異確率値の比率が予め決定された水準以上である場合、一致しない遺伝子座は対象サンプルの塩基配列変異候補と決定できる。他の実施形態によれば、塩基配列変異候補を決定する段階(S250)では、複数個の塩基配列が二つの塩基配列であり得る。このような場合、二つの塩基配列それぞれの一致しない遺伝子座に対する突然変異確率値をかけて算出された確率値に基づいて、二つの塩基配列内の一致しない遺伝子座は対象サンプルの塩基配列変異候補と決定できる。多様な実施形態によれば、塩基配列変異候補を決定する段階(S250)で一致しない遺伝子座は突然変異確率値と関係なく、分析エラーと決定できる。例えば、参照サンプルと対象サンプルのマッピングクオリティが予め決定された水準以下である場合、分析された対象サンプルの塩基の大多数がbase call quality点数が予め決定された水準以下である場合、遺伝子座に対する複数のリードが挿入または欠失が予め決定された水準以上を示す場合、これら対象サンプルの遺伝子座は突然変異確率値と関係なく、分析エラーと決定できる。また、複数のリードそれぞれの一致しない遺伝子座が予め決定された水準以上を示す場合、変異がマッチング対照群データで現れた場合、これら対象サンプルの遺伝子座は突然変異確率値と関係なく、分析エラーと決定できる。しかし、遺伝子座に対する分析エラーの決定は前述のものに制限されるわけではない。
さらに、目的遺伝子が癌連関遺伝子である場合、塩基配列変異候補を決定する段階(S250)では選択的に、癌治療効果に対する、塩基配列変異候補と抗ガン剤の相関関係の確認が行われる。これを通じて、特定抗ガン剤の作用の対象になる標的塩基配列変異が決定でき、さらに、塩基配列変異候補に対して効果的な抗ガン剤が決定できる。
塩基配列変異候補を決定する段階(S250)を通じて決定された塩基配列変異候補は選択的に、予め決定された塩基配列変異候補とマッチングされる。これを通じて、塩基配列変異候補と前記予め決定された塩基配列変異の一致有無の情報がさらに提供できる。この時、予め決定された塩基配列変異は前述の塩基配列変異検出段階のうちのいずれか一つに制限されず、容易に獲得できる。さらに、決定された塩基配列変異候補が予め決定された塩基配列変異と異なり、塩基配列変異候補の遺伝子座が予め決定された塩基配列変異の遺伝子座と異なる場合、予め決定された塩基配列変異と異なる塩基配列変異候補およびその遺伝子座に関する情報はさらに提供することができる。
以上の本発明の一実施形態による塩基配列変異検出方法は多様な変数を考慮して決定した塩基配列変異候補を提供することによって、本発明の一実施形態による塩基配列変異検出方法およびこれを用いたデバイスは敏感度高く遺伝子パネルに基づいて塩基配列変異を検出してこれを使用者に提供することができる。
以下、図3aおよび3bを参照して、本発明の一実施形態による塩基配列の変異検出方法で提供する、目的遺伝子に対する複数個の塩基配列を用いて分析エラー確率値を補正する方法を具体的に説明する。
図3aおよび3bは、次世代塩基配列分析による、目的遺伝子に対する複数個の塩基配列を示したものである。
まず、図3aを参照すれば、(A)座〜(C)座を含む目的遺伝子に対して2回次世代塩基配列分析を用いて塩基配列分析された結果であるRep.1、Rep.2が示される。具体的に、それぞれの正四角形は遺伝子座に対して参照塩基配列と不一致の程度、即ち、BAFを意味することができる。一方、cutoff値は遺伝子座に対するBAF値に基づいて突然変異とコール(call)することができる基準になり、従来の技法はこのようなcutoff値に基づいて突然変異を決定することができる。これにより、各遺伝子座に対してcutoff以上のBAF値を有する遺伝子座の場合、突然変異が現れた座、即ち、塩基配列変異と表示できる。しかし、単純に固定されたcutoff値に依存する既存の方法は複数個の塩基配列分析データがない場合、多数の偽陽性(false positive)変異を含む結果を産むようになる。図3aの例示で複数個の塩基配列分析データ(Rep.1とRep.2)を同時に考慮しない場合、Rep.1は6個の偽陽性変異が、Rep.2は5個の偽陽性変異が突然変異とコールされることもある。一方、二つの塩基配列分析データを同時に考慮して共に観察される座のみを変異候補として残す場合、分析エラーが起こった(B)座を除いた他の全ての偽陽性変異を除去することができて、正確度向上に大きく寄与することができる。即ち、低頻度塩基配列変異検出の正確度向上のためには一つの目的遺伝子座に対する複数個の塩基配列分析データが必要であるのを確認することができる。
しかし、従来のcutoff依存的検出方式に単純に複数個の塩基配列分析データを追加するといって問題を十分に解決することはできない。例えば、低頻度塩基配列変異検出のための高深度(high−depth)シークエンシングデータでは(B)座のようにcutoff値を超える分析エラーが複数個の塩基配列分析データで重複的に現れ、依然として偽陽性変異を多く生成する場合が頻繁に発生する。また、一括的なcutoffの適用は、突然変異が起こった(C)座のように実際突然変異が存在するにもかかわらずBAFがcutoffより低くて検出されない偽陰性(false negative)を多く作り出すことがある。これを解決するために、本発明の一実施形態による塩基配列変異の検出方法では突然変異確率値と分析エラー確率値に基づいて変異類型別に柔軟な判断基準を適用することによって突然変異候補を決定することができる。
具体的に、図3bの(b)を参照すれば、目的遺伝子に対して本当に突然変異が起こった座である(C)座は、従来の技法が使用する単純cutoffに基づけば突然変異とコールされない。しかし、当該タイプの塩基配列変異が分析エラーとして観察された場合が殆どないことを考慮して、本発明の一実施形態による塩基配列変異の検出方法では当該座に非常に希薄な分析エラー確率値を付与するようになる。また、二回の塩基配列分析結果、全てで一貫したBAFが観察されるため、低いBAFにもかかわらず、向上した突然変異確率値が付与される。この二つの要素を総合的に考慮して、本発明の一実施形態による塩基配列変異の検出方法では(C)座を突然変異と判断することができる。その結果、向上した敏感度で塩基配列変異を検出することができる。
図3bの(c)を参照すれば、目的遺伝子に対して分析エラーが起こった座(B)座は、従来の技法が使用する単純cutoffに基づく場合、突然変異とコールされる。反面、当該タイプの塩基配列変異が分析エラーとして高いBAFで非常に頻繁に現れることを考慮した本発明の一実施形態による塩基配列変異の検出方法では、当該座に高い分析エラー確率値を付与することができる。また、本発明の一実施形態による塩基配列変異の検出方法では、二回の塩基配列分析結果で互いに異なるBAFが観察されることを考慮して、高いBAFにもかかわらず(B)座に対して低い水準の突然変異確率値を付与することができる。この二つの要素を総合的に考慮して、本発明の一実施形態による塩基配列変異の検出方法では(B)座を分析エラーと決定することができる。その結果、本発明の一実施形態による塩基配列変異の検出方法は、向上した正確度で塩基配列変異を決定することができる。
図3bの結果で、塩基配列変異検出の正確度向上のためには、一つの目的遺伝子座に対する複数個の塩基配列分析データ(例えば、Rep.1およびRep.2)が考慮されなければならないということを確認することができる。さらには、一定のBAF値を有する遺伝子座(例えば、Rep.1およびRep.2の(A)座および(C)座)と一定でないBAF値を有する遺伝子座(例えば、Rep.1およびRep.2の(B)座)は当該類型の変異パターンを分析して互いに異なる突然変異確率値および分析エラー確率値を有するように補正されなければならないという点を確認することができる。
これにより、本発明の一実施形態による塩基配列変異検出方法は、Rep.1およびRep.2のように、一つの目的遺伝子に対して複数回の塩基配列分析を行うことによって、参照塩基配列と一致しない遺伝子座に対するBAF値を考慮して補正された突然変異確率値算出方式を提供する。即ち、本発明の一実施形態による塩基配列変異検出方法は、一定のBAF値を有する一致しない座の場合(例えば、Rep.1およびRep.2の(A)座および(C)座)、これに対して高い突然変異確率値を有するように補正された算出方式を提供することができる。また、本発明の一実施形態による塩基配列変異検出方法は一定しないBAF値を有する一致しない座の場合(例えば、Rep.1およびRep.2の(B)座)、これに対して相対的に低い突然変異確率値を有するように補正された算出方式を提供することができる。したがって、本発明の一実施形態による塩基配列変異検出方法は、遺伝子パネルに適用した時、正確度および敏感度が向上した塩基配列変異検出を提供することができる。
以下では、図3cを参照して、本発明の一実施形態による塩基配列の変異検出方法で提供する、一致しない遺伝子座に対する分析エラー確率値の補正方法について具体的に説明する。
図3cは、本発明の一実施形態による塩基配列の変異検出方法で提供する分析エラー確率値の補正を説明するためのフローチャートである。
まず、分析エラー確率値は、塩基配列の変異類型を考慮して補正された値で提供される。具体的に、分析プラットフォーム類型によって塩基配列の変異類型別分析エラーおよびこれらのbase call quality点数を含む分析エラープロファイルを決定する(S310)。より具体的に、base call quality点数は、シークエンシング段階で発生した分析エラーに関連し得る。例えば、シークエンシング段階での分析エラーを有する遺伝子座は低いbase call quality点数を有することができ、突然変異を有する遺伝子座は高いbase call quality点数を有することができる。しかし、塩基配列分析前段階のライブラリー製作段階で発生した分析エラーと突然変異確率は、base call quality点数に依存的でないこともある。これにより、分析エラープロファイルを決定する段階(S310)では、分析プラットフォーム類型による塩基配列の変異類型別全体分析エラーに対するライブラリー製作段階で発生した分析エラーの比率に基づいて、分析エラープロファイルを決定することができる。例えば、分析エラープロファイルを決定する段階(S310)では塩基配列の変異類型を考慮した分析エラーの補正のために、base call quality点数を一つの指標として用いることができる。即ち、分析プラットフォームによるbase call quality点数が高い分析エラーの塩基配列の変異類型は補正対象に選別できる。多様な実施形態によれば、分析プラットフォームがIllumina hybrid−captureである場合、塩基配列の変異類型別分析エラーCからAへの変異およびGからTへの変異類型のbase call quality点数は残り類型の変異より高いことがある。即ち、Illumina hybrid−captureで、CからAへの変異およびGからTへの変異類型は分析エラーであるが、突然変異と出力される検出のエラーを犯すことがある。また、分析プラットフォームがIllumina Ampliconである場合、塩基配列の変異類型のうちのGからAへの変異、CからTへの変異、TからAへの変異、AからTへの変異、TからCへの変異およびAからGへの変異類型のbase call quality点数は残り類型の変異より高いことがある。さらに、分析プラットフォームがIonTorrent Ampliconである場合、塩基配列の変異類型のうちのGからAへの変異、CからTへの変異、AからCへの変異、TからGへの変異、TからCへの変異およびAからGへの変異類型のbase call quality点数は残り類型の変異より高いことがある。結果的に、分析エラープロファイルを決定する段階(S310)では、前述の分析プラットフォーム類型による塩基配列の変異類型別分析エラーおよびそのbase call quality点数を含む分析エラープロファイルを決定することができる。また、分析エラープロファイルは、複数個の塩基配列のうちの一致しない遺伝子座の前、後に存在する塩基配列の情報をさらに含むことができる。
その後、分析エラープロファイルを決定する段階(S310)で決定された分析エラープロファイルに基づいて分析プラットフォーム類型によって塩基配列変異類型に対する分析エラー確率値が補正される(S320)。例えば、Illumina hybrid−captureに対して、塩基配列の変異類型別分析エラーのうちのCからAへの変異およびGからTへの変異類型に対する分析エラーの確率値を残り塩基配列変異類型の分析エラー確率値より高く補正することができる。また、Illumina Ampliconに対して、塩基配列の変異類型のうちのGからAへの変異、CからTへの変異、TからAへの変異、AからTへの変異、TからCへの変異およびAからGへの変異類型に対する分析エラーの確率値を残り塩基配列の変異類型の分析エラーの確率値より高く補正することができる。さらには、IonTorrent Ampliconに対して、塩基配列の変異類型のうちのGからAへの変異、CからTへの変異、AからCへの変異、TからGへの変異、TからCへの変異およびAからGへの変異類型に対する分析エラーの確率値を残り塩基配列の変異類型の分析エラーの確率値より高く補正することができる。結果的に、一致しない遺伝子座に対する分析エラー確率値は、分析エラー確率値補正段階(S320)を通じて補正された、分析エラー確率値で算出される。これにより、一致しない遺伝子座に対する塩基配列を考慮して算出された分析エラー確率値および突然変異確率値に基づいて対象サンプルの塩基配列変異候補が決定できる。
以下では、図3dを参照して、本発明の一実施形態による塩基配列の変異検出方法で提供する、一致しない遺伝子座に対する突然変異確率値および分析エラー確率値に基づいて対象サンプルの塩基配列変異候補を決定する段階について具体的に説明する。
図3dは、本発明の一実施形態による塩基配列の変異検出方法で提供する突然変異確率モデルおよび分析エラー確率モデルを示したものである。
具体的に、グラフのx軸の6個の点は6個の塩基配列それぞれが示す参照サンプルと一致しない遺伝子座に対するBAF値を意味し、y軸は確率値を意味する。より具体的に、x軸は対象サンプルそれぞれに対して3回ずつ塩基配列分析した結果として生成された、二つの一致しない遺伝子座に対する3個の塩基配列のBAF値を示す。さらには、突然変異確率モデル1および突然変異確率モデル2は、3個の塩基配列の一致しない遺伝子座に対するBAF値に基づいて作られた突然変異の確率密度関数である。また、分析エラー確率モデル1および分析エラー確率モデル2は、前述の分析エラープロファイルに基づいて作られた、互いに異なる塩基配列類型を示す一致しない遺伝子座に対する分析エラー確率密度関数である。グラフのx軸を参照すれば、一致しない遺伝子座に対して、突然変異確率モデル1の3個の黒い点に該当する3個の塩基配列のBAF値の標準偏差は、突然変異確率モデル2の3個の白い点に該当する3個の塩基配列より小さいことが分かる。これにより、BAF値の偏差が小さい突然変異確率モデル1の突然変異確率値が、BAF値の偏差が相対的に大きい突然変異確率モデル2より高いことが分かる。結果的に、BAF値の偏差が小さい突然変異確率モデル1の突然変異確率値が分析エラー確率モデル1の分析エラー確率値より高くて、突然変異確率モデル1の一致しない遺伝子座は対象サンプルの塩基配列変異候補と決定できる。これと対照的に、BAF値の偏差が大きい突然変異確率モデル2の突然変異確率値が分析エラー2の分析エラー確率値より低くて、突然変異確率モデル2の一致しない遺伝子座は対象サンプルの塩基配列変異候補と決定できない。
これにより、対象サンプルの塩基配列の変異候補の決定は、算出された分析エラー確率値に対する前記突然変異確率値の比率を考慮して設定した数式2から算出された比率値で決定できる。
Figure 0006983307
ここで、kは複数個の塩基配列の個数であり、Xはi番目遺伝子座に対するBAF値であり、Mutは突然変異であり、TEは分析エラーである。具体的に、Sはk個の塩基配列それぞれの分析エラー確率値を合算した確率値に対するk個の塩基配列それぞれの突然変異確率値を合算した確率値の比率にログを取った値を意味することができる。結果的に、数式2で算出された一致しない遺伝子座の比率値が、予め決定された水準以上である場合、この一致しない遺伝子座を対象サンプルの塩基配列変異候補と決定することができる。即ち、本発明の一実施形態による塩基配列の変異検出方法およびこれを用いた塩基配列の変異検出デバイスは、遺伝子パネルに適用される場合、多様な変数を考慮して算出した複数個の塩基配列内の参照サンプルと一致しない座に対する分析エラー確率値に対する突然変異確率値の比率に基づいて、一致しない遺伝子座を対象サンプルの塩基配列変異候補と決定することによって、敏感度高く疾患に関連した塩基配列の変異を検出することができる効果がある。
実施例1:本発明の塩基配列の変異検出方法に対する評価−岩パネル
以下では、図4aおよび4bを参照して、本発明の一実施形態による塩基配列の変異検出方法と従来の検出方法に対して癌パネルに適用した結果を説明する。本評価で、従来の検出方法は、Single、Intersection、BAMergeおよびUnionを用いた。具体的に、Singleは、一回の塩基配列分析方法を用いた塩基配列変異検出方法である。Intersectionは、複数回の塩基配列分析後、交差する遺伝子座に基づいて塩基配列変異を決定する検出方法を示すことができる。さらに、BAMergeは、複数回の塩基配列分析結果を合して、これに基づいて塩基配列変異を決定する検出方法を示すことができる。説明の簡明さのために、本発明の一実施形態による塩基配列の変異検出方法を適用した癌パネルに対する評価を実施例1、Singleを適用した癌パネルに対する評価を比較例1、Intersectionを適用した癌パネルに対する評価を比較例2、BAMergeを適用した癌パネルに対する評価を比較例3、Unionを適用した癌パネルに対する評価を比較例4と示して説明する。本評価では、35個の癌パネルホットスポット突然変異を含む標準物質および突然変異を含まない参照標準物質が用いられた。この時、標準物質が含む突然変異は、NRAS遺伝子のp.Q61H、p.Q61L、p.Q61Rおよびp.Q61K突然変異、ALK遺伝子のp.F1174L突然変異、IDH1遺伝子のp.R132Hおよびp.R132C突然変異、PIK3CA遺伝子のp.E542Kおよびp.E545K突然変異、PDGFRA遺伝子のp.D842V突然変異、KIT遺伝子のp.D816V突然変異、EGFR遺伝子のp.T790M、p.L858Rおよびp.L861Q突然変異、MET遺伝子のp.Y1253D突然変異、BRAF遺伝子のp.V600Gおよびp.V600M突然変異、JAK2遺伝子のp.V617F突然変異、GNAQ遺伝子のp.Q209L突然変異、ABL1遺伝子のp.T315I突然変異、FGFR2遺伝子のp.S252W突然変異、KRAS遺伝子のp.A146T、p.Q61H、p.Q61L、p.G12A、p.G12D、p.G12V、p.G12C、p.G12Rおよびp.G12S突然変異、FLT3遺伝子のp.D835Y突然変異、MEK1/MAP2K1遺伝子のp.P124L突然変異、IDH2遺伝子のp.R172Kおよびp.R140Q突然変異とGNA11遺伝子のp.Q209L突然変異である。標準物質は3回、参照標準物質は1回塩基配列分析した。その結果で、実施例およびそれぞれの比較例では3個の標準物質に対する塩基配列分析データ(Rep.1、Rep.2およびRep.3)が用いられた。具体的に、以下では、Rep.1とRep.2を組み合わせた(a)、Rep.1とRep.3を組み合わせた(b)、Rep.2とRep.3を組み合わせた(c)とRep.1、Rep.2およびRep.3を組み合わせた(d)の分析結果が示される。
図4aは、本発明の一実施形態による塩基配列の変異検出方法および従来の検出方法をIllumina SureSelect癌パネルに適用することによって評価された結果を示したものである。図4bは、本発明の一実施形態による塩基配列の変異検出方法および従来の検出方法をIon AmpliSeq癌パネルに適用することによって評価された結果を示したものである。
図4aの(a)を参照すれば、本発明の検出方法および4個の従来の検出方法をIllumina SureSelect癌パネルおよびIllumina hybrid−captureに適用し、これら方法に対して評価した結果がマトリックス上に示される。この時、マトリックス内のそれぞれの升目は突然変異を検出した場合に空欄で、突然変異を検出しなかった場合にハッチングで表示される。具体的に、実施例1の評価結果では比較例1〜比較例4と対照的に、35個の突然変異を全て検出したと示される。比較例1〜比較例4の結果を参照すれば、従来の検出方法を適用したIllumina SureSelect癌パネルの場合、NRAS遺伝子のp.Q61Lおよびp.Q61R突然変異、BRAF遺伝子のp.V600G突然変異、KRAS遺伝子のp.G12A、p.G12D、p.G12V、p.G12C、p.G12Rおよびp.G12S突然変異とFLT3遺伝子のp.D835Y突然変異を全て検出しなかった。特に、従来の検出方法は大部分、以上の突然変異に対してコールしないか(Nocall)、突然変異サイトを三重対立サイト(Triallelic site)と認識したと示される。図4aの(b)を参照すれば、実施例1評価結果での偽陽性比率は比較例1〜比較例4の結果での偽陽性比率より約2〜3倍低いと示される。即ち、本発明の一実施形態による塩基配列変異検出方法は、Illumina SureSelect癌パネルに適用した時、低い偽陽性比率を示すだけでなく、敏感度高い突然変異検出を提供することができる。
図4bの(a)を参照すれば、本発明の検出方法および4個の従来の検出方法をIon Ampliseq癌パネルおよびIonTorrent Ampliconに適用し、これら方法に対して評価した結果がマトリックス上に示す。この時、マトリックス内のそれぞれの升目は突然変異を検出した場合に空欄で、突然変異を検出しなかった場合にハッチングで表示される。具体的に、実施例1の評価結果では、NRAS遺伝子のp.Q61L突然変異に対して分析エラーと誤ってコールした結果(Misjudgement as an error)とPIK3CA遺伝子のp.E545K突然変異に対してこれらに対する座が参照塩基配列と過度にマッチングされなかった結果(Excessive mismatches)を除いた、残りの全ての突然変異は検出されたと示される。これと対照的に、比較例1〜比較例4の結果を参照すれば、従来の検出方法を適用したIon Ampliseq癌パネルの場合、NRAS遺伝子のp.Q61Lおよびp.Q61R突然変異、KIT遺伝子のp.D816V突然変異、BRAF遺伝子のp.V600G突然変異、KRAS遺伝子のp.G12A、p.G12D、p.G12V、p.G12C、p.G12Rおよびp.G12S突然変異を検出しなかったと示される。特に、従来の検出方法は大部分、以上の突然変異に対してコールしないか(No call)、突然変異サイトを三重対立サイト(Triallelic site)に認識したと示される。図4bの(b)を参照すれば、実施例1の評価結果での偽陽性比率は、比較例1〜比較例4の結果での偽陽性比率より最大40倍差が出ると示される。即ち、本発明の一実施形態による塩基配列変異検出方法は、Illumina SureSelect癌パネルに適用した時の結果(図4a)と同様に、Ion Ampliseq癌パネルに適用した場合も、低い偽陽性比率を示すだけでなく、敏感度高い突然変異検出を提供することができる。
以下では、図4cを参照して、本発明の一実施形態による、塩基配列変異検出方法で提供する、予め決定された塩基配列変異候補と決定された塩基配列変異候補の一致有無の情報を提供する段階を具体的に説明する。この時、対象サンプルは脳疾患サンプルを使用し、各サンプル内で癌パネルが提供する遺伝子に対して新しく発見された突然変異に対する分析が行われる。より具体的に、本分析にはddPCR(droplet digital PCR)が用いられ、それぞれのドロップレット(droplet)はDNA一鎖を含むことができ、それぞれのドロップレットに対してPCRが行われることによって、ドロップレットが含むDNA鎖に対する突然変異存在の有無が確認できる。また、本分析ではバックグラウンドノイズ(background noise)を確認するための空のドロップレット(No template)、変異がないサンプルのDNAを含むドロップレット(Negative)、脳疾患サンプルに対して突然変異のDNAを含むことができるドロップレット(Sample)に対してddPCRが行われる。
図4cは、本発明の一実施形態による、塩基配列変異検出方法を適用して検出した新たな低頻度の変異に対する評価結果を示したものである。この時、それぞれの点は一つのドロップレットを意味することができ、DNAを含まないドロップレットは黒色、正常のDNAを含むドロップレットは緑色、突然変異のDNAを含むドロップレットは青色、一つのドロップレットに正常のDNAと突然変異のDNAを共に含むドロップレットはオレンジ色で表示される。
具体的に、脳疾患サンプルに対して本発明の一実施形態による、塩基配列変異検出方法を適用した時、既存の方法が検出しなかった、TSC1遺伝子のp.G9673V突然変異、AKT3遺伝子のp.E275*突然変異、TSC2遺伝子のp.H777N突然変異、PIK3CA遺伝子のp.R832L突然変異、BRAF遺伝子のp.V600E突然変異、MTOR遺伝子のp.S2215F突然変異の新たな低頻度の突然変異が発見された。これら突然変異に対する分析結果、脳疾患サンプルに対してTSC1遺伝子のp.G9673V突然変異、AKT3遺伝子のp.E275*突然変異、TSC2遺伝子のp.H777N突然変異、PIK3CA遺伝子のp.R832L突然変異、BRAF遺伝子のp.V600E突然変異、MTOR遺伝子のp.S2215F突然変異座に対してTSC2遺伝子のp.H777N突然変異を除いた残り5個の突然変異座で突然変異DNAを有するドロップレットが現れた。その結果として、本発明の一実施形態による、塩基配列変異検出方法によって決定された塩基配列変異候補は敏感度高い検出が提供されることによって、遺伝子パネルが提供する塩基配列変異と異なる新たな塩基配列変異が検出できる。これにより、本発明の一実施形態による、塩基配列変異検出方法では、決定された塩基配列変異候補と予め決定された塩基配列変異の一致有無を確認することができる。さらに、決定された塩基配列変異候補が特定疾患に対して新しく明らかになった塩基配列変異である場合、目的遺伝子に対する新たな塩基配列変異候補とその遺伝子座に関する情報をさらに提供することができる。
以上の実施例1の結果として、本発明の一実施形態による、遺伝子パネルに適用可能な塩基配列の変異検出方法およびこれを用いた塩基配列の変異検出デバイスは、一つの対象サンプルに対する複数回の塩基配列分析、塩基配列変異類型を考慮した突然変異確率値補正することによって、より効果的に低頻度の突然変異を検出することができるのを確認した。特に、本発明の一実施形態による塩基配列の変異検出方法は、Illumina SureSelect癌パネルおよびIon Ampliseq癌パネルに適用した全ての結果で、塩基配列変異が高い敏感度および正確度で検出できた。これと共に、本発明の一実施形態による塩基配列の変異検出方法は、低い偽陽性比率を維持して検出のエラーが減少するのを確認することができた。これにより、本発明の一実施形態による、塩基配列変異検出方法およびデバイスは、多様な遺伝子パネルに適用された時、塩基配列変異検出において、敏感度だけでなく、精密度高い分析を提供することができる効果がある。
実施例2:本発明の塩基配列の変異検出方法に対する評価−多重塩基配列分析プラットフォーム
以下では、図5を参照して、本発明の一実施形態による塩基配列の変異検出方法と従来の検出方法を複数の分析プラットフォームに適用した結果を説明する。本評価で、従来の検出方法はBAMerge、UnionおよびIntersectionを用いた。BAMergeおよびIntersectionは実施例1の評価に用いられた方法と同一な塩基配列変異検出方法であり、Unionは複数の塩基配列分析データの和集合に基づいて、塩基配列変異を決定する検出方法であり得る。説明の簡明さのために、本発明の一実施形態による塩基配列の変異検出方法を適用した癌パネルに対する評価を実施例1、BAMergeを適用した癌パネルに対する評価を比較例1、Unionを適用した癌パネルに対する評価を比較例2、Intersectionを適用した癌パネルに対する評価を比較例3と示して説明する。実施例1、比較例1〜比較例3では検出の精密度、リコール(Recall)、検出の正確率および再現率と関連があるF−点数が評価された。
図5は、複数の分析プラットフォームで塩基配列分析されたデータを、本発明の一実施形態による塩基配列の変異検出方法および従来の検出方法を適用して評価された結果を示したものである。
図5の(a)を参照すれば、同一な目的遺伝子に対してIllumina hybrid−captureおよびIllumina Ampliconを用いて、それぞれ相異なる分析プラットフォームで塩基配列分析された、複数個の塩基配列データを本発明の一実施形態による塩基配列の変異検出方法および従来の検出方法を適用して評価された結果が示される。実施例1では比較例3の精密度の次に高い値を有すると示される。また、実施例1でのF−点数は全ての比較例1〜比較例3より高い値を有し、特に、比較例1および比較例2のF−点数より約70倍高いF−点数が示される。
図5の(b)を参照すれば、同一な目的遺伝子に対してIllumina hybrid−captureおよびIonTorrent Ampliconを用いて、それぞれ相異なる分析プラットフォームで塩基配列分析された、複数個の塩基配列データを本発明の一実施形態による塩基配列の変異検出方法および従来の検出方法を適用して評価された結果が示される。実施例1では比較例3の精密度と類似した水準の値を示すことによって、比較例1および比較例2より非常に高い精密度が示される。実施例1でのF−点数は全ての比較例1〜比較例3より高く示される。実施例1でのリコール数は、比較例3の次に低かった。
図5の(c)を参照すれば、同一な目的遺伝子に対してIllumina AmpliconおよびIonTorrent Ampliconを用いて、それぞれ相異なる分析プラットフォームで塩基配列分析された、複数個の塩基配列データを本発明の一実施形態による塩基配列の変異検出方法および従来の検出方法を適用して評価された結果が示される。実施例1では比較例1〜比較例3より高い精密度が示される。特に、実施例1での精密度は比較例1および比較例2での精密度より約60倍高い精密度が示される。また、実施例1でのF−点数は全ての比較例1〜比較例3より高く示され、実施例1でのリコール数は比較例1〜比較例3より低く示される。
以上の実施例2の結果として、本発明の一実施形態による塩基配列変異検出方法は遺伝子パネルに適用される時、塩基配列分析においてプラットフォーム類型に制限されず、分析された塩基配列データによって適当に補正された方法で算出された突然変異確率値を提供することによって、塩基配列変異候補を決定して、向上した精密度で塩基配列変異を検出することができる効果がある。
比較例1:従来の低頻度突然変異の検出方法に対する評価
以下では、図6a、6bおよび図6cを参照して、従来の塩基配列の変異検出方法を説明する。
図6aは、従来の塩基配列の変異検出方法をIllumina hybrid−captureに適用することによって測定された、変異検出の敏感度および偽陽性比率の結果を示したものである。図6bは、従来の塩基配列の変異検出方法をIllumina Ampliconに適用することによって測定された、変異検出の敏感度および偽陽性比率の結果を示したものである。図6cは、従来の塩基配列の変異検出方法をIonTorrent Ampliconに適用することによって測定された、変異検出の敏感度および偽陽性比率の結果を示したものである。
具体的に、従来の体細胞突然変異の検出方法は、体細胞突然変異検出方法の一つであるMuTectを用いて、低頻度で現れる体細胞突然変異を検出しようとした。
これに対する評価のために4個のサンプルを用いる。具体的に、A血液サンプルにB血液サンプルを連続希釈して、0.5%のB血液サンプルが入っているA血液サンプル、1%のB血液サンプルが入っているA血液サンプル、5%のB血液サンプルが入っているA血液サンプルおよび10%のB血液サンプルが入っているA血液サンプルを準備して、人工体細胞突然変異サンプルを準備する。即ち、A血液サンプルに対してB血液サンプルは体細胞突然変異であってもよく、その4個濃度は、体細胞突然変異の頻度を意味することができる。
その次に、準備された4個の人工体細胞突然変異サンプルに対してMuTectをIllumina hybrid−capture、Illumina AmpliconおよびIonTorrent Ampliconの分析プラットフォームに適用して評価する。
図6aを参照すれば、0.5%のB血液サンプルが入っているA血液サンプルに対して検出の敏感度が他の濃度に比べて低いことが分かる。また、デプスが高まることによって、偽陽性比率も共に増加するのを確認することができる。即ち、MuTectを適用したIllumina hybrid−captureの場合、低頻度の体細胞突然変異検出に対して検出敏感度が落ちることが分かる。
図6bを参照すれば、0.5%のB血液サンプルが入っているA血液サンプルに対して検出の敏感度は他の濃度に比べて低いが、図5aのIllumina hybrid−captureに適用した結果よりは、濃度別敏感度の差が大きくないことが分かる。しかし、偽陽性比率はデプスが高まることによって、4個濃度のサンプル全てで大きく増加するのを確認することができる。即ち、MuTectを適用したIllumina hybrid−captureの場合、低頻度の体細胞突然変異検出のためにデプスを高めた時、検出のエラーが現れる確率が高くなり得る。
図6cを参照すれば、0.5%のB血液サンプルが入っているA血液サンプルに対して検出の敏感度は他の濃度に比べて大きく低く、デプスが高まることによって偽陽性比率も上昇するのを確認することができる。
以上の比較例1の結果として、既存の体細胞突然変異検出方法を適用した分析プラットフォーム全て、低頻度の体細胞突然変異の検出に対して、検出の敏感度が低いことがあり、デプスが高まることによって偽陽性比率が高まって分析のエラーも、増加することがある。即ち、従来の塩基配列の変異検出方法は遺伝子パネルに適用した時、低調な敏感度で低頻度の塩基配列変異を検出することができる。これにより、従来の塩基配列の変異検出方法は遺伝子パネルに適用される場合、低頻度で存在する疾患に関連した突然変異を探索するのに適しないことがある。
以上、添付された図面を参照して本発明の実施例をさらに詳細に説明したが、本発明は必ずしもこのような実施例で限定されるのではなく、本発明の技術思想を逸脱しない範囲内で多様に変形実施できる。したがって、本発明に開示された実施例は本発明の技術思想を限定するためのものでなく、説明するためのものであり、このような実施例によって本発明の技術思想の範囲が限定されるのではない。したがって、以上で記述した実施例は全ての面で例示的なものであり、限定的ではないと理解しなければならない。本発明の保護範囲は下記の請求範囲によって解釈されなければならなく、それと同等な範囲内にある全ての技術思想は本発明の権利範囲に含まれると解釈されなければならないはずである。
以下、本発明の実施形態を示す。
(1)複数の目的遺伝子に対するプローブ(probe)を含む遺伝子パネル(gene
panel)を用いて、一つの対象サンプルに対して前記複数の目的遺伝子を獲得する段階;
次世代塩基配列分析(NGS、next generation sequencing)を用いて、前記複数の目的遺伝子それぞれを複数回塩基配列分析して、前記複数の目的遺伝子それぞれに対する同一な塩基配列または同一でない塩基配列を含む、複数個の塩基配列を収集する段階;
参照塩基配列と前記複数個の塩基配列をマッチング(matching)する段階;
前記複数個の塩基配列のうち、前記複数の目的遺伝子に対して前記参照塩基配列とマッチングされない塩基配列を決定する段階;および
前記マッチングされない塩基配列の統計的分析によって補正された算出方式で算出された、前記マッチングされない塩基配列内の一致しない遺伝子座(locus)に対する突然変異確率値に基づいて、前記対象サンプル内の前記複数の目的遺伝子に対する塩基配列変異候補を決定する段階を含む、塩基配列の変異検出方法。
(2)予め決定された塩基配列変異を獲得する段階;および
前記塩基配列変異候補と予め決定された塩基配列変異をマッチングすることによって、前記塩基配列変異候補と前記予め決定された塩基配列変異の一致有無の情報を提供する段階をさらに含む、(1)に記載の塩基配列の変異検出方法。
(3)前記塩基配列変異候補が前記予め決定された塩基配列変異と異なり、前記塩基配列変異候補の遺伝子座が前記予め決定された塩基配列変異の遺伝子座と異なる場合、
前記予め決定された塩基配列変異と異なる前記塩基配列変異候補およびその遺伝子座に関する情報を提供する段階をさらに含む、(2)に記載の塩基配列の変異検出方法。
(4)前記次世代塩基配列分析は、複数の分析プラットフォームによる次世代塩基配列分析であり、
前記複数個の塩基配列を収集する段階は、前記複数の分析プラットフォームによって行われ
前記同一な塩基配列または同一でない塩基配列それぞれは互いに異なる分析プラットフォームで分析された、複数個の塩基配列を収集する段階を含む、(1)に記載の塩基配列の変異検出方法。
(5)前記目的遺伝子が癌連関遺伝子である場合、前記塩基配列変異候補を決定する段階は、癌治療効果に対する前記塩基配列変異候補と抗ガン剤の相関関係を確認する段階をさらに含む、(1)に記載のい塩基配列の変異検出方法。
(6)前記相関関係を確認する段階は、前記抗ガン剤の作用の対象になる標的塩基配列変異を確認する段階を含む、(5)に記載の塩基配列の変異検出方法。
(7)前記塩基配列変異候補を決定する段階は、
前記マッチングされない塩基配列の統計的分析によって補正された算出方式で算出された、前記マッチングされない塩基配列内の一致しない遺伝子座に対する突然変異確率値および分析エラー確率値に基づいて、前記対象サンプル内の前記目的遺伝子に対する塩基配列変異候補を決定する段階をさらに含む、(1)に記載の塩基配列の変異検出方法。
(8)前記分析エラー確率値は、
前記遺伝子パネルの分析プラットフォーム(platform)類型によって塩基配列の変異類型別分析エラーおよび前記分析エラーのbase call quality点数を含む分析エラープロファイルを決定し、
前記分析エラープロファイルに基づいて、少なくとも一つの塩基配列の変異類型に対する分析エラー確率値が補正された、(7)に記載の塩基配列の変異検出方法。
(9)前記分析エラープロファイルは、
前記一致しない遺伝子座の前、後に存在する塩基配列の情報をさらに含む、(8)に記載の塩基配列の変異検出方法。
(10)前記分析プラットフォーム類型がIllumina塩基配列分析プラットフォームである場合、前記塩基配列の変異類型別分析エラーのうちのAからGへの変異、Tから
Cへの変異、AからTへの変異、TからAへの変異、CからTへの変異およびGからAへの変異、CからAへの変異およびGからTへの変異類型に対する分析エラーの確率は、残り塩基配列の変異類型の分析エラーの確率より高い、(8)に記載の塩基配列の変異検出方法。
(11)前記分析プラットフォーム類型がIonTorrent塩基配列分析プラットフォームである場合、前記塩基配列の変異類型のうちのAでGに変異、TからCへの変異、CからAへの変異、GからTへの変異、GからAへの変異およびCからTへの変異類型に対する分析エラーの確率は、残り塩基配列の変異類型の分析エラーの確率より高い、(8)に記載の塩基配列の変異検出方法。
(12)前記塩基配列変異候補を決定する段階は、前記一致しない遺伝子座の前記分析エラー確率値に対する前記突然変異確率値の比率に基づいて、前記対象サンプル内の前記目的遺伝子に対する塩基配列変異候補を決定する段階をさらに含む、(7)に記載の塩基配列の変異検出方法。
(13)前記比率は、下記数式1で算出される、(12)に記載の塩基配列の変異検出方法:
[数式1]
Figure 0006983307
(ここで、kは複数個の塩基配列の個数であり、X はi番目遺伝子座に対するBAF(B allele frequency)値であり、Mutは突然変異であり、TEは分析エラーである。)
(14)前記目的遺伝子は、
ABL1、AKT1、ALK、APC、ATM、BRAF、CDH1、CDKN2A、CSF1R、CTNNB1、EGFR、ERBB2、ERBB4、FBXW7、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、KRAS、MET、MLH1、MPL、NOTCH1、NPM1、NRAS、PDGFRA、PIK3CA、PTEN、PTPN11、RB1、RET、SMAD4、SMARCB1、SMO、SRC、STK11、TP53またはVHL遺伝子のうちの少なくとも一つである、(1)に記載の塩基配列の変異検出方法。
(15)前記塩基配列変異は、低頻度体細胞突然変異である、(1)に記載の塩基配列の変異検出方法。
(16)前記参照塩基配列は、前記対象サンプルと同一な目的遺伝子座に対して、塩基配列変異を含まない塩基配列である、(1)に記載の塩基配列の変異検出方法。
(17)前記統計的分析は、前記複数個の塩基配列それぞれに対する一致しない遺伝子座のBAF値の標準偏差および平均値のうちの少なくとも一つを用いる、(1)に記載の塩基配列の変異検出方法。
(18)通信部と動作可能に連結されたプロセッサーを含み、
前記プロセッサーは、前記通信部を通じて複数の目的遺伝子に対するプローブを含む遺伝子パネルを用いて、一つの対象サンプルに対して前記複数の目的遺伝子を獲得し、
次世代塩基配列分析を用いて、前記複数の目的遺伝子それぞれを複数回塩基配列分析して、前記複数の目的遺伝子それぞれに対する同一な塩基配列または同一でない塩基配列を含む、複数個の塩基配列を収集し、
参照塩基配列と前記複数個の塩基配列をマッチングし、
前記複数個の塩基配列のうち、前記複数の目的遺伝子に対して前記参照塩基配列とマッチングされない塩基配列を決定し、
前記マッチングされない塩基配列の統計的分析によって補正された算出方式で算出された、前記マッチングされない塩基配列内の一致しない遺伝子座に対する突然変異確率値に基づいて、前記対象サンプル内の前記目的遺伝子に対する塩基配列変異候補を決定するように構成された、塩基配列の変異検出デバイス。
(19)前記プロセッサーは、前記塩基配列変異候補と予め決定された塩基配列変異をマッチングすることによって、前記塩基配列変異候補と前記予め決定された塩基配列変異の一致有無の情報をさらに提供するように構成された、(18)に記載の塩基配列の変異検出デバイス。
(20)前記プロセッサーは、前記塩基配列変異候補が前記予め決定された塩基配列変異と異なり、前記塩基配列変異候補の遺伝子座が前記予め決定された塩基配列変異の遺伝子座と異なる場合、
前記予め決定された塩基配列変異と異なる前記塩基配列変異候補およびその遺伝子座に関する情報をさらに提供するように構成された、(19)に記載の塩基配列の変異検出デバイス。
(21)前記プロセッサーは、前記マッチングされない塩基配列の統計的分析によって補正された算出方式で算出された、前記マッチングされない塩基配列内の一致しない遺伝子座に対する突然変異確率値および分析エラー確率値に基づいて、前記対象サンプル内の前記複数の目的遺伝子に対する塩基配列変異候補を決定するように構成された、(18)に記載の塩基配列の変異検出デバイス。
(22)前記プロセッサーは、前記一致しない遺伝子座の前記分析エラー確率値に対する前記突然変異確率値の比率に基づいて、前記対象サンプル内の前記目的遺伝子に対する塩基配列変異候補を決定するようにさらに構成された、(21)に記載の塩基配列の変異検出デバイス。
(23)前記比率は、下記数式1で算出される、(22)に記載の塩基配列の変異検出デバイス:
[数式1]
Figure 0006983307
(ここで、kは複数個の塩基配列の個数であり、X はi番目遺伝子座に対するBAF(B allele frequency)値であり、Mutは突然変異であり、TEは分析エラーである。)
100:塩基配列の変異検出デバイス
110:通信部
120:入力部
130:表示部
140:保存部
150:プロセッサー
S210:獲得する段階
S220:収集する段階
S230:マッチングする段階
S240:マッチングされない塩基配列を決定する段階
S250:塩基配列変異候補を決定する段階
S310:分析エラープロファイルを決定する段階
S320:分析エラー確率値を補正する段階

Claims (23)

  1. 複数の目的遺伝子それぞれに対するプローブ(probe)の混成化反応(hybridization)を用いて、一つの対象サンプルに対して前記複数の目的遺伝子を獲得する段階であって、プローブが付着された前記複数の目的遺伝子は増幅されることで、塩基配列分析のためのライブラリーが製作されるものである、前記段階
    前記複数の目的遺伝子を用いたライブラリー製作を実施する段階;
    次世代塩基配列分析(NGS、next generation sequencing)を用いて、前記複数の目的遺伝子それぞれを複数回塩基配列分析して、前記複数の目的遺伝子それぞれについての複数個の塩基配列を産生する段階であって、前記複数個の塩基配列は、ライブラリー製作で発生した分析エラー及び塩基配列分析エラーに起因して、前記複数の目的遺伝子それぞれに対する同一な塩基配列又は同一でない塩基配列を含む、前記段階
    前記複数の目的遺伝子それぞれについての参照塩基配列と前記複数個の塩基配列をマッチング(matching)して、前記複数個の塩基配列のうち、前記複数の目的遺伝子それぞれについての前記参照塩基配列とマッチングされない塩基配列、及び前記マッチングされない塩基配列における一致しない遺伝子座(gene locus)を決定する段
    階であって、マッチングされないことは、前記複数個と前記参照塩基配列との間で検出される、前記段階;及び
    前記マッチングされない塩基配列内の前記一致しない遺伝子座に対する突然変異確率値及び分析エラー確率値に基づいて、前記対象サンプル内の前記複数の目的遺伝子に対する塩基配列変異候補を決定する段階であって、前記確率値は、前記マッチングされない塩基配列の統計的分析によって補正された算出方式で算出されたものである、前記段階、
    を含み、
    前記塩基配列変異は、1%以下の低頻度体細胞突然変異である、
    塩基配列の変異検出方法。
  2. 予め決定された塩基配列変異を獲得する段階;及び
    前記塩基配列変異候補と予め決定された塩基配列変異をマッチングすることによって、前記塩基配列変異候補と前記予め決定された塩基配列変異の一致有無の情報を提供する段階、
    をさらに含む、請求項1に記載の塩基配列の変異検出方法。
  3. 前記塩基配列変異候補が前記予め決定された塩基配列変異と異なり、又は前記塩基配列変異候補の遺伝子座が前記予め決定された塩基配列変異の遺伝子座と異なる場合に、前記予め決定された塩基配列変異及びその遺伝子座と異なる前記塩基配列変異候補及びその遺伝子座に関する情報を提供する段階をさらに含む、請求項2に記載の塩基配列の変異検出方法。
  4. 前記次世代塩基配列分析は、異なる分析プラットフォームで行われる、請求項1に記載の塩基配列の変異検出方法。
  5. 前記目的遺伝子が癌連関遺伝子である場合、前記塩基配列変異候補を決定する段階は、癌治療効果に対する前記塩基配列変異候補と抗癌剤の相関関係を確認する段階をさらに含む、請求項1に記載の塩基配列の変異検出方法。
  6. 前記分析エラー確率値は、塩基配列の変異類型を考慮して補正された値で提供される、請求項1に記載の塩基配列の変異検出方法。
  7. 分析エラープロファイルを、分析エラー及び塩基配列の変異類型あたりの塩基配列分析エラーを含む全体のエラーに対する分析エラーの比率に基づいて決定する、請求項1に記載の塩基配列の変異検出方法。
  8. 前記突然変異確率値は、所与の一致しない遺伝子座が真正の体細胞突然変異を有することであり、且つ、前記分析エラー確率値は、マッチングされない塩基を有する一致しない遺伝子座がライブラリー製作で発生した分析エラーから発生されることである、請求項1に記載の塩基配列の変異検出方法。
  9. 前記一致しない遺伝子座についての分析エラー確率値は、
    分析プラットフォーム類型によって塩基配列の変異類型別分析エラー及び前記分析エラーのbase call quality点数を含む分析エラープロファイルを決定し、
    前記分析エラープロファイルに基づいて、前記マッチングされない塩基配列のそれぞれの塩基配列の変異類型に対して補正されたものである、請求項8に記載の塩基配列の変異検出方法。
  10. 前記分析エラープロファイルは、前記一致しない遺伝子座の前、後に存在する塩基配列の情報をさらに含む、請求項9に記載の塩基配列の変異検出方法。
  11. 前記分析プラットフォーム類型がIllumina hybrid−capture塩基配列分析プラットフォームである場合、前記塩基配列の変異類型別分析エラーのうちのCからAへの変異及びGからTへの変異類型に対する分析エラー確率値は、残り塩基配列の変異類型の分析エラー確率値より高い、請求項9に記載の塩基配列の変異検出方法。
  12. 前記分析プラットフォーム類型がIllumina amplicon塩基配列分析プラットフォームである場合、前記塩基配列の変異類型別分析エラーのうちのAからGへの変異、TからCへの変異、AからTへの変異、TからAへの変異、CからTへの変異、GからAへの変異類型に対する分析エラー確率値は、残り塩基配列の変異類型の分析エラー確率値より高い、請求項9に記載の塩基配列の変異検出方法。
  13. 前記分析プラットフォーム類型がIonTorrent amplicon塩基配列分析プラットフォームである場合、前記塩基配列の変異類型のうちのAからGへの変異、T
    からCへの変異、CからAへの変異、GからTへの変異、GからAへの変異及びCからTへの変異類型に対する分析エラー確率値は、残り塩基配列の変異類型の分析エラー確率値より高い、請求項9に記載の塩基配列の変異検出方法。
  14. 前記統計的分析は、前記複数個の塩基配列それぞれに対する一致しない遺伝子座のBAF値の標準偏差及び平均値のうちの少なくとも一つを用いる、請求項1に記載の塩基配列の変異検出方法。
  15. 前記塩基配列変異候補を決定する段階は、前記一致しない遺伝子座の前記分析エラー確率値に対する前記突然変異確率値の比率に基づいて行われる、請求項1に記載の塩基配列の変異検出方法。
  16. 前記比率は、下記数式1で算出される、請求項15に記載の塩基配列の変異検出方法:
    [数式1]
    Figure 0006983307
    (ここで、kは複数個の塩基配列の個数であり、Xはi番目遺伝子座に対するBAF(B allele frequency)値であり、Mutは突然変異であり、TEは分析エラーである)。
  17. 前記参照塩基配列は、前記対象サンプルと同一な目的遺伝子に対して、塩基配列変異を含まない塩基配列である、請求項1に記載の塩基配列の変異検出方法。
  18. 通信部と動作可能に連結されたプロセッサーを含み、
    前記プロセッサーは、
    前記通信部を通じて複数の目的遺伝子それぞれに対するプローブの混成化反応を用いて、一つの対象サンプルに対して前記複数の目的遺伝子を獲得し、ここで、プローブが付着された前記複数の目的遺伝子は増幅されることで、塩基配列分析のためのライブラリーが製作されるものであり、
    前記複数の目的遺伝子を用いたライブラリー製作を実施し、
    次世代塩基配列分析(NGS)を用いて、前記複数の目的遺伝子それぞれを複数回塩基配列分析して、前記複数の目的遺伝子それぞれについての複数個の塩基配列を産生し、ここで、前記複数個の塩基配列は、ライブラリー製作で発生した分析エラー及び塩基配列分析エラーに起因して、前記複数の目的遺伝子それぞれに対する同一な塩基配列又は同一でない塩基配列を含み、
    前記複数の目的遺伝子それぞれについての参照塩基配列と前記複数個の塩基配列をマッチングして、前記複数個の塩基配列のうち、前記複数の目的遺伝子それぞれについての前記参照塩基配列とマッチングされない塩基配列、及び前記マッチングされない塩基配列における一致しない遺伝子座を決定し、ここで、マッチングされないことは、前記複数個と前記参照塩基配列との間で検出されるものであり、且つ、
    前記マッチングされない塩基配列内の前記一致しない遺伝子座に対する突然変異確率値及び分析エラー確率値に基づいて、前記対象サンプル内の前記複数の目的遺伝子に対する塩基配列変異候補を決定する、ここで、前記確率値は、前記マッチングされない塩基配列の統計的分析によって補正された算出方式で算出されたものである、
    ように構成されたものであり、
    前記塩基配列変異は、1%以下の低頻度体細胞突然変異である、
    塩基配列の変異検出デバイス。
  19. 前記プロセッサーは、前記塩基配列変異候補と予め決定された塩基配列変異をマッチングすることによって、前記塩基配列変異候補と前記予め決定された塩基配列変異の一致有無の情報をさらに提供するように構成されたものである、請求項18に記載の塩基配列の変異検出デバイス。
  20. 前記プロセッサーは、前記塩基配列変異候補が前記予め決定された塩基配列変異と異なり、又は前記塩基配列変異候補の遺伝子座が前記予め決定された塩基配列変異の遺伝子座と異なる場合、前記予め決定された塩基配列変異及びその遺伝子座と異なる前記塩基配列変異候補及びその遺伝子座に関する情報をさらに提供するように構成されたものである、請求項19に記載の塩基配列の変異検出デバイス。
  21. 前記突然変異確率値は、所与の一致しない遺伝子座が真正の体細胞突然変異を有することであり、且つ、前記分析エラー確率値は、マッチングされない塩基を有する一致しない遺伝子座がライブラリー製作で発生した分析エラーから発生されることである、請求項18に記載の塩基配列の変異検出デバイス。
  22. 前記プロセッサーは、前記一致しない遺伝子座の前記分析エラー確率値に対する前記突然変異確率値の比率に基づいて、塩基配列変異候補を決定するようにさらに構成されたものである、請求項18に記載の塩基配列の変異検出デバイス。
  23. 前記比率は、下記数式1で算出される、請求項22に記載の塩基配列の変異検出デバイス:
    [数式1]
    Figure 0006983307
    (ここで、kは複数個の塩基配列の個数であり、Xはi番目遺伝子座に対するBAF(B allele frequency)値であり、Mutは突然変異であり、TEは分析エラーである)。
JP2020506731A 2017-08-07 2018-08-06 遺伝子パネルに基づいた塩基配列の変異検出方法およびこれを用いた塩基配列の変異検出デバイス Active JP6983307B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020170099822A KR102035615B1 (ko) 2017-08-07 2017-08-07 유전자 패널에 기초한 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스
KR10-2017-0099822 2017-08-07
PCT/KR2018/008891 WO2019031785A2 (ko) 2017-08-07 2018-08-06 유전자 패널에 기초한 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스

Publications (2)

Publication Number Publication Date
JP2020529851A JP2020529851A (ja) 2020-10-15
JP6983307B2 true JP6983307B2 (ja) 2021-12-17

Family

ID=65271775

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020506731A Active JP6983307B2 (ja) 2017-08-07 2018-08-06 遺伝子パネルに基づいた塩基配列の変異検出方法およびこれを用いた塩基配列の変異検出デバイス

Country Status (7)

Country Link
US (1) US20200370104A1 (ja)
EP (1) EP3667671A4 (ja)
JP (1) JP6983307B2 (ja)
KR (1) KR102035615B1 (ja)
AU (1) AU2018315982B2 (ja)
CA (1) CA3072052C (ja)
WO (1) WO2019031785A2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109994155B (zh) * 2019-03-29 2021-08-20 北京市商汤科技开发有限公司 一种基因变异识别方法、装置和存储介质
WO2020257605A1 (en) * 2019-06-21 2020-12-24 Coopersurgical, Inc. Systems and methods for using density of single nucleotide variations for the verification of copy number variations in human embryos
KR102319447B1 (ko) * 2019-11-28 2021-10-29 주식회사 쓰리빌리언 Ngs를 이용한 열성유전병 원인 유전변이 판별 방법 및 장치
KR102572274B1 (ko) * 2021-01-29 2023-08-29 대한민국 염기서열 시퀀싱 데이터 분석 장치 및 그 동작 방법
CN113628683B (zh) * 2021-08-24 2024-04-09 慧算医疗科技(上海)有限公司 一种高通量测序突变检测方法、设备、装置及可读存储介质
KR20240046964A (ko) 2022-10-04 2024-04-12 대한민국(농촌진흥청장) 차세대 시퀀싱 데이터의 염기서열 변이 선별 방법 및 장치

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012092426A1 (en) * 2010-12-30 2012-07-05 Foundation Medicine, Inc. Optimization of multigene analysis of tumor samples
US20150073724A1 (en) * 2013-07-29 2015-03-12 Agilent Technologies, Inc Method for finding variants from targeted sequencing panels
CN106103736B (zh) * 2013-10-15 2020-03-03 瑞泽恩制药公司 高分辨率等位基因鉴定
WO2015173222A1 (en) * 2014-05-12 2015-11-19 Roche Diagnostics Gmbh Rare variant calls in ultra-deep sequencing
CN107075730A (zh) * 2014-09-12 2017-08-18 利兰·斯坦福青年大学托管委员会 循环核酸的鉴定及用途
KR101638473B1 (ko) * 2014-12-26 2016-07-12 연세대학교 산학협력단 차세대 염기서열 분석법을 기반으로 하는 결실 유전자군 검출 방법
WO2016139534A2 (en) * 2015-03-02 2016-09-09 Strand Life Sciences Private Limited Apparatuses and methods for determining a patient's response to multiple cancer drugs

Also Published As

Publication number Publication date
KR102035615B1 (ko) 2019-10-23
AU2018315982B2 (en) 2021-11-04
EP3667671A4 (en) 2020-07-22
KR20190015957A (ko) 2019-02-15
AU2018315982A1 (en) 2020-02-27
WO2019031785A2 (ko) 2019-02-14
EP3667671A2 (en) 2020-06-17
US20200370104A1 (en) 2020-11-26
CA3072052A1 (en) 2019-02-14
WO2019031785A9 (ko) 2019-07-11
WO2019031785A3 (ko) 2019-05-23
JP2020529851A (ja) 2020-10-15
CA3072052C (en) 2023-04-04

Similar Documents

Publication Publication Date Title
JP6983307B2 (ja) 遺伝子パネルに基づいた塩基配列の変異検出方法およびこれを用いた塩基配列の変異検出デバイス
Shin et al. Prevalence and detection of low-allele-fraction variants in clinical cancer samples
Plagnol et al. Analytical validation of a next generation sequencing liquid biopsy assay for high sensitivity broad molecular profiling
EP3481966B1 (en) Methods for fragmentome profiling of cell-free nucleic acids
US9850523B1 (en) Methods for multi-resolution analysis of cell-free nucleic acids
Gorelick et al. Respiratory complex and tissue lineage drive recurrent mutations in tumour mtDNA
US11062791B2 (en) Methods for multi-resolution analysis of cell-free nucleic acids
US20210343372A1 (en) Methods and systems for dynamic variant thresholding in a liquid biopsy assay
CN107577921A (zh) 一种肿瘤靶向基因测序数据解析方法
CN107513565A (zh) 一种微卫星不稳定位点组合、检测试剂盒及其应用
Misyura et al. Comparison of next-generation sequencing panels and platforms for detection and verification of somatic tumor variants for clinical diagnostics
US20190287645A1 (en) Methods for fragmentome profiling of cell-free nucleic acids
TW202039860A (zh) 游離dna末端特徵
CN110093417B (zh) 一种检测肿瘤单细胞体细胞突变的方法
US20190352695A1 (en) Methods for fragmentome profiling of cell-free nucleic acids
KR101936933B1 (ko) 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스
CN113674803A (zh) 一种拷贝数变异的检测方法及其应用
Zhan et al. Identification of copy number variation-driven molecular subtypes informative for prognosis and treatment in pancreatic adenocarcinoma of a Chinese cohort
Ahsan et al. A survey of algorithms for the detection of genomic structural variants from long-read sequencing data
KR101936934B1 (ko) 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스
EP4287213A1 (en) Method for predicting cancer recurrence using patient-specific panel
Kang et al. An advanced model to precisely estimate the cell-free fetal DNA concentration in maternal plasma
KR20200044123A (ko) 암 환자에서의 향상된 정밀도를 위한 포괄적 게놈 트랜스크립톰 종양-정상 유전자 패널 분석 (comprehensive genomic transcriptomic tumor-normal gene panel analysis for enhanced precision in patients with cancer)
WO2023182585A1 (ko) 순환 종양 핵산의 복제수 변이 분석 방법
WO2024138956A1 (zh) 微小残留病灶的检测方法、装置、设备和存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200330

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210316

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210611

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210916

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211102

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211122

R150 Certificate of patent or registration of utility model

Ref document number: 6983307

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S201 Request for registration of exclusive licence

Free format text: JAPANESE INTERMEDIATE CODE: R314201

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350