WO2024025361A1 - 차세대 염기서열분석 패널의 검증 방법 - Google Patents

차세대 염기서열분석 패널의 검증 방법 Download PDF

Info

Publication number
WO2024025361A1
WO2024025361A1 PCT/KR2023/010929 KR2023010929W WO2024025361A1 WO 2024025361 A1 WO2024025361 A1 WO 2024025361A1 KR 2023010929 W KR2023010929 W KR 2023010929W WO 2024025361 A1 WO2024025361 A1 WO 2024025361A1
Authority
WO
WIPO (PCT)
Prior art keywords
dna
ngs
mutations
panel
generation sequencing
Prior art date
Application number
PCT/KR2023/010929
Other languages
English (en)
French (fr)
Inventor
홍경만
김영호
Original Assignee
국립암센터
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 국립암센터 filed Critical 국립암센터
Publication of WO2024025361A1 publication Critical patent/WO2024025361A1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2539/00Reactions characterised by analysis of gene expression or genome comparison
    • C12Q2539/10The purpose being sequence identification by analysis of gene expression or genome comparison characterised by
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Definitions

  • the present invention provides a composition for verification of a next-generation sequencing panel; A kit for verification of a next-generation sequencing panel including this; and a verification method for next-generation sequencing panels.
  • NGS Next generation sequencing
  • Sanger sequencing which was used in the past, cost billions of dollars over several years to analyze one person's genome, but using the NGS method, analysis has become possible for a few days at a cost of about $1,000.
  • NGS technology is being applied to screening, diagnosis, prognosis prediction, and treatment selection for various diseases such as genetic diseases and infectious diseases as well as cancer diseases. In the United States alone, more than 55,000 treatments using NGS technology are being used for more than 11,000 diseases. NGS diagnostic panels are being used clinically.
  • the Frampton method is a method of verifying an NGS panel using a DNA pool mixed with DNA from a HapMap cell line or a DNA pool mixed with DNA from a cancer cell line whose base sequence is well known.
  • the Frampton method mixes equal amounts of DNA from 10 HapMap cell lines to create a DNA mixture with a DNA content of 5%, which is called pool XX, and a DNA mixture from 10 other cell lines, which is called pool YY. Afterwards, it was analyzed using an NGS panel to evaluate sensitivity and specificity (Frampton et al., Nature Biotechnology 2013).
  • the proportion of each single nucleotide variation (SNV) allele in a DNA mixture hereinafter referred to as "variant allelic fraction" or VAF
  • a haplotype allele that appears only in one cell line is calculated as the overall mixture. It accounts for 5%, and the remaining SNVs that appear several times have a VAF of more than 10%.
  • sensitivity was closely related to 1) down-sampled coverage of the in silico model corresponding to read count, and 2) VAF in the allele.
  • SNVs with 5% VAF were able to detect 96.1% of SNVs in 500 coverage, 83.5% in 300 coverage, and 44.2% of SNVs in 150 coverage, and SNVs with 10% VAF were 99.3% in 500 coverage and 44.2% in 300 coverage. 98.9%, 82.3% could be detected at 150 coverage, and 99.5% of SNVs with a VAF greater than 10% could be detected even at 150 coverage.
  • specificity was evaluated using the Framton method.
  • false positive indels In the case of false positive indels, false positive indels with a VAF of more than 20% were not detected, but in the case of indels with a VAF of less than 20%, false positive indels were detected in approximately 1 to 2% of cases. In the same way, the sensitivity and specificity of gene amplification/deletion detection were measured using DNA mixed from various cancer cell lines. No false positive mutations were found, but false negative mutations were detected in about 10-20%.
  • the Frampton method had difficulty evaluating the sensitivity of the NGS panel because errors often occurred in accurately mixing about 10 DNAs in equal amounts during the dilution process, and it was difficult to detect how many diluted mutations were detected at a specific dilution ratio. It was not possible to provide accurate information about whether it could be done.
  • the detection of indels and amplification/deletion is less sensitive than SNV detection, and due to variables such as allelic bias, duplicate reads, and sensitivity and specificity that vary depending on the detection power of the analysis pipeline, NGS panel It was difficult to set the sensitivity and specificity based on specific guidelines (Shin et al., Nature Comm 2017).
  • VAF information that can be detected with the minimum read count in the target area and Limit of Detection (LoD) information are provided through dilution experiments of standard samples (Rehm et al., Genet Med, 2013 ; ACMG clinical laboratory standards for next-generation sequencing).
  • ACLA American Clinical Laboratory Associations
  • CLIA Clinical Laboratory Improvement Amendments
  • the purpose of the present invention is to provide a composition for verification of a next-generation sequencing (NGS) panel containing homozygote DNA and control genomic DNA.
  • NGS next-generation sequencing
  • Another object of the present invention is to provide a kit for verification of a next-generation sequencing (NGS) panel, including a composition for verification of the next-generation sequencing (NGS) panel.
  • NGS next-generation sequencing
  • Another object of the present invention is (a) to perform next-generation sequencing (NGS) on a DNA mixture sample in which homozygous DNA and control genomic DNA are mixed at different dilution ratios using a next-generation sequencing (NGS) panel. steps; (b) selecting a Ho-N pair allele (Homozygote-Null pair allele) or He-N pair allele (Heterozygote-Null pair allele) from the next generation sequencing (NGS) results in step (a); and (c) analyzing the frequency of false negative mutations in each DNA mixture sample in which homozygous DNA and control genomic DNA are mixed at different dilution ratios based on the selected Ho-N pair allele or He-N pair allele. It provides a verification method for a next-generation sequencing (NGS) panel through analysis of false-negative mutations.
  • NGS next-generation sequencing
  • Another object of the present invention is (a) to perform next-generation sequencing (NGS) on a DNA mixture sample in which homozygous DNA and control genomic DNA are mixed at different dilution ratios using a next-generation sequencing (NGS) panel. steps; (b) selecting a Ho-N pair allele (Homozygote-Null pair allele) or He-N pair allele (Heterozygote-Null pair allele) from the next generation sequencing (NGS) results in step (a); (c) Ho-N pair allele or He-N pair in each DNA mixture sample in which homozygous DNA and control genomic DNA were mixed at different dilution ratios based on the selected Ho-N pair allele or He-N pair allele.
  • NGS next-generation sequencing
  • Analyzing the dilution mutation detection rate which represents the number of diluted mutations found in alleles as a percentage; and (d) analyzing the limit of detection.
  • NGS next-generation sequencing
  • Another object of the present invention is (a) to perform next-generation sequencing (NGS) on a DNA mixture sample in which homozygous DNA and control genomic DNA are mixed at different dilution ratios using a next-generation sequencing (NGS) panel. steps; (b) selecting an N-N pair allele (Null-Null pair allele) that does not contain mutations in the homozygous DNA and control genomic DNA from the next-generation sequencing (NGS) results in step (a); and (c) analyzing the frequency of false positive mutations in each DNA mixture sample in which homozygous DNA and control genomic DNA are mixed at different dilution ratios based on the selected N-N pair allele. It provides a verification method for next-generation sequencing (NGS) panels.
  • NGS next-generation sequencing
  • Another object of the present invention is (a) to perform next-generation sequencing (NGS) on a DNA mixture sample in which homozygous DNA and control genomic DNA are mixed at different dilution ratios using a next-generation sequencing (NGS) panel. steps; (b) selecting an N-N pair allele (Null-Null pair allele) that does not contain mutations in the homozygous DNA and control genomic DNA from the next-generation sequencing (NGS) results in step (a); (c) analyzing the frequency of false positive mutations in each DNA mixture sample in which homozygous DNA and control genomic DNA are mixed at different dilution ratios based on the selected N-N pair allele; and (d) information to increase the specificity of the next-generation sequencing (NGS) panel, including deriving a stringency cutoff value by analyzing the variant allelic fraction (VAF) to remove false positive variants.
  • NGS next-generation sequencing
  • Another object of the present invention is (a) collecting analysis results for false negative and false positive mutations from the company's raw data using the company's bioinformatics analysis results; and (b) comparing and analyzing the bioinformatics analysis results with the analysis results of step (a) using commercially available software from the company's raw data; the company's NGS panel analysis process including; It provides an evaluation method for errors in the process of generating raw data or errors in the bioinformatic analysis process.
  • the present invention provides a composition for verification of a next-generation sequencing (NGS) panel containing homozygote DNA and control genomic DNA.
  • NGS next-generation sequencing
  • the homozygous DNA may be DNA isolated from a hydatidiform mole cell line or a parthenogenetic cell line.
  • control genomic DNA may be genomic DNA isolated from the blood of a normal person. Additionally, the control genomic DNA may be genomic DNA isolated from the patient's blood or cancer tissue. Additionally, the control genomic DNA may be circulating tumor DNA (ctDNA). Additionally, the control genomic DNA may be synthetic DNA or cloned DNA.
  • the dilution ratio of homozygous DNA and control genomic DNA may be selected from the group consisting of 1:9999 to 9999:1.
  • the dilution ratio of homozygous DNA and control genomic DNA is 1:9999, 2.5:9997.5, 5:9995, 1:999, 2.5:997.5, 5:995, 1:99, 2.5:97.5, 5:95, 10:90, 20:80, 50:50, 80:20, 90:10, 95:5, 97.5:2.5, 99:1, 995:5, 997.5:2.5, 999:1, 9995:5, 9997.5: It may be selected from the group consisting of 2.5 and 9999:1, but is not limited thereto.
  • the present invention provides a kit for verification of a next-generation sequencing (NGS) panel, including a composition for verification of the next-generation sequencing (NGS) panel.
  • NGS next-generation sequencing
  • the present invention provides the step of (a) performing next-generation sequencing (NGS) on a DNA mixture sample in which homozygous DNA and control genomic DNA are mixed at different dilution ratios using a next-generation sequencing (NGS) panel. ; (b) selecting a Ho-N pair allele (Homozygote-Null pair allele) or He-N pair allele (Heterozygote-Null pair allele) from the next generation sequencing (NGS) results in step (a); and (c) analyzing the frequency of false negative mutations in each DNA mixture sample in which homozygous DNA and control genomic DNA are mixed at different dilution ratios based on the selected Ho-N pair allele or He-N pair allele.
  • NGS next-generation sequencing
  • the present invention provides the step of (a) performing next-generation sequencing (NGS) on a DNA mixture sample in which homozygous DNA and control genomic DNA are mixed at different dilution ratios using a next-generation sequencing (NGS) panel. ; (b) selecting a Ho-N pair allele (Homozygote-Null pair allele) or He-N pair allele (Heterozygote-Null pair allele) from the next generation sequencing (NGS) results in step (a); (c) Ho-N pair allele or He-N pair in each DNA mixture sample in which homozygous DNA and control genomic DNA were mixed at different dilution ratios based on the selected Ho-N pair allele or He-N pair allele.
  • NGS next-generation sequencing
  • Analyzing the dilution mutation detection rate which represents the number of diluted mutations found among alleles as a percentage; and (d) analyzing the limit of detection. It provides a verification method of a next-generation sequencing (NGS) panel through analysis of the limit of detection.
  • NGS next-generation sequencing
  • the method is a next-generation nucleotide sequence that can detect mutations selected from the group consisting of single nucleotide variation (SNV), insertion/deletion (Indel), and chromosome amplification/deletion. It may be verifying the analysis (NGS) panel.
  • SNV single nucleotide variation
  • Indel insertion/deletion
  • NGS chromosome amplification/deletion
  • the detection limit of step (d) is the maximum that shows a dilution variation detection rate of 90% or 95% in a DNA mixture sample in which homozygous DNA and control genomic DNA are mixed at different dilution ratios.
  • the VAF (variant allelic fraction) corresponding to the dilution factor may be expressed as a percentage.
  • the present invention provides the step of (a) performing next-generation sequencing (NGS) on a DNA mixture sample in which homozygous DNA and control genomic DNA are mixed at different dilution ratios using a next-generation sequencing (NGS) panel. ; (b) selecting an N-N pair allele (Null-Null pair allele) that does not contain mutations in the homozygous DNA and control genomic DNA from the next-generation sequencing (NGS) results in step (a); and (c) analyzing the frequency of false positive mutations in each DNA mixture sample in which homozygous DNA and control genomic DNA are mixed at different dilution ratios based on the selected N-N pair allele.
  • NGS next-generation sequencing
  • the method is a next-generation nucleotide sequence that can detect mutations selected from the group consisting of single nucleotide variation (SNV), insertion/deletion (Indel), and chromosome amplification/deletion. It may be verifying the analysis (NGS) panel.
  • SNV single nucleotide variation
  • Indel insertion/deletion
  • NGS chromosome amplification/deletion
  • the present invention provides the step of (a) performing next-generation sequencing (NGS) on a DNA mixture sample in which homozygous DNA and control genomic DNA are mixed at different dilution ratios using a next-generation sequencing (NGS) panel. ; (b) selecting an N-N pair allele (Null-Null pair allele) that does not contain mutations in the homozygous DNA and control genomic DNA from the next-generation sequencing (NGS) results in step (a); (c) analyzing the frequency of false positive mutations in each DNA mixture sample in which homozygous DNA and control genomic DNA are mixed at different dilution ratios based on the selected N-N pair allele; and (d) information to increase the specificity of the next-generation sequencing (NGS) panel, including deriving a stringency cutoff value by analyzing the variant allelic fraction (VAF) to remove false positive variants.
  • NGS next-generation sequencing
  • the stringency cutoff value is a stringency cutoff value of 95% to remove 95% of false positive variants or a stringency cutoff value of 99% to remove 99% of false positive variants. It may be.
  • the method may provide information on a stringency cutoff value to remove false positive mutations in order to increase the specificity of the next-generation sequencing (NGS) panel.
  • NGS next-generation sequencing
  • the present invention includes the steps of (a) collecting analysis results for false negative and false positive mutations from the company's raw data using bioinformatic analysis results held by the company; and (b) comparing and analyzing the bioinformatics analysis results with the analysis results of step (a) using commercially available software from the company's raw data; the company's NGS panel analysis process including; Provides an evaluation method for errors in the process of generating raw data or errors in the bioinformatics analysis process.
  • the composition according to the present invention can be usefully used for NGS panel verification, and in particular, the verification method according to the present invention can (i) analyze the frequency of false negative mutations, the frequency of false positive mutations, and detection limits for the NGS panel as objective results. (ii) By determining in advance the presence or absence of a specific chromosomal region or a specific gene region in which false negatives are particularly common when verifying an NGS panel, regions with a large number of false negatives can be removed during analysis, so NGS related to false negatives occurring in the NGS panel It can reduce errors in the interpretation of results, and (iii) provide an objective stringency cutoff value by analyzing the number of false positive mutations and the distribution of variant allelic fraction (VAF), which occurs in NGS panels. Errors in the interpretation of NGS results related to false positives can be reduced.
  • VAF variant allelic fraction
  • Figure 1 shows that the relative amount of DNA can be measured in a DNA mixture of homozygous variant DNA1 and null DNA2 mixed at various dilution ratios.
  • Figure 2A is the result of analyzing the detection limit for the NGS panel of the AA company using Ho-N pair alleles
  • 2B and 2C are the results of the analysis of the detection limit for the NGS panel of the BB company
  • 2D and 2E are the results of the CC
  • This is the result of analyzing the detection limit for the company's NGS panel
  • X-axis alleles listed according to chromosome number and position
  • VAF (variant allelic fraction) (variant allele read count)/(total read count); and FN: false negative allele; each color: false negative result at the corresponding dilution factor
  • X-axis at the bottom of each graph ordered according to chromosomal location
  • Y axis at the bottom of each graph chromosome numbers indicated).
  • the dilution factors for control genomic DNA and H mole DNA were as follows: CH100, 0:100; CH99, 1:99; CH97.5, 2.5:97.5; CH95, 5:95; CH90, 10:90; CH80, 20:80; CH50, 50:50; CH20, 80:20; CH10, 90:10; CH5, 95:5; CH2.5, 97.5:2.5; CH1, 99:1; and CH0, 100:0.
  • Figure 3A is the result of analyzing the detection limit of the NGS panel of the AA company using He-N pair alleles
  • 3B is the result of the analysis of the detection limit of the NGS panel of the BB company
  • 3C is the result of the analysis of the detection limit of the NGS panel of the CC company.
  • the dilution factors for control genomic DNA and H mole DNA were as follows: CH99, 1:99; CH97.5, 2.5:97.5; CH95, 5:95; CH90, 10:90; CH80, 20:80; CH50, 50:50; CH20, 80:20; CH10, 90:10; CH5, 95:5; CH2.5, 97.5:2.5; CH1, 99:1; and CH0, 100:0.
  • Figure 4A is the result of analyzing Indel detection according to the dilution ratio of the AA company's NGS panel using Ho-N pair alleles or He-N pair alleles
  • 4B is the result of Indel detection according to the dilution factor of the BB company's NGS panel.
  • the dilution factors for control genomic DNA and H mole DNA were as follows: CH100, 0:100; CH95, 5:95; CH90, 10:90; CH80, 20:80; CH50, 50:50; CH20, 80:20; CH10, 90:10; CH5, 95:5; and CH0, 100:0.
  • Figure 5A is the result of analyzing the detection limit of the AA company's NGS panel using Ho-He pair alleles
  • 5B is the result of analyzing the detection limit of the BB company's NGS panel
  • 5C is the detection limit of the CC company's NGS panel.
  • the dilution factors for control genomic DNA and H mole DNA were as follows: CH100, 0:100; CH99, 1:99; CH97.5, 2.5: 97.5; CH95, 5:95; CH90, 10:90; CH80, 20:80; CH50, 50:50; CH20, 80:20; CH10, 90:10; CH5, 95:5; CH2.5, 97.5:2.5; CH1, 99:1; and CH0, 100:0.
  • Figure 6A is the result of analyzing the detection limit of chromosome 6 mutation in the Ho-N pair allele or He-N pair allele for CC company's NGS panel
  • 6B is the detection limit in the Ho-N pair allele that is null in the control DNA. This is the result of analyzing the detection limit of chromosome 6 mutation.
  • 6C is the result of analyzing the detection limit of chromosome 6 mutation in He-N pair alleles
  • 6D is the result of analyzing the detection limit of chromosome 6 mutation in the control DNA.
  • the dilution factors for control genomic DNA and H mole DNA were as follows: CH99, 1:99; CH97.5, 2.5:97.5; CH95, 5:95; CH90, 10:90; CH50, 50:50; CH10, 90:10; CH5, 95:5; CH2.5, 97.5:2.5; and CH1, 99:1.
  • Figure 7A is the result of analyzing the frequency of false positive mutations in the NGS panel of company AA using N-N pair alleles in which both H mole DNA and control genomic DNA are null
  • Figure 7B is the result of analyzing the frequency of false positive mutations in the NGS panel of company BB.
  • the dilution factors of control genomic DNA and H mole DNA are as follows: CH99, 1:99; CH97.5, 2.5:97.5; CH95, 5 :95; CH90, 10:90; CH50, 50:50; CH10, 90:10; CH5, 95:5; CH2.5, 97.5:2.5; and CH1, 99:1.
  • Figure 8 shows the result of removing false positive mutations on chromosome 6 from the CC company's NGS panel results and deriving a stringency cutoff value only from the remaining false positive mutations
  • X axis chromosomal positions of alleles
  • Y axis Log(VAF);
  • VAF variant allelic fraction
  • the dilution factors for control genomic DNA and H mole DNA are as follows: CH99 , 1:99; CH97.5, 2.5:97.5; CH95, 5:95; CH90, 10:90; CH50, 50:50; CH10, 90:10; CH5, 95:5; CH2.5, 97.5:2.5 ; and CH1, 99:1.
  • Figure 9A shows the results of analyzing the false positive mutations of the derived mutations, the results of analyzing the false positive mutations of the mutations derived from each company (Inhouse), and the results of analyzing the false positive mutations of the mutations derived using the Dragen software (default, solid, and liquid) are displayed in a graph (y-axis: arithmetic mean value of false positive mutations found in multiple diluted samples).
  • 9B is the result of measuring sensitivity by analyzing false negatives from the mutation detection results of NGS panels of AA, BB, and CC companies, and the result of analyzing false negatives of mutations derived by each company using its own bioinformatics method (Inhouse), Dragen The dilution mutation detection rate was displayed on a graph (y-axis) from the results of analyzing the false negatives of mutations derived using the software's bioinformatics method under three conditions (default, solid, and liquid).
  • % is the % of samples with a mutation, so the % of the total DNA in each sample is half of the % of the mutant samples).
  • the present invention provides a composition for verification of a next-generation sequencing (NGS) panel comprising homozygote DNA and control genomic DNA.
  • NGS next-generation sequencing
  • next generation sequencing is a technology that can analyze millions of base sequences at once, and is also called massively parallel sequencing or high-throughput sequencing.
  • next-generation sequencing or NGS is used interchangeably.
  • allele in the present invention refers to a gene that forms a pair of homologous chromosomes and has different traits, and refers to the DNA sequence of the allele. Homologous chromosomes are classified into homozygotes and heterozygotes. “Homozygotes” are a combination of alleles with the same properties, and “heterozygotes” are a combination of alleles with different properties. In the present invention, allele or allele is used interchangeably.
  • the composition contains two different genomic DNA to verify the NGS panel, and one DNA is homozygous DNA.
  • the homozygous DNA may be DNA isolated from a hydatidiform mole cell line or a parthenogenetic cell line, but is not limited thereto.
  • control genomic DNA refers to genomic DNA other than the homozygous DNA among the two different genomic DNAs included in the composition, and may be homozygous or heterozygous genomic DNA.
  • control genomic DNA may be genomic DNA isolated from the blood of a normal person. Additionally, the control genomic DNA may be genomic DNA isolated from the patient's blood or cancer tissue. Additionally, the control genomic DNA may be circulating tumor DNA (ctDNA). Additionally, the control genomic DNA may be synthetic DNA or cloned DNA, but is not limited thereto.
  • the composition may have a dilution ratio of homozygous DNA and control genomic DNA selected from the group consisting of 1:9999 to 9999:1, and preferably the dilution ratio of homozygous DNA and control genomic DNA is 1:9999 to 9999:1.
  • kits for verification of a next-generation sequencing (NGS) panel including a composition for verification of the next-generation sequencing panel.
  • the present invention provides the step of (a) performing next-generation sequencing (NGS) on a DNA mixture sample in which homozygous DNA and control genomic DNA are mixed at different dilution ratios using a next-generation sequencing (NGS) panel. ; (b) selecting a Ho-N pair allele (Homozygote-Null pair allele) or He-N pair allele (Heterozygote-Null pair allele) from the next generation sequencing (NGS) results in step (a); and (c) analyzing the frequency of false negative mutations in each DNA mixture sample in which homozygous DNA and control genomic DNA are mixed at different dilution ratios based on the selected Ho-N pair allele or He-N pair allele.
  • NGS next-generation sequencing
  • false negative in the present invention refers to a case where a test result that should have been positive is incorrect and turns out to be negative.
  • the present invention provides the step of (a) performing next-generation sequencing (NGS) on a DNA mixture sample in which homozygous DNA and control genomic DNA are mixed at different dilution ratios using a next-generation sequencing (NGS) panel. ; (b) selecting a Ho-N pair allele (Homozygote-Null pair allele) or He-N pair allele (Heterozygote-Null pair allele) from the next generation sequencing (NGS) results in step (a); (c) Ho-N pair allele or He-N pair in each DNA mixture sample in which homozygous DNA and control genomic DNA were mixed at different dilution ratios based on the selected Ho-N pair allele or He-N pair allele.
  • NGS next-generation sequencing
  • Analyzing the dilution mutation detection rate which represents the number of diluted mutations found among alleles as a percentage; and (d) analyzing the limit of detection. It provides a verification method of a next-generation sequencing (NGS) panel through analysis of the limit of detection.
  • NGS next-generation sequencing
  • Ho-N pair allele (Homozygote-Null pair allele) of the present invention refers to an allele in which one allele region is mixed with a homozygous variant and a null without mutation.
  • He-N pair allele (Heterozygote-Null pair allele) of the present invention refers to an allele in which one allele region is mixed with a heterozygous variant and a null without mutation.
  • dilution mutation detection rate refers to the rate at which a diluted mutation among Ho-N pair alleles or He-N pair alleles is found in a DNA mixture sample mixed with different dilution ratios of homozygous DNA and control genomic DNA. It means a number expressed as a percentage.
  • the method is a next-generation sequencing (NGS) method that can detect mutations selected from the group consisting of single nucleotide variation (SNV), insertion/deletion (Indel), and chromosome amplification/deletion. It may be verifying the panel.
  • NGS next-generation sequencing
  • variant refers to a modification of a chromosome, gene, or base sequence that is genetically distinct from the wild type.
  • mutations or variants are used interchangeably.
  • the detection limit of step (d) is a dilution variation of 90% or 95% in a DNA mixture sample in which homozygous DNA and control genomic DNA are mixed at different dilution ratios. It may be expressed as a percentage of the VAF (variant allelic fraction) corresponding to the maximum dilution factor that shows the detection rate.
  • H mole DNA homozygous DNA
  • DNA1 and DNA2 are mixed and VAF (variant allelic fraction) is obtained.
  • the dilution factor of DNA1 and DNA2 can be known, and the VAF (variant allelic fraction) corresponding to the maximum dilution factor that shows a dilution variation detection rate of 90% or 95% for each allele is expressed as a percentage, and the Limit of Detection ) can be derived.
  • Figure 1 shows that the relative amount of DNA mixed in each DNA mixture of homozygous variant DNA1 and null DNA2 at various dilution ratios can be measured.
  • the allele in which one allele region is mixed with a homozygous variant and null was defined as "Ho-N pair allele (Homozygote-Null pair allele)", and among alleles with different VAF (variant allelic fraction)
  • the probability of encountering a Ho-N pair allele is shown in Table 1 below.
  • the P2/P1 ratio did not change even when calculating the probability by dividing the mutation in each allele into a case where it was analyzed as an actual mutation and a case where it was analyzed as a reference sequence.
  • the P2/P1 ratio was the same, considering the frequency of mutations in the distribution of each allele. Even if calculated and integrated with p values in the range of 0 to 1, the P2/P1 ratio remained almost unchanged at 2.50 (for example, considering that the frequency of allele 1 is 0.1 and the frequency of allele 9 is 0.9).
  • H mole DNA which is homozygous DNA
  • H mole DNA which is homozygous DNA
  • the present invention provides the step of (a) performing next-generation sequencing (NGS) on a DNA mixture sample in which homozygous DNA and control genomic DNA are mixed at different dilution ratios using a next-generation sequencing (NGS) panel. ; (b) selecting an N-N pair allele (Null-Null pair allele) that does not contain mutations in the homozygous DNA and control genomic DNA from the next-generation sequencing (NGS) results in step (a); and (c) analyzing the frequency of false positive mutations in each DNA mixture sample in which homozygous DNA and control genomic DNA are mixed at different dilution ratios based on the selected N-N pair allele.
  • NGS next-generation sequencing
  • N-N pair allele (Null-Null pair allele) of the present invention refers to an allele in which all allele regions are null with no mutation.
  • test positive in the present invention refers to a case where a test result that should have been negative is incorrect and turns out to be positive.
  • the method is a next-generation sequencing (NGS) method that can detect mutations selected from the group consisting of single nucleotide variation (SNV), insertion/deletion (Indel), and chromosome amplification/deletion. It may be verifying the panel.
  • NGS next-generation sequencing
  • the present invention provides the step of (a) performing next-generation sequencing (NGS) on a DNA mixture sample in which homozygous DNA and control genomic DNA are mixed at different dilution ratios using a next-generation sequencing (NGS) panel. ; (b) selecting an N-N pair allele (Null-Null pair allele) that does not contain mutations in the homozygous DNA and control genomic DNA from the next-generation sequencing (NGS) results in step (a); (c) analyzing the frequency of false positive mutations in each DNA mixture sample in which homozygous DNA and control genomic DNA are mixed at different dilution ratios based on the selected N-N pair allele; and (d) information to increase the specificity of the next-generation sequencing (NGS) panel, including deriving a stringency cutoff value by analyzing the variant allelic fraction (VAF) to remove false positive variants.
  • NGS next-generation sequencing
  • the stringency cutoff value may be a 95% stringency cutoff value that removes 95% of false positive mutations or a 99% stringency cutoff value that removes 99% of false positive mutations.
  • the method may provide information on a stringency cutoff value to remove false positive mutations in order to increase the specificity of the next-generation sequencing (NGS) panel.
  • NGS next-generation sequencing
  • H mole DNA which is homozygous DNA, to verify the NGS panel.
  • H mole DNA derived from human hydatidiform mole used in the present invention was purchased from Coriell (NA07489, Camden, NJ), and control genomic DNA was approved by the Institutional Review Board of the National Cancer Center. Genomic DNA was extracted from the blood of a collaborator and used.
  • the prepared H mole DNA, control genomic DNA, and DNA mixture of H mole DNA and control genomic DNA were sent to AA company, BB company, and CC company, respectively, and were used for Illumina company's Novaseq 6000 NGS equipment using each company's NGS panel.
  • the experiment was conducted through Afterwards, a file analyzing mutations was received from the FASTQ file obtained in the experiment using a method provided by each company, and verification of the NGS panel was performed.
  • the number of mutations obtained from each company's NS panel differs depending on each company's analysis method in addition to the number of genetic mutations.
  • all companies commonly used hg19 from the NCBI human genome assembly as a reference sequence, and the CC company used LoFreq in addition to MuTect as a variant caller to analyze more mutations.
  • the results of mutations analyzed by each company include reference sequence base, variant allele information, VAF, read count, and mutation information, along with each sample information, chromosome number and location ( Sorted based on position.
  • the read count was less than 100, it was excluded from the analysis
  • the analysis results of the CC company if the read count was less than 300, it was excluded from the analysis.
  • intron region SNVs and indel alleles were all included in the analysis.
  • exon region SNVs and splice region SNVs were included in the analysis, but intron region SNVs and indel mutations were included in the analysis. excluded from analysis.
  • H mole DNA and control genomic DNA are homozygous variant and null
  • H mole DNA is null
  • control genomic DNA is defined as "Ho-N pair allele (Homozygote-Null pair allele)”
  • a pair in which genomic DNA consists of a heterozygous variant was defined as “He-N pair allele (Heterozygote-Null pair allele).”
  • An allele for which no mutation is found in the NGS panel analysis of a DNA mixture sample of H mole DNA and control genomic DNA despite the presence of a mutation in homozygous H mole DNA or control genomic DNA is defined as a false negative allele.
  • the frequency of false negative alleles was analyzed by dividing the DNA mixture sample of H mole DNA and control genomic DNA into Ho-N pair allele and He-N pair allele.
  • the dilution mutation detection rate is the number of alleles in which a mutation is found among the Ho-N pair allele or He-N pair allele in a DNA mixture of homozygous H mole DNA and control genomic DNA mixed at different dilution ratios as a percentage. It was defined as shown.
  • Limit of Detection is the maximum dilution rate that achieves a dilution mutation detection rate of 90% or 95% among DNA mixtures of homozygous H mole DNA and control genomic DNA mixed at different dilution rates.
  • the variant allelic fraction was defined as a percentage.
  • VAF is the read count of sequences detected as mutations at a specific allele position divided by the total read count that adds the sequences detected as mutations and reference sequence bases at a specific allele position.
  • a mutation was present in the NGS analysis results of the DNA mixture sample in which the H mole DNA and the control genomic DNA were mixed at different dilution ratios. If it was found to be one, it was defined as a false positive mutation.
  • the value of VAF (variant allelic fraction) that can remove 95% or 99% of these false positive mutations was defined as the 95% stringency cutoff value or 99% stringency cutoff value, respectively. .
  • the median read count of variant alleles was found to be 197 (Q1, Q3; 51,464), 813 (433, 1189), and 679 (577, 717), respectively. It has been done.
  • the median read count in the samples for the Ho-N pair allele and He-N pair allele of the present invention was 380 (Q1, Q2; 221, 633) for the AA company and 901 (Q1, Q; 221, 633) for the BB company, respectively. 503, 1234) and 703 (Q1, Q2; 679, 727) in CC companies.
  • the sensitivity of NGS panels from three companies was evaluated by analyzing the Ho-N pair allele.
  • the AA company's mutation analysis results showed that there were almost no alleles in the exon region, sensitivity and specificity were analyzed including intron region mutations.
  • 15 (10.2%, 15/147) were confirmed to be exon region mutations, and the rest were confirmed to be intron region mutations or UTR region mutations.
  • the mutation analysis results from BB company included the SNV and indel sent, and the sensitivity and specificity were analyzed including both exon and intron mutations.
  • 134 89.9%, 134/ 149 was confirmed to be an exon site mutation or splice site mutation.
  • the number of analyzed alleles was relatively large, so only exon region mutations and splice site mutations were selected. Indels were removed and only SNVs were analyzed, and a total of 306 Ho-N pair alleles were confirmed.
  • BB Company's NGS panel is designed for 10% DNA mixture samples, i.e., a DNA mixture (CH90) containing 90% H mole DNA and 10% control genomic DNA and 10% H mole DNA and 90% control genomic DNA. All 149 Ho-N pair alleles were detected in a DNA mixture (CH10) containing 5% DNA mixture sample (i.e., a DNA mixture containing 95% H mole DNA and 5% control genomic DNA ( In CH95) and a DNA mixture containing 5% H mole DNA and 95% control genomic DNA (CH5)), 137 out of 149 Ho-N pair alleles were detected, resulting in a dilution mutation detection rate of approximately 88.6% ( Figures 2B and 2C).
  • the maximum dilution factor of BB Company's NGS panel showing a 90% dilution variant detection rate was confirmed to be between 5 and 10%, and closer to that, it was confirmed to be around 5%, which means that the detection limit showing a 90% dilution variant detection rate is 5%. It means degree.
  • Chromosome 6 contains 91 Ho-N pair alleles, so excluding these, 215 Ho-N pair alleles were analyzed.
  • the CC company's NGS panel consisted of a 2.5% DNA mixture sample (i.e., a DNA mixture (CH97.5) containing 97.5% H mole DNA and 2.5% control genomic DNA and 2.5% H mole DNA and 2.5% control genomic DNA). All 215 Ho-N pair alleles were detected in a DNA mixture containing 97.5% (CH2.5), and 1% of the DNA mixture sample (i.e., containing 99% H mole DNA and 1% control genomic DNA).
  • the Ho-N pair allele was selected using the DNA mixture containing the H mole DNA of the present invention, and the VAF (variant allelic fraction) corresponding to the maximum dilution factor showing a 90% dilution variant detection rate was determined. It was confirmed that the detection limit expressed in percentage can be analyzed, and each company's NGS panel can be verified through analysis of the frequency of false negative mutations and analysis of the detection limit.
  • BB Company's analysis results yielded 172 He-N pair alleles (147 exonic variants or splicing variants, 85.5% of the total).
  • BB Company's NGS panel is designed for 10% DNA mixture samples, i.e., a DNA mixture (CH90) containing 90% H mole DNA and 10% control genomic DNA and 10% H mole DNA and 90% control genomic DNA.
  • CH90 DNA mixture
  • 166 out of 172 He-N pair alleles were detected, confirming a dilution mutation detection rate of 96.5% (Figure 3B).
  • the detection limit for each NGS panel can be analyzed as an objective result by analyzing the Ho-N pair allele and He-N pair allele and confirming the maximum dilution ratio that shows a dilution mutation detection rate of 90%. It was confirmed that it can be usefully used for verification of NGS panels. In addition, it was confirmed that when both the results of the Ho-N pair allele and the He-N pair allele were used, there was an advantage in obtaining sensitivity information from more alleles compared to the case where only the Ho-N pair allele was used. did.
  • the median read count of the AA company was about 380, but only 10.9% of the mutations with a VAF (variant allelic fraction) of 10% were detected, and 91.2% of the mutations with a 20% VAF (variant allelic fraction) were detected, and the AA company's NGS panel It was found that the sensitivity to was significantly low.
  • BB Company's read count was about 900, and 88.6% of mutations with a VAF (variant allelic fraction) of 5% were detected, so the detection limit for BB Company's NGS panel showed similar results to the preceding literature.
  • the read count of the CC company is about 700, 100% of mutations with a VAF (variant allelic fraction) of 2.5% were detected, and 91.6% of mutations of 1% were detected, so the detection limit for the CC company's NGS panel is as above. It was found to be superior to previous literature and results. Additionally, these results mean that there may be several variables that determine the sensitivity of the NGS panel in addition to the relationship between read count and variant allelic fraction (VAF). Therefore, it can be seen that the sensitivity or detection limit of an NGS panel cannot be evaluated using only read count and VAF (variant allelic fraction), and researchers must evaluate whether a specific NGS panel has the sensitivity to achieve the research purpose. It can be seen that it is necessary to verify the sensitivity of the corresponding NGS panel using each standard mixture.
  • the pair consisting of a homozygous variant in H mole DNA and a heterozygous variant in control genomic DNA is defined as "Ho-He pair allele (Homozygote and Heterozygous pair allele)", and the fraction occupied by the diluted reference allele compared to the variant allele
  • RAF reference allelic fraction
  • RAF 2.5% reference allelic
  • a DNA mixture sample i.e., a DNA mixture containing 95% H mole DNA and 5% control genomic DNA (CH95)
  • CSA 5A a DNA mixture containing 95% H mole DNA and 5% control genomic DNA
  • BB company's NGS panel was designed for 5% DNA mixture samples, i.e., a DNA mixture (CH95) containing 95% H mole DNA and 5% control genomic DNA and 5% H mole DNA and 5% control genomic DNA.
  • CC Company's NGS panel was confirmed to have a serious problem with many false negatives on chromosome 6, and the analysis using the He-N pair allele was relatively small compared to the analysis using the Ho-N pair allele. Accordingly, the region of chromosome 6, which had many false negatives, was matched to the chromosomal location of the Ho-N pair allele or He-N pair allele, and then checked to see if there was a difference in the analysis results using the Ho-N pair allele and the He-N pair allele. .
  • the method of the present invention has the advantage of being able to determine the final result while considering the possibility of false negatives in the corresponding region during analysis by determining in advance the presence or absence of a specific chromosomal region or a specific gene region in which false negatives are particularly frequent when verifying the NGS panel.
  • errors due to NGS panel analysis related to false negatives occurring in the NGS panel can be reduced by removing these regions in the design of the new NGS panel.
  • N-N pair alleles in which no mutations were found in both H mole DNA and control genomic DNA, H mole DNA and control genomic DNA were used at different dilution ratios. If mutations were found in the NGS panel analysis results of the mixed DNA mixture sample, these were defined as false positive mutations, and the frequency of detection of false positive mutations in each company's NGS panel was analyzed.
  • the chromosome 6 alleles in the CC company's NGS panel had a problem in that the VAF of false positive mutations was significantly lower or significantly higher than the VAF of false positive mutations in the remaining chromosome regions, which can be confirmed in Figure 7C. Therefore, alleles on chromosome 6 were excluded from the false positive mutation detection analysis.
  • a 95% stringency cutoff value or a 99% stringency cutoff value defined as the VAF value capable of eliminating 95% or 99% of false positive variants.
  • VAF variable allelic fraction
  • the present invention clearly presents a method of deriving a VAF value that can remove 95% or 95% of false positive mutations as a "stringency cutoff value", and to confirm this, CC company's N-N pair allele
  • VAF values of false positive mutations in the field was analyzed.
  • two problems were encountered in the NGS panel of the CC company mentioned above (i.e., 1. large-scale false-positive mutations in CH10 samples; and 2. severe changes in VAF in false-positive mutations on chromosome 6). Alleles were excluded from the analysis and a stringency cutoff value was derived.
  • the final number of false positive mutations obtained from the CC company's NGS panel was 1,977, and the VAF (variant allelic fraction) value, which can remove 95% of false positive mutations, is 0.067, and 99% of false positive mutations can be removed.
  • the variable allelic fraction (VAF) value was confirmed to be 0.0875 (FIG. 8).
  • the stringency cutoff value was derived as 0.067, and to remove 99% of the false positive mutations, the CC company's NGS panel was derived. For analysis, the stringency cutoff value was derived as 0.087.
  • the present invention can verify the NGS panel by analyzing the frequency of false positive mutations, and provide information on an objective stringency cutoff value to remove false positive mutations to increase the specificity of the NGS panel. It was confirmed that errors in the interpretation of NGS results related to false positives occurring in can be reduced.
  • the errors in the results of each company's analysis of the three companies' NGS panels are 1) errors in the raw data created using the NGS panel, that is, the FASTQ file itself, and 2) each of the three companies found mutations in the raw data. It can be divided into errors in the bioinformatic analysis process. In order to confirm the contribution of these two errors, we used commercially available software to find mutations in raw data and used this to confirm the contribution of the two errors. Illumina's Dragen software was used for bioinformatic analysis. . This process requires bed files from each company, but AA and CC companies did not provide bed files, so only exon mutations of genes provided by the two companies were analyzed. In the case of the BB company, all mutations in the entire captured region were analyzed using the bed file provided by the company.
  • Figure 9 shows the results of false negatives and false positives analyzed from the mutation results provided by the bioinformatics method of the three companies, and the false negatives and false positives analyzed by analyzing the mutations from each company's raw data (FASTQ file) using Dragen software. It is shown. Variation analysis was performed using Dragen software, and three conditions were used: default, solid, and liquid. Default is a commonly used condition, and solid and liquid are conditions with increased sensitivity compared to the default condition.
  • Figure 9A shows the results of analyzing the false positive mutations of the derived mutations.
  • the results of analyzing the false positive mutations of the mutations derived from each company (Inhouse) and the results of analyzing the false positive mutations of the mutations derived using the Dragen software (default, The three conditions (solid, liquid, etc.) were displayed in a graph.
  • the y-axis of Figure 9A shows the arithmetic mean value of false positive mutations found in multiple diluted samples.
  • the three analysis conditions of the Dragen software it can be seen that fewer false positives occurred in the results analyzed under the default conditions compared to the results analyzed under solid or liquid conditions (the number of false positives for BB and CC companies was less than 30, indicated by the blue line). mark).
  • the analysis conditions of the Dragen software default has lower sensitivity than the other two conditions, this result is consistent with the general phenomenon that specificity increases when sensitivity is lowered.
  • the CC company's inhouse method generates many false positives (arrow in Figure 9A, the average false positive is 1680), which is likely related to the fact that the CC company intentionally increased sensitivity to analyze mutations, as will be explained later.
  • Figure 9B shows the results of measuring sensitivity by analyzing false negatives from the mutation detection results of NGS panels of AA, BB, and CC companies.
  • the dilution mutation detection rate from the results of analyzing false negatives of mutations derived by bioinformatics methods of Dragen software under three conditions (default, solid, and liquid) was displayed in a graph (y-axis).
  • the % shown on the x-axis of Figure 9B is the % of samples with heterozygote mutations, and accordingly, the % of mutations in the total DNA of each sample is half of the % of mutant samples shown on the x-axis (for example, the x-axis of Figure 9B In the case of a sample marked as 5%, this means that the actual variation accounted for is 2.5%).
  • the results using the bioinformatics method using the Dragen software in Figure 9B only showed results using default conditions. However, in order to analyze the mutation detection rate using the Dragen software in Figure 9B, only mutations present in the exons of target genes provided by each company were analyzed for AA and CC companies, and bed files were used for BB companies. We analyzed mutations present in all regions captured with BB Company's NGS panel. Additionally, all sensitivity analysis results in Figure 9B are results using He-N pair alleles.
  • the bioinformatics method used by the AA company selected conditions with low sensitivity. This low adjustment of sensitivity seems to be related to the discovery of too many false positive mutations (818) when analyzing the mutations obtained under the default condition of the Dragen software in Figure 9A, and in the end, the AA company sacrificed sensitivity and increased specificity. It can be understood that the analysis conditions were changed to increase the sensitivity (changed the conditions so that the sensitivity was about 20%).
  • Figure 9B Sensitivity analysis results
  • the CC company as a result of analysis under their bioinformatic conditions, it appears that most dilution mutations in the 2.5% heterozygote variant DNA sample are detected, and the sensitivity appears to be at a level that detects most of the 1.25% mutation.
  • Analyzing the mutations obtained under the default conditions of the Dragen software only about 50% of the dilution mutations of the 2.5% heterozygote variant DNA sample were detected and most of the dilution mutations of the 5% heterozygote variant DNA sample were detected, so the mutation detection limit appears to be about 2.5%. . Therefore, the sensitivity of CC's bioinformatics method seemed to be higher than that of the Dragen software analysis.
  • the AA company has many errors in the process of generating raw data.
  • This company adjusted the analysis conditions to sacrifice sensitivity to solve the problem of many false positive mutations occurring in the bioinformatic analysis process. It appears that it was done.
  • the BB company generated more false negative dilution mutations compared to the mutation analysis using the Dragen software.
  • the sensitivity of the NGS panel analyzed by the company appears to be slightly lower than the sensitivity according to the analysis using the Dragen software.
  • the CC company adjusted the analysis conditions to increase sensitivity during the bioinformatics analysis process, resulting in many false positives.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 동형접합체 DNA 및 대조 게놈 DNA를 포함하는 차세대 염기서열분석(NGS) 패널의 검증용 조성물; 상기 조성물을 포함하는 차세대 염기서열분석(NGS) 패널의 검증용 키트; 위음성 변이의 분석, 검출한계의 분석 및 위양성 변이의 분석을 통한 차세대 염기서열분석(NGS) 패널의 검증 방법; 및 차세대 염기서열분석(NGS) 패널의 특이도를 증가시키기 위한 정보제공 방법에 관한 것이다. 특히, 본 발명에 따른 검증 방법은 차세대 염기서열분석(NGS) 패널에 대한 위음성 변이의 빈도, 위양성 변이의 빈도 및 검출한계를 객관적 결과로 분석할 수 있어, 차세대 염기서열분석(NGS) 패널의 검증에 유용하게 사용될 수 있다.

Description

차세대 염기서열분석 패널의 검증 방법
본 발명은 차세대 염기서열분석 패널의 검증용 조성물; 이를 포함하는 차세대 염기서열분석 패널의 검증용 키트; 및 차세대 염기서열분석 패널의 검증 방법에 관한 것이다.
차세대 염기서열분석(Next generation sequencing, 이하 "NGS")는 수백만 염기서열을 한꺼번에 분석할 수 있는 기술로서, massively parallel sequencing 또는 high-throughput sequencing이라고도 한다. 과거에 사용되던 생거 염기서열분석법(Sanger sequencing)은 한 사람의 지놈을 분석하는데 수년 동안 수십억 달러가 소요되었으나, NGS 방법을 이용하여 며칠 동안 1,000 달러 정도의 비용으로 분석이 가능하게 되었다. 현재 NGS 기술은 암 질환 뿐 아니라, 유전질환과 감염질환과 같은 다양한 질병의 스크리닝, 진단, 예후예측, 및 치료제를 선택하는데 응용되고 있고, 미국에서만 11,000개 이상의 질환에 대해 NGS 기술을 이용한 55,000개 이상의 NGS 진단 패널(panel)이 임상에 이용되고 있다.
개발된 NGS 패널을 임상에 응용하기 위해서는 패널이 정확하게 원하는 결과를 얻을 수 있는지 평가되어야 한다. 이에 미국 FDA에서는 NGS 패널의 검증(validation)을 위한 가이드라인(guideline)을 발표하였고, CMS(Center for Medicare & Medicaid Services)에서는 패널을 모니터링(monitoring)하고 있으며, 가이드라인과 모니터링 방법은 지속적으로 업데이트되고 있다.
현재, NGS 패널의 검증을 위해 가장 많이 사용하는 방법은 2013년 Frampton 등이 Nature Biotechnology에 소개한 방법(이하, "Frampton 방법")이며, 이후의 연구에서도 지금까지 Frampton 방법이 주로 사용되고 있다 (Shin et al., Nature Comm 2017; 및 Froyen et al., Cancers 2022). Frampton 방법은 염기서열이 잘 알려져 있는 HapMap 세포주의 DNA가 혼합된 DNA 풀(pool) 또는 암세포주의 DNA가 혼합된 DNA 풀(pool)을 이용하여 NGS 패널을 검증하는 방법이다. 구체적으로, Frampton 방법은 HapMap 세포주 10개의 DNA를 각각 동일한 양으로 혼합하여 DNA의 양이 5%가 되도록 DNA 혼합물을 제작하여 pool XX 라고 하고, 또 다른 세포주 10개에서 DNA 혼합을 제작하여 pool YY 라고 한 후, 이를 NGS 패널로 분석하여 민감도 및 특이도를 평가하였다 (Frampton et al., Nature Biotechnology 2013). DNA 혼합물에서 각 단일염기변이(SNV) 대립유전자(allele)이 차지하는 비율(이하, "variant allelic fraction" 혹은 VAF)을 계산할 수 있는데, 하나의 세포주에만 나타나는 일배체형 대립유전자(haplotype allele)는 전체 혼합물에서 5%를 차지하게 되고, 나머지 여러 번 나타나는 SNV들은 10% 이상의 VAF을 가지게 된다. Frampton 등이 선발한 MapMap cell line의 혼합물을 이용하여 해당 패널로 분석하면, 패널의 유전자에 포함되어 있는 대립유전자 중 20%가 약 5% VAF을 갖게 되고, 약 30% 대립유전자가 10% VAF을 갖게 되므로, 대립유전자 중 20%는 5% VAF의 검출율 측정에 이용할 수 있었고, 30%의 대립유전자는 10% VAF의 검출율 측정에 이용할 수 있었다. 그러나, Frampton 등의 논문에서는 연구자들이 제작했던 HapMap cell line 혼합물에는 5% VAF 미만의 대립유전자가 존재하지 않아서 5% 미만의 VAF를 가진 대립유전자의 검출율 측정은 할 수 없었다. 또한 Frampton 방법을 사용하여 1% VAF를 가진 대립유전자의 검출율을 측정하려면, 적어도 50개 HapMap cell line을 이용하여야 하며, 변이의 발견 빈도가 1% 정도 되는 변이들을 이용해야 한다. 여기에 더하여, Frampton의 논문 결과에서 10개의 HapMap 세포주를 이용하여 5% 정도의 VAF를 가진 대립유전자 200 개 정도 얻을 수 있었는데, 이로부터 추산하면 1% VAF를 가진 대립유전자는 겨우 40여개 이하 밖에 얻을 수 없게 되므로, 적은 수의 대립유전자로 NGS 패널 민감도를 평가해야만 하는 단점이 발생한다.
또한, Frampton 방법에서 민감도 평가의 경우, 민감도가 1) read count에 해당하는 in silico model의 down-sampled coverage, 및 2) 대립유전자에서의 VAF와 밀접한 관련이 있었다. 자세히 살펴보면, 5% VAF를 가진 SNV는 500 coverage에서 96.1%, 300 coverage에서 83.5%, 150 coverage에서 44.2% SNV를 검출할 수 있었고, 10% VAF을 가진 SNV는 500 coverage에서 99.3%, 300 coverage에서 98.9%, 150 coverage에서 82.3%를 검출할 수 있었으며, 10% 보다 큰 VAF을 가진 SNV는 150 coverage에서도 99.5%를 검출할 수 있었다. 또한 Framton 방법으로 특이도를 평가하였는데, 발표된 논문의 결과에 의하면 down-sampled coverage가 500보다 큰 경우에만 5% 미만의 faction을 가진 2개의 SNV에서 검출되었고, 나머지 경우는 위양성 변이가 전혀 검출되지 않아 99.9% 이상의 positive predictive value를 보여서 이때 사용한 NGS 패널의 특이도가 아주 높다는 결과를 보고하였다.
또한, Frampton 방법에서 암세포주에 나타나는 indel의 검출을 위해 암세포주의 DNA를 2~10개까지 혼합한 pool을 41가지로 만들고, indel 검출의 민감도와 특이도를 측정하였다. Indel의 검출 민감도 역시 1) down-sampled coverage 와 2) 혼합물 내 indel 변이의 VAF에 따라 달라지는 것을 확인할 수 있었다. 자세히 살펴보면, 10% VAF을 가진 indel의 검출은 190 coverage에서 65%, 667 coverage에서 88.3%를 검출하였다. 20% VAF을 가진 indel의 검출은 190 coverage에서 86.3%, 667 coverage에서 97.3%를 검출하였다. 위양성 indel의 경우 20% 이상의 VAF를 가진 위양성 indel은 검출되지 않았으나, 20% 이하의 VAF를 가진 indel의 경우 1~2% 정도 위양성 indel이 검출되었다. 같은 방법으로 유전자의 amplification/deletion 검출의 민감도와 특이도를 다양한 암세포주들을 혼합한 DNA를 이용하여 측정하였는데, 위양성 변이는 발견되지 않았으나, 위음성 변이는 10-20% 정도 검출되었다.
상기와 같이, Frampton 방법은 희석과정에서 정확하게 10여개의 DNA를 같은 양으로 혼합하는데 오류가 흔하게 발생하기 때문에 NGS 패널의 민감도를 평가하는데 어려움이 있었고, 특정 희석배율에서 얼마만큼의 희석된 변이를 검출할 수 있는지에 대한 정확한 정보를 제공하여 주지 못하였다. 이러한 Frampton 방법의 한계에 더하여, indel과 amplification/deletion의 검출은 SNV 검출보다 민감도가 떨어지고, allelic bias와 duplicate read, 그리고 분석 파이프라인의 검출력에 따라 민감도가 특이도가 달라지는 등의 변수들 때문에 NGS 패널의 민감도와 특이도를 가이드라인(guideline)에 특정하여 설정하기 어려웠다 (Shin et al., Nature Comm 2017). 따라서, 현재 American College of Medical Genetics와 Genomics for next-generation sequencing-based assays의 guideline에서는 특정한 coverage threshold 혹은 최소한의 민감도나 특이도를 설정하지 않고 있다 (U.S. Food and Drug Administration (FDA). Considerations for Design, Development, and Analytical Validation of Next Generation Sequencing-Based In Vitro Diagnostics Intended to Aim in the Diagnosis of Suspected Germline Diseases. Updated 13 April 2018).
다만, 표적 부위에서 바람직한 최소 read count로 검출할 수 있는 VAF 정보와, 표준시료의 희석실험을 통해 검출한계 (LoD, Limit of Detection) 정보를 제공하도록 하고 있다 (Rehm et al., Genet Med, 2013; ACMG clinical laboratory standards for next-generation sequencing). 이러한 상황에서 아직 NGS 방법에 대한 규정은 명확하지 않지만, ACLA (Amerian Clinical Laboratory Associations)는 CLIA (Clinical Laboratory Improvement Amendments) 규칙을 통해 현재 genetic test에 이용되고 있는 NGS 패널을 감독하고, FDA는 이러한 패널의 디자인, 개발 및 분석적 검증에 관한 가이드라인을 제정함으로써 NGS가 임상에 적용될 수 있도록 하고 있다. 그러므로, NGS 패널의 민감도와 특이도를 측정할 수 있는 새로운 표준물질과 방법들이 개발된다면 연구자들이 쉽게 NGS 패널들을 비교 평가할 수 있게 되고, 임상적용에 필요한 최소 규정도 개정할 수 있게 될 것이다.
본 발명의 목적은 동형접합체(homozygote) DNA 및 대조 게놈 DNA를 포함하는 차세대 염기서열분석(NGS) 패널의 검증용 조성물을 제공하는 것이다.
본 발명의 다른 목적은 상기 차세대 염기서열분석 패널(NGS)의 검증용 조성물을 포함하는 차세대 염기서열분석(NGS) 패널의 검증용 키트를 제공하는 것이다.
본 발명의 또 다른 목적은 (a) 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 DNA 혼합물 시료에 대하여 차세대 염기서열분석(NGS) 패널을 이용하여 차세대 염기서열분석(NGS)을 수행하는 단계; (b) 상기 (a) 단계에 의한 차세대 염기서열분석(NGS) 결과로부터 Ho-N pair allele (Homozygote-Null pair allele) 또는 He-N pair allele (Heterozygote-Null pair allele)를 선별하는 단계; 및 (c) 상기 선별된 Ho-N pair allele 또는 He-N pair allele를 기준으로 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 각 DNA 혼합물 시료에서 위음성 변이의 빈도를 분석하는 단계를 포함하는 위음성 변이의 분석을 통한 차세대 염기서열분석(NGS) 패널의 검증 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 (a) 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 DNA 혼합물 시료에 대하여 차세대 염기서열분석(NGS) 패널을 이용하여 차세대 염기서열분석(NGS)을 수행하는 단계; (b) 상기 (a) 단계에 의한 차세대 염기서열분석(NGS) 결과로부터 Ho-N pair allele (Homozygote-Null pair allele) 또는 He-N pair allele (Heterozygote-Null pair allele)를 선별하는 단계; (c) 상기 선별된 Ho-N pair allele 또는 He-N pair allele를 기준으로 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 각 DNA 혼합물 시료에서 Ho-N pair allele 또는 He-N pair allele들에서 희석된 변이가 발견되는 수를 퍼센트로 나타내는 희석변이 검출율을 분석하는 단계; 및 (d) 검출한계(Limit of Detection)를 분석하는 단계를 포함하는 검출한계의 분석을 통한 차세대 염기서열분석(NGS) 패널의 검증 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 (a) 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 DNA 혼합물 시료에 대하여 차세대 염기서열분석(NGS) 패널을 이용하여 차세대 염기서열분석(NGS)을 수행하는 단계; (b) 상기 (a) 단계에 의한 차세대 염기서열분석(NGS) 결과로부터 동형접합체 DNA와 대조 게놈 DNA에서 변이가 포함되지 않은 N-N pair allele (Null-Null pair allele)를 선별하는 단계; 및 (c) 상기 선별된 N-N pair allele를 기준으로 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 각 DNA 혼합물 시료에서 위양성 변이의 빈도를 분석하는 단계를 포함하는 위양성 변이의 분석을 통한 차세대 염기서열분석(NGS) 패널의 검증 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 (a) 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 DNA 혼합물 시료에 대하여 차세대 염기서열분석(NGS) 패널을 이용하여 차세대 염기서열분석(NGS)을 수행하는 단계; (b) 상기 (a) 단계에 의한 차세대 염기서열분석(NGS) 결과로부터 동형접합체 DNA와 대조 게놈 DNA에서 변이가 포함되지 않은 N-N pair allele (Null-Null pair allele)를 선별하는 단계; (c) 상기 선별된 N-N pair allele를 기준으로 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 각 DNA 혼합물 시료에서 위양성 변이의 빈도를 분석하는 단계; 및 (d) 위양성 변이를 제거하는 VAF(variant allelic fraction)를 분석하여 엄격성 컷오프값(stringency cutoff value)을 도출하는 단계를 포함하는 차세대 염기서열분석(NGS) 패널의 특이도를 증가시키기 위한 정보제공 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 (a) 기업의 로 데이터(raw data)로부터 기업이 가지고 있는 생물정보학적 분석결과를 이용하여 위음성과 위양성 변이들에 대한 분석 결과를 수집하는 단계; 및 (b) 기업의 로 데이터(raw data)로부터 상용화된 소프트웨어(software)를 이용하여 생물정보학적 분석 결과를 단계(a)의 분석 결과와 비교 분석하는 단계;를 포함하는 기업의 NGS 패널 분석과정에서의 raw data를 생성하는 과정의 오류 또는 생물정보학적 분석과정의 오류에 대한 평가 방법을 제공하는 것이다.
상기 목적을 달성하기 위해, 본 발명은 동형접합체(homozygote) DNA 및 대조 게놈 DNA를 포함하는 차세대 염기서열분석(NGS) 패널의 검증용 조성물을 제공한다.
본 발명의 일 실시예에 있어서, 상기 동형접합체 DNA는 포상기태(hydatidiform mole) 세포주 또는 처녀생식 세포주에서 분리된 DNA인 것일 수 있다.
본 발명의 일 실시예에 있어서, 상기 대조 게놈 DNA는 정상인의 혈액에서 분리된 게놈 DNA인 것일 수 있다. 또한, 상기 대조 게놈 DNA는 환자의 혈액 또는 암조직에서 분리된 게놈 DNA인 것일 수 있다. 또한, 상기 대조 게놈 DNA는 순환 종양 DNA (ctDNA, circulating tumor DNA)인 것일 수 있다. 또한, 상기 대조 게놈 DNA는 합성 DNA 또는 클로닝된 DNA인 것일 수 있다.
본 발명의 일 실시예에 있어서, 동형접합체 DNA 및 대조 게놈 DNA의 희석배율은 1:9999 내지 9999:1로 이루어진 군에서 선택되는 것일 수 있다. 바람직하게는 동형접합체 DNA 및 대조 게놈 DNA의 희석배율은 1:9999, 2.5:9997.5, 5:9995, 1:999, 2.5:997.5, 5:995, 1:99, 2.5:97.5, 5:95, 10:90, 20:80, 50:50, 80:20, 90:10, 95:5, 97.5:2.5, 99:1, 995:5, 997.5:2.5, 999:1, 9995:5, 9997.5:2.5 및 9999:1으로 이루어진 군에서 선택되는 것일 수 있으나, 이에 한정되는 것은 아니다.
또한, 본 발명은 상기 차세대 염기서열분석 패널(NGS)의 검증용 조성물을 포함하는 차세대 염기서열분석(NGS) 패널의 검증용 키트를 제공한다.
또한, 본 발명은 (a) 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 DNA 혼합물 시료에 대하여 차세대 염기서열분석(NGS) 패널을 이용하여 차세대 염기서열분석(NGS)을 수행하는 단계; (b) 상기 (a) 단계에 의한 차세대 염기서열분석(NGS) 결과로부터 Ho-N pair allele (Homozygote-Null pair allele) 또는 He-N pair allele (Heterozygote-Null pair allele)를 선별하는 단계; 및 (c) 상기 선별된 Ho-N pair allele 또는 He-N pair allele를 기준으로 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 각 DNA 혼합물 시료에서 위음성 변이의 빈도를 분석하는 단계를 포함하는 위음성 변이의 분석을 통한 차세대 염기서열분석(NGS) 패널의 검증 방법을 제공한다.
또한, 본 발명은 (a) 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 DNA 혼합물 시료에 대하여 차세대 염기서열분석(NGS) 패널을 이용하여 차세대 염기서열분석(NGS)을 수행하는 단계; (b) 상기 (a) 단계에 의한 차세대 염기서열분석(NGS) 결과로부터 Ho-N pair allele (Homozygote-Null pair allele) 또는 He-N pair allele (Heterozygote-Null pair allele)를 선별하는 단계; (c) 상기 선별된 Ho-N pair allele 또는 He-N pair allele를 기준으로 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 각 DNA 혼합물 시료에서 Ho-N pair allele 또는 He-N pair allele들 중에서 희석된 변이가 발견되는 수를 퍼센트로 나타내는 희석변이 검출율을 분석하는 단계; 및 (d) 검출한계(Limit of Detection)를 분석하는 단계를 포함하는 검출한계의 분석을 통한 차세대 염기서열분석(NGS) 패널의 검증 방법을 제공한다.
본 발명의 일 실시예에 있어서, 상기 방법은 단일염기변이(SNV), 삽입/결실(Indel) 및 염색체 증폭/결실(amplification/deletion)로 이루어진 군에서 선택되는 변이를 검출할 수 있는 차세대 염기서열분석(NGS) 패널을 검증하는 것일 수 있다.
본 발명의 일 실시예에 있어서, 상기 (d) 단계의 검출한계는 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 DNA 혼합물 시료 중에서 90% 또는 95%의 희석변이 검출율을 보이는 최대 희석배율에 해당하는 VAF(variant allelic fraction)를 퍼센트로 나타낸 것일 수 있다.
또한, 본 발명은 (a) 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 DNA 혼합물 시료에 대하여 차세대 염기서열분석(NGS) 패널을 이용하여 차세대 염기서열분석(NGS)을 수행하는 단계; (b) 상기 (a) 단계에 의한 차세대 염기서열분석(NGS) 결과로부터 동형접합체 DNA와 대조 게놈 DNA에서 변이가 포함되지 않은 N-N pair allele (Null-Null pair allele)를 선별하는 단계; 및 (c) 상기 선별된 N-N pair allele를 기준으로 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 각 DNA 혼합물 시료에서 위양성 변이의 빈도를 분석하는 단계를 포함하는 위양성 변이의 분석에 통한 차세대 염기서열분석(NGS) 패널의 검증 방법을 제공한다.
본 발명의 일 실시예에 있어서, 상기 방법은 단일염기변이(SNV), 삽입/결실(Indel) 및 염색체 증폭/결실(amplification/deletion)로 이루어진 군에서 선택되는 변이를 검출할 수 있는 차세대 염기서열분석(NGS) 패널을 검증하는 것일 수 있다.
또한, 본 발명은 (a) 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 DNA 혼합물 시료에 대하여 차세대 염기서열분석(NGS) 패널을 이용하여 차세대 염기서열분석(NGS)을 수행하는 단계; (b) 상기 (a) 단계에 의한 차세대 염기서열분석(NGS) 결과로부터 동형접합체 DNA와 대조 게놈 DNA에서 변이가 포함되지 않은 N-N pair allele (Null-Null pair allele)를 선별하는 단계; (c) 상기 선별된 N-N pair allele를 기준으로 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 각 DNA 혼합물 시료에서 위양성 변이의 빈도를 분석하는 단계; 및 (d) 위양성 변이를 제거하는 VAF(variant allelic fraction)를 분석하여 엄격성 컷오프값(stringency cutoff value)을 도출하는 단계를 포함하는 차세대 염기서열분석(NGS) 패널의 특이도를 증가시키기 위한 정보제공 방법을 제공한다.
본 발명의 일 실시예에 있어서, 상기 엄격성 컷오프값(stringency cutoff value)은 위양성 변이의 95%를 제거하는 95% 엄격성 컷오프값 또는 위양성 변이의 99%를 제거하는 99%의 엄격성 컷오프값인 것일 수 있다.
본 발명의 일 실시예에 있어서, 상기 방법은 차세대 염기서열분석(NGS) 패널의 특이도를 증가시키기 위해 위양성 변이를 제거하는 엄격성 컷오프값의 정보를 제공하는 것일 수 있다.
또한, 본 발명은 (a) 기업의 로 데이터(raw data)로부터 기업이 가지고 있는 생물정보학적 분석결과를 이용하여 위음성과 위양성 변이들에 대한 분석 결과를 수집하는 단계; 및 (b) 기업의 로 데이터(raw data)로부터 상용화된 소프트웨어(software)를 이용하여 생물정보학적 분석 결과를 단계(a)의 분석 결과와 비교 분석하는 단계;를 포함하는 기업의 NGS 패널 분석과정에서의 raw data를 생성하는 과정의 오류 또는 생물정보학적 분석과정의 오류에 대한 평가 방법을 제공한다.
본 발명에 따른 조성물은 NGS 패널 검증에 유용하게 사용될 수 있고, 특히, 본 발명에 따른 검증 방법은 (i) NGS 패널에 대한 위음성 변이의 빈도, 위양성 변이의 빈도 및 검출한계를 객관적 결과로 분석할 수 있고, (ii) NGS 패널의 검증 시 위음성이 특히 많이 나오는 특정 염색체 부위 또는 특정 유전자 부위의 유무를 미리 판별함으로써 위음성이 많은 부위를 분석 시 제거할 수 있어, NGS 패널에서 발생되는 위음성과 관련된 NGS 결과의 해석에 대한 오류를 줄일 수 있으며, (iii) 위양성 변이의 수와 VAF(variant allelic fraction)의 분포를 분석하여 객관적인 엄격성 컷오프값(stringency cutoff value)을 제공할 수 있어, NGS 패널에서 발생되는 위양성과 관련된 NGS 결과의 해석에 대한 오류를 줄일 수 있다.
도 1은 homozygous variant인 DNA1과 null인 DNA2의 여러 희석배율로 혼합된 DNA 혼합물에서 DNA의 상대적인 양을 측정할 수 있음을 나타낸 것이다.
도 2A는 Ho-N pair allele들을 이용하여 AA 회사의 NGS 패널에 대한 검출한계를 분석한 결과이고, 2B 및 2C는 BB 회사의 NGS 패널에 대한 검출한계를 분석한 결과이며, 2D 및 2E는 CC 회사의 NGS 패널에 대한 검출한계를 분석한 결과이다 (X 축: 대립유전자들의 염색체 번호 및 위치(position)에 따라 나열한 것; Y 축: Log(VAF); VAF(variant allelic fraction) = (variant allele read count)/(total read count); 및 FN: 위음성(false negative) 대립유전자; 각각의 색: 해당 희석배율에서의 위음성 결과; 각 그래프 하단의 X 축: 염색체 위치에 따라 순서대로 나열한 것; 및 각 그래프 하단의 Y 축: 염색체 번호 표시). 대조 게놈 DNA와 H mole DNA의 희석배율은 다음과 같다: CH100, 0:100; CH99, 1:99; CH97.5, 2.5:97.5; CH95, 5:95; CH90, 10:90; CH80, 20:80; CH50, 50:50; CH20, 80:20; CH10, 90:10; CH5, 95:5; CH2.5, 97.5:2.5; CH1, 99:1; 및 CH0, 100:0.
도 3A는 He-N pair allele들을 이용하여 AA 회사의 NGS 패널에 대한 검출한계를 분석한 결과이고, 3B는 BB 회사의 NGS 패널에 대한 검출한계를 분석한 결과이며, 3C는 CC 회사의 NGS 패널에 대한 검출한계를 분석한 결과이다 (X 축: 대립유전자들의 염색체 번호 및 위치(position)에 따라 순서대로 나열한 것; Y 축: Log(VAF); VAF(variant allelic fraction) = (variant allele read count)/(total read count); FN: 위음성(false negative) 대립유전자; 각각의 색: 해당 희석배율에서의 위음성 결과; 각 그래프 하단의 X 축: 염색체 위치에 따라 순서대로 나열한 것; 및 각 그래프 하단의 Y 축: 염색체 번호 표시). 대조 게놈 DNA와 H mole DNA의 희석배율은 다음과 같다: CH99, 1:99; CH97.5, 2.5:97.5; CH95, 5:95; CH90, 10:90; CH80, 20:80; CH50, 50:50; CH20, 80:20; CH10, 90:10; CH5, 95:5; CH2.5, 97.5:2.5; CH1, 99:1; 및 CH0, 100:0.
도 4A는 Ho-N pair allele 또는 He-N pair allele들을 이용하여 AA 회사의 NGS 패널의 희석배율에 따른 Indel 검출을 분석한 결과이고, 4B는 BB 회사의 NGS 패널의 희석배율에 따른 Indel 검출을 분석한 결과이다 (X 축: 대립유전자들의 순서대로 나열한 것; Y 축: Log(VAF); VAF(variant allelic fraction) = (variant allele read count)/(total read count); FN: 위음성(false negative) 대립유전자; 및 각각의 색: 해당 희석배율에서의 위음성 결과). 대조 게놈 DNA와 H mole DNA의 희석배율은 다음과 같다: CH100, 0:100; CH95, 5:95; CH90, 10:90; CH80, 20:80; CH50, 50:50; CH20, 80:20; CH10, 90:10; CH5, 95:5; 및 CH0, 100:0.
도 5A는 Ho-He pair allele들을 이용하여 AA 회사의 NGS 패널에 대한 검출한계를 분석한 결과이고, 5B는 BB 회사의 NGS 패널에 대한 검출한계를 분석한 결과이며, 5C는 CC 회사의 NGS 패널에 대한 검출한계를 분석한 결과이다 (X 축: 대립유전자들의 염색체 위치(position)에 따라 나열한 것; Y 축: Log(VAF); VAF(variant allelic fraction) = (variant allele read count)/(total read count); FN: 위음성(false negative) 대립유전자; 각각의 색: 해당 희석배율에서의 위음성 결과; 5C 그래프 하단의 X 축: 염색체 위치에 따라 순서대로 나열한 것; 및 5C 그래프 하단의 Y 축: 염색체 번호 표시). 대조 게놈 DNA와 H mole DNA의 희석배율은 다음과 같다: CH100, 0:100; CH99, 1:99; CH97.5, 2.5: 97.5; CH95, 5:95; CH90, 10:90; CH80, 20:80; CH50, 50:50; CH20, 80:20; CH10, 90:10; CH5, 95:5; CH2.5, 97.5:2.5; CH1, 99:1; 및 CH0, 100:0.
도 6A는 CC 회사의 NGS 패널에 대하여 Ho-N pair allele 또는 He-N pair allele들에서 6번 염색체 변이의 검출한계를 분석한 결과이고, 6B는 대조 DNA에서 null인 Ho-N pair allele들에서 6번 염색체 변이의 검출한계를 분석한 결과이며, 6C는 He-N pair allele들에서 6번 염색체 변이의 검출한계를 분석한 결과이고, 6D는 대조 DNA에서 homozygote인 Ho-N pair allele들에서 6번 염색체 변이의 검출한계를 분석한 결과이다 (X 축: 대립유전자들의 염색체 위치(position)에 따라 나열한 것; Y 축: Log(VAF); VAF(variant allelic fraction) = (variant allele read count)/(total read count); FN: 위음성(false negative) 대립유전자; 및 각각의 색: 해당 희석배율에서의 위음성 결과). 대조 게놈 DNA와 H mole DNA의 희석배율은 다음과 같다: CH99, 1:99; CH97.5, 2.5:97.5; CH95, 5:95; CH90, 10:90; CH50, 50:50; CH10, 90:10; CH5, 95:5; CH2.5, 97.5:2.5; 및 CH1, 99:1.
도 7A는 H mole DNA와 대조 게놈 DNA가 모두 null인 N-N pair allele들을 이용하여 AA 회사의 NGS 패널에서 위양성 변이의 빈도를 분석한 결과이고, 7B는 BB 회사의 NGS 패널에서 위양성 변이의 빈도를 분석한 결과이며, 7C는 CC 회사의 NGS 패널에서 위양성 변이의 빈도를 분석한 결과이다 (X 축: 대립유전자들의 염색체 위치(position)에 따라 순서대로 나열한 것; Y 축: Log(VAF); VAF(variant allelic fraction) = (variant allele read count)/(total read count). 대조 게놈 DNA와 H mole DNA의 희석배율은 다음과 같다: CH99, 1:99; CH97.5, 2.5:97.5; CH95, 5:95; CH90, 10:90; CH50, 50:50; CH10, 90:10; CH5, 95:5; CH2.5, 97.5:2.5; 및 CH1, 99:1.
도 8은 CC 회사의 NGS 패널 결과에서 6번 염색체의 위양성 변이를 제거하고 나머지 위양성 변이들만으로 엄격성 컷오프값(stringency cutoff value)을 도출한 결과이다 (X 축: 대립유전자들의 염색체 위치(position)에 따라 순서대로 나열한 것; Y 축: Log(VAF); VAF(variant allelic fraction) = (variant allele read count)/(total read count). 대조 게놈 DNA와 H mole DNA의 희석배율은 다음과 같다: CH99, 1:99; CH97.5, 2.5:97.5; CH95, 5:95; CH90, 10:90; CH50, 50:50; CH10, 90:10; CH5, 95:5; CH2.5, 97.5:2.5; 및 CH1, 99:1.
도 9A는 도출된 변이들의 위양성 변이를 분석한 결과이며, 각 회사에서 도출한 변이들의 위양성 여부를 분석한 결과(Inhouse), Dragen software로 도출한 변이들의 위양성 여부를 분석한 결과(default, solid, 및 liquid 등 세가지 조건)를 그래프로 표시하여 나타내었다 (y축: 다수의 희석시료들에서 발견되는 위양성변이들의 산술평균 값). 9B는 AA, BB와 CC사 NGS패널의 변이검출 결과로부터 위음성을 분석하여 민감도를 측정한 결과이며, 각 회사에서 각자의 생물정보학적 방법으로 도출한 변이들의 위음성 여부를 분석한 결과 Inhouse), Dragen software의 생물정보학적 방법으로 도출한 변이들의 위음성 여부를 3가지 조건으로 분석한 결과(default, solid, 및 liquid)로부터 희석변이 검출율을 (y축) 그래프로 표시하였다. x 축: %는 변이를 가진 시료의 %이며, 이에 따라 각 시료 전체 DNA 중 변이가 차지하는 %는 변이시료 %의 절반임). 위양성 오류 판정을 위해서 모든 allele에서 H mole DNA와 대조 게놈 DNA에서 분석되어 나타나지 않은 variant 혹은 reference 염기가 발견된 경우 모두 위양성 오류로 판정하였다.
이하, 본 발명을 상세히 설명한다.
본 발명에 사용되는 용어는 본 발명의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 기술분야에 종사하는 기술자의 의도 또는 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 임의로 선정된 용어도 있으며, 이 경우 해당 실시예의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서, 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다.
본 발명에서 어느 구성요소 또는 어는 단계를 "포함한다"고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소 또는 다른 단계를 제외하는 것이 아니라 다른 구성요소 또는 다른 단계를 더 포함할 수 있는 것을 의미한다.
본 발명은 동형접합체(homozygote) DNA 및 대조 게놈 DNA를 포함하는 차세대 염기서열분석(NGS) 패널의 검증용 조성물을 제공한다.
본 발명의 용어, "차세대 염기서열분석(Next generation sequencing)"은 수백만 염기서열을 한꺼번에 분석할 수 있는 기술로서, massively parallel sequencing 또는 high-throughput sequencing이라고도 한다. 본 발명에서는 차세대 염기서열분석 또는 NGS를 혼용하여 기재하고 있다.
본 발명의 용어, "대립유전자(allele)"는 한 쌍의 상동염색체를 이루며 서로 다른 형질을 갖는 유전자로서, 대립인자의 DNA 서열을 의미한다. 상동염색체는 동형접합체와 이형접합체로 분류되며, "동형접합체"는 같은 성질을 가진 대립유전자가 결합된 것이고, "이형접합체"는 다른 성질을 가진 대립유전자가 결합된 것이다. 본 발명에서는 대립유전자 또는 allele를 혼용하여 기재하고 있다.
본 발명에 있어서, 상기 조성물에는 NGS 패널을 검증하기 위해 두 개의 서로 다른 게놈(genomic) DNA를 포함하고 있고, 하나의 DNA는 동형접합체 DNA를 이용하는 것이다.
본 발명에 있어서, 상기 동형접합체 DNA는 포상기태(hydatidiform mole) 세포주 또는 처녀생식 세포주에서 분리된 DNA인 것일 수 있으나, 이에 한정되는 것은 아니다.
본 발명의 용어, "대조 게놈 DNA"는 상기 조성물에 포함된 두 개의 서로 다른 게놈 DNA 중 동형접합체 DNA가 아닌, 다른 하나의 게놈 DNA를 의미하며, 동형접합체 또는 이형접합체의 게놈 DNA인 것일 수 있다.
본 발명에 있어서, 상기 대조 게놈 DNA는 정상인의 혈액에서 분리된 게놈 DNA인 것일 수 있다. 또한, 상기 대조 게놈 DNA는 환자의 혈액 또는 암조직에서 분리된 게놈 DNA인 것일 수 있다. 또한, 대조 게놈 DNA는 순환 종양 DNA (ctDNA, circulating tumor DNA)인 것일 수 있다. 또한, 상기 대조 게놈 DNA는 합성 DNA 또는 클로닝된 DNA인 것일 수 있으나, 이에 한정되는 것은 아니다.
본 발명에 있어서, 상기 조성물에는 동형접합체 DNA 및 대조 게놈 DNA의 희석배율이 1:9999 내지 9999:1로 이루어진 군에서 선택되는 것일 수 있고, 바람직하게는 동형접합체 DNA 및 대조 게놈 DNA의 희석배율은 1:9999, 2.5:9997.5, 5:9995, 1:999, 2.5:997.5, 5:995, 1:99, 2.5:97.5, 5:95, 10:90, 20:80, 50:50, 80:20, 90:10, 95:5, 97.5:2.5, 99:1, 995:5, 997.5:2.5, 999:1, 9995:5, 9997.5:2.5 및 9999:1으로 이루어진 군에서 선택되는 것일 수 있으나, 이에 한정되는 것은 아니다.
또한, 본 발명은 상기 차세대 염기서열분석 패널의 검증용 조성물을 포함하는 차세대 염기서열분석(NGS) 패널의 검증용 키트를 제공한다.
또한, 본 발명은 (a) 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 DNA 혼합물 시료에 대하여 차세대 염기서열분석(NGS) 패널을 이용하여 차세대 염기서열분석(NGS)을 수행하는 단계; (b) 상기 (a) 단계에 의한 차세대 염기서열분석(NGS) 결과로부터 Ho-N pair allele (Homozygote-Null pair allele) 또는 He-N pair allele (Heterozygote-Null pair allele)를 선별하는 단계; 및 (c) 상기 선별된 Ho-N pair allele 또는 He-N pair allele를 기준으로 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 각 DNA 혼합물 시료에서 위음성 변이의 빈도를 분석하는 단계를 포함하는 위음성 변이의 분석을 통한 차세대 염기서열분석(NGS) 패널의 검증 방법을 제공한다.
본 발명의 용어, "위음성"은 본래 양성이어야 할 검사결과가 잘못되어 음성으로 나온 경우를 말한다.
또한, 본 발명은 (a) 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 DNA 혼합물 시료에 대하여 차세대 염기서열분석(NGS) 패널을 이용하여 차세대 염기서열분석(NGS)을 수행하는 단계; (b) 상기 (a) 단계에 의한 차세대 염기서열분석(NGS) 결과로부터 Ho-N pair allele (Homozygote-Null pair allele) 또는 He-N pair allele (Heterozygote-Null pair allele)를 선별하는 단계; (c) 상기 선별된 Ho-N pair allele 또는 He-N pair allele를 기준으로 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 각 DNA 혼합물 시료에서 Ho-N pair allele 또는 He-N pair allele 중 희석된 변이가 발견되는 수를 퍼센트로 나타내는 희석변이 검출율을 분석하는 단계; 및 (d) 검출한계(Limit of Detection)를 분석하는 단계를 포함하는 검출한계의 분석을 통한 차세대 염기서열분석(NGS) 패널의 검증 방법을 제공한다.
본 발명의 용어, "Ho-N pair allele (Homozygote-Null pair allele)"는 하나의 대립유전자 부위가 homozygous variant와 변이가 없는 null로 혼합된 대립유전자를 말한다.
본 발명의 용어, "He-N pair allele (Heterozygote-Null pair allele)"는 하나의 대립유전자 부위가 heterozygous variant와 변이가 없는 null로 혼합된 대립유전자를 말한다.
본 발명의 용어, "희석변이 검출율"은 동형접합체 DNA와 대조 게놈 DNA의 서로 다른 희석배율로 혼합된 DNA 혼합물 시료에서 Ho-N pair allele 또는 He-N pair allele들 중 희석된 변이가 발견되는 수를 퍼센트로 나타낸 것을 의미한다.
본 발명에 있어서, 상기 방법은 단일염기변이(SNV), 삽입/결실(Indel) 및 염색체 증폭/결실(amplification/deletion)로 이루어진 군에서 선택되는 변이를 검출할 수 있는 차세대 염기서열분석(NGS) 패널을 검증하는 것일 수 있다.
본 발명의 용어, "변이(variant)"는 야생형과 유전적으로 구별되는 염색체, 유전자 또는 염기서열의 변형을 의미한다. 본 발명에서는 변이 또는 variant를 혼용하여 기재하고 있다.
본 발명에 있어서, 상기 (d) 단계의 검출한계는 상기 (d) 단계의 검출한계는 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 DNA 혼합물 시료 중에서 90% 또는 95%의 희석변이 검출율을 보이는 최대 희석배율에 해당하는 VAF(variant allelic fraction)를 퍼센트로 나타낸 것일 수 있다.
본 발명에서는 NGS 패널의 검증을 위해 동형접합체 DNA인 포상기태(hydatidiform mole) 세포주에서 분리된 DNA (이하, "H mole DNA") 및 대조 게놈 DNA가 여러 가지의 서로 다른 희석배율로 포함된 DNA 혼합물 시료를 포함하는 NGS 패널 검증용 조성물을 이용하였다.
예를 들어, 하나의 대립유전자 부위에서 동형접합 변이(homozygous variant)가 포함된 DNA1과 변이가 포함되지 않은 null이 포함된 DNA2인 경우, DNA1과 DNA2를 혼합하고, VAF(variant allelic fraction)을 구하면 DNA1과 DNA2의 희석배율을 알 수 있으며, 각 대립유전자들의 90% 또는 95%의 희석변이 검출율을 보이는 최대 희석배율에 해당하는 VAF(variant allelic fraction)를 퍼센트로 나타냄으로써 검출한계(Limit of Detection)를 도출할 수 있다.
더욱 구체적으로, 도 1은 homozygous variant인 DNA1과 null인 DNA2를 여러 가지의 서로 다른 희석배율로 혼합된 각 DNA 혼합물에서 혼합된 DNA의 상대적인 양을 측정할 수 있음을 나타낸 것이다. 이 경우, 하나의 대립유전자 부위가 homozygous variant와 null로 혼합된 대립유전자는 "Ho-N pair allele (Homozygote-Null pair allele)"로 정의하였고, VAF(variant allelic fraction)이 서로 다른 대립유전자들 중에서 Ho-N pair allele가 나올 확률을 하기 표 1에 나타내었다.
Figure PCTKR2023010929-appb-img-000001
* p = VAF(variant allelic fraction); q = 1-p; P1: 두 개의 DNA가 모두 일반적인 게놈(genomic) DNA인 경우 Ho-N pair allele가 나올 확률 (P1 = p2q2+q2p2 = 2 p2q2 ); 및 P2: 두 개의 DNA 중 하나의 DNA가 H mole DNA인 경우 Ho-N pair allele가 나올 확률 (P2 = p2q + q2p = pq(p + q) = pq).
상기 표 1에서와 같이, 두 개의 DNA 혼합물 중 하나의 DNA가 동형접합체 DNA인 H mole DNA인 경우와 두 개의 DNA가 모두 일반적인 게놈 DNA인 경우에 대하여, 9 가지 서로 다른 VAF(variant allelic fraction, p)를 가진 대립유전자들로부터 Ho-N pair allele의 수를 계산하여 비교하면, 두 개의 DNA가 모두 일반적인 게놈 DNA인 경우에는 9 가지 서로 다른 VAF를 가진 대립유전자들에서 Ho-N pair allele가 나올 확률의 합이 0.67 개로 계산되는 반면, 하나의 DNA가 동형접합체 DNA인 H mole DNA인 경우에는 1.65 개로 계산된다. 즉, 하나의 DNA가 동형접합체 DNA인 H mole DNA인 경우에는 두 개의 DNA가 모두 일반적인 게놈 DNA인 경우에 비해 Ho-N pair allele의 수를 약 2.45 배 정도 (= P2/P1 비율) 높게 얻을 수 있다.
특히, 각 대립유전자에서 변이가 실제 변이로 분석되는 경우와 참조서열(reference)로 분석되는 경우로 나누어 확률을 계산하더라도 P2/P1 비율이 달라지지 않았다. 또한, 참조서열 대립유전자(reference allele)로 결정된 대립유전자의 빈도가 변이 대립유전자(variant allele)의 빈도보다 낮은 경우에도 P2/P1 비율이 동일하였으며, 각 대립유전자들의 분포에서 변이가 나타나는 빈도를 고려하여 계산하고 p 값을 0~1까지 범위에서 적분하여도 P2/P1 비율은 2.50으로 거의 변하지 않았다 (예를 들어, allele 1의 빈도가 0.1이고, allele 9의 빈도가 0.9인 것으로 고려함).
이에 본 발명에서는 두 개의 DNA 혼합물 중 하나의 DNA가 동형접합체 DNA인 H mole DNA인 경우에는 그렇지 않은 경우에 비해 2.5배 정도로 많은 수의 Ho-N pair allele를 구할 수 있어, 동형접합체 DNA인 H mole DNA를 이용하여 NGS 패널의 검출한계(Limit of Detection)를 분석하는 것이 더 유용할 수 있음을 확인하였다.
또한, 본 발명은 (a) 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 DNA 혼합물 시료에 대하여 차세대 염기서열분석(NGS) 패널을 이용하여 차세대 염기서열분석(NGS)을 수행하는 단계; (b) 상기 (a) 단계에 의한 차세대 염기서열분석(NGS) 결과로부터 동형접합체 DNA와 대조 게놈 DNA에서 변이가 포함되지 않은 N-N pair allele (Null-Null pair allele)를 선별하는 단계; 및 (c) 상기 선별된 N-N pair allele를 기준으로 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 각 DNA 혼합물 시료에서 위양성 변이의 빈도를 분석하는 단계를 포함하는 위양성 변이의 분석에 통한 차세대 염기서열분석(NGS) 패널의 검증 방법을 제공한다.
본 발명의 용어, "N-N pair allele (Null-Null pair allele)"는 대립유전자 부위가 모두 변이가 없는 null로 이루어진 대립유전자를 말한다.
본 발명의 용어, "위양성"은 본래 음성이어야 할 검사결과가 잘못되어 양성으로 나온 경우를 말한다.
본 발명에서는 동형접합체 DNA와 대조 게놈 DNA가 모두 null인 N-N pair allele를 기준으로 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 각 DNA 혼합물 시료에서 변이가 존재한 것으로 나오면 위양성 변이로 판단하였다.
본 발명에 있어서, 상기 방법은 단일염기변이(SNV), 삽입/결실(Indel) 및 염색체 증폭/결실(amplification/deletion)로 이루어진 군에서 선택되는 변이를 검출할 수 있는 차세대 염기서열분석(NGS) 패널을 검증하는 것일 수 있다.
또한, 본 발명은 (a) 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 DNA 혼합물 시료에 대하여 차세대 염기서열분석(NGS) 패널을 이용하여 차세대 염기서열분석(NGS)을 수행하는 단계; (b) 상기 (a) 단계에 의한 차세대 염기서열분석(NGS) 결과로부터 동형접합체 DNA와 대조 게놈 DNA에서 변이가 포함되지 않은 N-N pair allele (Null-Null pair allele)를 선별하는 단계; (c) 상기 선별된 N-N pair allele를 기준으로 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 각 DNA 혼합물 시료에서 위양성 변이의 빈도를 분석하는 단계; 및 (d) 위양성 변이를 제거하는 VAF(variant allelic fraction)를 분석하여 엄격성 컷오프값(stringency cutoff value)을 도출하는 단계를 포함하는 차세대 염기서열분석(NGS) 패널의 특이도를 증가시키기 위한 정보제공 방법을 제공한다.
본 발명에 있어서, 상기 엄격성 컷오프값(stringency cutoff value)은 위양성 변이의 95%를 제거하는 95% 엄격성 컷오프값 또는 위양성 변이의 99%를 제거하는 99%의 엄격성 컷오프값인 것일 수 있다.
본 발명에 있어서, 상기 방법은 차세대 염기서열분석(NGS) 패널의 특이도를 증가시키기 위해 위양성 변이를 제거하는 엄격성 컷오프값의 정보를 제공하는 것일 수 있다.
이하, 본 발명을 실시예를 통하여 더욱 상세히 설명하기로 한다. 이들 실시예는 본 발명을 보다 구체적으로 설명하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다.
실시예 1. DNA 혼합물 준비 및 NGS 분석
본 발명에서는 NGS 패널 검증을 위해 동형접합체 DNA인 H mole DNA를 이용하여 세 회사의 NGS 패널에 대한 민감도 및 특이도를 비교 분석하였다. 본 발명에 사용된 인간 포상기태(hydatidiform mole) 유래의 H mole DNA는 Coriell 사(NA07489, Camden, NJ)에서 구입하였으며, 대조 게놈 DNA는 국립암센터 기관생명윤리위원회(Institutional Review Board)의 승인을 받아 공동연구자의 혈액에서 게놈 DNA를 추출하여 사용하였다.
준비된 H mole DNA, 대조 게놈 DNA 및 H mole DNA와 대조 게놈 DNA가 혼합된 DNA 혼합물을 각각 AA 회사, BB 회사 및 CC 회사에 보내고, 각 회사의 NGS 패널을 이용하여 Illumina 회사의 Novaseq 6000 NGS 장비를 통해 실험이 수행되었다. 이후, 실험에서 얻어진 FASTQ 파일(file)로부터 각 회사에 마련된 방법으로 변이들을 분석한 파일(file)을 받아 NGS 패널의 검증을 수행하였다. 다만, 각 회사의 NS 패널에서 얻은 변이의 수는 유전자의 변이의 수 이외에 각 회사의 분석 방법에 따라 차이가 있다. 그런데, 모든 회사는 공통적으로 NCBI human genome assembly의 hg19을 참조서열(reference)로 사용하였고, CC 회사는 variant caller으로 MuTect 이외에도 LoFreq를 추가로 사용하여 더 많은 변이를 분석하였다.
실시예 2. NGS 검증 방법
2.1. Ho-N pair allele와 He-N pair allele의 선별
각 회사에서 분석한 변이들에 대한 결과는 참조서열 염기 (reference base), 변이 대립유전자 정보 (variant allele information), VAF, read count 및 변이에 대한 정보 등을 각 시료정보와 함께 염색체 번호 및 위치(position)을 기준으로 정렬하였다. AA 회사와 BB 회사의 분석 결과에서는 read count가 100 미만이면 분석에서 제외하였고, CC 회사의 분석 결과에서는 read count가 300 미만이면 분석에서 제외하였다. 또한, AA와 BB 회사의 경우 엑손 부위 SNV이외에도 인트론 부위 SNV와 indel 대립유전자를 모두 분석에 포함하였는데, CC회사의 경우 엑손 부위 SNV와 스플라이스 부위 SNV를 분석에 포함시켰으나 인트론부위 SNV와 indel 변이는 분석에서 제외하였다.
선발된 대립유전자들 중 H mole DNA와 대조 게놈 DNA의 대립유전자가 homozygous variant와 null로 이루어진 쌍을 "Ho-N pair allele (Homozygote-Null pair allele)"라고 정의하고, H mole DNA가 null이고 대조 게놈 DNA가 heterozygous variant로 이루어진 쌍을 "He-N pair allele(Heterozygote-Null pair allele)"로 정의하였다.
2.2. Ho-N pair allele 및 He-N pair allele를 이용한 위음성 변이, 희석변이 검출율 및 검출한계의 결정
동형접합체 DNA인 H mole DNA 또는 대조 게놈 DNA에 변이가 존재하는데도, H mole DNA와 대조 게놈 DNA의 DNA 혼합물 시료의 NGS 패널 분석에서 변이가 발견되지 않은 대립유전자는 위음성(false negative) 대립유전자로 정의하였고, H mole DNA와 대조 게놈 DNA의 DNA 혼합물 시료에서 Ho-N pair allele와 He-N pair allele로 나누어 위음성 대립유전자의 빈도를 분석하였다.
희석변이 검출율은 동형접합체 DNA인 H mole DNA와 대조 게놈 DNA의 서로 다른 희석배율로 혼합된 DNA 혼합물에서 Ho-N pair allele 또는 He-N pair allele 중 변이가 발견되는 대립유전자의 수를 퍼센트로 나타낸 것으로 정의하였다.
검출한계(Limit of Detection, LoD)는 동형접합체 DNA인 H mole DNA와 대조 게놈 DNA의 서로 다른 희석배율로 혼합된 DNA 혼합물 중에서 90% 또는 95%의 희석변이 검출율을 보이는 최대 희석배율에 해당하는 VAF(variant allelic fraction)를 퍼센트로 나타낸 것으로 정의하였다. 여기서, VAF는 특정 대립유전자 위치에서 변이로 검출된 서열의 read count를 특정 대립유전자 위치에서 변이와 참조서열 염기로 검출된 서열을 더한 전체 read count로 나눈 값이다.
2.3. 위양성(false positive) 변이 및 엄격성 컷오프값(stringency cutoff value)의 결정
동형접합체 DNA인 H mole DNA와 대조 게놈 DNA가 모두 변이가 발견되지 않은 null 대립유전자들 중에서, H mole DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 DNA 혼합물 시료의 NGS 분석결과에서 변이가 존재한 것으로 나오면 위양성(false positive) 변이로 정의하였다. 이러한 위양성 변이의 95% 또는 99%를 제거할 수 있는 VAF(variant allelic fraction)의 값을 각각 95% 엄격성 컷오프값(stringency cutoff value) 또는 99% 엄격성 컷오프값(stringency cutoff value)로 정의하였다.
실시예 3. Ho-N pair allele을 이용한 NGS 패널에 대한 민감도 분석 결과
AA 회사, BB 회사 및 CC 회사의 결과에서 나온 모든 변이 부위들 중에서 변이 대립유전자들의 median read count는 각각 197 (Q1, Q3; 51,464), 813 (433, 1189) 및 679 (577, 717)로 확인되었다. 반면, 본 발명의 Ho-N pair allele와 He-N pair allele들에 대한 시료에서의 median read count는 각각 AA 회사에서 380 (Q1, Q2; 221, 633), BB 회사에서 901 (Q1, Q; 503, 1234) 및 CC 회사에서 703 (Q1, Q2; 679, 727)로 확인되었다.
우선, Ho-N pair allele를 분석하여 3개 회사의 NGS 패널에 대한 민감도를 평가하였다. AA 회사의 변이 분석 결과에는 엑손부위에 대립유전자가 거의 없었으므로, 인트론 부위 변이를 포함하여 민감도와 특이도를 분석하였다. AA 회사의 분석 결과로부터 Ho-N pair allele를 선발한 결과, 15 개(10.2%, 15/147)가 엑손 부위 변이인 것으로 확인되었고, 나머지는 인트론 부위 변이 혹은 UTR 부위 변이로 확인되었다.
또한, BB 회사의 변이 분석 결과에는 보내준 SNV와 indel을 포함하였 엑손과 인트론 변이를 모두 포함하여 민감도와 특이도를 분석하였으며, Ho-N pair allele를 선발한 결과, 134 개(89.9%, 134/149)가 엑손 부위 변이 또는 스플라이스 부위 변이로 확인되었다. CC 회사의 변이 분석 결과에는 분석된 대립유전자 수가 상대적으로 많아서 엑손 부위 변이 및 스플라이스 부위 변이만을 선발하였으며, indel을 제거하고 SNV만을 분석하였는데, Ho-N pair allele는 모두 306 개로 확인되었다.
Ho-N pair allele를 이용하여 각 회사의 NGS 패널에 대한 민감도를 분석한 결과, 먼저 AA 회사의 NGS 패널은 H mole DNA가 50% 및 대조 게놈 DNA가 50%가 포함된 DNA 혼합물(CH50)에서 모든 SNV가 검출되었고, H mole DNA가 80% 및 대조 게놈 DNA가 20%로 포함된 DNA 혼합물(CH80)에서 147 개의 Ho-N pair allele 중 134 개가 검출되어 희석변이 검출율이 91.2%로 확인되었다 (도 2A). 또한, H mole DNA가 90% 및 대조 게놈 DNA가 10%가 포함된 DNA 혼합물(CH90)에서 16 개의 SNV 만이 검출되어 희석변이 검출율이 10.9%로 확인되었다 (도 2A). 이에 AA 회사의 NGS 패널의 90% 희석변이 검출율을 보이는 최대 희석배율은 20% 정도로 확인되었으며, 이는 90% 희석변이 검출율을 보이는 검출한계가 20% 정도라는 것을 의미한다.
BB 회사의 NGS 패널은 10%의 DNA 혼합물 시료(즉, H mole DNA가 90% 및 대조 게놈 DNA가 10%로 포함된 DNA 혼합물(CH90) 및 H mole DNA가 10% 및 대조 게놈 DNA가 90%로 포함된 DNA 혼합물(CH10))에서 149 개의 Ho-N pair allele가 모두 검출되었고, 5%의 DNA 혼합물 시료(즉, H mole DNA가 95% 및 대조 게놈 DNA가 5%로 포함된 DNA 혼합물(CH95) 및 H mole DNA가 5% 및 대조 게놈 DNA가 95%로 포함된 DNA 혼합물(CH5))에서 149 개의 Ho-N pair allele 중 137 개가 검출되어 희석변이 검출율이 약 88.6%로 확인되었다 (도 2B 및 2C). 이에 BB 회사의 NGS 패널의 90% 희석변이 검출율을 보이는 최대 희석배율은 5~10% 사이이고, 더 근접하게는 5% 정도로 확인되었으며, 이는 90% 희석변이 검출율을 보이는 검출한계가 5% 정도라는 것을 의미한다.
CC 회사의 결과에서는 6번 염색체의 유전자 일부에 위음성이 많아 검출한계 분석에서 제외하였다. 6번 염색체에는 91 개의 Ho-N pair allele가 포함되어 있어, 이를 제외한 215 개의 Ho-N pair allele를 분석하였다. CC 회사의 NGS 패널은 2.5%의 DNA 혼합물 시료(즉, H mole DNA가 97.5% 및 대조 게놈 DNA가 2.5%로 포함된 DNA 혼합물(CH97.5) 및 H mole DNA가 2.5% 및 대조 게놈 DNA가 97.5%로 포함된 DNA 혼합물(CH2.5))에서 215 개의 Ho-N pair allele가 모두 검출되었고, 1%의 DNA 혼합물 시료(즉, H mole DNA가 99% 및 대조 게놈 DNA가 1%로 포함된 DNA 혼합물(CH99) 및 H mole DNA가 1% 및 대조 게놈 DNA가 99%로 포함된 DNA 혼합물(CH1))에서 215 개의 Ho-N pair allele 중 197 개가 검출되어 희석변이 검출율이 약 91.6%로 확인되었다 (도 2D 및 2E). 이에 CC 회사의 NGS 패널의 90% 희석변이 검출율을 보이는 최대 희석배율은 1% 로 확인되었으며, 이는 90% 희석변이 검출율을 보이는 검출한계가 1% 정도라는 것을 의미한다.
상기 결과로부터, 본 발명의 H mole DNA가 포함된 DNA 혼합물을 사용하여 Ho-N pair allele를 선별하고, 이로부터 90% 희석변이 검출율을 보이는 최대 희석배율에 해당하는 VAF(variant allelic fraction)을 퍼센트로 나타내는 검출한계를 분석할 수 있어, 위음성 변이의 빈도 분석 및 검출한계의 분석을 통해 각 회사의 NGS 패널을 검증할 수 있음을 확인하였다.
실시예 4. He-N pair allele를 이용한 NGS 패널에 대한 민감도 분석 결과
혼합된 두 DNA가 null과 heterozygous variant로 이루어진 He-N pair allele들을 이용하여 민감도를 분석할 수 있는 조사하였다. 우선, AA 회사의 분석 결과에서는 269 개의 He-N pair allele들을 얻을 수 있었다 (exonic variant는 53개, 전체의 19.7%). AA 회사의 NGS 패널은 50%의 DNA 혼합물 시료(즉, H mole DNA가 50% 및 대조 게놈 DNA가 50%가 포함된 DNA 혼합물(CH50))에서 269 개의 He-N pair allele 중 266 개가 검출되어 희석변이 검출율이 98.9%로 확인되었다 (도 3A). 이는 VAF(variant allelic fraction)가 0.25인 변이 대립유전자를 98.9% 검출하였다는 것으로서, 검출한계가 25% 이하라는 것을 의미한다. 이의 결과는 상기 Ho-N pair allele를 이용한 분석 결과와 유사하였음을 확인하였다.
BB 회사의 분석 결과에서는 172 개의 He-N pair allele들을 얻었다 (exonic variant 또는 splicing variant가 147개, 전체의 85.5%). BB 회사의 NGS 패널은 10%의 DNA 혼합물 시료(즉, H mole DNA가 90% 및 대조 게놈 DNA가 10%로 포함된 DNA 혼합물(CH90) 및 H mole DNA가 10% 및 대조 게놈 DNA가 90%로 포함된 DNA 혼합물(CH10))에서 172 개의 He-N pair allele 중 166 개가 검출되어 희석변이 검출율이 96.5%로 확인되었다 (도 3B). 이는 VAF(variant allelic fraction)가 0.05인 변이 대립유전자를 96.5% 검출하였다는 것으로서, 검출한계가 5% 이하라는 것을 의미한다. 이의 결과는 상기 Ho-N pair allele를 이용한 분석 결과와 유사하였음을 확인하였다.
CC 회사의 분석 결과에서는 6번 염색체에 존재하는 54 개의 He-N pair allele들을 제외하여 276 개의 He-N pair allele들을 얻었다 (모두 exon 부위 SNV). CC 회사의 NGS 패널은 2.5%의 DNA 혼합물 시료(즉, H mole DNA가 97.5% 및 대조 게놈 DNA가 2.5%로 포함된 DNA 혼합물(CH97.5) 및 H mole DNA가 2.5% 및 대조 게놈 DNA가 97.5%로 포함된 DNA 혼합물(CH2.5))에서 276 개의 He-N pair allele 중 246 개가 검출되어 희석변이 검출율이 89.1%로 확인되었다 (도 3C). 이는 VAF(variant allelic fraction)가 0.0125인 변이 대립유전자를 89.1% 검출하였다는 것으로서, 검출한계가 1.25% 라는 것을 의미한다. 이의 결과는 상기 Ho-N pair allele를 이용한 분석 결과와 유사하였음을 확인하였다.
참고로, AA 회사와 BB 회사의 Ho-N pair allele 또는 He-N pair allele들 중 SNV 이외에 각각 38개와 8개의 indel이 포함되어 있었고, 이들은 검출한계의 계산에 거의 영향을 미치지 않았다 (도 4).
상기 결과로부터, 본 발명에서는 Ho-N pair allele 및 He-N pair allele를 분석하여 90%의 희석변이 검출율을 보이는 최대 희석배율을 확인함으로써 각 NGS 패널에 대한 검출한계를 객관적 결과로 분석할 수 있어, NGS 패널의 검증에 유용하게 사용할 수 있음을 확인하였다. 또한, Ho-N pair allele의 결과와 He-N pair allele의 결과를 모두 사용한 경우에는 Ho-N pair allele 만을 사용한 경우에 비해 더 많은 대립유전자들에서의 민감도 정보를 얻을 수 있다는 장점이 있음을 확인하였다.
실시예 5. 검출한계와 read count 혹은 VAF(variant allelic fraction)와의 관련성
선행문헌에서는 SNV의 검출에 있어 read count (또는 local sequence coverage)가 350인 경우에 VAF(variant allelic fraction)가 5% 미만인 대립유전자와 5-10%인 대립유전자를 각각 89.4% 및 99.2%로 검출할 수 있으며, read count가 738인 경우에 VAF(variant allelic fraction)가 5% 미만인 대립유전자와 5-10%인 대립유전자를 각각 98.5% 및 99.7%로 검출할 수 있다고 보고하고 있어, read count와 VAF(variant allelic fraction)가 변이의 검출 민감도 혹은 검출한계와 관련이 있는 것으로 보고되었다 (Frampton et al., Nature Biotechnology 2013).
그런데, 실제 분석 결과에서는 AA 회사의 median read count가 380 정도이지만, VAF(variant allelic fraction)가 10%인 변이를 10.9%만 검출하였고, 20%인 변이를 91.2% 검출하여, AA 회사의 NGS 패널에 대한 민감도가 현저히 낮음을 알 수 있었다. 또한, BB 회사의 read count가 900 정도이고, VAF(variant allelic fraction)가 5%인 변이를 88.6% 검출하여, BB 회사의 NGS 패널에 대한 검출한계는 상기 선행문헌과 유사한 결과를 보였다.
다만, CC 회사의 read count가 700 정도이고, VAF(variant allelic fraction)가 2.5%인 변이를 100% 검출하였고, 1%인 변이를 91.6% 검출하여, CC 회사의 NGS 패널에 대한 검출한계는 상기 선행문헌과 결과보다 뛰어난 것을 알 수 있었다. 또한, 이러한 결과는 read count와 VAF(variant allelic fraction)의 관련성 이외에도 NGS 패널의 민감도를 결정하는 여러 변수가 있을 수 있음을 의미한다. 따라서, read count와 VAF(variant allelic fraction) 만으로 NGS 패널에 대한 민감도 혹은 검출한계를 평가할 수 없다는 것을 알 수 있으며, 특정 NGS 패널이 연구 목적을 달성할 수 있는 민감도를 가지고 있는지를 평가하기 위해 연구자들이 각각 표준 혼합물을 사용하여 해당 NGS 패널에 대한 민감도의 검증이 필요함을 알 수 있다.
실시예 6. Ho-He pair allele를 이용한 NGS 패널에 대한 민감도 분석 결과
다음으로, H mole DNA에서 homozygous variant이고, 대조 게놈 DNA에서 heterozygous variant로 이루어진 쌍을 "Ho-He pair allele (Homozygote and Heterozygous pair allele)"로 정의하고, variant allele에 비하여 희석된 reference allele이 차지하는 fraction을 계산한 RAF(reference allelic fraction) 값을 얻고 이를 기반으로 검출한계를 분석할 수 있는지 확인하였다.
RAF를 이용한 분석에서, AA 회사의 NGS 패널은 5%의 DNA 혼합물 시료(즉, H mole DNA가 95% 및 대조 게놈 DNA가 5%로 포함된 DNA 혼합물(CH95))에서 2.5% RAF(reference allelic fraction)을 가진 Ho-He pair allele을 94.9% (131/138) 검출하였다 (도 5A). 또한, BB 회사의 NGS 패널은 5%의 DNA 혼합물 시료(즉, H mole DNA가 95% 및 대조 게놈 DNA가 5%로 포함된 DNA 혼합물(CH95) 및 H mole DNA가 5% 및 대조 게놈 DNA가 95%로 포함된 DNA 혼합물(CH5))에서 2.5% RAF(reference allelic fraction)을 가진 Ho-He pair allele을 96.7% (116/120) 검출하였다 (도 5B). 또한, CC 회사의 NGS 패널은 1%의 DNA 혼합물 시료(즉, H mole DNA가 99% 및 대조 게놈 DNA가 1%로 포함된 DNA 혼합물(CH99) 및 H mole DNA가 1% 및 대조 게놈 DNA가 99%로 포함된 DNA 혼합물(CH1))에서 0.5% RAF을 가진 Ho-He pair allele을 97.8% (221/226) 검출하였다 (도 5C).
상기와 같이, Ho-He pair allele를 이용하여 검출한계를 분석한 결과에서는 각 회사에 의뢰한 최대 희석배율에서 희석된 참고서열 염기의 검출율이 모두 90% 이상으로 확인되었다. 또한, CC 회사의 NGS 패널에서 발견되었던 6번 염색체에서의 위음성 대립유전자들도 뚜렷하게 발견되지 않았다.
이상과 같이, Ho-He pair allele를 이용한 분석 결과는 상기 Ho-N pair allele 또는 He-N pair allele을 이용한 희석변이 검출분석 결과와 완전히 상이함을 알 수 있었다. 따라서, Ho-He pair allele들의 RAF(reference allelic fraction)값을 이용하여 참고서열 염기의 검출한계를 분석하는 방법은 NGS 패널 평가에 적절하지 않음을 확인하였다.
실시예 7. 6번 염색체에 대한 검출한계의 추가 분석 결과
CC 회사의 NGS 패널은 6번 염색체에서 위음성이 많이 나오는 심각한 문제가 확인되었고, He-N pair allele를 이용한 분석이 Ho-N pair allele를 이용한 분석에 비해 상대적으로 적었다. 이에 위음성이 많이 나온 6번 염색체 부위를 Ho-N pair allele 또는 He-N pair allele들의 염색체 위치와 일치시킨 후, Ho-N pair allele와 He-N pair allele를 이용한 분석 결과에 차이가 있는지 확인하였다.
그 결과, 6번 염색체 내에서도 위음성이 더 많이 발생하는 특정 유전자 부위가 있었고, He-N pair allele들에는 이러한 유전자 부위가 적게 포함되어 있어, Ho-N pair allele들에 비해 위음성이 적게 나타났음을 확인하였다 (도 6). CC 회사의 NGS 패널과 같이, 위음성과 관련된 특정 염색체 부위가 있다는 것은 VAF(variant allelic fraction)가 큰 돌연변이라도 위음성으로 나올 가능성이 있음을 고려해야 한다는 것을 의미한다.
상기 결과로부터, 본 발명의 방법은 NGS 패널의 검증 시 위음성이 특히 많이 나오는 특정 염색체 부위 또는 특정 유전자 부위의 유무를 미리 판별함으로써 분석 시 해당 부위의 위음성 가능성을 고려하면서 최종 결과를 판단할 수 있다는 장점이 있으며, 또한 새로운 NGS 패널의 디자인에서 이러한 부위를 제거함으로써 NGS 패널에서 발생되는 위음성과 관련된 NGS 패널 분석에 따른 오류를 줄일 수 있음을 확인하였다.
실시예 8. NGS 패널에 대한 위양성(false positive) 변이 및 엄격성 컷오프값(stringency cutoff value)의 분석 결과
앞서 언급한 바와 같이, H mole DNA와 대조 게놈 DNA가 모두 변이가 발견되지 않은 null 대립유전자들(이를 "N-N pair allele"로 정의함) 중에서, H mole DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 DNA 혼합물 시료의 NGS 패널 분석결과에서 변이가 발견된 경우 이들을 위양성(false positive) 변이로 정의하였고, 각 회사의 NGS 패널에서 위양성 변이의 검출 빈도를 분석하였다.
그 결과, AA 회사 및 BB 회사의 NGS 패널은 CC 회사에 비해 상대적으로 적은 위양성 변이가 발견되었다 (도 7). 이는 AA 회사 및 BB 회사 NGS 패널의 검출한계를 나타내는 VAF 값이 CC 회사의 검출한계 VAF 값보다 상대적으로 높아서, 다시 말해 변이를 검출할 수 있는 민감도가 떨어져서 기인된 것으로 사료된다. 다만, CC 회사의 NGS 패널은 6번 염색체를 제외하고 VAF(variant allelic fraction)가 0.1 이상인 경우에 AA 회사 및 BB 회사의 NGS 패널에 비해 위양성 변이가 상대적으로 적은 것으로 확인되었다 (도 7).
참고로, CC 회사의 NGS 패널 분석에서는 2가지의 문제가 발견되었다. 첫째, 10%의 DNA 혼합물 시료(즉, H mole DNA가 10% 및 대조 게놈 DNA가 90%로 포함된 DNA 혼합물(CH10))에서는 대규모의 위양성 변이들이 발견되었다는 것이다. 그런데, 다른 시료들과 유사한 조건에서 실험이 진행되었다면 비슷한 숫자의 위양성 변이들이 발견되었어야 하는데, CH10에서만 10배 정도 더 많은 수의 위양성 변이가 발견되었다는 점에서, 이는 CC 회사 NGS 기기를 이용한 실험 과정에서의 오류로 판단하였고, 도 7C에서는 CH10에서만 나오는 위양성 변이들을 제외하였다. 둘째, CC 회사 NGS 패널의 6번 염색체 대립유전자들은 위양성 변이들의 VAF가 나머지 염색체 부위의 위양성 변이들의 VAF에 비해 현저히 낮거나 현저히 높았다는 문제가 있었으며, 이는 도 7C에서 확인할 수 있다. 따라서, 위양성 변이검출 분석에는 6번 염색체의 대립유전자는 제외하였다.
이후, 앞서 언급한 바와 같이, 위양성 변이의 95% 또는 99%를 제거할 수 있는 VAF 값으로 정의된 95% 엄격성 컷오프값(stringency cutoff value) 또는 99% 엄격성 컷오프값(stringency cutoff value)을 도출하였다. 현재까지 대부분의 연구자들은 NGS 패널 분석 후 위양성 변이를 제거하기 위해 특정 VAF값 이상만을 "진성 변이"로 결정하고, 이때의 VAF(variant allelic fraction) 값을 "엄격성 컷오프값(stringency cutoff value)"라고 하였으나, 이를 과학적으로 결정하는 명확한 기준이 제시되지 않았었다.
본 발명에서는 위양성 변이의 95% 또는 95%를 제거할 수 있는 VAF 값을 "엄격성 컷오프값(stringency cutoff value)"으로 도출하는 방법을 명확히 제시하는 것이며, 이를 확인하기 위해 CC 회사의 N-N pair allele들에서 위양성 변이들의 VAF 값의 분포를 분석하였다. 이 경우, 상기 언급한 CC 회사의 NGS 패널에서 문제가 되었던 2가지(즉, 1. CH10 시료에서 대규모 위양성 변이가 나타남; 및 2. 6번 염색체의 위양성 변이에서 VAF의 변화가 심함)에 해당하는 대립유전자들은 분석에서 제외한 후 엄격성 컷오프값(stringency cutoff value)을 도출하였다.
그 결과, CC 회사의 NGS 패널에서 얻은 위양성 변이의 수는 최종적으로 1,977 개이었고, 위양성 변이의 95%를 제거할 수 있는 VAF(variant allelic fraction) 값은 0.067 이며, 위양성 변이의 99%를 제거할 수 있는 VAF(variant allelic fraction) 값은 0.0875 로 확인되었다 (도 8). 즉, 위양성 변이의 95%를 제거하기 위해 CC 회사의 NGS 패널을 분석하고자 한다면 엄격성 컷오프값(stringency cutoff value)을 0.067 로 도출되었고, 위양성 변이의 99%를 제거하기 위해 CC 회사의 NGS 패널을 분석하고자 한다면 엄격성 컷오프값(stringency cutoff value)을 0.087 로 도출되었다.
상기 결과로부터, 본 발명에서는 위양성 변이의 빈도를 분석하여 NGS 패널을 검증할 수 있고, NGS 패널의 특이도를 증가시키기 위해 위양성 변이를 제거하는 객관적인 엄격성 컷오프값의 정보를 제공할 수 있어 NGS 패널에서 발생되는 위양성과 관련된 NGS 결과의 해석에 대한 오류를 줄일 수 있음을 확인하였다.
실시예 9. 각 회사의 NGS 패널분석 결과에서 FASTQ 파일에 담겨있는 오류와 생물정보학분석 오류의 평가
세 회사 NGS 패널들을 각각 회사에서 분석한 결과의 오류는 1) NGS 패널을 이용하여 만들어진 로 데이터(raw data), 즉 FASTQ file자체가 가지고 있는 오류와 2) 세 회사들 각각 raw data로부터 변이를 찾아내기 위한 생물정보학적 분석과정의 오류로 나눌 수 있다. 이 두가지 오류의 기여도를 확인하기 위하여 상용화된 소프트웨어(software)를 사용하여 raw data로부터 변이를 찾아내고, 이를 이용하여 두가지 오류의 기여도를 확인하고자 하였으며, 생물정보학적 분석에는 Illumina 사의 Dragen software를 사용하였다. 이 과정에 각 회사의 bed file이 필요하지만 AA와 CC 회사에서 bed file을 제공하지 않았고, 이에 따라 두 회사에서 제공하는 유전자들의 exon부분 변이들만 분석하였다. BB 회사의 경우는 회사에서 제공한 bed file을 이용하여 전체 capture된 부위의 모든 변이를 분석하였다.
변이부분의 위음성 오류의 판정은 앞에서 기술한 바와 같이 시행하였다. 그러나 위양성 오류 판정을 위해서 N-N pair allele 뿐 아니라 Ho-N pair, He-N pair, Ho-He pair 등 모든 allele에서 H mole DNA와 대조 게놈 DNA에서 분석되어 나타나지 않은 variant 혹은 reference 염기가 발견된 경우 모두 위양성 오류로 판정하였고, 이로부터 각 회사의 NGS 패널에서 위양성 변이의 검출 빈도를 분석하였다.
도 9는 세 회사의 생물정보학적 방법으로 제공한 변이결과로부터 분석한 위음성과 위양성, 그리고 Dragen software를 이용하여 각 회사의 raw data (FASTQ file)로부터 변이를 분석하여 위음성과 위양성을 분석한 결과를 나타낸 것이다. Dragen software로 변이분석을 하는데, default, solid, 그리고 liquid 등 3가지 조건을 사용하였고, default는 일반적으로 사용하는 조건이며, solid와 liquid는 default 조건에 비하여 민감도를 높인 조건이다.
도 9A는 도출된 변이들의 위양성 변이를 분석한 결과인데, 각각의 회사에서 도출한 변이들의 위양성 여부를 분석한 결과와 (Inhouse), Dragen software로 도출한 변이들의 위양성 여부를 분석한 결과 (default, solid, 그리고 liquid 등 세가지 조건)를 그래프로 표시하였다. 도 9A의 y축은 다수의 희석시료들에서 발견되는 위양성변이들의 산술평균 값을 나타낸 것이다. Dragen software의 분석조건 3 가지 중 default 조건으로 분석한 결과에서 solid 혹은 liquid 조건으로 분석한 결과에 비해 위양성이 적게 발생한 것을 확인할 수 있다 (BB와 CC 회사에 위양성의 수는 30개 이하, 푸른 선으로 표시). Dragen software의 분석조건 중 default가 나머지 두 조건에 비해 민감도가 낮다는 것을 고려한다면 이와 같은 결과는 민감도를 낮추면 특이도가 증가하는 일반적인 현상과 일치하는 소견이다.
그런데 AA 회사의 inhouse방법으로 변이를 분석한 결과에서는 위양성 변이가 적게 포함되어 위양성이 적다는 결과를 얻었으나 (평균 0.5 개), Dragen software의 default 조건으로 분석하는 경우는 위양성이 많이 발생하였다 (도 9A 사각형, 위양성 평균 818개). 이러한 이유로 후술하겠지만 AA 회사의 NGS 패널결과 분석에서 FP오류가 많이 발생하였기 때문이 아닌가 의심된다. 이에따라 민감도를 희생하고 특이도를 높이도록 조건을 변경했을 것으로 의심된다. 그리고 CC 회사의 inhouse방법은 위양성을 많이 발생시킨다는 것을 확인할 수 있는데 (도 9A 화살표, 위양성 평균이 1680개), 이것은 후술하겠지만 CC 회사에서 의도적으로 민감도를 높여서 변이를 분석한 것과 관련이 있을 것으로 보인다.
도 9B는 AA, BB와 CC 회사 NGS패널의 변이검출 결과로부터 위음성을 분석하여 민감도를 측정한 결과인데, 각각의 회사에서 각자의 생물정보학적 방법으로 도출한 변이들의 위음성 여부를 분석한 결과와 (Inhouse), Dragen software의 생물정보학적 방법으로 도출한 변이들의 위음성 여부를 3가지 조건으로 분석한 결과 (default, solid, 그리고 liquid)로부터 희석변이 검출율을 (y축) 그래프로 표시하였다. 또한 도 9B의 x 축에 나타낸 %는 heterozygote 변이를 가진 시료의 %이며, 이에 따라 각 시료 전체 DNA 중 변이가 차지하는 %는 x축에 표시된 변이시료 %의 절반이다 (예를 들어 도 9B의 x축에 5%로 표시된 시료의 경우 실제 변이가 차지하는 %는 2.5%라는 것을 의미한다). 도 9B의 Dragen software를 이용한 생물정보학적 방법을 사용한 결과는 모두 default조건을 이용한 결과만을 표시하였다. 다만 도 9B에서의 Dragen software를 이용하여 변이검출율을 분석하기위해 AA와 CC 회사의 경우 각 회사에서 제공한 표적 유전자의 엑손에 존재하는 변이만 분석한 것이고, BB 회사의 경우는 bed file을 이용하여 BB 회사의 NGS 패널로 capture한 모든 부위에 존재하는 변이를 분석하였다. 또한 도 9B의 모든 민감도 분석결과는 He-N pair allele들을 이용한 결과이다.
도 9B의 민감도 분석결과를 살펴보면 AA 회사가 그들의 생물정보학적 방법으로 분석한 결과는 20% heterozygote variant DNA가 포함된 시료에서 변이를 거의 검출하지 못하는 결과를 보였는데, 이는 AA 회사 NGS패널의 변이 측정한계가 10%보다 크다는 것을 의미하며, Ho-N pair allele들을 분석한 결과를 참조하면 AA 회사의 raw data와 그들의 생물정보학적 방법으로 분석한 최종결과는 변이 측정한계가 겨우 20%정도라는 것을 의미한다. 그런데 Dragen software의 default조건에서 얻은 변이들을 분석하면 10% heterozygote variant DNA가 포함된 시료에 존재하는 변이들을 대부분 검출하는 것으로 보아 민감도 변이 측정한계가 5%정도 라는 것을 알 수 있다. 따라서 AA 회사가 사용한 생물정보학적 방법은 민감도가 낮은 조건을 선택한 것으로 여겨진다. 이렇게 민감도를 낮게 조정한 것은 도 9A에서 Dragen software의 defalut 조건으로 얻은 변이를 분석한 위양성 변이가 너무 많이 (818개) 발견되는 것과 관련이 있는 것으로 보이고, 결국 AA 회사는 민감도를 희생하고 특이도를 높이도록 분석조건을 변경한 (민감도가 20%정도가 되도록 조건을 변경) 것으로 이해할 수 있다.
도 9B 민감도 분석결과 CC 회사의 경우는 그들의 생물정보학적 조건으로 분석한 결과 2.5% heterozygote variant DNA시료에 있는 희석변이들을 대부분 검출하는 것으로 보아 민감도가 1.25% 변이 존재를 대부분 검출하는 정도로 보인다. Dragen software의 default 조건으로 획득한 변이들을 분석하면 2.5% heterozygote variant DNA시료의 희석변이 중 50% 정도만 검출하고 5% heterozygote variant DNA 시료의 희석변이를 대부분 검출하는 것으로 보아 변이 검출한계는 2.5%정도로 보인다. 따라서 CC 회사의 생물정보학적방법이 민감도가 Dragen software 분석에서의 민감도 보다 더 높은 것처럼 보였다. 그러나 도 9A의 특이도 분석결과를 보면 CC 회사의 inhouse 생물정보분석 조건에서는 1680개의 위양성 변이를 검출하는 것으로 보아 그들의 생물정보분석 조건은 의도적으로 민감도를 높이는 조건을 사용하였으며, 이에 따라 특이도가 크게 낮아지는 문제가 발생하고 있다는 것을 알 수 있다.
위 결과를 정리하면 AA 회사는 raw data를 생성하는 과정에 오류가 많다는 것을 평가할 수 있는데, 이 회사는 생물정보학적 분석과정에서 위양성 변이가 많이 발생하는 문제를 해결하고자 민감도를 희생하는 분석조건으로 조정한 것으로 보인다. BB 회사는 생물정보학적 분석과정에서 Dragen software를 이용한 변이분석에 비하여 더 많은 위음성 희석변이들이 발생하였는데, 결과적으로 회사에서 분석한 NGS패널의 민감도가 Dragen software의 분석에 따른 민감도에 비해 약간 낮은 것으로 보인다. CC 회사는 생물정보학적 분석과정에서 민감도를 증가시키기 위해 분석조건을 조정하여 위양성이 많이 발생한 것으로 보인다.
이상과 같이 본 발명의 결과를 상용화된 software로 분석함으로서 특정 회사의 NGS 패널 분석과정 중 1) raw data를 생성하는 과정의 오류와 2) 생물정보학적 분석과정의 오류들을 나누어 확인할 수 있다는 장점이 있다.

Claims (19)

  1. 동형접합체(homozygote) DNA 및 대조 게놈 DNA를 포함하는 차세대 염기서열분석(NGS) 패널의 검증용 조성물.
  2. 제 1 항에 있어서,
    상기 동형접합체 DNA는 포상기태(hydatidiform mole) 세포주 또는 처녀생식 세포주에서 분리된 DNA인 것인, 조성물.
  3. 제 1 항에 있어서,
    상기 대조 게놈 DNA는 정상인의 혈액에서 분리된 게놈 DNA인 것인, 조성물.
  4. 제 1 항에 있어서,
    상기 대조 게놈 DNA는 환자의 혈액 또는 암조직에서 분리된 게놈 DNA인 것인, 조성물.
  5. 제 1 항에 있어서,
    상기 대조 게놈 DNA는 순환 종양 DNA (ctDNA, circulating tumor DNA)인 것인, 조성물.
  6. 제 1 항에 있어서,
    상기 대조 게놈 DNA는 합성 DNA 또는 클로닝된 DNA인 것인, 조성물.
  7. 제 1 항에 있어서,
    동형접합체 DNA 및 대조 게놈 DNA의 희석배율은 1:99 내지 99:1로 이루어진 군에서 선택되는 것인, 조성물.
  8. 제 1 항에 있어서,
    동형접합체 DNA 및 대조 게놈 DNA의 희석배율은 1:9999, 2.5:9997.5, 5:9995, 1:999, 2.5:997.5, 5:995, 1:99, 2.5:97.5, 5:95, 10:90, 20:80, 50:50, 80:20, 90:10, 95:5, 97.5:2.5, 99:1, 995:5, 997.5:2.5, 999:1, 9995:5, 9997.5:2.5 및 9999:1으로 이루어진 군에서 선택되는 것인, 조성물.
  9. 제1항 내지 제8항 중 어느 한 항에 따른 차세대 염기서열분석(NGS) 패널의 검증용 조성물을 포함하는 차세대 염기서열분석(NGS) 패널의 검증용 키트.
  10. (a) 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 DNA 혼합물 시료에 대하여 차세대 염기서열분석(NGS) 패널을 이용하여 차세대 염기서열분석(NGS)을 수행하는 단계;
    (b) 상기 (a) 단계에 의한 차세대 염기서열분석(NGS) 결과로부터 Ho-N pair allele (Homozygote-Null pair allele) 또는 He-N pair allele (Heterozygote-Null pair allele)를 선별하는 단계; 및
    (c) 상기 선별된 Ho-N pair allele 또는 He-N pair allele를 기준으로 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 각 DNA 혼합물 시료에서 위음성 변이의 빈도를 분석하는 단계를 포함하는 위음성 변이의 분석을 통한 차세대 염기서열분석(NGS) 패널의 검증 방법.
  11. (a) 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 DNA 혼합물 시료에 대하여 차세대 염기서열분석(NGS) 패널을 이용하여 차세대 염기서열분석(NGS)을 수행하는 단계;
    (b) 상기 (a) 단계에 의한 차세대 염기서열분석(NGS) 결과로부터 Ho-N pair allele (Homozygote-Null pair allele) 또는 He-N pair allele (Heterozygote-Null pair allele)를 선별하는 단계;
    (c) 상기 선별된 Ho-N pair allele 또는 He-N pair allele를 기준으로 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 각 DNA 혼합물 시료에서 Ho-N pair allele 또는 He-N pair allele 중 희석된 변이가 발견되는 수를 퍼센트로 나타내는 희석변이 검출율을 분석하는 단계; 및
    (d) 검출한계(Limit of Detection)를 분석하는 단계를 포함하는 검출한계의 분석을 통한 차세대 염기서열분석(NGS) 패널의 검증 방법.
  12. 제 11 항에 있어서,
    상기 방법은 단일염기변이(SNV), 삽입/결실(Indel) 및 염색체 증폭/결실(amplification/deletion)로 이루어진 군에서 선택되는 변이를 검출할 수 있는 차세대 염기서열분석(NGS) 패널을 검증하는 것인, 검증 방법.
  13. 제 11 항에 있어서,
    상기 (d) 단계의 검출한계는 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 DNA 혼합물 시료 중에서 90% 또는 95%의 희석변이 검출율을 보이는 최대 희석배율에 해당하는 VAF(variant allelic fraction)를 퍼센트로 나타낸 것인, 검증 방법.
  14. (a) 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 DNA 혼합물 시료에 대하여 차세대 염기서열분석(NGS) 패널을 이용하여 차세대 염기서열분석(NGS)을 수행하는 단계;
    (b) 상기 (a) 단계에 의한 차세대 염기서열분석(NGS) 결과로부터 동형접합체 DNA와 대조 게놈 DNA에서 변이가 포함되지 않은 N-N pair allele (Null-Null pair allele)를 선별하는 단계; 및
    (c) 상기 선별된 N-N pair allele를 기준으로 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 각 DNA 혼합물 시료에서 위양성 변이의 빈도를 분석하는 단계를 포함하는 위양성 변이의 분석을 통한 차세대 염기서열분석(NGS) 패널의 검증 방법.
  15. 제 14 항에 있어서,
    상기 방법은 단일염기변이(SNV), 삽입/결실(Indel) 및 염색체 증폭/결실(amplification/deletion)로 이루어진 군에서 선택되는 변이를 검출할 수 있는 차세대 염기서열분석(NGS) 패널을 검증하는 것인, 검증 방법.
  16. (a) 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 DNA 혼합물 시료에 대하여 차세대 염기서열분석(NGS) 패널을 이용하여 차세대 염기서열분석(NGS)을 수행하는 단계;
    (b) 상기 (a) 단계에 의한 차세대 염기서열분석(NGS) 결과로부터 동형접합체 DNA와 대조 게놈 DNA에서 변이가 포함되지 않은 N-N pair allele (Null-Null pair allele)를 선별하는 단계;
    (c) 상기 선별된 N-N pair allele를 기준으로 동형접합체 DNA와 대조 게놈 DNA가 서로 다른 희석배율로 혼합된 각 DNA 혼합물 시료에서 위양성 변이의 빈도를 분석하는 단계; 및
    (d) 위양성 변이를 제거하는 VAF(variant allelic fraction)를 분석하여 엄격성 컷오프값(stringency cutoff value)을 도출하는 단계를 포함하는 차세대 염기서열분석(NGS) 패널의 특이도를 증가시키기 위한 정보제공 방법.
  17. 제 16 항에 있어서,
    상기 엄격성 컷오프값(stringency cutoff value)은 위양성 변이의 90%를 제거하는 90% 엄격성 컷오프값, 위양성 변이의 95%를 제거하는 95% 엄격성 컷오프값 또는 위양성 변이의 99%를 제거하는 99%의 엄격성 컷오프값인 것인, 정보제공 방법.
  18. 제 16 항에 있어서,
    상기 방법은 차세대 염기서열분석(NGS) 패널의 특이도를 증가시키기 위해 위양성 변이를 제거하는 엄격성 컷오프값의 정보를 제공하는 것인, 정보제공 방법.
  19. (a) 기업의 로 데이터(raw data)로부터 기업이 가지고 있는 생물정보학적 분석결과를 이용하여 위음성과 위양성 변이들에 대한 분석 결과를 수집하는 단계; 및
    (b) 기업의 로 데이터(raw data)로부터 상용화된 소프트웨어(software)를 이용하여 생물정보학적 분석 결과를 단계(a)의 분석 결과와 비교 분석하는 단계;를 포함하는 기업의 NGS 패널 분석과정에서의 raw data를 생성하는 과정의 오류 또는 생물정보학적 분석과정의 오류에 대한 평가 방법.
PCT/KR2023/010929 2022-07-28 2023-07-27 차세대 염기서열분석 패널의 검증 방법 WO2024025361A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2022-0093705 2022-07-28
KR20220093705 2022-07-28

Publications (1)

Publication Number Publication Date
WO2024025361A1 true WO2024025361A1 (ko) 2024-02-01

Family

ID=89707024

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2023/010929 WO2024025361A1 (ko) 2022-07-28 2023-07-27 차세대 염기서열분석 패널의 검증 방법

Country Status (2)

Country Link
KR (1) KR20240016220A (ko)
WO (1) WO2024025361A1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101030476B1 (ko) * 2008-03-11 2011-04-25 국립암센터 Snp 어레이를 이용한 염색체, 유전자, 또는 특정 뉴클레오티드 서열의 카피 수 측정방법
WO2019043015A1 (en) * 2017-08-29 2019-03-07 Assistance Publique - Hopitaux De Paris METHOD OF CONFIRMATION OF VARIANTS IN A NGS PANEL TEST BY GENOTYPING SNP

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101030476B1 (ko) * 2008-03-11 2011-04-25 국립암센터 Snp 어레이를 이용한 염색체, 유전자, 또는 특정 뉴클레오티드 서열의 카피 수 측정방법
WO2019043015A1 (en) * 2017-08-29 2019-03-07 Assistance Publique - Hopitaux De Paris METHOD OF CONFIRMATION OF VARIANTS IN A NGS PANEL TEST BY GENOTYPING SNP

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
FETTKE HEIDI, STEEN JASON A, KWAN EDMOND M, BUKCZYNSKA PATRICIA, KEERTHIKUMAR SHIVAKUMAR, GOODE DAVID, DOCANTO MARIA, NG NICOLE, M: "Analytical validation of an error-corrected ultra-sensitive ctDNA next-generation sequencing assay", BIOTECHNIQUES, INFORMA HEALTHCARE, US, vol. 69, no. 2, 1 August 2020 (2020-08-01), US , pages 133 - 140, XP093133640, ISSN: 0736-6205, DOI: 10.2144/btn-2020-0045 *
KIM, YOUNG-HO: "Novel next generation sequencing method which can detect mutations and copy number changes simultaneously. ", FINAL REPORT, OPERATION OF CANCER RESEARCH INSTITUTE AND NATIONAL CANCER MANAGEMENT PROJECT HEADQUARTER, 1 October 2019 (2019-10-01), pages 1 - 16, XP009552257 *
LAWRENCE J. JENNINGS, MARIA E. ARCILA, CHRISTOPHER CORLESS, SUZANNE KAMEL-REID, IRA M. LUBIN, JOHN PFEIFER, ROBYN L. TEMPLE-SMOLKI: "Guidelines for Validation of Next-Generation Sequencing–Based Oncology Panels", THE JOURNAL OF MOLECULAR DIAGNOSTICS, AMERICAN SOCIETY FOR INVESTIGATIVE PATHOLOGY AND THE ASSOCIATION FOR MOLECULAR PATHOLOGY, vol. 19, no. 3, 1 May 2017 (2017-05-01), pages 341 - 365, XP055644626, ISSN: 1525-1578, DOI: 10.1016/j.jmoldx.2017.01.011 *
PRIETO-POTIN IVÁN, CARVAJAL NEREA, PLAZA-SÁNCHEZ JENIFER, MANSO REBECA, AÚZ-ALEXANDRE CARMEN LAURA, CHAMIZO CRISTINA, ZAZO SANDRA,: "Validation and clinical application of a targeted next-generation sequencing gene panel for solid and hematologic malignancies", PEERJ, PEERJ INC., vol. 8, 6 October 2020 (2020-10-06), pages e10069, XP093133637, ISSN: 2167-8359, DOI: 10.7717/peerj.10069 *
SUSSMAN ROBYN T., SHAFFER SYDNEY, AZZATO ELIZABETH M., DESLOOVER DANIEL, FAROOQI MIDHAT S., MEYER ANDERS, LIEBERMAN DAVID B., BIGD: "Validation of a next-generation sequencing oncology panel optimized for low input DNA", CANCER GENETICS, ELSEVIER, AMSTERDAM, NL, vol. 228-229, 1 December 2018 (2018-12-01), AMSTERDAM, NL , pages 55 - 63, XP093133632, ISSN: 2210-7762, DOI: 10.1016/j.cancergen.2018.08.004 *

Also Published As

Publication number Publication date
KR20240016220A (ko) 2024-02-06

Similar Documents

Publication Publication Date Title
Guo et al. Genome sequencing identifies multiple deleterious variants in autism patients with more severe phenotypes
Souren et al. DNA methylation signatures of monozygotic twins clinically discordant for multiple sclerosis
Jia et al. Next-generation sequencing of paired tyrosine kinase inhibitor-sensitive and-resistant EGFR mutant lung cancer cell lines identifies spectrum of DNA changes associated with drug resistance
WO2017023148A1 (ko) 다양한 플랫폼에서 태아의 성별과 성염색체 이상을 구분할 수 있는 새로운 방법
WO2020171573A1 (ko) 혈중 무세포 dna 기반 간암 치료 예후예측 방법
Málaga et al. Sensitivity, advantages, limitations, and clinical utility of targeted next-generation sequencing panels for the diagnosis of selected lysosomal storage disorders
WO2019031785A2 (ko) 유전자 패널에 기초한 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스
Wei et al. Massively parallel sequencing reveals an accumulation of de novo mutations and an activating mutation of LPAR1 in a patient with metastatic neuroblastoma
Nelson et al. The MUC6/AP2A2 locus and its relevance to Alzheimer’s disease: a review
WO2017135768A1 (ko) 추정 자손의 유전질환 발병 위험성을 예측하는 방법 및 시스템
WO2017086675A1 (ko) 대사 이상 질환 진단 장치 및 그 방법
Maranhao et al. exomeSuite: Whole exome sequence variant filtering tool for rapid identification of putative disease causing SNVs/indels
Mahamdallie et al. The ICR96 exon CNV validation series: a resource for orthogonal assessment of exon CNV calling in NGS data
Strom et al. A streamlined approach to Prader-Willi and Angelman syndrome molecular diagnostics
WO2024025361A1 (ko) 차세대 염기서열분석 패널의 검증 방법
Capone et al. Evaluation of a next-generation sequencing assay for BRCA1 and BRCA2 mutation detection
Guruju et al. Molecular Diagnosis of Facioscapulohumeral Muscular Dystrophy in Patients Clinically Suspected of FSHD Using Optical Genome Mapping
WO2020209590A1 (ko) 신경교종의 진단 또는 예후 예측용 조성물 및 이에 관한 정보를 제공하는 방법
Liu et al. Comprehensive Analysis of Hemophilia A (CAHEA): Towards Full Characterization of the F8 Gene Variants by Long-Read Sequencing
Cao et al. NGS4THAL, a one-stop molecular diagnosis and carrier screening tool for thalassemia and other hemoglobinopathies by next-generation sequencing
WO2019132581A1 (ko) 유방암 및 난소암 등 암 진단용 조성물 및 이의 용도
Zhang et al. The reliable assurance of detecting somatic mutations in cancer-related genes by next-generation sequencing: the results of external quality assessment in China
WO2022119204A1 (ko) Ebv 동정을 포함한 암 면역치료제 효능예측 표적유전체 분석법
Pal et al. The etiology of Down syndrome: Maternal MCM9 polymorphisms increase risk of reduced recombination and nondisjunction of chromosome 21 during meiosis I within oocyte
Li et al. Identification of a novel de novo heterozygous deletion in the SOX10 gene in Waardenburg syndrome type II using next-generation sequencing

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23847018

Country of ref document: EP

Kind code of ref document: A1