WO2024089314A1 - Panel de secuenciación para biopsia líquida de pacientes con cáncer de mama - Google Patents

Panel de secuenciación para biopsia líquida de pacientes con cáncer de mama Download PDF

Info

Publication number
WO2024089314A1
WO2024089314A1 PCT/ES2023/070633 ES2023070633W WO2024089314A1 WO 2024089314 A1 WO2024089314 A1 WO 2024089314A1 ES 2023070633 W ES2023070633 W ES 2023070633W WO 2024089314 A1 WO2024089314 A1 WO 2024089314A1
Authority
WO
WIPO (PCT)
Prior art keywords
breast cancer
mutations
patients
genes
tumor
Prior art date
Application number
PCT/ES2023/070633
Other languages
English (en)
French (fr)
Inventor
Iñaki COMINO MÉNDEZ
Emilio ALBA CONEJO
Francisco Javier PASCUAL LÓPEZ
Alfonso ALBA BERNAL
Begoña JIMÉNEZ RODRÍGUEZ
María Elena QUIRÓS ORTEGA
Original Assignee
Servicio Andaluz De Salud
Roche Farma, S.A.
Universidad De Málaga
Consorcio Centro De Investigación Biomédica En Red
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Servicio Andaluz De Salud, Roche Farma, S.A., Universidad De Málaga, Consorcio Centro De Investigación Biomédica En Red filed Critical Servicio Andaluz De Salud
Publication of WO2024089314A1 publication Critical patent/WO2024089314A1/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Definitions

  • the present invention is within the field of medicine and oncology, and refers to a sequencing panel for tumor tissues and liquid biopsy of patients with breast cancer.
  • breast cancer the tumors that develop in the breast tissues.
  • ductal carcinoma which begins in the ducts that carry milk from the breast to the nipple and is the majority
  • lobular carcinoma which begins in the lobes that produce milk.
  • mammography breast ultrasound with high-resolution transducers (ultrasounds) or magnetic resonance imaging.
  • Liquid biopsy is a strategy with great potential in the management of cancer, including diagnosis, early detection of relapses or allowing monitoring of the state of the disease throughout treatment to see its evolution.
  • This is a test that is performed using body biofluids, most commonly blood, although they can also be analyzed in other body fluids such as the one that covers the meninges, the one that covers the lung, saliva or even urine, in order to to look for cancer cells from a tumor or DNA fragments from tumor cells, the so-called circulating tumor DNA (ctDNA).
  • ctDNA circulating tumor DNA
  • Sequencing panels are genetic tests that encompass genes involved in the same pathology, in this case, aimed at breast cancer.
  • SafeSEQ - Safe-sequencing system Targeted NGS such as SafeSEQ - Safe-sequencing system have recently emerged as a new tool to increase the sensitivity of massively parallel sequencing system instruments for the identification of rare variants in plasma DNA.
  • This sequencing strategy uses single-molecule barcodes prior to PCR amplification to reduce sequencing error and increase precision.
  • the SafeSEQ, or secure sequencing, system can be used to distinguish between rare mutations and technical errors and is capable of detecting mutations that other technologies would miss. SafeSEQ has so far been applied to plasma samples from metastatic colorectal cancer and patients with gastrointestinal stromal tumors.
  • NGS technologies include gene region enrichment probes such as Agilent SureSelect, which can be used to design custom hybrid capture panels and mass sequence any coding or non-coding region of the genome or transcriptome.
  • genes for ctDNA analysis and identification of metastatic breast cancer include the following genes: AKT1, AR, BRCA1, BRCA2, EGFR, ERCC4, ERBB2, ERBB3, ESR1, FGFR1, KRAS, MUC16, PIK3CA , PIK3R1, PTEN, PTGFR and TGFB1 (4).
  • a massive sequencing panel is proposed for the early diagnosis of breast cancer, useful in the evaluation and monitoring of the disease, composed of 37 genes (see Table 1).
  • this panel allows the ultrasensitive characterization of tumor genetic aberrations, so it can be used for the detection of mutations at allelic frequencies below 0.15%.
  • This high sensitivity allows detection of mutations in biofluids (liquid biopsy) from patients with localized/early tumors or those cancers with little release of tumor material.
  • This panel has been optimized and validated using four breast tumor samples with known mutations (see example 1) and its results have been compared with other sequencing panels for this same type of cancer, breast cancer, showing greater detection capacity. of mutations (see example 2).
  • Its use in liquid biopsies has been supported in comparative studies with tumor samples, where the high sensitivity, specificity and predictive value capacity of the breast cancer diagnosis method based on this sequencing panel is demonstrated (see example 3). Its usefulness as a marker of prognosis or progression of the disease has also been proven, through its correlation with clinicopathological variables (see example 4).
  • a first aspect of the invention refers to the sequencing panel comprising the genes of Table 1. Specifically and more preferably, to their use as biomarkers to diagnose, early diagnose, predict or forecast the evolution of breast cancer. And even more preferably, for use in liquid biopsy.
  • Another aspect of the invention relates to an in vitro method of obtaining data useful for diagnosing, early diagnosing, predicting or forecasting the evolution of breast cancer in an individual, hereinafter first method of the invention, which comprises : a) obtain a biological sample isolated from the individual, b) identify possible mutations in the genes in Table 1.
  • Another aspect of the invention relates to an in vitro method for diagnosing or early diagnosis of breast cancer, hereinafter second method of the invention, comprising steps (a) - (b) according to the first method. of the invention, and also comprises: c) assigning the individual who has mutations in any of the genes in Table 1 to the group of patients suffering from breast cancer.
  • the second method of the invention further comprises assigning the individual who has a higher median allele frequency of the mutations to the group of patients with a higher tumor grade.
  • Another aspect of the invention refers to an in vitro method to predict or forecast the evolution of breast cancer, which comprises the method of obtaining useful data of the invention, and which also comprises assigning the individual who has more than one mutation, to the group of patients with a probability of clinical relapse.
  • Another aspect of the invention refers to the in vitro method for predicting or prognosticating the evolution of breast cancer, which includes the method of obtaining useful data of the invention and which also includes assigning the individual who has mutations in TP53 to the group of patients with tumor negative for the expression of hormone receptors.
  • a "biological sample” as defined herein is a small part of a subject, representative of the whole, and may consist of a biopsy or a sample of body fluid.
  • the biological sample is plasma, coming from the physical separation of the blood sample taken from the patient.
  • Detection of mutations in the genes of Table 1 can be carried out by any means known in the state of the art.
  • next-generation sequencing NGS
  • Agilent SureSelect type enrichment probes Agilent SureSelect type enrichment probes.
  • the method of the present invention can be applied with samples from individuals of any sex, that is, men or women, and at any age. Preferably applied to samples obtained from women.
  • prognosis is understood as the expected evolution of a disease and refers to the assessment of the probability according to which a subject suffers from a disease, as well as the assessment of its onset, state of development, evolution, or of its regression, and/or the prognosis of the course of the disease in the future.
  • an assessment although preferred, may not normally be correct for 100% of the subjects to be diagnosed. The term, however, requires that a statistically significant portion of subjects can be identified as suffering from the disease or having a predisposition to it.
  • Whether a part is statistically significant can be determined simply by the person skilled in the art using various well-known statistical evaluation tools, for example, determination of confidence intervals, determination of p-values, Student's t test, Mann test. -Whitney, etc.
  • Preferred confidence intervals are at least 50%, at least 60%, at least 70%, at least 80%, at least 90%, at least 95%.
  • the p values are preferably 0.2, 0.1, 0.05.
  • other subclassifications could be established within this main one, facilitating, therefore, the choice and establishment of appropriate therapeutic regimens or treatment. This discrimination, as understood by an expert in the field, is not intended to be correct in 100% of the samples analyzed.
  • the quantity that is statistically significant can be established by a person skilled in the art through the use of different statistical tools, for example, but not limited to, by determining confidence intervals, determining the significance P value, Student's test or discriminant functions. Fisher, non-parametric Mann Whitney measurements, Spearman correlation, logistic regression, linear regression, area under the ROC curve (AUC).
  • the confidence intervals are at least 90%, at least 95%, at least 97%, at least 98% or at least 99%.
  • the p value is less than 0.1, 0.05, 0.01, 0.005 or 0.0001.
  • the present invention allows the disease to be correctly detected differentially in at at least 60%, more preferably at least 70%, much more preferably at least 80%, or even much more preferably at least 90% of the subjects of a certain group or population analyzed.
  • kit or device of the invention which comprises the elements necessary to detect mutations in the genes of Table 1 simultaneously.
  • Another aspect of the invention relates to a computer program comprising instructions for carrying out the procedure according to any of the methods of the invention.
  • the invention encompasses computer programs arranged on or in a carrier.
  • the carrier can be any entity or device capable of supporting the program.
  • the carrier could be an integrated circuit in which the program is included and that has been adapted to execute, or to be used in the execution of, the corresponding processes.
  • the programs could be embedded in a storage medium, such as a ROM memory, a CD ROM memory or a semiconductor ROM memory, a USB memory, or a magnetic recording medium, for example, a floppy disk or a disk. hard.
  • a storage medium such as a ROM memory, a CD ROM memory or a semiconductor ROM memory, a USB memory, or a magnetic recording medium, for example, a floppy disk or a disk. hard.
  • the programs could be supported on a transmissible carrier signal; For example, it could be an electrical or optical signal that could be transported via electrical or optical cable, by radio or by any other means.
  • the invention also extends to computer programs adapted so that any processing means can implement the methods of the invention.
  • Computer programs also include cloud applications based on this procedure.
  • FIG. 1 Mutations found in plasma samples from patients with localized breast cancer.
  • A Mutations identified in plasma samples in both the tumor genetics-informed and non-informed substudies.
  • B clinicopathological characteristics of the patients showing the current clinical status (clinical relapse).
  • the panel of 37 genes involved in breast cancer in Table 1 was evaluated by generating sequencing libraries with the DNA obtained from 4 breast tumors and comparing the results with another panel, which uses a different technology.
  • NGS Next generation ultrasensitive technologies
  • SureSelect XT HS was used for sequencing, specifically SureSelect XT HS. It was verified that the coverage of the genomic areas was correct and known mutations were detected in these tumors, which had been previously sequenced with another technology, called TruSeq from Illumina.
  • the panel does not include the gene, VAF- Variant allele frequency allele frequency of a variant.
  • Example 2 Sensitivity of the gene panel in Table 1 for use as breast cancer biomarkers in liquid biopsy.
  • Immunohistochemical (IHC) analysis was performed to quantify the expression of human epidermal growth factor receptor 2 (HER2), hormone receptors (HR), and K ⁇ 67.
  • Estrogen receptor (ER) and progesterone receptor (PR) were considered positive if tumors had more than 1% cells with nuclear staining.
  • HER2 staining was graded on a scale of 0 to 3+, according to HercepTest guidelines. HER2 status was considered positive when graded as 3+, while 0 to 1+ was negative and 2+ was an inconclusive result, and in those cases silver in situ hybridization (SISH) was performed to confirm positivity.
  • SISH silver in situ hybridization
  • the tumor with positive hormone receptors plus a K ⁇ 67 index of ⁇ 14% was considered a luminal A tumor, while >14% was considered a luminal B tumor.
  • IHC breast cancer subtypes were defined by a combination of these IHC markers as follows: luminal A (PR positive, HER2 negative and Ki-67 ⁇ 14%), luminal B (ER positive and/or PR positive, HER2 negative and Ki-67 > 14%), HER2 positive (ER negative, PR negative, HER2 positive) and triple negative (ER, PR and HER2 negative).
  • the clinicopathological characteristics of the tumors of the enrolled breast cancer patients are shown in Table 4.
  • the average age of the patients was 64 years (range 44-92 years).
  • the 29 primary breast tumors examined included 24 invasive ductal carcinomas (IDG) (82.7%), two invasive lobular carcinomas (ILC) (6.9%), two papillary carcinomas (6.9%), and one tubular carcinoma ( 3.4%).
  • IDG invasive ductal carcinomas
  • ILC invasive lobular carcinomas
  • papillary carcinomas 6.9%
  • tubular carcinoma 3.4%
  • Fourteen tumors had diameters less than 2 cm (48.3%), while 15 had diameters greater than 2 cm (51.7%).
  • Axillary lymph node metastasis was detected by core needle biopsy in nine patients (31.0%).
  • IHC tumor subtypes were 14 luminal A tumors (48.3%), 11 luminal B tumors (37.9%), three triple negative tumors (10.3%) and one HER2 positive tumor (3.4%).
  • hormone receptor status 25 of 29 BC patients were estrogen receptor (ER) positive (86.2%) and 17 of 29 patients were progesterone receptor (PR) negative (58.6%).
  • ER estrogen receptor
  • PR progesterone receptor
  • tumor grade the majority of patients had grade 2 tumors (16 patients, 55%) while seven patients had grade 3 tumors (24.5%) and five patients had grade 1 tumors (17%). . The tumor grade was unknown in one patient (3.5%).
  • Table 4 Clinicopathological characteristics of the patients.
  • GDI Invasive ductal carcinoma
  • ILC invasive lobular carcinoma
  • HER2 human epidermal growth factor receptor 2
  • IHC Immunohistochemistry
  • BIRADS Breast Imaging Data and Reporting System.
  • Tumor DNA was isolated from fresh frozen tissue samples using the DNeasy blood and tissue kit (Qiagen, Valencia, CA, USA) following the manufacturer's instructions.
  • Plasma DNA samples were collected from 10 ml blood plasma samples in STRECK tubes immediately before tissue biopsy. Within 2 h of collection, plasma was separated from whole blood samples by centrifugation for 10 min at 3000 rpm at room temperature and stored at ⁇ 80°C until further use. Plasma samples were thawed and centrifuged again for 10 minutes at 13,000 rpm at room temperature before DNA extraction to remove debris. DNA isolation from 2 ml of plasma was performed with the QIAamp circulating nucleic acid kit (Qiagen) according to the manufacturer's instructions and eluted in 140 pL of AVE buffer (Qiagen). The total amount of amplified human genomic DNA isolated from plasma samples was quantified using a modified version of the human long interspersed element 1 (LINE-1) real-time PCR assay and reported as genome equivalents (GE).
  • LINE-1 human long interspersed element 1
  • NGS next generation sequencing
  • the “VAF (%)” column expresses the allele frequencies observed using the panel of Table 1, both in solid tumor and in plasma, where allele frequencies of
  • the method of the invention is capable of detecting variants or concordant mutations between plasma and tumor that are described in reference 5.
  • Example 3 Sensitivity and detection capacity and diagnostic capacity of the custom sequencing panel.
  • Table 6 Clinicopathological characteristics of the 74 patients from whom plasma samples were extracted.
  • GDI invasive ductal carcinoma
  • ILC invasive lobular carcinoma
  • GDIS ductal carcinoma in situ
  • CP papillary carcinoma
  • CT tubular carcinoma
  • MC mucinous carcinoma
  • HER2 receptor 2 human epidermal growth factor
  • IHC Immunohistochemistry
  • BIRADS Breast Imaging Data and Reporting System.
  • HER2 human epidermal growth factor receptor 2
  • HR hormone receptors
  • K ⁇ 67 Estrogen receptor (ER) and progesterone receptor (PR) were considered positive in tumors that had more than 1% stained cells with nuclei.
  • HER2 staining was graded on a scale of 0 to 3+, according to HercepTest guidelines17. HER2 status was considered positive when graded as 3+, while 0 to 1+ was negative and 2+ was an inconclusive result, and in those cases silver in situ hybridization (SISH) was performed to confirm positivity.
  • SISH silver in situ hybridization
  • Hormone receptor-positive tumor plus a K ⁇ 67 index of ⁇ 14% was considered a luminal A tumor, while >14% was considered a luminal B tumor.
  • IHC BC subtypes were defined by a combination of immunohistochemical markers as follows manner: Luminal A (PR positive, HER2 negative and K ⁇ 67 ⁇ 14%), luminal B (ER positive and/or PR positive, HER2 negative and K ⁇ 67 > 14%), HER2 positive
  • cfDNA was extracted from plasma samples using the QIAamp Circulating Nucleic Acid Kit (Qiagen) according to the manufacturer's instructions. Tumor DNA was isolated from fresh frozen tissue samples using the DNeasy blood and tissue kit (Qiagen) following the manufacturer's instructions. cfDNA and solid tumor DNA were quantified by droplet digital PCR (ddPCR) and the RNAseP assay (Life Technologies) as indicated in Garcia-Murillas I. et al. (9).
  • the custom NGS panel for breast cancer was designed using SureDesign software (Agilent) with the following settings: 5x for tiling, less stringent for masking, XTHSBoosting for boosting, and a value of 30 for extension in repeats.
  • the panel included the coding regions from the list of genes in Table 1.
  • the SureSelectXTHS methodology was used to generate sequencing libraries. Libraries were made using a median plasma DNA input of 39.78 ng (max 173.91 ng - min 5.01 ng) from breast cancer patients and 21.78 ng (max 113.52 ng - min. 1.71 ng) from healthy individuals and a median tissue DNA of 199.5 ng (max. 200 ng - min. 6.95 ng) from tumors. Tissue DNA was fragmented using the SureSelect Enzymatic Fragmentation Kit (Agilent) and libraries were prepared using the SureSelectXT Target Enrichment System Kits (Agilent) following the manufacturer's instructions. All PCR steps were carried out in the C1000 Touch Thermocycler (Bio-Rad).
  • Fragment ranges from the libraries were analyzed with Bioanalyzer high-sensitivity DNA chips (Agilent) and quantified with the KAPA Library Quantification Kit (Roche).
  • 8 pools containing 8 to 9 library samples per pool were prepared and sequenced.
  • 8 pools containing 9 to 10 library samples per pool and 3 pools containing 7 to 8 library samples per pool of plasma DNA from controls were also prepared and sequenced. healthy.
  • the generated consensus reads were mapped again with bwa vO.7.17. These aligned consensus reads were then filtered using fgbio FilterConsensusReads by requiring a minimum base quality of 30 and keeping the consensus reads supported by at least a minimum number of reads. Then I use fgbio ClipBam to remove overlapping regions of forward and reverse reads.
  • vanant identification was carried out with MuTect2 (gatk v4.2.2.0-1), including a non-tumor DNA panel and a germline vanant annotation file for the GRCh38 genome, obtained from the resource package gatk, which is used to annotate vahantes to filter and only consider the regions included in the SureSelect panel.
  • Variants were annotated with AN NOVA v20200608 with information about their presence in the public databases COSMIC version 95 and “The Cancer Genome Atlas” (TCGA).
  • mutations were identified using two methods: i) Strict; using the same approach as described above, but filtering for a minimum of 1 read per molecular barcode, without applying a VAF threshold. To consider mutations not found in the tumor as detected in plasma, they were required to have a duplex configuration, with at least two fragments mapped to different coordinates and to be present in both COSMIC and TCGA-BC. The same processing approach was applied to the control samples, i) Exploratory; visualization of the alignments in the IGV genome browser (Robinson, Thorvaldsdottir, Wenger, Zehir, & Mesirov, 2017) to identify mutations found in the corresponding tumors but not detected by automated molecular barcoding.
  • the number of reads that carried the mutation in that sample and the number of reads that did not carry the mutation were counted. They were then compared to the same readout ratios in controls and breast cancer plasma samples without the corresponding mutation using a Fisher test.
  • Sensitivity, specificity and positive predictive value (PPV) values were calculated using the caret v6.0.93 package.
  • the oncoplot function of the maftools package (Mayakonda, Lin, Assenov, Plass, & Koeffler, 2018) v2.12.0 was used to plot mutations and clinicopathological data.
  • tumor DNA was sequenced using Agilent SureSelect XT HS technology, following protocol recommendations, as noted above. Tumor sequencing was performed with a median coverage of 15.483X. Post-bioinformatic processing using molecular barcoding to minimize sequencing errors provided a final median coverage of 1.698X. Among the captured regions, only 3 presented less than 100X in more than 10% of the sequenced bases. Furthermore, all genes presented homogeneous coverage in all samples. Custom filtering was then performed using information from public genomic databases to identify somatic mutations.
  • the custom sequencing panel in Table 1 was applied together with high-depth sequencing with a median coverage of 17,704X using plasma DNA from the corresponding patients.
  • 74 plasma samples from the patients were sequenced.
  • the median coverage was 2.525X.
  • 3 showed low coverage and all genes showed homogeneous coverage.
  • bioinformatic analyzes using the established mutation identifier 13/61 (21.31%) mutations were found in plasma that were also present in the corresponding tumors, 7 mutations in the TP53 gene (53.84%) and 3 in PIK3CA (27.27%) as the most frequently mutated genes.
  • Table 7 Mutations detected in tumor and plasma samples.
  • the method of the invention has a sensitivity (30%) that far exceeds other methods known to date, especially if we compare it with the two main studies where technologies/methodologies have been developed that use NGS panels (magnification and capture). ) in breast cancer screening, that is, as a diagnostic method.
  • studies have been carried out using PAN-cancer panels as a diagnostic method, where a sensitivity in breast cancer of 33% has been achieved, similar to that of the present invention, but for this it has been necessary to include also other analytes in blood circulation, such as proteins, as additional biomarkers (7).
  • NGS next generation sequencing
  • Mutect2 was used to detect mutations in plasma samples using 2 families of molecular barcodes and without filters on varying allele frequencies (VAF). Variants were considered tumor-associated if i) they affected exonic regions, i) were annotated in the COSMIC, TCGA BC and TCGA databases that include all cancer types, and if iii) presented reads aligned by 2 or more different genomic coordinates visualized manually using IGV software. In total, 25/74 (33.78%) patients had tumor mutations detected in plasma (Table 8, Figure 1), 16 of the mutations were not observed in the previous analysis reported by tumor genetics.
  • VAF allele frequencies
  • TP53 14 mutations, 48.27%)
  • PIK3CA 4 mutations, 13.79%)
  • GATA3 3 mutations, 10.34%)
  • ctDNA mutations were observed in 8 plasma samples in whose corresponding tumor biopsies no mutations were detected. Additionally, a mutation was observed in a plasma sample with no tumor tissue available.
  • Table 8 Results in plasma samples from 74 patients who have developed breast cancer, using the gene panel in Table 1.
  • Table 9 Results in plasma samples from 22 healthy subjects, using the gene panel in Table 1.
  • Mutations have only been found in 3 of the 22 control samples analyzed, that is, in 13.63% of the samples.
  • Sensitivity the probability that a test result will be positive when the disease is present (true positive rate).
  • Positive likelihood ratio Ratio between the probability of a positive test result given the presence of the disease and the probability of a positive test result given the absence of the disease.
  • Negative likelihood ratio Ratio between the probability of a negative test result given the presence of the disease and the probability of a negative test result given the absence of the disease.
  • Positive predictive value probability that the disease is present when the test is positive.
  • Negative predictive value probability that the disease is not present when the test is negative.
  • the method of the invention has a very high specificity , of 86.36% and a positive predictive value of 88.46%, so, if a mutation occurs in any of the genes in the panel in Table 1, there is a probability of almost 90% of present breast cancer.
  • the present invention provides, thanks to the selected sequencing panel, a methodology that allows the diagnosis of breast cancer, even from liquid biopsies, with sensitivity, capacity to detect low allele frequencies and specificity. and positive predictive value, which overcomes the limitations of other similar methods known to date.
  • the association of clinicopathological variables with the detection of mutations in plasma was also investigated. Specifically, ctDNA positivity in plasma, the median allelic frequency (FA) of the mutations, the number of mutations per sample, and samples with TP53 mutations were studied to determine their association with clinical characteristics (Tables 11 and 12). .
  • HR hormone receptors
  • ER estrogen receptor
  • PR progesterone receptor
  • Table 11 Relationship between clinical characteristics and positive ctDNA and median allele frequency (FA) in plasma.
  • Table 12 Relationship between clinical characteristics and 2 mutations in plasma and Mutated TP53.
  • the inventive plasma sequencing panel showed improved capabilities to detect ctDNA in breast cancer patients located in the early stages of diagnosis, improving the detection sensitivity of previous research and adding evidence that ctDNA could assist in the diagnosis process of the asymptomatic population.
  • This is also supported by the similar percentages in plasma mutation identification between symptomatic and asymptomatic women of 33.33% and 28.57% respectively.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Panel de secuenciación masiva compuesto por 37 genes para biopsia líquida que permite el diagnóstico precoz del cáncer de mama y métodos de obtención de datos útiles para el diagnóstico y seguimiento de la enfermedad.

Description

DESCRIPCIÓN
Panel de secuenciación para biopsia líquida de pacientes con cáncer de mama
CAMPO DE LA INVENCIÓN
La presente invención se encuentra dentro del campo de la medicina y la oncología, y se refiere a un panel de secuenciación para tejidos tumorales y biopsia líquida de pacientes con cáncer de mama.
ESTADO DEL ARTE
Denominamos cáncer de mama a los tumores que se desarrollan en los tejidos mamarios. Existen dos tipos principales de cáncer de mama: el carcinoma ductal que comienza en los conductos que llevan leche desde la mama hasta el pezón y que es el mayoritario, y el carcinoma lobular, que comienza en los lóbulos que producen leche. Para detectar el cáncer de mama, se utilizan diferentes pruebas como la mamografía, ultrasonido mamario con transductores de alta resolución (ecografías) o imágenes por resonancia magnética. Hasta la fecha, el diagnóstico de cáncer de mama solo se podía confirmar por medio de una biopsia del tumor.
La biopsia líquida es una estrategia con un gran potencial en el manejo del cáncer, incluyendo el diagnóstico, la detección de recaídas de forma temprana o permitiendo la monitorización del estado de la enfermedad a lo largo del tratamiento para ver su evolución. Se trata de una prueba que se realiza empleando biofluidos corporales, más comúnmente sangre, aunque también se pueden analizar en otros líquidos del organismo como son el que recubre las meninges, el que recubre el pulmón, la saliva o incluso la orina, con el fin de buscar células cancerosas de un tumor o fragmentos de ADN de células tumorales, el llamado ADN tumoral circulante (ctDNA). A diferencia de la biopsia de tejido, permite realizar el análisis molecular de una forma mucho más sencilla y rápida, ya que se puede hacer una analítica de sangre en cualquier momento, y además se puede repetir para monitorizar la evolución del tumor.
Lo que se pretende identificar en las muestras son las diferentes mutaciones propias del tumor, ya que estas mutaciones no están presentes en el resto de células normales que hay en la sangre.
Los paneles de secuenciación son tests genéticos que engloban genes implicados en una misma patología, en este caso, orientados al cáncer de mama.
La detección y caracterización de los materiales tumorales circulantes presenta dificultades en un escenario temprano debido a sus bajas cantidades en los biofluidos de los pacientes. Sin embargo, el avance en las técnicas de detección actualmente utilizadas, muy sensibles, permiten que, por muy poca cantidad de ctDNA que exista en la sangre o en otros biofluidos, se puede detectar y analizar pudiendo caracterizar la genética de los tumores.
La utilización del ctDNA junto con tecnologías NGS (next generation sequencing) ultrasensibles de última generación, también empleando paneles específicos de paciente, han servido para caracterizar los tumores, evaluar las respuestas a las quimioterapias neoadyuvantes y detectar la MRD (minimal residual disease) después de la cirugía.
NGS dirigidos como SafeSEQ - Safe-sequencing system o sistema de secuenciación segura han surgido recientemente como una nueva herramienta para aumentar la sensibilidad de los instrumentos del sistema de secuenciación paralela masiva para la identificación de vahantes raras en el ADN plasmático. Esta estrategia de secuenciación utiliza códigos de barras de una sola molécula antes de la amplificación por PCR para reducir el error de secuenciación y aumentar la precisión. El sistema SafeSEQ, o de secuenciación segura, se puede usar para distinguir entre mutaciones raras y errores técnicos y es capaz de detectar mutaciones que otras tecnologías pasarían por alto. SafeSEQ se ha aplicado hasta ahora a muestras de plasma de cáncer colorrectal metastásico y a pacientes con tumores del estroma gastrointestinal.
Otras tecnologías NGS son las sondas de enriquecimiento de regiones génicas concretas como son las de Agilent SureSelect, que se pueden utilizar para diseñar paneles de captura híbridos personalizados y secuenciar masivamente cualquier región codificante o no codificante del genoma o del transchptoma.
Todo ello ha contribuido al desarrollo de las técnicas de biopsia líquida. Actualmente se utilizan procedimientos de secuenciación masiva (NGS) y diferentes tecnologías para detectar ctDNA en dilución muy baja (1). Sin embargo, aún no está claro si las alteraciones moleculares en ctDNA pueden detectarse mediante ensayos basados en NGS de ctDNA en plasma en pacientes con cáncer de mama primario en el cribado y cómo se relacionan con la mutación del tejido tumoral encontrada en el mismo paciente.
Las ventajas que presenta este tipo de biopsia líquida en el seguimiento y la predicción del cáncer de mama metastásico (CMM) han sido comprobadas por diversos estudios (2), resaltando la importancia del ctDNA como potencial biomarcador para la evaluación, predicción y manejo clínico en los pacientes con CMM tratados con quimioterapia. En este sentido, la monitohzación de ctDNA durante el tratamiento puede mejorar significativamente los resultados al predecir la progresión de la enfermedad entre cuatro y seis meses antes que los métodos convencionales (3). Se han llevado a cabo vahos estudios que tratan de desarrollar un método para la monitohzacion de cáncer de mama utilizando la secuenciación de moléculas de ctDNA derivadas de una muestra obtenida del paciente y posterior análisis de dichas secuencias de ctDNA para identificar sus mutaciones. Un ejemplo de estos paneles de secuenciación lo tenemos en WO2017181146A1 donde se incluyen los siguientes genes: AKT1, ALK, APC, ATM, BRAF, CTNNB1, EGFR, ERBB2, ESR1, FGFR2, GATA3, GNAS, IDH1, IDH2, KIT, KRAS, MET, NRAS, PDGFRA, PIK3CA, PTEN, RB1, SMAD4, STK11 y TP53 y que permite detectar mutaciones en una frecuencia alélica de hasta 0,025 %. Otro ejemplo en este mismo sentido se describe en el documento US2021343372A1 donde en una muestra de biopsia líquida en pacientes con cáncer de mama se identifican mutaciones en TP53 para el 51,1% de los pacientes, y con menor incidencia, en PIK3CA, ESR1, BRCA2, NF1, ATM y APC. Las frecuencias alélicas detectadas son del orden de 0,1 %, 0,25 % y 0,5 %.
Otros paneles de genes para el análisis de ctDNA y la identificación de cáncer de mama metastásico (CMM) incluyen los siguientes genes: AKT1, AR, BRCA1, BRCA2, EGFR, ERCC4, ERBB2, ERBB3, ESR1, FGFR1, KRAS, MUC16, PIK3CA, PIK3R1, PTEN, PTGFR y TGFB1 (4).
También se ha valorado la idoneidad del análisis de ctDNA en el diagnóstico precoz de cáncer de mama, comparando mutaciones en PIK3CA y TP53 entre biopsias tumorales y DNA plasmático pretratamiento (5), revelando cuatro mutaciones adicionales, tres en TP53 y una en PIK3CA, no identificadas previamente en la biopsia de tejido de tres pacientes.
Teniendo en consideración los documentos citados en el estado de la técnica queda claro el gran interés que existe en el desarrollo de las técnicas de biopsia líquida y el análisis del ctDNA, con el fin de construir paneles de secuenciación personalizados para el diagnóstico precoz del cáncer de mama y que resulten útiles en la evaluación y seguimiento de la enfermedad, incluyendo la posibilidad de obtener predicciones sobre la progresión de la enfermedad y tomar decisiones terapéuticas personalizadas.
DESCRIPCIÓN DE LA INVENCIÓN
En la presente invención se propone un panel de secuenciación masiva para el diagnóstico precoz del cáncer de mama, útiles en la evaluación y seguimiento de la enfermedad, compuesto por 37 genes (ver Tabla 1).
Estos genes han sido seleccionados siguiendo los criterios que se exponen a continuación:
1. Genes con mutaciones en >=1% de las muestras de tumores de mama incluidas en la base de datos TCGA (https://www.cbioportal.org). 2. Genes secuenciados en un artículo seminal en tumores de mama y que presentaron mutaciones en este tipo tumoral (6).
3. Genes con relevancia biológica en el cáncer de mama y/o cánceres en general y no basados en su frecuencia mutacional. Tabla 1 : Genes incluidos en el panel se secuenciación masiva customizado empleando la tecnología de Agilent SureSelect XT HS.
Figure imgf000006_0001
Todos los genes de la tabla tienen secuencias conocidas, las cuales son públicas y accesibles a través de bases de datos públicas, por lo que no requieren mayor caracterización en la presente memoria para que un experto medio en la materia pueda reproducir la invención.
Las coordenadas genómicas de las regiones que han sido incluidas en el panel son las que se muestran en la siguiente Tabla 2.
Tabla 2: Coordenadas genómicas (versión del genoma humano=hg38):
Figure imgf000006_0003
Figure imgf000006_0002
Figure imgf000007_0001
Figure imgf000007_0002
Figure imgf000008_0001
Figure imgf000008_0002
Figure imgf000009_0001
Figure imgf000009_0002
Figure imgf000010_0001
Figure imgf000010_0002
Figure imgf000011_0001
Figure imgf000011_0002
Figure imgf000012_0001
Figure imgf000012_0002
Figure imgf000013_0001
Figure imgf000013_0002
Figure imgf000014_0001
Figure imgf000014_0002
Figure imgf000015_0002
Figure imgf000015_0001
Gracias al empleo de códigos de barras moleculares, este panel permite la caracterización ultrasensible de aberraciones genéticas tumorales, por lo que puede ser empleado para la detección de mutaciones en frecuencias alélicas por debajo del 0,15%.
Esta alta sensibilidad permite la detección de mutaciones en biofluidos (biopsia líquida) de pacientes con tumores localizados/tempranos o aquellos cánceres con poca liberación de material tumoral. Este panel ha sido optimizado y validado usando cuatro muestras de tumores de mama con mutaciones conocidas (ver ejemplo 1) y sus resultados han sido comparados con otros paneles de secuenciación para este mismo tipo de cáncer, cáncer de mama, mostrando una mayor capacidad de detección de mutaciones (ver ejemplo 2). Su uso en biopsias líquidas ha sido respaldado en estudios comparativos con muestras tumorales, donde se demuestra la alta sensibilidad, especificidad y capacidad de valor predictivo del método de diagnostico de cáncer de mama basado en este panel de secuenciación (ver ejemplo 3). También se han comprobado, mediante su correlación con variables clínico-patológicas, su utilidad como marcador de pronóstico o progresión de la enfermedad (ver ejemplo 4).
Por tanto, un primer aspecto de la invención se refiere al panel de secuenciación que comprende los genes de la Tabla 1. En concreto y más preferiblemente, a su uso como biomarcadores para diagnosticar, diagnosticar de forma temprana, predecir o pronosticar la evolución el cáncer de mama. Y aún más preferiblemente, para su uso en biopsia líquida.
Métodos de la invención
Otro aspecto de la invención se refiere a un método in vitro de obtención de datos útiles para diagnosticar, diagnosticar de forma temprana, predecir o pronosticar la evolución del cáncer de mama en un individuo, de ahora en adelante primer método de la invención, que comprende: a) obtener una muestra biológica aislada del individuo, b) identificar posibles mutaciones en los genes de la Tabla 1.
Otro aspecto de la invención se refiere a un método in vitro para diagnosticar o diagnosticar de forma temprana, el cáncer de mama, de ahora en adelante segundo método de la invención, que comprende los pasos (a) - (b) según el primer método de la invención, y además comprende: c) asignar al individuo que presenta mutaciones en alguno de los genes de la Tabla 1 al grupo de pacientes que padece cáncer de mama.
En una realización preferida del segundo método de la invención además comprende asignar al individuo que presenta una mediana de frecuencia alélica de las mutaciones más alta, al grupo de pacientes con un grado tumoral más alto.
Otro aspecto de la invención se refiere a un método in vitro para predecir o pronosticar la evolución del cáncer de mama, que comprende el método de obtención de datos útiles de la invención, y que además comprende asignar al individuo que presenta más de una mutación, al grupo de pacientes con probabilidad de recaída clínica.
Otro aspecto de la invención refiere al método in vitro para predecir o pronosticar la evolución del cáncer de mama, que comprende el método de obtención de datos útiles de la invención y que además comprende asignar al individuo que presenta mutaciones en TP53 al grupo de pacientes con tumor negativo a la expresión de receptores hormonales.
Una "muestra biológica" tal como se define aquí, es una pequeña parte de un sujeto, representativa del conjunto y puede estar constituida por una biopsia o una muestra de fluido corporal.
Preferiblemente, la muestra biológica es plasma, proveniente de la separación física de la muestra de sangre tomada del paciente. La detección las mutaciones en los genes de la Tabla 1 puede realizarse por cualquier medio conocido en el estado de la técnica.
Preferiblemente se lleva a cabo mediante tecnologías de secuenciación de próxima generación o “next-generation sequencing” (NGS). Más preferiblemente la tecnología NGS utilizada son sondas de enriquecimiento tipo Agilent SureSelect.
El método de la presente invención se puede aplicar con muestras de individuos de cualquier sexo, es decir, hombres o mujeres, y a cualquier edad. Preferiblemente se aplica a muestras obtenidas de mujeres.
En la presente invención se entiende por "pronóstico" la evolución esperada de una enfermedad y se refiere a la valoración de la probabilidad según la cual un sujeto padece una enfermedad, así como a la valoración de su inicio, estado de desarrollo, evolución, o de su regresión, y/o el pronóstico del curso de la enfermedad en el futuro. Como entenderán los expertos en la materia, tal valoración, aunque se prefiere que sea, normalmente puede no ser correcta para el 100% de los sujetos que se van a diagnosticar. El término, sin embargo, requiere que una parte estadísticamente significativa de los sujetos se pueda identificar como que padecen la enfermedad o que tienen predisposición a la misma. Si una parte es estadísticamente significativa se puede determinar sin más por el experto en la materia usando vahas herramientas de evaluación estadística bien conocidas, por ejemplo, determinación de intervalos de confianza, determinación de valores p, prueba de la t de Student, prueba de Mann-Whitney, etc. Los intervalos de confianza preferidos son al menos el 50%, al menos el 60%, al menos el 70%, al menos el 80%, al menos el 90%, al menos el 95%. Los valores de p son, preferiblemente, 0,2, 0,1 , 0,05. A su vez, atendiendo al método de la presente invención, se podrían establecer otras subclasificaciones dentro de esta principal, facilitando, por tanto, la elección y el establecimiento de regímenes terapéuticos o tratamiento adecuados. Esta discriminación tal y como es entendida por un experto en la materia no pretende ser correcta en un 100% de las muestras analizadas. Sin embargo, requiere que una cantidad estadísticamente significativa de las muestras analizadas sean clasificadas correctamente. La cantidad que es estadísticamente significativa puede ser establecida por un experto en la materia mediante el uso de diferentes herramientas estadísticas, por ejemplo, pero sin limitarse, mediante la determinación de intervalos de confianza, determinación del valor significación P, test de Student o funciones discriminantes de Fisher, medidas no paraméthcas de Mann Whitney, correlación de Spearman, regresión logística, regresión lineal, área bajo la curva de ROC (AUC). Preferiblemente, los intervalos de confianza son al menos del 90%, al menos del 95%, al menos del 97%, al menos del 98% o al menos del 99%. Preferiblemente, el valor de p es menor de 0,1 , de 0,05, de 0,01, de 0,005 o de 0,0001. Preferiblemente, la presente invención permite detectar correctamente la enfermedad de forma diferencial en al menos el 60%, más preferiblemente en al menos el 70%, mucho más preferiblemente en al menos el 80%, o aún mucho más preferiblemente en al menos el 90% de los sujetos de un determinado grupo o población analizada.
Kit y usos
Otro aspecto de la invención se refiere a un kit o dispositivo, de ahora en adelante kit o dispositivo de la invención, que comprende los elementos necesarios para detectar mutaciones en los genes de la Tabla 1 simultáneamente.
Automatización del método de la invención implementándolo en un programa de ordenador
Otro aspecto de la invención se refiere a un programa de ordenador que comprende instrucciones para realizar el procedimiento de acuerdo con cualquiera de los métodos de la invención.
En particular, la invención abarca programas de ordenador dispuestos sobre o dentro de una portadora. La portadora puede ser cualquier entidad o dispositivo capaz de soportar el programa. Como vanante, la portadora podría ser un circuito integrado en el que va incluido el programa y que se haya adaptado para ejecutar, o para ser utilizado en la ejecución de los procesos correspondientes.
Por ejemplo, los programas podrían estar incorporados en un medio de almacenamiento, como una memoria ROM, una memoria CD ROM o una memoria ROM de semiconductor, una memoria USB, o un soporte de grabación magnética, por ejemplo, un disco flexible o un disco duro. Alternativamente, los programas podrían estar soportados en una señal portadora transmisible; por ejemplo, podría tratarse de una señal eléctrica u óptica que podría transportarse a través de cable eléctrico u óptico, por radio o por cualesquiera otros medios.
La invención se extiende también a programas de ordenador adaptados para que cualquier medio de procesamiento pueda llevar a la práctica los métodos de la invención. Los programas de ordenador también abarcan aplicaciones en la nube basadas en dicho procedimiento.
Otros aspectos de la invención se refieren al medio de almacenamiento legible y a la señal transmisible que comprende instrucciones de programa necesarias para la ejecución del método de invención por un ordenador.
A lo largo de la descripción y las reivindicaciones la palabra "comprende" y sus vahantes no pretenden excluir otras características técnicas, aditivos, componentes o pasos. Para los expertos en la materia, otros objetos, ventajas y características de la invención se desprenderán en parte de la descripción y en parte de la práctica de la invención. Los siguientes ejemplos y dibujos se proporcionan a modo de ilustración, y no se pretende que sean limitativos de la presente invención.
DESCRIPCIÓN DE LAS FIGURAS
Figura 1. Mutaciones encontradas en las muestras de plasma de pacientes con cáncer de mama localizado. A: mutaciones identificadas en las muestras de plasma tanto en los subestudios informado y no informado por la genética del tumor. B: características clínico- patológicas de los pacientes mostrando el estado clínico actual (recaída clínica).
Figura 2. Mutaciones identificadas en la secuenciación del ADN tumoral de las muestras incluidas en el estudio. Oncoplot. A: mutaciones observadas en las muestras tumorales indicando si se encontraron en plasma. B: características clínico-patológicas del paciente.
EJEMPLOS DE LA INVENCIÓN
1 : Optimización v validación del panel de
Figure imgf000019_0001
de la Tabla 1
El panel de 37 genes implicados en cáncer de mama de la Tabla 1 fue evaluado generando librerías de secuenciación con el ADN obtenido de 4 tumores de mama y comparando los resultados con otro panel, que emplea una tecnología diferente.
Se utilizó para su secuenciación tecnologías ultrasensibles de última generación (NGS - next generation sequencing), en concreto SureSelect XT HS. Se comprobó que la cobertura de las zonas genómicas fue correcta y se detectaron mutaciones conocidas en estos tumores, que habían sido secuenciados previamente con otra tecnología, llamada TruSeq de Illumina.
Tabla 3 Mutaciones observadas en los cuatro tumores testados usando el panel personalizado de 37 genes (Sure Select XT HS) y un panel validado que emplea una tecnología y set de genes diferente (Illumina sequencing Truseq), en concreto TP53, CDH1 y PIK3CA.
Figure imgf000020_0001
ND, No detectado; NT, No testado, el panel no incluye el gen, VAF- Variant allele frequency frecuencia alélica de una vahante.
Comparando las mutaciones encontradas usando ambos paneles en los 4 tumores de prueba, se observaron frecuencias alélicas totalmente comparables para las mutaciones que fueron detectadas por ambos paneles, validando, por lo tanto, el panel de la invención.
Además, se detectó una mutación con baja frecuencia alélica y patogénica en el gen CDH1 que no fue detectada en la secuenciación previa.
Hay que destacar que usando el panel de la invención se detectaron nuevas mutaciones debido a que este panel incluye la secuenciación de muchos más genes.
Ejemplo 2: Sensibilidad del panel de genes de la Tabla 1 para su uso como biomarcadores de cáncer de mama en biopsia líquida.
Diseño del estudio y población de pacientes
El estudio incluyó a 29 pacientes con hallazgos de mamografía BI-RADS 4C/5 y posterior diagnóstico de cáncer de mama primario en el Hospital Virgen de la Victoria de Málaga y el
Hospital Clínico Universitario de Valencia. Estos pacientes fueron los mismos que los objeto de estudio en Jimenez Rodríguez, B. et al en “Detection of TP53 and PIK3CA Mutations in Circulating Tumor DNA Using Next-Generation Sequencing in the Screening Process for Early Breast Cancer Diagnosis" (5) Las muestras de sangre se recolectaron inmediatamente (menos de una hora) antes de la biopsia de tejido y antes de recibir cualquier tipo de tratamiento. Los tejidos tumorales coincidentes se recogieron a través de biopsias con aguja gruesa de tumores de mama, que posteriormente se congelaron en fresco.
Se realizó un análisis inmunohistoquímico (IHC) para cuantificar la expresión del receptor 2 del factor de crecimiento epidérmico humano (HER2), los receptores hormonales (HR) y K¡67.
El receptor de estrógeno (ER) y el receptor de progesterona (PR) se consideraron positivos si los tumores tenían más del 1 % de células con tinción nuclear.
La tinción de HER2 se calificó en una escala de 0 a 3+, de acuerdo con las pautas de HercepTest. El estado de HER2 se consideró positivo cuando se calificó como 3+, mientras que 0 a 1+ fue negativo y 2+ fue un resultado no concluyente y en esos casos se realizó hibridación in situ con plata (SISH) para confirmar la positividad.
El tumor con receptores hormonales positivos más un índice K¡ 67 de <14 % se consideró un tumor luminal A, mientras que >14 % se consideró un tumor luminal B.
Los subtipos de cáncer de mama IHC se definieron mediante una combinación de estos marcadores IHC de la siguiente manera: luminal A (PR positivo, HER2 negativo y Ki-67 < 14 %), luminal B (ER positivo y/o PR positivo, HER2 negativo y Ki-67 > 14 %), HER2 positivo (ER negativo, PR negativo, HER2 positivo) y triple negativo (ER, PR y HER2 negativo).
El estudio fue aprobado por los comités de ética de investigación del Hospital Virgen de la Victoria y del Hospital Clínico de Valencia, todos los pacientes dieron su consentimiento informado por escrito. La investigación se llevó a cabo de acuerdo con las Buenas Prácticas Clínicas y la Declaración de Helsinki.
Las características clínico-patológicas de los tumores de las pacientes con cáncer de mama inscritas se muestran en la Tabla 4. La edad promedio de las pacientes fue de 64 años (rango 44-92 años). Los 29 tumores de mama primarios examinados incluyeron 24 carcinoma ductal invasivo (GDI) (82,7 %), dos carcinomas lobulares invasivos (CLI) (6,9 %), dos carcinomas papilares (6,9 %) y un carcinoma tubular (3,4 %). catorce tumores presentaron diámetros menores a 2 cm (48,3%), mientras que 15 presentaron diámetros mayores a 2 cm (51,7%). Se detectó metástasis en los ganglios linfáticos axilares mediante biopsia con aguja gruesa en nueve pacientes (31,0 %).
Diez pacientes sin metástasis en los ganglios linfáticos tenían tumores con diámetros de más de 2 cm (34,5%). Se utilizó inmunohistoquímica para determinar los subtipos de tumores IHC de la siguiente manera, 14 tumores luminales A (48,3 %), 11 tumores luminales B (37,9 %), tres tumores triple negativos (10,3 %) y uno tumor HER2 positivo (3,4 %). Con respecto al estado de los receptores hormonales, 25 de 29 pacientes con BC tenían receptores de estrógeno (ER) positivos (86,2 %) y 17 de 29 pacientes tenían receptores de progesterona (PR) negativos (58,6 %). En cuanto al grado tumoral, la mayoría de los pacientes presentaron tumores de grado 2 (16 pacientes, 55%) mientras que siete pacientes tenían tumores de grado 3 (24,5%) y cinco pacientes tenían tumores de grado 1 (17%). Se desconocía el grado tumoral en un paciente (3,5%).
Tabla 4: Características clínico-patológicas de los pacientes.
Figure imgf000022_0001
Figure imgf000023_0001
GDI: Carcinoma ductal invasivo; CLI: carcinoma lobulillar invasivo; HER2: receptor 2 del factor de crecimiento epidérmico humano; IHC: Inmunohistoquímica; BIRADS: Sistema de datos e informes de imágenes mamarias.
Extracción de ADN
El ADN tumoral se aisló de muestras de tejido fresco congelado utilizando el kit de sangre y tejido DNeasy (Qiagen, Valencia, CA, EE. Ull.) siguiendo las instrucciones del fabricante.
Las muestras de ADN plasmático se recogieron a partir de muestras de plasma sanguíneo de 10 mi en tubos STRECK inmediatamente antes de la biopsia de tejido. Dentro de las 2h posteriores a la recolección, el plasma se separó de las muestras de sangre completa mediante centrifugación durante 10 min a 3000 rpm a temperatura ambiente y se almacenó a -80°C hasta su uso posterior. Las muestras de plasma se descongelaron y se centrifugaron nuevamente durante 10 minutos a 13.000 rpm a temperatura ambiente antes de la extracción de ADN para eliminar los desechos. El aislamiento de ADN de 2 mi de plasma se realizó con el kit de ácido nucleico circulante QIAamp (Qiagen) de acuerdo con las instrucciones del fabricante y se eluyó en 140 pL de tampón AVE (Qiagen). La cantidad total de ADN genómico humano amplificadle aislado de muestras de plasma se cuantificó utilizando una versión modificada del ensayo de PCR en tiempo real del elemento 1 intercalado largo humano (LINE- 1) y se notificó como equivalentes del genoma (GE).
Secuenciación dirigida en muestras de tejido y del ADN plasmático
El estudio NGS (next generation sequencing) de las muestras se realizó con un diseño personalizado de última generación (NGS - next generation sequencing), en concreto SureSelect XT HS) para los 37 genes de la Tabla 1.
La preparación de la librería de secuenciación y el procesamiento de datos de secuenciación se llevo a cabo siguiendo la metodología que se describe en los respectivos epígrafes del ejemplo 3.
Análisis estadístico
El análisis estadístico se realizó con SPSS (19.0, SPSS Inc., Chicago, IL, EE. UU.). Para los análisis de asociación entre variables clínico-patológicas y mutaciones derivadas de los genes de la Tabla 1 en sangre, se utilizaron la correlación de Spearmen y la prueba exacta de Fisher (para variables categóricas). El umbral de significación estadística se fijó en p < 0,05.
Los resultados usando el panel de 37 genes tanto para biopsias tumorales como para muestras de plasma se muestran en la Tabla 5. Se presenta a su vez una comparativa con los resultados obtenidos para estos mismos 29 pacientes incluidos en el artículo de Jimenez
Rodríguez, B. et al “Detection of TP53 and PIK3CA Mutations in Circulating Tumor DNA Using Next-Generation Sequencing in the Screening Process for Early Breast Cancer Diagnosis J. Clin Med. 2019 (5), donde se utilizó otra técnica de NGS, Plasma SafeSEQ (Sysmex Inostics S.A.). Tabla 5: Resultados comparativos de las mutaciones detectadas en biopsia tumoral y en muestras de plasma utilizando el panel de genes de la Tabla 1 ; y comparación con las mutaciones en plasma localizadas por otros métodos del estado de la técnica.
Figure imgf000024_0001
La columna “VAF (%)” expresa las frecuencias alélicas observadas usando el panel de la Tabla 1 , tanto en tumor sólido como en plasma, donde se llega a detectar frecuencias alélicas de
0,1% en biopsias líquidas. El método de la invención es capaz de detectar las vanantes o mutaciones concordantes entre plasma y tumor que se describen la referencia 5.
Además, gracias al panel de genes de la Tabla 1 , es posible detectar 7 vanantes en 7 muestras de plasma diferentes, en los genes PIK3CA y TP53 (que son los testados con ambos paneles) y que no se detectaban en la referencia 5. Se señalan estos resultados en negrita, indicándose SI en testado/ NO en detectado en plasma.
Al incluir muchas más regiones genéticas en el panel de la Tabla 1, es posible detectar 3 mutaciones más en 3 muestras de plasma diferentes (015MS, 016MS, 044MS).
Ejemplo 3: Sensibilidad y capacidad de detección y capacidad de diagnóstico del panel de secuenciación personalizado.
Para analizar la sensibilidad del panel de secuenciación de la invención se ha realizado una comparativa entre muestras de pacientes sanos (control) y pacientes que desarrollaron cáncer de mama.
El estudio fue aprobado por el comité de ética local y se realizó de acuerdo con las directrices de Buenas Prácticas Clínicas y la Declaración de Helsinki. Se obtuvo el consentimiento informado de todas las mujeres que fueron reclutadas en el Hospital Virgen de la Victoria de Málaga y en el Hospital Clínico Universitario de Valencia antes de realizar cualquier evaluación requerida según el protocolo.
Se han utilizado las siguientes muestras:
75 muestras de plasma de pacientes con cáncer de mama, de las que analizables fueron 74. Estas muestras se obtuvieron de pacientes con hallazgos de mamografía BIRADS 4C/5 justo antes de la biopsia de tejido, antes del diagnóstico y de ser sometidas a tratamiento para el cáncer.
71 biopsias sólidas pre-tratamiento de los pacientes antes citados.
22 muestras de plasma de mujeres que fueron incluidas en el estudio por mostrar mamografía sospechosa pero que finalmente el diagnóstico fueron negativas para la presencia cáncer de mama, y que aquí servirán como control negativo.
Tabla 6: Características clínico-patológicas de las 74 pacientes de las que se extrajeron las muestras de plasma.
Características clínicas Total n
Edad de diagnóstico (años) 30-50 13
>50 61
Tipo de tumor
GDI 59
GDIS 5
CLI 3
CP 1
TC 3
MC 3
Tamaño de tumor <2cm 32
2-5cm 37
>5cm 5
Grado del Tumor
Figure imgf000026_0001
Nodulo linfático auxiliar
Positivo 28
Negativo 38
Desconocido 8
Receptor estrógeno Positivo 66
Negativo 7
Desconocido 1
Receptor progesterona Positivo 56
Negativo 17
Desconocido 1
Estatus HER2
Positivo 6
Negativo 66
Desconocido 1
Categoría BIRADS 4/B/C 40
5B/C 33
Desconocido 1
Recaída clínica
Yes 8
No 64
Desconocido 2 k¡67 <20 36
>=20 36
GDI: carcinoma ductal invasivo; CLI: carcinoma lobulillar invasivo; GDIS: carcinoma ductal ¡n sitw, CP: carcinoma papilar; TC: carcinoma tubular; MC: carcinoma mucinoso; HER2: receptor 2 del factor de crecimiento epidérmico humano; IHC: Inmunohistoquímica; BIRADS: Sistema de datos e informes de imágenes mamarias.
Las biopsias tumorales se extrajeron utilizando agujas gruesas de biopsia y posteriormente se congelaron. Se realizó un análisis inmunohistoquímico para cuantificar la expresión del receptor 2 del factor de crecimiento epidérmico humano (HER2), los receptores hormonales (HR) y K¡67. El receptor de estrógeno (RE) y el receptor de progesterona (PR) se consideraron positivos en tumores que presentaban más del 1% de células teñidas con núcleo. La tinción de HER2 se calificó en una escala de 0 a 3+, de acuerdo con las pautas de HercepTest17. El estado de HER2 se consideró positivo cuando se calificó como 3+, mientras que 0 a 1+ fue negativo y 2+ fue un resultado no concluyente y en esos casos se realizó hibridación in situ con plata (SISH) para confirmar la positividad. El tumor con receptores hormonales positivos más un índice K¡67 de <14 % se consideró un tumor luminal A, mientras que >14 % se consideró un tumor luminal B. Los subtipos IHC BC se definieron mediante una combinación de marcadores inmunohistoquímicos de la siguiente manera: Luminal A (PR positivo, HER2 negativo y K¡67 < 14 %), luminal B (ER positivo y/o PR positivo, HER2 negativo y K¡67 > 14 %), HER2 positivo
(ER positivo/negativo, PR positivo/negativo, HER2 positivo) y triple negativo (ER, PR y HER2 negativo).
Procesamiento de muestras de sangre
Se obtuvieron 10 mi de plasma de cada individuo en tubos STRECK. Dentro de las 2 h posteriores a la recolección, el plasma se aisló de la sangre mediante centrifugación durante 10 min a 3000 rpm a temperatura ambiente y se almacenó a -80 °C hasta la extracción del ADN libre circulante (cfDNA).
Extracción y cuantificación de ADN a partir de plasma y biopsias sólidas
El cfDNA se extrajo de muestras de plasma utilizando el kit de ácido nucleico circulante QIAamp (Qiagen) de acuerdo con las instrucciones del fabricante. El ADN tumoral se aisló de muestras de tejido fresco congelado utilizando el kit de sangre y tejido DNeasy (Qiagen) siguiendo las instrucciones del fabricante. El cfDNA y el ADN de tumores sólidos se cuantificaron mediante PCR digital en gota (ddPCR) y el ensayo RNAseP (Life Technologies) como se indica en Garcia-Murillas I. et al. (9).
Diseño del panel de secuenciación para cáncer de mama
El panel NGS personalizado para cáncer de mama se diseñó utilizando el software SureDesign (Agilent) con la siguiente configuración: 5x para “tiling", menos estricto para enmascarar, XTHSBoosting para potenciar y un valor de 30 para extensión en repeticiones. El panel incluyó las regiones codificantes de la lista de genes en la Tabla 1.
Preparación de la librería de secuenciación
Se empleó la metodología SureSelectXTHS (Agilent) para generar librerías de secuenciación. Se realizaron librerías utilizando una mediana de entrada de ADN plasmático de 39,78 ng (máx. 173,91 ng - mín. 5,01 ng) de pacientes con cáncer de mama y 21 ,78 ng (máx. 113,52 ng - mín. 1,71 ng) de individuos sanos y una mediana de ADN tisular de 199,5 ng (máx. 200 ng - mín. 6,95 ng) de tumores. El ADN del tejido se fragmentó con el kit de fragmentación enzimática SureSelect (Agilent) y las librerías se prepararon con los kits del sistema de enriquecimiento de diana SureSelectXT (Agilent) siguiendo las indicaciones del fabricante. Todos los pasos de la PCR se llevaron a cabo en el Termociclador C1000 Touch (Bio-Rad).
Los intervalos de fragmentos de las librerías se analizaron con chips de ADN de alta sensibilidad Bioanalyzer (Agilent) y se cuantificaron con el KAPA Library Quantification Kit (Roche). Para la secuenciación del ADN del tejido tumoral, se prepararon y secuenciaron 8 grupos que contenían de 8 a 9 muestras de librería por grupo. Para el ADN de plasma de pacientes con cáncer de mama, también se prepararon y secuenciaron 8 grupos que contenían de 9 a 10 muestras de librería por grupo y 3 grupos que contenían de 7 a 8 muestras de librería por grupo de ADN de plasma de controles sanos. Se emplearon 19 carriles (1 carril por grupo) para secuenciar las librerías con el objetivo de obtener una secuenciación ultra profunda de alrededor de 20,000X antes de la de-duplicación en la plataforma DNBseq-G400 (MGI) en 100 lecturas pareadas siguiendo las instrucciones del fabricante para la secuenciación de códigos de barras moleculares, también llamados identificadores moleculares únicos (UMI).
Procesamiento de datos de secuenciación
Se creó un método personalizado para el procesamiento de los datos de secuenciación de SureSelectXTHS (Agilent). Inicialmente se realizó el control de calidad de los datos de secuenciación utilizando fastQC vO.11.9. A continuación, se recortaron las lecturas de los adaptadores y el filtrado de calidad mediante trim-galore vO.6.7. Para realizar los pasos de procesamiento que involucran datos con código de barras, se uso un subconjunto de herramientas fgbio v1.5.1. Se asignaron los datos al genoma de referencia GRCh38 utilizando bwa vO.7.17. Luego se usó fgbio GroupReadsByUmi para agrupar por código de barras usando la opción Identidad para tener en cuenta que los códigos de barras SureselectXT-HS están degenerados. A continuación, se generaron lecturas de consenso mediante fgbio CallMolecularConsensusReads. Las lecturas de consenso generadas se mapearon nuevamente con bwa vO.7.17. Luego, se filtraron estas lecturas de consenso alineadas usando fgbio FilterConsensusReads requiriendo una calidad de base mínima de 30 y manteniendo las lecturas de consenso respaldadas por al menos un número mínimo de lecturas. Entonces, se uso fgbio ClipBam para eliminar las regiones superpuestas de lecturas hacia adelante y hacia atrás.
Finalmente, se llevó a cabo la identificación de vanantes con MuTect2 (gatk v4.2.2.0-1), incluido un panel de ADN no tumoral y un archivo de anotación de vanantes de línea germinal para el genoma GRCh38, obtenido del paquete de recursos gatk, que se utiliza para anotar vahantes para filtrar y solo considerar las regiones incluidas en el panel SureSelect. Se anotaron las vanantes con AN NOVA v20200608 con información acerca de su presencia en las bases de datos públicas COSMIC versión 95 y “The Cancer Genome Atlas” (TCGA).
Filtración y análisis de variantes
Para el tumor, se utilizó un enfoque más estricto con el fin de generar una referencia sólida para comparar con los hallazgos de ctDNA. Se generaron lecturas de consenso que requirieron un mínimo de 3 lecturas por familia de código de barra molecular. Se aceptaron como llamadas válidas solo vanantes con VAF > 0,05 que también estaban presentes en COSMIC o TCGA (aumentando el umbral de VAF a VAF > 0,2 para tejidos embebidos en parafina fijados con formalina (FFPE)).
En el caso de ctDNA, se identificaron mutaciones utilizando dos métodos: i) Estricto; usando el mismo enfoque que se describió anteriormente, pero filtrando para un mínimo de 1 lectura por código de barra molecular, sin aplicar un umbral de VAF. Para considerar las mutaciones no encontradas en el tumor como detectadas en el plasma, se requirió que tuvieran una configuración dúplex, con al menos dos fragmentos mapeados en diferentes coordenadas y que estuvieran presentes tanto en COSMIC como en TCGA-BC. Se aplicó el mismo enfoque de procesamiento a las muestras de control, ¡i) Exploratorio; visualization de las alineaciones en el navegador del genoma IGV (Robinson, Thorvaldsdottir, Wenger, Zehir y Mesirov, 2017) para identificar mutaciones encontradas en los tumores correspondientes pero que los códigos de barras moleculares automatizados no detectaron. Para estas mutaciones identificadas de manera manual, se contó el número de lecturas que portaban la mutación en dicha muestra y el número de lecturas que no portaban la mutación. Luego, se compararon con las mismas proporciones de lectura en controles y muestras de plasma de cáncer de mama sin la mutación correspondiente mediante una prueba de Fisher.
Análisis estadísticos y visualization de datos
Se realizó el análisis estadístico y los gráficos de los datos con R (https://www.R-project.org/) Se aplicó la prueba exacta de Fisher o la prueba de Chi-cuadrado cuando fue apropiado, tanto para probar la asociación entre las variables clínico-patológicas y los datos de secuenciación de plasma como también en los análisis de datos de secuenciación. También se aplicó la prueba de Wilcoxon para probar las diferencias en la cobertura de secuenciación entre casos y controles. El umbral de significación estadística se estableció en p<0,05.
Los valores de sensibilidad, especificidad y valor predictivo positivo (VPP) se calcularon utilizando el paquete caret v6.0.93. Se utilizó la función oncoplot del paquete maftools (Mayakonda, Lin, Assenov, Plass, & Koeffler, 2018) v2.12.0 para trazar mutaciones y datos clínico-patológicos.
Resultados
En primer lugar, se secuenció el ADN del tumor utilizando la tecnología Agilent SureSelect XT HS, siguiendo las recomendaciones del protocolo, como se indicó anteriormente. La secuenciación del tumor se realizó con una mediana de cobertura de 15,483X. El procesamiento bioinformático posterior que utiliza códigos de barras moleculares para minimizar los errores de secuenciación proporcionó una cobertura mediana final de 1,698X. Entre las regiones capturadas, solo 3 presentaron menos de 100X en más del 10% de las bases secuenciadas. Además, todos los genes presentaron una cobertura homogénea en todas las muestras. A continuación, se realizó un filtrado personalizado utilizando información de bases de datos genómicas públicas para identificar mutaciones somáticas.
Se identificaron 61 mutaciones en 40/71 (56,33%) de las muestras de tumores. Entre ellos, 33 se ubicaron en el gen PIK3CA (54,09%), 12 en TP53 (19,67%) y 4 en GATA3 (6,55%) (Figura 2, Tabla 7), que representan los genes mutados con mayor frecuencia en nuestro conjunto de tumores
Para estudiar la relación entre las mutaciones observadas en los tumores y las detectadas también en el plasma, se aplicó el panel de secuenciación personalizado de la Tabla 1 junto con una secuenciación de alta profundidad con una mediana de cobertura de 17.704X utilizando el ADN plasmático de los pacientes correspondientes. En total se secuenciaron 74 muestras de plasma de los pacientes. Después del procesamiento de los códigos de barras moleculares, la cobertura mediana fue de 2,525X. Entre las regiones de genes secuenciados, 3 presentaron una cobertura baja y todos los genes mostraron una cobertura homogénea. Después de los análisis bioinformáticos utilizando el identificador de mutaciones establecido, se encontraron 13/61 (21,31%) mutaciones en plasma que también estaban presentes en los tumores correspondientes, 7 mutaciones en el gen TP53 (53,84%) y 3 en PIK3CA ( 27,27%) como los genes mutados con mayor frecuencia.
Además, todas las mutaciones observadas en los tumores se inspeccionaron manualmente en los datos sin procesar de secuenciación de plasma. Los datos alineados se usaron para identificar lecturas de apoyo para los alelos alternativos usando el software IGV. Las mutaciones que se encontraron en al menos 2 lecturas con diferentes coordenadas genómicas pasaron al siguiente paso de análisis.
Para considerar las vanantes como válidas, se aplicó una prueba exacta de Fisher utilizando datos de secuenciación de 22 controles sanos de plasma y pacientes que no portaban dicha mutación en sus tumores. En total, se rescataron 5 mutaciones de 4 pacientes diferentes de la secuenciación de plasma mediante inspección manual. Entre ellas, 3 mutaciones se localizaron en el gen TP53 y 2 en GATA3. Curiosamente, las 2 vanantes estructurales en GATA3 con estadísticas de secuenciación robustas se recuperaron mediante inspección manual.
Teniendo en cuenta el total de las variantes detectadas, 18 (13 + 5) en plasma y 61 en tumor, el 29,50% de las variantes encontradas en el tejido tumoral también se localizaron en las muestras de plasma. Por tanto, la sensibilidad de este método sería de alrededor de un 30%.
Tabla 7: Mutaciones detectadas en muestras de tumor y plasma.
Figure imgf000031_0001
Figure imgf000032_0001
El método de la invención presenta una sensibilidad (30%) que supera con creces otros métodos conocidos hasta la fecha, sobre todo si lo comparamos con los dos principales estudios donde se han desarrollado tecnologías/metodologías en las que emplean paneles NGS (amplificación y captura) en el screening del cáncer de mama, esto es, como método diagnóstico. Por un lado, se han realizado estudios utilizando paneles PAN-cáncer como método de diagnóstico, donde se ha llegado a alcanzar una sensibilidad en cáncer de mama de un 33%, similar a la de la presente invención, pero para ello ha sido necesario incluir además otros analitos en circulación sanguínea, tales como proteínas, a modo de biomarcadores adicionales (7).
Por otro lado, cuando se han empleado únicamente paneles paciente-específicos ultrasensibles y de amplificación, la sensibilidad obtenida ha sido solamente del 14,3%, siendo además necesaria la secuenciación previa del tumor para poder diseñarlos, lo cual no es necesario según el método de la presente invención. Cabe destacar que esta baja sensibilidad se da a pesar de que se utiliza una de las tecnologías más novedosas en el campo, Ampliseq HD (ThermoFisher).
Por tanto, podemos concluir que es la selección especifica de los genes de la Tabla 1 la que permite obtener una método de diagnóstico de cáncer de mama que supera las limitaciones en cuanto a sensibilidad que presentaban las metodologías conocidas hasta la fecha, basadas también en paneles de secuenciación.
Figure imgf000033_0001
Capacidad del panel de secuenciación de próxima generación (NGS) para detectar pacientes con cáncer de mama después de mamografías sospechosas usando biopsia líquida
Para investigar la capacidad del panel de secuenciación de próxima generación (NGS) para detectar de forma no invasiva cáncer de mama después de mamografías sospechosas se desarrolló un análisis bioinformático a partir de los datos obtenidos en las muestras del ejemplo 3. En esta ocasión el análisis está orientado a localizar todas las posibles mutaciones que se puedan presentar en plasma, a diferencia del ejemplo anterior donde se hace un análisis informado por la genética del tumor, es decir, donde únicamente se buscan en plasma las mutaciones que aparecen en el tumor.
Se empleó Mutect2 para detectar mutaciones en muestras de plasma usando 2 familias de códigos de barras moleculares y sin filtros en frecuencias alélicas vahantes (VAF). Las vahantes se consideraron asociadas al tumor si i) afectaban las regiones exónicas, ¡i) estaban anotadas en las bases de datos COSMIC, TCGA BC y TCGA que incluyen todos los tipos de cáncer, y si iii) presentaban lecturas alineadas en 2 o más coordenadas genómicas diferentes visualizadas manualmente utilizando el software IGV. En total, 25/74 (33,78 %) de las pacientes presentaron mutaciones tumorales detectadas en plasma (Tabla 8, Figura 1), 16 de las mutaciones no se observaron en el análisis anterior informado por la genética del tumor. Los genes más frecuentemente afectados por las 25 mutaciones diferentes detectadas fueron TP53 (14 mutaciones, 48,27%), PIK3CA (4 mutaciones, 13,79%) y GATA3 (3 mutaciones, 10,34%). Además, se observaron mutaciones de ctDNA en 8 muestras de plasma en cuyas biopsias tumorales correspondientes no se detectaron mutaciones. Además, se observó una mutación en una muestra de plasma sin tejido tumoral disponible.
Tabla 8: Resultados en muestras de plasma de 74 pacientes que han desarrollado cáncer de mama, utilizando el panel de genes de la Tabla 1.
Figure imgf000034_0001
Figure imgf000035_0001
En total, se han encontrado mutaciones en 25 de las 74 muestras, lo que supone un 33.78% del total.
En cuanto a los controles, se han localizado las siguientes mutaciones.
Tabla 9: Resultados en muestras de plasma de 22 sujetos sanos, utilizando el panel de genes de la Tabla 1.
Figure imgf000035_0002
Únicamente se han encontrado mutaciones en 3 de las 22 muestras control analizadas, es decir en un 13.63% de las muestras. Se trata de una mutación del gen MAP3K1 (p.N1125D) descrito en la base de datos COSMIC en una muestra de tumor de cáncer de mama, una mutación en el gen ERBB2 (p.V842l) que se ha observado con una frecuencia sustancialmente mayor en cánceres de colon y endometrio y otra mutación localizada en el gen SMAD4 (p.R361 H) también frecuente en adenocarcinoma de colon; y por otro lado, que el método de la invención tiene una capacidad de detección de frecuencias alélicas de hasta 0,03%, lo cual ¡guala, cuando no supera, otros estudio previos anteriormente citados en los antecedentes de la invención.
Con estos mismos datos se ha estudiado la capacidad de diagnóstico del panel de secuenciación de la Tabla 1 utilizando un análisis estadístico, en concreto: MedCalc Software Ltd. Diagnostic test evaluation calculator, https://www.medcalc.org/calc/diagnostic_test.php.
Los resultados de dicho análisis se muestran a continuación.
Tabla 10: Resultados.
Figure imgf000035_0003
Figure imgf000036_0001
(*) Valores dependientes de la prevalencia de la enfermedad.
Sensibilidad: probabilidad de que el resultado de una prueba sea positivo cuando la enfermedad está presente (tasa de verdaderos positivos).
Especificidad: probabilidad de que el resultado de una prueba sea negativo cuando la enfermedad no está presente (tasa de verdaderos negativos).
Razón de verosimilitud positiva: relación entre la probabilidad de un resultado positivo de la prueba dada la presencia de la enfermedad y la probabilidad de un resultado positivo de la prueba dada la ausencia de la enfermedad.
Razón de verosimilitud negativa: relación entre la probabilidad de un resultado negativo de la prueba dada la presencia de la enfermedad y la probabilidad de un resultado negativo de la prueba dada la ausencia de la enfermedad.
Valor predictivo positivo: probabilidad de que la enfermedad esté presente cuando la prueba es positiva.
Valor predictivo negativo: probabilidad de que la enfermedad no esté presente cuando la prueba es negativa.
Precisión: probabilidad global de que un paciente esté correctamente clasificado.
Tal y como se desprende de este análisis, el empleo del panel personalizado junto con una secuenciación ultra profunda y un análisis bioinformático personalizado no informado por el tumor condujo a una sensibilidad del 31 ,08 %, el método de la invención presenta una muy alta especificidad, de un 86,36% y un valor predictivo positivo de un 88,46%, por lo que, en caso de presentarse alguna mutación en alguno de los genes del panel de la tabla 1, existe una probabilidad de casi un 90% de presentar un cáncer de mama.
Con todo esto podemos concluir que la presente invención aporta, gracias al panel de secuenciación seleccionado, una metodología que permite el diagnóstico de cáncer de mama, incluso a partir de biopsias líquidas, con una sensibilidad, capacidad de detección de frecuencias alélicas bajas y una especificidad y valor predictivo positivo, que supera las limitaciones de otros métodos similares conocidos hasta la fecha. También se investigó la asociación de variables clínico-patológicas con la detección de mutaciones en plasma. En concreto, se estudió la positividad de ctDNA en plasma, la frecuencia alélica mediana (FA) de las mutaciones, el número de mutaciones por muestra y las muestras con mutaciones en TP53 para determinar su asociación con las características clínicas (Tablas 11 y 12). En general, una mediana de FA más alta se asoció con un grado tumoral más alto (p= 0,04639), la presencia de más de 1 mutación en plasma con probabilidad de recaída clínica (p= 0,02372) y las mutaciones en TP53 se observaron más frecuentemente en tumores negativos a la expresión de receptores hormonales (HR), en concreto receptor estrógeno (ER) negativos (p= 0,0316) y receptor progesterona (PR) negativos (P=0,0257). Además, la asociación de la recaída clínica y las mutaciones en plasma con una mediana de frecuencia alélica (FA) alta, definida como mutaciones con > 0,05 % en la FA, fue interesantemente cercana a la significación (p = 0,059).
Cabe destacar que el 38,35% de los pacientes incluidos en este estudio eran asintomáticos y fueron diagnosticados por el programa de detección precoz de cáncer de mama. De ellos, el 28,57% presentaba mutaciones plasmáticas, porcentaje similar al 33,33% de mujeres sintomáticas con mutaciones.
Tabla 11 : Relación entre características clínicas y ctDNA positivos y frecuencia alélica mediana (FA) en plasma.
Figure imgf000037_0001
Figure imgf000038_0001
Tabla 12: Relación entre características clínicas y 2 mutaciones en plasma y TP53 Mutado.
Figure imgf000038_0002
Figure imgf000039_0001
En conclusión, observamos una concordancia de mutaciones entre tumor y plasma del 29,50% con una sensibilidad por debajo del 0,075% en la frecuencia de alelos mutantes. En el enfoque no informado por el tumor, detectamos mutaciones en el 33,78% de las muestras de plasma observando 8 pacientes con mutaciones solo en plasma. Determinamos una especificidad del 86,36% y un valor predictivo positivo del 88,46%. Además, demostramos una asociación entre una mediana de FA más alta y un grado tumoral más alto, la presencia de múltiples mutaciones en plasma con probabilidad de recaída clínica y mutaciones en TP53 con positividad del receptor de estrógeno. Se trata por tanto de un panel de secuenciación único con una tecnología que no se había empleado anteriormente en el cáncer de mama temprano, demostrando una sensibilidad ultra alta y allanando el camino para su uso en la detección del cáncer de mama.
Teniendo en cuenta lo anterior, el panel de secuenciación de la invención para plasma mostró capacidades mejoradas para detectar ctDNA en pacientes con cáncer de mama localizados en las primeras etapas de diagnóstico, mejorando la sensibilidad de detección de investigaciones anteriores y agregando evidencia de que ctDNA podría ayudar en el proceso de diagnóstico de la población asintomática. Esto también está respaldado por los porcentajes similares en la identificación de mutaciones plasmáticas entre mujeres sintomáticas y asintomáticas de 33,33% y 28,57% respectivamente. En este sentido, desarrollamos una metodología bioinformática personalizada para identificar mutaciones plasmáticas sin información tumoral, demostrando un alto VPP y sugiriendo que enfoques similares podrían constituir una herramienta de detección para el cáncer de mama. También queda demostrado que mediante la secuenciación temprana del ADN plasmático de los pacientes con cáncer de mama, es factible obtener información importante sobre la enfermedad, así como predecir la evolución clínica en estas pacientes.
Referencias
1. Alfonso, Alba-Bernal et al.; Challenges and achievements of liquid biopsy technologies employed in early breast cáncer. eBioMedicine - Volumen 62, 103100. https://doi.Org/10.1016/i.ebiom.2020.103100. 2. Sun, M.-Y.; et al,. Targeted Next-Generation Sequencing of Circulating Tumor DNA Mutations among Metastatic Breast Cancer Patients. Curr. Oncol. 2021 , 28, 2326-2336. https://doi.org/10.3390/curroncol28040214.
3. Priskin, K.; et al., BC-Monitor: Towards a Routinely Accessible Circulating Tumor DNA-Based Tool for Real-Time Monitoring Breast Cancer Progression and Treatment Effectiveness. Cancers 2021 , 13, 3489. https://doi.org/10.3390/cancers13143489.
4. Keup, C., Benyaa et al. Targeted deep sequencing revealed variants in cell-free DNA of hormone receptor-positive metastatic breast cancer patients. Cell. Mol. Life Sci. 77, 497-509 (2020). https://doi.org/10.1007/s00018-019-03189-z.
5- Jimenez Rodríguez, B.; et al., Detection of TP53 and PIK3CA Mutations in Circulating Tumor DNA Using Next-Generation Sequencing in the Screening Process for Early Breast Cancer Diagnosis. . Clin. Med. 2019, 8, 1183. https://doi.Org/10.3390/jcm8081183 identificadores moleculares únicos 6. Pereira, B.,et al., The somatic mutation profiles of 2,433 breast cancers refine their genomic and transcriptomic landscapes. Nat Commun 7, 11479 (2016). https://doi.org/10.1038/ncomms11479.
7. Cohen JD et al., Detection and localization of surgically resectable cancers with a multianalyte blood test. Science. 2018 Feb 23;359(6378):926-930. doi: 10.1126/science.aar3247.
8. Page K, et al., Prevalence of ctDNA in early screen-detected breast cancers using highly sensitive and specific dual molecular barcoded personalised mutation assays. Ann Oncol. 2021 Aug;32(8):1057-1060. doi: 10.1016/j.annonc.2021.04.018. Epub 2021 Apr 29. PMID: 33932505.
9. Garcia-Murillas, I. et al. Mutation tracking in circulating tumor DNA predicts relapse in early breast cancer. Sel Transí Med 7, 302ra133 (2015).

Claims

REIVINDICACIONES
1. Uso del panel de secuenciación de la Tabla 1 para el diagnóstico o pronóstico del cáncer de mama.
2. Uso del panel de secuenciación según la reivindicación anterior en biopsias líquidas.
3. Un método in vitro de obtención de datos útiles para diagnosticar, predecir o pronosticar la evolución del cáncer de mama, a partir de una muestra biológica previamente aislada de un individuo, que comprende identificar posibles mutaciones en los genes de la Tabla 1.
4. Un método in vitro para diagnosticar o diagnosticar precozmente el cáncer de mama que comprende el método de obtención de datos útiles de la reivindicación 3 y que además comprende asignar al individuo que presenta mutaciones en alguno de los genes de la Tabla 1 al grupo de pacientes que padece cáncer de mama.
5. Un método in vitro para diagnosticar el cáncer de mama según la reivindicación anterior que además comprende asignar al individuo que presenta una mediana de frecuencia alélica de las mutaciones de los genes de la Tabla 1 más alta, al grupo de pacientes con un grado tumoral más alto.
6. Un método in vitro para predecir o pronosticar la evolución del cáncer de mama que comprende el método de obtención de datos útiles de la reivindicación 3 y que además comprende asignar al individuo que presenta más de una mutación en los genes de la Tabla 1 , al grupo de pacientes con probabilidad de recaída clínica.
7. Un método in vitro para predecir o pronosticar la evolución del cáncer de mama que comprende el método de obtención de datos útiles de la reivindicación 3 y que además comprende asignar al individuo que presenta mutaciones en TP53 al grupo de pacientes con tumor negativo a la expresión de receptores hormonales.
8. El método según cualquiera de las reivindicaciones 3 a 7 donde la muestra biológica es plasma.
9. El método según cualquiera de las reivindicaciones 3 a 8, en el que las mutaciones en los genes de la Tabla 1 se detectan mediante tecnologías de secuenciación de última generación o next generation sequencing.
10. El método según la reivindicación anterior donde la tecnología de secuenciación de última generación utilizada son sondas de enriquecimiento tipo Agilent Sure Select.
11. Un kit que comprende los elementos necesarios para la detección simultánea de mutaciones en cualquiera de los genes de la Tabla 1.
12. Uso del kit según la reivindicación 11 para diagnosticar o pronosticar la evolución del cáncer de mama.
13. Un programa de ordenador adaptado para que cualquier medio de procesamiento pueda llevar a la práctica el método según cualquiera las reivindicaciones 3 a 10.
14. Un medio de almacenamiento legible por un ordenador que comprende instrucciones de programa capaces de hacer que un ordenador lleve a cabo los pasos del método según cualquiera las reivindicaciones 3 a 10.
15. Una señal transmisible que comprende instrucciones de programa capaces de hacer que un ordenador lleve a cabo los pasos del método según cualquiera las reivindicaciones 3 a
PCT/ES2023/070633 2022-10-28 2023-10-27 Panel de secuenciación para biopsia líquida de pacientes con cáncer de mama WO2024089314A1 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
ES202230937 2022-10-28
ESP202230937 2022-10-28

Publications (1)

Publication Number Publication Date
WO2024089314A1 true WO2024089314A1 (es) 2024-05-02

Family

ID=89068579

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/ES2023/070633 WO2024089314A1 (es) 2022-10-28 2023-10-27 Panel de secuenciación para biopsia líquida de pacientes con cáncer de mama

Country Status (1)

Country Link
WO (1) WO2024089314A1 (es)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017181146A1 (en) 2016-04-14 2017-10-19 Guardant Health, Inc. Methods for early detection of cancer
US20210343372A1 (en) 2020-02-18 2021-11-04 Tempus Labs, Inc. Methods and systems for dynamic variant thresholding in a liquid biopsy assay
WO2022225933A1 (en) * 2021-04-22 2022-10-27 Natera, Inc. Methods for determining velocity of tumor growth

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017181146A1 (en) 2016-04-14 2017-10-19 Guardant Health, Inc. Methods for early detection of cancer
US20210343372A1 (en) 2020-02-18 2021-11-04 Tempus Labs, Inc. Methods and systems for dynamic variant thresholding in a liquid biopsy assay
WO2022225933A1 (en) * 2021-04-22 2022-10-27 Natera, Inc. Methods for determining velocity of tumor growth

Non-Patent Citations (14)

* Cited by examiner, † Cited by third party
Title
ALFONSO, ALBA-BERNAL ET AL.: "Challenges and achievements of liquid biopsy technologies employed in early breast cáncer", EBIOMEDICINE, vol. 62, pages 103100, Retrieved from the Internet <URL:https://doi.orQ/10.1016/i.ebiom.2020.103100>
COHEN JD ET AL.: "Detection and localization of surgically resectable cancers with a multi-analyte blood test", SCIENCE, vol. 359, no. 6378, 23 February 2018 (2018-02-23), pages 926 - 930, XP055687252, DOI: 10.1126/science.aar3247
GARCIA-MURILLAS, I. ET AL.: "Mutation tracking in circulating tumor DNA predicts relapse in early breast cáncer", SCI TRANSL MED, vol. 7, 2015, pages 302ra133, XP055440860, DOI: 10.1126/scitranslmed.aab0021
JIMENEZ RODRIGUEZ, B. ET AL.: "Detection of TP53 and PIK3CA Mutations in Circulating Tumor DNA Using Next-Generation Sequencing in the Screening Process for Early Breast Cancer Diagnosis", J. CLIN. MED., vol. 8, 2019, pages 1183, Retrieved from the Internet <URL:https://doi.org/10.3390/icm8081183>
KEUP CORINNA ET AL: "Targeted deep sequencing revealed variants in cell-free DNA of hormone receptor-positive metastatic breast cancer patients", CMLS CELLULAR AND MOLECULAR LIFE SCIENCES, BIRKHAUSER VERLAG, HEIDELBERG, DE, vol. 77, no. 3, 28 June 2019 (2019-06-28), pages 497 - 509, XP037016699, ISSN: 1420-682X, [retrieved on 20190628], DOI: 10.1007/S00018-019-03189-Z *
KEUP, C., BENYAA ET AL.: "Targeted deep sequencing revealed variants in cell-free DNA of hormone receptor-positive metastatic breast cáncer patients", CELL. MOL. LIFE SCI., vol. 77, pages 497 - 509, XP037016699, DOI: 10.1007/s00018-019-03189-z
PAGE K ET AL.: "Prevalence of ctDNA in early screen-detected breast cancers using highly sensitive and specific dual molecular barcoded personalised mutation assays", ANN ONCOL, vol. 32, no. 8, 29 April 2021 (2021-04-29), pages 1057 - 1060
PENG ZIZHEN ET AL: "Role of FAT1 in health and disease (Review)", ONCOLOGY LETTERS, vol. 21, no. 5, 18 March 2021 (2021-03-18), GR, XP093132228, ISSN: 1792-1074, DOI: 10.3892/ol.2021.12659 *
PEREIRA, B.: "The somatic mutation profiles of 2,433 breast cancers refine their genomic and transcriptomic landscapes", NAT COMMUN, vol. 7, 2016, pages 11479, Retrieved from the Internet <URL:https://doi.org/10.1038/ncomms11479>
PRISKIN KATALIN ET AL: "BC-Monitor: Towards a Routinely Accessible Circulating Tumor DNA-Based Tool for Real-Time Monitoring Breast Cancer Progression and Treatment Effectiveness", CANCERS, vol. 13, no. 14, 12 July 2021 (2021-07-12), CH, pages 3489, XP093114698, ISSN: 2072-6694, Retrieved from the Internet <URL:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8305126/pdf/cancers-13-03489.pdf> DOI: 10.3390/cancers13143489 *
PRISKIN, K. ET AL.: "BC-Monitor: Towards a Routinely Accessible Circulating Tumor DNA-Based Tool for Real-Time Monitoring Breast Cancer Progression and Treatment Effectiveness", CANCERS, vol. 13, 2021, pages 3489, Retrieved from the Internet <URL:https://doi.org/10.3390/cancers13143489>
SUN MIN-YING ET AL: "Targeted Next-Generation Sequencing of Circulating Tumor DNA Mutations among Metastatic Breast Cancer Patients", CURRENT ONCOLOGY, vol. 28, no. 4, 24 June 2021 (2021-06-24), pages 2326 - 2336, XP093093730, Retrieved from the Internet <URL:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8293138/pdf/curroncol-28-00214.pdf> DOI: 10.3390/curroncol28040214 *
SUN, M.-Y. ET AL.: "Targeted Next-Generation Sequencing of Circulating Tumor DNA Mutations among Metastatic Breast Cancer Patients", CURR. ONCOL., vol. 28, 2021, pages 2326 - 2336, XP093093730, Retrieved from the Internet <URL:https://doi.org/10.3390/curroncol28040214> DOI: 10.3390/curroncol28040214
YOSHINAMI TETSUHIRO ET AL: "Detection of ctDNA with Personalized Molecular Barcode NGS and Its Clinical Significance in Patients with Early Breast Cancer", TRANSLATIONAL ONCOLOGY, vol. 13, no. 100787, 1 August 2020 (2020-08-01), United States, XP093114697, ISSN: 1936-5233, Retrieved from the Internet <URL:https://pdf.sciencedirectassets.com/306536/1-s2.0-S1936523320X00076/1-s2.0-S193652332030019X/main.pdf?X-Amz-Security-Token=IQoJb3JpZ2luX2VjEJH//////////wEaCXVzLWVhc3QtMSJHMEUCIQCAORRJnuNY2qjia3zwz/oUAPHHRQoRZLUnyt3XpjerDQIgEJMxcnONX16fEZtrpe2FMqlTzH4debGf//YvWz0427sqswUIGhAFGgwwNTkwMDM1NDY4NjUiDG0dG> DOI: 10.1016/j.tranon.2020.100787 *

Similar Documents

Publication Publication Date Title
Tong et al. Tumor-derived DNA from pleural effusion supernatant as a promising alternative to tumor tissue in genomic profiling of advanced lung cancer
Cheung et al. Latest development of liquid biopsy
ES2525545T3 (es) Métodos y usos para identificar el origen de un carcinoma de origen primario desconocido
Roepman et al. Microarray-based determination of estrogen receptor, progesterone receptor, and HER2 receptor status in breast cancer
BR112020023587A2 (pt) método para determinar um perfil de fragmentação de dna livre de células (cfdna), método para identificar um mamífero como tendo câncer, método de identificação do tecido de origem de um câncer e método para tratar um mamífero com câncer
JP5666136B2 (ja) 原発不明がんの原発巣を同定するための方法および材料
Narayan et al. Novel biomarkers for prostate cancer: an evidence‐based review for use in clinical practice
CN105102636B (zh) 用于检测和测定前列腺癌预后的组合物和方法
CA2628390A1 (en) Molecular profiling of cancer
WO2012125411A1 (en) Methods of predicting prognosis in cancer
US20140127708A1 (en) Predictive biomarkers for prostate cancer
Florholmen et al. Discovery and validation of mucosal TNF expression combined with histological score-a biomarker for personalized treatment in ulcerative colitis
Cheng et al. A four‐gene transcript score to predict metastatic‐lethal progression in men treated for localized prostate cancer: Development and validation studies
AU2017201343A1 (en) Molecular biomarker set for early detection of ovarian cancer
Nizic-Kos et al. Bilateral disease common among slovenian CHEK2-positive breast cancer patients
Liu et al. Recurrence prediction by circulating tumor DNA in the patient with colorectal liver metastases after hepatectomy: a prospective biomarker study
Choi et al. Clinicoradiopathological features and prognosis according to genomic alterations in patients with resected lung adenocarcinoma
Lin et al. Association of immunohistochemical profiles with histotypes in endometrial carcinomas
Shao et al. Cell‐free DNA 5‐hydroxymethylcytosine as a marker for common cancer detection
Gupta et al. Fluorescent in situ hybridization in surgical pathology practice
WO2024089314A1 (es) Panel de secuenciación para biopsia líquida de pacientes con cáncer de mama
US10066270B2 (en) Methods and kits used in classifying adrenocortical carcinoma
Kashanizadeh et al. Molecular expression of some oncogenes and predisposing behaviors contributing to the aggressiveness of prostate cancer
Kolbinger et al. Significance of distinct liquid biopsy compartments in evaluating somatic mutations for targeted therapy selection in cancer of unknown primary
US20050084858A1 (en) Method for monitoring and prognosis of disease course of gastrointestinal tumors