ES2971182A1 - Sequencing panel for liquid biopsy of breast cancer patients (Machine-translation by Google Translate, not legally binding) - Google Patents

Sequencing panel for liquid biopsy of breast cancer patients (Machine-translation by Google Translate, not legally binding) Download PDF

Info

Publication number
ES2971182A1
ES2971182A1 ES202230937A ES202230937A ES2971182A1 ES 2971182 A1 ES2971182 A1 ES 2971182A1 ES 202230937 A ES202230937 A ES 202230937A ES 202230937 A ES202230937 A ES 202230937A ES 2971182 A1 ES2971182 A1 ES 2971182A1
Authority
ES
Spain
Prior art keywords
breast cancer
mutations
sequencing
genes
patients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
ES202230937A
Other languages
Spanish (es)
Inventor
Méndez Iñaki Comino
Conejo Emilio Alba
López Francisco Javier Pascual
Bernal Alfonso Alba
Rodríguez Begoña Jiménez
Ortega María Elena Quirós
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Roche Farma S A
Universidad de Malaga
Servicio Andaluz de Salud
Roche Farma SA
Consorcio Centro de Investigacion Biomedica en Red MP
Original Assignee
Roche Farma S A
Universidad de Malaga
Servicio Andaluz de Salud
Roche Farma SA
Consorcio Centro de Investigacion Biomedica en Red MP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Roche Farma S A, Universidad de Malaga, Servicio Andaluz de Salud, Roche Farma SA, Consorcio Centro de Investigacion Biomedica en Red MP filed Critical Roche Farma S A
Priority to ES202230937A priority Critical patent/ES2971182A1/en
Priority to PCT/ES2023/070633 priority patent/WO2024089314A1/en
Publication of ES2971182A1 publication Critical patent/ES2971182A1/en
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57415Specifically defined cancers of breast
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Medical Informatics (AREA)
  • Biochemistry (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • General Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Food Science & Technology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Cell Biology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)

Abstract

Massive sequencing panel composed of 37 genes for liquid biopsy that allows early diagnosis of breast cancer and methods for obtaining useful data for the diagnosis and monitoring of the disease. (Machine-translation by Google Translate, not legally binding)

Description

DESCRIPCIÓN DESCRIPTION

Panel de secuenciación para biopsia líquida de pacientes con cáncer de mama Sequencing panel for liquid biopsy of breast cancer patients

CAMPO DE LA INVENCIÓN FIELD OF INVENTION

La presente invención se encuentra dentro del campo de la medicina y la oncología, y se refiere a un panel de secuenciación para tejidos tumorales y biopsia líquida de pacientes con cáncer de mama. The present invention is within the field of medicine and oncology, and refers to a sequencing panel for tumor tissues and liquid biopsy of patients with breast cancer.

ESTADO DEL ARTE STATE OF THE ART

Denominamos cáncer de mama a los tumores que se desarrollan en los tejidos mamarios. Existen dos tipos principales de cáncer de mama: el carcinoma ductal que comienza en los conductos que llevan leche desde la mama hasta el pezón y que es el mayoritario, y el carcinoma lobular, que comienza en los lóbulos que producen leche. Para detectar el cáncer de mama, se utilizan diferentes pruebas como la mamografía, ultrasonido mamario con transductores de alta resolución (ecografías) o imágenes por resonancia magnética. Hasta la fecha, el diagnóstico de cáncer de mama solo se podía confirmar por medio de una biopsia del tumor. We call breast cancer the tumors that develop in the breast tissues. There are two main types of breast cancer: ductal carcinoma, which begins in the ducts that carry milk from the breast to the nipple and is the majority, and lobular carcinoma, which begins in the lobes that produce milk. To detect breast cancer, different tests are used such as mammography, breast ultrasound with high-resolution transducers (ultrasounds) or magnetic resonance imaging. To date, the diagnosis of breast cancer could only be confirmed through a tumor biopsy.

La biopsia líquida es una estrategia con un gran potencial en el manejo del cáncer, incluyendo el diagnóstico, la detección de recaídas de forma temprana o permitiendo la monitorización del estado de la enfermedad a lo largo del tratamiento para ver su evolución. Se trata de una prueba que se realiza empleando biofluidos corporales, más comúnmente sangre, aunque también se pueden analizar en otros líquidos del organismo como son el que recubre las meninges, el que recubre el pulmón, la saliva o incluso la orina, con el fin de buscar células cancerosas de un tumor o fragmentos de ADN de células tumorales, el llamado ADN tumoral circulante (ctDNA). A diferencia de la biopsia de tejido, permite realizar el análisis molecular de una forma mucho más sencilla y rápida, ya que se puede hacer una analítica de sangre en cualquier momento, y además se puede repetir para monitorizar la evolución del tumor. Liquid biopsy is a strategy with great potential in the management of cancer, including diagnosis, early detection of relapses or allowing monitoring of the state of the disease throughout treatment to see its evolution. This is a test that is performed using body biofluids, most commonly blood, although they can also be analyzed in other body fluids such as the one that covers the meninges, the one that covers the lung, saliva or even urine, in order to to look for cancer cells from a tumor or DNA fragments from tumor cells, the so-called circulating tumor DNA (ctDNA). Unlike tissue biopsy, it allows molecular analysis to be performed in a much simpler and faster way, since a blood test can be done at any time, and it can also be repeated to monitor the evolution of the tumor.

Lo que se pretende identificar en las muestras son las diferentes mutaciones propias del tumor, ya que estas mutaciones no están presentes en el resto de células normales que hay en la sangre. What is intended to be identified in the samples are the different mutations specific to the tumor, since these mutations are not present in the rest of the normal cells in the blood.

Los paneles de secuenciación son tests genéticos que engloban genes implicados en una misma patología, en este caso, orientados al cáncer de mama. Sequencing panels are genetic tests that encompass genes involved in the same pathology, in this case, aimed at breast cancer.

La detección y caracterización de los materiales tumorales circulantes presenta dificultades en un escenario temprano debido a sus bajas cantidades en los biofluidos de los pacientes. Sin embargo, el avance en las técnicas de detección actualmente utilizadas, muy sensibles, permiten que, por muy poca cantidad de ctDNA que exista en la sangre o en otros biofluidos, se puede detectar y analizar pudiendo caracterizar la genética de los tumores. The detection and characterization of circulating tumor materials presents difficulties in an early setting due to their low quantities in patients' biofluids. However, the advance in the detection techniques currently used, very sensitive, allows that, even if there is a very small amount of ctDNA that exists in the blood or in other biofluids, it can be detected and analyzed, being able to characterize the genetics of the tumors.

La utilización del ctDNA junto con tecnologías NGS(next generation sequencing)ultrasensibles de última generación, también empleando paneles específicos de paciente, han servido para caracterizar los tumores, evaluar las respuestas a las quimioterapias neoadyuvantes y detectar la MRD(minimal residual disease)después de la cirugía. The use of ctDNA together with state-of-the-art ultrasensitive NGS (next generation sequencing) technologies, also using patient-specific panels, has served to characterize tumors, evaluate responses to neoadjuvant chemotherapies and detect MRD (minimal residual disease) after Surgery.

NGS dirigidos como SafeSEQ - Safe-sequencing system o sistema de secuenciación segura han surgido recientemente como una nueva herramienta para aumentar la sensibilidad de los instrumentos del sistema de secuenciación paralela masiva para la identificación de variantes raras en el ADN plasmático. Esta estrategia de secuenciación utiliza códigos de barras de una sola molécula antes de la amplificación por PCR para reducir el error de secuenciación y aumentar la precisión. El sistema SafeSEQ, o de secuenciación segura, se puede usar para distinguir entre mutaciones raras y errores técnicos y es capaz de detectar mutaciones que otras tecnologías pasarían por alto. SafeSEQ se ha aplicado hasta ahora a muestras de plasma de cáncer colorrectal metastásico y a pacientes con tumores del estroma gastrointestinal. Targeted NGS such as SafeSEQ - Safe-sequencing system have recently emerged as a new tool to increase the sensitivity of massively parallel sequencing system instruments for the identification of rare variants in plasma DNA. This sequencing strategy uses single-molecule barcodes prior to PCR amplification to reduce sequencing error and increase precision. The SafeSEQ, or secure sequencing, system can be used to distinguish between rare mutations and technical errors and is capable of detecting mutations that other technologies would miss. SafeSEQ has so far been applied to plasma samples from metastatic colorectal cancer and patients with gastrointestinal stromal tumors.

Otras tecnologías NGS son las sondas de enriquecimiento de regiones génicas concretas como son las de Agilent SureSelect, que se pueden utilizar para diseñar paneles de captura híbridos personalizados y secuenciar masivamente cualquier región codificante o no codificante del genoma o del transcriptoma. Other NGS technologies include gene region enrichment probes such as Agilent SureSelect, which can be used to design custom hybrid capture panels and mass sequence any coding or non-coding region of the genome or transcriptome.

Todo ello ha contribuido al desarrollo de las técnicas de biopsia líquida. Actualmente se utilizan procedimientos de secuenciación masiva (NGS) y diferentes tecnologías para detectar ctDNA en dilución muy baja (1). Sin embargo, aún no está claro si las alteraciones moleculares en ctDNA pueden detectarse mediante ensayos basados en NGS de ctDNA en plasma en pacientes con cáncer de mama primario en el cribado y cómo se relacionan con la mutación del tejido tumoral encontrada en el mismo paciente. All of this has contributed to the development of liquid biopsy techniques. Massive sequencing (NGS) procedures and different technologies are currently used to detect ctDNA at very low dilution (1). However, it is still unclear whether molecular alterations in ctDNA can be detected by NGS-based assays of plasma ctDNA in patients with primary breast cancer at screening and how they relate to the tumor tissue mutation found in the same patient.

Las ventajas que presenta este tipo de biopsia líquida en el seguimiento y la predicción del cáncer de mama metastásico (CMM) han sido comprobadas por diversos estudios (2), resaltando la importancia del ctDNA como potencial biomarcador para la evaluación, predicción y manejo clínico en los pacientes con CMM tratados con quimioterapia. En este sentido, la monitorización de ctDNA durante el tratamiento puede mejorar significativamente los resultados al predecir la progresión de la enfermedad entre cuatro y seis meses antes que los métodos convencionales (3). The advantages of this type of liquid biopsy in the monitoring and prediction of metastatic breast cancer (MBC) have been proven by various studies (2), highlighting the importance of ctDNA as a potential biomarker for the evaluation, prediction and clinical management in MBC patients treated with chemotherapy. In this sense, ctDNA monitoring during treatment can significantly improve outcomes by predicting disease progression four to six months earlier than conventional methods (3).

Se han llevado a cabo varios estudios que tratan de desarrollar un método para la monitorizacion de cáncer de mama utilizando la secuenciación de moléculas de ctDNA derivadas de una muestra obtenida del paciente y posterior análisis de dichas secuencias de ctDNA para identificar sus mutaciones. Un ejemplo de estos paneles de secuenciación lo tenemos en WO2017181146A1 donde se incluyen los siguientes genes:AKT1, ALK, APC, ATM, BRAF, CTNNB1, EGFR, ERBB2, ESR1, FGFR2, GATA3, GNAS, IDH1, IDH2, KIT, KRAS, MET, NRAS, PDGFRA, PIK3CA, PTEN, RB1, SMAD4, STK11 y TP53y que permite detectar mutaciones en una frecuencia alélica de hasta 0,025 %. Otro ejemplo en este mismo sentido se describe en el documento US2021343372A1 donde en una muestra de biopsia líquida en pacientes con cáncer de mama se identifican mutaciones enTP53para el 51,1% de los pacientes, y con menor incidencia, enPIK3CA, ESR1, BRCA2, NF1, ATMyAPC.Las frecuencias alélicas detectadas son del orden de 0,1 %, 0,25 % y 0,5 %. Several studies have been carried out that try to develop a method for monitoring breast cancer using the sequencing of ctDNA molecules derived from a sample obtained from the patient and subsequent analysis of said ctDNA sequences to identify their mutations. We have an example of these sequencing panels in WO2017181146A1 where the following genes are included: AKT1, ALK, APC, ATM, BRAF, CTNNB1, EGFR, ERBB2, ESR1, FGFR2, GATA3, GNAS, IDH1, IDH2, KIT, KRAS, MET, NRAS, PDGFRA, PIK3CA, PTEN, RB1, SMAD4, STK11 and TP53y that allows detecting mutations at an allelic frequency of up to 0.025%. Another example in this sense is described in document US2021343372A1 where in a liquid biopsy sample in patients with breast cancer, mutations in TP53 are identified for 51.1% of patients, and with a lower incidence, in PIK3CA, ESR1, BRCA2, NF1 , ATMyAPC.The allele frequencies detected are of the order of 0.1%, 0.25% and 0.5%.

Otros paneles de genes para el análisis de ctDNA y la identificación de cáncer de mama metastásico (CMM) incluyen los siguientes genes:AKT1, AR, BRCA1, BRCA2, EGFR, ERCC4, ERBB2, ERBB3, ESR1, FGFR1, KRAS, MUC16, PIK3CA, PIK3R1, PTEN, PTGFRyTGFB1(4). Other gene panels for ctDNA analysis and identification of metastatic breast cancer (MBC) include the following genes: AKT1, AR, BRCA1, BRCA2, EGFR, ERCC4, ERBB2, ERBB3, ESR1, FGFR1, KRAS, MUC16, PIK3CA , PIK3R1, PTEN, PTGFRyTGFB1(4).

También se ha valorado la idoneidad del análisis de ctDNA en el diagnóstico precoz de cáncer de mama, comparando mutaciones enPIK3CAyTP53entre biopsias tumorales y DNA plasmático pretratamiento (5), revelando cuatro mutaciones adicionales, tres enTP53y una enPIK3CA,no identificadas previamente en la biopsia de tejido de tres pacientes. The suitability of ctDNA analysis in the early diagnosis of breast cancer has also been assessed, comparing mutations in PIK3CA and TP53 between tumor biopsies and pretreatment plasma DNA (5), revealing four additional mutations, three in TP53 and one in PIK3CA, not previously identified in the tissue biopsy. of three patients.

Teniendo en consideración los documentos citados en el estado de la técnica queda claro el gran interés que existe en el desarrollo de las técnicas de biopsia líquida y el análisis del ctDNA, con el fin de construir paneles de secuenciación personalizados para el diagnóstico precoz del cáncer de mama y que resulten útiles en la evaluación y seguimiento de la enfermedad, incluyendo la posibilidad de obtener predicciones sobre la progresión de la enfermedad y tomar decisiones terapéuticas personalizadas. Taking into consideration the documents cited in the state of the art, it is clear the great interest that exists in the development of liquid biopsy techniques and ctDNA analysis, in order to build personalized sequencing panels for the early diagnosis of breast cancer. breast and that are useful in the evaluation and monitoring of the disease, including the possibility of obtaining predictions about the progression of the disease and making personalized therapeutic decisions.

DESCRIPCIÓN DE LA INVENCIÓN DESCRIPTION OF THE INVENTION

En la presente invención se propone un panel de secuenciación masiva para el diagnóstico precoz del cáncer de mama, útiles en la evaluación y seguimiento de la enfermedad, compuesto por 37 genes (ver Tabla 1). In the present invention, a massive sequencing panel is proposed for the early diagnosis of breast cancer, useful in the evaluation and monitoring of the disease, composed of 37 genes (see Table 1).

Estos genes han sido seleccionados siguiendo los criterios que se exponen a continuación: These genes have been selected following the criteria set out below:

1. Genes con mutaciones en >=1% de las muestras de tumores de mama incluidas en la base de datos TCGA (https://www.cbioportal.org). 1. Genes with mutations in >=1% of breast tumor samples included in the TCGA database (https://www.cbioportal.org).

2. Genes secuenciados en un artículo seminal en tumores de mama y que presentaron mutaciones en este tipo tumoral (6). 2. Genes sequenced in a seminal article on breast tumors and that presented mutations in this tumor type (6).

3. Genes con relevancia biológica en el cáncer de mama y/o cánceres en general y no basados en su frecuencia mutacional. 3. Genes with biological relevance in breast cancer and/or cancers in general and not based on their mutational frequency.

Tabla 1: Genes incluidos en el panel se secuenciación masiva customizado empleando la tecnología de Agilent SureSelect XT HS. Table 1: Genes included in the custom massive sequencing panel using Agilent SureSelect XT HS technology.

Todos los genes de la tabla tienen secuencias conocidas, las cuales son públicas y accesibles a través de bases de datos públicas, por lo que no requieren mayor caracterización en la presente memoria para que un experto medio en la materia pueda reproducir la invención. All genes in the table have known sequences, which are public and accessible through public databases, so they do not require further characterization herein so that an average expert in the field can reproduce the invention.

Las coordenadas genómicas de las regiones que han sido incluidas en el panel son las que se muestran en la siguiente Tabla2. The genomic coordinates of the regions that have been included in the panel are shown in the following Table 2.

Tabla 2: Coordenadas genómicas (versión del genoma humano=hg38): Table 2: Genomic coordinates (human genome version=hg38):

Gracias al empleo de códigos de barras moleculares, este panel permite la caracterización ultrasensible de aberraciones genéticas tumorales, por lo que puede ser empleado para la detección de mutaciones en frecuencias alélicas por debajo del 0,15%. Thanks to the use of molecular barcodes, this panel allows the ultrasensitive characterization of tumor genetic aberrations, so it can be used for the detection of mutations at allelic frequencies below 0.15%.

Esta alta sensibilidad permite la detección de mutaciones en biofluidos (biopsia líquida) de pacientes con tumores localizados/tempranos o aquellos cánceres con poca liberación de material tumoral. Este panel ha sido optimizado y validado usando cuatro muestras de tumores de mama con mutaciones conocidas (ver ejemplo 1) y sus resultados han sido comparados con otros paneles de secuenciación para este mismo tipo de cáncer, cáncer de mama, mostrando una mayor capacidad de detección de mutaciones (ver ejemplo 2). Su uso en biopsias líquidas ha sido respaldado en estudios comparativos con muestras tumorales, donde se demuestra la alta sensibilidad, especificidad y capacidad de valor predictivo del método de diagnostico de cáncer de mama basado en este panel de secuenciación (ver ejemplo 3). También se han comprobado, mediante su correlación con variables clínico-patológicas, su utilidad como marcador de pronóstico o progresión de la enfermedad (ver ejemplo 4). This high sensitivity allows detection of mutations in biofluids (liquid biopsy) from patients with localized/early tumors or those cancers with little release of tumor material. This panel has been optimized and validated using four breast tumor samples with known mutations (see example 1) and its results have been compared with other sequencing panels for this same type of cancer, breast cancer, showing greater detection capacity. of mutations (see example 2). Its use in liquid biopsies has been supported in comparative studies with tumor samples, where the high sensitivity, specificity and predictive value capacity of the breast cancer diagnosis method based on this sequencing panel is demonstrated (see example 3). Its usefulness as a marker of prognosis or progression of the disease has also been proven, through its correlation with clinicopathological variables (see example 4).

Por tanto, un primer aspecto de la invención se refiere al panel de secuenciación que comprende los genes de la Tabla 1. Therefore, a first aspect of the invention refers to the sequencing panel comprising the genes of Table 1.

En concreto y más preferiblemente, a su uso como biomarcadores para diagnosticar, diagnosticar de forma temprana, predecir o pronosticar la evolución el cáncer de mama. Y aún más preferiblemente, para su uso en biopsia líquida. Specifically and more preferably, to their use as biomarkers to diagnose, early diagnose, predict or forecast the evolution of breast cancer. And even more preferably, for use in liquid biopsy.

Métodos de la invención Methods of the invention

Otro aspecto de la invención se refiere a un métodoin vitrode obtención de datos útiles para diagnosticar, diagnosticar de forma temprana, predecir o pronosticar la evolución del cáncer de mama en un individuo, de ahora en adelante primer método de la invención, que comprende: Another aspect of the invention refers to an in vitro method of obtaining data useful for diagnosing, early diagnosing, predicting or forecasting the evolution of breast cancer in an individual, hereinafter first method of the invention, which comprises:

a) obtener una muestra biológica aislada del individuo, a) obtain a biological sample isolated from the individual,

b) identificar posibles mutaciones en los genes de la Tabla 1. b) identify possible mutations in the genes in Table 1.

Otro aspecto de la invención se refiere a un métodoin vitropara diagnosticar o diagnosticar de forma temprana, el cáncer de mama, de ahora en adelante segundo método de la invención, que comprende los pasos (a) - (b) según el primer método de la invención, y además comprende: Another aspect of the invention relates to an in vitro method for diagnosing or early diagnosis of breast cancer, hereinafter second method of the invention, comprising steps (a) - (b) according to the first method of the invention. invention, and also includes:

c) asignar al individuo que presenta mutaciones en alguno de los genes de la Tabla 1 al grupo de pacientes que padece cáncer de mama. c) assign the individual who has mutations in any of the genes in Table 1 to the group of patients suffering from breast cancer.

En una realización preferida del segundo método de la invención además comprende asignar al individuo que presenta una mediana de frecuencia alélica de las mutaciones más alta, al grupo de pacientes con un grado tumoral más alto. In a preferred embodiment of the second method of the invention it further comprises assigning the individual who has a higher median allele frequency of the mutations to the group of patients with a higher tumor grade.

Otro aspecto de la invención se refiere a un métodoin vitropara predecir o pronosticar la evolución del cáncer de mama, que comprende el método de obtención de datos útiles de la invención, y que además comprende asignar al individuo que presenta más de una mutación, al grupo de pacientes con probabilidad de recaída clínica. Another aspect of the invention refers to an in vitro method to predict or forecast the evolution of breast cancer, which comprises the method of obtaining useful data of the invention, and which also comprises assigning the individual who has more than one mutation, to the group of patients with a probability of clinical relapse.

Otro aspecto de la invención refiere al métodoin vitropara predecir o pronosticar la evolución del cáncer de mama, que comprende el método de obtención de datos útiles de la invención y que además comprende asignar al individuo que presenta mutaciones enTP53al grupo de pacientes con tumor negativo a la expresión de receptores hormonales. Another aspect of the invention refers to the in vitro method to predict or forecast the evolution of breast cancer, which includes the method of obtaining useful data of the invention and which also includes assigning the individual who has mutations in TP53 to the group of patients with a negative tumor. expression of hormone receptors.

Una "muestra biológica" tal como se define aquí, es una pequeña parte de un sujeto, representativa del conjunto y puede estar constituida por una biopsia o una muestra de fluido corporal. A "biological sample" as defined herein is a small part of a subject, representative of the whole, and may consist of a biopsy or a sample of body fluid.

Preferiblemente, la muestra biológica es plasma, proveniente de la separación física de la muestra de sangre tomada del paciente. Preferably, the biological sample is plasma, coming from the physical separation of the blood sample taken from the patient.

La detección las mutaciones en los genes de la Tabla 1 puede realizarse por cualquier medio conocido en el estado de la técnica. Detection of mutations in the genes of Table 1 can be carried out by any means known in the state of the art.

Preferiblemente se lleva a cabo mediante tecnologías de secuenciación de próxima generación o “next-generation sequencing” (NGS). Más preferiblemente la tecnología NGS utilizada son sondas de enriquecimiento tipo Agilent SureSelect. Preferably it is carried out using next-generation sequencing (NGS) technologies. More preferably the NGS technology used is Agilent SureSelect type enrichment probes.

El método de la presente invención se puede aplicar con muestras de individuos de cualquier sexo, es decir, hombres o mujeres, y a cualquier edad. Preferiblemente se aplica a muestras obtenidas de mujeres. The method of the present invention can be applied with samples from individuals of any sex, that is, men or women, and at any age. Preferably applied to samples obtained from women.

En la presente invención se entiende por "pronóstico" la evolución esperada de una enfermedad y se refiere a la valoración de la probabilidad según la cual un sujeto padece una enfermedad, así como a la valoración de su inicio, estado de desarrollo, evolución, o de su regresión, y/o el pronóstico del curso de la enfermedad en el futuro. Como entenderán los expertos en la materia, tal valoración, aunque se prefiere que sea, normalmente puede no ser correcta para el 100% de los sujetos que se van a diagnosticar. El término, sin embargo, requiere que una parte estadísticamente significativa de los sujetos se pueda identificar como que padecen la enfermedad o que tienen predisposición a la misma. Si una parte es estadísticamente significativa se puede determinar sin más por el experto en la materia usando varias herramientas de evaluación estadística bien conocidas, por ejemplo, determinación de intervalos de confianza, determinación de valores p, prueba de la t de Student, prueba de Mann-Whitney, etc. Los intervalos de confianza preferidos son al menos el 50%, al menos el 60%, al menos el 70%, al menos el 80%, al menos el 90%, al menos el 95%. Los valores de p son, preferiblemente, 0,2, 0,1, 0,05. A su vez, atendiendo al método de la presente invención, se podrían establecer otras subclasificaciones dentro de esta principal, facilitando, por tanto, la elección y el establecimiento de regímenes terapéuticos o tratamiento adecuados. Esta discriminación tal y como es entendida por un experto en la materia no pretende ser correcta en un 100% de las muestras analizadas. Sin embargo, requiere que una cantidad estadísticamente significativa de las muestras analizadas sean clasificadas correctamente. La cantidad que es estadísticamente significativa puede ser establecida por un experto en la materia mediante el uso de diferentes herramientas estadísticas, por ejemplo, pero sin limitarse, mediante la determinación de intervalos de confianza, determinación del valor significación P, test de Student o funciones discriminantes de Fisher, medidas no paramétricas de Mann Whitney, correlación de Spearman, regresión logística, regresión lineal, área bajo la curva de ROC (AUC). Preferiblemente, los intervalos de confianza son al menos del 90%, al menos del 95%, al menos del 97%, al menos del 98% o al menos del 99%. Preferiblemente, el valor de p es menor de 0,1, de 0,05, de 0,01, de 0,005 o de 0,0001. Preferiblemente, la presente invención permite detectar correctamente la enfermedad de forma diferencial en al menos el 60%, más preferiblemente en al menos el 70%, mucho más preferiblemente en al menos el 80%, o aún mucho más preferiblemente en al menos el 90% de los sujetos de un determinado grupo o población analizada. In the present invention, "prognosis" is understood as the expected evolution of a disease and refers to the assessment of the probability according to which a subject suffers from a disease, as well as the assessment of its onset, state of development, evolution, or of its regression, and/or the prognosis of the course of the disease in the future. As experts in the field will understand, such an assessment, although preferred, may not normally be correct for 100% of the subjects to be diagnosed. The term, however, requires that a statistically significant portion of subjects can be identified as suffering from the disease or having a predisposition to it. Whether a part is statistically significant can be determined simply by the person skilled in the art using various well-known statistical evaluation tools, for example, determination of confidence intervals, determination of p-values, Student's t test, Mann test -Whitney, etc. Preferred confidence intervals are at least 50%, at least 60%, at least 70%, at least 80%, at least 90%, at least 95%. The p values are preferably 0.2, 0.1, 0.05. In turn, taking into account the method of the present invention, other subclassifications could be established within this main one, facilitating, therefore, the choice and establishment of appropriate therapeutic regimens or treatment. This discrimination, as understood by an expert in the field, is not intended to be correct in 100% of the samples analyzed. However, it requires that a statistically significant number of the analyzed samples be correctly classified. The amount that is statistically significant can be established by a person skilled in the art through the use of different statistical tools, for example, but not limited to, by determining confidence intervals, determining the significance P value, Student's test or discriminant functions. Fisher, non-parametric Mann Whitney measurements, Spearman correlation, logistic regression, linear regression, area under the ROC curve (AUC). Preferably, the confidence intervals are at least 90%, at least 95%, at least 97%, at least 98% or at least 99%. Preferably, the p value is less than 0.1, 0.05, 0.01, 0.005 or 0.0001. Preferably, the present invention allows the disease to be correctly detected differentially by at least 60%, more preferably by at least 70%, much more preferably by at least 80%, or even much more preferably by at least 90%. of the subjects of a certain group or population analyzed.

Kit y usos Kit and uses

Otro aspecto de la invención se refiere a un kit o dispositivo, de ahora en adelante kit o dispositivo de la invención, que comprende los elementos necesarios para detectar mutaciones en los genes de la Tabla 1 simultáneamente. Another aspect of the invention relates to a kit or device, hereinafter kit or device of the invention, which comprises the elements necessary to detect mutations in the genes of Table 1 simultaneously.

Automatización del método de la invención implementándolo en un programa de ordenador Automation of the method of the invention by implementing it in a computer program

Otro aspecto de la invención se refiere a un programa de ordenador que comprende instrucciones para realizar el procedimiento de acuerdo con cualquiera de los métodos de la invención. Another aspect of the invention relates to a computer program comprising instructions for carrying out the procedure according to any of the methods of the invention.

En particular, la invención abarca programas de ordenador dispuestos sobre o dentro de una portadora. La portadora puede ser cualquier entidad o dispositivo capaz de soportar el programa. Como variante, la portadora podría ser un circuito integrado en el que va incluido el programa y que se haya adaptado para ejecutar, o para ser utilizado en la ejecución de los procesos correspondientes. In particular, the invention encompasses computer programs arranged on or in a carrier. The carrier can be any entity or device capable of supporting the program. As a variant, the carrier could be an integrated circuit in which the program is included and which has been adapted to execute, or to be used in the execution of, the corresponding processes.

Por ejemplo, los programas podrían estar incorporados en un medio de almacenamiento, como una memoria ROM, una memoria CD ROM o una memoria ROM de semiconductor, una memoria USB, o un soporte de grabación magnética, por ejemplo, un disco flexible o un disco duro. Alternativamente, los programas podrían estar soportados en una señal portadora transmisible; por ejemplo, podría tratarse de una señal eléctrica u óptica que podría transportarse a través de cable eléctrico u óptico, por radio o por cualesquiera otros medios. For example, the programs could be embedded in a storage medium, such as a ROM memory, a CD ROM memory or a semiconductor ROM memory, a USB memory, or a magnetic recording medium, for example, a floppy disk or a disk. hard. Alternatively, the programs could be supported on a transmissible carrier signal; For example, it could be an electrical or optical signal that could be transported via electrical or optical cable, by radio or by any other means.

La invención se extiende también a programas de ordenador adaptados para que cualquier medio de procesamiento pueda llevar a la práctica los métodos de la invención. Los programas de ordenador también abarcan aplicaciones en la nube basadas en dicho procedimiento. The invention also extends to computer programs adapted so that any processing means can implement the methods of the invention. Computer programs also include cloud applications based on this procedure.

Otros aspectos de la invención se refieren al medio de almacenamiento legible y a la señal transmisible que comprende instrucciones de programa necesarias para la ejecución del método de invención por un ordenador. Other aspects of the invention relate to the readable storage medium and the transmissible signal comprising program instructions necessary for the execution of the inventive method by a computer.

A lo largo de la descripción y las reivindicaciones la palabra "comprende" y sus variantes no pretenden excluir otras características técnicas, aditivos, componentes o pasos. Para los expertos en la materia, otros objetos, ventajas y características de la invención se desprenderán en parte de la descripción y en parte de la práctica de la invención. Los siguientes ejemplos y dibujos se proporcionan a modo de ilustración, y no se pretende que sean limitativos de la presente invención. Throughout the description and claims the word "comprises" and its variants are not intended to exclude other technical characteristics, additives, components or steps. For those skilled in the art, other objects, advantages and features of the invention will emerge partly from the description and partly from the practice of the invention. The following examples and drawings are provided by way of illustration, and are not intended to be limiting of the present invention.

DESCRIPCIÓN DE LAS FIGURAS DESCRIPTION OF THE FIGURES

Figura 1. Mutaciones encontradas en las muestras de plasma de pacientes con cáncer de mama localizado. A: mutaciones identificadas en las muestras de plasma tanto en los subestudios informado y no informado por la genética del tumor. B: características clínicopatológicas de los pacientes mostrando el estado clínico actual (recaída clínica). Figure 1. Mutations found in plasma samples from patients with localized breast cancer. A: Mutations identified in plasma samples in both the tumor genetics-informed and non-informed substudies. B: clinicopathological characteristics of the patients showing the current clinical status (clinical relapse).

Figura 2. Mutaciones identificadas en la secuenciación del ADN tumoral de las muestras incluidas en el estudio. Oncoplot. A: mutaciones observadas en las muestras tumorales indicando si se encontraron en plasma. B: características clínico-patológicas del paciente. Figure 2. Mutations identified in the tumor DNA sequencing of the samples included in the study. Oncoplot. A: mutations observed in tumor samples indicating whether they were found in plasma. B: clinicopathological characteristics of the patient.

EJEMPLOS DE LA INVENCIÓN EXAMPLES OF THE INVENTION

Ejemplo 1: Optimización y validación del panel de genes de la Tabla 1 Example 1: Optimization and validation of the gene panel in Table 1

El panel de 37 genes implicados en cáncer de mama de la Tabla 1 fue evaluado generando librerías de secuenciación con el ADN obtenido de 4 tumores de mama y comparando los resultados con otro panel, que emplea una tecnología diferente. The panel of 37 genes involved in breast cancer in Table 1 was evaluated by generating sequencing libraries with the DNA obtained from 4 breast tumors and comparing the results with another panel, which uses a different technology.

Se utilizó para su secuenciación tecnologías ultrasensibles de última generación (NGS - next generation sequencing), en concreto SureSelect XT HS. Se comprobó que la cobertura de las zonas genómicas fue correcta y se detectaron mutaciones conocidas en estos tumores, que habían sido secuenciados previamente con otra tecnología, llamada TruSeq de Illumina. Next generation ultrasensitive technologies (NGS - next generation sequencing) were used for sequencing, specifically SureSelect XT HS. It was verified that the coverage of the genomic areas was correct and known mutations were detected in these tumors, which had been previously sequenced with another technology, called TruSeq from Illumina.

Tabla 3: Mutaciones observadas en los cuatro tumores testados usando el panel personalizado de 37 genes (Sure Select XT HS) y un panel validado que emplea una tecnología y set de genes diferente (Illumina sequencing Truseq), en concretoTP53, CDH1yPIK3CA.Table 3: Mutations observed in the four tumors tested using the custom panel of 37 genes (Sure Select

ND, No detectado; NT, No testado, el panel no incluye el gen, VAF-Variant alíele frequencyfrecuencia alélica de una variante. ND, Not detected; NT, Not tested, the panel does not include the gene, VAF-Variant allelic frequency of a variant.

Comparando las mutaciones encontradas usando ambos paneles en los 4 tumores de prueba, se observaron frecuencias alélicas totalmente comparables para las mutaciones que fueron detectadas por ambos paneles, validando, por lo tanto, el panel de la invención. Comparing the mutations found using both panels in the 4 test tumors, completely comparable allelic frequencies were observed for the mutations that were detected by both panels, therefore validating the panel of the invention.

Además, se detectó una mutación con baja frecuencia alélica y patogénica en el genCDH1que no fue detectada en la secuenciación previa. In addition, a mutation with low allelic and pathogenic frequency was detected in the CDH1 gene that was not detected in the previous sequencing.

Hay que destacar que usando el panel de la invención se detectaron nuevas mutaciones debido a que este panel incluye la secuenciación de muchos más genes. It should be noted that using the panel of the invention new mutations were detected because this panel includes the sequencing of many more genes.

Ejemplo 2: Sensibilidad del panel de genes de la Tabla 1 para su uso como biomarcadores de cáncer de mama en biopsia líquida. Example 2: Sensitivity of the gene panel in Table 1 for use as breast cancer biomarkers in liquid biopsy.

Diseño del estudio y población de pacientes Study design and patient population

El estudio incluyó a 29 pacientes con hallazgos de mamografía BI-RADS 4C/5 y posterior diagnóstico de cáncer de mama primario en el Hospital Virgen de la Victoria de Málaga y el Hospital Clínico Universitario de Valencia. Estos pacientes fueron los mismos que los objeto de estudio en Jimenez Rodriguez, B. et al en“Detection of TP53 and PIK3CA Mutations inCirculating Tumor DNA Using Next-Generation Sequencing in the Screening Process for Early Breast Cancer Diagnosis”(5) The study included 29 patients with BI-RADS 4C/5 mammography findings and subsequent diagnosis of primary breast cancer at the Virgen de la Victoria Hospital in Malaga and the University Clinical Hospital in Valencia. These patients were the same as those studied in Jimenez Rodriguez, B. et al in “Detection of TP53 and PIK3CA Mutations inCirculating Tumor DNA Using Next-Generation Sequencing in the Screening Process for Early Breast Cancer Diagnosis”(5)

Las muestras de sangre se recolectaron inmediatamente (menos de una hora) antes de la biopsia de tejido y antes de recibir cualquier tipo de tratamiento. Los tejidos tumorales coincidentes se recogieron a través de biopsias con aguja gruesa de tumores de mama, que posteriormente se congelaron en fresco. Blood samples were collected immediately (less than one hour) before tissue biopsy and before receiving any type of treatment. Matching tumor tissues were collected through core needle biopsies of breast tumors, which were subsequently fresh frozen.

Se realizó un análisis inmunohistoquímico (IHC) para cuantificar la expresión del receptor 2 del factor de crecimiento epidérmico humano (HER2), los receptores hormonales (HR) y Ki67. Immunohistochemical (IHC) analysis was performed to quantify the expression of human epidermal growth factor receptor 2 (HER2), hormone receptors (HR), and Ki67.

El receptor de estrógeno (ER) y el receptor de progesterona (PR) se consideraron positivos si los tumores tenían más del 1 % de células con tinción nuclear. Estrogen receptor (ER) and progesterone receptor (PR) were considered positive if tumors had more than 1% cells with nuclear staining.

La tinción de HER2 se calificó en una escala de 0 a 3+, de acuerdo con las pautas de HercepTest. El estado de HER2 se consideró positivo cuando se calificó como 3+, mientras que 0 a 1+ fue negativo y 2+ fue un resultado no concluyente y en esos casos se realizó hibridaciónin situcon plata (SISH) para confirmar la positividad. HER2 staining was graded on a scale of 0 to 3+, according to HercepTest guidelines. HER2 status was considered positive when it was scored as 3+, while 0 to 1+ was negative and 2+ was an inconclusive result and in those cases silver in situ hybridization (SISH) was performed to confirm positivity.

El tumor con receptores hormonales positivos más un índice Ki 67 de <14 % se consideró un tumor luminal A, mientras que >14 % se consideró un tumor luminal B. Hormone receptor-positive tumor plus a Ki 67 index of <14% was considered a luminal A tumor, while >14% was considered a luminal B tumor.

Los subtipos de cáncer de mama IHC se definieron mediante una combinación de estos marcadores IHC de la siguiente manera: luminal A (PR positivo, HER2 negativo y Ki-67 < 14 %), luminal B (ER positivo y/o PR positivo, HER2 negativo y Ki-67 > 14 %), HER2 positivo (ER negativo, PR negativo, HER2 positivo) y triple negativo (ER, PR y HER2 negativo). IHC breast cancer subtypes were defined by a combination of these IHC markers as follows: luminal A (PR positive, HER2 negative and Ki-67 < 14%), luminal B (ER positive and/or PR positive, HER2 negative and Ki-67 > 14%), HER2 positive (ER negative, PR negative, HER2 positive) and triple negative (ER, PR and HER2 negative).

El estudio fue aprobado por los comités de ética de investigación del Hospital Virgen de la Victoria y del Hospital Clínico de Valencia, todos los pacientes dieron su consentimiento informado por escrito. La investigación se llevó a cabo de acuerdo con las Buenas Prácticas Clínicas y la Declaración de Helsinki. The study was approved by the research ethics committees of the Hospital Virgen de la Victoria and the Hospital Clínico de Valencia; all patients gave their written informed consent. The research was carried out in accordance with Good Clinical Practice and the Declaration of Helsinki.

Las características clínico-patológicas de los tumores de las pacientes con cáncer de mama inscritas se muestran en la Tabla 4. La edad promedio de las pacientes fue de 64 años (rango 44-92 años). Los 29 tumores de mama primarios examinados incluyeron 24 carcinoma ductal invasivo (CDI) (82,7 %), dos carcinomas lobulares invasivos (CLI) (6,9 %), dos carcinomas papilares (6,9 %) y un carcinoma tubular (3,4 %). catorce tumores presentaron diámetros menores a 2 cm (48,3%), mientras que 15 presentaron diámetros mayores a 2 cm (51,7%). Se detectó metástasis en los ganglios linfáticos axilares mediante biopsia con aguja gruesa en nueve pacientes (31,0 %). The clinicopathological characteristics of the tumors of the enrolled breast cancer patients are shown in Table 4. The average age of the patients was 64 years (range 44-92 years). The 29 primary breast tumors examined included 24 invasive ductal carcinomas (IDC) (82.7%), two invasive lobular carcinomas (ILC) (6.9%), two papillary carcinomas (6.9%), and one tubular carcinoma ( 3.4%). Fourteen tumors had diameters less than 2 cm (48.3%), while 15 had diameters greater than 2 cm (51.7%). Axillary lymph node metastasis was detected by core needle biopsy in nine patients (31.0%).

Diez pacientes sin metástasis en los ganglios linfáticos tenían tumores con diámetros de más de 2 cm (34,5%). Se utilizó inmunohistoquímica para determinar los subtipos de tumores IHC de la siguiente manera, 14 tumores luminales A (48,3 %), 11 tumores luminales B (37,9 %), tres tumores triple negativos (10,3 %) y uno tumor HER2 positivo (3,4 %). Con respecto al estado de los receptores hormonales, 25 de 29 pacientes con BC tenían receptores de estrógeno (ER) positivos (86,2 %) y 17 de 29 pacientes tenían receptores de progesterona (PR) negativos (58,6 %). Ten patients without lymph node metastases had tumors with diameters of more than 2 cm (34.5%). Immunohistochemistry was used to determine IHC tumor subtypes as follows, 14 luminal A tumors (48.3%), 11 luminal B tumors (37.9%), three triple-negative tumors (10.3%), and one tumor HER2 positive (3.4%). Regarding hormone receptor status, 25 of 29 BC patients were estrogen receptor (ER) positive (86.2%) and 17 of 29 patients were progesterone receptor (PR) negative (58.6%).

En cuanto al grado tumoral, la mayoría de los pacientes presentaron tumores de grado 2 (16 pacientes, 55%) mientras que siete pacientes tenían tumores de grado 3 (24,5%) y cinco pacientes tenían tumores de grado 1 (17%). Se desconocía el grado tumoral en un paciente (3,5%). Regarding tumor grade, the majority of patients had grade 2 tumors (16 patients, 55%) while seven patients had grade 3 tumors (24.5%) and five patients had grade 1 tumors (17%). . The tumor grade was unknown in one patient (3.5%).

Tabla 4: Características clínico-patológicas de los pacientes. Table 4: Clinicopathological characteristics of the patients.

CDI: Carcinoma ductal invasivo; CLI: carcinoma lobulillar invasivo; HER2: receptor 2 del factor de crecimiento epidérmico humano; IHC: Inmunohistoquímica; BIRADS: Sistema de datos e informes de imágenes mamarias. CDI: Invasive ductal carcinoma; ILC: invasive lobular carcinoma; HER2: human epidermal growth factor receptor 2; IHC: Immunohistochemistry; BIRADS: Breast Imaging Data and Reporting System.

Extracción de ADN Extraction of DNA

El ADN tumoral se aisló de muestras de tejido fresco congelado utilizando el kit de sangre y tejido DNeasy (Qiagen, Valencia, CA, EE. UU.) siguiendo las instrucciones del fabricante. Tumor DNA was isolated from fresh frozen tissue samples using the DNeasy blood and tissue kit (Qiagen, Valencia, CA, USA) following the manufacturer's instructions.

Las muestras de ADN plasmático se recogieron a partir de muestras de plasma sanguíneo de 10 ml en tubos STRECK inmediatamente antes de la biopsia de tejido. Dentro de las 2h posteriores a la recolección, el plasma se separó de las muestras de sangre completa mediante centrifugación durante 10 min a 3000 rpm a temperatura ambiente y se almacenó a -80°C hasta su uso posterior. Las muestras de plasma se descongelaron y se centrifugaron nuevamente durante 10 minutos a 13.000 rpm a temperatura ambiente antes de la extracción de ADN para eliminar los desechos. El aislamiento de ADN de 2 ml de plasma se realizó con el kit de ácido nucleico circulante QlAamp (Qiagen) de acuerdo con las instrucciones del fabricante y se eluyó en 140 ^L de tampón AVE (Qiagen). La cantidad total de ADN genómico humano amplificable aislado de muestras de plasma se cuantificó utilizando una versión modificada del ensayo de PCR en tiempo real del elemento 1 intercalado largo humano (LINE-1) y se notificó como equivalentes del genoma (GE). Plasma DNA samples were collected from 10 ml blood plasma samples in STRECK tubes immediately before tissue biopsy. Within 2 h of collection, plasma was separated from whole blood samples by centrifugation for 10 min at 3000 rpm at room temperature and stored at −80°C until further use. Plasma samples were thawed and centrifuged again for 10 minutes at 13,000 rpm at room temperature before DNA extraction to remove debris. DNA isolation from 2 ml of plasma was performed with the QlAamp circulating nucleic acid kit (Qiagen) according to the manufacturer's instructions and eluted in 140 ^L AVE buffer (Qiagen). The total amount of amplifiable human genomic DNA isolated from plasma samples was quantified using a modified version of the human long interspersed element 1 (LINE-1) real-time PCR assay and reported as genome equivalents (GE).

Secuenciación dirigida en muestras de tejido y del ADN plasmático Targeted sequencing in tissue and plasma DNA samples

El estudio NGS (next generation sequencing) de las muestras se realizó con un diseño personalizado de última generación (NGS - next generation sequencing), en concreto SureSelectXT HS) para los 37 genes de la Tabla 1. The NGS (next generation sequencing) study of the samples was carried out with a personalized next generation sequencing design (NGS - next generation sequencing, specifically SureSelectXT HS) for the 37 genes in Table 1.

La preparación de la librería de secuenciación y el procesamiento de datos de secuenciación se llevo a cabo siguiendo la metodología que se describe en los respectivos epígrafes del ejemplo 3. The preparation of the sequencing library and the processing of sequencing data was carried out following the methodology described in the respective sections of example 3.

Análisis estadístico Statistic analysis

El análisis estadístico se realizó con SPSS (19.0, SPSS Inc., Chicago, IL, EE. UU.). Para los análisis de asociación entre variables clínico-patológicas y mutaciones derivadas de los genes de la Tabla 1 en sangre, se utilizaron la correlación de Spearmen y la prueba exacta de Fisher (para variables categóricas). El umbral de significación estadística se fijó en p < 0,05. Statistical analysis was performed with SPSS (19.0, SPSS Inc., Chicago, IL, USA). For association analyzes between clinicopathological variables and mutations derived from the genes in Table 1 in blood, Spearmen's correlation and Fisher's exact test (for categorical variables) were used. The threshold for statistical significance was set at p < 0.05.

Los resultados usando el panel de 37 genes tanto para biopsias tumorales como para muestras de plasma se muestran en la Tabla 5. Se presenta a su vez una comparativa con los resultados obtenidos para estos mismos 29 pacientes incluidos en el artículo de Jimenez Rodriguez, B. et al“Detection of TP53 and PIK3CA Mutations in Circulating Tumor DNA Using Next-Generation Sequencing in the Screening Process for Early Breast Cáncer DiagnosisJ. Clin Med. 2019 (5), donde se utilizó otra técnica de NGS, Plasma SafeSEQ (Sysmex Inostics S.A.). The results using the 37-gene panel for both tumor biopsies and plasma samples are shown in Table 5. A comparison is also presented with the results obtained for these same 29 patients included in the article by Jimenez Rodriguez, B. et al“Detection of TP53 and PIK3CA Mutations in Circulating Tumor DNA Using Next-Generation Sequencing in the Screening Process for Early Breast Cancer DiagnosisJ. Clin Med. 2019 (5), where another NGS technique was used, Plasma SafeSEQ (Sysmex Inostics S.A.).

Tabla 5: Resultados comparativos de las mutaciones detectadas en biopsia tumoral y en muestras de plasma utilizando el panel de genes de la Tabla 1; y comparación con las mutaciones en plasma localizadas por otros métodos del estado de la técnica. Table 5: Comparative results of the mutations detected in tumor biopsy and in plasma samples using the gene panel in Table 1; and comparison with plasma mutations located by other state-of-the-art methods.

La columna "VAF (%)” expresa las frecuencias alélicas observadas usando el panel de la Tabla 1, tanto en tumor sólido como en plasma, donde se llega a detectar frecuencias alélicas de 0,1% en biopsias líquidas. The "VAF (%)" column expresses the allele frequencies observed using the panel of Table 1, both in solid tumor and in plasma, where allele frequencies of 0.1% are detected in liquid biopsies.

El método de la invención es capaz de detectar las variantes o mutaciones concordantes entre plasma y tumor que se describen la referencia 5. The method of the invention is capable of detecting the concordant variants or mutations between plasma and tumor that are described in reference 5.

Además, gracias al panel de genes de la Tabla 1, es posible detectar 7 variantes en 7 muestras de plasma diferentes, en los genesPIK3CAyTP53(que son los testados con ambos paneles) y que no se detectaban en la referencia 5. Se señalan estos resultados en negrita, indicándose SI en testado/ NO en detectado en plasma. Furthermore, thanks to the gene panel in Table 1, it is possible to detect 7 variants in 7 different plasma samples, in the PIK3CAyTP53 genes (which are the ones tested with both panels) and that were not detected in reference 5. These results are noted. in bold, indicating YES in tested/NO in detected in plasma.

Al incluir muchas más regiones genéticas en el panel de la Tabla 1, es posible detectar 3 mutaciones más en 3 muestras de plasma diferentes (015MS, 016MS, 044MS). By including many more genetic regions in the panel of Table 1, it is possible to detect 3 more mutations in 3 different plasma samples (015MS, 016MS, 044MS).

Ejemplo 3: Sensibilidad y capacidad de detección y capacidad de diagnóstico del panel de secuenciación personalizado. Example 3: Sensitivity and detection capacity and diagnostic capacity of the custom sequencing panel.

Para analizar la sensibilidad del panel de secuenciación de la invención se ha realizado una comparativa entre muestras de pacientes sanos (control) y pacientes que desarrollaron cáncer de mama. To analyze the sensitivity of the sequencing panel of the invention, a comparison was made between samples from healthy patients (control) and patients who developed breast cancer.

El estudio fue aprobado por el comité de ética local y se realizó de acuerdo con las directrices de Buenas Prácticas Clínicas y la Declaración de Helsinki. Se obtuvo el consentimiento informado de todas las mujeres que fueron reclutadas en el Hospital Virgen de la Victoria de Málaga y en el Hospital Clínico Universitario de Valencia antes de realizar cualquier evaluación requerida según el protocolo. The study was approved by the local ethics committee and was conducted in accordance with the Good Clinical Practice guidelines and the Declaration of Helsinki. Informed consent was obtained from all women who were recruited at the Virgen de la Victoria Hospital in Malaga and at the Hospital Clínico Universitario in Valencia before performing any assessment required according to the protocol.

Se han utilizado las siguientes muestras: The following samples have been used:

- 75 muestras de plasma de pacientes con cáncer de mama, de las que analizables fueron 74. Estas muestras se obtuvieron de pacientes con hallazgos de mamografía BIRADS 4C/5 justo antes de la biopsia de tejido, antes del diagnóstico y de ser sometidas a tratamiento para el cáncer. - 75 plasma samples from patients with breast cancer, of which 74 were analysable. These samples were obtained from patients with BIRADS 4C/5 mammography findings just before the tissue biopsy, before diagnosis and before undergoing treatment for cancer.

- 71 biopsias sólidas pre-tratamiento de los pacientes antes citados. - 71 pre-treatment solid biopsies from the aforementioned patients.

- 22 muestras de plasma de mujeres que fueron incluidas en el estudio por mostrar mamografía sospechosa pero que finalmente el diagnóstico fueron negativas para la presencia cáncer de mama, y que aquí servirán como control negativo. - 22 plasma samples from women who were included in the study because they showed suspicious mammography but whose diagnosis was ultimately negative for the presence of breast cancer, and who will serve here as a negative control.

Tabla 6: Características clínico-patológicas de las 74 pacientes de las que se extrajeron las muestras de plasma. Table 6: Clinicopathological characteristics of the 74 patients from whom plasma samples were extracted.

CDI: carcinoma ductal invasivo; CLI: carcinoma lobulillar invasivo; CDIS: carcinoma ductalin situ;CP: carcinoma papilar; TC: carcinoma tubular; MC: carcinoma mucinoso; HER2: receptor 2 del factor de crecimiento epidérmico humano; IHC: Inmunohistoquímica; BIRADS: Sistema de datos e informes de imágenes mamarias. CDI: invasive ductal carcinoma; ILC: invasive lobular carcinoma; DCIS: ductal carcinoma in situ; PC: papillary carcinoma; CT: tubular carcinoma; MC: mucinous carcinoma; HER2: human epidermal growth factor receptor 2; IHC: Immunohistochemistry; BIRADS: Breast Imaging Data and Reporting System.

Las biopsias tumorales se extrajeron utilizando agujas gruesas de biopsia y posteriormente se congelaron. Se realizó un análisis inmunohistoquímico para cuantificar la expresión del receptor 2 del factor de crecimiento epidérmico humano (HER2), los receptores hormonales (HR) y Ki67. El receptor de estrógeno (RE) y el receptor de progesterona (PR) se consideraron positivos en tumores que presentaban más del 1% de células teñidas con núcleo. La tinción de HER2 se calificó en una escala de 0 a 3+, de acuerdo con las pautas de HercepTest17. El estado de HER2 se consideró positivo cuando se calificó como 3+, mientras que 0 a 1+ fue negativo y 2+ fue un resultado no concluyente y en esos casos se realizó hibridaciónin situcon plata (SISH) para confirmar la positividad. El tumor con receptores hormonales positivos más un índice Ki67 de <14 % se consideró un tumor luminal A, mientras que >14 % se consideró un tumor luminal B. Los subtipos IHC BC se definieron mediante una combinación de marcadores inmunohistoquímicos de la siguiente manera: Luminal A (PR positivo, HER2 negativo y Ki67 < 14 %), luminal B (ER positivo y/o PR positivo, HER2 negativo y Ki67 > 14 %), HER2 positivo (ER positivo/negativo, PR Tumor biopsies were removed using thick biopsy needles and subsequently frozen. Immunohistochemical analysis was performed to quantify the expression of human epidermal growth factor receptor 2 (HER2), hormone receptors (HR), and Ki67. Estrogen receptor (ER) and progesterone receptor (PR) were considered positive in tumors that had more than 1% stained cells with nuclei. HER2 staining was graded on a scale of 0 to 3+, according to HercepTest guidelines17. HER2 status was considered positive when it was scored as 3+, while 0 to 1+ was negative and 2+ was an inconclusive result and in those cases silver in situ hybridization (SISH) was performed to confirm positivity. Hormone receptor-positive tumor plus a Ki67 index of <14% was considered a luminal A tumor, while >14% was considered a luminal B tumor. IHC BC subtypes were defined by a combination of immunohistochemical markers as follows: Luminal A (PR positive, HER2 negative and Ki67 < 14%), luminal B (ER positive and/or PR positive, HER2 negative and Ki67 > 14%), HER2 positive (ER positive/negative, PR

positivo/negativo, HER2 positivo) y triple negativo (ER, PR y HER2 negativo). positive/negative, HER2 positive) and triple negative (ER, PR and HER2 negative).

Procesamiento de muestras de sangre Processing of blood samples

Se obtuvieron 10 ml de plasma de cada individuo en tubos STRECK. Dentro de las 2 h posteriores a la recolección, el plasma se aisló de la sangre mediante centrifugación durante 10 min a 3000 rpm a temperatura ambiente y se almacenó a -80 °C hasta la extracción del ADN libre circulante (cfDNA). 10 ml of plasma was obtained from each individual in STRECK tubes. Within 2 h of collection, plasma was isolated from blood by centrifugation for 10 min at 3000 rpm at room temperature and stored at −80°C until extraction of circulating free DNA (cfDNA).

Extracción y cuantificación de ADN a partir de plasma y biopsias sólidas DNA extraction and quantification from plasma and solid biopsies

El cfDNA se extrajo de muestras de plasma utilizando el kit de ácido nucleico circulante QlAamp (Qiagen) de acuerdo con las instrucciones del fabricante. El ADN tumoral se aisló de muestras de tejido fresco congelado utilizando el kit de sangre y tejido DNeasy (Qiagen) siguiendo las instrucciones del fabricante. El cfDNA y el ADN de tumores sólidos se cuantificaron mediante PCR digital en gota (ddPCR) y el ensayo RNAseP (Life Technologies) como se indica en Garcia-Murillas I.etal.(9). cfDNA was extracted from plasma samples using the QlAamp circulating nucleic acid kit (Qiagen) according to the manufacturer's instructions. Tumor DNA was isolated from fresh frozen tissue samples using the DNeasy blood and tissue kit (Qiagen) following the manufacturer's instructions. cfDNA and solid tumor DNA were quantified by droplet digital PCR (ddPCR) and the RNAseP assay (Life Technologies) as indicated in Garcia-Murillas I.etal.(9).

Diseño del panel de secuenciación para cáncer de mama Design of the sequencing panel for breast cancer

El panel NGS personalizado para cáncer de mama se diseñó utilizando el software SureDesign (Agilent) con la siguiente configuración: 5x para“tiling”,menos estricto para enmascarar, XTHSBoosting para potenciar y un valor de 30 para extensión en repeticiones. The custom NGS panel for breast cancer was designed using SureDesign software (Agilent) with the following settings: 5x for tiling, less stringent for masking, XTHSBoosting for boosting, and a value of 30 for extension in repeats.

El panel incluyó las regiones codificantes de la lista de genes en la Tabla 1. The panel included the coding regions from the list of genes in Table 1.

Preparación de la librería de secuenciación Preparation of the sequencing library

Se empleó la metodología SureSelectXTHS (Agilent) para generar librerías de secuenciación. Se realizaron librerías utilizando una mediana de entrada de ADN plasmático de 39,78 ng (máx. 173,91 ng - mín. 5,01 ng) de pacientes con cáncer de mama y 21,78 ng (máx. 113,52 ng - mín. 1,71 ng) de individuos sanos y una mediana de ADN tisularde 199,5 ng (máx. 200 ng - mín. 6,95 ng) de tumores. El ADN del tejido se fragmentó con el kit de fragmentación enzimática SureSelect (Agilent) y las librerías se prepararon con los kits del sistema de enriquecimiento de diana SureSelectXT (Agilent) siguiendo las indicaciones del fabricante. Todos los pasos de la PCR se llevaron a cabo en el Termociclador C1000 Touch (Bio-Rad). The SureSelectXTHS methodology (Agilent) was used to generate sequencing libraries. Libraries were made using a median plasma DNA input of 39.78 ng (max 173.91 ng - min 5.01 ng) from breast cancer patients and 21.78 ng (max 113.52 ng - min. 1.71 ng) from healthy individuals and a median tissue DNA of 199.5 ng (max. 200 ng - min. 6.95 ng) from tumors. Tissue DNA was fragmented using the SureSelect Enzymatic Fragmentation Kit (Agilent) and libraries were prepared using the SureSelectXT Target Enrichment System Kits (Agilent) following the manufacturer's instructions. All PCR steps were carried out in the C1000 Touch Thermocycler (Bio-Rad).

Los intervalos de fragmentos de las librerías se analizaron con chips de ADN de alta sensibilidad Bioanalyzer (Agilent) y se cuantificaron con el KAPA Library Quantification Kit (Roche). Para la secuenciación del ADN del tejido tumoral, se prepararon y secuenciaron 8 grupos que contenían de 8 a 9 muestras de librería por grupo. Para el ADN de plasma de pacientes con cáncer de mama, también se prepararon y secuenciaron 8 grupos que contenían de 9 a 10 muestras de librería por grupo y 3 grupos que contenían de 7 a 8 muestras de librería por grupo de ADN de plasma de controles sanos. Se emplearon 19 carriles (1 carril por grupo) para secuenciar las librerías con el objetivo de obtener una secuenciación ultra profunda de alrededor de 20,000X antes de la de-duplicación en la plataforma DNBseq-G400 (MGI) en 100 lecturas pareadas siguiendo las instrucciones del fabricante para la secuenciación de códigos de barras moleculares, también llamados identificadores moleculares únicos (UMI). Fragment ranges from the libraries were analyzed with Bioanalyzer high-sensitivity DNA chips (Agilent) and quantified with the KAPA Library Quantification Kit (Roche). For DNA sequencing of tumor tissue, 8 pools containing 8 to 9 library samples per pool were prepared and sequenced. For plasma DNA from breast cancer patients, 8 pools containing 9 to 10 library samples per pool and 3 pools containing 7 to 8 library samples per pool of plasma DNA from controls were also prepared and sequenced. healthy. 19 lanes (1 lane per group) were used to sequence the libraries with the objective of obtaining ultra-deep sequencing of around 20,000X before de-duplication on the DNBseq-G400 (MGI) platform in 100 paired reads following the instructions from the manufacturer for sequencing molecular barcodes, also called unique molecular identifiers (UMI).

Procesamiento de datos de secuenciación Sequencing data processing

Se creó un método personalizado para el procesamiento de los datos de secuenciación de SureSelectXTHS (Agilent). Inicialmente se realizó el control de calidad de los datos de secuenciación utilizando fastQC v0.11.9. A continuación, se recortaron las lecturas de los adaptadores y el filtrado de calidad mediante trim-galore v0.6.7. Para realizar los pasos de procesamiento que involucran datos con código de barras, se uso un subconjunto de herramientas fgbio v1.5.1. Se asignaron los datos al genoma de referencia GRCh38 utilizando bwa v0.7.17. Luego se usó fgbio GroupReadsByUmi para agrupar por código de barras usando la opción Identidad para tener en cuenta que los códigos de barras SureselectXT-HS están degenerados. A continuación, se generaron lecturas de consenso mediante fgbio CallMolecularConsensusReads. Las lecturas de consenso generadas se mapearon nuevamente con bwa v0.7.17. Luego, se filtraron estas lecturas de consenso alineadas usando fgbio FilterConsensusReads requiriendo una calidad de base mínima de 30 y manteniendo las lecturas de consenso respaldadas por al menos un número mínimo de lecturas. Entonces, se uso fgbio ClipBam para eliminar las regiones superpuestas de lecturas hacia adelante y hacia atrás. A custom method was created for processing SureSelectXTHS (Agilent) sequencing data. Quality control of sequencing data was initially performed using fastQC v0.11.9. Adapter reads were then trimmed and quality filtered using trim-galore v0.6.7. To perform the processing steps involving barcoded data, a subset of fgbio v1.5.1 tools was used. Data were mapped to the GRCh38 reference genome using bwa v0.7.17. fgbio GroupReadsByUmi was then used to group by barcode using the Identity option to account for SureselectXT-HS barcodes being degenerate. Consensus reads were then generated using fgbio CallMolecularConsensusReads. The generated consensus reads were mapped again with bwa v0.7.17. These aligned consensus reads were then filtered using fgbio FilterConsensusReads by requiring a minimum base quality of 30 and keeping the consensus reads supported by at least a minimum number of reads. Then, fgbio ClipBam was used to remove overlapping regions of forward and reverse reads.

Finalmente, se llevó a cabo la identificación de variantes con MuTect2 (gatk v4.2.2.0-1), incluido un panel de ADN no tumoral y un archivo de anotación de variantes de línea germinal para el genoma GRCh38, obtenido del paquete de recursos gatk, que se utiliza para anotar variantes para filtrar y solo considerar las regiones incluidas en el panel SureSelect. Se anotaron las variantes con ANNOVA v20200608 con información acerca de su presencia en las bases de datos públicas COSMIC versión 95 y "The Cancer Genome Atlas” (TCGA). Finally, variant identification was carried out with MuTect2 (gatk v4.2.2.0-1), including a non-tumor DNA panel and a germline variant annotation file for the GRCh38 genome, obtained from the resource package gatk, which is used to annotate variants to filter and only consider regions included in the SureSelect panel. Variants were annotated with ANNOVA v20200608 with information about their presence in the public databases COSMIC version 95 and “The Cancer Genome Atlas” (TCGA).

Filtración y análisis de variantes Variant filtering and analysis

Para el tumor, se utilizó un enfoque más estricto con el fin de generar una referencia sólida para comparar con los hallazgos de ctDNA. Se generaron lecturas de consenso que requirieron un mínimo de 3 lecturas por familia de código de barra molecular. Se aceptaron como llamadas válidas solo variantes con VAF > 0,05 que también estaban presentes en COSMIC o TCGA (aumentando el umbral de VAF a VAF > 0,2 para tejidos embebidos en parafina fijados con formalina (FFPE)). For tumor, a more stringent approach was used in order to generate a robust reference for comparison with ctDNA findings. Consensus reads were generated that required a minimum of 3 reads per molecular barcode family. Only variants with VAF > 0.05 that were also present in COSMIC or TCGA (increasing the VAF threshold to VAF > 0.2 for formalin-fixed paraffin-embedded (FFPE) tissues) were accepted as valid calls.

En el caso de ctDNA, se identificaron mutaciones utilizando dos métodos: i) Estricto; usando el mismo enfoque que se describió anteriormente, pero filtrando para un mínimo de 1 lectura por código de barra molecular, sin aplicar un umbral de VAF. Para considerar las mutaciones no encontradas en el tumor como detectadas en el plasma, se requirió que tuvieran una configuración dúplex, con al menos dos fragmentos mapeados en diferentes coordenadas y que estuvieran presentes tanto en COSMIC como en TCGA-BC. Se aplicó el mismo enfoque de procesamiento a las muestras de control. ii) Exploratorio; visualización de las alineaciones en el navegador del genoma IGV (Robinson, Thorvaldsdottir, Wenger, Zehir y Mesirov, 2017) para identificar mutaciones encontradas en los tumores correspondientes pero que los códigos de barras moleculares automatizados no detectaron. Para estas mutaciones identificadas de manera manual, se contó el número de lecturas que portaban la mutación en dicha muestra y el número de lecturas que no portaban la mutación. Luego, se compararon con las mismas proporciones de lectura en controles y muestras de plasma de cáncer de mama sin la mutación correspondiente mediante una prueba de Fisher. In the case of ctDNA, mutations were identified using two methods: i) Strict; using the same approach as described above, but filtering for a minimum of 1 read per molecular barcode, without applying a VAF threshold. To consider mutations not found in the tumor as detected in plasma, they were required to have a duplex configuration, with at least two fragments mapped to different coordinates and to be present in both COSMIC and TCGA-BC. The same processing approach was applied to the control samples. ii) Exploratory; visualization of the alignments in the IGV Genome Browser (Robinson, Thorvaldsdottir, Wenger, Zehir, & Mesirov, 2017) to identify mutations found in the corresponding tumors but not detected by automated molecular barcoding. For these manually identified mutations, the number of reads that carried the mutation in that sample and the number of reads that did not carry the mutation were counted. They were then compared to the same readout ratios in controls and breast cancer plasma samples without the corresponding mutation using a Fisher test.

Análisis estadísticos y visualización de datos Statistical analysis and data visualization

Se realizó el análisis estadístico y los gráficos de los datos con R (https://www.R-project.org/) Se aplicó la prueba exacta de Fisher o la prueba de Chi-cuadrado cuando fue apropiado, tanto para probar la asociación entre las variables clínico-patológicas y los datos de secuenciación de plasma como también en los análisis de datos de secuenciación. También se aplicó la prueba de Wilcoxon para probar las diferencias en la cobertura de secuenciación entre casos y controles. El umbral de significación estadística se estableció en p<0,05. Statistical analysis and graphing of the data were performed using R (https://www.R-project.org/). Fisher's exact test or Chi-square test was applied when appropriate, both to test the association. between clinicopathological variables and plasma sequencing data as well as in sequencing data analyses. The Wilcoxon test was also applied to test for differences in sequencing coverage between cases and controls. The statistical significance threshold was set at p<0.05.

Los valores de sensibilidad, especificidad y valor predictivo positivo (VPP) se calcularon utilizando el paquete caret v6.0.93. Se utilizó la función oncoplot del paquete maftools (Mayakonda, Lin, Assenov, Plass, & Koeffler, 2018) v2.12.0 para trazar mutaciones y datos clínico-patológicos. Sensitivity, specificity and positive predictive value (PPV) values were calculated using the caret v6.0.93 package. The oncoplot function of the maftools package (Mayakonda, Lin, Assenov, Plass, & Koeffler, 2018) v2.12.0 was used to plot mutations and clinicopathological data.

Resultados Results

En primer lugar, se secuenció el ADN del tumor utilizando la tecnología Agilent SureSelect XT HS, siguiendo las recomendaciones del protocolo, como se indicó anteriormente. La secuenciación del tumor se realizó con una mediana de cobertura de 15,483X. El procesamiento bioinformático posterior que utiliza códigos de barras moleculares para minimizar los errores de secuenciación proporcionó una cobertura mediana final de 1,698X. Entre las regiones capturadas, solo 3 presentaron menos de 100X en más del 10% de las bases secuenciadas. Además, todos los genes presentaron una cobertura homogénea en todas las muestras. A continuación, se realizó un filtrado personalizado utilizando información de bases de datos genómicas públicas para identificar mutaciones somáticas. First, tumor DNA was sequenced using Agilent SureSelect XT HS technology, following protocol recommendations, as noted above. Tumor sequencing was performed with a median coverage of 15.483X. Post-bioinformatic processing using molecular barcoding to minimize sequencing errors provided a final median coverage of 1.698X. Among the captured regions, only 3 presented less than 100X in more than 10% of the sequenced bases. Furthermore, all genes presented homogeneous coverage in all samples. Custom filtering was then performed using information from public genomic databases to identify somatic mutations.

Se identificaron 61 mutaciones en 40/71 (56,33%) de las muestras de tumores. Entre ellos, 33 se ubicaron en el genPIK3CA(54,09%), 12 enTP53(19,67%) y 4 enGATA3(6,55%) (Figura 2, Tabla 7), que representan los genes mutados con mayor frecuencia en nuestro conjunto de tumores 61 mutations were identified in 40/71 (56.33%) of the tumor samples. Among them, 33 were located in the PIK3CA gene (54.09%), 12 in TP53 (19.67%) and 4 in GATA3 (6.55%) (Figure 2, Table 7), which represent the most frequently mutated genes in our set of tumors

Para estudiar la relación entre las mutaciones observadas en los tumores y las detectadas también en el plasma, se aplicó el panel de secuenciación personalizado de la Tabla 1 junto con una secuenciación de alta profundidad con una mediana de cobertura de 17,704X utilizando el ADN plasmático de los pacientes correspondientes. En total se secuenciaron 74 muestras de plasma de los pacientes. Después del procesamiento de los códigos de barras moleculares, la cobertura mediana fue de 2,525X. Entre las regiones de genes secuenciados, 3 presentaron una cobertura baja y todos los genes mostraron una cobertura homogénea. Después de los análisis bioinformáticos utilizando el identificador de mutaciones establecido, se encontraron 13/61 (21,31%) mutaciones en plasma que también estaban presentes en los tumores correspondientes, 7 mutaciones en el genTP53(53,84%) y 3 enPIK3CA(27,27%) como los genes mutados con mayor frecuencia. To study the relationship between the mutations observed in tumors and those also detected in plasma, the custom sequencing panel in Table 1 was applied together with high-depth sequencing with a median coverage of 17,704X using plasma DNA from the corresponding patients. In total, 74 plasma samples from the patients were sequenced. After processing of the molecular barcodes, the median coverage was 2.525X. Among the sequenced gene regions, 3 showed low coverage and all genes showed homogeneous coverage. After bioinformatic analyzes using the established mutation identifier, 13/61 (21.31%) mutations were found in plasma that were also present in the corresponding tumors, 7 mutations in the TP53 gene (53.84%) and 3 in PIK3CA ( 27.27%) as the most frequently mutated genes.

Además, todas las mutaciones observadas en los tumores se inspeccionaron manualmente en los datos sin procesar de secuenciación de plasma. Los datos alineados se usaron para identificar lecturas de apoyo para los alelos alternativos usando el software IGV. Las mutaciones que se encontraron en al menos 2 lecturas con diferentes coordenadas genómicas pasaron al siguiente paso de análisis. Additionally, all mutations observed in the tumors were manually inspected in the raw plasma sequencing data. The aligned data were used to identify supporting reads for the alternative alleles using IGV software. Mutations that were found in at least 2 reads with different genomic coordinates were passed to the next step of analysis.

Para considerar las variantes como válidas, se aplicó una prueba exacta de Fisher utilizando datos de secuenciación de 22 controles sanos de plasma y pacientes que no portaban dicha mutación en sus tumores. En total, se rescataron 5 mutaciones de 4 pacientes diferentes de la secuenciación de plasma mediante inspección manual. Entre ellas, 3 mutaciones se localizaron en el genTP53y 2 enGATA3.Curiosamente, las 2 variantes estructurales enGATA3con estadísticas de secuenciación robustas se recuperaron mediante inspección manual. To consider the variants as valid, a Fisher's exact test was applied using sequencing data from 22 healthy plasma controls and patients who did not carry said mutation in their tumors. In total, 5 mutations from 4 different patients were rescued from plasma sequencing by manual inspection. Among them, 3 mutations were located in the TP53 gene and 2 in GATA3. Interestingly, the 2 structural variants in GATA3 with robust sequencing statistics were recovered by manual inspection.

Teniendo en cuenta el total de las variantes detectadas, 18 (13 5) en plasma y 61 en tumor, el 29,50% de las variantes encontradas en el tejido tumoral también se localizaron en las muestras de plasma. Por tanto, la sensibilidad de este método sería de alrededor de un 30%. Taking into account the total number of variants detected, 18 (13 5) in plasma and 61 in tumor, 29.50% of the variants found in the tumor tissue were also located in the plasma samples. Therefore, the sensitivity of this method would be around 30%.

Tabla 7: Mutaciones detectadas en muestras de tumor y plasma. Table 7: Mutations detected in tumor and plasma samples.

El método de la invención presenta una sensibilidad (30%) que supera con creces otros métodos conocidos hasta la fecha, sobre todo si lo comparamos con los dos principales estudios donde se han desarrollado tecnologías/metodologías en las que emplean paneles NGS (amplificación y captura) en el screening del cáncer de mama, esto es, como método diagnóstico. Por un lado, se han realizado estudios utilizando paneles PAN-cáncer como método de diagnóstico, donde se ha llegado a alcanzar una sensibilidad en cáncer de mama de un 33%, similar a la de la presente invención, pero para ello ha sido necesario incluir además otros analitos en circulación sanguínea, tales como proteínas, a modo de biomarcadores adicionales (7). The method of the invention has a sensitivity (30%) that far exceeds other methods known to date, especially if we compare it with the two main studies where technologies/methodologies have been developed that use NGS panels (magnification and capture). ) in breast cancer screening, that is, as a diagnostic method. On the one hand, studies have been carried out using PAN-cancer panels as a diagnostic method, where a sensitivity in breast cancer of 33% has been achieved, similar to that of the present invention, but for this it has been necessary to include also other analytes in blood circulation, such as proteins, as additional biomarkers (7).

Por otro lado, cuando se han empleado únicamente paneles paciente-específicos ultrasensibles y de amplificación, la sensibilidad obtenida ha sido solamente del 14,3%, siendo además necesaria la secuenciación previa del tumor para poder diseñarlos, lo cual no es necesario según el método de la presente invención. Cabe destacar que esta baja sensibilidad se da a pesar de que se utiliza una de las tecnologías más novedosas en el campo, Ampliseq HD (ThermoFisher). On the other hand, when only ultrasensitive and amplification patient-specific panels have been used, the sensitivity obtained has only been 14.3%, and prior sequencing of the tumor is also necessary to be able to design them, which is not necessary according to the method. of the present invention. It should be noted that this low sensitivity occurs despite the use of one of the newest technologies in the field, Ampliseq HD (ThermoFisher).

Por tanto, podemos concluir que es la selección especifica de los genes de la Tabla 1 la que permite obtener una método de diagnóstico de cáncer de mama que supera las limitaciones en cuanto a sensibilidad que presentaban las metodologías conocidas hasta la fecha, basadas también en paneles de secuenciación. Therefore, we can conclude that it is the specific selection of the genes in Table 1 that allows us to obtain a method for diagnosing breast cancer that overcomes the limitations in terms of sensitivity presented by the methodologies known to date, also based on panels. sequencing.

Ejemplo 4: Capacidad del panel de secuenciación de próxima generación (NGS) para detectar pacientes con cáncer de mama después de mamografías sospechosas usando biopsia líquida Example 4: Next Generation Sequencing (NGS) Panel Ability to Detect Breast Cancer Patients After Suspicious Mammograms Using Liquid Biopsy

Para investigar la capacidad del panel de secuenciación de próxima generación (NGS) para detectar de forma no invasiva cáncer de mama después de mamografías sospechosas se desarrolló un análisis bioinformático a partir de los datos obtenidos en las muestras del ejemplo 3. En esta ocasión el análisis está orientado a localizar todas las posibles mutaciones que se puedan presentar en plasma, a diferencia del ejemplo anterior donde se hace un análisis informado por la genética del tumor, es decir, donde únicamente se buscan en plasma las mutaciones que aparecen en el tumor. To investigate the ability of the next generation sequencing (NGS) panel to non-invasively detect breast cancer after suspicious mammograms, a bioinformatics analysis was developed from the data obtained in the samples of example 3. On this occasion the analysis It is aimed at locating all possible mutations that may occur in plasma, unlike the previous example where an analysis is carried out informed by the genetics of the tumor, that is, where only the mutations that appear in the tumor are searched in plasma.

Se empleó Mutect2 para detectar mutaciones en muestras de plasma usando 2 familias de códigos de barras moleculares y sin filtros en frecuencias alélicas variantes (VAF). Las variantes se consideraron asociadas al tumor si i) afectaban las regiones exónicas, ii) estaban anotadas en las bases de datos COSMIC, TCGA BC y TCGA que incluyen todos los tipos de cáncer, y si iii) presentaban lecturas alineadas en 2 o más coordenadas genómicas diferentes visualizadas manualmente utilizando el software IGV. Mutect2 was used to detect mutations in plasma samples using 2 families of molecular barcodes and without filters at variant allele frequencies (VAF). Variants were considered tumor-associated if i) they affected exonic regions, ii) were annotated in the COSMIC, TCGA BC, and TCGA databases that include all cancer types, and if iii) they presented reads aligned at 2 or more coordinates. different genomics manually visualized using the IGV software.

En total, 25/74 (33,78 %) de las pacientes presentaron mutaciones tumorales detectadas en plasma (Tabla 8, Figura 1), 16 de las mutaciones no se observaron en el análisis anterior informado por la genética del tumor. Los genes más frecuentemente afectados por las 25 mutaciones diferentes detectadas fueronTP53(14 mutaciones, 48,27%),PIK3CA(4 mutaciones, 13,79%) yGATA3(3 mutaciones, 10,34%). Además, se observaron mutaciones de ctDNA en 8 muestras de plasma en cuyas biopsias tumorales correspondientes no se detectaron mutaciones. Además, se observó una mutación en una muestra de plasma sin tejido tumoral disponible. In total, 25/74 (33.78%) patients had tumor mutations detected in plasma (Table 8, Figure 1), 16 of the mutations were not observed in the previous analysis reported by tumor genetics. The genes most frequently affected by the 25 different mutations detected were TP53 (14 mutations, 48.27%), PIK3CA (4 mutations, 13.79%) and GATA3 (3 mutations, 10.34%). Furthermore, ctDNA mutations were observed in 8 plasma samples in whose corresponding tumor biopsies no mutations were detected. Additionally, a mutation was observed in a plasma sample with no tumor tissue available.

Tabla 8: Resultados en muestras de plasma de 74 pacientes que han desarrollado cáncer de mama, utilizando el panel de genes de la Tabla 1. Table 8: Results in plasma samples from 74 patients who have developed breast cancer, using the gene panel in Table 1.

En total, se han encontrado mutaciones en 25 de las 74 muestras, lo que supone un 33.78% del total. In total, mutations have been found in 25 of the 74 samples, which represents 33.78% of the total.

En cuanto a los controles, se han localizado las siguientes mutaciones. Regarding the controls, the following mutations have been located.

Tabla 9: Resultados en muestras de plasma de 22 sujetos sanos, utilizando el panel de genes de la Tabla 1. Table 9: Results in plasma samples from 22 healthy subjects, using the gene panel in Table 1.

Únicamente se han encontrado mutaciones en 3 de las 22 muestras control analizadas, es decir en un 13.63% de las muestras. Se trata de una mutación del genMAP3K1(p.N1125D) descrito en la base de datos COSMIC en una muestra de tumor de cáncer de mama, una mutación en el genERBB2(p.V842I) que se ha observado con una frecuencia sustancialmente mayor en cánceres de colon y endometrio y otra mutación localizada en el genSMAD4(p.R361H) también frecuente en adenocarcinoma de colon; y por otro lado, que el método de la invención tiene una capacidad de detección de frecuencias alélicas de hasta 0,03%, lo cual iguala, cuando no supera, otros estudio previos anteriormente citados en los antecedentes de la invención. Mutations have only been found in 3 of the 22 control samples analyzed, that is, in 13.63% of the samples. This is a mutation of the MAP3K1(p.N1125D) gene described in the COSMIC database in a breast cancer tumor sample, a mutation in the ERBB2(p.V842I) gene that has been observed with a substantially higher frequency in cancers. colon and endometrium and another mutation located in the geneSMAD4(p.R361H) also common in colon adenocarcinoma; and on the other hand, that the method of the invention has a capacity to detect allele frequencies of up to 0.03%, which equals, if not exceeds, other previous studies previously cited in the background of the invention.

Con estos mismos datos se ha estudiado la capacidad de diagnóstico del panel de secuenciación de la Tabla 1 utilizando un análisis estadístico, en concreto: MedCalc Software Ltd. Diagnostic test evaluation calculator. https://www.medcalc.org/calc/diagnostic_test.php. With these same data, the diagnostic capacity of the sequencing panel in Table 1 has been studied using a statistical analysis, specifically: MedCalc Software Ltd. Diagnostic test evaluation calculator. https://www.medcalc.org/calc/diagnostic_test.php.

Los resultados de dicho análisis se muestran a continuación. The results of said analysis are shown below.

Tabla 10: Resultados. Table 10: Results.

(*) Valores dependientes de la prevalencia de la enfermedad. (*) Values dependent on the prevalence of the disease.

Sensibilidad: probabilidad de que el resultado de una prueba sea positivo cuando la enfermedad está presente (tasa de verdaderos positivos). Sensitivity: the probability that a test result will be positive when the disease is present (true positive rate).

Especificidad: probabilidad de que el resultado de una prueba sea negativo cuando la enfermedad no está presente (tasa de verdaderos negativos). Specificity: the probability that a test result will be negative when the disease is not present (true negative rate).

Razón de verosimilitud positiva: relación entre la probabilidad de un resultado positivo de la prueba dada la presencia de la enfermedad y la probabilidad de un resultado positivo de la prueba dada la ausencia de la enfermedad. Positive likelihood ratio: Ratio between the probability of a positive test result given the presence of the disease and the probability of a positive test result given the absence of the disease.

Razón de verosimilitud negativa: relación entre la probabilidad de un resultado negativo de la prueba dada la presencia de la enfermedad y la probabilidad de un resultado negativo de la prueba dada la ausencia de la enfermedad. Negative likelihood ratio: Ratio between the probability of a negative test result given the presence of the disease and the probability of a negative test result given the absence of the disease.

Valor predictivo positivo: probabilidad de que la enfermedad esté presente cuando la prueba es positiva. Positive predictive value: probability that the disease is present when the test is positive.

Valor predictivo negativo: probabilidad de que la enfermedad no esté presente cuando la prueba es negativa. Negative predictive value: probability that the disease is not present when the test is negative.

Precisión: probabilidad global de que un paciente esté correctamente clasificado. Precision: overall probability that a patient is correctly classified.

Tal y como se desprende de este análisis, el empleo del panel personalizado junto con una secuenciación ultra profunda y un análisis bioinformático personalizado no informado por el tumor condujo a una sensibilidad del 31,08 %, el método de la invención presenta una muy alta especificidad, de un 86,36% y un valor predictivo positivo de un 88,46%, por lo que, en caso de presentarse alguna mutación en alguno de los genes del panel de la tabla 1, existe una probabilidad de casi un 90% de presentar un cáncer de mama. As can be seen from this analysis, the use of the personalized panel together with ultra-deep sequencing and a personalized bioinformatic analysis not informed by the tumor led to a sensitivity of 31.08%, the method of the invention has a very high specificity , of 86.36% and a positive predictive value of 88.46%, so, if a mutation occurs in any of the genes in the panel in Table 1, there is a probability of almost 90% of present breast cancer.

Con todo esto podemos concluir que la presente invención aporta, gracias al panel de secuenciación seleccionado, una metodología que permite el diagnóstico de cáncer de mama, incluso a partir de biopsias líquidas, con una sensibilidad, capacidad de detección de frecuencias alélicas bajas y una especificidad y valor predictivo positivo, que supera las limitaciones de otros métodos similares conocidos hasta la fecha. With all this we can conclude that the present invention provides, thanks to the selected sequencing panel, a methodology that allows the diagnosis of breast cancer, even from liquid biopsies, with sensitivity, capacity to detect low allele frequencies and specificity. and positive predictive value, which overcomes the limitations of other similar methods known to date.

También se investigó la asociación de variables clínico-patológicas con la detección de mutaciones en plasma. En concreto, se estudió la positividad de ctDNA en plasma, la frecuencia alélica mediana (FA) de las mutaciones, el número de mutaciones por muestra y las muestras con mutaciones enTP53para determinar su asociación con las características clínicas (Tablas 11 y 12). En general, una mediana de FA más alta se asoció con un grado tumoral más alto (p= 0,04639), la presencia de más de 1 mutación en plasma con probabilidad de recaída clínica (p= 0,02372) y las mutaciones en TP53 se observaron más frecuentemente en tumores negativos a la expresión de receptores hormonales (HR), en concreto receptor estrógeno (ER) negativos (p= 0,0316) y receptor progesterona (PR) negativos (P=0,0257). Además, la asociación de la recaída clínica y las mutaciones en plasma con una mediana de frecuencia alélica (FA) alta, definida como mutaciones con > 0,05 % en la FA, fue interesantemente cercana a la significación (p = 0,059). The association of clinicopathological variables with the detection of mutations in plasma was also investigated. Specifically, ctDNA positivity in plasma, the median allelic frequency (FA) of the mutations, the number of mutations per sample, and samples with TP53 mutations were studied to determine their association with clinical characteristics (Tables 11 and 12). In general, a higher median FA was associated with a higher tumor grade (p= 0.04639), the presence of more than 1 mutation in plasma with probability of clinical relapse (p= 0.02372), and mutations in TP53 were more frequently observed in tumors negative for the expression of hormone receptors (HR), specifically estrogen receptor (ER) negative (p= 0.0316) and progesterone receptor (PR) negative (P=0.0257). Furthermore, the association of clinical relapse and plasma mutations with high median allele frequency (AF), defined as mutations with >0.05% in AF, was interestingly close to significance (p = 0.059).

Cabe destacar que el 38,35% de los pacientes incluidos en este estudio eran asintomáticos y fueron diagnosticados por el programa de detección precoz de cáncer de mama. De ellos, el 28,57% presentaba mutaciones plasmáticas, porcentaje similar al 33,33% de mujeres sintomáticas con mutaciones. It should be noted that 38.35% of the patients included in this study were asymptomatic and were diagnosed by the breast cancer early detection program. Of them, 28.57% had plasma mutations, a percentage similar to the 33.33% of symptomatic women with mutations.

Tabla 11: Relación entre características clínicas y ctDNA positivos y frecuencia alélica mediana (FA) en plasma. Table 11: Relationship between clinical characteristics and positive ctDNA and median allele frequency (FA) in plasma.

Tabla 12: Relación entre características clínicas y 2 mutaciones en plasma y TP53 Mutado. Table 12: Relationship between clinical characteristics and 2 mutations in plasma and Mutated TP53.

En conclusión, observamos una concordancia de mutaciones entre tumor y plasma del 29,50% con una sensibilidad por debajo del 0,075% en la frecuencia de alelos mutantes. En el enfoque no informado por el tumor, detectamos mutaciones en el 33,78% de las muestras de plasma observando 8 pacientes con mutaciones solo en plasma. Determinamos una especificidad del 86,36% y un valor predictivo positivo del 88,46%. Además, demostramos una asociación entre una mediana de FA más alta y un grado tumoral más alto, la presencia de múltiples mutaciones en plasma con probabilidad de recaída clínica y mutaciones enTP53con positividad del receptor de estrógeno. Se trata por tanto de un panel de secuenciación único con una tecnología que no se había empleado anteriormente en el cáncer de mama temprano, demostrando una sensibilidad ultra alta y allanando el camino para su uso en la detección del cáncer de mama. In conclusion, we observed a mutation concordance between tumor and plasma of 29.50% with a sensitivity below 0.075% in the frequency of mutant alleles. In the tumor-uninformed approach, we detected mutations in 33.78% of plasma samples by observing 8 patients with mutations only in plasma. We determined a specificity of 86.36% and a positive predictive value of 88.46%. Furthermore, we demonstrated an association between higher median FA and higher tumor grade, the presence of multiple plasma mutations with probability of clinical relapse, and TP53 mutations with estrogen receptor positivity. It is therefore a unique sequencing panel with a technology that has not been previously used in early breast cancer, demonstrating ultra-high sensitivity and paving the way for its use in the detection of breast cancer.

Teniendo en cuenta lo anterior, el panel de secuenciación de la invención para plasma mostró capacidades mejoradas para detectar ctDNA en pacientes con cáncer de mama localizados en las primeras etapas de diagnóstico, mejorando la sensibilidad de detección de investigaciones anteriores y agregando evidencia de que ctDNA podría ayudar en el proceso de diagnóstico de la población asintomática. Esto también está respaldado por los porcentajes similares en la identificación de mutaciones plasmáticas entre mujeres sintomáticas y asintomáticas de 33,33% y 28,57% respectivamente. En este sentido, desarrollamos una metodología bioinformática personalizada para identificar mutaciones plasmáticas sin información tumoral, demostrando un alto VPP y sugiriendo que enfoques similares podrían constituir una herramienta de detección para el cáncer de mama. También queda demostrado que mediante la secuenciación temprana del ADN plasmático de los pacientes con cáncer de mama, es factible obtener información importante sobre la enfermedad, así como predecir la evolución clínica en estas pacientes. Taking the above into account, the inventive plasma sequencing panel showed improved capabilities to detect ctDNA in breast cancer patients located in the early stages of diagnosis, improving the detection sensitivity of previous research and adding evidence that ctDNA could assist in the diagnosis process of the asymptomatic population. This is also supported by the similar percentages in plasma mutation identification between symptomatic and asymptomatic women of 33.33% and 28.57% respectively. In this sense, we developed a personalized bioinformatics methodology to identify plasma mutations without tumor information, demonstrating a high PPV and suggesting that similar approaches could constitute a screening tool for breast cancer. It has also been demonstrated that by early sequencing the plasma DNA of patients with breast cancer, it is feasible to obtain important information about the disease, as well as predict the clinical evolution in these patients.

Referencias References

1. Alfonso, Alba-Bernalet al.;Challenges and achievements of liquid biopsy technologies employed in early breast cáncer.eBioMedicine- Volumen 62, 103100. https://doi.org/10.1016/¡.ebiom.2020.10310Q. 1. Alfonso, Alba-Bernalet al.;Challenges and achievements of liquid biopsy technologies employed in early breast cancer.eBioMedicine-Volume 62, 103100. https://doi.org/10.1016/¡.ebiom.2020.10310Q.

2. Sun, M.-Y.;et al,.Targeted Next-Generation Sequencing of Circulating Tumor DNA Mutations among Metastatic Breast Cancer Patients.Curr. Oncol.2021,28,2326-2336. https://doi.org/10.3390/curroncol28040214. 2. Sun, M.-Y.;et al,.Targeted Next-Generation Sequencing of Circulating Tumor DNA Mutations among Metastatic Breast Cancer Patients.Curr. Oncol.2021,28,2326-2336. https://doi.org/10.3390/curroncol28040214.

3. Priskin, K.;et al.,BC-Monitor: Towards a Routinely Accessible Circulating Tumor DNA-Based Tool for Real-Time Monitoring Breast Cancer Progression and Treatment Effectiveness.Cancers2021,13,3489. https://doi.org/10.3390/cancers13143489. 3. Priskin, K.;et al.,BC-Monitor: Towards a Routinely Accessible Circulating Tumor DNA-Based Tool for Real-Time Monitoring Breast Cancer Progression and Treatment Effectiveness.Cancers2021,13,3489. https://doi.org/10.3390/cancers13143489.

4. Keup, C., Benyaaet al.Targeted deep sequencing revealed variants in cell-free DNA of hormone receptor-positive metastatic breast cancer patients.Cell. Mol. Life Sci.77, 497-509 (2020). https://doi.org/10.1007/s00018-019-03189-z. 4. Keup, C., Benyaaet al.Targeted deep sequencing revealed variants in cell-free DNA of hormone receptor-positive metastatic breast cancer patients.Cell. Mol. Life Sci.77, 497-509 (2020). https://doi.org/10.1007/s00018-019-03189-z.

5- Jimenez Rodriguez, B.;et al.,Detection ofTP53andPIK3CAMutations in Circulating Tumor DNA Using Next-Generation Sequencing in the Screening Process for Early Breast Cancer Diagnosis.J. Clin. Med.2019, 8, 1183. https://doi.org/10.3390/icm8081183 identificadores moleculares únicos 6. Pereira, B.,et al.,The somatic mutation profiles of 2,433 breast cancers refine their genomic and transcriptomic landscapes.Nat Commun7, 11479 (2016). https://doi.org/10.1038/ncomms11479. 5- Jimenez Rodriguez, B.;et al.,Detection ofTP53andPIK3CAMutations in Circulating Tumor DNA Using Next-Generation Sequencing in the Screening Process for Early Breast Cancer Diagnosis.J. Clin. Med.2019, 8, 1183. https://doi.org/10.3390/icm8081183 unique molecular identifiers 6. Pereira, B.,et al.,The somatic mutation profiles of 2,433 breast cancers refine their genomic and transcriptomic landscapes.Nat Commun7 , 11479 (2016). https://doi.org/10.1038/ncomms11479.

7. Cohen JDet al.,Detection and localization of surgically resectable cancers with a multianalyte blood test.Science.2018 Feb 23;359(6378):926-930. doi: 10.1126/science.aar3247. 7. Cohen JDet al.,Detection and localization of surgically resectable cancers with a multianalyte blood test.Science.2018 Feb 23;359(6378):926-930. doi: 10.1126/science.aar3247.

8. Page K,et al.,Prevalence of ctDNA in early screen-detected breast cancers using highly sensitive and specific dual molecular barcoded personalised mutation assays.Ann Oncol.8. Page K,et al.,Prevalence of ctDNA in early screen-detected breast cancers using highly sensitive and specific dual molecular barcoded personalized mutation assays.Ann Oncol.

2021 Aug;32(8):1057-1060. doi: 10.1016/j.annonc.2021.04.018. Epub 2021 Apr 29. PMID: 33932505. 2021 Aug;32(8):1057-1060. doi: 10.1016/j.annonc.2021.04.018. Epub 2021 Apr 29. PMID: 33932505.

9. Garcia-Murillas, I.etal.Mutation tracking in circulating tumor DNA predicts relapse in early breast cancer.Sci Transí Med7, 302ra133 (2015). 9. Garcia-Murillas, I.etal.Mutation tracking in circulating tumor DNA predicts relapse in early breast cancer. Sci Transí Med7, 302ra133 (2015).

Claims (16)

r e iv in d ic a c io n e sr e iv in d i c a t i o n s 1. Panel de secuenciación que comprende los genes de la Tabla 11. Sequencing panel comprising the genes in Table 1 2. Uso del panel de secuenciación de la Tabla 1 para el diagnóstico o pronóstico del cáncer de mama.2. Use of the sequencing panel in Table 1 for the diagnosis or prognosis of breast cancer. 3. Uso del panel de secuenciación según la reivindicación anterior en biopsias líquidas.3. Use of the sequencing panel according to the previous claim in liquid biopsies. 4. Un métodoin vitrode obtención de datos útiles para diagnosticar, predecir o pronosticar la evolución del cáncer de mama, a partir de una muestra biológica previamente aislada de un individuo, que comprende identificar posibles mutaciones en los genes de la Tabla 1.4. An in vitro method for obtaining useful data to diagnose, predict or forecast the evolution of breast cancer, from a biological sample previously isolated from an individual, which includes identifying possible mutations in the genes in Table 1. 5. Un métodoin vitropara diagnosticar o diagnosticar precozmente el cáncer de mama que comprende el método de obtención de datos útiles de la reivindicación 4 y que además comprende asignar al individuo que presenta mutaciones en alguno de los genes de la Tabla 1 al grupo de pacientes que padece cáncer de mama.5. An in vitro method for diagnosing or early diagnosing breast cancer that comprises the method of obtaining useful data of claim 4 and which also comprises assigning the individual who has mutations in any of the genes in Table 1 to the group of patients who suffers from breast cancer. 6. Un métodoin vitropara diagnosticar el cáncer de mama según la reivindicación anterior que además comprende asignar al individuo que presenta una mediana de frecuencia alélica de las mutaciones de los genes de la Tabla 1 más alta, al grupo de pacientes con un grado tumoral más alto.6. An in vitro method for diagnosing breast cancer according to the preceding claim, which further comprises assigning the individual who has a higher median allelic frequency of the mutations of the genes in Table 1 to the group of patients with a higher tumor grade. . 7. Un métodoin vitropara predecir o pronosticar la evolución del cáncer de mama que comprende el método de obtención de datos útiles de la reivindicación 4 y que además comprende asignar al individuo que presenta más de una mutación en los genes de la Tabla 1, al grupo de pacientes con probabilidad de recaída clínica.7. An in vitro method to predict or forecast the evolution of breast cancer that comprises the method of obtaining useful data of claim 4 and that also comprises assigning the individual who has more than one mutation in the genes of Table 1, to the group of patients with a probability of clinical relapse. 8. Un métodoin vitropara predecir o pronosticar la evolución del cáncer de mama que comprende el método de obtención de datos útiles de la reivindicación 4 y que además comprende asignar al individuo que presenta mutaciones enTP53al grupo de pacientes con tum or negativo a la expresión de receptores hormonales.8. An in vitro method to predict or forecast the evolution of breast cancer that comprises the method of obtaining useful data of claim 4 and that also comprises assigning the individual who has mutations in TP53 to the group of patients with a tumor negative for the expression of receptors. hormonal. 9. El método según cualquiera de las reivindicaciones 4 a 8 donde la muestra biológica es plasma.9. The method according to any of claims 4 to 8 wherein the biological sample is plasma. 10. El método según cualquiera de las reivindicaciones 4 a 9, en el que las mutaciones en los genes de la Tabla 1 se detectan mediante tecnologías de secuenciación de última generación onext generation sequencing.10. The method according to any of claims 4 to 9, wherein the mutations in the genes of Table 1 are detected by next generation sequencing technologies onext generation sequencing. 11. El método según la reivindicación anterior donde la tecnología de secuenciación de última generación utilizada son sondas de enriquecimiento tipo Agilent Sure Select.11. The method according to the previous claim where the next-generation sequencing technology used is Agilent Sure Select type enrichment probes. 12. Un kit que comprende los elementos necesarios para la detección simultánea de mutaciones en cualquiera de los genes de la Tabla 1.12. A kit that includes the elements necessary for the simultaneous detection of mutations in any of the genes in Table 1. 13. Uso del kit según la reivindicación 12 para diagnosticar o pronosticar la evolución del cáncer de mama.13. Use of the kit according to claim 12 to diagnose or predict the evolution of breast cancer. 14. Un programa de ordenador adaptado para que cualquier medio de procesamiento pueda llevar a la práctica el método según cualquiera las reivindicaciones 4 a 11.14. A computer program adapted so that any processing means can implement the method according to any of claims 4 to 11. 15. Un medio de almacenamiento legible por un ordenador que comprende instrucciones de programa capaces de hacer que un ordenador lleve a cabo los pasos del método según cualquiera las reivindicaciones 4 a 11.15. A computer-readable storage medium comprising program instructions capable of causing a computer to carry out the steps of the method according to any of claims 4 to 11. 16. Una señal transmisible que comprende instrucciones de programa capaces de hacer que un ordenador lleve a cabo los pasos del método según cualquiera las reivindicaciones 4 a 11.16. A transmissible signal comprising program instructions capable of causing a computer to carry out the steps of the method according to any of claims 4 to 11.
ES202230937A 2022-10-28 2022-10-28 Sequencing panel for liquid biopsy of breast cancer patients (Machine-translation by Google Translate, not legally binding) Pending ES2971182A1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
ES202230937A ES2971182A1 (en) 2022-10-28 2022-10-28 Sequencing panel for liquid biopsy of breast cancer patients (Machine-translation by Google Translate, not legally binding)
PCT/ES2023/070633 WO2024089314A1 (en) 2022-10-28 2023-10-27 Sequencing panel for liquid biopsy of patients with breast cancer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
ES202230937A ES2971182A1 (en) 2022-10-28 2022-10-28 Sequencing panel for liquid biopsy of breast cancer patients (Machine-translation by Google Translate, not legally binding)

Publications (1)

Publication Number Publication Date
ES2971182A1 true ES2971182A1 (en) 2024-06-03

Family

ID=89068579

Family Applications (1)

Application Number Title Priority Date Filing Date
ES202230937A Pending ES2971182A1 (en) 2022-10-28 2022-10-28 Sequencing panel for liquid biopsy of breast cancer patients (Machine-translation by Google Translate, not legally binding)

Country Status (2)

Country Link
ES (1) ES2971182A1 (en)
WO (1) WO2024089314A1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017181146A1 (en) * 2016-04-14 2017-10-19 Guardant Health, Inc. Methods for early detection of cancer
US20210343372A1 (en) * 2020-02-18 2021-11-04 Tempus Labs, Inc. Methods and systems for dynamic variant thresholding in a liquid biopsy assay
WO2022225933A1 (en) * 2021-04-22 2022-10-27 Natera, Inc. Methods for determining velocity of tumor growth

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017181146A1 (en) * 2016-04-14 2017-10-19 Guardant Health, Inc. Methods for early detection of cancer
US20210343372A1 (en) * 2020-02-18 2021-11-04 Tempus Labs, Inc. Methods and systems for dynamic variant thresholding in a liquid biopsy assay
WO2022225933A1 (en) * 2021-04-22 2022-10-27 Natera, Inc. Methods for determining velocity of tumor growth

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
KEUP CORINNA ET AL. Targeted deep sequencing revealed variants in cell-free DNA of hormone receptor-positive metastatic breast cancer patients. Cellular and Molecular Life Sciences FEB 2020. , 31/01/2020, Vol. 77, Páginas 497-509 ISSN 1420-682X(print) ISSN 1420-9071(electronic), (DOI: doi:10.1007/s00018-019-03189-z) fig 2d *
PRISKIN KATALIN ET AL. BC-Monitor: Towards a Routinely Accessible Circulating Tumor DNA-Based Tool for Real-Time Monitoring Breast Cancer Progression and Treatment Effectiveness. Cancers JUL 2021. , 30/06/2021, Vol. 13, Páginas Article No.: 3489 ISSN 2072-6694(electronic), (DOI: doi:10.3390/cancers13143489) tabla 1. *
SUN MIN-YING ET AL. Targeted Next-Generation Sequencing of Circulating Tumor DNA Mutations among Metastatic Breast Cancer Patients.. Current oncology (Toronto, Ont.) Switzerland 24 06 2021. , 24/06/2021, Vol. 28, Páginas 2326 - 2336 ISSN 1718-7729 (Electronic), (DOI: doi:10.3390/curroncol28040214 pubmed:34202466) fig.1. *
YOSHINAMI TETSUHIRO ET AL. Detection of ctDNA with Personalized Molecular Barcode NGS and Its Clinical Significance in Patients with Early Breast Cancer. Translational Oncology AUG 2020. , 31/07/2020, Vol. 13, Páginas Article No.: 100787 ISSN 1936-5233(print) ISSN 1936-5233(electronic), (DOI: doi:10.1016/j.tranon.2020.100787) figura 13, fig 1B. *

Also Published As

Publication number Publication date
WO2024089314A1 (en) 2024-05-02

Similar Documents

Publication Publication Date Title
Tong et al. Tumor-derived DNA from pleural effusion supernatant as a promising alternative to tumor tissue in genomic profiling of advanced lung cancer
Lamy et al. Prognostic biomarkers used for localised prostate cancer management: a systematic review
BR112020023587A2 (en) method of determining a cell-free DNA fragmentation (cfdna) profile, method of identifying a mammal as having cancer, method of identifying the tissue of origin of a cancer, and method of treating a mammal with cancer
Chatterjee et al. Cancer biomarkers: knowing the present and predicting the future
ES2525545T3 (en) Methods and uses to identify the origin of a carcinoma of unknown primary origin
ES2544500T3 (en) Cancer screening methods
Ritterhouse et al. GNAS mutations in primary mucinous and non-mucinous lung adenocarcinomas
JP2010517536A (en) Methods and materials for identifying primary lesions of cancer of unknown primary
Reinert et al. Circulating tumor DNA for prognosis assessment and postoperative management after curative‐intent resection of colorectal liver metastases
CA2628390A1 (en) Molecular profiling of cancer
WO2012125411A1 (en) Methods of predicting prognosis in cancer
Zhao et al. Circulating tumor DNA as a potential prognostic and predictive biomarker during interventional therapy of unresectable primary liver cancer
Cheng et al. A four‐gene transcript score to predict metastatic‐lethal progression in men treated for localized prostate cancer: Development and validation studies
US20140127708A1 (en) Predictive biomarkers for prostate cancer
Liu et al. Recurrence prediction by circulating tumor DNA in the patient with colorectal liver metastases after hepatectomy: a prospective biomarker study
AU2017201343A1 (en) Molecular biomarker set for early detection of ovarian cancer
Lin et al. Association of immunohistochemical profiles with histotypes in endometrial carcinomas
US20190161808A1 (en) Method for predicting prognosis of breast cancer patients by using gene deletions
Chew et al. Mismatch repair deficiency screening via immunohistochemical staining in young Asians with colorectal cancers
Gupta et al. Fluorescent in situ hybridization in surgical pathology practice
Shao et al. Cell‐free DNA 5‐hydroxymethylcytosine as a marker for common cancer detection
ES2971182A1 (en) Sequencing panel for liquid biopsy of breast cancer patients (Machine-translation by Google Translate, not legally binding)
Sanganeria et al. Molecular Diagnostics in Renal Cancer
CN116368242A (en) Methods for detecting and predicting cancer
Kashanizadeh et al. Molecular expression of some oncogenes and predisposing behaviors contributing to the aggressiveness of prostate cancer

Legal Events

Date Code Title Description
BA2A Patent application published

Ref document number: 2971182

Country of ref document: ES

Kind code of ref document: A1

Effective date: 20240603