WO2020165483A1 - Método de predicción de respuesta a tratamiento del cáncer con agentes antiangiogénicos - Google Patents

Método de predicción de respuesta a tratamiento del cáncer con agentes antiangiogénicos Download PDF

Info

Publication number
WO2020165483A1
WO2020165483A1 PCT/ES2020/070106 ES2020070106W WO2020165483A1 WO 2020165483 A1 WO2020165483 A1 WO 2020165483A1 ES 2020070106 W ES2020070106 W ES 2020070106W WO 2020165483 A1 WO2020165483 A1 WO 2020165483A1
Authority
WO
WIPO (PCT)
Prior art keywords
cancer
individual
sample
tumor
antiangiogenic
Prior art date
Application number
PCT/ES2020/070106
Other languages
English (en)
French (fr)
Inventor
Antonio RODRÍGUEZ ARIZA
Francisco Manuel CONDE PÉREZ
Enrique ARANDA AGUILAR
Ana María MELLADO FUENTES
Original Assignee
Universidad de Córdoba
Servicio Andaluz De Salud
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Universidad de Córdoba, Servicio Andaluz De Salud filed Critical Universidad de Córdoba
Publication of WO2020165483A1 publication Critical patent/WO2020165483A1/es

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions

Definitions

  • the present invention is within the field of biomedicine and biotechnology, and it relates to a method for predicting or predicting the response to cancer treatment with antiangiogens, and specifically colon cancer.
  • Angiogenesis is a term that describes the formation of new blood vessels and capillaries from the pre-existing vasculature. This phenomenon is the result of a balance between pro-angiogenic factors, such as vascular endothelial growth factor (VEGF) and anti-angiogenic factors.
  • VEGF vascular endothelial growth factor
  • Angiogenesis is a crucial mechanism in both physiological and pathological processes. Under physiological conditions, it is a highly regulated process that occurs during embryonic development, in wound healing, during the menstrual cycle or in the formation of the placenta during pregnancy. However, in pathological conditions such as psoriasis, diabetic retinopathy, and cancer, dysregulation of angiogenesis occurs. In this context, the modulation between pro-angiogenic and anti-angiogenic factors is disturbed, leading to dysregulated blood vessel formation.
  • angiogenesis is required for the proliferation and survival of a tumor that exceeds a few millimeters in size.
  • the creation of a network of blood vessels that penetrate the tumor provides the oxygen and nutrients necessary for its growth, in addition to allowing the elimination of waste products.
  • tumor cells can access the bloodstream, spread throughout the body, and proliferate elsewhere, in the process known as metastasis. Without blood vessels, tumors cannot proliferate or colonize other organs.
  • VEGF and VEGF receptors have become important therapeutic targets for the treatment of colon and breast cancer, among other neoplasms.
  • Activation of the VEGF / VEGFR pathway stimulates numerous intracellular signaling pathways, causing an increase in the growth and differentiation of endothelial cells and in vascular permeability, as well as in the proliferation, migration and invasion of the tumor cells themselves.
  • VEGF / VEGFR-mediated signaling include the use of monoclonal antibodies against VEFG, as well as the use of tyrosine kinase inhibitors.
  • the drug bevacizumab (Avastin®) is a humanized monoclonal antibody that selectively binds with high affinity to all human VEGF isoforms, neutralizing their biological activity by preventing binding to its VEGFR-1 (Flt-1) and VEGFR- receptors. 2 (KDR).
  • bevacizumab is indicated in combination with chemotherapy for the treatment of metastatic colorectal cancer, in combination with paclitaxel or capecitabine in the treatment of metastatic breast cancer, in non-small cell lung cancer in combination with chemotherapy, in metastatic kidney cancer in combination with interferon alfa-2, in ovarian cancer in combination with chemotherapy and in cervical cancer in combination with paclitaxel.
  • Tumors do not behave like simple masses of cells, they have a high degree of complexity that makes access to them difficult with most current analytical methods. Tumor tissues are made up of numerous cell types, specialized in different pathways, but all of them in turn connected by intrinsic interactions. In addition, they contain all the information on morphological, genetic and proteomic changes, which is why they represent the best material for any molecular research.
  • MALDI-IMS MALDI-imaging mass spectrometry
  • MALDI imaging also known as MALDI imaging. It is a tool that allows the identification of a wide variety of molecules present in biological tissues without their destruction, so that all morphological information is retained, providing molecular images of said tissues.
  • protocols that allow the analysis of paraffinized tumor tissues is an advantage that will allow this technique to be incorporated into current pathological analyzes.
  • This molecular imaging technique is characterized by fresh or paraffin-embedded tissue processing before obtaining peptide profiles by MALDI-TOF (Matrix-Assisted Laser Desorption / lonization-Time-Of-Flight).
  • MALDI-TOF Microx-Assisted Laser Desorption / lonization-Time-Of-Flight
  • a section of fresh tissue is deposited on an electrically conductive slide, and if the tissue is waxed, it is previously dewaxed.
  • a specific matrix is then deposited in a localized manner that efficiently extracts and crystallizes the molecules to be analyzed (lipids, proteins, drugs, etc.). If we need to analyze peptides, before adding this matrix the tissue is trypsinized.
  • the mass spectrum of the molecules present in the tissue is obtained.
  • the repetition of this process at all points in the tissue results in what is called a datacube in MALDI-IMS, where each peptide mass spectrum is associated with a Cartesian position.
  • the data from this datacube is collected and analyzed using specific software that provides biomolecular information on specific areas of the tissue, in addition to the distribution of peptide profiles throughout the entire tissue that has been analyzed.
  • the molecular images generated after processing the data are related to the morphological information of the tissue, since the molecular analysis must be interpreted in a histological context.
  • FIG. 1 Workflow for tumor microdissection.
  • the tissue sample is fully scanned by MALDI-IMS.
  • the scan generates a datacube (with a mean spectrum) that can be explored to visualize the m / z intensities.
  • the different segmentation models made it possible to select the tumor area that conserves all the m / z information with its particular mean spectrum.
  • Figure 2. ROC curves of the four methods used for classification.
  • FIG. 4 Distribution of m / z values 666, 816, 855 and 884 in the tumor area. The four most relevant m / z of a representative specimen of each classification group were visualized to see the distribution of the intensities.
  • the examples of the present invention describe the analysis of FFPE tumor tissues from patients with metastatic colorectal cancer treated with bevacizumab in order to generate a classifier for the prediction of the response to this antiangiogenic treatment with high sensitivity and specificity, based on the information proteomics obtained with MALDI-IMS. This methodology could be used to predict or predict the response to cancer treatment with antiangiogenic drugs.
  • a first aspect of the invention refers to the use of the expression product of type 1 collagen a2 chain, complement C3 and galectin-4, or any of their combinations, to predict or predict the response to cancer treatment in an individual with an antiangiogenic agent.
  • the expression product of all four biomarkers is used simultaneously.
  • C0L1A2 (also called in the literature 0/4; EDSCV; EDSARTH2) refers to both the human gene and protein.
  • the COL1A2 gene encodes the pro-alpha2 chain of type I collagen whose triple helix comprises two alpha chains and an alpha2 chain.
  • Type I is a fibril-forming collagen found in most connective tissues and is abundant in bone, cornea, dermis, and tendon. Mutations in this gene are associated with osteogenesis imperfecta type II V, Ehlers-Danlos syndrome type VIIB, recessive Ehlers-Danlos syndrome of classic type, idiopathic osteoporosis, and atypical Marfan syndrome.
  • COL1A2 is also defined by a sequence of nucleotides or polynucleotides, which constitutes the sequence "COL1A2", and which would comprise various variants derived from: a) nucleic acid molecules that encode a polypeptide that comprises the amino acid sequence of SEQ ID NO: 2, b) nucleic acid molecules whose hybrid complementary strand with the polynucleotide sequence of a), c) nucleic acid molecules whose sequence differs from a) and / or b) due to the degeneracy of the genetic code, d) molecules nucleic acid that encode a polypeptide comprising the amino acid sequence with an identity of at least 80%, 90%, 95%, 98% or 99% with SEQ ID NO: 2 in which the encoded polypeptide by these nucleic acids it possesses the activity and the structural characteristics of the COL1A2 protein.
  • Other possible nucleotide sequences encoding COL1A2 include, but are not limited to,
  • C3 refers to both the human gene and protein.
  • the C3 component of complement plays a central role in the activation of the complement system. Its activation is necessary for both classical and alternative complement activation pathways.
  • the encoded preprotein is proteolytically processed to generate alpha and beta subunits that form the mature protein, which is then processed to generate numerous peptide products.
  • C3a peptide also known as C3a anaphylatoxin, modulates inflammation and possesses antimicrobial activity. Mutations in this gene are associated with atypical hemolytic uremic syndrome and age-related macular degeneration in human patients.
  • C3 is also defined by a sequence of nucleotides or polynucleotides, which constitutes the sequence "C3”, and which would comprise various variants derived from: a) nucleic acid molecules that encode a polypeptide comprising the amino acid sequence of SEQ ID NO: 4, b) nucleic acid molecules whose complementary strand hybridizes with the polynucleotide sequence of a), c) nucleic acid molecules whose sequence differs from a) and / or b) due to the degeneracy of the genetic code, d) nucleic acid molecules that encode a polypeptide comprising the amino acid sequence with an identity of at least 80%, 90%, 95%, 98% or 99% with SEQ ID NO: 4 in which the polypeptide encoded by said nucleic acids possesses the activity and structural characteristics of the C3 protein.
  • Other possible nucleotide sequences encoding C3 include, but are not limited to, SEQ ID NO: 3.
  • LGALS4 also called in the literature GAL4; L36LBP refers to both the human gene and protein. Galectins are a family of beta-galactoside binding proteins involved in modulating cell-cell and cell-matrix interactions. The expression of this gene is restricted to the small intestine, colon, and rectum, and is under-expressed in colorectal cancer.
  • LGALS4 is also defined by a sequence of nucleotides or polynucleotides, which constitutes the sequence "LGALS4", and which would comprise various variants derived from: a) nucleic acid molecules that encode a polypeptide that comprises the amino acid sequence of SEQ ID NO: 6, b) nucleic acid molecules whose complementary strand hybridizes with the polynucleotide sequence of a), c) nucleic acid molecules whose sequence differs from a) and / or b) due to the degeneracy of the genetic code, d) nucleic acid molecules that encode a polypeptide comprising the amino acid sequence with an identity of at least 80%, 90%, 95%, 98% or 99% with SEQ ID NO: 6 wherein the polypeptide encoded by said nucleic acids possesses the activity and the structural characteristics of the LGALS4 protein.
  • Other possible nucleotide sequences encoding LGALS4 include, but are not limited to, SEQ ID NO: 5.
  • CTCCACACACTAGT AAT CT AAACC ACTCTCCCT ACAAT ACAACAT ACGT GGT AAAG AT GTGT
  • This aspect of the invention also relates to a method for obtaining data useful for predicting or predicting the response to cancer treatment in an individual with an antiangiogenic agent, which comprises: a) measuring the expression product of an isolated biological sample COL1A2, C3, LGALS4
  • step (a) it also refers to a method for predicting or predicting the response to cancer treatment in an individual with an antiangiogenic agent, comprising step (a) above, and further comprising: b) assigning the individual from step a) to the group of individuals that respond to antiangiogenic therapy when the expression product of COL1A2, C3, LGALS4, or any of their combinations present in said individual levels lower than the reference amounts.
  • the expression levels of the genes will give a certain profile of gene expression.
  • level also called “amount of gene product” or “expression product” refers to the biochemical material, be it RNA or protein, resulting from the expression of a gene. Sometimes a measure of the amount of gene product is used to infer how active a gene is.
  • gene expression profile is understood the gene profile obtained after quantifying the mRNA and / or protein produced by the genes of interest or biomarkers, that is, by the genes used as biological markers in the present invention, in a sample isolated biological.
  • the expression profile of the genes is preferably carried out by determining the level of mRNA derived from their transcription, after extraction of the total RNA present in the isolated biological sample, which can be carried out using protocols known in the state of the art.
  • the determination of the level of mRNA derived from the transcription of the genes used as biological markers in the present invention can be carried out, for example, but not limited to, by amplification by polymerase chain reaction (PCR), reverse transcription in combination with polymerase chain reaction (RT-PCR), quantitative RT-PCR (qPCR), reverse transcription in combination with ligase chain reaction (RT-LCR), or any other nucleic acid amplification method; serial analysis of gene expression (SAGE, SuperSAGE); DNA chips made from oligonucleotides deposited by any mechanism; DNA microarrays made with oligonucleotides synthesized in situ by photolithography or any other mechanism; in situ hybridization using specific probes labeled with any labeling method; using electrophoresis gels; by membrane blotting and hybrid
  • the gene expression profile could also be obtained by detecting and / or quantifying the proteins produced by the translation of the mRNA derived from the transcription of the genes used as biological markers in the present invention, for example, but not limited to, immunodetection by western blot.
  • the quantitative detection of the expression of the genes used as biological markers in the present invention can more preferably be carried out by means of real-time PCR (RT-PCR or RTqPCR). Real-time detection of amplified products can be carried out by using fluorescent molecules that are intercalated in double-stranded DNA or by hybridization with different types of probes.
  • step (a) is carried out by PCR, preferably RT-PCR.
  • the level or levels of proteins are detected, it can be done, as in the case of genes, by any of the techniques known to those skilled in the art.
  • the detection of the expression levels is carried out by an immunological technique.
  • the immunological techniques are based on precipitation reactions, agglutination, immunostaining, radioimmunoassay and radioimmunometric techniques, preferably ELISA (Enzyme Linked ImmunoadSorbent Assay), or Western blot or in any of its combinations.
  • ELISA Enzyme Linked ImmunoadSorbent Assay
  • the primers or primers are polynucleotide sequences of between 10 and 30 base pairs, more preferably between 15 and 25 base pairs, even more preferably between 18 and 22 base pairs, and still much more preferably around 20 base pairs, having an identity of at least 80%, more preferably at least 90%, still more preferably at least 95%, still much more preferably at least 98%, and particularly 100%, with a fragment of the sequences complementary to SEQ ID N ° 1 (COL1A2), SEQ ID N °: 3 (R C3), and / or SEQ ID N ° 5 (LGALS4),
  • the antibodies are capable of specifically binding to a region formed by any of the amino acid sequences SEQ ID N ° 2 (COL1A2), SEQ ID N °: 4 (R C3), and / or SEQ ID N °
  • the primers, probes or antibodies are modified or labeled, for example, but not limited to, by radioactive or immunological labeling.
  • the oligonucleotides present modifications in some of their nucleotides, such as, for example, but not limited to, nucleotides that have some of their atoms with a radioactive isotope, usually 32 P or tritium, immunologically labeled nucleotides, as for example with a digoxigenin molecule, and / or immobilized on a membrane.
  • a second aspect of the invention refers to a method for obtaining data useful to predict or predict the response to cancer treatment in an individual with an antiangiogenic agent, hereinafter first method of the invention, comprising: a) identifying the value of the m / z ratio of proteins in an isolated sample from an individual
  • the cancer is selected from colorectal cancer, breast cancer, non-small cell lung cancer, kidney cancer, ovarian cancer and cervical cancer, or any of their combinations .
  • the antiangiogenic agent is selected from among ranibizumab, bevacizumab and aflibercept, nintedanib, infigratinib, rogaratinib, carotuximab, trebananib, abituzumab, pazopanib, pembrolizumab, Henurtinib, les apurtinibricota vatalanib, or any of its combinations.
  • the antiangiogenic drug is bevacizumab.
  • a "biological sample” as defined herein is a small part of a subject, representative of the whole, and can be a biopsy or a body fluid sample.
  • Biopsies are small pieces of tissue and can be fresh, frozen, or fixed, as formalin-fixed and paraffin-embedded FFPE.
  • Body fluid samples can be blood, plasma, serum, urine, sputum, cerebrospinal fluid, milk or ductal fluid samples and can also be fresh, frozen, or fixed.
  • Samples can be removed surgically, by extraction, that is, with hypodermic or other needles, by microdissection or laser capture.
  • the sample must contain any suitable biological material to detect the desired marker, biomarker or biomarkers, therefore, said sample must advantageously comprise material from the cells of the subject. Therefore, in a particular embodiment, the sample is a tumor tissue biopsy.
  • the sample is tumor tissue, and more preferably it is embedded in paraffin.
  • Whether a part is statistically significant can be determined out of hand by the person skilled in the art using various well-known statistical evaluation tools, for example, determination of confidence intervals, determination of p-values, Student's t-test, Mann's test -Whitney, etc.
  • Preferred confidence intervals are at least 50%, at least 60%, at least 70%, at least 80%, at least 90%, at least 95%.
  • the p-values are preferably 0.2, 0.1, 0.05.
  • other sub-classifications could be established within this main one, thus facilitating the choice and establishment of appropriate therapeutic regimens or treatment. This discrimination as understood by an expert in the field does not claim to be correct in 100% of the samples analyzed.
  • the intervals of confidence are at least 90%, at least 95%, at least 97%, at least 98%, or at least 99%.
  • the p-value is less than 0.1, 0.05, 0.01, 0.005, or 0.0001.
  • the present invention allows the disease to be correctly detected differentially by at least 60%, more preferably at least 70%, much more preferably at least 80%, or even much more preferably at least 90% of the subjects of a certain group or population analyzed.
  • an “individual” or “subject”, as used herein, refers to a mammal, human or non-human, under observation, and more preferably a human.
  • the individual can be anyone, an individual predisposed to a disease (eg colon cancer) or an individual suffering from said disease.
  • a “reference sample”, as used herein, means a sample obtained from individuals, preferably two or more individuals, who are known to be free from disease (colon cancer) and / or alternatively from healthy population. Suitable reference levels of markers can be determined by measuring the levels of such markers in various suitable individuals, and such reference levels can be adjusted for populations of specific individuals or subjects.
  • the reference sample is obtained from a group of healthy individuals or subjects or from subjects without a previous history of colon cancer.
  • the profile of levels of markers in the reference sample can preferably be generated from a population of two or more individuals; for example, the population may comprise 3, 4, 5, 10, 15, 20, 30, 40, 50 or more individuals or subjects.
  • the determination of the markers can be done by any means known to the person skilled in the art. In a preferred embodiment, the determinations have been made by mass spectrometric methods.
  • anti-angiogenic agent is understood as vascular endothelial growth factor (VEGF) inhibitors.
  • VEGF vascular endothelial growth factor
  • the vascular endothelial growth factor (VEGF) inhibitors are selected from the list consisting of Bevacizumab and Ranibizumab. Even more preferably, the antiangiogenic agent is Bevacizumab.
  • a third aspect of the invention refers to a method for predicting or predicting the response to cancer treatment in an individual with an antiangiogenic agent, hereinafter the second method of the invention, comprising the steps of the first method of the invention, and also b) assign the individual from step a) to the group of individuals who respond to antiangiogenic therapy when: the values m / z 666, 816, 855 and 884, or any of their combinations present in said individual levels lower than the amounts of reference.
  • the cancer is selected from colorectal cancer, breast cancer, non-small cell lung cancer, kidney cancer, ovarian cancer and cervical cancer, or any of their combinations. .
  • the antiangiogenic agent is selected from among ranibizumab, bevacizumab and aflibercept, nintedanib, infigratinib, rogaratinib, carotuximab, trebananib, abituzumab, pazopanib, pembrolizumab, Henurtinibtanibrico, les apurtinibricota vatalanib, or any of its combinations. Most preferably it is bevacizumab.
  • a “reference sample”, as used herein, means a sample obtained from a group of healthy subjects who do not have a particular disease state or phenotype.
  • Reference levels can be determined by measuring the expression levels of such genes in various appropriate subjects, and those reference levels can be adjusted to specific populations (for example, a reference level may be related to age, so comparisons can be made between expression levels in samples of subjects of a certain age and reference levels for a particular disease, phenotype, or lack of it in a given age group).
  • the reference sample is obtained from various subjects in general, or from subjects not responding to antiangiogenic agents, preferably bevacizumab.
  • the type of reference sample may vary depending on the specific method to be performed.
  • the expression profile of the genes in the reference sample can preferably be generated from a population of two or more people.
  • the population for example, can contain 3, 4, 5, 10, 15, 20, 30, 40, 50 or more people.
  • the expression profile of the genes in the reference sample and in the sample of the person to be diagnosed according to the methods of the present invention can be generated from the same person, provided that the profiles are analyzed and the reference profile are generated from biological samples taken at different times and compared with each other. For example, a sample from an individual can be obtained at the beginning of a study period. A reference biomarker profile from this sample can be compared to biomarker profiles generated from subsequent samples from the same person.
  • the reference sample is a set of samples from various individuals.
  • the expression of a gene is considered increased in a sample of the subject under study when the levels increase with respect to the reference sample are at least 5%, at least 10%, at least 15%, at least 20%, at least 25%, at least 30%, at least less 35%, at least 40%, at least 45%, at least 50%, at least 55%, at least 60%, at least at least 65%, at least 70%, at least 75%, at least 80%, at least 85%, at least 90%, at least 95%, at least 100%, at least 1 10 %, at least 120%, at least 130%, at least 140%, at least 150%, or more.
  • the expression of a gene is considered decreased when its levels decrease with respect to the reference sample by at least 5%, at least 10%, at least 15%, at least 20%, by at least 25%, at least 30%, at least 35%, at least 40%, at least 45%, at least 50%, at least 55%, at least the 60%), at least 65%, at least 70%, at least 75%, at least 80%, at least 85%, at least 90%, at least 95 %, at least 100% (that is, absent).
  • Another aspect of the invention relates to an anti-EGFR (epidermal growth factor receptor) agent for use in the treatment of an individual identified as non-responsive to antiangiogenic agents, and more preferably as non-responsive to becizumab, identified by anyone of the methods of the invention, and which has also been identified as a wildtype for RAS.
  • the anti-EGFR agent is selected from cetuximab or panitumumab.
  • Another aspect of the invention relates to the triple chemotherapy of irinotecan + oxaliplatin + 5-fluorouracil for use in the treatment of an individual identified as not responding to antiangiogenic agents, and more preferably as non-responding to becizumab, identified by any of the methods of the invention, and that has also been identified as a mutated individual in RAS.
  • Another aspect of the invention relates to a computer program that comprises instructions for carrying out the procedure according to any of the methods of the invention.
  • the invention encompasses computer programs arranged on or within a carrier.
  • the carrier can be any entity or device capable of supporting the program.
  • the carrier could be an integrated circuit in which the program is included and which has been adapted to execute, or to be used in the execution of the corresponding processes.
  • the programs could be embedded in a storage medium, such as a ROM memory, a CD ROM memory or a semiconductor ROM memory, a USB memory stick, or a magnetic recording medium, for example a floppy disk or a disk. Lasted.
  • the programs could be supported on a transmittable carrier signal; for example, it could be an electrical or optical signal that could be carried via electrical or optical cable, by radio, or by any other means.
  • the invention also extends to computer programs adapted so that any processing means can carry out the methods of the invention.
  • Computer programs also cover cloud applications based on this procedure.
  • the characteristics of the patients included in this study are listed in Table I.
  • the analysis included samples of formalin-fixed and paraffin-embedded tumor tissue (formalin-fixed and paraffin embedded FFPE) or FFPE tumor tissues that were obtained from the System Biobank. Public Health of Andalusia, after providing the corresponding signed informed consent of each patient. In total, 29 samples from 20 patients were analyzed, corresponding to primary and / or metastatic tumor lesions.
  • FFPE tumor tissues were processed as described below and analyzed by MALDI-MSI. Tumor regions containing 3484 spectra on average (from 598 to 11003 spectra) were selected by unsupervised analysis. The mean spectrum of each extracted tumor was then pre-processed and used to test various classification methodologies in order to discover new biomarkers. Distinguishing samples from responding patients from samples from non-responders can be viewed as a classification problem or a supervised learning problem. Many methods have been developed for this purpose, and some of them have proven their ability to deal with complex and high-dimensional data.
  • SVM Support Vector Machines
  • RF Random Forest
  • PLS-DA Partial Least Squares Discriminant Analysis
  • NSC Nearest Shrunken Centroid
  • PLS-DA involves the derivation of latent variables that maximize the covariance between the independent variables and their corresponding dependent variable. Therefore, prediction is enabled by searching for a linear subspace of the explanatory variables.
  • PLS-DA performs well with noisy, highly collinear data.
  • NSC is a popular classification method for high-dimensional data where the classification is based on the scaled distance between the samples and the class centroids. In NSC class centroids are reduced to the general centroid. NSC incorporates a variable selection mechanism, which is generally useful in predicting high-dimensional classes.
  • ROC curves show the ratio of true positives (sensitivity) to the fraction of false positives (1 - specificity) as a function of a variable threshold.
  • a ten-fold cross-validation was used to assess the expected generalizability performance measures. Parameter optimization for each of the four models was performed using the default random search method implemented in Caret.
  • T size or extent of the primary tumor (X: cannot be determined, 1: the tumor invades the submucosa, 2: the tumor invades the muscularis basement, 3: the tumor passes through the muscularis basement to the horrorrectal tissues, 4: the tumor perforates the peritoneum.
  • N regional nodular metastasis (X: affected regional lymph nodes cannot be determined, 0: no nodular metastasis, 1: metastasis from one to three nodules, 2: metastasis in four or more nodules.
  • the FFPE tissue sections were cut at 5 pm thickness and mounted on an indium tin oxide (ITO, Sigma Aldrich, Steiheim, Germany) slide previously coated with poly-L-lysine (P1274-25mg, Sigma Aldrich, Steiheim, Germany) with a short custom protocol (0.1 mg / ml poly L-Lys, 37 ° C, 1 hour).
  • ITO indium tin oxide
  • P1274-25mg poly-L-lysine
  • the mounted samples were heated for 1 hour at 65 ° C in order to increase tissue fixation on the ITO slide.
  • a standard deparaffinization / rehydration protocol was performed according to: 10 min xylene washes (x2), 4 decreasing ethanol steps, 5 minutes each (100%, 96%, 80% and 70%) and a final wash step with deionized water for 5 minutes.
  • the antigen recovery steps were performed by heating the rehydrated samples in sodium citrate pH 10 mM (AD7-950-270-0500, Enzo, Farmingdale, NY, USA) at 98 ° C for 30 minutes. The samples were then allowed to cool to room temperature until reaching a minimum temperature of 40 ° C.
  • the last steps prior to tissue digestion were 2 washing steps with 10 mM NH4HC03 buffer and a vacuum drying step for 30 min.
  • a solution based on a-cyano-4-hydroxycinnamic acid, CHCA (70990, Sigma Aldrich, Steiheim, Germany) (7 mg / ml 60% ACN 0.2% TFA) was used.
  • Additional internal calibration Glu-Fibrinopeptidium (Sigma Aldrich, Steiheim, Germany) was added to the matrix solution at a final concentration of 625 fmol / ml.
  • the final matrix solution was sprayed using the Suncollect sprayer in 8 layers as follows: first layer at 10 pL / min, second layer at 20 ml / min, third layer at 30 pL / min and fourth layer to eighth layer at 45 pL / min, all of them on the az axis equal to 27.05. Upon completion, the slides were vacuum dried again for 30 minutes prior to analysis on the mass spectrometer.
  • MALDI mass spectrometry imaging Analysis of the samples was carried out using an AB 5800 TOF / TOF (ABSciex, Darmstadt, Germany). All slides were mounted on an adapter plate ready for mass spectrometry imaging (HTX image, Chapel Hill, USA). A positive reflector mode was used for all samples performing a double internal calibration of the spectra using first instance trypsin autolysis peak 842.508 [M + H] + and second Glu-Fibrinopetide peak at 1570.677 [M + H] +. The m / z range for all samples was defined from 650 to 1800 because 80% of the visualized peptides from these samples were in this range.
  • the laser intensity was set at 3200
  • the delay extraction was set at 450ns
  • the number of shots per pixel on the sample at 150 The first 20 shots were discarded to avoid noise from sample background.
  • the baffle parameters were adjusted for each sample to ensure a resolution (FWHW)> 15000 to GluFib mass.
  • MSI data sets were acquired using TOFTOF image acquisition software (ABSciex) using a fixed spatial resolution of 150 pm for all samples, since this resolution allows a correct analysis that distinguishes different histological features.
  • spectral data For the unsupervised analysis of spectral data, methods implemented in the R Cardinal MSI package were used. First, the data were normalized by the total ionic current (TIC). Next, to optimize computational time, the spectra were chosen to reduce dimensionality. Specifically, the selection of peaks in the tenth mass spectrum was carried out to search for peaks with a signal-to-noise ratio not lower than 10. These peaks were then aligned with the local maxima in the mean spectrum (with an error of + / - 25 ppm) and filtered to eliminate those that occurred in less than 1% of the pixels. Finally, the list of peaks was used to traverse the entire normalized data set and retrieve the identified peaks from all pixels.
  • TIC total ionic current
  • the samples were spatially segmented using Shrunken Centroid spatially-aware structurally-adaptive (SASA) (SASA) implemented in Cardinal MSI.
  • SASA Shrunken Centroid spatially-aware structurally-adaptive
  • the smoothing radius was set at 1.
  • the initial number of classes (parameter k) was set at 15 and 20.
  • the contraction parameter was set at 0, 3, 6 and 9.
  • the one with the best Tumor tissue was defined, at the discretion of an experienced pathologist, selected for subsequent microdissection.
  • each pixel is assigned a variable corresponding to the class to which it belongs.
  • this variable was reassigned to the raw spectral data and then the class or classes corresponding to the tumor region were subset using general methods implemented in the R environment.
  • the complete set of tumor tissue spectra was loaded into R statistics software (R Foundation for Statistical Computing).
  • the Cardinal MSI package was used for data processing, which includes normalization of the total ion current of each spectrum, the reduction baseline and resampling.
  • Basic R programming language tools were used to obtain an average spectrum of each region of interest (ROI) for further classification and to perform, where indicated, a correlation analysis.
  • the variables with the highest mean absolute correlation were eliminated from each correlated pair (cutoff> 0.9) using the findCorrelation function of the Caret package.
  • Proteins were isolated from a FFPE sample with the Qproteome FFPE tissue kit following the manufacturer's specifications. Samples were cleaned to remove contaminants by protein precipitation with TCA / acetone and solubilized in 50 ⁇ l of 0.2% RapiGest SF (Waters, Milford, MA, USA) in 50 mM ammonium bicarbonate. Total protein content was measured using the Qubit Protein Assay Kit (Thermo Fisher Scientific, Waltham, MA, USA) and 50 pg of protein was digested with trypsin following a protocol adapted from Vowinckel et al.
  • the peptide solutions were analyzed using a nano-LC-MS / MS data-dependent acquisition (DDA) approach.
  • Each sample (2 pl) was separated on an Ekspert nLC415 nano-LC system (Eksigent, Dublin, CA, USA) using an Acclaim PepMap C18 column (75 pm x 25 cm, 3 pm, 100 ° A) (Thermo Fisher Scientific) at a flow rate of 300 nl / min. Water and ACN, both containing 0.1% formic acid, were used as solvents A and B, respectively.
  • the gradient run consisted of 5% to 30% B in 120 minutes, 10 minutes to 90% B and finally 20 minutes to 5% B for equilibration of the column, in a total operating time of 150 min.
  • peptides As the peptides eluted, they were injected directly into a Quadripolar Triple TOF 5600+ Hybrid TOF Mass Spectrometer (Sciex, Redwood City, CA, USA) operating with a "top 65" data-dependent acquisition system using positive ion mode.
  • An ESI NanoSpray III source (Sciex) was used for the interface between nLC and MS, applying a voltage of 2,600 V.
  • the acquisition mode consisted of a 250 ms MS scan of 350 to 1,250 m / z, followed by a MS / MS scan 230 to 1,700 m / z (60 ms acquisition time, rolling collision energy) of the top 65 precursor ions from the survey scan, making a total cycle time of 4.2 s. Fragmented precursors were then added to a dynamic exclusion list for 15 s; any individually charged ions were excluded from MS / MS analysis.
  • the peak list was generated by Protein Pilot software (version 5.0.1, Sciex). Peptide and protein identifications were carried out using the Paragon Algorithm as a search engine (included in the Protein Pilot software) with a Swiss-Prot target-reverse concatenated human database (release date: March 2016) containing 20,200 sequences of target proteins. Iodoacetamide was specified as Cys alkylation. The false discovery rate (FDR) was set at 0.01 for both peptides and proteins. Other settings (number of missed and non-specific cuts allowed, variable modifications, mass tolerance for precursor ions and ion fragments, etc.) were automatically optimized by specifying Triple TOF 5600 + as the mass spectrometer device.
  • Table II shows the validated performance results (95% CI) for the four methods applied for classification using two different sets of characteristics.
  • SVM area under the curve
  • RF, PLS-DA and NSC showed an area under the curve (AUC) around 0.8, their sensitivity and specificity parameters were lower than desired for a good classification model. Therefore, in order to improve performance results, highly correlated m / z values were discarded as highly redundant information could worsen classification and prediction performance. After removing correlated features, 23 m / z were used to classify the samples.
  • variable importance is calculated as the mean decrease in ranking precision after permuting its values over all the trees.
  • PLS-DA the measure of variable importance is based on the contribution of each variable to the reduction of the sums of squares.
  • NSC the difference between the class centroids and the general centroid is used to measure variable influence.
  • four m / z values (666, 816, 855 and 884) were selected by the three models as the most important characteristics.
  • running RF, PLS-DA and NSC with the data set these four characteristics were also selected as the most important characteristics.
  • Table III The 23 m / z ratios selected for classification ordered by importance in the different classification methods
  • Classification-relevant m / z values are over-represented in the group of non-responders.
  • the proteins corresponding to peaks m / z 666, 816, 855 and 884 were identified.
  • LC-MS / MS was used after isolating the proteins. tumor in a representative sample. A total of 1107 proteins were identified with FDR set at 1%.
  • the results of protein identification are summarized in Table IV. No proteins were identified that matched m / z 666. However, the a2 chain of collagen (type 1), complement C3 and galectin 4 were identified for 816, 855 and 884 m / z respectively, based on peptides with a identification confidence> 95% and higher protein score. Interestingly, all of these proteins have been described to be related to the angiogenesis process.

Abstract

Método para predecir o pronosticar la respuesta al tratamiento del cáncer con antiangiogénicos, y en concreto para predecir la respuesta al tratamiento del cáncer colorrectal con bevacizumab.

Description

DESCRIPCIÓN
Método de predicción de respuesta a tratamiento del cáncer con agentes antiangiogénicos
CAMPO DE LA INVENCIÓN
La presente invención se encuentra dentro del campo de la biomedicina y la biotecnología, y se refiere a un método para predecir o pronosticar la respuesta al tratamiento del cáncer con antiangiogénicos, y en concreto del cáncer de colon.
ANTECEDENTES DE LA INVENCIÓN
La angiogénesis es un término que describe la formación de nuevos vasos sanguíneos y capilares a partir de la vasculatura preexistente. Este fenómeno es resultado de un balance entre factores pro-angiogénicos, como el factor de crecimiento del endotelio vascular (VEGF) y factores anti-angiogénicos. La angiogénesis es un mecanismo crucial tanto en procesos fisiológicos como patológicos. En condiciones fisiológicas, es un proceso altamente regulado que ocurre durante el desarrollo embrionario, en la cicatrización de heridas, durante el ciclo menstrual o en la formación de la placenta durante el embarazo. Sin embargo, en condiciones patológicas como la psoriasis, la retinopatía diabética y el cáncer, se produce una desregulación de la angiogénesis. En este contexto, la modulación entre factores pro-angiogénicos y anti angiogénicos se altera, conduciendo a una formación de vasos sanguíneos desregulada.
Durante su crecimiento, los organismos multicelulares necesitan formar nuevos vasos sanguíneos, por lo que se induce la angiogénesis y vasculogénesis (formación de novo de vasos sanguíneos). En cáncer, la angiogénesis es requerida para la proliferación y supervivencia de aquel tumor que exceda unos pocos milímetros de tamaño. La creación de una red de vasos sanguíneos que penetran en el tumor aporta el oxígeno y nutrientes necesarios para el crecimiento del mismo, además de permitir la eliminación de productos de desecho. Así mismo, utilizando estos vasos sanguíneos las células tumorales pueden acceder al torrente circulatorio, diseminarse por el organismo y proliferar en otro lugar, en el proceso conocido como metástasis. Sin vasos sanguíneos los tumores no pueden proliferar ni colonizar otros órganos.
En los años 70, Judah Folkman observó que el crecimiento tumoral y la metástasis dependían estrictamente de la angiogénesis y propuso que, el bloqueo de ésta podría detener la proliferación tumoral. Desde entonces mucho ha sido el esfuerzo dedicado al descubrimiento y desarrollo de inhibidores de la angiogénesis que permitieran reducir la mortalidad y morbilidad de los carcinomas.
i Sin embargo, no ha sido hasta esta última década cuando el uso de fármacos con actividad antiangiogénica se ha convertido en una de las estrategias terapéuticas reales contra el cáncer. Formas diferentes de VEGF y los receptores de VEGF (VEGFR) se han convertido en importantes dianas terapéuticas para el tratamiento del cáncer de colon y mama, entre otras neoplasias. La activación de la vía VEGF/VEGFR estimula numerosas vías de señalización intracelular, causando un aumento en el crecimiento y diferenciación de las células endoteliales y en la permeabilidad vascular, así como en la proliferación, migración e invasión de las propias células tumorales.
Entre las estrategias para inhibir la señalización mediada por VEGF/VEGFR se encuentran el uso de anticuerpos monoclonales contra VEFG, así como el uso de inhibidores de tirosina quinasa. El fármaco bevacizumab (Avastin®) es un anticuerpo monoclonal humanizado que se une selectivamente con alta afinidad a todas las isoformas de VEGF humano, neutralizando su actividad biológica por prevención de la unión a sus receptores VEGFR-1 (Flt-1) y VEGFR-2 (KDR). Actualmente, bevacizumab está indicado en combinación con quimioterapia para el tratamiento del cáncer colorrectal metastásico, en combinación con paclitaxel o capecitabina en el tratamiento de cáncer de mama metastásico, en cáncer de pulmón no microcítico en combinación con quimioterapia, en cáncer metastásico de riñón en combinación con interferón alfa-2, en cáncer de ovario en combinación con quimioterapia y en cáncer de cuello de útero en combinación con paclitaxel.
Los ensayos clínicos muestran que la eficacia (medida como supervivencia libre de progresión o supervivencia global) de los fármacos antiangiogénicos en general, y bevacizumab en particular, es muy variable y depende mucho del tipo de tumor así como del propio estudio. Sin embargo, los datos clínicos apoyan la existencia de grupos de pacientes que obtienen un gran beneficio del tratamiento con bevacizumab en combinación con sus regímenes de quimioterapia, mientras que en otros no se observa ninguna mejoría. Estos resultados resaltan la necesidad de buscar biomarcadores fiables que ayuden a predecir qué pacientes responderán mejor al tratamiento con fármacos antiangiogénicos, tales como bevacizumab.
Hasta ahora se han tratado de establecer algunos criterios clínicos, biológicos y moleculares que ayudaran a definir la selección de pacientes. En este sentido, recientemente se ha visto que pacientes que son buenos respondedores a bevacizumab usualmente desarrollan hipertensión arterial secundaria a la terapia anti-angiogénica. La hipertensión se controla con agentes hipertensivos orales como inhibidores de la enzima convertidora de angiotensina (ACE), diuréticos o bloqueadores beta. En los ensayos clínicos llevados a cabo en pacientes con cáncer colorrectal metastásico y cáncer de mama tratados con bevacizumab, aparecía hipertensión en el 22-32% de pacientes que respondían a la terapia. Sin embargo, todavía no ha sido posible la identificación de ningún marcador predictivo de respuesta al tratamiento con anti-angiogénicos. Los tumores no se comportan como simples masas de células, tienen un alto grado de complejidad que dificulta el acceso a ellos con la mayoría de métodos analíticos actuales. Los tejidos tumorales están formados por numerosos tipos celulares, especializados en rutas diferentes, pero todos ellos conectados a su vez por interacciones intrínsecas. Además, contienen toda la información de los cambios morfológicos, genéticos y proteómicos, por lo que representan el mejor material para cualquier investigación molecular.
El análisis de tejidos tumorales supone retos y limitaciones importantes debido a la heterogeneidad intratumoral que presentan las muestras. Además, la complejidad del tejido es difícil de captar con los métodos actuales disponibles, como la evaluación histológica, la inmunohistoquímica o las técnicas proteómicas convencionales, que requieren de la extracción y homogeneización de la muestra, lo que conlleva la pérdida de las conexiones espaciales que existen dentro de los tejidos.
La complicada búsqueda de biomarcadores para el uso en clínica debería ser desarrollada con métodos analíticos que aprovecharan la información almacenada dentro de los tejidos tumorales y así generar resultados prácticos que puedan ser aplicados en el estudio patológico. En este sentido, las herramientas proteómicas actuales permiten aproximarnos a la búsqueda de nuevos biomarcadores utilizando técnicas que no se basan en la homogenización de la muestra y son mucho más rápidas que los métodos analíticos convencionales.
Un método que en los últimos años está permitiendo la evaluación proteómica de tejidos sin homogeneizar es la imagen por espectrometría de masas MALDI (MALDI- IMS: MALDI-imaging mass spectrometry) también conocida como MALDI imaging. Se trata de una herramienta que permite la identificación de una amplia variedad de moléculas presentes en los tejidos biológicos sin su destrucción, por lo que toda la información morfológica queda retenida, aportando imágenes moleculares de dichos tejidos. Además, el desarrollo de protocolos que permitan el análisis de tejidos tumorales parafinados suponen una ventaja que permitirá incorporar esta técnica a los análisis patológicos actuales.
Esta técnica de imagen molecular se caracteriza por un procesamiento del tejido fresco o incluido en parafina antes de la obtención de los perfiles peptídicos por MALDI-TOF ( Matrix-Assisted Láser Desorption/lonization- Time-Of-Flight). En el caso más simple, una sección de tejido fresco se deposita sobre un porta conductor de la electricidad, y si el tejido está parafinado, se desparafina previamente. A continuación se deposita una matriz específica de forma localizada que extraiga y cristalice eficientemente las moléculas que se deseen analizar (lípidos, proteínas, fármacos, etc). Si necesitamos analizar péptidos, antes de añadir esta matriz se tripsiniza el tejido. Cuando el láser del MALDI-TOF incide sobre un punto concreto del tejido se obtiene el espectro de masas de las moléculas presentes en el tejido. La repetición de este proceso en todos los puntos del tejido da como resultado lo que en MALDI-IMS se denomina datacube, donde cada espectro de masas peptídicas está asociado a una posición cartesiana. Los datos de este datacube son recopilados y analizados utilizando un software específico que proporciona información biomolecular de zonas concretas del tejido, además de la distribución de los perfiles peptíficos a lo largo de todo el tejido que se ha analizado. A continuación, las imágenes moleculares generadas tras el procesamiento de los datos se relacionan con la información morfológica del tejido, ya que el análisis molecular debe ser interpretado en un contexto histológico.
A pesar del beneficio demostrado de bevacizumab en combinación con quimioterapia en cáncer colorrectal, sigue siendo un reto encontrar nuevos biomarcadores que predigan qué pacientes obtendrán beneficio de este tratamiento antiangiogénico.
DESCRIPCIÓN DE LAS FIGURAS
Figura 1. Flujo de trabajo para la microdisección tumoral. La muestra de tejido es escaneada completamente por MALDI-IMS. El escaneo genera un datacube (con un espectro medio) que puede ser explorado para visualizar las intensidades de las m/z. Los diferentes modelos de segmentación permitieron seleccionar el área tumoral que conserva toda la información m/z con su particular espectro medio.
Figura 2. Curvas ROC de los cuatro métodos utilizados para la clasificación. Figura 3. Espectro procesado promedio de grupos respondedores y no respondedores. El espectro medio de las 12 muestras de pacientes no respondedores y las 17 muestras pertenecientes a pacientes respondedores se trazaron para visualizar las diferencias de intensidad en los picos de 666, 816, 855 y 884 m/z. Línea negra = respondedores; línea roja = no respondedores. Las líneas verticales discontinuas indican los picos m/z 666, 816, 855 y 884.
Figura 4. Distribución de los valores m/z 666, 816, 855 y 884 en el área del tumor. Los cuatro m/z más relevantes de un espécimen representativo de cada grupo de clasificación se visualizaron para ver la distribución de las intensidades.
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN
Los ejemplos de la presente invención describen el análisis de tejidos tumorales FFPE de pacientes con cáncer colorrectal metastásico tratados con bevacizumab con el fin de generar un clasificador para la predicción de la respuesta a este tratamiento antiangiogénico con una alta sensibilidad y especificidad, basado en la información proteómica obtenida con MALDI-IMS. Esta metodología podría emplearse para predecir o pronosticar la respuesta al tratamiento del cáncer con fármacos antiangiogénicos.
Por tanto, un primer aspecto de la invención se refiere al uso del producto de expresión de colágeno tipo 1 cadena a2, complemento C3 y galectin-4, o cualquiera de sus combinaciones, para predecir o pronosticar la respuesta al tratamiento del cáncer en un individuo con un agente antiangiogénico.
En una realización preferida de este aspecto de la invención se emplea el producto de expresión de los cuatro biomarcadores simultáneamente.
El término "C0L1A2' (también llamado en la literatura 0/4; EDSCV; EDSARTH2 ) se refiere tanto al gen como a la proteína humana. El gen COL1A2 codifica la cadena pro-alfa2 del colágeno tipo I cuya triple hélice comprende dos cadenas alfal y una cadena alfa2. El tipo I es un colágeno formador de fibrillas que se encuentra en la mayoría de los tejidos conectivos y es abundante en hueso, córnea, dermis y tendón. Las mutaciones en este gen están asociadas con osteogénesis imperfecta tipo l-l V, síndrome de Ehlers-Danlos tipo VIIB, síndrome de Ehlers-Danlos recesivo de tipo clásico, osteoporosis idiopática y síndrome de Marfan atípico. Sin embargo, los síntomas asociados con las mutaciones en este gen tienden a ser menos graves que las mutaciones en el gen de la cadena alfal del colágeno tipo I (COL1A1), lo que refleja el papel diferente de las cadenas alfa2 en la integridad de la matriz. Se han identificado tres transcripciones, resultantes del uso de señales de poliadenilación alternativas, para este gen. En el contexto de la presente invención,“COL1A2” se define también por una secuencia de nucleótidos o polinucleótidos, que constituye la secuencia“COL1A2”, y que comprendería diversas variantes procedentes de: a) moléculas de ácido nucleico que codifican un polipéptido que comprende la secuencia aminoacídica de la SEQ ID NO: 2, b) moléculas de ácido nucleico cuya cadena complementaria híbrida con la secuencia polinucleotídica de a), c) moléculas de ácido nucleico cuya secuencia difiere de a) y/o b) debido a la degeneración del código genético, d) moléculas de ácido nucleico que codifican un polipéptido que comprende la secuencia aminoacídica con una identidad de al menos un 80%, un 90%, un 95%, un 98% o un 99% con la SEQ ID NO: 2 en las que el polipéptido codificado por dichos ácidos nucleicos posee la actividad y las características estructurales de la proteína COL1A2. Entre otras posibles secuencias nucleotídicas que codifican COL1A2 se encuentra, pero sin limitarse, la SEQ ID NO: 1.
Gene ID: 1278
Localización del gen: 7q21.3
SEQ ID N° 1
GTGTCCCATAGTGTTTCCAAACTTGGAAAGGGCGGGGGAGGGCGGGAGGATGCGGAGGG
CGGAGGTATGCAGACAACGAGTCAGAGTTTCCCCTTGAAAGCCTCAAAAGTGTCCACGTC
CTCAAAAAGAATGGAACCAATTTAAGAAGCCAGCCCCGTGGCCACGTCCCTTCCCCCATTC
GCTCCCTCCTCTGCGCCCCCGCAGGCTCCTCCCAGCTGTGGCTGCCCGGGCCCCCAGCC
CCAGCCCTCCCATTGGTGGAGGCCCTTTTGGAGGCACCCTAGGGCCAGGGAAACTTTTGC
CGT AT AAAT AGGGCAGAT CCGGGCTTT ATT ATTTT AGCACCACGGCAGCAGGAGGTTT CGG
CTAAGTTGGAGGTACTGGCCACGACTGCATGCCCGCGCCCGCCAGGTGATACCTCCGCC
GGTGACCCAGGGGCTCTGCGACACAAGGAGTCTGCATGTCTAAGTGCTAGACATGCTCAG
CTTTGTGGATACGCGGACTTTGTTGCTGCTTGCAGTAACCTTATGCCTAGCAACATGCCAA
TCTTT ACAAGAGGAAACTGT AAGAAAGGGCCCAGCCGGAGAT AGAGGACCACGTGGAGAA
AGGGGTCCACCAGGCCCCCCAGGCAGAGATGGTGAAGATGGTCCCACAGGCCCTCCTGG
TCCACCTGGTCCTCCTGGCCCCCCTGGTCTCGGTGGGAACTTTGCTGCTCAGTATGATGG
AAAAGGAGTTGGACTTGGCCCTGGACCAATGGGCTTAATGGGACCTAGAGGCCCACCTGG
TGCAGCTGGAGCCCCAGGCCCTCAAGGTTTCCAAGGACCTGCTGGTGAGCCTGGTGAAC
CTGGTCAAACTGGTCCTGCAGGTGCTCGTGGTCCAGCTGGCCCTCCTGGCAAGGCTGGT
GAAGATGGT CACCCTGGAAAACCCGGACGACCTGGT GAGAGAGGAGTT GTTGGACCACA
GGGTGCTCGTGGTTTCCCTGGAACTCCTGGACTTCCTGGCTTCAAAGGCATTAGGGGACA
CAATGGTCTGGATGGATTGAAGGGACAGCCCGGTGCTCCTGGTGTGAAGGGTGAACCTG GTGCCCCTGGTGAAAATGGAACTCCAGGTCAAACAGGAGCCCGTGGGCTTCCTGGTGAGA
GAGGACGTGTTGGTGCCCCTGGCCCAGCTGGTGCCCGTGGCAGTGATGGAAGTGTGGGT
CCCGTGGGTCCTGCTGGTCCCATTGGGTCTGCTGGCCCTCCAGGCTTCCCAGGTGCCCCT
GGCCCCAAGGGTGAAATTGGAGCTGTTGGTAACGCTGGTCCTGCTGGTCCCGCCGGTCC
CCGTGGTGAAGTGGGTCTTCCAGGCCTCTCCGGCCCCGTTGGACCTCCTGGTAATCCTGG
AGCAAACGGCCTTACTGGTGCCAAGGGTGCTGCTGGCCTTCCCGGCGTTGCTGGGGCTC
CCGGCCTCCCT GGACCCCGCGGTATTCCTGGCCCT GTT GGTGCT GCCGGTGCT ACTGGT
GCCAGAGGACTTGTTGGTGAGCCTGGTCCAGCTGGCTCCAAAGGAGAGAGCGGTAACAA
GGGTGAGCCCGGCTCTGCTGGGCCCCAAGGTCCTCCTGGTCCCAGTGGTGAAGAAGGAA
AGAGAGGCCCTAATGGGGAAGCTGGATCTGCCGGCCCTCCAGGACCTCCTGGGCTGAGA
GGTAGTCCTGGTTCTCGTGGTCTTCCTGGAGCTGATGGCAGAGCTGGCGTCATGGGCCCT
CCTGGTAGTCGTGGTGCAAGTGGCCCTGCTGGAGTCCGAGGACCTAATGGAGATGCTGGT
CGCCCTGGGGAGCCTGGTCTCATGGGACCCAGAGGTCTTCCTGGTTCCCCTGGAAATATC
GGCCCCGCTGGAAAAGAAGGTCCTGTCGGCCTCCCTGGCATCGACGGCAGGCCTGGCCC
AATTGGCCCAGCTGGAGCAAGAGGAGAGCCTGGCAACATTGGATTCCCTGGACCCAAAGG
CCCCACTGGTGATCCTGGCAAAAACGGTGATAAAGGTCATGCTGGTCTTGCTGGTGCTCG
GGGTGCTCCAGGTCCTGATGGAAACAATGGTGCTCAGGGACCTCCTGGACCACAGGGTGT
TCAAGGTGGAAAAGGTGAACAGGGTCCCCCTGGTCCTCCAGGCTTCCAGGGTCTGCCTGG
CCCCTCAGGTCCCGCTGGTGAAGTTGGCAAACCAGGAGAAAGGGGTCTCCATGGTGAGTT
TGGTCTCCCTGGTCCTGCTGGTCCAAGAGGGGAACGCGGTCCCCCAGGTGAGAGTGGTG
CTGCCGGTCCTACTGGTCCTATTGGAAGCCGAGGTCCTTCTGGACCCCCAGGGCCTGATG
GAAACAAGGGTGAACCTGGTGTGGTTGGTGCTGTGGGCACTGCTGGTCCATCTGGTCCTA
GTGGACTCCCAGGAGAGAGGGGTGCTGCTGGCATACCTGGAGGCAAGGGAGAAAAGGGT
GAACCTGGTCTCAGAGGTGAAATTGGTAACCCTGGCAGAGATGGTGCTCGTGGTGCTCCT
GGTGCTGTAGGTGCCCCTGGTCCTGCTGGAGCCACAGGTGACCGGGGCGAAGCTGGGG
CTGCTGGTCCTGCTGGTCCTGCTGGTCCTCGGGGAAGCCCTGGTGAACGTGGTGAGGTC
GGTCCTGCTGGCCCCAATGGATTTGCTGGTCCTGCTGGTGCTGCTGGTCAACCTGGTGCT
AAAGGAGAAAGAGGAGCCAAAGGGCCTAAGGGTGAAAACGGTGTTGTTGGTCCCACAGG
CCCCGTTGGAGCTGCTGGCCCAGCTGGTCCAAATGGTCCCCCCGGTCCTGCTGGAAGTC
GTGGTGATGGAGGCCCCCCTGGTATGACTGGTTTCCCTGGTGCTGCTGGACGGACTGGTC
CCCCAGGACCCTCTGGTATTTCTGGCCCTCCTGGTCCCCCTGGTCCTGCTGGGAAAGAAG
GGCTTCGTGGTCCTCGTGGTGACCAAGGTCCAGTTGGCCGAACTGGAGAAGTAGGTGCA
GTTGGTCCCCCTGGCTTCGCTGGTGAGAAGGGTCCCTCTGGAGAGGCTGGTACTGCTGG
ACCTCCTGGCACTCCAGGTCCTCAGGGTCTTCTTGGTGCTCCTGGTATTCTGGGTCTCCCT
GGCTCGAGAGGTGAACGTGGTCTACCAGGTGTTGCTGGTGCTGTGGGTGAACCTGGTCCT
CTTGGCATTGCCGGCCCTCCTGGGGCCCGTGGTCCTCCTGGTGCTGTGGGTAGTCCTGG
AGTCAACGGTGCTCCTGGTGAAGCTGGTCGTGATGGCAACCCTGGGAACGATGGTCCCCC
AGGTCGCGATGGTCAACCCGGACACAAGGGAGAGCGCGGTTACCCTGGCAATATTGGTC CCGTTGGTGCTGCAGGTGCACCTGGTCCTCATGGCCCCGTGGGTCCTGCTGGCAAACATG GAAACCGTGGTGAAACTGGTCCTTCTGGTCCTGTTGGTCCTGCTGGTGCTGTTGGCCCAA GAGGTCCTAGTGGCCCACAAGGCATTCGTGGCGATAAGGGAGAGCCCGGTGAAAAGGGG CCCAGAGGTCTTCCTGGCTTAAAGGGACACAATGGATTGCAAGGTCTGCCTGGTATCGCT GGTCACCATGGTGATCAAGGTGCTCCTGGCTCCGTGGGTCCTGCTGGTCCTAGGGGCCCT GCT GGTCCTTCT GGCCCT GCT GGAAAAGAT GGT CGCACT GGACATCCTGGT ACAGTTGGA CCTGCTGGCATTCGAGGCCCTCAGGGTCACCAAGGCCCTGCTGGCCCCCCTGGTCCCCC T GGCCCTCCT GGACCT CCAGGTGT AAGCGGT GGT GGTT AT GACTTTGGTT ACGAT GGAGA CTTCTACAGGGCTGACCAGCCTCGCTCAGCACCTTCTCTCAGACCCAAGGACTATGAAGTT GATGCTACTCTGAAGTCTCTCAACAACCAGATTGAGACCCTTCTTACTCCTGAAGGCTCTA GAAAGAACCCAGCTCGCACATGCCGTGACTTGAGACTCAGCCACCCAGAGTGGAGCAGTG GTTACTACTGGATTGACCCTAACCAAGGATGCACTATGGATGCTATCAAAGTATACTGTGAT TTCTCTACTGGCGAAACCTGTATCCGGGCCCAACCTGAAAACATCCCAGCCAAGAACTGGT AT AGGAGCT CCAAGGACAAGAAACACGT CT GGCTAGGAGAAACTATCAATGCT GGCAGCC AGTTT GAAT ATAAT GT AGAAGGAGT GACTT CCAAGGAAAT GGCT ACCCAACTTGCCTTCAT GCGCCTGCTGGCCAACTATGCCTCTCAGAACATCACCTACCACTGCAAGAACAGCATTGCA T ACAT GGAT GAGGAGACTGGCAACCT GAAAAAGGCTGTCATTCT ACAGGGCTCT AAT GAT G TT GAACTT GTTGCT GAGGGCAACAGCAGGTTCACTT ACACT GTTCTT GT AGATGGCTGCT C TAAAAAGACAAATGAATGGGGAAAGACAATCATTGAATACAAAACAAATAAGCCATCACGC CT GCCCTTCCTT GAT ATT GCACCTTTGGACATCGGT GGTGCTGACCAGGAATTCTTTGTGG ACATT GGCCC AGTCTGTTT CAAAT AAAT G AACT CAAT CT AAATT AAAAAAG AAAG AAATTT G A AAAAACTTT CT CTTTGCCATTT CTT CTT CTT CTTTTTT AACT GAAAGCT G AATCCTTCCATTTC TTCT GCACAT CT ACTTGCTT AAATT GT GGGCAAAAGAGAAAAAGAAGGATT GATCAGAGCAT TGTGCAATACAGTTTCATTAACTCCTTCCCCCGCTCCCCCAAAAATTTGAATTTTTTTTTCAA CACT CTT ACACCTGTT ATGG AAAAT GTCAACCTTT GT AAG AAAACCAAAAT AAAAATT GAAAA AT AAAAACCAT AAACATTTGCACCACTT GT GGCTTTT GAAT ATCTT CCACAGAGGGAAGTTT AAAACCCAAACTTCCAAAGGTTTAAACTACCTCAAAACACTTTCCCATGAGTGTGATCCACA TT GTT AGGTGCT G ACCT AG ACAG AG AT G AACT G AGGTCCTT GTTTTGTTTT GTT CAT AATAC AAAGGTGCT AATT AATAGT ATTTCAGAT ACTT GAAGAAT GTT GATGGTGCT AGAAGAATTTG AG AAG AAAT ACTCCT GT ATT GAGTTGT ATCGTGTGGTGT ATTTTTT AAAAAATTT G ATTT AGC ATTCATATTTTCCATCTTATTCCCAATTAAAAGTATGCAGATTATTTGCCCAAATCTTCTTCA GATT CAGC ATTT GTT CTTTGCC AGTCT CATTTT CAT CTT CTTCCAT GGTTCCACAGAAGCTTT GTTT CTT GGGCAAGCAG AAAAATT AAATT GT ACCT ATTTT GTATAT GTG AG AT GTTT AAAT AA ATT GT G AAAAAAAT GAAAT AAAGCATGTTT GGTTTT CC AAAAGAAC AT AT
SEQ ID N° 2
MLSFVDTRTLLLLAVTLCLATCQSLQEETVRKGPAGDRGPRGERGPPGPPGRDGEDGPTGPP
GPPGPPGPPGLGGNFAAQYDGKGVGLGPGPMGLMGPRGPPGAAGAPGPQGFQGPAGEPG EPGQTGPAGARGPAGPPGKAGEDGHPGKPGRPGERGVVGPQGARGFPGTPGLPGFKGIRG
HNGLDGLKGQPGAPGVKGEPGAPGENGTPGQTGARGLPGERGRVGAPGPAGARGSDGSVG
PVGPAGPIGSAGPPGFPGAPGPKGEIGAVGNAGPAGPAGPRGEVGLPGLSGPVGPPGNPGA
NGLTGAKGAAGLPGVAGAPGLPGPRGIPGPVGAAGATGARGLVGEPGPAGSKGESGNKGEP
GSAGPQGPPGPSGEEGKRGPNGEAGSAGPPGPPGLRGSPGSRGLPGADGRAGVMGPPGS
RGASGPAGVRGPNGDAGRPGEPGLMGPRGLPGSPGNIGPAGKEGPVGLPGIDGRPGPIGPA
GARGEPGNIGFPGPKGPTGDPGKNGDKGHAGLAGARGAPGPDGNNGAQGPPGPQGVQGG
KGEQGPPGPPGFQGLPGPSGPAGEVGKPGERGLHGEFGLPGPAGPRGERGPPGESGAAGP
TGPIGSRGPSGPPGPDGNKGEPGWGAVGTAGPSGPSGLPGERGAAGIPGGKGEKGEPGLR
GEIGNPGRDGARGAPGAVGAPGPAGATGDRGEAGAAGPAGPAGPRGSPGERGEVGPAGPN
GFAGPAGAAGQPGAKGERGAKGPKGENGVVGPTGPVGAAGPAGPNGPPGPAGSRGDGGP
PGMTGFPGAAGRTGPPGPSGISGPPGPPGPAGKEGLRGPRGDQGPVGRTGEVGAVGPPGF
AGEKGPSGEAGTAGPPGTPGPQGLLGAPGILGLPGSRGERGLPGVAGAVGEPGPLGIAGPPG
ARGPPGAVGSPGVNGAPGEAGRDGNPGNDGPPGRDGQPGHKGERGYPGNIGPVGAAGAP
GPHGPVGPAGKHGNRGETGPSGPVGPAGAVGPRGPSGPQGIRGDKGEPGEKGPRGLPGLK
GHNGLQGLPGIAGHHGDQGAPGSVGPAGPRGPAGPSGPAGKDGRTGHPGTVGPAGIRGPQ
GHQGPAGPPGPPGPPGPPGVSGGGYDFGYDGDFYRADQPRSAPSLRPKDYEVDATLKSLNN
QIETLLTPEGSRKNPARTCRDLRLSHPEWSSGYYWIDPNQGCTMDAIKVYCDFSTGETCIRAQ
PENIPAKNWYRSSKDKKHVWLGETINAGSQFEYNVEGVTSKEMATQLAFMRLLANYASQNITY
HCKNSIAYMDEETGNLKKAVILQGSNDVELVAEGNSRFTYTVLVDGCSKKTNEWGKTIIEYKTN
KPSRLPFLDIAPLDIGGADQEFFVDIGPVCFK
El término "C3" (también llamado en la literatura ASP; C3a; C3b; AHUS5; ARMD9; CP AMD 1; HEL-S-62p) se refiere tanto al gen como a la proteína humana. El componente C3 del complemento desempeña un papel central en la activación del sistema del complemento. Su activación es necesaria para las vías de activación del complemento tanto clásica como alternativa. La preproteína codificada se procesa proteolíticamente para generar subunidades alfa y beta que forman la proteína madura, que luego se procesa para generar numerosos productos peptídicos. El péptido C3a, también conocido como la anafilatoxina C3a, modula la inflamación y posee actividad antimicrobiana. Las mutaciones en este gen están asociadas con el síndrome urémico hemolítico atípico y la degeneración macular relacionada con la edad en pacientes humanos. En el contexto de la presente invención,“C3" se define también por una secuencia de nucleótidos o polinucleótidos, que constituye la secuencia “C3”, y que comprendería diversas variantes procedentes de: a) moléculas de ácido nucleico que codifican un polipéptido que comprende la secuencia aminoacídica de la SEQ ID NO: 4, b) moléculas de ácido nucleico cuya cadena complementaria híbrida con la secuencia polinucleotídica de a), c) moléculas de ácido nucleico cuya secuencia difiere de a) y/o b) debido a la degeneración del código genético, d) moléculas de ácido nucleico que codifican un polipéptido que comprende la secuencia aminoacídica con una identidad de al menos un 80%, un 90%, un 95%, un 98% o un 99% con la SEQ ID NO: 4 en las que el polipéptido codificado por dichos ácidos nucleicos posee la actividad y las características estructurales de la proteína C3. Entre otras posibles secuencias nucleotídicas que codifican C3 se encuentra, pero sin limitarse, la SEQ ID NO: 3.
Gene ID: 718
Localización del gen: 19p13.3 SEQ ID N° 3
AGATAAAAAGCCAGCTCCAGCAGGCGCTGCTCACTCCTCCCCATCCTCTCCCTCTGTCCCT
CTGTCCCTCTGACCCTGCACTGTCCCAGCACCATGGGACCCACCTCAGGTCCCAGCCTGC
T GCTCCT GCT ACT AACCCACCT CCCCCTGGCTCTGGGGAGTCCCAT GT ACT CT ATCATCAC
CCCCAACATCTTGCGGCTGGAGAGCGAGGAGACCATGGTGCTGGAGGCCCACGACGCGC
AAGGGGATGTTCCAGTCACTGTTACTGTCCACGACTTCCCAGGCAAAAAACTAGTGCTGTC
CAGTGAGAAGACTGTGCTGACCCCTGCCACCAACCACATGGGCAACGTCACCTTCACGAT
CCCAGCCAACAGGGAGTTCAAGTCAGAAAAGGGGCGCAACAAGTTCGTGACCGTGCAGG
CCACCTTCGGGACCCAAGTGGTGGAGAAGGTGGTGCTGGTCAGCCTGCAGAGCGGGTAC
CTCTTCATCCAGACAGACAAGACCATCTACACCCCTGGCTCCACAGTTCTCTATCGGATCT
TCACCGTCAACCACAAGCTGCTACCCGTGGGCCGGACGGTCATGGTCAACATTGAGAACC
CGGAAGGCATCCCGGTCAAGCAGGACTCCTTGTCTTCTCAGAACCAGCTTGGCGTCTTGC
CCTT GTCTT GGGACATT CCGGAACT CGTCAACATGGGCCAGTGGAAGAT CCGAGCCT ACT
ATGAAAACTCACCACAGCAGGTCTTCTCCACTGAGTTTGAGGTGAAGGAGTACGTGCTGCC
CAGTTTCGAGGTCATAGTGGAGCCTACAGAGAAATTCTACTACATCTATAACGAGAAGGGC
CTGGAGGTCACCATCACCGCCAGGTTCCTCTACGGGAAGAAAGTGGAGGGAACTGCCTTT
GTCATCTTCGGGATCCAGGATGGCGAACAGAGGATTTCCCTGCCTGAATCCCTCAAGCGC
ATTCCGATTGAGGATGGCTCGGGGGAGGTTGTGCTGAGCCGGAAGGTACTGCTGGACGG
GGTGCAGAACCCCCGAGCAGAAGACCTGGTGGGGAAGTCTTTGTACGTGTCTGCCACCGT
CATCTTGCACTCAGGCAGTGACATGGTGCAGGCAGAGCGCAGCGGGATCCCCATCGTGA
CCTCTCCCTACCAGATCCACTTCACCAAGACACCCAAGTACTTCAAACCAGGAATGCCCTT
TGACCTCATGGTGTTCGTGACGAACCCTGATGGCTCTCCAGCCTACCGAGTCCCCGTGGC
AGTCCAGGGCGAGGACACTGTGCAGTCTCTAACCCAGGGAGATGGCGTGGCCAAACTCA
GCATCAACACACACCCCAGCCAGAAGCCCTTGAGCATCACGGTGCGCACGAAGAAGCAG GAGCTCTCGGAGGCAGAGCAGGCTACCAGGACCATGCAGGCTCTGCCCTACAGCACCGT
GGGCAACTCCAACAATTACCTGCATCTCTCAGTGCTACGTACAGAGCTCAGACCCGGGGA
GACCCTCAACGTCAACTTCCTCCTGCGAATGGACCGCGCCCACGAGGCCAAGATCCGCTA
CT ACACCT ACCT GATCAT GAACAAGGGCAGGCTGTT GAAGGCGGGACGCCAGGTGCGAG
AGCCCGGCCAGGACCTGGTGGTGCTGCCCCTGTCCATCACCACCGACTTCATCCCTTCCT
TCCGCCTGGTGGCGTACTACACGCTGATCGGTGCCAGCGGCCAGAGGGAGGTGGTGGCC
GACTCCGTGTGGGTGGACGTCAAGGACTCCTGCGTGGGCTCGCTGGTGGTAAAAAGCGG
CCAGTCAGAAGACCGGCAGCCTGTACCTGGGCAGCAGATGACCCTGAAGATAGAGGGTG
ACCACGGGGCCCGGGTGGTACTGGTGGCCGTGGACAAGGGCGTGTTCGTGCTGAATAAG
AAGAACAAACTGACGCAGAGTAAGATCTGGGACGTGGTGGAGAAGGCAGACATCGGCTGC
ACCCCGGGCAGTGGGAAGGATTACGCCGGTGTCTTCTCCGACGCAGGGCTGACCTTCAC
GAGCAGCAGTGGCCAGCAGACCGCCCAGAGGGCAGAACTTCAGTGCCCGCAGCCAGCCG
CCCGCCGACGCCGTTCCGTGCAGCTCACGGAGAAGCGAATGGACAAAGTCGGCAAGTAC
CCCAAGGAGCTGCGCAAGTGCTGCGAGGACGGCATGCGGGAGAACCCCATGAGGTTCTC
GTGCCAGCGCCGGACCCGTTTCATCTCCCTGGGCGAGGCGTGCAAGAAGGTCTTCCTGG
ACTGCTGCAACTACATCACAGAGCTGCGGCGGCAGCACGCGCGGGCCAGCCACCTGGGC
CTGGCCAGGAGTAACCTGGATGAGGACATCATTGCAGAAGAGAACATCGTTTCCCGAAGT
GAGTTCCCAGAGAGCTGGCTGTGGAACGTTGAGGACTTGAAAGAGCCACCGAAAAATGGA
ATCTCT ACGAAGCTCAT GAAT AT ATTTTT GAAAGACTCCAT CACCACGT GGGAGATTCT GGC
TGTGAGCATGTCGGACAAGAAAGGGATCTGTGTGGCAGACCCCTTCGAGGTCACAGTAAT
GCAGGACTTCTTCATCGACCTGCGGCTACCCTACTCTGTTGTTCGAAACGAGCAGGTGGA
AATCCGAGCCGTTCTCTACAATTACCGGCAGAACCAAGAGCTCAAGGTGAGGGTGGAACT
ACTCCACAATCCAGCCTTCTGCAGCCTGGCCACCACCAAGAGGCGTCACCAGCAGACCGT
AACCATCCCCCCCAAGTCCTCGTTGTCCGTTCCATATGTCATCGTGCCGCTAAAGACCGGC
CTGCAGGAAGTGGAAGTCAAGGCTGCTGTCTACCATCATTTCATCAGTGACGGTGTCAGG
AAGTCCCTGAAGGTCGTGCCGGAAGGAATCAGAAT GAACAAAACT GTGGCT GTT CGCACC
CT GG ATCCAGAACGCCTGGGCCGT GAAGGAGTGCAGAAAGAGGACATCCCACCTGCAGA
CCTCAGTGACCAAGTCCCGGACACCGAGTCTGAGACCAGAATTCTCCTGCAAGGGACCCC
AGTGGCCCAGATGACAGAGGATGCCGTCGACGCGGAACGGCTGAAGCACCTCATTGTGA
CCCCCTCGGGCTGCGGGGAACAGAACATGATCGGCATGACGCCCACGGTCATCGCTGTG
CATTACCTGGATGAAACGGAGCAGTGGGAGAAGTTCGGCCTAGAGAAGCGGCAGGGGGC
CTTGGAGCTCATCAAGAAGGGGTACACCCAGCAGCTGGCCTTCAGACAACCCAGCTCTGC
CTTTGCGGCCTTCGTGAAACGGGCACCCAGCACCTGGCTGACCGCCTACGTGGTCAAGGT
CTTCTCTCTGGCTGTCAACCTCATCGCCATCGACTCCCAAGTCCTCTGCGGGGCTGTTAAA
TGGCTGATCCTGGAGAAGCAGAAGCCCGACGGGGTCTTCCAGGAGGATGCGCCCGTGAT
ACACCAAGAAAT GATT GGT GGATT ACGGAACAACAACGAGAAAGACATGGCCCTCACGGC
CTTTGTTCTCATCTCGCTGCAGGAGGCTAAAGATATTTGCGAGGAGCAGGTCAACAGCCTG
CCAGGCAGCATCACTAAAGCAGGAGACTTCCTTGAAGCCAACTACATGAACCTACAGAGAT CCTACACTGTGGCCATTGCTGGCTATGCTCTGGCCCAGATGGGCAGGCTGAAGGGGCCTC TTCTT AACAAATTTCT GACCACAGCCAAAGAT AAGAACCGCT GGGAGGACCCT GGT AAGCA GCTCTACAACGTGGAGGCCACATCCTATGCCCTCTTGGCCCTACTGCAGCTAAAAGACTTT GACTTTGTGCCTCCCGTCGTGCGTTGGCTCAATGAACAGAGATACTACGGTGGTGGCTAT GGCTCTACCCAGGCCACCTTCATGGTGTTCCAAGCCTTGGCTCAATACCAAAAGGACGCC CCTGACCACCAGGAACTGAACCTTGATGTGTCCCTCCAACTGCCCAGCCGCAGCTCCAAG ATCACCCACCGTATCCACTGGGAATCTGCCAGCCTCCTGCGATCAGAAGAGACCAAGGAA AATGAGGGTTTCACAGTCACAGCTGAAGGAAAAGGCCAAGGCACCTTGTCGGTGGTGACA ATGTACCATGCTAAGGCCAAAGATCAACTCACCTGTAATAAATTCGACCTCAAGGTCACCAT AAAACCAGCACCGGAAACAGAAAAGAGGCCTCAGGATGCCAAGAACACTATGATCCTTGA GATCT GT ACCAGGT ACCGGGGAGACCAGGATGCCACTAT GTCT AT ATTGGACAT AT CCAT G AT GACT GGCTTTGCTCCAGACACAGAT GACCTGAAGCAGCTGGCCAATGGTGTT GACAGA TACATCTCCAAGTATGAGCTGGACAAAGCCTTCTCCGATAGGAACACCCTCATCATCTACC T GG ACAAGGTCTCACACT CT GAGG AT G ACTGTCT AGCTTTC AAAGTT CACCAAT ACTTT AAT GT AGAGCTT AT CCAGCCTGGAGCAGT CAAGGT CT ACGCCT ATT ACAACCT GGAGGAAAGC TGTACCCGGTTCTACCATCCGGAAAAGGAGGATGGAAAGCTGAACAAGCTCTGCCGTGAT GAACT GTGCCGCT GTGCT GAGGAGAATT GCTTCATACAAAAGTCGGAT GACAAGGT CACC CTGGAAGAACGGCTGGACAAGGCCTGTGAGCCAGGAGTGGACTATGTGTACAAGACCCG ACTGGTCAAGGTTCAGCTGTCCAATGACTTTGACGAGTACATCATGGCCATTGAGCAGACC ATCAAGTCAGGCTCGGATGAGGTGCAGGTTGGACAGCAGCGCACGTTCATCAGCCCCATC AAGTGCAGAGAAGCCCTGAAGCTGGAGGAGAAGAAACACTACCTCATGTGGGGTCTCTCC TCCGATTTCTGGGGAGAGAAGCCCAACCTCAGCTACATCATCGGGAAGGACACTTGGGTG GAGCACTGGCCCGAGGAGGACGAATGCCAAGACGAAGAGAACCAGAAACAATGCCAGGA CCTCGGCGCCTTCACCGAGAGCATGGTTGTCTTTGGGTGCCCCAACTGACCACACCCCCA TTCCCCCACT CCAG AT AAAGCTT CAGTT AT AT CT CAAAAAAAAAAAAAAAAA
SEQ ID N° 4
MGPTSGPSLLLLLLTHLPLALGSPMYSIITPNILRLESEETMVLEAHDAQGDVPVTVTVHDFPGK
KLVLSSEKTVLTPATNHMGNVTFTIPANREFKSEKGRNKFVTVQATFGTQVVEKWLVSLQSGY
LFIQTDKTIYTPGSTVLYRIFTVNHKLLPVGRTVMVNIENPEGIPVKQDSLSSQNQLGVLPLSWDI
PELVNMGQWKIRAYYENSPQQVFSTEFEVKEYVLPSFEVIVEPTEKFYYIYNEKGLEVTITARFL
YGKKVEGTAFVIFGIQDGEQRISLPESLKRIPIEDGSGEWLSRKVLLDGVQNPRAEDLVGKSLY
VSATVILHSGSDMVQAERSGIPIVTSPYQIHFTKTPKYFKPGMPFDLMVFVTNPDGSPAYRVPV
AVQGEDTVQSLTQGDGVAKLSINTHPSQKPLSITVRTKKQELSEAEQATRTMQALPYSTVGNS
NNYLHLSVLRTELRPGETLNVNFLLRMDRAHEAKI RYYTYLIMNKGRLLKAGRQVREPGQDLW
LPLSITTDFIPSFRLVAYYTLIGASGQREWADSVWVDVKDSCVGSLWKSGQSEDRQPVPGQ
QMTLKIEGDHGARWLVAVDKGVFVLNKKNKLTQSKIWDWEKADIGCTPGSGKDYAGVFSDA
GLTFTSSSGQQTAQRAELQCPQPAARRRRSVQLTEKRMDKVGKYPKELRKCCEDGMRENPM RFSCQRRTRFISLGEACKKVFLDCCNYITELRRQHARASHLGLARSNLDEDIIAEENIVSRSEFP
ESWLWNVEDLKEPPKNGISTKLMNIFLKDSITTWEILAVSMSDKKGICVADPFEVTVMQDFFIDL
RLPYSWRNEQVEIRAVLYNYRQNQELKVRVELLHNPAFCSLATTKRRHQQTVTIPPKSSLSVP
YVIVPLKTGLQEVEVKAAVYHHFISDGVRKSLKWPEGIRMNKTVAVRTLDPERLGREGVQKED
IPPADLSDQVPDTESETRILLQGTPVAQMTEDAVDAERLKHLIVTPSGCGEQNMIGMTPTVIAVH
YLDETEQWEKFGLEKRQGALELIKKGYTQQLAFRQPSSAFAAFVKRAPSTWLTAYWKVFSLA
VNLIAIDSQVLCGAVKWLILEKQKPDGVFQEDAPVIHQEMIGGLRNNNEKDMALTAFVLISLQEA
KDICEEQVNSLPGSITKAGDFLEANYMNLQRSYTVAIAGYALAQMGRLKGPLLNKFLTTAKDKN
RWEDPGKQLYNVEATSYALLALLQLKDFDFVPPWRWLNEQRYYGGGYGSTQATFMVFQALA
QYQKDAPDHQELNLDVSLQLPSRSSKITHRIHWESASLLRSEETKENEGFTVTAEGKGQGTLS
WTMYHAKAKDQLTCNKFDLKVTIKPAPETEKRPQDAKNTMILEICTRYRGDQDATMSILDISM
MTGFAPDTDDLKQLANGVDRYISKYELDKAFSDRNTLIIYLDKVSHSEDDCLAFKVHQYFNVELI
QPGAVKVYAYYNLEESCTRFYHPEKEDGKLNKLCRDELCRCAEENCFIQKSDDKVTLEERLDK
ACEPGVDYVYKTRLVKVQLSNDFDEYIMAIEQTIKSGSDEVQVGQQRTFISPIKCREALKLEEKK
HYLMWGLSSDFWGEKPNLSYIIGKDTWVEHWPEEDECQDEENQKQCQDLGAFTESMVVFGC
PN
El término "LGALS4" (también llamado en la literatura GAL4; L36LBP) se refiere tanto al gen como a la proteína humana. Las galectinas son una familia de proteínas de unión a beta- galactósidos implicadas en la modulación de las interacciones célula-célula y célula-matriz. La expresión de este gen está restringida al intestino delgado, colon y recto, y está subexpresada en el cáncer colorrectal. En el contexto de la presente invención,“LGALS4” se define también por una secuencia de nucleótidos o polinucleótidos, que constituye la secuencia“LGALS4”, y que comprendería diversas variantes procedentes de: a) moléculas de ácido nucleico que codifican un polipéptido que comprende la secuencia aminoacídica de la SEQ ID NO: 6, b) moléculas de ácido nucleico cuya cadena complementaria híbrida con la secuencia polinucleotídica de a), c) moléculas de ácido nucleico cuya secuencia difiere de a) y/o b) debido a la degeneración del código genético, d) moléculas de ácido nucleico que codifican un polipéptido que comprende la secuencia aminoacídica con una identidad de al menos un 80%, un 90%, un 95%, un 98% o un 99% con la SEQ ID NO: 6 en las que el polipéptido codificado por dichos ácidos nucleicos posee la actividad y las características estructurales de la proteína LGALS4. Entre otras posibles secuencias nucleotídicas que codifican LGALS4 se encuentra, pero sin limitarse, la SEQ ID NO: 5.
Gene ID: 3960
Localización del gen: 19q13.2 SEQ ID N° 5
TGATCCATCCACCTCGGCCAGTCAAAGTGCTGGGATTACAGGCATGAGCCACTGCACCCA
GCCGATACTACTATATCCCCATTTTACAGATGAGCACATGGGCAAATTGAGGGTAAGGCAC
TGACCCATGATCATACAGCTGAGAAGTGGCAAAGGCAGGATTTGAACCTAGAACCTCTGG
CTCCACACACTAGT AAT CT AAACC ACTCTCCCT ACAAT ACAACAT ACGT GGT AAAG AT GTGT
GGTGGGCACGCAATCAACGTAGGTCCCTTCACAGTTGCTGGGAGAGGCAGGAATTTGCAG
TTCCTCCGCGTTCTCCTCCTCCGCTGCCCACCTGTCCTGGGTCATTCCTGCAGCCTGCCCT
GCCCTGCCTGGTCTCACCCTCCCTCTGCCAACAGAAGTCTGGGCAGGGTTTTATGGGCTC
TGATAAGGCCCTGGCAGGGCCGAAGTTCATGAGCACTTCCTCTTTGCAGGAGGGCGTAGG
GGAGGGGACCCAGGTGATTTGGGTCCTGGCTGGTCACCAGGGAAGCTGGCAAGGGAAGG
GAGACTAGGGTGCGCTCTAGGAGAAGCCGACAGCCTGAGAGTCCCAGAAGAGGAGCCCT
GTGGACCCTCCCCTGCCAGCCACTCCCTTACCCTGGGTATAAGAGCCACCACCGCCTGCC
ATCCGCCACCATCTCCCACTCCTGCAGCTCTTCTCACAGGACCAGCCACTAGCGCAGCCT
CGAGCGATGGCCTATGTCCCCGCACCGGGCTACCAGCCCACCTACAACCCGACGCTGCC
TTACTACCAGCCCATCCCGGGCGGGCTCAACGTGGGAATGTCTGTTTACATCCAAGGAGT
GGCCAGCGAGCACATGAAGCGGTGGTGGTAAATGGAAATCCCTTCTATGAGTACGGGCAC
CGGCTTCCCCTACAGATGGTCACCCACCTGCAAGTGGATGGGGATCTGCAACTTCAATCA
ATCAACTTCATCGGAGGCCAGCCCCTCCGGCCCCAGGGACCCCCGATGATGCCACCTTAC
CCT GGTCCCGGACATTGCCATCAACAGCT GAACAGCCT GCCCACCATGGAAGGACCCCCA
ACCTTCAACCCGCCTGTGCCATATTTCGGGAGGCTGCAAGGAGGGCTCACAGCTCGAAGA
ACCATCATCATCAAGGGCTATGTGCCTCCCACAGGCAAGAGCTTTGCTATCAACTTCAAGG
TGGGCTCCTCAGGGGACATAGCTCTGCACATTAATCCCCGCATGGGCAACGGTACCGTGG
TCCGGAACAGCCTTCTGAATGGCTCGTGGGGATCCGAGGAGAAGAAGATCACCCACAACC
CATTTGGTCCCGGACAGTTCTTTGATCTGTCCATTCGCTGTGGCTTGGATCGCTTCAAGGT
TTACGCCAATGGCCAGCACCTCTTTGACTTTGCCCATCGCCTCTCGGCCTTCCAGAGGGT
GG ACACATT GG AAATCCAGGGT G AT GTCACCTT GT CCTAT GTCCAGAT CT AATCTATTCCT
GGGGCCAT AACTCATGGGAAAACAGAATT AT CCCCT AGGACTCCTTTCT AAGCCCCT AAT A
AAAT GTCT G AGGGT GTCT CAT GA
SEQ ID N° 6 MVTHLQVDGDLQLQSINFIGGQPLRPQGPPMMPPYPGPGHCHQQLNSLPTMEGPPTFNPPVP
YFGRLQGGLTARRTIIIKGYVPPTGKSFAINFKVGSSGDIALHINPRMGNGTVVRNSLLNGSWGS
EEKKITHNPFGPGQFFDLSIRCGLDRFKVYANGQHLFDFAHRLSAFQRVDTLEIQGDVTLSYVQI
Este aspecto de la invención también se refiere a un método de obtención de datos útiles para predecir o pronosticar la respuesta al tratamiento del cáncer en un individuo con un agente antiangiogénico, que comprende: a) medir en una muestra biológica aislada el producto de expresión de COL1A2, C3, LGALS4
También se refiere a un método para predecir o pronosticar la respuesta al tratamiento del cáncer en un individuo con un agente antiangiogénico, que comprende el paso (a) anterior, y además comprende: b) asignar al individuo del paso a) al grupo de individuos que responden a terapia antiangiogénica cuando el producto de expresión de COL1A2, C3, LGALS4, o cualquiera de sus combinaciones presentan en dicho individuo niveles inferiores a las cantidades de referencia.
Los niveles de expresión de los genes van a dar un determinado perfil de expresión génica. El término "nivel", "nivel de expresión", también denominado "cantidad producto génico" o“producto de expresión” se refiere al material bioquímico, ya sea ARN o proteína, resultado de la expresión de un gen. Algunas veces se usa una medida de la cantidad de producto génico para inferir qué tan activo es un gen. Se entiende por "perfil de expresión génica" el perfil génico obtenido tras la cuantificación del ARNm y/o de proteína producida por los genes de interés o biomarcadores, es decir, por los genes empleados como marcadores biológicos en la presente invención, en una muestra biológica aislada. El perfil de expresión de los genes se realiza, preferiblemente, determinando el nivel de ARNm derivado de su transcripción, previa extracción del ARN total presente en la muestra biológica aislada, lo cual puede realizarse mediante protocolos conocidos en el estado de la técnica. La determinación del nivel de ARNm derivado de la transcripción de los genes empleados como marcadores biológicos en la presente invención, puede realizarse, por ejemplo, aunque sin limitarnos, mediante amplificación por reacción en cadena de la polimerasa (PCR), retrotranscripción en combinación con la reacción en cadena de la polimerasa (RT-PCR), RT-PCR cuantitativa (qPCR), retrotranscripción en combinación con la reacción en cadena de la ligasa (RT-LCR), o cualquier otro método de amplificación de ácidos nucleicos; análisis en serie de la expresión génica (SAGE, SuperSAGE); chips de ADN elaborados con oligonucleótidos depositados por cualquier mecanismo; microarrays de ADN elaborados con oligonucleótidos sintetizados in situ mediante fotolitografía o por cualquier otro mecanismo; hibridación in situ utilizando sondas específicas marcadas con cualquier método de mareaje; mediante geles de electroforesis; mediante transferencia a membrana e hibridación con una sonda específica; mediante resonancia magnética nuclear o cualquier otra técnica de diagnóstico por imagen utilizando nanopartículas paramagnéticas o cualquier otro tipo de nanopartículas detectables funcionalizadas con anticuerpos o por cualquier otro medio. El perfil de expresión génica también podría obtenerse mediante la detección y/o cuantificación de las proteínas producto de la traducción del ARNm derivado de la transcripción de los genes empleados como marcadores biológicos en la presente invención, mediante por ejemplo, pero sin limitarnos, inmunodetección por western blot. La detección cuantitativa de la expresión de los genes empleados como marcadores biológicos en la presente invención puede realizarse más preferiblemente mediante PCR en tiempo real (RT-PCR ó RTqPCR). La detección en tiempo real de los productos amplificados puede llevarse a cabo mediante la utilización de moléculas fluorescentes que se intercalan en el ADN de cadena doble o mediante hibridación con diferentes tipos de sondas.
Así pues, la detección de los niveles de proteínas o del nivel de expresión de los genes puede hacerse por cualquiera de las técnicas conocidas por el experto en la materia.
Los pasos del método descrito anteriormente pueden ser total o parcialmente automatizados, por ejemplo, por medio de un equipo robótico sensor para la detección de la presencia en el paso (a) o la clasificación computarizada en el paso (b).
En una realización preferida de este aspecto de la invención, la detección del paso (a) se realiza mediante PCR, preferiblemente RT-PCR.
En el caso de que se detecte el nivel o los niveles de proteínas puede hacerse, al igual que en el caso de los genes, por cualquiera de las técnicas conocidas por el experto en la materia. Así, en otra realización preferida de este aspecto de la invención, la detección de los niveles de expresión se realiza por una técnica inmunológica.
En una realización más preferida, las técnicas inmunológicas están basadas en reacciones de precipitación, de aglutinación, inmunomarcación, radioinmunoanálisis y técnicas radioinmunométricas, preferentemente ELISA (Enzime Linked ImmunoadSorbent Assay), o Western blot o en cualquiera de sus combinaciones
Otro aspecto de la invención, se refiere a un kit o dispositivo, de ahora en adelante kit o dispositivo de la invención, que comprende los elementos necesarios para detectar los niveles de expresión de COL1A2, C3, LGALS4, o cualquiera de sus combinaciones , y donde:
- los cebadores o primers son secuencias de polinucleótidos de entre 10 y 30 pares de bases, más preferiblemente de entre 15 y 25 pares de bases, aún más preferiblemente de entre 18 y 22 pares de bases, y aún mucho más preferiblemente de alrededor de 20 pares de bases, que presentan una identidad de al menos un 80%, más preferiblemente de al menos un 90%, aún más preferiblemente de al menos un 95%, aún mucho más preferiblemente de al menos un 98%, y particularmente de un 100%, con un fragmento de las secuencias complementarias a la SEQ ID N° 1 ( COL1A2 ), SEQ ID N°: 3 (R C3), y/o SEQ ID N° 5 (LGALS4),
- las sondas son secuencias de polinucleótidos de entre 80 y 1 100 pares de bases, más preferiblemente de entre 100 y 1000 pares de bases, y aún más preferiblemente de entre 200 y 500 pares de bases, que presentan una identidad de al menos un 80%, más preferiblemente de al menos un 90%, aún más preferiblemente de al menos un 95%, aún mucho más preferiblemente de al menos un 98%, y particularmente de un 100%, con un fragmento de las secuencias complementarias a la SEQ ID N° 1 ( COL1A2 ), SEQ ID N°: 3 ( R C3), y/o SEQ ID N°
5 {LGALS4),
- los anticuerpos son capaces de unirse específicamente a una región formada por cualquiera de las secuencias aminoacídicas SEQ ID N° 2 ( COL1A2 ), SEQ ID N°: 4 (R C3), y/o SEQ ID N°
6 {LGALS4),
En otra realización preferida de este aspecto de la invención, los cebadores, sondas o anticuerpos están modificados o marcados, por ejemplo, pero sin limitarnos, mediante un mareaje radiactivo o inmunológico. Así, preferiblemente, los oligonucleótidos presentan modificaciones en alguno de sus nucleótidos, como por ejemplo, pero sin limitarnos a, nucleótidos que tengan alguno de sus átomos con un isótopo radiactivo, normalmente 32P o tritio, nucleótidos marcados inmunológicamente, como por ejemplo con una molécula de digoxigenina, y/o inmovilizadas en una membrana. Varias posibilidades son conocidas en el estado de la técnica.
MÉTODOS DE LA INVENCIÓN
Un segundo aspecto de la invención se refiere a un método de obtención de datos útiles para predecir o pronosticar la respuesta al tratamiento del cáncer en un individuo con un agente antiangiogénico, de ahora en adelante primer método de la invención, que comprende: a) identificar el valor del ratio m/z de las proteínas en una muestra aislada de un individuo
En una realización preferida de este aspecto de la invención el cáncer se selecciona de entre cáncer colorrectal, cáncer de mama, en cáncer de pulmón no microcítico, cáncer de riñón, en cáncer de ovario y cáncer de cuello de útero, o cualquiera de sus combinaciones.
En otra realización preferida de este aspecto de la invención, el agente antiangiogéncio se selecciona de entre ranibizumab, el bevacizumab y el aflibercept, nintedanib, infigratinib, rogaratinib , carotuximab, trebananib, abituzumab, pazopanib, pembrolizumab, pegdinetanib, Henatinib, lestaurtinib, apricoxib, vatalanib, o cualquiera de sus combinaciones. Más preferiblemente el medicamento antiangiogénico es el bevacizumab. Una "muestra biológica" tal como se define aquí, es una pequeña parte de un sujeto, representativa del conjunto y puede estar constituida por una biopsia o una muestra de fluido corporal. Las biopsias son pequeñas piezas de tejido y pueden ser frescas, congeladas o fijas, como fijada con formalina y embebidas en parafina ( formalin - fixed and paraffin embedded FFPE). Muestras de fluidos corporales pueden ser sangre, plasma, suero, orina, esputo, líquido cefalorraquídeo, leche o muestras de fluido ductal y pueden asimismo ser frescos, congelados o fijados. Las muestras se pueden extirpar quirúrgicamente, mediante extracción, es decir, con agujas hipodérmicas o de otro tipo, por microdisección o captura láser. La muestra debe contener cualquier material biológico adecuado para detectar el marcador, biomarcador o biomarcadores deseado/s, por lo tanto, dicha muestra debe comprender ventajosamente material de las células del sujeto. Por lo tanto, en una realización particular, la muestra es una biopsia de tejido tumoral.
En otra realización preferida de este aspecto de la invención, la muestra es tejido tumoral, y más preferiblemente está embebida en parafina.
En la presente invención se entiende por "pronóstico" la evolución esperada de una enfermedad y se refiere a la valoración de la probabilidad según la cual un sujeto padece una enfermedad así como a la valoración de su inicio, estado de desarrollo, evolución, o de su regresión, y/o el pronóstico del curso de la enfermedad en el futuro. Como entenderán los expertos en la materia, tal valoración, aunque se prefiere que sea, normalmente puede no ser correcta para el 100% de los sujetos que se van a diagnosticar. El término, sin embargo, requiere que una parte estadísticamente significativa de los sujetos se pueda identificar como que padecen la enfermedad o que tienen predisposición a la misma. Si una parte es estadísticamente significativa se puede determinar sin más por el experto en la materia usando varias herramientas de evaluación estadística bien conocidas, por ejemplo, determinación de intervalos de confianza, determinación de valores p, prueba de la t de Student, prueba de Mann-Whitney, etc. Los intervalos de confianza preferidos son al menos el 50%, al menos el 60%, al menos el 70%, al menos el 80%, al menos el 90%, al menos el 95%. Los valores de p son, preferiblemente, 0,2, 0, 1 , 0,05. A su vez, atendiendo al método de la presente invención, se podrían establecer otras subclasificaciones dentro de esta principal, facilitando, por tanto, la elección y el establecimiento de regímenes terapéuticos o tratamiento adecuados. Esta discriminación tal y como es entendida por un experto en la materia no pretende ser correcta en un 100% de las muestras analizadas. Sin embargo, requiere que una cantidad estadísticamente significativa de las muestras analizadas sean clasificadas correctamente. La cantidad que es estadísticamente significativa puede ser establecida por un experto en la materia mediante el uso de diferentes herramientas estadísticas, por ejemplo, pero sin limitarse, mediante la determinación de intervalos de confianza, determinación del valor significación P, test de Student o funciones discriminantes de Fisher, medidas no paramétricas de Mann Whitney, correlación de Spearman, regresión logística, regresión lineal, área bajo la curva de ROC (AUC). Preferiblemente, los intervalos de confianza son al menos del 90%, al menos del 95%, al menos del 97%, al menos del 98% o al menos del 99%. Preferiblemente, el valor de p es menor de 0, 1 , de 0,05, de 0,01 , de 0,005 o de 0,0001. Preferiblemente, la presente invención permite detectar correctamente la enfermedad de forma diferencial en al menos el 60%, más preferiblemente en al menos el 70%, mucho más preferiblemente en al menos el 80%, o aún mucho más preferiblemente en al menos el 90% de los sujetos de un determinado grupo o población analizada.
Un“individuo” o "sujeto", como se usa aquí, se refiere a un mamífero, humano o no humano, en observación, y más preferiblemente un ser humano. El individuo puede ser cualquiera, un individuo predispuesto a una enfermedad (por ejemplo cáncer de colon) o un individuo que padece dicha enfermedad.
Una "muestra de referencia", como se usa aquí, significa una muestra obtenida de los individuos, preferiblemente dos o más individuos, de los que se sabe que están libres de la enfermedad (cáncer de colon) y/o, alternativamente, de la población sana. Los niveles adecuados de referencia de los marcadores se pueden determinar mediante la medición de los niveles de dichos marcadores en varios individuos adecuados, y tales niveles de referencia se pueden ajustar para poblaciones de individuos o sujetos específicos. En una realización preferida, la muestra de referencia se obtiene de un grupo de individuos o sujetos sanos o de sujetos sin historia previa de cáncer de colon. El perfil de niveles de marcadores en la muestra de referencia puede, preferiblemente, generarse a partir de una población de dos o más individuos; por ejemplo, la población puede comprender 3, 4, 5, 10, 15, 20, 30, 40, 50 o más individuos o sujetos.
La determinación de los marcadores se puede hacer por cualquier medio conocido por el experto en la materia. En una realización preferida, las determinaciones se han realizado por métodos de espectrometría de masas.
En esta memoria se entiende por“agente antiangiogénico” agentes inhibidores del factor de crecimiento endotelial vascular (VEGF). Más preferiblemente, los agentes inhibidores del factor de crecimiento endotelial vascular (VEGF) se seleccionan de la lista que consiste en Bevacizumab y Ranibizumab. Aún más preferiblemente, el agente antiangiogénico es el Bevacizumab
Un tercer aspecto de la invención se refiere a un método para predecir o pronosticar la respuesta al tratamiento del cáncer en un individuo con un agente antiangiogénico, de ahora en adelante segundo método de la invención, que comprende los pasos del primer método de la invención, y además b) asignar al individuo del paso a) al grupo de individuos que responden a terapia antiangiogenica cuando: los valores m/z 666, 816, 855 y 884, o cualquiera de sus combinaciones presentan en dicho individuo niveles inferiores a las cantidades de referencia. En una realización preferida de este aspecto de la invención el cáncer se selecciona de entre cáncer colorrectal, cáncer de mama, en cáncer de pulmón no microcítico, cáncer de riñón, en cáncer de ovario y cáncer de cuello de útero, o cualquiera de sus combinaciones.
En otra realización preferida de este aspecto de la invención, el agente antiangiogéncio se selecciona de entre ranibizumab, el bevacizumab y el aflibercept, nintedanib, infigratinib, rogaratinib , carotuximab, trebananib, abituzumab, pazopanib, pembrolizumab, pegdinetanib, Henatinib, lestaurtinib, apricoxib, vatalanib, o cualquiera de sus combinaciones. Más preferiblemente es el bevacizumab.
Una "muestra de referencia", como se usa aquí, significa una muestra obtenida de un grupo de sujetos sanos que no tiene un estado de enfermedad o fenotipo particular.
Los niveles de referencia pueden ser determinada mediante la medición de los niveles de expresión de dichos genes en varios temas adecuados, y esos niveles de referencia se puede ajustar a las poblaciones específicas (por ejemplo, un nivel de referencia puede estar relacionada con la edad, por lo que las comparaciones se puede hacer entre los niveles de expresión en las muestras de los sujetos de una cierta edad y niveles de referencia para una enfermedad particular, el fenotipo, o falta de ella en un determinado grupo de edad). En una realización preferida, la muestra de referencia se obtiene de varios sujetos en general, o de sujetos no respondedores a los agentes antiangiogénicos, preferiblmenete al bevacizumab. El experto en la técnica apreciará que el tipo de muestra de referencia puede variar dependiendo del método específico a realizar.
El perfil de expresión de los genes en la muestra de referencia de preferencia puede ser generado a partir de una población de dos o más personas. La población, por ejemplo, pueden contener 3, 4, 5, 10, 15, 20, 30, 40, 50 o más personas. Además, el perfil de expresión de los genes en la muestra de referencia y en la muestra de la persona que va a ser diagnosticada de acuerdo con los métodos de la presente invención pueden ser generados a partir de la misma persona, siempre que los perfiles sean analizados y el perfil de referencia son generados a partir de las muestras biológicas tomadas en diferentes momentos y se comparan entre sí. Por ejemplo, una muestra de un individuo puede obtener en el inicio de un período de estudio. Un perfil de marcador biológico de referencia de esta muestra se puede comparar con los perfiles de biomarcadores generados a partir de las muestras posteriores de la misma persona. En una realización preferida, la muestra de referencia es un conjunto de muestras de varios individuos.
Una vez que los niveles de expresión de los genes marcadores en relación con los valores de referencia para dichos genes se han determinado, es necesario identificar si existen alteraciones en la expresión de dichos genes (aumento o disminución de la expresión). La expresión de un gen se considera aumentada en una muestra de la materia objeto de estudio cuando los niveles de incremento con respecto a la muestra de referencia son al menos de un 5%, por lo menos 10%, por lo menos 15%, por lo menos el 20%, al menos un 25%, por lo menos 30%, por lo menos el 35%, por lo menos el 40%, por lo menos 45%, por lo menos el 50%, por lo menos el 55%, por lo menos el 60%, por menos por lo menos 65%, por lo menos el 70%, por lo menos el 75%, por lo menos el 80%, por lo menos el 85%, por lo menos el 90%, por lo menos el 95%, por lo menos 100%, por lo menos 1 10 %, por lo menos 120%, por lo menos 130%, por lo menos 140%, por lo menos 150%, o más. Del mismo modo, la expresión de un gen se considerada disminuida cuando sus niveles disminuyen con respecto a la muestra de referencia en al menos un 5%, por lo menos 10%, por lo menos 15%, por lo menos el 20%, por lo menos el 25%, al menos un 30%, por lo menos el 35%, por lo menos el 40%, por lo menos 45%, por lo menos el 50%, por lo menos el 55%, por lo menos el 60%), por lo menos el 65%, por lo menos 70%, por lo menos el 75%, por lo menos el 80%, por lo menos el 85%, por lo menos el 90%, por lo menos el 95%, por lo menos 100% (es decir, ausente).
USOS MÉDICOS DE LA INVENCIÓN
Otro aspecto de la invención se refiere a un agente anti-EGFR (receptor del factor de crecimiento epidérmico) para su uso en el tratamiento de un individuo identificado como no respondedor a agentes antiangiogénicos, y más preferiblemente como no respondedor al becizumab, identificado por cualquiera de los métodos de la invención, y que además se ha identificado como wildtype para RAS. En una realización preferida de este aspecto de la invención, el agente anti- EGFR se selecciona de entre cetuximab o panitumumab.
La existencia de mutaciones en los exones 2, 3 y 4 del gen KRAS y los exones 2 y 3 (así como probablemente el exón 4) del gen NRAS, se vincula con ausencia de beneficios con la administración de inhibidores del EGFR, como panitumumab y cetuximab. Por lo tanto, otro aspecto de la invención se refiere a la quimioterapia triple de irinotecan + oxaliplatino + 5- fluorouracilo para su uso en el tratamiento de un individuo identificado como no respondedor a agentes antiangiogénicos, y más preferiblemente como no respondedor al becizumab, identificado por cualquiera de los métodos de la invención, y que además se ha identificado como individuo mutado en RAS.
AUTOMATIZACIÓN DEL MÉTODO DE LA INVENCIÓN IMPLEMENTÁNDOLO EN UN PROGRAMA DE ORDENADOR
Otro aspecto de la invención se refiere a un programa de ordenador que comprende instrucciones para realizar el procedimiento de acuerdo con cualquiera de los métodos de la invención. En particular, la invención abarca programas de ordenador dispuestos sobre o dentro de una portadora. La portadora puede ser cualquier entidad o dispositivo capaz de soportar el programa. Como variante, la portadora podría ser un circuito integrado en el que va incluido el programa y que se haya adaptado para ejecutar, o para ser utilizado en la ejecución de los procesos correspondientes.
Por ejemplo, los programas podrían estar incorporados en un medio de almacenamiento, como una memoria ROM, una memoria CD ROM o una memoria ROM de semiconductor, una memoria USB, o un soporte de grabación magnética, por ejemplo, un disco flexible o un disco duro. Alternativamente, los programas podrían estar soportados en una señal portadora transmisible; por ejemplo, podría tratarse de una señal eléctrica u óptica que podría transportarse a través de cable eléctrico u óptico, por radio o por cualesquiera otros medios.
La invención se extiende también a programas de ordenador adaptados para que cualquier medio de procesamiento pueda llevar a la práctica los métodos de la invención. Los programas de ordenador también abarcan aplicaciones en la nube basadas en dicho procedimiento.
Otros aspectos de la invención se refieren al medio de almacenamiento legible y a la señal transmisible que comprende instrucciones de programa necesarias para la ejecución del método de invención por un ordenador.
A lo largo de la descripción y las reivindicaciones la palabra "comprende" y sus variantes no pretenden excluir otras características técnicas, aditivos, componentes o pasos. Para los expertos en la materia, otros objetos, ventajas y características de la invención se desprenderán en parte de la descripción y en parte de la práctica de la invención. Los siguientes ejemplos y dibujos se proporcionan a modo de ilustración, y no se pretende que sean limitativos de la presente invención.
EJEMPLOS DE LA INVENCIÓN
En este trabajo, se realizó un estudio retrospectivo de pacientes con cáncer colorrectal metastásico tratados con bevacizumab y quimioterapia en el Servicio de Oncología del Hospital Reina Sofía de Córdoba, tras la aprobación del comité de ética de dicha institución y el consentimiento informado de los pacientes, con el propósito de generar un clasificador con capacidad de predecir la respuesta a tratamiento antiangiogénico con bevacizumab.
Para ello se desarrolló en primer lugar un agrupamiento por Shrunken Centroid spatially-aware para definir el tejido tumoral del conjunto completo, con el posterior análisis de los datos proteómicos de todos los tumores empleando diferentes algoritmos de clasificación con el objeto de predecir el tiempo de fallo de terapia antiangiogénica con una alta sensibilidad y especificidad. Ejemplo 1. Materiales y métodos
Diseño experimental y fundamento estadístico
Todos los pacientes incluidos en el estudio cumplían los siguientes criterios de inclusión: mayores de 18 años, elegibilidad para recibir tratamiento antiangiogénico con bevacizumab para el tratamiento de enfermedad avanzada y disponibilidad de datos clínico-patológicos. Las características de los pacientes incluidos en este estudio se enumeran en la Tabla I. El análisis incluyó muestras de tejido tumoral fijada con formalina y embebidas en parafina (formalin- fixed and paraffin embedded FFPE) o tejidos tumorales FFPE que se obtuvieron del Biobanco del Sistema Público de Salud de Andalucía, después de proporcionar el correspondiente consentimiento informado firmado de cada paciente. En total, se analizaron 29 muestras de 20 pacientes, correspondientes a lesiones tumorales primarias y/o metastásicas. 12 muestras fueron de pacientes tratados durante menos de 12 meses y 17 corresponden a pacientes tratados durante más de 12 meses o que han sido rescatados por resección quirúrgica de metástasis. Los tejidos tumorales FFPE se procesaron como se describe a continuación y se analizaron por MALDI-MSI. Mediante un análisis no supervisado se seleccionaron regiones tumorales que contenían 3484 espectros en promedio (desde 598 a 11003 espectros). El espectro medio de cada tumor extraído fue entonces pre-procesado y utilizado para probar varias metodologías de clasificación con el fin de descubrir nuevos biomarcadores. Distinguir las muestras de los pacientes respondedores de las muestras de los pacientes no respondedores puede considerarse como un problema de clasificación o un problema de aprendizaje supervisado. Muchos métodos se han desarrollado para este propósito, y algunos de ellos han probado su capacidad para hacer frente a datos complejos y de alta dimensión. Se seleccionaron cuatro de estos métodos: Máquinas de Vectores de Soporte (SVM), Random Forest (RF), Análisis discriminante cuadrados mínimos parciales (PLS-DA) y Nearest Shrunken Centroid (NSC). Todos estos enfoques han demostrado un buen desempeño en numerosas tareas de aprendizaje del mundo real, cada uno con sus respectivas características. RF es una técnica no paramétrica basada en la generación de varios árboles de decisión individuales que se combinan para determinar el resultado final. RF es bien conocido por su capacidad para funcionar eficientemente en grandes conjuntos de datos con baja propensión a exceso de ajuste. Los modelos SVM suelen producir un límite de decisión entre los puntos de datos, transformando los datos originales en una nueva versión del espacio de entrada original. SVM ha sido ampliamente utilizado debido a su eficacia en el manejo de datos ruidosos. PLS-DA implica la derivación de variables latentes que maximizan la covarianza entre las variables independientes y su correspondiente variable dependiente. Por lo tanto, la predicción se permite mediante la búsqueda de un subespacio lineal de las variables explicativas. PLS-DA se comporta bien con datos altamente colineales y ruidosos. NSC es un método de clasificación popular para datos de alta dimensión donde la clasificación se basa en la distancia escalada entre las muestras y los centroides de clase. En NSC los centroides de clase se reducen al centroide general. NSC incorpora un mecanismo de selección variable, que es generalmente útil en predicción de clases de alta dimensionalidad.
Se seleccionó un enfoque probabilístico para cada modelo, permitiendo el posterior análisis de la curva ROC. Las curvas ROC muestran la relación de verdaderos positivos (sensibilidad) a la fracción de falsos positivos (1 - especificidad) en función de un umbral variable. Se utilizó una validación cruzada de diez veces para evaluar las medidas de rendimiento de generalización esperadas. La optimización de parámetros para cada uno de los cuatro modelos se realizó utilizando el método de búsqueda aleatoria por defecto implementado en Caret.
Finalmente, como forma de reforzar la metodología de clasificación, se identificó el m/z más relevante obtenido a través de LC-MS/MS. Como MS/MS no se utilizó con fines cuantitativos, pero sí para la identificación de péptidos y proteínas correspondientes a los picos m/z obtenidos a partir de análisis de clasificación de los datos MALDI-MSI, no se realizaron replicas de la muestra procesada o del control.
Todos los datos brutos de espectrometría de masas MALDI (incluyendo la tinción histológica hematoxilina y eosina de las muestras) y LC-MS / MS fueron sometidos a consorcio ProteomeXchange (número de registro PXD006261).
Tabla I. Características clínico-patológicas de los pacientes.
Característica Número
Edad (años, promedio ±SD) 60.5±8.5
Tumores primaries o recidivas 19
Tumores metastásicos 10
T (X/1/2/3/4) 4/0/ 1/9/6
Clasificación TNM (en el
momento del N (X/0/1/2) 4/6/2/8
diagnóstico)
M (0/1) 9/11
T: tamaño o extensión del tumor primario (X: no puede determinarse, 1 : el tumor invade la submucosa, 2: el tumor invade la muscularis propria, 3: el tumor atraviesa la muscularis propia hasta los tejidos pericolorrectales, 4: el tumor perfora el peritoneo.
N: metástasis regional nodular (X: los nodulos linfáticos regionales afectados no se pueden determinar, 0: no hay metástasis nodular, 1 : metástasis de uno a tres nodulos, 2: metástasis en cuatro o más nodulos.
M : metástasis a distancia (0: sin metástasis a distancia, 1 : con metástasis a distancia)
Procesamiento de muestras
Las secciones de los tejidos de FFPE se cortaron a 5 pm de espesor y se montaron sobre un portaobjetos de óxido de indio y estaño (ITO, Sigma Aldrich, Steiheim, Alemania) previamente recubierta con poli-L-lisina (P1274-25mg, Sigma Aldrich, Steiheim, Alemania) con un corto protocolo personalizado (0, 1 mg/ml poli L-Lys, 37°C, 1 hora). Las muestras montadas se calentaron durante 1 hora a 65°C con el fin de aumentar la fijación de tejido en el porta de ITO. Después de esto, se realizó un protocolo estándar de desparafinación/rehidratación según: lavados de xileno de 10 min (x2), 4 pasos con etanol decrecientes, 5 minutos cada uno (100%, 96%, 80% y 70%) y una etapa de lavado final con agua desionizada durante 5 minutos. Las etapas de recuperación de antígeno se realizaron calentando las muestras rehidratadas en citrato de sodio pH 10 mM (AD7-950-270-0500, Enzo, Farmingdale, NY, EE.UU.) a 98°C durante 30 minutos. Después se dejaron enfriar las muestras a temperatura ambiente hasta alcanzar una temperatura mínima de 40°C. Los últimos pasos previos a la digestión tisular fueron 2 etapas de lavado con tampón NH4HC03 10 mM y una etapa de secado en vacío durante 30 min.
Digestión en el tejido v deposición de matriz
La digestión en el tejido de cada muestra se realizó pulverizando 4 capas de tripsina (V51 11 , Promega, Madison, Wl, USA), 0,1 ug/uL en NH4HC03 25 mM, TFE al 10%, a un flujo de 10 uL/min con un pulverizador SunCollect (Sunchrom, Alemania). Posteriormente, las muestras se dejaron overnight a 37°C en una cámara húmeda saturada. Una vez terminada la digestión en el tejido, las placas se secaron al vacío durante 30 minutos antes de la deposición de la matriz.
Para la deposición de la matriz se utilizó una solución a base de ácido a-ciano-4-hidroxicinámico, CHCA (70990, Sigma Aldrich, Steiheim, Alemania) (7 mg/ml 60% ACN 0,2% TFA). El Glu- Fibrinopeptídio interno adicional de calibración (Sigma Aldrich, Steiheim, Alemania) se añadió a la solución de matriz a una concentración final de 625 fmol/ml. La solución de matriz final se pulverizó usando el pulverizador Suncollect en 8 capas como sigue: primera capa a 10 pL/min, segunda capa a 20 mI/min, tercera capa a 30 pL/min y cuarta capa a octava capa a 45 pL/min, todos ellos en el eje a z igual a 27,05. Una vez completado, los portaobjetos se secaron al vacío de nuevo durante 30 minutos antes de su análisis en el espectrómetro de masas.
Imágenes espectrometría de masas MALDI El análisis de las muestras se realizó utilizando un AB 5800 TOF/TOF (ABSciex, Darmstadt, Alemania). Todos los portaobjetos se montaron en una placa adaptadora lista para la obtención de imágenes por espectrometría de masas (imagen HTX, Chapel Hill, EE.UU.). Se utilizó un modo de reflector positivo para todas las muestras que realizaban una calibración interna doble de los espectros usando pico de autolisis de tripsina de primera instancia 842.508 [M + H]+ y segundo pico de Glu-Fibrinopetide a 1570.677 [M + H]+. El rango m/z para todas las muestras se definió de 650 a 1800 porque el 80% de los péptidos visualizados de estas muestras estaban en este intervalo. Otros parámetros fueron fijados para todas las muestras: la intensidad del láser se fijó a 3200, la extracción de retardo se fijó en 450ns y la cantidad de disparos por píxel sobre la muestra a 150. Los 20 primeros disparos fueron descartados para evitar el ruido de fondo de la muestra. Los parámetros de los deflectores se ajustaron para cada muestra para asegurar una resolución (FWHW)>15000 a la masa de GluFib.
Los conjuntos de datos MSI fueron adquiridos utilizando el software de adquisición de imágenes TOFTOF (ABSciex) utilizando una resolución espacial fija de 150 pm para todas las muestras, ya que esta resolución permite un análisis correcto que distingue diferentes características histológicas.
Segmentación espacial v micro-disección virtual
Para el análisis sin supervisión de datos espectrales se utilizaron métodos implementados en el paquete R Cardinal MSI. Primero, los datos fueron normalizados por la corriente iónica total (TIC). A continuación, para optimizar el tiempo computacional, se escogieron los espectros para reducir la dimensionalidad. Concretamente, se realizó la selección de picos en el décimo espectro de masas para buscar picos con una ratio señal-ruido no inferior a 10. A continuación, estos picos se alinearon con los máximos locales en el espectro medio (con un error del +/- 25 ppm) y filtrado para eliminar aquellos que ocurrieron en menos del 1 % de los píxeles. Finalmente, la lista de picos se utilizó para recorrer el conjunto de datos normalizado completo y recuperar los picos identificados de todos los píxeles. Después de esta etapa de pre-procesamiento, las muestras fueron segmentadas espacialmente utilizando Shrunken Centroid spatially-aware structurally- adaptive (SASA) (SASA) implementado en Cardinal MSI. El radio de suavizado se estableció en 1. El número inicial de clases (parámetro k) se fijó en 15 y 20. El parámetro de contracción se fijó en 0, 3, 6 y 9. De los 8 modelos diferentes generados, el que mejor se definió el tejido tumoral, según el criterio de un patólogo experimentado, se seleccionó para la subsiguiente micro- disección.
Cuando se utiliza el Cardinal MSI para segmentar espacialmente la muestra, a cada píxel se le asigna una variable correspondiente a la clase a la que pertenece. Para virtualmente microdiseccionar el tejido tumoral, esta variable fue reasignada a los datos espectrales crudos y luego la clase o clases correspondientes a la región del tumor fueron subconjunto usando métodos generales implementados en el ambiente R.
Pre-procesamiento de datos para análisis de clasificación
El conjunto completo de los espectros de tejido tumoral se cargó en el software de estadística R (R Foundation for Statistical Computing). El paquete Cardinal MSI se utilizó para el procesamiento de datos, que incluye la normalización de la corriente de iones totales de cada espectro, la línea de base de reducción y el nuevo muestreo. Se utilizaron herramientas básicas del lenguaje de programación R para obtener un espectro promedio de cada región de interés (ROI) para la clasificación posterior y para realizar, cuando se indique, un análisis de correlación. Las variables con mayor correlación absoluta media fueron eliminadas de cada par correlacionado (cutoff>0,9) utilizando la función findCorrelation del paquete Caret.
Preparación de la muestra para el análisis de LC-MS/MS
Las proteínas se aislaron a partir de una muestra de FFPE con el kit de tejido Qproteome FFPE siguiendo las especificaciones del fabricante. Las muestras se limpiaron para eliminar contaminantes mediante precipitación de proteínas con TCA/acetona y se solubilizaron en 50 pl de RapiGest SF al 0,2% (Waters, Milford, MA, EE.UU.) en bicarbonato de amonio 50 mM. El contenido de proteína total se midió utilizando el Kit de ensayo Qubit Protein (Thermo Fisher Scientific, Waltham, MA, EE.UU.) y 50 pg de proteína se sometieron a digestión con tripsina siguiendo un protocolo adaptado de Vowinckel et al. Brevemente, las muestras de proteína se incubaron con DTT 5 mM a 60°C durante 30 min, y luego con yodoacetamida 10 mM a temperatura ambiente y oscuridad durante 30 min. Se añadió tripsina modificada de grado de secuenciación (Promega, Madison, Wl, EE. UU.) En dos etapas, incubando a 37°C durante 2 horas en el primer paso y durante 15 horas en el segundo paso. RapiGest se precipitó después por centrifugación tras incubación con TFA al 0,5% a 37°C durante 1 hora. El volumen final se ajustó con agua miliQ y ACN hasta una concentración final de 0,5 pg de péptido/pl, 2,25% de ACN y 0,2% de TFA.
Análisis de LC-MS/MS
Las soluciones de péptido se analizaron mediante un enfoque de adquisición dependiente de datos (DDA) por nano-LC-MS/MS. Cada muestra (2 pl) se separó en un sistema nano-LC Ekspert nLC415 (Eksigent, Dublín, CA, EE.UU.) usando una columna Acclaim PepMap C18 (75 pm x 25 cm, 3 pm, 100 °A) (Thermo Fisher Scientific) a un caudal de 300 nl/min. Se usaron agua y ACN, ambos conteniendo ácido fórmico al 0, 1 %, como disolventes A y B, respectivamente. La carrera de gradiente consistió en 5% a 30% de B en 120 minutos, 10 minutos a 90% de B y finalmente 20 minutos a 5% de B para el equilibrado de la columna, en un tiempo de funcionamiento total de 150 min. A medida que los péptidos se eluyeron, se inyectaron directamente en un espectrómetro de masas TOF híbrido quadripolar Triple TOF 5600+ (Sciex, Redwood City, CA, EE.UU.) operando con un sistema de adquisición dependiente de datos "top 65" usando modo de iones positivos. Se utilizó una fuente ESI NanoSpray III (Sciex) para la interfaz entre nLC y MS, aplicando un voltaje de 2.600 V. El modo de adquisición consistió en una exploración MS de 250 ms de exploración de 350 a 1.250 m/z, seguida de una exploración MS/MS de 230 a 1.700 m/z (60 ms de tiempo de adquisición, energía de colisión de rodadura) de los 65 iones precursores superiores de la exploración de la encuesta, lo que hace un tiempo de ciclo total de 4,2 s. Los precursores fragmentados se añadieron después a una lista de exclusión dinámica durante 15 s; cualquier ión cargado individualmente se excluyó del análisis MS/MS.
La lista de picos fue generada por el software Protein Pilot (versión 5.0.1 , Sciex). Las identificaciones de péptidos y proteínas se realizó usando el Algoritmo Paragon como motor de búsqueda (incluido en el software Protein Pilot) con una base de datos humana Swiss-Prot diana- reversa concatenada (fecha de lanzamiento: marzo de 2016) que contiene 20200 secuencias de proteínas diana. La yodoacetamida se especificó como alquilación de Cys. La tasa de falso descubrimiento (FDR) se fijó en 0,01 tanto para los péptidos como para las proteínas. Otros ajustes (número de cortes perdidos y no específicos permitidos, modificaciones variables, tolerancia de masa para iones precursores y fragmentos de iones, etc) se optimizaron automáticamente especificando Triple TOF 5600 + como dispositivo de espectrómetro de masas.
Ejemplo 2. Resultados
La segmentación de centroides Spatially-aware Shrunken permite una microdisección eficaz de los tejidos tumorales colorrectales
Antes de generar el clasificador, se seleccionaron las áreas tumorales de muestras enteras de cáncer colorrectal. Para lograr este objetivo se utilizaron los espectros proteómicos generados por MALDI-MSI. Los datos de todas las muestras se pretrataron como se describe en la presente memoria. Como se muestra en la Figura 1 , el método de centroides shrunken SASA fue capaz de agrupar píxeles en diferentes segmentos en función de sus características moleculares intrínsecas. A través del parámetro shrinkage (s), el algoritmo de centroide shrunken redujo automáticamente el número de m/z relevantes utilizados para definir un segmento. Como consecuencia, el número de segmentos también se redujo (véanse los modelos s = 0 a 9 en la Figura 1). Comparando los modelos de segmentación con tinción con hematoxilina y eosina se pudo microdiseccionar la región tumoral de la muestra seleccionando uno o más segmentos. Los datos espectrales obtenidos de estos segmentos tumorales se utilizaron para el análisis de clasificación subsiguiente.
Diferentes algoritmos clasifican las muestras tumorales según su respuesta a la terapia antianqioqénica. La Tabla II muestra los resultados de rendimiento validados (IC del 95%) para los cuatro métodos aplicados para la clasificación utilizando dos conjuntos diferentes de características. En primer lugar, se consideró el espectro medio completo que empleaba 1.149 características después del remuestreo para cada región tumoral. Sin embargo, ninguna de las metodologías dio un buen desempeño de clasificación, siendo SVM el peor método. Aunque RF, PLS-DA y NSC mostraron un área bajo la curva (AUC) alrededor de 0,8, sus parámetros de sensibilidad y especificidad fueron menores de lo deseado para un buen modelo de clasificación. Por lo tanto, con el fin de mejorar los resultados de rendimiento, valores muy m/z correlacionados fueron descartados ya que la información altamente redundante podría empeorar la clasificación y el rendimiento de predicción. Después de quitar características correlacionadas, 23 m/z fueron utilizados para clasificar las muestras. Como se muestra en la Tabla II, el rendimiento de clasificación mejoró significativamente utilizando este segundo enfoque. Aunque utilizando las 23 características seleccionadas los cuatro métodos mostraron unas AUC similares (Figura 2, Tabla II), la proporción de clasificaciones verdaderas positivas fue significativamente baja en el modelo SVM (sensibilidad 0,58). RF, PLS-DA y NSC, por el contrario, se comportaron mejor en este sentido, siendo RF el método con mejores resultados de clasificación (AUC 0.85, sensibilidad 0.7 y especificidad 0.8).
Tabla II. Rendimiento de la clasificación de las cuatro metodologías aplicadas
Figure imgf000030_0001
Los 23 m/z seleccionados para efectos de clasificación y su importancia (dependiendo del método de clasificación) se muestran en la Tabla III. En RF, la importancia variable se calcula como la disminución media en la precisión de la clasificación después de permutar sus valores sobre todos los árboles. En PLS-DA la medida de importancia variable se basa en la contribución de cada variable a la reducción de las sumas de cuadrados. En NSC la diferencia entre los centroides de clase y el centroide general se utiliza para medir la influencia variable. En particular, cuatro valores m/z (666, 816, 855 y 884) fueron seleccionados por los tres modelos como las características más importantes. Por otra parte, la ejecución de RF, PLS-DA y NSC con el conjunto de datos, estas cuatro características también fueron seleccionados como las características más importantes.
Tabla III. Los 23 ratios m/z seleccionados para la clasificación ordenados por importancia en los diferentes métodos de clasificación
Figure imgf000031_0001
Valores m/z relevantes para la clasificación están sobre-representados en el grupo de no respondedores.
Dada la reproducibilidad de los cuatro valores m/z en los modelos analizados, se investigaron las intensidades en cada grupo de clasificación. La gráfica del espectro medio remuestreado de muestras de respondedores y no respondedores (Figura 3) mostró que las intensidades de los cuatro picos m/z eran mayores en el grupo no respondedor con respecto al respondedor. La distribución de los valores de intensidad para los m/z seleccionados en muestras individuales de cada grupo también confirmó que los pacientes que no respondían tenían tumores con valores m/z 666, 816, 855 y 884 sobre-representados (Figura 4). Identificación de m/z relevantes para la clasificación
Con el fin de establecer si la clasificación estaba proporcionando información biológica relevante, se identificó las proteínas correspondientes a picos m/z 666, 816, 855 y 884. Para la identificación de proteínas, se utilizó LC-MS/MS después de aislar las proteínas del tumor en una muestra representativa. Un total de 1107 proteínas se identificaron con FDR establecido en el 1 %. Los resultados de la identificación de proteínas se resumen en la Tabla IV . No se identificaron proteínas que coincidieran con m/z 666. Sin embargo, se identificaron la cadena a2 del colágeno (tipo 1), el complemento C3 y la galectina 4 para 816, 855 y 884 m/z respectivamente, basados en péptidos con una confianza de identificación>95 % y mayor puntuación de proteína. Curiosamente, todas estas proteínas se ha descrito que están relacionados con el proceso de angiogénesis.
Figure imgf000032_0001
La heterogeneidad del conjunto de muestras, que incluyen tumores primarios y metastásicos, y la diversidad de regímenes de quimioterapia en combinación con bevacizumab dado a los pacientes apoyan firmemente que los biomarcadores están relacionados con características intrínsecas del tumor. Además, la identificación de proteínas indicaría que estos biomarcadores estarían realmente implicados en la angiogénesis. Especialmente destacables son los m/z más relevantes obtenidos con tres de las cuatro metodologías diferentes de clasificación aplicadas. Teniendo en cuenta la puntuación de las proteínas, aquellas proteínas que coinciden con los m/z 816, 855 y 884 fueron colágeno tipo 1 cadena a2, complemento C3 y galectin-4, respectivamente. Estas tres proteínas han estado implicadas en la angiogénesis tumoral.

Claims

REIVINDICACIONES
1 Un método de obtención de datos útiles para predecir o pronosticar la respuesta al tratamiento del cáncer en un individuo con un agente antiangiogénico que comprende: a) identificar el valor del ratio m/z de las proteínas en una muestra aislada de un individuo
2.- Un método para predecir o pronosticar la respuesta al tratamiento del cáncer en un individuo con un agente antiangiogénico que comprende el paso (a) según la reivindicación anterior, y además comprende: b) asignar al individuo del paso a) al grupo de individuos que responden a terapia antiangiogenica cuando: los valores m/z 666, 816, 855 y 884, o cualquiera de sus combinaciones presentan en dicho individuo niveles inferiores a las cantidades de referencia.
3.- El método según cualquiera de las reivindicación 1-2 donde el cáncer se selecciona de entre: cáncer colorrectal, cáncer de mama, en cáncer de pulmón no microcítico, cáncer de riñón, en cáncer de ovario y cáncer de cuello de útero, o cualquiera de sus combinaciones.
4 El método según la reivindicación 3, donde el cáncer es el cáncer colorrectal.
5.- El método según cualquiera de las reivindicación 1-4, donde el agente antiangiogéncio se selecciona de entre ranibizumab, el bevacizumab y el aflibercept, nintedanib, infigratinib, rogaratinib , carotuximab, trebananib, abituzumab, pazopanib, pembrolizumab, pegdinetanib, Henatinib, lestaurtinib, apricoxib, vatalanib, o cualquiera de sus combinaciones.
6.- El método según la reivindicación 5, donde el agente antiangiogénico es el bevacizumab.
7.- El método según cualquiera de las reivindicación 1-6 donde la muestra es una biopsia de tejido tumoral.
8.- El método según cualquiera de las reivindicación 1-7 donde la determinación de los valores m/z se realiza mediante MALDI-MSI.
PCT/ES2020/070106 2019-02-15 2020-02-15 Método de predicción de respuesta a tratamiento del cáncer con agentes antiangiogénicos WO2020165483A1 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
ES201930122 2019-02-15
ESP201930122 2019-02-15

Publications (1)

Publication Number Publication Date
WO2020165483A1 true WO2020165483A1 (es) 2020-08-20

Family

ID=72044767

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/ES2020/070106 WO2020165483A1 (es) 2019-02-15 2020-02-15 Método de predicción de respuesta a tratamiento del cáncer con agentes antiangiogénicos

Country Status (1)

Country Link
WO (1) WO2020165483A1 (es)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112778187A (zh) * 2021-01-06 2021-05-11 烟台舜康生物科技有限公司 一种海那替尼中间体的合成方法及所得的海纳替尼中间体

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011089101A1 (en) * 2010-01-19 2011-07-28 F. Hoffmann-La Roche Ag Tumor tissue based biomarkers for bevacizumab combination therapies
US20170115306A1 (en) * 2015-10-26 2017-04-27 Industry-Academic Cooperation Foundation, Yonsei University Small molecule detection and localization method based on maldi imaging mass spectrometry
US20170281725A1 (en) * 2014-09-16 2017-10-05 Regeneron Pharmaceuticals, Inc. Predictive and prognostic biomarkers related to anti-angiogenic therapy of metastatic colorectal cancer

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011089101A1 (en) * 2010-01-19 2011-07-28 F. Hoffmann-La Roche Ag Tumor tissue based biomarkers for bevacizumab combination therapies
US20170281725A1 (en) * 2014-09-16 2017-10-05 Regeneron Pharmaceuticals, Inc. Predictive and prognostic biomarkers related to anti-angiogenic therapy of metastatic colorectal cancer
US20170115306A1 (en) * 2015-10-26 2017-04-27 Industry-Academic Cooperation Foundation, Yonsei University Small molecule detection and localization method based on maldi imaging mass spectrometry

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
COLE L M ET AL.: "Investigation of protein induction in tumour vascular targeted strategies by MALDI MSI", vol. 54, no. 4, 31 July 2011 (2011-07-31), amsterdam, pages 442 - 453, XP028259959, ISSN: 1046-2023 *
COLLINSON FIONA ET AL.: "Predicting Response to Bevacizumab in Ovarian Cancer: A Panel of Potential Biomarkers Informing Treatment Selection", CLINICAL CANCER RESEARCH, vol. 19, no. 18, 31 August 2013 (2013-08-31), pages 5227 - 5239, XP055141203, ISSN: 1078-0432, DOI: 10.1158/1078-0432.CCR-13-0489 *
HAYASHI TAKUO ET AL.: "Galectin-4, a Novel Predictor for Lymph Node Metastasis in Lung Adenocarcinoma", PLOS ONE, vol. 8, no. 12, 10 December 2013 (2013-12-10), pages e81883-1 - e81883-9, XP055733306, ISSN: 1932-6203 *
REYZER MICHELLE L ET AL.: "Early changes in protein expression detected by mass spectrometry predict tumor response to molecular therapeutics", CANCER RESEARCH, vol. 64, no. 24, 15 December 2004 (2004-12-15), pages 9093 - 9100, XP003024460, ISSN: 0008-5472, DOI: 10.1158/0008-5472.CAN-04-2231 *
SCHOENE CEDRIK ET AL.: "MALDI imaging mass spectrometry in cancer research : Combining proteomic profiling and histological evaluation", CLINICAL BIOCHEMISTRY, vol. 46, no. 6, 31 March 2013 (2013-03-31), pages 539 - 545, XP028996881, ISSN: 0009-9120, DOI: 10.1016/j.clinbiochem.2013.01.018 *
WARD D G ET AL.: "Identification of serum biomarkers for colon cancer by proteomic analysis", BRITISH JOURNAL OF CANCER, vol. 94, no. 12, 19 June 2006 (2006-06-19), pages 1898 - 1905, XP002461832, ISSN: 0007-0920, DOI: 10.1038/sj.bjc.6603188 *
ZHU DEXIANG ET AL.: "Serum proteomic profiling for the early diagnosis of colorectal cancer", JOURNAL OF CELLULAR BIOCHEMISTRY, vol. 114, no. 2, 31 January 2013 (2013-01-31), pages 448 - 455, XP055733299, ISSN: 0730-2312 *
ZOU XIA ET AL.: "Up-regulation of type I collagen during tumorigenesis of colorectal cancer revealed by quantitative proteomic analysis", JOURNAL OF PROTEOMICS, vol. 94, 6 December 2013 (2013-12-06), pages 473 - 485, XP028791619, ISSN: 1874-3919, DOI: 10.1016/j.jprot.2013.10.020 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112778187A (zh) * 2021-01-06 2021-05-11 烟台舜康生物科技有限公司 一种海那替尼中间体的合成方法及所得的海纳替尼中间体
CN112778187B (zh) * 2021-01-06 2022-10-28 烟台舜康生物科技有限公司 一种海那替尼中间体的合成方法及所得的海纳替尼中间体

Similar Documents

Publication Publication Date Title
Martínez-Aguilar et al. Proteomics of thyroid tumours provides new insights into their molecular composition and changes associated with malignancy
BR112020023587A2 (pt) método para determinar um perfil de fragmentação de dna livre de células (cfdna), método para identificar um mamífero como tendo câncer, método de identificação do tecido de origem de um câncer e método para tratar um mamífero com câncer
JP2018141795A (ja) 膵臓癌診断用組成物およびこれを用いた膵臓癌診断方法
KR20150132500A (ko) 암 예후용 조성물 및 방법
BR112013011875A2 (pt) Marcador para detecção de câncer de bexiga e/ou condições inflamatórias da bexiga
US20190249261A1 (en) Methods For Identifying Clonal Mutations And Treating Cancer
Fan et al. Identification of the up-regulation of TP-alpha, collagen alpha-1 (VI) chain, and S100A9 in esophageal squamous cell carcinoma by a proteomic method
TWI651536B (zh) 一種用以診斷及預斷癌症的方法
ES2703943T3 (es) Método para el diagnóstico y pronóstico in vitro de recaída de cáncer de mama triple negativo
WO2020165483A1 (es) Método de predicción de respuesta a tratamiento del cáncer con agentes antiangiogénicos
KR20190035677A (ko) 결장직장 선종 및 암종의 검출, 병기 설정 및 감시 방법
ES2914727T3 (es) Algoritmos y métodos para evaluar los criterios clínicos tardíos en el cáncer de próstata
Xu et al. Application of SELDI-TOF-MS to identify serum biomarkers for renal cell carcinoma
WO2021116057A1 (en) Biomarker panel for diagnosing colorectal cancer
Zhen et al. LyGDI is a promising biomarker for ovarian cancer
TW202016545A (zh) 泌尿道上皮細胞癌生物標記及其應用
ES2332557B1 (es) Huella genomica para el pronostico de la evolucion de adenocarcinoma colorectal.
CN111748626B (zh) 用于预测食管鳞癌患者新辅助放化疗的疗效和预后的系统及其应用
US20170247766A1 (en) Late er+ breast cancer onset assessment and treatment selection
Yang et al. Proteomic analysis reveals the heterogeneity of metabolic reprogramming in lacrimal gland tumors
WO2020161686A1 (en) Compositions and methods for cancer diagnosis and prognosis
ES2403781B1 (es) Método de obtención de datos útiles para el diagnóstico del cáncer de páncreas, y para evaluar la respuesta al tratamiento.
US9362094B2 (en) Biomarkers for determining breast cancer bone metastasis
ES2534734A1 (es) Método para predecir la respuesta al tratamiento con quimioterapia en pacientes de cáncer colorrectal
Li et al. Longitudinal plasma proteome profiling reveals the diversity of biomarkers for diagnosis and cetuximab therapy response of colorectal cancer

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20755975

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20755975

Country of ref document: EP

Kind code of ref document: A1