WO2019168426A1 - Способ и система для оценки клинической эффективности таргетных лекарственных средств - Google Patents

Способ и система для оценки клинической эффективности таргетных лекарственных средств Download PDF

Info

Publication number
WO2019168426A1
WO2019168426A1 PCT/RU2018/000120 RU2018000120W WO2019168426A1 WO 2019168426 A1 WO2019168426 A1 WO 2019168426A1 RU 2018000120 W RU2018000120 W RU 2018000120W WO 2019168426 A1 WO2019168426 A1 WO 2019168426A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
expression
type
molecular
targeted
Prior art date
Application number
PCT/RU2018/000120
Other languages
English (en)
French (fr)
Inventor
Антон Александрович БУЗДИН
Максим Игоревич СОРОКИН
Виктор Сергеевич ТКАЧЕВ
Даниил Михайлович НИКИТИН
Марианна Арсеновна ЗОЛОТОВСКАЯ
Андрей Владимирович ГАРАЖА
Николай Михайлович БОРИСОВ
Original Assignee
Общество С Ограниченной Ответственностью "Онкобокс"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Общество С Ограниченной Ответственностью "Онкобокс" filed Critical Общество С Ограниченной Ответственностью "Онкобокс"
Priority to RU2020115015A priority Critical patent/RU2741703C1/ru
Priority to PCT/RU2018/000120 priority patent/WO2019168426A1/ru
Priority to US16/088,446 priority patent/US11614434B2/en
Publication of WO2019168426A1 publication Critical patent/WO2019168426A1/ru

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/15Medicinal preparations ; Physical properties thereof, e.g. dissolubility
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks

Definitions

  • the invention relates to personalized medicine for oncological diseases, namely to a clinical decision support system using an analysis of the activity of intracellular molecular pathways based on large-scale mutational profiles and gene expression data.
  • Oncological diseases are characterized by a violation of the cell cycle, the appearance of uncontrollably dividing cells, capable of rapid growth and invasion in the areas adjacent to the tumor and metastasis to distant organs.
  • Oncological diseases occupy a leading position among the causes of mortality, both in Russia and in the world. Thanks to the development of modern approaches to radio and chemotherapy for cancer, as well as early diagnosis and improvement of techniques for surgical removal of tumors, in recent decades it has been possible to stabilize, and in some cases reduce, mortality rates from this type of disease.
  • the level of activity of the molecular pathway in the cell depends on the concentrations of the gene products included in it, participating in the fulfillment of molecular functions that are the specialization of this pathway.
  • PAS p is an indicator of the level of activation of the molecular pathway p
  • ARR np is the role of the gene product n in the molecular pathway p (takes values from -1 to 1 depending on whether the gene product is an activator or repressor of the molecular pathway, respectively)
  • BTIF n is an indicator of whether a gene product is n differentially expressed relative to a control group of samples
  • lg is the decimal logarithm
  • CNR n is the ratio of the level of gene expression n in the test sample to the average expression level in the group of control samples.
  • this algorithm was proposed for processing the expression data of messenger RNA (mRNA) and protein profiles.
  • An application of the calculated molecular pathway activation values can be the creation of a new generation of biomarkers, since PAS values can mark various physiological and pathological conditions of cells, tissues, and the whole organism. Moreover, the level of gene expression is determined directly in the pathological tissue of the patient. Such in the case of cancer can be, for example, fresh biopsy samples or paraffinized blocks of tumor tissue.
  • Patent application US20160224739 A1 proposes the use of a set of molecular pathway activation indices to predict the response of patients with breast cancer to various types of chemotherapy.
  • the authors predefine reference (reference) values of the activation indices of marker molecular pathways for each of the analyzed chemotherapy types, separately for the group of patients who responded to it (responders) and for the group of non-responding patients (non-responders).
  • responders for the case under study (for example, a block of paraffinized tumor tissue)
  • activation levels of marker molecular pathways are determined and an analysis is made of how close these values are to the values for the reference groups of responders and non-responders.
  • Based on the similarity of the profiles of activation indices of marker pathways to a particular group a prediction is made regarding the response of a particular patient to this type of chemotherapy.
  • DS d E t DTI dt S r NII tp AMCF p PAS p , where DS is an indicator of the potential effectiveness of a targeted drug; d is the drug for which a performance analysis is performed; PAS p is an indicator of the activation force of the molecular path p; AMCF P is an indicator that takes into account the ability of the molecular pathway p to enhance or weaken cell growth or death (in this case, it takes values 1 and -1, respectively); DTI - an indicator that takes into account the ability of the drug d to inhibit the gene product t or not (while it takes values 1 and 0, respectively); Nil is an indicator that takes into account whether or not the gene product t is involved in the molecular pathway p (in this case, it takes values 1 and 0, respectively).
  • this method does not take into account changes in the effective concentration of molecular targets of pharmaceuticals. Another difference is that the method described in the application US20170193176A1, as well as in the application US20160132632A1, can analyze only the levels of expression of mRNA and proteins, but not the profiles of DNA mutations, the distribution of binding sites of transcription factors and miRNAs.
  • the objective of the present invention is to provide an effective, scientifically based approach to personalized therapy for cancer patients, that is, to the choice of an antitumor drug that is most suitable for a particular patient and is able to modulate signaling pathways in such a way as to compensate for pathological changes in tumor tissues.
  • the approach described in the present invention consists in analyzing changes in the intracellular molecular pathways: signaling, repair, metabolic, cytoskeletal, and others, as well as predicting the clinical efficacy of drugs for individual cancer patients.
  • the Oncobox platform described in the invention solves the problem of repositioning of existing drugs for new indications for use, and can also solve the problem of searching for molecular targets in the development of new drugs with targeted action (targeted drugs).
  • Oncobox uses the results of multi-mix studies of samples of cells and tissues of individual patients, as well as individuals without medical pathology, as input data. As biomaterial for the study, fresh, paraffinized or otherwise preserved in a different way tissue samples are used.
  • Studies that provide initial data for the Oncobox platform may include multi-mix genetic profiling: high-performance profiling of gene expression at the mRNA level using microarray hybridization, deep sequencing, real-time RT-PCR or profiling at the level of protein expression using quantitative proteomics technologies, profiling the quantitative spectrum of miRNA transcript of biosamples, as well as deep sequencing of genomic DNA or the determination of sirloin transcription factor binding to the genomic DNA.
  • the Oncobox platform calculates the activation profiles of intracellular signaling pathways (signal), and then evaluates the potential effectiveness of pharmaceuticals with a known spectrum of molecular targets on an individual patient.
  • This problem is solved by applying a method for evaluating the clinical efficacy of targeted drugs for treating a patient with a proliferative or oncological disease, selected from the group of targeted drugs, consisting of at least the following steps: (a) obtain molecular target information for each targeted drug, selected from the specified group; (b) obtaining a patient tissue sample having a proliferative phenotype; (c) receive data of at least one type from the specified sample, the data type being selected from the following list: (i) data on the expression of total mRNA, (i) genome-wide data on protein expression, (iii) genome-wide data on transcription binding sites factors, (iv) genomic data on mutations in genomic DNA, (v) genomic data on miRNA expression;
  • (e) obtain data of at least one type of molecular targets for each targeted drug from the indicated sample, the data type being selected from the following list: (i) data on mRNA expression of molecular targets, (i) data on expression of molecular targets, (iii) data on mutations in the genes of molecular targets; (iv) data on the binding sites of transcription factors in the genes of molecular targets, (v) data on the expression of microRNAs that affect the expression of genes of molecular targets, each type data (i) - (v) obtained at stage (e), coincides with the data type, respectively (i) -
  • step (h) determine the clinical efficacy for each targeted drug from the group of targeted drugs by averaging the quantitative efficacy indicators determined in step (g).
  • the aforementioned method for evaluating the clinical efficacy of targeted drugs is characterized in that the data obtained from at least one control tissue sample are harmonized with the data obtained in steps (c) and (e).
  • the method is characterized in that (i) in step (c), data of at least two types are obtained; (ii) in step (g), a quantitative measure of performance is independently calculated for each type of data; and (iii) evaluate the clinical efficacy for each targeted drug from the targeted drug group, averaging the quantitative performance indicators calculated for each data type.
  • step (c) genome-wide harmonized data on protein expression and genome-wide data on mutations in genomic DNA are obtained.
  • this problem is solved by applying a method for treating a patient with a proliferative or oncological disease, consisting of at least the following steps: (a) obtain information about the available targeted drugs and form a group of targeted drugs; (b) evaluate the clinical effectiveness of targeted drugs selected from the specified group of targeted drugs, according to the above method for evaluating the clinical effectiveness of targeted drugs; (c) a medicament having the best or one of the best quantitative efficacy indicators determined according to the above method for evaluating the clinical efficacy of targeted drugs is selected for treatment of said patient.
  • this problem is solved by using a system for evaluating the clinical efficacy of targeted drugs selected from the group of targeted drugs for a patient with proliferative or cancerous tissue disease, including:
  • a computer-implemented method consisting of at least the following steps: (a) obtain information about molecular targets for each targeted drug selected from the specified group; (c) obtain data of at least one type from a patient’s tissue sample having a proliferative phenotype, the data type being selected from the following list: (i) data on the expression of total mRNA, (ii) genome-wide data on protein expression, (III) genome-wide data on transcription factor binding sites, (iv) genome-wide data on mutations in genomic DNA, (v) genome-wide data on miRNA expression; (d) obtaining data from at least one control tissue sample that does not have a proliferative phenotype, wherein the control sample is obtained from tissue of the same type as said patient tissue; the type of data obtained from the control sample coincides with the type of data obtained in stage (c); (e) obtain data of at least one type of molecular targets for each targeted drug from the indicated sample, the data type being selected from the following
  • this problem is solved by applying a method for determining the most effective drug from the group of targeted drugs for a patient with a proliferative or oncological disease, consisting of at least the following steps: (a) obtain molecular target information for each targeted drug, selected from the specified group; (b) obtaining a patient tissue sample having a proliferative phenotype; (c) receive data of at least one type from the indicated sample, the data type being selected from the following list: (i) data on the expression of total mRNA, (ii) genome-wide data on protein expression, (iii) genome-wide data on transcriptional binding sites factors, (iv) genomic data on mutations in genomic DNA, (v) genomic data on miRNA expression; (d) obtaining data from at least one control tissue sample that does not have a proliferative phenotype, while the control sample is obtained from tissue of the same type as the specified patient tissue, and the type of data obtained from the control sample is the same as the data type, obtained in stage (
  • a new, more effective method for assessing clinical effectiveness has been developed targeted drugs for an individual patient with proliferative or oncological tissue disease using a wide range of experimental data: data on gene mutations, on the profile of transcription factor binding, on the level of protein expression (taking into account harmonization), mRNA (taking into account harmonization) and microRNA, and also information on molecular targets for targeted drugs.
  • This method can be automated, which prevents potential errors associated with manual calculation, and allows you to take into account changes in hundreds and thousands of molecular pathways, including tens and hundreds of gene products characteristic of a particular patient.
  • FIG. 1 Organization chart of the Oncobox platform.
  • FIG. 2 Shambhala algorithm scheme for universal harmonization of expression profiles. Different samples (profiles) (1, ..., N) (see the bottom left rectangle) are added one at a time to the auxiliary (calibration) set of profiles P using quantile normalization (Bolstad et al. 2003). The resulting set of P1 profiles is then converted to the definitive form characteristic of the set of Q profiles using piecewise linear harmonization (Shabalin et al. 2008).
  • FIG. 3 Distribution of human protein coding genes according to GRES indices (indicated in the diagram as GRE).
  • FIG. 4 Hematoxylin and eosin staining indicates a moderately differentiated intrahepatic cholangiocarcinoma.
  • FIG. 5 The clinical status of drugs sorted by the value of the BES index. Indicators of clinical significance (plotted along the ordinate): 1 - the drug is approved for clinical use in tumors of this localization; 0.85 - successfully passed the III phase of clinical trials; 0.7 - is in phase III clinical trials; 0.4 - successfully passed the II phase; 0.3 - is in phase II clinical trials; 0.2 - successfully passed the I phase; 0.1 - is in phase I of clinical trials.
  • FIG. 6. Bringing gene expression profiles to a universal look using the Shambhala method of the Oncobox platform. Shown are the expression profiles before and after harmonization using the Shambhala algorithm (upper and lower rows of panels, respectively).
  • FIG. 7 The Jacquard index for comparing the lists of drugs that fell to the top of the rating compiled by the DS1a efficacy index for the studied 11 nosologies (diseases by type of tissue are indicated).
  • FIG. 8 The Jacquard index for comparing the lists of drugs that fell to the top of the rating compiled by the BES efficacy index for the 11 nosologies under study (diseases by type of tissue are indicated).
  • FIG. 9 The dependence of the rating of targeted drugs, calculated by the Oncobox system according to the transcriptome profile of a patient with cervical cancer from the TCGA database, on the clinical rating of these drugs based on clinicaltrials.gov (as of August 2017). Green indicates the drugs that were at the top of the rating, red - at the bottom.
  • FIG. 10 The distribution density of the Anubis coefficients calculated on the basis of the BES drug efficacy index (upper graph) or DS1a (lower graph) for 306 patients with cervical cancer (green).
  • the transparent bars of the histogram reflect the distribution of Anubis coefficients with random mixing of the clinical status of the drugs.
  • tissue of a patient or subject, one should understand the meaning accepted in the medical literature — this is a system of cells and intercellular substance, united by a common origin, structure, and functions. In the description of this invention, it may be blood, hard tissue of various origins (e.g., epithelial, connective, nervous or muscle) or part of any organ of a patient or subject.
  • tissue sample having a proliferative phenotype is meant a tumor tissue sample whose cells are capable of uncontrolled division as a result of a pathological change (usually as a result of a change in the genetic apparatus of the cells). Such a sample may be part of a benign or malignant tumor.
  • a proliferative or oncological disease is understood to mean a disease characterized by a pathological change in the genetic apparatus of cells, leading to uncontrolled division of a particular population of cells.
  • proliferative diseases are myeloproliferative diseases, lymphoproliferative diseases, proliferative diseases of the connective tissue, and other diseases.
  • Data on the expression of total mRNA should be understood as data showing the absolute or relative number of all or more than 300 types of mRNA molecules in a sample.
  • Under the full-genome data on the binding sites of transcription factors should be understood data showing the binding region of a given set of transcription factors with DNA sequences in the subject's genome.
  • This kit is determined by a specialist based on the involvement of transcription factors in the molecular pathways, presumably responsible for the disease.
  • genome-wide data on protein expression, genomic and full-exomic data on mutations in genomic DNA, and genomic data on microRNA expression are determined.
  • Data harmonization is understood as bringing them to a universal comparable form.
  • the need for harmonization arises when using data on the expression of total mRNA or genomic data on the expression of proteins, in the case when the corresponding data of the control samples were obtained independently of the patient's data, including using different methods.
  • the Shambhala method proposed by the authors or another method providing the ability to compare genome-wide expression data obtained on different platforms can be used.
  • the data are considered harmonized without the use of additional algorithms.
  • there is no need for harmonization and such data is considered harmonized without the use of additional algorithms.
  • the Oncobox platform solves the problems of predicting the clinical efficacy of drugs for individual cancer patients, as well as the task of repositioning existing drugs and the task of finding molecular targets in the development of new targeted drugs (targeted drugs).
  • the problems are solved using technology based on molecular profiling of pathological tissue samples, subsequent analysis of molecular pathway activation profiles and calculation of balanced Balanced Efficiency Score (BES) drug efficacy indices.
  • BES Balanced Efficiency Score
  • samples of pathological tissue samples of fresh, paraffinized or otherwise preserved tissue can be taken.
  • tissue analysis is performed in a patient with proliferative or cancerous tissue disease.
  • pathological tissue it is preferable to analyze a sufficiently homogeneous portion of the patient’s tissue having a proliferative phenotype. For this, it is possible to carry out additional purification of a tissue having a proliferative phenotype from other tissues surrounding it using methods known to those skilled in the art.
  • the Oncobox platform is effective for analyzing a wide range of large-scale molecular data: data on gene mutation profiles, gene mRNA expression, expression of microRNA molecules specific for the corresponding gene products, quantitative proteomic profiles, and the frequency of occurrence of transcription factor binding sites in gene regulatory areas.
  • the first technical task to be solved (1) is the analysis of changes in intracellular molecular paths based on the above types of data. Moreover, the measured intracellular pathways include signaling, repair, metabolic, cytoskeletal and other molecular pathways.
  • the first technical task is divided into a number of subtasks:
  • the second technical task to be solved (2) is personalized prediction of the clinical effectiveness of pharmaceuticals for individual patients, including cancer patients.
  • the second technical task is divided into the following subtasks:
  • the Oncobox platform has a number of significant advantages relative to other published analogues.
  • oncobox platform introduces methods for formalized prediction of the effectiveness of targeted drugs of different specificity based on gene mutation profiles, miRNA expression, and transcription factor binding.
  • the ability to simultaneously use different types of molecular data gives Oncobox a unique advantage of verifying the correct choice of drugs using alternative methods.
  • the final recommendation includes consensus drugs recommended using the largest number of available types of analysis.
  • the Oncobox platform uses a combination of molecular pathway activation levels and a special quantitative measure of change (expression or mutation load) of the genes that are the direct targets of the drugs. This allows you to get the results of calculating the relative effectiveness of pharmaceutical products of higher quality than in previously published methods, for example, than in the application US20170193176A1, as well as in the article Artemov et al., 2015. Mapping data groups obtained using the platform
  • BES Balanced Efficiency Score
  • DES Mp reflects the contribution of molecular pathways
  • DES TG reflects the contribution of specific molecular drug targets
  • different types of drugs are used weights for DES Mp u DES TG ranging from -1 to 1.5.
  • DES MP and DES tg the separation of drugs into classes and weights in the formula for DES MP u DES TG Depending on these classes. Classification of drugs is carried out in accordance with their known mechanism of action and molecular specificity.
  • the proposed method can also be used for repositioning of existing drugs and for the search for new targets in the development of new pharmaceuticals.
  • the Oncobox system uses a single basic molecular pathway analysis algorithm, for which the ability to minimize experimental measurement errors was previously shown (Aliper et al. 2017). For each type of data analyzed (DNA mutations, profiles expression of mRNA, proteins, miRNAs, transcription factor binding profile), the Oncobox system uses specific modifications of the original algorithm.
  • the analysis is based on a database of molecular pathways with automatically supervised functional roles of gene products - participants of each pathway.
  • Oncobox system five types of functional roles for gene products are distinguished: path activator, repressor, rather activator, rather repressor, as well as gene products with an unclear or controversial role.
  • the algorithm for assigning coefficients to gene products that reflect the role of gene products in the activation of the molecular pathway is based on the analysis of the graph of protein-protein interactions for each individual path.
  • This graph can be constructed manually or using published databases of molecular paths, such as KEGG, biocarta, Reactome, etc.
  • KEGG KEGG
  • biocarta biocarta
  • Reactome etc.
  • At the vertices of such a graph are genes, and the presence of an edge between two vertices indicates the presence of a protein-protein interaction between the corresponding gene products.
  • Each edge of this graph is directed and also has a parameter indicating the nature of the protein-protein interaction: “activation” or “inhibition”. For the correct arrangement of the ARR coefficients, this graph must be connected, and weak connection is sufficient.
  • the values of the ARR coefficient reflecting the functional significance of the gene product in this molecular pathway are attributed to the genetic products included in the molecular pathway database.
  • the basic molecular pathway activation analysis algorithm is based on the following basic principles.
  • the graph of molecular interactions in each path is put in the form of two parallel chains of events, where one leads to activation and the other to inhibition of the molecular path.
  • the level of expression of each of the gene products participating in the path in a state of low path activity is considered to be lower than in a state of high path activity.
  • This position is taken on the basis of data that, in a state of low activity of the pathway, a state of deeply unsaturated concentration of each of the signal carrier proteins was shown (Kuzmina and Borisov 2011; Aliper et al. 2017).
  • the Oncobox system considers all gene products participating in the molecular pathways in each individual pathway as having potentially equal opportunities to cause activation or inhibition of this pathway. To analyze the level of molecular pathway activation, the Oncobox system uses the following basic formula:
  • PAL p Sh Nll np ⁇ ARR np ⁇ In CNR n / S h
  • the In CNR n parameter is calculated differently in the basic algorithm, that is, the logarithm of the ratio of the reduced expression of gene n in the test sample to the reduced expression of gene n in the control sample. Below are the options for calculating the In CNRn parameter.
  • MR n 1000 - 1 Nmu t ( n ) I lc d s ( n )
  • N mut ( n) is the number of detected mutations in the protein coding part of the gene n in the test sample
  • Lc d s ( n ) is the length of the protein coding portion of gene n in pairs of nucleotides.
  • In CNR n In CNR (MR n ), where CNR (MR n ) is the ratio of the MR parameter in the test sample to the average MR value in the control group, for the gene
  • a consensus transcription start point is determined for each gene.
  • a neighborhood is determined that is, by default, a plot of 5 kbp or less. above the transcription start point to 5 kb below the transcription point for the corresponding gene n. In this neighborhood, the mapping of transcription factor binding sites is counted.
  • GRES Gene Record Enrichment Score
  • GRES 1 indicates the average level of enriched TM among all genes; GRES> 1 indicates the level of enrichment above the average for all genes; GRES ⁇ 1, on the contrary, means that the gene is depleted in the binding sites of transcription factors relative to all genes.
  • CNRn In CNR (GRES n ), where CNR (GRES n ) is the ratio of the GRES parameter in the test sample to the average GRES in the control group, for the gene of item
  • An important feature of the Oncobox system is that before calculating the activation of molecular pathways, an original joint normalization of the studied samples with groups of the corresponding normal samples is carried out for mRNA profiles.
  • the information contained in the databases of gene expression profiles represents the results of studies obtained by various methods, including microchip hybridization of mRNA, high-throughput sequencing, etc. Each of these methods is implemented using various experimental platforms from different manufacturers. Such open-access data warehouses contain results for more than 2 million samples obtained in more than 70 thousand experiments (Cancer Genome Atlas Research Network 2008; https: // www. Ncbi. N I m .nih.gov / qeo / )
  • the original Shambhala method developed by us is used for this purpose, which allows harmonizing the results of gene expression profiling obtained both on the same and on different platforms, which leads them to a universal comparable form.
  • the Shambhala method allows harmonization for any number of compared samples obtained on any number of experimental platforms.
  • the Shambhala method uses clustering of genes and images using stochastic genetic algorithms, as well as piecewise linear iterative convergence of gene expression profiles.
  • the Shambhala algorithm includes the following features (Fig. 2):
  • the harmonization of the set of profiles (P ⁇ ) is brought (conversion) to the distribution of expression levels, similar to the reference (definitive) set of profiles (Q).
  • a set of one hundred expression profiles of the Genotype Tissue Expression (GTEx) project (GTEx Consortium 2013) was used as a reference (definitive) data set.
  • the set of GTEx expression profiles (GSE45878) was obtained using microchip hybridization of mRNA using an Affymetrix Human Gene 1.1 ST (GPL16977). During the conversion process, the data set P1 iteratively approaches the set of profiles Q, which remains constant.
  • the result of this conversion will be a set of P2 expression profiles, which is a set of P1 profiles, similar to if it were profiled on the same platform as the reference (definitive) set of Q profiles. 2.
  • the cosine-shaped metric of proximity of sets is used instead of the Euclidean barycentric (in the XPN method, Shabalin et al. 2008) Krishna, 1999; Hornik, 2012).
  • the Shambhala method is used, similar to the previous application.
  • the application of this calculation method is based on the use of a database of gene products - targets of micro RNA.
  • the database for each included miRNA should contain the following information:
  • each gene product may have several regulatory miRNAs, and each miRNA may have several target genes.
  • n is the currently analyzed gene product
  • j is the totality of the miRNAs analyzed by the system
  • i is the miRNA currently being analyzed.
  • the Boolean variable microRNA involvement index indicates whether the analyzed gene product n is a target for miRNA i.
  • mill ln assumes a value of 1 when the analyzed gene product l is a target for miRNA i, and a value of 0 when it is not.
  • the miCNR value is the ratio of the quantitatively measured level of miRNA expression i in the test sample to that average value in the control group.
  • a negative coefficient in front of the sum sign reflects the inhibitory role of miRNAs for the corresponding target gene product.
  • control samples of healthy subjects you can use publicly available data known for a particular tissue (for example, expression data), and, preferably, experimental data obtained from control samples of healthy subjects on the same equipment as the data from the test sample of the patient. In the latter case, they can be obtained in parallel with the analysis of samples of pathological tissue of a particular patient.
  • samples of healthy subjects that have as much as possible similar characteristics with the patient, for example, characteristics such as gender, age, etc. Minimum is the use of one control sample for one patient sample.
  • Averaging should be understood as using the arithmetic mean of averaged values. In some embodiments, the geometric mean of the averaged values is used for averaging.
  • the implementation of the invention is possible with data of lesser coverage.
  • Sufficient data can be recognized that evaluate the specified parameters (levels of miRNA, protein or mRNA expression, transcription factor binding profile) for at least 80% of all gene products that are part of the molecular pathways selected and placed in the database, which include molecular targets of the studied drugs .
  • the minimum required set of quantitatively characterized gene products depends (i) on the number and composition of the list of studied drugs and (ii) on the set of molecular pathways that are added by the user of Oncobox technology to the reference database.
  • tissue sample that does not have a proliferative phenotype For each targeted drug, data is obtained from at least one control tissue sample that does not have a proliferative phenotype, and the control sample is obtained from tissue of the same type as the specified tissue of the patient.
  • a tissue sample that does not have a proliferative phenotype should be understood as a tissue sample taken either from a “healthy” subject that does not have the same cancer as the patient in question, or taken from the patient in question, but from a place that is not affected by cancer.
  • genomic data of non-optimal quality it is possible to use genomic data of non-optimal quality.
  • any type of input expression data capable of uniquely determining the expression level of each gene product can be used for mRNA and miRNA expression data, which needs to be analyzed, as well as the detection of at least 1000-fold differences in the level of expression between individual transcripts.
  • genomic DNA mutation profiles any type of input genomic or exomic sequencing data can be used that completely covers the coding regions of the genes that need to be analyzed, with an average of at least 100-fold coverage.
  • transcription factor binding sites the number of analyzed mapped binding sites should be at least 10 times the number of genes that need to be analyzed.
  • Targeted pharmaceuticals include drugs with known molecular targets.
  • the term "targeted drug” is limited to drugs of certain 16 classes, or types, are shown in Table 1. These classes cover the main currently known targeted drugs used in the clinic.
  • the drugs numbered 8, 9, 10, 14, 15 in Table 1 are preparations based on immunoglobulins (antibodies), while other types of drugs in Table 1 are low molecular weight chemical compounds (small molecules).
  • the database for each included drug should contain the following information:
  • the evaluation of the Oncobox system is based on modeling the ability of drugs to block pathological changes in the molecular pathways and simultaneously block gene products with pathologically elevated levels of reduced expression.
  • the Oncobox platform uses the original Balanced Efficiency Score (BES) parameter as a measure of the effectiveness of targeted drugs.
  • BES Balanced Efficiency Score
  • BES d a ⁇ DES MP d ⁇ + b - DES TG d , where d is the analyzed target drug; a and b are weights ranging from -1 to 1.5 depending on the type of targeted drug d; DES MP d (Drug Efficiency Score for Molecular Pathways) is the activity index of the drug d, calculated based on the activity levels of the molecular pathways containing its molecular targets; DES TG d (Drug Efficiency Score for Target Genes) is the activity index of the targeted drug d, calculated on the basis of the expression levels of individual gene products - its molecular targets.
  • DES MP d L DTI dt - I p PAL p AMCF P ⁇ Nll t P , where d is the unique identifier of the targeted drug; t is the unique identifier of the target drug product; d p is the unique identifier of the signaling pathway; PAL p - level of activation of the molecular path p; discrete value AMCF (activation-to-mitosis conversion factor) is defined as follows:
  • AMCF 1, when activation of the molecular pathway promotes cell survival, growth, and division;
  • AMCF 0, when there is no data on whether activation of the molecular pathway promotes cell survival, growth and division, or when such data available to the researcher are contradictory;
  • AMCF -1, when the activation of the molecular pathway impedes the survival, growth and division of the cell.
  • DTI drug-target index
  • Nil node involvement index
  • DES TG d I t DTI dt - I p In CNR t ⁇ ARR, p ⁇ AMCF P - Nll t, p , where d is the unique identifier of the targeted drug; t is the unique identifier of the target drug product; d p is the unique identifier of the signaling pathway; CNR n (case-to-normal ratio) - the ratio of the reduced expression levels of the gene encoding the protein t in the test sample to the norm (the average value in the control group); In is the natural logarithm; the definitions of DTI dt , AMCF P and Nil are similar to those given above; the discrete value ARR t p (activator / repressor role) is determined for the gene product t in the path p as follows and is placed in the base of molecular paths:
  • protein i is a repressor or signal activator in the path p
  • weights a and b are used, which differ depending on the nature of the preparation.
  • the values of the coefficients are shown in Table 1.
  • both weight coefficients are 0.5, which reflects the equal significance of the activation of targeted molecular pathways and the level of expression of target genes in the studied sample of pathological tissue. This is due to the ability of nibs to block their molecular targets and thereby inhibit their activity, and thereby modulate the signal passage through the associated molecular pathways.
  • both weights take a value of -0.5, this is due to the fact that they activate rather than inhibit their molecular targets and have a corresponding effect on their targeted molecular pathways.
  • the coefficients again assume the value 0.5, which is associated with the inhibitory mechanism of their effect on their molecular targets, on the production of hormones or their molecular signaling, as well as on the corresponding targeted molecular pathways.
  • retinoids both coefficients are -0.5, since this type of drug binds to retinoic acid receptors and activates a number of molecular pathways dependent on them.
  • rapalogues rapamycin analogues
  • both coefficients are equal to 0.5, since they have an inhibitory mechanism of action upon binding to their molecular targets, as well as on signaling of the corresponding molecular pathways.
  • B 1, since this class of drugs directly blocks VEGF molecules in the bloodstream, without binding to targets inside or on the cell surface and, thus, without directly affecting intracellular signaling.
  • Killermab preparations consist of antibodies that bind to molecular targets on the cell surface that are bound to cytotoxic agents. Contacting the cell surface, killermabs kill it, thereby providing a therapeutic effect that is not associated with the activation of molecular pathways inside the cell.
  • both coefficients are equal to 0.5, due to the dependence of their effects on the presence of both their direct molecular targets and on the activation of molecular pathways associated with lymphocytic tumor infiltration.
  • drugs that block poly-ADP ribose inhibit DNA repair and depend both on the presence of a direct molecular target and on the activity of targeted molecular pathways. This is reflected in the fact that both coefficients are equal to 0.5.
  • Table 1 The values of the weighting coefficients a and b for 16 classes of targeted antitumor drugs.
  • the Oncobox system allows you to quantify the effectiveness of anticancer drugs belonging to 16 different classes (Table 1). Classification of drugs is carried out in accordance with their known mechanism of action and molecular specificity. Then, the balanced Balanced Efficiency Score (BES) is calculated, differently for different classes of anticancer drugs (Table 1). Then, based on the BES values, a personalized rating of targeted anticancer drugs is formed for the studied biosample, for example, taken from an oncological patient, while drugs with a positive BES value (BES> 0) can be recommended for use.
  • BES Balanced Efficiency Score
  • the present invention provides a method for evaluating the clinical efficacy of targeted drugs for treating a patient with a proliferative or oncological disease selected from the group of targeted drugs, comprising at least the following steps: (a) obtain molecular target information for each targeted drug facilities, selected from the specified group; (b) obtaining a patient tissue sample having a proliferative phenotype; (c) obtain data of at least one type from the indicated sample, the data type being selected from the following list: (i) data on expression of total mRNA, (i) genome-wide data on protein expression, (III) genome-wide data on transcriptional binding sites factors, (iv) genomic data on mutations in genomic DNA, (v) genomic data on miRNA expression; (d) obtaining data from at least one control tissue sample that does not have a proliferative phenotype, while the control sample is obtained from tissue of the same type as the specified patient tissue, and the type of data obtained from the control sample is the same as the data type, obtained at the stage
  • a quantitative indicator of drug efficacy (BES) for each of the data types (i) - (v) is determined by adding two parts (DES MP d and DES TG d ), which are determined from the data on the activity of molecular pathways in the test sample and data on the given expression of gene products - molecular targets of the drug d), taking into account the weight coefficients (a and b), depending on the type of drug, and disclosed in Table 1.
  • DES MP d and DES TG d data obtained from patient sample, normalized to data of the same type obtained from at least one control sample.
  • a quantitative indicator of the effectiveness of the drug d for each of the data types (i) - (v) is determined using the formula:
  • a method for evaluating the clinical efficacy of targeted drugs can be carried out using a computing device containing such components as: one or more processors, at least one memory, and also, preferably, input / output interfaces, input / output means, network interaction means and other components.
  • the processor of the device performs the basic computational operations necessary for the functioning of the modules of the executing command of the device.
  • the processor executes the necessary machine-readable instructions contained in RAM.
  • Memory should be understood as any information storage device capable of storing the necessary program logic that provides the required functionality.
  • the storage medium can be implemented in the form of HDD, SSD disks, RAID raid, flash memory, optical information storage devices (CD, DVD, MD, Blue-Ray disks), etc.
  • the choice of interfaces depends on the specific design of the computing device, which can be a personal computer, a mainframe, a server cluster, a thin client, a smartphone, a cash register, etc.
  • the following can be used as data input / output means: keyboard, joystick, display (touch screen), projector, touchpad, mouse, trackball, light pen, speakers, microphone, etc.
  • Oncobox system applications for analyzing molecular pathway activation levels, for creating drug efficacy ratings, for searching for new biomarkers, for searching molecular targets and repositioning existing pharmaceuticals are illustrated below by examples.
  • Example 1 The calculation of the activation index of molecular paths based on data on the concentration of epigenetic markers. Full genome binding profiles of 225 transcription factor proteins
  • TF Human (TF) obtained by different laboratories during chromatin immunoprecipitation experiments (ChlP-seq) for the K562 cell line (erythroleukemia, immortalized cell line) were downloaded from the ENCODE database (https://www.encodeproiect.org/chip- seq / transcriDtion factor /). The profiles were control-normalized TF binding in bedGraph format (https://qenome.ucsc.edu/qoldenpath/help/bedqraph.html).
  • the reference assembly of the hg19 human genome was indexed by the Burrow-Wheeler algorithm using the BWA program (https: //www.encodeproiect.orq/pipelines/ENCPL220NBH/T Merging fastq files with raw data, aligning to reference genome and filtration were performed by BWA, Samtools, Picard, Bedtools and Phantompeakqualtools (https://www.encodeproiect.org). Profiles normalized to control the level of TF binding were Macunins by Macs
  • Example 2 The calculation of the activity rating of cancer drugs for an individual tumor based on the activation of molecular paths based on data on mRNA expression.
  • a rating of potentially effective anticancer targeted drugs was calculated for a 72-year-old patient with histologically confirmed moderately differentiated intrahepatic cholangiocarcinoma (Fig. 4).
  • the patient was diagnosed in October 2015 with the following symptoms: moderate weight loss, pain in the right hypochondrium, loss of appetite and asthenia, with a Karnofsky index of 70%.
  • Magnetic resonance imaging (MRI) results during the diagnosis confirmed the diagnosis.
  • the tumor was not removed surgically due to the advanced stage, several intrahepatic formations and lung metastases.
  • the treatment was ineffective and the tumor increased in size according to MRI; additional metastatic nodes appeared in the left and right lobes with spread to the bile duct and gall bladder.
  • a rating of targeted drugs was compiled according to the values of the BES index (Table 2).
  • Pazopanib another tyrosine kinase inhibitor, is recommended based on a rating calculated by the Oncobox system. Pazopanib treatment began in January 2017. Control MRI in July 2017 revealed moderate tumor growth. At the same time, a change in treatment regimen led to the elimination of side effects of Sorafenib and an overall improvement in the quality of life. As of October 2017, the patient is alive and physically active, and the Karnofsky index is 100%.
  • Example 3 Calculation of the activity rating of cancer drugs for colorectal cancer based on data on mutations of genomic DNA.
  • the activity rating of targeted drugs was calculated for 105 drugs based on the genome data of 1,441 cases of colorectal cancer using the Oncobox platform.
  • the data were obtained from the COSMIC v76 database (The Catalog of Somatic Mutations In Cancer) (Forbes et al. 2008) and contained information on 1,165,882 mutations in 19897 genes.
  • the top positions of the obtained drug rating are presented in Table 3 (9 drugs with the maximum Balanced Efficiency Score (BES) are indicated).
  • BES Balanced Efficiency Score
  • Table 3 List of drugs that have received the highest potential efficacy ratings based on MDS values.
  • Example 5 Repositioning of known drugs for malignant tumors based on data on genomic DNA mutations.
  • Regorafenib was approved for use with this type of cancer, successfully passed the third phase of clinical trials of Tivantinib and Nintedanib (BIBF 1120), and the second phase of clinical trials was completed for Flavopiridol (Alvociclib).
  • the remaining drugs that have reached the maximum Balanced Efficiency Score are currently not used for liver tumors and in the absence of clinical trials conducted earlier, can be recommended for consideration of the use of this nosology.
  • the clinical status of all drugs, sorted according to the Balanced Efficiency Score, is shown in FIG. five.
  • Example 7 The combination of the mutational and expression method of rating targeted drugs for a patient with head and neck cancer on the Oncobox platform.
  • the following chemotherapy line was chosen using the Oncobox platform.
  • a biopsy of the tumor tissue was taken from the patient, mRNA expression was profiled, and full-exom DNA sequencing was performed on lllumina HiSeq 2000 equipment.
  • BES Balanced drug Efficiency Score
  • Table 5 Rating of targeted drugs with the highest BES for a patient with head and neck cancer, according to the results of mRNA expression profiling.
  • the BES index was calculated in an alternative way, based on data from full-exomic sequencing of a tumor tissue sample. In total, somatic mutations in 13 genes were found in this patient. The rating of targeted drugs according to BES values calculated according to genomic DNA mutations is shown in Table 6.
  • Table 6 Rating of targeted drugs with the highest BES for a patient with head and neck cancer, according to the results of genomic DNA mutations profiling.
  • DNA is a distinctive feature of the Oncobox platform.
  • Table 7 Medical status of targeted drugs for the treatment of head and neck tumors that simultaneously have a maximum BES rating based on profiling of mRNA expression and genomic DNA mutations in tumor tissue of a patient with head and neck cancer.
  • Example 8 Comparison of the expression method of rating targeted drugs on the Oncobox platform with previously published approaches. The following is an assessment of balanced performance indices of targeted drugs calculated using the method of the present invention (using the proposed BES index) in comparison with the method previously described in the application US20170193176A1, which uses only molecular path activation values to calculate
  • DS1a Drug Score
  • Target drug efficacy indices were calculated based on transcriptome profiles of cancer patients from the TCGA public database (The Cancer Genome Atlas), after which efficacy indices were compared with the clinical status of targeted drugs.
  • the Cancer Genome Atlas database contains mutational and transcriptome profiles of cancer patients with different nosologies.
  • the authors calculated balanced target drug efficacy indices (BES) for 11 nosology patients (Table 8).
  • BES balanced target drug efficacy indices
  • the DS1a targeted efficacy indices were also calculated according to the method previously published in the application US20170193176A1, as well as in the article by Artemov et al., 2015. Table 8.
  • the number of analyzed transcriptome patient profiles from the nosology TCGA database is analyzed.
  • targeted drugs were analyzed that fall into the top of the rating according to the version separately according to the BES coefficient and separately according to the DS1a coefficient. For this, the above coefficients were calculated for each individual transcriptome profile. In total, coefficients for 128 targeted drugs were analyzed. Then, drugs were found that fall into the top 10% of the rating (top 13 drugs) for most patients. The resulting lists were compared between different nosologies using the Jacquard coefficient. The resulting graph for pairwise comparison of all nosologies for DS1a is shown in FIG. 7. It turned out that the top 13 drugs according to the DS1a efficacy coefficient version are the same for different nosologies (with this specific position in the ranking may not coincide). This suggests that DS1 a is not suitable for the personalized appointment of targeted therapy to cancer patients, as in accordance with this rating, the majority of patients are expected to prescribe the same drugs.
  • E j is the clinical coefficient for the drug under number i
  • DS is the efficacy coefficient of a given targeted drug, for example, BES or DS1a
  • n drugs - the number of targeted drugs (in our case, equal to 128).
  • the resulting coefficient A which we called the Anubis coefficient, gives an estimate of how well calculated indexes of drug efficacy correlate with their clinical status.
  • FIG. Figure 9 shows a graph of the dependence of the drug rating by BES coefficient on the clinical status of the drug using the example of one patient with cervical cancer. The graph shows that drugs that were in the later stages of clinical trials were more likely in the upper half of the rating.
  • the Anubis coefficient calculated by the above formula for this patient turned out to be equal to 14.83.
  • the distribution density of the obtained values of the Anubis coefficient is shown in FIG. 10.
  • the graph shows that, on average, the Anubis coefficients were higher in the case of BES than in the case of DS1 a. This suggests that the rating of drugs according to the BES coefficient is more consistent with the clinical status of drugs than for DS1a.
  • the BES coefficient has a clear advantage over DS1a, because at the top of the BES rating, more often are drugs that have successfully performed in clinical trials.

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Public Health (AREA)
  • Biophysics (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Food Science & Technology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • General Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Bioethics (AREA)
  • Genetics & Genomics (AREA)
  • Data Mining & Analysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Изобретение описывает способ, позволяющий эффективно оценивать клиническую эффективность существующих таргетных лекарственных средств для индивидуального пациента с пролиферативным или онкологическим заболеванием. Способ позволяет использовать широкий спектр экспериментальных данных, получаемых из образцов патологических тканей пациентов и соответствующих контрольных образцов: данные по генным мутациям, по профилю связывания транскрипционных факторов, по уровню экспрессии белков (с учетом гармонизации), мРНК (с учетом гармонизации) и микроРНК. Способ также использует информацию по молекулярным мишеням таргетных лекарственных средств. Данный способ может быть автоматизирован, что предотвращает потенциальные ошибки, связанные с ручным расчетом, и позволяет учитывать изменения, характерные для конкретного пациента, в сотнях и тысячах молекулярных путей, включающих десятки и сотни генных продуктов. Данный способ также учитывает особенности и механизм действия различных классов таргетных препаратов. Применение данного способа позволит выбрать для лечения пациента лекарственное средство на основании анализа объективных индивидуальных изменений, возникших в патологической ткани.

Description

Способ и система для оценки клинической эффективности таргетных лекарственных средств
Область техники
Изобретение относится к персонализированной медицине для онкологических заболеваний, а именно к системе поддержки принятия клинических решений с использованием анализа активности внутриклеточных молекулярных путей, основанного на широкомасштабных мутационных профилях и данных по генной экспрессии.
Уровень техники
Онкологические заболевания характеризуются нарушением клеточного цикла, появлением бесконтрольно делящихся клеток, способных к быстрому росту и инвазии в прилежащие к опухоли зоны и метастазированию в отдаленные органы. Онкологические заболевания занимают лидирующие позиции среди причин смертности, как в России, так и в мире. Благодаря развитию современных подходов радио- и химиотерапии рака, а также ранней диагностики и совершенствованию техник хирургического удаления опухолей, в последние десятилетия удалось стабилизировать, а в некоторых случаях и снизить, показатели смертности от данного типа заболеваний.
На сегодняшний день разработаны и применяются в медицинской практике более 200 лекарственных препаратов для борьбы с раком и еще больше вариантов их комбинаций [htps://www.cancer.gov/about-cancer/treatment/drugs]. Но по-прежнему остается открытым вопрос выбора терапии для конкретного пациента. Известно, что применение одного и того же препарата при одном и том же гисто-морфологическом типе опухоли у разных пациентов может иметь разный эффект: от полного регресса опухоли до ее активной прогрессии. Этот ответ невозможно предугадать лишь на основании истории болезни и гистологического типа опухоли, поэтому сегодня выбор терапии зачастую осуществляется вслепую из списка одобренных для данной нозологии препаратов, что часто ассоциировано с низкой эффективностью применения терапии и высокими показателями смертности от онкологических заболеваний.
Развитие современных наукоемких технологий массового параллельного секвенирования (или глубокого секвенирования) и микрочипового исследования транскриптомов позволили взглянуть на гистологически однотипные опухоли с новой стороны. Оказалось, что одинаковые гистолого-морфологические изменения тканей могут быть вызваны разными наборами мутаций, а также сопровождаться разными профилями экспрессии генов. Таким образом, в современном медицинском мире информация о гистолого-морфологическом типе опухоли постепенно отходит на второй план при выборе терапии, в то время как генетика опухоли конкретного пациента выходит на первый. Такой подход все чаще встречается в современной медицинской практике и имеет очевидные доказанные преимущества (Martel CL, Lara PN. Renal cell carcinoma: current status and future directions. Crit Rev Oncol Hematol. 2003 Feb;45(2): 177-90). 23 мая 2017 года Управление по продуктам и лекарствам США медикаментов
(FDA) впервые в истории одобрило в качестве показания к применению противоракового препарата Кейтруда (Пембролизумаб) наличие генетического маркера опухоли, а не локализацию или тип опухоли
[https://www.fda.gov/NewsEvents/Newsroonn/PressAnnouncements/ucm560167.html].
Персонализированная онкология по этой причине представляется будущим стандартом медицины. Поэтому актуальной задачей является создание биомедицинских платформ для интеллектуального подбора наиболее эффективной терапии и поиска прогностических опухолевых маркеров в случае конкретного пациента. Широкое внедрение подобных методик в будущем будет способствовать уменьшению частоты смертности от онкологических заболеваний.
В настоящее время существует ограниченное число платформ, использующих отдельные виды широкомасштабного генетического профилирования для консультирования докторов и пациентов. Примером является система Caris Molecular Intelligence (Russell et al. 2014; Green et al. 2014; Popovtzer et al. 2015; Vigneswaran et al. 2016). Использование платформы основано на анализе ограниченного спектра мутаций с ранее показанной клинической значимостью, а также на профилировании биообразцов пациентов на иммуногистохимической панели определения белковых онкомаркеров. Тем не менее, указанная система не использует результатов исследований полных спектров генной экспрессии, не производит анализ активации молекулярных путей и не предназначена для одновременной обработки мультиомиксных данных. Как следствие, возможности таких систем по использованию мультиомиксных данных для анализа внутриклеточных путей и для выработки клинически значимых рекомендаций существенным образом ограничены.
Уровень активности молекулярного пути в клетке зависит от концентраций входящих в него генных продуктов, участвующих в выполнении молекулярных функций, являющихся специализацией данного пути.
Для того, чтобы оценивать активацию молекулярных путей на основе данных по концентрации генных продуктов-участников этих путей ранее были разработаны такие методы, как ТАРРА (Gao and Wang 2007), topology-based score (ТВ) (Ibrahim et al. 2012), Pathway-Express (PE) (Draghici et al. 2007), SPIA (Tarca et al. 2009), Oncofinder (Buzdin et al., 2013), IPANDA (Ozerov et al., 2016) и другие. Эти подходы используют различные формулы для расчета уровней активации каждого молекулярного пути, и их отличительными чертами является приведение вычисляемого уровня активации в зависимость от концентрации генных продуктов - участников пути, в исследуемом образце по сравнению с контрольными образцами. Например, в патентной заявке US20170262578A1 , описывается вычисление активации молекулярных путей (индекс Pathway Activation Strength, PAS) по формуле:
Figure imgf000005_0001
Здесь PASp - показатель уровня активации молекулярного пути р; ARRnp - роль генного продукта п в молекулярном пути р (принимает значения от -1 до 1 в зависимости от того, является ли генный продукт активатором или репрессором молекулярного пути, соответственно); BTIFn - это показатель того, является ли генный продукт п дифференциально экспрессируемым относительно контрольной группы образцов; lg - десятичный логарифм; case-to-normal ratio, CNRn - отношение уровня экспрессии гена п в исследуемом образце к усредненному уровню экспрессии в группе контрольных образцов. При этом данный алгоритм был предложен для обработки данных экспрессии матричной РНК (мРНК) и белковых профилей. Приложением вычисленных значений активации молекулярных путей может являться создание биомаркеров нового поколения, поскольку значения PAS могут маркировать различные физиологические и патологические состояния клеток, тканей и всего организма. При этом уровень генной экспрессии определяется непосредственно в самой патологической ткани пациента. Таковой в случае онкозаболеваний могут являться, например, свежие образцы биопсии или парафинизированные блоки опухолевой ткани.
В патентной заявке US20160224739 А1 предлагается использовать набор индексов активации молекулярных путей для предсказания ответа пациентов с раком молочной железы на различные виды химиотерапии. Для достижения этого результата, авторы заранее определяют справочные (референтные) значения индексов активации маркерных молекулярных путей для каждого из анализируемых видов химиотерапии, отдельно для группы пациентов, ответивших на нее (ответчиков) и для группы неответивших пациентов (неответчики). После этого, для исследуемого случая (например, блока парафинизированной опухолевой ткани) определяется уровней активации маркерных молекулярных путей и проводится анализ того, насколько эти уровни близки к значениям для референтных групп ответчиков и неответчиков. На основании сходства профилей индексов активации маркерных путей к той или иной группе, делается предсказание относительно ответа конкретного исследуемого пациента на данный вид химиотерапии.
С другой стороны, в заявке US20170193176A1 , см. также статью Artemov et al., 2015, предлагается способ расчета относительной эффективности действия фармпрепаратов (Drug Score, DS) исходя из значений активации молекулярных путей. Для этого авторы предлагают формулу:
DSd = Et DTIdt Sr NIItpAMCFp PASp, где DS - это показатель потенциальной эффективности таргетного препарата; d - это препарат, для которого производится анализ эффективности; PASp- показатель силы активации молекулярного пути р; AMCFP - показатель, учитывающий способность молекулярного пути р усиливать или ослаблять клеточные рост или гибель (при этом он принимает значения 1 и -1 , соответственно); DTI - показатель, учитывающий способность препарата d ингибировать генный продукт t или нет (при этом он принимает значения 1 и 0, соответственно); Nil- показатель, учитывающий вовлеченность или нет генного продукта t в молекулярный путь р (при этом он принимает значения 1 и 0, соответственно).
В отличие от системы Онкобокс, при оценке эффективности, этот метод не учитывает изменение эффективной концентрации молекулярных мишеней фармпрепаратов. Другое отличие - в том, что приведенный в заявке US20170193176A1, а также в заявке US20160132632А1 метод может анализировать только уровни экспрессии мРНК и белков, но не профили мутаций ДНК, распределение сайтов связывания транскрипционных факторов и микроРНК.
Для всех ранее опубликованных способов предсказания эффективности препаратов характерен ряд ограничений.
Во-первых, они не могут одновременно использовать широкий спектр результатов мультиомиксного профилирования генов: данные по генным мутациям, по профилю связывания транскрипционных факторов, по уровню экспрессии белков, мРНК и микроРНК. При этом ранее вообще никогда не публиковались способы формализованного предсказания эффективности большого числа препаратов разной специфичности исходя из профилей генных мутаций, экспрессии микроРНК и связывания транскрипционных факторов.
Во-вторых, ранее опубликованные методы для предсказания эффективности препаратов не использовали комбинирования уровней активации молекулярных путей и отдельной количественной меры уровней изменения (экспрессии или мутационной нагрузки) генов - непосредственных мишеней исследуемых препаратов, взятой вне контекста молекулярных путей.
В-третьих, ранее опубликованные подходы при анализе экспрессии мРНК и белка (протеомные профили) не решали проблему гармонизации данных в части объединения профилей генной экспрессии исследуемых образцов и набора нормальных (контрольных) образцов.
В-четвертых, при анализе уровней активации молекулярных путей, роль тех или иных генных продуктов в составе пути определялась при ручном курировании графа молекулярного пути. Это является источником операционных ошибок и ограничивает широкое применение таких технологий в силу невозможности эффективной ручной обработки сотен и тысяч молекулярных путей, включающих десятки и сотни генных продуктов.
В-пятых, в ранее опубликованных методах массового скрининга таргетных препаратов слабо проработаны различия в расчетных алгоритмах в зависимости от природы различных классов таргетных препаратов и от механизма их действия.
На сегодняшний день в клинической практике не существует эффективных способов прогнозирования эффективности действия существующих противоопухолевых препаратов для конкретного пациента, которые бы учитывали особенности молекулярного дисбаланса, образующегося при развитии конкретной опухоли. Как следствие, большинство пациентов получают стандартные препараты, выбор которых основан на клинических или морфологических параметрах, таких как стадия заболевания, размер опухоли, агрессивность развития заболевания и др., что зачастую приводит к тому, что пациенты не отвечают на терапию, и рост опухоли продолжается. Развитие персонализированного подхода к лечению раковых заболеваний исходя из молекулярных нарушений в организме пациента является актуальной задачей, и данное изобретение призвано расширить круг подходов, применяющихся для решения этой задачи.
Сущность изобретения
Задачей настоящего изобретения является создание эффективного, научно обоснованного подхода к персонализированной терапии для онкологических пациентов, то есть к выбору противоопухолевого препарата, наиболее подходящего для конкретного пациента и способного модулировать сигнальные пути таким образом, чтобы компенсировать патологические изменения в опухолевых тканях. Описанный в настоящем изобретении подход заключается в анализе изменений во внутриклеточных молекулярных путях: сигнальных, репарационных, метаболических, цитоскелетных и других, а также прогнозе клинической эффективности применения лекарственных средств для индивидуальных онкологических пациентов. Описанная в изобретении платформа Oncobox решает задачу перепозиционирования существующих лекарственных препаратов для новых показаний к применению, а также может решать задачу поиска молекулярных мишеней при разработке новых лекарственных препаратов направленного действия (таргетных препаратов).
В качестве исходных данных Oncobox использует результаты мультиомиксных исследований образцов клеток и тканей индивидуальных больных, а также лиц без медицинской патологии. В качестве биоматериала для исследования используются свежие, парафинизированные или законсервированные иным путем образцы ткани. Исследованиями, предоставляющими исходные данные для платформы Oncobox, может быть мультиомиксное генетическое профилирование: высокопроизводительное профилирование экспрессии генов на уровне мРНК с использованием гибридизации на микрочипах, глубокого секвенирования, ОТ-ПЦР в реальном времени или профилирование на уровне экспрессии белков с использованием технологий количественной протеомики, профилирование количественного спектра микроРНК- транскриптома биообразцов, а также глубокое секвенирование геномной ДНК или определение профилей связывания транскрипционных факторов с геномной ДНК.
На основе результатов мультиомиксного профилирования, платформа Oncobox вычисляет профили активации внутриклеточных сигнальных путей (сигналома), а затем оценивает потенциальную эффективность воздействия фармпрепаратов с известным спектром молекулярных мишеней на индивидуального больного.
Указанная задача решается путем применения способа оценки клинической эффективности таргетных лекарственных средств для лечения пациента с пролиферативным или онкологическим заболеванием, выбранных из группы таргетных лекарственных средств, состоящего по меньшей мере из следующих этапов: (а) получают информацию о молекулярных мишенях для каждого таргетного лекарственного средства, выбранного из указанной группы; (б) получают образец ткани пациента, имеющий пролиферативный фенотип; (в) получают данные по меньшей мере одного типа из указанного образца, при этом тип данных выбирается из следующего списка: (i) данные по экспрессии тотальной мРНК, (и) полногеномные данные по экспрессии белков, (iii) полногеномные данные по сайтам связывания транскрипционных факторов, (iv) полногеномные данные по мутациям в геномной ДНК, (v) полногеномные данные по экспрессии микроРНК;
(г) получают данные из по меньшей мере одного контрольного образца ткани, не имеющего пролиферативного фенотипа, при этом контрольный образец получают из ткани того же типа, что и указанная ткань пациента, и тип данных, получаемых из контрольного образца, совпадает с типом данных, полученных на стадии (в);
(д) получают данные по меньшей мере одного типа о молекулярных мишенях для каждого таргетного лекарственного средства из указанного образца, при этом тип данных выбирается из следующего списка: (i) данные по экспрессии мРНК молекулярных мишеней, (и) данные по экспрессии молекулярных мишеней, (iii) данные по мутациям в генах молекулярных мишеней; (iv) данные по сайтам связывания транскрипционных факторов в генах молекулярных мишеней, (v) данные по экспрессии микроРНК, влияющих на экспрессию генов молекулярных мишеней, при этом каждый из типов данных (i) - (v), получаемых на стадии (д), совпадает с типом данных, соответственно (i) -
(v), получаемых на стадии (в);
(е) получают данные о молекулярных мишенях для каждого таргетного лекарственного средства из по меньшей мере одного контрольного образца ткани, не имеющего пролиферативного фенотипа, при этом контрольный образец получают из ткани того же типа, что и указанная ткань пациента, и тип данных из контрольного образца совпадает с типом данных, полученных на стадии (д);
(ж) определяют количественные показатели эффективности лекарственного средства для каждого из типов данных (i) - (v), используя данные, полученные на стадиях (в)-(е);
(з) определяют клиническую эффективность для каждого таргетного лекарственного средства из группы таргетных лекарственных средств с помощью усреднения количественных показателей эффективности, определенных на стадии (ж).
В некоторых предпочтительных вариантах осуществления изобретения вышеуказанный способ оценки клинической эффективности таргетных лекарственных средств характеризуется тем, что данные, полученные из по меньшей мере одного контрольного образца ткани гармонизированы с данными, полученными на стадиях (в) и (д). В других вариантах способ характеризуется тем, что (i) на стадии (в) получают данные по меньшей мере двух типов; (ii) на стадии (ж) независимо рассчитывают количественный показатель эффективности по каждому типу данных; и (ш) оценивают клиническую эффективность для каждого таргетного лекарственного средства из группы таргетных лекарственных средств, усредняя рассчитанные для каждого типа данных количественные показатели эффективности. В особо предпочтительных вариантах на стадии (в) получают полногеномные гармонизированные данные по экспрессии белков, и полногеномные данные по мутациям в геномной ДНК.
В других вариантах изобретения указанная задача решается путем применения способа лечения пациента с пролиферативным или онкологическим заболеванием, состоящего по меньшей мере из следующих этапов: (а) получают информацию об имеющихся таргетных лекарственных средствах и формируют группу таргетных лекарственных средств; (б) оценивают клиническую эффективность таргетных лекарственных средств, выбранных из указанной группы таргетных лекарственных средств, согласно вышеуказанному способу оценки клинической эффективности таргетных лекарственных средств; (в) выбирают для лечения указанного пациента лекарственное средство, имеющее лучший, или один из лучших количественных показателей эффективности, определенных согласно вышеуказанному способу оценки клинической эффективности таргетных лекарственных средств. В других вариантах изобретения указанная задача решается путем использования системы для оценки клинической эффективности таргетных лекарственных средств, выбранных из группы таргетных лекарственных средств, для пациента с пролиферативным или онкологическим заболеванием ткани, включающей:
- по меньшей мере, один процессор;
- по меньшей мере, одну память, которая содержит машиночитаемые инструкции, которые при их исполнении, по меньшей мере, одним процессором
- осуществляют оценку клинической эффективности указанных таргетных лекарственных средств, при помощи компьютерно-реализуемого способа, состоящего по меньшей мере из следующих этапов: (а) получают информацию о молекулярных мишенях для каждого таргетного лекарственного средства, выбранного из указанной группы; (в) получают данные по меньшей мере одного типа из образца ткани пациента, имеющей пролиферативный фенотип, при этом тип данных выбирается из следующего списка: (i) данные по экспрессии тотальной мРНК, (ii) полногеномные данные по экспрессии белков, (Ш) полногеномные данные по сайтам связывания транскрипционных факторов, (iv) полногеномные данные по мутациям в геномной ДНК, (v) полногеномные данные по экспрессии микроРНК; (г) получают данные из по меньшей мере одного контрольного образца ткани, не имеющего пролиферативного фенотипа, при этом контрольный образец получают из ткани того же типа, что и указанная ткань пациента; тип данных, получаемых из контрольного образца, совпадает с типом данных, полученных на стадии (в); (д) получают данные по меньшей мере одного типа о молекулярных мишенях для каждого таргетного лекарственного средства из указанного образца, при этом тип данных выбирается из следующего списка: (i) данные по экспрессии мРНК молекулярных мишеней, (ii) данные по экспрессии молекулярных мишеней, (iii) данные по мутациям в генах молекулярных мишеней; (iv) данные по сайтам связывания транскрипционных факторов в генах молекулярных мишеней, (v) данные по экспрессии микроРНК, влияющих на экспрессию генов молекулярных мишеней, при этом каждый из типов данных (i) - (v), получаемых на стадии (д), совпадает с типом данных, соответственно (i) - (v), получаемых на стадии (в); (е) получают данные о молекулярных мишенях для каждого таргетного лекарственного средства из по меньшей мере одного контрольного образца ткани, не имеющего пролиферативного фенотипа, при этом контрольный образец получают из ткани того же типа, что и указанная ткань пациента; тип данных из контрольного образца совпадает с типом данных, полученных на стадии (д); (ж) определяют количественные показатели эффективности лекарственного средства для каждого из типов данных (i) - (v), используя данные, полученные на стадиях (в)-(е); (з) оценивают клиническую эффективность для каждого таргетного лекарственного средства из группы таргетных лекарственных средств с помощью усреднения количественных показателей эффективности, определенных на стадии (ж).
В других вариантах изобретения указанная задача решается путем применения способа определения наиболее эффективного лекарственного средства из группы таргетных лекарственных средств для пациента с пролиферативным или онкологическим заболеванием, состоящего по меньшей мере из следующих этапов: (а) получают информацию о молекулярных мишенях для каждого таргетного лекарственного средства, выбранного из указанной группы; (б) получают образец ткани пациента, имеющий пролиферативный фенотип; (в) получают данные по меньшей мере одного типа из указанного образца, при этом тип данных выбирается из следующего списка: (i) данные по экспрессии тотальной мРНК, (ii) полногеномные данные по экспрессии белков, (iii) полногеномные данные по сайтам связывания транскрипционных факторов, (iv) полногеномные данные по мутациям в геномной ДНК, (v) полногеномные данные по экспрессии микроРНК; (г) получают данные из по меньшей мере одного контрольного образца ткани, не имеющего пролиферативного фенотипа, при этом контрольный образец получают из ткани того же типа, что и указанная ткань пациента, и тип данных, получаемых из контрольного образца, совпадает с типом данных, полученных на стадии (в); (д) получают данные по меньшей мере одного типа о молекулярных мишенях для каждого таргетного лекарственного средства из указанного образца, при этом тип данных выбирается из следующего списка: (i) данные по экспрессии мРНК молекулярных мишеней, (ii) данные по экспрессии молекулярных мишеней, (iii) данные по мутациям в генах молекулярных мишеней; (iv) данные по сайтам связывания транскрипционных факторов в генах молекулярных мишеней, (v) данные по экспрессии микроРНК, влияющих на экспрессию генов молекулярных мишеней, при этом каждый из типов данных (i) - (v), получаемых на стадии (д), совпадает с типом данных, соответственно (ί) - (n), получаемых на стадии (в); (е) получают данные о молекулярных мишенях для каждого таргетного лекарственного средства из по меньшей мере одного контрольного образца ткани, не имеющего пролиферативного фенотипа, при этом контрольный образец получают из ткани того же типа, что и указанная ткань пациента, и тип данных из контрольного образца совпадает с типом данных, полученных на стадии (д); (ж) определяют количественные показатели эффективности лекарственного средства для каждого из типов данных (i) - (v), используя данные, полученные на стадиях (в)-(е);(з) определяют клиническую эффективность для каждого таргетного лекарственного средства из группы таргетных лекарственных средств с помощью усреднения количественных показателей эффективности, определенных на стадии (ж).
При осуществлении изобретения достигается следующий технический результат: разработан новый, более эффективный способ оценки клинической эффективности таргетных лекарственных средств для индивидуального пациента с пролиферативным или онкологическим заболеванием ткани, использующий широкий спектр экспериментальных данных: данные по генным мутациям, по профилю связывания транскрипционных факторов, по уровню экспрессии белков (с учетом гармонизации), мРНК (с учетом гармонизации) и микроРНК, а также информацию по молекулярным мишеням таргетных лекарственных средств. Данный способ может быть автоматизирован, что предотвращает потенциальные ошибки, связанные с ручным расчетом, и позволяет учитывать изменения в сотнях и тысячах молекулярных путей, включающих десятки и сотни генных продуктов, характерных для конкретного пациента.
Краткое описание рисунков
Фиг. 1. Схема организации платформы Oncobox.
Фиг. 2. Схема алгоритма Shambhala для универсальной гармонизации экспрессионных профилей. Различные образцы (профили) (1 ,... , N) (см. левый нижний прямоугольник) добавляются по одному к вспомогательному (калибровочному) набору профилей Р с помощью квантильной нормализации (Bolstad et al. 2003). Получившийся в результате этого набор профилей Р1 подвергается затем конверсии в дефинитивную форму, характерную для набора профилей Q, с помощью кусочно-линейной гармонизации (Shabalin et al. 2008). Отличие данной конверсии от других опубликованных аналогов заключается в том, что 1) в процессе конверсии итеративным изменениям подвергается только набор профилей Р1 , в то время, как набор Q остается постоянным; 2) для кластеризации генов и образцов в наборах профилей P1 and Q используется сферическая (косинусоидальная), а не барицентрическая, как в методе XPN, мера близости (Shabalin et al. 2008). После данных процедур образец/профиль i = (1 , ... , N) считается гармонизированным.
Фиг. 3. Распределение белоккодирующих генов человека по значениям индексов GRES (обозначено на схеме как GRE).
Фиг. 4. Окрашивание гематоксилином и эозином указывает на умеренно дифференцированную внутрипеченочную холангиокарциному.
Фиг. 5. Клинический статус препаратов, отсортированных по значению индекса BES. Показатели клинической значимости (отложены по оси ординат): 1 - препарат одобрен для клинического применения при опухолях данной локализации; 0,85 - успешно прошел III фазу клинических испытаний; 0,7 - находится на III фазе клинических испытаний; 0,4 -успешно прошел II фазу; 0,3 - находится на II фазе клинических испытаний; 0,2 -успешно прошел I фазу; 0,1 - находится на I фазе клинических испытаний. Фиг. 6. Приведение профилей генной экспрессии к универсальному виду с использованием метода Shambhala платформы Онкобокс. Показаны экспрессионные профили до и после гармонизации с помощью алгоритма Shambhala (верхний и нижний ряды панелей, соответственно). Показано распределение генов по уровням экспрессии (оси абсцисс). Исходные экспрессионные профили были получены для одного и того же биообразца (Stratagene Universal Human Reference RNA; UHRR Catalog #740000) c использованием разных экспериментальных платформ (слева направо): lllumina HiSeq 2000 (GPL11154), lllumina HumanHT-12 V4.0 expression beadchip (GPL10558), Affymetrix Human Gene 2.0 ST Array (GPL17930) и Affymetrix GeneChip PrimeView Human Gene Expression Array (GPL16043).
Фиг. 7. Индекс Жаккара для сравнения списков препаратов, которые попадали в верхнюю часть рейтинга, составленного по индексу эффективности DS1a, для исследуемых 11 нозологий (указаны заболевания по типу ткани).
Фиг. 8. Индекс Жаккара для сравнения списков препаратов, которые попадали в верхнюю часть рейтинга, составленного по индексу эффективности BES, для исследуемых 11 нозологий (указаны заболевания по типу ткани).
Фиг. 9. Зависимость рейтинга таргетных препаратов, рассчитанного системой Oncobox по транскриптомному профилю пациента с раком шейки матки из базы данных TCGA, от клинического рейтинга данных препаратов по базе clinicaltrials.gov (по состоянию на август 2017 года). Зеленым отмечены препараты, которые находились в верхней части рейтинга, красным - в нижней части.
Фиг. 10. Плотность распределения коэффициентов Анубиса, рассчитанных по индексу эффективности препаратов BES (верхний график) или DS1a (нижний график) для 306 пациентов с раком шейки матки (зеленым). Прозрачные столбцы гистограммы отражают распределение коэффициентов Анубиса при случайном перемешивании клинического статуса препаратов.
Подробное раскрытие изобретения
В описании данного изобретения термины «включает» и «включающий» интерпретируются как означающие «включает, помимо всего прочего». Указанные термины не предназначены для того, чтобы их истолковывали как «состоит только из».
Под «субъектом», или «пациентом», следует понимать человека (предпочтительно) или другое млекопитающее. Под «тканью» пациента или субъекта следует понимать значение, принятое в медицинской литературе— это система клеток и межклеточного вещества, объединённых общим происхождением, строением и выполняемыми функциями. В описании данного изобретения это может быть кровь, твердая ткань различного происхождения (например, эпителиальная, соединительная, нервная или мышечная) или часть любого органа пациента или субъекта.
Под образцом ткани пациента, имеющим пролиферативный фенотип, понимают образец опухолевой ткани, клетки которой обладают способностью к неконтролируемому делению в результате патологического изменения (обычно в результате изменения генетического аппарата клеток). Такой образец может быть частью доброкачественной или злокачественной опухоли.
Под пролиферативным или онкологическим заболеванием понимают заболевание, характеризуемое патологическим изменением генетического аппарата клеток, приводящее к неконтролируемому делению определенной популяции клеток. Примерами пролиферативных заболеваний могут служить миелопролиферативные заболевания, лимфопролиферативные заболевания, пролиферативные заболевания соединительной ткани и другие заболевания.
Под данными по экспрессии тотальной мРНК следует понимать данные, показывающие абсолютное или относительное количество всех или более 300 видов молекул мРНК в образце. Под полногеномными данными по сайтам связывания транскрипционных факторов следует понимать данные, показывающие области связывания заданного набора транскрипционных факторов с последовательностями ДНК в геноме субъекта. Этот набор определяется специалистом исходя из вовлеченности транскрипционных факторов в молекулярные пути, предположительно ответственные за заболевание. Аналогичным образом определяются полногеномные данные по экспрессии белков, полногеномные и полноэкзомные данные по мутациям в геномной ДНК, полногеномные данные по экспрессии микроРНК.
Под гармонизацией данных понимают приведение их к универсальному сравниваемому виду. При осуществлении данного изобретения необходимость гармонизации возникает при использовании данных по экспрессии тотальной мРНК или полногеномных данных по экспрессии белков, в случае, когда соответствующие данные контрольных образцов были получены независимо от данных пациента, в том числе, с использованием разных методов. В таком случае, для их гармонизации может быть использован предложенный авторами метод Shambhala, или другой метод, обеспечивающий возможность сравнения полногеномных экспрессионных данных, полученных на разных платформах. В случае, когда данные пациента и контрольных образцов получают параллельно с использованием единой методики, данные считаются гармонизированными без использования дополнительных алгоритмов. Аналогично, для полногеномных данных по мутациям в геномной ДНК, полногеномных данных по экспрессии микроРНК и полногеномных данных по сайтам связывания транскрипционных факторов необходимость в гармонизации отсутствует, и такие данные считаются гармонизированными без использования дополнительных алгоритмов.
Если не определено отдельно, технические и научные термины в данном описании имеют стандартные значения, общепринятые в научной и технической литературе.
Платформа Oncobox решает задачи прогноза клинической эффективности лекарственных средств для индивидуальных онкологических пациентов, а также задачу перепозиционирования существующих лекарственных препаратов и задачу поиска молекулярных мишеней при разработке новых лекарственных препаратов направленного действия (таргетных препаратов).
Задачи решаются при помощи технологии, основанной на молекулярном профилировании образцов патологической ткани, последующем анализе профилей активации молекулярных путей и вычислении сбалансированных индексов эффективности препаратов Balanced Efficiency Score (BES).
В качестве образцов патологической ткани могут браться образцы свежей, парафинизированной или законсервированной иным способом ткани. В предпочтительном варианте осуществления изобретения анализ ткани производится у пациента с пролиферативным или онкологическим заболеванием ткани. Также для патологической ткани предпочтительно проводить анализ достаточно гомогенного участка ткани пациента, имеющей пролиферативный фенотип. Для этого возможно проводить дополнительную очистку ткани, имеющей пролиферативный фенотип, от других окружающих ее тканей с помощью методов, известных специалистам.
Платформа Oncobox эффективна для анализа большого спектра широкомасштабных молекулярных данных: данных по профилям мутаций в генах, по экспрессии мРНК генов, по экспрессии молекул микроРНК, специфических к соответствующим генным продуктам, по количественным протеомным профилям, а также по частоте встречаемости сайтов связывания транскрипционных факторов в генных регуляторных областях.
Первой решаемой технической задачей (1) является анализ изменений внутриклеточных молекулярных путей исходя из перечисленных видов данных. При этом к измеряемым внутриклеточным путям относятся сигнальные, репарационных, метаболические, цитоскелетные и другие молекулярные пути.
При этом первая техническая задача разделяется на ряд подзадач:
1.1. Разработка баз данных молекулярных путей и определение функциональной роли включенных в них генных продуктов 1.2. Разработка алгоритмов анализа активации молекулярных путей для данных по мутациям ДНК, экспрессии мРНК, белков, микроРНК, а также по профилям связывания транскрипционных факторов.
Второй решаемой технической задачей (2) является персонализированное прогнозирование клинической эффективности фармпрепаратов для индивидуальных пациентов, в том числе онкологических.
Вторая техническая задача разделяется на следующие подзадачи:
2.1. Разработка баз данных молекулярных мишеней фармпрепаратов.
2.2. Разработка алгоритмов персонализированного прогнозирования клинической эффективности фармпрепаратов на основе уровней активации молекулярных путей и других молекулярно-статистических данных.
Схема организации платформы Oncobox.
Общая схема работы платформы Oncobox приведена на Фиг.1.
Платформа Oncobox имеет ряд существенных преимуществ относительно иных опубликованных аналогов.
Во-первых, в отличие от других систем, она может одновременно использовать беспрецедентно широкий спектр результатов мультиомиксного профилирования генов: данные по генным мутациям, по профилю связывания транскрипционных факторов, по уровню экспрессии белков, мРНК и микроРНК. При этом в рамках платформы Oncobox впервые вводятся способы формализованного предсказания эффективности таргетных препаратов разной специфичности исходя из профилей генных мутаций, экспрессии микроРНК и связывания транскрипционных факторов. Возможность одновременного использования разных видов молекулярных данных дает платформе Oncobox уникальное преимущество проверки правильности выбора препаратов альтернативными методами. Впервые появляется возможность проведения единообразного сравнения геномных, транскриптомных либо эпигенетических данных, доступных для данного пациента. При этом итоговая рекомендация включает консенсусные препараты, рекомендованные с использованием наибольшего числа из доступных видов анализа.
Во-вторых, в отличие от других методов, платформа Oncobox использует комбинирование уровней активации молекулярных путей и специальной количественной меры изменения (экспрессии или мутационной нагрузки) генов - непосредственных мишеней препаратов. Это позволяет получать результаты расчета относительной эффективности действия фармпрепаратов более высокого качества, чем в ранее опубликованных методах, например, чем в заявке US20170193176A1 , а также в статье Artemov et al., 2015. Сопоставление групп данных, полученных с помощью платформы
Oncobox и ранее опубликованных подходов, приведено в Примере 8.
В-третьих, в рамках платформы Oncobox впервые вводится требование к унификации (гармонизации) данных в части объединения профилей генной экспрессии исследуемых образцов и наборов нормальных (контрольных) образцов перед анализом и предлагается оригинальный инструмент для осуществления этой задачи.
В-четвертых, в рамках платформы Oncobox впервые вводится автоматическая аннотация молекулярных путей. Предлагается оригинальный инструмент для определения роли каждого генного продукта в составе каждого молекулярного пути при анализе их уровней активации. Это одновременно снижает число операционных ошибок и повышает производительность платформы Oncobox до анализа любого количества молекулярных путей, включающих любое количество генных продуктов.
Другим важным отличием системы Oncobox является оригинальный способ расчета сбалансированного индекса эффективности для каждого препарата Balanced Efficiency Score (BES). На основании значений этого индекса, производится моделирование эффективности препаратов. BES рассчитывается с использованием единого алгоритма, включающего два базовых слагаемых: Drug Efficiency Score МР, DESMp (отражает вклад молекулярных путей) u Drug Efficiency Score TG, DESTG (отражает вклад конкретных молекулярных мишеней препаратов), при этом для различных типов препаратов используются разные весовые коэффициенты для DESMp u DESTG, варьирующие от -1 до 1.5. Впервые вводится суммирование слагаемых: DESMP и DEStg, разделение препаратов на классы и весовые коэффициенты в формуле для DESMP u DESTG В зависимости от этих классов. Разделение препаратов на классы осуществляется в соответствии с их известным механизмом действия и молекулярной специфичностью.
Предлагаемый метод может быть также использован для перепозиционирования существующих препаратов и для поиска новых мишеней при разработке новых фармпрепаратов.
Анализ внутриклеточных молекулярных путей
Количественный анализ молекулярных путей в исследуемом биообразце является первым этапом работы платформы Oncobox. Для этого система Oncobox использует единый базовый алгоритм анализа молекулярных путей, для которого ранее была показана способность минимизировать экспериментальные ошибки измерения (Aliper et al. 2017). Для каждого из типов анализируемых данных (мутации ДНК, профили экспрессии мРНК, белков, микроРНК, профиль связывания транскрипционных факторов), система Oncobox использует специфические модификации исходного алгоритма.
Анализ проводится на основе базы данных молекулярных путей с автоматически курируемыми функциональными ролями генных продуктов - участников каждого пути. В рамках системы Онкобокс, выделяют пять видов функциональных ролей для генных продуктов: активатор пути, репрессор, скорее активатор, скорее репрессор, а также генные продукты с невыясненной или противоречивой ролью.
Автоматическое курирование функциональной роли генных продуктов из базы молекулярных путей является одной из оригинальных особенностей платформы Oncobox. Оно устроено следующим образом.
Алгоритм расстановки коэффициентов, отражающих роль генных продуктов в активации молекулярного пути.
Алгоритм присвоения генным продуктам коэффициентов, отражающих роль генных продуктов в активации молекулярного пути (activator/repressor role, ARR) основан на анализе графа белок-белковых взаимодействий для каждого отдельного пути. Данный граф может быть построен вручную или с использование опубликованных баз данных молекулярных путей, таких как KEGG, biocarta, Reactome и др. В вершинах такого графа находятся гены, а наличие ребра между двумя вершинами свидетельствует о наличии белок-белкового взаимодействия между соотвествующими генными продуктами. Каждое ребро данного графа направлено, а также имеет параметр, указывающий на характер белок-белкового взаимодействия: «активация» или «ингибирование». Для корректной расстановки коэффициентов ARR данный граф должен быть связным, при этом достаточным условием является слабая связность.
Если граф белок-белковых взаимодействий для заданного молекулярного пути соответствует вышеуказанным критериям, коэффициенты ARR могут быть автоматически выставлены генным продуктам, которые входят в состав данного пути. Для этого авторы предлагают следующий рекурсивный алгоритм:
1) Инициализация: выявляется первая вершина, которая будет считаться центральным узлом графа. Для этого для каждой вершины V рассчитывается два параметра: N и М. N - количество вершин, которые могут быть достигнуты при движении из вершины V, М - количетво вершин, из которых можно достичь вершины V. Центральной вершиной будем считать такую вершину V, для которой параметр N+M будет максимальным. Центральной вершине присваивается ARR = 1. С данной вершины начинаем рекурсивно присваивать ARR другим вершинам 2) Рекурсия R: для каждой вершины V находим все вершины Pi, для которых в графе есть ребро Pi -> V или V -> Pi. Каждое ребро может быть рассмотрено в ходе рекурсии только один раз. В противном случае рекурсия будет вечной в случае появления циклов в графе. В том случае, если ребро имеет параметр «активация», то вершине Pi присваивается временный ARRtemp = 1. Если ребро имеет параметр «ингибирование», то вершине Pi присваивается временный ARRtemp = -1. В том случае, если при обходе графа вершина Pi ранее не встречалась, то присваиваем вершине Pi ARR = ARRtemp. В том случае, если при обходе графа вершина Pi ранее встречалась и присвоенный ранее ARR равен ARRtemp, то присваиваем вершине Pi ARR = ARRtemp. В том случае, если при обходе графа вершина Pi ранее встречалась и присвоенный ранее ARR не равен ARRtemp, то присваиваем вершине Pi ARR по правилу разрешения конфликтов. Правило разрешения конфликтов: в случае, если при обходе графа встречается ген, у которого уже указан ARR, но, согласно вышеизложенным правилам, данному гену требуется присвоить ARR, отличный от указанного, «конфликты» разрешаются по следующим правилам: 1) если знаки двух коэффициентов ARR различны, то результирующий ARR = 0; 2) если ARR отличаются на 0,5 и один из них положительный, то результирующий ARR = 0.5; 3) если ARR отличаются на 0,5 и один из них отрицательный, то результирующий ARR = -0.5. Затем для каждой вершины Pi, для которой модуль |ARR| равен 1 , вызывается рекурсия R.
3) В результате алгоритм присвоит ARR вершинам графа. Данные коэффициенты могут быть использованы для расчета уровня активации молекулярных путей по вышеуказанным формулам.
Таким образом, генным продуктам, входящим в базу молекулярных путей, приписываются значения коэффициента ARR, отражающего функциональную значимость генного продукта в данном молекулярном пути.
При создании базы молекулярных путей, могут использоваться как опубликованные каталоги молекулярных путей, так и заданные пользователем самостоятельно. К опубликованным каталогам молекулярных путей относятся коллекции данных BioCarta, KEGG, NCI, Reactome и Pathway Central (Buzdin et al., 2017). В них собрана информация о 3125 молекулярных путях, совместно покрывающих около 11 000 белоккодирующих генов человека. Для использования в системе Oncobox, база данных для каждого молекулярного пути должна содержать следующую информацию:
1) Уникальные идентификаторы для всех генов, продукты которых включенных в молекулярные пути, 2) Роль каждого соответствующего генного продукта в функционировании конкретного молекулярного пути: роль активатора, репрессора, нейтральная роль, либо роли промежуточного активатора либо репрессора.
Базовый алгоритм анализа активации молекулярных путей основан на принятии следующих основных принципов.
Во-первых, граф молекулярных взаимодействий в каждом пути полагают в виде двух параллельных цепочек событий, где одна приводит к активации, а другая - к ингибированию молекулярного пути.
Во-вторых, уровень экспрессии каждого из генных продуктов - участников пути в состоянии низкой активности пути полагают меньшим, чем в состоянии высокой активности пути. Это положение принимается на основе данных о том, что в состоянии низкой активности пути было показано глубоконенасыщенное по концентрации состояние каждого из белков-переносчиков сигнала (Kuzmina and Borisov 2011 ; Aliper et al. 2017).
Важно отметить, что хотя базовый алгоритм включает понятие «экспрессии» гена (то есть при обычном толковании это уровни мРНК и белка), к нему могут сводиться также и другие измеряемые молекулярные характеристики:
-экспрессия микроРНК (влияет на экспрессию генов через ингибирование мРНК- мишеней),
-связывание транскрипционных факторов (регулирует экспрессию генов на уровне транскрипции),
-мутации геномной ДНК (влияют на экспрессию генов дикого типа путем появления мутантных аллелей). Авторами используется термин "приведенная экспрессия гена", охватывающий расчет экспрессии гена по вышеуказанным типам молекулярных данных.
Система Oncobox рассматривает все генные продукты-участники молекулярных путей в каждом отдельном пути как имеющие потенциально равные возможности вызывать активацию или ингибирование этого пути. Для анализа уровня активации молекулярных путей, в системе Oncobox используется следующая основная формула:
PALp = Sh Nllnp · ARRnp · In CNRn / Sh |ARRn|, где PALp (Pathway Activation Level p)- это уровень активации молекулярного пути р; CNRn (case-to-normal ratio) - это отношение приведенных уровней экспрессии гена, кодирующего белок п, в исследуемом образце к норме (среднему значению у контрольной группы); In - натуральный логарифм; Nllnp - показатель принадлежности генного продукта п к пути р, принимает значения, равные единице для генных продуктов, входящих в путь и равные нулю для генных продуктов, не входящих в путь; дискретная величина ARRnp (activator/repressor role) определяется для гена n в пути р следующим образом и помещается в базу молекулярных путей:
Г- 1; белок п - репрессор сигнала в пути р
ARR
- 0,5; белок п - скорее репрессор сигнала в пути р
, 0; нельзя сказать, что белок и - репрессор или активатор сигнала в пути р
0,5; белок и - скорее активатор сигнала в пути р
1; белок и - активатор сигнала в пути р
Важным отличием базового алгоритма от ранее опубликованных (см. например Buzdin et al., Front Genet 2014) является то, что в системе Oncobox уровень активации молекулярного пути нормализуется на число генов-участников соответствующего пути с известной функциональной ролью, что отражается параметром |ARRn|.
В зависимости от типа получаемых молекулярных данных, в составе базового алгоритма по-разному рассчитывается параметр In CNRn, то есть логарифм отношения приведенной экспрессии гена п в исследуемом образце к приведенной экспрессии гена п в контрольном образце. Ниже приведены варианты расчета параметра In CNRn.
(1) - In CNRn для данных по мутациям в геномной ДНК.
В каждом образце, для анализируемого гена п рассчитывается параметр MR (mutation rate): MRn= 1000 - 1 Nmut(n) I l-cds(n) где Nmut(n) - это число выявленных мутаций в белоккодирующей части гена п в исследуемом образце; Lcds(n) - это длина белоккодирующей части гена п в парах нуклеотидов.
В свою очередь, параметр In CNRn рассчитывается по формуле: In CNRn = In CNR(MRn), где CNR(MRn) - это отношение параметра MR в исследуемом образце к среднему значению MR в контрольной группе, для гена п.
(2) - In CNRn для данных по сайтам связывания транскрипционных факторов.
В данном приложении, для каждого гена определяется консенсусная точка начала транскрипции. Для каждой точки начала транскрипции, определяется окрестность, составляющая по умолчанию участок от 5 т.п.н. выше точки начала транскрипции до 5 т.п.н. ниже точки транскрипции для соответствующего гена n. В данной окрестности, ведется подсчет картированных сайтов связывания транскрипционных факторов. Затем для каждого гена производится расчет параметра GRES (Gene Record Enrichment Score):
Figure imgf000022_0001
где GRESn - это значение GRES для гена n; m - общее число исследуемых генов для данного образца; TESn - это количество картированных сайтов связывания транскрипционных факторов в окрестностях гена п; /' - индекс, соответствующий идентификатору гена; сумма TES по числу генов m - это общее число картированных сайтов связывания транскрипционных факторов в окрестностях всех исследуемых генов. Для каждого гена, значения GRES позволяют измерять уровень обогащения сайтами связывания транскрипционных факторов. Например, GRES =1 обозначает средний уровень обогащенное™ среди всех генов; GRES >1 обозначает уровень обогащения выше среднего по всем генам; GRES <1 , напротив, обозначает то, что ген обеднен сайтами связывания транскрипционных факторов относительно всех генов.
Наконец, параметр In CNRn рассчитывается по формуле:
In CNRn = In CNR(GRESn), где CNR(GRESn) - это отношение параметра GRES в исследуемом образце к среднему значению GRES в контрольной группе, для гена п.
(3)- In CNRn для данных по экспрессии мРНК
Важной особенностью системы Oncobox является то, что перед проведением расчетов активации молекулярных путей, для профилей мРНК проводится оригинальная совместная нормализация исследуемых образцов с группами соответствующих нормальных образцов.
Информация, содержащаяся в базах данных профилей генной экспрессии, представляют собой результаты исследований, полученных разными методами, включая микрочиповую гибридизацию мРНК, высокопроизводительное секвенирование и т.д. Каждый из этих методов реализован с использованием различных экспериментальных платформ от разных производителей. Находящиеся в открытом доступе такие хранилища данных содержат результаты для более чем 2 млн образцов, полученные в более чем 70 тыс. экспериментов (Cancer Genome Atlas Research Network 2008; https://www. ncbi . n I m .nih.gov/qeo/ ) .
Результаты количественного профилирования экспрессии генов, как правило, являются несравнимыми между собой (Demetrashvili et al. 2010). Для достижения удовлетворительного уровня однородности сравниваемых экспрессионных данных, в рамках системы Oncobox используется оригинальный метод гармонизации профилей генной экспрессии Shambhala, подходящий для унификации результатов, полученных как на одинаковых, так и на разных экспериментальных платформах. Среди ранее опубликованных, могут быть отмечены методы гармонизации DWD
(distance-weighted discrimination) (Huang et al. 2012), XPN (cross-platform normalization)
(Shabalin et al. 2008) и PLIDA (platform-independent latent Dirichlet allocation) (Deshwar and
Morris 2014), которые осуществляют глубокую реструктуризацию профилей генной экспрессии. Как правило, методы гармонизации экспрессионных профилей предусматривают поиск сходно экспрессирующихся на обеих платформах кластеров генов и белков, а затем производят пошаговое сближение экспрессионных профилей, полученных на двух разных экспериментальных платформах, в пределах каждого кластера. Тем не менее, все ранее опубликованные методы рассчитаны на гармонизацию максимально только двух наборов профилей экспрессии, полученных на разных экспериментальных платформах, причем число этих профилей в каждом из наборов, как правило, ограничено пороговым значением в сотню образцов. Это не позволяет применять данную группу методов для масштабного анализа массивов экспрессионных данных, включающих сотни и тысячи образцов.
В рамках системы Oncobox для этой цели используется разработанный нами оригинальный метод Shambhala, позволяющий проводить гармонизацию результатов профилирования генной экспрессии, полученных как на одинаковых, так и на разных платформах, который приводит их к универсальному сравниваемому виду. Метод Shambhala позволяет проводить гармонизацию для любого количества сравниваемых образцов, полученных на любом количестве экспериментальных платформ.
Метод Shambhala использует кластеризацию генов и образов с помощью стохастических генетических алгоритмов, а также кусочно-линейное итеративное сближение профилей генной экспрессии. Алгоритм Shambhala включает следующие особенности (Фиг. 2):
1. Осуществляется приведение (конверсия) гармонизируемого набора профилей (Р\) к распределению уровней экспрессии, аналогичному эталонному (дефинитивному) набор профилей (Q). В качестве эталонного (дефинитивного) набора данных использован набор из ста экспрессионных профилей проекта Genotype Tissue Expression (GTEx) (GTEx Consortium 2013). Набор экспрессионных профилей GTEx (GSE45878) получен с помощью микрочиповой гибридизации мРНК на установке Affymetrix Human Gene 1.1 ST (GPL16977). В процессе конверсии, набор данных Р1 итеративно приближается к набору профилей Q, который остается постоянным. Результатом такой конверсии будет являться набор экспрессионных профилей Р2, который представляет из себя набор профилей Р1 , аналогичный тому, как если бы он был профилирован на той же платформе, что и эталонный (дефинитивный) набор профилей Q. 2. Для обеспечения большей устойчивости (меньших выбросов, обусловленных стохастической природой алгоритма кластеризации генов, входящего в алгоритм итеративной гармонизации), используется косинусоидальная метрика близости наборов вместо используемой в других методах (например, в методе XPN, Shabalin et al. 2008) евклидовой барицентрической (Krishna, 1999; Hornik, 2012).
3. Для обеспечения устойчивой конверсии в форму эталонного набора профилей Q всех образцов, депонированных в базах экспрессионных данных, каждый из конвертируемых профилей (/ = 1 ,...Л/), по одному подвергается конверсии в составе вышеупомянутого набора профилей Р1. Для формирования набора Р1 , каждый из экспрессионных профилей / (/ = 1 ,... N) сначала квантильно нормализуется (Bolstad et al. 2003b) с заданным промежуточным (вспомогательным) набором профилей (Р) для обеспечения единообразного масштаба калибровки по значениям экспрессий перед конверсией в форму набора профилей Q. Наконец, получившийся в результате такой конверсии набор Р2 содержит гармонизированный профиль генной экспрессии / (/ = 1....L/), см. Фиг. 2. После гармонизации методом Shambhala, производят прямое сравнение экспрессионных профилей. Активность молекулярных путей вычисляют согласно указанной выше основной формуле, где в качестве In CNRn берется натуральный логарифм от отношения гармонизированного уровня экспрессии гена п в исследуемом образце к норме (среднему значению у контрольной группы).
(4) - In CNRn для данных количественной протеомики
Для анализа активации молекулярных путей на уровне данных белковой экспрессии, в системе Oncobox на первом этапе для гармонизации профилей сравниваемых образцов и группы норм, используется метод Shambhala, аналогично предыдущему приложению.
После этого рассчитывается активность молекулярных путей, где в качестве In CNRn берется натуральный логарифм от отношения гармонизированного уровня экспрессии белка п в исследуемом образце к норме (среднему значению у контрольной группы).
(5) - In CNRn для данных профилей микроРНК
Применение данного метода расчетов основано на использовании базы данных генных продуктов - мишеней микро РНК. Для использования в системе Oncobox, база данных для каждой включенной микроРНК должна содержать следующую информацию:
1 ) уникальное название и/или идентификатор микроРНК, 2) список уникальных идентификаторов генов молекулярных мишеней данной микроРНК.
В системе Oncobox, учет влияния микроРНК на приведенный уровень генной экспрессии осуществляется исходя из положения об ингибировании молекулами микроРНК своих мРНК-мишеней. Поэтому возрастание уровня микроРНК приводит к снижению приведенного уровня экспрессии соответствующей мРНК-мишени, и наоборот. При этом каждый генный продукт может иметь несколько регуляторных микроРНК, а каждая микроРНК - несколько генов-мишеней.
При этом In CNRn вычисляется по следующей формуле:
Figure imgf000025_0001
где n - анализируемый в настоящий момент генный продукт, j - вся совокупность анализируемых системой микроРНК, i - анализируемая в настоящий момент микроРНК. Булева переменная microRNA involvement index (millj n) указывает, является ли анализируемый генный продукт п мишенью для микроРНК i. При этом milll n принимает значение, равное 1 , когда анализируемый генный продукт л является мишенью для микроРНК i, и значение, равное 0 - когда не является. Величина miCNR, - это отношение количественно измеряемого уровня экспрессии микроРНК i в исследуемом образце к таковому среднему значению в контрольной группе. Отрицательный коэффициент перед знаком суммы отражает ингибирующую роль микроРНК для соответствующего генного продукта - мишени.
Для оптимального проведения оценки клинической эффективности таргетных лекарственных средств предпочтительно совмещать анализ различных типов молекулярных данных, полученных из патологической ткани пациента. Одной из возможных комбинаций является получение данных по изменению экспрессии белков (в молекулярных путях, а также белков-мишеней) и данных по накопленным в ткани мутациям. Эти два типа данных дополняют друг от друга и являются предпочтительными для проведения способа оценки клинической эффективности таргетных лекарственных средств, при условии достаточного качества этих данных. Остальные типы данных (связывание транскрипционных факторов, уровни микроРНК и мРНК) в основном влияют на уровень экспрессии белков в молекулярных путях, а также экспрессии белков- мишеней и действуют опосредованно. Данные этих типов могут быть использованы при осуществлении способа оценки клинической эффективности таргетных лекарственных средств в случаях, когда два предпочтительных типа данных недоступны или недостаточного качества.
Для получения информации из контрольных образцов здоровых субъектов можно использовать публично доступные данные, известные для конкретной ткани (например, данные экспрессии), так и, предпочтительно, экспериментальные данные, полученные из контрольных образцов здоровых субъектов на том же оборудовании, что и данные из исследуемого образца пациента. В последнем случае их можно получать параллельно с анализом образцов патологической ткани конкретного пациента. Для повышения точности оценки при выборе контрольных образцов желательно использовать образцы здоровых субъектов, имеющих как можно более схожие характеристики с пациентом, например, такие характеристики как пол, возраст и т.д. Минимальным является использование одного контрольного образца для одного образца пациента. Для повышения точности оценки рекомендуется использование от трех до двадцати контрольных образцов, что позволяет эффективно усреднять возможные отклонения, существующие в индивидуальных данных. Под усреднением следует понимать использование среднего арифметического значения усредняемых величин. В некоторых вариантах изобретения для усреднения используют среднее геометрическое значение усредняемых величин.
В предпочтительных вариантах осуществления изобретения необходимо получение полногеномных данных из образца пациента и контрольного образца. Однако осуществление изобретения возможно и с данными меньшего покрытия. Достаточными можно признать данные, оценивающие заданные параметры (уровни экспрессии микроРНК, белка или мРНК, профиль связывания транскрипционных факторов) для не менее 80% всех генных продуктов, входящих в состав отобранных и помещенных в базу молекулярных путей, в состав которых входят молекулярные мишени исследуемых препаратов. При этом крайне желательно получение данных для всех генных продуктов, которые являются известными молекулярными мишенями исследуемых препаратов. Минимально необходимый набор количественно охарактеризованных генных продуктов зависит (i) от количества и состава списка исследуемых препаратов и (ii) от набора молекулярных путей, которые добавлены пользователем технологии Онкобокс в референсную базу данных.
Для каждого таргетного лекарственного средства получают данные по меньшей мере от одного контрольного образца ткани, не имеющего пролиферативного фенотипа, при этом контрольный образец получают из ткани того же типа, что и указанная ткань пациента. Под образцом ткани, не имеющим пролиферативного фенотипа, следует понимать образец ткани, взятый либо от "здорового" субъекта, не имеющего такого же онкологического заболевания, как и рассматриваемый пациент, либо взятый от рассматриваемого пациента, но из места, не пораженного онкологическим заболеванием.
Для осуществления изобретения возможно использование геномных данных неоптимального качества. Например, для данных экспрессии мРНК и микроРНК могут быть использованы любые типы входящих экспрессионных данных, способные обеспечить однозначное определение уровня экспрессии каждого генного продукта, который необходимо проанализировать, а также детекцию как минимум 1000-кратных различий в уровне экспрессии между отдельными транскриптами. Для мутационных профилей геномной ДНК могут быть использованы любые типы входящих данных геномного или экзомного секвенирования, полностью покрывающие кодирующие области генов, которые необходимо проанализировать, со средним по крайней мере 100-кратным уровнем покрытия. Для сайтов связывания транскрипционных факторов: количество анализируемых картированных сайтов связывания должно быть не менее, чем 10- кратное количество генов, которые необходимо проанализировать.
Расчет сбалансированного индекса эффективности для таргетных противоопухолевых препаратов.
К таргетным фармпрепаратам (лекарственным препаратам) относят препараты с известными молекулярными мишенями. В описании данного изобретения термин "таргетный препарат" ограничен препаратами определенных 16ти классов, или типов, приведенных в Таблице 1. Эти классы покрывают основные известные на сегодняшний день таргетные препараты, использующиеся в клинике. Препаратов под номерами 8, 9, 10, 14, 15 в Таблице 1 представляют собой препараты на основе иммуноглобулинов (антител), в то время как препараты других типов в Таблице 1 - это низкомолекулярные химические соединения (малые молекулы).
При формировании базы молекулярных мишеней для каждого таргетного лекарственного средства, в качестве источника может быть использована информация производителей фармпрепарата, а также научные публикации в специализированных журналах фармакологического, биохимического или биомедицинского профиля. Для использования в системе Oncobox, база данных для каждого включенного препарата должна содержать следующую информацию:
1. уникальное название и/или идентификатор препарата,
2. список уникальных идентификаторов генов - молекулярных мишеней данного препарата,
3. тип препарата по механизму действия (согласно Таблице 1).
Оценка системы Oncobox основывается на моделировании способности препаратов блокировать патологические изменения в молекулярных путях и одновременно блокировать генные продукты с патологически повышенными уровнями приведенной экспрессии. В отличие от известных аналогов, платформа Oncobox в качестве меры эффективности таргетных препаратов использует оригинальный параметр Balanced Efficiency Score (BES) для каждого препарата. При этом при расчете BES одновременно используются данные по активности молекулярных путей в исследуемом образце и данные по приведенной экспрессии генных продуктов - мишеней конкретного препарата. Значение BES вычисляется согласно формуле:
BESd = а · DESMP d · + Ь - DESTG d, где d - анализируемый таргетный препарат; а и b - весовые коэффициенты, варьирующие от -1 до 1.5 в зависимости от типа таргетного препарата d; DESMP d (Drug Efficiency Score for Molecular Pathways) - индекс активности препарата d, рассчитанный исходя из уровней активности молекулярных путей, содержащих его молекулярные мишени; DESTG d (Drug Efficiency Score for Target Genes) - индекс активности таргетного препарата d, рассчитанный исходя из уровней экспрессии индивидуальных генных продуктов - его молекулярных мишеней.
- Для вычисления значения DESMP используется следующая формула:
DESMP d = L DTId t - Ip PALp AMCFP · Nllt P, где d - уникальный идентификатор таргетного препарата; t - уникальный идентификатор генного продукта-мишени препарата d р - уникальный идентификатор сигнального пути; PALp - уровень активации молекулярного пути р; дискретная величина AMCF (activation-to-mitosis conversion factor) определяется так:
AMCF=1 , когда активация молекулярного пути способствует выживанию, росту и делению клетки;
AMCF=0, когда нет данных относительно того, способствует ли активация молекулярного пути выживанию, росту и делению клетки, или когда такие данные, имеющиеся в распоряжении исследователя, противоречивы;
AMCF= -1 , когда активация молекулярного пути препятствует выживанию, росту и делению клетки.
Дискретная величина DTI (drug-target index) определяется так:
DTI dt О, препарат d не воздействует на белок t
1 , препарат d воздействует на белок t
Дискретная величина Nil (node involvement index) определяется так: Nil f = ГО, белка t нет в пути р
1 , белок t есть в пути р
- Для вычисления значения DESTG используется следующая формула: DESTG d = It DTId t - Ip In CNRt · ARR, p · AMCFP - Nllt,p, где d - уникальный идентификатор таргетного препарата; t - уникальный идентификатор генного продукта-мишени препарата d р - уникальный идентификатор сигнального пути; CNRn (case-to-normal ratio) - отношение приведенных уровней экспрессии гена, кодирующего белок t, в исследуемом образце к норме (среднему значению у контрольной группы); In - натуральный логарифм; определения DTId t, AMCFP и Nil аналогичны приведенным выше; дискретная величина ARRt р (activator/repressor role) определяется для генного продукта t в пути р следующим образом и помещается в базу молекулярных путей:
- 1; белок п - репрессор сигнала в пути р
ARR.
- 0,5; белок п - скорее репрессор сигнала в пути р
0; нельзя сказать, что белок я - репрессор или активатор сигнала в пути р
0,5; белок я - скорее активатор сигнала в пути р
1; белок я - активатор сигнала в пути р
При расчете значения сбалансированной эффективности BES для препарата d, используются весовые коэффициенты а и Ь, различающиеся в зависимости от природы препарата. Значения коэффициентов приведены в Таблице 1.
Для низкомолекулярных ингибиторов тирозинкиназ (нибов), оба весовых коэффициента равны 0.5, что отражает равную значимость активации таргетных молекулярных путей и уровня экспрессии таргетных генов в исследуемом образце патологической ткани. Это связано со способностью нибов блокировать свои молекулярные мишени и тем самым ингибировать их активность, а также тем самым модулировать прохождение сигнала по связанным с ними молекулярным путям. Для гормонов, оба весовых коэффициента принимают значение -0.5, это связано с тем, что они активируют, а не ингибируют свои молекулярные мишени и оказывают соответствующее воздействие на свои таргетные молекулярные пути. Для антигормонов, коэффициенты вновь принимают значение 0.5, что связано с ингибирующим механизмом их воздействия на свои молекулярные мишени, на продукцию гормонов или их молекулярную сигнализацию, а также на соответствующие таргетные молекулярные пути. Для ретиноидов, оба коэффициента равны -0.5, поскольку этот тип препаратов связывается с рецепторами ретиноевой кислоты и активирует ряд зависимых от них молекулярных путей. Для рапалогов (аналогов рапамицина), оба коэффициента равны 0.5, поскольку они обладают ингибирующим механизмом воздействия при связывании со своими молекулярными мишенями, а также на сигнализацию соответствующих молекулярных путей. Для мибов (ингибиторов протеасомы), оба коэффициента равны 0.5, поскольку эти препараты обладают ингибирующим механизмом воздействия при связывании со своими молекулярными мишенями, а также на сигнализацию молекулярных путей, включающих активность протеасомы. Для блокаторов VEGF, а=0 и
Ь=1 , поскольку данный класс препаратов непосредственно блокирует молекулы VEGF в кровотоке, не связываясь с мишенями внутри или на поверхности клетки и, таким образом, не оказывая прямого влияния на внутриклеточную сигнализацию. Для моноклональных антител, связывающихся с молекулярными мишенями на поверхности клетки (мабов), а=0 и Ь=1 , поскольку основной механизм их действия заключается в активации иммунного цитотоксического ответа на клетки, содержащие связанные молекулы мабов на своей поверхности, и не включает модуляцию прохождения сигнала по молекулярным путям. Препараты киллермабы состоят из антител, связывающихся с молекулярными мишенями на поверхности клетки, связанными с цитотоксическими агентами. Связываясь с поверхностью клетки, киллермабы убивают ее, тем самым обеспечивая терапевтический эффект, не связанный с активацией молекулярных путей внутри клетки. Для них а=0 и Ь=1.5; в данном случае повышенное значение коэффициента b отражает собственную высокую цитотоксическую активность препаратов. Для препаратов-блокаторов de novo полимеризации тубулина, а=0 и Ь=1 ; это отражает неопределенную функцию большинства таргетируемых путей для выживания и пролиферации клетки, а также непосредственное ингибирующее воздействие данного класса препаратов при связывании с со своими молекулярными мишенями. Аналогичные коэффициенты заданы и для препаратов-ингибиторов гистондеацетилаз, по тем же причинам. В случае препаратов ДНК-алкилирующих агентов, а=0 и b= -1 , что отражает неопределенную функцию большинства таргетируемых путей для выживания и пролиферации клетки, а также непосредственное ингибирование на эффект от препаратов данного класса от белков-участников систем репарации, таргетирующих алкилированную ДНК (отражено коэффициентом b= -1). Для иммунотерапевтических препаратов, оба коэффициента равны 0.5, в силу зависимости их воздействия от наличия как их непосредственных молекулярных мишеней, так и от активации молекулярных путей, связанных с лимфоцитарной инфильтрацией опухоли. Аналогично, препараты - блокаторы поли-ADP рибозы ингибируют репарацию ДНК и зависят как от наличия непосредственной молекулярной мишени, так и от активности таргетируемых молекулярных путей. Это отражено тем, что оба коэффициента приравниваются к 0.5.
Таблица 1. Значения весовых коэффициентов а и b для 16 классов таргетных противоопухолевых препаратов.
Figure imgf000030_0001
Figure imgf000031_0001
Система Oncobox позволяет количественно оценивать эффективность противоопухолевых препаратов, относящиеся к 16 различным классам (Таблица 1). Разделение препаратов на классы осуществляется в соответствии с их известным механизмом действия и молекулярной специфичностью. Затем вычисляется сбалансированная величина Balanced Efficiency Score (BES), по-разному для разных классов противоопухолевых препаратов (Таблица 1). Затем на основании значений BES формируется персонализированный рейтинг таргетных противораковых препаратов для исследованного биообразца, например, взятого от онкобольного пациента, при этом к использованию могут быть рекомендованы препараты, обладающие положительным значением величины BES (BES >0).
Таким образом, в настоящем изобретении предложен способ оценки клинической эффективности таргетных лекарственных средств для лечения пациента с пролиферативным или онкологическим заболеванием, выбранных из группы таргетных лекарственных средств, состоящий по меньшей мере из следующих этапов: (а) получают информацию о молекулярных мишенях для каждого таргетного лекарственного средства, выбранного из указанной группы; (б) получают образец ткани пациента, имеющий пролиферативный фенотип; (в) получают данные по меньшей мере одного типа из указанного образца, при этом тип данных выбирается из следующего списка: (i) данные по экспрессии тотальной мРНК, (и) полногеномные данные по экспрессии белков, (Ш) полногеномные данные по сайтам связывания транскрипционных факторов, (iv) полногеномные данные по мутациям в геномной ДНК, (v) полногеномные данные по экспрессии микроРНК; (г) получают данные из по меньшей мере одного контрольного образца ткани, не имеющего пролиферативного фенотипа, при этом контрольный образец получают из ткани того же типа, что и указанная ткань пациента, и тип данных, получаемых из контрольного образца, совпадает с типом данных, полученных на стадии
(в); (д) получают данные по меньшей мере одного типа о молекулярных мишенях для каждого таргетного лекарственного средства из указанного образца, при этом тип данных выбирается из следующего списка: (i) данные по экспрессии мРНК молекулярных мишеней, (ii) данные по экспрессии молекулярных мишеней, (ш) данные по мутациям в генах молекулярных мишеней; (iv) данные по сайтам связывания транскрипционных факторов в генах молекулярных мишеней, (v) данные по экспрессии микроРНК, влияющих на экспрессию генов молекулярных мишеней, при этом каждый из типов данных (i) - (v), получаемых на стадии (д), совпадает с типом данных, соответственно (i) -
(v), получаемых на стадии (в); (е) получают данные о молекулярных мишенях для каждого таргетного лекарственного средства из по меньшей мере одного контрольного образца ткани, не имеющего пролиферативного фенотипа, при этом контрольный образец получают из ткани того же типа, что и указанная ткань пациента, и тип данных из контрольного образца совпадает с типом данных, полученных на стадии (д); (ж) определяют количественные показатели эффективности лекарственного средства для каждого из типов данных (i) - (v), используя данные, полученные на стадиях (в)-(е);(з) определяют клиническую эффективность для каждого таргетного лекарственного средства из группы таргетных лекарственных средств с помощью усреднения количественных показателей эффективности, определенных на стадии (ж).
Количественный показатель эффективности лекарственного средства (BES) для каждого из типов данных (i) - (v) определяют при помощи сложения двух частей (DESMP d и DESTG d), которые определяют из данных по активности молекулярных путей в исследуемом образце и данных по приведенной экспрессии генных продуктов - молекулярных мишеней препарата d), с учетом весовых коэффициентов (а и Ь), зависящих от типа лекарственного средства, и раскрытых в Таблице 1. При вычислении обеих частей (DESMP d и DESTG d) данные, полученные из образца пациента, нормируются на соответствующие данные того же типа, полученные из по меньшей мере одного контрольного образца. В предпочтительных вариантах изобретения количественный показатель эффективности лекарственного средства d для каждого из типов данных (i) - (v) определяют при помощи формулы:
Figure imgf000033_0001
При наличии нескольких типов данных от пациента определяют несколько количественных показателей эффективности для каждого из типов данных (i) - (v), после чего для оценки клинической эффективности таргетного лекарственного средства используют усредненный показатель эффективности.
Способ оценки клинической эффективности таргетных лекарственных средств может быть осуществлен с использованием вычислительного устройства, содержащего такие компоненты, как: один или более процессоров, по меньшей мере одну память, а также, предпочтительно, интерфейсы ввода/вывода, средство ввода/вывода, средство сетевого взаимодействия и другие компоненты. Процессор устройства выполняет основные вычислительные операции, необходимые для функционирования модулей исполняющего команды устройства. Процессор исполняет необходимые машиночитаемые команды, содержащиеся в оперативной памяти. Под памятью следует понимать любой накопитель информации, способный хранить необходимую программную логику, обеспечивающую требуемый функционал. Средство хранения данных может выполняться в виде HDD, SSD дисков, рейд массива, флэш-памяти, оптических накопителей информации (CD, DVD, MD, Blue-Ray дисков) и т.п. Выбор интерфейсов зависит от конкретного исполнения вычислительного устройства, которое может представлять собой персональный компьютер, мейнфрейм, серверный кластер, тонкий клиент, смартфон, кассовый аппарат и т.п. В качестве средств ввода/вывода данных может использоваться: клавиатура, джойстик, дисплей (сенсорный дисплей), проектор, тачпад, манипулятор мышь, трекбол, световое перо, динамики, микрофон и т.п.
Приложения системы Oncobox для анализа уровней активации молекулярных путей, для создания рейтингов эффективности препаратов, для поиска новых биомаркеров, для поиска молекулярных мишеней и перепозиционирования существующих фармацевтических препаратов проиллюстрированы ниже примерами.
Нижеследующие примеры работы системы приведены в целях раскрытия характеристик настоящего изобретения и их не следует рассматривать как каким-либо образом ограничивающие объем изобретения.
Пример 1. Расчет индекса активации молекулярных путей исходя из данных по концентрации эпигенетических маркеров. Полногеномные профили связывания 225 белков-транскрипционных факторов
(ТФ) человека, полученные разными лабораториями в ходе экспериментов по иммунопреципитации хроматина (ChlP-seq) для клеточной линии К562 (эритролейкемия, иммортализованная клеточная линия), были загружены из базы данных ENCODE (https://www.encodeproiect.org/chip-seq/transcriDtion factor/). Профили представляли собой нормированную на контроль интенсивность связывания ТФ в формате bedGraph (https://qenome.ucsc.edu/qoldenpath/help/bedqraph.html). В соответствии с протоколом обработки данных ChlP-seq референсная сборка человеческого генома hg19 была проиндексирована алгоритмом Бурроу-Уиллера с помощью программы BWA (https://www.encodeproiect.orq/pipelines/ENCPL220NBH/T Слияние fastq-файлов с сырыми данными, выравнивание на референсный геном и фильтрация проводились программами BWA, Samtools, Picard, Bedtools и Phantompeakqualtools (https://www.encodeproiect.org) . Профили нормированного на контроль уровня связывания ТФ были Полунины программой Macs
(https://www.encodeproiect.org/pipelines/ENCPL138KID/). Эти профили были картированы на окрестности длиной 5 тысяч пар нуклеотидов для белок-кодирующих генов человека (координаты были загружены с USCS Browser, https://qenome.ucsc.edu/cqi-bin/hqs. таблица RefGenes ). Для каждого гена были рассчитаны индексы GRES (Фиг. 3) и CA/R(GRES) и далее для каждого молекулярного пути - индекс PAL.
Таким образом, с помощью системы Oncobox были найдены группы генов и молекулярные пути, активированные в опухолевой клеточной линии К562. Были охарактеризованы наиболее сильно активированные процессы: синтез белков, репликация и репарация ДНК, поддержание структуры ядра и хроматина, везикулярный транспорт и цитоскелет. В обоих случаях была обнаружена активация путей врожденной иммунной системы, что закономерно для клеточной линии миелоидного ряда.
Пример 2. Расчет рейтинга активности онкопрепаратов для индивидуальной опухоли исходя из активации молекулярных путей на основе данных по экспрессии мРНК.
Был произведен расчёт рейтинга потенциально эффективных противоопухолевых таргетных препаратов для пациента 72 лет с гистологически подтвержденной умеренно дифференцированной внутрипеченочной холангиокарциномой (Фиг. 4). Пациент был диагностирован в октябре 2015 года со следующими симптомами: умеренная потеря веса, боль в правом подреберье, потеря аппетита и астения, с показателем индекса Карнофского 70%. Результаты магнитно-резонансной томографии (МРТ) во время диагностики подтверждали диагноз. Опухоль не удалялась хирургическим путем из-за продвинутой стадии, нескольких внутрипеченочных образований и метастазов в легкие. Сначала данный пациент получал лечение, считающееся лучшей клинической практикой: четыре курса химиотерапии (2 курса гемцитабина в сочетании с капецитабином и последующие 2 курса гемцитабина в сочетании с цисплатином) были проведены до мая 2016 года. Лечение было неэффективным, и опухоль увеличивалась в размерах согласно данным МРТ; в левой и правой долях появились дополнительные метастатические узлы с распространением на желчный проток и в желчный пузырь.
Индекс шкалы Карнофского снизился до 60%. Пациент не отвечал на лечение, и для него был проведен расширенный молекулярный анализ опухоли с помощью системы Oncobox для определения альтернативных вариантов лечения. Для этого сначала была выделена тотальная РНК из опухолевого образца, которая была использована для измерения уровня экспрессии 2163 генов на оборудовании CustomArray Inc. (США) с помощью метода микрочиповой гибридизации. В список 2163 генов входили гены из основных сигнальных путей человека, ассоциированных с онкопаталогиями, а также мишени всех таргетных противоопухолевых препаратов. В качестве образцов нормальной ткани, необходимых для расчётов вышеуказанных индексов, были использованы образцы печени без признаков патологических изменений, полученные от здоровых доноров. При помощи алгоритма Oncobox был составлен рейтинг таргетных препаратов согласно значениям индекса BES (Таблица 2).
Таблица 2. Рейтинг потенциально наиболее эффективных препаратов для пациента с холангиокарциномой согласно результатам платформы Oncobox.
Figure imgf000035_0001
Согласно результатам анализа, в мае 2016 года пациенту был назначен таргетный препарат Сорафениб, который является ингибитором тирозинкиназ. При MPT-анализе в октябре 2016 года был обнаружен умеренный рост опухоли, что соответствует стабилизации болезни. Однако после лечения Сорафенибом пациент перестал жаловаться на боль в правом подреберье. МРТ, проведенная в январе 2017 г., выявила прогрессирование роста опухоли и дополнительные узлы в левом легком. Таким образом, время до прогрессирования составило около 6 месяцев. Кроме того, появились следующие побочные эффекты: покраснение, отек, боль на ладонях рук и подошвах ног.
Поэтому было принято решение изменить лечение, для чего был выбран препарат
Пазопаниб, другой тирозинкиназный ингибитор, рекомендованный на основе рейтинга, рассчитанного системой Oncobox. Лечение Пазопанибом началось в январе 2017 года. Контрольная МРТ в июле 2017 года выявила умеренный рост опухоли. При этом смена режима лечения привела к устранению побочных эффектов Сорафениба и общему улучшению качества жизни. По состоянию на октябрь 2017 года, пациент жив и физически активен, а индекс по шкале Карнофского составляет 100%.
Данный клинический случай свидетельствует о том, что персонализированное назначение тирозинкиназных ингибиторов при помощи системы Oncobox может быть эффективным с точки зрения общей выживаемости и качества жизни пациента при метастатической холангиокарциноме.
Пример 3. Расчет рейтинга активности онкопрепаратов для колоректального рака исходя из данных по мутациям геномной ДНК. Рейтинг активности таргетных препаратов был составлен рассчитан для 105 препаратов на основании полногеномных данных 1441 случаев колоректального рака при помощи платформы Oncobox. Данные были получены из базы данных COSMIC v76 (The Catalogue of Somatic Mutations In Cancer) (Forbes et al. 2008) и содержали информацию о 1 165 882 мутациях в составе 19897 генов. Верхние позиции полученного рейтинга лекарственных препаратов представлены в Таблице 3 (указаны 9 препаратов с максимальными значениями Balanced Efficiency Score (BES)).
Таблица 3. Список препаратов, получивших наиболее высокие позиции рейтинга потенциальной эффективности исходя из значений MDS.
Figure imgf000036_0001
Figure imgf000037_0001
Пример 4. Моделирование новых молекулярных мишеней для опухолевых препаратов с помощью данных по мутациям ДНК.
Для оценки мутационного профиля первичных злокачественных опухолей печени были использованы данные полногеномного секвенирования из базы данных COSMIC v76 (The Catalogue of Somatic Mutations In Cancer) (Forbes et al. 2008), содержащие записи о 852964 мутациях 19491 генов 1654 опухолевых образцов. Для всех генов были определены нормализованные частоты мутаций (NMR). Далее были интегрированы в единую базу данные молекулярных путей, полученные из крупнейших международных баз данных: Reactome [doi: 10.1093/nar/gkt1102], NCI Pathway Interaction Database [doi: 10.1093/nar/gkn653], Kyoto Encyclopedia of Genes and Genomes [doi:
10.1093/nar/gks1239] и HumanCyc Kwww.humancvc.orq)!. Из 3125 путей в целях адекватности статистического анализа были отобраны молекулярные пути, содержащие более 10 генов. В результате дальнейшая работа велась с 1753 путями, содержащими 8755 генов, которые были рассмотрены в качестве потенциальных молекулярных мишеней для новых онкопрепаратов. Для всех молекулярных путей были определены величины PAL. В качестве спектра потенциальных таргетных препаратов были приняты 8755 условных препаратов, каждый из которых имел качестве мишени по одному гену из базы данных путей. Для всех генных продуктов - потенциальных мишеней были посчитаны значения индекса Balanced Efficiency Score с использованием платформы Онкобокс.
В результате были выявлены потенциальные гены-мишени для разработки новых терапевтических агентов. Примерами могут служить следующие потенциальные гены- мишени (Таблица 4).
Таблица 4. Рейтинги по индексу Balanced Efficiency Score для генов - потенциальных мишеней таргетной терапии, рассчитанные для злокачественных опухолей печени с помощью системы Oncobox.
Figure imgf000037_0002
Figure imgf000038_0001
Пример 5. Перепозиционирование известных лекарственных препаратов для злокачественных опухолей на основе данных по мутациям геномной ДНК.
При расчете рейтинга Balanced Efficiency Score для 105 препаратов с помощью системы Онкобокс были использованы полногеномные данные из базы данных COSMIC v76 (The Catalogue of Somatic Mutations In Cancer) (Forbes et al. 2008), содержащие записи о 852964 мутациях 19491 генов 1654 образцов первичных злокачественных опухолей печени. Максимальный мутационный рейтинг (первые 10 позиций) получили препараты: Regorafenib, Idelalisib, Masitinib, Thalidomide, Sorafenib, Tivantinib, Nintedanib (BIBF 1120), Crizotinib, Foretinib, Flavopiridol (Alvociclib).
Из них одобрен к применению при данном виде онкозаболеваний Regorafenib, успешно прошли третью фазу клинических испытаний Tivantinib и Nintedanib (BIBF 1120), а для препарата Flavopiridol (Alvociclib) завершена вторая фаза клинических испытаний. Остальные препараты, набравшие максимальный рейтинг Balanced Efficiency Score в данный момент не используются при опухолях печени и при отсутствии клинических испытаний, проводимых ранее, могут быть рекомендованы для рассмотрения применения при данной нозологии. Клинический статус всех препаратов, отсортированный согласно рейтингу Balanced Efficiency Score, приведен на Фиг. 5.
Пример 6. Гармонизация профилей генной экспрессии, полученных на разных экспериментальных платформах, с помощью системы Онкобокс.
Экспрессионные профили для одних и тех же образцов мРНК человека были получены в рамках проекта SEQC с использованием разных экспериментальных платформ и опубликованы в публичных базах данных (Su at al, 2014, SEQC/MAQC-III Consortium, 2014). Были взяты транскрипционные профили для коммерчески доступного образца мРНК человека Stratagene Universal Human Reference RNA (UHRR Catalog #740000) с использованием экспериментальных платформ микрочиповой гибридизации и глубокого секвенирования: lllumina HiSeq 2000 (GPL11154), lllumina HumanHT-12 V4.0 expression beadchip (GPL10558), Affymetrix Human Gene 2.0 ST Array (GPL17930),
Affymetrix GeneChip PrimeView Human Gene Expression Array (GPL16043).
Полученные экспрессионные профили исходно существенно различались распределением генов по различным уровням экспрессии (Фиг. 6, верхние панели). После применения метода Shambhala в рамках платформы Онкобокс, экспрессионные профили были приведены к универсальному виду (Фиг. 6, нижние панели).
Пример 7. Комбинирование мутационного и экспрессионного способа рейтингования таргетных препаратов для пациента с раком головы и шеи на платформе Онкобокс. Для взрослого онкобольного с раком головы и шеи 4 стадии заболевания с помощью платформы Онкобокс осуществлялся выбор следующей линии химиотерапии. Для этого у пациента была взята биопсия опухолевой ткани, была профилирована экспрессия мРНК и проведено полноэкзомное секвенирование ДНК на оборудовании lllumina HiSeq 2000. В качестве образца нормальной ткани был использован образец миндалины, полученный от здорового пациента, для которого профиль генной экспрессии был получен на том же оборудовании.
По профилям экспрессии мРНК в опухолевом и нормальном образцах, для 128 таргетных препаратов были рассчитаны величины Balanced drug Efficiency Score (BES). В таблице 5 приведены препараты с наибольшим значением индекса BES по данным экспрессии мРНК.
Таблица 5. Рейтинг таргетных препаратов с наибольшим значением BES для пациента с раком головы и шеи, согласно результатам профилирования экспрессии мРНК.
Figure imgf000039_0001
Figure imgf000040_0001
В параллель, для того же пациента индекс BES был рассчитан альтернативным способом, исходя из данных полноэкзомного секвенирования образца опухолевой ткани. Всего у данного пациента были найдены соматические мутации в 13 генах. Рейтинг таргетных препаратов согласно значениям BES, подсчитанным по данным мутаций геномной ДНК, приведен в Таблице 6.
Таблица 6. Рейтинг таргетных препаратов с наибольшим значением BES для пациента с раком головы и шеи, согласно результатам профилирования мутаций геномной ДНК.
Figure imgf000040_0002
Figure imgf000041_0001
Затем был составлен список тех препаратов, которые одновременно имели максимальные значения BES по данным мутаций геномной ДНК и экспрессии мРНК в опухолевой ткани (Таблица 7). Выяснилось, что многие такие препараты завершили третью фазу клинических испытаний или рекомендованы FDA (США) для применения при раке головы и шеи. Это свидетельствует в пользу эффективности и надежности комбинирования рейтингов таргетных препаратов, рассчитанных на экспрессионных и мутационных данных. По итогам исследования, в качестве следующей линии терапии для пациента был рекомендован препарат цетуксимаб. Возможность комбинирования рейтингов таргетных препаратов по итогам исследований профилей мРНК и геномной
ДНК является отличительной особенностью платформы Онкобокс.
Таблица 7. Медицинский статус таргетных препаратов для лечения опухолей головы и шеи, которые одновременно имеют максимальный рейтинг BES по результатам профилирования экспрессии мРНК и мутаций геномной ДНК в опухолевой ткани пациента с раком головы и шеи.
Figure imgf000042_0001
Пример 8. Сравнение экспрессионного способа рейтингования таргетных препаратов на платформе Онкобокс с ранее опубликованными подходами. Ниже приведена оценка сбалансированных индексов эффективности таргетных препаратов, рассчитанных при помощи способа по настоящему изобретению (используя предложенный индекс BES) в сравнении с ранее описанным в заявке US20170193176A1 способом, использующим для расчета только значения активации молекулярных путей
(индекс Drug Score, далее обозначенный как DS1a).
Расчёт индексов эффективности таргетных препаратов был произведен по транскриптомным профилям онкопациентов из публичной базы данных TCGA (The Cancer Genome Atlas), после чего было произведено сравнение индексов эффективности с клиническим статусом таргетных препаратов.
База данных The Cancer Genome Atlas (TCGA, https://cancergenome.nih.gov/) содержит мутационные и транскриптомные профили онкопациентов с разными нозологиями. С помощью системы Oncobox авторы рассчитали сбалансированные индексы эффективности таргетных препаратов (BES) для пациентов 11 нозологий (Таблица 8). Для этих же пациентов были также рассчитаны индексы эффективности таргетных препаратов DS1a согласно методу, ранее опубликованному в заявке US20170193176A1 , а также в статье Artemov et al., 2015. Таблица 8. Количество проанализированных транскриптомных профилей пациентов из базы данных TCGA по нозологиям.
Figure imgf000043_0001
На первом этапе были проанализированы таргетные препараты, которые попадают в верхнюю часть рейтинга по версии отдельно по коэффициенту BES и отдельно по коэффициенту DS1a. Для этого вышеуказанные коэффициенты были рассчитаны для каждого отдельного транскриптомного профиля. Всего были проанализированы коэффициенты для 128 таргетных препаратов. Затем были найдены препараты, которые попадают в топ 10% рейтинга (топ-13 препаратов) для большей части пациентов. Получившиеся списки сравнили между разными нозологиями при помощи коэффициента Жаккара. Полученный график по парному сравнению всех нозологий для DS1a приведен на Фиг. 7. Оказалось, что топ-13 препаратов по версии коэффициента эффективности DS1a является одинаковым для разных нозологий (при этом конкретные позиции в рейтинге могут не совпадать). Это говорит о том, что DS1 a не подходит для персонализированного назначения таргетной терапии онкопациентам, т.к. в соответствии с этим рейтингом большей части пациентов предполагается назначить одинаковые препараты.
Аналогичный анализ был проведен для рейтинга таргетных препаратов BES. В этом случае, напротив, топ-13 препаратов был вариабелен между нозологиями (Фиг. 8). Действительно, эффективность таргетных препаратов чаще всего варьирует между разными нозологиями. Таким образом, рейтинг BES, с одной стороны, в большей степени отражает клинические данные, и, с другой стороны, подходит для персонализированного назначения терапии онкопациентам.
Затем авторы оценили степень того, насколько рейтинг таргетных препаратов, рассчитанный системой Oncobox, соотносится с клиническим статусом данных препаратов. Для этого была проанализирована база данных clinicaltrials.gov, которая содержит в себе информацию о большей части клинических испытаний, в которых изучалась эффективность таргетных препаратов. В качестве примера были рассмотрены стадии клинических испытаний всех 128 таргетных препаратов для рака шейки матки. Затем, в зависимости от того, на какой клинической стадии находился препарат, ему проставлялся коэффициент от 0 до 1 : 1 - если препарат одобрен для рака шейки матки, 0.85 - завершена третья фаза клинических испытаний, 0.7 - третья фаза клинических испытаний проходит в данный момент, 0.4 - вторая фаза клинических испытаний, 0.3 - первая фаза, 0 - данные по клиническим испытаниям отсутствуют. Исходя из этих данных, для каждого отдельно взятого пациента можно рассчитать, насколько персонализированный рейтинг соотносится с клиническим статусом препарата. Если в верхней половине рейтинга преобладают препараты, которые прошли начальные фазы клинических испытаний, или даже рекомендованы для данной нозологии, и при этом в нижней половине рейтинга таких препаратов меньше, значит данному пациенту скорее будет назначен препарат, успешно прошедший клинические испытания.
Для того, чтобы количественно оценить данный эффект, авторы предлагают использовать формулу:
Figure imgf000044_0001
, где Ej - клинический коэффициент для препарата под номером i; DS - коэффициент эффективности данного таргетного препарата, например, BES или DS1a; ndrugs- количество таргетных препаратов (в нашем случае равно 128). Полученный коэффициент А, названный нами коэффициентом Анубиса, даёт оценку того, насколько хорошо рассчитанные индексы эффективности препаратов соотносятся с их клиническим статусом. На Фиг. 9 приведен график зависимости рейтинга препарата по коэффициенту BES от клинического статуса препарата на примере одного пациента с раком шейки матки. Из графика видно, что препараты, которые находились на более поздних стадиях клинических испытаний находились скорее в верхней половине рейтинга. Коэффициент Анубиса, рассчитанный по вышеуказанной формуле, для данного пациента получился равным 14.83.
Авторы рассчитали коэффициент Анубиса для всех пациентов с раком шейки матки используя коэффициент эффективности препаратов BES и DS1a. Плотность распределения полученных значений коэффициента Анубиса приведена на Фиг. 10. Из графика видно, что в среднем коэффициенты Анубиса были выше в случае BES, чем в случае DS1 a. Это говорит о том, что рейтинг препаратов по коэффициенту BES в большей степени соответствует клиническому статусу препаратов, чем для DS1a. Таким образом, коэффициент BES имеет явное преимущество перед DS1a, т.к. в верхней части рейтинга, построенного по BES, чаще содержатся препараты, успешно показавшие себя в клинических испытаниях.
Несмотря на то, что изобретение описано со ссылкой на раскрываемые варианты воплощения, для специалистов в данной области должно быть очевидно, что конкретные подробно описанные эксперименты приведены лишь в целях иллюстрирования настоящего изобретения, и их не следует рассматривать как каким-либо образом ограничивающие объем изобретения. Должно быть понятно, что возможно осуществление различных модификаций без отступления от сути настоящего изобретения.

Claims

ФОРМУЛА ИЗОБРЕТЕНИЯ
1. Способ оценки клинической эффективности таргетных лекарственных средств для лечения пациента с пролиферативным или онкологическим заболеванием, выбранных из группы таргетных лекарственных средств, состоящий по меньшей мере из следующих этапов:
(а) получают информацию о молекулярных мишенях для каждого таргетного лекарственного средства;
(б) получают образец ткани пациента, имеющий пролиферативный фенотип;
(в) получают данные по меньшей мере одного типа из указанного образца, при этом тип данных выбирается из следующего списка: (i) данные по экспрессии тотальной мРНК, (и) полногеномные данные по экспрессии белков, (ш) полногеномные данные по сайтам связывания транскрипционных факторов, (iv) полногеномные данные по мутациям в геномной ДНК, (v) полногеномные данные по экспрессии микроРНК;
(г) получают данные из по меньшей мере одного контрольного образца ткани, не имеющего пролиферативного фенотипа, при этом контрольный образец получают из ткани того же типа, что и указанная ткань пациента, и тип данных, получаемых из контрольного образца, совпадает с типом данных, полученных на стадии (в);
(д) получают данные по меньшей мере одного типа о молекулярных мишенях для каждого таргетного лекарственного средства из указанного образца, при этом тип данных выбирается из следующего списка: (i) данные по экспрессии мРНК молекулярных мишеней, (м) данные по экспрессии молекулярных мишеней, (iii) данные по мутациям в генах молекулярных мишеней; (iv) данные по сайтам связывания транскрипционных факторов в генах молекулярных мишеней, (v) данные по экспрессии микроРНК, влияющих на экспрессию генов молекулярных мишеней, при этом каждый из типов данных (i) - (v), получаемых на стадии (д), совпадает с типом данных, соответственно (i) - (v), получаемых на стадии (в);
(е) получают данные о молекулярных мишенях для каждого таргетного лекарственного средства из по меньшей мере одного контрольного образца ткани, не имеющего пролиферативного фенотипа, при этом контрольный образец получают из ткани того же типа, что и указанная ткань пациента, и тип данных из контрольного образца совпадает с типом данных, полученных на стадии (д);
(ж) определяют количественные показатели эффективности лекарственного средства для каждого из типов данных (i) - (v), используя данные, полученные на стадиях (в)-(е); (з) определяют клиническую эффективность для каждого таргетного лекарственного средства из группы таргетных лекарственных средств с помощью усреднения количественных показателей эффективности, определенных на стадии (ж).
2. Способ по п.1 , в котором данные, полученные из по меньшей мере одного контрольного образца ткани гармонизированы с данными, полученными на стадиях (в) и (Д).
3. Способ по п.2, в котором
(i) на стадии (в) получают данные по меньшей мере двух типов;
(и) на стадии (ж) независимо рассчитывают количественный показатель эффективности по каждому типу данных; и
(iii) оценивают клиническую эффективность для каждого таргетного лекарственного средства из группы таргетных лекарственных средств, усредняя рассчитанные для каждого типа данных количественные показатели эффективности.
4. Способ по п.З, в котором на стадии (в) получают полногеномные данные по экспрессии белков, и полногеномные данные по мутациям в геномной ДНК.
5. Способ лечения пациента с пролиферативным или онкологическим заболеванием, состоящий по меньшей мере из следующих этапов:
(а) получают информацию об имеющихся таргетных лекарственных средствах и формируют группу таргетных лекарственных средств;
(б) оценивают клиническую эффективность таргетных лекарственных средств, выбранных из указанной группы таргетных лекарственных средств, согласно способу по п. 1 ;
(в) выбирают для лечения указанного пациента лекарственное средство, имеющее лучший, или один из лучших количественных показателей эффективности, определенных согласно способу по п. 1.
6. Система для оценки клинической эффективности таргетных лекарственных средств, выбранных из группы таргетных лекарственных средств, для пациента с пролиферативным или онкологическим заболеванием ткани, включающая:
- по меньшей мере, один процессор;
- по меньшей мере, одну память, которая содержит машиночитаемые инструкции, которые при их исполнении, по меньшей мере, одним процессором - осуществляют оценку клинической эффективности указанных таргетных лекарственных средств, при помощи компьютерно-реализуемого способа, состоящего по меньшей мере из следующих этапов:
(а) получают информацию о молекулярных мишенях для каждого таргетного лекарственного средства, выбранного из указанной группы;
(в) получают данные по меньшей мере одного типа из образца ткани пациента, имеющей пролиферативный фенотип, при этом тип данных выбирается из следующего списка: (i) данные по экспрессии тотальной мРНК, (и) полногеномные данные по экспрессии белков, (ш) полногеномные данные по сайтам связывания транскрипционных факторов, (iv) полногеномные данные по мутациям в геномной ДНК, (v) полногеномные данные по экспрессии микроРНК;
(г) получают данные из по меньшей мере одного контрольного образца ткани, не имеющего пролиферативного фенотипа, при этом контрольный образец получают из ткани того же типа, что и указанная ткань пациента; тип данных, получаемых из контрольного образца, совпадает с типом данных, полученных на стадии (в);
(д) получают данные по меньшей мере одного типа о молекулярных мишенях для каждого таргетного лекарственного средства из указанного образца, при этом тип данных выбирается из следующего списка: (i) данные по экспрессии мРНК молекулярных мишеней, (ii) данные по экспрессии молекулярных мишеней, (iii) данные по мутациям в генах молекулярных мишеней; (iv) данные по сайтам связывания транскрипционных факторов в генах молекулярных мишеней, (v) данные по экспрессии микроРНК, влияющих на экспрессию генов молекулярных мишеней, при этом каждый из типов данных (i) - (v), получаемых на стадии (д), совпадает с типом данных, соответственно (i) - (v), получаемых на стадии (в);
(е) получают данные о молекулярных мишенях для каждого таргетного лекарственного средства из по меньшей мере одного контрольного образца ткани, не имеющего пролиферативного фенотипа, при этом контрольный образец получают из ткани того же типа, что и указанная ткань пациента; тип данных из контрольного образца совпадает с типом данных, полученных на стадии (д);
(ж) определяют количественные показатели эффективности лекарственного средства для каждого из типов данных (i) - (v), используя данные, полученные на стадиях (в)-(е);
(з) определяют клиническую эффективность для каждого таргетного лекарственного средства из группы таргетных лекарственных средств с помощью усреднения количественных показателей эффективности, определенных на стадии (ж).
PCT/RU2018/000120 2018-03-01 2018-03-01 Способ и система для оценки клинической эффективности таргетных лекарственных средств WO2019168426A1 (ru)

Priority Applications (3)

Application Number Priority Date Filing Date Title
RU2020115015A RU2741703C1 (ru) 2018-03-01 2018-03-01 Платформа анализа генетической информации oncobox
PCT/RU2018/000120 WO2019168426A1 (ru) 2018-03-01 2018-03-01 Способ и система для оценки клинической эффективности таргетных лекарственных средств
US16/088,446 US11614434B2 (en) 2018-03-01 2018-03-01 Genetic information analysis platform oncobox

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/RU2018/000120 WO2019168426A1 (ru) 2018-03-01 2018-03-01 Способ и система для оценки клинической эффективности таргетных лекарственных средств

Publications (1)

Publication Number Publication Date
WO2019168426A1 true WO2019168426A1 (ru) 2019-09-06

Family

ID=67805064

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/RU2018/000120 WO2019168426A1 (ru) 2018-03-01 2018-03-01 Способ и система для оценки клинической эффективности таргетных лекарственных средств

Country Status (3)

Country Link
US (1) US11614434B2 (ru)
RU (1) RU2741703C1 (ru)
WO (1) WO2019168426A1 (ru)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113140275A (zh) * 2021-05-07 2021-07-20 四川大学华西医院 一种肝癌靶向治疗疗效的监测系统及方法
CN114203259A (zh) * 2021-12-17 2022-03-18 暨南大学 一种多组学数据整合分析方法和在线交互式综合分析平台
CN116312923A (zh) * 2023-02-22 2023-06-23 深圳市海普洛斯医疗系统科技有限公司 基因检测报告自动化处理方法、装置、设备及存储介质
CN116312923B (zh) * 2023-02-22 2024-06-07 深圳市海普洛斯医疗系统科技有限公司 基因检测报告自动化处理方法、装置、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160132632A1 (en) * 2014-11-10 2016-05-12 Insilico Medicine, Inc. System, Method and Software for Improved Drug Efficacy and Safety in a Patient
US20170193176A1 (en) * 2015-12-30 2017-07-06 Insilico Medicine, Inc. System, Method, and Software for Improved Drug Efficacy and Safety in a Patient

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004026109A2 (en) * 2002-09-20 2004-04-01 Wayne State University Molecular targets of cancer and aging
US9183349B2 (en) * 2005-12-16 2015-11-10 Nextbio Sequence-centric scientific information management
US8367340B2 (en) * 2008-12-03 2013-02-05 University Of Maryland, Baltimore Prognostic tools to predict the efficacy of drug treatment targeting chromatin DNA or enzymes acting on DNA
ES2763899T3 (es) * 2009-07-08 2020-06-01 Worldwide Innovative Network Método para predecir la eficacia de fármacos en un paciente
US10192641B2 (en) * 2010-04-29 2019-01-29 The Regents Of The University Of California Method of generating a dynamic pathway map
US20170262576A1 (en) 2014-03-13 2017-09-14 Canada Cancer and Aging Research Laboratories Inc. System, method and software for analysis of intracellular signaling pathway activation using transcriptomic data
US20170262578A1 (en) 2014-05-27 2017-09-14 Pathway Pharmaceuticals Ltd System, method and software for analysis of intracellular signaling pathway activation using transcriptomic data
US20160224739A1 (en) 2015-01-29 2016-08-04 Pathway Pharmaceuticals Ltd System, Method and Software for Predicting Clinical Outcome of a Drug Treatment of Breast Cancer in a Patient
US20160224738A1 (en) 2015-01-29 2016-08-04 Pathway Pharmaceuticals Ltd System, Method and Software for Predicting Drug Efficacy in a Patient
US20170277826A1 (en) * 2016-03-27 2017-09-28 Insilico Medicine, Inc. System, method and software for robust transcriptomic data analysis
JP6932363B2 (ja) * 2016-12-06 2021-09-08 ダルミヤン,インク. 脳障害を特定するための方法及びシステム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160132632A1 (en) * 2014-11-10 2016-05-12 Insilico Medicine, Inc. System, Method and Software for Improved Drug Efficacy and Safety in a Patient
US20170193176A1 (en) * 2015-12-30 2017-07-06 Insilico Medicine, Inc. System, Method, and Software for Improved Drug Efficacy and Safety in a Patient

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
A. ARTEMOV ET AL.: "A method for predicting target drug efficiency in cancer based on the analysis of signaling pathway activation", ONCOTARGET, vol. 6, no. 30, 2015, pages 29347 - 29356, XP055274162, Retrieved from the Internet <URL:www.impactjournals.com/oncotarget> [retrieved on 20180211], doi:10.18632/oncotarget.5119 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113140275A (zh) * 2021-05-07 2021-07-20 四川大学华西医院 一种肝癌靶向治疗疗效的监测系统及方法
CN113140275B (zh) * 2021-05-07 2023-03-24 四川大学华西医院 一种肝癌靶向治疗疗效的监测系统及方法
CN114203259A (zh) * 2021-12-17 2022-03-18 暨南大学 一种多组学数据整合分析方法和在线交互式综合分析平台
CN114203259B (zh) * 2021-12-17 2024-05-17 暨南大学 一种多组学数据整合分析方法和在线交互式综合分析平台
CN116312923A (zh) * 2023-02-22 2023-06-23 深圳市海普洛斯医疗系统科技有限公司 基因检测报告自动化处理方法、装置、设备及存储介质
CN116312923B (zh) * 2023-02-22 2024-06-07 深圳市海普洛斯医疗系统科技有限公司 基因检测报告自动化处理方法、装置、设备及存储介质

Also Published As

Publication number Publication date
US11614434B2 (en) 2023-03-28
RU2741703C1 (ru) 2021-01-28
US20200292515A1 (en) 2020-09-17

Similar Documents

Publication Publication Date Title
Yang et al. Consistent gene signature of schizophrenia identified by a novel feature selection strategy from comprehensive sets of transcriptomic data
Shi et al. Co-expression module analysis reveals biological processes, genomic gain, and regulatory mechanisms associated with breast cancer progression
Lou et al. Construction of potential glioblastoma multiforme-related miRNA-mRNA regulatory network
Li et al. A prognostic 4‐gene expression signature for squamous cell lung carcinoma
WO2020234729A1 (en) Deep proteome markers of human biological aging and methods of determining a biological aging clock
Huang et al. Drug repositioning for non-small cell lung cancer by using machine learning algorithms and topological graph theory
Tkachev et al. Oncobox method for scoring efficiencies of anticancer drugs based on gene expression data
Wang et al. A transcriptome profile in hepatocellular carcinomas based on integrated analysis of microarray studies
Gulfidan et al. Systems biomarkers for papillary thyroid cancer prognosis and treatment through multi-omics networks
Meckbach et al. PC-TraFF: identification of potentially collaborating transcription factors using pointwise mutual information
Mi et al. Construction and analysis of human diseases and metabolites network
Yan et al. Identifying critical states of complex diseases by single-sample Jensen-Shannon divergence
Hyeon et al. Proteogenomic landscape of human pancreatic ductal adenocarcinoma in an Asian population reveals tumor cell-enriched and immune-rich subtypes
Li et al. Investigating pathogenic and hepatocarcinogenic mechanisms from normal liver to HCC by constructing genetic and epigenetic networks via big genetic and epigenetic data mining and genome-wide NGS data identification
Ricard-Blum et al. Omic approaches to decipher the molecular mechanisms of fibrosis, and design new anti-fibrotic strategies
Zou et al. Identification of key modules and prognostic markers in adrenocortical carcinoma by weighted gene co‑expression network analysis
WO2019168426A1 (ru) Способ и система для оценки клинической эффективности таргетных лекарственных средств
Wang et al. A prognosis marker dynein cytoplasmic 1 heavy chain 1 correlates with EMT and immune signature in liver hepatocellular carcinoma by bioinformatics and experimental analysis
WO2022058980A1 (en) Methylation data signatures of aging and methods of determining a methylation aging clock
Zheng et al. Epimix is an integrative tool for epigenomic subtyping using dna methylation
Zhao et al. Identification of hub genes for early detection of bone metastasis in breast cancer
Dong et al. A novel defined m7G regulator signature to investigate the association between molecular characterization and clinical significance in lung adenocarcinoma
Ran et al. Developing metabolic gene signatures to predict intrahepatic cholangiocarcinoma prognosis and mining a miRNA regulatory network
Jørgensen et al. Untangling the intracellular signalling network in cancer—A strategy for data integration in acute myeloid leukaemia
Wu et al. Finding gastric cancer related genes and clinical biomarkers for detection based on gene–gene interaction network

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18907494

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18907494

Country of ref document: EP

Kind code of ref document: A1