WO2020242130A1 - 물질의 의약용도 또는 생물학적 메카니즘 예측 방법 및 장치 - Google Patents

물질의 의약용도 또는 생물학적 메카니즘 예측 방법 및 장치 Download PDF

Info

Publication number
WO2020242130A1
WO2020242130A1 PCT/KR2020/006630 KR2020006630W WO2020242130A1 WO 2020242130 A1 WO2020242130 A1 WO 2020242130A1 KR 2020006630 W KR2020006630 W KR 2020006630W WO 2020242130 A1 WO2020242130 A1 WO 2020242130A1
Authority
WO
WIPO (PCT)
Prior art keywords
gene expression
substance
expression pattern
processor
predicting
Prior art date
Application number
PCT/KR2020/006630
Other languages
English (en)
French (fr)
Inventor
최진우
Original Assignee
주식회사 바이오릿지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 바이오릿지 filed Critical 주식회사 바이오릿지
Publication of WO2020242130A1 publication Critical patent/WO2020242130A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics

Definitions

  • the disclosed embodiments relate to a method, an apparatus, a program for executing on a computer, and a recording medium recording the program for predicting the medicinal use or biological mechanism of a substance, for example, a drug candidate substance such as a plant extract or a natural product. .
  • CMAP Connectivity Map
  • CMAP's reference database contains gene expression profiles obtained from cultured human cells treated with a large number of perturbagen.
  • the present disclosure is intended to provide an apparatus, a method, a computer program, and a recording medium recording the program using a previously generated database in order to predict a new medical use or a mechanism of action of a substance whose biological mechanism is unknown.
  • a method performed in an electronic device comprising at least one processor, the method comprising: determining, by the at least one processor, a first gene expression pattern caused by a first substance; Identifying, by the at least one processor, a second substance that causes a second gene expression pattern corresponding to the first gene expression pattern based on genome-wide transcriptional expression data; And outputting, by the at least one processor, the usage of the first material based on the usage of the second material.
  • a method may be provided, wherein the genome level transcriptional expression data is updated based on experimental data.
  • the first material is a natural product
  • the second material is a compound whose use is known, a method may be provided.
  • the genome-level transcriptional expression data includes a Connectivity Map (CMAP), and a method may be provided.
  • CMAP Connectivity Map
  • the method may be provided, wherein the first gene expression pattern is determined through differentially expressed genes (DEG) by administering the first substance to a subject.
  • DEG differentially expressed genes
  • a method may be provided, wherein the DEG comprises a gene that is upregulated above a predetermined criterion by administering the first substance to the subject.
  • the method can be provided, wherein the DEG comprises a gene downregulated above a predetermined criterion by administering the first substance to the subject.
  • the second gene expression pattern may be the same or most similar to the first gene expression pattern among a plurality of second gene expression patterns, and a method may be provided.
  • the step of identifying the second substance comprises, based on a predetermined criterion, identifying a plurality of second substances causing each of the plurality of second gene expression patterns corresponding to the first gene expression pattern, and And outputting the use of the first material comprises outputting the use of the first material based on a use most common among the plurality of second materials.
  • the genome-level transcriptional expression data includes a Connectivity Map (CMAP), and the second gene expression pattern indicates a region overlapping the first gene expression pattern on the CMAP, among the plurality of second gene expression patterns. Including, a method can be provided.
  • CMAP Connectivity Map
  • a computer program stored in a medium for executing the method in combination with hardware may be provided.
  • a computer-readable recording medium containing a program for executing the method in a computer can be provided.
  • a memory for storing instructions; And executing the instructions: determining a first gene expression pattern caused by a first substance, wherein the at least one processor, based on genome-wide transcriptional expression data, At least one configured to identify a second substance causing a second gene expression pattern corresponding to the one gene expression pattern, and wherein the at least one processor outputs the use of the first substance based on the use of the second substance
  • An electronic device including a processor of may be provided.
  • 1 is a view for explaining the similarity between gene expression patterns between a compound (chemical compound) and a plant extract (plant extract) according to an embodiment.
  • FIG. 2 is a flowchart of a method of comparing gene expression patterns of candidate substances and compounds, according to an embodiment.
  • FIG. 3 is a flowchart of a method of determining a ranking of compounds showing a pattern similar to a gene expression pattern of a candidate substance, according to an embodiment.
  • 4A is a flow chart of a method according to an embodiment.
  • 4B is a flowchart illustrating a method of predicting a medical use or a biological mechanism according to an embodiment.
  • topoisomerage I topoisomerage I inhibitor according to an embodiment with camptothecin.
  • FIG. 6 is a result of comparing the effect of a ginseng extract according to an embodiment and a rectal cancer cell killing effect of camptothecin, which is well known as a topoisomerase I inhibitor.
  • HDAC histone deacetylase
  • FIG. 9 is a block diagram of a biological mechanism or a device for predicting medical use according to an embodiment.
  • 1 is a view for explaining the similarity between gene expression patterns between a compound (chemical compound) and a plant extract (plant extract) according to an embodiment.
  • CMAP Connectivity Map
  • a compound showing the gene expression pattern most similar to the drug candidate may be identified.
  • substances including natural products, extracts, compounds, and mixtures may be used as drug candidates.
  • the similarity of the gene expression pattern between the drug candidate and the compound may be determined based on overlapping regions on the Connectivity Map (CMAP). For example, as the number of overlapping regions increases, it may be determined to be similar. For example, as the number of regions overlapping successively increases, it may be determined to be similar. In FIG. 1, overlapping areas are indicated in yellow.
  • CMAP Connectivity Map
  • FIG. 2 is a flowchart of a method of comparing gene expression patterns of candidate substances and compounds, according to an embodiment.
  • the candidate material may be a plant extract such as gilgyeong extract or phosphate extract.
  • the electronic device includes differentially expressed genes compared with a case where a candidate substance is treated with a subject, for example, a human lung cancer cell, and a case without treatment.
  • a subject for example, a human lung cancer cell, and a case without treatment.
  • ;DEG determined through the gene expression profile of the candidate substance
  • the gene expression profile of the candidate substance can be input to the electronic device through the experimental results. These experimental results may include previously published cDNA microarray data.
  • DEGs may contain genes that are upregulated above a predetermined criterion by treating a subject, for example, a human lung cancer cell with a candidate.
  • DEGs may contain genes upregulated by more than a predetermined criterion by treating a candidate with a subject.
  • the predetermined criterion may be twice. For example, genes that are upregulated more than 2 times or down regulated more than 2 times can be selected for DEG.
  • the electronic device may collect a gene expression profile of a candidate substance and statistically analyze the collected gene expression profile. According to an embodiment, the electronic device may determine a gene expression pattern of a candidate substance using a statistically analyzed gene expression profile.
  • the electronic device may identify a compound showing a gene expression pattern having a high similarity to the gene expression pattern using a previously generated database.
  • the previously generated database may be a CMAP database.
  • it was selected that the difference in the amount of gene expression in the case where the candidate material was treated and the case where the candidate material was not treated is two or more times different for the differential expression of the gene. Does not.
  • human lung cancer cells were used as an embodiment of the present disclosure, the cells that can be used are not limited, and those skilled in the art may change according to the purpose.
  • FIG. 3 is a flowchart of a method of determining a ranking of compounds showing a pattern similar to a gene expression pattern of a candidate substance, according to an embodiment.
  • the electronic device selects a gene that exhibits a differential expression pattern, and then applies the candidate substance to a previously generated database.
  • the ranking can be ranked by scoring the degree of similarity by comparing the gene expression pattern of the substance and the gene expression pattern of the substance stored in the previously created database.
  • a rank of substances may be determined based on the similarity, and information on at least one substance may be generated in the form of a list listing them in order.
  • the previously generated database may be CMAP, but is not limited thereto.
  • the CMAP refers to a database of genome-wide transcriptional expression data obtained by culturing human cells treated with 1,309 bioactive small molecules.
  • candidate substances that is, substances showing a gene expression pattern corresponding to the gene expression pattern of ginseng extract or gilkyung extract are identified, ranking among substances in an order similar to the gene expression pattern of ginseng extract or gilkyung extract Can be determined.
  • 3 illustrates a ginseng extract and a gilkyung extract, but is not limited thereto, and compounds showing a gene expression pattern similar to that of other plant extracts may be identified.
  • the order of the substances may be determined. For example, a compound having the most overlapping region with the candidate substance on CMAP may be identified as the compound most similar to the candidate substance.
  • the order of the substances may be determined in the order in which the number of consecutively overlapping regions on the CMAP is large. For example, the more regions adjacent to each other among regions overlapping with the candidate substance on the CMAP, the most similar compound to the candidate substance may be identified. For example, referring to Table 1, there are no regions adjacent to each other among the overlapping regions of compound 1, two regions of the overlapping regions of compound 2 are adjacent to each other, and three regions of the overlapping regions of compound 3 are If adjacent, it may be determined to be similar to the candidate material in the order of Compound 3, Compound 2, and Compound 1. In an embodiment, a weight may be applied in proportion to the number of consecutively overlapping regions.
  • Overlapping area ⁇ Non-overlapping area: ⁇ Compound 1 Compound 2 Compound 3 Overlap area pattern ⁇ ⁇ ⁇
  • Table 1 shows only one axis, but if the pattern is expressed in two dimensions, it can be determined whether it is adjacent along two axes, and if the pattern is expressed in three dimensions, it can be determined whether it is adjacent along three axes. I can. For example, referring to Table 2, among the overlapping regions of compound 4, there are no regions adjacent to each other, among the overlapping regions of compound 5, 6 regions are adjacent to each other, and 9 of the overlapping regions of compound 3 are If they are adjacent to each other, it may be determined to be similar to the candidate material in the order of Compound 3, Compound 2, and Compound 1.
  • the order of the density of regions overlapping successively on the CMAP may be determined, in order to rank among substances. For example, among compounds having the same number of overlapping regions with the candidate substance, a compound having a denser overlapping region may be determined to be more similar to the candidate substance than a compound having the overlapping region scattered.
  • Overlapping area ⁇ Non-overlapping area: ⁇ Compound 4 Compound 5 Compound 6 Overlap area pattern ⁇ ⁇ ⁇
  • the use of the ginseng extract or the gilkyung extract may be determined as the same use as the highest-ranking compound a, but is not limited thereto.
  • the use of the ginseng extract or the gilkyung extract may be determined as a common use among the compounds of the upper ranking, for example, the first and second priority, but is not limited thereto.
  • the use of the ginseng extract or Gilkyung extract may be determined as the most common use among the top N compounds, similar to the gene expression pattern of the ginseng extract or Gilkyung extract. Accordingly, the suitable use of the candidate material can be predicted.
  • 4A is a flow chart of a method according to an embodiment.
  • the electronic device can determine a first gene expression pattern of the first substance.
  • the first gene expression pattern of the first substance may be obtained by comparing a case in which the first substance is administered to a subject and a case in which the first substance is not administered to the subject.
  • the first gene expression pattern of the first substance may be statistically determined by collecting experimental data on the previous first substance. Since the method of determining the first gene expression pattern of the first material has been described with reference to FIGS. 1 and 2, duplicate descriptions are omitted.
  • the first material may be a natural material such as a plant extract.
  • the electronic device can identify a second agent that causes a second gene expression pattern corresponding to the first gene expression pattern.
  • the second material showing a second gene expression pattern corresponding to the first gene expression pattern of the first material is a material showing the same or most similar gene expression pattern as the first gene expression pattern among various compounds. I can.
  • the second material showing a second gene expression pattern corresponding to the first gene expression pattern of the first material is a material showing a gene expression pattern similar to the first gene expression pattern and more than a predetermined criterion among various compounds.
  • the second substance may be determined according to the order of similarity to the first gene expression pattern among the substances.
  • the second substance may be a compound whose medical use is already known.
  • the second substance showing a second gene expression pattern corresponding to the first gene expression pattern of the first substance has high similarity to the first gene expression pattern among various compounds, e.g., first and second They may be materials that have similarity in order and have common uses.
  • the electronic device can output the use of the first material based on the use of the second material. Since the method of determining and outputting the use of the first material has been described with reference to FIG. 3, duplicate descriptions are omitted.
  • 4B is a flowchart illustrating a method of predicting a medical use or a biological mechanism according to an embodiment.
  • step S410 first data when the candidate substance is administered in vitro and second data when the candidate substance is not administered may be obtained.
  • the above step is a step for obtaining information on changes in gene expression when a candidate substance is administered or not administered to isolated cells, tissues, plasma, blood, and various samples.
  • step S420 based on the first data and the second data obtained in S410, genes whose expression patterns have changed may be determined.
  • the criterion that the gene expression pattern has changed refers to the degree to which it can be determined that the expression pattern has changed significantly in the art.
  • the direction in which the pattern of gene expression changes there are cases where the amount of gene expression decreases by more than a predetermined standard and increases by more than a predetermined standard, compared with the case where the candidate material is treated and not treated.
  • step S430 it is possible to determine substances having an expression pattern that matches the expression pattern of genes whose expression pattern has changed and a predetermined criterion or more.
  • biological information such as gene expression patterns, known medical uses, target genes or proteins, etc. of various substances are stored in the previously created database, and based on the information of the stored gene expression patterns.
  • the predetermined criterion in the present disclosure may be set by weighting the number of genes that match the direction of increase or decrease of gene expression of a candidate substance and the direction of increase or decrease of gene expression of a substance in the previously generated database, for example. . If the number of genes in the direction of increase or decrease is 40, and the weight of each matching gene is 1, it becomes 40*1, and the substance in the previously generated data can be given a score of 40 points, and the set criterion is 40. If set, the substances can be listed.
  • the set criteria are only an example and do not limit the present disclosure.
  • Step S440 is a step of determining characteristics shared by the substances based on the substances.
  • the characteristics include, but are not limited to, gene expression patterns in specific human cells of the substance, medical use, target proteins, and target genes.
  • Step S450 relates to outputting a prediction of the properties of the candidate material based on the shared properties.
  • a ginseng extract was used as a candidate substance
  • the list of substances became 20, of which five substances shared anticancer activity, two substances were anti-inflammatory drugs, and two were antibacterial agents.
  • Camptothecin was the highest ranked substance among them, and irinotecan was ranked second, all of which share the properties of inhibitors of topoisomerase I.
  • the candidate substance can be predicted as an inhibitor of topoisomerase I, and can be predicted as an anticancer agent.
  • CMAP is generally used to predict other pharmaceutical uses, targets and mechanisms, etc., only for compounds recorded in a database, based on data of compounds with known gene expression profiles or pharmaceutical uses. There is a problem that it is not easy to reveal the characteristics.
  • FIG. 5 shows a result of comparing the effect of a ginseng extract as a topoisomerage I inhibitor with camptothecin
  • FIG. 6 is a ginseng extract and topoisomerase according to an embodiment. The results of comparing the effects of camptothecin, which are well known as I inhibitors, on killing rectal cancer cells are shown.
  • a ginseng extract was used as a candidate material, and a butanol-based ginseng extract was treated with 50 ⁇ g/mL in a human lung cancer cell line, or cDNA microarray when not treated.
  • the expression pattern of the gene was investigated. As a result, genes with increased expression of 80 genes and genes with reduced expression of 29 genes were derived, and at this time, genes with a difference of more than two times in gene expression were selected.
  • the gene expression pattern was derived from 20 substances showing similar gene expression pattern using CMAP.
  • FIG. 7 is a result of comparing the protein expression levels of p21 and p53 of ginseng extract or platycodon grandiflorum extract and Vorinostat, which is well known as a histone deacetylase (HDAC) inhibitor, according to an embodiment
  • FIG. This is a result of comparing the degree of apoptosis of myeloid leukemia cells of vorinostat and ginseng extract or Gilkyung extract according to an embodiment.
  • FIG. 7 or 8 a substance having an expression pattern similar to the above expression pattern using CMAP based on a gene whose gene expression pattern changes when ginseng extract or Gilkyung is treated and untreated on a human lung cancer cell line.
  • a method for predicting the pharmaceutical use of a plant extract has been described as an example, but it should be understood that the present disclosure is not limited to the described examples.
  • the prediction method according to the present disclosure may be sufficiently applied not only to plant extracts but also to other substances whose use is not known within the scope of the invention.
  • FIG. 9 is a block diagram of an apparatus for predicting a biological mechanism or medical use according to an embodiment.
  • the above-described electronic device may be the biological mechanism of FIG. 9 or the apparatus for predicting medical use.
  • the biological mechanism or the medical use prediction apparatus 900 may include a memory 910, an input unit 920, and at least one processor 930. According to the method proposed in the above embodiments, the memory 910, the input unit 920, and at least one processor 930 may operate. However, the components of the device 900 according to the embodiment are not limited to the above-described example. According to another embodiment, the biological mechanism or the medical use prediction apparatus 900 may include more or fewer components than the above-described components.
  • the processor 930 may control the overall operation of the device 900.
  • the processor 930 may control the device 900 based on a user input or may control the device 900 based on a program executed by the processor 930.
  • the program may be stored in the memory 910.
  • the memory 910 may store instructions, and the processor 930 may be configured to execute the instructions to perform the method described in this disclosure.
  • the memory 910 may store data required to perform the method described in the present disclosure, but is not limited thereto. For example, such data may be stored on a device other than apparatus 900, such as a server.
  • the memory 910 may store a database previously generated based on the transcriptional expression data at the genome level.
  • the memory 910 may store CMAP as an example of a database, but is not limited thereto.
  • the memory 910 may store genome-level transcriptional expression data of a material obtained through CMAP, a medical use, a target protein, and the like.
  • the input unit 920 may input a differential gene expression level when a candidate substance is administered or not administered in vitro. However, this is only an example, and the input unit 920 may receive all required user inputs.
  • the at least one processor 930 may generate a gene whose expression pattern has changed based on the first data when the candidate substance is administered in vitro and the second data when the candidate substance is not administered. It is possible to determine and determine a substance having an expression pattern that matches the expression pattern of the determined genes and a predetermined criterion or more, and based on the substances, characteristics shared by the substances may be determined. Also, a prediction of the properties of the candidate material may be output based on the properties.
  • the device includes a processor, a memory for storing and executing program data, a permanent storage such as a disk drive, a communication port for communicating with an external device, a user interface such as a touch panel, keys, and buttons.
  • Methods implemented as software modules or algorithms may be stored on a computer-readable recording medium as computer-readable codes or program instructions executable on the processor.
  • a computer-readable recording medium a magnetic storage medium (e.g., read-only memory (ROM), random-access memory (RAM), floppy disk, hard disk, etc.) and optical reading medium (e.g., CD-ROM ) And DVD (Digital Versatile Disc).
  • the computer-readable recording medium is distributed over network-connected computer systems, so that computer-readable codes can be stored and executed in a distributed manner.
  • the medium is readable by a computer, stored in memory, and executed on a processor.
  • Embodiments of the present disclosure may be represented by functional block configurations and various processing steps. These functional blocks may be implemented with various numbers of hardware or/and software configurations that perform specific functions. For example, embodiments of the present disclosure directly control one or more microprocessors or execute various functions by other control devices, such as memory, processing, logic, and look-up tables. Circuit configurations can be employed. Similar to how the elements of embodiments of the present disclosure can be executed with software programming or software elements, the present disclosure includes various algorithms implemented with a combination of data structures, processes, routines or other programming configurations, including C , C++, Java, assembler, etc. may be implemented in a programming or scripting language. Functional aspects can be implemented with an algorithm running on one or more processors.
  • the present disclosure may employ conventional techniques for electronic environment setting, signal processing, and/or data processing.
  • Terms such as “mechanism”, “element”, “means”, and “configuration” may be used widely, and are not limited to mechanical and physical configurations.
  • the term may include the meaning of a series of routines of software in connection with a processor or the like.
  • connection or connection members of the lines between the components shown in the drawings exemplarily represent functional connections and/or physical or circuit connections, and in an actual device, various functional connections that can be replaced or additionally It may be referred to as a connection, or circuit connections.
  • connection, or circuit connections if there is no specific mention, such as "essential”, “important”, etc., it may not be an essential component for the application of the present disclosure.
  • the HCT116 colorectal cancer cell line was purchased from the Korea Cell Line Bank and contains 10% fetal bovine serum (FBS) and 1% penicillin/streptomycin (RPMI)-1649. It was cultured in medium (HyClone, USA). The reagent and ginseng extract were treated in the absence of FBS.
  • siRNA targeting Werner syndrome gene (WRN ) (5'-UUCUUGUCACGUCCUCUG-3', SEQ ID NO: 1) and negative control siRNA (5'-UUCUCCGACGUGUCACGUdTdT-3', SEQ ID NO: 2) were prepared.
  • Human non-small-cell lung cancer cell lines A549 and NCI-H460 were cultured in RPMI 21 containing 10% fetal bovine serum (FBS) and 1% antibiotic.
  • FBS fetal bovine serum
  • Bellflower ( Platycodon grandiflorum) and ginseng extract were supplied (Dr. Young Pyo Jang, Kyung Hee University, Seoul, Korea).
  • Vorinostat was purchased from Sigma Aldrich (#SML0061).
  • cDNA microarray data were used (Kwon et al., 2013, 16, 30.), and CMAP analysis (http://www) based on the data. .broad.mit.edu/cmap/) was performed. 80 upregulated genes and 29 downregulated genes were used as input data to uncover new mechanisms for the efficacy of ginseng. Statistically significant top ranked 20 compounds were selected and the duplicate list was checked to confirm.
  • an assay kit (TG1018-1; Topogen, USA) was performed and confirmed according to the manufacturer's manual. Specifically, 2 ⁇ L of 10 ⁇ topoisomerase I reaction buffer and 200 ng of supercoiled and relaxed plasmid DNA (e.g., 10 ⁇ L of 20 ⁇ g/mL stock solution) were transferred to each tube. . Then, ginseng extract was added for each concentration (50, 500, and 5000 ⁇ g/mL). 5 U/mL purified topoisomerase I enzyme was added, and each tube was incubated for 30 minutes at 37°C. Each sample was loaded on 1% agarose gel.
  • the cells treated with camptothecin and ginseng were 150 mM NaCl, 20 mM Tris-HCl [pH 7.5], 1 mM EGTA, 1% NP-40, 1% sodium deoxycholate, 1 It was dissolved with a buffer containing mM EDTA and a phosphatase inhibitor. The lysate was analyzed by immunoblotting.
  • Protein expression was performed using a DNA damage antibody sampler kit (#9947, Cell Signaling Technology, USA), and the antibody was anti-phospho-Chk1 Ser 345 (#2348; Cell Signaling Technology), anti-phospho-Chk2 Thr 68 ( #2197; Cell Signaling Technology), anti-phospho-Histone H2A.X Ser 139 (#9718; Cell Signaling Technology), anti-phospho-p53 Ser 15 (#9286; Cell Signaling Technology) and anti- ⁇ -actin (A5441 ; Sigma-Aldrich, USA) was used.
  • Extract-treated A549 cells were obtained and RIPA lysis buffer [150 mM NaCl, 20 mM Tris-HCl (pH 7.5), 1 mM EGTA, 1% NP-40, 1% sodium deoxycholate, 1 mM EDTA and phosphata. Enzyme (phosphatase inhibitor)] was treated and dissolved.
  • the extracted protein was subjected to SDS-PAGE using the following antibodies: p21 antibody (Santa Cruz Biotechnology, #sc-53870), p53 antibody (Santa Cruz Biotechnology, #sc-126), and ⁇ -actin antibody ( Sigma-Aldrich, #A5441).
  • Cell viability was measured using 3-(4,5-dimethylthiazol-2-yl)-2,5-diphenyltetrazolium bromide assay (MTT; Promega, Ltd, USA.) according to the manufacturer's protocol. Specifically, cells were inoculated per well in a 96-well plate at a concentration of 5 ⁇ 10 3 cells. After inoculation, the cells were cultured for 4 hours with 5 mg/mL MTT. After removing the medium and adding 150 ⁇ L solubilizing solution and stop solution, incubation was performed at 37°C for 4 hours, and the absorbance of the reaction solution was measured at 570 nm.
  • MTT 3-(4,5-dimethylthiazol-2-yl)-2,5-diphenyltetrazolium bromide assay
  • NCI-H460 cells were inoculated at 5 ⁇ 10 3 per 96-well plate. Cells were treated with vehicle, vorinostat and each extract for 24 hours, and cultured with 5 mg/ml MTT [3-(4,5-dimethylthiazol-2-yl)-2,5-diphenyltetrazolium bromide)] I did. After 4 hours, the culture medium was removed, and 150 ⁇ l of DMSO was added to the cells to dissolve in the formazan product. The absorbance of the MTT staining solution was measured at 570 nm using a micro plate reader.
  • NCI-H460 cells were inoculated in a 10-cm2 Petri dish with 70% confluence, and the extract was treated on each cell for 4 hours.
  • HDAC activity was analyzed using the HDAC activity color development kit (BioVision, #K331).
  • the nucleic acid extract 50 ⁇ g was incubated with 10 ⁇ l HDAC assay buffer and 5 ⁇ l HDAC color substrate at 37°C for 1 hour. Thereafter, 10 ⁇ l of a lysine neutralizing agent was added to the cells, and the cells were incubated under conditions of 37 degrees and 30 minutes until the reaction was completed. The absorbance was measured at 405 nm using a micro plate reader.
  • A549 cells were treated with vehicle, vorinostat, and each extract for 24 hours. After treatment, it was fixed with 4% PFA (paraformaldehyde) and permeated with 0.1% Triton X-100. Damaged cells were stained using In Situ Cell Death Detection Kit (Roche, #12 156 792 910) and analyzed with a confocal microscope.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Theoretical Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

적어도 하나의 프로세서를 포함하는 전자 디바이스에서 수행되는 방법으로서, 상기 적어도 하나의 프로세서가, 제 1 물질에 의해 야기되는 제 1 유전자 발현 패턴을 결정하는 단계; 상기 적어도 하나의 프로세서가, 유전체 수준의 전사 발현 데이터(genome-wide transcriptional expression data) 에 기초하여, 상기 제 1 유전자 발현 패턴에 대응하는 제 2 유전자 발현 패턴을 야기하는 제 2 물질을 식별하는 단계; 및 상기 적어도 하나의 프로세서가, 상기 제 2 물질의 용도에 기초하여 상기 제 1 물질의 용도를 출력하는 단계를 포함하는, 의약 용도 예측 방법이 개시된다.

Description

물질의 의약용도 또는 생물학적 메카니즘 예측 방법 및 장치
개시된 실시예는 물질, 예를 들어, 식물 추출물이나 천연물과 같은 약물 후보물질의 의약용도 또는 생물학적 메카니즘을 예측하기 위한 방법, 장치, 컴퓨터에서 실행시키기 위한 프로그램, 및 그 프로그램을 기록한 기록매체에 관한 것이다.
컴퓨팅 방법(computational method)과 생명 정보학을 이용함으로써, 연구원은 기존 약제의 새로운 사용법을 찾기 위해 많은 양의 표현 데이터를 기초로 물질의 새로운 의약용도를 예측할 수 있다. 이러한 방식은 천연물이나 식물 추출물 등으로부터 신규 약제 발견에 많이 사용되고 있다.
신약 발견과 개발은 항상 많은 시간 및 비용을 필요로 하며, 복잡한 공정을 거치게 된다. 이에 따라, 최근에는 다른 분야의 학문, 예를 들면 생명정보학(bio-informatics), 케미-인포메틱(chemi-informatics), 컴퓨터 공학 및 CADD(computer-aided drug discovery/design) 등을 융합하여, 신약 발견과 개발에 드는 시간을 줄이고 그 효과를 높이려는 연구가 이루어지고 있다.
특히, 시뮬레이션을 통한 신약 개발을 위한 많은 데이터베이스들이 통합되고 있다. 예를 들어, 복잡한 신약 타겟의 데이터베이스인 drugbank(2006)가 있으며, 웹으로 접근가능한 신약 타겟 확인을 위한 단백질 데이터베이스인 PDTD가 있다. 이외에도 의약품 및 유전자 정보를 포함한 다양한 퍼블릭 데이터베이스가 제공되었다. 예를 들면 Connectivity Map (CMAP)은 의약품, 유전자와 질병의 관계를 밝힐 수 있는 데이터베이스이다. 특히, CMAP은 유전자표현 프로파일등을 이용하여 의약품사용에 따른 생물학적 상태간의 연결성을 보여줄 수 있다. CMAP의 참조 데이터베이스는 많은 수의 perturbagen을 처리한 배양된 인간 세포들에서 얻어진 유전자 발현 프로파일을 포함하고 있다.
따라서, 본 개시는 생물학적 메카니즘이 밝혀지지 않은 물질의 새로운 의약용도 또는 작용기전을 예측하기 위하여, 기 생성된 데이터베이스를 이용하는 장치, 방법, 컴퓨터 프로그램, 및 그 프로그램을 기록한 기록 매체를 제공하고자 한다.
적어도 하나의 프로세서를 포함하는 전자 디바이스에서 수행되는 방법으로서: 상기 적어도 하나의 프로세서가, 제 1 물질에 의해 야기되는 제 1 유전자 발현 패턴을 결정하는 단계; 상기 적어도 하나의 프로세서가, 유전체 수준의 전사 발현 데이터(genome-wide transcriptional expression data) 에 기초하여, 상기 제 1 유전자 발현 패턴에 대응하는 제 2 유전자 발현 패턴을 야기하는 제 2 물질을 식별하는 단계; 및 상기 적어도 하나의 프로세서가, 상기 제 2 물질의 용도에 기초하여 상기 제 1 물질의 용도를 출력하는 단계를 포함하는, 방법이 제공될 수 있다.
상기 유전체 수준의 전사 발현 데이터는 실험 데이터에 기초하여 업데이트되는, 방법이 제공될 수 있다.
상기 제 1 물질은 천연물이고, 상기 제 2 물질은 용도가 알려진 화합물인, 방법이 제공될 수 있다.
상기 유전체 수준의 전사 발현 데이터는 Connectivity Map (CMAP) 을 포함하는, 방법이 제공될 수 있다.
상기 제 1 유전자 발현 패턴은, 대상체에 상기 제 1 물질을 투여함으로써 차등적으로 발현되는 유전자 (differentially expressed genes;DEG) 를 통해 결정되는, 방법이 제공될 수 있다.
상기 DEG 는 상기 대상체에 상기 제 1 물질을 투여함으로써, 미리 결정된 기준 이상 상향 조정된 (upregulated) 유전자를 포함하는, 방법이 제공될 수 있다.
상기 DEG 는 상기 대상체에 상기 제 1 물질을 투여함으로써, 미리 결정된 기준 이상 하향 조정된 (downregulated) 유전자를 포함하는, 방법이 제공될 수 있다.
상기 제 2 유전자 발현 패턴은, 복수의 제 2 유전자 발현 패턴들 중 상기 제 1 유전자 발현 패턴과 동일하거나 가장 유사한, 방법이 제공될 수 있다.
상기 제 2 물질을 식별하는 단계는, 미리 결정된 기준에 기초하여, 상기 제 1 유전자 발현 패턴에 대응하는 복수의 제 2 유전자 발현 패턴들 각각을 야기하는 복수의 제 2 물질들을 식별하는 단계를 포함하고, 상기 제 1 물질의 상기 용도를 출력하는 단계는, 상기 복수의 제 2 물질들 간에 가장 많이 공통되는 용도에 기초하여, 상기 제 1 물질의 상기 용도를 출력하는 단계를 포함하는, 방법이 제공될 수 있다.
상기 유전체 수준의 전사 발현 데이터는 Connectivity Map (CMAP) 을 포함하고, 상기 제 2 유전자 발현 패턴은 상기 CMAP 상에서 상기 제 1 유전자 발현 패턴과 중첩되는 영역을, 복수의 제 2 유전자 발현 패턴들 중에서 가장 많이 포함하는, 방법이 제공될 수 있다.
본 개시에 의해, 하드웨어와 결합하여 상기 방법을 실행시키기 위해 매체에 저장되는 컴퓨터 프로그램이 제공될 수 있다.
본 개시에 의해, 상기 방법을 컴퓨터에서 실행하는 프로그램이 수록된 컴퓨터 판독가능 기록매체가 제공될 수 있다.
본 개시에 의해, 인스트럭션들을 저장하는 메모리; 및 상기 인스트럭션들을 실행하여: 제 1 물질에 의해 야기되는 제 1 유전자 발현 패턴을 결정하고, 상기 적어도 하나의 프로세서가, 유전체 수준의 전사 발현 데이터(genome-wide transcriptional expression data) 에 기초하여, 상기 제 1 유전자 발현 패턴에 대응하는 제 2 유전자 발현 패턴을 야기하는 제 2 물질을 식별하고, 상기 적어도 하나의 프로세서가, 상기 제 2 물질의 용도에 기초하여 상기 제 1 물질의 용도를 출력하도록 구성된 적어도 하나의 프로세서를 포함하는 전자 디바이스가 제공될 수 있다.
본 개시의 방법 및 장치를 이용하여, 물질, 예를 들어, 천연물이나 식물 추출물의 메카니즘 또는 새로운 용도를 빠르고 정확하게 예측할 수 있다.
도 1은 일 실시예에 따른, 화합물 (chemical compound) 및 식물 추출물 (plant extract) 간의 유전자 발현 패턴 간의 유사도를 설명하기 위한 도면이다.
도 2는 일 실시예에 따라, 후보물질과 화합물의 유전자 발현 패턴을 비교하는 방법의 흐름도이다.
도 3은 일 실시예에 따라, 후보물질의 유전자 발현 패턴과 유사한 패턴을 보이는 화합물들의 순위를 결정하는 방법의 흐름도이다.
도 4a는 일 실시예에 따른 방법의 흐름도이다.
도 4b는 일 실시에 따른 의약용도 또는 생물학적 메카니즘을 예측하는 방법을 설명하기 위한 흐름도이다.
도 5는 일 실시예에 따른 인삼 추출물의 국소이성질화효소 I(topoisomerage I) 억제제로서의 효과를 캠프토더신(camptothecin)과 비교한 결과이다.
도 6은 일 실시예에 따른 인삼 추출물과 topoisomerase I 억제제로 잘 알려진 캠프토더신(camptothecin)의 직장암 세포 사멸효과를 비교한 결과이다.
도 7은 일 실시예에 따른 인삼 추출물 또는 길경(platycodon grandiflorum) 추출물과 HDAC(histone deacetylase) 억제제로 잘 알려진 보리노스타트(Vorinostat)의 p21 및 p53의 단백질 발현 수준을 비교한 결과이다.
도 8은 일 실시예 따른 인삼 추출물 또는 길경 추출물과 보리노스타트의 골수성 백혈병 세포의 세포자멸사 정도를 비교한 결과이다.
도 9는 일 실시예에 생물학적 메카니즘 또는 의약용도 예측 장치의 블록도이다.
본 개시에서 사용되는 용어에 대해 간략히 설명하고, 본 개시에 대해 구체적으로 설명하기로 한다.
본 개시에서 사용되는 용어는 실시예에서 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 해당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 실시예의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 개시에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 정의되어야 한다.
명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.
이하 첨부된 도면을 참고하여 본 발명을 상세히 설명하기로 한다.
도 1은 일 실시예에 따른, 화합물 (chemical compound) 및 식물 추출물 (plant extract) 간의 유전자 발현 패턴 간의 유사도를 설명하기 위한 도면이다.
식물 추출물과 같은 천연물의 경우, 단일 화합물에 기반한 화합물과 달리 생물학적 메카니즘등이 밝혀지지 않은 경우가 많고, 천연물 내에 많은 화합물이 포함되고 있어 유전자 발현 패턴의 확인만으로 약학적 용도 및 상기 약학적 용도의 작용기전(mode of action)을 밝히는 것에 대한 문제점이 있다. Connectivity Map (CMAP) 은, 유전자 발현 프로파일 또는 의약용도등이 알려진 화합물의 데이터를 기반으로, 데이터베이스에 기록된 화합물에 대해서만 다른 의약용도, 타겟 및 메카니즘등을 예측하는데 이용되는 것이 일반적이고, 데이터베이스에 기록되지 않은 화합물의 특성을 밝히기는 쉽지 않은 문제점이 있다.
도 1을 참조하면, 약물 후보물질과 화합물과의 유전자 발현 패턴의 유사도를 분석하여, 약물 후보물질과 가장 유사한 유전자 발현 패턴을 보이는 화합물이 식별될 수 있다. 본 개시에서 약물 후보물질은 천연물, 추출물, 화합물, 혼합물을 포함한 다양한 물질을 이용할 수 있다.
일 실시예에서, 약물 후보물질과 화합물과의 유전자 발현 패턴의 유사도는 Connectivity Map (CMAP) 상에서 중첩되는 영역에 기초하여 결정될 수 있다. 예를 들어, 중첩되는 영역의 개수가 많을수록 유사한 것으로 결정될 수 있다. 예를 들어, 연이어 중첩되는 영역의 개수가 많을수록 유사한 것으로 결정될 수 있다. 도 1에서 중첩되는 영역은 노란색으로 표시된다.
도 2는 일 실시예에 따라, 후보물질과 화합물의 유전자 발현 패턴을 비교하는 방법의 흐름도이다.
일 실시예에서, 후보물질은 길경 추출물 또는 인산추출물과 같은 식물 추출물일 수 있다.
도 2를 참조하면, 일 실시예에 따르면, 전자 디바이스는, 후보물질을 대상체, 예를 들어, 인간 폐암 세포에 처리한 경우와 처리하지 않은 경우와 비교하여 차등적으로 발현되는 유전자(differentially expressed genes;DEG)를 통해 결정된, 후보물질의 유전자 표현 프로필을 수신할 수 있다. 후보물질의 유전자 표현 프로필은 실험 결과를 통해 전자 디바이스에 입력될 수 있다. 이러한 실험 결과는, 기존에 공개된 cDNA 마이크로어레이 데이터를 포함할 수 있다.
DEG는 대상체, 예를 들어, 인간 폐암 세포에 후보물질을 처리함으로써, 미리 결정된 기준 이상 상향 조정된 (upregulated) 유전자를 포함할 수 있다. DEG는 대상체에 후보물질을 처리함으로써, 미리 결정된 기준 이상 하향 조정된 (upregulated) 유전자를 포함할 수 있다. 일 실시예에서, 미리 결정된 기준은 2배일 수 있다. 예를 들어, 2배 이상 상향 조정되거나 2배 이상 하향 조정된 유전자가 DEG 로 선별될 수 있다.
일 실시예에 따르면, 전자 디바이스는 후보물질의 유전자 표현 프로필을 수집할 수 있고, 수집된 유전자 표현 프로필을 통계적으로 분석할 수 있다. 일 실시예에 따르면, 전자 디바이스는 통계적으로 분석된 유전자 표현 프로필을 이용하여 후보물질의 유전자 발현 패턴을 결정할 수 있다.
일 실시예에서, 전자 디바이스는 기 생성된 데이터베이스를 이용하여 상기 유전자 발현 패턴과 유사도가 높은 유전자 발현 패턴을 보이는 화합물을 식별할 수 있다. 여기서 기 생성된 데이터베이스는, CMAP 데이터베이스일 수 있다. 상기 일 실시예에서는 유전자의 차등 발현은 후보물질을 처리한 경우와 처리하지 않은 경우의 유전자 발현양의 차이가 2배 이상 차이나는 것을 선별하였으나, 상기 기준은 하나의 예시일뿐 본 개시는 이에 제한되지 않는다. 또한, 본 개시의 일 실시예로 인간 폐암세포를 이용하였으나, 이용할 수 있는 세포는 제한은 없으며, 목적에 맞게 당업자가 변경이 가능하다.
도 3은 일 실시예에 따라, 후보물질의 유전자 발현 패턴과 유사한 패턴을 보이는 화합물들의 순위를 결정하는 방법의 흐름도이다.
도 3을 참조하면, 일 실시예에 따르면, 전자 디바이스는 후보물질을 인비트로에서 처리한 경우와 처리하지 않은 경우, 차등 발현 양상을 보이는 유전자를 선별 후, 기 생성된 데이터베이스에 적용하여, 상기 후보물질의 유전자 발현 양상과 기 생성된 데이터베이스에 저장된 물질의 유전자 발현 양상과 비교하여 유사정도를 점수화하여 순위를 나열할 수 있다. 보다 구체적으로 상기 유사도를 기반으로 물질의 순위(Rank)를 결정하여, 이를 순서대로 나열한 리스트 형태로 적어도 하나의 물질에 대한 관한 정보를 생성할 수 있다. 또한, 본 개시의 일 실시예로는 상기 기 생성된 데이터베이스는 CMAP일 수 있으나, 이에 한정되지 않는다. 상기 CMAP은 1,309가지의 생물체 작용 저분자 (bioactive small molecule)를 처리한 인간 세포를 배양하여 얻은 유전체 수준의 전사 발현 데이터 (genome-wide transcriptional expression data)를 모아 놓은 데이터베이스를 의미한다.
도 3을 참조하면, 후보물질, 즉, 인삼 추출물 또는 길경 추출물의 유전자 발현 패턴에 대응하는 유전자 발현 패턴을 보이는 물질들이 식별되어, 인삼 추출물 또는 길경 추출물의 유전자 발현 패턴과 유사한 순서대로 물질들 간의 순위가 결정될 수 있다. 도 3은 인삼 추출물과 길경 추출물을 예시하나, 이에 제한되지 않고 다른 식물 추출물의 유전자 발현 패턴과 유사한 유전자 발현 패턴을 보이는 화합물들도 식별될 수 있다.
일 실시예에서, CMAP 상에서 중첩되는 영역이 많은 순서대로, 물질들 간의 순위가 결정될 수 있다. 예를 들어, CMAP 상에서 후보물질과 중첩되는 영역을 가장 가지는 화합물이, 해당 후보물질과 가장 유사한 화합물로 식별될 수 있다.
일 실시예에서, CMAP 상에서 연이어 중첩되는 영역의 개수가 많은 순서대로, 물질들 간의 순위가 결정될 수 있다. 예를 들어, CMAP 상에서 후보물질과 중첩되는 영역들 중 서로 인접한 영역이 많을수록, 해당 후보물질과 가장 유사한 화합물로 식별될 수 있다. 예를 들어, 표 1 을 참조하면, 화합물 1 의 중첩영역들 중에서 서로 인접한 영역이 없고, 화합물 2 의 중첩 영역들 중에서 2개 영역이 서로 인접하고, 화합물 3 의 중첩 영역들 중에서 3개 영역이 서로 인접하는 경우, 화합물 3, 화합물2, 및 화합물 1 의 순서대로 후보물질과 유사한 것으로 결정될 수 있다. 일 실시예에서, 연이어 중첩되는 영역의 개수에 비례하여 가중치가 적용될 수 있다. 예를 들어, 화합물 3 과 같이 3개의 중첩되는 영역이 서로 인접하는 경우 3의 가중치를 적용함으로써, 9개의 영역이 중첩되는 것으로 계산하고, 화합물 2와 같이 2개의 중첩되는 영역이 서로 인접하는 경우 2의 가중치를 적용함으로써, 6개의 영역이 중첩되는 것으로 계산하고, 화합물 1과 같이 중첩되는 영역들 중 서로 인접하는 영역이 없는 경우에는 가중치를 적용하지 않음으로써, 3개의 영역이 중첩되는 것으로 계산할 수 있으나, 이에 제한되지 않는다. 예를 들어, 화합물 1과 같이 중첩되는 영역들 중 서로 인접하는 영역이 없는 경우에는 1 이하의 가중치를 적용할 수도 있다.
중첩영역: ■비중첩영역: □ 화합물 1 화합물 2 화합물 3
중첩 영역 패턴 □■□■□■ □■■□□■ □■■■□□
표 1 은 하나의 축만을 도시하고 있으나, 패턴이 2차원으로 표현되는 경우에는 2개의 축을 따라 인접 여부가 판단될 수 있고, 패턴이 3차원으로 표현되는 경우에는 3개의 축을 따라 인접 여부가 판단될 수 있다. 예를 들어, 표 2 를 참조하면, 화합물 4 의 중첩영역들 중에서 서로 인접한 영역이 없고, 화합물 5 의 중첩 영역들 중에서는 6개 영역이 서로 인접하고, 화합물 3 의 중첩 영역들 중에서 9개 영역이 서로 인접하는 경우, 화합물 3, 화합물2, 및 화합물 1 의 순서대로 후보물질과 유사한 것으로 결정될 수 있다.
일 실시예에서, CMAP 상에서 연이어 중첩되는 영역의 밀도가 높은 순서대로, 물질들 간의 순위가 결정될 수도 있다. 예를 들어, 후보물질과 중첩되는 영역의 개수가 같은 화합물들 중에서도, 중첩되는 영역이 산재해 있는 (scattered) 화합물보다, 중첩되는 영역이 더 조밀한 화합물이 후보물질과 더 유사한 것으로 결정될 수 있다.
중첩영역: ■비중첩영역: □ 화합물 4 화합물 5 화합물 6
중첩 영역 패턴 □■□■□■■□■□■□□■□■□■ □■■□□■■□■■□□□■■□□■ □■■■□□□□■■■□□■■■□□
일 실시예에 따르면, 인삼 추출물 또는 길경 추출물의 용도는, 가장 높은 순위의 화합물 a 와 동일한 용도로 결정될 수 있으나, 이에 제한되지 않는다.
일 실시예에 따르면, 인삼 추출물 또는 길경 추출물의 용도는, 상위 순위, 예를 들어, 1순위와 2순위의 화합물들에서 공통되는 용도로 결정될 수 있으나, 이에 제한되지 않는다. 인삼 추출물 또는 길경 추출물의 용도는, 인삼 추출물 또는 길경 추출물의 유전자 발현 패턴과 유사한, 상위 N개의 화합물들에서 가장 많이 공통되는 용도로 결정될 수 있다. 이에 따라, 후보물질의 적합한 용도를 예측할 수 있다.
도 4a는 일 실시예에 따른 방법의 흐름도이다.
402에서, 전자 디바이스는 제 1 물질의 제 1 유전자 발현 패턴을 결정할 수 있다. 일 실시예에서, 제 1 물질의 제 1 유전자 발현 패턴은, 대상체에 제 1 물질이 투여된 경우와, 대상체에 제 1 물질이 투여되지 않은 경우를 비교하여 획득될 수 있다. 일 실시예에서, 제 1 물질의 제 1 유전자 발현 패턴은 이전의 제 1 물질에 대한 실험 데이터를 수집하여 통계적으로 결정될 수 있다. 제 1 물질의 제 1 유전자 발현 패턴을 결정하는 방법은 도 1 및 도 2 를 참조하여 설명되었으므로, 중복 설명은 생략한다.
일 실시예에서, 제 1 물질은 식물 추출물과 같은 천연물질일 수 있다.
404에서, 전자 디바이스는 제 1 유전자 발현 패턴에 대응하는 제 2 유전자 발현 패턴을 야기하는 제 2 물질을 식별할 수 있다. 일 실시예에서, 제 1 물질의 제 1 유전자 발현 패턴에 대응하는 제 2 유전자 발현 패턴을 보이는 제 2 물질은, 다양한 화합물들 중 제 1 유전자 발현 패턴과 동일하거나 가장 유사한 유전자 발현 패턴을 보이는 물질일 수 있다.
일 실시예에서, 제 1 물질의 제 1 유전자 발현 패턴에 대응하는 제 2 유전자 발현 패턴을 보이는 제 2 물질은, 다양한 화합물들 중 제 1 유전자 발현 패턴과 소정 기준 이상 유사한 유전자 발현 패턴을 보이는 물질들일 수 있다. 제 2 물질은 해당 물질들 중 제 1 유전자 발현 패턴과의 유사도 순위에 따라 결정될 수도 있다.
일 실시예에서, 제 2 물질은 이미 그 의학적 용도가 알려진 화합물일 수 있다. 일 실시예에서, 제 1 물질의 제 1 유전자 발현 패턴에 대응하는 제 2 유전자 발현 패턴을 보이는 제 2 물질은, 다양한 화합물들 중 제 1 유전자 발현 패턴과 높은 유사성, 예를 들어, 1순위 및 2순위의 유사성을 가지고, 서로 공통되는 용도를 가지는 물질들일 수 있다.
제 2 물질을 식별하는 방법은 도 3, 도 4a 및 도 4b 를 참조하여 설명되었으므로, 중복 설명은 생략한다.
406에서, 전자 디바이스는 제 2 물질의 용도에 기초하여 제 1 물질의 용도를 출력할 수 있다. 제 1 물질의 용도를 결정하여 출력하는 방법은 도 3 을 참조하여 설명되었으므로, 중복 설명은 생략한다.
도 4b는 일 실시에 따른 의약용도 또는 생물학적 메카니즘을 예측하는 방법을 설명하기 위한 흐름도이다.
단계 S410에서 인 비트로에서 후보 물질을 투여한 경우의 제 1 데이터 및 상기 후보 물질을 투여하지 않은 경우의 제 2 데이터를 획득할 수 있다. 상기 단계에서는 분리된 세포, 조직, 혈장, 혈액 및 다양한 시료에 후보 물질을 투여한 경우와 투여하지 않은 경우의 유전자 발현의 변화의 정보를 얻기 위한 단계이다.
단계 S420에서는 S410에서 얻은 제 1 데이터 및 상기 제 2 데이터에 기초하여, 발현 양상이 변화한 유전자들을 결정할 수 있다. 유전자 발현 양상이 변화하였다는 기준은 당업계에서 발현 양상이 유의성 있게 변화하였다고 판단할 수 있는 정도를 의미한다. 또한, 유전자 발현의 양상이 변화하는 방향은 후보물질을 처리한 경우와 처리하지 않은 경우를 비교하여, 유전자 발현양이 소정기준 이상 감소한 경우와 소정기준 이상 증가한 경우가 존재하고, 본 개시의 일 실시예에서는 2배이상 변화한 경우 유전자의 발현양상이 변화하였다고 결정할 수 있으나, 상기 기준은 설정에 의하여 변경될 수 있다.
단계 S430에서는 상기 발현 양상이 변화한 유전자들의 발현양상과 소정 기준 이상 일치하는 발현 양상을 갖는 물질들을 결정할 수 있다. 상기 물질들을 결정하는 방법을 구체적으로 설명하면, 기 생성된 데이터베이스에는 다양한 물질들의 유전자 발현 양상 및 알려진 의약용도, 타겟 유전자 또는 단백질 등의 생물학적 정보가 저장되어 있고, 상기 저장된 유전자 발현 양상의 정보를 기반으로 후보물질의 유전자 발현 양상과 유사도가 높은 순서대로 물질들을 리스트화 할 수 있으며, 후보물질과 기 생성된 데이터베이스 내의 물질의 유사도가 높은 순위대로 나열할 수 있으며, 바람직하게는 20개 이하의 물질을 리스트화 시킬 수 있으나, 이는 당업자가 필요에 따라 변경이 가능하다. 또한, 본원 개시에서의 상기 소정 기준이란, 예를들어 후보물질의 유전자 발현의 증감 방향과 기 생성된 데이터베이스의 물질의 유전자 발현의 증감 방향과 일치하는 유전자의 개수에 가중치를 주어 기준을 설정할 수 있다. 만약 증감 방향이 일치하는 유전자의 개수가 40개이고, 각 일치하는 유전자에 가중치를 1로 하면 40*1이 되어 기 생성된 데이터 내의 물질은 40점의 점수를 부여받을 수 있고, 설정된 기준을 40으로 설정한다면, 상기 물질은 리스트화 되어질 수 있다. 상기 설정된 기준은 하나의 예시일 뿐 본 개시를 한정하는 것은 아니다.
단계 S440은 상기 물질들에 기초하여, 상기 물질들이 공유하는 특성을 결정하는 단계이다. 상기 특성은 물질의 특정 인간 세포 내에서의 유전자 발현 양상, 의약용도, 타겟 단백질, 타겟 유전자등이 있으나, 이에 제한되는 것은 아니다.
단계 S450은 상기 공유되는 특성에 기초하여 상기 후보 물질의 특성의 예측을 출력하는 단계에 관한 것이다. 본 개시의 일 실시예에 따르면, 후보물질로 인삼 추출물을 이용한 경우, 물질의 리스트화가 20개가 되었고, 이 중 5개의 물질에서 항암 활성을 공유하고 있고, 2개의 물질은 항염제였고, 2개는 항균제였고, 이 중 가장 높은 순위를 차지하는 물질은 Camptothecin이었고, 2위는 irinotecan으로 모두 topoisomerase I의 억제제라는 특성을 공유한다. 따라서, 상기 후보 물질은 topoisomerase I의 억제제라고 예측할 수 있으며, 항암제라고 예측할 수 있다.
인삼 및 길경과 같은 천연물의 경우, 단일 화합물에 기반한 화합물과 달리 생물학적 메카니즘등이 밝혀지지 않은 경우가 많고, 천연물 내에 많은 화합물이 포함되고 있어 유전자 발현 패턴의 확인만으로 약학적 용도 및 상기 약학적 용도의 작용기전(mode of action)을 밝히는 것에 대한 문제점이 있다. CMAP은, 유전자 발현 프로파일 또는 의약용도등이 알려진 화합물의 데이터를 기반으로, 데이터베이스에 기록된 화합물에 대해서만 다른 의약용도, 타겟 및 메카니즘등을 예측하는데 이용되는 것이 일반적이고, 데이터베이스에 기록되지 않은 화합물의 특성을 밝히기는 쉽지 않은 문제점이 있다.
도 5는 일 실시예에 따른 인삼 추출물의 국소이성질화효소 I(topoisomerage I) 억제제로서의 효과를 캠프토더신(camptothecin)과 비교한 결과이다를 나타내고,도 6은 일 실시예에 따른 인삼 추출물과 topoisomerase I 억제제로 잘 알려진 캠프토더신(camptothecin)의 직장암 세포 사멸효과를 비교한 결과를 나타낸다.
도 5 및 도 6을 참조하면, 본 개시의 일 실시예에서는 인삼 추출물을 후보 물질로 이용하였고, 부탄올 기반 인삼 추출물을 인간 폐암 세포주에 50 μg/mL를 처리하거나, 처리하지 않은 경우에 cDNA 마이크로어레이를 이용항 유전자 발현 양상을 조사하였다. 그 결과, 80개의 유전자 발현이 증가한 유전자와 29개의 유전자 발현이 감소한 유전자를 도출하였고, 이때 유전자 발현의 변화가 2배이상 차이가 나는 유전자를 선별하였다. 상기 유전자 발현 양상을 CMAP을 이용하여 유사한 유전자 발현 양상을 보이는 20개의 물질을 도출하였다. 이 중 5개의 물질에서 항암 활성을 공유하고 있고, 2개의 물질은 항염제였고, 2개는 항균제였고, 이 중 가장 높은 순위를 차지하는 물질은 camptothecin이었고, 2위는 irinotecan으로 모두 topoisomerase I의 억제제라는 특성을 공유하고 있었다. 따라서, 인삼 추출물은 topoisomerase I의 억제제로서의 생물학적 메카니즘을 가질 것이라고 예측하였고, 이 같은 예측을 검증하기 위하여, 인산 추출물이 topoisomerage I 활성 억제 및 직장암 세포의 사멸효과 있어 Camptothecin과 동일한 생물학적 메카니즘 및 의약용도가 있음을 확인하였다. 따라서, 일시예에 따라 인삼 추출물이 topoisomerase I 억제제로서의 생물학적 메카니즘을 갖고, 항암 효과가 있을 것이라는 예측이 정확함을 확인할 수 있었다.
도 7 은 일 실시예에 따른 인삼 추출물 또는 길경(platycodon grandiflorum) 추출물과 HDAC(histone deacetylase) 억제제로 잘 알려진 보리노스타트(Vorinostat)의 p21 및 p53의 단백질 발현 수준을 비교한 결과이고, 도 8은 일 실시예 따른 인삼 추출물 또는 길경 추출물과 보리노스타트의 골수성 백혈병 세포의 세포자멸사 정도를 비교한 결과이다. 도 7 또는 도 8을 참조하면 인삼 추출물 또는 길경을 인간 폐암 세포주에 처리한 경우와 처리하지 않은 경우 유전자 발현 양상이 변화하는 유전자를 기반으로, CMAP를 이용하여 상기 발현 양상과 유사한 발현 양상을 갖는 물질 리스트를 확보하였고, 이 때 상기 물질들이 HDAC 억제제로서의 생물학적 메카니즘을 공유하고 있음을 확인하였다. 따라서, 이 같은 예측을 검증하기 위하여, HDAC 억제시 유도되는 p53, p21의 단백질 발현 정도를 분석하여 HDAC로 잘알려진 보리노스타트와 비교하였고, 골수 백혈병 세포주에서의 세포 사멸효과를 확인하였다. 이의 결과, HDAC 억제제로서의 작용함을 확인하여, 본 개시의 일 실시예의 효과를 검증하였다.
본 개시에서 식물 추출물의 의약 용도를 예측하는 방법이 실시예로서 설명되었으나, 본 개시는 설명된 실시예에 한정되지 않음이 이해되어야 한다. 예를 들어, 본 개시에 따른 예측 방법은 식물 추출물뿐만 아니라 용도가 밝혀지지 않은 다른 물질에 대해서도 발명의 사상을 벗어나지 않는 범위에서 충분히 적용될 수 있을 것이다.
도 9는 일 실시예에 따른, 생물학적 메카니즘 또는 의약용도 예측 장치의 블록도이다. 전술된 전자 디바이스는 도 9 의 생물학적 메카니즘 또는 의약용도 예측 장치일 수 있다.
도 9를 참조하면, 생물학적 메카니즘 또는 의약용도 예측장치(900)는 메모리(910), 입력부(920) 및 적어도 하나의 프로세서(930)를 포함할 수 있다. 상기 실시 예들에서 제안한 방법에 따라, 메모리(910), 입력부(920) 및 적어도 하나의 프로세서(930)가 동작할 수 있다. 다만, 일 실시예에 따른 장치(900)의 구성 요소가 전술한 예에 한정되는 것은 아니다. 다른 실시예에 따라, 생물학적 메카니즘 또는 의약용도 예측장치(900)는 전술한 구성 요소들 보다 더 많은 구성 요소를 포함하거나 더 적은 구성 요소를 포함할 수도 있다.
프로세서 (930) 는 장치 (900) 의 전반적인 동작을 제어할 수 있다. 프로세서 (930) 는 사용자의 입력에 기초하여 장치 (900) 를 제어하거나, 프로세서 (930) 에 의해 실행되는 프로그램에 기초하여 장치 (900) 를 제어할 수 있다. 프로그램은 메모리 (910) 에 저장될 수 있다.
메모리 (910) 는 인스트럭션들을 저장할 수 있고, 프로세서 (930) 는 인스트럭션들을 실행하여, 본 개시에서 설명된 방법을 수행하도록 구성될 수 있다. 메모리 (910) 는 본 개시에서 설명된 방법을 수행하는 데 필요한 데이터를 저장할 수 있으나, 이에 제한되지 않는다. 예를 들어, 이러한 데이터는 장치 (900) 와 다른 디바이스, 예를 들어, 서버에 저장될 수 있다.
일 실시예에 따른 메모리(910)는 유전체 수준의 전사 발현 데이터를 기초로 기 생성된 데이터 베이스를 저장할 수 있다. 예를 들어, 메모리(910)는 데이터베이스의 일 예로 CMAP을 저장할 수 있으나, 이에 제한되지 않는다. 또한, 다른 실시예에 따라, 메모리(910)는 CMAP을 통해 획득한 물질의 유전체 수준의 전사 발현 데이터, 의약용도 및 타겟 단백질등을 저장할 수 있다.
일 실시예에 따른 입력부(920)는 인 비트로에서 후보 물질을 투여한 경우와 투여하지 않은 경우의 차별적 유전자 발현 수준을 입력할 수 있다. 다만, 이는 일 실시예일 뿐, 입력부(920)는 요구되는 모든 사용자 입력을 수신할 수 있다.
일 실시예에 따른 적어도 하나의 프로세서(930)는 인 비트로에서 후보 물질을 투여한 경우의 제 1 데이터 및 상기 후보 물질을 투여하지 않은 경우의 제 2 데이터를 기초로, 발현 양상이 변화한 유전자를 결정하고, 결정된 유전자들의 발현양상과 소정 기준 이상 일치하는 발현 양상을 갖는 물질을 결정할 수 있고, 상기 물질들에 기초하여, 상기 물질들이 공유하는 특성을 결정할 수 있다. 또한, 상기 특성에 기초하여 상기 후보 물질의 특성의 예측을 출력할 수 있다.
본 개시에 따른 장치는 프로세서, 프로그램 데이터를 저장하고 실행하는 메모리, 디스크 드라이브와 같은 영구 저장부(permanent storage), 외부 장치와 통신하는 통신 포트, 터치 패널, 키(key), 버튼 등과 같은 사용자 인터페이스 장치 등을 포함할 수 있다. 소프트웨어 모듈 또는 알고리즘으로 구현되는 방법들은 상기 프로세서상에서 실행 가능한 컴퓨터가 읽을 수 있는 코드들 또는 프로그램 명령들로서 컴퓨터가 읽을 수 있는 기록 매체 상에 저장될 수 있다. 여기서 컴퓨터가 읽을 수 있는 기록 매체로 마그네틱 저장 매체(예컨대, ROM(read-only memory), RAM(random-access memory), 플로피 디스크, 하드 디스크 등) 및 광학적 판독 매체(예컨대, 시디롬(CD-ROM), 디브이디(DVD: Digital Versatile Disc)) 등이 있다. 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템들에 분산되어, 분산 방식으로 컴퓨터가 판독 가능한 코드가 저장되고 실행될 수 있다. 매체는 컴퓨터에 의해 판독가능하며, 메모리에 저장되고, 프로세서에서 실행될 수 있다.
본 개시에서 인용하는 공개 문헌, 특허 출원, 특허 등을 포함하는 모든 문헌들은 각 인용 문헌이 개별적으로 및 구체적으로 병합하여 나타내는 것 또는 본 개시에서 전체적으로 병합하여 나타낸 것과 동일하게 본 개시에 병합될 수 있다.
본 개시의 이해를 위하여, 도면에 도시된 바람직한 실시 예들에서 참조 부호를 기재하였으며, 본 개시의 실시 예들을 설명하기 위하여 특정 용어들을 사용하였으나, 특정 용어에 의해 본 개시가 한정되는 것은 아니며, 본 개시는 당업자에 있어서 통상적으로 생각할 수 있는 모든 구성 요소들을 포함할 수 있다.
본 개시의 실시예들은 기능적인 블록 구성들 및 다양한 처리 단계들로 나타내어질 수 있다. 이러한 기능 블록들은 특정 기능들을 실행하는 다양한 개수의 하드웨어 또는/및 소프트웨어 구성들로 구현될 수 있다. 예를 들어, 본 개시의 실시예들은 하나 이상의 마이크로프로세서들의 제어 또는 다른 제어 장치들에 의해서 다양한 기능들을 실행할 수 있는, 메모리, 프로세싱, 로직(logic), 룩업 테이블(look-up table) 등과 같은 직접 회로 구성들을 채용할 수 있다. 본 개시의 실시예들의 구성 요소들이 소프트웨어 프로그래밍 또는 소프트웨어 요소들로 실행될 수 있는 것과 유사하게, 본 개시는 데이터 구조, 프로세스들, 루틴들 또는 다른 프로그래밍 구성들의 조합으로 구현되는 다양한 알고리즘을 포함하여, C, C++, 자바(Java), 어셈블러(assembler) 등과 같은 프로그래밍 또는 스크립팅 언어로 구현될 수 있다. 기능적인 측면들은 하나 이상의 프로세서들에서 실행되는 알고리즘으로 구현될 수 있다. 또한, 본 개시는 전자적인 환경 설정, 신호 처리, 및/또는 데이터 처리 등을 위하여 종래 기술을 채용할 수 있다. "매커니즘", "요소", "수단", "구성"과 같은 용어는 넓게 사용될 수 있으며, 기계적이고 물리적인 구성들로서 한정되는 것은 아니다. 상기 용어는 프로세서 등과 연계하여 소프트웨어의 일련의 처리들(routines)의 의미를 포함할 수 있다.
본 개시에서 설명하는 특정 실행들은 일 실시 예들로서, 어떠한 방법으로도 본 개시의 범위를 한정하는 것은 아니다. 명세서의 간결함을 위하여, 종래 전자적인 구성들, 제어 시스템들, 소프트웨어, 상기 시스템들의 다른 기능적인 측면들의 기재는 생략될 수 있다. 또한, 도면에 도시된 구성 요소들 간의 선들의 연결 또는 연결 부재들은 기능적인 연결 및/또는 물리적 또는 회로적 연결들을 예시적으로 나타낸 것으로서, 실제 장치에서는 대체 가능하거나 추가의 다양한 기능적인 연결, 물리적인 연결, 또는 회로 연결들로서 나타내어질 수 있다. 또한, "필수적인", "중요하게" 등과 같이 구체적인 언급이 없다면 본 개시의 적용을 위하여 반드시 필요한 구성 요소가 아닐 수 있다.
본 개시에서 "상기"의 용어 및 이와 유사한 지시 용어의 사용은 단수 및 복수 모두에 해당하는 것일 수 있다. 또한, 본 개시의 실시예에서 범위(range)를 기재한 경우 상기 범위에 속하는 개별적인 값을 적용한 실시예를 포함하는 것으로서(이에 반하는 기재가 없다면) 이해되어야 하고, 상기 범위를 구성하는 각 개별적인 값을 기재한 것과 동일한 것으로 이해되어야 한다. 본 개시의 실시예에 따른 방법을 구성하는 단계들에 대하여 명백하게 순서를 기재하거나 반하는 기재가 없다면, 상기 단계들은 적당한 순서로 행해질 수 있다. 반드시 상기 단계들의 기재 순서에 따라 본 개시가 한정되는 것은 아니다. 본 개시에서 모든 예들 또는 예시적인 용어(예들 들어, 등등)의 사용은 단순히 본 개시를 상세히 설명하기 위한 것으로서 특허청구범위에 의해 한정되지 않는 이상 상기 예들 또는 예시적인 용어로 인해 본 개시의 범위가 한정되는 것은 아니다. 또한, 당업자는 다양한 수정, 조합 및 변경이 부가된 특허청구범위 또는 그 균등물의 범주 내에서 설계 조건 및 팩터에 따라 구성될 수 있음을 알 수 있다.
<실시예 1> 세포 및 시약 준비
1-1. 인삼
HCT116 대장암 세포주는 한국 세포주 은행(Korea Cell Line Bank)에서 구입하였고 10% FBS(fetal bovine serum) 및 1% 페니실린(penicillin)/스트렙토마이신(streptomycin)을 포함하는 RPMI(Roswell Park Memorial Institute)-1649 배지(HyClone,USA)에 배양하였다. 시약 및 인삼 추출물은 FBS가 없는 상태에서 처리하였다. siRNA 실험을 위하여,  Werner syndrome gene (WRN)을 타겟하는 siRNA( 5'-UUCUUGUCACGUCCUCUG-3', 서열번호 1) 및 음성 대조군 siRNA(5'-UUCUCCGACGUGUCACGUdTdT-3', 서열번호 2)를 준비하였다.
1-2. 길경
인간 비소폐암세포주(non-small-cell lung cancer cell) A549 및 NCI-H460 를 10% FBS(fetal bovine serum) 및 1% 항생제를 포함하는 RPMI 21에 배양하였다. 도라지(Platycodon grandiflorum) 및 인삼 추출물은 공급 받았다(Dr. Young Pyo Jang, Kyung Hee University, Seoul, Korea). 보리노스타트(Vorinostat)는 Sigma Aldrich (#SML0061)에서 구입하였다.
<실시예 2> 유전자 발현 및 커넥티비티 맵(connectivity map)
2-1. 인삼
인삼 추출물이 처리된 세포에 대한 유전자 발현 프로파일을 확인하기 위하여, cDNA 마이크로어레이 데이터를 이용하였고(Kwon et al., 2013, 16, 30.), 상기 데이터를 바탕으로 CMAP analysis (http://www.broad.mit.edu/cmap/)를 수행하였다. 80개의 상향 조절된 유전자(upregulated genes) 및 29개의 하향 조절된 유전자(downregulated genes)는 인삼의 효능에 대한 새로운 메카니즘을 밝히기 위한 인풋 데이터로 이용되었다. 통계적으로 유의미한 상위 랭킹된 20개의 화합물을 선택하고 중복 리스트를 체크하여 확인하였다.
<실시예 3>  인삼의 국소이성질화효소(Topoisomerase) I 활성 확인
국소이성질화효소 I 활성을 확인하기 위하여, 분석 키트(TG1018-1; Topogen, USA)를 제조사 메뉴얼에 따라 수행하여 확인하였다. 구체적으로, 2 μL의 10×국소이성질화효소 I 반응 완충액 및 200 ng의 수퍼코일 및 리랙스트(supercoiled and relaxed) plasmid DNA(예컨대, 10 μL of 20 μg/mL stock solution)을 각 튜브에 옮겨 담았다. 그 후, 인삼 추출물을 각 농도(50, 500, and 5000 μg/mL)별로 추가하였다. 5 U/mL 정제된 국소이성질화효소 I 효소를 추가하고, 각 튜브는 37도에서 30분 동안 배양하였다. 각 샘플은 1%의 아가로스 겔에 로딩하였다.
<실시예 4> 웨스턴 블랏 분석
4-1. 인삼
캠프토더신(camptothecin) 및 인삼이 처리된 세포를 150 mM NaCl,20 mM Tris-HCl [pH 7.5], 1 mM EGTA, 1% NP-40, 1% 디옥시콜린산나트륨(sodium deoxycholate), 1 mM EDTA 및 포스파타아제(phosphatase) 억제제를 포함하는 버퍼로 용해되었다. 상기 용해물은 면역블로팅으로 분석하였다. 단백질 발현은 DNA damage antibody sampler kit (#9947, Cell Signaling Technology, USA)를 이용하여 수행되었고, 항체는 anti-phospho-Chk1 Ser 345 (#2348; Cell Signaling Technology), anti-phospho-Chk2 Thr 68 (#2197; Cell Signaling Technology), anti-phospho- Histone H2A.X Ser 139 (#9718; Cell Signaling Technology), anti-phospho-p53 Ser 15(#9286; Cell Signaling Technology) 및 anti-β-actin (A5441; Sigma-Aldrich, USA)을 이용하였다.
4-2. 길경
추출물이 처리된 A549 세포를 수득하고 RIPA 용해 버퍼[150 mM NaCl, 20mM Tris-HCl (pH 7.5), 1 mM EGTA, 1% NP-40, 1% 디옥시콜린산나트륨, 1 mM EDTA 및 포스파타아제(phosphatase) 억제제]를 처리하여 용해하였다. 추출된 단백질은 다음과 같은 항체를 이용하여 SDS-PAGE를 수행하였다: p21 antibody (Santa Cruz Biotechnology, #sc-53870), p53 antibody(Santa Cruz Biotechnology, #sc-126), and β-actin antibody (Sigma-Aldrich, #A5441).
<실시예 5> MTT 분석
5-1. 인삼
세포 생존력 측정은 3-(4,5-dimethylthiazol-2-yl)-2,5-diphenyltetrazolium bromide assay (MTT; Promega, Ltd, USA.)를 이용하여 제조사의 프로토콜에 따라 수행하였다. 구체적으로, 세포를 96-웰 플레이트에 5×103세포 농도로 웰 당 접종하였다. 접종 후, 세포를 5 mg/mL MTT로 4시간 동안 배양하였다. 배지를 제거하고 150 μL 가용화 용액 및 정지 용액을 첨가한 후, 37도에서 4시간 동안 배양하였고, 반응액의 흡광도는 570 nm에서 측정하였다.
5-2. 길경
NCI-H460 세포의 세포 생존률을 평가하기 위하여, 96-웰 플레이트 당 5 × 103로 세포를 접종하였다. 세포는 vehicle, 보리노스타트(Vorinostat) 및 각 추출물을 24시간 동안 처리하고, 5 mg/ml MTT [3-(4,5-dimethylthiazol-2-yl)-2,5- diphenyltetrazolium bromide)]로 배양하였다. 4시간 후, 배양 배지를 제거하고, 150 μl의 DMSO를 세포에 첨가하여 포르마잔 생성물에 용해시켰다. MTT 착색 용액의 흡광도는 마이크로 플레이트 판독기를 이용하여 570 nm로 측정하였다.
<실시예 6> 길경 HDAC 활성 분석
NCI-H460 세포를  10-cm2 페트리디쉬에 70% 컨플루언스(confluence)로 접종하였고, 4시간 동안 추출물을 각 세포에 처리하였다. HDAC 활성 발색 분석 키트(BioVision, #K331)를 이용하여 HDAC 활성을 분석하였다. 핵산 추출물(50 μg)은 10 μl HDAC 분석 버퍼 및 5 μl HDAC 표색 기질로 37도, 1시간 조건으로 배양하였다. 그 후, 세포에 10 μl 라이신 중화제를 첨가하고 37도, 30분 조건으로 반응이 종료될때까지 배양하였다. 흡광도는 마이크로 플레이트 판독기를 이용하여 405 nm로 측정하였다.
<실시예 7> 길경 TUNEL 분석
A549 세포는 vehicle, 보리노스타트(Vorinostat) 및 각 추출물로 24시간 동안 처리하였다. 처리 후, 4% PFA (paraformaldehyde)로 고정하였고 0.1% Triton X-100로 투과시켰다. 손상된 세포는 In Situ Cell Death Detection Kit (Roche, #12 156 792 910)를 이용하여 염색하고 공 초점 현미경으로 분석하였다.

Claims (13)

  1. 적어도 하나의 프로세서를 포함하는 전자 디바이스에서 수행되는 방법으로서:
    상기 적어도 하나의 프로세서가, 제 1 물질에 의해 야기되는 제 1 유전자 발현 패턴을 결정하는 단계;
    상기 적어도 하나의 프로세서가, 유전체 수준의 전사 발현 데이터(genome-wide transcriptional expression data) 에 기초하여, 상기 제 1 유전자 발현 패턴에 대응하는 제 2 유전자 발현 패턴을 야기하는 제 2 물질을 식별하는 단계; 및
    상기 적어도 하나의 프로세서가, 상기 제 2 물질의 용도에 기초하여 상기 제 1 물질의 용도를 출력하는 단계를 포함하는, 의약 용도 예측 방법.
  2. 제 1 항에 있어서,
    상기 유전체 수준의 전사 발현 데이터는 실험 데이터에 기초하여 업데이트되는, 의약 용도 예측 방법.
  3. 제 1 항에 있어서,
    상기 제 1 물질은 식물 추출물이고, 상기 제 2 물질은 용도가 알려진 화합물인, 의약 용도 예측 방법.
  4. 제 1 항에 있어서,
    상기 유전체 수준의 전사 발현 데이터는 Connectivity Map (CMAP) 을 포함하는, 의약 용도 예측 방법.
  5. 제 1 항에 있어서,
    상기 제 1 유전자 발현 패턴은, 대상체에 상기 제 1 물질을 투여함으로써 차등적으로 발현되는 유전자 (differentially expressed genes;DEG) 를 통해 결정되는, 의약 용도 예측 방법.
  6. 제 5 항에 있어서,
    상기 DEG 는 상기 대상체에 상기 제 1 물질을 투여함으로써, 미리 결정된 기준 이상 상향 조정된 (upregulated) 유전자를 포함하는, 의약 용도 예측 방법.
  7. 제 5 항에 있어서,
    상기 DEG 는 상기 대상체에 상기 제 1 물질을 투여함으로써, 미리 결정된 기준 이상 하향 조정된 (downregulated) 유전자를 포함하는, 의약 용도 예측 방법.
  8. 제 1 항에 있어서,
    상기 제 2 유전자 발현 패턴은, 복수의 제 2 유전자 발현 패턴들 중 상기 제 1 유전자 발현 패턴과 동일하거나 가장 유사한, 의약 용도 예측 방법.
  9. 제 1 항에 있어서,
    상기 제 2 물질을 식별하는 단계는,
    미리 결정된 기준에 기초하여, 상기 제 1 유전자 발현 패턴에 대응하는 복수의 제 2 유전자 발현 패턴들 각각을 야기하는 복수의 제 2 물질들을 식별하는 단계를 포함하고,
    상기 제 1 물질의 상기 용도를 출력하는 단계는,
    상기 복수의 제 2 물질들 간에 가장 많이 공통되는 용도에 기초하여, 상기 제 1 물질의 상기 용도를 출력하는 단계를 포함하는, 의약 용도 예측 방법.
  10. 제 1 항에 있어서,
    상기 유전체 수준의 전사 발현 데이터는 Connectivity Map (CMAP) 을 포함하고, 상기 제 2 유전자 발현 패턴은 상기 CMAP 상에서 상기 제 1 유전자 발현 패턴과 중첩되는 영역을, 복수의 제 2 유전자 발현 패턴들 중에서 가장 많이 포함하는, 의약 용도 예측 방법.
  11. 하드웨어와 결합하여 제 1 항 내지 제 10 항 중 어느 한 항의상기 방법을 실행시키기 위해 매체에 저장되는 의약 용도 예측 컴퓨터 프로그램.
  12. 제 1 항 내지 제 10 항 중 어느 한 항의 상기 방법을 컴퓨터에서 실행하기 위한 의약 용도 예측 프로그램이 수록된 컴퓨터 판독가능 기록매체.
  13. 인스트럭션들을 저장하는 메모리; 및
    상기 인스트럭션들을 실행하여:
    제 1 물질에 의해 야기되는 제 1 유전자 발현 패턴을 결정하고,
    상기 적어도 하나의 프로세서가, 유전체 수준의 전사 발현 데이터(genome-wide transcriptional expression data) 에 기초하여, 상기 제 1 유전자 발현 패턴에 대응하는 제 2 유전자 발현 패턴을 야기하는 제 2 물질을 식별하고,
    상기 적어도 하나의 프로세서가, 상기 제 2 물질의 용도에 기초하여 상기 제 1 물질의 용도를 출력하도록 구성된 적어도 하나의 프로세서를 포함하는 의약 용도 예측 디바이스.
PCT/KR2020/006630 2019-05-24 2020-05-21 물질의 의약용도 또는 생물학적 메카니즘 예측 방법 및 장치 WO2020242130A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2019-0061339 2019-05-24
KR1020190061339A KR102331324B1 (ko) 2019-05-24 2019-05-24 식물 추출물의 의약용도 또는 생물학적 메카니즘 예측 방법 및 장치

Publications (1)

Publication Number Publication Date
WO2020242130A1 true WO2020242130A1 (ko) 2020-12-03

Family

ID=73552899

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2020/006630 WO2020242130A1 (ko) 2019-05-24 2020-05-21 물질의 의약용도 또는 생물학적 메카니즘 예측 방법 및 장치

Country Status (2)

Country Link
KR (1) KR102331324B1 (ko)
WO (1) WO2020242130A1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100234236A1 (en) * 2007-11-30 2010-09-16 Pharnext Novel Disease Treatment by Predicting Drug Association
US20120296090A1 (en) * 2011-04-04 2012-11-22 The Methodist Hospital Research Institute Drug Repositioning Methods For Targeting Breast Tumor Initiating Cells
WO2018160925A1 (en) * 2017-03-02 2018-09-07 President And Fellows Of Harvard College Methods and systems for predicting treatment responses in subjects
KR20190000168A (ko) * 2017-06-22 2019-01-02 한국과학기술원 질병 연관 세포기능에 연결된 마커 기반으로 멀티마커 패널을 선정하는 시스템 및 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100234236A1 (en) * 2007-11-30 2010-09-16 Pharnext Novel Disease Treatment by Predicting Drug Association
US20120296090A1 (en) * 2011-04-04 2012-11-22 The Methodist Hospital Research Institute Drug Repositioning Methods For Targeting Breast Tumor Initiating Cells
WO2018160925A1 (en) * 2017-03-02 2018-09-07 President And Fellows Of Harvard College Methods and systems for predicting treatment responses in subjects
KR20190000168A (ko) * 2017-06-22 2019-01-02 한국과학기술원 질병 연관 세포기능에 연결된 마커 기반으로 멀티마커 패널을 선정하는 시스템 및 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BYUN, M. R. ET AL.: "Repurposing natural products as novel HDAC inhibitors by comparative analysis of gene expression profiles", PHYTOMEDICINE, vol. 59, no. 152900, 22 March 2019 (2019-03-22), pages 1 - 7 *
DONNER, Y . ET AL.: "Drug repurposing using deep embeddings of gene expression profiles", MOLECULAR PHARMACEUTICS, vol. 15, 2018, pages 4314 - 4325, XP055769831 *

Also Published As

Publication number Publication date
KR20200135004A (ko) 2020-12-02
KR102331324B1 (ko) 2021-11-26

Similar Documents

Publication Publication Date Title
Mahmud et al. Bioinformatics and system biology approach to identify the influences of SARS-CoV-2 infections to idiopathic pulmonary fibrosis and chronic obstructive pulmonary disease patients
Novakovic et al. β-Glucan reverses the epigenetic state of LPS-induced immunological tolerance
US6849403B1 (en) Apparatus and method for drug screening
Zhang et al. KIAA0101 is a novel transcriptional target of FoxM1 and is involved in the regulation of hepatocellular carcinoma microvascular invasion by regulating epithelial-mesenchymal transition
Li et al. Defining disease-related modules based on weighted miRNA synergistic network
Yin et al. CENPL, ISG20L2, LSM4, MRPL3 are four novel hub genes and may serve as diagnostic and prognostic markers in breast cancer
Xie et al. Comparisons of gene expression in normal, lesional, and non‐lesional psoriatic skin using DNA microarray techniques
Luzwick et al. MRE11-dependent instability in mitochondrial DNA fork protection activates a cGAS immune signaling pathway
Zhang et al. Nuclear lamina erosion-induced resurrection of endogenous retroviruses underlies neuronal aging
Jaffe Postmortem human brain genomics in neuropsychiatric disorders—how far can we go?
Nacif-Pimenta et al. Differential responses of epithelial cells from urinary and biliary tract to eggs of Schistosoma haematobium and S. mansoni
Song et al. Integrative transcriptome-wide analysis of atopic dermatitis for drug repositioning
WO2020242130A1 (ko) 물질의 의약용도 또는 생물학적 메카니즘 예측 방법 및 장치
Zhang et al. Identification of critical genes and molecular pathways in COVID-19 myocarditis and constructing gene regulatory networks by bioinformatic analysis
Gersten et al. An integrated systems analysis implicates EGR1 downregulation in simian immunodeficiency virus encephalitis-induced neural dysfunction
Gordon et al. Evaluating whole-genome expression differences in idiopathic and diabetic adhesive capsulitis
Ferenczy et al. Clonal immortalized human glial cell lines support varying levels of JC virus infection due to differences in cellular gene expression
Fuzo et al. The turning point of COVID‐19 severity is associated with a unique circulating neutrophil gene signature
Qiu et al. Identification of differentially expressed genes and pathways crosstalk analysis in Rheumatoid and Osteoarthritis using next-generation sequencing and protein-protein networks
Rizk et al. In vivo antibabesial activity and bioinformatic analysis of compounds derived from the medicines for malaria venture box against Babesia microti
Hamzeloo-Moghadam et al. Side effects of omeprazole: a system biology study
Li et al. Total flavones from Sceptridium ternatum alleviate pulmonary hypertension through inhibiting the proliferation of vascular endothelial cells
WO2018105921A2 (ko) 지방간의 진단 또는 치료를 위한 류신 지퍼 단백질의 용도
Liedtke et al. Correlated expression analysis of genes implicated in schizophrenia: identification of putative disease-related pathways
WO2023177275A1 (ko) 세포외소포 내 mirna를 포함하는 혈액응고장애 진단용 바이오 마커 조성물

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20813836

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20813836

Country of ref document: EP

Kind code of ref document: A1