WO2020162613A1 - mRNA前駆体の解析方法、情報処理装置、コンピュータプログラム - Google Patents

mRNA前駆体の解析方法、情報処理装置、コンピュータプログラム Download PDF

Info

Publication number
WO2020162613A1
WO2020162613A1 PCT/JP2020/004901 JP2020004901W WO2020162613A1 WO 2020162613 A1 WO2020162613 A1 WO 2020162613A1 JP 2020004901 W JP2020004901 W JP 2020004901W WO 2020162613 A1 WO2020162613 A1 WO 2020162613A1
Authority
WO
WIPO (PCT)
Prior art keywords
splicing
gene
pattern
splicing pattern
information
Prior art date
Application number
PCT/JP2020/004901
Other languages
English (en)
French (fr)
Inventor
典弘 岡田
亨 杉野
Original Assignee
株式会社Zenick
典弘 岡田
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2019217279A external-priority patent/JP6931860B2/ja
Application filed by 株式会社Zenick, 典弘 岡田 filed Critical 株式会社Zenick
Priority to US17/428,807 priority Critical patent/US20220073971A1/en
Priority to EP20752573.4A priority patent/EP3922730A4/en
Publication of WO2020162613A1 publication Critical patent/WO2020162613A1/ja

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression

Definitions

  • the present invention relates to a technique for analyzing biological information, for example, a technique for analyzing a human body condition through analysis of mRNA in a eukaryote, or a technique for analyzing a human body condition through analysis of genes.
  • Patent Document 1 discloses a method for analyzing the relationship between genetic abnormalities and diseases.
  • mutations occurring in the coding region and disorders in transcription/translation process are known.
  • the cell nucleus of a eukaryote has all the genetic information in DNA.
  • Individual genes are transcribed as required to produce mRNA precursors.
  • the mRNA precursor serves as a basis for a blueprint of a protein produced in the body, and includes an exon that is a portion having information on protein synthesis and an intron existing between the exons.
  • introns are essentially unnecessary, exons are joined together after being removed by splicing, which is a molecular editing work, and as a result, mRNA (mature mRNA), which is a blueprint for proteins made in the body, is generated. Complete. This mRNA is transported to the cytoplasm and translated to produce a protein. It is said that if there is any abnormality in splicing, the intron is not sufficiently removed, and a condition unfavorable to eukaryotes, such as aging or disease, tends to occur.
  • Splicing regulators are involved in splicing of mRNA precursors.
  • various types of splicing regulators and there are individual differences among eukaryotes. Therefore, it is difficult to rapidly analyze the mRNA status in each eukaryote, and there is no disclosure in the cited document 1.
  • the present invention has been made under the above background, and its main object is to provide a technique for analyzing a biological state by analyzing a biological signal or mRNA or DNA.
  • Another object of the present invention is to provide a technique for easily analyzing the state of mRNA and facilitating the suggestion of countermeasures when the state is unfavorable.
  • One form for solving the above-mentioned problem is a gene different from the first splicing pattern for deriving a reference gene expression pattern by quantitatively analyzing the removal state of an intron in a eukaryotic mRNA precursor. Detecting the presence or absence of a second splicing pattern that may lead to an expression pattern, and when there is the second splicing pattern, it is pharmaceutically acceptable to bring the second splicing pattern closer to the first splicing pattern. It is a method for analyzing an mRNA precursor, characterized in that the substance information is specified from a substance list created in advance, and the specified information is output as information unique to the eukaryote.
  • the present invention it is possible to provide a technique for analyzing a biological state by analyzing a biological signal or mRNA or DNA. It is also possible to easily analyze the state of eukaryotic mRNA, and to facilitate the proposal of countermeasures when it is in an unfavorable state.
  • the functional block block diagram of an information processing apparatus Explanatory drawing of the processing procedure of the analysis method performed with an information processing apparatus.
  • (A)-(c) is explanatory drawing of SE splicing pattern in a Ptbp1 gene.
  • (A) to (D) are graphs showing the measurement results of intron characteristics.
  • Embodiments of the present invention will be described below with reference to the drawings.
  • the inventors of the present invention analyzed the mRNA in eukaryotes and took measures for improvement when the mRNA state was unfavorable (for example, when the mRNA state showed aging or other undesirable biological condition) (unwanted condition such as aging). The recovery of the living body from the) was performed.
  • the outline and the result thereof will be described.
  • the present invention is not limited to aging and can be widely applied to other living body conditions or human body conditions, such as the non-illness condition described in the second embodiment.
  • a model mouse of aging called klotho mouse and a wild type mouse as a comparative example were used.
  • the Klotho mouse is also called a human premature aging syndrome mouse, and senescence advances earlier than the wild mouse.
  • the lifespan of Klotho mice is about 60 days on average, and since experiments can be performed in a shorter period than wild mice, they are used in various experiments as a substitute for humans. When it is not necessary to distinguish these mice, they are called "subjects”. Further, as an example of measures for changing and recovering the state of mRNA unfavorable to eukaryotes in the subject, the subject was made to ingest a pharmaceutically acceptable substance.
  • Pharmaceutically acceptable substances are substances that do not cause excessive toxicity, irritation, anaphylaxis, immunogenicity, or any other problem or complication to humans or mice.
  • Such substances include not only substances themselves that can be ingested by humans and mice, but also liquid substances obtained by dissolving the substances in liquids, substances that can be ingested as a preparation, and the like.
  • traditional Chinese medicine, Kampo medicine was used as an example. Chinese herbs are believed to exert clinical effects through the synergistic effects that occur with the combination of thousands of chemical substances contained in many herbal ingredients. However, no studies have been known that elucidate the mechanism of action of Kampo medicines from the viewpoint of molecular biology.
  • the inventors of the present invention ingested Chinese herbs in a subject and verified the effect on splicing in the organ of the subject by known RNA-seq analysis. Specifically, after ingesting a Chinese herbal medicine to a subject, the difference in splicing including the intron removal state in the mRNA precursor of the subject was analyzed. By this analysis, for example, the effect of the ingested substance on the subject was examined with respect to the mRNA in which a splicing pattern (senescence-type splicing pattern) for deriving a gene expression pattern related to aging is generated.
  • a splicing pattern senescence-type splicing pattern
  • the splicing pattern is not limited to the aging type, and a splicing pattern which is a splicing pattern for deriving a gene expression pattern related to a non-disease state described later can be used as a non-disease type splicing pattern. Can also be applied.
  • genes that change the splicing pattern in a subject due to the intake of Chinese herbs There are two types of genes that change the splicing pattern in a subject due to the intake of Chinese herbs.
  • One is a gene of a factor directly or concomitantly associated with splicing, and at present, a group including 21 genes is known.
  • the other is genes related to organ mitochondria, lipid and sugar metabolism. At present, a group containing about 350 genes is known.
  • the former gene controls the latter gene group through the regulation of splicing, and is therefore referred to as "driver gene” or "upstream gene”.
  • the latter gene group is referred to as a “target gene (target gene)” or a “downstream gene” with respect to an “upstream gene”.
  • an upstream gene gradually changes its splicing pattern into an aging type as it ages, and the splicing pattern of its downstream gene inevitably ages. Therefore, it is desirable that the gene whose splicing pattern is changed is an upstream gene.
  • a state before aging in a subject is referred to as a “health state” as an example of a state before an unfavorable state occurs.
  • a gene or splicing pattern in an aged state is referred to as "aging type”
  • a gene or splicing pattern in a healthy state is referred to as "healthy type”.
  • FIG. 1 is an explanatory diagram of alternative splicing that causes various splicing patterns.
  • Alternative splicing is the process of joining exons in six patterns by the aforementioned splicing regulator.
  • FIG. 1 shows constantly used exons (Constitutive exons), selectively spliced exons, and introns that should originally be removed.
  • the Normal pattern shown at the top of FIG. 1 there is an intron between the first constitutive exon and the second constitutive exon, and the intron also exists between the second constitutive exon and the third constitutive exon. Exists. In the Normal pattern, these two introns are removed and three constitutive exons are connected. This state is the most common splicing pattern.
  • the mRNA to which the first constitutive exon, the first Alternatively spliced exon and the second constitutive exon were connected, and the first constitutive exon, the second Alternatively spliced exon and the second constitutive exon were connected were connected. Two mRNAs with the connected mRNA are produced.
  • RNA-seq analysis how the alternative splicing in the mRNA precursor is performed was analyzed by the known RNA-seq method (RNA-seq analysis).
  • the splicing analysis can be performed using "rMATS", which is software well known in the bioinformatics industry.
  • the rMATS can also be operated as a visualization means that draws the detection result for display using a known R language.
  • the R language is a programming language for statistical analysis of open source free software and its development and execution environment, and can be easily utilized according to the purpose of use.
  • IJC intron inclusion junction
  • SJC Exon junction after splicing of mRNA precursor, intron removed junction between exons
  • Figure 2 shows a conceptual diagram of IJC and SJC.
  • the lower part of FIG. 2 shows that the intron is completely removed and exons are bound to each other. This state is the normal pattern at the top of FIG. 1, and is in a healthy state.
  • removal of introns in splicing becomes insufficient and IJC in mRNA increases while SJC decreases in healthy subjects. This is caused by the portion extending over the exon region and the intron region in FIG. Since these parts are not recognized as introns, they are not removed and consequently remain in the mRNA.
  • log 2 IJC/SJC is calculated as an index showing how much intron is removed in the alternative splicing. This is an index (fold change) that shows how many IJCs are relative to SJCs. This value is the value obtained by taking the log based on 2 (log 2 IJC and log 2 SJC) and subtracting from the above IJC and SJC values. This value is an index of the degree of intron retention at the boundary between exons and introns.
  • log 2 IJC/SJC is increased as compared with the control. This value can be used as an index of aging.
  • Test Example 1 In Test Example 1, the effect on selective splicing (splicing pattern obtained thereby) when a test subject was ingested Juzentaihoto was analyzed based on sample data acquired from the test subject.
  • Juzentaihoto is a mixture of ten kinds of crude drugs, and is considered to be a Chinese herbal medicine prescribed for loss of appetite, fatigue and physical fitness after illness.
  • Juzentaihoto "Tsumura Juzentaihoto extract granules (medical use)" manufactured by Tsumura Co., Ltd. was used.
  • the components are as follows. In addition, the number in each component shows a weight ratio (relative ratio of weight). Astragalus 3.0 Carrot 3.0 Keihi 3.0 Toki 3.0 River Kyu (Senkyu) 3.0 Peony 3.0 Jukujio 3.0 Soujutsu 3.0 Bukuryo 3.0 Licorice 1.5
  • Group 1 5 Klotho mice were fed normal for 3.5 weeks followed by 3.5 weeks of supplementary feeding. Second group: 5 Klotho mice were normally fed for 3.5 weeks and then for 3.5 weeks thereafter.
  • Group 3 Five wild mice were fed normal for 3.5 weeks, followed by the supplemented feeding used in group 1 for 3.5 weeks.
  • Group 4 5 wild mice were fed normal for 4 weeks and then for 4 weeks thereafter.
  • the subjects of the above first to fourth groups are bred in the same environment, and after the breeding period is completed, sample data of each organ of the liver, kidney and heart and analysis data of blood are obtained from each subject, and each sample data is obtained.
  • RNA-seq analysis was performed on the above to detect the splicing pattern (gene expression level).
  • the splicing pattern gene expression level
  • the mRNA precursor of 702 genes was detected in comparison between the Klotho mice of the first group supplemented and fed and the Klotho mice of the second group fed normally. It was confirmed that the splicing pattern resulting from the alternative splicing was changed. Of the 702 changed genes, 27 genes are upstream genes of splicing and dominate many downstream genes.
  • the Sirt7 gene is known to prevent fatty liver by suppressing myc activity and ER stress (Cell reports, 2013).
  • the Sirt7 gene is known to regulate hepatic fatty acid metabolism via the ubiquitin proteome (Cell Metabol. 2014).
  • 3(a) to 3(c) are explanatory views of intron retention in the Sirt7 gene.
  • the uppermost graph is a graph quantifying introns and exons in the liver of the first group, that is, Klotho mice (abbreviated as KL+) fed with Juzentaihoto.
  • the horizontal axis represents the gene sequence, and the vertical axis represents the Read value. The same applies to graphs representing other introns and exons.
  • E1, E2, and E3 represent exons
  • I1 and I2 represent introns.
  • the value of the vertical axis for intron I1 is smaller than the value of the vertical axis for exons E1, E2, and E3, and it is possible to distinguish between exons and introns quantitatively and visually in the figures. is there.
  • the value of the vertical axis of the intron I2 is almost 0, which is clearly distinguishable from the exons E1, E2, and E3.
  • the second graph in Fig. 3(a) shows introns and exons in the genes of the liver of the second group of Klotho mice (abbreviated as KL-).
  • KL- the second group of Klotho mice
  • the value on the vertical axis of intron I1 is generally higher than the value of intron I1 at KL+.
  • both the intron I1 and the exon E2 show a downward sloping tendency, making it difficult to distinguish between the two.
  • the uppermost graph in Fig. 3(a) is the KL+ pattern, and the effect of adding Juzentaihoto was investigated.
  • the value on the vertical axis of the intron I1 is smaller than the value on the vertical axis of the exons E1 and E2, and similarly to the graph at the bottom, there are exons and introns in the pattern of KL+. Can be clearly distinguished.
  • FIG. 3( b) shows the IJC read value (KL+_IJC) and the SJC read value (KL+_SJC) in the Klotho mice that continued to be fed with supplements.
  • FIG. 3( b) is a read value of IJC (KL-_IJC) and a read value of SJC value (KL-_SJC) in a Klotho mouse only fed normally, and a read value of IJC in a wild mouse only fed normally.
  • the value (WT-_IJC) and the read value (WT-_SJC) of the SJC value are shown.
  • p indicates a p-value (significance probability), and FDR indicates a false discovery rate.
  • the p value was 0.0050 and the FDR was 0.0978.
  • FIG. 3(c) shows Fold Change values for Klotho mice KL+, KL ⁇ and wild mouse WT ⁇ .
  • the fold change value on the vertical axis shows the value of log 2 IJC/SJC value.
  • the distribution of Fold Change values in the Klotho mouse KL+ which continued to be fed with feed was small as in the wild mouse WT ⁇ .
  • the Fold Change value of the Klotho mouse KL ⁇ only fed normally is about four times that of the Klotho mouse KL+ and the wild mouse WT ⁇ . Therefore, the gene aging of the Klotho mouse KL+, which has been continuously fed with supplementation, is suppressed as compared with the Klotho mouse KL-.
  • the Cyp27a1 gene shown in FIGS. 4(a)-(c) is a member of the cytochrome P450 superfamily of enzymes.
  • the Cyp27a1 gene is a monooxygenase that catalyzes many reactions involved in drug metabolism and the synthesis of cholesterol, steroids and other lipids, and oxidizes cholesterol intermediates as part of the bile synthesis pathway.
  • 5(a) to 5(c) are explanatory diagrams of intron retention in the Ppard gene.
  • the Ppard gene a member of the peroxisome proliferator-activated receptor (PPAR) family, regulates the peroxisomal beta-oxidation pathway of fatty acids.
  • PPAR peroxisome proliferator-activated receptor
  • 6(a) to 6(c) are explanatory diagrams of intron retention in the Acadm gene.
  • the Acadm gene encodes a medium-chain-specific acyl-coenzyme A dehydrogenase and catalyzes an early step in the mitochondrial fatty acid beta oxidation pathway. This deficiency in the Acadm gene causes a disease causing infant death characterized by medium-chain acyl-CoA dehydrogenase deficiency, liver dysfunction, fasting hypoglycemia, and encephalopathy.
  • the splicing is normally maintained to suppress the progress of senescence, and the splicing is performed similarly to the normal wild-type mouse. Is supported.
  • FIG. 7(a) to 7(c) are explanatory diagrams of intron retention in the Decr2 gene.
  • the Decr2 gene is a beta-oxidative coenzyme and is involved in the degradation of unsaturated fatty acid enoyl-CoA esters with double bonds at both even and odd positions of the peroxisome.
  • the splicing is normally maintained to suppress the progress of senescence, and the splicing is performed similarly to the normal wild-type mouse. That is supported.
  • Test Example 2 In Test Example 1, with respect to the Cyp27a1 gene and the like, the effect of continuing addition feeding on splicing was analyzed. In Test Example 2, further, as a result of intensive analysis of the driver gene, the effect of Juzentaihoto was examined for the loci where alternative splicing was not correctly performed. Specifically, in Test Example 2, out of the 368 loci (Liver 368 loci) in the liver gene, the 20 locus, which is the upstream gene, was examined for whether or not splicing was normally performed. FIG. 9 shows an explanatory diagram of the upstream gene of the liver of the subject. Driver Gene in the figure indicates an upstream gene.
  • upstream gene shows a dominant behavior with respect to many downstream genes, if the splicing is not normally performed, the downstream gene will not be normally spliced.
  • the upstream genes (Driver Gene) Aqr, Ddx39, Ddx5, Fmr1, Hnrnpa2b1, Kdm4b, Luc7l2, Mbnl1, Nxf1, Prpf38b, Ptbp1, Rnps1, Sf3b1, Son(2), Srrm1, Srsf11, Srsf5, Srsf6 shown in FIG.
  • Test Example 2 it was also verified whether the splicing pattern was restored in the downstream genes of the upstream genes that were found to be recovered, as in Test Example 1. As a result, it was confirmed that the splicing pattern was changed in many downstream genes, that is, the aging type was changed to the healthy type. Since the upstream gene shows a dominant behavior with respect to the downstream gene, it is considered that the restoration of the splicing pattern in the upstream gene also restored the splicing pattern in many of the downstream genes.
  • the sample data including the data of the mRNA precursor of the sample is acquired from the sample, and the data of FIGS. 3(a), (b), (c) to FIG.
  • the intron removal state in the mRNA precursor was analyzed with respect to the acquired sample data.
  • the intron remains large after splicing.
  • Test Examples 1 and 2 it was confirmed that the splicing pattern of 702 genes was changed in association with senescence of Klotho mice, and 27 of the 702 genes were upstream genes. Then, it was confirmed that the liver had an effect of recovering the splicing pattern at the 19 loci by feeding Juzen-taiho-to.
  • different types of aging such as Alzheimer-type aging and other diseases, can result in changes in different upstream genes. Therefore, by examining IJC and/or SJC in splicing in more detail to analyze changes in splicing patterns in mRNA precursors of individual genes, not only aging but also changes in health status, such as disease, It would be possible to identify in which gene the splicing pattern is altered.
  • the results of this experiment can be similarly applied to humans who are also eukaryotes. That is, when humans take Juzentaihoto, the splicing pattern in the liver can be restored from the aging type to the healthy type.
  • a solid such as powder, a liquid obtained by dissolving the substance in a liquid, or a solid obtained by solidifying the substance, which can be taken as a preparation, is used.
  • FIG. 10 is a hardware configuration diagram of the information processing device 10 according to the present embodiment.
  • the information providing device 10 includes a CPU (Central Processing Unit) 11, a ROM (Read Only Memory) 12, a RAM (Random Access Memory) 13, which is a computer, a storage 14, and an input I/F (I/F is an interface). (Omitted) (1) 15, input I/F (2) 16, output I/F 17, and communication I/F 18.
  • CPU Central Processing Unit
  • ROM Read Only Memory
  • RAM Random Access Memory
  • the CPU 11 controls the overall operation of the information processing device 10 by executing a computer program stored in the ROM 12 using the RAM 13 as a work area.
  • the storage 14 is a large-capacity storage device such as an HDD (Hard Disk Drive) and an SSD (Solid State Drive).
  • the storage 14 stores a computer program and data necessary for its execution, and also provides an area for storing various databases (abbreviated as DB) described later.
  • DB databases
  • Input devices such as a keyboard, a mouse, and a touch panel are connected to the input I/F (2) 16.
  • Output devices such as a display, a printer, a speaker, and an external storage device are connected to the output I/F 17.
  • the communication I/F 18 is connected to a communication network such as the Internet.
  • the information providing apparatus 10 executes various computer programs stored in the storage 14 by the CPU 11 to analyze various mRNA precursors of a subject (human) and facilitate various functions of precision medicine. Realize blocks.
  • FIG. 11 shows an example of the configuration of these functional blocks.
  • the information providing device 10 includes a sample data acquisition unit 111, an analysis unit 112, a search unit 113, and an output unit 114. Moreover, it has a substance DB 1131 and an action DB 1132.
  • the substance DB 1131 is pharmaceutically acceptable for bringing a splicing pattern (second splicing pattern described later), which is known to change in advance, into a splicing pattern before the change (first splicing pattern described below). It is a DB that stores information on substances for each second splicing pattern.
  • the pharmaceutically acceptable substances are as described above in this experiment. This substance is usually an ingestible substance, but one ingestible substance is incompatible with another ingestible substance, and when one substance is searched for, Other substances can also be made readable. This makes it possible to obtain information such that the second splicing pattern approaches the first splicing pattern with one substance, but has the opposite effect with another substance.
  • the substance DB 1131 stores a list (substance list) in which the information of the above-mentioned substance for making the second splicing pattern frequently searched for close to the first splicing pattern is recorded. Therefore, when the second splicing pattern is listed, information on a pharmaceutically acceptable substance (information on the above-mentioned one substance and/or other substance) can be quickly searched.
  • action DB 1132 information on actions for bringing the second splicing pattern closer to the pre-change first splicing pattern, for example, after ingesting the substance specified in the substance DB 1131, resting for a predetermined time, or a characteristic Information on countermeasures such as exercising or relaxing by so-called non-ingestion (feeding) is stored using the second splicing pattern and the like as keywords.
  • the sample data acquisition unit 111 acquires sample data including data of mRNA precursor of the subject from the subject (human). You may make it acquire the sample data from each said subject with the identification information which identifies each living environment from the same subject placed in different living environments. In the latter case, by storing the identification information and associating it with the analysis result of the analysis unit 112 described later, the analysis result of mRNA for each living environment can be obtained.
  • the sample data is data obtained by analyzing blood collected from the subject with a sample data processing device, but is not limited to this, and analysis data of blood collected at a blood collecting institution or a hospital is used as a sample data processing device. You may get it through.
  • the sample data includes information indicating the internal condition of the subject and the state of cells.
  • the analysis unit 112 derives a predetermined gene expression pattern by quantitatively analyzing the removal state of introns in the mRNA precursor (result information of alternative splicing) with respect to the sample data acquired by the sample data acquisition unit 111.
  • the presence or absence of a second splicing pattern that may lead to a gene expression pattern different from the first splicing pattern is detected.
  • the “removed state” includes the state that should be removed originally, as described in the above-mentioned experiment. Quantitative means that the above state can be expressed by a numerical value or mass.
  • the presence or absence of the second splicing pattern in the upstream gene among the regulatory factors for splicing of the sample data acquired from the subject is detected.
  • the first splicing pattern is a splicing pattern to be compared when the mRNA precursor state of the subject is analyzed, and is obtained by analyzing a large number of sample data obtained from healthy humans about 20 years old, for example. Splicing pattern that derives the gene expression pattern of the gene. However, the above analysis is performed on sample data acquired multiple times from the same subject, and the result information of alternative splicing is accumulated in time series, and the true information that serves as a reference among the accumulated result information is stored.
  • the alternative splicing result information that derives the result information that is most similar to the alternative splicing result information by the nuclear organism (for example, the healthy human population described above) may be used as the first splicing pattern for the subject.
  • the first splicing pattern for the subject is stored in a predetermined area of the storage 14 and read out as appropriate.
  • the analysis unit 112 can be realized using the above-mentioned “rMATS” and R language. Therefore, the analysis unit 112 can also operate as a visualization unit that visualizes the result information of the alternative splicing.
  • the search unit 113 searches the substance DB 1131 for information on a pharmaceutically acceptable substance for bringing the second splicing pattern closer to the first splicing pattern. At that time, if the information about the action is stored in the action DB 1132, it is also searched for.
  • the output unit 114 outputs the retrieved information to the output device as information unique to the subject.
  • the output unit 114 can also output only the result information of the alternative splicing.
  • FIG. 12 shows a procedure example of processing executed in the information processing apparatus 10 configured as described above.
  • the information processing apparatus 10 first acquires the sample data of the subject (human) (S1).
  • the sample data is, for example, analysis data of blood collected from the subject.
  • the information processing device 10 analyzes the state of the mRNA precursor (S2). Specifically, quantitative analysis is performed as shown in FIGS. After that, the information processing device 10 determines whether or not there is a slicing pattern (second splicing pattern) that changes with respect to the reference splicing pattern (first splicing pattern) (S3). If there is (S3:Y), it is determined whether the changed splicing pattern is an upstream gene (S4).
  • chromatin components and epigenetic factors such as those associated with histone modifications and DNA methylation not only regulate transcription, but also splicing.
  • the chromatin component and epigenetic factors such as those related to histone modification and DNA methylation were used to determine whether the gene was aged, or the aged gene was Juzentaihoto. It is also possible to confirm whether or not the person has returned to a healthy type.
  • the DNA methylation is normalized. By detecting whether or not the gene is present, it can be known whether or not the gene has returned to the healthy type.
  • a further theoretical background that the DNA methylation and the like can be applied to know whether the gene is senescent type or healthy type will be explained.
  • the above-mentioned epigenetic factor affects the elongation rate of PolII, which in turn affects the splicing pattern.
  • canonical histone-depleted human cells exhibit the transcriptional and splicing changes often observed in senescent tissues. Histone depletion increases Pol II extension rate and causes exon exclusion, consistent with a "kinetic model" of cotranscriptional splicing.
  • epigenetic histone modification recent studies have shown that depletion of the specific demethylase of H3K4me3/2, KDM5B, results in reduced Pol II promoter occupancy, which in turn induces slow Pol II elongation and results in embryonic stem cell growth. It is shown to affect the expression of alternative splice exons in E. coli.
  • a kinetic model There are two models for controlling splice site selection, a kinetic model and a recruitment model, each of which involves the rate of transcription elongation.
  • alternative splicing is affected by affecting the rate of transcription elongation, the pace at which splice sites and regulatory sequences appear in nascent mRNAs during transcription.
  • faster elongation facilitates the use of stronger splice sites than weaker (upstream) splice sites, as stronger splice sites are available, resulting in the removal of exons.
  • slow elongation promotes recruitment of standard splicing factors to the weaker upstream splice site before the stronger downstream splice site can be synthesized, resulting in the inclusion of exons.
  • the decrease in MeCP2 level is associated with a delay in RNAPol II elongation at the genomic position that coincides with intron retention. Delayed Pol II elongation contributes to increased recruitment of the splicing repressor, leading to a further increase in intron retention. From these data, it can be said that the role responsible for the decrease of DNA methylation in promoting intron retention by linking the above two models can be said.
  • the upstream gene controls (controls) the splicing of the downstream gene, and by ingesting a substance such as Juzentaihoto, the upstream gene is returned from the aging type to the healthy type, and The upstream gene that has returned to the normal form restores the downstream gene that has changed to the aging type to the healthy type.
  • substances such as Juzen-taiho-to itself may directly act on downstream genes to restore the healthy form.
  • FIG. 13(a) to 13(c) are explanatory diagrams of the Skipped Exon (SE) splicing pattern shown in the second stage of FIG. 1 in the upstream gene Ptbp1 in Test Example 1.
  • Kl+ and Kl ⁇ in the figure are the same as KL+ and KL ⁇ in FIG. Represents a Klotho mouse.
  • other symbols such as WT are the same as those in FIG.
  • FIGS. 13(a) to 13(c) it is clearly shown from FIGS. 13(a) to 13(c) that not only intron retention but also in other splicing patterns, the recovery from the aging type to the healthy type of the splicing pattern occurs.
  • a second embodiment of the present invention will be described.
  • an example of analyzing the biological state of the human body will be described. That is, an example in which the state of the human body as the biological state is analyzed based on the measurement result of the measurement target will be described.
  • the measurement target include biosignals emitted from the body due to biological phenomena such as heartbeat, electroencephalogram, pulse, respiration, and sweating, but other targets can also be used.
  • the expression of a gene is taken as an example, and the biological state of the human body is analyzed using the concept of “unill”.
  • FIG. 14 shows an explanatory diagram of the concept of unillness.
  • the flow of time is shown by the direction of the arrow.
  • the direction from left to right in the figure represents the direction of passage of time.
  • the time point near the left end of the figure represented by T1 indicates a health condition
  • E1 indicates the start time point of a pre-disease due to a slight change in metabolism.
  • the term “undiseased” refers to a state in which an organism has undergone some abnormality due to a slight metabolic change or other factors, but its effect has not become apparent.
  • non-illness can be said to be a state between health and illness.
  • such a condition may be referred to as a “pre-disease condition”.
  • the unaffected state the disease is not diagnosed by existing criteria, but the risk of developing any disease is significantly higher. Further, as shown in the figure, it is shown that the disorder of homeostasis (homeostasis) increases with the passage of time.
  • T2 indicates a time point between the pre-disease start point E1 and the intron retention output point E2.
  • E2 an example of identifying a locus in which intron retention has appeared is shown, that is, intron retention does not appear in T2 between E1 and E2.
  • T3 in FIG. 14 represents the time point between the appearance of intron retention and the manifestation of protein expression changes
  • T4 represents the time point between the manifestation of protein expression changes and the appearance of pathological abnormal findings. Since the time points of T3 and T4 are both before the appearance of pathological findings, if the loci in which intron retention has appeared at any of these time points can be identified, pre-disease can be detected. In addition, by performing a corresponding treatment such as JTT administration according to the identified intron retention, it becomes possible to restore the human body from a non-diseased state to a healthy state before pathological abnormal findings appear.
  • DNB theory dynamic network biomarker theory
  • mice spontaneously developing metabolic syndrome were bred, and the expression levels of genes in adipose tissue were comprehensively measured every 3 weeks from 3 weeks to 7 weeks by a microarray method. ..
  • data analysis based on the DNB theory was performed to examine whether there was a time point of increased fluctuation within the measurement period, and as a result, at the time of 5 weeks before the mouse developed metabolic syndrome, 147 It was revealed that the fluctuation of the gene expression level was greatly increased.
  • the DNB theory quantitatively detects an undiseased state.
  • the approach of detecting the undiseased state by measuring intron retention in m-RNA is performed, and the undiseased state is returned to the normal state.
  • a state in which intron retention has occurred at a locus is defined as an undiseased state, and a locus in which intron retention has occurred is identified.
  • intron retention is recovered by taking measures such as JTT administration as in the first embodiment, and as a result, the undiseased state is returned to the healthy state.
  • intron retention was measured in Klotho mice in the same manner as in the first embodiment, and the characteristics of genes whose non-disease-type splicing patterns were recovered and genes which were not recovered were examined.
  • FIG. 8 70 “complete recovery” genes expressed in the liver, 120 “no recovery” genes, and all other genes (approximately 250,000). The characteristics of the intron of the gene locus) were measured. Graphs showing the results of measuring the intron characteristics of this gene are shown in FIGS. 15(A) to 15(D).
  • intron length indicates the length of the intron
  • the vertical axis indicates the common logarithmic value (log 10 (length)) of the intron length.
  • GC content indicates GC content (the ratio of guanine and cytosine among four bases in the DNA molecule, GC%).
  • 5' splice site strength indicates the strength of the 5'splice site. This intensity can be shown as a Splice site score on the vertical axis in the figure.
  • FIG. 15(D) the strength and score of the 3′ splice site are shown.
  • introns tend to be retained at loci with short intron length, high GC content, and low 5'splicing score.
  • the RI locus has a distinctive feature.
  • 15(A) to 15(D) are box plots of various data measured in relation to the intron.
  • (A) shows the intron length
  • (B) shows the GC percentage in the intron sequence
  • (C) shows the intensity score of the 5'splice site
  • (D) shows the intensity score of the 3'splice site.
  • FIGS. 15(A) to 15(D) show that there are three groups of introns, that is, “no recovery” (no recovery in the figure), “complete recovery” (complete recovery in the figure), and liver.
  • the comparison between all the introns from the expressed gene (254,005 locus) (All introns in the figure) is shown.
  • the test was performed by t-test. Significance level is *P ⁇ 0.05, ***P ⁇ 0.001, and ns indicates that it is not significant.
  • one gene usually contains 10 to 30 exons on average, and the human body contains about 20,000 to 30,000 genes. As described above, there are 400,000 to 600,000 kinds of exons in the human body, and it is very difficult to judge whether or not intron retention can occur in these exons.
  • exons that can cause intron retention can be narrowed down under the condition that the intron has a short intron length, a high GC content, and a weak 5'splice site as described above.
  • the disease-free test microarray is a custom test microarray that tests intron retention for at least some of the loci narrowed down as described above.
  • the pre-disease detection microarray includes a reference data storage unit that stores reference data in a healthy state for at least a part of the above-described narrowed down loci, a body fluid storage unit, and a locus information detection unit. , And an analysis unit.
  • body fluid such as blood collected from the human body is stored in the body fluid storage unit.
  • the gene locus information detection unit detects the information of the gene locus from the body fluid stored in the body fluid storage unit.
  • the analysis unit analyzes the locus information by comparing the locus information detected by the locus information detection unit and the reference data for the loci narrowed down as described above, and thereby the intron retention Identify the locus that is occurring.
  • the present invention can also be implemented by executing the following processing. That is, the computer program that realizes the functions of the information processing apparatus described above is supplied to a computer or a system including the computer via a network or various storage media. Then, the computer reads and executes the computer program. In this case, the computer program and the recording medium storing the computer program constitute the present invention.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

真核生物のmRNAの状態を簡易に解析し、それが好ましくない状態であった場合の対応策の提案などを容易にする技術を提供する。 真核生物のmRNA前駆体におけるイントロンの除去状態を定量的に解析し、真核生物に固有の情報を出力するmRNA前駆体の解析方法である。定量的に解析されたイントロンの除去状態から、健康型のスプライシングパターンとは異なる老化型あるいは未病型のスプライシングパターンの有無を検出する(S3)。その後、予め作成された物質リストから、老化型あるいは未病型のスプライシングパターンを健康型のスプライシングパターンに近づけるための薬学的に許容される物質の情報を特定する(S5)。そして、特定した情報を解析対象となった真核生物に固有の情報として出力する(S6)。

Description

mRNA前駆体の解析方法、情報処理装置、コンピュータプログラム
 本発明は、生体情報の解析技術、例えば、真核生物におけるmRNAの解析を通じた人体状態の解析技術、あるいは、遺伝子の解析を通じた人体状態の解析技術に関する。
 従来、遺伝子の構造解析を通じた人体状態の解析技術等が知られている。例えば、特許文献1に、遺伝子の異常と疾病との関連の解析手法が開示されている。遺伝子の異常の原因としては、コーディング領域に起こった変異や転写・翻訳過程の障害などが知られている。
 ヒトを含む真核生物を例にとって説明すると、真核生物の細胞核は、全遺伝情報をDNAに有する。個々の遺伝子は、必要に応じて転写され、mRNA前駆体が生成される。mRNA前駆体は、体内で作られる蛋白質の設計図の元になるもので、蛋白質合成の情報を持つ部分であるエキソンと、エキソン間に存在するイントロンとを含む。
 イントロンは、本来的に不要なものなので、分子的な編集作業であるスプライシングにより除去された上でエキソン同士が結合され、これにより、体内で作られる蛋白質の設計図であるmRNA(成熟mRNA)が完成する。このmRNAは細胞質に運ばれて翻訳され、蛋白質が生成される。スプライシングに何らかの異常があるとイントロンが十分に除去されず、真核生物にとって好ましくない状態、例えば老化や疾病の状態が生じやすくなるといわれている。
特開2002-223760号公報
 mRNA前駆体のスプライシングには、スプライシング調節因子が関わっている。また、スプライシング調節因子の種類は多岐にわたり、真核生物間の個体差もある。そのため、個々の真核生物におけるmRNAの状態を迅速に解析することは困難であり、引用文献1にも開示がない。
 また、仮にmRNA状態が真核生物にとって好ましくない状態であった場合の当該真核生物に固有となる対応策については、未だ研究されていない。
 本発明は上記背景の下になされたものであり、生体信号あるいはmRNAやDNAを解析することで生体状態を解析する技術を提供することを主たる課題とする。
本発明は、また、mRNAの状態を簡易に解析し、それが好ましくない状態であった場合の対応策の提案などを容易にする技術を提供することを課題とする。
 上記課題を解決するための一つの形態は、真核生物のmRNA前駆体におけるイントロンの除去状態を定量的に解析することにより、基準となる遺伝子発現パターンを導出する第1スプライシングパターンとは異なる遺伝子発現パターンを導出する可能性がある第2スプライシングパターンの有無を検出し、前記第2スプライシングパターンが有るときは、当該第2スプライシングパターンを前記第1スプライシングパターンに近づけるための薬学的に許容される物質の情報を予め作成された物質リストから特定し、特定した前記情報を前記真核生物に固有の情報として出力することを特徴とする、mRNA前駆体の解析方法である。
 本発明によれば、生体信号あるいはmRNAやDNAを解析することで生体状態を解析する技術を提供することが可能である。また、真核生物のmRNAの状態を簡易に解析し、それが好ましくない状態であった場合の対応策の提案などを容易にすることもできる。
選択的スプライシングの説明図。 IJC及びSJCの説明図。 (a)~(c)は、Sirt7遺伝子におけるイントロンリテンションの説明図。 (a)~(c)は、Cyp27a1遺伝子におけるイントロンリテンションの説明図。 (a)~(c)は、Ppard遺伝子におけるイントロンリテンションの説明図。 (a)~(c)は、Acadm遺伝子におけるイントロンリテンションの説明図。 (a)~(c)は、Decr2遺伝子におけるイントロンリテンションの説明図。 イントロンリテンションの回復結果の説明図。 肝臓の遺伝子における368座位のクラスタ及びドライバー遺伝子の説明図。 本実施形態における情報処理装置のハードウエア構成図。 情報処理装置の機能ブロック構成図。 情報処理装置で行う解析方法の処理手順説明図。 (a)~(c)は、Ptbp1遺伝子におけるSEスプライシングパターンの説明図。 未病の概念の説明図。 (A)~(D)は、イントロンの特徴の測定結果を表すグラフ。
 以下、図面を参照して、本発明の実施の形態例を説明する。
<第1実施形態>
 本発明者らは、真核生物におけるmRNAの解析とmRNAの状態が好ましくない場合(例えばmRNAの状態が、老化あるいはその他の望ましくない生体状態を示す場合)の改善策(老化等の望ましくない状態からの生体の回復)の実験を行った。
第1実施形態では、その概要とその結果について説明する。この実験では、真核生物の生体状態が望ましくない状態にある例として、老化に着目した。ただし、本発明は、老化に限定されるものではなく、その他の生体状態ないし人体状態、例えば第2実施形態で説明する未病状態などについても広く適用できるものである。
真核生物の例として、第1実施形態では、クロトーマウス(klotho mouse)という老化のモデルマウスと、比較例となる野生のマウス(Wild type mouse)とを用いた。クロトーマウスは、ヒト早発性老化症候群マウスとも呼ばれ、野生のマウスより老化が早く進む。クロトーマウスの寿命は平均60日程度であり、野生のマウスよりも短期間での実験が可能なことなどから、ヒトの代用として様々な実験に使用されている。これらのマウスを特に区別する必要がない場合は「被検体」と呼ぶ。また、被検体における真核生物にとって好ましくないmRNAの状態を変化させ、回復させるための対策の一例として、被検体に薬学的に許容される物質を摂取させた。
 薬学的に許容される物質は、ヒトやマウスなどに対して、過度の毒性、刺激、アナフィラキシー、免疫原性又は任意のその他の問題若しくは合併症などを起こさない物質である。このような物質には、ヒトやマウスなどが摂取可能な物質それ自体のほか、その物質を液体に溶かした液状体、製剤として摂取可能にしたものなどが含まれる。本実験では、日本の伝統的薬である漢方薬を一例として用いた。漢方薬はその多くの薬草成分に含まれている何千という化学物質の組み合わせで起こる相乗効果で臨床的効果が発揮すると考えられている。しかしながら、分子生物学的な観点から漢方薬の作用のメカニズムを解明した研究は知られていない。そこで、本発明者らは、漢方薬を被検体に摂取させ、公知のRNA-seq解析により被検体の器官におけるスプライシングに対する効果を検証した。具体的には、被検体に漢方薬を摂取させた後、被検体のmRNA前駆体におけるイントロンの除去状態を含むスプライシングの相違を解析した。この解析により、例えば老化に関わる遺伝子発現パターンを導出するスプライシングパターン(老化型スプライシングパターン)が発生しているmRNAに対して、摂取された物質が被検体に与える影響を調べた。なお、第1実施形態では老化型について説明するが、スプライシングパターンは老化型に限定されるものではなく、後述する未病状態に関わる遺伝子発現パターンを導出するスプライシングパターンである未病型スプライシングパターンにも適用が可能である。
 漢方薬の摂取によって被検体におけるスプライシングパターンが変化する遺伝子は二種類ある。一つはスプライシングに直接あるいは付随的に関わる因子の遺伝子であり、現在のところ、21の遺伝子を含むグループが知られている。もう一つは、器官のミトコンドリアや脂質や糖代謝に関する遺伝子である。現在のところ、約350の遺伝子を含むグループが知られている。
前者の遺伝子は、スプライシングの調節を通して後者の遺伝子群を支配しているので「ドライバー遺伝子」又は「上流遺伝子」と呼ぶ。一方、後者の遺伝子群を「ターゲット遺伝子(標的遺伝子)」又は「上流遺伝子」に対する「下流遺伝子」と呼ぶ。上流遺伝子は、例えば老化とともにスプライシングパターンを徐々に老化型に変えていき、その下流遺伝子のスプライシングパターンも必然的に老化する。そのため、スプライシングパターンが変化する遺伝子は、上流遺伝子であることが望ましい。
 本発明者らは、漢方薬が、その薬草成分が、被検体における前述の転写やエピゲノムの系に働きかけて上流遺伝子におけるmRNA前駆体のスプライシングパターンを老化前の状態に変化(回復)することを検証した。本明細書では、説明の便宜上、被検体における老化前の状態を、好ましくない状態が発生する前の状態の例として「健康状態」と呼ぶ。また、老化した状態の遺伝子ないしスプライシングパターンを「老化型」、健康状態の遺伝子ないしスプライシングパターンを「健康型」と呼ぶ。
 ここで、実験の前提となる、クロトーマウスを含む真核生物において共通に生じるmRNA前駆体のスプライシングについて説明する。図1は、様々なスプライシングパターンを生じさせる選択的スプライシング(alternative splicing)の説明図である。選択的スプライシングは、前述のスプライシング調節因子によって6種のパターンでエキソンを結合させる工程である。
 図1に示されているのは、常に使われるエキソン(Constitutive exon)、選択的にスプライスされるエキソン(Alternatively spliced exon)、そして、本来は除去されるべきであるイントロンが示されている。図1の最上段に示されるNormalパターンでは、先頭のconstitutive exonと2番目のconstitutive exonとの間にイントロンが存在し、かつ、2番目のconstitutive exonと3番目のconstitutive exonとの間にもイントロンが存在する。Normalパターンでは、これら2つのイントロンが除去され、3つのconstitutive exonが接続される。この状態が最も一般的なスプライシングパターンである。
 図1の二段目に示されているSkipped Exon(SE)パターンでは、先頭のconstitutive exonと3番目のconstitutive exonとが接続され、その間にあるイントロン及び2番目のconstitutive exonは除去されている。
 図1の三段目に示されているAlternative 5' Splice Site(A5SS)パターンでは、2番目のconstitutive exonと3番目のconstitutive exonとの間にあるイントロンについては、その一部が除去されずに残る。そのため、スプライシング後には、2番目のconstitutive exonと3番目のconstitutive exonとの間のイントロンの一部が残される。
 図1の四段目に示されているAlternative 3' Splice Site(A3SS)パターンでは、先頭のconstitutive exonと2番目のconstitutive exonとの間にあるイントロンについては、その一部が除去されずに残る。従って、スプライシング後には、先頭のconstitutive exonと2番目のconstitutive exonとの間のイントロンの一部が残される。
 図1の五段目に示されているRetained Intron(RI)パターンでは、先頭のconstitutive exonと2番目のconstitutive exonとの間にあるイントロンは除去されず、2番目のconstitutive exonと3番目のconstitutive exonとの間にあるイントロンのみが除去される。
 図1の六段目に示されているMutually eXclusive Exons(MXE)では、スプライシング前において先頭のconstitutive exonの次に第1のAlternatively spliced exon、第2のAlternatively spliced exon、2番目のconstitutive exonが接続されており、スプライシング後には、先頭のconstitutive exon、第1のAlternatively spliced exon及び2番目のconstitutive exonが接続されたmRNAと、先頭のconstitutive exon、第2のAlternatively spliced exon及び2番目のconstitutive exonが接続されたmRNAとの2つのmRNAが生成される。
 本実験では、mRNA前駆体における選択的スプライシングがどのように行われているかを公知のRNA-seq法により解析(RNA-seq解析)した。スプライシングの解析は、バイオインフォマティクス業界では周知のソフトウェアである「rMATS」を用いて行うことができる。rMATSでは、公知のR言語を用いて、検出結果をディスプレイ表示用に描画する可視化手段として動作させることもできる。R言語は、オープンソース・フリーソフトウェアの統計解析向けのプログラミング言語及びその開発実行環境であり、使用目的に応じて容易に活用することができる。
 また、RNA-seq解析の結果から、mRNA前駆体のスプライシングパターンと老化との関係を分析し、変化したスプライシングパターンの回復の可能性を模索した。
 その際、本実験では、スプライシングパターンを調べるために、mRNA前駆体のスプライシング後におけるイントロンインクルーディングジャンクション(IJC)とスキップジャンクションとを以下のように定義した。
 IJC:mRNA前駆体スプライシング後のエキソン接合部であって、エキソン間にイントロンが存在する接合部
 SJC:mRNA前駆体のスプライシング後のエキソン接合部であって、エキソン間のイントロン除去されている接合部
 IJC及びSJCの概念図を図2に示す。図2の下段は、イントロンが完全に除去されてエキソン同士が結合することを示す。この状態が、図1の最上段のNormalパターンであり、健康状態となる。ところが、老化した被検体の場合、スプライシングにおけるイントロンの除去が不十分になり、健康状態の被検体に対してmRNAにおけるIJCが増加する一方でSJCが減少する。これは、図2において、エキソンの領域とイントロンの領域とに跨がる部分が原因となる。これらの部分はイントロンとして認知されないため、除去されず、結果、mRNAに残ることになる。
 このことから、選択的スプライシングにおいてイントロンがどれだけ除去されているかを示す指標として、log2IJC/SJCを計算する。これはSJCに対してIJCがどれだけ多いかを示す指標(fold change)である。この値は上記のIJCとSJCのそれぞれの値に対して、2を基数とするlogを取り(logIJCとlog2SJC)引き算をした値となっている。この値がエキソンとイントロンの境界におけるイントロンの残留の度合いの指標となる。
 つまり、老化した被検体のmRNAは、log2IJC/SJCがコントロールと比べて増加している。この値を老化の指標として用いることができる。以上のことを前提とする試験例をいくつか説明する。
[試験例1]
 試験例1では、漢方薬として十全大補湯を被検体に摂取させたときの選択的スプライシング(それにより得られるスプライシングパターン)に与える影響を被検体から取得した検体データに基づいて解析した。十全大補湯は、十種類の生薬を配合したものであり、食欲不振、疲労倦怠、病後の体力低下などに処方される漢方薬とされる。十全大補湯は、株式会社ツムラ製の「ツムラ十全大補湯 エキス顆粒(医療用)」を用いた。その成分は、以下の通りである。なお、各成分における数字は重量比(重量の相対比率)を示す。
  黄耆(オウギ) 3.0
  人参(ニンジン) 3.0
  桂皮(ケイヒ) 3.0
  当帰(トウキ) 3.0
  川キュウ(センキュウ) 3.0
  芍薬(シャクヤク)3.0
  熟地黄(ジオウ) 3.0
  蒼朮(ソウジュツ) 3.0
  茯苓(ブクリョウ) 3.0
  甘草(カンゾウ) 1.5
 選択的スプライシングの影響を確認するために、被検体として複数のクロトーマウスと複数の野生のマウスに対して、様々な環境で同じ比率で十全大補湯を摂取させた。
試験例1では、以下に示すように第1グループから第4グループの被検体に7週間にわたって給餌を行い、心臓、腎臓、肝臓の各器官及び血液について、mRNAの生成時におけるスプライシングパターンを解析した。十全大補湯は、同一量の通常の餌に同一量を添加した。そして、十全大補湯を添加した場合と添加しない場合とにわけて給餌を行うことで、遺伝子発現の変化が生じるか否かを確認した。説明の便宜上、十全大補湯を添加しない給餌を「通常給餌」、添加した給餌を「添加給餌」と呼ぶ。
 第1グループ:5匹のクロトーマウスに対して3.5週間にわたって通常給餌を行い、その後、3.5週間にわたって添加給餌を行った。
 第2グループ:5匹のクロトーマウスに対して3.5週間にわたって通常給餌を行い、その後の3.5週間も同様に通常給餌を行った。
 第3グループ:5匹の野生マウスに対して3.5週間にわたって通常給餌を行い、その後、3.5週間にわたって、第1グループで用いた添加給餌を行った。
 第4グループ:5匹の野生マウスに対して4週間にわたって通常給餌を行い、その後の4週間も同様に通常給餌を行った。
 上記第1~第4グループの被検体を同じ環境で飼育し、飼育期間完了後に、それぞれの被検体から肝臓、腎臓、心臓の各器官の検体データ及び血液の分析データを取得し、各検体データに対してRNA-seq解析を行ってスプライシングパターン(遺伝子発現量)を検出した。その結果、肝臓、腎臓、心臓の各器官及び血液について、添加給餌した第1グループのクロトーマウスと、通常給餌を行った第2グループのクロトーマウスの比較では、702の遺伝子でそのmRNA前駆体の選択的スプライシングの結果であるスプライシングパターンが変化することが確認された。この変化した702の遺伝子のうち、27の遺伝子は、スプライシングの上流遺伝子であり、多くの下流の遺伝子を支配している。これらの27の遺伝子の変化やそれが関わるスプライシングパターンの変化は、器官の老化に深く関わっていることは明らかである。
 また、添加給餌を続けた第1グループのクロトーマウスでは、より多数の上流遺伝子について、スプライシングパターンが健康型に回復したことが認められた。
 特に、肝臓の遺伝子においては、添加給餌を繰り返したクロトーマウスと通常給餌のみのクロトーマウスとの間には、368座位において多数の選択的スプライシングの変化(スプライシングパターンの変化)が見られ、その変化の88.3%(325座位)は、老化型から健康型への変化、つまりスプライシングパターンの老化型から健康型への回復が認められた。
 また、選択的スプライシングの違いの中でも、特に本来は除去されるはずであった、イントロンが残ったままエキソンが結合してしまっている、イントロンリテンション(RI)という現象が起きているmRNAにおいては、その97.2%において、スプライシングパターンの回復が認められた。
以下、そのようなmRNAについて、回復した状態をより詳細に調べるために、上流遺伝子のうち公知のSirt7遺伝子に関する解析結果を説明する。Sirt7遺伝子は、mycの活性を抑え、ER stressを抑制することで、脂肪肝を防ぐことが知られている(Cell reports, 2013)。また、Sirt7遺伝子は、ユビキチン・プロテオームを介して肝臓の脂肪酸代謝を制御 する(Cell Metabol. 2014)ことが知られている。
 図3(a)~図3(c)は、Sirt7遺伝子におけるイントロンリテンションの説明図である。図3(a)において、最上段のグラフは、第1グループ、つまり十全大補湯を給餌したクロトーマウス(KL+と略記する)の肝臓におけるイントロントとエキソンとを定量化したグラフである。横軸は遺伝子配列を表し、縦軸はRead値を表す。他のイントロントとエキソンとを表すグラフについても同様である。
 図3(a)の最下段のグラフにおいて、E1、E2、E3はエキソンを表し、I1、I2はイントロンを表す。第2段、第3段のグラフについても同様である。これらのグラフでは、イントロンI1における縦軸の値は、エキソンE1、E2、E3における縦軸の値よりも小さくなっており、図中においてエキソンとイントロンとの区別が定量的かつ視覚的に可能である。特に、イントロンI2は、その縦軸の値がほぼ0となっており、エキソンE1、E2、E3とは明瞭に区別できる。これは第4グループ(通常給餌のみ)の野生マウス(WT-と略記する)の肝臓の遺伝子におけるイントロンとエキソンとを表す。
 図3(a)の2段目のグラフは、第2グループのクロトーマウス(KL-と略記する)の肝臓の遺伝子におけるイントロンとエキソンとを表す。このグラフでは、イントロンI1の縦軸の値は全体的にKL+におけるイントロンI1の値よりも高い。エキソンE1,E2とイントロンI1との境界は比較的明瞭であるものの、イントロンI1及びエキソンE2は、共に右肩下がりの傾向を示しており、両者は区別しにくいものとなっている。
 図3(a)の最上段のグラフはKL+のパターンで、十全大補湯を加えた時の効果を調べたものである。このグラフでは、イントロンI1の縦軸の値は、エキソンE1、E2における縦軸の値よりも小さくなっており、最下段のグラフで示したのと同様に、KL+のパターンにおいてもエキソンとイントロンとを明瞭に区別することができる。
 図3(b)は、添加給餌を続けたクロトーマウスにおけるIJCのread値(KL+_IJC)及びSJCのread値(KL+_SJC)を示す。また、図3(b)は、通常給餌のみのクロトーマウスにおけるIJCのread値(KL-_IJC)及びSJC値のread値(KL-_SJC)、及び、通常給餌のみの野生のマウスにおけるIJCのread値(WT-_IJC)及びSJC値のread値(WT-_SJC)を示す。図中のpは、p値(有意確率)、FDRはフォールスディスパカバリーレート(false discovery rate)を示す。図3(b)に示されている通り、p値は0.0050、FDRは0.0978であった。これらの値は、添加給餌を続けたことによってスプライシングパターンが統計的に有意に健康型に回復していることを裏付けるものである。
 また、十全大補湯を加えたKL+と通常給餌のみのクロトーマウスKL-と、通常給餌のみの野生のマウスWT-とを比較すると、KL-のlog2IJC/SJC値は、WT-やKL+のlog2IJC/SJC値よりも非常に大きい。
 このように、老化した被検体では、mRNA前駆体のスプライシングにおけるイントロンの除去が不十分となり、健康型の被検体と比較して、mRNAにおいてIJCが増加してSJCが減少することが明らかになった。この事実は、図3(b)に示されるように、添加給餌を続けたクロトーマウスは、通常給餌のみの野生のマウスに比較してIJCが非常に大きく、その結果、老化が進んでいることを裏付けるものである。
 一方、十全大補湯を給餌したクロトーマウスKL+のlog2IJC/SJC値は、クロトーマウスKL-のlog2IJC/SJC値に比較して非常に小さく、かつ、野生のマウスWT-のlog2IJC/SJC値に類似した分布を示す。このことから、添加給餌を続けたクロトーマウスの場合、Sirt7遺伝子の老化が抑えられ、log2IJC/SJC値は正常な野生のマウスに近い分布となることが明らかになった。
 図3(c)は、クロトーマウスKL+、KL-及び野生のマウスWT-についてのFold Change値を示す。図中、縦軸のfold change値はlog2IJC/SJC値の値を示す。図3(c)においても、添加給餌を続けたクロトーマウスKL+は、野生のマウスWT-と同様にFold Change値の分布が小さくなっている。一方、通常給餌のみのクロトーマウスKL-は、Fold Change値が、クロトーマウスKL+、野生のマウスWT-に比較して4倍程度となっている。従って、添加給餌を続けたクロトーマウスKL+は、クロトーマウスKL-に比較して、遺伝子の老化が抑えられている。
 以上のことから、通常給餌のみのクロトーマウスKL-では、スプライシング後もイントロンが多く残るためにエキソンとの差が曖昧になっており、エキソンが正しく結合されない。これに対して、野生のマウスWT-と、添加給餌を続けたクロトーマウスKL+では、イントロンとエキソンの差がはっきりしており、正しくエキソンが結合されている。この事実は、クロトーマウスであっても、添加給餌を続けることで老化の進行が抑えられ、野生のマウスと同様にスプライシングが行われることが裏付けるものである。
 なお、老化が進むとスプライシングが正しく行われなくなるという知見については、「The emerging role of alternative splicing in senescence and aging(Aging Cell 2017 10月)」などで言及されているが、老化の進行を抑える手法を定量的に明らかにした文献は存在しない。本実験では、被検体に添加給餌を続けることで、スプライシングを正常に保ち、これにより、老化した部分を回復させることができるという驚くべき効果が得られている。
 以上はSirt7遺伝子についての解析結果であるが、Sirt7遺伝子以外の遺伝子についても解析を行ったので、その結果について説明する。図4(a)~(c)は、Cyp27a1遺伝子におけるイントロンリテンションの説明図である。図5(a)~(c)は、Ppard遺伝子におけるイントロンリテンションの説明図である。図6(a)~(c)は、Acadm遺伝子におけるイントロンリテンションの説明図である。図7(a)~(c)は、Decr2遺伝子におけるイントロンリテンションの説明図である。それぞれ、グラフの縦軸、横軸及びE1、I1等の記号は、いずれも図3(a)~(c)と同様である。
 図4(a)~(c)に示されたCyp27a1遺伝子は、酵素のシトクロムP450スーパーファミリーのメンバーである。Cyp27a1遺伝子は、薬物代謝及びコレステロール、ステロイド及び他の脂質の合成に関与する多くの反応を触媒するモノオキシゲナーゼであり、コレステロール中間体を胆汁合成経路の一部として酸化する。
 Cyp27a1遺伝子においても、図3(a)~図3(c)に示したSirt7遺伝子と同様、通常給餌のみのクロトーマウスKL-では、スプライシング後もイントロンが多く残ることからエキソンとの差が曖昧になっている。
一方、野生のマウスWT-と、添加給餌を続けたクロトーマウスKL+では、イントロンとエキソンの差がはっきりしており、正しくエキソンが結合されている。特に、図4(a)の2段目に示されるように、通常給餌のみのクロトーマウスKL-のIJCのread値では、エキソンE1、イントロンI1、エキソンE2がともに同じような分布となって区別が付きにくいが、添加給餌を続けた最上段のグラフでは、野生のマウスWT-に対応する3段目のグラフと同様、イントロンとエキソンとの区別が明瞭になっている。つまり、添加給餌によるスプライシングパターンの回復の効果が一層明瞭になっている。
この事実は、Cyp27a1遺伝子においても、クロトーマウスであっても添加給餌を続けることで、選択的スプライシングを正常に保って老化の進行を抑え、野生のマウスと同様にスプライシングが行われることが裏付けられる。
 図5(a)~図5(c)は、Ppard遺伝子におけるイントロンリテンションの説明図を示す。Ppard遺伝子は、ペルオキシソーム増殖因子活性化受容体(PPAR)ファミリーのメンバーであり、脂肪酸のペルオキシソームベータ酸化経路を調節する。図示されるように、Ppard遺伝子においても、クロトーマウスであっても、十全大補湯を給餌することで、スプライシングを正常に保って老化の進行を抑え、正常な野生タイプのマウスと同様にスプライシングが行われることが裏付けられる。
 図6(a)~図6(c)は、Acadm遺伝子におけるイントロンリテンションの説明図を示す。Acadm遺伝子は、中鎖特異的アシル - コエンザイムAデヒドロゲナーゼをコードし、ミトコンドリア脂肪酸ベータ酸化経路の初期段階を触媒する。このAcadm遺伝子の欠損は、中鎖のアシル-CoAデヒドロゲナーゼ欠乏症、肝機能障害、空腹時低血糖症、及び脳症を特徴とする幼児死亡の原因となる疾患を引き起こす。図示されるように、Acadm遺伝子においても、クロトーマウスであっても添加給餌を続けることで、スプライシングを正常に保って老化の進行を抑え、正常な野生タイプのマウスと同様にスプライシングが行われることが裏付けられる。
 図7(a)~図7(c)に、Decr2遺伝子におけるイントロンリテンションの説明図を示す。Decr2遺伝子は、ベータ酸化補助酵素であり、ペルオキシソームの偶数及び奇数の両方の位置に二重結合を有する不飽和脂肪酸エノイル-CoAエステルの分解に関係する。図示されるように、Decr2遺伝子においても、クロトーマウスであっても、添加給餌を続けることで、スプライシングを正常に保って老化の進行を抑え、正常な野生タイプのマウスと同様にスプライシングが行われることが裏付けられる。
 また、252種の遺伝子について、JTTの投与によりイントロンリテンションが回復するかを調べた。その結果を図8に示す。図示されるように、complete recovery(完全回復)は70、partial recovery (部分回復)は62、no recovery(回復しない老化遺伝子)は120であった。
 また、JTTの投与により完全回復した遺伝子のリストを以下に示す。なお、Acadmについてchr3:153939069-153939167とあるが、これはマウスの染色体番号と、ゲノム上での位置を示す。Adck5等のその他の遺伝子についても同様である。
Acadm, chr3:153939069-153939167
Adck5, chr15:76594152-76594447
Adipor1, chr1:134424750-134424922
Aldh4a1, chr4:139642076-139642273
Aldh4a1, chr4:139633896-139633989
Alg6, chr4:99752816-99752885
Anapc5, chr5:122800450-122800593
Anxa11, chr14:25874670-25874784
Atg9a, chr1:75182591-75182737
Atp11b, chr3:35839048-35839214
Bsdc1, chr4:129466822-129466990
Camk1, chr6:113339506-113339581
Cct3, chr3:88300928-88300991
Chkb, chr15:89428713-89428827
Cln3, chr7:126575343-126575412
Cnbp, chr6:87845464-87845557
Ctdsp1, chr1:74393796-74393901
Cyp27a1, chr1:74735863-74736036
Ddx5, chr11:106783958-106784018
Enpp5, chr17:44085204-44086567
Faah, chr4:116000786-116000827
Fastkd2, chr1:63735844-63735968
Ftcd, chr10:76584169-76584299
Gaa, chr11:119274214-119274311
Gatad2b, chr3:90355674-90355785
Galt, chr4:41756681-41756811
Gdi1, chrX:74308129-74308261
Ghdc, chr11:100768217-100768289
Gnb2l1, chr11:48802272-48802420
Gnmt, chr17:46726268-46726411
Hpd, chr5:123181860-123181923
Hsd3b7, chr7:127802785-127803802
Jmjd8, chr17:25830138-25830206
Kctd2, chr11:115430312-115431274
Las1l, chrX:95950336-95950446
Maged1, chrX:94537973-94538065
Med24, chr11:98717909-98718142
Men1, chr19:6338825-6338961
Metap1d, chr2:71511411-71511560
Mrps2, chr2:28468820-28468950
Mtfr1l, chr4:134530679-134530789
Ndufs2, chr1:171238286-171238372
Neu1, chr17:34934002-34934185
Npdc1, chr2:25408904-25409001
Nr1i3, chr1:171217313-171217430
Nxf1, chr19:8766796-8766833
Pde9a, chr17:31460178-31460261
Phc1, chr6:122322324-122322472
Phykpl, chr11:51593915-51594141
Rnf167, chr11:70649911-70650017
Rnpepl1, chr1:92917633-92917746
Rnpepl1, chr1:92917146-92917746
Rpl3, chr15:80081614-80081783
Rsrp1, chr4:134926734-134926818
Saal1, chr7:46701780-46701961
Selenbp1, chr3:94937954-94938075
Sirt7, chr11:120620646-120620883
Slc25a11, chr11:70645349-70645440
Slc35f6, chr5:30655887-30656100
Slc6a9, chr4:117864753-117864888
Spsb3, chr17:24890832-24890935
Spsb3, chr17:24891010-24891136
Srsf5, chr12:80949094-80949168
Srsf6, chr2:162933425-162933550
Timm44, chr8:4266555-4266680
Tmem208, chr8:105328607-105328692
Ugdh, chr5:65422634-65422782
Uros, chr7:133691085-133691166
Wbp1, chr6:83120771-83120873
Zfp26, chr9:20444893-20444985
[試験例2]
 試験例1では、Cyp27a1遺伝子等について、添加給餌を続けることがスプライシングに与える影響を解析した。試験例2では、さらに、driver 遺伝子の重点的な解析の結果、選択的スプライシングが正しく行われていない座位について、十全大補湯の効果を調べた。詳細には、試験例2では、肝臓の遺伝子での368座位(Liver 368 loci)のうち、上流遺伝子である20座位について、スプライシングが正常に行われているか否かを調べた。図9に、被検体の肝臓の上流遺伝子の説明図を示す。図中のDriver Geneは上流遺伝子を示す。
 上流遺伝子が多数の下流遺伝子に対して支配的な挙動を示すことから、そのスプライシングが正常に行われないと、下流遺伝子でもスプライシングが正常に行われなくなることは上述した通りである。
 図9に示された上流遺伝子(Driver Gene)Aqr, Ddx39, Ddx5, Fmr1, Hnrnpa2b1, Kdm4b, Luc7l2, Mbnl1, Nxf1, Prpf38b, Ptbp1, Rnps1, Sf3b1, Son(2), Srrm1, Srsf11, Srsf5, Srsf6, Thoc2, のうち、Mbnl1及びFmr1を除く上流遺伝子においてクロトーマウスへの添加給餌によりスプライシングパターンが老化型から健康型へ回復している事実が確認された。つまり、スプライシングが正常に行われるようになったことが確認された。
 図9において、スプライシングパターンの回復が認められた座位については、「Recovery Level」の項目を「+」と表現し、特に大きな回復の効果が確認された座位については、「Recovery Level」の項目を「++」と表現している。例えばAqrについて、「chr2:114158869-114161684」とあるが、これはマウスの染色体番号と、ゲノム上での位置を示す。(2)というのは、同じ遺伝子上での異なる座位でスプライシングが回復していることを示す。
 試験例2では、また、回復が認められた上流遺伝子の下流遺伝子についても、試験例1と同様にスプライシングパターンが回復されているか否かを検証した。その結果、多数の下流遺伝子においてスプライシングパターンが変化したこと、つまり、老化型から健康型に変化したことが確認された。上流遺伝子は下流遺伝子に対して支配的な挙動を示すことから、上流遺伝子でスプライシングパターンが回復したことによって、その多数の下流遺伝子についても、スプライシングパターンを回復させたと考えられる。
 特に、添加給餌を続けたクロトーマウスの肝臓(Liver)については、19座位の上流遺伝子のスプライシングパターンが老化型から健康型に変化していた。一方、2座位の上流遺伝子については、スプライシングパターンの変化は認められなかった。このように、上流遺伝子に対してmRNA前駆体におけるスプライシングパターンの回復の効果が選択的に出現することが、十全大補湯の特徴の一つといえると考えられる。
 以上のように、本実験では、被検体から当該被検体のmRNA前駆体のデータを含む検体データを取得し、図3(a),(b),(c)~図7(a),(b),(c)に示されるように、取得した検体データに対してmRNA前駆体におけるイントロンの除去状態を解析した。そして、mRNAにおいてスプライシング後にもイントロンが多く残るスプライシングパターンが検出された被検体に対して薬学的に許容される物質のうち十全大補湯を選択して給餌を行うことで、mRNAにおいてイントロンが切断されてエキソンが正しく結合されることが確認された。
 このことから、mRNAにおいてスプライシング後にもイントロンが多く残るスプライシングパターンが検出された被検体に対して、十全大補湯を選択して給餌を行うことで、mRNAにおいてイントロンが切断されてエキソンが正しく結合させるようにできると考えられる。
 また、試験例1、2では、クロトーマウスの老化に関連して702の遺伝子においてスプライシングパターンが変化し、かつ、702の遺伝子のうち27遺伝子が上流遺伝子であることが確認された。そして、肝臓については、十全大補湯の給餌により19座位についてスプライシングパターンを回復させる効果を有することが確認された。
ただし、異なるタイプの老化、例えばアルツハイマー型老化やその他の疾病などでは、異なる上流遺伝子についての変化が起こる可能性がある。そのため、スプライシングにおけるIJC及び/又はSJCをより詳細に調べて個々の遺伝子のmRNA前駆体におけるスプライシングパターンの変化を分析することにより、老化のみならず、健康状態の変化、例えば疾病に対しても、どの遺伝子においてスプライシングパターンが変化するかを特定することができると考えられる。
 一方、個々の遺伝子の座位について、その座位におけるスプライシングパターンを回復させる物質、あるいはそのような物質の組合せも特定できると考えられる。例えば、試験例2では、クロトーマウスの老化では肝臓について19座位の上流遺伝子のスプライシングパターンが十全大補湯により回復することが示されたが、その一方で、二つの座位Mbnl1及びFmr1には十全大補湯では回復しなかった。
様々な物質に対して試験例1と同様の試験を行ってこれら二つの座位Mbnl1及びFmr1に対してスプライシングパターンを回復させる物質を特定することができた場合、その物質と十全大補湯とを合わせて給餌することで、このような老化や疾病の原因となる座位をいずれも正常化することができると考えられる。
 実際、自然に老化した野生のマウスやアルツハイマー型老化の野生のマウスにも十全大補湯を給餌し、スプライシングパターンが変化した遺伝子セットを見てみると、クロトーマウスの場合と同様、23座位の上流遺伝子のセットの中には異なるセットが見出された。この事実は、クロトーマウスと同種の器官ないし細胞質を有する他の真核生物についても、十全大補湯の摂取によって、少なくとも肝臓の遺伝子に関連する23部位の選択的スプライシングのパターンが変化することを類推させるものである。
 本実験の結果は、同じく真核生物であるヒトにおいても同様に適用できるものである。すなわち、ヒトが十全大補湯を摂取することで、肝臓におけるスプライシングパターンを老化型から健康型へ回復させることができる。なお、十全大補湯は、例えば粉末等の固体、あるいは、その物質を液体に溶かした液状体、あるいはそれを固形した固形体等、製剤として摂取可能にしたものが用いられる。
また、十全大補湯以外の漢方薬(例えば補中益気湯)、あるいは薬剤等の、ヒトや動物が摂取可能な物質について、試験例1と同様な分析を行うことで、遺伝子のどの座位について、どの物質がスプライシングパターンの回復効果を有するのかを求めるための分析が可能である。
 また、本実験では肝臓によるmRNAの解析を行ったが、皮膚の健康など、肝臓以外の組織や血液などについて、老化型に変化している上流遺伝子、その上流遺伝子を変化させる物質を特定することが可能である。そのため、漢方薬や他の伝統医薬、サプリメントあるいはその他の物資における老化や疾病の原因となるmRNA前駆体におけるスプライシングパターンの回復効果を、個々のヒトや動物の血液の検体データから解析される上流遺伝子のスライシングパターンの正常化として対応付けることも可能である。また、このような対応関係をバーコード化して特定の患者や動物に適切な薬を処方することが可能になると考えられる。
つまり、本実験の結果は、プレシジョン・メディシン(precision medicine:個人の病気や老化に合わせて投薬するシステム)にも応用できるものである。
 そこで、以下に、プレシジョン・メディシンなどに適した情報処理装置の実施の形態例を説明する。
[情報処理装置の構成]
 図10は、本実施形態に係る情報処理装置10のハードウエア構成図である。情報提供装置10は、コンピュータであるCPU(Central Processing Unit)11、ROM(Read Only Memory)12、及びRAM(Random Access Memory)13と、ストレージ14と、入力I/F(I/Fはインタフェースの略)(1)15と、入力I/F(2)16と、出力I/F17と、通信I/F18とを備える。
 CPU11は、ROM12に格納されるコンピュータプログラムを、RAM13を作業領域に用いて実行することで情報処理装置10全体の動作を制御する。ストレージ14は、HDD(Hard Disk Drive)やSSD(Solid State Drive)等の大容量記憶装置である。ストレージ14は、コンピュータプログラムやその実行に必要となるデータを格納するとともに、後述する各種データベース(DBと略す)を記憶する領域を提供する。入力I/F(1)15には、被検者から採血した血液の分析結果を保持する検体データ処理装置が接続される。入力I/F(2)16には、キーボード、マウス、タッチパネル等の入力デバイスが接続される。出力I/F17には、ディスプレイ、プリンタ、スピーカ、外部記憶装置等の出力デバイスが接続される。通信I/F18は、インターネット等の通信ネットワークが接続される。
 情報提供装置10は、ストレージ14に記憶されているコンピュータプログラムをCPU11が実行することで、被検者(ヒト)のmRNA前駆体の解析を行ってプレシジョン・メディシンを容易にするための種々の機能ブロックを実現する。これらの機能ブロック構成例を図11に示す。図示の通り、情報提供装置10は、検体データ取得部111、解析部112、検索部113及び出力部114を有する。また、物質DB1131及びアクションDB1132を有する。
 物質DB1131は、予め変化することが実験等により判明しているスプライシングパターン(後述する第2スプライシングパターン)を変化前のスプライシングパターン(後述する第1スプライシングパターン)に近づけるための薬学的に許容される物質の情報を第2スプライシングパターン毎に格納したDBである。
薬学的に許容される物質については、本実験において上述した通りである。なお、この物質は、通常は摂取可能な物質であるが、一の摂取可能な物質に対して相性が良くない他の摂取可能な物質を関連付けておき、一の物質が索出されるときに、他の物質も読み出し可能にしておくこともできる。これにより、一の物質では第2スプライシングパターンが第1スプライシングパターンに近づくが、他の物質では逆効果になる等の情報を得ることが可能になる。
 物質DB1131には、頻繁に検索される第2スプライシングパターンについて、それを第1スプライシングパターンに近づけるための上記物質の情報を記録したリスト(物質リスト)が格納されている。そのため、第2スプライシングパターンがリストアップされているときは、薬学的に許容される物質の情報(上記の一の物質、及び/又は他の物質の情報)を迅速に索出することができる。
 アクションDB1132には、第2スプライシングパターンを変化前の第1スプライシングパターンに近づけるためのアクションの情報、例えば、物質DB1131で特定された物質を摂取した後は所定時間だけ安静にするとか、特徴的な運動をするとか、リラックスするという、いわば非摂取(摂食)による対応策の情報が、第2スプライシングパターン等をキーワードとして格納されている。
 検体データ取得部111は、被検体(ヒト)から当該被検体のmRNA前駆体のデータを含む検体データを取得する。異なる生活環境におかれた同一の被検体からそれぞれの生活環境を識別する識別情報と共にそれぞれの当該被検体から検体データを取得するようにしても良い。後者の場合、識別情報を保存し、後述する解析部112の解析結果と関連付けておくことで、生活環境毎のmRNAの解析結果を得ることができる。
 検体データは、本実施形態では、被検体から採血した血液を検体データ処理装置で分析したデータを用いるが、これに限らず、採血機関や病院で採血した血液の分析データを検体データ処理装置を介して取得しても良い。検体データには、被検体の内蔵や細胞の状態を表す情報が含まれている。
 解析部112は、検体データ取得部111で取得した検体データに対してmRNA前駆体におけるイントロンの除去状態(選択的スプライシングの結果情報)を定量的に解析することにより、所定の遺伝子発現パターンを導出する第1スプライシングパターンと異なる遺伝子発現パターンを導出する可能性がある第2スプライシングパターンの有無を検出する。「除去状態」とは、上述した実験において説明した通り、本来除去されるべきであるにも関わらず残っている状態を含む。定量的とは、上記状態を数値ないし質量などで表現できることをいう。本実施形態では、便宜上、被検者から取得した検体データのスプライシングの調節因子のうち上流遺伝子における第2スプライシングパターンの有無を検出する。
 第1スプライシングパターンは、被検者のmRNA前駆体の状態解析時の比較対象となるスプライシングパターンであって、例えば約20歳前の健全なヒトから取得した多数の検体データを解析することで得られる遺伝子発現パターンを導出するスプライシングパターンをいう。ただし、同一の被検者から複数回取得した検体データに対してそれぞれ上記の解析を行い、それぞれ選択的スプライシングの結果情報を時系列に蓄積するとともに、蓄積された結果情報のうち基準となる真核生物(例えば上述した健全なヒトの集合)による選択的スプライシングの結果情報と最も類似する結果情報を導出した選択的スプライシングの結果情報を、その被検者用の第1スプライシングパターンとしても良い。この場合、その被検者用の第1スプライシングパターンをストレージ14の所定領域に保存し、これを適宜、読み出すようにする。
 なお、解析部112は、上述した「rMATS」とR言語とを用いて実現することができる。そのため、解析部112は、選択的スプライシングの結果情報を可視化する可視化手段として動作させることも可能となる。
 検索部113は、第2スプライシングパターンが検出されたときに、当該第2スプライシングパターンを第1スプライシングパターンに近づけるための薬学的に許容される物質の情報を物質DB1131から索出する。その際、アクションDB1132にアクションに関する情報が格納されている場合は、それを併せて索出する。
 出力部114は、索出したこれらの情報を、被検者に固有の情報として出力デバイスに出力する。なお、出力部114は、選択的スプライシングの結果情報だけを出力することも可能である。
 上記のように構成される情報処理装置10において実行される処理の手順例を図12に示す。図12を参照すると、情報処理装置10は、まず、被検体(ヒト)の検体データを取得する(S1)。検体データは、例えば被検体から採血した血液の分析データである。情報処理装置10は、その後、mRNA前駆体の状態を解析する(S2)。具体的には、図3~図7のように定量的に解析する。その後、情報処理装置10は、基準となるスプライシングパターン(第1スプライシングパターン)に対して変化しているスライシングパターン(第2スプライシングパターン)が有るかどうかを判定する(S3)。有る場合は(S3:Y)変化したスプライシングパターンが上流遺伝子かどうかを判定する(S4)。上流遺伝子であった場合は(S4:Y)、イントロンを減少させる薬学的に許容される物質の情報を特定する(S5)。その際、関連するアクションの情報が存在する場合は、それを併せて特定する。そして、特定したこれらの情報を被検体に固有の情報として出力デバイスに出力して(S6)処理を終える。
 S3において変化しているスプライシングパターンが無いと判定した場合(S3:N)、S4において上流遺伝子でないと判定した場合(S4:N)は、直ちに処理を終える。
 このような手順を実行することにより、被検体の検体データ取得時において、スプライシングパターンが変化している場合は、回復に適した物質の情報等がその被検体に固有の情報として出力されるので、例えば被検体が老化している状態であった場合の対応情報の提案などを容易にすることができる。
 [本実験による他の考察]
 選択的スプライシングにおける全体的な変化が、癌により誘発されることは従来より知られている。それと同様に、本実験により、老化のような望ましくない状態もまた、選択的スプライシングにおける全体的な変化を誘発することが確認された。
多くの遺伝子の選択的スプライシングにおける老化に起因するスプライシングパターンの変化は、スプライシング因子の発現の変化によって引き起こされる。選択的スプライシングは転写と結び付いているので、転写を制御するメカニズムはまた選択的スプライシングを制御し得る。
 例えば、クロマチン成分、ならびにヒストン修飾及びDNAメチル化に関連するものなどのエピジェネティックファクターは、転写を制御するだけでなく、スプライシングも調節する。本実験では、選択的スプライシングにおけるイントロンの除去状態を通じて、遺伝子が老化していることを検出し、真核生物に薬学的に許容される物質を与えることによってイントロンの除去状態が健康型に回復することを確認した。
ただし、イントロンの除去状態に代えて、クロマチン成分、ならびにヒストン修飾及びDNAメチル化に関連するものなどのエピジェネティックファクターを用いて、遺伝子が老化したか、また、老化した遺伝子が十全大補湯等により健康型に戻ったかを確認することもできる。
 例えば、DNAメチル化低レベルであることによって遺伝子が老化していることを確認し、かつ、十全大補湯などの薬学的に許容される物質を与えた後に、DNAメチル化が正常化しているか否かを検出することで、遺伝子が健康型に戻っているか否かを知ることができる。以下に、遺伝子が老化型であるか、健康型であるかを知るためにこのようなDNAメチル化等の適用が可能であることの更なる理論的背景を説明する。
 上述したエピジェネティックファクターは、Pol IIの伸長速度に影響を与え、ひいてはスプライシングパターンに影響を与える。例えば、標準的なヒストンが枯渇したヒト細胞は老化組織においてしばしば観察される転写及びスプライシングの変化を示す。ヒストンの枯渇はPol IIの伸長速度を増加させ、エキソンの排除を引き起こし、これは共転写スプライシングの「速度論的モデル」と一致する。エピジェネティックヒストン修飾の場合、最近の研究は、H3K4me3/2の特異的デメチラーゼであるKDM5Bの枯渇がPol IIプロモーター占有率の低下をもたらし、それがその後、遅いPol II伸長を誘導し、胚性幹細胞におけるオルタナティブスプライスエキソンの発現に影響を及ぼすことが示される。
 これらのデータは、エキソンのエクスクルージョン(排除)及びインクルージョン(包含)に関して、転写伸長速度の調節の主な重要性を示唆している。もともとはヒストン修飾の変化によって誘導された転写伸長速度の変化は、老化に伴うSEパターンの広範な変化(エキソンエクスクルージョン除去またはエキソンインクルージョン)ならびに十全大補湯治療後のそれからの回復にある程度関与していると推測される。
 スプライス部位の選択を制御するために、速度論的モデル及び動員モデルの2つのモデルがあり、これらにはそれぞれ転写伸長速度が含まれる。「速度論モデル」では、転写伸長速度すなわち、転写中にスプライス部位及び調節配列が新生のmRNAに出現するペースに影響を与えることによって選択的スプライシングに影響を与える。
 特に、伸長が速いと、より強いスプライス部位が利用できることから、より弱い(上流)スプライス部位よりも、より強いスプライス部位の使用が促進され、その結果エキソンが除去される。一方、伸長が遅いと、より強い下流側スプライス部位が合成され得る前に、より弱い上流側スプライス部位への標準的なスプライシングファクターの補充(リクルートメント)を促進し、その結果、エキソンが包含される。
 「リクルートメントモデル」においては、抑制性及び刺激性スプライシングファクターなどの他のプレーヤーは、転写のペースに基づいて設定された特定の時間枠内にスプライス部位に結合することができ、結果としてエキソン包含またはエキソン排除となる。
 驚くべきことに、十全大補湯の投与後にイントロンリテンションを受けている遺伝子座の97.2%が健康型に回復していることが観察された。このことから、DNAメチル化とRNA Pol II伸長がこの過程に関与していることが示されるか、あるいは強く推測される。DNAメチル化が低レベルであることで、スプライシングされなかったイントロンをエンコードするDNA中のスプライスジャンクション付近において、MeCP2 (methyl CpG binding protein 2) 結合が減少した。これにより、TRA2b(SRSF10)やSrsfファミリーメンバーなどのスプライシング促進ファクターのリクルートメントが減少し、対応するmRNAに対して、イントロンリテンションが生じる。
 さらに、MeCP2レベルの減少は、イントロンリテンションと一致するゲノム位置でのRNAPol II伸長の遅れと関連する。Pol II伸長が遅れることは、スプライシングリプレッサーのリクルートメントの増加に寄与し、イントロンリテンションのさらなる増加をもたらす。これらのデータから、上記2つのモデルを結び付けることによってイントロン保持を促進することにおける、DNAメチル化減少の原因となる役割が実証されたといえる。
 特定のSrsfファミリーメンバー(srsf5, 6, 11)をエンコードする遺伝子は、そのスプライシングパターンが老化と共に変化した上流遺伝子として検出されたが、Srsf5とSrsf6のイントロンは、老化の間も保持されている。これらの遺伝子の活性は、ナンセンス変位依存分解(nonsense-mediated decay)のような監視メカニズムによって減少し得る。それにより、これらのファクターのリクルートメントが減少したことから生じるMeCP2の喪失を通じて、イントロンリテンションの蓄積に寄与することになり得る。
 十全大補湯を摂取した後の多くの遺伝子におけるスプライシングパターンが回復したのは、DNAメチル化が正常化したこと、及び、Srsfファミリーメンバーのイントロンリテンションが回復したことによって促進された転写伸長速度と加速されたこと、が原因であるともいえる。
以上のような理論的背景からも、遺伝子が老化型であるか、健康型であるかを知るためにDNAメチル化等の適用が可能であることが示される。
 なお、上述したように、上流遺伝子は、下流遺伝子のスプライシングを支配(制御)しており、十全大補湯などの物質を摂取することにより、上流遺伝子を老化型から健康型に戻し、健康型に戻った上流遺伝子が、老化型に変わった下流遺伝子を健康型に戻す。ただし、十全大補湯などの物質それ自体が、下流遺伝子に直接働きかけて健康型に戻すという作用を有する可能性も考えられる。
 すなわち、下流遺伝子が老化型から健康型へと変換する原因が、上流遺伝子に由来するものに限られるとは断言できない。従って、上述の説明では、選択的スプライシングで健康型に変換された遺伝子として上流遺伝子を対象として、遺伝子を老化型から健康型に戻す、薬学的に許容される物質を求めるための解析を行ったが、下流遺伝子についても同様の解析を行うことで、遺伝子を老化型から健康型に戻す物質をより高い解像度、あるいはより高い精度で求めることが可能である。
 具体的には、上流遺伝子及び下流遺伝子を含めて350以上の遺伝子が肝臓で変化をしており、これらを全て解析対象にすれば、薬学的に許容される物質の摂取などによる効果や老化度の変化をより精度良く検出することが可能である。ただし、これらすべての遺伝子に対して解析を行うことは多大な時間及び労力を必要とすることから、上流遺伝子に対する解析を行うことは、物質の摂取などによる効果や老化度の変化を効率良く検出する上で有利である。
 なお、以上の説明では、スプライシングパターンのうちイントロンリテンションが生じているmRNAにおいては、その97.2%において、スプライシングパターンの回復が認められたことから、主にスプライシングパターンのうちイントロンリテンションが生じているmRNAを主な対象とした。しかし、これに限定されるものではなく、上述したSkipped Exon(SE)パターン、Alternative 5' Splice Site(A5SS)パターン、Alternative 3' Splice Site(A3SS)パターン、Mutually eXclusive Exons(MXE)等の他のスプライシングパターンにも適用できる。
 上述したように、肝臓の遺伝子においては、添加給餌を繰り返したクロトーマウスと通常給餌のみのクロトーマウスとの間で368座位において、選択的スプライシングの変化が発生している。そのうち、88.3%(325座位)はスプライシングパターンの老化型から健康型への回復である。このことからも、イントロンリテンションに限らず、その他のスプライシングパターンにおいてもスプライシングパターンの老化型から健康型への回復が発生していることが明瞭に示される。
 図13(a)~(c)に、試験例1において上流遺伝子Ptbp1における、図1の二段目に示されるSkipped Exon(SE)スプライシングパターンの説明図を示す。なお、図中のKl+、Kl-は、図3(a)等におけるKL+、KL-と同様に、それぞれ、十全大補湯を添加給餌したクロトーマウス、十全大補湯を添加給餌しなかったクロトーマウスを表す。また、WT等のその他の記号は、図3(a)等における記号と同一である。
 図13の(a)を参照すると、エキソンE9がスキップされており、スプライシングパターンがSEであることが示される。図13の(b)を参照すると、十全大補湯を添加給餌していないクロトーマウス(Kl-)read値のパターンは、十全大補湯を添加給餌したクロトーマウス(Kl+)及び十全大補湯を添加給餌していない野生のマウス(WT-)のread値のパターンとは異なるものになっている。
 そして、図13の(c)に示されるように、Fold changeの値、つまりlog2IJC/SJCの値は、Kl+とWT-においては同じくらいの値であるが、Kl-ではその値が1/3程度であり、明らかに小さい値になっていることが示される。このことは、十全大補湯を添加給餌することで、クロトーマウスの上流遺伝子Ptbp1において、SEスプライシングパターンが老化型から健康型に回復していることを示す。
 従って、図13(a)~(c)からも、イントロンリテンションに限らず、その他のスプライシングパターンにおいてもスプライシングパターンの老化型から健康型への回復が発生していることが明瞭に示される。
<第2実施形態>
 次に、本発明の第2実施形態について説明する。第2実施形態では、人体についての生体状態の解析例を説明する。すなわち、生体状態としての人体の状態を測定対象の測定結果に基づいて解析する例を説明する。測定対象としては、心拍、脳波、脈拍、呼吸、発汗などの生体現象によって体内から発せられる生体信号(Biosignal)が挙げられるが、その他の対象を用いることもできる。第2実施形態では遺伝子の発現を例にとり、「未病」という概念を用いて人体の生体状態を解析した。
 図14に、未病の概念の説明図を示す。図中、時間の流れを矢印の方向で示す。図に向かって左から右の方向が時間の経過方向を表す。T1で表される図の左端に近い時点は健康状態を示し、E1は、僅かな代謝の変化等による未病の開始時点を示す。
ここで、未病とは、生物が健康な状態から僅かな代謝の変化やその他の要因により何らかの異変が生じているがその影響が顕在化してはいない状態をいう。つまり、未病とは、健康と病気の中間にある状態であるともいえる。便宜上、このような状態を「未病状態」と呼ぶ場合がある。 
未病状態では、既存の基準では病気と診断されないが、何らかの病気の発症危険が有意に高くなっている。また、図示されるように、時間が経過するにつれてホメオタシス(恒常性)の乱れが大きくなっていることが示される。
 この未病状態が発生した後に、第1実施形態で説明したイントロンリテンションが出現する。これは図14においてE2で表される。その後、E2におけるイントロンリテンションの出現の影響として、E3において遺伝子の発現(タンパク質の発現)が顕在化する。タンパク質発現に変化が生じた結果として、E4において病理的異常所見が出現する。このように、病理的異常所見が出現した結果として、人体は病気あるいは死に至る。
 また、図14において、T2は、未病の開始時点E1とイントロンリテンションの出現時点E2との間の時点を示す。以下の説明では、E2以降の時点において、イントロンリテンションが出現した遺伝子座を特定する例が示されているが、つまり、E1とE2との間であるT2においてイントロンリテンションは出現していないが、代謝の変化等が生じていることを検知することができる場合、T2の時点において未病状態を検知することも可能である。未病状態は、できるだけ早く検知されることが望ましい。
 図14のT3は、イントロンリテンションの出現とタンパク質発現変化の顕在化との間の時点を表し、T4は、タンパク質発現変化の顕在化と病理的異常所見の出現との間の時点を表す。T3及びT4の時点は、いずれも病理的所見が出現する前なので、これらの時点のいずれかでイントロンリテンションが出現した遺伝子座を特定することができれば、未病を検知することができる。また、特定されたイントロンリテンションに対応して、JTT投与等の対応する処置を行うことで、病理的異常所見が出現する前に、人体を未病状態から健康状態に戻すことも可能となる。
 なお、未病の研究としては、「動的ネットワークバイオマーカー理論(DNB理論)」と呼ばれる生体信号の揺らぎに着目した数学理論も知られている。DNB理論では、実用的に簡易化したインデックスを用いて実データを解析することで、メタボリックシンドロームの未病を科学的に検出している。DNB理論では、健康な状態から病気の状態へと遷移する直前において、一部の互いに関連した生体信号の揺らぎが大幅に増加した時点を未病状態と定義し、これにより、未病を生体信号データの解析を介して定量的に直接検出することを可能としている。
 特に、恒常性が維持される状態、つまり正常(健康)状態では、遺伝子の発現量についてDNB理論により解析を行うと、エネルギーが低く高ロバスト・高レジリエンス性が認められる状態にあることが示された。そして、未病状態、つまり疾病前状態においては、遺伝子の発現においてエネルギーが高く揺らぎが発生している状態が観察された。この状態は低ロバスト・低レジリエンス性が認められる状態である。
 そして、正常状態と未病状態とは可逆性があり、適切な処置を行うことで未病状態から正常状態に戻すことができることが確認された。一方、未病状態を放置すると、異常(疾病)状態になり、この状態では、遺伝子の発現量においてエネルギーが低く高ロバスト・高レジリエンス性が認められる状態になった。また、未病状態と異常状態とは非可逆性であり、異常状態になってしまうと未病状態に戻すことはできなかった。
 また、この研究では、メタボリックシンドロームを自然発症するマウス(TSODマウス)を飼育し、3週齢から7週齢まで1週間おきに、脂肪組織における遺伝子の発現量をマイクロアレイ法により網羅的に測定した。次に、DNB理論に基づくデータ解析を行い、測定期間内で揺らぎの増加した時点があるかどうかを調べ、その結果、マウスがメタボリックシンドロームを発症する以前の5週齢の時点において、147個の遺伝子の発現量の揺らぎが大きく増加していることが明らかとなった。
 このように、上述の研究ではDNB理論により未病状態を定量的に検出している。これに対し、第2実施形態では、理論に基づく解析ではなく、m-RNAにおけるイントロンリテンションを測定することで未病状態を検出するというアプローチを行い、なおかつ、未病状態を正常状態に戻すことを可能とした。特に、第2実施形態では、イントロンリテンションが遺伝子座に発生した状態を未病状態とし、イントロンリテンションが発生している遺伝子座を特定する。そして、その遺伝子座に対応して、第1実施形態のようにJTT投与等の対処を行うことで、イントロンリテンションを回復させ、その結果として未病状態を健康状態に戻すようにした。
 このように、未病状態を検出するだけでなく、未病状態を回復させる具体的な手法を提供することについては従来知られておらず、本発明によって初めて可能となったものである。なお、以下の説明では、選択的スプライシングが正常に行われずにイントロンリテンションが発生した状態を、便宜上、未病型スプライシングパターンと呼ぶ。
 第2実施形態では、第1実施形態と同様にクロトーマウスにおけるイントロンリテンションを測定し、その未病型スプライシングパターンが回復した遺伝子と回復しなかった遺伝子についての特徴を調べた。
 具体的には、図8に示される、肝臓で発現する70の「完全回復(complete recovery)」遺伝子、120の「回復なし(no recovery)」遺伝子、および他のすべての遺伝子(約250,000の遺伝子座)のイントロンについて、その特徴を測定した。この遺伝子のイントロンの特徴の測定結果を表すグラフを図15(A)~図15(D)に示す。
 図15(A)において「intron length」はイントロンの長さを示し、縦軸においてはイントロン長の常用対数値(log10(length))が示されている。図15(B)において「GC content」はGCコンテンツ(DNA分子中の4つの塩基のうちグアニンとシトシンの割合、GC%)を示す。図15(C)において「5' splice site strength」は、5'スプライスサイトの強度を示す。この強度は図中の縦軸においてスプライスサイトスコア(Splice site score)として示され得る。図15(D)では、同様に3'スプライスサイトの強度及びスコアが示されている。
 図示されるように、「完全回復」および「回復なし」の遺伝子座におけるイントロンの長さは、他のすべての遺伝子におけるイントロンの長さよりも著しく短かった(図15(A))。ただし、「完全回復」遺伝子座と「非回復」遺伝子座のイントロン長に有意差はなかった。このことから、JTTに関連する回復プロセス中において、「完全回復」遺伝子座が「回復なし」遺伝子座から選択的に識別されることはなかったことが示唆される。
 一方、「完全回復」および「回復なし」グループに関連するイントロンのGCコンテンツは、他のすべての肝臓関連イントロンのGCコンテンツよりも有意に高かった(図15(B))。また、この点において「完全回復」イントロンと「回復なし」イントロンの間に有意差はなく、GC含有量はRI遺伝子座の回復状態とは関連がないことが示唆される。
 次に、ソフトウェアMaxEntScanを使用してこれらのスプライスサイトのスコアを計算することにより、5 'および3'スプライスサイトの強度を調べた。
 「完全回復」および「回復なし」遺伝子座のイントロンの5 'スプライス部位は、他のすべての肝臓関連イントロンのスプライスサイトよりもわずかではあるが有意に弱かったが(図15(C))、3'スプライスサイトではそのような違いは見られなかった(図15(D))。
 RI(イントロンリテンション)遺伝子座のイントロンのこれらの特徴は、他の3つの器官で観察され(図15(A)~図15(D)を参照)、これは従来に報告されたデータと一致している(Braunschweig et al., 2014)。
 したがって、イントロン長が短く、GC含有量が高く、5 '部位のスプライシングスコアが低い遺伝子座ではイントロンが保持される傾向がある。
 また、図15(A)~図15(D)に示されるように、RI遺伝子座には際立った特徴がある。図15(A)~図15(D)は、イントロンに関連して測定された各種データの箱ひげ図を示す。図15において(A)はイントロン長、(B)はイントロン配列におけるGCパーセンテージ、(C)は5’スプライスサイトの強度スコア、及び(D)は3’スプライスサイトの強度スコアを示す。
 これら図15(A)~図15(D)は、イントロンの3つのグループ間、つまり、「回復なし」(図中のno recovery)と、「完全回復」(図中のcomplete recovery)と、肝臓発現遺伝子(254,005遺伝子座)からのすべてのイントロン(図中のAll introns)と、の間での比較を表す。その結果、図中において検定はt検定(t-test)で行なった。有意水準は* P≦0.05、*** P≦0.001、nsは有意ではない事を示す。
 これらの結果から、イントロンリテンションを起こす可能性のある遺伝子座を絞り込むことができる。特に、図15(A)、図15(B)、図15(C)の結果から、イントロン長(intron length)が短くかつGCコンテンツが高く、かつ弱い5’スプライスサイトを持つイントロンは、イントロンリテンションを起こす可能性が高いので、これを指標にイントロンリテンションを起こしやすい遺伝子座を絞り込むことができる。
 例えば、一つの遺伝子には通常10~30、平均して20程度のエキソンが含まれ、また、人体には2万~3万程度の遺伝子が含まれることが既知である。このように人体には40万~60万種類のエキソンが存在し、これらについてイントロンリテンションが起こりうるか否かを判定することは非常に困難である。
 一方、第2実施形態では、上記のようにイントロン長が短くかつGCコンテンツが高く、弱い5’スプライスサイトを持つイントロンという条件で、イントロンリテンションを起こしうるエキソンを絞り込むことができる。その結果、40~60万種類の遺伝子座のうちから、イントロンリテンションを起こしうると推定されるエキソンを1万弱程度に絞り込むことが可能である。その結果、遺伝子座を絞り込んでイントロンリテンションの検出を行うことが可能である。
 なお、イントロンリテンションを起こす可能性のある遺伝子座について説明したが、これを用いてイントロンリテンションがある程度回復が可能な遺伝子座を絞り込む事が可能である。このようにして特定された1万弱の遺伝子座について、未病検査用マイクロアレイを用いて未病検査を行うことで、未病検査にかかる時間や労力を劇的に少なくすることができる。未病検査用マイクロアレイは、上述のように絞り込まれた遺伝子座の少なくとも幾つかについてイントロンリテンションの検査を行う検査用カスタムマイクロアレイである。
 遺伝子座については、既に健康な状態でのデータが知られている。未病検査用マイクロアレイは、上述の絞り込まれた遺伝子座のうちの少なくとも一部についての健康な状態での参照データが格納された参照データ格納部と、体液格納部と、遺伝子座情報検出部と、解析部とを有する。未病検査用マイクロアレイで未病の状態検知する場合、人体から採取した血液等の体液が体液格納部に格納される。遺伝子座情報検出部は、体液格納部に格納された体液から、その遺伝子座の情報を検出する。解析部は、遺伝子座情報検出部で検出された遺伝子座情報と、上述のように絞り込まれた遺伝子座についての参照データとを比較して遺伝子座情報の解析を行い、これにより、イントロンリテンションが発生している遺伝子座を特定する。
 このようにして未病検査用マイクロアレイを用いてイントロンリテンションが発生している遺伝子座を特定することで、特定された遺伝子座に応じてJTT投与等の対処を行うことが可能である。
 実際に、「イントロン長が短くかつGCコンテンツが高く、弱い5’スプライスサイトを持つイントロン」という条件でイントロンリテンションを起こしうるエキソンには、第1実施形態で用いたエキソンである、図8に示した70の「完全回復」の遺伝子全てが対応する。
 また、上記の条件で絞り込まれたエキソンである70遺伝子に対して第1実施形態のようにイントロンリテンションの有無を調べ、健康状態におけるエキソンと比較することで、未病検査を行うことが可能であった。
 その結果、イントロンリテンションを回復させて未病状態を健康状態に戻すことができる。このように、第2実施形態によれば、未病状態を定量的に検出するだけでなく、未病状態を回復させる具体的な手法が提供される。また、このように第1実施形態を応用して幾つかの遺伝子座について未病状態を検出して健康状態に回復させることが可能であることから、上述の絞り込まれた1万の遺伝子座の情報を格納してイントロンリテンションの検査を行う検査用カスタムマイクロアレイを製造することも可能であることが確かめられた。
 なお、以上の説明では、図8のように肝臓において「完全回復」が確認された70の遺伝子について記載したが、本発明はこの70の遺伝子に限定されるものではなく、イントロンリテンションを起こしうるすべての遺伝子について適用可能なものである。
 第1実施形態及び第2実施形態により本発明を説明したが、本発明は、以下の処理を実行することによっても実施が可能である。すなわち、上述した情報処理装置の機能を実現するコンピュータプログラムを、ネットワークまたは各種記憶媒体を介してコンピュータないしそれを含むシステムに供給する。そしてそのコンピュータが上記コンピュータプログラムを読み出して実行する処理である。この場合、そのコンピュータプログラム、および当該コンピュータプログラムを記憶した記録媒体は、本発明を構成することになる。

Claims (12)

  1.  真核生物のmRNA前駆体におけるイントロンの除去状態を定量的に解析することにより、基準となる遺伝子発現パターンを導出する第1スプライシングパターンとは異なる遺伝子発現パターンを導出する可能性がある第2スプライシングパターンの有無を検出し、
     前記第2スプライシングパターンが有るときは、当該第2スプライシングパターンを前記第1スプライシングパターンに近づけるための薬学的に許容される物質の情報を予め作成された物質リストから特定し、特定した前記情報を前記真核生物に固有の情報として出力することを特徴とする、
     mRNA前駆体の解析方法。
  2.  前記物質は、漢方薬又は漢方薬が溶け込んだ液状体であることを特徴とする、
     請求項1に記載の解析方法。
  3.  前記液状体が十全大補湯であることを特徴とする、
     請求項2に記載の解析方法。
  4.  真核生物から当該真核生物のmRNA前駆体のデータを含む検体データを取得する取得手段と、
     取得した前記検体データに対してmRNA前駆体におけるイントロンの除去状態を定量的に解析することにより、所定の遺伝子発現パターンを導出する第1スプライシングパターンと異なる遺伝子発現パターンを導出する可能性がある第2スプライシングパターンの有無を検出する解析手段と、
     前記第2スプライシングパターンが検出されたときに、当該第2スプライシングパターンを前記第1スプライシングパターンに近づけるための薬学的に許容される物質の情報を所定の物質データベースから索出する検索手段と、
     索出した前記情報を前記真核生物に固有の情報として出力する出力手段と、
     を備える情報処理装置。
  5.  前記第1スプライシングパターンは、健康状態の遺伝子でのスプライシングパターンであり、前記第2スプライシングパターンは、老化型の遺伝子でのスプライシングパターンであることを特徴とする、
    請求項4に記載の情報処理装置。
  6.  前記第1スプライシングパターンは、健康状態の遺伝子でのスプライシングパターンであり、前記第2スプライシングパターンは、何らかの異変が生じているがその影響が顕在化していない未病状態の遺伝子でのスプライシングパターンであることを特徴とする、
    請求項4に記載の情報処理装置。
  7.  前記解析手段は、取得した前記検体データのスプライシングの調節因子のうち下流遺伝子を制御する上流遺伝子における前記第2スプライシングパターンの有無を検出することを特徴とする、
     請求項4~6のいずれか一項に記載の情報処理装置。
  8.  前記解析手段は、同一の真核生物から複数回取得した前記検体データに対して前記解析を行い、それぞれ選択的スプライシングの結果情報を時系列に蓄積するとともに、蓄積された結果情報のうち基準となる真核生物による選択的スプライシングの結果情報と最も類似する結果情報を導出した選択的スプライシングの結果情報を前記真核生物における前記第1スプライシングパターンとして保存する、
     請求項4~7のいずれかに記載の情報処理装置。
  9.  前記物質は、漢方薬又は漢方薬が溶け込んだ液状体であることを特徴とする、
     請求項4~8のいずれか一項に記載の情報処理装置。
  10.  前記液状体が十全大補湯であることを特徴とする、
     請求項9に記載の情報処理装置。
  11.  前記検索手段は、前記第2スプライシングパターンを前記第1スプライシングパターンに近づけるためのアクションの情報を所定のアクションデータベースから索出することを特徴とする、
     請求項4~10のいずれか一項に記載の情報処理装置。
  12.  コンピュータを請求項4~11のいずれか一項に記載された情報処理装置として動作させるためのコンピュータプログラム。
PCT/JP2020/004901 2019-02-08 2020-02-07 mRNA前駆体の解析方法、情報処理装置、コンピュータプログラム WO2020162613A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US17/428,807 US20220073971A1 (en) 2019-02-08 2020-02-07 Method for analyzing mrna precursor, information processing apparatus, and computer program
EP20752573.4A EP3922730A4 (en) 2019-02-08 2020-02-07 METHOD OF ANALYZING AN MRNA PRECURSOR, INFORMATION PROCESSING DEVICE AND COMPUTER PROGRAM

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2019-021463 2019-02-08
JP2019021463 2019-02-08
JP2019-217279 2019-11-29
JP2019217279A JP6931860B2 (ja) 2019-02-08 2019-11-29 mRNA前駆体の解析方法、情報処理装置、コンピュータプログラム

Publications (1)

Publication Number Publication Date
WO2020162613A1 true WO2020162613A1 (ja) 2020-08-13

Family

ID=71947006

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/004901 WO2020162613A1 (ja) 2019-02-08 2020-02-07 mRNA前駆体の解析方法、情報処理装置、コンピュータプログラム

Country Status (2)

Country Link
US (1) US20220073971A1 (ja)
WO (1) WO2020162613A1 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013039111A (ja) * 2011-08-19 2013-02-28 Shizuoka Prefecture スプライシングバリアント
JP2017220012A (ja) * 2016-06-07 2017-12-14 株式会社リコー 情報処理装置、情報処理方法、プログラムおよび情報処理システム
WO2018130410A1 (en) * 2017-01-13 2018-07-19 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Method of actuating a shape changeable member, shape changeable member and actuating system
JP2018525994A (ja) * 2015-09-01 2018-09-13 エーザイ・アール・アンド・ディー・マネジメント株式会社 ネオモルフィックsf3b1変異体に関連するスプライスバリアント
JP2020038021A (ja) * 2018-09-03 2020-03-12 西光エンジニアリング株式会社 マイクロ波減圧乾燥機及び乾燥食品等の製造方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013039111A (ja) * 2011-08-19 2013-02-28 Shizuoka Prefecture スプライシングバリアント
JP2018525994A (ja) * 2015-09-01 2018-09-13 エーザイ・アール・アンド・ディー・マネジメント株式会社 ネオモルフィックsf3b1変異体に関連するスプライスバリアント
JP2017220012A (ja) * 2016-06-07 2017-12-14 株式会社リコー 情報処理装置、情報処理方法、プログラムおよび情報処理システム
WO2018130410A1 (en) * 2017-01-13 2018-07-19 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Method of actuating a shape changeable member, shape changeable member and actuating system
JP2020038021A (ja) * 2018-09-03 2020-03-12 西光エンジニアリング株式会社 マイクロ波減圧乾燥機及び乾燥食品等の製造方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"The emerging role of alternative splicing in senescence and aging", October 2017
NORIHIRO OKADA, KENSHIRO OSHIMA, YUKI IWASAKI, AKIKO MARUKO, ERIKA IIOKA, NAOKI FUJITSUKA, MITSUE NISHIYAMA, AKINORI NISHI, ATSUSH: "3PW-09-2 Juzentaihoto, a Chinese herbal medicine, reduces intron retention associated with aging and restores splicing to a healthy form.", 42ND ANNUAL CONFERENCE OF THE MOLECULAR BIOLOGY SOCIETY OF JAPAN; DECEMBER 3-6, 2019, vol. 42, 5 December 2019 (2019-12-05), JP, pages 166, XP009530210 *

Also Published As

Publication number Publication date
US20220073971A1 (en) 2022-03-10

Similar Documents

Publication Publication Date Title
Lan et al. Combined expression trait correlations and expression quantitative trait locus mapping
Wadman et al. Drug treatment for spinal muscular atrophy type I
Mahajan et al. Altered neuro-inflammatory gene expression in hippocampus in major depressive disorder
Bunney et al. Microarray technology: a review of new strategies to discover candidate vulnerability genes in psychiatric disorders
Agus et al. The caudate nucleus undergoes dramatic and unique transcriptional changes in human prodromal Huntington’s disease brain
Neumeister et al. Differential effects of 5-HTTLPR genotypes on the behavioral and neural responses to tryptophan depletion in patients with major depression and controls
Ghazalpour et al. Genomic analysis of metabolic pathway gene expression in mice
Turner et al. Knowledge-driven multi-locus analysis reveals gene-gene interactions influencing HDL cholesterol level in two independent EMR-linked biobanks
WO2018160548A1 (en) Markers for coronary artery disease and uses thereof
US20210074378A1 (en) Methods for Analyzing Genetic Data to Classify Multifactorial Traits Including Complex Medical Disorders
Sahm et al. Increased longevity due to sexual activity in mole-rats is associated with transcriptional changes in the HPA stress axis
Schaum et al. The murine transcriptome reveals global aging nodes with organ-specific phase and amplitude
Polesskaya et al. Nicotine causes age-dependent changes in gene expression in the adolescent female rat brain
WO2019069067A1 (en) BIOMARKER
Blue et al. Association of uncommon, noncoding variants in the APOE region with risk of Alzheimer disease in adults of European ancestry
US20190243945A1 (en) Leveraging Genomic, Phenotypic and Pharmacological Data to Cure Disease
Listyarini et al. Hepatic transcriptome analysis reveals genes, polymorphisms, and molecules related to Lamb Tenderness
Lechner et al. Cardiomyopathy as cause of death in Duchenne muscular dystrophy: a longitudinal observational study
Kazani et al. The role of pharmacogenomics in improving the management of asthma
WO2020162613A1 (ja) mRNA前駆体の解析方法、情報処理装置、コンピュータプログラム
JP6910039B1 (ja) mRNAの解析方法、情報処理装置、コンピュータプログラム
Christopher et al. A variant in PPP4R3A protects against alzheimer‐related metabolic decline
Johnston et al. Genetically regulated gene expression in the brain associated with chronic pain: Relationships with clinical traits and potential for drug repurposing
US20210255198A1 (en) Methods for objective assessment of stress, early detection of risk for stress disorders, matching individuals with treatments, monitoring response to treatment, and new methods of use for drugs
Zhang et al. Cross-platform expression microarray performance in a mouse model of mitochondrial disease therapy

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20752573

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2020752573

Country of ref document: EP

Effective date: 20210908