WO2024062867A1 - 対象のがん罹患の可能性を分析する方法 - Google Patents

対象のがん罹患の可能性を分析する方法 Download PDF

Info

Publication number
WO2024062867A1
WO2024062867A1 PCT/JP2023/031406 JP2023031406W WO2024062867A1 WO 2024062867 A1 WO2024062867 A1 WO 2024062867A1 JP 2023031406 W JP2023031406 W JP 2023031406W WO 2024062867 A1 WO2024062867 A1 WO 2024062867A1
Authority
WO
WIPO (PCT)
Prior art keywords
cancer
sequence
rna
subject
types
Prior art date
Application number
PCT/JP2023/031406
Other languages
English (en)
French (fr)
Inventor
友美 安東
美津子 石原
良威 佐野
拓也 宮川
幸二 橋本
Original Assignee
株式会社 東芝
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社 東芝 filed Critical 株式会社 東芝
Priority to US18/591,077 priority Critical patent/US20240200149A1/en
Publication of WO2024062867A1 publication Critical patent/WO2024062867A1/ja

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/178Oligonucleotides characterized by their use miRNA, siRNA or ncRNA

Definitions

  • Embodiments of the present invention relate to a method of analyzing the possibility of a subject suffering from cancer.
  • miRNA is a single-stranded nucleic acid of about 17 to 25 bases, and has been shown to have the function of regulating gene expression. It has been reported that its type and expression level change from the initial stage in various diseases. For example, in cancer patients, various miRNA levels are used as cancer markers, and are known to increase or decrease compared to healthy individuals.
  • the problem to be solved by the present invention is to provide a method that can more easily detect cancer at an early stage.
  • the method for analyzing the possibility of developing cancer includes counting the number of types of RNA in a sample derived from a subject for types of RNA in which sequence variations based on RNA editing exist compared to a reference sequence. and determining the possibility of the subject suffering from cancer using the obtained number of types of RNA as an index.
  • FIG. 1 is a schematic diagram showing a first embodiment.
  • FIG. 2 is a diagram illustrating an example of the first embodiment.
  • FIG. 3 is a schematic diagram showing an example of the second embodiment.
  • FIG. 4 is a schematic diagram showing a further example of the second embodiment.
  • FIG. 5 is a schematic diagram showing the third embodiment.
  • FIG. 6 is a schematic diagram showing an example of the fourth embodiment.
  • FIG. 7 is a diagram showing an example of the fourth embodiment.
  • FIG. 8 is a diagram showing an example of the fourth embodiment.
  • FIG. 9 is a schematic diagram showing the fifth embodiment.
  • FIG. 10 is a diagram showing an example of the fifth embodiment.
  • FIG. 11 is a diagram showing a further example of the fifth embodiment.
  • FIG. 12 is a diagram showing a further example of the fifth embodiment.
  • FIG. 13 is a diagram showing the results of Example 1.
  • FIG. 14 is a diagram showing the results of Example 2.
  • FIG. 15 is a diagram showing the results of Example 3.
  • the analysis method according to the embodiment of the present application provides knowledge that can distinguish between cancer patients and non-cancer patients by clarifying how sequence variations based on RNA editing exist in RNA groups. It was achieved by what I learned. This discovery makes it possible to qualitatively, rather than quantitatively, analyze the possibility of a subject developing cancer. Thereby, it is possible to detect cancer at an early stage more easily and at a lower cost. For example, since there is no need to quantify genes, there is no need to ensure quantitative performance.
  • the analysis method is a dramatic and technological method based on a very original discovery.
  • This embodiment is a method for analyzing the possibility of a subject suffering from cancer.
  • the analysis method involves counting the number of RNA types in a sample derived from the subject, that is, the number of types, in which there is sequence variation due to RNA editing compared to a reference sequence, and counting the number of types obtained. This includes determining the possibility of the subject suffering from cancer using this as an indicator.
  • RNA editing is a mechanism in animals and plants that replaces the base sequence of RNA transcribed from DNA or RNA that is being transcribed, or inserts or deletes one to several bases. It is considered to be one of the post-transcriptional modifications of RNA, and has been reported to be involved in the control of various biological processes.
  • a typical example of RNA editing will be explained using FIG. 2. That is, typical examples of RNA editing are (1) A-to-I RNA editing, (2) C-to-U RNA editing, (3) insertion of one to several bases, and (4) one to several bases. deletion (deletion), etc.
  • A-to-I RNA editing (adenosin to inosin editing) is RNA editing by ADAR enzyme.
  • RNA editing cytidine to uridine editing
  • C-to-U RNA editing is the substitution of cytidine (C) with uridine (U).
  • the reference sequence may be any sequence that has not undergone sequence variation due to RNA editing, and may be, for example, a corresponding wild-type sequence.
  • Information on wild-type sequences can be obtained, for example, from gene banks according to the type of RNA, databases that collect all genetic data such as Ensembl or NCBI, and information about specific types of RNA such as miRBase, which is a miRNA database. You can use or refer to the collected database, and if the information is updated, you can refer to the latest information as desired.
  • the reference sequence may be a specific full-length RNA, a partial sequence of a specific RNA, or a combination thereof.
  • Samples derived from a subject include cells, tissues, and/or fluids collected from a subject, mixtures thereof, and processed products obtained by appropriately processing them.
  • the sample may be, for example, serum or plasma, or other body fluids, such as blood, leukocyte interstitial fluid, urine, stool, sweat, saliva, oral mucosa, nasal mucosa, nasal mucus, pharynx. It may be mucous membrane, sputum, digestive fluid, gastric juice, lymph fluid, spinal fluid, tear fluid, breast milk, amniotic fluid, semen, vaginal fluid, or a mixture thereof.
  • the sample may be a tissue, a cell, a mixture thereof, or the like.
  • the samples may also be freshly taken from a subject, cultured, preserved in a desired procedure, or their supernatant obtained after maintaining them in a desired liquid. It is preferable to use body fluids such as blood, serum, and plasma as samples from the subject because they are easy to collect.
  • RNA extraction method may be performed by a method known per se, for example, it is also possible to use a commercially available kit.
  • the subject is the animal that is subjected to analysis in this method, that is, the animal that provides the sample.
  • the subject may be an animal with some disease or a healthy animal.
  • the target may be an animal that may be suffering from cancer or an animal that has suffered from cancer in the past, especially an animal that may be suffering from breast cancer. , or may be an animal that has suffered from breast cancer in the past.
  • the subject is a human.
  • the target may be another animal.
  • Other animals are, for example, mammals, such as primates such as monkeys, rodents such as mice, rats, or guinea pigs, companion animals such as dogs, cats, or rabbits, domestic animals such as horses, cows, or pigs, Or, it includes animals belonging to exhibition animals, etc.
  • RNA with sequence variations rather than measuring the expression level or copy number of a specific RNA species, the analysis method does not measure the expression level or copy number of a specific RNA species. The number of types of RNA having a sequence, that is, having sequence variations is counted.
  • the number of types can be counted by, for example, comprehensively examining and counting RNA in a specific category, or by setting a specific or arbitrary RNA population and comprehensively examining and counting them.
  • the number of RNA molecules included in the RNA population may be a number registered in a database to be used, or may be arbitrarily selected from there.
  • miRBase currently has 38,589 pre-miRNAs and 4,860 miRNAs registered for 271 biological species. Of these, 1917 pre-miRNAs and 2654 miRNAs have been registered in the human genome. These numbers may be the number of RNA molecules contained in the RNA population, but are not limited thereto.
  • RNA may be, for example, about 17 bases to about 25 bases in length in the case of miRNA, but is not limited thereto.
  • it may be, for example, about 60 base pairs to about 70 base pairs.
  • the length of RNA may be, for example, 17 to 25 bases in the case of miRNA, but is not limited thereto.
  • it may be, for example, 60 to 70 base pairs.
  • RNA to be counted may be any RNA species that may have sequence variation due to RNA editing, such as RNA, mRNA, ncRNA (non-coding RNA), housekeeping ncRNA, tRNA, small ncRNA, miRNA, piRNA, It may be tsRNA, IncRNA, etc. These RNAs may be counted comprehensively, several categories may be counted in a mixed state, or RNAs of a specific category may be counted. For example, when counting a specific category of RNA, it may be mRNA, tRNA, small ncRNA, miRNA, piRNA, tsRNA, etc., and for example, it may be a mixture of at least two of these categories.
  • RNA such a specific category of RNA may be, for example, miRNA.
  • the number of RNA types distributed in an RNA group is counted, rather than the expression level or copy number of a specific RNA type, and based on the obtained number of types, the cancer incidence of the target is determined. The probability can be determined.
  • a site that is less likely to be affected for example, a highly conserved sequence, or a sequence that is or contains a highly conserved site, may be selected.
  • positions 1 to 10 of the 5' end which is called the seed sequence, generally have a low probability of single nucleotide polymorphisms and low sequence variability, making it highly useful. It can be said.
  • Analyzing the possibility of a subject suffering from cancer means, for example, determining whether there is a possibility that the subject has cancer, or determining whether the subject is likely to have cancer or not. It may be possible to determine whether the target is low or to identify whether the subject is a cancer patient or a non-cancer patient. According to the first embodiment, it is possible to mechanically and/or automatically determine the probability that a subject is suffering from cancer based on objective comparison criteria. For example, a method for analyzing the possibility that a subject is suffering from cancer can be rephrased as, for example, a method for acquiring information regarding the possibility that a subject is suffering from cancer.
  • the acquired information can be used by a doctor, for example, for medical purposes to determine, or diagnose, the medical condition or health condition of a human being. If such a "judgment” or “diagnosis” by a doctor is defined as "determination of the presence or absence of a target cancer group in a subject," then this embodiment is a medical examination by a "doctor” for medical purposes. It can also be said to be an ⁇ analytical method that assists'' in ⁇ determining whether or not a subject has cancer.''
  • the determination can be made that if the number of types is greater than a preset threshold, there is a high possibility that the subject is suffering from cancer.
  • the number of types is smaller than a preset threshold, it may be determined that the possibility that the subject is suffering from cancer is low.
  • the threshold value is set by matching the population RNA and the reference sequence, and comparing the results obtained using samples derived from non-cancer patients and the results obtained using samples derived from representative cancer patients. It may be determined by comparing in advance.
  • cancer includes any stage of cancer; for example, a state in which cancer remains within the organ of origin, a state in which cancer has spread to surrounding tissues, and a state in which cancer has spread to lymph nodes. This includes states in which cancer has metastasized, and states in which cancer has spread to distant organs.
  • breast cancer refers to a malignant tumor (neoplasm) formed in mammary gland tissue.
  • breast cancer includes what is commonly referred to as “breast cancer” or “breast cancer.”
  • breast cancer according to embodiments also includes any type of breast cancer, including lobular or ductal carcinoma.
  • Breast cancer according to embodiments also includes, for example, epithelial tumors, non-epithelial tumors, and malignant phyllodes tumors that are both epithelial and non-epithelial.
  • cancers include breast cancer, colon cancer, lung cancer, stomach cancer, pancreatic cancer, cervical cancer, uterine cancer, ovarian cancer, sarcoma, prostate cancer, bile duct cancer, bladder cancer, and esophageal cancer. , liver cancer, brain tumor, and kidney cancer.
  • the method of this embodiment is not a quantitative test but a qualitative test, so there is no need to ensure quantitative performance, so it is excellent in time and economic efficiency for clinical development.
  • serum or plasma which can be easily collected during health checkups, as a sample. Therefore, for example, using serum collected from a subject, it is possible to comprehensively, ie, universally detect cancer as primary screening during a health checkup. Cancer can be detected early.
  • serum, plasma, etc. the physical and economic burden on the subject can be greatly reduced compared to cytodiagnosis, etc., and the procedure is easy, so it is less burdensome on the examiner.
  • the second embodiment is a method for analyzing the possibility of a subject suffering from cancer.
  • the analysis method also counts the number of types in a sample from a subject, for example, a non-cancer control. .
  • the number of types from the subject and the number of types from the non-cancer control are compared to determine the possibility of the subject suffering from cancer.
  • the control may be, for example, a healthy subject.
  • a healthy individual may be at least an individual who is not suffering from cancer.
  • the healthy body is preferably a healthy individual without any disease or abnormality.
  • the individual selected as a control may be a different individual from the subject analyzed by this method, and is preferably an individual belonging to the same species, ie, a human if the subject is a human.
  • the physical conditions such as age, gender, height and weight, or the number of controls are not particularly limited, but the physical conditions may be the same or similar to those of the subjects tested by this analysis method. preferable.
  • samples derived from the subject may be collected over time, and the test results obtained when the subject is a healthy subject may be used as a control, a non-cancer person, or a non-cancer control.
  • FIG. 3 An example of the analysis method according to the second embodiment will be conceptually explained using FIG. 3.
  • miRNA as a specific category of RNA is selected and counted for humans
  • FIG. 3 also conceptually shows an example of a general quantitative test as a comparative example (FIG. 3, S31(f), S32A(g), S32B(h)).
  • a sample (a) from a subject and a sample (f) from a non-cancer control subject are prepared (S31).
  • specific categories of RNA contained in these samples as a population, count the number of types of RNA in samples derived from subjects and non-cancer controls for the types of RNA that have sequence variations due to RNA editing ( S32A(b), (b1), (b2)).
  • the population miRNA is obtained by comprehensively classifying and analyzing miRNAs present in serum, and counting the types of RNAs in which sequence variations based on RNA editing exist.
  • the criterion in this case is that a subject is identified as having a high possibility of suffering from cancer if there are sequence variations based on RNA editing in more types of miRNA than in non-cancer controls.
  • miR-1 is secreted into serum as 3 copies, miR-2 as 2 copies, miR-3 as 6 copies, miR-4 as 0 copies, and miR-5 as 2 copies.
  • S32A(b1) RNA editing was observed in two copies of miR-3 (each marked with an x).
  • miR-3 there is only one type of RNA, ie, miR-3, in which a sequence variation based on RNA editing exists in a sample derived from a non-cancer patient.
  • the results of a simulation assuming that the subject was a cancer patient are shown.
  • RNA editing was observed in 2 copies of miR-1, 1 copy of miR-2, 3 copies of miR-3, and 1 copy of miR-4 (each marked with an x). Therefore, there are four types of RNA, miR-1 to miR-4, in which sequence variations occur due to RNA editing in samples derived from subjects. In comparison, there are 4 types in the subjects compared to 1 type in the control subjects, which is a large number of types. Based on this result, the subject is identified as having a high possibility of suffering from cancer.
  • the analysis method is a qualitative test, and is based solely on RNA editing without taking into account the sequence, target, function, and phenotype of each type of miRNA included in the population miRNA used here. By determining whether there is a mutation or not, and comparing the number of mutations between non-cancer controls and the subject, we can determine the probability that the subject has cancer. can be determined.
  • counting the number of types of RNA in which sequence variations based on RNA editing exist can be used to calculate the mutation frequency in cancer tissue and the secretion of miRNA into serum, for example, as shown in S32B. It can be said that it includes both quantity and information.
  • information such as information that the amount of miRNA secreted into serum is low in normal cells and high in cancer cells (S32B(h)), mutation frequency in cancer tissues, etc.
  • the information (S32B(i)) multiplied by the information that it is low in normal cells and high in cancer cells is the number of miRNA types in which mutations are detected in miRNA in serum, and in normal cells (less x less), cancer In cells, it becomes (many ⁇ many) (S32B(c)). This emphasizes the results, making them easier to see. In addition, it can be a qualitative test that uses the number of particles as an indicator instead of the concentration.
  • the number of types is counted (S41), and the number of types obtained is compared with the number of types obtained from the sample derived from the control, and based on the results, the possibility of the subject suffering from cancer is determined. It may also include determining (S42).
  • the miRNA that becomes the population can be created by using any known miRNA database, or by creating an original database using a known discovery tool, and then selecting any type of miRNA included in those databases. It may be arbitrarily selected, designed and/or set from among the following. Examples of miRNA databases may be miRNABase, Rfam, miRIAD, dbDEMC, etc. Examples of discovery tools may be miRscan, miRNAFold, miRDeep, miRanalyzer, ChIPBase, sRNAbench, etc. Alternatively, it may be arbitrarily selected from an miRNA database in which sequences that can cause mutations based on RNA editing, such as MiREDiBase (miRNA Editing Database), are registered. The number of miRNAs included in the population may be, for example, 300 or more, 400 or more, 500 or more, or 600 or more.
  • the second embodiment is based on the inventors' discovery that it is possible to separate nucleic acids from body fluids that can be collected in a minimally invasive manner, and to use the sequence variations to distinguish between healthy individuals and cancer patients.
  • it is a qualitative test rather than a quantitative test there is no need to ensure quantitative performance, so it is excellent in time and economic efficiency for clinical development.
  • using serum collected from a subject it is possible to comprehensively, ie, universally detect cancer as primary screening during a health checkup.
  • FIG. 5 shows a third embodiment of a method for analyzing the possibility of a subject suffering from cancer.
  • the method includes three steps: a sample data acquisition step (S51), a feature extraction step (S52), and a disease determination step (S53).
  • S51 information regarding sequence variation from the reference sequence is acquired from the body fluid obtained from the subject
  • S52 information regarding sequence variations from a reference sequence is information regarding RNA contained in body fluids.
  • S52 the number of types of RNA in which sequence variation exists is counted (S52).
  • the disease determination step the possibility of cancer disease is determined using the number of types of RNA in which sequence variation exists as an index.
  • this disease determination step may be a step in which it is determined whether the subject is a cancer patient or a non-cancer patient using the index.
  • serum or plasma which can be easily collected during health checkups, as a sample. Therefore, for example, using serum collected from a subject, it is possible to comprehensively, ie, universally detect cancer as primary screening during a health checkup. This allows cancer to be detected early.
  • serum, plasma, etc. the physical and economic burden on the subject can be greatly reduced compared to cytodiagnosis, etc., and the procedure is easy, so it is less burdensome on the examiner.
  • serum or plasma contains a stable RNA concentration, for example, miRNA concentration, more accurate tests can be performed.
  • FIG. 6 shows a fourth embodiment of a method for analyzing the possibility of a subject suffering from cancer.
  • the analysis method includes four steps. First, RNA contained in a sample derived from a subject is classified based on the homology of its sequence to a reference sequence (S61). Next, a group of representative sequences having the same sequence in the RNA population classified with respect to each reference sequence is determined (S62). Each sequence of the representative sequence group is compared with the corresponding reference sequence to detect sequence variations (S63). Furthermore, the number of types of representative sequences having sequence variations is counted (S64). This method can also be used as a method to detect sequence variation.
  • the method for detecting sequence variation is to classify RNA contained in a sample derived from a subject based on the homology of its sequence to a reference sequence, and to identify representative sequences that have the same sequence in the RNA population classified for each reference sequence.
  • the method may comprise determining a group, comparing each sequence of the representative sequence group to a corresponding reference sequence, and detecting each sequence variation.
  • it may also be a method of detecting a sequence variation that can be identified, together with sequence information of the representative sequence, to indicate that a specific representative sequence has undergone sequence variation compared to a corresponding reference sequence.
  • Classifying by RNA sequence homology means creating multiple groups by classifying highly homologous sequences into one group for the sequence of a specific part of the RNA from which information is to be obtained. At that time, a reference sequence (a known sequence obtained from a database) is used as a standard sequence for the group. Classification by homology can be performed, for example, by using next generation sequencing (NGS), qPCR, Sanger, microarrays for RNA detection, hybridization, and the like. Alternatively, it may be performed by using a combination of at least two of these methods.
  • NGS next generation sequencing
  • qPCR qPCR
  • Sanger qPCR
  • microarrays for RNA detection hybridization
  • hybridization hybridization
  • FIG. 7 images of an example of comprehensive analysis of miRNA using a next-generation sequencer are shown in Figures 7 to 11.
  • the samples used were serum collected from 30 healthy subjects, 24 breast cancer cases, 18 lung cancer cases, 24 colon cancer cases, 24 uterine cancer cases, 24 stomach cancer cases, 24 pancreatic cancer cases, 24 prostate cancer cases, 24 ovarian cancer cases, 24 kidney cancer cases, 24 brain tumor cases, 13 cervical cancer cases, 24 bile duct cancer cases, 24 esophageal cancer cases, 24 bladder cancer cases, 24 sarcoma cases, and 3 liver cases.
  • the analyzed miRNAs were has-let-7a-2-3p, has-let-7a-3p, has-let-7a-5p, has-let-7b-3p, has-let-7b-5p, has-let-7c-3p, has-let-7c-5p, has-let-7d-3p, has-let-7d-5p, has-let-7e-3p, has-let-7e-5p, has-let-7f-3p, has-let-7f-5p, has-let-7g-3p, has-let- 7g-5p, has-let-7i-3p, has-let-7i-5p, has-miR-100-3p, has-miR-100-5p, has-miR-101-3p, has-miR-101-5p, has-miR-103a-2p, has-miR-103a-3p, has-miR-103b, has-miR-105-3p, has-miR-103-5p, has-miR-106a-3p, has-
  • FIG. 7(b) shows a portion of the results.
  • Column A lists the names of miRNAs, and columns C, D, E, etc. list data for 30 cases of healthy individuals and patients with each type of cancer. This shows that the RNA contained in the samples derived from the subjects has been classified according to their sequence homology.
  • the sequences with sequence variations selected from each population were defined as a candidate list.
  • the table in Figure 8 (c) is a portion of the data from Figure 7 (b), and the presence or absence of mutations is determined for the types of miRNAs included in the miRNA mutation candidate list created in advance for five healthy subjects and six cancer patients.
  • miRNA_mutant_1, miRNA_mutant_2, miRNA_mutant_3, miRNA_mutant_4, miRNA_mutant_5, miRNA_mutant_6, and miRNA_mutant_7 are shown as part of the miRNA mutation candidates. "1" is entered for those with mutations, and "0" for those without mutations, and the number of types of miRNA with mutations in the entire mutation list is counted. If the number of types of miRNA mutations detected is equal to or exceeds a predetermined threshold value or a threshold value determined as needed, it is determined that the patient is highly likely to be a cancer patient.
  • the threshold value may be determined by pre-analyzing and comparing samples derived from cancer patients and non-cancer patients, and each time a sample derived from a subject is analyzed, may be determined by analyzing and comparing information from other sources.
  • examples of threshold values include, but are not limited to, 2, 3, 5, 10, 23, 25, 26, or 30.
  • the number of types of miRNA used as markers may be set to the maximum value.
  • the threshold value may be determined depending on the technique and type of RNA used in the analysis method.
  • the method of this embodiment is a qualitative test rather than a quantitative test, there is no need to ensure quantitative performance, so it is excellent in time and economic efficiency for clinical development. Furthermore, for example, using serum collected from a subject, it is possible to comprehensively, ie, universally detect cancer as primary screening during a health checkup.
  • serum or plasma which can be easily collected during health checkups, as a sample. Therefore, cancer can be detected early.
  • serum, plasma, etc. the physical and economic burden on the subject can be greatly reduced compared to cytodiagnosis, etc., and the procedure is easy, so it is less burdensome on the examiner.
  • serum or plasma contains a stable RNA concentration, for example, miRNA concentration, more accurate tests can be performed.
  • the fifth embodiment is a method of setting a threshold value used to determine that a person is likely to be suffering from cancer.
  • the threshold value setting method includes four steps (FIG. 9). First, RNA contained in samples derived from a subject or a cancer patient and a sample derived from a non-cancer patient is classified based on the homology of the sequence to a reference sequence (S91). Next, in the RNA population classified with respect to each reference sequence, representative sequence groups having the same sequence are determined (S92). For the sample derived from the subject or cancer patient and the sample derived from the control, each sequence of the representative sequence group and each corresponding reference sequence are compared, and sequence variation is detected (S93).
  • the number of types of representative sequences having sequence variations is counted (S94).
  • the number of types of representative sequences counted is compared between the subject or cancer-affected person and the control, and a threshold value that separates the subject or cancer-affected person from the control is determined (S95).
  • FIGS. 10 to 12 show an example of setting the threshold when miRNA is an example of RNA.
  • FIG. 10 shows an example of comparing 24 types of miRNA between samples derived from cancer patients and healthy controls.
  • 24 cases of cancer 24 cases of prostate cancer, 24 cases of ovarian cancer, 24 cases of kidney cancer, 24 cases of brain tumor, 13 cases of cervical cancer, 24 cases of bile duct cancer, 24 cases of esophageal cancer, 24 cases of bladder cancer, There were 24 cases of sarcoma and 3 cases of liver disease.
  • FIGS. 10(a), 11(a), and 12(a) are graphs showing the types of representative sequences in controls and the number of representative sequences in cancer patients. Specifically, the number of representative sequences with editing-based sequence variations in miRNAs derived from healthy individuals and the number of representative sequences with editing-based sequence variations in miRNAs derived from cancer patients are shown. The number of representative sequences derived from cancer patients is shown classified into cancer stages 0, 1, 2, 3, and 4. Data is also shown for cancer patients for whom there is no information on recurrence.
  • FIG. 10 24 types of miRNAs that are thought to have mutations that have a high contribution rate to determining whether or not someone is suffering from cancer are used as representative sequences.
  • FIG. 11 310 types of miRNAs for which NGS data showed the presence of mutations based on RNA editing were used as representative sequences.
  • FIG. 12 611 types of miRNAs having mutations based on RNA editing that have already been reported on the database were used as representative sequences. For each case, the number of representative sequences with sequence variation in miRNAs derived from healthy individuals and miRNAs derived from cancer patients is plotted in Figures 10(a), 11(a), and 12(a). .
  • FIG. 10(b) shows the results of verifying that the threshold value 3 is effective. In the verification, the threshold value was set to 3, and experiments were actually conducted on all cancer patients and all healthy individuals to determine whether or not they had cancer.
  • the threshold value was set to 3
  • experiments were actually conducted on all cancer patients and all healthy individuals to determine whether or not they had cancer.
  • the cancer patient group 292 samples were determined to be positive, and 54 samples were determined to be negative.
  • 1 sample was determined to be positive and 29 samples were determined to be negative.
  • FIG. 11(b) shows the results of verifying that the threshold value 28 is effective. In the verification, the threshold value was set to 28, and experiments were actually conducted on all cancer patients and all healthy individuals to determine whether or not they had cancer.
  • the cancer patient group 266 samples were determined to be positive, and 80 samples were determined to be negative.
  • the healthy group 3 samples were determined to be positive, and 27 samples were determined to be negative.
  • the threshold value can be set to 23.
  • FIG. 12(b) shows the results of verifying that the threshold value 23 is effective. In the verification, the threshold value was set to 23, and experiments were actually conducted on all cancer patients and all healthy people, and the presence or absence of cancer was determined. In the cancer patient group, 293 samples were determined to be positive, and 53 samples were determined to be negative. In the healthy group, 5 samples were determined to be positive, and 25 samples were determined to be negative.
  • the fifth embodiment it is possible to provide a threshold value that can be used in the method of analyzing the possibility of a subject suffering from cancer according to the first to fourth embodiments.
  • Sequence variation based on RNA editing can be used as a marker for distinguishing between healthy individuals and cancer-affected individuals.
  • the marker in the sixth embodiment is the number of types of RNA in a sample derived from a subject, in which sequence variations based on RNA editing exist compared to a reference sequence. In other words, it is the number of representative sequences with sequence variation in the sample derived from the subject.
  • RNA to be detected from serum for example, miRNA can be used, but there is no limit to the number and combination of miRNAs.
  • the sequence variation of the selected miRNA the number of types in which sequence variation occurred in the subject, i.e., the target, is counted, and the number is used to distinguish between healthy subjects and cancer patients.
  • ADAR1 is an enzyme that converts adenosine (A) in double-stranded RNA to inosine by hydrolytic deamination. Since the structure of inosine is similar to guanosine (G), one of the components of DNA, it is recognized as guanosine during translation. In other words, in terms of gene sequence, it results in a phenotype equivalent to the A to G mutation. Alternatively, a C to U conversion is also known, but this is not limited to these. It is also possible to limit the position on the gene where sequence variation occurs to a specific location.
  • a site where diversity has been shown to exist as SNPs due to the race of the test subjects, etc. is a possible method of limitation in which it is not considered as a sequence variation caused by cancer, since it is known in advance that a certain percentage of test subjects have the variation.
  • the areas where sequence variation occurs biologically or is unlikely to occur are known, it is possible to limit the areas of particular interest depending on the likelihood of occurrence and the reason for it, but this is not limited to this.
  • the process of determining the number of sequence variations of miRNA in body fluids mainly involves (i) collecting a sample from a subject, (ii) extracting miRNA from the sample, (iii) sequencing the target miRNA, and (iv) determining the type of miRNA. (V) detecting the presence or absence of sequence variation within each type of miRNA, and typical methods thereof are described below, but are not limited to these. Furthermore, it is preferable that the disease determination step of identifying the presence or absence of cancer based on the number of sequence variations consists of (VI) setting a threshold value (VII) comparing the size with the threshold value, and a typical method is described below. However, it is not limited to these.
  • Sample collection from the subject The samples used for measurement are collected from the subject and are not particularly limited, and include, for example, blood, serum, plasma, white blood cells, urine, digestive juices, saliva, Gastric fluid, sweat, tears, nasal mucus, semen, vaginal fluid, amniotic fluid, milk, lymph fluid, tissue, oral mucosa, sputum, etc. can be used.
  • the sample is subjected to treatments such as centrifugation, precipitation, extraction and/or separation to render it suitable for nucleic acid amplification. Further, if the collected sample is suitable for nucleic acid amplification as it is, the collected sample may be used as a specimen.
  • Nucleic acid extraction can be performed using commercially available nucleic acid extraction kits such as NucleoSpin (registered trademark) miRNA Plasma (manufactured by Takara Bio), Quick-cfRNA Serum & Plasma Kit (Zymo), but is not limited to these.
  • NucleoSpin registered trademark
  • miRNA Plasma manufactured by Takara Bio
  • Zymo Quick-cfRNA Serum & Plasma Kit
  • a single molecule sequencer such as MiSeq or NextSeq550 manufactured by Illumina, or a single molecule sequencer manufactured by Pacific Biosciences can be used, but is not limited thereto.
  • a single molecule sequencer such as MiSeq or NextSeq550 manufactured by Illumina, or a single molecule sequencer manufactured by Pacific Biosciences can be used, but is not limited thereto.
  • By performing alignment using, for example, the human genome sequence as a reference it is possible to classify sequences according to the type of miRNA. BWA, bowtie, bowtie2, etc. can be used for alignment, but are not limited thereto.
  • primers are designed according to the type of miRNA and the sequence is determined. Alternatively, if the sequence before and after the sequence variation has been determined, by designing a primer specific to the sequence after the sequence variation, if the sequence can be decoded with that primer, it can be determined that the sequence variation has occurred. You can also. In that case, qPCR method, digital PCR method, etc. can be used. Alternatively, a microarray provided with probes specific for sequence variations can also be used.
  • the threshold can be set, for example, by using a ROC (receiver operating characteristic test) curve, or by considering the effects of false positives and false negatives. There are methods to take these factors into consideration, but they are not limited to these methods and may vary depending on the design of the inspection.
  • the ROC curve plots sensitivity on the X-axis (1-specificity) and sensitivity on the Y-axis, and an ideal test (100% sensitivity, 100% specificity) would be located in the upper left corner.
  • the usefulness of a test can be evaluated by the area under the curve (AUC).
  • the threshold is set using the Youden Index, which selects the threshold that maximizes (sensitivity + specificity), and the distance from the upper left corner of the ROC curve ((1-sensitivity) 2 + (1-specificity) 2 ).
  • Youden Index which selects the threshold that maximizes (sensitivity + specificity), and the distance from the upper left corner of the ROC curve ((1-sensitivity) 2 + (1-specificity) 2 ).
  • There are two types of methods for selecting the threshold value that minimizes When setting thresholds using these methods, false positives and false negatives are generally of equal importance.
  • the threshold value can be set with greater consideration given to the weighting of false negatives relative to false positives.
  • statistical software such as EZR (Bone Marrow Transplantation 2013: 48, 452-458) or JMP can be used.
  • Example 1 Discrimination using sequence variations in serum nucleic acids between cancer patients and healthy individuals as an index is described below.
  • the number of samples was 30 serum samples from healthy individuals and 346 samples from cancer patients.
  • the breakdown of cancer patient samples was 24 breast cancer samples, 24 colorectal cancer samples, 24 gastric cancer samples, 18 lung cancer samples, 24 ovarian cancer samples, 24 pancreatic cancer samples, 24 biliary tract cancer samples, 24 esophageal cancer samples, 3 liver cancer samples, and brain tumor samples.
  • the nucleic acid sequence in the serum was determined by next-generation sequencer analysis. miRNA was extracted from 300 ⁇ L of all serum using miRNeasy Serum/Plasma Kit (Qiagen). Extracted miRNA was performed using QIAseq miRNA Library Kit (Qiagen) and QIAseq miRNA NGS 96 Index IL (Qiagen) according to the protocol.
  • the index used uses a molecular barcode technology called UMI, which eliminates the effects of PCR duplication and amplification bias caused by gene amplification associated with library preparation, and enables more accurate sequencing.
  • NGS analysis was performed using NextSeq500 (single-end, 75 bp), and more than 10 million reads of data were obtained for all samples.
  • a FASTQ file with UMI removed was obtained using the extract command of UMI-tools (Genome Res. (2017) 27(3):491-499. PMID: 28100584).
  • miRBase Release 22 As a sequence classification according to the type of miRNA, annotation was performed for miRBase Release 22. In addition, the sequence of miRBase Release 22 was set as a wild type, that is, a sequence in which no sequence variation occurred. We particularly focused on the 10 bp of the 5' end of miRNA as a candidate for sequence variation. A region called a Seed sequence exists at about 7 bp from the 2nd to 8th bases from the 5' end of miRNA.
  • This region is considered to be important for miRNA to exert its function, and the occurrence of sequence variations dependent on an individual's genetic information is thought to be low.
  • ADAR1 A-to-I RNA editing enzyme
  • Sequences in which A-to-I mutations can be introduced into miRNAs are compiled in a database (MiREDiBase [cited]), and when we obtained a list of mutations that met the conditions, there were 611 types of sequence variation candidates for 388 types of miRNA. Sequence information for the miRNA of interest was extracted from the annotation results of the NGS analysis results, and each sample was analyzed to see if there were any sequence variations that matched the database.
  • the ROC (receiver operating characteristic) curve plots sensitivity on the x-axis (1 - specificity) and sensitivity on the y-axis; in an ideal test (100% sensitivity, 100% specificity) It will be located in the upper left corner.
  • the usefulness of the test can be evaluated by the area under the curve (AUC).
  • AUC area under the curve
  • the AUC value was 0.887 (95% confidence interval 0.841-0.934).
  • the sensitivity was 84.7%
  • specificity was 83.3%
  • positive predictive value was 98. .3% (FIG. 13(c)), showing high discrimination performance and demonstrating high performance as a discrimination system for cancer and healthy people.
  • Example 2 The following describes a method for identifying sequences using sequence variation in serum nucleic acids between cancer patients and healthy individuals as an indicator, in situations where there is no prior information on sequences where sequence variation occurs.
  • the NGS analysis data described in Example 1 is used. Instead of using prior data as candidates for sequence variation, we used actual NGS sequence information in which sequence variation was detected.
  • NGS sequence variation uses the miRBase Release 22 sequence as a wild type, that is, a sequence in which no sequence variation has occurred, and comprehensively detects miRNAs with sequence variations and variation patterns in a population aligned to the same miRNA. I used it.
  • VCF file miRNAs with sequence variations and their variation patterns were output. At this time, as in Example 1, we focused on the 10 bp of the 5' end of miRNA, and were able to select 310 types of sequence variation candidates. The results are shown in FIG.
  • the AUC value was 0.854 (95% confidence interval 0.802-0.906).
  • the sensitivity is 76.9%
  • the specificity is 90.0%
  • the positive predictive value is 98. .9% (FIG. 14(c)), showing high discrimination performance, indicating that it is a high-performance discrimination system for cancer and healthy people.
  • Example 3 Among the methods for identifying cancer patients and healthy individuals using sequence variations in serum nucleic acids as indicators, methods using selected markers are described below.
  • the NGS analysis data described in Example 1 is used.
  • the AUC value was 0.953 (95% confidence interval 0.931- 0.976).
  • the results are shown in FIG.
  • the sensitivity is 84.4%
  • specificity is 96.7%
  • positive predictive value is 99. .7% ( Figure 15(c))
  • Figure 15(c) showed high discrimination performance even when verified using a limited number of miRNAs, indicating high performance as a system for distinguishing between cancer and healthy individuals.
  • RNA that have sequence variation due to RNA editing compared to a reference sequence
  • count the number of types of RNA in a sample derived from the subject and calculate the number of types of RNA obtained.
  • a method for analyzing the possibility of a subject suffering from cancer including determining the possibility of the subject suffering from cancer using an index.
  • the sample derived from the subject is a body fluid
  • the counting and determination are the following steps: a sample data acquisition step of acquiring information regarding sequence variation from a reference sequence from the body fluid; a feature extraction step of counting the number of types of RNA in which the sequence variation exists;
  • the method for analysis according to [1] comprising a disease determination step of identifying the possibility of cancer disease using the number of types of RNA in which the sequence variation exists as an index.
  • the method according to [1] or [2] further comprising comparing the number of RNA types from the subject and the number of RNA types obtained from a sample derived from a non-cancer person.
  • RNA types from the subject is greater than the number of RNA types from non-cancer individuals, the subject is identified as having a high possibility of having cancer, and If the number of RNA types from a non-cancer person is less than or equal to the number of RNA types from a non-cancer person, the subject is identified as having a low possibility of suffering from cancer, [3] The method described in. [5] The method according to any one of [2] to [4], wherein the body fluid is blood, serum, or plasma. [6] The method according to any one of [1] to [5], wherein the RNA is miRNA, mRNA, tRNA, or piRNA.
  • RNA is miRNA.
  • sequence variation is caused by RNA editing.
  • sequence variation is caused by an RNA editing enzyme.
  • sequence variation is a base substitution.
  • RNA contained in a sample derived from a subject according to the homology of its sequence to a reference sequence Determining a representative sequence group having the same sequence in the RNA population classified with respect to each reference sequence; Comparing each sequence of the representative sequence group with the corresponding reference sequence to detect sequence variation, and counting the number of types of representative sequences having the sequence variation;
  • a method of analyzing a subject's likelihood of developing cancer including: [12] The cancer is breast cancer, colon cancer, lung cancer, stomach cancer, pancreatic cancer, cervical cancer, uterine cancer, ovarian cancer, sarcoma, prostate cancer, bile duct cancer, bladder cancer, or esophagus cancer.
  • each representative sequence group having the same sequence in the RNA population classified according to the sequence Determining each representative sequence group having the same sequence in the RNA population classified according to the sequence; Comparing each sequence of the representative sequence group with each corresponding reference sequence for a sample derived from the subject or cancer patient and a sample derived from the control, and detecting each sequence variation; counting the number of types of representative sequences having the sequence variation, and comparing the number of types of representative sequences counted between the subject or cancer patient and the control; The method for analyzing the possibility of a subject suffering from cancer according to [1] to [12], further comprising determining a threshold that separates the method from a control.
  • RNA contained in a sample derived from a subject according to the homology of its sequence to a reference sequence Determining a representative sequence group having the same sequence in the RNA population classified with respect to each reference sequence; A method for detecting sequence variation comprising: comparing each sequence of the representative sequence group with a corresponding reference sequence to detect each sequence variation; and counting the number of types of sequence variation.
  • the method according to [17] in which it is possible to identify, together with sequence information of the representative sequence, that sequence variation has occurred in a specific representative sequence compared to the corresponding reference sequence.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

実施形態のがん罹患の可能性を分析する方法は、参照配列に比較して、RNA編集に基づく配列変動が存在するRNAの種類について、対象に由来する試料中の当該RNAの種類数をカウントすること、得られた当該RNAの種類数を指標にして当該対象のがん罹患の可能性を判断することを含む。

Description

対象のがん罹患の可能性を分析する方法
 本発明の実施形態は、対象のがん罹患の可能性を分析する方法に関する。
 採取が容易な体液から分離される核酸を解析することでがん罹患者と健常者を識別する系が知られている。例えば、広く検証されている系は、miRNA(microRNA)を用いた識別系である。miRNAは、17~25塩基程度の一本鎖核酸であり、遺伝子発現を調節する機能を持つことが明らかにされている。その種類や発現量は、種々の疾患において、初期の段階から変化していることが報告されている。例えば、がん患者では、種々のmiRNA量が、がんマーカーとして使用されており、健常者と比較して増加、或いは減少していることが知られている。これらの知見は、被験者ががんか否かを知るための手段として、被検者から採取された試料中の目的とするmiRNAを定量的に調べることを提案している。
特開2020-202768号
 本発明が解決しようとする課題は、より簡便に、早期段階のがんを検出することが可能な方法を提供することである。
 実施形態のがん罹患の可能性を分析する方法は、参照配列に比較して、RNA編集に基づく配列変動が存在するRNAの種類について、対象に由来する試料中の当該RNAの種類数をカウントすること、得られた当該RNAの種類数を指標にして当該対象のがん罹患の可能性を判断することを含む。
図1は、第1の実施形態を示すスキーム図である。 図2は、第1の実施形態の1例について説明する図である。 図3は、第2の実施形態の1例を示すスキーム図である。 図4は、第2の実施形態の更なる1例を示すスキーム図である。 図5は、第3の実施形態を示すスキーム図である。 図6は、第4の実施形態の1例を示すスキーム図である。 図7は、第4の実施形態の1例を示す図である。 図8は、第4の実施形態の1例を示す図である。 図9は、第5の実施形態を示すスキーム図である。 図10は、第5の実施形態の1例を示す図である。 図11は、第5の実施形態の更なる例を示す図である。 図12は、第5の実施形態の更なる例を示す図である。 図13は、例1の結果を示す図である。 図14は、例2の結果を示す図である。 図15は、例3の結果を示す図である。
実施形態
 以下、実施形態について、添付の図面を参照して説明する。なお、各実施形態において、実質的に同一の構成部位には同一の符号を付し、その説明を一部省略する場合がある。図面は模式的なものであり、各部の厚さと平面寸法との関係、各部の厚さの比率等は現実のものとは異なる場合がある。
 (第1の実施形態)
 本願の実施形態に係る分析方法は、RNA編集に基づく配列変動がRNA群においてどのように存在しているのかを明らかにすることによって、がん罹患者と非がん者とを識別できる知見を得たことにより達成されたものである。この発見により、対象のがん罹患の可能性を定量ではなく、定性的に分析することが可能になる。それによって、より簡便に、ひいては、より安価に、早期段階でがんを発見することが可能である。例えば、遺伝子を定量する必要がないので、定量性能を担保する必要がない。当該分析方法は、非常に独創的な発見に基づいた飛躍的且つ画期的な方法である。
 第1の実施形態について、図1を用いて説明する。この実施形態は、対象のがん罹患の可能性を分析する方法である。当該分析方法は、参照配列に比較して、RNA編集に基づく配列変動が存在するRNAの種類について、対象に由来する試料中のその数、即ち、種類数をカウントすること、得られた種類数を指標にして当該対象のがん罹患の可能性を判定することを含む。
 RNA編集(RNA editing)とは、DNAから転写されたRNA、又は転写中のRNAの塩基配列を置換したり、1~数塩基を挿入したり、削除したりする、動植物における機構である。RNA転写後の修飾の1つとも考えられており、様々な生体プロセスの制御に係わっていることが報告されている。図2を用いて、代表的なRNA編集の例について説明する。即ち、代表的なRNA編集の例は、(1)A-to-I RNA編集、(2)C-to-U RNA編集、(3)1~数塩基の挿入、(4)1~数塩基の削除(欠失)などである。A-to-I RNA編集(adenosin to inosin editing)は、ADAR酵素によるRNA編集である。アデノシン(A)のアミノ基を加水分解し、イノシン(I)に置換するものであり、翻訳時には、化学構造が類似しているグアノシン(G)として認識される。C-to-U RNA編集(cytidine to uridine editing)は、シチジン(C)からウリジン(U)に置換されるものである。当該分析方法においては、RNA編集の機序は問わず、参照配列に照らして、配列変動が存在するRNAについて、試料中の種類数がカウントされればよい。
 参照配列は、RNA編集による配列変動が発生していない配列であればよく、例えば、対応する野生型の配列であり得る。野生型の配列の情報は、例えば、RNAの種類に応じた遺伝子バンク、例えば、Ensembl又はNCBIなどの全ての遺伝子データが集まるデータベースや、miRNAのデータベースであるmiRBaseなど特定の種類のRNAの情報を収集しているデータベースを利用しても、参照してもよく、また情報の更新があれば所望に応じて最新の情報を参照し得る。また、参照配列は、特定の全長RNAであっても、特定のRNAの部分配列であっても、その組み合わせであってもよい。
 対象由来の試料とは、対象から採取された細胞、組織及び/又は液体、或いは、それらの混合物、それらを適切に処理することにより得られた処理物等を含む。試料が体液である場合、例えば、血清又は血漿であってよく、或いはその他の体液、例えば、血液、白血球間質液、尿、便、汗、唾液、口腔内粘膜、鼻腔内粘膜、鼻水、咽頭粘膜、喀痰、消化液、胃液、リンパ液、髄液、涙液、母乳、羊水、精液、膣液又はそれらの混合物等であってもよい。或いは、試料は、組織若しくは細胞、又はそれらの混合物等であってもよい。また試料は、対象から採取された直後のもの、培養されたもの、所望の手続きで保存されたもの、或いはそれらを所望の液体中に維持した後に得られるその上清であってもよい。採取が容易であるので、血液、血清及び血漿などの体液を対象由来の試料とすることは好ましい。
 試料についてのRNAに関する情報は、試料からRNAを抽出した後に行われ得る。RNAの抽出方法は、それ自身公知の方法により行われてよく、例えば、市販のキットを使用することも可能である。
 対象は、本方法において分析に供される動物、即ち、試料を提供する動物である。対象は、何らかの疾患を有する動物であってもよいし、健常な動物であってもよい。例えば、対象は、がんに罹患している可能性がある動物、或いは過去にがんに罹患したことのある動物等であってもよく、特に、乳がんに罹患している可能性がある動物、或いは過去に乳がんに罹患したことのある動物等であってもよい。対象はヒトであることが好ましい。
 或いは、対象は他の動物であってもよい。他の動物は、例えば哺乳動物であり、例えば、サル等の霊長類、マウス、ラット又はモルモット等の齧歯類、イヌ、ネコ又はウサギ等の伴侶動物、ウマ、ウシ又はブタ等の家畜動物、或いは展示動物等に属する動物を含む。
 当該分析方法では、対象に由来する試料中に含まれる母集団RNAのうち、何種類のRNAが、RNA編集に基づく配列変動を有しているのか、種類数をカウントし、得られた種類数を指標にして対象のがん罹患の可能性を判断する。当該分析方法においては、配列変動を有するRNAについて、特定のRNA種の発現量やコピー数を量るのではなく、対象からの試料に含まれるRNAのうち、RNA編集によって、参照配列とは異なる配列を有する、即ち、配列変動を有するRNAが何種類あるのか、その数をカウントする。詳しくは後述するが、種類数のカウントは、例えば、特定のカテゴリーのRNAを網羅的に調べ、カウントしてもよく、特定又は任意のRNA母集団を設定し、それらについて網羅的に調べてカウントしてもよい。例えば、RNA母集団に含まれるRNA分子の数は、例えば、使用するデータベースに登録される数としても、或いは、そこから任意に選択してもよい。例えば、現時点のmiRBaseには、271の生物種に対して38589のpre-miRNAが、4860のmiRNAが登録されている。そのうち、ヒトゲノムは、1917のpre-miRNA、2654のmiRNAが登録されている。これらの数をRNA母集団に含まれるRNA分子の数とし得るが、これらに限定されるものではない。例えば、特定のRNA母集団を形成する場合、例えば、対象とするmiRNAの数を制限する方法であれば、発現量が単純に多いものから選ぶ方法や、検体間で発現量のばらつきの小さいものから選ぶ、あるいは変異の比率の高いものから選ぶ、検体間の変異の比率のばらつきが小さいものから選ぶなどの基準が考えられるが、これらに限定されるものではない。また、RNAの長さは、例えば、miRNAであれば、約17塩基長~約25塩基長であり得るが、これらに限定されるものではない。またPre-miRNAであれば、例えば、約60塩基対~約70塩基対であり得る。RNAの長さは、例えば、miRNAであれば、17塩基長~25塩基長であり得るが、これらに限定されるものではない。またPre-miRNAであれば、例えば、60塩基対~70塩基対であり得る。
 カウントされるRNAは、RNA編集に基づく配列変動が存在し得るRNA種であればよく、例えば、RNA、mRNA、ncRNA(non-coding RNA)、ハウスキーピング ncRNA、tRNA、スモールncRNA、miRNA、piRNA、tsRNA、IncRNAなどであってもよい。これらのRNAは、カテゴリー包括的にカウントされてもよく、幾つかのカテゴリーが混合している状態でカウントされてもよく、特定のカテゴリーのRNAについてカウントされてもよい。例えば、特定のカテゴリーのRNAをカウントする場合には、mRNA、tRNA、スモールncRNA、miRNA、piRNA、tsRNAなどであってよく、例えば、それらのうちの少なくとも2カテゴリーの混合物であってもよい。或いは、そのような特定のカテゴリーのRNAは、例えば、miRNAであってよい。配列変動を有するRNAについて、特定のRNA種の発現量やコピー数ではなく、RNA群に分布しているRNAの種類の数をカウントし、得られた種類数に基づいて対象のがん罹患の可能性の高さが判断され得る。
 RNA編集による配列変動をより精度よく追跡するためには、転写以前の核酸、例えば、ゲノム上で起こり得る配列変動や多様性、例えば、多型、変異、置換、欠失、挿入などの頻度が低く、影響が出にくい部位、例えば、高度に保存された配列、又は高度に保存された部位の配列若しくはそれを含む配列を選択してもよい。例えば、miRNAであれば、シード配列を称される5’末端の1位~10位には、一般的に一塩基多型などの存在確率が低く、配列変動性が低いため高い有用性があるといえる。
 対象のがん罹患の可能性を分析するとは、例えば、対象ががんを罹患している可能性があるのか否かを判定すること、対象ががんを罹患している可能性が高い又は低いことを判定すること、対象ががん罹患者であるのか、非がん者であるのかを識別することなどであってもよい。第1の実施形態によれば、対象ががんに罹患している可能性の高さを客観的な比較基準に基づいて機械的及び/又は自動的に決定することが可能である。例えば、対象のがん罹患の可能性を分析する方法は、例えば「対象ががんに罹患している可能性に関する情報を取得する方法」との言い換えることが可能である。取得された情報は、例えば、医師が医療目的で「対象」である人間の病状や健康状態等について判断、即ち、診断するために利用することが可能である。このような医師による「判断」、即ち「診断」を「対象における標的がん群の罹患の有無の判定」であるとすれば、当該実施形態は、「医師」によるこのような医療目的での「対象におけるがんの罹患の有無の判定」を「補助する分析方法」であるともいえる。
 例えば、判定は、予め設定した閾値よりも大きい数の種類数があった場合に、対象ががんを罹患している可能性が高いとすることができる。或いは、予め設定した閾値よりも小さい数の種類数があった場合に、対象ががんを罹患している可能性が低いとすることもできる。閾値の設定は、母集団RNA及び参照配列を対応させて、非がん者に由来する試料を用いてえられた結果と代表的ながん罹患者に由来する試料を用いて得られた結果とを予め比較することにより決定されてもよい。
 本明細書においてがんは、何れの病期のものも含み、例えば、発生母地の臓器内にがんが留まった状態、更に周辺の組織までがんが及んだ状態、更にリンパ節へがんが転移した状態、及び更に離れた臓器へのがんの転移がある状態等を含む。また本明細書において乳がんは、乳腺組織に形成される悪性腫瘍(新生物)をいう。例えば、乳がんは、一般に「乳癌」又は「乳がん」と称されるものも含む。また、実施形態に従う乳がんは、何れの種類の乳がんも含み、例えば乳腺小葉がん又は乳管がんを含む。また、実施形態に従う乳がんは、例えば上皮性腫瘍、非上皮性腫瘍、並びに上皮性及び非上皮性の両方からなる悪性葉状腫瘍を含む。
 例えば、がんは、乳がん、大腸がん、肺がん、胃がん、膵臓がん、子宮頚がん、子宮がん、卵巣がん、肉腫、前立腺がん、胆管がん、膀胱がん、食道がん、肝臓がん、脳腫瘍、腎臓がんからなる群から選択される少なくとも一種のがんであり得る。
 本実施形態の方法は、定量試験ではなく、定性試験であることで定量性能を担保する必要がないので、臨床開発の時間的経済的効率に優れている。
 例えば、健康診断等で容易に採取できる血清または血漿を試料として用いることが可能である。そのため、例えば、対象から採取された血清を用いて、健康診断時のがんの一次スクリーニングとして、包括的に、即ち、ユニバーサルに検出することが可能である。がんを早期に発見することができる。血清または血漿等を用いることで、細胞診等と比較して対象の肉体的及び経済的負担を大きく軽減することができるとともに、手順が容易であるため検査者にとっても負担が少ない。
 (第2の実施形態)
 第2の実施形態は、対象のがん罹患の可能性を分析する方法である。当該分析方法は、対象からの試料について第1の実施例に示したように種類数をカウントするのに加えて、対象、例えば、非がん対照からの試料についても同様に種類数をカウントする。得られた種類数を指標にして、この実施形態において、対象からの種類数と非がん対照からの種類数とを比較することで、当該対象のがん罹患の可能性を判断する。
 対照は、例えば、健常体であり得る。健常体とは、少なくともがんに罹患していない個体であってよい。健常体は、疾患や異常を有さない健康な個体であることが好ましい。対照として選択される個体は、本方法で分析される対象とは別の個体であってもよく、同じ種に属する個体、即ち対象がヒトであればヒトであることが好ましい。また、対照の年齢、性別及び身長体重等の身体的条件又は人数は特に限定されるものではないが、身体的条件は、本分析方法で検査を受ける対象のものと同じ又は類似であることが好ましい。或いは、経時的に対象由来の試料を採取し、対象が、健常体である場合の検査結果を対照、非がん者若しくは非がん対照として使用してもよい。
 図3を用いて、第2の実施形態としての当該分析方法の1例について概念的に説明する。第2の実施形態の1例として、ヒトを対象として、RNAは、特定のカテゴリーとしてのmiRNAを選択し、カウントする例を示している(図3、S31(a)、S32A、S32B)。ここでは、対象は対象者、対照は非がん対照者、母集団RNAは母集団miRNAと表している。また図3には、比較例として一般的な定量試験の1例についても概念的に示した(図3、S31(f)、S32A(g)、S32B(h))。
 まず、最初に、対象者からの試料(a)と非がん対照者からの試料(f)を準備する(S31)。これらの試料に含まれる特定のカテゴリーのRNAを母集団として、RNA編集に基づく配列変動が存在するRNAの種類について、対象者と非がん対照者に由来する試料中の種類数をカウントする(S32A(b)、(b1)、(b2))。この例では、母集団miRNAは、血清中に存在するmiRNAを網羅的に分類して分析し、RNA編集に基づく配列変動が存在するRNAの種類をカウントした例を示す。母集団miRNAのうちの5種類、miR-1、miR-2、miR-3、miR-4及びmiR-5を代表的に図3に示し、他の画分については省略している(S32A(b))。この場合の判定基準は、非がん対照者よりも多くの種類のmiRNAにRNA編集に基づく配列変動が存在した場合に、対象者はがんに罹患している可能性が高いと識別する。
 以下、便宜的にコピー数にまで言及してシミュレーションする。非がん者の試料においては、miR-1は3コピー、miR-2が2コピー、miR-3が6コピー、miR-4が0コピー、miR-5が2コピーとして、血清中に分泌しているとする(S32A(b1))。そのうちのmiR-3の2コピーにRNA編集が見られている(それぞれx印)。この場合、非がん者由来の試料におけるRNA編集に基づく配列変動が存在するRNAは、1種類、即ちmiR-3のみである。これに対して、対象者ががん罹患者であったことを仮定してシミュレーションした結果を示す。対象者では、miR-1は12コピー、miR-2が9コピー、miR-3が10コピー、miR-4が5コピー、miR-5が9コピーとして、血清中に分泌している(S32A(b2))。そのうちのmiR-1の2コピー、miR-2の1コピー、miR-3の3コピー、miR-4の1コピーにRNA編集が見られる(それぞれx印)。従って、対象者由来の試料におけるRNA編集に基づく配列変動が存在するRNAは、miR-1~miR-4の4種類である。比較すると、対照者の1種類に比べて、対象者は4種類であり、種類数が多い。この結果から、対象者はがんに罹患している可能性が高いと識別される。
 当該分析方法は、定性試験であり、ここで使用される母集団miRNAに含まれる各種類のmiRNAの配列、標的、機能及び表現型などの特性は、一切考慮することなく、単にRNA編集に基づく変異があるのか、もしくはないのか、を判定し、且つその種類について、非がん対照者と対象者との間で数を比較することによって、対象者の「がん」である可能性の高低を判定することができる。
 これに対して、一般的に知られる特定の種類のmiRNAをがんマーカーとして使用し、対象の「がん」の可能性の高低を判定する場合には、定量試験が行われている。即ち、図3(g)に示すように、対象者からの試料(a)と非がん対照者からの試料(f)を準備し
(S31)、その後、非がん者の試料に含まれる特定のmiRNA(ここでは便宜的にmiR-0と示している)の発現量(S32A(g1))と、対象者の試料に含まれる対応するmiRNA(ここでは、miR-0)の発現量(S32A(g2))とを比較する。そして、比較の結果、例えば、対象者からの試料のmiR-0が対照者よりもその量が多い場合に、対象者は「がん」である可能性が高いと判定される。
 本実施形態の分析方法において、RNA編集に基づく配列変動が存在するRNAの種類数をカウントすることは、例えば、S32Bに示すように、がん組織中の変異頻度と血清中へのmiRNAの分泌量との両方の情報を含んでいるともいえる。言い換えると、一般的に定量試験の場合、例えば、血清中へのmiRNAの分泌量が、正常細胞で少なく、がん細胞で多いという情報(S32B(h))、がん組織中の変異頻度が正常細胞で少なく、がん細胞で多いという情報(S32B(i))を掛け合わせた情報が血清中のmiRNAで変異が検出されるmiRNAの種類数、正常細胞では(少ない×少ない)、がん細胞では(多い×多い)となる(S32B(c))。これにより、結果が強調されることにより、より見やすい結果となり得る。また、濃度ではなく個数を指標とした定性試験となり得る。
 上述のような第2の実施形態は、図4のスキーム図に示しているように、参照配列に比較し、RNA変種に基づく配列変動が存在するRNAの種類について、対象に由来する試料中の種類数をカウントする(S41)ことと、得られた種類数と、対照に由来する試料から得られた種類数とを比較して、その結果を基に当該対象のがん罹患の可能性を判断する(S42)ことを備えていてもよい。
 母集団となるmiRNAは、それ自体公知の何れのmiRNAのデータベースを利用して、或いは公知の発見ツールなどを利用して独自にデータベースを作製した後に、それらのデータベースに含まれる任意の種類のmiRNAから任意に選択、設計及び/又は設定すればよい。miRNAのデータベースの例は、miRNABase,Rfam、miRIAD、dbDEMCなどであってもよい。発見ツールの例は、miRscan、miRNAFold、miRDeep、miRanalyzer、ChIPBase、sRNAbenchなどであってもよい。或いは、MiREDiBase(miRNA Editing Database)などのRNA編集に基づく変異を起こし得る配列が登録されているmiRNAのデータベースから任意に選択されてもよい。母集団に含まれるmiRNAの数は、例えば、300種以上、400種類以上、500種類以上、600種類以上であってよい。
 第2の実施形態は、本発明者らが、低侵襲に採取できる体液から核酸を分離し、その配列変動を利用して健常者とがん罹患者を識別できることを見出したことに基づく。言い換えると、第2の実施形態により、低侵襲に採取できる体液から核酸を分離し、その配列変動を利用して健常者とがん罹患者を識別することが可能である。また、定量試験ではなく、定性試験であることで定量性能を担保する必要がないので、臨床開発の時間的経済的効率に優れている。また例えば、対象から採取された血清を用いて、健康診断時のがんの一次スクリーニングとして、包括的に、即ち、ユニバーサルに検出することが可能である。
 (第3の実施形態)
 第3の実施形態である対象のがん罹患の可能性を分析する方法を図5に示した。当該方法は、3つの工程、試料データ取得工程(S51)と、特徴抽出工程(S52)と、罹患判定工程(S53)とを備える。試料データ取得工程では、参照配列からの配列変動に関する情報を、対象から得られた体液から取得する(S51)。参照配列から配列変動に関する情報とは、体液中に含まれるRNAについての情報である。特徴抽出工程では、配列変動が存在するRNAの種類数をカウントする(S52)。罹患判定工程では、配列変動が存在するRNAの種類数を指標として、がん罹患の有無の可能性を決定する。或いは、この罹患判定工程は、当該指標を用いて、対象が、がん罹患者であるのか、非がん者であるのかを識別される工程であってもよい。
 本実施形態の方法が、定量試験ではなく、定性試験であることで定量性能を担保する必要がないので、臨床開発の時間的経済的効率に優れている。
 例えば、健康診断等で容易に採取できる血清または血漿を試料として用いることが可能である。そのため、例えば、対象から採取された血清を用いて、健康診断時のがんの一次スクリーニングとして、包括的に、即ち、ユニバーサルに検出することが可能である。これによりがんを早期に発見することができる。血清または血漿等を用いることで、細胞診等と比較して対象の肉体的及び経済的負担を大きく軽減することができるとともに、手順が容易であるため検査者にとっても負担が少ない。また、血清又は血漿は、そこに含まれるRNA濃度、例えば、miRNA濃度が安定しているため、より正確な検査を行うことが可能である。
 (第4の実施形態)
 第4の実施形態である対象のがん罹患の可能性を分析する方法を図6に示す。当該分析方法は、4つの工程を含む。まず、対象に由来する試料に含まれるRNAをその配列の参照配列に対する相同性によって分類する(S61)。次に、各参照配列に対して分類されたRNA集団で同一の配列をもつ代表配列群を決定する(S62)。代表配列群の各配列を対応する参照配列と比較し、配列変動をそれぞれ検出する(S63)。更に、配列変動を有する当該代表配列の種類数をカウントする(S64)。この方法はまた、配列変動を検出する方法として使用され得る。配列変動を検出する方法は、対象に由来する試料に含まれるRNAをその配列の参照配列に対する相同性によって分類すること、各参照配列に対して分類されたRNA集団で同一の配列をもつ代表配列群を決定すること、代表配列群の各配列を対応する参照配列と比較し、配列変動をそれぞれ検出すること、を備え得る。更に、特定の代表配列が、対応する参照配列に比較して配列変動が生じていることを、当該代表配列の配列情報と共に識別可能な配列変動を検出する方法でもあり得る。
 RNA配列の相同性によって分類するとは、情報を得ようとするRNAの特定の部位の配列について、相同性の高い配列同士を1グループに分類することにより、複数のグループを作るということである。その際に、参照配列(データベースから入手した既知の配列)をグループの基準の配列として使用する。相同性による分類は、例えば、次世代シーケンサー(NGS)、qPCR、サンガー、RNA検出用のマイクロアレイ、及びハイブリダイゼーションなどを使用することによって行われ得る。或いはこれらの手法を少なくとも2つ組み合わせて使用することにより行われてもよい。
 例えば、miRNAについて、次世代シーケンサーを使用して網羅的に分析する例のイメージを図7~図11に示す。図7(a)に示すように、試料は、健常者30例、乳がん24例、肺がん18例、大腸がん24例、子宮がん24例、胃がん24例、すい臓がん24例、前立腺癌24例、卵巣癌24例、腎臓がん24例、脳腫瘍24例、子宮頸がん13例、胆管がん24例、食道がん24例、膀胱がん24例、肉腫24例及び肝臓肝3例から採取した血清を用いた。図7(b)に示すように、分析したmiRNAは、has-let-7a-2-3p、has-let-7a-3p、has-let-7a-5p、has-let-7b-3p、has-let-7b-5p、has-let-7c-3p、has-let-7c-5p、has-let-7d-3p、has-let-7d-5p、has-let-7e-3p、has-let-7e-5p、has-let-7f-3p、has-let-7f-5p、has-let-7g-3p、has-let-7g-5p、has-let-7i-3p、has-let-7i-5p、has-miR-100-3p、has-miR-100-5p、has-miR-101-3p、has-miR-101-5p、has-miR-103a-2p、has-miR-103a-3p、has-miR-103b、has-miR-105-3p、has-miR-103-5p、has-miR-106a-3p、has-miR-106a-5p、has-miR-106b-3pを含む2654種類である。まず、これらのmiRNAについて、健常者及びがん罹患者について1例ずつ、次世代シーケンサーにより定量した。図7(b)には、その結果の一部分を示している。miRNAの名前をカラムAに、カラムC、D、E…と、30例の健常者、各がんの罹患者データを並べて示している。これは、対象に由来する試料に含まれるRNAが、その配列の相同性によって、分類された状態である。
 次に、分類された集団それぞれ(=各miRNA、例えばAGCTAGCT)で参照配列に対して配列変動を持つかどうかを決定するために、分類された各集団の代表配列群(= AGCTAGCT(野生型)あるいは変異型AGCTGGCTあるいはAGCTAGTT)のうち、参照配列に対して配列変動を持つ配列(=変異型AGCTGGCTあるいはAGCTAGTT)を1つあるいは複数選んだ。各集団から選ばれた配列変動を持つ配列を候補リストと定めた。すなわち、候補リストは集団名と配列変動を持つ配列情報から成る。候補リストと同一の集団に選ばれた配列変動を持つ配列と同一の配列(=AGCTGGCTあるいはAGCTAGTT)を持つ場合に、その候補に対して変異を持つと判定した。図8(c)の表は、図7(b)からのデータの一部分であり、5例の健常者と6例のがん罹患者について、予め作製されたmiRNA変異候補リストに含まれる種類のmiRNAについて変異の有無を決定する。図8(c)においては、miRNA_mutant_1、miRNA_mutant_2、miRNA_mutant_3、miRNA_mutant_4、miRNA_mutant_5、miRNA_mutant_6、miRNA_mutant_7がmiRNA変異候補の一部分として示されている。変異があるものは「1」、変異のないものは「0」を入力し、変異リスト全体で変異が存在したmiRNAの種類数をカウントする。予め決定された閾値又は随時決定される閾値以上のmiRNA変異検出種類数であった場合に、がん罹患者である可能性が高いと判断される。
 閾値の決定は、がん罹患者に由来する試料と非がん者に由来する試料とを予め分析及び比較することにより決定してもよく、対象に由来する試料を分析する度に、非がん者に由来するからの情報を分析し、比較することによって決定してもよい。例えば、閾値の例は、2、3、5、10、23、25、26又は30などであるが、これに限定されるものではない。マーカーとして使用するmiRNAの種類数を最大値としてもよい。例えば、閾値は、当該分析方法において使用される手法とRNAの種類によって決定されてもよい。
 本実施形態の方法が、定量試験ではなく、定性試験であることで定量性能を担保する必要がないので、臨床開発の時間的経済的効率に優れている。また例えば、対象から採取された血清を用いて、健康診断時のがんの一次スクリーニングとして、包括的に、即ち、ユニバーサルに検出することが可能である。
 例えば、健康診断等で容易に採取できる血清または血漿を試料として用いることが可能である。そのため、がんを早期に発見することができる。血清または血漿等を用いることで、細胞診等と比較して対象の肉体的及び経済的負担を大きく軽減することができるとともに、手順が容易であるため検査者にとっても負担が少ない。また、血清又は血漿は、そこに含まれるRNA濃度、例えば、miRNA濃度が安定しているため、より正確な検査を行うことが可能である。
 (第5の実施形態)
 第5の実施形態は、がん罹患者である可能性が高いと判断するために使用される閾値を設定する方法である。当該閾値設定方法は、4つの工程を含む(図9)。まず、対象又はがん罹患者に由来する試料と非がん者に由来する試料について、それぞれ含まれるRNAをその配列の参照配列に対する相同性によって、それぞれ分類する(S91)。次に、各々の参照配列に対して分類されたRNA集団において、同一の配列をもつ代表配列群を、それぞれ決定する(S92)。対象又はがん罹患者に由来する試料と対照に由来する試料とについて、代表配列群の各配列と各対応する参照配列とをそれぞれ比較し、配列変動をそれぞれ検出する(S93)。検出結果を基に、配列変動を有する代表配列の種類数をカウントする(S94)。対象又はがん罹患者と対照との間で、カウントされた代表配列の種類数を比較し、対象又はがん罹患者と対照とを分ける閾値を決定する(S95)。
 当該閾値を設定する方法を、miRNAをRNAの1例とした場合について、閾値を設定するイメージとして図10~12に示す。図10には、24種類のmiRNAについて、がん罹患者に由来する試料と対照としての健常者とを比較する1例を示した。この例において、健常者の数は、30例とした(n=30)。がん罹患者の数は、346例であり(n=346)、がん種の内訳は、乳がん24例、肺がん18例、大腸がん24例、子宮がん24例、胃がん24例、すい臓がん24例、前立腺癌24例、卵巣癌24例、腎臓がん24例、脳腫瘍24例、子宮頸がん13例、胆管がん24例、食道がん24例、膀胱がん24例、肉腫24例及び肝臓肝3例である。
 図10(a)、図11(a)及び図12(a)には、対照における代表配列の種類とがん罹患者における代表配列の数を示すグラフに示している。具体的には、健常者由来のmiRNAにおける編集に基づく配列変動のありの代表配列の数、がん罹患者由来のmiRNAにおける編集に基づく配列変動のありの代表配列の数を示している。がん罹患者由来の代表配列の数については、がんのステージ0、1、2、3、4毎に分類して示している。更にがん罹患者のうち、再発情報のないものについてもデータとして示している。
 図10では、がん罹患の有無の判断への寄与率の高い変異であると考えられる24種類のmiRNAを代表配列とした。図11では、NGSデータでRNA編集に基づく変異の存在が示された310種類のmiRNAを代表配列とした。図12では、データベース上で既に報告されているRNA編集に基づく変異を有する611種類のmiRNAを代表配列とした。それぞれの場合について、健常者由来のmiRNAとがん罹患者由来のmiRNAにおける配列変動ありの代表配列の数を図10(a)、図11(a)及び図12(a)にプロットしている。
 図10に示すように、24種類の代表配列を使用する場合には、配列変動ありの代表配列の数、即ち、変異検出数(グラフ縦軸)において、健常者とがん罹患者とを分ける閾値は3と設定できる。図10(b)には、閾値3が有効であることを検証した結果を示す。検証では、閾値を3として、がん罹患者全体と健常者全体について、実際に実験を行ってがん罹患の有無を判定した。がん患者群においては、陽性と判定される試料は292例、陰性と判定される試料は54例であった。健常者群においては、陽性と判定される試料は1例、陰性と判定される試料は29例であった。図10(c)に示すように、このような設定では、対象のがん罹患の可能性を分析する方法の性能は、感度84.4%、特異度96.7%、陽性的中率99.7%となり、実用に値することが検証によって明らかになっている。
 図11に示すように、310種類の代表配列を使用する場合には、配列変動ありの代表配列の数、即ち、変異検出数(グラフ縦軸)において、健常者とがん罹患者とを分ける閾値は28と設定できる。図11(b)には、閾値28が有効であることを検証した結果を示す。検証では、閾値を28として、がん罹患者全体と健常者全体について、実際に実験を行って、がん罹患の有無を判定した。がん患者群においては、陽性と判定される試料は266例、陰性と判定される試料は80例であった。健常者群においては、陽性と判定される試料は3例、陰性と判定される試料は27例であった。図11(c)に示すように、このような設定では、対象のがん罹患の可能性を分析する方法の性能は、感度76.9%、特異度90.0%、陽性的中率98.9%となり、実用に値することが検証によって明らかになっている。
 図12に示すように、611種類の代表配列を使用する場合には、配列変動ありの代表配列の数、即ち、変異検出数(グラフ縦軸)において、健常者とがん罹患者とを分ける閾値は23と設定できる。図12(b)には、閾値23が有効であることを検証した結果を示す。検証では、閾値を23として、がん罹患者全体と健常者全体について、実際に実験を行い、がん罹患の有無を判定した。がん患者群においては、陽性と判定される試料は293例、陰性と判定される試料は53例であった。健常者群においては、陽性と判定される試料は5例、陰性と判定される試料は25例であった。図12(c)に示すように、このような設定では、対象のがん罹患の可能性を分析する方法の性能は、感度84.7%、特異度83.3%、陽性的中率98.3%となり、実用に値することが検証によって明らかになっている。
 第5の実施形態によれば、第1~第4の実施形態の対象のがん罹患の可能性を分析する方法において使用できる閾値を提供することが可能である。
 (第6の実施形態)
 健常者とがん罹患者を識別するためのマーカーとして、RNA編集に基づく配列変動を利用することが可能である。第6の実施形態であるマーカーは、参照配列に比較して、RNA編集に基づく配列変動が存在するRNAの種類について、対象に由来する試料中の種類数である。言い換えると、対象に由来する試料中の配列変動のある代表配列の数である。
 血清から検出されるRNAとしては、例えばmiRNAを用いることができるが、その個数と組み合わせに制限はない。選択したmiRNAの配列変動について、被験者、即ち、対象の配列変動が発生した種類数をカウントし、その個数を用いて健常者とがん罹患者を識別する。
 配列変動の要因として、A-to-I RNA編集酵素ADAR1によるAからGへの変異が候補として挙げられる。ADAR1は二本鎖RNAのアデノシン(A)を加水分解的脱アミノ化反応によりイノシンへと変換する酵素である。イノシンの構造はDNAの構成因子の1つであるグアノシン(G)と類似しているため、翻訳時にグアノシンと認識される。すなわち、遺伝子配列的にはAからGへの変異と同等の表現型となる。あるいは、CからUへの変換も知られているが、これらに限定はしない。配列変動が発生する遺伝子上の位置を特定の個所に限定することも考えられる。例えば、SNPsとして検査対象の人種などで多様性が存在することが示されている部位は、検査対象者の一定割合がその変動を有することが事前にわかっていることとなるため、がんによって発生する配列変動としてみなさないといった限定方法が考えられる。あるいは生物学的に配列変動が発生する領域あるいは発生しにくい領域が明らかになっている場合には、発生のしやすさとその理由に応じて特に注目する領域を限定することが考えられるが、これに限定されない。
 miRNAの体液中の配列変動数を決定する工程は、主に(i)被験者からの試料採取、(ii)試料からのmiRNAの抽出、(iii)標的miRNAの配列解読(iV)miRNAの種類に応じた配列の分類(V)miRNAの各種類内での配列変動の有無の検出、から成ることが好ましく、その代表的な手法を下記に記すが、これらに限定されない。さらに続いて配列変動数に基づいたがん罹患有無の識別をする罹患判定工程は(VI)閾値の設定(VII)閾値との大小比較、から成ることが好ましく、その代表的な手法を下記に記すが、これらに限定されない。
(i)被験者からの試料採取
 測定に用いる試料は、被検者から採取されるものであり、特に限定されるものではなく、例えば、血液、血清、血漿、白血球、尿、消化液、唾液、胃液、汗、涙、鼻水、精液、膣液、羊水、乳汁、リンパ液、組織、口腔内粘膜、喀痰などを用いることができる。試料は、遠心、沈殿、抽出および/または分離などの処理を行い、核酸の増幅に適切である状態にする。また、採取された試料が、そのままで核酸の増幅に適切である場合には、採取された試料を検体として使用してよい。
(ii)試料からのmiRNAの抽出
 核酸の抽出は、これらに限定されないが、市販の核酸抽出キットである、NucleoSpin(登録商標) miRNA Plasma(タカラバイオ製)、Quick-cfRNA Serum & Plasma Kit(ザイモリサーチ製)、miRNeasy Serum/Plasma キット(キアゲン製)、miRVana PARIS isolation kit(サーモフィッシャー製)、PureLinkTM Total RNA Blood Kit(サーモフィッシャー製)、Plasma/Serum RNA Purification Kit (Norgen Biotech製)、microRNA Extractor(登録商標) SP Kit(和光純薬)、High Pure miRNA Isolation Kit(シグマアルドリッチ製)などを利用して実行することができる。また、キットによらず、試料をバッファーで希釈した上で、80~100℃の加熱処理後に遠心分離して上清を得る、という簡便な方法を使うこともできる。
 (iii)miRNAの配列解読(iV)miRNAの種類に応じた配列の分類、および(V)miRNAの各種類内での配列変動の有無の検出
 体液中に存在するmiRNAの配列を測定する方法として、次世代シーケンサー(NGS)を用いて、体液中のmiRNAを網羅的に配列解読する方法がある。あるいは、ターゲットとなるmiRNAのみを特異的に増幅可能なプライマーを用いて増幅しサンガーシーケンス法で配列を確認する方法も用いることができるがこれらに限定されない。
 次世代シーケンサーを使用する場合、illumina社製MiSeqやNextSeq550など、あるいはPacific Biosciences社製などの1分子シーケンサーなどを使用できるがこれに限定されない。リファレンスとして例えばヒトゲノム配列を用いてアライメントを実施することでmiRNAの種類に応じた配列の分類が可能である。アライメントにはBWAやbowtie, bowtie2などを使用できるがこれに限定されない。
 サンガーシーケンス法を使用する場合、miRNAの種類に応じたプライマーを設計し配列を決定する。あるいは配列変動の変動前後における配列が決定できている場合、配列変動後の配列に特異的なプライマーを設計することで、そのプライマーで配列が解読できた場合に、配列変動が発生していたと判断することもできる。その場合には、qPCR法やデジタルPCR法などを利用することができる。あるいは、配列変動に特異的なプローブを付与したマイクロアレイを利用することもできる。
 (VI)閾値の設定、(VII)閾値との大小比較
 閾値の設定は、例えばROC(受信者動作特性試験、receiver operating characteristic)曲線を用いて設定する方法や、偽陽性や偽陰性の影響を考慮して設定する方法などがあるが、これらに限定されず検査の設計によって異なると考えられる。
 ROC曲線は、X軸に(1-特異度)、Y軸に感度をプロットするもので、理想的な検査(感度100%、特異度100%)では左上隅に位置することになる。ROC曲線の下の面積(area under the curve、AUC)によって検査の有用性を評価できる。閾値の設定はYouden Indexと呼ばれる、(感度+特異度)を最大にする閾値を選択する方法と、ROC曲線の左上隅からの距離((1-感度)+(1-特異度))が最小になる閾値を選択する方法の2種類がある。これらの手法で閾値を設定する場合、偽陽性と偽陰性の重要度が同等である場合が一般的である。一方、例えばがんが早期であれば治療法が確立されており、陽性者を確実に発見することが重要ながん種の場合、偽陽性よりも偽陰性を低くすることが重要であると考えることができる。その場合には偽陽性に対する偽陰性の重みづけを大きく考えて閾値を設定することができる。このような閾値の設定にはEZR(Bone Marrow Transplantation 2013: 48, 452-458)やJMPなどの統計ソフトを利用することができる。
 (実施例1)
 がん罹患者と健常者の血清中核酸の配列変動を指標とした識別について以下に示す。
 検体数は健常者血清30検体とがん罹患者検体346検体とした。がん罹患者検体の内訳は、乳がん24検体、大腸がん24、胃がん24、肺がん18、卵巣がん24、膵臓がん24、胆道がん24、食道がん24、肝臓がん3、脳腫瘍24、膀胱がん24、前立腺がん24、肉腫24、子宮がん24、腎臓がん24、子宮頸がん13であった。
 血清中の核酸配列は、次世代シーケンサー解析により決定した。すべての血清300μLから、miRNeasy Serum/Plasma Kit(Qiagen)を用いてmiRNAを抽出した。抽出したmiRNAはQIAseq miRNA Library Kit(Qiagen)およびQIAseq miRNA NGS 96 Index IL(Qiagen)を用いてプロトコルに従って実施した。
 使用したインデックスにはUMIと呼ばれる分子バーコード技術が用いられており、ライブラリ調整に伴う遺伝子増幅によるPCR Duplicateや増幅バイアスの影響を排除でき、より正確な配列決定が可能である。NGS解析はNextSeq500(シングルエンド、75bp)を用いて実施し、全検体について1000万リード以上のデータを得た。UMI-tools(Genome Res. (2017) 27(3):491-499. PMID: 28100584)のextractコマンドを利用し、UMIを除去したFASTQファイルを得た。
 さらにリード品質によるQCを実施した。miRNAの種類に応じた配列の分類として、miRBase Release 22に対するアノテーションを実施した。また、miRBase Release 22の配列を野生型、すなわち配列変動が発生していない配列とした。配列変動の候補として、特にmiRNAの5’末端側10bpに着目した。miRNAの5’末端から2~8塩基目の7bp程度には、Seed配列と呼ばれる領域が存在する。
 この領域はmiRNAがその機能を発揮するために重要とされている領域で、個人の遺伝子情報に依存した配列変動の発生率が低いと考えられる。配列変動の候補としてA-to-I RNA編集酵素ADAR1によるAからGへの変異に注目した。miRNAに対するA-to-I変異が導入されうる配列はデータベース(MiREDiBase[引用])としてまとめられており、条件を満たす変異のリストを入手したところ388種類のmiRNAに対して611種類の配列変動候補が存在した。NGS解析結果のアノテーション結果から、注目するmiRNAの配列情報を抽出し、データベースと一致する配列変動が存在するかどうかを各検体について解析した。
 各検体について611種類の配列変動候補のうち何種類で配列変動が発生したかをカウントし、その合計数を各検体の配列変動種類数として以降の解析に用いた。各検体の種別(がん/健常者)と配列変動種類数を用いてROC曲線を作成し、AUC値を算出した。結果を図13に示す。
 ROC(受信者動作特性試験、receiver operating characteristic)曲線は、X軸に(1-特異度)、Y軸に感度をプロットするもので、理想的な検査(感度100%、特異度100%)では左上隅に位置することになる。ROC曲線の下の面積(area under the curve、AUC)によって検査の有用性を評価できる。その結果、AUC値は0.887(95%信頼区間 0.841-0.934)であった。611種類の配列変動候補のうち23種類以上で配列変動を有した場合にがんであると判断する閾値を設定した場合、感度は84.7%、特異度83.3%、陽性的中率98.3%となり(図13(c))、高い識別性能を示し、がんと健常者の識別系として高性能であることが示された。
 (実施例2)
 がん罹患者と健常者の血清中核酸の配列変動を指標とした識別のうち、事前に配列変動が起きる配列の情報がない状況で実施する手法について以下に示す。実施例1に記載したNGS解析データを用いる。配列変動の候補として事前データを用いずに、実際のNGSの配列情報において配列変動が検出されたものを利用した。NGSの配列変動はmiRBase Release 22の配列を野生型、すなわち配列変動が発生していない配列とし、同じmiRNAにアライメントされた集団中で配列変動が発生しているmiRNAと変動様式を網羅的に検出し利用した。あるいは、VCFファイルを出力することで配列変動が発生しているmiRNAとその変動様式を出力した。この際、実施例1と同様にmiRNAの5’末端側10bpに着目したところ、310種類の配列変動候補が選別できた。結果を図14に示す。
 実施例1と同様に配列変動が存在するかどうかを各検体について解析したところ、AUC値は0.854(95%信頼区間 0.802-0.906)であった。310種類の配列変動候補のうち28種類以上で配列変動を有した場合にがんであると判断する閾値を設定した場合、感度は76.9%、特異度90.0%、陽性的中率98.9%となり(図14(c))、高い識別性能を示し、がんと健常者の識別系として高性能であることが示された。
 (実施例3)
 がん罹患者と健常者の血清中核酸の配列変動を指標とした識別のうち、選別したマーカーを利用して実施する手法について以下に示す。実施例1に記載したNGS解析データを用いる。実施例1、実施例2でがんと健常者の識別に特に寄与していた24種類に限定して同様の解析を実施したところ、AUC値は0.953(95%信頼区間 0.931-0.976)であった。結果を図11に示す。24種類の配列変動候補のうち3種類以上で配列変動を有した場合にがんであると判断する閾値を設定した場合、感度は84.4%、特異度96.7%、陽性的中率99.7%となり(図15(c))、限定したmiRNAを用いて検証した場合にも高い識別性能を示し、がんと健常者の識別系として高性能であることが示された。
 本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
 以下に、本願発明の実施態様を付記する。
[1] 参照配列に比較して、RNA編集に基づく配列変動が存在するRNAの種類について、対象に由来する試料中の当該RNAの種類数をカウントすること、得られた当該RNAの種類数を指標にして当該対象のがん罹患の可能性を判定することを含む、対象のがん罹患の可能性を分析する方法。
[2] 前記対象に由来する試料が体液であり、前記カウントすること及び判定することが以下の工程:
当該体液から、参照配列からの配列変動に関する情報を取得する試料データ取得工程と、
当該配列変動が存在するRNAの種類数をカウントする特徴抽出工程と、
当該配列変動が存在するRNAの種類数を指標として、がん罹患の可能性を識別する罹患判定工程と
を具備する、[1]に記載の分析する方法。
[3] 当該対象からの当該RNA種類数と、非がん者に由来する試料から得た当該RNA種類数とを比較することを更に含む、[1]又は[2]に記載の方法。
[4] 当該対象からの当該RNA種類数が、非がん者からの当該RNA種類数よりも多い場合に、当該対象ががんに罹患している可能性が高いと識別し、当該対象からの当該RNA種類数が、非がん者からの当該RNA種類数よりも少ないか、又は同等である場合に、当該対象ががんに罹患している可能性が低いと識別する、[3]に記載の方法。
[5] 前記体液が、血液、血清又は血漿である、[2]~[4]の何れか1項に記載の方法。
[6] 前記RNAが、miRNA、mRNA、tRNA又はpiRNAである、[1]~[5]の何れか1項に記載の方法。
[7] 前記RNAがmiRNAである、[1]~[5]の何れか1項に記載の方法。
[8] 前記配列変動が、RNA編集によって生じる、[1]~[7]の何れか1項に記載の方法。
[9] 前記配列変動が、RNA編集酵素によって生じる、[1]~[7]の何れか1項に記載の方法。
[10] 前記配列変動が、塩基の置換である、[1]~[9]の何れか1項に記載の方法。
[11] 対象に由来する試料に含まれるRNAをその配列の参照配列に対する相同性によって分類すること、
各参照配列に対して分類された、RNA集団において同一の配列をもつ代表配列群を決定すること、
当該代表配列群の各配列を対応する参照配列と比較し、配列変動をそれぞれ検出すること、及び
当該配列変動を有する代表配列の種類数をカウントすること、
を含む、対象のがん罹患の可能性を分析する方法。
[12] 当該がんが、乳がん、大腸がん、肺がん、胃がん、膵臓がん、子宮頚がん、子宮がん、卵巣がん、肉腫、前立腺がん、胆管がん、膀胱がん、食道がん、肝臓がん、脳腫瘍、腎臓がんからなる群から選択される少なくとも一種のがんである、[1]~[11]の何れか1項に記載の方法。
[13] 対象又はがん罹患者に由来する試料と、非がん者に由来する試料とについて、それぞれに含まれるRNAをその配列の参照配列に対する相同性によって、それぞれ分類すること
各々の当該参照配列に対して分類されたRNA集団において、同一の配列をもつ代表配列群を、それぞれ決定すること、
当該対象又はがん罹患者に由来する試料と、当該対照に由来する試料とについて、当該代表配列群の各配列と各対応する参照配列とをそれぞれ比較し、当該配列変動をそれぞれ検出すること、
当該配列変動を有する代表配列の種類数をカウントすること、及び
前記対象又はがん罹患者と前記対照との間で、カウントされた代表配列の種類数を比較し、対象又はがん罹患者と対照とを分ける閾値を決定すること
を更に備える、[1]~[12]に記載の対象のがん罹患の可能性を分析する方法。
[14] 当該閾値が、がん罹患者群における配列変動について得られる数の方が、非がん者群から得られる数よりも大きい、[1]~[12]に記載の対象のがん罹患の可能性を分析する方法。
[15] 閾値は2以上の整数である、[1]~[12]に記載の対象のがん罹患の可能性を分析する方法。
[16] 当該閾値は、そこにおいて使用される手法とRNAの種類によって決定される[1]~[12]に記載の対象のがん罹患の可能性を分析する方法。
[17] 対象に由来する試料に含まれるRNAをその配列の参照配列に対する相同性によって分類すること、
各参照配列に対して分類された、RNA集団において同一の配列をもつ代表配列群を決定すること、
当該代表配列群の各配列を対応する参照配列と比較し、配列変動をそれぞれ検出すること、及び
当該配列変動の種類数をカウントすること
を備える配列変動を検出する方法。
[18] 特定の代表配列が、対応する参照配列に比較して配列変動が生じていることを、当該代表配列の配列情報と共に識別可能な[17]に記載の方法。
[19] NGS、qPCR、サンガー、マイクロアレイ及びハイブリダイゼーションからなる群より少なくとも1手法が選択されて使用される[1]~[18]の何れか1項に記載の方法。

Claims (20)

  1.  参照配列に比較して、RNA編集に基づく配列変動が存在するRNAの種類について、対象に由来する試料中の当該RNAの種類数をカウントすること、得られた当該RNAの種類数を指標にして当該対象のがん罹患の可能性を判定することを含む、対象のがん罹患の可能性を分析する方法。
  2.  前記対象に由来する試料が体液であり、前記カウントすること及び判定することが以下の工程:
    当該体液から、参照配列からの配列変動に関する情報を取得する試料データ取得工程と、
    当該配列変動が存在するRNAの種類数をカウントする特徴抽出工程と、
    当該配列変動が存在するRNAの種類数を指標として、がん罹患の可能性を識別する罹患判定工程と
    を具備する、請求項1に記載の分析する方法。
  3.  当該対象からの当該RNA種類数と、非がん者に由来する試料から得た当該RNA種類数とを比較することを更に含む、請求項1又は請求項2に記載の方法。
  4.  当該対象からの当該RNA種類数が、非がん者からの当該RNA種類数よりも多い場合に、当該対象ががんに罹患している可能性が高いと識別し、当該対象からの当該RNA種類数が、非がん者からの当該RNA種類数よりも少ないか、又は同等である場合に、当該対象ががんに罹患している可能性が低いと識別する、請求項3に記載の方法。
  5.  前記体液が、血液、血清又は血漿である、請求項2に記載の方法。
  6.  前記RNAが、miRNA、mRNA、tRNA又はpiRNAである、請求項1、2及び5の何れか1項に記載の方法。
  7.  前記RNAが、miRNA、mRNA、tRNA又はpiRNAである、請求項3に記載の方法。
  8.  前記RNAが、miRNA、mRNA、tRNA又はpiRNAである、請求項4項に記載の方法。
  9.  前記配列変動が、RNA編集酵素によって生じる、請求項1に記載の方法。
  10.  前記配列変動が、塩基の置換である、請求項1に記載の方法。
  11.  対象に由来する試料に含まれるRNAをその配列の参照配列に対する相同性によって分類すること、
    各参照配列に対して分類された、RNA集団において同一の配列をもつ代表配列群を決定すること、
    当該代表配列群の各配列を対応する参照配列と比較し、配列変動をそれぞれ検出すること、及び
    当該配列変動を有する当該代表配列の種類数をカウントすること
    を含む、対象のがん罹患の可能性を分析する方法。
  12.  前記RNAがmiRNAであり、当該がんが、乳がん、大腸がん、肺がん、胃がん、膵臓がん、子宮頚がん、子宮がん、卵巣がん、肉腫、前立腺がん、胆管がん、膀胱がん、食道がん、肝臓がん、脳腫瘍、腎臓がんからなる群から選択される少なくとも一種のがんである、請求項1、2及び5の何れか1項に記載の方法。
  13.  対象又はがん罹患者に由来する試料と、非がん者に由来する試料とについて、それぞれに含まれるRNAをその配列の参照配列に対する相同性によって、それぞれ分類すること
    各々の当該参照配列に対して分類されたRNA集団において、同一の配列をもつ代表配列群を、それぞれ決定すること、
    前記対象又はがん罹患者に由来する試料と、前記対照に由来する試料について、当該代表配列群の各配列と、対応する当該参照配列とを、それぞれ比較し、当該配列変動をそれぞれ検出すること、
    当該配列変動を有する代表配列の種類数をカウントすること、及び
    前記対象又はがん罹患者と前記対照との間で、カウントされた当該代表配列の種類数を比較し、対象又はがん罹患者と対照とを分ける閾値を決定すること
    を更に備える、請求項1に記載の対象のがん罹患の可能性を分析する方法。
  14.  前記指標として判定することが、
     対象又はがん罹患者に由来する試料と、非がん者に由来する試料とについて、それぞれに含まれるRNAをその配列の参照配列に対する相同性によって、それぞれ分類すること
    各々の当該参照配列に対して分類されたRNA集団において、同一の配列をもつ代表配列群を、それぞれ決定すること、
    前記対象又はがん罹患者に由来する試料と、前記対照に由来する試料について、当該代表配列群の各配列と対応する当該参照配列とをそれぞれ比較し、当該配列変動をそれぞれ検出すること、
    当該配列変動を有する代表配列の種類数をカウントすること、及び
    前記対象又はがん罹患者と前記対照との間で、カウントされた当該代表配列の種類数を比較し、対象又はがん罹患者と対照とを分ける閾値を決定すること
    により設定される閾値との比較によって行われ、
    当該閾値が、がん罹患者群における配列変動について得られる数の方が、非がん者群から得られる数よりも大きい、請求項1に記載の対象のがん罹患の可能性を分析する方法。
  15.  当該閾値は2以上の整数である、請求項14に記載の対象のがん罹患の可能性を分析する方法。
  16.  当該閾値は、そこにおいて使用される手法とRNAの種類によって決定される請求項14に記載の対象のがん罹患の可能性を分析する方法。
  17.  NGS、qPCR、サンガー、マイクロアレイ及びハイブリダイゼーションからなる群より少なくとも1手法が選択されて使用される請求項14に記載の対象のがん罹患の可能性を分析する方法。
  18.  対象に由来する試料に含まれるRNAをその配列の参照配列に対する相同性によって分類すること、
    各参照配列に対して分類された、RNA集団において同一の配列をもつ代表配列群を決定すること、
    代表配列群の各配列を対応する参照配列と比較し、配列変動をそれぞれ検出すること、及び
    配列変動の種類数をカウントすること
    を備える配列変動を検出する方法。
  19.  特定の代表配列が、対応する参照配列に比較して配列変動が生じていることを、当該代表配列の配列情報と共に識別可能な請求項18に記載の配列変動を検出する方法。
  20.  NGS、qPCR、サンガー、マイクロアレイ及びハイブリダイゼーションからなる群より少なくとも1手法が選択されて使用される請求項19に記載の配列変動を検出する方法。
PCT/JP2023/031406 2022-09-20 2023-08-30 対象のがん罹患の可能性を分析する方法 WO2024062867A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US18/591,077 US20240200149A1 (en) 2022-09-20 2024-02-29 Method for analyzing probability of suffering from cancer in subject

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2022-149024 2022-09-20
JP2022149024A JP2024043823A (ja) 2022-09-20 2022-09-20 対象のがん罹患の可能性を分析する方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US18/591,077 Continuation US20240200149A1 (en) 2022-09-20 2024-02-29 Method for analyzing probability of suffering from cancer in subject

Publications (1)

Publication Number Publication Date
WO2024062867A1 true WO2024062867A1 (ja) 2024-03-28

Family

ID=90454194

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2023/031406 WO2024062867A1 (ja) 2022-09-20 2023-08-30 対象のがん罹患の可能性を分析する方法

Country Status (3)

Country Link
US (1) US20240200149A1 (ja)
JP (1) JP2024043823A (ja)
WO (1) WO2024062867A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021222647A2 (en) * 2020-05-01 2021-11-04 Cornell University Method and markers for identification and relative quantification of nucleic acid sequence, mutation, copy number, or methylation changes using combinations of nuclease, ligation, deamination, dna repair, and polymerase reactions with carryover prevention

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021222647A2 (en) * 2020-05-01 2021-11-04 Cornell University Method and markers for identification and relative quantification of nucleic acid sequence, mutation, copy number, or methylation changes using combinations of nuclease, ligation, deamination, dna repair, and polymerase reactions with carryover prevention

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
AISO SATOKO, MAKIKO UEDA, MAKOTO KARIDA, HARUHIKO KONFUJI, HIROSHI OTSUKA, HIROSHI OHNISHI: "Deep sequencing analysis of serum microRNA profiles of lung adenocarcinoma patients", JOURNAL OF THE KYORIN MEDICAL ASSOCIATION, vol. 51, no. 1, 1 March 2020 (2020-03-01), pages 3 - 10, XP093148785 *
LIN CHUI-HSIEN, CHEN SEAN CHUN-CHANG: "The Cancer Editome Atlas: A Resource for Exploratory Analysis of the Adenosine-to-Inosine RNA Editome in Cancer", CANCER RESEARCH, AMERICAN ASSOCIATION FOR CANCER RESEARCH, US, vol. 79, no. 11, 1 June 2019 (2019-06-01), US, pages 3001 - 3006, XP093148792, ISSN: 0008-5472, DOI: 10.1158/0008-5472.CAN-18-3501 *
MARCECA GIOACCHINO P., TOMASELLO LUISA, DISTEFANO ROSARIO, ACUNZO MARIO, CROCE CARLO M., NIGITA GIOVANNI: "Detecting and Characterizing A-To-I microRNA Editing in Cancer", CANCERS, CH, vol. 13, no. 7, 3 April 2021 (2021-04-03), CH , pages 1699, XP093148789, ISSN: 2072-6694, DOI: 10.3390/cancers13071699 *
QIN JIA-XIN, LIU XING, WANG XIN-LEI, WANG GUANG-YUE, LIANG QING, DONG YANG, PANG KUN, HAO LIN, XUE LIANG, ZHAO YAN, HU ZHENG-XIANG: "Identification and analysis of microRNA editing events in recurrent bladder cancer based on RNA sequencing: MicroRNA editing level is a potential novel biomarker", FRONTIERS IN GENETICS, FRONTIERS RESEARCH FOUNDATION, SWITZERLAND, vol. 13, 19 September 2022 (2022-09-19), Switzerland , pages 984279., XP093148791, ISSN: 1664-8021, DOI: 10.3389/fgene.2022.984279 *
YUN ZHENG;TING LI;REN REN;DONGHUA SHI;SHENGPENG WANG: "Revealing editing and SNPs of microRNAs in colon tissues by analyzing high-throughput sequencing profiles of small RNAs", BMC GENOMICS, BIOMED CENTRAL LTD, LONDON, UK, vol. 15, no. Suppl 9, 8 December 2014 (2014-12-08), London, UK , pages S11, XP021204629, ISSN: 1471-2164, DOI: 10.1186/1471-2164-15-S9-S11 *

Also Published As

Publication number Publication date
US20240200149A1 (en) 2024-06-20
JP2024043823A (ja) 2024-04-02

Similar Documents

Publication Publication Date Title
CN111910004A (zh) cfDNA在早期乳腺癌无创诊断中的应用
CN109715830A (zh) 用于使用基因表达谱诊断肺癌的组合物和方法
CN106399304B (zh) 一种与乳腺癌相关的snp标记
CN106661623A (zh) 使用miRNA生物标志物相对于多发性硬化诊断视神经脊髓炎
CN114277143B (zh) 外泌体arpc5、cda等在肺癌诊断中的应用
CN113724862A (zh) 一种结直肠癌生物标志物及其筛选方法和应用
KR20190143058A (ko) 뇌 종양의 예후 예측 방법
WO2024062867A1 (ja) 対象のがん罹患の可能性を分析する方法
CN114507738A (zh) 甲基化位点、检测甲基化水平的产品的用途及试剂盒
WO2022170133A1 (en) Micro rna liver cancer markers and uses thereof
CN112501295A (zh) miRNA组合、含其的试剂盒及在肺癌诊断中的应用
CN111187836B (zh) 泌尿上皮癌的检测套组及微型核糖核酸组合物在制备用于预测泌尿上皮癌检测套组中的应用
US20240309459A1 (en) Method of identifying feature of test body and microrna cancer marker
CN116287252B (zh) 长链非编码rna apcdd1l-dt在制备检测胰腺癌的产品中的应用
WO2022199570A1 (zh) 用于Basal型胰腺导管腺癌(PDAC)诊断的标志物组合及其应用
CN111363818B (zh) 基于pax3基因的肺癌诊断剂及试剂盒
WO2023063049A1 (ja) がん検出のためのバイオマーカーセットの作製方法
JP7299765B2 (ja) マイクロrna測定方法およびキット
CN106520957B (zh) Dhrs7易感snp位点检测试剂及其制备的试剂盒
WO2023246808A1 (zh) 利用癌症中剪接异常的短外显子辅助癌症诊断和预后
CN111363816B (zh) 基于pax3和zic4基因的肺癌诊断试剂及试剂盒
CN106868191B (zh) 真核翻译延伸因子在检测乳腺癌试剂中的应用
WO2021192397A1 (ja) がん検査方法
TWI676688B (zh) 辨識細胞種類型之方法及系統
CN106834468B (zh) Aim1和eme1易感snp位点检测试剂及其制备的试剂盒

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23867991

Country of ref document: EP

Kind code of ref document: A1