WO2022264189A1 - 遺伝的特徴推定装置、制御方法、及び非一時的なコンピュータ可読媒体 - Google Patents

遺伝的特徴推定装置、制御方法、及び非一時的なコンピュータ可読媒体 Download PDF

Info

Publication number
WO2022264189A1
WO2022264189A1 PCT/JP2021/022428 JP2021022428W WO2022264189A1 WO 2022264189 A1 WO2022264189 A1 WO 2022264189A1 JP 2021022428 W JP2021022428 W JP 2021022428W WO 2022264189 A1 WO2022264189 A1 WO 2022264189A1
Authority
WO
WIPO (PCT)
Prior art keywords
genetic
mutation
score
contribution
interest
Prior art date
Application number
PCT/JP2021/022428
Other languages
English (en)
French (fr)
Inventor
正隆 菊地
憲一 上條
泰人 伏見
香織 小林
Original Assignee
日本電気株式会社
国立大学法人大阪大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社, 国立大学法人大阪大学 filed Critical 日本電気株式会社
Priority to PCT/JP2021/022428 priority Critical patent/WO2022264189A1/ja
Priority to JP2023529152A priority patent/JPWO2022264189A5/ja
Publication of WO2022264189A1 publication Critical patent/WO2022264189A1/ja

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M1/00Apparatus for enzymology or microbiology
    • C12M1/34Measuring or testing with condition measuring or sensing means, e.g. colony counters

Definitions

  • the present disclosure relates to techniques for estimating genetic characteristics of living things.
  • Patent Document 1 discloses a technique for predicting a trait to be evaluated from a gene mutation to be evaluated using a database in which information on gene mutations common to a group of samples exhibiting the common trait is accumulated. there is The system of Patent Document 1 uses information in a database to calculate a score representing the high degree of relevance between each of one or more genetic mutations of an evaluation target and a specific trait. Make trait predictions based on scores.
  • the purpose of the present disclosure is to provide a new technique for estimating the genetic characteristics of organisms.
  • the genetic feature estimation apparatus of the present disclosure provides gene mutation information about gene mutations in the DNA (deoxyribonucleic acid) sequence of target cells obtained from the target organism, and the position on the DNA sequence with respect to the type of cell or the type of organ an acquisition unit that acquires the associated position information, and the position information is associated with the type of the target cell or the type of the organ containing the target cell from among the gene mutations indicated by the gene mutation information.
  • a calculation unit that specifies a mutation of interest, which is a genetic mutation at the position, and calculates a genetic characteristic index value representing the genetic characteristics of the target organism based on the characteristics of the mutation of interest.
  • the control method of the present disclosure is executed by a computer.
  • the position on the DNA sequence is associated with the gene mutation information regarding the gene mutation in the DNA (deoxyribonucleic acid) sequence possessed by the target cell obtained from the target organism, and the cell type or organ type.
  • the non-transitory computer-readable medium of the present disclosure stores a program that causes a computer to execute the control method of the present disclosure.
  • FIG. 4 is a diagram illustrating an outline of the operation of the genetic feature estimation device of Embodiment 1;
  • FIG. 2 is a block diagram illustrating the functional configuration of the genetic feature estimation device of Embodiment 1;
  • FIG. It is a block diagram which illustrates the hardware constitutions of the computer which implement
  • 4 is a flowchart illustrating the flow of processing executed by the genetic feature estimation device of Embodiment 1; It is a figure which illustrates gene mutation information in a table form. It is a figure which illustrates a positional information in a table form. It is a figure which illustrates contribution information in a table form.
  • predetermined values such as predetermined values and threshold values are stored in advance in a storage unit or the like in a manner that can be obtained by a device that uses the values.
  • the storage unit is composed of one or more storage devices.
  • FIG. 1 is a diagram illustrating an overview of the operation of the genetic feature estimation device 2000 of Embodiment 1.
  • FIG. 1 is a diagram for facilitating understanding of the outline of genetic feature estimation apparatus 2000, and the operation of genetic feature estimation apparatus 2000 is not limited to that shown in FIG.
  • the genetic feature estimation device 2000 calculates an index value (hereinafter referred to as a genetic feature index value) regarding the genetic features of the target organism 10.
  • the target organism 10 is an arbitrary organism for which the genetic characteristic index value is calculated, and may be a human or other animal, or may be a plant.
  • genetic traits are traits associated with a disease, such as the likelihood of contracting the disease and the speed at which the disease progresses.
  • genetic characteristics are physical characteristics, such as height and weight.
  • the genetic characteristic is the magnitude of drug effect, such as resistance or sensitivity to the drug.
  • a genetic characteristic index value is, for example, a polygenic risk score.
  • the genetic feature index value is not limited to the polygenic risk score as long as it is an index value representing the genetic feature of the target organism 10 .
  • the genetic feature estimation device 2000 acquires the gene mutation information 30 and the position information 40.
  • the gene mutation information 30 indicates information about gene mutation in the DNA (deoxyribonucleic acid) sequence of the target cell 20 obtained from the target organism 10 (target cell 20 ).
  • the gene mutation information 30 indicates at least the position on the DNA sequence of each of one or more gene mutations that the target cell 20 has.
  • the position information 40 is information that associates the type of cell or organ with the position on the DNA sequence.
  • the position information 40 indicates, for each type of cell or organ, a position on the DNA sequence to which particular attention should be paid when calculating the genetic characteristic index value.
  • Types of cells include nerve cells, glial cells, blood cells, and skin cells.
  • classification granularity is arbitrary.
  • glial cells may be further subdivided into more specific types such as microglia and oligodendrocytes.
  • Types of organs include types such as the brain, heart, and lungs. However, the classification granularity is arbitrary for the types of organs as well. For example, a group including multiple types of organs such as "respiratory system" may be used as the type of organ.
  • the genetic feature estimating apparatus 2000 identifies genetic mutations at positions associated with the type of the target cell 20 or the type of the organ having the target cell 20 in the positional information 40 from among the genetic mutations indicated by the genetic mutation information 30. do.
  • the gene mutation specified here is referred to as "mutation of interest”.
  • the genetic feature estimation device 2000 calculates a genetic feature index value for the target organism 10 based on the feature of the mutation of interest.
  • the characteristics of genetic mutations other than the mutation of interest may or may not be used to calculate the genetic characteristic index value.
  • the feature of the mutation of interest is set to have a greater influence on the genetic feature index value (contribution to the genetic feature index value) than the feature of the gene mutation other than the mutation of interest. A specific method thereof will be described later.
  • the position information 40 corresponds to the type of the target cell 20 or the type of the organ containing the target cell 20 among the genetic mutations of the target cell 20 of the target organism 10
  • a genetic mutation (mutation of interest) at the assigned position is specified.
  • an index value relating to the genetic characteristics of the target organism 10 is calculated based on the characteristics of the mutation of interest.
  • the features of genetic mutations other than the mutation of interest are either not used in calculating the genetic feature index value, or are used so that their influence on the genetic feature index value is smaller than that of the feature of the mutation of interest.
  • the type of target cell 20 or the type of organ containing the target cell 20 is associated with a position on the DNA sequence that is considered to have a large effect on genetic characteristics.
  • the genetic feature index value attention is focused on the feature of genetic mutation at a position that is considered to have a large influence on the genetic feature. Therefore, it is possible to calculate a genetic characteristic index value that expresses the genetic characteristic of the target organism 10 more accurately than in the case where such attention is not given.
  • the genetic feature estimation device 2000 of this embodiment will be described in more detail below.
  • FIG. 2 is a block diagram illustrating the functional configuration of the genetic feature estimation device 2000 of Embodiment 1.
  • the genetic feature estimation device 2000 has an acquisition section 2020 and a calculation section 2040 .
  • the acquisition unit 2020 acquires the genetic mutation information 30 and the position information 40 regarding the target cell 20 of the target organism 10 .
  • the calculation unit 2040 identifies a genetic mutation at a position associated with the type of the target cell 20 or the type of the organ having the target cell 20 in the position information 40 from among the genetic mutations indicated by the genetic mutation information 30 . Then, the calculation unit 2040 calculates a genetic characteristic index value based on the identified genetic mutation characteristic.
  • Each functional configuration unit of the genetic feature estimation apparatus 2000 may be implemented by hardware (eg, hardwired electronic circuit, etc.) that implements each functional configuration unit, or may be implemented by a combination of hardware and software (for example, it may be realized by a combination of an electronic circuit and a program for controlling it).
  • hardware e.g, hardwired electronic circuit, etc.
  • software for example, it may be realized by a combination of an electronic circuit and a program for controlling it.
  • FIG. 3 is a block diagram illustrating the hardware configuration of the computer 500 that implements the genetic feature estimation device 2000.
  • Computer 500 is any computer.
  • the computer 500 is a stationary computer such as a PC (Personal Computer) or a server machine.
  • the computer 500 is a portable computer such as a smart phone or a tablet terminal.
  • Computer 500 may be a dedicated computer designed to implement genetic feature estimation apparatus 2000 or a general-purpose computer.
  • the functions of the genetic feature estimation device 2000 are realized on the computer 500.
  • the application is composed of a program for realizing each functional component of genetic feature estimation apparatus 2000 .
  • the acquisition method of the above program is arbitrary.
  • the program can be obtained from a storage medium (DVD disc, USB memory, etc.) in which the program is stored.
  • the program can be obtained by downloading the program from a server device that manages the storage section storing the program.
  • Computer 500 has bus 502 , processor 504 , memory 506 , storage device 508 , input/output interface 510 and network interface 512 .
  • the bus 502 is a data transmission path through which the processor 504, memory 506, storage device 508, input/output interface 510, and network interface 512 exchange data with each other.
  • the method of connecting the processors 504 and the like to each other is not limited to bus connection.
  • the processor 504 is various processors such as a CPU (Central Processing Unit), GPU (Graphics Processing Unit), or FPGA (Field-Programmable Gate Array).
  • the memory 506 is a main memory implemented using a RAM (Random Access Memory) or the like.
  • the storage device 508 is an auxiliary storage device implemented using a hard disk, SSD (Solid State Drive), memory card, ROM (Read Only Memory), or the like.
  • the input/output interface 510 is an interface for connecting the computer 500 and input/output devices.
  • the input/output interface 510 is connected to an input device such as a keyboard and an output device such as a display device.
  • a network interface 512 is an interface for connecting the computer 500 to a network.
  • This network may be a LAN (Local Area Network) or a WAN (Wide Area Network).
  • the storage device 508 stores a program that implements each functional component of the genetic feature estimation device 2000 (a program that implements the application described above).
  • the processor 504 reads this program into the memory 506 and executes it, thereby realizing each functional component of the genetic feature estimation device 2000 .
  • the genetic feature estimation device 2000 may be realized by one computer 500 or may be realized by a plurality of computers 500. In the latter case, the configuration of each computer 500 need not be the same, and can be different.
  • FIG. 4 is a flow chart illustrating the flow of processing executed by the genetic feature estimation device 2000 of the first embodiment.
  • the acquisition unit 2020 acquires the gene mutation information 30 (S102).
  • the acquisition unit 2020 acquires the position information 40 (S104).
  • the calculation unit 2040 identifies the mutation of interest using the gene mutation information 30 and the position information 40 (S106). Specifically, the calculation unit 2040 focuses on genetic mutations associated with the type of the target cell 20 or the type of the organ containing the target cell 20 in the position information 40, among the genetic mutations indicated by the genetic mutation information 30. Identify as a mutation. Then, the calculation unit 2040 calculates a genetic feature index value based on the magnitude of contribution of the mutation of interest to the genetic feature (S108).
  • the flow of processing shown in FIG. 4 is an example of the flow of processing executed by genetic feature estimation device 2000, and the flow of processing executed by genetic feature estimation device 2000 is shown in FIG. are not limited to those indicated by
  • the acquisition of the genetic mutation information 30 (S102) and the acquisition of the position information 40 (S104) may be performed in the reverse order to the above order, or may be performed in parallel with each other.
  • the acquisition unit 2020 acquires the gene mutation information 30 (S102).
  • the gene mutation information 30 indicates information about gene mutation in the DNA sequence of the target cell 20 .
  • At least the gene mutation information 30 indicates the position of each gene mutation in the target cell 20 in the DNA sequence of the target cell 20 .
  • FIG. 5 is a diagram illustrating gene mutation information 30 in a table format.
  • the genetic variation information 30 in FIG. 5 has two columns, position 32 and genetic variation 34 .
  • Position 32 indicates the position on the DNA sequence of target cell 20 .
  • a genetic mutation 34 indicates a genetic mutation that the target cell 20 has at the position on the DNA sequence indicated by the corresponding position 32 .
  • the first row record in FIG. 5 indicates that the target cell 20 has the gene mutation V1 at the position P1.
  • the acquisition unit 2020 acquires the gene mutation information 30.
  • the gene mutation information 30 is pre-stored in a storage accessible from the genetic feature estimation device 2000 .
  • the acquisition unit 2020 acquires the gene mutation information 30 by accessing this storage unit.
  • the target organism 10 is a patient in a hospital
  • the gene mutation information 30 can be included in data representing the medical chart of the target organism 10 (so-called electronic chart).
  • the acquisition unit 2020 acquires the gene mutation information 30 of the target organism 10 from the electronic medical record of the target organism 10 .
  • An existing technology can be used as a technology for acquiring desired information from a specific person's electronic medical record.
  • the genetic mutation information 30 may be transmitted from another device to the genetic feature estimation device 2000.
  • the acquisition unit 2020 acquires the position information 40 (S104).
  • the position information 40 is information that associates the position on the DNA sequence with the type of cell or organ.
  • FIG. 6 is a diagram illustrating the position information 40 in a table format.
  • the location information 40 has two columns, type 42 and location 44 .
  • the type 42 indicates the type of cell or organ.
  • Position 44 indicates one or more positions on the DNA sequence. If position 44 indicates multiple positions, position 44 may indicate a specific region on the DNA sequence. For example, the record on the first line in FIG. 6 associates the range R1 on the DNA sequence with the cell type C1.
  • regions on the DNA sequence include promoters, enhancers, chemically modified regions (regions where DNA methylation has occurred), and specific genes. These regions directly or indirectly affect gene expression and protein structure. Therefore, genetic mutations in these regions are considered to have a greater effect on the genetic characteristics of organisms than genetic mutations in other regions. Therefore, by paying particular attention to genetic mutations in these regions among the genetic mutations of the target organism 10, the genetic characteristics of the target organism 10 can be grasped more accurately.
  • the acquisition unit 2020 acquires the position information 40.
  • the position information 40 is stored in advance in a storage accessible from the genetic feature estimation device 2000 .
  • the acquisition unit 2020 acquires the position information 40 by accessing this storage unit.
  • the position information 40 may be transmitted from another device to the genetic feature estimation device 2000 .
  • the position information 40 may be prepared for each type of genetic feature for which the genetic feature index value is to be calculated. For example, in this case, different position information 40 is used for the calculation of the genetic feature index value representing the risk of developing lung cancer and the calculation of the genetic feature index value representing the risk of developing Alzheimer's disease.
  • a plurality of pieces of position information 40 may be prepared for one type of genetic feature.
  • the genetic feature estimation device 2000 may calculate one genetic feature index value using a plurality of pieces of position information 40, or may calculate a genetic feature index value for each position information 40 individually. may By calculating genetic feature index values individually for a plurality of pieces of position information 40, it is possible to evaluate risks and the like for one genetic feature of the target organism 10 for each organ type or cell type.
  • the genetic characteristic index value representing the risk of contracting schizophrenia for each of the three organs of the brain, liver, and intestines is predicted.
  • the genetic feature estimation device 2000 individually calculates genetic feature index values for each of these three pieces of position information 40 .
  • the genetic characteristic index values for the brain and intestines both indicate that the risk of schizophrenia is high, while the genetic characteristic index value for the liver indicates that the risk of schizophrenia is high.
  • the genetic feature estimation device 2000 determines which type of genetic feature the genetic feature index value is to be calculated (calculation of genetic feature index value). Acquire information that specifies the type of genetic characteristics to be targeted. For example, this information is entered by the user. In this case, the acquisition unit 2020 acquires the position information 40 corresponding to the type of genetic feature specified by the user.
  • the calculation unit 2040 identifies the position associated with the type of the target cell 20 or the type of the organ containing the target cell 20 in the position information 40, and determines the gene mutation indicated by the gene mutation information 30 for that position as the mutation of interest. (S106). For example, the calculation unit 2040 identifies a record indicating the type 42 of the type of the target cell 20 or the type of the organ containing the target cell 20 from the position information 40 .
  • the calculation unit 2040 identifies, from among the records of the gene mutation information 30, the record of the identified position information 40 whose position indicated by the position 44 is indicated by the position 32. Then, the calculation unit 2040 identifies the genetic mutation indicated by the genetic mutation 34 in the identified record of the genetic mutation information 30 as the mutation of interest.
  • the calculation unit 2040 identifies, from the gene mutation information 30, a record indicating the position 32 that is included in the promoter or enhancer. Then, the calculation unit 2040 identifies the genetic mutation indicated in the genetic mutation 34 of the identified record as the mutation of interest.
  • whether to use the type of cell or the type of organ, or whether to use both of them may be predetermined in the genetic feature estimation apparatus 2000, or may be determined dynamically by the user. may be In the latter case, for example, the genetic feature estimation apparatus 2000 provides the user of the genetic feature estimation apparatus 2000 with an input interface (for example, , input screen). Then, the genetic feature estimation apparatus 2000 identifies the mutation of interest based on the result of user input. For example, assume that the user selects "cell type". In this case, the calculator 2040 identifies the position associated with the type of the target cell 20 in the position information 40 .
  • the calculator 2040 calculates a genetic feature index value based on the features of the mutation of interest (S108). For example, the calculation unit 2040 calculates a score based on the characteristics of each mutation of interest. Then, a genetic characteristic index value is calculated based on the score calculated for each mutation of interest.
  • a calculation formula for calculating the score from the characteristics of the gene mutation and a calculation formula for calculating the genetic characteristic index value based on the score calculated for each mutation of interest are determined in advance.
  • these calculation formulas are represented by Formula (1) below.
  • S represents the genetic characteristic index value.
  • A represents the set of mutations of interest.
  • i represents a gene mutation identifier.
  • a gene mutation whose identifier is i is hereinafter referred to as gene mutation i.
  • f[i] represents the features of gene mutation i.
  • h() is a formula for calculating a score from the characteristics of gene mutation.
  • g() is a calculation formula for calculating a genetic characteristic index value based on the score calculated for each mutation of interest.
  • Equation (1) can be expressed as Equation (2) below.
  • ⁇ [i] is the weight given to mutation i.
  • Various methods are conceivable for converting the characteristics of the mutation of interest into a score. For example, the number of specific alleles possessed by the mutation of interest is used as the score. In addition, for example, the strength of the correlation between the mutation of interest expressed as linkage disequilibrium and the surrounding mutations on DNA, and the strength of activity of promoters and enhancers are also used as scores.
  • the magnitude of the effect of genetic mutation characteristics on genetic characteristics may differ depending on the type of genetic characteristics. For example, it is highly probable that a certain gene mutation will have different effects on the risk of developing lung cancer, Alzheimer's disease, and the ability to grow taller. . Therefore, it is preferable to define a calculation formula for calculating a score from characteristics of genetic mutation for each type of genetic characteristics.
  • the genetic feature estimation device 2000 selects the type of genetic feature for which the genetic feature index value is to be calculated. Get the specified information. As mentioned above, for example, this information is entered by the user.
  • the calculation unit 2040 calculates the genetic feature index value using a calculation formula corresponding to the type of the designated genetic feature among the calculation formulas prepared in advance.
  • the formula for calculating the genetic characteristic index value based on the score calculated for each mutation of interest is also determined for each genetic characteristic for which the genetic characteristic index value is to be calculated. may
  • the genetic feature index value may be calculated using the features of genetic mutations other than the mutation of interest.
  • the calculation formula for calculating the genetic characteristics is represented, for example, by the following formula (3).
  • set B is a set of all genetic mutations contained in target cell 20 . Therefore, the set BA represents a set of genetic mutations other than the mutation of interest among the genetic mutations contained in the target cell 20 .
  • j is an identifier of a gene mutation included in the set B;
  • Equation (3) when the genetic characteristic index value is calculated as a simple sum or a weighted sum of the scores calculated for each mutation of interest, Equation (3) can be expressed as Equation (4) below.
  • Equation (4) the constraint “ ⁇ [i]> ⁇ [j]” is such that “the magnitude of the effect of the features of the mutation of interest on the genetic” This is one of the methods for realizing the constraint that the effect is greater than the effect on the feature index value. However, the method of realizing this constraint is not limited to the method of " ⁇ [i]> ⁇ [j]".
  • the calculation unit 2040 selects genetic mutations to be used for calculating the genetic characteristic index value based on the degree of contribution of each genetic mutation to the genetic characteristic. More specifically, the calculation unit 2040 selects, from among the genetic mutations contained in the target cell 20, genetic mutations whose contributions to genetic characteristics are equal to or greater than a threshold value, and based on the characteristics of the selected genetic mutations, A genetic characteristic index value is calculated. In this way, genetic feature index values that more accurately represent the genetic features of the target organism 10 can be selected by selecting gene mutations to be used for calculating the genetic feature index values based on the magnitude of contribution to the genetic features. can be calculated.
  • the calculation formula for calculating the genetic characteristic index value can be expressed, for example, as shown in Formula (5) below.
  • c[i] represents the contribution of genetic variation i to genetic characteristics.
  • th represents the contribution threshold used to select gene mutations. In this example, only gene mutations whose contribution is greater than or equal to th are used to calculate genetic feature index values.
  • the calculation formula for calculating the genetic characteristic index value can be expressed, for example, as shown in Formula (6) below.
  • Equation (6) only those mutations whose contribution is equal to or greater than the threshold value are selected for both the mutation of interest and the other genetic mutations.
  • the calculation unit 2040 may perform contribution-based selection only for gene mutations other than the mutation of interest without performing contribution-based selection for the mutation of interest.
  • the mutation of interest is used to calculate the genetic characteristic index value regardless of the degree of contribution.
  • the calculation unit 2040 acquires information representing the degree of contribution of genetic mutations to genetic characteristics (hereinafter referred to as contribution degree information).
  • Contribution degree information is pre-stored in an arbitrary storage unit in a form that can be obtained from genetic feature estimation device 2000 .
  • Calculation unit 2040 acquires contribution degree information about genetic features for which genetic feature index values are to be calculated, and uses the acquired contribution degree information to select gene mutations to be used for calculating genetic feature index values. do.
  • FIG. 7 is a diagram exemplifying contribution degree information in a table format.
  • the contribution information 50 in FIG. 7 has two columns, genetic variation 52 and contribution 54 .
  • Gene mutation 52 indicates identification information of the gene mutation.
  • Contribution 54 indicates the contribution to genetic characteristics for the genetic variation indicated by corresponding genetic variation 52 .
  • the contribution information 50 is prepared for each type of genetic feature.
  • the contribution information 50 in FIG. 7 indicates the contribution of each gene mutation to a genetic feature of type Fa. Therefore, for example, the record on the first line of the contribution information 50 in FIG. 7 indicates that the contribution of the gene mutation V1 to the genetic feature Fa is Ka1.
  • Contribution information may be prepared for each biological index (blood sugar level, brain volume, etc.) that may affect genetic characteristics. Specifically, contribution degree information 50 is prepared that indicates a higher degree of contribution to a gene mutation that has a stronger correlation with a specific index. When calculating a genetic feature index value for a genetic feature related to a specific index, the genetic feature estimating apparatus 2000 uses contribution degree information 50 generated based on the strength of correlation with the index. use.
  • biological index blood sugar level, brain volume, etc.
  • the strength of the correlation with the blood sugar level is examined for each genetic mutation, and contribution degree information 50 representing a higher degree of contribution is generated for a genetic mutation with a stronger correlation with the blood sugar level.
  • the genetic feature estimating apparatus 2000 uses this contribution degree information 50 when calculating a genetic feature index value (for example, the risk of developing diabetes) for diseases related to blood sugar levels.
  • the genetic feature estimating apparatus 2000 calculates a genetic feature index value for a given genetic feature, in addition to the mutation of interest, contribution Gene mutations with degrees greater than or equal to a threshold are used.
  • the genetic feature estimation device 2000 outputs information (hereinafter referred to as output information) indicating the genetic feature index value.
  • the output information includes the type of genetic feature and the calculated genetic feature index value for that type of genetic feature.
  • the output information may include various information used to calculate the genetic characteristic index value.
  • Information used to calculate the genetic characteristic index value includes, for example, the position (promoter, enhancer, etc.) associated with the type of target cell 20 or the type of organ containing the target cell 20 in the position information 40, , a mutation of interest specified by the calculation unit 2040, and the like.
  • the output information may further include information such as the selected genetic variation and the contribution threshold.
  • the output mode of the output information is arbitrary.
  • the genetic feature estimation device 2000 stores the output information in any storage accessible from the genetic feature estimation device 2000 .
  • the genetic feature estimation device 2000 causes any display device accessible from the genetic feature estimation device 2000 to display the output information.
  • the genetic feature estimation device 2000 transmits output information to any device accessible from the genetic feature estimation device 2000 .
  • Non-transitory computer readable media include various types of tangible storage media.
  • Examples of non-transitory computer-readable media include magnetic recording media (e.g., floppy disks, magnetic tapes, hard disk drives), magneto-optical recording media (e.g., magneto-optical discs), CD-ROMs, CD-Rs, CD-Rs /W, including semiconductor memory (e.g. mask ROM, PROM (programmable ROM), EPROM (erasable PROM), flash ROM, RAM).
  • the program may also be provided to the computer on various types of transitory computer readable medium. Examples of transitory computer-readable media include electrical signals, optical signals, and electromagnetic waves. Transitory computer-readable media can deliver the program to the computer via wired channels, such as wires and optical fibers, or wireless channels.
  • (Appendix 1) Acquire genetic mutation information related to genetic mutations in DNA (deoxyribonucleic acid) sequences possessed by target cells obtained from target organisms, and position information in which positions on DNA sequences are associated with cell types or organ types. an acquisition unit; Among the genetic mutations indicated by the genetic mutation information, a mutation of interest, which is a genetic mutation at the position associated with the type of the target cell or the type of the organ containing the target cell in the position information, is specified;
  • a genetic feature estimating apparatus comprising: a calculator that calculates a genetic feature index value representing the genetic feature of the target organism based on the feature of the mutation of interest.
  • the position indicated by the position information represents a promoter, enhancer, chemically modified region, or specific gene region in the DNA possessed by the cell of the associated cell or the associated organ.
  • genetic feature estimator (Appendix 3) The calculation unit Acquiring contribution degree information representing the degree of contribution, which is the degree of contribution of each gene mutation to genetic characteristics, 3.
  • the genetic feature estimation device according to appendix 1 or 2, wherein the genetic feature index value is calculated based on the feature of the mutation of interest whose contribution is equal to or greater than a threshold.
  • the calculation unit calculating a first score based on the characteristics of the mutation of interest and a second score based on the characteristics of a genetic mutation other than the mutation of interest; The first score and the second score are mutually adjusted so that the influence of the first score on the genetic characteristic index value is greater than the influence of the second score on the genetic characteristic index value give different weights, 3.
  • the genetic feature estimation device according to appendix 1 or 2, wherein the genetic feature index value is calculated using the weighted first score and the second score.
  • the calculation unit Acquiring contribution degree information representing the degree of contribution, which is the degree of contribution of each gene mutation to genetic characteristics, 5.
  • the genetic feature estimation device according to Supplementary Note 4, wherein the second score is calculated only for genetic mutations whose degree of contribution is equal to or greater than a threshold among genetic mutations other than the mutation of interest.
  • Appendix 6 The genetic feature estimation device according to Supplementary note 5, wherein the calculation unit calculates the first score only for the mutation of interest whose contribution degree is equal to or greater than a threshold value.
  • Appendix 7) 7. The genetic feature estimation device according to any one of Appendices 1 to 6, wherein the genetic feature index value is a polygenic risk score.
  • a control method implemented by a computer comprising: Acquire genetic mutation information related to genetic mutations in DNA (deoxyribonucleic acid) sequences possessed by target cells obtained from target organisms, and position information in which positions on DNA sequences are associated with cell types or organ types. an acquisition step; Among the genetic mutations indicated by the genetic mutation information, a mutation of interest, which is a genetic mutation at the position associated with the type of the target cell or the type of the organ containing the target cell in the position information, is specified; and a calculation step of calculating a genetic feature index value representing the genetic feature of the target organism based on the feature of the mutation of interest.
  • the position indicated by the position information represents a promoter, enhancer, chemically modified region, or specific gene region in the DNA possessed by the cell of the associated cell or the associated organ.
  • control method (Appendix 10)
  • Acquiring contribution degree information representing the degree of contribution, which is the degree of contribution of each gene mutation to genetic characteristics, 10.
  • the position indicated by the positional information represents a promoter, enhancer, chemically modified region, or specific gene region in the DNA possessed by the cell of the associated cell or associated organ computer readable medium.
  • Appendix 17 In the calculating step, Acquiring contribution degree information representing the degree of contribution, which is the degree of contribution of each gene mutation to genetic characteristics, 17.
  • Target organism 20 Target cell 30
  • Gene mutation information 32
  • Position 34 Gene mutation 40
  • Position information 42
  • Contribution degree information 52
  • Contribution degree 500 Computer 502 Bus 504 Processor 506 Memory 508 Storage device 510
  • Input/output interface 512
  • Network interface 2000

Landscapes

  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Sustainable Development (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

遺伝的特徴推定装置(2000)は、遺伝子変異情報(30)及び位置情報(40)を取得する。遺伝子変異情報(30)は、対象生物(10)から得た対象細胞(20)が持つ DNA(deoxyribonucleic acid)配列における遺伝子変異に関する情報を示す。位置情報(40)は、細胞の種類又は臓器の種類に対して DNA 配列上の位置を対応づけている。遺伝的特徴推定装置(2000)は、遺伝子変異情報(30)が示す遺伝子変異の中から、位置情報(40)において対象細胞(20)の種類又は対象細胞(20)を含む臓器の種類に対応づけられている位置における遺伝子変異を特定し、特定した遺伝子変異の特徴に基づいて、対象生物(10)の遺伝的特徴を表す遺伝的特徴指標値を算出する。

Description

遺伝的特徴推定装置、制御方法、及び非一時的なコンピュータ可読媒体
 本開示は、生物の遺伝的特徴を推定する技術に関する。
 生物の遺伝的特徴を推定する技術が開発されている。例えば特許文献1では、共通の形質を示すサンプル群において共通する遺伝子変異の情報が蓄積されているデータベースを利用して、評価対象の遺伝子変異から、評価対象の形質を予測する技術を開示している。特許文献1のシステムは、データベースの情報を利用して、評価対象が持つ1つ以上の遺伝子変異それぞれについて、その遺伝子変異と特定の形質との関連性の高さを表すスコアを算出し、このスコアに基づいて形質の予測を行う。
国際公開第2019/181022号
 本開示の目的は、生物の遺伝的特徴を推定する新たな技術を提供することである。
 本開示の遺伝的特徴推定装置は、対象生物から得た対象細胞が持つ DNA(deoxyribonucleic acid)配列における遺伝子変異に関する遺伝子変異情報、及び細胞の種類又は臓器の種類に対して DNA 配列上の位置が対応づけられている位置情報を取得する取得部と、前記遺伝子変異情報が示す遺伝子変異の中から、前記位置情報において前記対象細胞の種類又は前記対象細胞を含む臓器の種類に対応づけられている前記位置における遺伝子変異である着目変異を特定し、前記着目変異の特徴に基づいて、前記対象生物の遺伝的特徴を表す遺伝的特徴指標値を算出する算出部と、を有する。
 本開示の制御方法は、コンピュータによって実行される。当該制御方法は、対象生物から得た対象細胞が持つ DNA(deoxyribonucleic acid)配列における遺伝子変異に関する遺伝子変異情報、及び細胞の種類又は臓器の種類に対して DNA 配列上の位置が対応づけられている位置情報を取得する取得ステップと、前記遺伝子変異情報が示す遺伝子変異の中から、前記位置情報において前記対象細胞の種類又は前記対象細胞を含む臓器の種類に対応づけられている前記位置における遺伝子変異である着目変異を特定し、前記着目変異の特徴に基づいて、前記対象生物の遺伝的特徴を表す遺伝的特徴指標値を算出する算出ステップと、を有する。
 本開示の非一時的なコンピュータ可読媒体は、本開示の制御方法をコンピュータに実行させるプログラムを格納している。
 本開示によれば、生物の遺伝的特徴を推定する新たな技術が提供される。
実施形態1の遺伝的特徴推定装置の動作の概要を例示する図である。 実施形態1の遺伝的特徴推定装置の機能構成を例示するブロック図である。 遺伝的特徴推定装置を実現するコンピュータのハードウエア構成を例示するブロック図である。 実施形態1の遺伝的特徴推定装置によって実行される処理の流れを例示するフローチャートである。 遺伝子変異情報をテーブル形式で例示する図である。 位置情報をテーブル形式で例示する図である。 寄与度情報をテーブル形式で例示する図である。
 以下では、本開示の実施形態について、図面を参照しながら詳細に説明する。各図面において、同一又は対応する要素には同一の符号が付されており、説明の明確化のため、必要に応じて重複説明は省略される。また、特に説明しない限り、所定値や閾値などといった予め定められている値は、その値を利用する装置が取得可能な態様で、記憶部などに予め格納されている。また、特に説明しない限り、記憶部は、1つ以上の記憶装置によって構成されている。
 図1は、実施形態1の遺伝的特徴推定装置2000の動作の概要を例示する図である。ここで、図1は、遺伝的特徴推定装置2000の概要の理解を容易にするための図であり、遺伝的特徴推定装置2000の動作は、図1に示したものに限定されない。
 遺伝的特徴推定装置2000は、対象生物10の遺伝的特徴に関する指標値(以下、遺伝的特徴指標値)を算出する。対象生物10は、遺伝的特徴指標値の算出対象である任意の生物であり、人その他の動物であってもよいし、植物であってもよい。
 遺伝的特徴は、遺伝子の効果によって現れる特徴である。例えば遺伝的特徴は、疾患に罹る蓋然性の高さや疾患の進行の速さなどのような、疾患に関係する特徴である。その他にも例えば、遺伝的特徴は、身長の高さや体重の重さなどのような、身体的特徴である。その他にも例えば、遺伝的特徴は、薬剤に対する耐性や感受性の高さなどのような、薬剤の効果の大きさである。
 遺伝的特徴指標値は、例えば、ポリジェニックリスクスコアである。ただし、遺伝的特徴指標値は、対象生物10の遺伝的特徴を表す指標値であればよく、ポリジェニックリスクスコアに限定されない。
 対象生物10の遺伝的特徴指標値を算出するために、遺伝的特徴推定装置2000は、遺伝子変異情報30及び位置情報40を取得する。遺伝子変異情報30は、対象生物10から得た細胞(対象細胞20)について、その対象細胞20が持つ DNA(deoxyribonucleic acid)配列における遺伝子変異に関する情報を示す。ここで、遺伝子変異情報30は少なくとも、対象細胞20が持つ1つ以上の遺伝子変異それぞれについて、DNA 配列上の位置を示す。
 位置情報40は、細胞又は臓器の種類に対し、DNA 配列上の位置とを対応づけた情報である。例えば位置情報40では、遺伝的特徴指標値を算出する際に特に着目すべき DNA 配列上の位置が、細胞又は臓器の種類ごとに示されている。
 細胞の種類としては、神経細胞、グリア細胞、血球、又は皮膚細胞などといった種類が挙げられる。ここで、分類の粒度は任意である。例えばグリア細胞をさらに細かく分類して、ミクログリアやオリゴデンドロサイトなどといった、より具体的な種類が利用されてもよい。
 臓器の種類としては、脳、心臓、又は肺などといった種類が挙げられる。ただし、臓器の種類についても、分類の粒度は任意である。例えば、「呼吸器系」などのように、複数の種類の臓器を含むグループが、臓器の種類として利用されてもよい。
 遺伝的特徴推定装置2000は、遺伝子変異情報30が示す遺伝子変異の中から、位置情報40において対象細胞20の種類又は対象細胞20を持つ臓器の種類に対応づけられている位置における遺伝子変異を特定する。以下、ここで特定される遺伝子変異のことを、「着目変異」と呼ぶ。遺伝的特徴推定装置2000は、着目変異の特徴に基づき、対象生物10について、遺伝的特徴指標値を算出する。
 ここで、対象細胞20が持つ遺伝子変異のうち、着目変異以外の遺伝子変異の特徴については、遺伝的特徴指標値の算出に利用されなくてもよいし、利用されてもよい。ただし後者の場合、着目変異以外の遺伝子変異の特徴よりも、着目変異の特徴の方が、遺伝的特徴指標値に与える影響(遺伝的特徴指標値に対する寄与)が大きくなるようにする。その具体的な方法については後述する。
<作用効果の一例>
 本実施形態の遺伝的特徴推定装置2000によれば、対象生物10の対象細胞20が持つ遺伝子変異の中から、位置情報40において対象細胞20の種類又は対象細胞20が含まれる臓器の種類に対応づけられている位置における遺伝子変異(着目変異)が特定される。そして、着目変異の特徴に基づいて、対象生物10の遺伝的特徴に関する指標値が算出される。着目変異以外の遺伝子変異の特徴については、遺伝的特徴指標値の算出に利用されないか、着目変異の特徴よりも、遺伝的特徴指標値に与える影響が小さくなるように利用される。
 このような方法によれば、着目変異とそれ以外の遺伝子変異とを区別しないケースと比較し、対象生物10の遺伝的特徴をより精度良く表す遺伝的特徴指標値を算出することができる。例えば、位置情報40において、対象細胞20の種類又は対象細胞20が含まれる臓器の種類に対し、遺伝的特徴に対する影響が大きいと考えられる DNA 配列上の位置を対応づけておく。こうすることで、遺伝的特徴指標値の算出において、遺伝的特徴に対する影響が大きいと考えられる位置における遺伝子変異の特徴が着目されるようになる。そのため、このような着目が行われないケースと比較し、対象生物10の遺伝的特徴をより精度良く表す遺伝的特徴指標値を算出することができる。
 以下、本実施形態の遺伝的特徴推定装置2000について、より詳細に説明する。
<機能構成の例>
 図2は、実施形態1の遺伝的特徴推定装置2000の機能構成を例示するブロック図である。遺伝的特徴推定装置2000は、取得部2020及び算出部2040を有する。取得部2020は、対象生物10の対象細胞20についての遺伝子変異情報30、及び位置情報40を取得する。算出部2040は、遺伝子変異情報30が示す遺伝子変異の中から、位置情報40において対象細胞20の種類又は対象細胞20を持つ臓器の種類に対応づけられている位置における遺伝子変異を特定する。そして、算出部2040は、特定した遺伝子変異の特徴に基づいて、遺伝的特徴指標値を算出する。
<ハードウエア構成の例>
 遺伝的特徴推定装置2000の各機能構成部は、各機能構成部を実現するハードウエア(例:ハードワイヤードされた電子回路など)で実現されてもよいし、ハードウエアとソフトウエアとの組み合わせ(例:電子回路とそれを制御するプログラムの組み合わせなど)で実現されてもよい。以下、遺伝的特徴推定装置2000の各機能構成部がハードウエアとソフトウエアとの組み合わせで実現される場合について、さらに説明する。
 図3は、遺伝的特徴推定装置2000を実現するコンピュータ500のハードウエア構成を例示するブロック図である。コンピュータ500は、任意のコンピュータである。例えばコンピュータ500は、PC(Personal Computer)やサーバマシンなどといった、据え置き型のコンピュータである。その他にも例えば、コンピュータ500は、スマートフォンやタブレット端末などといった可搬型のコンピュータである。コンピュータ500は、遺伝的特徴推定装置2000を実現するために設計された専用のコンピュータであってもよいし、汎用のコンピュータであってもよい。
 例えば、コンピュータ500に対して所定のアプリケーションをインストールすることにより、コンピュータ500で、遺伝的特徴推定装置2000の各機能が実現される。上記アプリケーションは、遺伝的特徴推定装置2000の各機能構成部を実現するためのプログラムで構成される。なお、上記プログラムの取得方法は任意である。例えば、当該プログラムが格納されている記憶媒体(DVD ディスクや USB メモリなど)から、当該プログラムを取得することができる。その他にも例えば、当該プログラムが格納されている記憶部を管理しているサーバ装置から、当該プログラムをダウンロードすることにより、当該プログラムを取得することができる。
 コンピュータ500は、バス502、プロセッサ504、メモリ506、ストレージデバイス508、入出力インタフェース510、及びネットワークインタフェース512を有する。バス502は、プロセッサ504、メモリ506、ストレージデバイス508、入出力インタフェース510、及びネットワークインタフェース512が、相互にデータを送受信するためのデータ伝送路である。ただし、プロセッサ504などを互いに接続する方法は、バス接続に限定されない。
 プロセッサ504は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、又は FPGA(Field-Programmable Gate Array)などの種々のプロセッサである。メモリ506は、RAM(Random Access Memory)などを用いて実現される主記憶装置である。ストレージデバイス508は、ハードディスク、SSD(Solid State Drive)、メモリカード、又は ROM(Read Only Memory)などを用いて実現される補助記憶装置である。
 入出力インタフェース510は、コンピュータ500と入出力デバイスとを接続するためのインタフェースである。例えば入出力インタフェース510には、キーボードなどの入力装置や、ディスプレイ装置などの出力装置が接続される。
 ネットワークインタフェース512は、コンピュータ500をネットワークに接続するためのインタフェースである。このネットワークは、LAN(Local Area Network)であってもよいし、WAN(Wide Area Network)であってもよい。
 ストレージデバイス508は、遺伝的特徴推定装置2000の各機能構成部を実現するプログラム(前述したアプリケーションを実現するプログラム)を記憶している。プロセッサ504は、このプログラムをメモリ506に読み出して実行することで、遺伝的特徴推定装置2000の各機能構成部を実現する。
 遺伝的特徴推定装置2000は、1つのコンピュータ500で実現されてもよいし、複数のコンピュータ500で実現されてもよい。後者の場合において、各コンピュータ500の構成は同一である必要はなく、それぞれ異なるものとすることができる。
<処理の流れ>
 図4は、実施形態1の遺伝的特徴推定装置2000によって実行される処理の流れを例示するフローチャートである。取得部2020は、遺伝子変異情報30を取得する(S102)。取得部2020は、位置情報40を取得する(S104)。算出部2040は、遺伝子変異情報30及び位置情報40を用いて、着目変異を特定する(S106)。具体的には、算出部2040は、遺伝子変異情報30が示す遺伝子変異のうち、位置情報40において対象細胞20の種類又は対象細胞20を含む臓器の種類に対応づけられている遺伝子変異を、着目変異として特定する。そして、算出部2040は、遺伝的特徴に対する着目変異の寄与の大きさに基づいて、遺伝的特徴指標値を算出する(S108)。
 ここで、図4によって示されている処理の流れは、遺伝的特徴推定装置2000によって実行される処理の流れの一例であり、遺伝的特徴推定装置2000によって実行される処理の流れは、図4によって示されているものに限定されない。例えば、遺伝子変異情報30の取得(S102)と位置情報40の取得(S104)は、上述の順序とは逆の順序で行われてもよいし、互いに並行して行われてもよい。
<遺伝子変異情報30の取得:S102>
 取得部2020は、遺伝子変異情報30を取得する(S102)。前述したように、遺伝子変異情報30は、対象細胞20について、その対象細胞20が持つ DNA 配列における遺伝子変異に関する情報を示す。少なくとも遺伝子変異情報30は、対象細胞20が持つ遺伝子変異それぞれについて、対象細胞20の DNA 配列におけるその遺伝子変異の位置を示す。
 図5は、遺伝子変異情報30をテーブル形式で例示する図である。図5の遺伝子変異情報30は、位置32、及び遺伝子変異34という2つの列を有する。位置32は、対象細胞20の DNA 配列上の位置を示す。遺伝子変異34は、対応する位置32が示す DNA 配列上の位置において、対象細胞20が持つ遺伝子変異を示す。例えば図5の1行目のレコードは、対象細胞20が、位置 P1 において、遺伝子変異 V1 を持つことを表している。
 取得部2020が遺伝子変異情報30を取得する方法は様々である。例えば遺伝子変異情報30は、遺伝的特徴推定装置2000からアクセス可能な記憶部に予め格納されている。この場合、取得部2020は、この記憶部にアクセスすることで、遺伝子変異情報30を取得する。より具体的な例としては、対象生物10が病院の患者である場合、遺伝子変異情報30は、対象生物10のカルテを表すデータ(いわゆる電子カルテ)に含まれうる。この場合、取得部2020は、対象生物10の電子カルテから、対象生物10の遺伝子変異情報30を取得する。なお、特定の者の電子カルテから所望の情報を取得する技術には、既存の技術を利用することができる。その他にも例えば、遺伝子変異情報30は、他の装置から遺伝的特徴推定装置2000に対して送信されてもよい。
<位置情報40の取得:S104>
 取得部2020は、位置情報40を取得する(S104)。前述した通り、位置情報40は、細胞又は臓器の種類に対し、DNA 配列上の位置を対応づけた情報である。図6は、位置情報40をテーブル形式で例示する図である。位置情報40は、種類42及び位置44という2つの列を有する。種類42は、細胞又は臓器の種類を示す。位置44は、DNA 配列上の1つ以上の位置を示す。位置44が複数の位置を示す場合、位置44は、DNA 配列上の特定の領域を示してもよい。例えば図6の1行目のレコードは、細胞の種類 C1 に対し、DNA 配列上の範囲 R1 を対応づけている。
 DNA 配列上の領域の具体的な例としては、プロモーター、エンハンサー、化学修飾領域(DNA メチル化が起こった領域)、又は特定の遺伝子などが挙げられる。これらの領域は、遺伝子の発現やタンパク質の構造に直接的又は間接的に影響を及ぼす。そのため、これらの領域における遺伝子変異は、他の領域における遺伝子変異と比較し、生物の遺伝的特徴に与える影響が大きいと考えられる。よって、対象生物10の遺伝子変異のうち、これらの領域における遺伝子変異に特に着目することにより、対象生物10の遺伝的特徴をより精度よく把握することができる。
 取得部2020が位置情報40を取得する方法は様々である。例えば位置情報40は、遺伝的特徴推定装置2000からアクセス可能な記憶部に予め格納されている。この場合、取得部2020は、この記憶部にアクセスすることで、位置情報40を取得する。その他にも例えば、位置情報40は、他の装置から遺伝的特徴推定装置2000に対して送信されてもよい。
 位置情報40は、遺伝的特徴指標値の算出対象とする遺伝的特徴の種類ごとに用意されてもよい。例えばこの場合、肺がんに罹るリスクを表す遺伝的特徴指標値の算出と、アルツハイマー病に罹るリスクを表す遺伝的特徴指標値の算出とでは、互いに異なる位置情報40が利用される。
 ここで、1種類の遺伝的特徴について、位置情報40が複数用意されていてもよい。この場合、遺伝的特徴推定装置2000は、複数の位置情報40を利用して1つの遺伝的特徴指標値を算出してもよいし、各位置情報40について個々に遺伝的特徴指標値を算出してもよい。複数の位置情報40について個々に遺伝的特徴指標値を算出することによれば、対象生物10に関する1つの遺伝的特徴について、臓器の種類や細胞の種類ごとにリスク等を評価することができる。
 例えば、統合失調症の患者について、統合失調症の罹患リスクを表す遺伝的特徴指標値を脳、肝臓、及び腸という3種類の臓器それぞれについて算出することにより、これらの臓器の中から、その患者の統合失調症に関わりが大きい臓器を予測するとする。この場合、「種類42=脳」である位置情報40、「種類42=肝臓」である位置情報40、及び「種類42=腸」である位置情報40をそれぞれ用意しておく。そして、遺伝的特徴推定装置2000は、これら3つの位置情報40それぞれについて個々に遺伝的特徴指標値を算出する。
 ここで、脳と腸についての遺伝的特徴指標値はいずれも、統合失調症の罹患リスクが高いことを示している一方で、肝臓についての遺伝的特徴指標値は、統合失調症の罹患リスクが高くないことを示しているとする。この場合、この患者の統合失調症には、脳と腸が関係している蓋然性が高いことが分かる。
 位置情報40が遺伝的特徴の種類ごとに定められている場合、例えば遺伝的特徴推定装置2000は、どの種類の遺伝的特徴について遺伝的特徴指標値を算出したいのか(遺伝的特徴指標値の算出対象とする遺伝的特徴の種類)を指定する情報を取得する。例えばこの情報は、ユーザによって入力される。この場合、取得部2020は、ユーザによって指定された遺伝的特徴の種類に対応する位置情報40を取得する。
<着目変異の特定:S106>
 算出部2040は、位置情報40において、対象細胞20の種類又は対象細胞20を含む臓器の種類に対応づけられている位置を特定し、遺伝子変異情報30がその位置について示す遺伝子変異を、着目変異として特定する(S106)。例えば算出部2040は、位置情報40の中から、対象細胞20の種類又は対象細胞20を含む臓器の種類を種類42に示すレコードを特定する。
 算出部2040は、遺伝子変異情報30のレコードの中から、特定した位置情報40のレコードの位置44に示されている位置が、位置32に示されているものを特定する。そして、算出部2040は、特定した遺伝子変異情報30のレコードの遺伝子変異34によって示されている遺伝子変異を、着目変異として特定する。
 例えば、対象細胞20の種類を種類42に示す位置情報40のレコードが、「プロモーター」と「エンハンサー」という2つを位置44に示しているとする。この場合、算出部2040は、遺伝子変異情報30の中から、プロモーター又はエンハンサーに含まれる位置を位置32に示すレコードを特定する。そして、算出部2040は、特定したレコードの遺伝子変異34に示されている遺伝子変異を、着目変異として特定する。
 ここで、細胞の種類と臓器の種類のどちらを利用するのか、又はこれらの双方を利用するのかについては、遺伝的特徴推定装置2000において予め定められていてもよいし、ユーザによって動的に決定されてもよい。後者の場合、例えば遺伝的特徴推定装置2000は、遺伝的特徴推定装置2000のユーザに対し、細胞の種類と臓器の種類のうち、着目変異の特定に利用するものを選択可能な入力インタフェース(例えば、入力画面)を提供する。そして、遺伝的特徴推定装置2000は、ユーザ入力の結果に基づいて、着目変異の特定を行う。例えばユーザが、「細胞の種類」を選択したとする。この場合、算出部2040は、位置情報40において、対象細胞20の種類に対応づけられている位置を特定する。
<遺伝的特徴指標値の算出:S108>
 算出部2040は、着目変異の特徴に基づいて、遺伝的特徴指標値を算出する(S108)。例えば算出部2040は、着目変異ごとにその特徴に基づくスコアを算出する。そして、各着目変異について算出されたスコアに基づいて、遺伝的特徴指標値を算出する。
 例えば、遺伝子変異の特徴からスコアを算出する算出式、及び各着目変異について算出されたスコアに基づいて遺伝的特徴指標値を算出するための算出式を、予め定めておく。例えばこれらの算出式は、以下の式(1)で表される。
Figure JPOXMLDOC01-appb-M000001
 ここで、S は遺伝的特徴指標値を表す。A は、着目変異の集合を表す。i は、遺伝子変異の識別子を表す。以下、識別子が i である遺伝子変異を、遺伝子変異iと表記する。f[i] は、遺伝子変異iの特徴を表す。h() は、遺伝子変異の特徴からスコアを算出する算出式である。g() は、各着目変異について算出されたスコアに基づいて遺伝的特徴指標値を算出するための算出式である。
 例えば遺伝的特徴指標値は、各着目変異について算出されたスコアの単純和や重み付き和などとして算出される。この場合、式(1)は、以下の式(2)のように表すことができる。
Figure JPOXMLDOC01-appb-M000002
 ここで、α[i] は、遺伝子変異iに与えられた重みである。例えば遺伝子変異iの重みは、対象細胞20の DNA 配列上における位置に応じて定められる。なお、全てのiについて α[i]=1 とすれば、式(2)は単純和となる。
 着目変異の特徴をスコアに変換する方法には、様々な方法が考えられる。例えば、着目変異が有する特定のアレルの数が、スコアとして利用される。その他にも例えば、連鎖不平衡等として表される着目変異と DNA 上の周辺の変異との相関の強さや、プロモーターやエンハンサーの活性の強さも、スコアとして利用される。
 ここで、遺伝子変異の特徴が遺伝的特徴に与える影響の大きさは、遺伝的特徴の種類によって異なりうる。例えば、或る遺伝子変異について、肺がんに罹るリスクに与える影響の大きさ、アルツハイマー病に罹るリスクに与える影響の大きさ、及び身長の伸びやすさに与える影響の大きさは、それぞれ異なる蓋然性が高い。そのため、遺伝子変異の特徴からスコアを算出する算出式は、遺伝的特徴の種類ごとに定めておくことが好適である。
 遺伝子変異の特徴からスコアを算出する算出式が遺伝的特徴の種類ごとに定められている場合、例えば遺伝的特徴推定装置2000は、遺伝的特徴指標値の算出対象とする遺伝的特徴の種類を指定する情報を取得する。前述した通り、例えばこの情報は、ユーザによって入力される。算出部2040は、予め用意されている算出式のうち、指定された遺伝的特徴の種類に対応する算出式を利用して、遺伝的特徴指標値を算出する。なお、同様にして、各着目変異について算出されたスコアに基づいて遺伝的特徴指標値を算出するための算出式についても、遺伝的特徴指標値の算出対象とする遺伝的特徴ごとに定められていてもよい。
<<着目変異以外の遺伝子変異の利用>>
 ここで、前述したように、遺伝的特徴指標値の算出には、着目変異以外の遺伝子変異の特徴が利用されてもよい。この場合、遺伝的特徴を算出する算出式は、例えば以下の式(3)のように表される。
Figure JPOXMLDOC01-appb-M000003
 ここで、集合 B は、対象細胞20に含まれる全ての遺伝子変異の集合である。そのため、集合 B-A は、対象細胞20に含まれる遺伝子変異のうち、着目変異以外の遺伝子変異の集合を表す。jは、集合 B に含まれる遺伝子変異の識別子である。
 また、各着目変異について算出されたスコアの単純和や重み付き和などとして遺伝的特徴指標値が算出される場合、式(3)は、以下の式(4)のように表すことができる。
Figure JPOXMLDOC01-appb-M000004
 式(4)において、制約「α[i]>β[j]」は、「着目変異の特徴が遺伝的特徴指標値に与える影響の大きさは、着目変異以外の遺伝子変異の特徴が遺伝的特徴指標値に与える影響よりも大きい」という制約を実現する方法の1つである。ただし、この制約を実現する方法は、「α[i]>β[j]」とする方法に限定されない。
<<寄与度の考慮>>
 遺伝的特徴指標値の算出において、遺伝的特徴に対する各遺伝子変異の寄与の大きさ(寄与度)が考慮されてもよい。この場合、例えば算出部2040は、遺伝的特徴に対する各遺伝子変異の寄与度に基づいて、遺伝的特徴指標値の算出に利用する遺伝子変異を選択する。より具体的には、算出部2040は、対象細胞20に含まれる遺伝子変異の中から、遺伝的特徴に対する寄与度が閾値以上である遺伝子変異を選択し、選択した遺伝子変異の特徴に基づいて、遺伝的特徴指標値を算出する。このように遺伝的特徴に対する寄与の大きさに基づいて、遺伝的特徴指標値の算出に利用する遺伝子変異を選択することにより、対象生物10の遺伝的特徴をより正確に表す遺伝的特徴指標値を算出することができる。
 着目変異のみを利用し、なおかつ、寄与度を考慮する場合、遺伝的特徴指標値を算出する算出式は、例えば以下の式(5)のように表すことができる。
Figure JPOXMLDOC01-appb-M000005
 ここで、c[i] は、遺伝的特徴に対する遺伝子変異iの寄与度を表す。th は、遺伝子変異の選択に利用する寄与度の閾値を表す。この例では、寄与度が th 以上である遺伝子変異のみが、遺伝的特徴指標値の算出に利用されている。
 着目変異とそれ以外の遺伝子変異の双方を利用し、なおかつ、寄与度を考慮する場合、遺伝的特徴指標値を算出する算出式は、例えば以下の式(6)のように表すことができる。
Figure JPOXMLDOC01-appb-M000006
 ここで、式(6)では、着目変異とそれ以外の遺伝子変異のいずれについても、寄与度が閾値以上であるもののみが選択されている。しかしながら、算出部2040は、着目変異については寄与度に基づく選択を行わず、着目変異以外の遺伝子変異についてのみ寄与度に基づく選択を行うようにしてもよい。この場合、着目変異については、寄与度にかかわらず、遺伝的特徴指標値の算出に利用される。一方、着目変異以外の遺伝子変異については、寄与度が閾値以上であるもののみが、遺伝的特徴指標値の算出に利用される。この場合、遺伝的特徴指標値の算出式は、以下の式(7)のように表すことができる。
Figure JPOXMLDOC01-appb-M000007
 式(7)は、式(6)と異なり、c[i]>=th という条件を含まない。そのため、着目変異については、その寄与度にかかわらず、遺伝的特徴指標値の算出に利用されている。
 上述のように、遺伝的特徴に対する各遺伝子変異の寄与度を考慮するために、例えば算出部2040は、遺伝的特徴に対する遺伝子変異の寄与度を表す情報(以下、寄与度情報)を取得する。寄与度情報は、遺伝的特徴推定装置2000から取得可能な態様で、任意の記憶部に予め格納されている。算出部2040は、遺伝的特徴指標値の算出対象である遺伝的特徴について寄与度情報を取得し、取得した寄与度情報を利用して、遺伝的特徴指標値の算出に利用する遺伝子変異を選択する。
 図7は、寄与度情報をテーブル形式で例示する図である。図7の寄与度情報50は、遺伝子変異52及び寄与度54という2つの列を有する。遺伝子変異52は、遺伝子変異の識別情報を示す。寄与度54は、対応する遺伝子変異52によって示されている遺伝子変異について、遺伝的特徴に対する寄与度を示す。
 寄与度情報50は、遺伝的特徴の種類ごとに用意される。例えば図7の寄与度情報50は、Fa という種類の遺伝的特徴に対する各遺伝子変異の寄与度を示す。そのため、例えば図7の寄与度情報50の1行目のレコードは、遺伝子変異 V1 の遺伝的特徴 Fa に対する寄与度が Ka1 であることを表している。
 寄与度情報は、遺伝的特徴に影響を与える可能性がある、生物についての何らかの指標(血糖値や脳体積など)ごとに用意されてもよい。具体的には、特定の指標との相関が強い遺伝子変異ほど高い寄与度を表す寄与度情報50を用意する。遺伝的特徴推定装置2000は、特定の指標に関係のある遺伝的特徴についての遺伝的特徴指標値を算出する際に、その指標との相関の強さに基づいて生成された寄与度情報50を利用する。
 例えば、遺伝子変異ごとに血糖値との相関の強さを調べ、血糖値との相関が強い遺伝子変異ほど高い寄与度を表す寄与度情報50を生成しておく。遺伝的特徴推定装置2000は、この寄与度情報50を、血糖値に関係のある疾患についての遺伝的特徴指標値(例えば糖尿病に罹るリスク)を算出する際に利用する。
 指標ごとに用意された寄与度情報50を利用する場合、遺伝的特徴と、その遺伝的特徴と関係のある指標とを対応づけた情報を予め用意しておく。例えばこの情報は、「血糖値」という指標と、「糖尿病に罹るリスク」という遺伝的特徴とを対応づけている。遺伝的特徴推定装置2000は、或る遺伝的特徴についての遺伝的特徴指標値を算出する際、着目変異に加え、その遺伝的特徴に対応づけられている指標についての寄与度情報50において、寄与度が閾値以上である遺伝子変異を利用する。
<遺伝的特徴推定装置2000による出力>
 遺伝的特徴推定装置2000は、遺伝的特徴指標値を示す情報(以下、出力情報)を出力する。例えば出力情報は、遺伝的特徴の種類と、その種類の遺伝的特徴について算出された遺伝的特徴指標値とを含む。その他にも例えば、出力情報は、遺伝的特徴指標値の算出に利用された種々の情報を含んでもよい。遺伝的特徴指標値の算出に利用された情報としては、例えば、位置情報40において、対象細胞20の種類又は対象細胞20を含む臓器の種類に対応付けられている位置(プロモーターやエンハンサーなど)や、算出部2040によって特定された着目変異などが挙げられる。また、寄与度の閾値に基づいて遺伝子変異の選択が行われる場合、出力情報は、選択された遺伝子変異や寄与度の閾値などの情報をさらに含んでもよい。
 出力情報の出力態様は任意である。例えば遺伝的特徴推定装置2000は、遺伝的特徴推定装置2000からアクセス可能な任意の記憶部に、出力情報を格納する。その他にも例えば、遺伝的特徴推定装置2000は、遺伝的特徴推定装置2000からアクセス可能な任意のディスプレイ装置に、出力情報を表示させる。その他にも例えば、遺伝的特徴推定装置2000は、遺伝的特徴推定装置2000からアクセス可能な任意の装置に対して、出力情報を送信する。
 以上、実施の形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
 なお、上述の例において、プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに提供することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えば、フレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば、光磁気ディスク)、CD-ROM、CD-R、CD-R/W、半導体メモリ(例えば、マスク ROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM)を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに提供されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
 上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
 (付記1)
 対象生物から得た対象細胞が持つ DNA(deoxyribonucleic acid)配列における遺伝子変異に関する遺伝子変異情報、及び細胞の種類又は臓器の種類に対して DNA 配列上の位置が対応づけられている位置情報を取得する取得部と、
 前記遺伝子変異情報が示す遺伝子変異の中から、前記位置情報において前記対象細胞の種類又は前記対象細胞を含む臓器の種類に対応づけられている前記位置における遺伝子変異である着目変異を特定し、前記着目変異の特徴に基づいて、前記対象生物の遺伝的特徴を表す遺伝的特徴指標値を算出する算出部と、を有する遺伝的特徴推定装置。
 (付記2)
 前記位置情報が示す前記位置は、対応づけられている細胞又は対応づけられている臓器が持つ細胞が持つ DNA におけるプロモーター、エンハンサー、化学修飾領域、又は特定の遺伝子の領域を表す、付記1に記載の遺伝的特徴推定装置。
 (付記3)
 前記算出部は、
  遺伝的特徴に対する各遺伝子変異の寄与の大きさである寄与度を表す寄与度情報を取得し、
  前記寄与度が閾値以上である前記着目変異の特徴に基づいて、前記遺伝的特徴指標値を算出する、付記1又は2に記載の遺伝的特徴推定装置。
 (付記4)
 前記算出部は、
  前記着目変異の特徴に基づく第1スコアと、前記着目変異以外の遺伝子変異の特徴に基づく第2スコアを算出し、
  前記第1スコアが前記遺伝的特徴指標値に与える影響が、前記第2スコアが前記遺伝的特徴指標値に与える影響よりも大きくなるように、前記第1スコアと前記第2スコアに対して互いに異なる重みを付与し、
  重みが付与された前記第1スコアと前記第2スコアを用いて、前記遺伝的特徴指標値を算出する、付記1又は2に記載の遺伝的特徴推定装置。
 (付記5)
 前記算出部は、
  遺伝的特徴に対する各遺伝子変異の寄与の大きさである寄与度を表す寄与度情報を取得し、
  前記着目変異以外の遺伝子変異のうち、前記寄与度が閾値以上である遺伝子変異のみについて前記第2スコアを算出する、付記4に記載の遺伝的特徴推定装置。
 (付記6)
 前記算出部は、前記寄与度が閾値以上である前記着目変異のみについて前記第1スコアを算出する、付記5に記載の遺伝的特徴推定装置。
 (付記7)
 前記遺伝的特徴指標値はポリジェニックリスクスコアである、付記1から6いずれか一項に記載の遺伝的特徴推定装置。
 (付記8)
 コンピュータによって実行される制御方法であって、
 対象生物から得た対象細胞が持つ DNA(deoxyribonucleic acid)配列における遺伝子変異に関する遺伝子変異情報、及び細胞の種類又は臓器の種類に対して DNA 配列上の位置が対応づけられている位置情報を取得する取得ステップと、
 前記遺伝子変異情報が示す遺伝子変異の中から、前記位置情報において前記対象細胞の種類又は前記対象細胞を含む臓器の種類に対応づけられている前記位置における遺伝子変異である着目変異を特定し、前記着目変異の特徴に基づいて、前記対象生物の遺伝的特徴を表す遺伝的特徴指標値を算出する算出ステップと、を有する制御方法。
 (付記9)
 前記位置情報が示す前記位置は、対応づけられている細胞又は対応づけられている臓器が持つ細胞が持つ DNA におけるプロモーター、エンハンサー、化学修飾領域、又は特定の遺伝子の領域を表す、付記8に記載の制御方法。
 (付記10)
 前記算出ステップにおいて、
  遺伝的特徴に対する各遺伝子変異の寄与の大きさである寄与度を表す寄与度情報を取得し、
  前記寄与度が閾値以上である前記着目変異の特徴に基づいて、前記遺伝的特徴指標値を算出する、付記8又は9に記載の制御方法。
 (付記11)
 前記算出ステップにおいて、
  前記着目変異の特徴に基づく第1スコアと、前記着目変異以外の遺伝子変異の特徴に基づく第2スコアを算出し、
  前記第1スコアが前記遺伝的特徴指標値に与える影響が、前記第2スコアが前記遺伝的特徴指標値に与える影響よりも大きくなるように、前記第1スコアと前記第2スコアに対して互いに異なる重みを付与し、
  重みが付与された前記第1スコアと前記第2スコアを用いて、前記遺伝的特徴指標値を算出する、付記8又は9に記載の制御方法。
 (付記12)
 前記算出ステップにおいて、
  遺伝的特徴に対する各遺伝子変異の寄与の大きさである寄与度を表す寄与度情報を取得し、
  前記着目変異以外の遺伝子変異のうち、前記寄与度が閾値以上である遺伝子変異のみについて前記第2スコアを算出する、付記11に記載の制御方法。
 (付記13)
 前記算出ステップにおいて、前記寄与度が閾値以上である前記着目変異のみについて前記第1スコアを算出する、付記12に記載の制御方法。
 (付記14)
 前記遺伝的特徴指標値はポリジェニックリスクスコアである、付記8から13いずれか一項に記載の制御方法。
 (付記15)
 コンピュータに、
 対象生物から得た対象細胞が持つ DNA(deoxyribonucleic acid)配列における遺伝子変異に関する遺伝子変異情報、及び細胞の種類又は臓器の種類に対して DNA 配列上の位置が対応づけられている位置情報を取得する取得ステップと、
 前記遺伝子変異情報が示す遺伝子変異の中から、前記位置情報において前記対象細胞の種類又は前記対象細胞を含む臓器の種類に対応づけられている前記位置における遺伝子変異である着目変異を特定し、前記着目変異の特徴に基づいて、前記対象生物の遺伝的特徴を表す遺伝的特徴指標値を算出する算出ステップと、を実行させるプログラムが格納されている非一時的なコンピュータ可読媒体。
 (付記16)
 前記位置情報が示す前記位置は、対応づけられている細胞又は対応づけられている臓器が持つ細胞が持つ DNA におけるプロモーター、エンハンサー、化学修飾領域、又は特定の遺伝子の領域を表す、付記15に記載のコンピュータ可読媒体。
 (付記17)
 前記算出ステップにおいて、
  遺伝的特徴に対する各遺伝子変異の寄与の大きさである寄与度を表す寄与度情報を取得し、
  前記寄与度が閾値以上である前記着目変異の特徴に基づいて、前記遺伝的特徴指標値を算出する、付記15又は16に記載のコンピュータ可読媒体。
 (付記18)
 前記算出ステップにおいて、
  前記着目変異の特徴に基づく第1スコアと、前記着目変異以外の遺伝子変異の特徴に基づく第2スコアを算出し、
  前記第1スコアが前記遺伝的特徴指標値に与える影響が、前記第2スコアが前記遺伝的特徴指標値に与える影響よりも大きくなるように、前記第1スコアと前記第2スコアに対して互いに異なる重みを付与し、
  重みが付与された前記第1スコアと前記第2スコアを用いて、前記遺伝的特徴指標値を算出する、付記15又は16に記載のコンピュータ可読媒体。
 (付記19)
 前記算出ステップにおいて、
  遺伝的特徴に対する各遺伝子変異の寄与の大きさである寄与度を表す寄与度情報を取得し、
  前記着目変異以外の遺伝子変異のうち、前記寄与度が閾値以上である遺伝子変異のみについて前記第2スコアを算出する、付記18に記載のコンピュータ可読媒体。
 (付記20)
 前記算出ステップにおいて、前記寄与度が閾値以上である前記着目変異のみについて前記第1スコアを算出する、付記19に記載のコンピュータ可読媒体。
 (付記21)
 前記遺伝的特徴指標値はポリジェニックリスクスコアである、付記15から20いずれか一項に記載のコンピュータ可読媒体。
10      対象生物
20      対象細胞
30      遺伝子変異情報
32      位置
34      遺伝子変異
40      位置情報
42      種類
44      位置
50      寄与度情報
52      遺伝子変異
54      寄与度
500      コンピュータ
502      バス
504      プロセッサ
506      メモリ
508      ストレージデバイス
510      入出力インタフェース
512      ネットワークインタフェース
2000     遺伝的特徴推定装置
2020     取得部
2040     算出部

Claims (21)

  1.  対象生物から得た対象細胞が持つ DNA(deoxyribonucleic acid)配列における遺伝子変異に関する遺伝子変異情報、及び細胞の種類又は臓器の種類に対して DNA 配列上の位置が対応づけられている位置情報を取得する取得部と、
     前記遺伝子変異情報が示す遺伝子変異の中から、前記位置情報において前記対象細胞の種類又は前記対象細胞を含む臓器の種類に対応づけられている前記位置における遺伝子変異である着目変異を特定し、前記着目変異の特徴に基づいて、前記対象生物の遺伝的特徴を表す遺伝的特徴指標値を算出する算出部と、を有する遺伝的特徴推定装置。
  2.  前記位置情報が示す前記位置は、対応づけられている細胞又は対応づけられている臓器が持つ細胞が持つ DNA におけるプロモーター、エンハンサー、化学修飾領域、又は特定の遺伝子の領域を表す、請求項1に記載の遺伝的特徴推定装置。
  3.  前記算出部は、
      遺伝的特徴に対する各遺伝子変異の寄与の大きさである寄与度を表す寄与度情報を取得し、
      前記寄与度が閾値以上である前記着目変異の特徴に基づいて、前記遺伝的特徴指標値を算出する、請求項1又は2に記載の遺伝的特徴推定装置。
  4.  前記算出部は、
      前記着目変異の特徴に基づく第1スコアと、前記着目変異以外の遺伝子変異の特徴に基づく第2スコアを算出し、
      前記第1スコアが前記遺伝的特徴指標値に与える影響が、前記第2スコアが前記遺伝的特徴指標値に与える影響よりも大きくなるように、前記第1スコアと前記第2スコアに対して互いに異なる重みを付与し、
      重みが付与された前記第1スコアと前記第2スコアを用いて、前記遺伝的特徴指標値を算出する、請求項1又は2に記載の遺伝的特徴推定装置。
  5.  前記算出部は、
      遺伝的特徴に対する各遺伝子変異の寄与の大きさである寄与度を表す寄与度情報を取得し、
      前記着目変異以外の遺伝子変異のうち、前記寄与度が閾値以上である遺伝子変異のみについて前記第2スコアを算出する、請求項4に記載の遺伝的特徴推定装置。
  6.  前記算出部は、前記寄与度が閾値以上である前記着目変異のみについて前記第1スコアを算出する、請求項5に記載の遺伝的特徴推定装置。
  7.  前記遺伝的特徴指標値はポリジェニックリスクスコアである、請求項1から6いずれか一項に記載の遺伝的特徴推定装置。
  8.  コンピュータによって実行される制御方法であって、
     対象生物から得た対象細胞が持つ DNA(deoxyribonucleic acid)配列における遺伝子変異に関する遺伝子変異情報、及び細胞の種類又は臓器の種類に対して DNA 配列上の位置が対応づけられている位置情報を取得する取得ステップと、
     前記遺伝子変異情報が示す遺伝子変異の中から、前記位置情報において前記対象細胞の種類又は前記対象細胞を含む臓器の種類に対応づけられている前記位置における遺伝子変異である着目変異を特定し、前記着目変異の特徴に基づいて、前記対象生物の遺伝的特徴を表す遺伝的特徴指標値を算出する算出ステップと、を有する制御方法。
  9.  前記位置情報が示す前記位置は、対応づけられている細胞又は対応づけられている臓器が持つ細胞が持つ DNA におけるプロモーター、エンハンサー、化学修飾領域、又は特定の遺伝子の領域を表す、請求項8に記載の制御方法。
  10.  前記算出ステップにおいて、
      遺伝的特徴に対する各遺伝子変異の寄与の大きさである寄与度を表す寄与度情報を取得し、
      前記寄与度が閾値以上である前記着目変異の特徴に基づいて、前記遺伝的特徴指標値を算出する、請求項8又は9に記載の制御方法。
  11.  前記算出ステップにおいて、
      前記着目変異の特徴に基づく第1スコアと、前記着目変異以外の遺伝子変異の特徴に基づく第2スコアを算出し、
      前記第1スコアが前記遺伝的特徴指標値に与える影響が、前記第2スコアが前記遺伝的特徴指標値に与える影響よりも大きくなるように、前記第1スコアと前記第2スコアに対して互いに異なる重みを付与し、
      重みが付与された前記第1スコアと前記第2スコアを用いて、前記遺伝的特徴指標値を算出する、請求項8又は9に記載の制御方法。
  12.  前記算出ステップにおいて、
      遺伝的特徴に対する各遺伝子変異の寄与の大きさである寄与度を表す寄与度情報を取得し、
      前記着目変異以外の遺伝子変異のうち、前記寄与度が閾値以上である遺伝子変異のみについて前記第2スコアを算出する、請求項11に記載の制御方法。
  13.  前記算出ステップにおいて、前記寄与度が閾値以上である前記着目変異のみについて前記第1スコアを算出する、請求項12に記載の制御方法。
  14.  前記遺伝的特徴指標値はポリジェニックリスクスコアである、請求項8から13いずれか一項に記載の制御方法。
  15.  コンピュータに、
     対象生物から得た対象細胞が持つ DNA(deoxyribonucleic acid)配列における遺伝子変異に関する遺伝子変異情報、及び細胞の種類又は臓器の種類に対して DNA 配列上の位置が対応づけられている位置情報を取得する取得ステップと、
     前記遺伝子変異情報が示す遺伝子変異の中から、前記位置情報において前記対象細胞の種類又は前記対象細胞を含む臓器の種類に対応づけられている前記位置における遺伝子変異である着目変異を特定し、前記着目変異の特徴に基づいて、前記対象生物の遺伝的特徴を表す遺伝的特徴指標値を算出する算出ステップと、を実行させるプログラムが格納されている非一時的なコンピュータ可読媒体。
  16.  前記位置情報が示す前記位置は、対応づけられている細胞又は対応づけられている臓器が持つ細胞が持つ DNA におけるプロモーター、エンハンサー、化学修飾領域、又は特定の遺伝子の領域を表す、請求項15に記載のコンピュータ可読媒体。
  17.  前記算出ステップにおいて、
      遺伝的特徴に対する各遺伝子変異の寄与の大きさである寄与度を表す寄与度情報を取得し、
      前記寄与度が閾値以上である前記着目変異の特徴に基づいて、前記遺伝的特徴指標値を算出する、請求項15又は16に記載のコンピュータ可読媒体。
  18.  前記算出ステップにおいて、
      前記着目変異の特徴に基づく第1スコアと、前記着目変異以外の遺伝子変異の特徴に基づく第2スコアを算出し、
      前記第1スコアが前記遺伝的特徴指標値に与える影響が、前記第2スコアが前記遺伝的特徴指標値に与える影響よりも大きくなるように、前記第1スコアと前記第2スコアに対して互いに異なる重みを付与し、
      重みが付与された前記第1スコアと前記第2スコアを用いて、前記遺伝的特徴指標値を算出する、請求項15又は16に記載のコンピュータ可読媒体。
  19.  前記算出ステップにおいて、
      遺伝的特徴に対する各遺伝子変異の寄与の大きさである寄与度を表す寄与度情報を取得し、
      前記着目変異以外の遺伝子変異のうち、前記寄与度が閾値以上である遺伝子変異のみについて前記第2スコアを算出する、請求項18に記載のコンピュータ可読媒体。
  20.  前記算出ステップにおいて、前記寄与度が閾値以上である前記着目変異のみについて前記第1スコアを算出する、請求項19に記載のコンピュータ可読媒体。
  21.  前記遺伝的特徴指標値はポリジェニックリスクスコアである、請求項15から20いずれか一項に記載のコンピュータ可読媒体。
PCT/JP2021/022428 2021-06-14 2021-06-14 遺伝的特徴推定装置、制御方法、及び非一時的なコンピュータ可読媒体 WO2022264189A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2021/022428 WO2022264189A1 (ja) 2021-06-14 2021-06-14 遺伝的特徴推定装置、制御方法、及び非一時的なコンピュータ可読媒体
JP2023529152A JPWO2022264189A5 (ja) 2021-06-14 遺伝的特徴推定装置、制御方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/022428 WO2022264189A1 (ja) 2021-06-14 2021-06-14 遺伝的特徴推定装置、制御方法、及び非一時的なコンピュータ可読媒体

Publications (1)

Publication Number Publication Date
WO2022264189A1 true WO2022264189A1 (ja) 2022-12-22

Family

ID=84525791

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/022428 WO2022264189A1 (ja) 2021-06-14 2021-06-14 遺伝的特徴推定装置、制御方法、及び非一時的なコンピュータ可読媒体

Country Status (1)

Country Link
WO (1) WO2022264189A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019181022A1 (ja) * 2018-03-19 2019-09-26 日本電気株式会社 遺伝子変異の評価装置、評価方法、プログラム、および記録媒体

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019181022A1 (ja) * 2018-03-19 2019-09-26 日本電気株式会社 遺伝子変異の評価装置、評価方法、プログラム、および記録媒体

Also Published As

Publication number Publication date
JPWO2022264189A1 (ja) 2022-12-22

Similar Documents

Publication Publication Date Title
Kullo et al. Polygenic scores in biomedical research
Yang et al. Accurate and scalable construction of polygenic scores in large biobank data sets
JP4781710B2 (ja) 治療効果予測システム及びそのプログラム
JP6691401B2 (ja) 個別化予測モデルを用いた、個人レベルのリスク・ファクタの識別およびランク付け
McClish Analyzing a portion of the ROC curve
RU2699517C2 (ru) Способ оценки риска заболевания у пользователя на основании генетических данных и данных о составе микробиоты кишечника
RU2007124523A (ru) Способы, системы и компьютерные программные продукты для разработки и использования прогнозных моделей для прогнозирования большинства медицинских случаев, оценки стратегий вмешательства и для одновременной оценки нерегулярности биологических маркеров
US20210118571A1 (en) System and method for delivering polygenic-based predictions of complex traits and risks
JP2007102709A (ja) 遺伝子診断用のマーカー選定プログラム、該プログラムを実行する装置及びシステム、並びに遺伝子診断システム
CN111091907A (zh) 基于相似病例库的健康医疗知识检索方法和系统
WO2014052921A2 (en) Patient health record similarity measure
KR102087613B1 (ko) 연관 표현형의 유전적 위험도를 결합한 질병의 위험도 예측 장치 및 방법
CN115985523A (zh) 一种数字化慢病随访管理系统
US20180004900A1 (en) Method and apparatus for information analysis
WO2022264189A1 (ja) 遺伝的特徴推定装置、制御方法、及び非一時的なコンピュータ可読媒体
JP2006163489A (ja) 発症確率算出装置、および、プログラム
JP4795666B2 (ja) 健康管理支援装置および健康管理支援プログラム
JP2011134106A (ja) 医療情報収集システム、医療情報収集処理方法及び医療情報収集画面表示制御方法
RU2699284C2 (ru) Система и способ интерпретации данных и предоставления рекомендаций пользователю на основе его генетических данных и данных о составе микробиоты кишечника
KR20200015315A (ko) 기계 학습을 이용하여 비만하지 않은 대상자의 대사증후군 발생 가능성을 예측하는 방법 및 장치
JP5361683B2 (ja) 医療情報処理装置およびプログラム
Ossorio The ethics of translating high-throughput science into clinical practice
JP6777351B2 (ja) プログラム、情報処理装置および情報処理方法
JP6737519B1 (ja) プログラム、学習モデル、情報処理装置、情報処理方法および学習モデルの生成方法
CN116438604A (zh) 对基因组数据进行匿名化的方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21945869

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2023529152

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 18569733

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE