JP7141039B2 - DNA mutation screening device, DNA mutation screening system, DNA mutation screening method, and program - Google Patents
DNA mutation screening device, DNA mutation screening system, DNA mutation screening method, and program Download PDFInfo
- Publication number
- JP7141039B2 JP7141039B2 JP2018164050A JP2018164050A JP7141039B2 JP 7141039 B2 JP7141039 B2 JP 7141039B2 JP 2018164050 A JP2018164050 A JP 2018164050A JP 2018164050 A JP2018164050 A JP 2018164050A JP 7141039 B2 JP7141039 B2 JP 7141039B2
- Authority
- JP
- Japan
- Prior art keywords
- dna mutation
- dna
- polynomial
- predetermined
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Description
本発明は、DNA変異絞込装置、DNA変異絞込システム、DNA変異絞込方法、及びプログラムに関する。 The present invention relates to a DNA mutation narrowing-down device, a DNA mutation narrowing-down system, a DNA mutation narrowing-down method, and a program.
複数の被験者のDNA(DeoxyriboNucleic Acid)変異データを用いて、DNA変異と特定の病気や量的形質との関連を調べる技術が知られている(例えば、特許文献1参照)。 A technique is known in which DNA (DeoxyriboNucleic Acid) mutation data of a plurality of subjects is used to investigate the relationship between DNA mutations and specific diseases or quantitative traits (see, for example, Patent Document 1).
また、具体的な研究の例として、日本人約16万人のDNA情報を用いて全ゲノム関連解析を実施し、さらに欧米人32万人で行われたメタ解析を行うことにより、体重に影響すると考えられる193のゲノム領域を同定した例がある(例えば、非特許文献1参照)。 In addition, as a specific example of research, we conducted a genome-wide association analysis using the DNA information of about 160,000 Japanese people, and further conducted a meta-analysis conducted on 320,000 Westerners to determine the effects on body weight. There is an example of identifying 193 genomic regions that are thought to be (see, for example, Non-Patent Document 1).
さらに、妊娠高血圧症候群(以下HDP: Hypertensive Disorders of Pregnancy)に罹患した50名の遺伝子情報と、罹患していない50名の遺伝子情報とを用いてエキソーム解析を行ったところ、両群の遺伝子の発現量に差は見られたものの、有意差がでなかった例がある(例えば、非特許文献2参照)。 Furthermore, exome analysis was performed using the genetic information of 50 people with hypertensive disorders of pregnancy (HDP: Hypertensive Disorders of Pregnancy) and the genetic information of 50 people who were not affected. Although there was a difference in the amount, there is an example in which the difference was not significant (see, for example, Non-Patent Document 2).
例えば、非特許文献1のように、全ゲノム関連解析を行う際には、約30億の塩基対の中から、所定の疾患に関連するDNA変異を特定するため、膨大な数(例えば、数千~数十万単位)のDNAサンプルが必要となる。 For example, as in Non-Patent Document 1, when performing whole-genome association analysis, a huge number (for example, a number of thousands to hundreds of thousands) of DNA samples are required.
しかし、研究機関の資金不足や、所定の疾患の罹患率が低い等の理由により、十分な数のサンプルが得られないことも多く、このような場合には、例えば、非特許文献2に示すように、所定の疾患に関連するバイオマーカーを十分に絞り込めない場合がある。 However, due to reasons such as lack of funding for research institutions and low prevalence of certain diseases, it is often not possible to obtain a sufficient number of samples. As such, it may not be possible to sufficiently narrow down the biomarkers associated with a given disease.
また、疾患によっては、罹患群と非罹患群の定義が曖昧な場合がある。例えば、HDPには診断のガイドラインが設定されているが、実際には、HDPに分類されていなくてもHDPのような血圧値が現れる場合がある。このような場合には罹患群、非罹患群の遺伝的背景に十分な差がない可能性があり、所定の疾患に関連するDNA変異を十分に絞り込めない場合がある。 Also, depending on the disease, the definition of an affected group and a non-affected group may be ambiguous. For example, there are diagnostic guidelines for HDP, but in reality, blood pressure values like HDP may appear even if they are not classified as HDP. In such a case, there may not be a sufficient difference in genetic background between the affected group and the non-affected group, and DNA mutations associated with a given disease may not be sufficiently narrowed down.
こういった課題を解決する方法として、罹患群と非罹患群のDNA配列の違いに関し関連解析を行う方法に加え、体重、BMI、血圧、体温などの所定の疾患に関わる量的形質を用いて、量的形質の大小にDNA配列が及ぼす影響を評価する量的形質を用いた関連解析が考えられる。しかし、例えば来院時に測定した量的形質を用いて関連解析を行う場合、患者によって来院時期が異なっている等の理由から、罹患群、非罹患群で量的形質の比較を行う際、量的形質に及ぼす来院時期の影響を取り除くことができず、所定の疾患に関連するDNA変異を十分に絞り込めない場合が想定できる。 As a method to solve these problems, in addition to the method of performing association analysis on the difference in the DNA sequence between the affected group and the non-affected group, quantitative traits related to a given disease such as body weight, BMI, blood pressure, body temperature, etc. , an association analysis using quantitative traits that evaluates the effect of DNA sequences on the magnitude of a quantitative trait. However, when performing association analysis using, for example, quantitative traits measured at the time of hospital visit, it is difficult to compare quantitative It is conceivable that the effect of visit time on traits cannot be removed and DNA mutations associated with a given disease cannot be sufficiently narrowed down.
このように、従来の技術では、例えば、検体のDNAサンプルが少ない場合や、疾患の定義が曖昧である場合には、所定の疾患に関連するDNA変異を絞り込むことには困難を伴っていた。さらに量的形質を用いて関連解析を行う場合でも所定の疾患に関連するDNA変異を絞り込むことが困難であることが想定できる。 As described above, with conventional techniques, it is difficult to narrow down DNA mutations associated with a given disease, for example, when there are few DNA samples of a specimen or when the definition of a disease is ambiguous. Furthermore, even when performing association analysis using quantitative traits, it can be assumed that it is difficult to narrow down DNA mutations associated with a given disease.
本発明の実施形態は、上記の問題点に鑑みてなされたものであって、所定の疾患に関わる量的形質を用いて関連解析を行う場合に、所定の疾患に関連するDNA変異を容易に絞り込むことができるDNA変異絞込装置を提供する。 An embodiment of the present invention has been made in view of the above-mentioned problems, and facilitates identification of DNA mutations associated with a given disease when performing association analysis using quantitative traits associated with the given disease. To provide a DNA mutation narrowing down device capable of narrowing down.
上記の課題を解決するため、本発明の一実施形態に係るDNA変異絞込装置は、所定の疾患に罹患している被験者を含む複数の被験者から収集した、前記所定の疾患に関連する量的形質の連続的な計測値に対して所定の多項式にフィッティングを行い、前記多項式の係数、前記多項式の切片、又は前記多項式の係数と切片を用いて、前記被験者ごとにから特徴量を抽出する特徴量抽出部と、前記複数の被験者におけるDNA変異の情報を取得する取得部と、前記特徴量と前記DNA変異との関連を解析する解析部と、前記解析部の解析結果に基づいて、前記所定の疾患に関連するDNA変異を抽出するDNA変異抽出部と、を有し、前記解析部は、前記特徴量を目的変数、前記DNA変異を説明変数として関連解析を行い、前記特徴量と各DNA変異との関連度を示す統計的指標の値を算出し、前記DNA変異抽出部は、前記解析部が算出した前記統計的指標の値が、予め定められた基準値以上、又は基準値以下となるDNA変異を抽出する。
In order to solve the above problems, a DNA mutation narrowing down apparatus according to one embodiment of the present invention provides a quantitative A feature of performing fitting to a predetermined polynomial on the continuous measured values of traits and extracting a feature amount from each subject using the coefficient of the polynomial, the intercept of the polynomial, or the coefficient and intercept of the polynomial an amount extraction unit, an acquisition unit that acquires information on DNA mutations in the plurality of subjects, an analysis unit that analyzes the relationship between the feature amount and the DNA mutations, and based on the analysis results of the analysis unit, the predetermined and a DNA mutation extraction unit for extracting DNA mutations related to the disease , wherein the analysis unit performs association analysis using the feature amount as an objective variable and the DNA mutation as an explanatory variable, and performs association analysis with the feature amount and each DNA A statistical index value indicating the degree of association with a mutation is calculated, and the DNA mutation extraction unit determines whether the statistical index value calculated by the analysis unit is equal to or greater than a predetermined reference value or equal to or less than a predetermined reference value. DNA mutations are extracted.
ここで、所定の疾患に関連する量的形質には、例えば、被験者の血圧、体重、BMI(Body Mass Index)、脈拍、心拍数、体脂肪率、活動量、消費カロリー、睡眠時間、体温等の連続的かつ量的に変化する形質が含まれる。量的形質の連続的な計測値は、これらの量的形質を所定の期間連続的に測定し記録した値である。 Quantitative traits related to a given disease include, for example, subject's blood pressure, weight, BMI (Body Mass Index), pulse, heart rate, body fat percentage, amount of activity, calorie consumption, sleep time, body temperature, and the like. includes continuously and quantitatively changing traits of Continuous measurements of quantitative traits are values that are measured and recorded continuously for a given period of time for those quantitative traits.
このように、疾患に関わる連続的な量的形質を用いることで、罹患、非罹患という2値の情報を使う場合よりも当該疾患に関する情報を増やすことを可能とする。 In this way, the use of continuous quantitative traits associated with a disease makes it possible to obtain more information about the disease than the binary information of diseased and non-diseased.
本発明の一実施形態によれば、所定の疾患に関わる量的形質を用いて関連解析を行う場合に、所定の疾患に関連するDNA変異を容易に絞り込むことができるDNA変異絞込装置を提供することができる。 According to one embodiment of the present invention, there is provided a DNA mutation narrowing-down apparatus capable of easily narrowing down DNA mutations associated with a given disease when performing association analysis using quantitative traits associated with the given disease. can do.
以下、図面を参照して本発明の実施の形態を説明する。なお、以下で説明する実施の形態は一例であり、本発明が適用される実施の形態は、以下の実施の形態に限られない。 BEST MODE FOR CARRYING OUT THE INVENTION Hereinafter, embodiments of the present invention will be described with reference to the drawings. In addition, the embodiment described below is an example, and the embodiment to which the present invention is applied is not limited to the following embodiment.
<DNA変異絞込装置の構成>
図1~3を用いて、一実施形態に係るDNA(DeoxyriboNucleic Acid)変異絞込装置の構成について説明する。DNA変異絞込装置110は、コンピュータの構成を有する情報処理装置、又は複数の情報処理装置を含むシステム(DNA変異絞込システム100)である。DNA変異絞込装置110は、例えば、図3に示すようなハードウェア構成を備えている。
<Configuration of DNA mutation screening device>
The configuration of a DNA (DeoxyriboNucleic Acid) mutation screening device according to one embodiment will be described with reference to FIGS. The DNA mutation narrowing down
DNA変異絞込装置110は、例えば、入力された複数の被験者のDNA変異データと、連続した量的形質のデータとに基づいて関連解析(検定)を行いDNA変異データが連続した量的形質の変化に及ぼす影響を算出し所定の疾患に関連するDNA変異の絞込を行い、絞込結果(例えば、候補リスト等)を出力する。
The DNA mutation narrowing down
ここで、関連解析(検定)には、線形回帰、ロジスティック回帰、フィッシャーの正確検定、カイ二乗検定、コクラン・アミテージ検定、t検定等を用いることができるが、これに限定されない。 Here, for the association analysis (test), linear regression, logistic regression, Fisher's exact test, chi-square test, Cochran-Amitage test, t-test, etc. can be used, but not limited thereto.
なお、DNA変異絞込装置110は、例えば、所定の疾患に関連する一塩基多型等のDNA変異の候補を絞り込むものであれば良く、必ずしも、所定の疾患の罹患/非罹患や進行度等を直接示すDNA変異を特定するものでなくても良い。
Note that the DNA mutation narrowing-down
図1は、一実施形態に係るDNA変異絞込装置110の構成例を示す図(1)である。DNA変異絞込装置110は、図3のプロセッサ301で所定のプログラムを実行することにより、図1に示す入力受付部111、特徴量抽出部112、DNA変異情報取得部113、関連解析部114、DNA変異抽出部115、記憶部116、及び結果出力部117等を実現している。なお、入力受付部111、特徴量抽出部112、DNA変異情報取得部113、関連解析部114、DNA変異抽出部115、記憶部116、及び結果出力部117のうち、少なくとも一部は、ハードウェアによって実現されるものであっても良い。
FIG. 1 is a diagram (1) showing a configuration example of a DNA
入力受付部111は、例えば、図3のプロセッサ301で実行されるプログラムによって実現され、図3の入力装置304、通信装置306等から入力される入力データや入力操作等を受け付ける。例えば、入力受付部111は、所定の疾患に罹患している被験者を含む複数の被験者から収集した、所定の疾患に関連する量的形質の連続的な計測値の入力を受け付ける。
The
また、入力受付部111は、所定の疾患に罹患している被験者を含む複数の被験者から収集したDNA配列情報(以下、DNA情報と呼ぶ)や、DNA変異の情報等の入力を受け付けることもできる。
The
DNAは、遺伝情報を記録している物質(デオキシリボ核酸)であり、約30億対の塩基から構成されている。DNAには、遺伝情報を含む特定の領域(塩基配列)である遺伝子が含まれる。本実施形態では、遺伝子以外の領域に存在するDNA変異も絞込の対象とすることができる。 DNA is a substance (deoxyribonucleic acid) that records genetic information, and is composed of about 3 billion pairs of bases. DNA includes genes, which are specific regions (nucleotide sequences) containing genetic information. In this embodiment, DNA mutations present in regions other than genes can also be narrowed down.
DNA変異は、DNAにおける構造(塩基配列)の変異であり、例えば、一塩基多型(SNP: Single Nucleotide Polymorphism)、コピー数多型(CNV: Copy Number Variation)、DNAの欠失、挿入等が含まれ得る。 DNA mutations are structural (nucleotide sequence) mutations in DNA, and include, for example, single nucleotide polymorphisms (SNPs), copy number variations (CNVs), DNA deletions, insertions, and the like. can be included.
特徴量抽出部112は、例えば、図3のプロセッサ301で実行されるプログラムによって実現され、入力受付部111が受け付けた、所定の疾患に関連する量的形質の連続的な計測値から特徴量を抽出(決定)する。
The feature
ここで特徴量は、例えば、所定の疾患に関連する量的形質の連続的な計測値を、所定の多項式にフィッティングし得られた、多項式の係数、多項式の切片、又は多項式の係数と切片等である。なお、特徴量抽出部112による特徴量の抽出方法の具体的な一例については、後述する。
Here, the feature amount is, for example, a polynomial coefficient, a polynomial intercept, or a polynomial coefficient and intercept obtained by fitting continuous measured values of quantitative traits related to a given disease to a given polynomial. is. A specific example of the method of extracting feature amounts by the feature
DNA変異情報取得部(取得部)113は、例えば、図3のプロセッサ301で実行されるプログラムによって実現され、所定の疾患に罹患している被験者を含む複数の被験者におけるDNA変異の情報を取得する。
The DNA mutation information acquisition unit (acquisition unit) 113 is implemented by, for example, a program executed by the
例えば、DNA変異情報取得部113は、入力受付部111が受け付けたDNA情報を解析して、DNA変異の情報を抽出する。
For example, the DNA mutation
或いは、DNA変異情報取得部113は、図2に示すように、DNA情報からDNA変異の情報を取得する外部装置であるDNA変異情報取得装置210から、複数の被験者におけるDNA変異の情報を取得するものであっても良い。さらに、DNA変異情報取得部113は、図2に示すように、予め取得したDNA変異の情報を格納するDNA変異情報DB(Database)220から、複数の被験者に対応するDNA変異の情報を取得するものであっても良い。
Alternatively, as shown in FIG. 2, the DNA mutation
好ましくは、DNA変異情報取得部113が取得するDNA変異の情報には、複数の被験者のDNA情報(DNA配列情報)から抽出された、DNA配列中の全ての一塩基多型(SNP)の情報が含まれる。
Preferably, the DNA mutation information acquired by the DNA mutation
関連解析部(解析部)114は、例えば、図3のプロセッサ301で実行されるプログラムによって実現され、特徴量抽出部112が抽出した特徴量と、DNA変異情報取得部113が取得したDNA変異の情報に含まれるDNA変異との関連を解析する。例えば、関連解析部114は、特徴量を目的変数、DNA変異を説明変数として関連解析(検定)を行い、DNA変異が特徴量にどの程度の影響を与えているかを表す、特徴量とDNA変異との関連度を示す統計的指標の値を算出する。
The association analysis unit (analysis unit) 114 is realized by, for example, a program executed by the
ここで、特徴量とDNA変異との関連度を示す統計的指標の値には、特徴量抽出部112が抽出した特徴量と、DNA変異情報取得部113が取得したDNA変異の情報に含まれる各DNA変異との有意差を示す数値(例えば、p値、f値、オッズ比等)が含まれる。
Here, the value of the statistical index indicating the degree of association between the feature quantity and the DNA mutation is included in the feature quantity extracted by the feature
また、関連解析(検定)には、線形回帰、ロジスティック回帰、フィッシャーの正確検定、カイ二乗検定、コクラン・アミテージ検定、t検定等を用いることができるが、これに限定されない。 For the association analysis (test), linear regression, logistic regression, Fisher's exact test, chi-square test, Cochran-Amitage test, t-test, etc. can be used, but not limited thereto.
なお、関連解析部114は、特徴量抽出部112が抽出した特徴量を、予め定めた基準値を用いて所定の疾患の罹患群と非罹患群とにラベル付けし、各DNA変異の有意性を示す統計的指標の値を算出するものであっても良い。
Note that the
DNA変異抽出部115は、例えば、図3のプロセッサ301で実行されるプログラムによって実現され、関連解析部114の解析結果に基づいて、所定の疾患に関連するDNA変異を抽出する。例えば、DNA変異抽出部115は、関連解析部114が算出した統計的指標の値を基準として、所定の疾患に関するDNA変異を抽出する。
The DNA
記憶部116は、例えば、図3のプロセッサ301で実行されるプログラム、及びストレージ303、メモリ302等によって実現され、入力受付部111が受け付けた情報や、DNA変異情報取得部113が取得した情報等を記憶する。
The
結果出力部117は、例えば、図3のプロセッサ301で実行されるプログラムによって実現される。結果出力部117は、DNA変異抽出部115が抽出した、所定の疾患に関連するDNA変異の情報(例えば、DNA変異の候補リスト等)を、本実施形態のハードウェア構成の例を示す図3の出力装置305等を用いて出力する。
The
(具体的な構成の一例)
DNA変異絞込装置110の具体的な構成の一例として、図1で示す入力受付部111は、所定の疾患に罹患している被験者を含む複数の被験者から、所定の時間間隔(例えば、毎日、同じ時間帯等)で測定した、連続した血圧の計測値の情報を受け付ける。
(Example of specific configuration)
As an example of a specific configuration of the DNA mutation narrowing down
特徴量抽出部112は、入力受付部111が受け付けた、連続した血圧の計測値を多項式(例えば、一次式)にフィッティングして、多項式の傾き、切片等を算出する。一例として、特徴量抽出部112は、多項式の傾きを特徴量として用いることができる。
The feature
DNA変異情報取得部113は、例えば、所定の疾患に罹患している被験者を含む複数の被験者のDNA情報から抽出した、全ての被験者の各々の一塩基多型(DNA変異の一例)の情報を取得する。
The DNA mutation
関連解析部114は、特徴量抽出部112が抽出した特徴量(多項式の傾き)を目的変数、DNA変異情報取得部113が取得した一塩基多型の情報に含まれる全ての一塩基多型を説明変数として、関連解析(検定)を行う。例えば、関連解析部114は、線形回帰による検定を行い、抽出した特徴量と、一塩基多型の情報に含まれる全ての一塩基多型との有意確率を表すp値(統計的指標の値の一例)を算出する。
The
DNA変異抽出部115は、塩基多型の情報に含まれる全ての一塩基多型のうち、p値が、予め定められた有意水準(例えば、5×10-8)以下(又は未満)となる一塩基多型を抽出する。
The DNA
ここで、有意水準は、p値が統計的に有意とみなすことができる水準を示す値であり、一般的な解析では0.05(5%)が用いられる。しかし、ゲノム解析においては数千~数万のパラメータを一度に検定するため、検定回数が増え、偶然に有意差が生じる可能性が増すため有意水準を補正するのが一般的である。補正後のp値の水準には5×10-8(0.000005%)が多く用いられるが、必要に応じて他の値(例えば、5×10-10、5×10-12等)を用いても良い。 Here, the significance level is a value indicating the level at which the p-value can be regarded as statistically significant, and 0.05 (5%) is used in general analysis. However, since thousands to tens of thousands of parameters are tested at once in genome analysis, the number of tests increases and the possibility of significant differences occurring by chance increases, so it is common to correct the significance level. 5 × 10 -8 (0.000005%) is often used as the level of the p-value after correction, but other values (for example, 5 × 10 -10 , 5 × 10 -12 , etc.) can be used as necessary. You can use it.
記憶部116は、所定の疾患に罹患している被験者を含む複数の被験者の連続的な量的形質の計測値を取得し、取得した連続的な量的形質の計測値を記憶する。
The
結果出力部117は、DNA変異抽出部115が抽出した一塩基多型の情報を、所定の疾患に関連する一塩基多型として、例えば、候補リスト等として出力する。
The
図2は、一実施形態に係るDNA変異絞込装置の構成例を示す図(2)である。図2に示すように、DNA変異絞込装置110は、DNA変異情報取得装置210や、DNA変異情報DB220等の外部装置と連携して、各機能を実現するものであっても良い。また、DNA変異絞込装置110は、前述したように、複数の情報処理装置で構成されるDNA変異絞込システム100であっても良い。
FIG. 2 is a diagram (2) showing a configuration example of a DNA mutation screening device according to an embodiment. As shown in FIG. 2, the DNA mutation narrowing-down
(ハードウェア構成)
図3は、図1、図2に記載の一実施形態に係るDNA変異絞込装置110のハードウェア構成の例を示す図である。DNA変異絞込装置110は、物理的には、プロセッサ301、メモリ302、ストレージ303、入力装置304、出力装置305、通信装置306、及びバス307等を含むコンピュータ装置として構成されても良い。なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニット等に読み替えることができる。
(Hardware configuration)
FIG. 3 is a diagram showing an example of the hardware configuration of the DNA
プロセッサ301は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ301は、周辺装置とのインタフェース、制御装置、演算装置、レジスタ等を含む中央処理装置(CPU:Central Processing Unit)で構成されても良い。
The
また、プロセッサ301は、プログラム(プログラムコード)、ソフトウェアモジュールやデータを、ストレージ303及び/又は通信装置306からメモリ302に読み出し、これらに従って各種の処理を実行する。プログラムとしては、DNA変異絞込装置110の動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。DNA変異絞込装置110において実行される各種処理は、1つのプロセッサ301で実行されても良いし、2以上のプロセッサ301により同時又は逐次に実行されても良い。プロセッサ301は、1以上のチップで実装されても良い。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。
The
メモリ302は、コンピュータ読み取り可能な記憶媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)等の少なくとも1つで構成されても良い。メモリ302は、レジスタ、キャッシュ、メインメモリ(主記憶装置)等と呼ばれても良い。メモリ302は、本発明の一実施の形態に係るDNA変異絞込方法を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュール等を保存することができる。
The
ストレージ303は、コンピュータ読み取り可能な記憶媒体であり、例えば、CD-ROM(Compact Disc ROM)等の光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu-ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップ等の少なくとも1つで構成されても良い。ストレージ303は、補助記憶装置と呼ばれても良い。上述の記憶媒体は、例えば、メモリ302及び/又はストレージ303を含むデータベース、サーバその他の適切な媒体であっても良い。
The
入力装置304は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサ等)である。出力装置305は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカ、LEDランプ等)である。なお、入力装置304及び出力装置305は、一体となった構成(例えば、タッチパネルディスプレイ)であっても良い。
The
通信装置306は、有線及び/又は無線ネットワークを介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュール等ともいう。また、通信装置306は、近距離無線通信により、外部装置と直接通信を行う機能を有していても良い。
The
上記のプロセッサ301やメモリ302等の各装置は、情報を通信するためのバス307で接続される。バス307は、単一のバスで構成されても良いし、装置間で異なるバスで構成されても良い。
Devices such as the
<処理の流れ>
続いて、本実施形態に係るDNA変異絞込方法の処理の流れについて図4~6を用いて説明する。
<Process flow>
Next, the process flow of the method for narrowing down DNA mutations according to this embodiment will be described with reference to FIGS. 4 to 6. FIG.
図4は、一実施形態に係るDNA変異絞込処理の概要を示すフローチャートである。ここでは、後述する第1の具体例、及び第2の具体例に共通する処理を中心に説明を行う。 FIG. 4 is a flowchart showing an overview of DNA mutation screening processing according to one embodiment. Here, the explanation will focus on the processing common to the first specific example and the second specific example, which will be described later.
ステップS401において、DNA変異絞込装置110の入力受付部111は、所定の疾患に罹患している被験者を含む複数の被験者の連続的な量的形質の計測値を取得し、取得した連続的な量的形質の計測値を記憶部116等に記憶する。
In step S401, the
ステップS402において、DNA変異絞込装置110の特徴量抽出部112は、記憶部116に記憶された、量的形質の経時的な変化から、所定の疾患に関連する特徴量を抽出する。例えば、特徴量抽出部112は、図5に示すような特徴量の抽出処理を実行する。
In step S<b>402 , the feature
図5は、一実施形態に係る特徴量の抽出処理の例を示すフローチャートである。この処理は、例えば、図4のステップS402で実行される特徴量の抽出処理の例を示している。 FIG. 5 is a flowchart illustrating an example of feature amount extraction processing according to an embodiment. This process shows an example of the feature amount extraction process executed in step S402 of FIG. 4, for example.
ステップS501において、特徴量抽出部112は、入力受付部111が取得した連続的な量的形質の計測値を、例えば、図6に示すように、多項式にフィッティングする。
In step S<b>501 , the feature
図6は、一実施形態に係る特徴量の一例について説明するための図である。ここでは、具体的な一例として、連続的な量的形質が、所定の時間間隔(例えば、毎日、同じ時間帯等)に測定した妊婦(被験者の一例)の血圧の計測値であり、多項式が1次式であるものとする。 FIG. 6 is a diagram for explaining an example of feature amounts according to one embodiment. Here, as a specific example, the continuous quantitative trait is the measured value of the blood pressure of a pregnant woman (an example of a subject) measured at predetermined time intervals (eg, every day, the same time zone, etc.), and the polynomial is It is assumed to be a linear expression.
図6において、特徴量抽出部112は、妊婦Aの血圧の計測値601を、例えば、線形回帰により、1次式「y=ax+b」にフィッティングする。なお、1次式「y=ax+b」は所定の多項式の一例である。
In FIG. 6 , the feature
ステップS502において、特徴量抽出部112は、フィッティングした多項式の係数、及び切片を算出する。例えば、特徴量抽出部112は、1次式で表される直線の傾きa1、及び切片b1を算出する。
In step S502, the feature
ステップS503において、特徴量抽出部112は、算出した係数、切片、又は係数と切片を特徴量として抽出する。
In step S503, the feature
例えば、他の妊婦Bの計測値を用いて、1次式「y=ax+b」にフィッティングを行い、傾きa2、及び切片b2を、さらに算出したものとする。この場合、一例として、1次式の傾きa1、a2を、特徴量として利用することができる。 For example, it is assumed that the slope a2 and the intercept b2 are further calculated by performing fitting to the linear expression "y=ax+b" using the measured values of another pregnant woman B. In this case, as an example, the slopes a1 and a2 of the linear expressions can be used as feature amounts.
例えば、図6に示すように、時間(妊娠経過)とともに血圧が増加するものとする。各妊婦が各々のタイミングで血圧を測定している場合、例えば、図6の通り、t1時点での妊婦Aの血圧の計測値601は存在するが、妊婦Bの血圧の計測値603は存在しない。異なる時点の血圧を妊婦AとBで比較した場合、その差には、測定時点差の影響が含まれることから、妊婦AとBの血圧値の差を真に比較することは困難である。 For example, as shown in FIG. 6, it is assumed that blood pressure increases with time (pregnancy progress). When each pregnant woman measures her blood pressure at each timing, for example, as shown in FIG. . When the blood pressures of pregnant women A and B are compared at different time points, the difference includes the influence of the difference in the time points of measurement.
一方、図6に示すように、例えば、妊婦Aと妊婦Bの血圧の計測値を1次式にフィッティングし、妊娠Aの血圧値に対する回帰線602と妊婦Bの血圧の計測値に対する回帰線604を算出したとする。回帰線602や604も用いることで、両者の傾きから妊娠AとBの血圧推移の差を比較することができる。また、所定の時間(t)において血圧の予測値を用いることで、測定時点差の影響を排除した比較が可能となる。
On the other hand, as shown in FIG. 6, for example, the measured blood pressure values of pregnant woman A and pregnant woman B are fitted to a linear expression, and a
また、別の一例として、図6において、時間t0が妊婦の妊娠の初日であるものとする。また、ある疾患の発症の有無が、妊娠の初日の血圧値に関連があるものとする。この場合、妊婦A、妊婦B、妊婦Cのように妊娠初日の血圧値の記録がない場合でも、各妊婦の血圧値を1次式にフィッティングすることで、1次式の切片b1と、切片b2、切片3を得ることができ、特徴量として用いることができる。 As another example, in FIG. 6, it is assumed that time t0 is the first day of pregnancy of the pregnant woman. It is also assumed that the presence or absence of the onset of a certain disease is related to the blood pressure value on the first day of pregnancy. In this case, even if there is no record of blood pressure values on the first day of pregnancy, such as pregnant women A, pregnant women B, and pregnant women C, by fitting the blood pressure values of each pregnant woman to the linear equation, the intercept b1 of the linear equation and the intercept b2, intercept 3 can be obtained and used as a feature quantity.
同様にして、例えば、妊娠の初日から所定の日数を経過した時点における各妊婦の血圧を、フィッティングした1次式を用いて算出し、特徴量として利用することができる。 Similarly, for example, the blood pressure of each pregnant woman at the time when a predetermined number of days have passed since the first day of pregnancy can be calculated using a fitted linear expression and used as a feature amount.
このように、特徴量抽出部112は、複数の被験者から収集した、量的形質の経時的な変化から、所定の疾患に関連する特徴量を抽出する。
In this way, the feature
なお、上記の傾きa1、a2、a3及び切片b1、b2、b3は、特徴量抽出部112が抽出する特徴量の一例である。また、図6に示す1次式は、所定の多項式の一例であり、所定の多項式は、2次以上の多項式であっても良い。
Note that the slopes a1, a2, a3 and the intercepts b1, b2, b3 described above are examples of feature amounts extracted by the feature
ここで、図4に戻り、DNA変異の絞込処理の例を示すフローチャートの説明を続ける。 Here, returning to FIG. 4, the description of the flowchart showing an example of DNA mutation narrowing down processing is continued.
ステップS403において、DNA変異絞込装置110のDNA変異情報取得部113は、例えば、ステップS401、S402の処理と並行して、所定の疾患に罹患している被験者を含む複数の被験者におけるDNA変異の情報を取得する。
In step S403, the DNA mutation
一例として、DNA変異情報取得部113は、入力受付部111が受け付けた、所定の疾患に罹患している被験者を含む複数の被験者のDNA情報を用いて、DNA配列中の所定のDNA変異情報(例えば、全ての一塩基多型等)を抽出(取得)する。
As an example, the DNA mutation
また、別の一例として、DNA変異情報取得部113は、図2に示すDNA変異情報取得装置210から、DNA変異情報取得装置210が抽出した、所定の疾患に罹患している被験者を含む複数の被験者のDNA変異情報を取得するものであっても良い。さらに、DNA変異情報取得部113は、所定の疾患に罹患している被験者を含む複数の被験者のDNA変異情報が、図2に示す予め登録されたDNA変異情報DB220から、所定の疾患に罹患している被験者を含む複数の被験者のDNA変異情報を取得するものであっても良い。
As another example, the DNA mutation
なお、ステップS401において、連続的な量的形質の計測値を取得する複数の被験者と、ステップS403において、一塩基多型の情報を取得する複数の被験者は、同じ被験者である。 It should be noted that the plurality of subjects for whom continuous quantitative trait measurement values are obtained in step S401 and the plurality of subjects for which single nucleotide polymorphism information is obtained in step S403 are the same subjects.
ステップS404において、DNA変異絞込装置110の関連解析部114は、ステップS402で抽出した特徴量と、ステップS403で取得したDNA変異の情報に含まれるDNA変異との関連を解析する。
In step S404, the
一例として、関連解析部114は、特徴量を目的変数、DNA変異を説明変数として関連解析(検定)を行い、特徴量と各DNA変異との関連度を示す統計的指標の値を算出する(第1の具体例)。例えば、関連解析部114は、特徴量を目的変数、DNA変異を説明変数とした回帰式において、各DNA変異の係数のWald統計量から算出されるp値を、統計的指標の値とすることができる。
As an example, the
別の一例として、関連解析部114は、特徴量を、予め定めた基準値を用いて、罹患群と非罹患群とラベル付けし、各DNA変異に対して、罹患群、及び非罹患群における保有数に差があるかを示す統計的指標の値を算出する(第2の具体例)。例えば、関連解析部114は、フィッシャーの正確検定や、カイ二乗検定を行い、有意確率を表すp値を、統計的指標の値とすることができる。
As another example, the
なお、関連解析部114が、統計的指標の値を算出する際の検定(関連解析)には、例えば、線形回帰、ロジスティック回帰、フィッシャーの正確検定、カイ二乗検定、コクラン・アミテージ検定、t検定等が用いられるが、これに限定されない。また、関連解析部114が算出する統計的指標の値には、例えば、p値、f値、又はオッズ比等が用いられるが、これに限定されない。
The test (association analysis) when the
また、関連解析部114は、優性遺伝子作用、劣性遺伝子作用、遺伝子型等をさらに考慮して統計的指標の値を算出しても良いし、共編量として年齢、体重、BMI等の情報を用いるものであっても良い。
In addition, the
ステップS405において、DNA変異絞込装置110のDNA変異抽出部115は、関連解析部114の解析結果に基づいて、所定の疾患に関連するDNA変異を抽出する。例えば、DNA変異抽出部115は、ステップS403で取得したDNA変異の情報に含まれる各DNA変異の中から、ステップS404で算出した統計的指標の値を基準値として、所定の疾患に関連するDNA変異を抽出する。例えば、DNA変異抽出部115は、統計的指標の値が、基準値以上、又は基準値以下のDNA変異を抽出する。
In step S405, the DNA
なお、上記の処理で抽出されたDNA変異の情報は、DNA変異絞込装置110の結果出力部117によって、例えば、所定の疾患に関連するDNA変異の候補として、出力装置305、又はストレージ303等に出力される。
The information on the DNA mutation extracted by the above process is output by the
続いて、第1の具体例、及び第2の具体例におけるDNA変異絞込方法の処理の流れについて説明する。 Next, the processing flow of the DNA mutation narrowing-down method in the first specific example and the second specific example will be described.
[第1の具体例]
第1の具体例では、DNA変異絞込装置110の関連解析部114が、特徴量を目的変数、DNA変異を説明変数として関連解析を行い、特徴量と各DNA変異との関連度を示す統計的指標の値(例えば、p値等)を算出する場合の処理の例について説明する。
[First specific example]
In a first specific example, the
図7は、一実施形態に係る第1の具体例に係るDNA変異の絞込処理の例を示すフローチャートである。 FIG. 7 is a flowchart showing an example of narrowing down processing for DNA mutations according to the first specific example according to the embodiment.
ステップS701において、DNA変異絞込装置110の入力受付部111は、複数の被験者の連続的な量的形質の計測値を取得し、取得した連続的な量的形質の計測値を記憶部116等に保存(記憶)する。
In step S701, the
ステップS702において、DNA変異絞込装置110の特徴量抽出部112は、記憶部116に記憶された、量的形質の経時的な変化から、所定の表現型に関連する特徴量を抽出する。例えば、特徴量抽出部112は、図5に示すような特徴量の抽出処理を実行する。
In step S<b>702 , the feature
なお、表現型とは、例えば、ヒトの遺伝子型が形質として表現されたものであり、例えば身長の高さや目や肌、髪の色、肥満になりやすい体質であるか否か、等の個人の体質や、高血圧、糖尿病、妊娠高血圧症候群、冠動脈疾患等の所定の疾患を含む。本実施形態は、所定の疾患に限られず、所定の表現型に関連する遺伝子変異を絞り込む用途にも適用することができる。 A phenotype is, for example, a person's genotype expressed as a trait. and pre-determined diseases such as hypertension, diabetes, pregnancy-induced hypertension, and coronary artery disease. This embodiment can be applied not only to specific diseases but also to narrow down gene mutations associated with specific phenotypes.
ステップS703、S704において、DNA変異絞込装置110は、例えば、ステップS701、S702の処理と並行して、複数の被験者におけるDNA変異の情報を取得する。例えば、ステップS703において、DNA変異絞込装置110の入力受付部111は、複数の被験者のDNA情報を取得し、記憶部116に記憶する。また、ステップ704において、DNA変異絞込装置110のDNA変異情報取得部113は、記憶部116に記憶した複数の被験者のDNA情報を解析して、DNA変異の情報を抽出する。
In steps S703 and S704, the DNA mutation narrowing down
なお、ステップS703、S704において、DNA変異情報取得部113は、図2に示すDNA変異情報取得装置210や、DNA変異情報DB220等から、複数の被験者におけるDNA変異の情報を取得するものであっても良い。
In steps S703 and S704, the DNA mutation
ステップS705において、DNA変異絞込装置110の関連解析部114は、特徴量を目的変数、DNA変異を説明変数として関連解析(検定)を行い、特徴量と各DNA変異との関連度を示す統計的指標の値を算出する。例えば、関連解析部114は、特徴量と各DNA変異との関連度を示す統計的指標の値として、p値、f値、オッズ比等を算出する。
In step S705, the
ステップS706において、DNA変異絞込装置110のDNA変異抽出部115は、ステップS705で算出した統計的指標の値が、基準値以上、又は基準値以下となるDNA変異を抽出する。
In step S706, the DNA
上記の処理により、DNA変異絞込装置110は、ステップS703、S704で取得したDNA変異の中から、所定の表現型に関連するDNA変異を抽出することができる。
By the above processing, the DNA mutation narrowing down
(応用例)
図8は、一実施形態に係る第1の具体例のDNA変異の絞込処理の応用例を示すフローチャートである。
(Application example)
FIG. 8 is a flowchart showing an application example of the DNA mutation narrowing-down process of the first specific example according to one embodiment.
ここでは、上記の処理を用いて、DNA情報のサンプルが少ない場合や、所定の疾患の定義が曖昧である場合であっても、所定の疾患に関連するDNA変異を容易に絞り込むことができるDNA変異絞込方法について説明する。 Here, using the above-described processing, even when there are few DNA information samples or when the definition of a given disease is ambiguous, DNA mutations associated with a given disease can be easily narrowed down. A method for narrowing down mutations will be described.
ここでは、具体的な一例として、所定の疾患が、妊娠高血圧症候群(以下HDP: Hypertensive Disorders of Pregnancy)であるものとして、以下の説明を行う。 Here, as a specific example, the following description will be given assuming that the prescribed disease is hypertensive disorders of pregnancy (hereinafter referred to as HDP: Hypertensive Disorders of Pregnancy).
HDPには、診断のガイドラインが設定されているが、実際には、HDPに分類されていなくてもHDPのような血圧値が現れる場合がある。このような場合には、罹患群、非罹患群の遺伝的背景に十分な差がなく、所定の疾患に関連するDNA変異を十分に絞り込めない場合がある。なお、HDPは、罹患群と非罹患群の定義が曖昧な疾患の一例である。 Although diagnostic guidelines are set for HDP, in practice, blood pressure values similar to HDP may appear even if they are not classified as HDP. In such cases, there may not be a sufficient difference in genetic background between the diseased group and the non-affected group, and DNA mutations associated with a given disease may not be sufficiently narrowed down. HDP is an example of a disease in which the definition of an affected group and a non-affected group is ambiguous.
また、ここでは、図6に示すように、血圧の計測値の変化率を示す傾きが、HDPの罹患と関連しており、例えば、HDPに罹患している妊婦における血圧の計測値の傾きは、HDPに罹患していない妊婦における血圧の計測値の傾きより大きい傾向があるものとする。なお、妊婦の血圧の計測値は、所定の疾患に関連する量的形質の連続的な計測値の一例である。また、血圧の計測値の傾きは、正規化された特徴量の一例である。 Also, here, as shown in FIG. 6, the slope indicating the rate of change of the measured blood pressure value is related to the prevalence of HDP. , tend to be greater than the slope of blood pressure measurements in pregnant women without HDP. It should be noted that blood pressure measurements of pregnant women are an example of continuous measurements of quantitative traits associated with a given disease. Also, the slope of the blood pressure measurement value is an example of a normalized feature amount.
ステップS801において、DNA変異絞込装置110の入力受付部111は、HDPに罹患している被験者を含む、複数の被験者における血圧の計測値を含む連続的な量的形質の計測値を取得し、記憶部116に記憶する。
In step S801, the
ステップS802において、DNA変異絞込装置110の特徴量抽出部112は、量的形質の経時的な変化から、HDPに関連する特徴量を抽出する。例えば、特徴量抽出部112は、図6に示すように、妊婦の血圧の計測値601を1次式「y=ax+b」にフィッティングし、一次式の傾きaを特徴量として抽出する。
In step S802, the feature
ステップS803において、DNA変異絞込装置110のDNA変異情報取得部113は、HDPに罹患している被験者を含む複数の被験者のDNA情報から抽出された一塩基多型の情報を取得する。例えば、図2のDNA変異情報取得装置210は、HDPに罹患している被験者を含む複数の被験者のDNA情報を用いて、DNA配列中における全ての一塩基多型の情報を抽出する。また、DNA変異情報取得部113は、DNA変異情報取得装置210から、抽出された一塩基多型の情報を取得する。なお、一塩基多型の情報は、DNA変異の情報の一例である。
In step S803, the DNA mutation
ステップS804において、DNA変異絞込装置110の関連解析部114は、ステップS802で抽出した特徴量を目的変数、ステップS803で取得した一塩基多型の情報に含まれる一塩基多型を説明変数として関連解析(検定)を行う。例えば、関連解析部114は、特徴量を目的変数、一塩基多型を説明変数とした回帰式において、各一塩基多型の係数のWald統計量から、有意確率を表すp値を算出する。
In step S804, the
ステップS805において、DNA変異絞込装置110のDNA変異抽出部115は、ステップS803で取得した一塩基多型の情報に含まれる一塩基多型の中から、p値が、予め定められた有意水準(例えば、5×10-8)より小さい一塩基多型を抽出する。
In step S805, the DNA
これにより、図6に示すような、血圧の計測値の傾きaに関連する一塩基多型の情報、例えば、HDPに関連する一塩基多型の情報を抽出することができる。 This makes it possible to extract single nucleotide polymorphism information related to the slope a of the blood pressure measurement value, for example, single nucleotide polymorphism information related to HDP, as shown in FIG.
本実施形態によれば、例えば、HDPのように疾患の症状と血圧等の量的形質が関わっている疾患において、量的形質を用いた関連解析を行う際に、多時点の情報を扱うことで、関連解析(検定)の精度を高め、所定の疾患に関連する一塩基多型を容易に抽出(絞込)することができる。 According to this embodiment, for example, in a disease such as HDP in which symptoms of the disease and quantitative traits such as blood pressure are involved, when performing association analysis using quantitative traits, multi-time information can be handled. , it is possible to improve the accuracy of association analysis (test) and easily extract (narrow down) single nucleotide polymorphisms associated with a predetermined disease.
また、本実施形態では、例えば、図6に示すように、量的形質の連続的な計測値から抽出した、特徴量を用いて関連解析を行う。これにより、互いに異なる期間に計測された複数の被験者の計測値を、同様に処理することができる。また、計測期間とは異なる時点における量的形質の計測値を推定して、関連解析を行うこと(例えば、妊娠10週~15週の血圧の計測値に基づいて、妊娠初日の血圧値を推定して、関連解析を行う等)もできる。 Further, in this embodiment, for example, as shown in FIG. 6, association analysis is performed using feature amounts extracted from continuous measurement values of quantitative traits. Thereby, measured values of a plurality of subjects measured in mutually different periods can be similarly processed. In addition, estimating the measured values of quantitative traits at time points different from the measurement period and performing association analysis and perform related analysis, etc.).
以上、本実施形態によれば、量的形質を用いた関連解析を行う際に、所定の疾患に関連するDNA変異を容易に絞り込むことができるDNA変異絞込装置、DNA変異絞込システム、及びDNA変異絞込方法を提供することができる。 As described above, according to the present embodiment, a DNA mutation narrowing-down device, a DNA mutation narrowing-down system, and a A method for narrowing down DNA mutations can be provided.
[第2の具体例]
第1の具体例では、関連解析部114が、特徴量を目的変数、DNA変異を説明変数として関連解析を行い、特徴量と各DNA変異との関連度を示す統計的指標の値(例えば、p値等)を算出する場合の処理の例について説明した。
[Second example]
In a first specific example, the
第2の具体例では、関連解析部114が、特徴量を、予め定めた基準値を用いて、罹患群と非罹患群とラベル付けし、各DNA変異に対して、罹患群、及び非罹患群における保有数に差があるかを示す統計的指標の値を算出する場合の処理の例について説明する。
In a second specific example, the
図9は、一実施形態に係る第2の具体例のDNA変異の絞込処理の例を示すフローチャートである。なお、ここでは、第1の具体例と同様の処理に対する詳細な説明は省略する。 FIG. 9 is a flow chart showing an example of narrowing down processing for DNA mutations in the second specific example according to one embodiment. A detailed description of the same processing as in the first specific example is omitted here.
ステップS901において、DNA変異絞込装置110の入力受付部111は、複数の被験者の連続的な量的形質の計測値を取得し、取得した連続的な量的形質の計測値を記憶部116に保存(記憶)する。
In step S901, the
ステップS902において、DNA変異絞込装置110は、量的形質の経時的な変化から所定の表現型に関連する特徴量を抽出し、抽出した特徴量を予め定めた基準値を用いて罹患群と非罹患群とにラベル付けを行う。例えば、DNA変異絞込装置110は、図10に示すような罹患群、非罹患群のラベル付け処理を実行する。
In step S902, the DNA mutation narrowing down
図10は、一実施形態に係る第2の具体例の罹患群、非罹患群のラベル付け処理の例を示すフローチャートである。この処理は、図9のステップS902において、DNA変異絞込装置110が実行する罹患群、非罹患群のラベル付け処理の一例を示している。
FIG. 10 is a flow chart showing an example of the process of labeling the diseased group and the non-diseased group in the second specific example according to one embodiment. This process shows an example of the diseased group and non-diseased group labeling process executed by the DNA
ステップS1001において、DNA変異絞込装置110の特徴量抽出部112は、入力受付部111が取得した連続的な量的形質の計測値を、多項式にフィッティングする。
In step S1001, the
ステップS1002において、特徴量抽出部112は、フィッティングした多項式の係数、切片等を算出する。
In step S1002, the feature
ステップS1003において、特徴量抽出部112は、算出した係数、切片、又は係数と切片を用いて、正規化された特徴量を抽出する。
In step S1003, the feature
具体的な一例として、所定の表現型が、HDPである場合、特徴量抽出部112は、図6で前述したように、連続的な血圧(量的形質の一例)の計測値を1次式にフィッティングし、1次式の傾きを特徴量として抽出する。
As a specific example, when the predetermined phenotype is HDP, the feature
ステップS1004において、DNA変異絞込装置110の関連解析部114は、特徴量抽出部112が抽出した特徴量を、予め定めた基準値を用いて罹患群と非罹患群とに分類(ラベル付け)する。
In step S1004, the
例えば、前述したように、HDPに罹患している妊婦における血圧の計測値の傾きは、HDPに罹患していない妊婦における血圧の計測値の傾きより大きい傾向があることから、予め定められた傾き(基準値)を用いて、罹患群と非罹患群とを分類することができる。具体的な一例として、関連解析部114は、予め定められた傾きより大きい特徴量を罹患群としてラベル付けし、予め定められた傾き以下の特徴量を非罹患群としてラベル付けすることができる。
For example, as described above, the slope of blood pressure measurements in pregnant women with HDP tends to be greater than the slope of blood pressure measurements in pregnant women without HDP. (reference value) can be used to classify diseased and non-diseased groups. As a specific example, the
ここで、図9に戻り、DNA変異の絞込処理の例を示すフローチャートの説明を続ける。 Here, returning to FIG. 9, the description of the flowchart showing an example of narrowing down processing for DNA mutations will be continued.
ステップS903、S904において、DNA変異絞込装置110は、例えば、ステップS901、S902の処理と並行して、複数の被験者におけるDNA変異の情報を取得する。
In steps S903 and S904, the DNA mutation narrowing down
ステップS905において、DNA変異絞込装置110の関連解析部114は、DNA変異情報取得部113が取得したDNA変異の情報に含まれる各DNA変異に対して、罹患群、及び非罹患群における保有数に差があるかを示す統計的指標の値を算出する。
In step S905, the
具体的な一例として、関連解析部114は、フィッシャーの正確検定、又はカイ二乗検定を行い、p値を算出する。
As a specific example, the
ステップS906において、DNA変異絞込装置110のDNA変異抽出部115は、関連解析部114が算出した統計的指標の値が、基準値以上、又は基準値以下となるDNA変異を抽出する。
In step S906, the DNA
具体的な一例として、DNA変異抽出部115は、p値が、予め定められた基準値(例えば、0.05等)以下となるDNA変異を抽出する。
As a specific example, the DNA
上記の処理において、例えば、所定の表現型をHDP、量的形質の計測値を妊婦の血圧の計測値、血圧の計測値の傾きを特徴量とすることにより、第1の具体例と同様に、HDPに関連するDNA変異(一塩基多型)を抽出することができる。 In the above process, for example, by setting the predetermined phenotype as HDP, the measured value of the quantitative trait as the blood pressure measurement value of the pregnant woman, and the slope of the blood pressure measurement value as the feature quantity, the same as in the first specific example , DNA mutations (single nucleotide polymorphisms) associated with HDP can be extracted.
また、第2の具体例においても、検体のサンプルが少ない場合や、疾患の定義が曖昧である場合であっても、所定の疾患に関連するDNA変異を容易に絞り込むことができるDNA変異絞込装置、DNA変異絞込システム、及びDNA変異絞込方法を提供することができる。 Also in the second specific example, even when there are few specimen samples or when the definition of a disease is ambiguous, DNA mutation narrowing down can easily narrow down DNA mutations associated with a given disease. Devices, DNA mutation screening systems, and DNA mutation screening methods can be provided.
以上、本発明の実施形態によれば、サンプルが少ない場合や、疾患の定義が曖昧であり、通常のゲノムワイド関連解析で有効な結果が得られないようなケースでも、有意なDNA変異を絞込できることができる。これにより、従来の技術では特定できなかった疾患に関連するDNA変異を特定し、疾患の早期発見や予防に活用することが期待できる。 As described above, according to the embodiments of the present invention, significant DNA mutations can be narrowed down even in cases where the number of samples is small, or the definition of a disease is ambiguous, and effective results cannot be obtained by ordinary genome-wide association analysis. can be included. As a result, it can be expected to identify disease-related DNA mutations that could not be identified by conventional techniques, and to utilize them for early detection and prevention of diseases.
<補足>
なお、図1、2の構成図は、機能単位のブロックを示している。これらの機能ブロックは、ハードウェア及び/又はソフトウェアの任意の組み合わせによって実現される。また、各機能ブロックの実現手段は特に限定されない。すなわち、各機能ブロックは、物理的及び/又は論理的に結合した1つの装置により実現されても良いし、物理的及び/又は論理的に分離した2つ以上の装置を直接的及び/又は間接的に(例えば、有線及び/又は無線)で接続し、これら複数の装置により実現されても良い。
<Supplement>
1 and 2 show blocks for each function. These functional blocks are realized by any combination of hardware and/or software. Further, means for realizing each functional block is not particularly limited. That is, each functional block may be implemented by one device physically and/or logically coupled, or may be implemented by two or more physically and/or logically separated devices directly and/or indirectly. These multiple devices may be connected together (eg, wired and/or wirelessly).
また、図3に示すDNA変異絞込装置110のハードウェア構成は、図に示した各装置を1つ又は複数含むように構成されても良いし、一部の装置を含まずに構成されても良い。また、DNA変異絞込装置110は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)等のハードウェアを含んで構成されても良く、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されても良い。例えば、プロセッサ301は、これらのハードウェアの少なくとも1つで実装されても良い。
The hardware configuration of the DNA
本明細書で説明した各態様/実施形態の処理手順、シーケンス、フローチャート等は、矛盾のない限り、順序を入れ替えても良い。例えば、本明細書で説明した方法については、例示的な順序で様々なステップの要素を提示しており、提示した特定の順序に限定されない。 The processing procedures, sequences, flowcharts, etc. of each aspect/embodiment described herein may be interchanged in order as long as there is no contradiction. For example, the methods described herein present elements of the various steps in a sample order, and are not limited to the specific order presented.
入出力された情報等は特定の場所(例えば、メモリ)に保存されても良いし、管理テーブルで管理しても良い。入出力される情報等は、上書き、更新、又は追記され得る。出力された情報等は削除されても良い。入力された情報等は他の装置へ送信されても良い。 Input/output information and the like may be stored in a specific location (for example, memory), or may be managed in a management table. Input/output information and the like can be overwritten, updated, or appended. The output information and the like may be deleted. The entered information and the like may be transmitted to another device.
判定は、1ビットで表される値(0か1か)によって行われても良いし、真偽値(Boolean:true又はfalse)によって行われても良いし、数値の比較(例えば、所定の値との比較)によって行われても良い。 The determination may be made by a value represented by 1 bit (0 or 1), by a true/false value (Boolean: true or false), or by numerical comparison (for example, a predetermined value).
本明細書で説明した各態様/実施形態は単独で用いても良いし、組み合わせて用いても良いし、実行に伴って切り替えて用いても良い。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われても良い。 Each aspect/embodiment described herein may be used alone, may be used in combination, or may be used by switching between implementations. In addition, the notification of predetermined information (for example, notification of “being X”) is not limited to being performed explicitly, but may be performed implicitly (for example, not notifying the predetermined information). Also good.
ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。 Software, whether referred to as software, firmware, middleware, microcode, hardware description language or otherwise, includes instructions, instruction sets, code, code segments, program code, programs, subprograms, and software modules. , applications, software applications, software packages, routines, subroutines, objects, executables, threads of execution, procedures, functions, and the like.
また、ソフトウェア、命令などは、伝送媒体を介して送受信されても良い。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア及びデジタル加入者回線(DSL)などの有線技術及び/又は赤外線、無線及びマイクロ波などの無線技術を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び/又は無線技術は、伝送媒体の定義内に含まれる。 Software, instructions, etc. may also be transmitted and received over a transmission medium. For example, the software can be used to access websites, servers, or other When transmitted from a remote source, these wired and/or wireless technologies are included within the definition of transmission media.
本明細書で説明した情報、信号等は、様々な異なる技術のいずれかを使用して表されても良い。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されても良い。 Information, signals, etc. described herein may be represented using any of a variety of different technologies. For example, data, instructions, commands, information, signals, bits, symbols, chips, etc. that may be referred to throughout the above description may refer to voltages, currents, electromagnetic waves, magnetic fields or magnetic particles, light fields or photons, or any of these. may be represented by a combination of
なお、本明細書で説明した用語及び/又は本明細書の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えても良い。 The terms explained in this specification and/or terms necessary for understanding this specification may be replaced with terms having the same or similar meanings.
また、本明細書で説明した情報、パラメータなどは、絶対値で表されても良いし、所定の値からの相対値で表されても良いし、対応する別の情報で表されてもよい。例えば、無線リソースはインデックスで指示されるものであっても良い。 In addition, the information, parameters, and the like described in this specification may be represented by absolute values, may be represented by relative values from a predetermined value, or may be represented by corresponding other information. . For example, radio resources may be indexed.
本明細書で使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。 As used herein, the phrase "based on" does not mean "based only on," unless expressly specified otherwise. In other words, the phrase "based on" means both "based only on" and "based at least on."
「含む(including)」、「含んでいる(comprising)」、及びそれらの変形が、本明細書、或いは特許請求の範囲で使用されている限り、これら用語は、用語「備える」と同様に、包括的であることが意図される。さらに、本明細書、或いは特許請求の範囲において使用されている用語「または(or)」は、排他的論理和ではないことが意図される。 To the extent that "including," "comprising," and variations thereof are used herein or in the claims, these terms, as well as the term "comprising," intended to be inclusive. Furthermore, the term "or" as used in this specification or the claims is not intended to be an exclusive OR.
本開示の全体において、例えば、英語でのa, an, 及びtheのように、翻訳により冠詞が追加された場合、これらの冠詞は、文脈から明らかにそうではないことが示されていなければ、複数のものを含むものとする。 Throughout this disclosure, where articles have been added by translation, e.g., a, an, and the in English, these articles are used unless the context clearly indicates otherwise. It shall include plural things.
以上、本発明について詳細に説明したが、当業者にとっては、本発明が本明細書中に説明した実施形態に限定されるものではないということは明らかである。本発明は、特許請求の範囲の記載により定まる本発明の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。従って、本明細書の記載は、例示説明を目的とするものであり、本発明に対して何ら制限的な意味を有するものではない。 Although the present invention has been described in detail above, it will be apparent to those skilled in the art that the present invention is not limited to the embodiments described herein. The present invention can be implemented with modifications and variations without departing from the spirit and scope of the invention defined by the claims. Accordingly, the descriptions herein are for illustrative purposes only and are not meant to be limiting of the present invention.
100 DNA変異絞込システム
110 DNA変異絞込装置
112 特徴量抽出部
113 DNA変異情報取得部(取得部)
114 関連解析部(解析部)
115 DNA変異抽出部
100 DNA mutation narrowing down
114 Association analysis part (analysis part)
115 DNA Mutation Extractor
Claims (10)
前記複数の被験者におけるDNA変異の情報を取得する取得部と、
前記特徴量と前記DNA変異との関連を解析する解析部と、
前記解析部の解析結果に基づいて、前記所定の疾患に関連するDNA変異を抽出するDNA変異抽出部と、
を有し、
前記解析部は、前記特徴量を目的変数、前記DNA変異を説明変数として関連解析を行い、前記特徴量と各DNA変異との関連度を示す統計的指標の値を算出し、
前記DNA変異抽出部は、前記解析部が算出した前記統計的指標の値が、予め定められた基準値以上、又は基準値以下となるDNA変異を抽出する、
DNA変異絞込装置。 A continuous measure of a quantitative trait associated with a given disease collected from a plurality of subjects, including subjects with the given diseaseto a predetermined polynomial, and using the coefficient of the polynomial, the intercept of the polynomial, or the coefficient and intercept of the polynomial, for each subjecta feature quantity extraction unit that extracts a feature quantity;
an acquisition unit that acquires information on DNA mutations in the plurality of subjects;
an analysis unit that analyzes the relationship between the feature quantity and the DNA mutation;
a DNA mutation extraction unit that extracts a DNA mutation associated with the predetermined disease based on the analysis result of the analysis unit;
havedeath,
The analysis unit performs association analysis using the feature amount as an objective variable and the DNA mutation as an explanatory variable, and calculates a statistical index value indicating the degree of association between the feature amount and each DNA mutation,
The DNA mutation extraction unit extracts DNA mutations in which the value of the statistical index calculated by the analysis unit is a predetermined reference value or more or a reference value or less.
D.NA mutation screening device.
前記複数の被験者におけるDNA変異の情報を取得する取得部と、
前記特徴量と前記DNA変異との関連を解析する解析部と、
前記解析部の解析結果に基づいて、前記所定の疾患に関連するDNA変異を抽出するDNA変異抽出部と、
を有し、
前記解析部は、
前記特徴量抽出部が抽出した特徴量を、予め定めた基準値を用いて前記所定の疾患の罹患群と非罹患群とにラベル付けし、
前記取得部が取得したDNA変異の情報に含まれる各DNA変異に対して、前記罹患群、及び前記非罹患群における保有数に差があるかを示す統計的指標の値を算出し、
前記DNA変異抽出部は、前記解析部が算出した前記統計的指標の値が、予め定められた基準値以上、又は基準値以下となるDNA変異を抽出する、
DNA変異絞込装置。 Fitting a given polynomial to continuous measurements of a quantitative trait associated with the given disease, collected from a plurality of subjects, including subjects suffering from the given disease, the coefficients of the polynomial, A feature quantity extraction unit that extracts a feature quantity for each subject using the intercept of the polynomial, or the coefficient and intercept of the polynomial,
an acquisition unit that acquires information on DNA mutations in the plurality of subjects;
an analysis unit that analyzes the relationship between the feature quantity and the DNA mutation;
a DNA mutation extraction unit that extracts a DNA mutation associated with the predetermined disease based on the analysis result of the analysis unit;
has
The analysis unit is
Labeling the feature amount extracted by the feature amount extraction unit into a group affected by the predetermined disease and a group not affected by the predetermined disease using a predetermined reference value,
For each DNA mutation contained in the DNA mutation information acquired by the acquisition unit, calculate a statistical index value indicating whether there is a difference in the number of possession between the diseased group and the non-diseased group,
The DNA mutation extraction unit extracts DNA mutations in which the value of the statistical index calculated by the analysis unit is a predetermined reference value or more or a reference value or less.,
D.NA mutation screening device.
前記統計的指標は、有意確率を表すp値を含み、
前記DNA変異抽出部は、前記p値が、予め定められた有意水準より小さい前記一塩基多型を抽出する、請求項1又は2に記載のDNA変異絞込装置。 The DNA mutation includes a single nucleotide polymorphism,
The statistical index includes a p-value representing a significance probability,
3. The DNA mutation narrowing down device according to claim 1, wherein said DNA mutation extracting unit extracts said single nucleotide polymorphisms whose p-value is smaller than a predetermined significance level.
前記所定の疾患に関連する量的形質の連続的な計測値は、所定の時間間隔で計測した血圧の計測値を含む、請求項1乃至3のいずれか一項に記載のDNA変異絞込装置。 The predetermined disease includes gestational hypertension,
4. The DNA mutation narrowing down apparatus according to any one of claims 1 to 3 , wherein the continuous measured values of quantitative traits related to the predetermined disease include measured values of blood pressure measured at predetermined time intervals. .
前記複数の被験者におけるDNA変異の情報を取得する取得部と、
前記特徴量と前記DNA変異との関連を解析する解析部と、
前記解析部の解析結果に基づいて、前記所定の疾患に関連するDNA変異を抽出するDNA変異抽出部と、
を有し、
前記解析部は、前記特徴量を目的変数、前記DNA変異を説明変数として関連解析を行い、前記特徴量と各DNA変異との関連度を示す統計的指標の値を算出し、
前記DNA変異抽出部は、前記解析部が算出した前記統計的指標の値が、予め定められた基準値以上、又は基準値以下となるDNA変異を抽出する、
DNA変異絞込システム。 Continuous measurements of a quantitative trait associated with a given disease collected from a plurality of subjects, including subjects with the given diseaseis fitted to a predetermined polynomial, and using the coefficient of the polynomial, the intercept of the polynomial, or the coefficient and intercept of the polynomial, for each subjecta feature quantity extraction unit that extracts a feature quantity;
an acquisition unit that acquires information on DNA mutations in the plurality of subjects;
an analysis unit that analyzes the relationship between the feature quantity and the DNA mutation;
a DNA mutation extraction unit that extracts a DNA mutation associated with the predetermined disease based on the analysis result of the analysis unit;
havedeath,
The analysis unit performs association analysis using the feature amount as an objective variable and the DNA mutation as an explanatory variable, and calculates a statistical index value indicating the degree of association between the feature amount and each DNA mutation,
The DNA mutation extraction unit extracts DNA mutations in which the value of the statistical index calculated by the analysis unit is a predetermined reference value or more or a reference value or less.
D.NA mutation screening system.
前記複数の被験者におけるDNA変異の情報を取得する取得部と、 an acquisition unit that acquires information on DNA mutations in the plurality of subjects;
前記特徴量と前記DNA変異との関連を解析する解析部と、 an analysis unit that analyzes the relationship between the feature quantity and the DNA mutation;
前記解析部の解析結果に基づいて、前記所定の疾患に関連するDNA変異を抽出するDNA変異抽出部と、 a DNA mutation extraction unit that extracts a DNA mutation associated with the predetermined disease based on the analysis result of the analysis unit;
を有し、 has
前記解析部は、 The analysis unit is
前記特徴量抽出部が抽出した特徴量を、予め定めた基準値を用いて前記所定の疾患の罹患群と非罹患群とにラベル付けし、 labeling the feature amount extracted by the feature amount extracting unit into a diseased group and a non-affected group of the predetermined disease using a predetermined reference value;
前記取得部が取得したDNA変異の情報に含まれる各DNA変異に対して、前記罹患群、及び前記非罹患群における保有数に差があるかを示す統計的指標の値を算出し、 For each DNA mutation included in the DNA mutation information acquired by the acquisition unit, calculate a statistical index value indicating whether there is a difference in the number of possession between the diseased group and the non-diseased group,
前記DNA変異抽出部は、前記解析部が算出した前記統計的指標の値が、予め定められた基準値以上、又は基準値以下となるDNA変異を抽出する、 The DNA mutation extraction unit extracts DNA mutations in which the value of the statistical index calculated by the analysis unit is a predetermined reference value or more or a reference value or less.
DNA変異絞込システム。 DNA mutation screening system.
所定の疾患に罹患している被験者を含む複数の被験者から収集した、前記所定の疾患に関連する量的形質の連続的な計測値に対して所定の多項式にフィッティングを行い、前記多項式の係数、前記多項式の切片、又は前記多項式の係数と切片を用いて、前記被験者ごとに特徴量を抽出する処理と、
前記複数の被験者におけるDNA変異の情報を取得する処理と、
前記特徴量と前記DNA変異との関連を解析する解析処理と、
前記解析処理の解析結果に基づいて、前記所定の疾患に関連するDNA変異を抽出するDNA変異抽出処理と、
を実行し、
前記解析処理は、前記特徴量を目的変数、前記DNA変異を説明変数として関連解析を行い、前記特徴量と各DNA変異との関連度を示す統計的指標の値を算出し、
前記DNA変異抽出処理は、前記解析処理で算出した前記統計的指標の値が、予め定められた基準値以上、又は基準値以下となるDNA変異を抽出する、
DNA変異絞込方法。 the computer
A continuous measure of a quantitative trait associated with a given disease collected from a plurality of subjects, including subjects with the given diseaseis fitted to a predetermined polynomial, and using the coefficient of the polynomial, the intercept of the polynomial, or the coefficient and intercept of the polynomial, for each subjecta process of extracting a feature quantity;
a process of obtaining information on DNA mutations in the plurality of subjects;
analyzing the relationship between the feature amount and the DNA mutationanalysisprocessing;
Saidanalysisextracting a DNA mutation associated with the predetermined disease based on the analysis result of the treatment;DNA mutation extractionprocessing;
rundeath,
In the analysis process, association analysis is performed using the feature amount as an objective variable and the DNA mutation as an explanatory variable, and a statistical index value indicating the degree of association between the feature amount and each DNA mutation is calculated;
The DNA mutation extraction process extracts DNA mutations in which the value of the statistical index calculated in the analysis process is a predetermined reference value or more or a reference value or less.
DNA mutation screening method.
所定の疾患に罹患している被験者を含む複数の被験者から収集した、前記所定の疾患に関連する量的形質の連続的な計測値に対して所定の多項式にフィッティングを行い、前記多項式の係数、前記多項式の切片、又は前記多項式の係数と切片を用いて、前記被験者ごとに特徴量を抽出する特徴量抽出処理と、 Fitting a predetermined polynomial to continuous measurements of a quantitative trait associated with the predetermined disease collected from a plurality of subjects, including subjects suffering from the predetermined disease, the coefficients of the polynomial, A feature quantity extraction process for extracting a feature quantity for each subject using the intercept of the polynomial, or the coefficient and intercept of the polynomial,
前記複数の被験者におけるDNA変異の情報を取得する取得処理と、 an acquisition process for acquiring information on DNA mutations in the plurality of subjects;
前記特徴量と前記DNA変異との関連を解析する解析処理と、 an analysis process for analyzing the relationship between the feature amount and the DNA mutation;
前記解析処理の解析結果に基づいて、前記所定の疾患に関連するDNA変異を抽出するDNA変異抽出処理と、 a DNA mutation extraction process for extracting a DNA mutation associated with the predetermined disease based on the analysis result of the analysis process;
を実行し、 and run
前記解析処理は、 The analysis process includes
前記特徴量抽出処理で抽出した特徴量を、予め定めた基準値を用いて前記所定の疾患の罹患群と非罹患群とにラベル付けし、 Labeling the feature amount extracted by the feature amount extraction process into the diseased group and the non-affected group of the predetermined disease using a predetermined reference value,
前記取得処理で取得したDNA変異の情報に含まれる各DNA変異に対して、前記罹患群、及び前記非罹患群における保有数に差があるかを示す統計的指標の値を算出し、 For each DNA mutation contained in the DNA mutation information acquired in the acquisition process, calculate a statistical index value indicating whether there is a difference in the number of carriers in the diseased group and the non-diseased group,
前記DNA変異抽出処理は、前記解析処理で算出した前記統計的指標の値が、予め定められた基準値以上、又は基準値以下となるDNA変異を抽出する、 The DNA mutation extraction process extracts DNA mutations in which the value of the statistical index calculated in the analysis process is a predetermined reference value or more or a reference value or less.
DNA変異絞込方法。 DNA mutation screening method.
所定の疾患に罹患している被験者を含む複数の被験者から収集した、前記所定の疾患に関連する量的形質の連続的な計測値に対して所定の多項式にフィッティングを行い、前記多項式の係数、前記多項式の切片、又は前記多項式の係数と切片を用いて、前記被験者ごとに特徴量を抽出する処理と、
前記複数の被験者におけるDNA変異の情報を取得する処理と、
前記特徴量と前記DNA変異との関連を解析する解析処理と、
前記解析する処理の解析結果に基づいて、前記所定の疾患に関連するDNA変異を抽出するDNA変異抽出処理と、
を実行させ、
前記解析処理は、前記特徴量を目的変数、前記DNA変異を説明変数として関連解析を行い、前記特徴量と各DNA変異との関連度を示す統計的指標の値を算出し、
前記DNA変異抽出処理は、前記解析処理で算出した前記統計的指標の値が、予め定められた基準値以上、又は基準値以下となるDNA変異を抽出する、
プログラム。 to the computer,
A continuous measure of a quantitative trait associated with a given disease collected from a plurality of subjects, including subjects with the given diseaseto a predetermined polynomial, and using the coefficient of the polynomial, the intercept of the polynomial, or the coefficient and intercept of the polynomial, for each subjecta process of extracting a feature quantity;
a process of obtaining information on DNA mutations in the plurality of subjects;
analyzing the relationship between the feature amount and the DNA mutationanalysisprocessing;
extracting a DNA mutation associated with the predetermined disease based on the analysis result of the analyzing process;DNA mutation extractionprocessing;
run,
In the analysis process, association analysis is performed using the feature amount as an objective variable and the DNA mutation as an explanatory variable, and a statistical index value indicating the degree of association between the feature amount and each DNA mutation is calculated;
The DNA mutation extraction process extracts DNA mutations in which the value of the statistical index calculated in the analysis process is a predetermined reference value or more or a reference value or less.
program.
所定の疾患に罹患している被験者を含む複数の被験者から収集した、前記所定の疾患に関連する量的形質の連続的な計測値に対して所定の多項式にフィッティングを行い、前記多項式の係数、前記多項式の切片、又は前記多項式の係数と切片を用いて、前記被験者ごとに特徴量を抽出する特徴量抽出処理と、 Fitting a predetermined polynomial to continuous measurements of a quantitative trait associated with the predetermined disease collected from a plurality of subjects, including subjects suffering from the predetermined disease, the coefficients of the polynomial, A feature amount extraction process for extracting a feature amount for each subject using the intercept of the polynomial, or the coefficient and intercept of the polynomial,
前記複数の被験者におけるDNA変異の情報を取得する取得処理と、 an acquisition process for acquiring information on DNA mutations in the plurality of subjects;
前記特徴量と前記DNA変異との関連を解析する解析処理と、 an analysis process for analyzing the relationship between the feature amount and the DNA mutation;
前記解析処理の解析結果に基づいて、前記所定の疾患に関連するDNA変異を抽出するDNA変異抽出処理と、 a DNA mutation extraction process for extracting a DNA mutation associated with the predetermined disease based on the analysis result of the analysis process;
を実行させ、 and
前記解析処理は、 The analysis process includes
前記特徴量抽出処理で抽出した特徴量を、予め定めた基準値を用いて前記所定の疾患の罹患群と非罹患群とにラベル付けし、 Labeling the feature amount extracted by the feature amount extraction process into the diseased group and the non-affected group of the predetermined disease using a predetermined reference value,
前記取得処理で取得したDNA変異の情報に含まれる各DNA変異に対して、前記罹患群、及び前記非罹患群における保有数に差があるかを示す統計的指標の値を算出し、 For each DNA mutation contained in the DNA mutation information acquired in the acquisition process, calculate a statistical index value indicating whether there is a difference in the number of carriers in the diseased group and the non-diseased group,
前記DNA変異抽出処理は、前記解析処理で算出した前記統計的指標の値が、予め定められた基準値以上、又は基準値以下となるDNA変異を抽出する、 The DNA mutation extraction process extracts DNA mutations in which the value of the statistical index calculated in the analysis process is a predetermined reference value or more or a reference value or less.
プログラム。 program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018164050A JP7141039B2 (en) | 2018-08-31 | 2018-08-31 | DNA mutation screening device, DNA mutation screening system, DNA mutation screening method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018164050A JP7141039B2 (en) | 2018-08-31 | 2018-08-31 | DNA mutation screening device, DNA mutation screening system, DNA mutation screening method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020038413A JP2020038413A (en) | 2020-03-12 |
JP7141039B2 true JP7141039B2 (en) | 2022-09-22 |
Family
ID=69738547
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018164050A Active JP7141039B2 (en) | 2018-08-31 | 2018-08-31 | DNA mutation screening device, DNA mutation screening system, DNA mutation screening method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7141039B2 (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008191716A (en) | 2007-01-31 | 2008-08-21 | Signpost Corp | Method for presenting risk of disease and its program |
JP2016059759A (en) | 2014-09-22 | 2016-04-25 | 株式会社メディプリーム | Pathogenesis prediction network system |
-
2018
- 2018-08-31 JP JP2018164050A patent/JP7141039B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008191716A (en) | 2007-01-31 | 2008-08-21 | Signpost Corp | Method for presenting risk of disease and its program |
JP2016059759A (en) | 2014-09-22 | 2016-04-25 | 株式会社メディプリーム | Pathogenesis prediction network system |
Non-Patent Citations (1)
Title |
---|
Paula J. Williams, et al.,The genetics of pre-eclampsia and other hypertensive disorders of pregnancy,Best Practice & Research Clinical Obstetrics and Gynaecology [online],2011年08月25日,Volume 25, Issue 4,Pages 405-417,[検索日:2022年7月19日], <URL:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3145161/> |
Also Published As
Publication number | Publication date |
---|---|
JP2020038413A (en) | 2020-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yousefi et al. | DNA methylation-based predictors of health: applications and statistical considerations | |
Denny et al. | Systematic comparison of phenome-wide association study of electronic medical record data and genome-wide association study data | |
WO2020168118A1 (en) | Methods and systems for determining a pregnancy-related state of a subject | |
Binder et al. | Big data in medical science—a biostatistical view: Part 21 of a series on evaluation of scientific publications | |
WO2019191649A1 (en) | Methods and systems for analyzing microbiota | |
Fogel | Genetic and genomic testing for neurologic disease in clinical practice | |
CN115667554A (en) | Method and system for detecting colorectal cancer by nucleic acid methylation analysis | |
Scheubert et al. | Tissue-based Alzheimer gene expression markers–comparison of multiple machine learning approaches and investigation of redundancy in small biomarker sets | |
Pavey et al. | Utilization of genomic sequencing for population screening of immunodeficiencies in the newborn | |
Thibodeau et al. | A neural network based model effectively predicts enhancers from clinical ATAC-seq samples | |
Zhou et al. | Maternal blood EBF1-based microRNA transcripts as biomarkers for detecting risk of spontaneous preterm birth: A nested case-control study | |
JP7141038B2 (en) | Onset prediction device and onset prediction system | |
Cherik et al. | DNA methylation episignature in Gabriele-de Vries syndrome | |
Sugawara et al. | Maternity Log study: a longitudinal lifelog monitoring and multiomics analysis for the early prediction of complicated pregnancy | |
Coenen-van der Spek et al. | DNA methylation episignature for Witteveen-Kolk syndrome due to SIN3A haploinsufficiency | |
AU2019446735B2 (en) | Method for discovering marker for predicting risk of depression or suicide using multi-omics analysis, marker for predicting risk of depression or suicide, and method for predicting risk of depression or suicide using multi-omics analysis | |
JP7141039B2 (en) | DNA mutation screening device, DNA mutation screening system, DNA mutation screening method, and program | |
Balan et al. | MICon contamination detection workflow for next-generation sequencing laboratories using microhaplotype loci and supervised learning | |
Leung et al. | Classification of pathogenic or benign status of CNVs detected by microarray analysis | |
Shen et al. | Cohort research in “Omics” and preventive medicine | |
Sabbagh et al. | Clinico-biological refinement of BCL11B-related disorder and identification of an episignature: A series of 20 unreported individuals | |
Yang et al. | Improving the calling of non-invasive prenatal testing on 13-/18-/21-trisomy by support vector machine discrimination | |
Sawada et al. | Analyzing the Mutation Frequencies and Correlation of Genetic Diseases in Worldwide Populations Using Big Data Processing, Clustering, and Predictive Analytics | |
Yu et al. | Joint estimation and imputation of variant functional effects using high throughput assay data | |
US20230410957A1 (en) | Methods and systems for conducting pregnancy-related clinical trials |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20180920 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20180920 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220510 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220706 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220816 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220826 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7141039 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |