JP7108571B2 - How to determine your risk of anorexia - Google Patents
How to determine your risk of anorexia Download PDFInfo
- Publication number
- JP7108571B2 JP7108571B2 JP2019081178A JP2019081178A JP7108571B2 JP 7108571 B2 JP7108571 B2 JP 7108571B2 JP 2019081178 A JP2019081178 A JP 2019081178A JP 2019081178 A JP2019081178 A JP 2019081178A JP 7108571 B2 JP7108571 B2 JP 7108571B2
- Authority
- JP
- Japan
- Prior art keywords
- snp
- genotype
- disease
- risk
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Investigating Or Analysing Biological Materials (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Description
本発明は拒食症のリスクを判定する方法に関する。 The present invention relates to a method for determining the risk of anorexia.
疾患のリスクの判定に用いるために、一塩基多型(以下、「SNP」ともいう。)と疾患との関連性の特定が進められている。NCBI SNP Databaseは、ヒトのSNPをまとめたデータベースであり、SNPにrs番号を付して管理している。本明細書におけるrs番号も、このNCBI SNP Databaseにおける登録番号を意味するものとする。 Identification of the relationship between single nucleotide polymorphisms (hereinafter also referred to as "SNPs") and diseases is in progress for use in determining disease risk. The NCBI SNP Database is a database that summarizes human SNPs, and manages the SNPs by assigning rs numbers. The rs number in this specification also means the accession number in this NCBI SNP Database.
本明細書においてrs番号で特定されるSNPと、当該SNPに関連する疾患、病態又は状態等として非特許文献等で開示されているものとの関係は、以下のとおりである。
rs4820268:血液中の鉄分濃度に関するSNP(非特許文献 1)
rs3809060:鼠径ヘルニアに関するSNP(非特許文献 2)
rs4273077:多発性骨髄腫に関するSNP(非特許文献 3)
rs10937405:肺がん(肺腺がん)に関するSNP(非特許文献 4)
rs7097:大細胞型B細胞リンパ腫に関するSNP(非特許文献 5)
rs2853677:肺がん(肺腺がん)に関するSNP(非特許文献 6)
rs6570507:脊柱側弯症に関するSNP(非特許文献 7)
rs4680:喫煙量に関するSNP(非特許文献 8)
rs4680:痛みの感じやすさに関するSNP(非特許文献 9)
rs4680:調和性(男性向け)に関するSNP(非特許文献 10)
rs4680:外向性(女性向け)に関するSNP(非特許文献 11)
rs4680:損害回避(男性向け)に関するSNP(非特許文献 12)
rs4680:損害回避(女性向け)に関するSNP(非特許文献 13)
rs4680:支配欲に関するSNP(非特許文献 14)
rs4680:失敗を避ける傾向に関するSNP(非特許文献 15)
rs4680:短期的利益を求める傾向に関するSNP(非特許文献 16)
rs4680:悲しみの表情の認識力に関するSNP(非特許文献 17)
rs4680:怒りの表情の認識力に関するSNP(非特許文献 18)
rs6010620:神経膠腫に関するSNP(非特許文献 19)
The relationships between the SNPs identified by the rs numbers in this specification and the diseases, pathologies, conditions, etc. associated with the SNPs disclosed in non-patent literature and the like are as follows.
rs4820268: SNP related to iron concentration in blood (Non-Patent Document 1)
rs3809060: SNP related to inguinal hernia (Non-Patent Document 2)
rs4273077: SNP related to multiple myeloma (Non-Patent Document 3)
rs10937405: SNP related to lung cancer (lung adenocarcinoma) (Non-Patent Document 4)
rs7097: SNP related to large B-cell lymphoma (Non-Patent Document 5)
rs2853677: SNP related to lung cancer (lung adenocarcinoma) (Non-Patent Document 6)
rs6570507: SNP related to scoliosis (Non-Patent Document 7)
rs4680: SNP related to smoking amount (Non-Patent Document 8)
rs4680: SNP related to pain sensitivity (Non-Patent Document 9)
rs4680: SNP related to harmony (for men) (Non-Patent Document 10)
rs4680: SNP related to extroversion (for women) (Non-Patent Document 11)
rs4680: SNP for loss avoidance (for men) (Non-Patent Document 12)
rs4680: SNP on loss avoidance (for women) (Non-Patent Document 13)
rs4680: SNP related to control desire (Non-Patent Document 14)
rs4680: SNP related to tendency to avoid failure (Non-Patent Document 15)
rs4680: SNP related to tendency to seek short-term profits (Non-Patent Document 16)
rs4680: SNP related to recognition of sad facial expressions (Non-Patent Document 17)
rs4680: SNP related to recognition of angry facial expressions (Non-Patent Document 18)
rs6010620: SNP related to glioma (Non-Patent Document 19)
本発明は、拒食症(以下、「本疾患」ともいう。)のリスクを判定する方法を提供することを課題とする。 An object of the present invention is to provide a method for determining the risk of anorexia (hereinafter also referred to as "this disease").
本発明者らは上記課題を解決するために鋭意検討した。その結果、これまで一見すると本疾患との関連性がないと認められる個々の一塩基多型を、一つのまとまったセットとしてみたときに、本疾患との関連性があることを見出した。そして、その関連性を用いることで、本疾患のリスクを判定する本発明を完成するに至った。 The present inventors have made intensive studies to solve the above problems. As a result, we found that individual single nucleotide polymorphisms, which at first glance seem to be unrelated to this disease, are related to this disease when viewed as a set. Then, by using the relationship, the present invention for determining the risk of this disease has been completed.
すなわち、本発明の方法では、本疾患との関連性を見出した、rs4820268、rs3809060、rs4273077、rs10937405、rs7097、rs2853677、rs6570507、rs4680、及びrs6010620を少なくとも含む一塩基多型セット(以下、「本SNPセット」ともいう。)の遺伝子型情報に基づいて、本疾患のリスクを判定する。 That is, in the method of the present invention, a single nucleotide polymorphism set (hereinafter referred to as "this SNP The risk of this disease is determined based on the genotype information of the set.
本発明の方法においては、「一塩基多型セット」とは、複数の一塩基多型の一つのまとまったセットを意味し、この一つのセットにより本疾患との関連性が見出されている。 In the method of the present invention, the "single nucleotide polymorphism set" means a set of multiple single nucleotide polymorphisms, and this one set has been found to be associated with the disease. .
また、本発明の方法における「遺伝子型情報」とは、一塩基多型における2つのホモ接合型(AA,BB)と、ヘテロ接合型(AB)に分類して示される、一塩基多型の遺伝子型(Genotype)の情報を意味し、「本SNPセットの遺伝子型情報」とは、本SNPセットにおいて特定される各一塩基多型の遺伝子型情報を一まとまりとしたセットを意味し、言い換えれば、各rs番号で示される塩基配列中の各SNPの多型となる塩基に関する情報のセットである。本SNPセットの遺伝子型情報は、図1において示すとおりである。 In addition, the "genotype information" in the method of the present invention refers to single nucleotide polymorphisms classified into two homozygous types (AA, BB) and heterozygous types (AB) for single nucleotide polymorphisms. It means genotype information, and "genotype information of this SNP set" means a set of genotype information of each single nucleotide polymorphism identified in this SNP set, in other words For example, it is a set of information on the polymorphic bases of each SNP in the base sequence indicated by each rs number. The genotype information of this SNP set is as shown in FIG.
本発明によれば、本疾患のリスクを判定することができる。 According to the present invention, the risk of this disease can be determined.
本発明の実施の形態について説明する。以下の実施形態は、本発明を説明するための例示であり、本発明をこの実施形態にのみ限定する趣旨ではない。本発明は、その要旨を逸脱しない限り、様々な形態で実施することができる。 An embodiment of the present invention will be described. The following embodiments are examples for explaining the present invention, and are not meant to limit the present invention only to these embodiments. The present invention can be embodied in various forms without departing from the gist thereof.
本実施形態において、拒食症とは、摂食障害の一つであり、身体的な病気がないのに食事がとれない状態をいう。拒食症は、神経性無食欲症や神経性やせ症ともいわれる。 In the present embodiment, anorexia is one of eating disorders, and refers to a condition in which a person cannot eat without physical illness. Anorexia nervosa is also known as anorexia nervosa or anorexia nervosa.
また、本実施形態において、本疾患は、一般には、本疾患に関する医学会の公表するガイドラインに沿って診断される疾患、医療用医薬品の添付文書において、効能・効果の欄に記載される疾患、あるいは、医薬・医療業界において汎用される用語として理解される疾患の少なくともいずれかを意味するものと解することができる。 In addition, in this embodiment, the disease is generally defined as a disease diagnosed according to the guidelines published by the medical society regarding this disease, a disease described in the column of efficacy and effect in the package insert of ethical drugs, Alternatively, it can be understood to mean at least one of diseases understood as a term commonly used in the pharmaceutical and medical industries.
本実施形態の方法においては、一見すると本疾患との関連性がないと認められる所定数の一塩基多型セットを用いて、本疾患のリスクを判定する。 In the method of this embodiment, the risk of this disease is determined using a predetermined number of single nucleotide polymorphism sets that seemingly have no association with this disease.
本疾患のリスクとは、本疾患の罹りやすさや罹りにくさなどの本疾患に罹る可能性をいう。「リスクを判定する」とは、例えば、現在または将来において本疾患に罹る可能性をいくつかのレベルに分けて出力することや、数値により出力することを含む。本疾患のリスクの判定には、疾患に罹りやすい傾向にあるのか、罹りにくい傾向にあるのかといった、疾患に対する遺伝的要因あるいは遺伝的感受性についての評価が含まれる。 The risk of this disease means the possibility of contracting this disease, such as susceptibility or difficulty of contracting this disease. "Risk determination" includes, for example, dividing the present or future possibility of contracting the disease into several levels and outputting it numerically. Determining risk for the disease involves assessing genetic factors or genetic susceptibility to the disease, such as predisposition or predisposition to the disease.
なお、本疾患のリスクを判定するにあたっては、本疾患のリスクの判定を受ける対象者が、本疾患のリスクの判定時において、実際に本疾患に罹患しているか(発症しているか)否かは問わない。 In determining the risk of this disease, it is necessary to check whether the subject who is to be assessed for the risk of this disease actually has (has developed) this disease at the time of the risk assessment of this disease. does not matter.
本実施形態の方法では、本SNPセットで特定される各SNPの遺伝子型を2つのホモ接合型(AA,BB)と、ヘテロ接合型(AB)に分類した遺伝子型のセットである、本SNPセットの遺伝子型情報を用いる。そして、本SNPセットの遺伝子型情報に基づいて、対象者の本疾患のリスクを判定する。 In the method of the present embodiment, the present SNP is a set of genotypes in which genotypes of each SNP specified in the present SNP set are classified into two homozygous types (AA, BB) and a heterozygous type (AB). A set of genotype information is used. Then, based on the genotype information of this SNP set, the subject's risk of this disease is determined.
本実施形態の方法で用いる本SNPセットは、本疾患との関連性が従来認められていなかったSNPを含むセットである。すなわち、通常は、本SNPセットに含まれるSNPを個別に分析したとしても、本疾患のリスクを判定することはできない。しかしながら、本実施形態の方法では、本SNPセットに含まれる各SNPの遺伝子型情報を一まとまりのセットとして分析することにより、本疾患のリスクを判定することができる。また、本SNPセットを分析した場合と、比較SNPセットを分析した場合とを比較すると、本SNPセットを分析した場合の方が統計的に有意な結果が得られている。すなわち、本実施形態の方法において、本SNPセットを分析して本疾患のリスクを判定することで、高精度が高い、あるいは予測能力が高いリスクの判定方法を提供することができる。 This SNP set used in the method of this embodiment is a set containing SNPs that have not been found to be related to this disease. That is, normally, even if the SNPs included in this SNP set are individually analyzed, the risk of this disease cannot be determined. However, in the method of this embodiment, the risk of this disease can be determined by analyzing the genotype information of each SNP included in this SNP set as a set. Further, when comparing the case of analyzing the present SNP set and the case of analyzing the comparative SNP set, the case of analyzing the present SNP set yields statistically significant results. That is, in the method of this embodiment, by analyzing this SNP set and determining the risk of this disease, it is possible to provide a highly accurate or highly predictive risk determination method.
以下、本SNPセットに含まれる各SNPに関連して、rs番号と、各SNPが存在する染色体番号(性染色体の場合には、XかYで示す)と、各SNPの染色体上の位置と、rs番号に対応する塩基配列と、を列記する。なお、各rs番号で示される塩基配列中において、SNPは[]で囲って示す。例えば、[A/G]と表記した場合には、その塩基配列の位置においてA又はGの一塩基多型があることを示す。また、各SNPに関する塩基配列や疾患などの情報は、例えば、rs番号に基づいてNCBI SNP Databaseを検索することで得られる。それらの情報は当該Databaseにより参照可能であり、また、本明細書で援用する。なお、以下に記す染色体上の位置は、assembly genomeのバージョンGRCh37に対応するものである。 Below, in relation to each SNP included in this SNP set, the rs number, the chromosome number where each SNP exists (indicated by X or Y in the case of sex chromosomes), and the position of each SNP on the chromosome , and the nucleotide sequence corresponding to the rs number. In addition, in the base sequence indicated by each rs number, SNPs are enclosed in brackets []. For example, [A/G] indicates that there is a single nucleotide polymorphism of A or G at the position of the base sequence. Further, information such as base sequences and diseases related to each SNP can be obtained, for example, by searching the NCBI SNP Database based on the rs number. Their information can be referenced by the Database and is incorporated herein by reference. The positions on the chromosome described below correspond to the assembly genome version GRCh37.
rs4820268
染色体番号 22
染色体上の位置 37469591
塩基配列 CCCTACCTTCCTGGCACTGCTCTTC[A/G]TCGCTGCCGTTGAGACAATCAGGCT(配列番号1)
rs4820268
chromosome number 22
Chromosome location 37469591
Nucleotide sequence CCCTACCTTCCTGGCACTGCTCTTC[A/G]TCGCTGCCGTTGAGACAATCAGGCT (SEQ ID NO: 1)
rs3809060
染色体番号 11
染色体上の位置 32458807
塩基配列 GGCCACCTTTGCTGCTTGACTTTGC[T/G]TCGTCTCCACTCAGAAGCTTTTAAA(配列番号2)
rs3809060
chromosome number 11
Chromosome location 32458807
Nucleotide sequence GGCCACCTTTGCTGCTTGACTTTGC[T/G]TCGTCTCCACTCAGAAGCTTTTTAAA (SEQ ID NO: 2)
rs4273077
染色体番号 17
染色体上の位置 16849139
塩基配列 CCCCCTCCCCCAGCTTGCTCCTTCC[A/G]CCAAGAGGTGGCGTCTGTTTCCCCT(配列番号3)
rs4273077
Chromosome number 17
Chromosome location 16849139
Nucleotide sequence CCCCCTCCCCCAGCTTGCTCCTTCC[A/G]CCAAGAGGTGGCGTCTGTTTCCCCCT (SEQ ID NO: 3)
rs10937405
染色体番号 3
染色体上の位置 189383183
塩基配列 CAACCCTACTTCAACATTATAATCT[T/C]GTGTTCAAACCTGATAAGCTACTTT(配列番号4)
rs10937405
Chromosome location 189383183
Nucleotide sequence CAACCCTACTTCAACATTATAATCT [T/C] GTGTTCAAACCTGATAAGCTACTTT (SEQ ID NO: 4)
rs7097
染色体番号 13
染色体上の位置 28197436
塩基配列 TCTAATTCTGGGTTCTGCACCATCA[A/G]GAAGAGAATATCCTACAGGACAGTT(配列番号5)
rs7097
chromosome number 13
Chromosome location 28197436
Nucleotide sequence TCTAATTCTGGGTTCTGCACCATCA [A/G] GAAGAGAATATCCTACAGGACAGTT (SEQ ID NO: 5)
rs2853677
染色体番号 5
染色体上の位置 1287194
塩基配列 TCATTTTTTTGTCACTAGAGACCCG[T/C]CTGGTGCACTCTGATTCTCCACTTG(配列番号6)
rs2853677
Chromosome location 1287194
Nucleotide sequence TCATTTTTTGTCACTAGAGACCCG [T/C] CTGGTGCACTCTGATTCTCCACTTG (SEQ ID NO: 6)
rs6570507
染色体番号 6
染色体上の位置 142679572
塩基配列 AGTGAATTCAGTCCTTGTAGAATAA[A/G]TCTGCCTTGCCACTGTGACTGCTAA(配列番号7)
rs6570507
Chromosome number 6
Chromosome location 142679572
Nucleotide sequence AGTGAATTCAGTCCTTGTAGAATAA [A/G] TCTGCCTTGCCACTGTGACTGCTAA (SEQ ID NO: 7)
rs4680
染色体番号 22
染色体上の位置 19951271
塩基配列 CCAGCGGATGGTGGATTTCGCTGGC[A/G]TGAAGGACAAGGTGTGCATGCCTGA(配列番号8)
rs4680
chromosome number 22
Chromosome location 19951271
Nucleotide sequence CCAGCGGATGGTGGATTTCGCTGGC[A/G]TGAAGGACAAGGTGTGCATGCCTGA (SEQ ID NO: 8)
rs6010620
染色体番号 20
染色体上の位置 62309839
塩基配列 TCCCTTTTTGAGACCTGGGAGGAGC[A/G]CCTGCTTTGCATGATCTGGTTGCTG(配列番号9)
rs6010620
chromosome number 20
Chromosome location 62309839
Nucleotide sequence TCCCTTTTTGAGACCTGGGAGGAGC[A/G]CCTGCTTTGCATGATCTGGTTGCTG (SEQ ID NO: 9)
本実施形態の方法において、本SNPセットを構成する各SNPはrs番号により特定される塩基配列を参照することによって特定可能であるが、本明細書において記載するrs番号が他のrs番号と併合され、新たなrs番号が付与された場合には、本明細書において該当するrs番号は、併合後のrs番号及び併合される他のrs番号をも意味する。また、本明細書において記載するrs番号が複数のrs番号の併合により付与された番号である場合には、本明細書において該当するrs番号は、その他の元となるrs番号をも意味する。 In the method of this embodiment, each SNP that constitutes this SNP set can be identified by referring to the base sequence identified by the rs number. and a new rs number is assigned, the applicable rs number in this specification also means the merged rs number and the merged other rs number. In addition, when the rs number described in this specification is a number assigned by merging multiple rs numbers, the applicable rs number in this specification also means other original rs numbers.
また、SNPに関する各rs番号で示される上記塩基配列は、特定の塩基配列として示しているが、人種の相違等によって、当該塩基配列において該当するSNP以外の部分における塩基配列は変更されてもよい。 In addition, although the base sequences indicated by the respective rs numbers related to SNPs are shown as specific base sequences, the base sequences in portions other than the relevant SNPs in the base sequences may be changed due to differences in race, etc. good.
本実施形態の方法は、いずれの人種の被検者に対しても用いることができるが、特に、アジア人に好適に用いることができる。アジア人の中でも日本人等の東アジア人の被検者により好適に用いることができる。また、本実施形態の方法は、いずれの性別の被検者に対しても用いてもよい。 Although the method of the present embodiment can be used for subjects of any race, it is particularly suitable for Asian subjects. Among Asians, it can be preferably used for East Asian subjects such as Japanese. Moreover, the method of the present embodiment may be used for subjects of any gender.
以下、本SNPセットの遺伝子型情報を分析することにより本疾患のリスクを判定する方法の一態様について説明する。但し、判定方法は、以下に限定されない。 One aspect of the method for determining the risk of this disease by analyzing the genotype information of this SNP set will be described below. However, the determination method is not limited to the following.
はじめに、対象者の試料を用いて、試料中の本SNPセットに含まれる各SNPの遺伝子型を特定する。SNPの検出に用いる試料としては、染色体DNAを含む試料であれば特に制限されない。このような試料としては、例えば、唾液、血液、尿等の体液サンプル;口腔粘膜などの細胞サンプル;毛髪等の体毛などが挙げられる。SNPの検出には、これらの試料から常法により単離した染色体DNAを直接使用してもよいし、単離した染色体DNAを増幅して、増幅後の染色体DNAを使用してもよい。 First, a subject's sample is used to identify the genotype of each SNP included in this SNP set in the sample. The sample used for SNP detection is not particularly limited as long as it contains chromosomal DNA. Such samples include, for example, body fluid samples such as saliva, blood and urine; cell samples such as oral mucosa; body hair such as hair. For detection of SNPs, chromosomal DNA isolated from these samples by a conventional method may be directly used, or the isolated chromosomal DNA may be amplified and the amplified chromosomal DNA may be used.
SNPの検出は、通常の遺伝子多型解析方法によって行うことができる。例えば、DNAチップ法(DNAマイクロアレイ)、サンガー法を用いた従来型のシーケンサーや次世代シーケンサー(NGS;Next Generation Sequencer)などを用いたシーケンス解析、PCR(Polymerase Chain Reaction)、ハイブリダイゼーション、インベーダー法などが挙げられるが、これらに限定されない。 SNP detection can be performed by a normal genetic polymorphism analysis method. For example, DNA chip method (DNA microarray), sequence analysis using a conventional sequencer or next generation sequencer (NGS; Next Generation Sequencer) using the Sanger method, PCR (Polymerase Chain Reaction), hybridization, invader method, etc. include, but are not limited to:
DNAチップ法では、SNP部位を含む多数のDNA断片(プローブ)を基板上に配置したDNAチップを用い、染色体DNAをチップ上のプローブとハイブリダイズさせて、結合部位を蛍光又は電流により検出することにより、染色体DNAの配列を解析する。SNP解析に用いられるDNAチップとしては、SNP部位を含む塩基配列を検出可能なオリゴヌクレオチドプローブが配置されたチップが挙げられる。 In the DNA chip method, a DNA chip is used in which a large number of DNA fragments (probes) containing SNP sites are arranged on a substrate, chromosomal DNA is hybridized with the probes on the chip, and binding sites are detected by fluorescence or electric current. analyzes the sequence of chromosomal DNA. A DNA chip used for SNP analysis includes a chip on which oligonucleotide probes capable of detecting base sequences containing SNP sites are arranged.
また、シーケンス解析は通常のサンガー法により行うことができる。例えば、多型を示す塩基の5'側の数十塩基の位置に設定したプライマーを使用してシーケンス反応を行い、その解析結果から、該当する位置がどの種類の塩基であるかを決定することができる。なお、シーケンス反応の前に、あらかじめSNP部位を含む断片をPCRなどによって増幅しておくことが好ましい。効率の観点からはNGS技術を使用してもよい。 Also, sequence analysis can be performed by the usual Sanger method. For example, a sequence reaction is performed using a primer set at a position several tens of bases on the 5' side of a base exhibiting a polymorphism, and the type of base at the corresponding position is determined from the analysis results. can be done. In addition, it is preferable to amplify the fragment containing the SNP site in advance by PCR or the like before the sequencing reaction. From an efficiency point of view, NGS technology may be used.
また、SNPの検出は、例えば従来のPCRによる増幅の有無を調べることによって行うことができる。例えば、多型を示す塩基を含む領域に対応する配列を有し、かつ、3'末端が各多型に対応するプライマーをそれぞれ用意する。それぞれのプライマーを使用してPCRを行い、増幅産物の有無によってどのタイプの多型であるかを決定することができる。また、LAMP法(Loop-Mediated Isothermal Amplification;特許第3313358号明細書)、NASBA法(Nucleic Acid Sequence-Based Amplification;特許2843586号明細書)、ICAN法(Isothermal and Chimeric primer-initiated Amplification of Nucleic acids;特許第3433929号公報)などによって増幅の有無を調べることもできる。その他、単鎖増幅法やNGSを用いた解析法を用いてもよい。 Moreover, detection of SNPs can be performed, for example, by examining the presence or absence of amplification by conventional PCR. For example, primers each having a sequence corresponding to a region containing a base exhibiting a polymorphism and having a 3′ end corresponding to each polymorphism are prepared. PCR can be performed using each primer and the type of polymorphism can be determined by the presence or absence of the amplified product.また、LAMP法(Loop-Mediated Isothermal Amplification;特許第3313358号明細書)、NASBA法(Nucleic Acid Sequence-Based Amplification;特許2843586号明細書)、ICAN法(Isothermal and Chimeric primer-initiated Amplification of Nucleic acids; The presence or absence of amplification can also be checked by Japanese Patent No. 3433929). In addition, a single-strand amplification method or an analysis method using NGS may be used.
また、SNP部位を含むDNA断片を増幅し、増幅産物の電気泳動における移動度の違いによってどのタイプの多型であるかを決定することもできる。このような方法としては、例えば、PCR-SSCP(single-strand conformation polymorphism)法(Genomics. 1992 Jan 1;12(1):139-146.)などが挙げられる。具体的には、まず、目的のSNPを含むDNAを増幅し、増幅したDNAを一本鎖DNAに解離させる。次いで、解離させた一本鎖DNAを非変性ゲル上で分離し、分離した一本鎖DNAのゲル上での移動度の違いによってどのタイプの多型であるかを決定することができる。
It is also possible to amplify a DNA fragment containing the SNP site and determine which type of polymorphism it is based on the difference in electrophoretic mobility of the amplified product. Examples of such methods include the PCR-SSCP (single-strand conformation polymorphism) method (Genomics. 1992
さらに、多型を示す塩基が制限酵素認識配列に含まれる場合は、制限酵素による切断の有無によって解析することもできる(RFLP(Restriction Fragment Length Polymorphism)法)。この場合、まず、DNA試料を制限酵素により切断する。次いで、DNA断片を分離し、検出されたDNA断片の大きさによってどのタイプの多型であるかを決定することができる。 Furthermore, when a base exhibiting polymorphism is included in the restriction enzyme recognition sequence, it can be analyzed based on the presence or absence of cleavage by the restriction enzyme (RFLP (Restriction Fragment Length Polymorphism) method). In this case, first, the DNA sample is cleaved with a restriction enzyme. The DNA fragments can then be separated and the type of polymorphism determined by the size of the detected DNA fragment.
また、ハイブリダイゼーションの有無を調べることによって多型の種類を解析することも可能である。すなわち、各塩基に対応するプローブを用意し、いずれのプローブにハイブリダイズするかを調べることによってSNPがいずれの塩基であるかを調べることもできる。 It is also possible to analyze the type of polymorphism by examining the presence or absence of hybridization. That is, it is also possible to examine which base the SNP is by preparing probes corresponding to each base and examining which probe it hybridizes to.
このようにして、本SNPセットの各SNPに関して、対象者の遺伝子型データを決定することができる。なおここで、「対象者の遺伝子型データ」とは、対象者の有する遺伝子型情報をいう。 In this way, the subject's genotype data can be determined for each SNP in the SNP set. Here, "subject's genotype data" refers to genotype information possessed by the subject.
次いで、本SNPセットの遺伝子型情報に基づいて、本疾患のリスクを判定する。リスクの判定には、任意のモデルを用いることができる。モデルとしては、特に制限されないが、例えば、本SNPセットの遺伝子型情報を用いて、対象者の遺伝子型データから算出される特徴量を入力とし、本疾患のリスクを出力とするロジスティック回帰モデルを用いることができる。当該ロジスティック回帰モデルは、予め、本疾患に罹患したヒトの遺伝子型データと、本疾患に罹患していないヒトの遺伝子型データと、を学習データとして用いてパラメータを機械学習している。 Then, the risk of this disease is determined based on the genotype information of this SNP set. Any model can be used to determine risk. The model is not particularly limited, but for example, using the genotype information of the present SNP set, a logistic regression model in which the feature value calculated from the genotype data of the subject is input and the risk of this disease is output. can be used. In the logistic regression model, the parameters are machine-learned in advance using the genotype data of humans affected by this disease and the genotype data of humans not affected by this disease as learning data.
また、疾患のリスクを判定するモデルとしては、ロジスティック回帰モデルに代えて、多層パーセプトロン、CNN(Convolutional Neural Network)及びRNN(Recurrent Neural Network)などのニューラルネットワーク、ガウシアンカーネル等の任意のカーネル関数を用いるサポートベクターマシーン、回帰木としてモデル化したランダムフォレスト、重回帰分析、隠れマルコフモデルなどを利用したモデル、統計モデルや確率モデルなど種々の他のモデルを採用することもできる。また、種々のモデルを組み合わせて総合的な判定を行うモデルを採用することもできる。 In addition, as a model for determining the risk of disease, any kernel function such as a multilayer perceptron, a neural network such as a CNN (Convolutional Neural Network) and an RNN (Recurrent Neural Network), or a Gaussian kernel is used instead of the logistic regression model. Various other models such as support vector machines, random forests modeled as regression trees, multiple regression analysis, models utilizing hidden Markov models, statistical models and probabilistic models can also be employed. It is also possible to employ a model that combines various models to make a comprehensive determination.
次いで、モデルを用いた本疾患のリスク判定の一例について説明する。まず、本疾患のリスクの判定をする対象者の遺伝子型データを、モデルに入力可能な特徴量に変換する。本実施形態の方法における特徴量は、例えば、本SNPセットの各SNPについて、対象者の遺伝子型データがホモ接合型(AA)、ホモ接合型(BB)、又はヘテロ接合型(AB)のいずれであるかを示すパラメータである。遺伝子型は、相同染色体のSNPが共にG(グアニン)であることを示す“GG”や、一方がG(グアニン)で、他方がA(アデニン)であることを示す“AG”などヌクレオチドにより表記されることが一般的であるため、対象者の遺伝子型データを、本SNPセットの遺伝子型情報を用いるモデルに入力可能なパラメータに変換する。しかし、モデルが、このようなパラメータへの変換の必要がないものである場合には、上記変換は必要とされない。 Next, an example of risk determination for this disease using a model will be described. First, the genotype data of the subject whose risk of this disease is to be determined is converted into a feature quantity that can be input to the model. The feature amount in the method of the present embodiment is, for example, whether the genotype data of the subject is homozygous (AA), homozygous (BB), or heterozygous (AB) for each SNP in the SNP set. It is a parameter that indicates whether Genotypes are represented by nucleotides such as "GG" indicating that both SNPs on homologous chromosomes are G (guanine), or "AG" indicating that one is G (guanine) and the other is A (adenine). Therefore, the subject's genotype data is converted into parameters that can be input to a model that uses the genotype information of this SNP set. However, if the model is one that does not require such transformations into parameters, then such transformations are not required.
対象者の遺伝子型データの特徴量への変換は、例えば、本SNPセットに含まれるSNP1つ1つに関して、対象者の遺伝子型データに値を付すことにより行うことができる。例えば、各SNPについて、対象者の遺伝子型データがホモ接合型(AA)、ホモ接合型(BB)、又はヘテロ接合型(AB)のいずれに該当するのかに応じて、そのSNPに値(例えば、0又は1)を対応づける。これにより、対象者の遺伝子型データを特徴量に変換することができる。なお、以下では、各SNPに対応させる値を0又は1とした場合を例に説明するが、SNPに対応させる値は0又は1の2つの値に限られるものではない。 Conversion of the subject's genotype data into feature quantities can be performed, for example, by assigning a value to the subject's genotype data for each SNP included in this SNP set. For example, for each SNP, a value (for example, , 0 or 1). Thereby, the subject's genotype data can be converted into a feature amount. In the following, the case where the value associated with each SNP is 0 or 1 will be described as an example, but the value associated with the SNP is not limited to 0 or 1.
接合型に対応づける値はSNPごとに決めることができる。例えば、あるSNPは、対象者の遺伝子型データがホモ接合型(AA)である場合に値1を対応付け、ホモ接合型(BB)及びヘテロ接合型(AB)である場合に値0を対応付けるようにし、他のSNPは、対象者の遺伝子型データがヘテロ接合型(AB)である場合に値1を対応付け、ホモ接合型(AA)及びホモ接合型(BB)である場合に値0を対応付けるようにしてもよい。そのほか、対象者の遺伝子型データがヘテロ接合型(AB)及びホモ接合型(BB)である場合に値1を対応付け、ホモ接合型(AA)である場合に値0を対応付けるようにしてもよい。
A value associated with a mating type can be determined for each SNP. For example, a SNP associates a value of 1 when the subject's genotype data is homozygous (AA), and a value of 0 when the subject is homozygous (BB) and heterozygous (AB). As such, other SNPs are associated with a value of 1 when the subject's genotype data is heterozygous (AB), and a value of 0 when they are homozygous (AA) and homozygous (BB). may be associated with each other. In addition, if the genotype data of the subject is heterozygous (AB) and homozygous (BB), the
上記のように、対象者の遺伝子型データを特徴量に変換することができる。この特徴量への変換において対応付けに使用する値は、任意に決定することができる。例えば、上記非特許文献に基づいて、もともと各SNPが関連する疾患に関係の高い遺伝子型に対して値1を対応付けるようにし、かつ、各SNPが関連する疾患に関係の低い遺伝子型に対して値0を対応付けるようにすることができる。 As described above, a subject's genotype data can be converted into feature quantities. Values used for correspondence in the conversion to this feature quantity can be arbitrarily determined. For example, based on the above non-patent literature, a value of 1 is associated with genotypes that are highly related to the disease to which each SNP is originally associated, and genotypes that are less related to the disease to which each SNP is related are associated with A value of 0 can be associated.
このような、SNPごとの接合型とその接合型に対応付ける値の関係は、図1のような本SNPセットの遺伝子型情報をもとに、例えば、図2のような変換テーブルとして表すこともできる。図2の変換テーブルでは、網掛けをした遺伝子型と一致する場合にはそのSNPに対応付ける値を1とし、一致しない場合には対応付ける値を0とする。なお、図1及び2の具体的な遺伝子型の表記において、Aはアデニン、Gはグアニン、Cはシトシン、Tはチミンを示す。但し、特徴量の変換テーブルの形式は、図2に限定されるものではない。 Such a relationship between the mating type for each SNP and the value associated with the mating type can be expressed as a conversion table such as that shown in FIG. 2, for example, based on the genotype information of this SNP set as shown in FIG. can. In the conversion table of FIG. 2, the value associated with the SNP is set to 1 if it matches the shaded genotype, and 0 if it does not match. 1 and 2, A represents adenine, G represents guanine, C represents cytosine, and T represents thymine. However, the format of the feature amount conversion table is not limited to that shown in FIG.
最後に、本SNPセットの遺伝子型情報に基づいて、対象者の本疾患のリスクを判定する。より具体的には、本SNPセットの遺伝子型情報に基づく変換テーブルを用いて、対象者の遺伝子型データを、モデルに入力可能に変換した特徴量として算出し、当該特徴量を所定の判定モデルに入力し、対象者の本疾患のリスクを判定することができる。 Finally, the subject's risk of the disease is determined based on the genotype information of the SNP set. More specifically, using a conversion table based on the genotype information of this SNP set, the genotype data of the subject is calculated as a feature amount converted so that it can be input to the model, and the feature amount is converted into a predetermined judgment model. to determine the subject's risk of this disease.
判定モデルにおいて、特徴量には、本SNPセットのSNPごとに、本疾患のリスクと正の相関があることを表す重みづけや、本疾患のリスクと負の相関があることを表す重みづけをすることができる。例えば、rs4820268、rs7097、rs3809060、及びrs6010620に対応付けた値(特徴量)ついては、本疾患のリスクと正の相関があることを表す重みづけを行い、rs6570507、rs4680、rs2853677、及びrs4273077に対応付けた値(特徴量)ついては、本疾患のリスクと負の相関があることを表す重みづけを行い、rs10937405に対応付けた値(特徴量)ついては、本疾患のリスクと正の相関又は負の相関があることを表す重みづけを行うことができる。 In the judgment model, for each SNP in the SNP set, a weighting indicating that there is a positive correlation with the risk of this disease and a weighting that indicates that there is a negative correlation with the risk of this disease. can do. For example, the values (feature values) associated with rs4820268, rs7097, rs3809060, and rs6010620 are weighted to indicate that there is a positive correlation with the risk of this disease, and are associated with rs6570507, rs4680, rs2853677, and rs4273077. The value (feature value) associated with rs10937405 is weighted to indicate that there is a negative correlation with the risk of this disease, and the value (feature value) associated with rs10937405 is positively or negatively correlated with the risk of this disease. can be weighted to indicate that there is
例えば、特徴量に対して重みづけを行う場合には、rs10937405の遺伝子型がTC、rs4820268の遺伝子型がAG、rs7097の遺伝子型がAA、rs3809060の遺伝子型がTT、及びrs6010620の遺伝子型がAAである場合に、本疾患のリスクと正の相関があることを表す重みづけを行い、rs10937405の遺伝子型がCC、rs6570507の遺伝子型がAG、rs4680の遺伝子型がGG、rs2853677の遺伝子型がTT、及びrs4273077の遺伝子型がAGである場合に、本疾患のリスクと負の相関があることを表す重みづけを行うことができる。また、特徴量として値0を対応付けた各SNPの遺伝子型の場合には、本疾患のリスクと相関がない或いは無視しうる程度に低いものと評価することができる。 For example, when weighting features, the genotype of rs10937405 is TC, the genotype of rs4820268 is AG, the genotype of rs7097 is AA, the genotype of rs3809060 is TT, and the genotype of rs6010620 is AA. If , weighted to indicate that there is a positive correlation with the risk of this disease, the rs10937405 genotype is CC, the rs6570507 genotype is AG, the rs4680 genotype is GG, and the rs2853677 genotype is TT. , and rs4273077 genotype AG can be weighted to indicate that there is a negative correlation with the risk of this disease. In addition, in the case of each SNP genotype associated with a value of 0 as a feature quantity, it can be evaluated that there is no correlation with the risk of this disease or that it is negligibly low.
このような、本疾患のリスクとの相関を表す重みづけは、本疾患に罹患したヒトの遺伝子型データと、本疾患に罹患していないヒトの遺伝子型データと、を学習データとして用いてパラメータを機械学習することにより特定される。この際、あるモデルにおいて、あるSNPが本疾患のリスクと正の相関があることを表す重み付けがなされるとした場合、他のモデルにおいても同様にそのSNPは本疾患のリスクと正の相関があることを表す重み付けがなされることが通常である。すなわち、モデルの種類等によって、あるSNPにおいて本疾患のリスクとの相関関係が逆になるような事態は想定し難い。なお、重みづけの具体的な値はモデルによって異なり、特に制限されるものではない。 Such weighting, which represents the correlation with the risk of this disease, is performed by using the genotype data of humans affected by this disease and the genotype data of humans not affected by this disease as learning data. is identified by machine learning. At this time, if a certain SNP is weighted to indicate that there is a positive correlation with the risk of this disease in a certain model, the SNP is similarly positively correlated with the risk of this disease in other models. It is normal to have some weighting. In other words, it is difficult to imagine a situation in which the correlation with the risk of this disease is reversed for a certain SNP, depending on the type of model or the like. Note that specific weighting values differ depending on the model and are not particularly limited.
ここで、本SNPセットのなかで本疾患のリスクと正の相関があることを表す重みづけを行うSNPのまとまりを「正相関SNPセット」といい、本疾患のリスクと負の相関があることを表す重みづけを行うSNPのまとまりを「負相関SNPセット」という。本SNPセットは、正相関SNPセットと負相関SNPセットとを含むものであり、このような本SNPセットの遺伝子型情報に基づくことにより、対象者の本疾患のリスクを、リスクが上昇する要因とリスクが低下する要因の両面を総合して判定することができる。 Here, in this SNP set, a group of SNPs that are weighted to indicate that there is a positive correlation with the risk of this disease is called a "positive correlation SNP set", and that there is a negative correlation with the risk of this disease. A group of SNPs weighted to represent is called a "negatively correlated SNP set". This SNP set includes a positive correlation SNP set and a negative correlation SNP set. and risk reduction factors can be comprehensively determined.
上記のようにして得られる判定結果は、本疾患の専門医が本疾患を診断する際の補助としても用いられる。また、上記のようにして判定した本疾患のリスクと、対象者からのアンケート結果とに基づいて、本疾患のリスクの判定結果は補正されしてもよい。また、本疾患のリスクと、対象者からのアンケート結果とに基づいて、対象者に対して、生活改善に関するアドバイスを出力してもよい。 The determination result obtained as described above is also used as an aid in diagnosing this disease by a specialist of this disease. In addition, the determination result of the risk of the disease may be corrected based on the risk of the disease determined as described above and the results of questionnaires from the subjects. In addition, based on the risk of this disease and the results of a questionnaire from the subject, advice on life improvement may be output to the subject.
本発明は、プライマーやプローブなどの検査試薬を提供することもできる。このようなプローブとしては、上記SNP部位を含み、ハイブリダイズの有無によってSNP部位の塩基の種類を判定できるプローブが挙げられる。また、プライマーとしては、上記SNP部位を増幅するためのPCRに用いることのできるプライマー、又は上記SNP部位をシーケンス解析するために用いることのできるプライマーが挙げられる。本実施形態の検査試薬はこれらのプライマーやプローブに加えて、PCR用のポリメラーゼやバッファー、ハイブリダイゼーション用試薬などを含むものであってもよい。 The present invention can also provide test reagents such as primers and probes. Examples of such probes include probes that contain the above SNP site and can determine the type of base at the SNP site based on the presence or absence of hybridization. Further, examples of primers include primers that can be used for PCR for amplifying the SNP site, and primers that can be used for sequence analysis of the SNP site. In addition to these primers and probes, the test reagents of the present embodiment may also contain polymerases and buffers for PCR, reagents for hybridization, and the like.
以下、本実施形態を実施例によりさらに具体的に説明する。但し、本実施形態はこれらの実施例に限定されない。 EXAMPLES Hereinafter, the present embodiment will be described in more detail with reference to examples. However, the present embodiment is not limited to these examples.
本SNPセットと本疾患との関連性を、以下のように検証した。 The association between this SNP set and this disease was verified as follows.
遺伝子解析サービスの利用者7万3千人以上から、利用者の同意のもと、唾液試料と、各種疾患の罹患情報を収集した。罹患情報とは、例えば、本疾患に罹患している場合に1、罹患していない場合に0となる数値である。唾液試料から、利用者ごとの遺伝子型データを特定し、利用者の遺伝子型データと各種罹患情報とを対応付けたデータベースを構築した。このデータベースの中から、本疾患に罹患している被検者103名と、罹患していないコントロール103名との症例対照セットを構築した。 With the consent of the users, we collected saliva samples and information on the prevalence of various diseases from more than 73,000 users of the genetic analysis service. The disease information is, for example, a numerical value that is 1 when the subject is afflicted with the disease and 0 when the subject is not afflicted with the disease. We identified the genotype data of each user from the saliva samples, and built a database that correlates the user's genotype data with various disease information. From this database, a case-control set of 103 subjects with the disease and 103 controls without the disease was constructed.
次いで、被検者及びコントロールの本SNPセットの各SNPの遺伝子型を、2つのホモ接合型(AA,BB)と、ヘテロ接合型(AB)に分類した。そして、遺伝子型が図2に示す網掛けをした変換テーブルの遺伝子型と一致する場合には、xiの値を1とし、一致しない場合には0として、x1~xNを以下の数式(1)で表されるロジスティック回帰モデルの説明変数とした。例えば、rs4820268の場合は、遺伝子型が“AG”であるときにx1の値を1とし、遺伝子型が“AA”又は“GG”であるときにはx1の値を0とした。なお、本実施例ではN=10である。また、以下の数式で表されるロジスティック回帰モデルの目的変数は、本疾患に罹患している確率を表す0から1の間の値p(罹患情報)とした。
1.AUCによるモデルの検証
本SNPセットを用いた判定方法の精度について説明する。上記データベースから、テスト用に、利用者の遺伝子型情報と罹患情報とを対応付けたデータセットを作成した。データセットにおける各利用者の本SNPセットの各SNPの遺伝子型を、ホモ接合型(AA,BB)と、ヘテロ接合型(AB)に分類し、分類した各遺伝子型が図2に示す網掛けをした遺伝子型と一致する場合には、xiの値を1と評価し、一致しない場合には0と評価して、x1~xNを特徴量として算出した。
1. Validation of model by AUC The accuracy of the determination method using this SNP set will be described. From the above database, a data set was created for testing, in which user's genotype information and disease information were associated with each other. The genotype of each SNP in this SNP set of each user in the data set is classified into homozygous type (AA, BB) and heterozygous type (AB), and each classified genotype is shaded in FIG. The value of x i was evaluated as 1 when it matched the genotype obtained by the calculation, and evaluated as 0 when it did not match, and x 1 to x N were calculated as feature amounts.
利用者毎の本SNPセットに関する特徴量を上記ロジスティック回帰モデル(以下、「判定モデル」ともいう。)に入力し、各利用者が本疾患に罹患しているか否かを予測し、その偽陽性率と真陽性率を算出し、ROC(Receiver Operating Characteristic)曲線とAUC(Area Under the Curve)をそれぞれ求めた。より具体的には、判定モデルについて5分割交差検証を行い、5つのROC曲線(ROC fold 1からROC fold 5)を求めて、その平均(Mean ROC)と標準偏差(±1std. dev.)を求めた。図3中の破線(Luck)は、本疾患に罹患しているか否かをランダムに出力する場合であり、予測能力が無いモデルのROC曲線に対応している。
Input the feature amount related to this SNP set for each user into the above logistic regression model (hereinafter also referred to as "determination model"), predict whether each user is suffering from this disease, and detect the false positive A rate and a true positive rate were calculated, and ROC (Receiver Operating Characteristic) curve and AUC (Area Under the Curve) were determined respectively. More specifically, 5-fold cross-validation is performed on the decision model, five ROC curves (
また、同様にして、本SNPセットから1つのSNPを除いた各比較SNPセットに対して、上記と同様にそれぞれロジスティック回帰モデル(以下、「比較判定モデル」ともいう。)を作成した。そして、各比較SNP関する特徴量を各比較判定モデルに入力し、各利用者が本疾患に罹患しているか否かを予測し、偽陽性率と真陽性率を算出し、ROC曲線とAUCをそれぞれ求めた。その結果を図4以降に示す。 Similarly, a logistic regression model (hereinafter also referred to as a "comparative determination model") was created for each comparison SNP set, excluding one SNP from the main SNP set. Then, input the feature amount related to each comparative SNP into each comparative judgment model, predict whether each user is suffering from this disease, calculate the false positive rate and true positive rate, and calculate the ROC curve and AUC. sought each. The results are shown in FIG. 4 and subsequent figures.
本SNPセットを用いて本疾患を判定した場合、AUCは0.80±0.07であり、ランダムな出力の場合(AUC=0.5)と比べて有意に高く、本SNPセットを用いる判定モデルの予測能力が高いことが確認できる。 When the disease was determined using this SNP set, the AUC was 0.80 ± 0.07, which was significantly higher than the case of random output (AUC = 0.5). It can be confirmed that the prediction ability of the model is high.
一方、各比較SNPセットを用いる比較判定モデルの場合、AUCは本SNPセットを用いる場合よりも低い。従って、各比較SNPセットを用いる比較判定モデルのAUCは、ランダムな出力の場合(AUC=0.5)よりも高いものの、本SNPセットを用いる判定モデルのAUC(0.80±0.07)よりも総じて低いことが確認できる。 On the other hand, in the case of the comparative decision model using each comparative SNP set, the AUC is lower than in the case of using the present SNP set. Therefore, although the AUC of the comparative decision model using each comparative SNP set was higher than the case of random output (AUC=0.5), the AUC of the decision model using this SNP set (0.80±0.07) can be seen to be generally lower than
よって、本SNPセットに含まれるSNP全てを用いて判定することで、本SNPセットから1つのSNPを除いた各比較SNPセットを用いる場合よりも、本疾患に罹患しているか否かを高精度で予測できることが分かった。 Therefore, by using all the SNPs included in this SNP set, it is possible to determine whether or not the patient is suffering from the disease with higher accuracy than when using each comparison SNP set excluding one SNP from this SNP set. was found to be predictable.
2.ウィルコクソンの順位和検定による検証
本SNPセットを用いる判定モデルが、各比較SNPセットを用いる比較判定モデルよりも有意に優れたモデルであることを確かめるために、ノンパラメトリック検定の一種であるウィルコクソンの順位和検定を行った。具体的には、本SNPセットを用いる判定モデルのAUCと、各比較SNPセットを用いる比較判定モデルのAUCとに差が無いという帰無仮説を設定し、有意水準を0.01としてウィルコクソンの順位和検定を行った。
2. Verification by Wilcoxon Rank Sum Test In order to confirm that the judgment model using this SNP set is significantly superior to the comparison judgment model using each comparative SNP set, Wilcoxon rank sum test, which is a kind of nonparametric test, was performed. A sum test was performed. Specifically, a null hypothesis that there is no difference between the AUC of the judgment model using this SNP set and the AUC of the comparison judgment model using each comparison SNP set is set, and the significance level is set to 0.01, and the Wilcoxon rank A sum test was performed.
その結果、p値は、rs2853677(TT)を除外した比較SNPセットにおいては4.20×10-18であり、rs6570507(AG)を除外した比較SNPセットにおいては4.08×10-18であり、その他の比較SNPセットにおいてはいずれも3.96×10-18であり、最大でも4.20×10-18であることから、帰無仮説が棄却されることが確認された。すなわち、本SNPセットを用いる判定モデルのAUCと、各比較SNPセットを用いる比較判定モデルのAUCとは、統計的に有意な差があり、本SNPセットを用いる判定モデルは、各比較SNPセットを用いる比較判定モデルよりも優れたモデルであるといえる。 As a result, the p-value was 4.20×10 −18 in the comparative SNP set excluding rs2853677 (TT) and 4.08×10 −18 in the comparative SNP set excluding rs6570507 (AG). , 3.96×10 −18 and 4.20×10 −18 at maximum in other comparison SNP sets, confirming that the null hypothesis is rejected. That is, there is a statistically significant difference between the AUC of the judgment model using this SNP set and the AUC of the comparison judgment model using each comparison SNP set, and the judgment model using this SNP set has each comparison SNP set. It can be said that this model is superior to the comparative judgment model used.
上記のとおり、本実施形態の方法は、本疾患に罹患しているか否かを予測する精度が、ランダムな予測の場合の精度よりも有意に高いという効果を有する。また、本実施形態の方法は、本SNPセットの遺伝子型情報に基づく本疾患の判定の結果と、比較SNPセットの遺伝子型情報に基づく本疾患の判定の結果との間に、有意な差があるという効果を有する。当該効果は、本SNPセットの遺伝子型情報と本疾患の間に、これまで見出されていなかった潜在的な相関性があることに基づくものであると考えられる。上記で例示したロジスティック回帰モデルやその他のモデルは、本SNPセットの遺伝子型情報を前提として、本疾患に罹患したヒトと本疾患に罹患していないヒトの遺伝子型に関するデータと罹患情報を学習データとして用いてパラメータを機械学習することなどにより得られるものである。すなわち、いずれのモデルも上記潜在的な相関性を表す一つの表現型に過ぎず、本実施形態の方法の実施において使用されるモデルの種類は特に限定されるものではない。 As described above, the method of the present embodiment has the effect that the accuracy of predicting whether or not the person has the disease is significantly higher than the accuracy of random prediction. In addition, the method of the present embodiment has a significant difference between the determination result of the disease based on the genotype information of the present SNP set and the determination result of the disease based on the genotype information of the comparative SNP set. have the effect of being This effect is considered to be based on the potential correlation between the genotype information of this SNP set and this disease, which has not been found so far. The logistic regression model exemplified above and other models are based on the genotype information of this SNP set, and the genotype data and disease information of humans affected by this disease and those not affected by this disease are used as learning data. It is obtained by machine learning the parameters using as In other words, any model is just one phenotype that expresses the potential correlation, and the type of model used in implementing the method of the present embodiment is not particularly limited.
本発明の方法は、医療やヘルスケアに関連する分野において、本疾患のリスクを判定し、その予防および/または治療に貢献するものである。 The method of the present invention contributes to determining the risk of this disease and its prevention and/or treatment in fields related to medicine and healthcare.
Claims (2)
rs10937405の遺伝子型がTC、rs4820268の遺伝子型がAG、rs7097の遺伝子型がAA、rs3809060の遺伝子型がTT、rs6010620の遺伝子型がAA、rs10937405の遺伝子型がCC、rs6570507の遺伝子型がAG、rs4680の遺伝子型がGG、rs2853677の遺伝子型がTT、及びrs4273077の遺伝子型がAGであるか否かに関する遺伝子型情報に基づいて、拒食症のリスクを判定する、方法。 rs10937405 genotype is TC, rs4820268 genotype is AG, rs7097 genotype is AA, rs3809060 genotype is TT, rs6010620 genotype is AA, rs10937405 genotype is CC, rs6570507 genotype is AG, rs4680 genotype of GG, genotype of rs2853677 is TT, and genotype of rs4273077 is AG.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019081178A JP7108571B2 (en) | 2019-04-22 | 2019-04-22 | How to determine your risk of anorexia |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019081178A JP7108571B2 (en) | 2019-04-22 | 2019-04-22 | How to determine your risk of anorexia |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2020174624A JP2020174624A (en) | 2020-10-29 |
JP2020174624A5 JP2020174624A5 (en) | 2022-03-15 |
JP7108571B2 true JP7108571B2 (en) | 2022-07-28 |
Family
ID=72935715
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019081178A Active JP7108571B2 (en) | 2019-04-22 | 2019-04-22 | How to determine your risk of anorexia |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7108571B2 (en) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004173505A (en) | 2002-11-22 | 2004-06-24 | Mitsuo Itakura | Method for identifying disease-susceptible gene and program and system used therefor |
JP2004537311A (en) | 2001-07-16 | 2004-12-16 | プライス ファンデーション リミテッド | Genes and SNPs associated with eating disorders |
JP2005501563A (en) | 2001-08-31 | 2005-01-20 | アベンティス・ファーマ・ドイチユラント・ゲゼルシャフト・ミット・ベシュレンクテル・ハフツング | Use of MCH-R SNPs to identify genetic disorders in maintaining normal weight |
JP2008048730A (en) | 2006-07-25 | 2008-03-06 | Tokai Univ | Eating disorder-related gene and method for judging risk of eating disorder crisis |
US20120040342A1 (en) | 2008-03-17 | 2012-02-16 | Geisinger Clinic | Genetic Indicators Of Weight Loss |
JP2012094143A (en) | 2010-10-27 | 2012-05-17 | Samsung Sds Co Ltd | Apparatus and method for extracting biomarker |
-
2019
- 2019-04-22 JP JP2019081178A patent/JP7108571B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004537311A (en) | 2001-07-16 | 2004-12-16 | プライス ファンデーション リミテッド | Genes and SNPs associated with eating disorders |
JP2005501563A (en) | 2001-08-31 | 2005-01-20 | アベンティス・ファーマ・ドイチユラント・ゲゼルシャフト・ミット・ベシュレンクテル・ハフツング | Use of MCH-R SNPs to identify genetic disorders in maintaining normal weight |
JP2004173505A (en) | 2002-11-22 | 2004-06-24 | Mitsuo Itakura | Method for identifying disease-susceptible gene and program and system used therefor |
JP2008048730A (en) | 2006-07-25 | 2008-03-06 | Tokai Univ | Eating disorder-related gene and method for judging risk of eating disorder crisis |
US20120040342A1 (en) | 2008-03-17 | 2012-02-16 | Geisinger Clinic | Genetic Indicators Of Weight Loss |
JP2012094143A (en) | 2010-10-27 | 2012-05-17 | Samsung Sds Co Ltd | Apparatus and method for extracting biomarker |
Also Published As
Publication number | Publication date |
---|---|
JP2020174624A (en) | 2020-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7161441B2 (en) | How to Determine Risk for Chronic Sinusitis | |
JP7165100B2 (en) | Method for determining risk of atrial and/or ventricular fibrillation | |
JP7140707B2 (en) | How to determine your risk of glaucoma | |
JP7161442B2 (en) | How to determine the risk of rheumatoid arthritis | |
JP7165098B2 (en) | Methods for determining arteriosclerosis risk | |
JP7165099B2 (en) | Method for determining risk of myocardial infarction and/or angina pectoris | |
JP7161443B2 (en) | Method for determining the risk of ureteral and/or renal stones | |
JP7137525B2 (en) | How to determine the risk of contact dermatitis | |
JP7108571B2 (en) | How to determine your risk of anorexia | |
JP7138076B2 (en) | How to Determine Your Risk for Anxiety Disorders | |
JP7108572B2 (en) | How to Determine Your Binge Eating Risk | |
JP7106487B2 (en) | How to determine your risk of ulcerative colitis | |
JP7137523B2 (en) | How to determine your risk of hives | |
JP7108573B2 (en) | How to determine the risk of chronic otitis media | |
JP7137518B2 (en) | How to determine the risk of hyperthyroidism | |
JP7137526B2 (en) | Methods for determining the risk of atopic dermatitis | |
JP7107886B2 (en) | How to determine your risk of caries | |
JP7138075B2 (en) | How to determine your risk for hypothyroidism | |
JP7138077B2 (en) | Methods for determining risk of ovarian and/or uterine cancer | |
JP7107885B2 (en) | How to determine your risk of chemical sensitivity | |
JP7107884B2 (en) | How to determine food allergy risk | |
JP7108574B2 (en) | Methods for determining the risk of allergic conjunctivitis | |
JP7137519B2 (en) | How to determine your risk of tuberculosis | |
JP7137522B2 (en) | How to determine your scoliosis risk | |
JP7106489B2 (en) | How to determine the risk of fatty liver |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200609 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220304 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220627 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220715 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7108571 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |