JP2023002298A - 糖尿病指標値の検出方法 - Google Patents

糖尿病指標値の検出方法 Download PDF

Info

Publication number
JP2023002298A
JP2023002298A JP2021103461A JP2021103461A JP2023002298A JP 2023002298 A JP2023002298 A JP 2023002298A JP 2021103461 A JP2021103461 A JP 2021103461A JP 2021103461 A JP2021103461 A JP 2021103461A JP 2023002298 A JP2023002298 A JP 2023002298A
Authority
JP
Japan
Prior art keywords
gene
value
expression
level
diabetes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021103461A
Other languages
English (en)
Inventor
哲矢 桑野
Tetsuya Kuwano
高良 井上
Takayoshi Inoue
裕也 上原
Yuya Uehara
直人 高田
Naoto Takada
真恵子 岩村
Maeko Iwamura
優衣 上田
Yui Ueda
恭子 志摩
Kyoko Shima
夏海 長森
Natsumi Nagamori
智史 堀
Satoshi Hori
路子 矢野
Michiko Yano
重之 中路
Shigeyuki Nakamichi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kao Corp
Hirosaki University NUC
Original Assignee
Kao Corp
Hirosaki University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kao Corp, Hirosaki University NUC filed Critical Kao Corp
Priority to JP2021103461A priority Critical patent/JP2023002298A/ja
Publication of JP2023002298A publication Critical patent/JP2023002298A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

【課題】糖尿病指標値を検出するための検出マーカー、及び当該検出マーカーを用いた糖尿病指標値の検出方法の提供。【解決手段】被験者から採取された生体試料について、31種の特定の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者の糖尿病指標値の検出方法。【選択図】なし

Description

本発明は、糖尿病指標値の検出マーカーを用いた糖尿病指標値の検出方法に関する。
糖尿病は、インスリン作用の不足による慢性高血糖を主徴とし、種々の特徴的な代謝異常を伴う疾患群である。糖尿病の検査指標には、血糖値(空腹時、経口糖負荷試験(OGTT)2時間、随時)、HbA1c値、グリコアルブミン値等がある。糖尿病の臨床診断においては、空腹時血糖値が126mg/dL以上、HbA1c値が6.5%以上であると糖尿病型に分類され、HbA1c値が5.5~6.5%未満は境界領域と言われる(非特許文献1)。
糖尿病の予防や治療には、継続的に血糖値等の糖尿病指標値を管理することが重要である。現在、自宅において血糖値を測定可能な自己測定器が市販されている。しかしながら、指先採血は痛みが伴い、測定のたびに精神的苦痛もかかる上、採血する際に感染症を引き起こす可能性がある。最近では、Freestyleリブレ(アボットジャパン)のような低侵襲的な血糖モニタリング機器が開発されているが、糖尿病患者向けの医療機器であり、未病領域の人が予防的に使用する類のものではない。そのため、非侵襲的に、痛み無く、糖尿病指標値を簡便に把握できる方法が望まれる。
近年、生体試料中のDNAやRNA等の核酸の解析によりヒトの生体内の現在さらには将来の生理状態を調べる技術が開発されている。生体由来の核酸は、血液等の体液、分泌物、組織等から抽出することができる。さらに最近、皮膚表上脂質(skin surface lipids;SSL)に含まれるRNAを生体の解析用の試料として利用可能であることが報告されている(特許文献1)。
国際公開公報第2018/008319号
糖尿病 (2012) 55(7): 485-504
本発明は、糖尿病指標値を検出するための検出マーカー、及び当該検出マーカーを用いた糖尿病指標値の検出方法を提供することに関する。
本発明者は、正常型、境界型、糖尿病型のいずれかに属する被験者からSSLを採取し、SSL中に含まれるRNAの発現状態をシーケンス情報として網羅的に解析した結果、特定の遺伝子の発現レベルが糖尿病指標値と有意に相関し、当該遺伝子の発現レベルに基づいて糖尿病指標値を検出できることを見出した。
すなわち、本発明は、以下の1)~3)に係るものである。
1)被験者から採取された生体試料について、下記表1に示す31種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者の糖尿病指標値の検出方法。
2)前記遺伝子又はそれに由来する核酸と特異的にハイブリダイズするオリゴヌクレオチド、又は前記遺伝子の発現産物を認識する抗体を含有する、1)の方法に用いられる糖尿病指標値を検出するための検査用キット。
3)下記表1に示す31種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる、糖尿病指標値を検出するための検出マーカー。
本発明によれば、簡便且つ非侵襲的に、糖尿病指標値を検出することが可能である。
本明細書中で引用された全ての特許文献、非特許文献、及びその他の刊行物は、その全体が本明細書中において参考として援用される。
本発明において、「核酸」又は「ポリヌクレオチド」と云う用語は、DNA又はRNAを意味する。DNAには、cDNA、ゲノムDNA、及び合成DNAのいずれもが含まれ、「RNA」には、total RNA、mRNA、rRNA、tRNA、non-coding RNA及び合成のRNAのいずれもが含まれる。
本発明において「遺伝子」とは、ヒトゲノムDNAを含む2本鎖DNAの他、cDNAを含む1本鎖DNA(正鎖)、当該正鎖と相補的な配列を有する1本鎖DNA(相補鎖)、及びこれらの断片を包含するものであって、DNAを構成する塩基の配列情報の中に、何らかの生物学的情報が含まれているものを意味する。
また、本発明における「遺伝子」には、特定の塩基配列で表される「遺伝子」だけではなく、その同族体(すなわち、ホモログもしくはオーソログ)、遺伝子多型等の変異体、及び誘導体が包含される。
ここで、本明細書中に開示される遺伝子の名称は、NCBI([www.ncbi.nlm.nih.gov/])に記載のあるOfficial Symbolに従う。
本発明において、遺伝子の「発現産物」とは、遺伝子の転写産物及び翻訳産物を包含する概念である。「転写産物」とは、遺伝子(DNA)から転写されて生じるRNAであり、「翻訳産物」とは、RNAに基づき翻訳合成される、遺伝子にコードされたタンパク質を意味する。
本発明において、「糖尿病指標値」とは、糖尿病の臨床診断に利用される検査指標を指す。例えば、空腹時血糖値、75g経口糖負荷試験(OGTT)2時間値、随時血糖値、血中HbA1c値、血中グリコアルブミン値、血中1,5-AG(1,5-アンヒドログルシトール)値等が挙げられる。
本発明において、糖尿病指標値の「検出」は、検査、測定、判定又は評価支援等の用語で言い換えることもできる。なお、本発明における糖尿病指標値積の「検出」、「検査」、「測定」、「判定」又は「評価」という用語は、医師による診断を含むものではない。
後述する実施例に示すように、糖尿病指標値として知られている、空腹時血糖値、血中HbA1c値又は血中グリコアルブミン値が正常型、境界型、糖尿病型のいずれかを示す被験者について、以下の手順1)~3)でRNA発現解析を行ったところ、下記表1に示す31種の遺伝子は、SSL中の発現が当該糖尿病指標値のいずれかと正に相関する遺伝子であることが見出された。
1)SSL由来RNAの発現量のデータ(リードカウント値)を取得する。
2)リードカウント値をサンプル被験者間の総リード数の違いを補正したRPM値に変換し、これに整数1を加算した底2の対数値(log2(RPM+1)値)と、糖尿病指標値に整数1を加算した自然対数値(ln(測定値+1)値))の組み合わせについてスピアマンの順位相関係数を求める。
3)スピアマンの順位相関係数(ρ)の大きな遺伝子(上位遺伝子)を抽出・選択する。
Figure 2023002298000001
上記表1に示す31種の遺伝子は、これまでに糖尿病との関連が報告されていない遺伝子である。
したがって、当該31種の遺伝子群より選択される遺伝子又はその発現産物は糖尿病指標値を検出するための検出マーカーとなり得る。また、当該31種の遺伝子群より選択される遺伝子又はその発現産物の発現レベルに基づいて、被験者の糖尿病指標値の検出が可能である。糖尿病指標値の検出により、糖尿病の病態(病期)を把握することができ、糖尿病の有無の検出や糖尿病発症リスクの検出、糖尿病予備軍、糖尿病患者への指導、治療等に役立てることができる。
当該31種の遺伝子は、それぞれ単独で糖尿病指標値を検出するための検出マーカーとなり得る。
本発明においては、精度向上の観点から、糖尿病指標値として空腹時血糖値を検出するにあたっては、PIM2、RPTN、EHBP1L1、CTDSP2、EFHD2、WBP1L、SNORA10、CYTH4、NCF1B、FLJ45445、ZFP36L1、HMHA1及びFAM25Bからなる13種の遺伝子群より選択される遺伝子又はその発現産物を、空腹時血糖値を検出するための検出マーカーとして用いることが好ましい。当該13種のうち、好ましくは2種以上、より好ましくは5種以上、更に好ましくは13種全てを用いる。また、当該13種のうち、好ましくはPIM2、RPTN、EHBP1L1、CTDSP2、EFHD2及びWBP1L、より好ましくはPIM2、RPTN及びEHBP1L1から選択される1種以上を用いる。
また、精度向上の観点から、糖尿病指標値として血中HbA1c値を検出するにあたっては、SNORA8、PIM2、GNB2、SNORA21、SNORA38、SNORA10、REXO1L2P、SNORA71D、SNORD17、ARHGAP9、SCARNA16、SNORA16A及びSNORA14Bからなる13種の遺伝子群より選択される遺伝子又はその発現産物を、血中HbA1c値を検出するための検出マーカーとして用いることが好ましい。当該13種のうち、好ましくは2種以上、より好ましくは5種以上、更に好ましくは13種全てを用いる。また、当該13種のうち、好ましくはSNORA8、PIM2、GNB2、SNORA21、SNORA38及びSNORA10、より好ましくはSNORA8、PIM2及びGNB2から選択される1種以上を用いる。
また、精度向上の観点から、糖尿病指標値として血中グリコアルブミン値を検出するにあたっては、SPRR3、SPDYE7P、SNORA38、SNORA9、SNORA81、MYO1F、KRT25、NCF1B、SNORD17及びECE1からなる10種の遺伝子群より選択される遺伝子又はその発現産物を、血中グリコアルブミン値を検出するための検出マーカーとして用いることが好ましい。当該10種のうち、好ましくは2種以上、より好ましくは5種以上、更に好ましくは10種全てを用いる。また、当該10種のうち、好ましくはSPRR3、SPDYE7P、SNORA38、SNORA9及びSNORA81、より好ましくはSPRR3、SPDYE7P及びSNORA38から選択される1種以上を用いる。
上記の糖尿病指標値を検出するための検出マーカーとなり得る遺伝子(以下、「標的遺伝子」とも称す)には、糖尿病指標値を検出するための検出マーカーとなり得る限り、当該遺伝子を構成するDNAの塩基配列と実質的に同一の塩基配列を有する遺伝子も包含される。ここで、実質的に同一の塩基配列とは、例えば、相同性計算アルゴリズムNCBI BLASTを用い、期待値=10;ギャップを許す;フィルタリング=ON;マッチスコア=1;ミスマッチスコア=-3の条件にて検索をした場合、当該遺伝子を構成するDNAの塩基配列と90%以上、好ましくは95%以上、より好ましく98%以上、さらに好ましくは99%以上の同一性があることを意味する。
本発明の糖尿病指標値の検出方法は、被験者から採取された生体試料について、標的遺伝子、一態様として、上記表1に示す31種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む。
本発明における被験者は、例えばヒト又は非ヒト哺乳動物であって、糖尿病指標値の検出を所望するか又は必要とする者が挙げられる。例えば、遺伝的に糖尿病リスクが高いと判断される者、糖尿病と判断される可能性がある者、具体的には空腹時血糖値が126mg/dL以上、血中HbA1c値が6.5%以上若しくは血中グリコアルブミン値が18.3%以上の少なくとも1つを満たす者、又は糖尿病リスクが高いと判断される可能性がある者、具体的には空腹時血糖値が110~126mg/dL未満、血中HbA1c値が5.6~6.5%未満若しくは血中グリコアルブミン値が15.6~18.3%未満の少なくとも1つを満たす者が挙げられる。被験者は、好ましくはヒトである。
本発明において用いられる生体試料としては、非侵襲的に採取可能で、本発明の遺伝子が発現変化する細胞、組織及び生体材料であればよい。具体的には皮膚、尿、唾液、汗、角層、皮膚表上脂質(SSL)、組織浸出液等の体液、その他、便、毛髪等が挙げられ、好ましくは皮膚又は皮膚表上脂質(SSL)、より好ましくは皮膚表上脂質(SSL)が挙げられる。
ここで、「皮膚表上脂質(SSL)」とは、皮膚の表上に存在する脂溶性画分をいい、皮脂と呼ばれることもある。一般に、SSLは、皮膚にある皮脂腺等の外分泌腺から分泌された分泌物を主に含み、皮膚表面を覆う薄い層の形で皮膚表上に存在している。SSLは、皮膚細胞で発現したRNAを含む。(前記特許文献1参照)。また本発明において、「皮膚」とは、特に限定しない限り、角層、表皮、真皮、毛包、ならびに汗腺、皮脂腺及びその他の腺等の組織を含む領域の総称である。
被験者の皮膚からのSSLの採取には、皮膚からのSSLの回収又は除去に用いられているあらゆる手段を採用することができる。好ましくは、後述するSSL吸収性素材、SSL接着性素材、又は皮膚からSSLをこすり落とす器具を使用することができる。SSL吸収性素材又はSSL接着性素材としては、SSLに親和性を有する素材であれば特に限定されず、例えばポリプロピレン、パルプ等が挙げられる。皮膚からのSSLの採取手順のより詳細な例としては、あぶら取り紙、あぶら取りフィルム等のシート状素材へSSLを吸収させる方法、ガラス板、テープ等へSSLを接着させる方法、スパーテル、スクレイパー等によりSSLをこすり落として回収する方法、等が挙げられる。SSLの吸着性を向上させるため、脂溶性の高い溶媒を予め含ませたSSL吸収性素材を用いてもよい。一方、SSL吸収性素材は、水溶性の高い溶媒や水分を含んでいるとSSLの吸着が阻害されるため、水溶性の高い溶媒や水分の含有量が少ないことが好ましい。SSL吸収性素材は、乾燥した状態で用いることが好ましい。
SSLが採取される皮膚の部位としては、特に限定されず、頭、顔、首、体幹、手足等の身体の任意の部位の皮膚が挙げられ、皮脂の分泌が多い部位、例えば顔の皮膚が好ましい。
被験者から採取されたRNA含有SSLは一定期間保存されてもよい。採取されたSSLは、含有するRNAの分解を極力抑えるために、採取後できるだけ速やかに低温条件で保存することが好ましい。本発明における該RNA含有SSLの保存の温度条件は、0℃以下であればよく、好ましくは-20±20℃~-80±20℃、より好ましくは-20±10℃~-80±10℃、さらに好ましくは-20±20℃~-40±20℃、さらに好ましくは-20±10℃~-40±10℃、さらに好ましくは-20±10℃、さらに好ましくは-20±5℃である。該RNA含有SSLの該低温条件での保存の期間は、特に限定されないが、好ましくは12か月以下、例えば6時間以上12ヶ月以下、より好ましくは6ヶ月以下、例えば1日間以上6ヶ月以下、さらに好ましくは3ヶ月以下、例えば3日間以上3ヶ月以下である。
本発明において、標的遺伝子又はその発現産物の発現レベルの測定対象としては、RNAから人工的に合成されたcDNA、そのRNAをエンコードするDNA、そのRNAにコードされるタンパク質、該タンパク質と相互作用をする分子、そのRNAと相互作用する分子、又はそのDNAと相互作用する分子等が挙げられる。ここで、RNA、DNA又はタンパク質と相互作用する分子としては、DNA、RNA、タンパク質、多糖、オリゴ糖、単糖、脂質、脂肪酸、及びこれらのリン酸化物、アルキル化物、糖付加物等、及び上記いずれかの複合体が挙げられる。また、発現レベルとは、当該遺伝子又は発現産物の発現量や活性を包括的に意味する。
本発明の方法においては、好ましい態様として、生体試料としてSSLが用いられるが、この場合にはSSLに含まれるRNAの発現レベルが解析され、具体的にはRNAを逆転写によりcDNAに変換した後、該cDNA又はその増幅産物が測定される。
SSLからのRNAの抽出には、生体試料からのRNAの抽出又は精製に通常使用される方法、例えば、フェノール/クロロホルム法、AGPC(acid guanidinium thiocyanate-phenol-chloroform extraction)法、又はTRIzol(登録商標)、RNeasy(登録商標)、QIAzol(登録商標)等のカラムを用いた方法、シリカをコーティングした特殊な磁性体粒子を用いる方法、Solid Phase Reversible Immobilization磁性体粒子を用いる方法、ISOGEN等の市販のRNA抽出試薬による抽出等を用いることができる。
該逆転写には、解析したい特定のRNAを標的としたプライマーを用いてもよいが、より包括的な核酸の保存及び解析のためにはランダムプライマーを用いることが好ましい。該逆転写には、一般的な逆転写酵素又は逆転写試薬キットを使用することができる。好適には、正確性及び効率性の高い逆転写酵素又は逆転写試薬キットが用いられ、その例としては、M-MLV Reverse Transcriptase及びその改変体、あるいは市販の逆転写酵素又は逆転写試薬キット、例えばPrimeScript(登録商標)Reverse Transcriptaseシリーズ(タカラバイオ社)、SuperScript(登録商標)Reverse Transcriptaseシリーズ(Thermo Scientific社)等が挙げられる。SuperScript(登録商標)III Reverse Transcriptase、SuperScript(登録商標)VILO cDNA Synthesis kit(いずれもThermo Scientific社)等が好ましく用いられる。
該逆転写における伸長反応は、温度を好ましくは42℃±1℃、より好ましくは42℃±0.5℃、さらに好ましくは42℃±0.25℃に調整し、一方、反応時間を好ましくは60分間以上、より好ましくは80~120分間に調整するのが好ましい。
発現レベルを測定する方法は、RNA、cDNA又はDNAを対象とする場合、これらにハイブリダイズするDNAをプライマーとしたPCR法、リアルタイムRT-PCR法、マルチプレックスPCR、SmartAmp法、LAMP法等に代表される核酸増幅法、これらにハイブリダイズする核酸をプローブとして用いるハイブリダイゼーション法(DNAチップ、DNAマイクロアレイ、ドットブロットハイブリダイゼーション、スロットブロットハイブリダイゼーション、ノーザンブロットハイブリダイゼーション等)、塩基配列を決定する方法(シーケンシング)、又はこれらを組み合わせた方法から選ぶことができる。
PCRでは、解析したい特定のDNAを標的としたプライマーペアを用いて該特定の1種のDNAのみを増幅してもよいが、複数のプライマーペアを用いて同時に複数の特定のDNAを増幅してもよい。好ましくは、該PCRはマルチプレックスPCRである。マルチプレックスPCRは、PCR反応系に複数のプライマー対を同時に使用することで、複数の遺伝子領域を同時に増幅する方法である。マルチプレックスPCRは、市販のキット(例えば、Ion AmpliSeqTranscriptome Human Gene Expression Kit;ライフテクノロジーズジャパン株式会社等)を用いて実施することができる。
該PCRにおけるアニーリング及び伸長反応の温度は、使用するプライマーに依存するため一概には言えないが、上記のマルチプレックスPCRキットは用いる場合、好ましくは62℃±1℃、より好ましくは62℃±0.5℃、さらに好ましくは62℃±0.25℃である。したがって、該PCRでは、好ましくはアニーリング及び伸長反応が1ステップで行われる。該アニーリング及び伸長反応のステップの時間は、増幅すべきDNAのサイズ等に依存して調整され得るが、好ましくは14~18分間である。該PCRにおける変性反応の条件は、増幅すべきDNAに依存して調整され得るが、好ましくは95~99℃で10~60秒間である。上記のような温度及び時間での逆転写及びPCRは、一般的にPCRに使用されるサーマルサイクラーを用いて実行することができる。
当該PCRで得られた反応産物の精製は、反応産物のサイズ分離によって行われることが好ましい。サイズ分離により、目的のPCR反応産物を、PCR反応液中に含まれるプライマーやその他の不純物から分離することができる。DNAのサイズ分離は、例えば、サイズ分離カラムや、サイズ分離チップ、サイズ分離に利用可能な磁気ビーズ等によって行うことができる。サイズ分離に利用可能な磁気ビーズの好ましい例としては、Ampure XP等のSolid Phase Reversible Immobilization(SPRI)磁性ビーズが挙げられる。
精製したPCR反応産物に対して、その後の定量解析を行うために必要なさらなる処理を施してもよい。例えば、DNAのシーケンシングのために、精製したPCR反応産物を、適切なバッファー溶液へと調製したり、PCR増幅されたDNAに含まれるPCRプライマー領域を切断したり、増幅されたDNAにアダプター配列をさらに付加したりしてもよい。例えば、精製したPCR反応産物をバッファー溶液へと調製し、増幅DNAに対してPCRプライマー配列の除去及びアダプターライゲーションを行い、得られた反応産物を、必要に応じて増幅して、定量解析のためのライブラリーを調製することができる。これらの操作は、例えば、SuperScript(登録商標)VILO cDNA Synthesis kit(ライフテクノロジーズジャパン株式会社)に付属している5×VILO RT Reaction Mix、及びIon AmpliSeq Transcriptome Human Gene Expression Kit(ライフテクノロジーズジャパン株式会社)に付属している5×Ion AmpliSeq HiFi Mix、及びIon AmpliSeq Transcriptome Human Gene Expression Core Panelを用いて、各キット付属のプロトコルに従って行うことができる。
ノーザンブロットハイブリダイゼーション法を利用して標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、まずプローブDNAを放射性同位元素、蛍光物質等で標識し、次いで、得られた標識DNAを、常法に従ってナイロンメンブレン等にトランスファーした生体試料由来のRNAとハイブリダイズさせる。その後、形成された標識DNAとRNAとの二重鎖を、標識物に由来するシグナルを検出することにより測定する方法が挙げられる。
RT-PCR法を用いて標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、まず生体試料由来のRNAから常法に従ってcDNAを調製し、これを鋳型として本発明の標的遺伝子が増幅できるように調製した一対のプライマー(上記cDNA(-鎖)に結合する正鎖、+鎖に結合する逆鎖)をこれとハイブリダイズさせる。その後、常法に従ってPCR法を行い、得られた増幅二本鎖DNAを検出する。増幅された二本鎖DNAの検出には、予めRI、蛍光物質等で標識しておいたプライマーを用いて上記PCRを行うことによって産生される標識二本鎖DNAを検出する方法等を用いることができる。
DNAマイクロアレイを用いて標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、支持体に本発明の標的遺伝子由来の核酸(cDNA又はDNA)の少なくとも1種を固定化したアレイを用い、mRNAから調製した標識化cDNA又はcRNAをマイクロアレイ上に結合させ、マイクロアレイ上の標識を検出することによって、mRNAの発現量を測定することができる。
前記アレイに固定化される核酸としては、ストリンジェントな条件下に特異的(すなわち、実質的に目的の核酸のみに)にハイブリダイズする核酸であればよく、例えば、本発明の標的遺伝子の全配列を有する核酸であってもよく、部分配列からなる核酸であってもよい。ここで、「部分配列」とは、少なくとも15~25塩基からなる核酸が挙げられる。ここでストリンジェントな条件は、通常「1×SSC、0.1%SDS、37℃」程度の洗浄条件を挙げることができ、より厳しいハイブリダイズ条件としては「0.5×SSC、0.1%SDS、42℃」程度、さらに厳しいハイブリダイズ条件としては「0.1×SSC、0.1%SDS、65℃」程度の条件を挙げることができる。ハイブリダイズ条件は、J. Sambrook et al., Molecular Cloning: A Laboratory Manual, Thrd Edition, Cold Spring Harbor Laboratory Press (2001)等に記載されている。
シーケンシングによって標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、次世代シーケンサー(例えばIon S5/XLシステム、ライフテクノロジーズジャパン株式会社)が用いて解析することが挙げられる。シーケンシングで作成されたリードの数(リードカウント)に基づいて、RNA発現を定量することができる。
上記の測定に用いられるプローブ又はプライマー、すなわち、本発明の標的遺伝子又はそれに由来する核酸を特異的に認識し増幅するためのプライマー、又は該RNA又はそれに由来する核酸を特異的に検出するためのプローブがこれに該当するが、これらは、当該標的遺伝子を構成する塩基配列に基づいて設計することができる。ここで「特異的に認識する」とは、例えばノーザンブロット法において、実質的に本発明の標的遺伝子又はそれに由来する核酸のみを検出できること、また例えばRT-PCR法において、実質的に当該核酸のみが増幅される如く、当該検出物又は生成物が当該遺伝子又はそれに由来する核酸であると判断できることを意味する。
具体的には、本発明の標的遺伝子を構成する塩基配列からなるDNA又はその相補鎖に相補的な一定数のヌクレオチドを含むオリゴヌクレオチドを利用することができる。ここで「相補鎖」とは、A:T(RNAの場合はU)、G:Cの塩基対からなる2本鎖DNAの一方の鎖に対する他方の鎖を指す。また、「相補的」とは、当該一定数の連続したヌクレオチド領域で完全に相補配列である場合に限られず、好ましくは80%以上、より好ましくは90%以上、さらに好ましくは95%以上の塩基配列上の同一性を有すればよい。
塩基配列の同一性は、前記BLAST等のアルゴリズムにより決定することができる。
斯かるオリゴヌクレオチドは、プライマーとして用いる場合には、特異的なアニーリング及び鎖伸長ができればよく、通常、例えば10塩基以上、好ましくは15塩基以上、より好ましくは20塩基以上、かつ例えば100塩基以下、好ましくは50塩基以下、より好ましくは35塩基以下の鎖長を有するものが挙げられる。また、プローブとして用いる場合には、特異的なハイブリダイゼーションができればよく、本発明の標的遺伝子を構成する塩基配列からなるDNA(又はその相補鎖)の少なくとも一部若しくは全部の配列を有し、例えば10塩基以上、好ましくは15塩基以上、かつ例えば100塩基以下、好ましくは50塩基以下、より好ましくは25塩基以下の鎖長のものが用いられる。
なお、ここで、「オリゴヌクレオチド」は、DNAあるいはRNAであることができ、合成されたものでも天然のものでもよい。又、ハイブリダイゼーションに用いるプローブは、通常標識したものが用いられる。
また、本発明の標的遺伝子の翻訳産物(タンパク質)、当該タンパク質と相互作用する分子、RNAと相互作用する分子、又はDNAと相互作用する分子を測定する場合は、プロテインチップ解析、免疫測定法(例えば、ELISA等)、質量分析(例えば、LC-MS/MS、MALDI-TOF/MS)、1-ハイブリッド法(PNAS 100, 12271-12276(2003))や2-ハイブリッド法(Biol. Reprod. 58, 302-311 (1998))のような方法を用いることができ、対象に応じて適宜選択できる。
例えば、測定対象としてタンパク質が用いられる場合は、本発明の発現産物を特異的に認識する抗体、具体的には発現産物であるタンパク質を他のタンパク質から識別することが可能な構造的特徴部位(エピトープ)を認識する抗体を生体試料と接触させ、当該抗体に結合した試料中のポリペプチド又はタンパク質を検出し、そのレベルを測定することによって実施される。例えば、ウェスタンブロット法によれば、一次抗体として上記の抗体を用いた後、二次抗体として放射性同位元素、蛍光物質又は酵素等で標識した一次抗体に結合する抗体を用いて、その一次抗体を標識し、これら標識物質由来のシグナルを放射線測定器、蛍光検出器等で測定することが行われる。
尚、上記翻訳産物に対する抗体は、ポリクローナル抗体であっても、モノクローナル抗体であってもよい。これらの抗体は、公知の方法に従って製造することができる。具体的には、ポリクローナル抗体は、常法に従って大腸菌等で発現し精製したタンパク質を用いて、あるいは常法に従って当該タンパク質の部分ポリペプチドを合成して、家兎等の非ヒト動物に免疫し、該免疫動物の血清から常法に従って得ることが可能である。
一方、モノクローナル抗体は、常法に従って大腸菌等で発現し精製したタンパク質又は該タンパク質の部分ポリペプチドをマウス等の非ヒト動物に免疫し、得られた脾臓細胞と骨髄腫細胞とを細胞融合させて調製したハイブリドーマ細胞から得ることができる。また、モノクローナル抗体は、ファージディスプレイを用いて作製してもよい(Griffiths, A.D.; Duncan, A.R., Current Opinion in Biotechnology, Volume 9, Number 1, February 1998 , pp. 102-108(7))。
斯くして、被験者から採取された生体試料中の本発明の標的遺伝子又はその発現産物の発現レベルが測定され、当該発現レベルに基づいて当該被験者の糖尿病指標値が検出される。
具体的には、予め十分な母数を有する任意の集団における本発明の標的遺伝子又はその発現産物の発現レベルを説明変数とし、該集団から得た糖尿病指標値を目的変数とする機械学習を行うことにより、該発現レベルから該糖尿病指標値を予測するための最適な予測モデルを構築する。次いで、構築された予測モデルに基づいて、糖尿病指標値を検出する対象である被験者における該標的遺伝子又はその発現産物の発現レベルから、該被験者の糖尿病指標値の予測値を算出することができる。
予測モデルの構築に用いられる集団としては、対象となる被験者の属性(性別、人種、年代等)が一致した集団であることが好ましい。
発現レベルとしては、上記したように、発現量のデータであるリードカウント値、当該リードカウント値をサンプル間の総リード数の違いを補正したRPM値、当該RPM値を底2の対数値に変換した値(Log2RPM値)又は整数1を加算した底2の対数値(log2(RPM+1)値)、あるいはDESeq2(Love MI et al. Genome Biol. 2014)を用いて補正されたカウント値(Normalized count値)又は整数1を加算した底2の対数値(log2(Normalized count+1)値)を指標として用いるのが好ましい。また、RNA-seqの定量値として一般的な、fragments per kilobase of exon per million reads mapped (FPKM)、reads per kilobase of exon per million reads mapped (RPKM)、transcripts per million (TPM)等によって算出される値であってもよい。また、マイクロアレイ法によって得られるシグナル値、及びその補正値であってもよい。また、RT-PCR等により特定の標的遺伝子のみの解析を行う場合には、対象遺伝子の発現量をハウスキーピング遺伝子の発現量を基準とする相対的な発現量に変換して解析する方法、又は標的遺伝子の領域を含むプラスミドを用いて絶対的なコピー数を定量(絶対定量)して解析する方法が好ましい。デジタルPCR法によって得られるコピー数であってもよい。
一方、糖尿病指標値としては、例えば実測値に整数1を加算した自然対数値(ln(測定値+1)値)を用いることができる。
また精度向上の観点から、予測モデルの構築において本発明の標的遺伝子又はその発現産物の発現レベルに加えて、年齢情報を説明変数に加えても良い。
予測モデルの構築に用いるアルゴリズムとしては、機械学習に用いるアルゴリズム等の公知のものを利用することができる。機械学習アルゴリズムの例としては、ランダムフォレスト(Random forest)、線形カーネルのサポートベクターマシン(SVM linear)、rbfカーネルのサポートベクターマシン(SVM rbf)、ニューラルネットワーク(Nerural net)、一般線形モデル(Generalized linear model)、正則化線形判別分析(Regularized linear discriminant analysis)、正則化ロジスティック回帰(Regularized logistic regression)、ラッソ(Least Absolute Shrinkage and Selection Operator)回帰等が挙げられる。構築した予測モデルに検証用のデータを入力して予測値を算出し、当該予測値が実測値と最も適合するモデル、例えば正解率(Accuracy)が最も大きいモデルを最適な予測モデルとして選抜することができる。また、予測値と実測値から検出率(Recall)、精度(Precision)、及びそれらの調和平均であるF値を計算し、そのF値が最も大きいモデルを最適な予測モデルとして選抜することができる。また、予測値と実測値の二乗平均平方根誤差(RMSE)を予測モデルの精度評価指標として用い、そのRMSEの最も小さいモデルを最適な予測モデルとして選抜することができる。
また本発明では、標的遺伝子又はその発現産物の発現レベルを、予め設定した基準値と比較することによって、被験者の糖尿病の有無の検出や糖尿病発症リスクの検出等を行うことができる。具体的には、標的遺伝子又はその発現産物の発現レベルを、予め設定した基準値と比較することによって行われる。
ここで、「基準値」は、糖尿病指標値と、本発明の標的遺伝子又はその発現産物の発現レベルの関係に基づき、予め決定することができる。例えば、ある集団を、糖尿病指標値、例えば、空腹時血糖値、血中HbA1c値又は血中グリコアルブミン値に基づいて糖尿病型(空腹時血糖値:126mg/dL以上、血中HbA1c値:6.5%以上、血中グリコアルブミン値:18.3%以上)、境界型(空腹時血糖値:110~126mg/dL未満、血中HbA1c値:5.6~6.5%未満、血中グリコアルブミン値:15.6~18.3%未満)、正常型(空腹時血糖値:110mg/dL未満、血中HbA1c値:5.6%未満、血中グリコアルブミン値:15.6%未満)の群に分ける。そして、それぞれの群における当該標的遺伝子又はその発現産物の発現レベルの平均値や標準偏差等の統計値を参考に決定した値を、それぞれの群への属否を判別する基準値として決定することができる。
標的遺伝子として複数種の遺伝子を用いる場合は、それぞれ各々の遺伝子又はその発現産物について基準値を求めることが好ましい。
集団としては、対象となる被験者の属性(性別、人種、年代等)が一致した集団であることが好ましい。
基準値の決定方法は特に制限されず、公知の手法に従って決定することができる。例えば、判別式(予測モデル)を使用して作成されたROC(Receiver Operating Characteristic Curve)曲線より求めることができる。ROC曲線では、縦軸に陽性患者において陽性の結果がでる確率(感度)と、横軸に陰性患者において陰性の結果がでる確率(特異度)を1から減算した値(偽陽性率)がプロットされる。ROC曲線に示される「真陽性(感度)」及び「偽陽性(1-特異度)」に関し、「真陽性(感度)」-「偽陽性(1-特異度)」が最大となる値(Youden index)を基準値とすることができる。
本発明の糖尿病指標値を検出するための検査用キットは、患者から分離した生体試料における本発明の標的遺伝子又はその発現産物の発現レベルを測定するための検査試薬を含有するものである。具体的には、本発明の標的遺伝子又はそれに由来する核酸と特異的に結合(ハイブリダイズ)するオリゴヌクレオチド(例えば、PCR用のプライマー)を含む、核酸増幅、ハイブリダイゼーションのための試薬、或いは、本発明の標的遺伝子の発現産物(タンパク質)を認識する抗体を含む免疫学的測定のための試薬等が挙げられる。当該キットに包含されるオリゴヌクレオチド、抗体等は、上述したとおり公知の方法により得ることができる。
また、当該検査用キットには、上記抗体や核酸の他、標識試薬、緩衝液、発色基質、二次抗体、ブロッキング剤や、試験に必要な器具やポジティブコントロールやネガティブコントロールとして使用するコントロール試薬、生体試料を採取するための用具(例えば、SSLを採取するためのあぶら取りフィルム等)等を含むことができる。
上述した実施形態に関し、本発明は以下の態様をさらに開示する。
<1>被験者から採取された生体試料について、上記表1に示す31種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者の糖尿病指標値の検出方法。
<2>前記遺伝子が、PIM2、RPTN、EHBP1L1、CTDSP2、EFHD2、WBP1L、SNORA10、CYTH4、NCF1B、FLJ45445、ZFP36L1、HMHA1及びFAM25Bからなる13種の遺伝子群より選択される遺伝子であり、前記糖尿病指標値が空腹時血糖値である<1>記載の検出方法。
<3>前記13種のうち、好ましくは2種以上、より好ましくは5種以上、更に好ましくは13種全ての遺伝子又はその発現産物の発現レベルが測定される<2>記載の検出方法。
<4>前記13種のうち、好ましくはPIM2、RPTN、EHBP1L1、CTDSP2、EFHD2及びWBP1L、より好ましくはPIM2、RPTN及びEHBP1L1から選択される1種以上の遺伝子又はその発現産物の発現レベルが測定される<2>記載の検出方法。
<5>前記遺伝子が、SNORA8、PIM2、GNB2、SNORA21、SNORA38、SNORA10、REXO1L2P、SNORA71D、SNORD17、ARHGAP9、SCARNA16、SNORA16A及びSNORA14Bからなる13種の遺伝子群より選択される遺伝子であり、前記糖尿病指標値が血中HbA1c値である<1>記載の検出方法。
<6>前記13種のうち、好ましくは2種以上、より好ましくは5種以上、更に好ましくは13種全ての遺伝子又はその発現産物の発現レベルが測定される<5>記載の検出方法。
<7>前記13種のうち、好ましくはSNORA8、PIM2、GNB2、SNORA21、SNORA38及びSNORA10、より好ましくはSNORA8、PIM2及びGNB2から選択される1種以上の遺伝子又はその発現産物の発現レベルが測定される<5>記載の検出方法。
<8>前記遺伝子が、SPRR3、SPDYE7P、SNORA38、SNORA9、SNORA81、MYO1F、KRT25、NCF1B、SNORD17及びECE1からなる10種の遺伝子群より選択される遺伝子であり、前記糖尿病指標値が血中グリコアルブミン値である<1>記載の検出方法。
<9>前記10種のうち、好ましくは2種以上、より好ましくは5種以上、更に好ましくは10種全ての遺伝子又はその発現産物の発現レベルが測定される<8>記載の検出方法。
<10>前記10種のうち、好ましくはSPRR3、SPDYE7P、SNORA38、SNORA9及びSNORA81、より好ましくはSPRR3、SPDYE7P及びSNORA38から選択される1種以上の遺伝子又はその発現産物の発現レベルが測定される<8>記載の検出方法。
<11>前記遺伝子又はその発現産物の発現レベルの測定対象が、好ましくはRNAから人工的に合成されたcDNA、そのRNAをエンコードするDNA、そのRNAにコードされるタンパク質、該タンパク質と相互作用をする分子、そのRNAと相互作用する分子、又はそのDNAと相互作用する分子である<1>~<10>のいずれかに記載の検出方法。
<12>前記遺伝子又はその発現産物の発現レベルが、好ましくはmRNAの発現量である<1>~<11>のいずれかに記載の検出方法。
<13>前記生体試料が、被験者の好ましくは皮膚、尿、唾液、汗、角層、皮膚表上脂質(SSL)、組織浸出液等の体液、便又は毛髪であり、より好ましくは皮膚又は皮膚表上脂質(SSL)であり、更に好ましくは皮膚表上脂質(SSL)である<1>~<12>のいずれかに記載の検出方法。
<14>前記遺伝子又はその発現産物の発現レベルに基づいて前記被験者の糖尿病指標値を検出することを含む<1>~<13>のいずれかに記載の検出方法。
<15>好ましくは、前記遺伝子又はその発現産物の発現レベルに基づく予測モデルを用いて糖尿病指標値を検出することを含み、
前記予測モデルが、前記遺伝子又はその発現産物の発現レベルの測定値、又は当該発現レベルの測定値及び被験者の年齢を説明変数とし、糖尿病指標値を目的変数として構築される<1>~<14>のいずれかに記載の検出方法。
<16>前記遺伝子又はそれに由来する核酸と特異的にハイブリダイズするオリゴヌクレオチド、又は前記遺伝子の発現産物を認識する抗体を含有する、<1>~<15>のいずれかに記載の検出方法に用いられる糖尿病指標値を検出するための検査用キット。
<17>前記表1に示す31種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる、糖尿病指標値を検出するための検出マーカー。
<18>前記遺伝子が、PIM2、RPTN、EHBP1L1、CTDSP2、EFHD2、WBP1L、SNORA10、CYTH4、NCF1B、FLJ45445、ZFP36L1、HMHA1及びFAM25Bからなる13種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物であって、糖尿病指標値が空腹時血糖値である、<17>記載の検出マーカー。
<19>前記遺伝子が、SNORA8、PIM2、GNB2、SNORA21、SNORA38、SNORA10、REXO1L2P、SNORA71D、SNORD17、ARHGAP9、SCARNA16、SNORA16A及びSNORA14Bからなる13種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物であって、糖尿病指標値が血中HbA1c値である、<17>記載の検出マーカー。
<20>前記遺伝子が、SPRR3、SPDYE7P、SNORA38、SNORA9、SNORA81、MYO1F、KRT25、NCF1B、SNORD17及びECE1からなる10種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物であって、糖尿病指標値が血中グリコアルブミン値である、<17>記載の検出マーカー。
実施例1 SSLから抽出されたRNAを用いた糖尿病指標値の検出(1)
1)被験者及び空腹時血糖値の測定
20~80歳代女性376名を被験者として試験を行った。被験者は試験会場に来る当日の朝食摂取を禁止とし、来場後、医師の監督のもと看護師が定法に従って血液を採取した。本血液を用いて、空腹時血糖値を測定した。その結果、この集団の空腹時血糖値の平均値±標準偏差は93.7±15.4mg/dL、中央値は91mg/dLであった。
2)SSL採取
各被験者の全顔からあぶら取りフィルム(5×8cm、ポリプロピレン製、3M社)を用いて皮脂を回収後、該あぶら取りフィルムをバイアルに移し、RNA抽出に使用するまで-80℃にて保存した。
3)RNA調製及びシーケンシング
上記2)のあぶら取りフィルムを適当な大きさに切断し、QIAzol Lysis Reagent(Qiagen)を用いて、付属のプロトコルに準じてRNAを抽出した。抽出されたRNAを元に、SuperScript VILO cDNA Synthesis kit(ライフテクノロジーズジャパン株式会社)を用いて42℃、90分間逆転写を行いcDNAの合成を行った。逆転写反応のプライマーには、キットに付属しているランダムプライマーを使用した。得られたcDNAから、マルチプレックスPCRにより20802遺伝子に由来するDNAを含むライブラリーを調製した。マルチプレックスPCRは、Ion AmpliSeqTranscriptome Human Gene Expression Kit(ライフテクノロジーズジャパン株式会社)を用いて、[99℃、2分→(99℃、15秒→62℃、16分)×20サイクル→4℃、Hold]の条件で行った。得られたPCR産物は、Ampure XP(ベックマン・コールター株式会社)で精製した後に、バッファーの再構成、プライマー配列の消化、アダプターライゲーションと精製、増幅を行い、ライブラリーを調製した。調製したライブラリーをIon 540 Chipにローディングし、Ion S5/XLシステム(ライフテクノロジーズジャパン株式会社)を用いてシーケンシングした。
4)データ解析
(1)使用データ
上記3)で測定したSSL由来RNAの発現量のデータ(リードカウント値)を取得し、サンプル被験者間の総リード数の違いを補正したRPM値に変換した。機械学習モデルの構築には、負の二項分布に従うRPM値を正規分布に近似するため、RPM値に整数1を加算した底2の対数値(log2(RPM+1)値)を用いた。なお、全サンプル被験者の発現量データのうち90%以上のサンプル被験者で欠損値ではない発現量データが得られている2227遺伝子のみ以下の解析に使用した。
また、空腹時血糖値を正規分布に近似するため、上記の測定値に整数1を加算した自然対数値(ln(測定値+1)値)を用いた。
(2)データセット分割
被験者376名のデータセットのうち、304名のRNAプロファイルデータをモデル構築の訓練データとし、残り72名分のRNAプロファイルデータをモデル精度評価に使用するテストデータとした。
(3)特徴量遺伝子の選択
304名分の空腹時血糖値(ln(測定値+1)値)と、全ての遺伝子RNA発現データ(log2(RPM+1)値)の組み合わせについてスピアマンの順位相関係数を求めた。
その結果、スピアマンの順位相関係数(ρ)の大きな遺伝子を抽出し、表2に示す13遺伝子を選択した。これら13遺伝子はいずれもこれまで空腹時血糖値との関連が報告されていない遺伝子である。
Figure 2023002298000002
(4)モデル構築
(a)特徴量遺伝子による予測
訓練データである、SSL由来RNAから選択された前記特徴量遺伝子の発現量のデータ(log2(RPM+1)値)を説明変数とし、空腹時血糖値(ln(測定値+1)値)を目的変数として用い、予測モデルの構築を実施した。予測モデルは、一般線形モデル(Generalized linear model)、ニューラルネットワーク(Nerural net)、ラッソ回帰(Lasso)、ランダムフォレスト(Random forest)、線形カーネルのサポートベクターマシン(SVM linear)、rbfカーネルのサポートベクターマシン(SVM rbf)の6種のアルゴリズムを用いて、10分割交差検証を行って学習させた。各アルゴリズムについて、学習後のモデルに訓練データを入力し、二乗平均平方根誤差(RMSE)を求め、RMSEの最も小さいモデルを採用した。
前記選択したモデルに、テストデータの特徴量遺伝子発現量(log2(RPM+1)値)を入力して、空腹時血糖値(ln(測定値+1)値)の予測値を計算した。最後に、予測値と実測値からスピアマンの順位相関係数を求めた。
(b)特徴量遺伝子+年齢による予測
訓練データである、SSL由来RNAから選択された前記特徴量遺伝子の発現量のデータ(log2(RPM+1)値)及び被験者年齢を説明変数とし、空腹時血糖値(ln(測定値+1)値)を目的変数として用い、予測モデルの構築を実施した。その後は上記(a)と同様の方法で予測モデルの構築を行い、最後に、予測値と実測値からスピアマンの順位相関係数を求めた。
5)結果
特徴量遺伝子13種を用いた予測モデル(ランダムフォレスト)において、テストデータで順位相関係数は0.418(p<0.001)となり、空腹時血糖値の予測が可能であることが示された。特徴量遺伝子13種及び年齢を用いた予測モデル(ラッソ回帰)場合には、0.607(p<0.001)となり予測精度の向上が認められた。
実施例2 SSLから抽出されたRNAを用いた糖尿病指標値の検出(2)
1)被験者及び血中HbA1c値の測定
被験者は実施例1と同一で、実施例1で採取した血液を用いて、血中HbA1c値を測定した。その結果、この集団の血中HbA1c値の平均値±標準偏差は5.7±0.5%、中央値は5.6%であった。
2)SSL採取、3)RNA調製及びシーケンシング
実施例1と同様に実施した。
4)データ解析
(1)使用データ
上記3)で測定したSSL由来RNAの発現量のデータ(リードカウント値)を取得し、サンプル被験者間の総リード数の違いを補正したRPM値に変換した。機械学習モデルの構築には、負の二項分布に従うRPM値を正規分布に近似するため、RPM値に整数1を加算した底2の対数値(log2(RPM+1)値)を用いた。なお、全サンプル被験者の発現量データのうち90%以上のサンプル被験者で欠損値ではない発現量データが得られている2227遺伝子のみ以下の解析に使用した。
また、血中HbA1c値を正規分布に近似するため、上記の測定値に整数1を加算した自然対数値(ln(測定値+1)値)を用いた。
(2)データセット分割
被験者376名のデータセットのうち、304名のRNAプロファイルデータをモデル構築の訓練データとし、残り72名分のRNAプロファイルデータをモデル精度評価に使用するテストデータとした。
(3)特徴量遺伝子の選択
304名分の血中HbA1c値(ln(測定値+1)値)と、全ての遺伝子RNA発現データ(log2(RPM+1)値)の組み合わせについてスピアマンの順位相関係数を求めた。
その結果、スピアマンの順位相関係数(ρ)の大きな遺伝子を抽出し、表3に示す13遺伝子を選択した。これら13遺伝子はいずれもこれまで血中HbA1c値との関連が報告されていない遺伝子である。
Figure 2023002298000003
(4)モデル構築
(a)特徴量遺伝子による予測
訓練データである、SSL由来RNAから選択された前記特徴量遺伝子の発現量のデータ(log2(RPM+1)値)を説明変数とし、血中HbA1c値(ln(測定値+1)値)を目的変数として用い、予測モデルの構築を実施した。予測モデルは、一般線形モデル(Generalized linear model)、ニューラルネットワーク(Nerural net)、ラッソ回帰(Lasso)、ランダムフォレスト(Random forest)、線形カーネルのサポートベクターマシン(SVM linear)、rbfカーネルのサポートベクターマシン(SVM rbf)の6種のアルゴリズムを用いて、10分割交差検証を行って学習させた。各アルゴリズムについて、学習後のモデルに訓練データを入力し、二乗平均平方根誤差(RMSE)を求め、RMSEの最も小さいモデルを採用した。
前記選択したモデルに、テストデータの特徴量遺伝子発現量(log2(RPM+1)値)を入力して、血中HbA1c値(ln(測定値+1)値)の予測値を計算した。最後に、予測値と実測値からスピアマンの順位相関係数を求めた。
(b)特徴量遺伝子+年齢による予測
訓練データである、SSL由来RNAから選択された前記特徴量遺伝子の発現量のデータ(log2(RPM+1)値)及び被験者年齢を説明変数とし、血中HbA1c値(ln(測定値+1)値)を目的変数として用い、予測モデルの構築を実施した。その後は上記(a)と同様の方法で予測モデルの構築を行い、最後に、予測値と実測値からスピアマンの順位相関係数を求めた。
5)結果
特徴量遺伝子13種を用いた予測モデル(rbfカーネルのサポートベクターマシン)において、テストデータで順位相関係数は0.267(p<0.05)となり、血中HbA1c値の予測が可能であることが示された。特徴量遺伝子13種及び年齢を用いた予測モデル(ラッソ回帰)の場合には、0.45(p<0.001)となり予測精度の向上が認められた。
実施例3 SSLから抽出されたRNAを用いた糖尿病指標値の検出(3)
1)被験者及び血中グリコアルブミン値の測定
被験者は実施例1と同一で、実施例1で採取した血液を用いて、血中グリコアルブミン値を測定した。その結果、この集団の血中グリコアルブミン値の平均値±標準偏差は14.6±1.7%、中央値は14.5%であった。
2)SSL採取、3)RNA調製及びシーケンシング
実施例1と同様に実施した。
4)データ解析
(1)使用データ
上記3)で測定したSSL由来RNAの発現量のデータ(リードカウント値)を取得し、サンプル被験者間の総リード数の違いを補正したRPM値に変換した。機械学習モデルの構築には、負の二項分布に従うRPM値を正規分布に近似するため、RPM値に整数1を加算した底2の対数値(log2(RPM+1)値)を用いた。なお、全サンプル被験者の発現量データのうち90%以上のサンプル被験者で欠損値ではない発現量データが得られている2227遺伝子のみ以下の解析に使用した。
また、血中グリコアルブミン値を正規分布に近似するため、上記の測定値に整数1を加算した自然対数値(ln(測定値+1)値)を用いた。
(2)データセット分割
被験者376名のデータセットのうち、304名のRNAプロファイルデータをモデル構築の訓練データとし、残り72名分のRNAプロファイルデータをモデル精度評価に使用するテストデータとした。
(3)特徴量遺伝子の選択
304名分の血中グリコアルブミン値(ln(測定値+1)値)と、全ての遺伝子RNA発現データ(log2(RPM+1)値)の組み合わせについてスピアマンの順位相関係数を求めた。
その結果、スピアマンの順位相関係数(ρ)の大きな遺伝子を抽出し、表4に示す10遺伝子を選択した。これら10遺伝子はいずれもこれまで血中グリコアルブミン値との関連が報告されていない遺伝子である。
Figure 2023002298000004
(4)モデル構築
(a)特徴量遺伝子による予測
訓練データである、SSL由来RNAから選択された前記特徴量遺伝子の発現量のデータ(log2(RPM+1)値)を説明変数とし、血中グリコアルブミン値(ln(測定値+1)値)を目的変数として用い、予測モデルの構築を実施した。予測モデルは、一般線形モデル(Generalized linear model)、ニューラルネットワーク(Nerural net)、ラッソ回帰(Lasso)、ランダムフォレスト(Random forest)、線形カーネルのサポートベクターマシン(SVM linear)、rbfカーネルのサポートベクターマシン(SVM rbf)の6種のアルゴリズムを用いて、10分割交差検証を行って学習させた。各アルゴリズムについて、学習後のモデルに訓練データを入力し、二乗平均平方根誤差(RMSE)を求め、RMSEの最も小さいモデルを採用した。
前記選択したモデルに、テストデータの特徴量遺伝子発現量(log2(RPM+1)値)を入力して、血中グリコアルブミン値(ln(測定値+1)値)の予測値を計算した。最後に、予測値と実測値からスピアマンの順位相関係数を求めた。
5)結果
特徴量遺伝子10種を用いた予測モデル(線形カーネルのサポートベクターマシン)において、テストデータで順位相関係数は0.345(p<0.01)となり、血中グリコアルブミン値の予測が可能であることが示された。

Claims (13)

  1. 被験者から採取された生体試料について、下記表1に示す31種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者の糖尿病指標値の検出方法。
    Figure 2023002298000005
  2. 前記遺伝子又はその発現産物の発現レベルがmRNAの発現量である請求項1記載の検出方法。
  3. 前記生体試料が被験者の皮膚表上脂質である請求項1又は2記載の検出方法。
  4. 前記遺伝子又はその発現産物の発現レベルに基づいて前記被験者の糖尿病指標値を検出することを含む請求項1~3のいずれか1項記載の検出方法。
  5. 前記遺伝子又はその発現産物の発現レベルに基づく予測モデルを用いて糖尿病指標値を検出することを含み、
    前記予測モデルが、前記遺伝子又はその発現産物の発現レベルの測定値、又は当該発現レベルの測定値及び被験者の年齢を説明変数とし、糖尿病指標値を目的変数として構築される請求項1~4のいずれか1項記載の検出方法。
  6. 前記遺伝子が、PIM2、RPTN、EHBP1L1、CTDSP2、EFHD2、WBP1L、SNORA10、CYTH4、NCF1B、FLJ45445、ZFP36L1、HMHA1及びFAM25Bからなる13種の遺伝子群より選択される遺伝子であり、前記糖尿病指標値が空腹時血糖値である請求項1~5のいずれか1項記載の検出方法。
  7. 前記遺伝子が、SNORA8、PIM2、GNB2、SNORA21、SNORA38、SNORA10、REXO1L2P、SNORA71D、SNORD17、ARHGAP9、SCARNA16、SNORA16A及びSNORA14Bからなる13種の遺伝子群より選択される遺伝子であり、前記糖尿病指標値が血中HbA1c値である請求項1~5のいずれか1項記載の検出方法。
  8. 前記遺伝子が、SPRR3、SPDYE7P、SNORA38、SNORA9、SNORA81、MYO1F、KRT25、NCF1B、SNORD17及びECE1からなる10種の遺伝子群より選択される遺伝子であり、前記糖尿病指標値が血中グリコアルブミン値である請求項1~5のいずれか1項記載の検出方法。
  9. 前記遺伝子又はそれに由来する核酸と特異的にハイブリダイズするオリゴヌクレオチド、又は前記遺伝子の発現産物を認識する抗体を含有する、請求項1~8のいずれか1項記載の検出方法に用いられる糖尿病指標値を検出するための検査用キット。
  10. 前記表1に示す31種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる、糖尿病指標値を検出するための検出マーカー。
  11. 前記遺伝子が、PIM2、RPTN、EHBP1L1、CTDSP2、EFHD2、WBP1L、SNORA10、CYTH4、NCF1B、FLJ45445、ZFP36L1、HMHA1及びFAM25Bからなる13種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物であって、糖尿病指標値が空腹時血糖値である、請求項10記載の検出マーカー。
  12. 前記遺伝子が、SNORA8、PIM2、GNB2、SNORA21、SNORA38、SNORA10、REXO1L2P、SNORA71D、SNORD17、ARHGAP9、SCARNA16、SNORA16A及びSNORA14Bからなる13種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物であって、糖尿病指標値が血中HbA1c値である、請求項10記載の検出マーカー。
  13. 前記遺伝子が、SPRR3、SPDYE7P、SNORA38、SNORA9、SNORA81、MYO1F、KRT25、NCF1B、SNORD17及びECE1からなる10種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物であって、糖尿病指標値が血中グリコアルブミン値である、請求項10記載の検出マーカー。
JP2021103461A 2021-06-22 2021-06-22 糖尿病指標値の検出方法 Pending JP2023002298A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021103461A JP2023002298A (ja) 2021-06-22 2021-06-22 糖尿病指標値の検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021103461A JP2023002298A (ja) 2021-06-22 2021-06-22 糖尿病指標値の検出方法

Publications (1)

Publication Number Publication Date
JP2023002298A true JP2023002298A (ja) 2023-01-10

Family

ID=84797957

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021103461A Pending JP2023002298A (ja) 2021-06-22 2021-06-22 糖尿病指標値の検出方法

Country Status (1)

Country Link
JP (1) JP2023002298A (ja)

Similar Documents

Publication Publication Date Title
EP2494065B1 (en) Means and methods for non-invasive diagnosis of chromosomal aneuploidy
US20060099593A1 (en) Method of diagnosing integration dysfunction syndrome using blood
JP2023157965A (ja) アトピー性皮膚炎の検出方法
WO2021230379A1 (ja) パーキンソン病の検出方法
JP2023002298A (ja) 糖尿病指標値の検出方法
WO2022220299A1 (ja) 乳幼児顔湿疹の症度の検出方法
WO2022220298A1 (ja) 乳幼児おむつ皮膚炎の症度の検出方法
JP2023002299A (ja) 内臓脂肪面積の検出方法
JP2023073135A (ja) 更年期障害の重症度の検出方法
JP2023073134A (ja) ホットフラッシュの検出方法
JP2023045067A (ja) 不眠の検出方法
JP2023048810A (ja) 慢性ストレスレベルの検出方法
JP2022134126A (ja) アトピー性皮膚炎の症度悪化の検出方法
JP2022134127A (ja) アトピー性皮膚炎による皮膚痒みの症度悪化の検出方法
JP2022016416A (ja) アトピー性皮膚炎の重症度の検出方法
JP2023048811A (ja) 疲労の検出方法
JP2024045047A (ja) 肥満改善剤の有効性予測方法
JP2021175382A (ja) 乳幼児アトピー性皮膚炎の検出方法
JP2023069499A (ja) 乾燥による皮膚表面形状悪化の検出方法
JP2024075099A (ja) アンモニア代謝能力の検出方法
Dwyer et al. Myocardial gene expression associated with genetic cardiac hypertrophy in the absence of hypertension
JP2024045048A (ja) 肥満改善剤の有効性予測方法
EP4253547A1 (en) Method for detecting severity of atopic dermatitis
WO2022114201A1 (ja) アトピー性皮膚炎の症度変化の検出方法
EP2818546B1 (en) Method for determining rheumatoid arthritis activity indicator, and biomarker used therein

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240328