JP2023073135A - 更年期障害の重症度の検出方法 - Google Patents

更年期障害の重症度の検出方法 Download PDF

Info

Publication number
JP2023073135A
JP2023073135A JP2021185983A JP2021185983A JP2023073135A JP 2023073135 A JP2023073135 A JP 2023073135A JP 2021185983 A JP2021185983 A JP 2021185983A JP 2021185983 A JP2021185983 A JP 2021185983A JP 2023073135 A JP2023073135 A JP 2023073135A
Authority
JP
Japan
Prior art keywords
gene
expression
genes
severity
expression level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021185983A
Other languages
English (en)
Inventor
智史 堀
Satoshi Hori
真由美 大塚
Mayumi Otsuka
征輝 山本
Masateru Yamamoto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kao Corp
Original Assignee
Kao Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kao Corp filed Critical Kao Corp
Priority to JP2021185983A priority Critical patent/JP2023073135A/ja
Publication of JP2023073135A publication Critical patent/JP2023073135A/ja
Pending legal-status Critical Current

Links

Abstract

【課題】更年期障害の重症度を検出するためのマーカー、及び当該マーカーを用いた更年期障害の重症度の検出方法の提供。【解決手段】被験者から採取された生体試料について、16種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者における更年期障害の重症度を検出する方法。【選択図】なし

Description

本発明は、更年期障害の重症度を検出するためのマーカーを用いた更年期障害の重症度の検出方法に関する。
更年期障害とは、閉経前後10年間の更年期において、主に性ホルモン分泌量の低下が原因となる様々な身体的、精神的な症状が重く、日常生活に支障を来す状態のことをいう。更年期の身体的症状としては、顔等のほてり、のぼせ、動悸、息切れ、異常な発汗、耳鳴り、頭痛やめまい等がある。精神的な症状としては、イライラや不安感、うつ、不眠等がある。
更年期障害の検査・診断方法として、血中のホルモン濃度を調べる血液検査がある。しかしながら、血中のホルモン濃度を指標とする検査法は採血を必要とするため、侵襲的な方法である。また、更年期障害の程度は本人からの申告が重要であるが、申告基準は個々人で異なることから早期かつ適切な対処や治療のタイミングを逃してしまう可能性を秘めている。そのため、簡便に更年期障害の程度を判定できる技術は早期からの症状緩和をサポートする技術になると考えられる。
一方、生体試料中のDNAやRNA等の核酸の解析によりヒトの生体内の現在、さらには将来の生理状態を調べる技術が開発されている。生体由来の核酸は、血液等の体液、分泌物、組織等から抽出することができる。特許文献1には、皮膚表上脂質(skin surface lipids;SSL)に含まれるRNA等の核酸を分離し、生体の解析用の試料として用いることが記載されている。
国際公開公報第2018/008319号
本発明は、更年期障害の重症度を検出するためのマーカー、及び当該マーカーを用いた更年期障害の重症度の検出方法を提供することに関する。
本発明者は、更年期障害の重症度が異なる被験者群の全顔からSSLを採取し、SSL中に含まれるRNAの発現状態をシーケンス情報として網羅的に解析した結果、特定の遺伝子の発現レベルが両群間で有意に異なり、これを指標として更年期障害の重症度を検出できることを見出した。
すなわち、本発明は、以下の1)~4)に係るものである。
1)被験者から採取された生体試料について、下記表1に示す16種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者における更年期障害の重症度を検出する方法。
2)更年期障害に対する予防又は治療的介入の存在下、被験者から採取された生体試料について、下記表1に示す16種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定することを含む、当該介入効果の評価方法。
3)生体試料の採取及び保存に必要な用具及び試薬、並びに生体試料から前記遺伝子又はその発現産物の発現レベルを測定するための試薬を含有する、1)の方法に用いられる更年期障害の重症度を検出するための検査用キット又は2)の方法に用いられる介入効果の評価用キット。
4)下記表5に示す178種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる、更年期障害の重症度を検出するためのマーカー。
本発明によれば、簡便且つ非侵襲的に、更年期障害の重症度を検出することが可能である。これにより、個々人の主観に因らずに更年期障害の程度を客観的指標に基づいて把握できるため、当該更年期障害に対する適切な対策を講じることができる。
本明細書中で引用された全ての特許文献、非特許文献、及びその他の刊行物は、その全体が本明細書中において参考として援用される。
本発明において、「核酸」又は「ポリヌクレオチド」と云う用語は、DNA又はRNAを意味する。DNAには、cDNA、ゲノムDNA、及び合成DNAのいずれもが含まれ、「RNA」には、total RNA、mRNA、rRNA、tRNA、non-coding RNA及び合成のRNAのいずれもが含まれる。
本発明において「遺伝子」とは、ヒトゲノムDNAを含む2本鎖DNAの他、cDNAを含む1本鎖DNA(正鎖)、当該正鎖と相補的な配列を有する1本鎖DNA(相補鎖)、及びこれらの断片を包含するものであって、DNAを構成する塩基の配列情報の中に、何らかの生物学的情報が含まれているものを意味する。
また、本発明における「遺伝子」には、特定の塩基配列で表される「遺伝子」だけではなく、その同族体(すなわち、ホモログもしくはオーソログ)、遺伝子多型等の変異体、及び誘導体が包含される。
ここで、本明細書中に開示される遺伝子の名称は、NCBI([www.ncbi.nlm.nih.gov/])に記載のあるOfficial Symbolに従う。
本発明において、遺伝子の「発現産物」とは、遺伝子の転写産物及び翻訳産物を包含する概念である。「転写産物」とは、遺伝子(DNA)から転写されて生じるRNAであり、「翻訳産物」とは、RNAに基づき翻訳合成される、遺伝子にコードされたタンパク質を意味する。
本発明において、「皮膚表上脂質(SSL)」とは、皮膚の表上に存在する脂溶性画分をいい、皮脂と呼ばれることもある。一般に、SSLは、皮膚にある皮脂腺等の外分泌腺から分泌された分泌物を主に含み、皮膚表面を覆う薄い層の形で皮膚表上に存在している。SSLは、皮膚細胞で発現したRNAを含む(前記特許文献1参照)。また本発明において、「皮膚」とは、特に限定しない限り、角層、表皮、真皮、毛包、ならびに汗腺、皮脂腺及びその他の腺等の組織を含む領域の総称である。
本発明において、「更年期障害」とは、閉経前後10年間の更年期において現れる様々な身体的、精神的な症状(更年期症状)が重く、日常生活に支障を来す状態をいう。
身体的な症状としては、ほてり、のぼせ、ホットフラッシュ、発汗、めまい、動悸、胸が締め付けられるような感じ、頭痛、肩こり、腰や背中の痛み、関節の痛み、冷え、しびれ、疲れやすさ等が挙げられる。
精神的な症状としては、気分の落ち込み、意欲の低下、イライラ、情緒不安定、不眠等が挙げられる。
「更年期障害の重症度」は、更年期症状の悪さの程度を意味し、症状の状態により、例えば、軽症、中等症又は重症、あるいは軽症又は重症のように分類される。重症度分類としては、例えば、クッパーマン更年期指数(KKSI)(Kupperman HS et al. J Clin Endocrinol Metab.1953)や簡略更年期指数(Simplified Menopausal Index:SMI)(小山嵩夫.更年期指数.産婦治療 1998)が知られている。クッパーマン更年期指数は、11種類の症状の程度について、3:強い、2:中程度、1:弱い、0:なし、の4段階のスコアをつけ、当該スコアに症状毎に決められている「評価度」の数値(1、2又は4)を掛けて、症状全ての算出値を合算した値である。また、簡略更年期指数は、10種類の症状の程度を強、中、弱、無の4段階で評価し、当該スコアに症状毎に決められている数値を合算した値である。
本発明の更年期障害の重症度の検出においては、「軽症」、「中等症」及び「重症」の検出ができるが、「軽症」及び「重症」の検出を行うのが好ましい。
本発明において、「軽症」とは、上記更年期症状が軽度である状態をいい、例えば、「軽症」及び「重症」の検出を行う場合、クッパーマン更年期指数が22点以下であることが該当する。
「重症」とは、上記更年期症状が重度である状態をいい、例えば、「軽症」及び「重症」の検出を行う場合、クッパーマン更年期指数が23点以上であることが該当する。
なお、クッパーマン更年期指数等を用いた重症度分類の決定においては、各評価の基準となる値の範囲は上の限りでなく、適宜決定することができる。
本発明において、更年期障害の重症度の「検出」とは、更年期障害の重症度を明らかにする意味であり、検査、測定、判定又は評価支援等の用語で言い換えることもできる。なお、本発明における更年期障害の重症度の「検出」、「検査」、「測定」、「判定」又は「評価」という用語は、医師による診断を含むものではない。
後述する実施例に示すように、クッパーマン更年期障害指数が23点以上の更年期障害の重症度が高い重症群と、当該指数が22点以下の更年期障害が軽症な軽症群の間で、全顔から採取したSSLにおいて発現レベルが異なっている遺伝子が見出された。すなわち、当該SSLから抽出されたRNAの発現量のデータ(リードカウント値)について、RPM(Reads per million mapped reads)値に変換し、補正されたカウント値(Normalized count値)を用いて、重症群と軽症群でStudent’s t testによるp値が0.05未満である遺伝子を抽出することにより、重症群で発現が上昇する遺伝子98種(下記表2の「up」)、発現が低下する遺伝子11種(下記表2の「down」)、計109遺伝子が同定された。そして、当該109遺伝子のLog2(RPM+1)値を説明変数とし、更年期障害の重症度(重症群か軽症群)を目的変数とし、機械学習アルゴリズムとしてランダムフォレスト(Breiman L. Machine Learning (2001) 45;5-32)を用いた判別式(更年期障害の重症度の予測モデル)で、更年期障害の重症度の検出が可能であることが示された。
したがって、斯かる109種の遺伝子群より選択される遺伝子又はその発現産物は、更年期障害の重症度を検出するためのマーカーとなり得る。この場合、重症群で発現が上昇する98遺伝子又はその発現産物はポジティブマーカーであり、発現が低下する11遺伝子又はその発現産物はネガティブマーカーである。
また、被験者から検出された全てのSSL由来RNAの発現量のデータ(3570遺伝子のLog2(RPM+1)値)を説明変数とし、更年期障害の重症度(重症群か軽症群)を目的変数とし、機械学習アルゴリズムとしてランダムフォレストを用いて特徴量遺伝子の抽出及び予測モデルの構築を試みた。後述する実施例に示すように、ジニ係数に基づく変数重要度の上位82遺伝子(下記表3)を特徴量遺伝子として選択し、これを用いた予測モデルで更年期障害の重症度の検出が可能であることが示された。
したがって、斯かる82種の遺伝子群より選択される遺伝子又はその発現産物は、更年期障害の重症度を検出するための好適なマーカーとなり得る。
また、機械学習アルゴリズムとしてBoruta法(Kursa et al. Fundamental Informaticae (2010) 101;271-286)を用いて特徴量遺伝子の抽出(最大試行回数1000回、p値0.01未満)を行ったところ、4遺伝子(下記表4)が特徴量遺伝子として抽出され、後述の実施例で示すように、これを用いたランダムフォレストによる予測モデルで更年期障害の重症度の検出が可能であることが示された。
したがって、斯かる4種の遺伝子群より選択される遺伝子又はその発現産物は、更年期障害の重症度を検出するためのマーカーとなり得る。
上述した発現変動解析で抽出された表2で示される109種の遺伝子群(A)と、ランダムフォレストにより特徴量遺伝子として選択された表3で示される82種の遺伝子群(B)及びBoruta法により特徴量遺伝子として選択された表4で示される4種の遺伝子群(C)の和(A∪B∪C)である178種の遺伝子(下記表5)はいずれも更年期障害の重症度を検出するためのマーカーとなり得る。斯かる178種の遺伝子は、これまでに更年期障害との関係が報告されていない新規な遺伝子である。
表5で示される178種の遺伝子のうち、下記表1で示される16種の遺伝子は、上述した発現変動解析で抽出された表2で示される109種の遺伝子群(A)と、ランダムフォレストにより特徴量遺伝子として選択された表3で示される82種の遺伝子群(B)に共通(A∩B;14遺伝子)するか、ランダムフォレストにより特徴量遺伝子として選択された表3で示される82種とBoruta法により特徴量遺伝子として選択された表4で示される4種の遺伝子群(C)に共通(B∩C;1遺伝子)するか、発現変動解析で抽出された表2で示される109種の遺伝子群(A)とBoruta法により特徴量遺伝子として選択された表4で示される4種の遺伝子群(C)に共通(A∩C;3遺伝子)する遺伝子である。
また、当該16遺伝子のうち、SLC39A7は、発現変動解析で抽出された表2で示される109種の遺伝子群(A)と、ランダムフォレストにより特徴量遺伝子として選択された表3で示される82種の遺伝子群(B)と、Boruta法により特徴量遺伝子として選択された表4で示される4種の遺伝子群(C)全てにおいて共通する遺伝子(A∩B∩C)である。
したがって、当該16種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物、更にSLC39A7又はその発現産物は、更年期障害の重症度を検出するためのマーカーとして特に有用である。
Figure 2023073135000001
本発明の更年期障害の重症度の検出においては、表1で示される16種の遺伝子群から1種以上、好ましくは2種以上、より好ましくは5種以上、更に好ましくは8種以上の遺伝子又はその発現産物を選択して用いることができ、16種全ての遺伝子又はその発現産物を用いることもできる。精度向上の観点から、SLC39A7を含む2種以上の遺伝子又はその発現産物を選択して用いることが好ましい。
本発明の更年期障害の重症度の検出においては、精度向上の観点から、表1で示される16種の遺伝子群から選択される遺伝子又はその発現産物と、表2で示される109種のうち当該16種を除いた93種の遺伝子群(下記表2A)から選択される少なくとも1つの遺伝子又はその発現産物を組み合わせて用いることが好ましい。
Figure 2023073135000002
また、精度向上の観点から、表1で示される16種の遺伝子のうち、表1Aで示される14種の遺伝子群から選択される遺伝子又はその発現産物と、表3で示される82種のうち当該14種を除いた68種の遺伝子群(下記表3A)から選択される少なくとも1つの遺伝子又はその発現産物を組み合わせて用いることが好ましい。
Figure 2023073135000003
Figure 2023073135000004
また、精度向上の観点から、表1で示される16種の遺伝子のうち、表1Bで示される3種の遺伝子群から選択される遺伝子又はその発現産物と、表4で示される4種のうち当該3種を除いた1種、すなわちABI1又はその発現産物を組み合わせて用いることが好ましい。
Figure 2023073135000005
また、本発明の更年期障害の重症度の検出においては、表1で示される16種の遺伝子群から選択される遺伝子又はその発現産物と、表5で示される178種のうち当該16種を除いた162種の遺伝子群(下記表5A)から選択される少なくとも1つの遺伝子又はその発現産物を組み合わせて用いることができる。
Figure 2023073135000006
上記の更年期障害の重症度を検出するためのマーカーとなり得る遺伝子(以下、「標的遺伝子」とも称す)には、更年期障害の重症度を検出するためのマーカーとなり得る限り、当該遺伝子を構成するDNAの塩基配列と実質的に同一の塩基配列を有する遺伝子も包含される。ここで、実質的に同一の塩基配列とは、例えば、相同性計算アルゴリズムNCBI BLASTを用い、期待値=10;ギャップを許す;フィルタリング=ON;マッチスコア=1;ミスマッチスコア=-3の条件にて検索をした場合、当該遺伝子を構成するDNAの塩基配列と90%以上、好ましくは95%以上、より好ましく98%以上、さらに好ましくは99%以上の同一性があることを意味する。
本発明の更年期障害の重症度を検出する方法は、被験者から採取された生体試料について、一態様として、表1で示される16種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む。
本発明における被験者は、例えば、更年期障害の重症度の検出を所望するか又は必要とする被験者が挙げられる。例えば、プレ更年期の時期といわれる30代後半~40代半のヒト、更年期の時期といわれる40代半ば~50代半ばのヒトが挙げられる。
本発明において用いられる生体試料としては、本発明の遺伝子が発現変化する細胞、組織及び生体材料であればよい。具体的には臓器、皮膚、血液、尿、唾液、汗、角層、皮膚表上脂質(SSL)、組織浸出液等の体液、血液から調製された血清、血漿、その他、便、毛髪等が挙げられ、好ましくは皮膚又は皮膚表上脂質(SSL)、より好ましくは皮膚表上脂質(SSL)が挙げられる。本発明において、SSLが採取される皮膚は、好ましくは顔の皮膚、より好ましくは全顔の皮膚である。
被験者の皮膚からのSSLの採取には、皮膚からのSSLの回収又は除去に用いられているあらゆる手段を採用することができる。好ましくは、後述するSSL吸収性素材、SSL接着性素材、又は皮膚からSSLをこすり落とす器具を使用することができる。SSL吸収性素材又はSSL接着性素材としては、SSLに親和性を有する素材であれば特に限定されず、例えばポリプロピレン、パルプ等が挙げられる。皮膚からのSSLの採取手順のより詳細な例としては、あぶら取り紙、あぶら取りフィルム等のシート状素材へSSLを吸収させる方法、ガラス板、テープ等へSSLを接着させる方法、スパーテル、スクレイパー等によりSSLをこすり落として回収する方法、等が挙げられる。SSLの吸着性を向上させるため、脂溶性の高い溶媒を予め含ませたSSL吸収性素材を用いてもよい。一方、SSL吸収性素材は、水溶性の高い溶媒や水分を含んでいるとSSLの吸着が阻害されるため、水溶性の高い溶媒や水分の含有量が少ないことが好ましい。SSL吸収性素材は、乾燥した状態で用いることが好ましい。
被験者から採取されたRNA含有SSLは一定期間保存されてもよい。採取されたSSLは、含有するRNAの分解を極力抑えるために、採取後できるだけ速やかに低温条件で保存することが好ましい。本発明における該RNA含有SSLの保存の温度条件は、0℃以下であればよく、好ましくは-20±20℃~-80±20℃、より好ましくは-20±10℃~-80±10℃、さらに好ましくは-20±20℃~-40±20℃、さらに好ましくは-20±10℃~-40±10℃、さらに好ましくは-20±10℃、さらに好ましくは-20±5℃である。該RNA含有SSLの該低温条件での保存の期間は、特に限定されないが、好ましくは12か月以下、例えば6時間以上12ヶ月以下、より好ましくは6ヶ月以下、例えば1日間以上6ヶ月以下、さらに好ましくは3ヶ月以下、例えば3日間以上3ヶ月以下である。
本発明において、標的遺伝子又はその発現産物の発現レベルの測定対象としては、RNA、そのRNAをエンコードするDNA、そのRNAにコードされるタンパク質、該タンパク質と相互作用をする分子、そのRNAと相互作用する分子、又はそのDNAと相互作用する分子等が挙げられ、RNAが好ましく、より好ましくはmRNAである。ここで、RNA、DNA又はタンパク質と相互作用する分子としては、DNA、RNA、タンパク質、多糖、オリゴ糖、単糖、脂質、脂肪酸、及びこれらのリン酸化物、アルキル化物、糖付加物等、及び上記いずれかの複合体が挙げられる。また、発現レベルとは、当該遺伝子又は発現産物の発現量や活性を包括的に意味する。
本発明の方法においては、好ましい態様として、生体試料としてSSLが用いられるが、この場合にはSSLに含まれるmRNAの発現レベルが解析され、具体的にはRNAを逆転写によりcDNAに変換した後、該cDNA又はその増幅産物が測定される。
SSLからのRNAの抽出には、生体試料からのRNAの抽出又は精製に通常使用される方法、例えば、フェノール/クロロホルム法、AGPC(acid guanidinium thiocyanate-phenol-chloroform extraction)法、又はTRIzol(登録商標)、RNeasy(登録商標)、QIAzol(登録商標)等のカラムを用いた方法、シリカをコーティングした特殊な磁性体粒子を用いる方法、Solid Phase Reversible Immobilization磁性体粒子を用いる方法、ISOGEN等の市販のRNA抽出試薬による抽出等を用いることができる。
該逆転写には、解析したい特定のRNAを標的としたプライマーを用いてもよいが、より包括的な核酸の保存及び解析のためにはランダムプライマーを用いることが好ましい。該逆転写には、一般的な逆転写酵素又は逆転写試薬キットを使用することができる。好適には、正確性及び効率性の高い逆転写酵素又は逆転写試薬キットが用いられ、その例としては、M-MLV Reverse Transcriptase及びその改変体、あるいは市販の逆転写酵素又は逆転写試薬キット、例えばPrimeScript(登録商標)Reverse Transcriptaseシリーズ(タカラバイオ社)、SuperScript(登録商標)Reverse Transcriptaseシリーズ(Thermo Scientific社)等が挙げられる。SuperScript(登録商標)III Reverse Transcriptase、SuperScript(登録商標)VILO cDNA Synthesis kit(いずれもThermo Scientific社)等が好ましく用いられる。
該逆転写における伸長反応は、温度を好ましくは42℃±1℃、より好ましくは42℃±0.5℃、さらに好ましくは42℃±0.25℃に調整し、一方、反応時間を好ましくは60分間以上、より好ましくは80~120分間に調整するのが好ましい。
発現レベルを測定する方法は、RNA、cDNA又はDNAを対象とする場合、これらにハイブリダイズするDNAをプライマーとしたPCR法、リアルタイムRT-PCR法、マルチプレックスPCR、SmartAmp法、LAMP法等に代表される核酸増幅法、これらにハイブリダイズする核酸をプローブとして用いるハイブリダイゼーション法(DNAチップ、DNAマイクロアレイ、ドットブロットハイブリダイゼーション、スロットブロットハイブリダイゼーション、ノーザンブロットハイブリダイゼーション等)、塩基配列を決定する方法(シーケンシング)、又はこれらを組み合わせた方法から選ぶことができる。
PCRでは、解析したい特定のDNAを標的としたプライマーペアを用いて該特定の1種のDNAのみを増幅してもよいが、複数のプライマーペアを用いて同時に複数の特定のDNAを増幅してもよい。好ましくは、該PCRはマルチプレックスPCRである。マルチプレックスPCRは、PCR反応系に複数のプライマー対を同時に使用することで、複数の遺伝子領域を同時に増幅する方法である。マルチプレックスPCRは、市販のキット(例えば、Ion AmpliSeqTranscriptome Human Gene Expression Kit;ライフテクノロジーズジャパン株式会社等)を用いて実施することができる。
該PCRにおけるアニーリング及び伸長反応の温度は、使用するプライマーに依存するため一概には言えないが、上記のマルチプレックスPCRキットを用いる場合、好ましくは62℃±1℃、より好ましくは62℃±0.5℃、さらに好ましくは62℃±0.25℃である。したがって、該PCRでは、好ましくはアニーリング及び伸長反応が1ステップで行われる。該アニーリング及び伸長反応のステップの時間は、増幅すべきDNAのサイズ等に依存して調整され得るが、好ましくは14~18分間である。該PCRにおける変性反応の条件は、増幅すべきDNAに依存して調整され得るが、好ましくは95~99℃で10~60秒間である。上記のような温度及び時間での逆転写及びPCRは、一般的にPCRに使用されるサーマルサイクラーを用いて実行することができる。
当該PCRで得られた反応産物の精製は、反応産物のサイズ分離によって行われることが好ましい。サイズ分離により、目的のPCR反応産物を、PCR反応液中に含まれるプライマーやその他の不純物から分離することができる。DNAのサイズ分離は、例えば、サイズ分離カラムや、サイズ分離チップ、サイズ分離に利用可能な磁気ビーズ等によって行うことができる。サイズ分離に利用可能な磁気ビーズの好ましい例としては、Ampure XP等のSolid Phase Reversible Immobilization(SPRI)磁性ビーズが挙げられる。
精製したPCR反応産物に対して、その後の定量解析を行うために必要なさらなる処理を施してもよい。例えば、DNAのシーケンシングのために、精製したPCR反応産物を、適切なバッファー溶液へと調製したり、PCR増幅されたDNAに含まれるPCRプライマー領域を切断したり、増幅されたDNAにアダプター配列をさらに付加したりしてもよい。例えば、精製したPCR反応産物をバッファー溶液へと調製し、増幅DNAに対してPCRプライマー配列の除去及びアダプターライゲーションを行い、得られた反応産物を、必要に応じて増幅して、定量解析のためのライブラリーを調製することができる。これらの操作は、例えば、SuperScript(登録商標)VILO cDNA Synthesis kit(ライフテクノロジーズジャパン株式会社)に付属している5×VILO RT Reaction Mix、及びIon AmpliSeq Transcriptome Human Gene Expression Kit(ライフテクノロジーズジャパン株式会社)に付属している5×Ion AmpliSeq HiFi Mix、及びIon AmpliSeq Transcriptome Human Gene Expression Core Panelを用いて、各キット付属のプロトコルに従って行うことができる。
ノーザンブロットハイブリダイゼーション法を利用して標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、まずプローブDNAを放射性同位元素、蛍光物質等で標識し、次いで、得られた標識DNAを、常法に従ってナイロンメンブレン等にトランスファーした生体試料由来のRNAとハイブリダイズさせる。その後、形成された標識DNAとRNAとの二重鎖を、標識物に由来するシグナルを検出することにより測定する方法が挙げられる。
RT-PCR法を用いて標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、まず生体試料由来のRNAから常法に従ってcDNAを調製し、これを鋳型として本発明の標的遺伝子が増幅できるように調製した一対のプライマー(上記cDNA(-鎖)に結合する正鎖、+鎖に結合する逆鎖)をこれとハイブリダイズさせる。その後、常法に従ってPCR法を行い、得られた増幅二本鎖DNAを検出する。増幅された二本鎖DNAの検出には、予めRI、蛍光物質等で標識しておいたプライマーを用いて上記PCRを行うことによって産生される標識二本鎖DNAを検出する方法等を用いることができる。
DNAマイクロアレイを用いて標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、支持体に本発明の標的遺伝子由来の核酸(cDNA又はDNA)の少なくとも1種を固定化したアレイを用い、mRNAから調製した標識化cDNA又はcRNAをマイクロアレイ上に結合させ、マイクロアレイ上の標識を検出することによって、mRNAの発現量を測定することができる。
前記アレイに固定化される核酸としては、ストリンジェントな条件下に特異的(すなわち、実質的に目的の核酸のみに)にハイブリダイズする核酸であればよく、例えば、本発明の標的遺伝子の全配列を有する核酸であってもよく、部分配列からなる核酸であってもよい。ここで、「部分配列」とは、少なくとも15~25塩基からなる核酸が挙げられる。ここでストリンジェントな条件は、通常「1×SSC、0.1%SDS、37℃」程度の洗浄条件を挙げることができ、より厳しいハイブリダイズ条件としては「0.5×SSC、0.1%SDS、42℃」程度、さらに厳しいハイブリダイズ条件としては「0.1×SSC、0.1%SDS、65℃」程度の条件を挙げることができる。ハイブリダイズ条件は、J. Sambrook et al., Molecular Cloning: A Laboratory Manual, Thrd Edition, Cold Spring Harbor Laboratory Press (2001)等に記載されている。
シーケンシングによって標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、次世代シーケンサー(例えばIon S5/XLシステム、ライフテクノロジーズジャパン株式会社)が用いて解析することが挙げられる。シーケンシングで作成されたリードの数(リードカウント)に基づいて、RNA発現を定量することができる。
上記の測定に用いられるプローブ又はプライマー、すなわち、本発明の標的遺伝子又はそれに由来する核酸を特異的に認識し増幅するためのプライマー、又は該RNA又はそれに由来する核酸を特異的に検出するためのプローブがこれに該当するが、これらは、当該標的遺伝子を構成する塩基配列に基づいて設計することができる。ここで「特異的に認識する」とは、例えばノーザンブロット法において、実質的に本発明の標的遺伝子又はそれに由来する核酸のみを検出できること、また例えばRT-PCR法において、実質的に当該核酸のみが増幅される如く、当該検出物又は生成物が当該遺伝子又はそれに由来する核酸であると判断できることを意味する。
具体的には、本発明の標的遺伝子を構成する塩基配列からなるDNA又はその相補鎖に相補的な一定数のヌクレオチドを含むオリゴヌクレオチドを利用することができる。ここで「相補鎖」とは、A:T(RNAの場合はU)、G:Cの塩基対からなる2本鎖DNAの一方の鎖に対する他方の鎖を指す。また、「相補的」とは、当該一定数の連続したヌクレオチド領域で完全に相補配列である場合に限られず、好ましくは80%以上、より好ましくは90%以上、さらに好ましくは95%以上、よりさらに好ましくは99%以上の塩基配列上の同一性を有すればよい。塩基配列の同一性は、前記BLAST等のアルゴリズムにより決定することができる。
斯かるオリゴヌクレオチドは、プライマーとして用いる場合には、特異的なアニーリング及び鎖伸長ができればよく、通常、例えば10塩基以上、好ましくは15塩基以上、より好ましくは20塩基以上、かつ例えば100塩基以下、好ましくは50塩基以下、より好ましくは35塩基以下の鎖長を有するものが挙げられる。また、プローブとして用いる場合には、特異的なハイブリダイゼーションができればよく、本発明の標的遺伝子を構成する塩基配列からなるDNA(又はその相補鎖)の少なくとも一部若しくは全部の配列を有し、例えば10塩基以上、好ましくは15塩基以上、かつ例えば100塩基以下、好ましくは50塩基以下、より好ましくは25塩基以下の鎖長のものが用いられる。
なお、ここで、「オリゴヌクレオチド」は、DNAあるいはRNAであることができ、合成されたものでも天然のものでもよい。又、ハイブリダイゼーションに用いるプローブは、通常標識したものが用いられる。
また、本発明の標的遺伝子の翻訳産物(タンパク質)、当該タンパク質と相互作用する分子、RNAと相互作用する分子、又はDNAと相互作用する分子を測定する場合は、プロテインチップ解析、免疫測定法(例えば、ELISA等)、質量分析(例えば、LC-MS/MS、MALDI-TOF/MS)、1-ハイブリッド法(PNAS 100, 12271-12276(2003))や2-ハイブリッド法(Biol. Reprod. 58, 302-311 (1998))のような方法を用いることができ、対象に応じて適宜選択できる。
例えば、測定対象としてタンパク質が用いられる場合は、本発明の発現産物を特異的に認識する抗体、具体的には発現産物であるタンパク質を他のタンパク質から識別することが可能な構造的特徴部位(エピトープ)を認識する抗体を生体試料と接触させ、当該抗体に結合した試料中のポリペプチド又はタンパク質を検出し、そのレベルを測定することによって実施される。例えば、ウェスタンブロット法によれば、一次抗体として上記の抗体を用いた後、二次抗体として放射性同位元素、蛍光物質又は酵素等で標識した一次抗体に結合する抗体を用いて、その一次抗体を標識し、これら標識物質由来のシグナルを放射線測定器、蛍光検出器等で測定することが行われる。
尚、上記翻訳産物に対する抗体は、ポリクローナル抗体であっても、モノクローナル抗体であってもよい。これらの抗体は、公知の方法に従って製造することができる。具体的には、ポリクローナル抗体は、常法に従って大腸菌等で発現し精製したタンパク質を用いて、あるいは常法に従って当該タンパク質の部分ポリペプチドを合成して、家兎等の非ヒト動物に免疫し、該免疫動物の血清から常法に従って得ることが可能である。
一方、モノクローナル抗体は、常法に従って大腸菌等で発現し精製したタンパク質又は該タンパク質の部分ポリペプチドをマウス等の非ヒト動物に免疫し、得られた脾臓細胞と骨髄腫細胞とを細胞融合させて調製したハイブリドーマ細胞から得ることができる。また、モノクローナル抗体は、ファージディスプレイを用いて作製してもよい(Griffiths, A.D.; Duncan, A.R., Current Opinion in Biotechnology, Volume 9, Number 1, February 1998 , pp. 102-108(7))。
斯くして、被験者から採取された生体試料中の本発明の標的遺伝子又はその発現産物の発現レベルが測定され、当該発現レベルに基づいて当該被験者の更年期障害の重症度が検出される。
検出は、具体的には、測定された本発明の標的遺伝子又はその発現産物の発現レベルを対照レベルと比較することによって行われる。
シーケンシングにより複数の標的遺伝子の発現レベルの解析を行う場合は、上記したように、発現量のデータであるリードカウント値、該リードカウント値をサンプル間の総リード数の違いを補正したRPM値、当該RPM値を底2の対数値に変換した値(Log2RPM値)又は整数1を加算した底2の対数値(Log2(RPM+1)値)、あるいはDESeq2を用いて補正されたカウント値(Normalized count値)又は整数1を加算した底2の対数値(Log2(count+1)値)を指標として用いるのが好ましい。また、RNA-seqの定量値として一般的な、fragments per kilobase of exon per million reads mapped (FPKM)、reads per kilobase of exon per million reads mapped (RPKM)、transcripts per million (TPM)などによって算出される値であってもよい。また、マイクロアレイ法によって得られるシグナル値、及びその補正値であってもよい。また、RT-PCRなどにより特定の標的遺伝子のみ発現レベルの解析を行う場合には、対象遺伝子の発現量をハウスキーピング遺伝子の発現量を基準とする相対的な発現量に変換(相対定量)して解析する方法、又は標的遺伝子の領域を含むプラスミドを用いて絶対的なコピー数を定量(絶対定量)して解析する方法が好ましい。デジタルPCR法によって得られるコピー数であってもよい。
ここで、「対照レベル」とは、例えば、「軽症」及び「重症」の検出を行う場合、軽症者の検出の際は健常人における、重症者の検出の際は軽症者における、当該標的遺伝子又はその発現産物の発現レベルが挙げられる。各々の発現レベルは、各々に該当する集団から測定した当該遺伝子又はその発現産物の発現レベルの統計値(例えば平均値等)であってもよい。標的遺伝子が複数の場合は、各々の遺伝子又はその発現産物について基準発現レベルを求めることが好ましい。
また、本発明における更年期障害の重症度の検出は、本発明の標的遺伝子又はその発現産物の発現レベルの上昇/減少により行うこともできる。この場合は、被験者由来の生体試料における標的遺伝子又はその発現産物の発現レベルが、各遺伝子又はその発現産物の参照値(カットオフ値)と比較される。参照値は、予め更年期障害が無い、あるいは軽症(状態が健常、あるいは軽症)における当該標的遺伝子又はその発現産物の発現レベルを基準データとして取得しておき、それに基づく発現レベルの平均値や標準偏差等の統計的数値に基づき、適宜決定すれば良い。
一実施形態においては、測定された本発明の標的遺伝子又はその発現産物の発現レベルを、参照値と比べることで、該被験者の更年期障害の重症度を検出することができる。あるいは、一被験者から本発明の標的遺伝子又はその発現産物の発現レベルを定期的に(例えば毎月)測定し、その発現レベルの変動を追跡することで、該被験者の更年期障害の重症度を検出することができる。該参照値には、予め決定した値、例えば、本発明の標的遺伝子又はその発現産物の発現レベルの統計値(例えば平均値)を用いることができる。該参照値は、被験者ごとに設定されてもよい。例えば、同じ被験者から複数回測定した標的遺伝子又はその発現産物の発現レベルの統計値から該参照値を算出してもよい。あるいは、該参照値は、参照集団(予め更年期障害が任意である個体からなる群)、又は軽症群(例えば、前述したクッパーマン更年期障害指数が22点以下である個体からなる群)から測定した本発明の標的遺伝子又はその発現産物の発現レベルの統計値(例えば平均値など)に基づいて決定することができる。本発明の標的遺伝子又はその発現産物として複数種を用いる場合は、各々の標的遺伝子又はその発現産物について参照値を求めることが好ましい。
例えば、本発明の標的遺伝子又はその発現産物がポジティブマーカーとなる場合、該マーカーの発現レベルが参照値よりも高い場合、被験者は重症であると検出され得、そうでない場合、被験者は重症ではない(又は軽症)と検出され得る。例えば、被験者における標的遺伝子又はその発現産物の発現レベルが参照値と比べて統計学的に有意に高ければ、該被験者は重症であると検出され得、そうでない場合、被験者は重症ではない(又は軽症)と検出され得る。また例えば、被験者における標的遺伝子又はその発現産物の発現レベルが参照値に対して、好ましくは110%以上、より好ましくは150%以上、さらに好ましくは200%以上であれば、該被験者は更年期障害が重症であると検出され得、そうでない場合、被験者は重症ではない(又は軽症)と検出され得る。
一方、本発明の標的遺伝子又はその発現産物がネガティブマーカーとなる場合、該マーカーの発現レベルが基準値よりも低い場合、被験者は重症であると検出され得、そうでない場合、被験者は重症ではない(又は軽症)と検出され得る。例えば、被験者における標的遺伝子又はその発現産物の発現レベルが基準値と比べて統計学的に有意に低ければ、該被験者は重症であると検出され得、そうでない場合、被験者は重症ではない(又は軽症)と検出され得る。また例えば、被験者における標的遺伝子又はその発現産物の発現レベルが基準値に対して、好ましくは90%以下、より好ましくは75%以下、さらに好ましくは50%以下であれば、該被験者は重症であると検出され得、そうでない場合、被験者は重症ではない(又は軽症)と検出され得る。
あるいは、複数の標的遺伝子又はその発現産物を組み合わせて用いる場合には、それらの標的遺伝子又はその発現産物の一定割合、例えば50%以上、好ましくは70%以上、より好ましくは90%以上、さらに好ましくは100%が上述した発現レベルの基準を満たすか否かに基づいて、被験者の更年期障害の重症度を検出することができる。
さらに、更年期障害の重症度が高い個体(重症群)由来の標的遺伝子又はその発現産物の発現レベルと、重症度が低い個体(軽症群)由来の標的遺伝子又はその発現産物の発現レベルの測定値(発現プロファイル)を利用して、重症度を分ける判別式(予測モデル)を構築し、当該判別式を利用して、更年期障害の重症度を検出することができる。
すなわち、重症群由来の標的遺伝子又はその発現産物の発現レベルと、軽症群由来の標的遺伝子又はその発現産物の発現レベルの測定値を教師サンプルとして、重症群と軽症群を分ける判別式(予測モデル)を構築し、当該判別式に基づいて更年期障害の重症度を判別する参照値(カットオフ値)を求める。なお、判別式の作成においては、主成分分析(PCA)により次元圧縮を行ない、主要成分を説明変数とすることができる。
そして、被験者の生体試料から標的遺伝子又はその発現産物のレベルを同様に測定し、得られた測定値を当該判別式に代入し、当該判別式から得られた結果を参照値と比較することによって、被験者における更年期障害の重症度を評価できる。
判別式の構築に用いる変数には説明変数と目的変数がある。説明変数としては、例えば、下記の方法で選択した標的遺伝子又はその発現産物の発現レベル(特徴量)を用いることができる。目的変数としては、例えば、そのサンプルが重症か軽症か(重症群か軽症群か)、を用いることができる。
特徴量の選択には、判別する2群間の統計学的に有意な差異、例えば、発現レベルが2群間で有意に変動する遺伝子(発現変動遺伝子)又はその発現産物の発現レベルを用いることができる。また、機械学習に用いるアルゴリズムなどの公知のものを利用して特徴量遺伝子を抽出し、その発現レベルを用いたりすることができる。例えば、下記に示すランダムフォレストにおける変数重要度の高い遺伝子またはその発現産物の発現レベルを用いたり、R言語の“Boruta”パッケージなどを用いて特徴量遺伝子を抽出し、その発現レベルを用いたりすることができる。
判別式の構築におけるアルゴリズムは、機械学習に用いるアルゴリズムなどの公知のものを利用することができる。機械学習アルゴリズムの例としては、ランダムフォレスト(Random forest)、線形カーネルのサポートベクターマシン(SVM linear)、rbfカーネルのサポートベクターマシン(SVM rbf)ニューラルネットワーク(Nerural net)、一般線形モデル(Generalized linear model)、正則化線形判別分析(Regularized linear discriminant analysis)、正則化ロジスティック回帰(Regularized logistic regression)などが挙げられる。構築した予測モデルに検証用のデータを入力して予測値を算出し、該予測値が実測値と最も適合するモデル、例えば正解率(Accuracy)が最も大きいモデルを最適な予測モデルとして選抜することができる。また、予測値と実測値から検出率(Recall)、精度(Precision)、及びそれらの調和平均であるF値を計算し、そのF値が最も大きいモデルを最適な予測モデルとして選抜することができる。
判別式の構築においてランダムフォレストのアルゴリズムを使用する場合、予測モデルの精度の指標として、未知データに対する推定の誤答率(OOB error rate)を算出することができる(Breiman L. Machine Learning (2001) 45;5-32)。
ランダムフォレストにおいては、ブートストラップ法という手法に従い、全サンプル中から重複を許して、サンプル数の約3分の2のサンプルをランダムに抽出し、決定木と呼ばれる分類器を作成する。この時抽出されなかったサンプルはOut of bug(OOB)と呼ばれ、1本の決定木を用いて、OOBの目的変数の予測を行い、正解ラベルと比較することでその誤答率を算出することができる(決定木におけるOOB error rate)。同様の作業を500回繰り返し行い、500本の決定木におけるOOB error rateの平均値をとった値を、該ランダムフォレストのモデルのOOB error rateとすることができる。
なお、ランダムフォレストのモデルを構築する決定木の数(ntree値)は、デフォルトでは500本であるが、必要に応じて1本から任意の本数に変更することができる。さらに、1つの決定木においてサンプルの判別式の作成に用いる変数の数(mtry値)は、デフォルトでは説明変数の数の平方根をとった値であるが、必要に応じて1つから全説明変数の数までの値のいずれかに変更することができる。
mtry値の決定にはR言語の“caret”パッケージを用いることができる。“caret”パッケージのメソッドにランダムフォレストを指定し、8通りのmtry値を試行し、例えばAccuracyが最大となるmtry値を最適なmtry値として選択することができる。なお、mtry値の試行回数は、必要に応じて任意の試行回数に変更することができる。
判別式の構築においてランダムフォレストのアルゴリズムを使用する場合、モデルの構築に用いた説明変数の重要度を数値(変数重要度)化することができる。変数重要度の値には、例えば、ジニ係数の減少量(Mean Decrease Gini)を用いることができる。
カットオフ値(参照値)の決定方法は特に制限されず、公知の手法に従って決定することができる。例えば、判別式を使用して作成されたROC(Receiver Operating Characteristic Curve)曲線より求めることができる。ROC曲線では、縦軸に陽性患者において陽性の結果がでる確率(感度)と、横軸に陰性患者において陰性の結果がでる確率(特異度)を1から減算した値(偽陽性率)がプロットされる。ROC曲線に示される「真陽性(感度)」及び「偽陽性(1-特異度)」に関し、「真陽性(感度)」-「偽陽性(1-特異度)」が最大となる値(Youden index)をカットオフ値(参照値)とすることができる。
本発明の更年期障害の重症度の検出に用いられる予測モデルを構築するための特徴量遺伝子としては、例えば、SLC39A7、当該遺伝子を含む表1で示される16遺伝子からなる遺伝子群、当該16種の遺伝子を全て含む表5で示される178遺伝子からなる遺伝子群、当該16種の遺伝子を含む表2で示される109遺伝子からなる遺伝子群、SLC39A7を含む表3で示される82遺伝子からなる遺伝子群、SLC39A7を含む、表4で示される4遺伝子からなる遺伝子群が挙げられる。
また、表1で示される16種の遺伝子群から選択される遺伝子と、表2で示される109種のうち当該16種を除いた93種の遺伝子群(上記表2A)から選択される少なくとも1つの遺伝子を組み合わせて特徴量遺伝子とすることができる。
また、表1で示される16種の遺伝子のうち、表1Aで示される14種の遺伝子群から選択される遺伝子と、表3で示される82種のうち当該14種を除いた68種の遺伝子群(上記表3A)から選択される少なくとも1つの遺伝子を組み合わせて特徴量遺伝子とすることができる。ここで、前記表3Aで示される遺伝子群から選択される遺伝子は、変数重要度のより上位の遺伝子から順に、あるいは変数重要度が上位から50位以内、好ましくは30位以内の遺伝子から選択するのが好ましい。
また、表1で示される16種の遺伝子のうち、表1Bで示される3種の遺伝子群から選択される遺伝子と、表4で示される4種のうち当該3種を除いた1種、すなわちABI1を組み合わせて特徴量遺伝子とすることができる。
また、表1で示される16種の遺伝子群から選択される遺伝子と、表5で示される178種のうち当該16種を除いた162種の遺伝子群(上記表5A)から選択される少なくとも1つの遺伝子又を組み合わせて特徴量遺伝子とすることができる。
上述した本発明の更年期障害の重症度の検出方法は、更年期障害に対する予防又は治療的介入の存在下で実施することにより当該介入の効果を評価することができる。
すなわち、本発明の介入効果の評価方法は、更年期障害に対する予防又は治療的介入の存在下、被験者から採取された生体試料について、表1で示される16種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定することを含む。
ここで、更年期障害に対する予防又は治療的介入とは、更年期障害に対して予防又は治療的効果を期待して実施される介入であり、化学的介入、物理的又は機械的介入が包含される。化学的介入としては、天然物質、合成物質、組成物等の物質の投与が挙げられ、物理的又は機械的介入としては、電磁波、光等の照射、温熱付与、マッサージ等の施術が挙げられる。
介入効果の評価は、介入によって生じる被験者の標的遺伝子又はその発現産物のレベル、更にはそれに基づく更年期症状の程度の変化に基づいて評価することができる。
例えば、介入存在下における被験者の標的遺伝子又はその発現産物のレベル、更にはそれに基づく更年期症状の程度を、対照(介入非存在下)と比較することで、その効果を評価することが挙げられる。そして、被験者の更年期症状の程度を改善するような介入は、更年期障害の予防又は治療のために有効な介入と評価できる。
更年期障害の重症度検出用キット又は介入効果の評価用キットは、本発明による更年期障害の重症度の検出方法に従って被験者の更年期障害の重症度を検出するためのキット、及び本発明による介入効果の評価方法に従って介入効果を評価するためのキットである。
本発明のキットは、生体試料の採取及び保存に必要な用具及び試薬、標的遺伝子又はその発現産物の発現レベルを測定するための試薬を含有する。
生体試料の採取及び保存に必要な用具及び試薬としては、例えば、生体試料を採取するための用具(例えば、生体試料がSSLの場合、SSLを採取するための脂取りフィルム)、採取した生体試料を保存するための試薬、保存用の容器等が挙げられる。
標的遺伝子又はその発現産物の発現レベルを測定するための試薬としては、例えば採取したSSLからRNAを抽出・精製するための試薬、標的遺伝子に由来する核酸と特異的に結合(ハイブリダイズ)するオリゴヌクレオチド(例えば、PCR用のプライマー、シーケンシング用アダプター配列等)を含む、核酸増幅又はハイブリダイゼーションのための試薬、遺伝子発現産物(タンパク質)を認識する抗体を含む免疫学的測定のための試薬の他、標識試薬、緩衝液、発色基質、二次抗体、ブロッキング剤、ポジティブコントロールやネガティブコントロールとして使用するコントロール試薬、試験に必要な器具の他、標的遺伝子又はその発現産物の発現レベルを検出するための指標又はガイダンス等が包含される。
上述した実施形態に関し、本発明は以下の態様をさらに開示する。
<1>被験者から採取された生体試料について、前記表1に示す16種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者における更年期障害の重症度を検出する方法。
<2>前記16種のうち、好ましくは2種以上、より好ましくは5種以上、更に好ましくは8種以上、更に好ましくは16種全ての遺伝子又はその発現産物の発現レベルが測定される<1>記載の検出方法。
<3>前記16種のうち、SLC39A7又はその発現産物の発現レベルが測定される<1>又は<2>記載の検出方法。
<4>前記16種の遺伝子群から選択される遺伝子と、前記表2Aで示される93種の遺伝子群から選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される<1>~<3>のいずれかに記載の検出方法。
<5>前記16種の遺伝子のうち、前記表1Aで示される14種の遺伝子群から選択される遺伝子と、前記表3Aで示される68種の遺伝子群から選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される<1>~<3>のいずれかに記載の検出方法。
<6>前記16種の遺伝子のうち、前記表1Bで示される3種の遺伝子群から選択される遺伝子と、ABI1又はその発現産物の発現レベルが測定される<1>~<3>のいずれかに記載の検出方法。
<7>前記16種の遺伝子群から選択される遺伝子と、前記表5Aで示される162種の遺伝子群から選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される<1>~<3>のいずれかに記載の検出方法。
<8>前記遺伝子又はその発現産物の発現レベルの測定対象が、好ましくはRNAから人工的に合成されたcDNA、そのRNAをエンコードするDNA、そのRNAにコードされるタンパク質、該タンパク質と相互作用をする分子、そのRNAと相互作用する分子、又はそのDNAと相互作用する分子である<1>~<7>のいずれかに記載の検出方法。
<9>前記遺伝子又はその発現産物の発現レベルが、好ましくはmRNAの発現量である<1>~<8>のいずれかに記載の検出方法。
<10>前記生体試料が、被験者の好ましくは臓器、皮膚、血液、尿、唾液、汗、角層、皮膚表上脂質(SSL)、組織浸出液等の体液、血液から調製された血清、血漿、便又は毛髪であり、より好ましくは皮膚又は皮膚表上脂質(SSL)であり、更に好ましくは皮膚表上脂質(SSL)である<1>~<9>のいずれかに記載の検出方法。
<11>前記被験者の皮膚が顔の皮膚である<10>記載の検出方法。
<12>発現レベルの測定値を前記各遺伝子又はその発現産物の参照値と比較し、更年期障害の重症度を評価する<1>~<11>のいずれかに記載の検出方法。
<13>重症度群由来の前記遺伝子又はその発現産物の発現レベルと、軽症群由来の同遺伝子又はその発現産物の発現レベルの測定値を教師サンプルとして、重症群と軽症群を分ける判別式を作成し、被験者の生体試料から得られた同遺伝子又はその発現産物の発現レベルの測定値を当該判別式に代入し、得られた結果を参照値と比較することによって、被験者における更年期障害の重症度を評価する<1>~<12>のいずれかに記載の検出方法。
<14>更年期障害に対する予防又は治療的介入の存在下、被験者から採取された生体試料について、前記表1で示される16種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定することを含む、当該介入効果の評価方法。
<15>生体試料の採取及び保存に必要な用具及び試薬、並びに生体試料から前記遺伝子又はその発現産物の発現レベルを測定するための試薬を含有する<1>~<13>のいずれかに記載の検出方法に用いられる更年期障害の重症度を検出するための検査用キット又は<14>記載の方法に用いられる介入効果の評価用キット。
<16>下記表5で示される178種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる、更年期障害の重症度を検出するためのマーカー。
実施例1 発現変動遺伝子を用いた更年期障害重症度判別モデルの構築
1)被験者の選抜及びSSL採取
40~50歳代の健常な女性46名に、クッパーマン更年期障害指数(KKSI)に回答させ、そのスコアが23点以上の19名の更年期障害の重症度が高い方々を重症群の被験者として選抜し、22点以下の27名の更年期障害が軽症な方々を軽症群の被験者として選抜した。両群合わせて46名の各被験者の全顔からあぶら取りフィルム(5cm×8cm、ポリプロピレン製、3M社)を用いて皮脂を回収した。該あぶら取りフィルムはガラスバイアルに移し、RNA抽出に使用するまで-80℃で保存した。
2)RNA調製及びシーケンシング
上記1)のあぶら取りフィルムを適当な大きさに切断し、QIAzol Lysis Reagent(Qiagen)を用いて、付属のプロトコルに準じてRNAを抽出した。抽出したRNAは、SuperScript VILO cDNA Synthesis kit(ライフテクノロジーズジャパン株式会社)を用いて42℃で90分間逆転写し、cDNAを合成した。逆転写反応のプライマーには、キットに付属しているランダムプライマーを使用した。得られたcDNAから、マルチプレックスPCRにより20802遺伝子に由来するDNAを含むライブラリーを調製した。マルチプレックスPCRは、Ion AmpliSeqTranscriptome Human Gene Expression Kit(ライフテクノロジーズジャパン株式会社)を用いて、[99℃、2分→(99℃、15秒→62℃、16分)×20サイクル→4℃、Hold]の条件で行った。得られたPCR産物は、Ampure XP(ベックマン・コールター株式会社)で精製した後に、バッファーの再構成、プライマー配列の消化、アダプターライゲーションと精製、及び増幅を行い、ライブラリーを調製した。調製したライブラリーをIon 540 Chipにローディングし、Ion S5/XLシステム(ライフテクノロジーズジャパン株式会社)を用いてシーケンシングした。シーケンシングで得られた各リード配列をヒトゲノムのリファレンス配列であるhg19 AmpliSeq Transcriptome ERCC v1を用いて遺伝子マッピングすることで各リード配列の由来する遺伝子を決定した。
3)データ解析及び特徴量遺伝子の選択
上記2)で測定した被験者由来のRNAの発現レベルのデータ(リードカウント値)のうち90%以上の被験者で欠損値ではない発現レベルデータが得られた3570遺伝子のみ以下の解析に使用した。解析では、サンプル間の総リードカウントの違いを補正するため、各リードカウントをRPM値に変換し、補正されたカウント値(Normalized count値)を用い、群間(重症群及び軽症群)でStudent’s t testを行い、p<0.05となる遺伝子を抽出した。その結果、表2に示す、群間で統計学的に有意に発現が変動する109種の遺伝子が得られた。表2の「up」で示される98遺伝子は、重症群で発現レベルがより高かったことから、重症群でその発現レベルが高いマーカー(ポジティブマーカー)であった。表2「down」で示される11遺伝子は、重症群で発現レベルがより低かったことから、重症群でその発現レベルが低いマーカー(ネガティブマーカー)であった。これら109遺伝子を以下の予測モデル構築に用いる特徴量遺伝子として選択した。
Figure 2023073135000007
4)モデル構築
3)で選択した109の特徴量遺伝子の発現レベルデータを、負の二項分布に従うRPM値から正規分布に近似するため、整数1を加算した底2の対数値(Log2(RPM+1)値)に変換した。得られた109の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、更年期障害重症度(重症群か軽症群か)を目的変数として用いて、更年期障害重症度を判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rateを算出した。その結果、109遺伝子全ての発現レベルデータを変数に用いた場合のモデルではOOB error rateは21.7%であり、表2に示す109遺伝子を、更年期障害の重症度を検出するためのマーカーとして使用できることが示された。
実施例2 ランダムフォレスト変数重要度の高い遺伝子を用いた更年期障害重症度判別モデルの構築
1)使用データ
実施例1の3)で取得した90%以上の被験者で欠損値ではない発現レベルデータが得られた3570種の遺伝子を以下の解析に使用した。遺伝子の発現レベルデータを、負の二項分布に従うRPM値から正規分布に近似するため、整数1を加算した底2の対数値(Log2(RPM+1)値)に変換した。
2)特徴量遺伝子の選択
ランダムフォレストのアルゴリズムを用いて、予測モデル構築に用いる特徴量遺伝子の選択を行った。1)で得られた3570遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、更年期障害重症度(重症群か軽症群か)を目的変数として用いて、更年期障害重症度を判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、ジニ係数に基づく変数重要度の上位82遺伝子を算出した(表3)。これら82遺伝子を予測モデル構築に用いる特徴量遺伝子として選択した。
Figure 2023073135000008
3)モデル構築
2)で選択した82の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、更年期障害重症度(重症群か軽症群か)を目的変数として用いて、更年期障害重症度を判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rate)を算出した。その結果、82遺伝子の発現レベルデータを変数に用いた場合のモデルではOOB error rateは17.4%であり、表3に示す82遺伝子を、更年期障害の重症度を検出するためのマーカーとして使用できることが示された。
実施例3 Boruta法により抽出した特徴量遺伝子を用いた更年期障害重症度判別モデルの構築
1)使用データ
実施例1の3)で取得した90%以上の被験者で欠損値ではない発現レベルデータが得られた3570種の遺伝子を以下の解析に使用した。遺伝子の発現レベルデータを、負の二項分布に従うRPM値から正規分布に近似するため、整数1を加算した底2の対数値(Log2(RPM+1)値)に変換した。
2)特徴量遺伝子の選択
1)で得られた3570遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、更年期障害重症度(重症群か軽症群か)を目的変数として用いて、R言語の“Boruta”パッケージのアルゴリズムを実行し、更年期障害重症度を判別する予測モデルを構築した。最大試行回数を1000回とし、p値が0.01未満であるABI1、DDOST、HYOU1、SLC39A7の4遺伝子(下記表4)を選出した。これら4遺伝子を予測モデル構築に用いる特徴量遺伝子として選択した。
Figure 2023073135000009
3)モデル構築
2)で選択した4の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、更年期障害重症度(重症群か軽症群か)を目的変数として用いて、更年期障害重症度を判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rate)を算出した。その結果、4遺伝子の発現レベルデータを変数に用いた場合のモデルではOOB error rateは23.9%であり、表4に示す4遺伝子を、更年期障害の重症度を検出するためのマーカーとして使用できることが示された。
実施例4 実施例1~3の2つ以上で重複して用いられた特徴量遺伝子に基づく更年期障害重症度判別モデルの構築
1)特徴量遺伝子の選択
実施例1~3で用いられた特徴量遺伝子のうち、実施例1と2で重複して用いられた遺伝子は14遺伝子、実施例1と3で重複して用いられた遺伝子は3遺伝子、実施例2と3で重複して用いられた遺伝子は1遺伝子、実施例1~3の全てで重複して用いられた遺伝子は1遺伝子であり、実施例間で重複して用いられた遺伝子は計16遺伝子(表1)であった。これら16遺伝子を予測モデル構築に用いる特徴量遺伝子として選択した。
2)モデル構築
1)で選択した16の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、更年期障害重症度(重症群か軽症群か)を目的変数として用いて、更年期障害重症度を判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rate)を算出した。その結果、16遺伝子の発現レベルデータを変数に用いた場合のモデルではOOB error rateは21.7%であり、上記16遺伝子を、更年期障害の重症度を検出するためのマーカーとして使用できることが示された。
実施例5 実施例1~3で用いられた全ての特徴量遺伝子に基づく更年期障害重症度判別モデルの構築
1)特徴量遺伝子の選択
実施例1~3のいずれかで用いられた特徴量遺伝子の全て(計178種の遺伝子)を予測モデル構築に用いる特徴量遺伝子として選択した。表5に、178種の遺伝子のGene SymbolとNCBI Gene IDを示す。
Figure 2023073135000010
2)モデル構築
1)で選択した178の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、更年期障害重症度(重症群か軽症群か)を目的変数として用いて、更年期障害重症度を判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rate)を算出した。その結果、178遺伝子の発現レベルデータを変数に用いた場合のモデルではOOB error rateは26.1%であり、表5の178遺伝子を、更年期障害の重症度を検出するためのマーカーとして使用できることが示された。

Claims (14)

  1. 被験者から採取された生体試料について、下記表1で示される16種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者における更年期障害の重症度を検出する方法。
    Figure 2023073135000011
  2. 前記16種の遺伝子群から選択される遺伝子と、下記表2Aで示される93種の遺伝子群から選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、請求項1記載の検出方法。
    Figure 2023073135000012
  3. 前記16種の遺伝子のうち、下記表1Aで示される14種の遺伝子群から選択される遺伝子と、下記表3Aで示される68種の遺伝子群から選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、請求項1記載の検出方法。
    Figure 2023073135000013
    Figure 2023073135000014
  4. 前記16種の遺伝子のうち、下記表1Bで示される3種の遺伝子群から選択される遺伝子と、ABI1又はその発現産物の発現レベルが測定される、請求項1記載の検出方法。
    Figure 2023073135000015
  5. 前記16種の遺伝子群から選択される遺伝子と、下記表5Aで示される162種の遺伝子群から選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、請求項1記載の検出方法。
    Figure 2023073135000016
  6. 重症度がクッパーマン更年期障害指数に基づく重症度である、請求項1~5のいずれか1項記載の検出方法。
  7. 前記遺伝子又はその発現産物の発現レベルがmRNAの発現量である請求項1~6のいずれか1項記載の検出方法。
  8. 前記生体試料が被験者の皮膚表上脂質である請求項1~7のいずれか1項記載の検出方法。
  9. 前記被験者の皮膚が顔の皮膚である請求項8記載の検出方法。
  10. 発現レベルの測定値を前記各遺伝子又はその発現産物の参照値と比較し、更年期障害の重症度を評価する、請求項1~9のいずれか1項記載の検出方法。
  11. 重症群由来の前記遺伝子又はその発現産物の発現レベルと、軽症群由来の同遺伝子又はその発現産物の発現レベルの測定値を教師サンプルとして、重症群と軽症群を分ける判別式を作成し、被験者の生体試料から得られた同遺伝子又はその発現産物の発現レベルの測定値を当該判別式に代入し、得られた結果を参照値と比較することによって、被験者における更年期障害の重症度を評価する、請求項1~10のいずれか1項記載の検出方法。
  12. 更年期障害に対する予防又は治療的介入の存在下、被験者から採取された生体試料について、前記表1で示される16種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定することを含む、当該介入効果の評価方法。
  13. 生体試料の採取及び保存に必要な用具及び試薬、並びに生体試料から前記遺伝子又はその発現産物の発現レベルを測定するための試薬を含有する、請求項1~11のいずれか1項記載の検出方法に用いられる更年期障害の重症度を検出するための検査用キット又は請求項12記載の方法に用いられる介入効果の評価用キット。
  14. 下記表5で示される178種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる、更年期障害の重症度を検出するためのマーカー。
    Figure 2023073135000017
JP2021185983A 2021-11-15 2021-11-15 更年期障害の重症度の検出方法 Pending JP2023073135A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021185983A JP2023073135A (ja) 2021-11-15 2021-11-15 更年期障害の重症度の検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021185983A JP2023073135A (ja) 2021-11-15 2021-11-15 更年期障害の重症度の検出方法

Publications (1)

Publication Number Publication Date
JP2023073135A true JP2023073135A (ja) 2023-05-25

Family

ID=86425089

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021185983A Pending JP2023073135A (ja) 2021-11-15 2021-11-15 更年期障害の重症度の検出方法

Country Status (1)

Country Link
JP (1) JP2023073135A (ja)

Similar Documents

Publication Publication Date Title
EP2494065B1 (en) Means and methods for non-invasive diagnosis of chromosomal aneuploidy
JP2023157965A (ja) アトピー性皮膚炎の検出方法
WO2021230379A1 (ja) パーキンソン病の検出方法
JP2023073135A (ja) 更年期障害の重症度の検出方法
US20210087634A1 (en) Determination of risk for development of cardiovascular disease by measuring urinary levels of podocin and nephrin messenger rna
WO2022220299A1 (ja) 乳幼児顔湿疹の症度の検出方法
JP2023073134A (ja) ホットフラッシュの検出方法
WO2022220298A1 (ja) 乳幼児おむつ皮膚炎の症度の検出方法
JP2023048810A (ja) 慢性ストレスレベルの検出方法
JP2023048811A (ja) 疲労の検出方法
JP2023045067A (ja) 不眠の検出方法
JP2023002298A (ja) 糖尿病指標値の検出方法
WO2022186296A1 (ja) アトピー性皮膚炎の症度悪化の検出方法
WO2022186297A1 (ja) アトピー性皮膚炎による皮膚痒みの症度悪化の検出方法
JP2022016416A (ja) アトピー性皮膚炎の重症度の検出方法
JP2021175382A (ja) 乳幼児アトピー性皮膚炎の検出方法
WO2022059745A1 (ja) 乳幼児アトピー性皮膚炎の検出方法
JP2023002299A (ja) 内臓脂肪面積の検出方法
JP2024045047A (ja) 肥満改善剤の有効性予測方法
JP2024045048A (ja) 肥満改善剤の有効性予測方法
JP2023069499A (ja) 乾燥による皮膚表面形状悪化の検出方法
WO2022114200A1 (ja) アトピー性皮膚炎の症度の検出方法
CN116377053A (zh) 冠状动脉扩张症的诊断生物标志物及其应用
WO2022114201A1 (ja) アトピー性皮膚炎の症度変化の検出方法
EP2818546B1 (en) Method for determining rheumatoid arthritis activity indicator, and biomarker used therein