特許文献1には、上記のとおり、miR−135a及びその前駆体と、その他の数十個のmiRNAを組み合わせてがんの評価をすること、及び対象とするがんの1例として胆管がんが記載されているが、胆管がん患者の生体試料におけるmiR−135a及びその前駆体の具体的な精度、感度、特異度などの検出性能についての記載はなく、また、数個程度のマーカーを組み合わせることにより簡便に、かつ高精度に判別しようとすることについて記載もない。また、具体的にどのような検体を用いて胆管がんを診断できるのかについても記載されていない。
このように、既知の腫瘍マーカーは検出性能が検証されていないか、検証されていても精度及び/又は感度及び/又は特異度に乏しい。そのため、これらを用いて胆管がんを検出しようとしても、健常体を胆管がん患者と誤検出することによる無駄な追加検査が必要となり、また胆管がん患者を見落とすことによる治療機会の逸失がおこる可能性がある。また、数十個のmiRNAを測定することは検査費用を増大させるため、健康診断のような大規模なスクリーニングには使用しづらい。また、miRNAを測定するために胆管組織を採取することは患者に与える侵襲性が高く好ましくないため、低侵襲に採取できる、例えば血液を使用することが可能で、胆管がん患者を胆管がん患者と、健常体を健常体と正しく判別できる精度の高い胆管がんマーカーが求められる。特に、胆管がんは早期発見による切除が唯一の根治治療となるため、感度の高い胆管がんマーカーが切望されている。
本発明の課題は、精度、感度及び特異度のいずれも高い、新規な胆管がん腫瘍マーカーを提供し、当該マーカーに特異的に結合可能な核酸を用いて胆管がんを効果的に検出できる方法を提供することである。
本発明者らは上記課題を解決すべく鋭意検討の結果、胆管がんの検出マーカーに使用可能な新たな遺伝子を見出した。そして、これに特異的に結合可能な核酸を用いることにより、胆管がんを有意に検出できることを見いだし、本発明を完成するに至った。
<発明の概要>
すなわち、本発明は、以下の特徴を有する。
(1)miR−204−3p、miR−3678−3p、miR−760、miR−4675及びmiR−5001−5pから選択される少なくとも1つ以上のポリヌクレオチドと特異的に結合可能な核酸プローブを含む、胆管がんの検出用キット。
(2)miR−204−3pがhsa−miR−204−3p、miR−3678−3pがhsa−miR−3678−3p、miR−760がhsa−miR−760、miR−4675がhsa−miR−4675、miR−5001−5pがhsa−miR−5001−5pである、(1)に記載のキット。
(3)前記核酸プローブが、下記の(a)〜(e)に示すポリヌクレオチド:
(a)配列番号1〜5で表される塩基配列もしくは当該塩基配列においてuがtである塩基配列からなるポリヌクレオチド、その変異体、又は15以上の連続した塩基を含むその断片、
(b)配列番号1〜5で表される塩基配列を含むポリヌクレオチド、
(c)配列番号1〜5で表される塩基配列もしくは当該塩基配列においてuがtである塩基配列に相補的な塩基配列からなるポリヌクレオチド、その変異体、又は15以上の連続した塩基を含むその断片、
(d)配列番号1〜5で表される塩基配列もしくは当該塩基配列においてuがtである塩基配列に相補的な塩基配列を含むポリヌクレオチド、及び
(e)前記(a)〜(d)のいずれかのポリヌクレオチドとストリンジェントな条件でハイブリダイズするポリヌクレオチド、
からなる群から選択される、(1)又は(2)に記載のキット。
(4)前記核酸プローブに、miR−135a−3pのポリヌクレオチドと特異的に結合可能な核酸プローブをさらに含む、(1)〜(3)のいずれかに記載のキット。
(5)miR−135a−3pがhsa−miR−135a−3pである、(4)に記載のキット。
(6)前記のさらに含む核酸プローブが、下記の(f)〜(j)に示すポリヌクレオチド:
(f)配列番号6で表される塩基配列もしくは当該塩基配列においてuがtである塩基配列からなるポリヌクレオチド、その変異体、又は15以上の連続した塩基を含むその断片、
(g)配列番号6で表される塩基配列を含むポリヌクレオチド、
(h)配列番号6で表される塩基配列もしくは当該塩基配列においてuがtである塩基配列に相補的な塩基配列からなるポリヌクレオチド、その変異体、又は15以上の連続した塩基を含むその断片、
(i)配列番号6で表される塩基配列もしくは当該塩基配列においてuがtである塩基配列に相補的な塩基配列を含むポリヌクレオチド、及び
(j)前記(f)〜(i)のいずれかのポリヌクレオチドとストリンジェントな条件でハイブリダイズするポリヌクレオチド、
からなる群から選択されるポリヌクレオチドである、(4)又は(5)に記載のキット。
(7)miR−204−3p、miR−3678−3p、miR−760、miR−4675及びmiR−5001−5pから選択される少なくとも1つ以上のポリヌクレオチドと特異的に結合可能な核酸プローブを用いて、被験体の生体試料における標的核酸の発現量を測定し、該発現量を用いて被験体が胆管がんに罹患していること、又は胆管がんに罹患していないことをin vitroで判定することを含む、胆管がんの検出方法。
(8)miR−204−3pがhsa−miR−204−3p、miR−3678−3pがhsa−miR−3678−3p、miR−760がhsa−miR−760、miR−4675がhsa−miR−4675、miR−5001−5pがhsa−miR−5001−5pである、(7)に記載の方法。
(9)前記核酸プローブが、下記の(a)〜(e)に示すポリヌクレオチド:
(a)配列番号1〜5で表される塩基配列もしくは当該塩基配列においてuがtである塩基配列からなるポリヌクレオチド、その変異体、又は15以上の連続した塩基を含むその断片、
(b)配列番号1〜5で表される塩基配列を含むポリヌクレオチド、
(c)配列番号1〜5で表される塩基配列もしくは当該塩基配列においてuがtである塩基配列に相補的な塩基配列からなるポリヌクレオチド、その変異体、又は15以上の連続した塩基を含むその断片、
(d)配列番号1〜5で表される塩基配列もしくは当該塩基配列においてuがtである塩基配列に相補的な塩基配列を含むポリヌクレオチド、及び
(e)前記(a)〜(d)のいずれかのポリヌクレオチドとストリンジェントな条件でハイブリダイズするポリヌクレオチド、
からなる群から選択される、(7)又は(8)に記載の方法。
(10)前記核酸プローブに、miR−135a−3pのポリヌクレオチドと特異的に結合可能な核酸プローブをさらに含む、(7)〜(9)のいずれかに記載の方法。
(11)miR−135a−3pがhsa−miR−135a−3pである、(10)に記載の方法。
(12)前記のさらに含む核酸プローブが、下記の(f)〜(j)に示すポリヌクレオチド:
(f)配列番号6で表される塩基配列もしくは当該塩基配列においてuがtである塩基配列からなるポリヌクレオチド、その変異体、又は15以上の連続した塩基を含むその断片、
(g)配列番号6で表される塩基配列を含むポリヌクレオチド、
(h)配列番号6で表される塩基配列もしくは当該塩基配列においてuがtである塩基配列に相補的な塩基配列からなるポリヌクレオチド、その変異体、又は15以上の連続した塩基を含むその断片、
(i)配列番号6で表される塩基配列もしくは当該塩基配列においてuがtである塩基配列に相補的な塩基配列を含むポリヌクレオチド、及び
(j)前記(f)〜(i)のいずれかのポリヌクレオチドとストリンジェントな条件でハイブリダイズするポリヌクレオチド、
からなる群から選択されるポリヌクレオチドである、(10)又は(11)に記載の方法。
(13)前記被験体が、ヒトである、(7)〜(12)のいずれかに記載の方法。
(14)前記生体試料が、血液、血清又は血漿である、(7)〜(13)のいずれかに記載の方法。
<用語の定義>
本明細書中で使用する用語は、以下の定義を有する。
ヌクレオチド、ポリヌクレオチド、DNA、RNAなどの略号による表示は、「塩基配列又はアミノ酸配列を含む明細書等の作成のためのガイドライン」(日本国特許庁編)及び当技術分野における慣用に従うものとする。
本明細書において「ポリヌクレオチド」とは、RNA及びDNAのいずれも包含する核酸に対して用いられる。なお、上記DNAには、cDNA、ゲノムDNA、及び合成DNAのいずれもが含まれる。また上記RNAには、total RNA、mRNA、rRNA、miRNA、siRNA、snoRNA、snRNA、non−coding RNA及び合成RNAのいずれもが含まれる。また、本明細書では、ポリヌクレオチドは核酸と互換的に使用される。
本明細書において「断片」とは、ポリヌクレオチドの連続した一部分の塩基配列を有するポリヌクレオチドであり、15塩基以上の長さを有することが望ましい。
本明細書において「遺伝子」とは、RNA、及び2本鎖DNAのみならず、それを構成する正鎖(又はセンス鎖)又は相補鎖(又はアンチセンス鎖)などの各1本鎖DNAを包含することを意図して用いられる。またその長さによって特に制限されるものではない。
従って、本明細書において「遺伝子」は、特に言及しない限り、ヒトゲノムDNAを含む2本鎖DNA、cDNAを含む1本鎖DNA(正鎖)、当該正鎖と相補的な配列を有する1本鎖DNA(相補鎖)、マイクロRNA(miRNA)、及びこれらの断片、ヒトゲノム、及びそれらの転写産物のいずれも含む。また当該「遺伝子」は特定の塩基配列(又は配列番号)で表される「遺伝子」だけではなく、これらによってコードされるRNAと生物学的機能が同等であるRNA、例えば同族体(すなわち、ホモログもしくはオーソログ)、遺伝子多型などの変異体、及び誘導体をコードする「核酸」が包含される。かかる同族体、変異体又は誘導体をコードする「核酸」としては、具体的には、後に記載したストリンジェントな条件下で、配列番号1〜22で表される塩基配列、もしくは当該塩基配列においてuがtである塩基配列、の相補配列とハイブリダイズする塩基配列を有する「核酸」を挙げることができる。なお、「遺伝子」は、機能領域の別を問うものではなく、例えば発現制御領域、コード領域、エキソン又はイントロンを含むことができる。また、「遺伝子」は細胞に含まれていてもよく、細胞外に放出されて単独で存在していてもよく、またエキソソームと呼ばれる小胞に内包された状態にあってもよい。
本明細書において「エキソソーム」又は「エクソソーム」とは、細胞から分泌される脂質二重膜に包まれた小胞である。エキソソームは多胞エンドソームに由来し、細胞外環境に放出される際にRNA、DNA等の「遺伝子」やタンパク質などの生体物質を内部に含むことがある。エキソソームは血液、血清、血漿、リンパ液等の体液に含まれることが知られている。
本明細書において「転写産物」とは、遺伝子のDNA配列を鋳型にして合成されたRNAのことをいう。RNAポリメラーゼが遺伝子の上流にあるプロモーターと呼ばれる部位に結合し、DNAの塩基配列に相補的になるように3'末端にリボヌクレオチドを結合させていく形でRNAが合成される。このRNAには遺伝子そのもののみならず、発現制御領域、コード領域、エキソン又はイントロンをはじめとする転写開始点からポリA配列の末端にいたるまでの全配列が含まれる。
また、本明細書において「マイクロRNA(miRNA)」は、特に言及しない限り、ヘアピン様構造のRNA前駆体として転写され、RNase III切断活性を有するdsRNA切断酵素により切断され、RISCと称するタンパク質複合体に取り込まれ、mRNAの翻訳抑制に関与する15〜25塩基の非コーディングRNAを意図して用いられる。また本明細書で使用する「miRNA」は特定の塩基配列(又は配列番号)で表される「miRNA」だけではなく、当該「miRNA」の前駆体(pre−miRNA、pri−miRNA)を含有し、これらによってコードされるmiRNAと生物学的機能が同等であるmiRNA、例えば同族体(すなわち、ホモログもしくはオーソログ)、遺伝子多型などの変異体、及び誘導体をコードする「miRNA」も包含する。かかる前駆体、同族体、変異体又は誘導体をコードする「miRNA」としては、具体的には、miRBase release 20(http://www.mirbase.org/)により同定することができ、後に記載したストリンジェントな条件下で、配列番号1〜22で表されるいずれかの特定塩基配列の相補配列とハイブリダイズする塩基配列を有する「miRNA」を挙げることができる。
本明細書において「プローブ」とは、遺伝子の発現によって生じたRNA又はそれに由来するポリヌクレオチドを特異的に検出するために使用されるポリヌクレオチド及び/又はそれに相補的なポリヌクレオチドを包含する。
本明細書において「プライマー」とは、遺伝子の発現によって生じたRNA又はそれに由来するポリヌクレオチドを特異的に認識し、増幅する、連続するポリヌクレオチド及び/又はそれに相補的なポリヌクレオチドを包含する。
ここで相補的なポリヌクレオチド(相補鎖、逆鎖)とは、配列番号1〜22によって定義される塩基配列、もしくは当該塩基配列においてuがtである塩基配列、からなるポリヌクレオチドの全長配列、又はその部分配列(ここでは便宜上、これを正鎖と呼ぶ)に対してA:T(U)、G:Cといった塩基対関係に基づいて、塩基的に相補的な関係にあるポリヌクレオチドを意味する。ただし、かかる相補鎖は、対象とする正鎖の塩基配列と完全に相補配列を形成する場合に限らず、対象とする正鎖とストリンジェントな条件でハイブリダイズできる程度の相補関係を有するものであってもよい。
本明細書において「ストリンジェントな条件」とは、核酸プローブが他の配列に対するよりも、検出可能により大きな程度(例えばバックグラウンド測定値の平均+バックグラウンド測定値の標準誤差×2以上の測定値)で、その標的配列に対してハイブリダイズする条件をいう。ストリンジェントな条件は配列依存性であり、ハイブリダイゼーションが行われる環境によって異なる。ハイブリダイゼーション及び/又は洗浄条件のストリンジェンシーを制御することにより、核酸プローブに対して100%相補的である標的配列が同定され得る。
本明細書において「Tm値」とは、ポリヌクレオチドの二本鎖部分が一本鎖へと変性し、二本鎖と一本鎖が1:1の比で存在する温度を意味する。
本明細書において「断片」とは、配列番号で表される塩基配列、もしくは該塩基配列においてuがtである塩基配列、もしくはそれらに相補的な塩基配列からなる核酸を意味する。
本明細書において「変異体」とは、核酸の場合、多型性、突然変異などに起因した天然の変異体、あるいは配列番号で表される塩基配列、もしくは当該塩基配列においてuがtである塩基配列、又はその部分配列において1、2もしくは3又はそれ以上の塩基の欠失、置換、付加又は挿入を含む変異体、あるいは配列番号1〜22の配列の前駆体RNA(premature miRNA)の塩基配列、もしくは当該塩基配列においてuがtである塩基配列、又はその部分配列において1又は2以上の塩基の欠失、置換、付加又は挿入を含む変異体、あるいは当該塩基配列の各々又はその部分配列と約90%以上、約95%以上、約97%以上、約98%以上、約99%以上の%同一性を示す変異体、あるいは当該塩基配列又はその部分配列を含むポリヌクレオチド又はオリゴヌクレオチドと上記定義のストリンジェントな条件でハイブリダイズする核酸を意味する。
本明細書において「数個」とは、約10、9、8、7、6、5、4、3又は2個の整数を意味する。
本明細書において、変異体は、部位特異的突然変異誘発法、PCR法を利用した突然変異導入法などの周知の技術を用いて作製可能である。
本明細書において「%同一性」は、上記のBLASTやFASTAによるタンパク質又は遺伝子の検索システムを用いて、ギャップを導入して、又はギャップを導入しないで、決定することができる(Zheng Zhangら、2000年、J. Comput. Biol.、7巻、p203−214;Altschul,S.F.ら、1990年、Journal of Molecular Biology、第215巻、p403−410;Pearson,W.R.ら、1988年、Proc. Natl. Acad. Sci. U. S. A.、第85巻、p2444−2448)。
本明細書において「誘導体」とは、修飾核酸、非限定的に例えば、蛍光団などによるラベル化誘導体、修飾ヌクレオチド(例えばハロゲン、メチルなどのアルキル、メトキシなどのアルコキシ、チオ、カルボキシメチルなどの基を含むヌクレオチド及び塩基の再構成、二重結合の飽和、脱アミノ化、酸素分子の硫黄分子への置換などを受けたヌクレオチドなど)を含む誘導体、PNA(peptide nucleic acid; Nielsen,P.E.ら、1991年、Science、254巻、p1497−500)、LNA(locked nucleic acid; Obika,S.ら,1998年、Tetrahedron Lett.、39巻、p5401−5404)などを含むことを意味する。
本明細書において「核酸プローブ」又は「プライマー」は、被験体中の胆管がんの有無を検出するために、又は胆管がんの罹患の有無、罹患の程度、胆管がんの改善の有無や改善の程度、胆管がんの治療に対する感受性を診断するために、あるいは胆管がんの予防、改善又は治療に有用な候補物質をスクリーニングするために、直接又は間接的に利用される。これらには胆管がんの罹患に関連して生体内、特に血液、尿等の体液等の生体試料において配列番号1〜22で表される転写産物又はそのcDNA合成核酸を特異的に認識し結合することのできるヌクレオチド、オリゴヌクレオチド及びポリヌクレオチドを包含する。これらのヌクレオチド、オリゴヌクレオチド及びポリヌクレオチドは、上記性質に基づいて生体内、組織や細胞内などで発現した上記遺伝子を検出するためのプローブとして、また生体内で発現した上記遺伝子を増幅するためのプライマーとして有効に利用することができる。
本明細書で使用する「検出」という用語は、検査、測定、検出又は、判定支援という用語で置換しうる。
本明細書で使用される「被験体」は、ヒト、チンパンジーを含む霊長類、イヌ、ネコなどのペット動物、ウシ、ウマ、ヒツジ、ヤギなどの家畜動物、マウス、ラットなどの齧歯類などの哺乳動物を意味する。また、「健常体」もまた、このような哺乳動物であって、検出しようとするがんに罹患していない動物を意味する。
本明細書で使用される「P」又は「P値」とは、統計学的検定において、帰無仮説の下で実際にデータから計算された統計量よりも極端な統計量が観測される確率を示す。したがって「P」又は「P値」が小さいほど、比較対象間に有意差があるとみなせる。
本明細書において、「感度」は、(真陽性の数)/(真陽性の数+偽陰性の数)の値を意味する。感度が高ければ胆管がんを早期に発見することが可能となり、完全ながん部の切除や再発率の低下につながる。
本明細書において、「特異度」は、(真陰性の数)/(真陰性の数+偽陽性の数)を意味する。特異度が高ければ健常体を胆管がん患者と誤判別することによる無駄な追加検査の実施を防ぎ、患者の負担の軽減や医療費の削減につながる。
本明細書において、「精度」は(真陽性の数+真陰性の数)/(全症例数)の値を意味する。精度は全検体に対しての判別結果が正しかった割合を示しており、診断性能を評価する第一の指標となる。
本明細書において、「Fold change」は遺伝子の発現値をlog2−scaleに変換した場合の、(胆管がん患者群の中央値−健常体群の中央値)で算出される。Fold changeの絶対値が大きいほど2群の中央値の差が大きいことを意味する。
本明細書において、「AUROC値」とは、受信者動作特性曲線(ROC曲線)下の面積を意味し、患者を陽性群と陰性群に分けるための予測、判定、検出又は診断の方法の精度を測る指標となる。これらの曲線では、評価対象となる方法が示す結果に関して、縦軸に陽性患者において陽性の結果がでる確率(感度)と、横軸に陰性患者において陰性の結果がでる確率(特異度)を1から減算した値(偽陽性率)がプロットされる。
本明細書において判定、検出又は診断の対象となる「試料」とは、胆管がんの発生、胆管がんの進行、及び胆管がんに対する治療効果の発揮にともない本発明の遺伝子が発現変化する組織及び生体材料を指す。具体的には胆管組織及びその周辺の脈管、リンパ節及び臓器、また転移が疑われる臓器、皮膚、及び血液、尿、唾液、汗、組織浸出液などの体液、血液から調整された血清、血漿、その他、便、毛髪などを指す。
本明細書で使用される「hsa−miR−204−3p遺伝子」又は「hsa−miR−204−3p」という用語は、配列番号1に記載のhsa−miR−204−3p遺伝子(miRBase Accession No.MIMAT0022693)やその他生物種ホモログもしくはオーソログなどが包含される。hsa−miR−204−3p遺伝子は、Landgraf Pら、2007年、Cell.、第129号、p.1401−1414に記載される方法によって得ることができる。また、「hsa−miR−204−3p」は、その前駆体としてヘアピン様構造をとる「hsa−mir−204」(miRBase Accession No.MI0000284、配列番号7)が知られている。
本明細書で使用される「hsa−miR−3678−3p遺伝子」又は「hsa−miR−3678−3p」という用語は、配列番号2に記載のhsa−miR−3678−3p遺伝子(miRBase Accession No.MIMAT0018103)やその他生物種ホモログもしくはオーソログなどが包含される。hsa−miR−3678−3p遺伝子は、Vaz Cら、2010年、Cancer Res.、第11巻、p.288に記載される方法によって得ることができる。また、「hsa−miR−3678−3p」は、その前駆体としてヘアピン様構造をとる「hsa−mir−3678」(miRBase Accession No.MI0016079、配列番号8)が知られている。
本明細書で使用される「hsa−miR−760遺伝子」又は「hsa−miR−760」という用語は、配列番号3に記載のhsa−miR−760遺伝子(miRBase Accession No.MIMAT0004957)やその他生物種ホモログもしくはオーソログなどが包含される。hsa−miR−760遺伝子は、Landgraf P.ら、2007年、Cell.、第129巻、p.1401−1414に記載される方法によって得ることができる。また、「hsa−miR−760」は、その前駆体としてヘアピン様構造をとる「hsa−mir−760」(miRBase Accession No.MI0005567、配列番号9)が知られている。
本明細書で使用される「hsa−miR−4675遺伝子」又は「hsa−miR−4675」という用語は、配列番号4に記載のhsa−miR−4675遺伝子(miRBase Accession No.MIMAT0019757)やその他生物種ホモログもしくはオーソログなどが包含される。hsa−miR−4675遺伝子は、Persson Hら、2011年、Cancer Res.、第71巻、p.78−86に記載される方法によって得ることができる。また、「hsa−miR−4675」は、その前駆体としてヘアピン様構造をとる「hsa−mir−4675」(miRBase Accession No.MI0017306、配列番号10)が知られている。
本明細書で使用される「hsa−miR−5001−5p遺伝子」又は「hsa−miR−5001−5p」という用語は、配列番号5に記載のhsa−miR−5001−5p遺伝子(miRBase Accession No.MIMAT0021021)やその他生物種ホモログもしくはオーソログなどが包含される。hsa−miR−5001−5p遺伝子は、Cummins JM.ら、2006年、Proc Natl Acad Sci U S A.、第103巻、p.3687−3692に記載される方法によって得ることができる。また、「hsa−miR−5001−5p」は、その前駆体としてヘアピン様構造をとる「hsa−mir−5001」(miRBase Accession No.MI0017867、配列番号11)が知られている。
本明細書で使用される「hsa−miR−135a−3p遺伝子」又は「hsa−miR−135a−3p」という用語は、配列番号6に記載のhsa−miR−135a−3p遺伝子(miRBase Accession No.MIMAT0004595)やその他生物種ホモログもしくはオーソログなどが包含される。hsa−miR−135a−3p遺伝子は、Landgraf P.ら、2007年、Cell.、第129巻、p.1401−1414に記載される方法によって得ることができる。また、「hsa−miR−135a−3p」は、その前駆体としてヘアピン様構造をとる「hsa−mir−135a−1」(miRBase Accession No.MI0000452、配列番号12)が知られている。
また、成熟型のmiRNAは、ヘアピン様構造をとるRNA前駆体から成熟型miRNAとして切出されるときに、配列の前後1〜数塩基が短く、又は長く切出されることや、塩基の置換が生じて変異体となることがあり、isomiRと称される(Morin RD.ら、2008年、Genome Res.、第18巻、p.610−621)。miRBase Release20では、配列番号1〜6で表される塩基配列のほかに、数々のisomirと呼ばれる配列番号14〜22で表される塩基配列の変異体及び断片も示されている。これらの変異体もまた、配列番号1〜6で表される塩基配列のmiRNAとして得ることができる。
すなわち、本発明の配列番号1〜3及び5〜6で表される塩基配列もしくは該塩基配列においてuがtである塩基配列からなるポリヌクレオチド、の変異体の例としては、それぞれ配列番号13、15、17、19、21で表されるポリヌクレオチド、及びmiRBaseに登録された、配列番号13、15、17、19、21の数々のisomirであるポリヌクレオチドが挙げられる。また、本発明の配列番号1〜3及び5〜6で表される塩基配列もしくは該塩基配列においてuがtである塩基配列からなるポリヌクレオチド、の断片の例としては、それぞれ配列番号14、16、18、20、22で表される配列のポリヌクレオチドが挙げられる。さらに、配列番号1〜6で表される塩基配列を含むポリヌクレオチドの例としては、それぞれ前駆体である配列番号7〜12で表されるポリヌクレオチドが挙げられる。
本明細書において「特異的に結合可能な」とは、本発明で使用する核酸プローブ又はプライマーが、特定の標的核酸と結合し、他の核酸と実質的に結合できないことを意味する。
本発明により、胆管がんを容易にかつ高い精度、感度及び特異度で検出することが可能になった。
特に、本発明によれば、低侵襲的に採取できる患者の血液、血清及び/又は血漿のサンプルを使用することが可能であり、このサンプル中の数個のmiRNA測定値を指標とすることで、容易かつ高い精度、感度及び特異度にて胆管がんの有無を検出することができる。
以下に本発明をさらに具体的に説明する
1.胆管がんの標的核酸
本発明の上記定義の胆管がん検出用の核酸プローブ又はプライマーを使用して、胆管がん又は胆管がん細胞の存在及び/又は不存在を検出するための、胆管がんマーカーとしての主要な標的核酸には、miR−204−3p、miR−3678−3p、miR−760、miR−4675及びmiR−5001−5pからなる群から選択される少なくとも1つ以上のmiRNAが含まれる。さらにこれらのmiRNAと組み合わせることができる他の胆管がんマーカー、すなわち、miR−135a−3pのmiRNAも標的核酸として好ましく用いることができる。
上記のmiRNAには、例えば、配列番号1〜6で表される塩基配列を含むヒト遺伝子(すなわち、それぞれ、hsa−miR−204−3p、hsa−miR−3678−3p、hsa−miR−760、hsa−miR−4675、hsa−miR−5001−5p、hsa−miR−135a−3p)、その同族体、その転写産物、あるいは及びその変異体又は誘導体が含まれる。ここで、遺伝子、同族体、転写産物、変異体及び誘導体は、上記定義のとおりである。
好ましい標的核酸は、配列番号1〜22で表される塩基配列を含むヒト遺伝子、その転写産物、より好ましくは当該転写産物、すなわちmiRNA、その前駆体RNAであるpri−miRNA及びpre−miRNAである。
本発明において胆管がんの標的となる上記遺伝子はいずれも、健常体と比べて胆管がんに罹患した被験体において発現量が変化しているものである(後述の実施例1を参照)。
第1の標的遺伝子は、hsa−miR−204−3p遺伝子、それらの同族体、それらの転写産物、あるいはそれらの変異体又は誘導体である。これまでに遺伝子又はその転写産物の発現の変化が胆管がんのマーカーになりうるという報告は知られていない。
第2の標的遺伝子は、hsa−miR−3678−3p遺伝子、それらの同族体、それらの転写産物、あるいはそれらの変異体又は誘導体である。これまでに遺伝子又はその転写産物の発現の変化が胆管がんのマーカーになりうるという報告は知られていない。
第3の標的遺伝子は、hsa−miR−760遺伝子、それらの同族体、それらの転写産物、あるいはそれらの変異体又は誘導体である。これまでに遺伝子又はその転写産物の発現の変化が胆管がんのマーカーになりうるという報告は知られていない。
第4の標的遺伝子は、hsa−miR−4675遺伝子、それらの同族体、それらの転写産物、あるいはそれらの変異体又は誘導体である。これまでに遺伝子又はその転写産物の発現の変化が胆管がんのマーカーになりうるという報告は知られていない。
第5の標的遺伝子は、hsa−miR−5001−5p遺伝子、それらの同族体、それらの転写産物、あるいはそれらの変異体又は誘導体である。これまでに遺伝子又はその転写産物の発現の変化が胆管がんのマーカーになりうるという報告は知られていない。
第6の標的遺伝子は、hsa−miR−135a−3p遺伝子、それらの同族体、それらの転写産物、あるいはそれらの変異体又は誘導体である。これまでに遺伝子又はその転写産物の発現の変化が胆管がんのマーカーになりうるという報告が知られている(上記の特許文献1)。
2.胆管がんの検出用の核酸プローブ又はプライマー
本発明において、胆管がんを検出するための、あるいは胆管がんを診断するために使用可能な核酸プローブ又はプライマーは、胆管がんの標的核酸としての、ヒト由来の、hsa−miR−204−3p、hsa−miR−3678−3p、hsa−miR−760、hsa−miR−4675、hsa−miR−5001−5p、あるいはそれらの組み合わせ、並びに、それらと場合により組み合わせることができる、hsa−miR−135a−3p、あるいはそれらの組み合わせ、それらの同族体、それらの転写産物、あるいはそれらの変異体又は誘導体の存在、発現量又は存在量を定性的及び/又は定量的に測定することを可能にする。
上記の標的核酸は、健常体と比べて胆管がんに罹患した被験体において、該標的核酸の種類に応じてそれらの発現量が増加するものもあれば、又は低下するものもある(以下、「増加/低下」と称する。)。それゆえ、本発明の組成物は、胆管がんの罹患が疑われる被験体(例えばヒト)由来の体液と健常体由来の体液について上記標的核酸の発現量を測定し、それらを比較して、胆管がんを検出するために有効に使用することができる。
本発明で使用可能な核酸プローブ又はプライマーは、配列番号1〜5の少なくとも1つで表される塩基配列からなるポリヌクレオチドと特異的に結合可能な核酸プローブ、あるいは、配列番号1〜5の少なくとも1つで表される塩基配列からなるポリヌクレオチドを増幅するためのプライマーである。
本発明で使用可能な核酸プローブ又はプライマーはさらに、配列番号6の少なくとも1つで表される塩基配列からなるポリヌクレオチドと特異的に結合可能な核酸プローブ、あるいは、配列番号6の少なくとも1つで表される塩基配列からなるポリヌクレオチドを増幅するためのプライマーを含むことができる。
具体的には、上記の核酸プローブ又はプライマーは、配列番号1〜22で表される塩基配列、もしくは当該塩基配列においてuがtである塩基配列、を含むポリヌクレオチド群及びその相補的ポリヌクレオチド群、当該塩基配列に相補的な塩基配列からなるDNAとストリンジェントな条件(後述)でそれぞれハイブリダイズするポリヌクレオチド群及びその相補的ポリヌクレオチド群、並びにそれらのポリヌクレオチド群の塩基配列において15以上、好ましくは17以上の連続した塩基を含むポリヌクレオチド群から選ばれた1又は複数のポリヌクレオチドの組み合わせを含む。これらのポリヌクレオチドは、標的核酸である上記胆管がんマーカーを検出するための核酸プローブ及びプライマーとして使用できる。
さらに具体的には、本発明で使用可能な核酸プローブ又はプライマーの例は、以下のポリヌクレオチド(a)〜(e)からなる群から選択される1又は複数のポリヌクレオチドである。
(a)配列番号1〜5のいずれかで表される塩基配列、もしくは当該塩基配列においてuがtである塩基配列、からなるポリヌクレオチド、その変異体、又は15以上の連続した塩基を含むその断片、
(b)配列番号1〜5のいずれかで表される塩基配列を含むポリヌクレオチド、
(c)配列番号1〜5のいずれかで表される塩基配列、もしくは当該塩基配列においてuがtである塩基配列、に相補的な塩基配列からなるポリヌクレオチド、その変異体、又は15以上の連続した塩基を含むその断片、
(d)配列番号1〜5のいずれかで表される塩基配列、もしくは当該塩基配列においてuがtである塩基配列、に相補的な塩基配列を含むポリヌクレオチド、並びに、
(e)前記(a)〜(d)のいずれかのポリヌクレオチドとストリンジェントな条件でハイブリダイズするポリヌクレオチド。
本発明で使用可能な核酸プローブ又はプライマーはさらに、上記のポリヌクレオチド(a)〜(e)から選択される少なくとも1つ以上のポリヌクレオチドの他に、下記の(f)〜(j)に示すポリヌクレオチドを含むことができる。
(f)配列番号6で表される塩基配列もしくは当該塩基配列においてuがtである塩基配列からなるポリヌクレオチド、その変異体、又は15以上の連続した塩基を含むその断片、
(g)配列番号6で表される塩基配列を含むポリヌクレオチド、
(h)配列番号6で表される塩基配列、もしくは当該塩基配列においてuがtである塩基配列、に相補的な塩基配列からなるポリヌクレオチド、その変異体、又は15以上の連続した塩基を含むその断片、
(i)配列番号6で表される塩基配列、もしくは当該塩基配列においてuがtである塩基配列、に相補的な塩基配列を含むポリヌクレオチド、並びに、
(j)前記(f)〜(i)のいずれかのポリヌクレオチドとストリンジェントな条件でハイブリダイズするポリヌクレオチド。
上記のポリヌクレオチドにおいて「15以上の連続した塩基を含むそのポリヌクレオチド」は、各ポリヌクレオチドの塩基配列において、例えば、連続する15〜配列の全塩基数、15〜17塩基などの範囲の塩基数を含むことができるが、これらに限定されないものとする。
本発明で使用される上記ポリヌクレオチド類又はその断片類はいずれもDNAでもよいしRNAでもよい。
本発明で使用可能な上記のポリヌクレオチドは、DNA組換え技術、PCR法、DNA/RNA自動合成機による方法などの一般的な技術を用いて作製することができる。
DNA組換え技術及びPCR法は、例えばAusubelら, Current Protocols in Molecular Biology, John Willey & Sons, US (1993); Sambrookら, Molecular Cloning A Laboratory Manual, Cold Spring Harbor Laboratory Press, US (1989)などに記載される技術を使用することができる。
配列番号1〜6で表されるヒト由来の、hsa−miR−204−3p、hsa−miR−3678−3p、hsa−miR−760、hsa−miR−4675、hsa−miR−5001−5p、hsa−miR−135a−3pは公知であり、前述のようにその取得方法も知られている。このため、この遺伝子をクローニングすることによって、本発明で使用可能な核酸プローブ又はプライマーとしてのポリヌクレオチドを作製することができる。
そのような核酸プローブ又はプライマーは、DNA自動合成装置を用いて化学的に合成することができる。この合成には一般にホスホアミダイト法が使用され、この方法によって約100塩基までの一本鎖DNAを自動合成することができる。DNA自動合成装置は、例えばPolygen社、ABI社、Applied BioSystems社などから市販されている。
あるいは、本発明のポリヌクレオチドは、cDNAクローニング法によって作製することもできる。cDNAクローニング技術は、例えばmicroRNA Cloning Kit Wako(和光純薬工業)などを利用できる。
ここで、配列番号1〜6で表される塩基配列からなるポリヌクレオチドを検出するための核酸プローブ及びプライマーの配列は、miRNA又はその前駆体としては生体内に存在していない。例えば、配列番号2で表される塩基配列は、配列番号8で表される前駆体から生成されるが、この前駆体は図1に示すようなヘアピン様構造を有しており、配列番号2で表される塩基配列は相補鎖に対してミスマッチ配列を有している。このため、配列番号2で表される塩基配列に対する、完全に相補的な塩基配列が生体内で自然に生成されることはない。このため、配列番号1〜6で表される塩基配列を検出するための核酸プローブ及びプライマーは生体内に存在しない人工的な塩基配列を有することになる。
3.胆管がん検出用キット
本発明はまた、本発明において核酸プローブ又はプライマーとして使用可能なポリヌクレオチド(これには、変異体、断片、又は誘導体を含みうる。)の1つ又は複数を含む胆管がん検出用キットを提供する。
本発明のキットは、好ましくは、上記2に記載したポリヌクレオチド類から選択される1又は複数のポリヌクレオチド又はその変異体を含む。
具体的には、本発明のキットは、配列番号1〜5で表される塩基配列、もしくは当該塩基配列においてuがtである塩基配列、を含む(もしくは、からなる)ポリヌクレオチド、その相補的配列を含む(もしくは、からなる)ポリヌクレオチド、それらのポリヌクレオチドとストリンジェントな条件でハイブリダイズするポリヌクレオチド、又はそれらのポリヌクレオチド配列の15以上の連続した塩基を含む変異体又は断片、を少なくとも1つ以上含むことができる。
本発明のキットはさらに、配列番号6で表される塩基配列、もしくは当該塩基配列においてuがtである塩基配列、を含む(もしくは、からなる)ポリヌクレオチド、その相補的配列を含む(もしくは、からなる)ポリヌクレオチド、それらのポリヌクレオチドとストリンジェントな条件でハイブリダイズするポリヌクレオチド、又はそれらのポリヌクレオチド配列の15以上の連続した塩基を含む変異体又は断片、を1つ以上含むことができる。
本発明のキットに含むことができるポリヌクレオチド断片は、例えば下記の(1)〜(2)からなる群より選択される1つ以上、好ましくは2つ以上のDNAである:
(1)配列番号1〜5で表される塩基配列においてuがtである塩基配列又はその相補的配列において、15以上の連続した塩基を含むDNA。
(2)配列番号6で表される塩基配列においてuがtである塩基配列又はその相補的配列において、15以上の連続した塩基を含むDNA。
好ましい実施形態では、前記ポリヌクレオチドが、配列番号1〜5で表される塩基配列、もしくは当該塩基配列においてuがtである塩基配列、からなるポリヌクレオチド、その相補的配列からなるポリヌクレオチド、それらのポリヌクレオチドとストリンジェントな条件でハイブリダイズするポリヌクレオチド、又はそれらの15以上、より好ましくは17以上の連続した塩基を含む変異体である。
また、好ましい実施形態では、前記ポリヌクレオチドが、配列番号6で表される塩基配列、もしくは当該塩基配列においてuがtである塩基配列、からなるポリヌクレオチド、その相補的配列からなるポリヌクレオチド、それらのポリヌクレオチドとストリンジェントな条件でハイブリダイズするポリヌクレオチド、又はそれらの15以上、より好ましくは17以上の連続した塩基を含む変異体である。
好ましい実施形態では、前記断片は、15以上、より好ましくは17以上の連続した塩基を含むポリヌクレオチドであることができる。
本発明において、ポリヌクレオチドの断片のサイズは、各ポリヌクレオチドの塩基配列において、例えば、連続する15〜配列の全塩基数、17〜配列の全塩基数、17〜19塩基などの範囲の塩基数である。
本発明のキットを構成する上記の組み合わせは、具体的には後述の表2、表4又は表5に示されるような配列番号の組み合わせに関する上記のポリヌクレオチドを挙げることができるが、それらはあくまでも例示であり、他の種々の可能な組み合わせのすべてが本発明に包含されるものとする。
本発明のキットには、上で説明した本発明におけるポリヌクレオチド(これには、変異体、断片又は誘導体を包含しうる。)に加えて、胆管がん検出を可能とする既知のポリヌクレオチド又は将来見出されるであろうポリヌクレオチドも包含させることができる。
本発明のキットには、上で説明した本発明におけるポリヌクレオチド、及びその変異体又はその断片に加えて、CEA、CA19−9、DUPAN−2、CA195、CA242、IL−6などの公知の胆管がん検査用マーカーを測定するための抗体も包含させることができる。
本発明のキットに含まれるポリヌクレオチド、及びその変異体又はその断片は、個別に又は任意に組み合わせて異なる容器に包装されうる。
4.胆管がんの検出方法
本発明はさらに、上記3.で説明した本発明のキット(本発明で使用可能な上記の核酸プローブ及び/又はプライマーを含む。)を用いて、生体試料(検体試料)中の、miR−204−3p、miR−3678−3p、miR−760、miR−4675及びmiR−5001−5pで表される胆管がん由来の遺伝子の発現量、並びに場合により、miR−135a−3pで表される胆管がん由来の遺伝子の発現量、をin vitroで測定し、さらに、胆管がんの罹患が疑われる被験体と、健常体(非胆管がん患者を含む)とから採取した血液、血清、血漿等の生体試料を用いて、試料中の上記遺伝子の発現量を比較して、当該生体試料中の標的核酸の発現量に差がある場合、被験体が胆管がんに罹患していると評価することを含む、in vitroでの胆管がんの検出方法を提供する。
本明細書中、胆管がんの検出方法は、胆管がんの検査方法又は胆管がんの検出の支援(若しくは、補助)方法と置換することも可能である。
本発明の上記方法は、低侵襲的に、感度及び特異度の高い、がんの早期診断を可能とし、これにより、早期の治療及び予後の改善をもたらし、さらに、疾病憎悪のモニターや外科的、放射線療法的、及び化学療法的な治療の有効性のモニターを可能にする。
本発明の血液、血清、血漿等の生体試料から胆管がん由来の遺伝子を抽出する方法としては、3D−Gene(登録商標)RNA extraction reagent from liquid sample kit (東レ株式会社)中のRNA抽出用試薬を加えて調整するのが特に好ましいが、一般的な酸性フェノール法(Acid Guanidinium−Phenol−Chloroform(AGPC)法)を用いてもよいし、Trizol(登録商標)(Life Technologies社)用いてもよいし、Trizol(Life technologies社)やIsogen(ニッポンジーン社)などの酸性フェノールを含むRNA抽出用試薬を加えて調製してもよい。さらに、miRNeasy(登録商標)Mini Kit(Qiagen社)などのキットを利用できるが、これらの方法に限定されない。
本発明はまた、本発明のキットの、被験体由来の生体試料中の胆管がん由来のmiRNA遺伝子の発現産物のin vitroでの検出のための使用を提供する。
本発明の上記方法において、上記キットは、上で説明したような、本発明で使用可能なポリヌクレオチドを単一であるいはあらゆる可能な組み合わせで含むものが使用される。
本発明の胆管がんの検出又は(遺伝子)診断において、本発明のキットに含まれるポリヌクレオチドは、プローブ又はプライマーとしてとして用いることができる。プライマーとして用いる場合には、Life Technologies社のTaqMan(登録商標) MicroRNA Assays、Qiagen社のmiScript PCR Systemなどを利用できるが、これらの方法に限定されない。
本発明のキットに含まれるポリヌクレオチドは、ノーザンブロット法、サザンブロット法、in situ ハイブリダイゼーション法、ノーザンハイブリダイゼーション法、サザンハイブリダイゼーション法などのハイブリダイゼーション技術、定量RT−PCR法などの定量増幅技術などの、特定遺伝子を特異的に検出する公知の方法において、定法に従ってプライマー又はプローブとして利用することができる。測定対象試料としては、使用する検出方法の種類に応じて、被験体の血液、血清、血漿、尿等の体液を採取する。あるいは、そのような体液から上記の方法によって調製したtotal RNAを用いてもよいし、さらに当該RNAをもとにして調製される、cDNAを含む各種のポリヌクレオチドを用いてもよい。
本発明のキットは、胆管がんの診断又は罹患の有無の検出のために有用である。具体的には、当該キットを使用した胆管がんの検出は、胆管がんの罹患が疑われる被験体から、血液、血清、血漿、尿等の試料を用いて、当該キットに含まれる核酸プローブ又はプライマーで検出される遺伝子の発現量をin vitroで測定することによって行うことができる。胆管がんの罹患が疑われる被験体の血液、血清、血漿、尿等の試料中の、配列番号1〜5の少なくとも1つ以上で表される塩基配列、並びに場合により配列番号6で表される塩基配列、からなるポリヌクレオチドの発現量が、健常体の血液、血清、又は血漿、尿等の試料中のそれらの発現量と比べて統計学的に有意に高い場合、当該被験体は胆管がんに罹患していると評価することができる。
本発明のキットを利用した生体試料中に胆管がん由来の遺伝子の発現産物が含まれないこと、又は胆管がん由来の遺伝子の発現産物が含まれること、の検出方法は、被験体の血液、血清、血漿、尿等の体液を採取して、そこに含まれる標的遺伝子の発現量を、本発明のポリヌクレオチド群から選ばれた単数又は複数のポリヌクレオチド(変異体、断片又は誘導体を包含する。)を用いて測定することにより、胆管がんの有無を評価する又は胆管がんを検出することを含む。また本発明の胆管がんの検出方法を通して、例えば胆管がん患者において、該疾患の改善のために治療薬を投与した場合における当該疾患の改善の有無又は改善の程度を評価又は診断することもできる。
本発明の方法は、例えば以下の(a)、(b)及び(c)のステップ:
(a)被験体由来の生体試料を、in vitroで、本発明のキットのポリヌクレオチドと接触させるステップ、
(b)生体試料中の標的核酸の発現量を、上記ポリヌクレオチドを核酸プローブ又はプライマーとして用いて測定するステップ、
(c)(b)の結果をもとに、当該被験体中の胆管がん(細胞)の存在又は不存在を評価するステップ、
を含むことができる。
具体的には、本発明は、miR−204−3p、miR−3678−3p、miR−760、miR−4675及びmiR−5001−5pから選択される少なくとも1つ以上のポリヌクレオチドと特異的に結合可能な核酸プローブを用いて、被験体の生体試料における標的核酸の発現量を測定し、該発現量を用いて被験体が胆管がんに罹患していること、又は胆管がんに罹患していないことをin vitroで評価することを含む、胆管がんの検出方法を提供する。
本明細書において「評価」するとは、医師による判定ではなく、in vitroでの検査による結果に基づいた評価支援である。
上記のとおり、本方法において、具体的には、miR−204−3pがhsa−miR−204−3pであり、miR−3678−3pがhsa−miR−3678−3pであり、miR−760がhsa−miR−760であり、miR−4675がhsa−miR−4675であり、及び、miR−5001−5pがhsa−5001−5pである。
また、本方法において、具体的には、核酸プローブが、下記の(a)〜(e)に示すポリヌクレオチド:
(a)配列番号1〜5で表される塩基配列、もしくは当該塩基配列においてuがtである塩基配列、からなるポリヌクレオチド、その変異体、又は15以上の連続した塩基を含むその断片、
(b)配列番号1〜5で表される塩基配列を含むポリヌクレオチド、
(c)配列番号1〜5で表される塩基配列、もしくは当該塩基配列においてuがtである塩基配列、に相補的な塩基配列からなるポリヌクレオチド、その変異体、又は15以上の連続した塩基を含むその断片、
(d)配列番号1〜5で表される塩基配列、もしくは当該塩基配列においてuがtである塩基配列、に相補的な塩基配列を含むポリヌクレオチド、及び
(e)前記(a)〜(d)のいずれかのポリヌクレオチドとストリンジェントな条件でハイブリダイズするポリヌクレオチド、
からなる群から選択される。
核酸プローブにはさらに、miR−135a−3pのポリヌクレオチドと特異的に結合可能な核酸プローブを含むことができる。
具体的には、miR−135a−3pがhsa−miR−135a−3pである。
さらに、具体的には、核酸プローブが、下記の(f)〜(j)に示すポリヌクレオチド:
(f)配列番号6で表される塩基配列、もしくは当該塩基配列においてuがtである塩基配列、からなるポリヌクレオチド、その変異体、又は15以上の連続した塩基を含むその断片、
(g)配列番号6で表される塩基配列を含むポリヌクレオチド、
(h)配列番号6で表される塩基配列、もしくは当該塩基配列においてuがtである塩基配列、に相補的な塩基配列からなるポリヌクレオチド、その変異体、又は15以上の連続した塩基を含むその断片、
(i)配列番号6で表される塩基配列、もしくは当該塩基配列においてuがtである塩基配列、に相補的な塩基配列を含むポリヌクレオチド、及び
(j)前記(f)〜(i)のいずれかのポリヌクレオチドとストリンジェントな条件でハイブリダイズするポリヌクレオチド、
からなる群から選択されるポリヌクレオチドである。
本発明方法で用いられる生体試料は、被験体の生体組織(好ましくは、胆管組織)、血液、血清、血漿、尿等の体液など、から調製される試料を挙げることができる。具体的には、当該組織から調製されるRNA含有試料、それからさらに調製されるポリヌクレオチドを含む試料、血液、血清、血漿、尿等の体液、被験体の生体組織の一部又は全部をバイオプシーなどで採取するか、手術によって摘出した生体組織、などであり、これらから、測定のための試料を調製することができる。
本明細書で被験体とは、哺乳動物、例えば非限定的にヒト、サル、マウス、ラットなどを指し、好ましくはヒトである。
本発明の方法は、測定対象として用いる生体試料の種類に応じてステップを変更することができる。
測定対象物としてRNAを利用する場合、胆管がん(細胞)の検出は、例えば下記のステップ(a)、(b)及び(c):
(a)被験体の生体試料から調製されたRNA又はそれから転写された相補的ポリヌクレオチド(cDNA)を、本発明のキットのポリヌクレオチドと結合させるステップ、
(b)当該ポリヌクレオチドに結合した生体試料由来のRNA又は当該RNAから合成されたcDNAを、上記ポリヌクレオチドを核酸プローブとして用いるハイブリダイゼーションによって、あるいは、上記ポリヌクレオチドをプライマーとして用いる定量RT−PCRによって測定するステップ、
(c)上記(b)の測定結果に基づいて、胆管がん(由来の遺伝子)の存在又は不存在を評価するステップ、
を含むことができる。
本発明によって胆管がん(由来の遺伝子)をin vitroで検出、検査、評価又は診断するために、例えば種々のハイブリダイゼーション法を使用することができる。このようなハイブリダイゼーション法には、例えばノーザンブロット法、サザンブロット法、RT−PCR法、DNAチップ解析法、in situハイブリダイゼーション法、ノーザンハイブリダイゼーション法、サザンハイブリダイゼーション法などを使用することができる。
ノーザンブロット法を利用する場合は、本発明で使用可能な上記核酸プローブを用いることによって、RNA中の各遺伝子発現の有無やその発現量を検出又は測定することができる。具体的には、核酸プローブ(相補鎖)を放射性同位元素(32P、33P、35Sなど)や蛍光物質などで標識し、それを常法にしたがってナイロンメンブレンなどにトランスファーした被検者の生体組織由来のRNAとハイブリダイズさせたのち、形成されたDNA/RNA二重鎖の標識物(放射性同位元素又は蛍光物質)に由来するシグナルを放射線検出器(BAS−1800II(富士写真フィルム株式会社)、などを例示できる)又は蛍光検出器(STORM 865(GEヘルスケア社)、などを例示できる)で検出又は測定する方法を例示することができる。
定量RT―PCR法を利用する場合には、本発明で使用可能な上記プライマーを用いることによって、RNA中の遺伝子発現の有無やその発現量を検出又は測定することができる。具体的には、被検体の生体組織由来のRNAから常法にしたがってcDNAを調製して、これを鋳型として標的の各遺伝子の領域が増幅できるように、本発明の検出用組成物から調製した1対のプライマー(上記cDNAに結合する正鎖と逆鎖からなる)をcDNAとハイブリダイズさせて常法によりPCR法を行い、得られた二本鎖DNAを検出する方法を例示することができる。なお、二本鎖DNAの検出法としては、上記PCRをあらかじめ放射性同位元素や蛍光物質で標識しておいたプライマーを用いて行う方法、PCR産物をアガロースゲルで電気泳動し、エチジウムブロマイドなどで二本鎖DNAを染色して検出する方法、産生された二本鎖DNAを常法にしたがってナイロンメンブレンなどにトランスファーさせ、標識した核酸プローブとハイブリダイズさせて検出する方法を含むことができる。
DNAアレイ解析を利用する場合は、本発明の上記検出用組成物を核酸プローブ(一本鎖又は二本鎖)として基板に貼り付けたDNAチップを用いる。核酸プローブを貼り付けた領域をプローブスポット、核酸プローブを貼り付けていない領域をブランクスポットと称する。遺伝子群を基板に固相化したものには、一般にDNAチップ及びDNAアレイという名称があり、DNAアレイにはDNAマクロアレイとDNAマイクロアレイが包含されるが、本明細書ではDNAチップといった場合、当該DNAアレイを含むものとする。DNAチップとしては3D−Gene(登録商標)Human miRNA Oligo chip(東レ株式会社)を用いることができるが、これに限られない。
DNAチップの測定は、限定されないが、例えば検出用組成物の標識物に由来するシグナルを画像検出器(Typhoon 9410(GEヘルスケア社)、3D−Gene(登録商標)スキャナー(東レ株式会社)などを例示できる)で検出又は測定する方法を例示することができる。
本明細書中で使用する「ストリンジェントな条件」とは、上述のように核酸プローブが他の配列に対するよりも、検出可能により大きな程度(例えばバックグラウンド測定値の平均+バックグラウンド測定値の標準誤差×2以上の測定値)で、その標的配列に対してハイブリダイズする条件である。
ストリンジェントな条件はハイブリダイゼーションとその後の洗浄によって、規定される。そのハイブリダイゼーションの条件は、限定されないが、例えば30℃〜60℃で、SSC、界面活性剤、ホルムアミド、デキストラン硫酸塩、ブロッキング剤などを含む溶液中で1〜24時間の条件とする。ここで、1×SSCは、150mM塩化ナトリウム及び15mMクエン酸ナトリウムを含む水溶液(pH7.0)であり、界面活性剤はSDS(ドデシル硫酸ナトリウム)、Triton、もしくはTweenなどを含む。ハイブリダイゼーション条件としては、より好ましくは3〜10×SSC、0.1〜1% SDSを含む。ストリンジェントな条件を規定するもうひとつの条件である、ハイブリダイゼーション後の洗浄条件としては、例えば、30℃の0.5×SSCと0.1%SDSを含む溶液、及び30℃の0.2×SSCと0.1%SDSを含む溶液、及び30℃の0.05×SSC溶液による連続した洗浄などの条件を挙げることができる。相補鎖はかかる条件で洗浄しても対象とする正鎖とハイブリダイズ状態を維持するものであることが望ましい。具体的にはこのような相補鎖として、対象の正鎖の塩基配列と完全に相補的な関係にある塩基配列からなる鎖、並びに当該鎖と少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%又は少なくとも95%の同一性を有する塩基配列からなる鎖を例示することができる。
これらのハイブリダイゼーションにおける「ストリンジェントな条件」の他の例については、例えばSambrook, J. & Russel, D. 著、Molecular Cloning, A LABORATORY MANUAL、Cold Spring Harbor Laboratory Press、2001年1月15日発行、の 第1巻7.42〜7.45、第2巻8.9〜8.17などに記載されており、本発明において利用できる。
本発明のキットのポリヌクレオチド断片をプライマーとしてPCRを実施する際の条件の例としては、例えば10mM Tris−HCL(pH8.3)、50mM KCL、1〜2mM MgCl2などの組成のPCRバッファーを用い、当該プライマーの配列から計算されたTm値+5〜10℃において15秒から1分程度処理することなどが挙げられる。かかるTm値の計算方法としてTm値=2×(アデニン残基数+チミン残基数)+4×(グアニン残基数+シトシン残基数)などが挙げられる。
また、定量RT−PCR法を用いる場合には、TaqMan(登録商標) MicroRNA Assays(Life Technologies社):LNA(登録商標)−based MicroRNA PCR(Exiqon社):Ncode(登録商標) miRNA qRT−PCT キット(invitrogen社)などの、miRNAを定量的に測定するために特別に工夫された市販の測定用キットを用いてもよい。
遺伝子発現量の算出としては、限定されないが、例えばStatistical analysis of gene expression microarray data(Speed T.著、Chapman and Hall/CRC)、及びA beginner’s guide Microarray gene expression data analysis(Causton H.C.ら著、Blackwell publishing)などに記載された統計学的処理を、本発明において利用できる。例えばDNAチップ上のブランクスポットの測定値の平均値に、ブランクスポットの測定値の標準偏差の2倍、好ましくは3倍、より好ましくは6倍を加算し、その値以上のシグナル値を有するプローブスポットを検出スポットとみなすことができる。さらに、ブランクスポットの測定値の平均値をバックグラウンドとみなし、プローブスポットの測定値から減算し、遺伝子発現量とすることができる。遺伝子発現量の欠損値については、解析対象から除外するか、好ましくは各DNAチップにおける遺伝子発現量の最小値で置換するか、より好ましくは遺伝子発現量の最小値の対数値から0.1を減算した値、で置換することができる。さらに、低シグナルの遺伝子を除去するために、測定サンプル数の20%以上、好ましくは50%、より好ましくは80%以上において2の6乗、好ましくは2の8乗、より好ましくは2の10乗以上の遺伝子発現量を有する遺伝子のみを解析対象として選択することができる。遺伝子発現量の正規化(ノーマライゼーション)としては、限定されないが、例えばglobal normalizationやquantile normalization(Bolstad, B. M.ら、2003年、Bioinformatics、19巻、p185−193)、などが挙げられる。
本発明はまた、本発明の診断用ポリヌクレオチド、キット、DNAチップ、又はそれらの組み合わせを用いて、被験体由来の生体試料中の標的遺伝子又は遺伝子の発現量を測定し、胆管がん患者由来の生体試料と健常体由来の生体試料の遺伝子発現量を教師サンプルとして判別式(判別関数)を作成し、生体試料が胆管がん由来の遺伝子を含むこと及び/又は含まないことを決定又は評価する方法を提供する。
すなわち、本発明はさらに、本発明の診断用ポリヌクレオチド、キット、DNAチップ、又はそれらの組み合わせを用いて、生体試料が胆管がん由来の遺伝子を含むこと/又は胆管がん由来の遺伝子を含まないことを決定又は評価することが既知の複数の生体試料中の標的遺伝子の発現量をin vitroで測定する第1のステップ、前記第1のステップで得られた当該標的遺伝子の発現量の測定値を教師サンプルとした判別式を作成する第2のステップ、被験体由来の生体試料中の当該標的遺伝子の発現量を第1のステップと同様にin vitroで測定する第3のステップ、前記第2のステップで得られた判別式に第3のステップで得られた当該標的遺伝子の発現量の測定値を代入し、当該判別式から得られた結果に基づいて、生体試料が胆管がん由来の遺伝子を含むこと/又は胆管がん由来の遺伝子を含まないことを決定又は評価する第4のステップを含む、ここで、当該標的遺伝子が当該ポリヌクレオチド、キット又はDNAチップに含まれるポリヌクレオチド、及びその変異体又はその断片によって検出可能なものである、前記方法を提供する。ここで、フィッシャーの判別分析、マハラノビス距離による非線形判別分析、Support Vector Machine(SVM)などを用いて判別式を作成できるが、これらに限定されない。
線形判別分析は群分けの境界が直線あるいは超平面である場合、式1を判別式として用いて群の所属を判別する方法である。式中、xは説明変数、wは説明変数の係数、w0は定数項を表す。
判別式で得られた値を判別得点と呼び、新たに与えられたデータセットの測定値を説明変数として当該判別式に代入し、判別得点の符号で群分けを判別することができる。
線形判別分析の一種であるフィッシャーの判別分析は群判別を行うのに適した次元を選択するための次元削減法であり、合成変数の分散に着目して、同じラベルを持つデータの分散を最小化することで識別力の高い合成変数を構成する(Venables,W. N.ら著 Modern Applied Statistics with S. Fourth edition. Springer.、2002年)。フィッシャーの判別分析では式2を最大にするような射影方向wを求める。ここで、μは入力の平均、ngはg群に属するデータ数、μgはg群に属するデータの入力の平均とする。分子・分母はそれぞれデータをベクトルwの方向に射影したときの群間分散、群内分散となっており、この比を最大化することで判別式係数wiを求める。(金森敬文ら著、「パターン認識」、共立出版(2009年)、Richard O.ら著、Pattern Classification Second Edition.、Wiley−Interscience、2000年)。
マハラノビス距離はデータの相関を考慮した式3で算出され、各群からのマハラノビス距離の近い群を所属群として判別する非線形判別分析として用いることができる。ここで、μは各群の中心ベクトル、S−1はその群の分散共分散行列の逆行列である。中心ベクトルは説明変数xから算出され、平均ベクトルや中央値ベクトルなどを用いることができる。
SVMとはV.Vapnikが考案した判別分析法である(The Nature of Statistical Leaning Theory、Springer、1995年)。分類すべき群分けが既知のデータセットの特定のデータ項目を説明変数、分類すべき群分けを目的変数として、当該データセットを既知の群分けに正しく分類するための超平面と呼ばれる境界面を決定し、当該境界面を用いてデータを分類する判別式を決定する。そして当該判別式は、新たに与えられるデータセットの測定値を説明変数として当該判別式に代入することにより、群分けを判別することができる。また、このときの判別結果は分類すべき群でも良く、分類すべき群に分類されうる確率でも良く、超平面からの距離でも良い。SVMでは非線形な問題に対応するための方法として、特徴ベクトルを高次元へ非線形変換し、その空間で線形の識別を行う方法が知られている。非線形に写像した空間での二つの要素の内積がそれぞれのもとの空間での入力のみで表現されるような式のことをカーネルと呼び、カーネルの一例としてリニアカーネル、RBF(Radial Basis Function)カーネル、ガウシアンカーネルを挙げることができる。カーネルによって高次元に写像しながら、実際には写像された空間での特徴の計算を避けてカーネルの計算のみで最適な判別式、すなわち判別式を構成することができる。(例えば、麻生英樹ら著、統計科学のフロンテイア6「パターン認識と学習の統計学 新しい概念と手法」、岩波書店(2004年)、Nello Cristianiniら著、SVM入門、共立出版(2008年))。
SVM法の一種であるC−support vector classification(C−SVC)は、2群の説明変数で学習を行って超平面を作成し、未知のデータセットがどちらの群に分類されるかを判別する(C. Cortesら、1995年、Machine Learning、20巻、p273−297)。
本発明の方法で使用可能なC−SVCの判別式の算出例を以下に示す。まず全被験体を胆管がん患者と健常体の2群に群分けする。被験体が胆管がん患者である、もしくは健常体であると判断する基準としては、例えば胆管組織検査を用いることができる。
次に、分けられた2群の血清由来の生体試料の網羅的遺伝子発現量からなるデータセット(以下、学習セット)を用意し、当該2群の間で遺伝子発現量に明確な差が見られる遺伝子を説明変数、当該群分けを目的変数(例えば−1と+1)としたC−SVCによる判別式を決定する。式4は最適化する目的関数であり、式中、eは全ての入力ベクトル、yは目的変数、aはLagrange未定乗数ベクトル、Qは正定値行列、Cは制約条件を調整するパラメータを表す。
式5は最終的に得られた判別式であり、判別式によって得られた値の符号で所属する群を決定できる。ここで、xはサポートベクトル、yは群の所属を示すラベル、aは対応する係数、bは定数項、Kはカーネル関数である。
カーネル関数としては例えば式6で定義されるRBFカーネルを用いることができる。ここで、xはサポートベクトル、γは超平面の複雑さを調整するカーネルパラメータを表す。
そして、未知の胆管がん患者もしくは健常体については、当該胆管がん患者もしくは当該胆管がん患者の血清における、当該判別式で使用する遺伝子の発現量を測定し、それらを当該判別式のxに代入することによって、胆管がん患者又は健常体のいずれに所属するかを判別することができる。
これらのほかにも被験体由来の生体試料が胆管がん由来の遺伝子を含むこと及び/又は含まないことを決定又は評価する方法として、ニューラルネットワーク、k−近傍法、決定木、ロジスティック回帰分析などの手法を選択することができる。
本発明の方法は、例えば下記のステップ(a)、(b)及び(c):
(a)胆管がん患者由来の胆管がん由来遺伝子を含む組織及び/又は健常体由来の胆管がん由来遺伝子を含まない組織であることが既に知られている生体試料中の標的遺伝子の発現量を、本発明による検出用ポリヌクレオチド、キット又はDNAチップを用いて測定するステップ、
(b)(a)で測定された発現量の測定値から、上記の式1〜3、5及び6の判別式を作成するステップ、
(c)被験体由来の生体試料中の当該標的遺伝子の発現量を、本発明による診断(検出)用ポリヌクレオチド、キット又はDNAチップを用いて測定し、(b)で作成した判別式にそれらを代入して、得られた結果に基づいて生体試料が胆管がん由来遺伝子を含むこと及び/又は含まないことを決定又は評価するステップ、
を含むことができる。ここで、式1〜3、5及び6の式中のxは説明変数であり、上記2節に記載したポリヌクレオチド類から選択されるポリヌクレオチド又はその断片を測定することによって得られる値を含み、具体的には本発明の胆管がん患者と健常体を判別するための説明変数は、例えば下記の(1)又は(2)より選択される遺伝子発現量である。
(1)配列番号1〜5で表される塩基配列又はその相補的配列において、15以上の連続した塩基を含むDNAのいずれかによって測定される胆管がん患者もしくは健常体の血清における遺伝子発現量。
(2)配列番号6で表される塩基配列又はその相補的配列において、15以上の連続した塩基を含むDNAのいずれかによって測定される胆管がん患者もしくは健常体の血清における遺伝子発現量。
以上に示すように、被験体由来の生体試料が胆管がん由来の遺伝子を含むこと及び/又は含まないことを決定又は評価する方法として、判別式の作成には、学習セットから作成した判別式が必要であり、当該判別式の判別精度を上げるためには、学習セット中の2群間に明確な差がある遺伝子を判別式に用いることが必要である。
また、判別式の説明変数に用いる遺伝子の決定は、次のように行うことが好ましい。まず、学習セットである、胆管がん患者群の網羅的遺伝子発現量と健常体群の網羅的遺伝子発現量をデータセットとし、パラメトリック解析であるt検定のP値、ノンパラメトリック解析であるMann−WhitneyのU検定のP値、又はWilcoxon検定のP値などを利用して、当該2群間における各遺伝子の発現量の差の大きさを求める。
検定によって得られたP値の危険率(有意水準)が例えば5%、1%又は0.01%より小さい場合に統計学的に有意とみなすことができる。
検定を繰り返し行うことに起因する第一種の過誤の確率の増大を補正するために公知の方法、例えばボンフェローニ、ホルムなどの方法によって補正することができる(例えば、永田靖ら著、「統計的多重比較法の基礎」、サイエンティスト社(2007年))。ボンフェローニ補正を例示すると、例えば検定によって得られたP値を検定の繰り返し回数、即ち、解析に用いる遺伝子数で乗じ、所望の有意水準と比較することにより検定全体での第一種の過誤を生じる確率を抑制できる。
また、検定ではなく胆管がん患者群の遺伝子発現量と健常体群の遺伝子発現量の間で、各々の遺伝子発現量の中央値の発現比の絶対値(Fold change)を算出し、判別式の説明変数に用いる遺伝子を選択してもよい。また、胆管がん患者群と健常体群の遺伝子発現量を用いてROC曲線を作成し、AUROC値を基準にして判別式の説明変数に用いる遺伝子を選択してもよい。
次に、ここで求めた遺伝子発現量の差が大きい任意の数の遺伝子を用いた判別式を作成し、この判別式に対し、別の独立の胆管がん患者もしくは健常体の遺伝子発現量を説明変数に代入して、この独立の胆管がん患者もしくは健常体について所属する群の判別結果を算出する。最大の判別精度を得る判別式を構築する方法として、例えばP値の有意水準を満たした遺伝子のあらゆる組み合わせで判別式を構築する方法や、判別式を作成するために使用する遺伝子を、遺伝子発現量の差の大きい順に一つずつ増やしながら繰り返して評価する方法などがある(Furey TS.ら、2000年、Bioinformatics.、16巻、p906−14)。
また、当該判別式の判別性能(汎化性)の評価には、交差検証を用いることが望ましい。交差検証の一種である「Leave−one−out cross validation(LOOCV)」(Ron Kohavi、1995年、Proceedings of the 14th international joint conference on Artificial intelligence − Volume 2、p 1137−1143)は、まず全データセットから1つのサンプルのデータをテストセットとして抜き出し、残りを学習セットとする。そして、学習セットを用いて判別式を作成し、当該判別式を用いてテストセットが所属する群を判別する。そして、すべてのサンプルのデータが1回ずつテストデータとして用いられるように反復し、精度・感度・特異度などを算出して判別性能を評価する。
本発明は、胆管がんの診断及び治療に有用な疾患診断用(又は検査用)ポリヌクレオチド、当該ポリヌクレオチドを用いた胆管がんの検出方法、及び当該ポリヌクレオチドを含む胆管がんの検出キットを提供する。特に、既存の腫瘍マーカーCEA及びCA19−9による胆管がん診断法を超える精度を示す診断用(又は検査用)遺伝子の選定と診断用(又は検査用)判別式の作成を実施するため、本発明の方法において、例えば、CEA及びCA19−9によって陰性と判断されたにもかかわらず、造影剤を用いたコンピュータ断層撮影等の精密検査によって最終的に胆管がんが存在することが明らかとなった患者由来の血清中の発現遺伝子と、胆管がんが存在しない患者由来の血清中の発現遺伝子を比較することによって、CEA及びCA19−9を超える精度を示す、診断用(又は検査用)遺伝子セット及び診断用(又は検査用)判別式を構築できる。
具体的には、以下のようにして、診断用(又は検査用)遺伝子セット及び診断用(又は検査用)判別式を構築することができる。まず、標的核酸となる診断用(又は検査用)遺伝子セット(ポリヌクレオチドのセット)を選択する。配列番号1〜5で表される塩基配列に基づく上記(a)〜(e)のポリヌクレオチドから選択される1〜5種の任意の組み合わせを診断用(又は検査用)遺伝子セットとして用いることができる。または、この1〜5種の任意の組み合わせに、配列番号6で表される塩基配列に基づく上記(f)〜(j)から選択される1種のポリヌクレオチドを更に加えた2〜6種のポリヌクレオチドの組み合わせを診断用(又は検査用)遺伝子セットとすることもできる。次に、選択した診断用(又は検査用)遺伝子セットにおけるポリヌクレオチドの発現量を、胆管がん患者由来であることが予め判明している生体試料と、健常体由来であることが予め判明している生体試料との2群に分けて測定する。ここで得られた発現量の各測定値に対して、上記した統計的手法を適用することにより、診断用(又は検査用)判別式を得ることができる。
以上のようにして得た、特定の診断用(又は検査用)遺伝子セットにおける診断用(又は検査用)判別式を用いて、胆管がんの罹患の有無を診断又は検査したい被験体について、当該診断用(又は検査用)遺伝子セットにおけるポリヌクレオチドの発現量を測定し、その結果を当該診断用(又は検査用)判別式に適用することにより、当該被験体における胆管がん罹患の有無を診断又は検査することができる。診断用(又は検査用)遺伝子セットとして、配列番号1〜5で表される塩基配列に基づく上記1〜5種のポリヌクレオチドの組み合わせ、またはこの1〜5種の任意の組み合わせに、配列番号6で表される塩基配列に基づく1種のポリヌクレオチドを更に加えた2〜6種のポリヌクレオチドの組み合わせを用いた場合、最高95.7%の精度で診断又は検査することができる。
本発明を以下の実施例によってさらに具体的に説明する。しかし、本発明の範囲は、この実施例によって制限されないものとする。
[実施例1]
<試料の採取>
インフォームドコンセントを得た健常体(N=10)、胆管がん患者(N=13)からベノジェクトII真空採血管VP−AS109K60(テルモ株式会社)を用いてそれぞれ血清を採取した。
[実施例2]
<totalRNAの抽出>
試料として上記の実施例1で得た、計23検体から得られた血清、それぞれ900μLから、3D−Gene(登録商標)RNA extraction reagent from liquid sample kit(東レ株式会社)中のRNA抽出用試薬を用いて、同社の定めるプロトコールに従ってtotal RNAを得た。
[実施例3]
<遺伝子発現量の測定>
試料として上記の実施例2で得た計23検体に対応するtotal RNAに対して、3D−Gene(登録商標) miRNA Labeling kit(東レ株式会社)を用いて同社が定めるプロトコール(ver2.20)に基づいてmiRNAを蛍光標識した。オリゴDNAチップとして、3D−Gene(登録商標) Human miRNA Oligo chip(東レ株式会社)を用い、同社が定めるプロトコールに基づいてストリンジェントな条件でハイブリダイゼーション及びハイブリダイゼーション後の洗浄を行った。DNAチップを3D−Gene(登録商標)スキャナー(東レ株式会社)を用いてスキャンし、画像を取得して3D−Gene(登録商標)Extraction(東レ株式会社)にて蛍光強度を数値化した。数値化された蛍光強度を、底が2の対数値に変換して遺伝子発現量とし、ブランク値の減算を行い、欠損値は各DNAチップにおける遺伝子発現量の最小値の対数値から0.1を減算した値で置換した。その結果、胆管がん患者13例及び健常体10例に対する、網羅的なmiRNAの遺伝子発現量を得た。
[実施例4]
<判別式作成に用いる遺伝子の選定と判別性能の評価方法>
上記の実施例3で得た胆管がん患者13検体、もしくは健常体10検体の合計23検体の血清由来のtotal RNAから検出されたmiRNAの遺伝子発現量を、R言語3.0.1(R Development Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing, URL http://www.R−project.org/.)及びe1071パッケージ1.6−1(Evgenia Dimitriadou, Kurt Hornik, Friedrich Leisch, David Meyer and Andreas Weingessel (2011)., TU Wien. R package version 1.6.)を用いて胆管がん患者群と健常体群で比較して、胆管がん判別用遺伝子を決定し、その遺伝子を用いた場合の胆管がん患者もしくは健常体の判別結果を算出した。すなわち、まず上記の実施例3で得た13検体の胆管がん患者群と10検体の健常体群を、quantile normalizationで正規化し、13検体の胆管がん患者群と10検体の健常体群のいずれかにおいて80%以上の検体で2の6乗以上の遺伝子発現量を有する遺伝子のみを選択した。胆管がん患者群と健常体群の各々の遺伝子発現量について、等分散を仮定した両側t検定によってP値を算出し、ボンフェローニ補正を行い、p<0.01を満たす遺伝子を判別式の説明変数に用いる遺伝子として選択した。また、胆管がん患者群と健常体群の各々の遺伝子発現量について、中央値の発現比の絶対値(Fold change)を算出し、log2−scaleで2群の差が1.5以上の遺伝子を判別式の説明変数に用いる遺伝子として選択した。また、AUROC値が0.8以上の遺伝子を判別式の説明変数に用いる遺伝子として選択した(表1)。このようにして、hsa−miR−204−3p、hsa−miR−3678−3p、hsa−miR−760、hsa−miR−4675、hsa−miR−5001−5p及びhsa−miR−135a−3p遺伝子、これらに関連する配列番号1〜6の塩基配列を見出した。次に、これらの遺伝子の発現量を指標として、胆管がんの有無を判別する判別式を作成して判別性能を評価した。すなわち、選択された6種の遺伝子の中で、配列番号1〜5で表される塩基配列からなるポリヌクレオチドを少なくとも1つ以上含む組み合わせを式1〜3、5、6に入力し、LOOCVによってそれぞれの診断用判別式の精度、感度及び特異度を算出した。
[実施例5]
<判別分析の結果(1) フィッシャーの判別分析>
胆管がん患者13検体の血清と健常体10検体の血清の配列番号1〜6で表される塩基配列からなるポリヌクレオチドの中で、配列番号1〜5で表される塩基配列からなるポリヌクレオチドを少なくとも1つ以上含む測定値の組み合わせで、胆管がんの存在の有無をフィッシャーの判別分析によって判別し、LOOCVで汎化性の評価を行った。「配列番号4」又は「配列番号2+5」又は「配列番号4+5」又は「配列番号4+6」又は「配列番号1+2+5」又は「配列番号1+4+5」又は「配列番号2+4+5」又は「配列番号2+5+6」又は「配列番号4+5+6」又は「配列番号1+2+4+5」又は「配列番号2+3+4+5」又は「配列番号2+4+5+6」のそれぞれの組み合わせで表される塩基配列からなるポリヌクレオチドを標的核酸として用いた場合に精度が91.3%、感度が92.3%、特異度が90%となり、精度及び感度が最高になる遺伝子セットとなることを見出した(表2)。一方、「配列番号3」又は「配列番号2+3」又は「配列番号3+4」又は「配列番号3+5」又は「配列番号3+6」又は「配列番号1+3+5」又は「配列番号2+3+4」又は「配列番号3+4+6」のそれぞれの組み合わせで表される塩基配列からなるポリヌクレオチドを標的核酸として用いた場合に精度が91.3%、感度が84.6%、特異度が100%となり、精度及び特異度が最高になる遺伝子セットとなることを見出した(表2)。
また、全検体を用いて同様の解析を行った場合の判別式係数と定数項の計算結果を表3に示した。この結果を元にして、x軸に健常体と胆管がん患者を群ごとに分け、y軸に「配列番号4」で表される塩基配列からなるポリヌクレオチドの測定値をプロットし、判別式を2次元平面上に図示すると図2のようになる。同様に、x軸に配列番号2で表される塩基配列からなるポリヌクレオチドの測定値、y軸に配列番号5で表される塩基配列からなるポリヌクレオチドの測定値をプロットし、「配列番号2+5」で表される塩基配列からなるポリヌクレオチドの組み合わせについて発現量を測定した時の判別式を2次元平面上に図示すると図3のようになる。これらの判別式は未知検体を判別する際の判別式として用いることができ、高い判別性能を示すことが期待される。
[実施例6]
<判別分析の結果(2) マハラノビス距離の判別分析>
胆管がん患者13検体の血清と健常体10検体の血清の配列番号1〜6で表される塩基配列からなるポリヌクレオチドの中で、配列番号1〜5で表される塩基配列からなるポリヌクレオチドを少なくとも1つ以上含む測定値の組み合わせで、マハラノビス距離の判別分析を行い、LOOCVで汎化性の評価を行った。
「配列番号1+3」又は「配列番号4+6」のそれぞれの組み合わせで表される塩基配列からなるポリヌクレオチドを標的核酸として用いた場合に、精度が91.3%、感度が100%、特異度が80%となり、精度と感度が最高になる遺伝子セットとなることを見出した。一方、「配列番号4」又は「配列番号2+5」又は「配列番号3+6」又は「配列番号2+4+5」又は「配列番号2+4+6」又は「配列番号2+5+6」のそれぞれの組み合わせで表される塩基配列からなるポリヌクレオチドを標的核酸として用いた場合に精度が91.3%、感度が92.3%、特異度が90%となり、精度と特異度が最高になる遺伝子セットとなることを見出した(表4)。
「配列番号1+3」で表される塩基配列からなるポリヌクレオチドの組み合わせで全検体に対してマハラノビス距離の判別分析を行い、x軸に配列番号1で表される塩基配列からなるポリヌクレオチドの測定値、y軸に配列番号3で表される塩基配列からなるポリヌクレオチドの測定値をプロットし、判別式を2次元平面上に図示すると図4のようになる。同様に、x軸に健常体と胆管がん患者を群ごとに分け、y軸に「配列番号4」で表される塩基配列からなるポリヌクレオチドの測定値をプロットし、全検体に対してマハラノビス距離の判別分析を行い、判別式を2次元平面上に図示すると図5のようになる。これらの判別式は未知検体を判別する際の判別式として用いることができ、高い判別性能を示すことが期待される。
[実施例7]
<判別分析の結果(3) SVMの判別分析>
SVMはA Practical Guide to Support Vector Classification(Chih−Wei Hsuら、http://www.csie.ntu.edu.tw/〜cjlin/papers/guide/guide.pdf)に従いC−support vector classification(C−SVC)及びRBF kernelを使用した。胆管がん患者13検体の血清と健常体10検体の血清の配列番号1〜6で表される塩基配列からなるポリヌクレオチドの中で、配列番号1〜5で表される塩基配列からなるポリヌクレオチドを少なくとも1つ以上含む測定値の組み合わせでSVMを行い、LOOCVで汎化性の評価を行ったところ、「配列番号1+3」又は「配列番号3+4」又は「配列番号1+2+3」又は「配列番号1+2+6」又は「配列番号1+3+4」又は「配列番号1+3+5」又は「配列番号2+3+4」又は「配列番号3+4+5」又は「配列番号1+2+3+4」又は「配列番号1+2+3+5」又は「配列番号1+3+4+5」又は「配列番号1+3+4+6」又は「配列番号1+3+5+6」又は「配列番号1+3+4+5+6」のそれぞれの組み合わせで表される塩基配列からなるポリヌクレオチドを標的核酸として用いた場合に精度が95.7%、感度が92.3%、特異度が100%となり、精度と感度と特異度が最高になる遺伝子セットとなることを見出した(表5)。
「配列番号1+3」又は「配列番号3+4」で表される塩基配列からなるポリヌクレオチドの組み合わせについて、全検体を用いて判別式を作成した場合の式5の係数及び変数を表6−1及び表6−2にまとめた。これらの数値は未知検体を判別する際の判別式として用いることができ、高い判別性能を示すことが期待される。
[比較例1]
<既存の胆管がんマーカーとの比較>
臨床現場で一般的に異常値とみなされるCEA 5ng/mL以上又はCA19−9 37U/mL以上を示した検体を胆管がん患者とみなすと、今回用いた検体においてはCEAの感度は7.7%、CA19−9の感度は46.2%しかなく、いずれのマーカーも胆管がんの検出には有用でないことが分かる(表7)。
一方、上記の実施例5の表2、及び実施例6の表4、及び実施例7の表5において、最も低い感度を示したのは、表2の「配列番号1」で表される塩基配列からなるポリヌクレオチドを標的核酸として用いた場合であり、その値は69.2%であった。これはCA19−9の感度を20%以上も上回っていることから、配列番号1〜5で表される塩基配列からなるポリヌクレオチドを含む組み合わせは、解析手法に依存せずに既存の胆管がんマーカー以上の感度を示すことになり、優れた診断マーカーであるといえる。
以上の実施例、比較例に示すように、本発明のキット及び方法によれば、既存の腫瘍マーカーよりも胆管がんを感度よく検出できるので、外科手術によるがん部の切除実施の早期判断が可能となり、その結果、5年生存率の向上や、再発率を低くすることが可能となる。