(定義)
別段の表示がない限り、核酸配列は、左から右に、5’から3’方向に書かれる。本願明細書で挙げられる数値的範囲は、範囲を定める数字を含み、定義された範囲内の各整数またはいずれの非整数有理数を含む。別段の定義がない限り、本願明細書で使用されるすべての技術用語および科学用語は、本発明が関与する技術分野の当業者によって通常理解されるものと同義である。
下記の用語は、本願の構成では、下記に示される意味を有するものとする。「多型マーカー」は、「マーカー」と呼ばれることもあり、本願明細書に記載される場合、ゲノム多形性部位を意味する。各多型マーカーは、多形性部位の特定の対立遺伝子に特徴のある少なくとも2つの配列多様性を有する。従って、多型マーカーの遺伝的関連は、その特定の多型マーカーの少なくとも1つの特定の対立遺伝子に関連があることを意味する。当該マーカーは、SNP、ミニサテライトまたはマイクロサテライト、転座およびコピー数の変異(挿入、欠失、重複)を含む、ゲノム中に見出されるいずれの変異型のいずれの対立遺伝子をも含み得る。多型マーカーは、集団における測定可能な頻度のいずれであってもよい。疾病遺伝子のマッピングのためには、集団頻度が5〜10%よりも高い多型マーカーが一般的に最も有用である。しかし、多型マーカーもまた、特定のコピー数変異(CNV)について、より低い集団頻度(1〜5%頻度、またはさらに低い頻度など)を有するかもしれない。当該用語は、本願の構成においては、いずれの集団頻度を有する多型マーカーをも含むように解釈されるものとする。
「対立遺伝子」は、染色体の所定の遺伝子座(位置)のヌクレオチド配列を意味する。多型マーカー対立遺伝子は、従って、染色体上のマーカーの構成(すなわち、配列)を意味する。個体のゲノムDNAは、各染色体上のマーカーの各コピーを代表する、いずれの所定の多型マーカーの2つの対立遺伝子(例えば、対立遺伝子特異的配列)を含む。本願明細書で使用されるヌクレオチドの配列コードは、A=1、C=2、G=3、T=4である。マイクロサテライト対立遺伝子のために、CEPH試料(ヒト多型研究センター、ゲノム貯蔵所、CEPH試料1347−02)を参照として使用し、この試料中の各マイクロサテライトのより短い対立遺伝子を0と設定し、他の試料中のすべての他の対立遺伝子に、当該参照に関連して番号を付けた。従って、例えば、対立遺伝子1は、CEPH試料中のより短い対立遺伝子より1bp長く、対立遺伝子2は、CEPH試料中のより短い対立遺伝子より2bp長く、対立遺伝子3はCEPH試料中の下位の対立遺伝子より3bp長いなどであり、対立遺伝子−1は、CEPH試料中のより短い対立遺伝子よりも1bp短く、対立遺伝子−2は、CEPH試料中のより短い対立遺伝子より2bp短いなどである。
配列表を含めて本願明細書に記載された配列コヌクレオチド(conucleotide)多義性は、IUPAC−IUBによって提唱されるとおりである。これらのコードは、EMBL、ジェンバンク、およびPIRデータベースによって使用されるコードに準拠している。
1より多い配列が集団(自然の集団または合成の集団(例えば、合成分子のライブラリー)のいずれか)において可能性のあるヌクレオチドの位置は、本願明細書では「多形性部位」と呼ばれる。
「一塩基多型」または「SNP」は、ゲノムの特定の部位の1つのヌクレオチドが種のメンバー間または個体の対の染色体間で異なる場合に生じる、DNA配列の多様性である。大部分のSNP多型は、2つの対立遺伝子を有する。当該例では、各個体は、多型の1つの対立遺伝子のホモ接合(すなわち、個体の染色体のコピーの両方が、SNP部位の同一のヌクレオチドを有する)であるか、または、個体はヘテロ接合(すなわち、個体の2つの姉妹染色体は異なるヌクレオチドを含む)である。本願明細書で報告されたSNPの命名は、国立バイオテクノロジー情報センター(NCBI)によって各特有のSNPに割り当てられた公式の参照SNP(rs)ID同定タグを意味する。
「変異」は、本願明細書に記載される場合、参照DNAと異なるDNAの分節を意味する。「マーカー」または「多型マーカー」は、本願明細書に定義されるように、変異である。参照と異なる対立遺伝子は、「変異」対立遺伝子と呼ばれる。
「マイクロサテライト」は、特定の部位の長さが2〜8ヌクレオチドの塩基の複数の小さい反復(CA反復など)を有する多型マーカーであり、反復長の数は一般的な集団において変化する。「インデル」は、典型的にはわずか数ヌクレオチド長の小さな挿入または欠損を含む、多型性の一般的な形態である。
「ハプロタイプ」は、本願明細書に記載される場合、分節に沿って並んだ対立遺伝子の特定の組み合わせによって特徴付けられるゲノムDNAの分節を意味する。ヒトなどの二倍体の生物では、ハプロタイプは、分節に沿った各多型マーカーまたは遺伝子座の対の対立遺伝子の1つのメンバーを含む。ある実施態様では、当該ハプロタイプは、2つ以上の対立遺伝子、3つ以上の対立遺伝子、4つ以上の対立遺伝子、または5つ以上の対立遺伝子を含み得る。ハプロタイプは、マーカーのマーカー名および対立遺伝子に関して本願明細書に記載される。つまり、ハプロタイプ、例えば、「3 rs965513」は、そのハプロタイプの中にあるマーカーrs7758851の3 対立遺伝子を指し、これは「rs965513 対立遺伝子 3」と等価である。さらに、ハプロタイプにおける対立形質のコードは、個々のマーカーについてのものと同じようであり、すなわち、1=A、2=C、3=Gおよび4=Tである。
用語「感受性」は、本願明細書に記載される場合、ある状態(例えば、ある形質、表現型または疾病)の発生または、平均的な個体よりも特定の状態に抵抗できないことに対する個体の易発性を意味する。当該用語は、増加した感受性および減少した感受性の両方を包含する。従って、本発明の多型マーカーにおける特定の対立遺伝子および/またはハプロタイプは、本願明細書に記載されるように、1より大きいその特定の対立遺伝子またはハプロタイプの相対リスク(RR)、またはオッズ比(OR)によって特徴付けられるように、甲状腺癌の増加した感受性(すなわち、増加したリスク)に特徴があってもよい。あるいは、本発明のマーカーおよび/またはハプロタイプは、1未満の相対リスクによって特徴付けられるように、甲状腺癌の減少した感受性(すなわち、減少したリスク)に特徴がある。
用語「および(ならびに、かつ)/または(もしくは)」は、本願の構成では、当該用語によって結合された項目のいずれかまたは両方が関連することを示すことが理解されるだろう。換言すれば、本願明細書におけるこの用語は、「いずれかまたは両方」を意味することが捉えられるだろう。
用語「検査表」は、本願明細書に記載される場合、データの一形態を別の形態と関連付ける表、または、1もしくは複数の形態のデータを、当該データが関連する予測される成果(表現型または形質など)と関連付ける表である。例えば、検査表は、少なくとも1つの多型マーカーの対立遺伝子のデータと、特定の対立遺伝子のデータを含む個体が示しやすいまたは特定の対立遺伝子のデータを含まない個体よりも示しやすい特定の形質もしくは表現型(特定の疾病診断など)との間の相関を含み得る。検査表は、多次元的であり得、すなわち、単一のマーカーの複数の対立遺伝子についての情報を同時に含み得、または、それらは複数のマーカーについての情報を含み得、そしてそれらは他の因子(疾病診断の特徴、人種の情報、バイオマーカー、生化学的測定、治療方法または薬剤など)も含んでいてもよい。
「コンピューター可読媒体」は、市販または特注のインターフェースを使用した、コンピューターによって接続され得る情報記憶媒体である。典型的なコンピューター可読媒体は、メモリ(例えば、RAM、ROM、フラッシュメモリなど)、光学式記憶媒体(例えば、CD−ROM)、磁気記憶媒体(例えば、コンピューターのハードドライブ、フロッピー(登録商標)ディスクなど)、パンチカードまたは他の市販の媒体を含む。情報は、興味のあるシステムと媒体との間、コンピューター間、またはコンピューターと、記憶した情報を保存または接続するコンピューター可読媒体との間で転送されてもよい。このような転送は、電気的であり得、または他の利用可能な方法(IRリンク、無線接続など)によってもよい。
本願明細書で使用される「核酸試料」は、核酸(DNAまたはRNA)を含む個体から入手した試料を意味する。ある実施態様、すなわち、特定の多型マーカーの検出および/またはハプロタイプの検出では、当該核酸試料はゲノムDNAを含む。このような核酸試料は、ゲノムDNAを含むいずれの供給源(血液試料、羊水試料、脳脊髄液試料、または皮膚、筋肉、頬側粘膜もしくは結膜粘膜、胎盤、消化管もしくは他の器官から得た組織試料を含む)からも得られ得る。
用語「甲状腺癌の治療薬」は、甲状腺癌に関連する症候の寛解または予防に使用され得る薬剤を意味する。
用語「甲状腺癌に関連した核酸」は、本願明細書に記載される場合、甲状腺癌に関連することが見出された核酸を意味する。これは、本願明細書記載のマーカーおよびハプロタイプ、ならびにそれらと強い連鎖不平衡(LD)のマーカーおよびハプロタイプを含むが、これらに限定されない。1つの実施態様では、甲状腺癌に関連した核酸は、ある領域(LDブロックなど)内に位置する少なくとも1つの多型マーカーを介して甲状腺癌のリスクと関連すると見出された、そのゲノム領域またはLDブロックなどを指す。
本願明細書に記載された用語「FoxE1」または「FoxE1遺伝子」は、染色体9q22.33上の、かつては甲状腺転写因子2(TTF−2)と呼ばれていたフォークヘッド因子(Forkhead Factor) E1遺伝子を意味する。
本願明細書に記載された用語「LDブロックC09」は、NCBI(国立バイオテクノロジー情報センター)ビルド36の位置99,350,532〜99,953,197に対応するマーカーrs2795492およびrs7855669にまたがる、染色体9上の連鎖不平衡(LD)ブロック領域(配列番号:1)を指す。
甲状腺癌に対する感受性を与える遺伝的変異体についてのゲノム全体での分析を通して、本発明者らは、甲状腺癌のリスクと関連する変異体を含む染色体9q22.33上の領域を同定した。マーカーrs965513、rs907580およびrs7024345は、甲状腺癌のリスクと有意に関連するということが見出された。最も強い関連シグナルは、マーカーrs965513について観察された(OR 1.77、P値 1.18×10−15)。追跡調査解析により、アイスランドにおいて、ならびに米国およびスペインから得た試料において、ともに、この結果が確認された(rs965513についての全体のP値 1.7×10−27)。
rs965513マーカーは、広範な連鎖不平衡によって特徴付けられる染色体9q22.33上の領域内に位置する。このような広範なLDの重要性は、その領域内のいくつかの遺伝的変異は、リスクのある変異体rs965513に対する代用物(例えばrs907580およびrs7024345、ならびにまたrs10759944、rs10984103、rs925487およびrs1443434を含む)であり、このようなマーカーもまた本発明を実現するのに有用であるということである。rs965513とLDであるため本発明を実現するのに有用な他のSNPマーカーは、本願明細書中の表2に与えられている。以下でより詳細に論じられるように、代用マーカーは、領域のゲノム構造によっては、大きいゲノム領域にわたって広がり得る。例えば、本願明細書中の表2に記載されるrs965513についての代用マーカーは、約600kbの領域(本願明細書においてLDブロックC09とも呼ばれる)にまたがる。この領域で同定される甲状腺癌についての遺伝的危険率の生物学的重要性に関与する機能的単位は、原則として、広範なLDの領域内のどこにでも存在することができる。rs965513と特に高LD(例えば、以下でさらに記載するようにr2および/またはD’の高い値、例えば0.1または0.2よりも大きいr2値によって特徴付けられるLD)であるマーカーは、このような単位の中にあるか、またはこのような単位と高LDである可能性が非常に高い。
フォークヘッド因子E1(FoxE1;かつては甲状腺転写因子2(TTF−2)と呼ばれていた)遺伝子は、rs965513の近くで、かつrs965513と強いLDであるマーカーを含む領域内に位置する。この領域の中の他の遺伝子としては、XPA、C9orf156およびHEMGN(図2)が挙げられる。このFoxE1遺伝子は、甲状腺特異的遺伝子の発現を制御し(De Felice,M.、およびR.Di Lauro.、Endocr.Rev. 25:722−746(2004);Francis−Lang,H.ら、Mol.Cell.Biol. 12:576−588(1992);Sinclair,A.ら、Eur.J.Biochem. 193:311−318(1990))、それは甲状腺形成(Dathan,N.、R.Parlato、A.Rosica、M.De Felice、およびR.Di Lauro、Dev.Dyn. 224:450−456(2002))および遊走(De Felice,M.ら、Nat.Genet. 19:395−398(1998))にとって必須であり、甲状腺分化を惹起する転写因子および補助因子の制御ネットワークの中心にある(Parlato,R.ら、Dev.Biol. 276:464−475(2004))。FoxE1遺伝子の変異は、表現型の中でもとりわけ、甲状腺無形成と関連するヒトの症候群の原因となる(Castanet,M.ら、Hum Mol Genet 11:2051−9(2002);Clifton−Bligh,R.J.ら、Nat.Genet. 19:399−401(1998))。FoxE1は、甲状腺の分化した状態の維持のためにも必要である。なぜなら、それは、サイログロブリン(Tg)(Santisteban,P.ら、Mol.Endocrinol. 6:1310−1317(1992))および甲状腺ペルオキシダーゼ(TPO)(Aza−Blanc,P.、R.Di Lauro、およびP.Santisteban. Mol.Endocrinol. 7:1297−1306(1993))遺伝子などの甲状腺特異的遺伝子の転写のホルモンによる制御のために必須であるからである。TPO遺伝子の発現は、TTF−1(Nkx2.1)、Pax8、および核性因子1(NF−1)によっても制御される。これらの補助因子の中で、FoxE1は、甲状腺刺激ホルモン(TSH)およびインスリン様増殖因子1(IGF−1)に対するTPO反応の主要なメディエーターである(Aza−Blanc,P.、R.Di Lauro、およびP.Santisteban. Mol.Endocrinol. 7:1297−1306(1993))。FoxE1の発現、ならびにそのDNA結合活性および転写活性は、TSHおよびIGF−1によって活性化され、FoxE1 DNA結合部位は、甲状腺遺伝子の特異的発現を制御するホルモン応答配列を構成する(Ortiz,L.ら、J.Biol.Chem. 272:23334−23339(1997))。FOXE1は、サイログロブリン(Tg)および甲状腺ペルオキシダーゼ(TPO)遺伝子などの甲状腺特異的遺伝子の転写を制御することへのその関与に基づいて、甲状腺の分化した状態の維持のためにも必要である。これらの遺伝子の両方の制御された発現は、甲状腺ホルモン、トリヨードチロニン(T3)およびチロキシン(T4)の合成のために極めて重要である。なぜなら、TgはT3およびT4の前駆体であり、それらの合成はTPOによって触媒されるからである。主要な制御因子として作用する甲状腺刺激ホルモン(TSH)は、甲状腺ホルモンの合成および分泌の制御にとって中心的な役割を果たす。
本発明者らは、rs965513が血清中のTSH、遊離T4および遊離T3のレベルと関連するということも見出した。これは、染色体9q22領域の中のマーカーと甲状腺癌および甲状腺癌に関連する生物活性との関連をさらに裏付ける。
(マーカーおよびハプロタイプの評価)
集団内のゲノム配列は、個体を比較すると同一ではない。ある程度、ゲノムは、ゲノム中の多くの部位で、個体間の配列変異性を呈する。このような配列の変異は、通常、多型性と呼ばれ、各ゲノム内に多くのこのような部位がある。例えば、ヒトゲノムは、平均500塩基対ごとに生じる配列多様性を呈する。最も一般的な配列変異は、ゲノム中の単一の塩基位置の塩基変異からなり、このような配列変異、または多型性は、通常、一塩基多型(「SNP」)と呼ばれる。これらのSNPは、単一の突然変異事象によって生じていると考えられ、従って、通常、各SNP部位において可能性を有する、2つの可能性のある対立遺伝子がある(本来の対立遺伝子および変異した対立遺伝子)。自然の遺伝的浮動、および、おそらくまた、選択圧によって、最初の変異は、いずれの所定の集団においてもその対立遺伝子の特定の頻度によって特徴付けられる多型性をもたらす。配列変異の多くの他の型は、ヒトゲノムにおいて見出され、ミニサテライトおよびマイクロサテライト、ならびに挿入、欠損、逆位(コピー数多型(CNV)とも呼ばれる)を含む。多型のマイクロサテライトは、複数の小塩基反復(CA反復、相補鎖上のTGなど)を、反復長数が一般的な集団において異なる特定の部位に有する。一般論では、多形性部位に関する配列の各バージョンは、多形性部位の特定の対立遺伝子を表す。すべてのこれらの配列変異は、問題になっている配列変異を特徴付ける特定の多形性部位に生じる、多型性と呼ばれ得る。一般に、多型性は、あらゆる数の特定の対立遺伝子を含み得る。従って、本発明の1つの実施態様では、当該多型性は、いずれの所定の集団においても2つ以上の対立遺伝子の存在によって特徴付けられる。別の実施態様では、当該多型性は、3つ以上の対立遺伝子の存在によって特徴付けられる。他の実施態様では、当該多型性は、4つ以上の対立遺伝子、5つ以上の対立遺伝子、6つ以上の対立遺伝子、7つ以上の対立遺伝子、9つ以上の対立遺伝子、または10以上の対立遺伝子によって特徴付けられる。すべてのこのような多型性は、本発明の方法およびキットに使用され得、従って、本発明の範囲内である。
その存在量によって、SNPは、ヒトゲノムの配列変異性の大部分について説明する。600万超のSNPが、現在までに確認されている(http://www.ncbi.nlm.nih.gov/projects/SNP/snp_summary.cgi)。しかし、CNVは、ますます注目されている。これらの大規模な多型性(典型的には、1kb以上)は、構築されたヒトゲノムの実質的な割合に影響する多型の変異性を説明する。公知のCNVはヒトゲノム配列の15%超にわたる(covery)(Estivill,X Armengol;L.、PloS Genetics 3:1787−99(2007)。http://projects.tcag.ca/variation/)。しかし、これらの多型性のほとんどは、非常に稀であり、平均して、各個体のゲノム配列の一部分のみに影響する。CNVは、遺伝子量の撹乱により遺伝子発現、表現型の変異性および適応に影響することが知られ、また、疾病(微小欠失疾患および微小重複疾患)の原因となることも知られ、一般的な複合疾患(HIV−1感染および糸球体腎炎を含む)のリスクを与える(Redon,R.ら、Nature 23:444−454(2006))。従って、前述のCNVまたは未知のCNVのいずれかが、甲状腺癌と関連のあると本願明細書に記載されたマーカーと連鎖不平衡の、原因となる変異体を表わす可能性がある。CNVの検出方法は、比較ゲノムハイブリダイゼーション(CGH)および遺伝子型の同定(Carter (Nature Genetics 39:S16−S21(2007))によって記載されたように、遺伝子型の同定アレイの使用を含む)を含む。ゲノムの変異体のデータベース(http://projects.tcag.ca/variation/)は、記載されたCNVの位置、型および大きさについての最新の情報を含む。当該データベースは、現在、15,000超のCNVのデータを含む。
いくつかの例では、参照対立遺伝子を選択することなく、多形性部位の異なる対立遺伝子が参照される。あるいは、参照配列は、特定の多形性部位を意味し得る。参照対立遺伝子は、「野生型」の対立遺伝子と呼ばれることもあり、それは、第1に配列決定された対立遺伝子、または「非罹患の」個体(例えば、形質または疾病の表現型を示さない個体)からの対立遺伝子のいずれかとして通常は選択される。
本願明細書で述べられたSNPマーカーの対立遺伝子は、使用されたSNPアッセイにおいて多形性部位に生じる場合、塩基A、C、GまたはTを意味する。本願明細書で使用されるSNPについての対立遺伝子コードは、下記のとおりである;1=A、2=C、3=G、4=T。しかし、当業者は、逆のDNA鎖のアッセイまたは解読によって、相補的な対立遺伝子が各症例において判定され得ることを理解するだろう。従って、A/G多型性によって特徴付けられる多形性部位(多型マーカー)について、使用されるアッセイは、可能性のある2つの塩基(すなわちAおよびG)のうち1つまたは両方の存在を特異的に検出するように設計されてもよい。あるいは、鋳型DNA上の逆ストランドを検出するように設計されたアッセイを設計することで、相補的塩基TおよびCの存在が判定され得る。(例えば、相対リスクに関して)量的に、同一の結果が、いずれかのDNA鎖(+鎖または−鎖)の判定から得られ得る。
典型的には、参照配列は、特定の配列を意味する。当該参照と異なる対立遺伝子は、「変異」対立遺伝子と呼ばれることもある。変異配列は、本願明細書で使用される場合、参照配列と異なるが、その他の点では実質的に類似である配列を意味する。本願明細書記載の多型の遺伝子マーカーの対立遺伝子は変異体である。変異体は、ポリペプチドに影響する変化を含み得る。配列の相違は、参照ヌクレオチド配列と比較した場合、以下を含み得る;フレームシフトをもたらす、1つのヌクレオチドの挿入もしくは欠損、または1より多いヌクレオチドの挿入もしくは欠損;コードされるアミノ酸中の変化をもたらす、少なくとも1つのヌクレオチドの変化;中途終止コドンの生成をもたらす、少なくとも1つのヌクレオチドの変化;ヌクレオチドによってコードされた1つまたは複数のアミノ酸の欠損をもたらす、いくつかのヌクレオチドの欠損;読み枠のコード配列の中断をもたらす、不等組み換えまたは遺伝子変換などによる1つまたはいくつかのヌクレオチドの挿入;すべてまたは一部の配列の重複;転座;またはヌクレオチド配列の再編成。このような配列変化は、核酸によってコードされたポリペプチドを変化させ得る。例えば、核酸配列の変化がフレームシフトを引き起こすと、当該フレームシフトはコードされたアミノ酸の変化をもたらし得、かつ/または、切断されたポリペプチドの生成をもたらす、中途終止コドンの生成をもたらし得る。あるいは、疾病または形質と関連する多型性は、1つまたは複数のヌクレオチドにおける同義の変化(すなわち、アミノ酸配列の変化をもたらさない変化)であり得る。このような多型性は、例えば、スプライス部位を変化させ得、mRNAの安定性または輸送に影響し得、またはそうでなければコードされたポリペプチドの転写または翻訳に影響し得る。このような多型性はまた、構造の変化(増幅または欠損など)が体細胞レベルで生じるという可能性を増加させるようにDNAを変化させ得る。参照ヌクレオチド配列にコードされたポリペプチドは、特定の参照アミノ酸配列を有する「参照」ポリペプチドであり、変異対立遺伝子によってコードされたポリペプチドは、変異アミノ酸配列を有する「変異」ポリペプチドと呼ばれる。
ハプロタイプは、DNAの一本鎖の分節に沿って並んだ対立遺伝子の特定の組み合わせによって特徴付けられる、そのDNAの一本鎖の分節を意味する。二倍体の生物(ヒトなど)では、ハプロタイプは、各多型マーカーまたは遺伝子座の対の対立遺伝子のうちの1のメンバーを含む。ある実施態様では、当該ハプロタイプは、2つ以上の対立遺伝子、3つ以上の対立遺伝子、4つ以上の対立遺伝子、または5つ以上の対立遺伝子(各対立遺伝子は分節に沿った特定の多型マーカーに対応する)を含み得る。ハプロタイプは、多形性部位において特定の対立遺伝子を有する、様々な多型マーカーの組み合わせ(例えば、SNPとマイクロサテライト)を含み得る。従って、ハプロタイプは、様々な遺伝子マーカーの対立遺伝子の組み合わせを含む。
特定の多型マーカーおよび/またはハプロタイプの検出は、多形性部位の配列の検出のための、当該技術分野で公知の方法によって達成され得る。例えば、SNPおよび/またはマイクロサテライトマーカーの存在についての遺伝子型の同定の標準的な技術(PCR、LCR、ネステッドPCRおよび核酸増幅のための他の技術を用いた、蛍光に基づいた技術(Chen X.ら、Genome Res.9(5):492−98(1999);Kutyavinら、Nucleic Acid Res. 34:e128(2006))など)が使用され得る。SNP遺伝子型の同定について利用可能な特定の市販の方法論は、TaqMan遺伝子型の同定アッセイおよびSNPlexプラットフォーム(アプライドバイオシステムズ(Applied Biosystems))、ゲル電気泳動(アプライドバイオシステムズ)、質量分析(例えば、MassARRAYシステム、シーケノム(Sequenom))、ミニ配列分析法、リアルタイムPCR、Bio−Plexシステム(バイオラッド(BioRad))、CEQおよびSNPstreamシステム(ベックマン(Beckman))、アレイハイブリダイゼーション技術(例えば、Affymetrix遺伝子チップ、パーレジェン(Perlegen))、ビーズアレイ技術(例えば、イルミナ GoldenGateおよびInfiniumアッセイ)、アレイタグ技術(例えば、Parallele)、およびエンドヌクレアーゼに基づいた蛍光ハイブリダイゼーション技術(インベーダー法、サードウェイブ(Third Wave))を含むが、これらに限定されない。利用できるアレイプラットフォームのいくつか(アフィメトリクス(Affymetrix)SNPアレイ 6.0およびイルミナ CNV370−Duoおよび1M ビーズチップス(BeadChips)を含む)は、あるCNVをタグするSNPを含む。これにより、これらのプラットフォームに含まれた代用SNPによって、CNVの検出が可能となる。従って、当業者に利用可能なこれらのまたは他の方法の使用によって、多型マーカー(マイクロサテライト、SNPまたは他のタイプの多型マーカーを含む)の1つまたは複数の対立遺伝子を同定し得る。
本発明の構成では、疾病に対して増加した感受性(すなわち、増加したリスク)を有する個体は、当該疾病について増加した感受性(増加したリスク)を与える1つもしくは複数の多型マーカーの少なくとも1つの特定の対立遺伝子またはハプロタイプが同定された(すなわち、リスクのあるマーカー対立遺伝子またはハプロタイプ)個体である。当該リスクのあるマーカーまたはハプロタイプは、当該疾病の増加したリスク(増加した感受性)を与えるものである。1つの実施態様では、マーカーまたはハプロタイプに関連する有意性は、相対リスク(RR)によって判定される。別の実施態様では、マーカーまたはハプロタイプに関連する有意性は、オッズ比(OR)によって判定される。さらなる実施態様では、当該有意性は、割合(%)によって判定される。1つの実施態様では、有意に増加したリスクは、少なくとも1.2のリスク(相対リスクおよび/またはオッズ比)(少なくとも1.2、少なくとも1.3、少なくとも1.4、少なくとも1.5、少なくとも1.6、少なくとも1.7、1.8、少なくとも1.9、少なくとも2.0、少なくとも2.5、少なくとも3.0、少なくとも4.0、および少なくとも5.0を含むがこれらに限定されない)として判定される。特定の実施態様では、少なくとも1.2のリスク(相対リスクおよび/またはオッズ比)が有意である。別の特定の実施態様では、少なくとも1.3のリスクが有意である。さらに別の実施態様では、少なくとも1.4のリスクが有意である。さらなる実施態様では、少なくとも約1.5の相対リスクが有意である。別のさらなる実施態様では、リスクの有意な増加は、少なくとも約1.7が有意である。しかし、他のカットオフ、例えば、少なくとも1.15、1.25、1.35などもまた考えられ、このようなカットオフもまた本発明の範囲内である。他の実施態様では、リスクの有意な増加は、少なくとも約20%(約25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、150%、200%、300%、および500%を含むがこれらに限定されない)である。1つの特定の実施態様では、リスクの有意な増加は、少なくとも20%である。他の実施態様では、リスクの有意な増加は、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、および少なくとも100%である。本発明を特徴付ける、当業者によって適しているとみなされる他のカットオフまたは範囲も、しかしまた考えられ、それらもまた本発明の範囲内である。ある実施態様では、リスクの有意な増加は、p値が0.05未満、0.01未満、0.001未満、0.0001未満、0.00001未満、0.000001未満、0.0000001未満、0.00000001未満、または0.000000001未満などの、p値によって特徴付けられる。
本願明細書に記載されるリスクのある多型マーカーまたはハプロタイプは、少なくとも1つのマーカーの少なくとも1つの対立遺伝子またはハプロタイプが、比較群(対照)におけるその存在の頻度と比較して、疾病(もしくは形質)のリスクのある(罹患した)、または疾病と診断された個体においてより頻繁に存在するものであり、当該マーカーまたはハプロタイプの存在が疾病に対する感受性を示す。1つの実施態様では、対照群は、集団の試料、すなわち一般的な集団から得た確率標本であってもよい。対照群は、別の実施態様では、疾病フリーの個体群によって表される。このような疾病フリーの対照は、1つの実施態様では、1つまたは複数の特定の疾病に関連する症候の不存在によって特徴付けられてもよい。あるいは、この疾病フリーの対照は、当該疾病と診断されたことがない対照である。別の実施態様では、当該疾病フリーの対照群は、1つまたは複数の疾病特異的な危険因子の不存在によって特徴付けられる。このような危険因子は、1つの実施態様では、少なくとも1つの環境的な危険因子である。代表的な環境的因子は、特定の疾病または形質について発生のリスクに影響することが知られる、または影響すると考えられる天然物、鉱物または他の化学薬品である。他の環境的な危険因子は、生活スタイルに関連する危険因子である(飲食の習慣、主な居住環境の地理的な位置、および職業性危険因子を含むが、これらに限定されない)。別の実施態様では、危険因子は、少なくとも1つの遺伝的危険因子を含む。
相関についての簡易な検定の例は、2×2の表のフィッシャーの正確確率検定であり得る。所定の染色体コホートについて、マーカーまたはハプロタイプの両方を含む染色体数、マーカーまたはハプロタイプのうち片方のみを含むが、もう片方は含まない染色体数、およびマーカーまたはハプロタイプのどちらも含まない染色体数から、2×2の表が作成される。当業者に知られた他の関連の統計検定もまた考えられ、これらもまた本発明の範囲内である。
本発明の他の実施態様では、疾病または形質について減少した感受性(すなわち、減少したリスク)を有する個体は、疾病または形質について減少した感受性を与える1つまたは複数の多型マーカーの少なくとも1つの特定の対立遺伝子またはハプロタイプが同定された個体である。減少したリスクを与えるマーカー対立遺伝子および/またはハプロタイプはまた、保護的であると言える。1つの態様では、保護マーカーまたはハプロタイプは、疾病または形質の有意に減少したリスク(または感受性)を与えるものである。1つの実施態様では、有意に減少したリスクは、0.90未満の相対リスク(またはオッズ比)(0.90未満、0.80未満、0.7未満、0.6未満、0.5未満、0.4未満、0.3未満、0.2未満および0.1未満を含むが、これらに限定されない)として判定される。1つの特定の実施態様では、有意に減少したリスクは0.7未満である。別の実施態様では、有意に減少したリスクは、0.5未満である。さらに別の実施態様では、有意に減少したリスクは、0.3未満である。別の実施態様では、リスク(または感受性)の減少は、少なくとも20%(少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%および少なくとも98%を含むが、これらに限定されない)である。1つの特定の実施態様では、リスクの有意な減少は、少なくとも約30%である。別の実施態様では、リスクの有意な減少は、少なくとも約50%である。別の実施態様では、リスクの減少は、少なくとも約70%である。本発明を特徴付ける、当業者によって適しているとみなされる他のカットオフまたは範囲も、しかしまた考えられ、それらもまた本発明の範囲内である。
当業者は、2つの対立遺伝子を有する多型マーカーが、検討された集団に存在し(SNPなど)、1つの対立遺伝子が、当該集団において形質または疾病を有する個体群中で対照と比較して増加した頻度が見出されると、マーカーのもう1つの対立遺伝子は、形質または疾病を有する個体群中で、対照と比較して、減少した頻度で見出されることが理解するだろう。このような場合は、マーカーの1つの対立遺伝子(形質または疾病を有する個体中で増加した頻度で見出されたもの)は、リスクのある対立遺伝子であり、一方、もう1つの対立遺伝子は保護的対立遺伝子となるだろう。
疾病または形質に関連する遺伝的変異は、所定の遺伝子型についての疾病のリスクを予測するために、単独で使用され得る。2対立形質のマーカー(SNPなど)については、3つの可能性のある遺伝子型がある(リスク変異のホモ接合体、ヘテロ接合体、およびリスク変異の非保有者)。複数の座位の変異と関連するリスクは、全体のリスクの評価に使用され得る。複数のSNP変異については、k個の可能性のある遺伝子型(k=3n×2p)がある。nは、常染色体の座位数であり、pは、ゴノソーマルな(gonosomal)(性染色体の)座位数である。複数のリスク変異体についての全体のリスクアセスメントの算出は、通常、異なる遺伝的変異の相対リスクが掛かる、すなわち、特定の遺伝子型の組み合わせと関連する全体のリスク(例えば、RRまたはOR)が、各遺伝子座の遺伝子型のリスク値の積であることを想定している。性別および民族性をマッチさせた参照集団と比較して、示されたリスクが、ヒトまたはヒトの特定の遺伝子型の相対リスクである場合は、複合リスクは遺伝子座特異的なリスク値の積であり、また、これは当該集団と比較した全体的のリスク推定値と一致する。ヒトのリスクが、リスク対立遺伝子の非保有者との比較に基づく場合、複合リスクは、すべての座位の遺伝子型の所定の組み合わせを有する個人を、これらの座位のいずれでもリスク変異を有さない個体群と比較した推定値と一致する。いずれのリスク変異も有さない非保有者群は、最も低いリスク推定値を有し、自身(すなわち、非保有者)と比較した複合リスクが1.0であるが、集団と比較した全体のリスクは1.0未満である。非保有者群は潜在的に、特に多数の座位について、非常に小さいものであり得ることに注意すべきであり、この場合、その関連性は対応して小さい。
複合モデルは、通常、複合形質のデータにまずまず適合する簡潔なモデルである。多重度からの偏差は、一般的な疾病の一般的な変異に関連して稀に記載され、報告されたとしても、座位間の統計的相互作用を示すことができるように、非常に大きなサンプルサイズが通常要求されることから、通常、示唆的であるのみである。
例として、前立腺癌に関連すると記載されている全部で8つの変異を考えることにする(Gudmundsson,J.ら、Nat Genet 39:631−7(2007)、Gudmundsson,J.ら、Nat Genet 39:977−83(2007);Yeager,M.ら、Nat Genet 39:645−49(2007)、Amundadottir,L.ら、Nat Genet 38:652−8 (2006); Haiman,C.A.ら、Nat Genet 39:638−44(2007))。これらの遺伝子座のうちの7つは常染色体の上にあり、残りの遺伝子座は染色体X上にある。理論上の遺伝子型の組み合わせの総数は、37×21=4374である。これらの遺伝子型のクラスのいくつかは非常に稀であるが、依然として可能性があり、全体のリスクアセスメントに考慮されるべきである。複数の遺伝的変異の場合に適用される複合モデルはまた、遺伝的変異が「環境的な」因子と明瞭には相関していないと仮定して、非遺伝的危険変異と合わせることが妥当であろうと思われる。換言すれば、遺伝的リスクおよび非遺伝的リスクのある変異は、非遺伝的危険因子および遺伝的危険因子が相互作用していないと仮定して、複合リスクを推定するために複合モデル下で評価し得る。
同様の定量的アプローチを使用し、甲状腺癌に関連する多数のこれらのおよび他の変異に関連する複合または全体のリスクを評価してもよい。これは、マーカーrs965513(配列番号:1)、rs907580(配列番号:2)およびrs7024345(配列番号:3)、またはそれらと連鎖不平衡のマーカーのうちのいずれかのものの組み合わせを含む。
(連鎖不平衡)
各減数分裂事象の間に各染色体対に平均1度生じる、組み換えの自然現象は、自然が配列変異(および、結果生じる生物学的機能)をもたらす1つの方法を表す。組み換えはゲノム中でランダムには生じないことが発見された。ある程度、組み換え率の頻度に大きな変異があり、高い組み換え頻度の小領域(組み換えホットスポットとも呼ばれる)、および、低い組み換え頻度のより大きな領域(通常、連鎖不平衡(LD)ブロックと呼ばれる)をもたらす(Myers,S.ら、Biochem Soc Trans 34:526−530(2006);Jeffreys,A.J.ら、Nature Genet 29:217−222(2001);May,C.A.ら、Nature Genet 31:272−275(2002))。
連鎖不平衡(LD)は、2つの遺伝因子の非ランダム分類を意味する。例えば、特定の遺伝因子(例えば、多型マーカーの対立遺伝子、またはハプロタイプ)が0.50(50%)の頻度で集団に生じ、別の因子が0.50(50%)の頻度で生じると、当該因子のランダム分布を仮定すると、ヒトが両因子を有すると予測される発生率は0.25(25%)である。しかし、2つの因子が0.25より高い頻度でともに生じることが発見されると、それらの別個の発生頻度(例えば、対立遺伝子またはハプロタイプの頻度)における予測よりも高い割合で、ともに遺伝する傾向にあるため、当該因子は、連鎖不平衡であると言える。大まかに言うと、LDは、一般的に、2つの因子間の組み換え事象の頻度と相関する。対立遺伝子またはハプロタイプの頻度は、集団内の個体の遺伝子型の同定、および集団の各対立遺伝子またはハプロタイプの発生頻度の測定によって、集団において判定し得る。二倍体の集団(例えば、ヒト集団)については、個体は、典型的に各遺伝因子(例えば、マーカー、ハプロタイプまたは遺伝子)について2つの対立遺伝子または対立遺伝子の組み合わせを有するだろう。
多くの異なる基準が、連鎖不平衡(LD;Devlin,B.およびRisch,N.、Genomics 29:311−22(1995)において概説されている)の強さの評価について提案されてきた。大部分は、対の2対立形質の部位間の関連の強さを捉える。2つの重要な対のLDの基準は、r2(Δ2と表示されることもある)および|D’|である(Lewontin,R.、Genetics 49:49−67(1964);Hill,W.G.およびRobertson,A. Theor.Appl.Genet.22:226−231(1968))。両基準とも、0(不平衡がない)から1(「完全な」不平衡)の範囲であるが、それらの解釈は少し異なる。|D’|は、2つまたは3つのみの可能性のあるハプロタイプが存在する場合1に等しく、すべての4つの可能性のあるハプロタイプが存在する場合に<1となるように定義される。従って、<1の|D’|値は、背景の組み換えが、2つの部位間(再発性変異もまた、|D’|を<1にし得るが、一塩基多型(SNP)については、これは通常、組み換えよりも可能性が少ないと考えられる)で起きたかもしれないことを示す。基準のr2は、2つの部位間の統計的相関を表し、2つのハプロタイプのみが存在する場合は、値は1である。
r2基準は、r2と、感受性座位とSNPとの間の関連を検出するのに必要な試料サイズとの間に単純な逆の関連性があるため、関連マッピングについてのほぼ間違いなく最も関連する基準である。これらの基準は、対の部位について定義されるが、いくつかの適用については、どの位強いLDが、多くの多形性部位を含む全体の領域をわたっているかについての判定が望ましいだろう(例えば、LDの強さが座位間もしくは集団にわたって有意に異なっているかについての試験、または特定のモデル下で、領域に、予測されるよりも多かれ少なかれLDがあるかについての試験)。ある1つの領域にわたってLDを判定することは、容易なことではないが、1つのアプローチは、集団遺伝学で開発された判定基準rを使用することである。大まかに言うと、rは、データに見られるLDを生じるために特定の集団モデル下で、どの位の組み換えが必要とされるかを判定する。この型の方法はまた、潜在的に、LDデータが組み換えホットスポットの存在についてのエビデンスを提供するかどうかについての判定の問題に対する、統計的に厳密なアプローチを提供し得る。本願明細書記載の方法において、有意なr2値は、少なくとも0.1(少なくとも0.15、0.2、0.25、0.3、0.35、0.4、0.45、0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.91、0.92、0.93、0.94、0.95、0.96、0.97、0.98、または少なくとも0.99など)であり得る。1つの好ましい実施態様では、有意なr2値は、少なくとも0.2であり得る。あるいは、本願明細書に記載される連鎖不平衡は、少なくとも0.2の|D’|値(0.3、0.4、0.5、0.6、0.7、0.8、0.85、0.9、0.95、0.96、0.97、0.98、または少なくとも0.99など)によって特徴付けられる連鎖不平衡を意味する。従って、連鎖不平衡は別個のマーカーの対立遺伝子間の相関を表す。これは、相関係数または|D’|(最高1.0のr2および最高1.0の|D’|)によって評価される。ある実施態様では、連鎖不平衡は、r2および|D’|基準の両方についての値によって定義される。1つのこのような実施態様では、有意な連鎖不平衡はr2>0.1および|D’|>0.8として定義される。別の実施態様では、有意な連鎖不平衡は、r2>0.2および|D’|>0.9として定義される。連鎖不平衡を判定するためのr2および|D’|の値の他の組み合わせおよび順列(permutation)もまた企図され、それらも本発明の範囲内である。連鎖不平衡は、本願明細書で定義されたように、単一のヒト集団において判定し得、または複数のヒト集団からの個体を含む試料の収集物において判定し得る。本発明の1つの実施態様では、LDは、(http://www.hapmap.org)で定義されたように、1つまたは複数のHapMap集団(コーカサス人、アフリカ人、日本人、中国人)から得られた試料で判定される。このような実施態様の1つでは、LDは、HapMap試料のCEU集団で判定される。別の実施態様では、LDは、YRI集団において判定される。さらに別の実施態様では、LDは、アイスランド人の集団由来の試料において判定される。
ゲノム中のすべての多型性が、集団レベルで同一の場合(すなわち、LDなし)、すべての異なる多形状態を評価するために、それらのことごとくが、関連研究において検討されることが必要だろう。しかし、多型間の連鎖不平衡により、密接に連鎖した多型は強く関連し、有意な関連を観察するために関連研究において検討される必要がある多型の数は減る。LDの別の結果は、多くの多型が、これらの多型が強く関連するという事実によって関連シグナルを与える可能性がある、ということである。
ゲノムLDマップは、ゲノムにわたって作成されてきており、このようなLDマップは、疾病遺伝子のマッピングのためのフレームワークとして役立つと提案されてきている(Risch N.およびMerkiangas K、Science 273:1516−1517(1996);Maniatis N.ら、Proc Natl Acad Sci USA 99:2228−2233(2002);Reich DEら、Nature 411:199−204(2001))。
今では、ヒトゲノムの多くの部分が、少数の共通のハプロタイプを含む一連の別々のハプロタイプブロックに切断され得ることが確立されている。これらのブロックについては、連鎖不平衡データは、組み換えを示すエビデンスをわずかに提供するにすぎない(例えば、Wall.、J.D.およびPritchard,J.K.、Nature Reviews Genetics 4:587−597(2003);Daly,M.ら、Nature Genet.29:229−232(2001);Gabriel,S.B.ら、Science 296:2225−2229(2002);Patil,N.ら、Science 294:1719−1723(2001);Dawson,E.ら、Nature 418:544−548(2002);Phillips,M.S.ら、Nature Genet.33:382−387(2003)を参照)。
これらのハプロタイプブロックを定義する2つの主な方法がある。ブロックは、限られたハプロタイプの多様性を有するDNAの領域(例えば、Daly,M.ら、Nature Genet.29:229−232(2001);Patil,N.ら、Science 294:1719−1723(2001);Dawson,E.ら、Nature 418:544−548(2002);Zhang,K.ら、Proc.Natl.Acad.Sci.USA 99:7335−7339(2002)参照)、または、連鎖不平衡を使用して同定された、広範な背景の組み換えを有する転位ゾーン間の領域(例えば、Gabriel,S.B.ら、Science 296:2225−2229(2002);Phillips,M.S.ら、Nature Genet.33:382−387(2003);Wang,N.ら、Am.J.Hum.Genet.71:1227−1234(2002);Stumpf,M.P.およびGoldstein,D.B.、Curr.Biol.13:1−8(2003)参照)として定義され得る。つい最近では、ヒトゲノムにわたる組み換え率および対応するホットスポットの、詳細なスケールのマップが、作成されてきている(Myers,S.ら、Science 310:321−32324(2005);Myers,S.ら、Biochem Soc Trans 34:526530(2006))。当該マップは、組み換え率が、ホットスポット中で10〜60cM/Mbほど高く、一方、介在性領域では0に近く、従って、限られたハプロタイプの多様性および高いLDの領域を表す、ゲノムにわたる組み換えにおける莫大な変異を明らかにした。従って、当該マップは、組み換えホットスポットに隣接した領域として、ハプロタイプブロック/LDブロックを定義することに使用され得る。本願明細書で使用される場合、用語「ハプロタイプブロック」または「LDブロック」は、上述の特性、またはこのような領域を定義するために当業者によって使用される他の別の方法のいずれかによって定義されるブロックを含む。
ハプロタイプブロック(LDブロック)は、1つのマーカーまたは複数のマーカーを含むハプロタイプを使用して、表現型とハプロタイプ状態との間の関連をマッピングするために使用され得る。これらの主なハプロタイプは各ハプロタイプブロックにおいて特定され得、次いで一連の「タグした(tagging)」SNPまたはマーカー(当該ハプロタイプを区別するために必要とされるSNPまたはマーカーの最小の組)が同定され得る。これらのタグしたSNPまたはマーカーは、表現型とハプロタイプとの間の関連を特定するために、個体群由来の試料の評価で使用され得る。当該ハプロタイプブロック間で連鎖不平衡が存在し得るため、所望の場合、隣接するハプロタイプブロックは、同時に評価され得る。
従って、ゲノム中の多型マーカーへの、所定の認められた関連のいずれについても、ゲノム中のさらなるマーカーもまた関連を示すことが明らかになって来た。このことは、組み換え率の大きな変動によって認められたように、ゲノムにわたるLDの不均等な分布の当然の結果である。従って、関連の検出のために使用されたマーカーは、ある意味では、所定の疾病または形質と関連する、ゲノム領域(すなわち、ハプロタイプブロックまたはLDブロック)の「タグ」を表し、従って本発明の方法およびキットで使用するために有用である。1つまたは複数の原因である(機能的)変異体または変異は、疾病または形質に関連することが見出された領域内に属していてもよい。機能的な変異体は、別のSNP、タンデムリピート多型性(ミニサテライトまたはマイクロサテライトなど)、転位因子、またはコピー数の変異(逆位、欠損または挿入など)であってもよい。本願明細書に記載された変異体とLDにあるこのような変異は、関連の検出のために使用されたタグしたマーカーについて認められたものより、高い相対リスク(RR)またはオッズ比(OR)を与えてもよい。従って、本発明は、本願明細書記載の疾病の関連の検出のために使用されたマーカー、および当該マーカーとの連鎖不平衡のマーカーを意味する。従って、本発明のある実施態様では、本願明細書に記載された本発明のマーカーおよび/またはハプロタイプとLDのマーカーは、代用マーカーとして使用されてもよい。代用マーカーは、1つの実施態様では、本願明細書に記載されたような当該疾病と関連することが最初に見出されたマーカーまたはハプロタイプについての相対リスク(RR)および/またはオッズ比(OR)値よりも小さい相対リスク(RR)および/またはオッズ比(OR)の値を有する。他の実施態様では、代用マーカーは、本願明細書記載のように、当該疾病に関連することが最初に見出されたマーカーで最初に判定されたものより大きいRRまたはOR値を有する。このような実施態様の例は、本願明細書に記載されたものなどの、当該疾病と関連することが最初に見出された、より一般的な変異体(>10%集団における頻度)とLDにある、稀、または相対的に稀(対立遺伝子の集団における頻度が<10%)な変異体であろう。本願明細書記載のように、本発明者らによって見出された関連の検出のためにこのようなマーカーを同定および使用することは、当業者に周知のルーチンの方法によって行われ得、従ってこれらは本発明の範囲である。
(ハプロタイプ頻度の測定)
患者および対照群におけるハプロタイプの頻度は、期待値最大化アルゴリズムを使用して評価され得る(Dempster A.ら、J.R.Stat.Soc.B、39:1−38(1977))。フェーズとともに、欠損した遺伝子型および不確定度を扱うことができる当該アルゴリズムの実行が使用され得る。帰無仮説下では、患者および対照は、同一の頻度を有すると想定される。尤度法を使用し、別の仮説が検討され、候補のリスクのあるハプロタイプ(本願明細書記載のマーカーを含み得る)は、対照よりも患者において高い頻度を有していてもよく、一方、他のハプロタイプの頻度の割合は、両群で同一であると想定される。尤度は、両仮説下で別々に最大化され、対応する1−dfの可能性の割合の統計量は、統計的有意性を評価するために使用される。
感受性領域内(例えば、LDブロック領域内)のリスクのあるマーカーおよび保護マーカーならびにハプロタイプを探索するため、当該領域内の遺伝子型を同定されたマーカーのすべての可能性のある組み合わせの関連が検討される。合わされた患者および対照群は、本来の患者群および対照群とサイズが等しい、ランダムに2つのセットに分けられ得る。次いで、マーカーおよびハプロタイプ分析は、繰り返され、最も有意な記載されたp値が判定される。当該ランダム化スキームは、例えば、実験に基づいたp値の分布を作成するために、100回を超えて繰り返され得る。好ましい実施態様では、p値が<0.05であることは、有意なマーカーおよび/またはハプロタイプの関連性を示す。
(ハプロタイプ分析)
ハプロタイプ分析の1つの一般的なアプローチは、ネステッド(NEsted)モデルに適用した尤度に基づいた推論の使用に関する(Gretarsdottir S.ら、Nat.Genet.35:131−38(2003))。当該方法は、多くの多型マーカー、SNPおよびマイクロサテライトに適用してもよい、プログラムNEMOで行われる。当該方法およびソフトウェアは、異なるリスクを与えるハプロタイプ群を同定することを目的とする、症例と対照の研究のために特に設計される。これはまた、LD構造を研究するためのツールである。NEMOでは、EMアルゴリズムを活用して、観察されたデータについて最尤推定値、尤度比およびp値が直接的に算出され、観察されたデータについては欠損データの問題として扱う。
フェーズにおける不確定度および欠損遺伝子型による情報の損失を捉える、観察されたデータについて直接的に算出される尤度に基づく尤度比検定は、妥当なp値を与えるために頼ることができるが、情報が不完全であることでどの位の量の情報が失われているのかについて知ることは依然として興味深い。ハプロタイプ分析のための情報測定は、NicolaeおよびKong(Technical Report 537、シカゴ大学、統計大学(University of Statistics)、統計学科;Biometrics、60(2):368−75(2004))に、連鎖分析のために定義された情報測定の自然な拡張として記載され、NEMOにおいて実行される。
疾病に関連する単一のマーカーについては、各個々の対立遺伝子の両側p値を算出するために、フィッシャーの直接確率検定が使用され得る。通常は、すべてのp値は、特に示されない限り、多重比較について未調整で示される。(マイクロサテライト、SNPおよびハプロタイプについて)提示された頻度は、保有者頻度ではなく対立遺伝子頻度である。当該研究に家族として補充された患者の関連性によるいずれの偏りも最小化するため、第一および第二度近親者は患者リストから排除され得る。さらに、当該検定は、同胞群のためのこれまでに記載された分散調整の手順(Risch,N.およびTeng,J.Genome Res.、8:1273−1288(1998))を拡張することで、患者間の残存する関連性の関連補正のために繰り返され得、そのため、それは一般的な家族性の関連に適用され得、そして比較のため、調整したp値および未調整のp値を両方示し得る。ゲノム制御の方法(Devlin,B.およびRoeder,K. Biometrics 55:997(1999))はまた、個体および可能な層別化の関連性を調整するために使用され得る。相違は、予期されるように、一般的に非常に小さい。複数の検定について補正された単一マーカーの関連の有意性を評価するため、本発明者らは、同一の遺伝子型のデータを使用して、無作為化検定を行うことができる。患者および対照のコホートはランダム化され得、複数回の関連分析(例えば、最大500,000回)が再度行われ得、p値は、元来の患者および対照のコホートを使用して本発明者らが観測したp値よりも低いか等しい、いくつかのマーカー対立遺伝子のp値を生じる反復の一部である。
単一のマーカーおよびハプロタイプ分析の両方について、相対リスク(RR)および集団に起因するリスク(PAR)は、複合モデル(ハプロタイプの相対リスクモデル)を仮定して算出され得る(Terwilliger J.D.およびOtt,J.、Hum.Hered.42:337−46(1992)、ならびにFalk,C.T.およびRubinstein,P、Ann.Hum.Genet.51(Pt3):227−33(1987))。すなわち、ヒトが保有する2つの対立遺伝子/ハプロタイプのリスクは乗算で表される。例えば、RRが、aに関連するAのリスクである場合、ヒトホモ接合体AAのリスクは、ヘテロ接合体AaのリスクのRR倍となり、ホモ接合体aaのリスクのRR2倍となる。複合モデルは、分析および計算を単純化する良好な性質を有する。ハプロタイプは罹患した集団内で、対照集団内同様に独立であり、すなわち、ハーディ・ワインベルグ平衡にある。結果として、罹患者および対照のハプロタイプ数は、それぞれ多項分布を有するが、別の仮説下で異なるハプロタイプの頻度を有する。特に、2つのハプロタイプ(hiおよびhj)については、リスク(hi)/リスク(hj)=(fi/pi)/(fj/pj)であり、fおよびpは、それぞれ、罹患した集団における頻度および対照集団における頻度を表す。真のモデルが乗算的ではない場合、いくらかの検出力の損失がある一方で、当該損失は、極端な症例以外では、軽度である傾向がある。最も重要なのは、帰無仮説に関して算出されるため、p値が常に妥当であることである。
1つの関連研究で検出される関連シグナルは、理想的には、同一のまたは異なる民族性の、異なる集団(例えば、同一の国の異なる領域、または異なる国)からの、第2のコホートで再現されてもよい。追試の利点は、追試で実施される試験の数であり、従って、適用される必要がある統計的基準はより厳密ではないことである。例えば、300,000SNPを使用した特定の疾病または形質の感受性変異体のゲノム全体での検索に対し、実施される300,000試験(各SNPについて1つ)について補正を行うことができる。典型的に使用されるアレイ上の多くのSNPは、関連しているため(すなわち、LDにあるため)、これらは独立ではない。従って、この補正は、保守的である。それにもかかわらず、この補正因子の適用は、この保守的検定(conservative test)を単一の研究コホートから得た結果に適用するとき、そのシグナルが有意であるとみなされるためには、観察されたP値が、0.05/300,000=1.7×10−7未満であることを必要とする。自明なことであるが、P値がこの保守的な閾値未満である、ゲノム全体での関連研究で見出されたシグナルは、真の遺伝効果の基準であることは明らかであり、さらなるコホートでの再現は、必ずしも統計的な観点からのものではない。しかし、当該補正因子は、実施された統計検定の数に依存するため、最初の研究から得た1つのシグナル(1つのSNP)が、第2の症例−対照コホートで再現された場合、有意性についての適切な統計検定は、1回の統計検定についてのものであり、すなわち、P値が0.05未満である。1つまたはさらにいくつかの追加の症例−対照コホートでの追試は、さらなる集団における関連シグナルの評価を与えるという付加された利点を有し、従って、最初の発見を確認し、ヒト集団一般で試験される遺伝的変異(1つまたは複数)の全体の有意性の評価を与える。
いくつかの症例−対照コホートから得た結果は、根底にある効果の全体の評価を与えるために合わされてもよい。複数の遺伝関連研究から得た結果を合わせるために一般的に使用される方法論は、マンテル・ヘンツェルモデルである(MantelおよびHaenszel、J Natl Cancer Inst 22:719−48(1959))。当該モデルは、それぞれがおそらく遺伝的変異の異なる集団頻度を有する、異なる集団から得た関連結果が合わされる状況を扱うために設計されている。当該モデルは、ORまたはRRによって判定される当該疾病のリスクに対する変異体の効果は、すべての集団で同一であるが、当該変異体の頻度は集団間で異なっているかもしれないと仮定して結果を合わせる。いくつかの集団から得た結果を合わせることは、合わせられたコホートによって与えられる、増加した統計的検出力による、現実の根底にある関連シグナルの全体の検出力が増加するという、付加された利点を有する。さらに、個体研究のいずれの欠損(例えば、症例および対照の不均等な組み合わせまたは集団の層別化による)は、複数のコホートから得た結果が合わせられると、相殺される傾向があるだろうから、ここでも再度、真の根底にある遺伝効果のより良い評価を与えるだろう。
(リスクアセスメントおよび診断)
いずれの所定の集団内でも、疾病または形質が発生する絶対的なリスクがあり、特定の期間にわたってヒトが特定の疾病または形質を生じる可能性として定義される。例えば、乳癌についての女性の生涯の絶対的なリスクは9分の1である。つまり、9人のうち1人の女性は、その人生のある時点で乳癌を生じる。典型的には、リスクは、特定の個体を見るよりも、非常に多くの人々を見ることによって判定される。リスクはしばしば絶対的なリスク(AR)および相対リスク(RR)の観点から示される。相対リスクは、2つの変異に関連するリスクまたは人々の2つの異なる群のリスクを比較するために使用される。例えば、ある遺伝子型を有する人々の群を、異なる遺伝子型を有する別の群と比較するために使用され得る。疾病について、2の相対リスクは、1つの群が他の群に対して疾病を生じる2倍の可能性を有することを意味する。示されたリスクは、通常、性別および民族性をマッチさせた集団と比較した、ヒト、またはヒトの特定の遺伝子型についての相対リスクである。同一の性別および民族性の2個体のリスクは、簡潔な様式で比較され得る。例えば、集団と比較して、第1の個体の相対リスクが1.5であり、第2の個体の相対リスクが0.5である場合、第2の個体と比較した第1の個体のリスクは、1.5/0.5=3である。
(リスクの算出)
全体の遺伝的危険率を算出するためのモデルの創出には、2つの工程を伴う:i)1つの遺伝的変異についてのオッズ比を相対リスクに変換すること、およびii)異なる遺伝子座における複数の変異に由来するリスクを1つの相対リスク値へと組み合わせること。
(オッズ比からのリスクの誘導)
現在までに権威ある雑誌で刊行された、複合疾患についてのほとんどの遺伝子発見の研究は、それらのレトロスペクティブな設定のため、症例対照設計を用いてきた。これらの研究は、選択された組の症例(特定された病状を有する人々)および対照個体をサンプリングし、その遺伝子型を同定する。興味があるのは、症例および対照における頻度が有意に異なる遺伝的変異(対立遺伝子)である。
結果は、典型的には、オッズ比で報告される。これは、罹患者の群 対 対照におけるリスク変異体(保有者) 対 非リスク変異体(非保有者)の割合(確率)の間の比であり、すなわち当該罹患状態を条件とする確率によって表される:
OR=(Pr(c|A)/Pr(nc|A))/(Pr(c|C)/Pr(nc|C))
しかし、時には、興味が持たれるのは、当該疾病についての絶対的なリスク、すなわち当該疾病にかかる当該リスク変異体を保有する個体の割合、または換言すると当該疾病にかかる確率であるということもある。この数は、症例対照研究では直接判定され得ない。なぜなら、一部には、症例 対 対照の比は、典型的には、一般的な集団におけるものとは同じではないからである。しかし、ある仮定の下で、このオッズ比からリスクを評価し得る。
稀な疾病の仮定の下では、疾病の相対リスクはオッズ比によって近似し得るということは周知である。しかしこの仮定は、多くの一般的な疾病に対しては適用できないかもしれない。それでもなお、別の遺伝子型変異体に対する1つの遺伝子型変異体のリスクは、上で表されたオッズ比から評価され得るということは明らかである。対照が症例と同じ集団に由来する確率標本であり、厳密に罹患していない個体であるというよりは罹患した人々を含むランダム集団の対照という仮定の下では、算出は特に簡単である。サンプルサイズおよび検出力を高めるために、大きいゲノム全体での関連および再現研究の多くは、症例と年齢をマッチさせていない対照を使用し、かつその対照は、対照がその研究時に当該疾病を有していなかったということを確実にするために慎重に精査されてもいない。従って、正確ではないが、それらは、一般的集団に由来する確率標本を近似することが多い。この仮定が正確に満足されるということは稀であると予想されるが、当該リスク評価は、この仮定からの少しのずれに対しては通常はロバストであるということに留意されたい。
リスク変異体保有者「c」、および非保有者「nc」を有する優性および劣性モデル(the dominant and the recessive model)について、個体のオッズ比はこれらの変異体間のリスク比と同じであるということが、算出によって示される:
OR=Pr(A|c)/Pr(A|nc)=r
また同様に、リスクが2つの対立遺伝子のコピーに関連するリスクの積である複合モデルについて、対立遺伝子のオッズ比は危険因子に等しい:
OR=Pr(A|aa)/Pr(A|ab)=Pr(A|ab)/Pr(A|bb)=r
ここで「a」はリスク対立遺伝子を表し、「b」は非リスク対立遺伝子を表す。従って因子「r」は、対立遺伝子のタイプの間の相対リスクである。
複合疾患に関連する一般的な変異を報告する過去数年に刊行された研究の多くについて、当該複合モデルは、効果を十分に要約し、かつ優性および劣性モデルなどの代替のモデルよりも優れたデータに対する一致を最も頻繁に与えるということが見出された。
(平均的な集団のリスクに対するリスク)
平均的な集団に対する遺伝的変異のリスクを表すことが最も簡便である。なぜなら、それは、ベースラインの集団のリスクと比べて、当該疾病の発生についての生涯リスクを伝えることをより容易にするからである。例えば、複合モデルでは、変異体「aa」についての相対的な集団リスクは、
RR(aa)=Pr(A|aa)/Pr(A)=(Pr(A|aa)/Pr(A|bb))/(Pr(A)/Pr(A|bb))=r2/(Pr(aa)r2+Pr(ab)r+Pr(bb))=r2/(p2r2+2pqr+q2)=r2/R
として算出され得る。
ここで「p」および「q」は、それぞれ「a」および「b」の対立遺伝子の頻度である。同様に、RR(ab)=r/RおよびRR(bb)=1/R が得られる。対立遺伝子の頻度の評価は、オッズ比を報告する刊行物から、およびHapMapデータベースから、入手され得る。個体の遺伝子型が不明である症例においては、その試験またはマーカーについての相対的な遺伝的危険率は単に1に等しいということに留意されたい。
一例として、2型糖尿病のリスクでは、染色体10上のTCF7L2 遺伝子の中の当該疾病に関連するマーカーrs7903146の対立遺伝子Tは、非スペイン系アメリカ人白人の集団では1.37の対立遺伝子のOR、および約0.28の頻度(p)を有する。遺伝子型CCと比較した当該遺伝子型の相対リスクは、上記複合モデルに基づき評価される。
TTについては、それは1.37×1.37=1.88である;CTについては、それは単にOR 1.37であり、CCについては定義によりそれは1.0である。
対立遺伝子Cの頻度は、q=1−p=1−0.28=0.72である。このマーカーにおけるこの3つの可能性のある遺伝子型の各々の集団頻度は、
Pr(TT)=p2=0.08、Pr(CT)=2pq =0.40、およびPr(CC)=q2=0.52
である。
遺伝子型CC(これは1のリスクを有すると定義されている)に対する平均的な集団リスクは、
R=0.08×1.88+0.40×1.37+0.52×1=1.22
である。
従って、このマーカーにおける以下の遺伝子型のうちの1つを有する個体についての一般的集団に対するリスク(RR)は、
RR(TT)=1.88/1.22=1.54、RR(CT)=1.37/1.22=1.12、RR(CC)=1/1.22=0.82
である。
(複数のマーカーからのリスクの組み合わせ)
多くのSNP変異の遺伝子型が個体についてのリスクを評価するために使用される場合、特段の記載がない限り、リスクについての複合モデルが仮定され得る。これは、当該集団に対する合わせた遺伝的危険率が、個々のマーカーについて、例えば2つのマーカーg1およびg2についての対応する評価の積として算出される:
RR(g1,g2)=RR(g1)RR(g2)
ということを意味する。
根底にある仮定は、危険因子は独立に発生し振舞うということ、すなわち結合条件付き確率は積として表され得る:
Pr(A|g1,g2)=Pr(A|g1)Pr(A|g2)/Pr(A)およびPr(g1,g2)=Pr(g1)Pr(g2)
ということである。
この仮定に対する明白な違反は、2以上のリスク対立遺伝子の同時発生に相関性があるほどに、当該ゲノム上で密に間隔をあけられた、すなわち連鎖不平衡にあるマーカーである。このような場合では、相関性があるSNPのすべての対立遺伝子の組み合わせに対してオッズ比が定義されるいわゆるハプロタイプモデリングが使用され得る。
統計モデルが利用されるほとんどの場合のように、適用されるモデルは、まさに真実であるとは予想されない。なぜなら、それは、根底にある生物物理学的モデルに基づくからである。しかし、当該複合モデルは、今までのところ十分にデータに一致することが見出されている。すなわち多くのリスク変異体が発見されてきた多くの一般的な疾病について、著しいずれは検出されない。
一例として、各マーカーにおけるこの集団に対するリスクとともに、2型糖尿病のリスクに関連する4つのマーカーにおいて以下の遺伝子型を有する個体について:
染色体3 PPARG CC 算出されたリスク:RR(CC)=1.03
染色体6 CDKAL1 GG 算出されたリスク:RR(GG)=1.30
染色体9 CDKN2A AG 算出されたリスク:RR(AG)=0.88
染色体11 TCF7L2 TT 算出されたリスク:RR(TT)=1.54。
合わせると、この個体についてのこの集団に対する全体のリスクは、1.03×1.30×0.88×1.54=1.81である。
(調整された生涯リスク)
個体の生涯リスクは、集団に対する全体の遺伝的危険率に、同じ民族性および性別の一般的集団におけるおよび当該個体の地理的起源の領域における当該疾病の平均の生涯リスクを乗じることにより誘導される。一般的集団リスクを定める際に選択するためのいくつかの疫学的研究が通常は存在するので、遺伝的変異について使用されてきた疾病の定義のために十分に検討された(well−powered)研究を取り上げることにする。
例えば、2型糖尿病について、集団に対する全体の遺伝的危険率が白人男性について1.8である場合、およびその個体の層(demographic)の個体についての2型糖尿病の平均的な生涯リスクが20%である場合、その個体についての調整された生涯リスクは20%×1.8=36%である。
集団についての平均RRは1であるため、この複合モデルは当該疾病の同じ平均的な調整された生涯リスクを与えるということに留意されたい。さらに、現実の生涯リスクは100%を超え得ないため、遺伝的RRに対して上限があるべきである。
(甲状腺癌についてのリスクアセスメント)
本願明細書記載のように、このようなマーカーを含むある多型マーカーおよびハプロタイプは、甲状腺癌のリスクアセスメントに有用であることが見出された。リスクアセスメントは、甲状腺癌に対する感受性の診断のマーカーの使用に関連し得る。多型マーカー(例えばSNP)の特定の対立遺伝子は、甲状腺癌と診断されていない個体よりも、甲状腺癌を有する個体において、より頻繁であることが見出された。従って、これらのマーカー対立遺伝子は、個体において、甲状腺癌または甲状腺癌に対する感受性の検出の予測値を有する。本願明細書記載のリスクのある変異体(または保護的変異体)と連鎖不平衡のタグしたマーカーは、これらのマーカー(および/またはハプロタイプ)の代用物として使用され得る。このような代用マーカーは、特定のハプロタイプブロックまたはLDブロック内に位置し得る。このような代用マーカーはまた、時には、当該LDブロック/ハプロタイプブロックのごく近傍のいずれかに、このようなハプロタイプブロックまたはLDブロックの物理的な境界の外側に位置し得るが、より遠く離れたゲノム位置に位置する可能性もある。
長距離のLDは、例えば、特定のゲノムの領域(例えば、遺伝子)が機能的に関連している場合に生じ得る。例えば、2つの遺伝子が共通の代謝経路において役割を果たすタンパク質をコードする場合、1つの遺伝子における特定の変異は、他の遺伝子についての観察された変異に対して直接的な影響を及ぼし得る。1つの遺伝子の中の変異が遺伝子産物の増加した発現につながるという場合を考えよう。この効果を弱めて特定の経路の全体のフラックスを保存するために、この変異体は、その遺伝子の減少した発現レベルを与える第2の遺伝子での1つ(以上)の変異の選択につながったかもしれない。これらの2つの遺伝子は、おそらく異なる染色体上の異なるゲノムの部位に位置し得るが、当該遺伝子内の変異は、高LDの領域内のそれらの共通の物理的な位置のためではなく、進化力により見かけ上LDである。このようなLDも企図され、本発明の範囲内である。当業者なら、機能的な遺伝子−遺伝子相互作用の多くの他のシナリオが可能性を有し、本願明細書で論じられる特定の例は、1つのこのような可能性のあるシナリオを表しているにすぎないということは分かるであろう。
r2値が1に等しいマーカーは、リスクのある変異体の完全な代用物であり、すなわち、1つのマーカーの遺伝子型は、別の遺伝子型を完全に予測する。1より小さいr2値を有するマーカーはまた、リスクのある変異体の代用物となり得、あるいは、リスクのある変異体と同程度に高いかまたはおそらくはさらに高い相対リスク値を有する変異体を表す。同定されたリスクのある変異体は、それ自体機能的変異体ではないかもしれないが、当該例では、真の機能的変異体と連鎖不平衡にある。機能的な変異体は、例えば、タンデムリピート(ミニサテライトもしくはマイクロサテライトなど)、転位因子(例えば、Alu因子)、または構造上の変化(欠損、挿入または逆位(コピー数変異、またはCNVとも呼ばれることがある)など)であってもよい。本発明は、本願明細書で開示されたマーカーのこのような代用マーカーの評価を包含する。このようなマーカーは、当業者に周知のように、注解され、マッピングされ、および公的なデータベースに記載され、あるいは、個体群において本発明のマーカーによって同定された領域または領域の一部を配列決定し、そして得られた配列群の多型性を同定するによって、すぐに同定され得る。結果として、当業者は、すぐに、かつ過度の実験をすることなく、本願明細書記載の、マーカーおよび/またはハプロタイプと連鎖不平衡の代用マーカーの遺伝子型を同定できる。検出されたリスクのある変異体とLDにあるこれらのタグしたマーカーまたは代用マーカーはまた、個体における当該疾病への関連、または当該疾病に対する感受性を検出するための予測値を有する。本発明のマーカーとLDにあるこれらのタグしたマーカーまたは代用マーカーはまた、これらは同様に当該特定の疾病に対する感受性の検出の予測値を有するため、ハプロタイプを区別する他のマーカーを含み得る。
ある実施態様では、本発明は、甲状腺癌に関連すると本願明細書に記載の変異体の存在についての、個体から入手したゲノムDNAを含む試料の評価によって行われ得る。このような評価は、当業者に周知の方法およびさらに本願明細書記載の方法を使用し、少なくとも1つの多型マーカーの少なくとも1つの対立遺伝子の存在または不存在を検出する工程を典型的に含み、このような評価の成果に基づき、試料の由来である個体が、甲状腺癌の増加したリスクまたは減少したリスク(増加した感受性または減少した感受性)にあるかを判定する。多型マーカーの特定の対立遺伝子を検出することは、ある実施態様では、少なくとも1つの多型マーカーの少なくとも1つの対立遺伝子を同定する、特定のヒト個体についての核酸配列データを入手することによって行われ得る。この少なくとも1つのマーカーの異なる対立遺伝子は、ヒトにおける当該疾病に対する異なる感受性と関連する。核酸配列データを入手することは、単一のヌクレオチド位置での核酸配列を含み得、SNPにおける対立遺伝子を同定するのにはこれで十分である。この核酸配列データは、特に複数のヌクレオチド位置を含む遺伝子マーカーに対しては、いずれの他の数のヌクレオチド位置で配列をも含み得、これは2〜数十万、おそらくは数百万でさえのヌクレオチド(特に、コピー数多型(CNV)の場合)のどこにあってもよい。
ある実施態様では、本発明は、疾病に関連する少なくとも1つの多型マーカー(または当該疾病に関連する少なくとも1つのマーカーと連鎖不平衡のマーカー)の遺伝子型の状態についての情報を含むデータセットを利用して行われ得る。換言すれば、例えば、ある多型マーカーまたは多数のマーカーにおける配列データ、遺伝子型の数の形態にあるこのような遺伝的状態についての情報(例えば、あるリスクのある対立遺伝子の存在または不存在の指標)を含むデータセット、または1つ以上のマーカーの実際の遺伝子型は、当該疾病に関連すると本願発明者によって示された、ある多型マーカーのあるリスクのある対立遺伝子の存在または不存在についてクエリされ得る。当該疾病に関連する変異体(例えば、マーカー対立遺伝子)についての陽性の結果は、本願明細書で示されたように、データセットの由来である個体が当該疾病の増加した感受性(増加したリスク)にあることを示す。
本発明のある実施態様では、多型マーカーは、多型マーカーの遺伝子型のデータを、多型性の少なくとも1つの対立遺伝子と疾病との間の相関を含む検査表へ照会することによって、当該疾病に関連付けられる。いくつかの実施態様では、その表は1つの多型性についての相関を含む。他の実施態様では、表は多数の多型性についての相関を含む。両方のシナリオで、マーカーと当該疾病との間の相関の指標を与える検査表へ照会することによって、当該疾病のリスク、または当該疾病に対する感受性が試料の由来である個体において同定され得る。いくつかの実施態様では、相関は統計的判定基準として報告される。統計的判定基準はリスク判定基準(相対リスク(RR)、絶対的なリスク(AR)またはオッズ比(OR)など)として報告されてもよい。
本願明細書に記載されたマーカー、例えば、表2に提示されたマーカー、例えばrs965513(配列番号:1)は、単独または組合せてのいずれでも、リスクアセスメントおよび診断目的のために有用であり得る。本願明細書に記載されたマーカーに基づく甲状腺癌のリスクの結果はまた、全体のリスクを確立するために、甲状腺癌についての他の遺伝子マーカーまたは危険因子についてのデータと合わされ得る。従って、個々のマーカーによるリスクの増加が相対的に少ない、例えば10〜30%の程度である場合でさえ、その関連は、重要な影響をもたらし得る。従って、相対的に共通の変異は、全体のリスクに対して重要な寄与をし得る(集団に起因するリスクが高い)か、またはマーカーの組み合わせは、当該マーカーの合わせたリスクに基づいて、当該疾病の発生の有意な合わせたリスクにある個体群を定義するために使用され得る。
従って、本発明のある実施態様では、複数の変異体(マーカーおよび/またはハプロタイプ)は、全体のリスクアセスメントのために用いられる。これらの変異体は、1つの実施態様では、本願明細書に開示された変異体から選択される。他の実施態様は、甲状腺癌に対する感受性の診断に有用であることが知られた他の変異体と組み合わせた本発明の変異体の使用を含む。このような実施態様では、多数のマーカーおよび/またはハプロタイプの遺伝子型の状態は、関連した変異体の集団における頻度、または臨床的に健康な被験者(年齢をマッチさせた被験者および性別をマッチさせた被験者など)の変異体の頻度と比較した、個体、および個体の状態について判定される。当該技術分野で公知の方法(多変量解析もしくは共同リスク解析、または当業者に知られた他の方法など)は、その後に、複数の部位の遺伝子型の状態に基づいて与えられた全体のリスクの判定のために使用されてもよい。このような分析に基づくリスクの評価は、本願明細書記載のように、その後に、本発明の方法、使用およびキットで使用されてもよい。
甲状腺癌についてのリスクのある変異体に対してホモ接合である個体は、甲状腺癌の発生の特に高いリスクにある。これは、リスクのある対立遺伝子の用量依存的な効果に起因しており、そのため、ホモ接合保有者についてのリスクは、一般的に、各対立遺伝子のコピーについてのリスクの二乗と見積もられる。1つのそのような実施態様では、マーカーrs965513の対立遺伝子Aに対してホモ接合の個体は、一般的集団および/またはrs965513−Aリスク対立遺伝子の非保有者と比べて、甲状腺癌の特に高い発生のリスクにある。
上述のように、ヒトゲノムのハプロタイプブロックの構造は、疾病または形質と元来関連した変異と連鎖不平衡にある数多くの変異(マーカーおよび/またはハプロタイプ)は、疾病または形質に対する関連の評価のための代用マーカーとして使用されてもよいという効果を有する。このような代用マーカーの数は、因子(領域内の背景の組み換え率、領域内の変異の頻度(すなわち、領域内の多形性部位またはマーカーの数)、および領域内のLDの程度(LDブロックのサイズ)など)に依存するだろう。これらのマーカーは、通常、本願明細書記載の方法または他の当業者に知られた方法を使用して定義されるように、問題となっているLDブロックまたはハプロタイプブロックの物理的な境界内に位置する。しかし、時折、マーカーおよびハプロタイプの関連は、上で論じたように、定義されたハプロタイプブロックの物理的な境界を越えて拡張することが見出された。このようなマーカーおよび/またはハプロタイプはまた、これらの場合において、定義されたハプロタイプブロック内に物理的に属するマーカーおよび/またはハプロタイプの代用マーカーおよび/またはハプロタイプとして使用されてもよい。結果として、本発明のマーカーおよびハプロタイプとLDにあるマーカーおよびハプロタイプ(典型的には、0.1より大きいマーカー間r2によって特徴付けられ、0.2より大きいr2など(0.3より大きいr2を含み、0.4より大きいr2値によって相関づけられるマーカーをまた含む))はまた、これらが定義されたハプロタイプブロックの境界を越えて物理的に位置している場合であっても、本発明の範囲内である。これは、本願明細書記載のマーカー(例えば、rs965513)を含むがまた、1または複数の表10、表15および表19に記載されたマーカーと強いLD(例えば、0.1より大きいr2、0.2より大きいr2および/または|D’|>0.8によって特徴付けられる)にある他のマーカー(例えば、表2に記載されるマーカー)を含んでいてもよい。
本願明細書記載のSNPマーカーについて、患者において過剰であることが見出された対立遺伝子(リスクのある対立遺伝子)に対して逆の対立遺伝子は、甲状腺癌において頻度が減少していることが見出された。このようなマーカーとLDにあり、かつ/またはこのようなマーカーを含む、マーカーおよびハプロタイプは、従って、甲状腺癌に対して保護的であり、すなわち、これらは甲状腺癌を発生させるこれらのマーカーおよび/またはハプロタイプを保有する個体において減少したリスクまたは感受性を与える。
あるハプロタイプを含めて、ある本発明の変異は、いくつかの症例では、様々な遺伝的マーカー(例えば、SNPおよびマイクロサテライト)の組み合わせを含む。ハプロタイプの検出は、多形性部位の配列の検出のための当該技術分野で公知の方法および/または本願明細書記載の方法によって達成され得る。さらに、あるハプロタイプまたはマーカーのセットと、疾病の表現型との間の相関は、標準的な技法を使用して検証され得る。相関についての簡易試験の代表的な例は、2×2の表のフィッシャーの直接確率検定であるだろう。
特定の実施態様では、甲状腺癌に関連することが見出されたマーカー対立遺伝子またはハプロタイプ(例えば、表1に記載されたマーカー対立遺伝子)は、マーカー対立遺伝子またはハプロタイプが、健康な個体(対照)におけるその存在の頻度と比較して、または当該集団から無作為に選択された個体において、甲状腺癌のリスクのある(罹患した)個体により頻繁に存在するものであり、当該マーカー対立遺伝子またはハプロタイプの存在は、甲状腺癌に対する感受性を示す。他の実施態様では、甲状腺癌に関連することが本発明において見出された1または複数のマーカー(例えば、表1に記載されたマーカー対立遺伝子、ならびにそれらと連鎖不平衡のマーカー)と連鎖不平衡にあるリスクのあるマーカーは、健康な個体(対照)における、または当該集団から無作為に選択された個体におけるその存在の頻度と比較して、甲状腺癌のリスクのある(罹患した)個体により頻繁に存在するタグしたマーカーであり、当該タグしたマーカーの存在は、甲状腺癌に対する増加した感受性を示す。さらなる実施態様では、甲状腺癌に関連することが見出された1または複数のマーカーと連鎖不平衡の、リスクのあるマーカー対立遺伝子(すなわち、増加した感受性を与える)は、健康な個体(対照)におけるその存在の頻度と比較して、甲状腺癌のリスクのある個体により頻繁に存在する1または複数の対立遺伝子を含むマーカーであり、当該マーカーの存在は甲状腺癌に対する増加した感受性を示す。
(集団の研究)
一般的な意味では、本発明の方法およびキットは、いずれの供給源およびいずれの個体に由来する核酸物質(DNAまたはRNA)を含む試料から、またはこのような試料に由来する遺伝子型データからから利用され得る。好ましい実施態様では、個体はヒト個体である。個体は、成人、子供、または胎児であり得る。この核酸供給源は、核酸物質を含むいずれの試料であってもよく、例としては生物学的試料、またはそれに由来する核酸物質を含む試料が挙げられる。本発明はまた、標的集団のメンバーである個体のマーカーおよび/またはハプロタイプの評価について提供する。このような標的集団は、1つの実施態様では、他の遺伝要因、バイオマーカー、生物物理的なパラメータ、甲状腺癌または関連する疾病の履歴、甲状腺癌の以前の診断、甲状腺癌の家族歴)に基づく、甲状腺癌を発生させるリスクがある個体の集団または群である。標的集団は、ある実施態様では、診断医学または治療医学に起因する放射線被曝、核爆発から生じた放射性降下物、原子力発電所または他の放射活性源に起因する放射線被曝など、既知の放射線被曝をもつ集団または群である。
本発明は、特定の年齢亜群(40歳超、45歳超、または50、55、60、65、70、75、80、または85歳超など)からの個体を含む実施態様を提供する。本発明の他の実施態様は、他の年齢群(85歳未満の個体など、80歳未満、75歳未満、または70、65、60、55、50、45、40、35、または30歳未満など)に関する。他の実施態様は、甲状腺癌の発生時の年齢が上述の年齢幅のいずれかである個体に関する。年齢幅は、ある実施態様では、発生時の年齢が45歳以上だが60歳未満などであることに関連していてもよいことも考慮される。しかし、他の年齢幅もまた考慮され、上記の年齢の値によってひとまとめにされるすべての年齢幅を含む。本発明は、さらに、いずれかの性別(男性または女性)の個体に関する。
アイスランド人の集団は、北欧の祖先を有するコーカサス人の集団である。アイスランド人の集団の遺伝的連鎖および関連の結果を報告する数多くの研究が、直近の数年間に発表されてきている。これらの研究の多くは、特定の疾病に関連しているとしてアイスランド人の集団で最初に同定された変異の複製を、他の集団でも示した(Styrkarsdottir,U.ら、N Engl J Med、2008年4月29日(印刷物に先駆けた電子出版);Thorgeirsson,T.ら、Nature 452:638−42(2008);Gudmundsson,J.ら、Nat Genet. 40:281−3(2008);Stacey,S.N.ら、Nat Genet. 39:865−69(2007);Helgadottir,A.ら、Science 316:1491−93(2007);Steinthorsdottir,V.ら、Nat Genet. 39:770−75(2007);Gudmundsson,J.ら、Nat Genet. 39:631−37(2007);Frayling,TM、Nature Reviews Genet 8:657−662(2007);Amundadottir,L.T.ら、Nat Genet. 38:652−58(2006);Grant,S.F.ら、Nat Genet. 38:320−23(2006))。従って、アイスランド人の集団における遺伝的発見は、一般的に、他の集団(アフリカ人の集団およびアジア人の集団を含む)において再現されている。
甲状腺癌に関連することが見出された本発明のマーカーは、他のヒト集団において同様の関連性を示すと考えられている。従って、ヒト個体集団を含む特定の実施態様もまた、考慮され、本発明の範囲内である。このような実施態様は、コーカサス人の集団、ヨーロッパ人の集団、アメリカ人の集団、ユーラシア人の集団、アジア人の集団、中央/南アジア人の集団、東アジア人の集団、中東人の集団、アフリカ人の集団、スペイン系アメリカ人の集団、およびオセアニア人の集団を含む(しかしこれらに限定されない)1または複数のヒト集団の出身であるヒト被験者に関する。ヨーロッパ人の集団は、スウェーデン人、ノルウェー人、フィンランド人、ロシア人、デンマーク人、アイスランド人、アイルランド人、ケルト人、英国人、スコットランド人、オランダ人、ベルギー人、フランス人、ドイツ人、スペイン人、ポルトガル人、イタリア人、ポーランド人、ブルガリア人、スラブ人、セルビア人、ボスニア人、チェコスロバキア(Chech)人、ギリシャ人およびトルコ人集団を含むが、これらに限定されない。さらに、本発明の他の実施態様では、バンツー人、マンデンク(Mandenk)人、ヨルバ族、サン(San)人、ムブティピグミー(Mbuti Pygmy)族、オークニー諸島民、アディゲル(Adygel)人、ロシア人、サルデーニャ人、トスカナ人、モザバイト(Mozabite)人、ベドウィン,ドゥルーズ(Druze)人、パレスチナ人,バロチ(Balochi)人、ブラーフーイ人、マクラーニー(Makrani)人、シンド族、パサン族、ブルショー(Burusho)族、ハザラ人、ウィグル人、カラシュ(Kalash)族、ハン族、ダイ族、ダフール族、ホジェン(Hezhen)族、ラフ族、ミャオ族、オロチョン(Oroqen)族、シー(She)族、トゥチャ(Tujia)族、トゥ(Tu)族、シボ(Xibo)族、イ族、モンゴル(Mongolan)人、ナシ(Naxi)族、カンボジア人、日本人、ヤクート族、メラネシア人、パプア人、カーチアン(Karitianan)人、スルイ(Surui)人、コロンビア(Colmbian)人、マヤ人およびピマ族、を含む、特定のヒト集団において行われ得る。
ある実施態様では、本発明は、黒色アフリカ人の祖先(アフリカ人の家系または系統のヒトを含む集団など)を含む集団に関する。黒色アフリカ人の祖先は、アフリカ系アメリカ人(African−Americans)、アフリカ系アメリカ人(Afro−Americans)、黒色アメリカ人、黒色人種の一員である、または黒人(negro)人種の一員であるという自己申告によって判定されてもよい。例えば、アフリカ系アメリカ人または黒色アメリカ人は、北アメリカに住んでおり、かつアフリカの黒色人種の群のいずれかに起源を有するヒトである。別の例では、黒色アフリカ人祖先について自己申告したヒトは、少なくとも1人の黒色アフリカ人の祖先の親または少なくとも1人の黒色アフリカ人の祖先の祖父母を有していてもよい。1つの実施態様では、本発明は、コーカサス人の血統の個体に関する。
個々の被験者における人種の寄与はまた、遺伝的分析によって判定されてもよい。系統の遺伝的分析は、非連鎖のマイクロサテライトマーカー(Smithら、Am J Hum Genet 74、1001−13(2004)に提示されるものなど)を使用して行ってもよい。
ある実施態様では、本発明は、上述のように、特定の集団で同定されたマーカーおよび/またはハプロタイプに関する。当業者は、連鎖不平衡(LD)の判定基準は、異なる集団に適用した場合は異なる結果を与えてもよいことを理解するだろう。このことは、特定のゲノム領域におけるLDの相違を引き起こしたかもしれない、異なるヒト集団の異なる集団歴および異なる選択圧による。あるマーカー(例えば、SNPマーカー)は、異なる集団においては異なる頻度を有する、すなわち1つの集団では多型だが別の集団ではそうではないこともまた、当業者に周知である。しかし、当業者は、いずれかの所定のヒト集団で本発明を実行するために、利用可能であり、本願明細書で教示された方法を適用するだろう。このことは、特定の集団内で最も強い関連を与えるこれらのマーカーを同定するための、本発明のLD領域における多型マーカーの評価を含んでいてもよい。従って、本発明のリスクのある変異体は、異なるハプロタイプの背景に、および様々なヒト集団において異なる頻度で属していてもよい。しかし、当該技術分野で公知の方法および本発明のマーカーを利用し、本発明は、所定のヒト集団いずれにおいても実行され得る。
(甲状腺刺激ホルモン)
甲状腺刺激ホルモン(TSHまたはサイロトロピンとしても知られる)は、甲状腺の内分泌機能を制御する脳下垂体前葉の中の甲状腺刺激ホルモン産生細胞によって合成されて分泌されるペプチドホルモンである。TSHは甲状腺を刺激して、ホルモン、チロキシン(T4)およびトリヨードチロニン(T3)を分泌させる。TSH産生は、甲状腺刺激ホルモン放出ホルモン(TRH)によって制御され、この甲状腺刺激ホルモン放出ホルモンは、視床下部で作られて、上下垂体動脈を通って脳下垂体前葉へと運ばれ、そこでこの甲状腺刺激ホルモン放出ホルモンはTSHの産生および放出を増加させる。ソマトスタチンもまた視床下部によって産生され、TSHの下垂体産生に対して反対の効果を有し、その放出を減少させるかまたは阻害する。
血中の甲状腺ホルモン(T3およびT4)のレベルは、TSHの下垂体放出に対してある効果を有する;T3およびT4のレベルが低いとき、TSHの産生は高められ、逆に、T3およびT4のレベルが高いとき、TSHの産生は低められる。この効果は、制御上の負のフィードバックループを作り出す。
チロキシン、または3,5,3’,5’−テトラヨードチロニン(T4と略されることが多い)は、甲状腺の濾胞細胞によって分泌される主要ホルモンである。T4は血中を運ばれ、分泌されたT4のうちの99.95%は、タンパク質に結合しており、おもにチロキシン結合グロブリン(TBG)に結合しており、より少ない程度ではあるが、トランスサイレチンおよび血清アルブミンに結合している。T4は、体内での代謝過程の速度を制御すること、および身体の発育に影響を及ぼすことに関与する。チロキシンを投与すると、成体マウスの脳の中の神経増殖因子の濃度が著しく高まるということが示されている。
視床下部で、T4は、T3としても知られるトリヨードチロニンに転化される。TSHは主にT3によって阻害される。甲状腺は、T3よりもT4を多量に放出し、そのためT4の血漿中濃度はT3の血漿中濃度よりも40倍高い。循環しているT3のほとんどは、T4の脱ヨウ素化、すなわちT4の外側の環の上の炭素5からのヨウ素の除去を伴うプロセスによって末梢で形成される(85%)。従って、T4は、T3のプロホルモンとして作用する。
(遺伝子検査の有用性)
当業者は、本願明細書記載の変異は、一般的には、それらだけでは、甲状腺癌を生じるであろう個体の絶対的な同定を提供しないことを認め、理解するだろう。しかし、本願明細書記載の変異は、本発明のリスクのある変異または保護的変異を保有する個体が甲状腺癌を生じる増加したおよび/または減少した可能性を示す。本発明者らは、本願明細書中の実施例に提示される統計的に有意な結果に支持されるように、ある変異体が甲状腺癌の発生のリスクの増加をもたらすということを発見した。以下でより詳細に説明するように、この情報はそれ自体で極めて価値がある。なぜならこの情報は、例えば、初期段階で予防措置を開始するため、症候の進行および/もしくは出現をモニターするために定期的な理学的検査を実施するため、または初期段階で治療を施すことができるように初期の症候を同定するために定期的な間隔で検査を予定するために使用することができるからである。
甲状腺癌の発生のリスクを与える遺伝的変異についての知識は、甲状腺癌を生じる増加したリスクを有する個体(すなわち、リスクのある変異の保有者)と、甲状腺癌を生じる減少したリスクを有する個体(すなわち、保護的変異の保有者)とを区別するための遺伝的試験を適用する機会を提供する。遺伝子検査の基本的価値は、上述の群の両方に属する個体について、早期の段階で疾病もしくは疾病に対する素因を診断でき、最も適切な治療を施すことができるために臨床医に疾病の予後診断/病原力についての情報を与えられる可能性である。
甲状腺癌の家族歴を有する個体およびリスクのある変異体の保有者は遺伝子検査から利益を受け得る。なぜなら、遺伝的危険因子の存在、または1以上の危険因子の保有者であるという増加したリスクについてのエビデンスを知ることは、その疾病についての公知の環境的危険因子を回避または最小化することによってより健康的な生活習慣を実践するための誘因の高まりをもたらし得るからである。甲状腺癌と診断された患者の遺伝子検査はさらに、当該疾病の主要因についての価値ある情報を与え得、各個体についての最良の治療の選択肢および薬物療法を選択する上で臨床医を支援し得る。
上で論じたように、甲状腺癌についての主要な既知の危険因子は放射線被曝である。米国内の甲状腺癌発生率は数十年間上昇し続けており(Davies,L.およびWelch,H.G.、Jama、295、2164(2006))、これは、甲状腺癌の真の発生の増加ではなく、無症候性癌の検出の増加に起因する可能性がある(Davies,L.およびWelch,H.G.、Jama、295、2164(2006))。1980年代の超音波検査および穿刺吸引細胞診の導入により、小結節の検出が改善され、小結節の細胞学的評価がよりルーチン化された(Rojeski,M.T.およびGharib,H.、N Engl J Med、313、428(1985)、Ross,D.S.、J Clin Endocrinol Metab、91、4253(2006))。この高められた診断上の精査によって、潜在的には致死的な甲状腺癌の早期の検出が可能になる可能性がある。しかし、いくつかの研究は、甲状腺癌を、甲状腺癌と診断されていない人における一般的な剖検所見(最高35%)として報告する(Bondeson,L.およびLjungberg,O.、Cancer、47、319(1981)、Harach,H.R.ら、Cancer、56、531 (1985)、Solares,C.A.ら、Am J Otolaryngol、26、87(2005)ならびにSobrinho−Simoes,M.A.、Sambade,M.C.、およびGoncalves,V.、Cancer、43、1702(1979))。これは、多くの人は、その健康にとってほとんど脅威とならないかまたはまったく脅威とならない無症候性形態の甲状腺癌とともに生活しているということを示唆する。
医師は、甲状腺癌疑いを裏付けるため、塊(しこり)のサイズおよび位置を特定するため、ならびにその塊(しこり)が非癌性(良性)または癌性(悪性)であるかどうかを判定するためにいくつかの検査を使用する。甲状腺刺激ホルモン(TSH)検査などの血液検査は甲状腺機能をチェックする。
TSHレベルは、甲状腺ホルモンの過剰(甲状腺機能亢進症)、または欠乏(甲状腺機能低下症)を患っていると疑われる患者の血液で検査される。一般的に、成人についてのTSHの正常範囲は0.2〜10μIU/mL(mIU/Lと等価である)である。治療中の患者についての最適なTSHレベルは0.3〜3.0mIU/Lの範囲である。TSH測定値の解釈は、甲状腺ホルモン(T3およびT4)の血中レベルがどうであるかにも依存する。英国の国民保健サービスは、「正常」範囲は0.1〜5.0μIU/mLのようにもう少し高いと考えている。
小児についてのTSHレベルは、通常、はるかに高いところから始まる。2002年に、米国の臨床生化学アカデミー(the National Academy of Clinical Biochemistry、NACB)は、年齢に関連する参考限界値を推奨した。これは、出生時の満期分娩の乳児(normal term infant)についての約1.3〜19μIU/mLから始まり、10週齢で0.6〜10μIU/mLに、14ヶ月で0.4〜7.0μIU/mLに低下し、そして小児期および思春期に成人のレベル、0.4〜4.0μIU/mLに徐々に低下する。特に甲状腺抗体が高められている場合には、2.0μIU/mLを超える最初に測定されたTSHレベルをもつ成人は20年間にわたって(20年後に)甲状腺機能低下症を発症する増加したオッズ比を有するということが研究により示されたため、成人についての正常(95%)範囲は0.4〜2.5μIU/mLへと下げられると見込まれるともNACBは述べた。
一般に、特定の甲状腺機能障害が原発性の下垂体または原発性の甲状腺の疾病によってどこで引き起こされるかを解明するためには、TSHならびにT3およびT4の両方が測定されるべきである。両方が高い(または低い)場合は、問題はおそらくは下垂体でのものである。1つの成分(TSH)が高く、他の成分(T3およびT4)が低い場合は、疾病はおそらくは甲状腺自体でのものである。同じことは、低TSH、高T3およびT4の知見にも当てはまる。
甲状腺癌についての根底にある遺伝的危険因子についての知識は、甲状腺癌についてのスクリーニングプログラムの適用で利用され得る。従って、甲状腺癌についてのリスクのある変異体の保有者は、非保有者よりも頻繁なスクリーニングから利益を受け得る。リスクのある変異体のホモ接合保有者は、特に甲状腺癌を発症するリスクがある。
特定の遺伝子プロファイル、例えば本願明細書に記載された甲状腺癌についての特定のリスクのある対立遺伝子(例えばrs965513−A)の存在に関してTSH、T3およびT4のレベルを測定することは有益であり得る。TSH、T3およびT4は甲状腺機能の判断基準であるので、診断上および予防上のスクリーニングプログラムは、このような臨床的測定を含む分析から利益を受けることになる。例えば、rs965513−Aの少なくとも1つのコピーの存在の判定と合わせたTSHの異常な(増加したまたは減少した)レベルは、個体が甲状腺癌の発生のリスクにあるということを示す。1つの実施態様では、rs965513−Aの存在に関しての個体におけるTSHの減少したレベルの判定は、個体についての甲状腺癌の増加したリスクを示す。
また、保有者は、超音波検査および/または細針生検を含めたより広範なスクリーニングから利益を受け得る。スクリーニングプログラムの目的は、癌を初期段階で検出することである。公知のリスク変異体に関して個体の遺伝子状態を知ることは、適用できるスクリーニングプログラムの選択を支援し得る。ある実施態様では、放射性ヨウ素(RAI)スキャン、超音波検査、CTスキャン(CATスキャン)、磁気共鳴画像法(MRI)、ポジトロンエミッショントモグラフィ(PET)スキャン、穿刺吸引細胞診および外科生検から選択される1以上の診断ツールと一緒に、本願明細書に記載された甲状腺癌についてのリスクのある変異体を使用することは有用であり得る。
(方法)
疾病のリスクアセスメントおよびリスクマネジメントについての方法が本願明細書に記載され、本発明により包含される。本発明はまた、治療薬に対する反応の可能性について個体を評価する方法、治療薬、核酸、ポリペプチドおよび抗体およびコンピューターで実施される機能の有効性を予測する方法を包含する。本願明細書中に与えられる種々の方法で使用するためのキットも、本発明によって包含される。
(診断方法およびスクリーニング方法)
ある実施態様では、本発明は、甲状腺癌と診断された被験者もしくは甲状腺癌に感受性がある被験者においてより頻繁に表れる遺伝子マーカーの特定の対立遺伝子を検出することよる、甲状腺癌もしくは甲状腺癌に対する感受性の診断方法、または診断の補助方法に関する。特定の実施態様では、本発明は、少なくとも1つの多型マーカー(例えば、本願明細書記載のマーカー)の少なくとも1つの対立遺伝子を検出することによる、甲状腺癌に対する感受性の判定方法である。他の実施態様では、本発明は、少なくとも1つの多型マーカーの少なくとも1つの対立遺伝子を検出することによる、甲状腺癌に対する感受性の診断方法に関する。本発明は、特定のマーカーの特定の対立遺伝子またはハプロタイプの検出が甲状腺癌に対する感受性を示す方法について記載する。このような予後診断のアッセイまたは予測的なアッセイはまた、甲状腺癌の症状の発生前の被験者の予防的な治療の判定に使用され得る。
本発明は、いくつかの実施態様では、診断、例えば、医療専門家によって行われる診断の臨床的適用の方法に関する。他の実施態様では、本発明は、素人によって行われる感受性の診断方法または判定方法に関する。当該素人は、遺伝子型の同定サービスの顧客であり得る。当該素人はまた、個体(すなわち、当該顧客)の遺伝子型の状態に基づく、特定の形質または疾病についての遺伝的危険因子に関するサービスを提供するための、当該個体から得たDNA試料上で遺伝子型分析を行う遺伝子型サービスの提供者であってもよい。遺伝子型の同定技術についての近年の技術的進歩(SNPマーカーの高処理の遺伝子型の同定(分子反転プローブアレイ技術(例えば、Affymetrix遺伝子チップ)など)、およびビーズアレイ技術(例えば、イルミナ(イルミナ)GoldenGateアッセイおよびInfiniumアッセイ)を含む)は、個体が、彼ら自身のゲノムが最大100万のSNPについて同時に、相対的に低い費用で、評価されることを可能にする。得られた遺伝子型の情報は、当該個体に利用可能となり、様々なSNPに関連する疾病または形質リスクについての情報(公的な文献および科学出版物からの情報を含む)と比較され得る。従って、本願明細書記載の疾病に関連する対立遺伝子の診断の適用は、例えば、当該個体の遺伝子型のデータの分析を通じて当該個体によって、臨床試験の結果に基づいて医療従事者によって、または遺伝子型サービス提供者を含む第三者によって行われ得る。当該第三者は、特定の遺伝的危険因子(本願明細書に記載された遺伝子マーカーを含む)に関するサービスを提供するために当該顧客から得た遺伝子型情報を解釈するサービス提供者であってもよい。換言すれば、遺伝的危険率の感受性の診断もしくは判定は、個体の遺伝子型の状態についての情報および特定の遺伝的危険因子(例えば、特定のSNP)によって与えられ得るリスクについての知識に基づいて、医療従事者、遺伝的カウンセラー、遺伝子型の同定サービスを提供する第三者、リスクアセスメントサービスを提供する第三者、または素人(例えば、当該個体)によってされ得る。本願明細書の文脈では、用語「診断」、「感受性を診断する」および「感受性を判定する」とは、利用可能な診断方法(上記記載のものを含む)のいずれをも指すことを意味する。
ある実施態様では、個体から得たゲノムDNAを含む試料が集められる。このような試料は、例えば、さらに本願明細書に記載されるように、頬スワブ、唾液試料、血液試料、またはゲノムDNAを含む他の適した試料であり得る。次いで、当該ゲノムDNAは、当業者が利用できるいずれかの一般的な技術(高処理アレイ技術など)を使用して分析される。このような遺伝子型の同定から得た結果は、簡便なデータ保存ユニット(コンピューターデータベースを含むデータ保有物、データ保存ディスク、または他の簡便なデータ保存手段など)に保存される。ある実施態様では、当該コンピューターデータベースは、オブジェクトデータベース、リレーショナルデータベースまたはポストリレーショナルデータベースである。当該遺伝子型データは、引き続いて、特定のヒトの状態の感受性変異体であることが知られるある変異体(本願明細書で記載された遺伝的変異体など)の存在について分析される。遺伝子型データは、いずれの簡便なデータクエリ方法を使用して、データ保存ユニットから検索され得る。当該個体の特定の遺伝子型によって与えられるリスクの算出は、当該個体の遺伝子型を、例えば、特定の疾病または形質(甲状腺癌など)についてのリスクのある変異体のヘテロ接合性の保有者に対して、当該遺伝子型について、以前に判定されたリスク(例えば、相対リスク(RR)またはおよびオッズ比(OR)として表わされる)と比較することに基づくことができる。当該個体について算出されたリスクは、性別および民族性がマッチされた平均的な集団と比較した、ヒトについての相対リスクまたはヒトの特定の遺伝子型の相対リスクであってもよい。当該平均的な集団のリスクは、参照集団から得た結果を使用して、異なる遺伝子型のリスクの加重平均として表わしてもよく、次いで当該集団に対する遺伝子型群のリスクを算出するための適切な算出を行ってもよい。あるいは、個体のリスクは、特定の遺伝子型の比較、例えば、リスクのある対立遺伝子の非保有者と比較した、マーカーのリスクのある対立遺伝子のヘテロ接合性の保有者の比較に基づく。集団平均の使用は、ある実施態様では、それが当該使用者にとって解釈しやすい基準、すなわち、当該集団の平均と比較して、当該個体の遺伝子型に基づき、個体のリスクを与える基準を供給するため、より簡便であることがある。評価され、算出されたリスクは、ウェブサイト、好ましくは安全なウェブサイトを通じて顧客が利用できるようになり得る。
ある実施態様では、サービス提供者は、顧客によって提供された試料から得たゲノムDNAの単離工程、単離されたDNAの遺伝子型の同定の実行工程、遺伝子型データに基づく遺伝的危険率の算出工程、および当該顧客にリスクを報告すること、の全工程を、提供されたサービスに含めるだろう。いくつかの他の実施態様では、当該サービス提供者は、当該個体についての遺伝子型データの解釈、すなわち、当該個体の遺伝子型データに基づく特定の遺伝的変異のリスク評価を、サービスに含めるだろう。いくつかの他の実施態様では、当該サービス提供者は、個体(顧客)から単離されたDNAの試料から開始した、遺伝子型の同定サービスおよび遺伝子型データの解釈を含むサービスを含めてもよい。
複数のリスク変異体についての全体のリスクは、標準的な方法論を使用して行われ得る。例えば、複合モデルの仮定、すなわち、全体の効果を確立するために個々のリスク変異体のリスクが乗算として表されるという仮定は、複数のマーカーについての全体のリスクの単純な算出を可能にする。
さらに、ある他の実施態様では、本発明は、甲状腺癌と診断されていない個体もしくは一般的な集団よりも、甲状腺癌患者に頻繁に表れていない特定の遺伝子マーカー対立遺伝子またはハプロタイプを検出することによる、甲状腺癌に対する減少した感受性についての判定方法に関する。
本願明細書において記載され例証されるように、特定のマーカー対立遺伝子またはハプロタイプ(例えばrs965513、およびそれと連鎖不平衡のマーカー)は、甲状腺癌のリスクに関連する。1つの実施態様では、マーカー対立遺伝子またはハプロタイプは、甲状腺癌に対する有意なリスクまたは感受性を与えるものである。別の実施態様では、本発明はヒト個体の甲状腺癌に対する感受性の判定方法に関し、当該方法は、当該個体から入手した核酸試料の、少なくとも1つの多型マーカーの少なくとも1つの対立遺伝子の存在または不存在の判定を含み、当該少なくとも1つの多型マーカーは、表2に列挙される多型マーカーからなる群から選択される。別の実施態様では、本発明は、rs965513(配列番号:1)、rs907580(配列番号:81)およびrs7024345(配列番号:66)から選択される少なくとも1つのマーカーについてのスクリーニングによる、ヒト個体の甲状腺癌に対する感受性の診断方法に関する。別の実施態様では、マーカー対立遺伝子またはハプロタイプは、甲状腺癌を有する、または甲状腺癌に感受性がある(罹患している)被験者において、健康な被験者(集団対照などの対照)におけるその存在の頻度に比較して、より頻繁に存在する。ある実施態様では、少なくとも1つのマーカー対立遺伝子またはハプロタイプの関連の有意性は、p値<0.05によって特徴付けられる。他の実施態様では、関連の有意性は、より小さいp値(<0.01、<0.001、<0.0001、<0.00001、<0.000001、<0.0000001、<0.00000001つまたは<0.000000001など)によって特徴付けられる。
これらの実施態様では、少なくとも1つのマーカー対立遺伝子またはハプロタイプの存在は、甲状腺癌に対する感受性を示す。これらの診断方法には、甲状腺癌のリスクと関連する特定の対立遺伝子またはハプロタイプが特定の個体に存在するかどうかを判定することが伴う。本願明細書に記載されたハプロタイプは、種々の遺伝子マーカーの対立遺伝子の組み合わせ(例えば、SNP、マイクロサテライトまたは他の遺伝的変異)を含む。特定のハプロタイプを構成する特定の遺伝子マーカー対立遺伝子の検出は、本願明細書記載の様々な方法および/または当該技術分野で知られた方法によって行われ得る。例えば、遺伝子マーカーは、核酸レベル(例えば、直接のヌクレオチド配列決定、または当業者に知られた他の遺伝子型同定手段による)または、遺伝子マーカーがタンパク質のコード配列に影響する場合は、アミノ酸レベル(例えば、タンパク質配列決定またはこのようなタンパク質を認識する抗体を使用したイムノアッセイによる)で検出され得る。本発明のマーカー対立遺伝子またはハプロタイプは、甲状腺癌に関連するゲノム分節(例えば、遺伝子)の断片に対応する。このような断片は、問題となっている多型マーカーまたはハプロタイプのDNA配列を含むがまた、マーカーまたはハプロタイプと強いLD(連鎖不平衡)のDNA分節を含んでいてもよい。1つの実施態様では、このような分節は、(0.2超のr2値および/または|D’|>0.8によって判定されるような)当該マーカーまたはハプロタイプとLDにある分節を含む。
1つの実施態様では、甲状腺癌に対する感受性の判定は、ハイブリダイゼーション法を使用して達成され得る(Current Protocols in Molecular Biology、Ausubel,F.ら、編集、John Wiley & Sons参照、すべての補遣を含む)。特異的なマーカー対立遺伝子の存在は、特定の対立遺伝子に特異的な核酸プローブの配列特異的なハイブリダイゼーションによって示され得る。複数の特定のマーカー対立遺伝子または特定のハプロタイプの存在は、それぞれ特定の対立遺伝子に特異的ないくつかの配列特異的な核酸プローブを使用することによって示され得る。配列特異的なプローブは、ゲノムDNA、RNA、またはcDNAにハイブリダイズするように向けられ得る。「核酸プローブ」は、本願明細書で使用される場合、相補的配列にハイブリダイズするDNAプローブまたはRNAプローブであり得る。当業者であれば、配列特異的なハイブリダイゼーションが、試験試料に由来する特定の対立遺伝子が試験試料のゲノム配列に存在する場合のみに生じるように、このようなプローブを設計する方法を知っているだろう。本発明はまた、いずれの簡便な遺伝子型の同定方法(特定の多型マーカーの遺伝子型の同定のための市販の技術および方法を含む)を使用して、実行に移すことができる。
甲状腺癌に対する感受性を判定するため、ハイブリダイゼーション試料は、試験試料(ゲノムDNA試料など、甲状腺癌に関連する核酸を含む)を、少なくとも1つの核酸プローブに接触させることで形成され得る。mRNAまたはゲノムDNAを検出するプローブの非限定的な例は、本願明細書記載のmRNAまたはゲノムDNA配列にハイブリダイズできる標識された核酸プローブである。核酸プローブは、例えば、全長の核酸分子、またはその部分(長さが少なくとも15、30、50、100、250または500ヌクレオチドの、適切なmRNAまたはゲノムDNAにストリンジェントな条件下で特異的にハイブリダイズするのに十分なオリゴヌクレオチドなど)であり得る。例えば、当該核酸プローブは、任意に本願明細書に記載されたマーカーの少なくとも1つの対立遺伝子、または本願明細書に記載された少なくとも1つのハプロタイプを含んで、本願明細書に記載されたLDブロックC09のヌクレオチド配列のすべてもしくは一部分を含み得、または当該プローブは、このような配列の相補的配列であり得る。核酸プローブはまた、本願明細書に記載される配列番号:1〜229のいずれか1つのヌクレオチド配列のすべてまたは一部分を含み得る。特定の実施態様では、この核酸プローブは、任意に本願明細書中の表2に記載される多型マーカーのうちの少なくとも1つの少なくとも1つの対立遺伝子を含む、本願明細書に記載された配列番号:1〜229のいずれか1つのヌクレオチド配列の一部分であり、または当該プローブは、このような配列の相補的配列であり得る。本発明の診断のアッセイの使用のための他の適したプローブは、本願明細書に記載される。ハイブリダイゼーションは、当業者に周知の方法(例えば、Current Protocols in Molecular Biology、Ausubel,F.ら、編集、John Wiley & Sonsを参照、すべての補遣を含む)によって行われ得る。1つの実施態様では、ハイブリダイゼーションは、特異的なハイブリダイゼーション、すなわち、ミスマッチのないハイブリダイゼーション(正確なハイブリダイゼーション)を意味する。1つの実施態様では、特異的なハイブリダイゼーションのハイブリダイゼーション条件は、高度にストリンジェンシーである。
特異的なハイブリダイゼーションは、存在する場合は、標準的な方法を使用して検出される。特異的なハイブリダイゼーションが、試験試料中で核酸プローブと核酸との間で生じた場合は、当該試料は当該核酸プローブに存在する当該ヌクレオチドに相補的な対立遺伝子を含む。この工程は、いずれの本発明のマーカー、または本発明のハプロタイプを構成するマーカーについて繰り返すことができ、または複数のプローブは1より多くのマーカー対立遺伝子を同時に検出するために、同時に使用され得る。特定のハプロタイプの1より多くのマーカー対立遺伝子を含む単一のプローブ(例えば、特定のハプロタイプを構成する2、3、4、5またはすべてのマーカーに相補的な対立遺伝子を含むプローブ)を設計することもまた、可能である。試料中の当該ハプロタイプの特定のマーカーの検出は、当該試料の供給源が特定のハプロタイプ(例えば、ハプロタイプ)を有し、従って、甲状腺癌に感受性があることを示す。
1つの好ましい実施態様では、Kutyavinら(Nucleic Acid Res.34:e128(2006))によって記載されているように、3’末端に蛍光部分または基、および5’末端に消光剤を含む検出オリゴヌクレオチドプローブ、ならびにエンハンサーオリゴヌクレオチドを利用する方法が使用される。蛍光部分は、Gig Harbor GreenまたはYakima Yellow、または他の適した蛍光部分であり得る。検出プローブは、検出されるSNP多型を含む短いヌクレオチド配列にハブリダイズするように設計される。好ましくは、SNPは、末端残基から、当該検出プローブの3’末端から−6残基のどこでもよい。エンハンサーは、当該検出プローブに対して3’の鋳型DNAにハイブリダイズする短いオリゴヌクレオチドプローブである。当該検出プローブと当該エンハンサーヌクレオチドプローブとが当該鋳型に結合すると、両方の間に1つのヌクレオチドの間隙が存在するように、当該プローブが設計される。間隙は、エンドヌクレアーゼ(エンドヌクレアーゼIVなど)によって認識される合成の脱塩基の部位を作る。この酵素は、色素を完全に相補的な検出プローブから切断するが、ミスマッチを含む検出プローブを切断することはできない。従って、放出された蛍光部分の蛍光を測定することで、検出プローブのヌクレオチド配列によって定められる特定の対立遺伝子の存在の評価を行い得る。
検出プローブは、いずれの適したサイズでもあり得るが、好ましくは、当該プローブは相対的に短い。1つの実施態様では、当該プローブは長さが5〜100ヌクレオチドである。別の実施態様では、当該プローブは、長さが10〜50ヌクレオチドであり、別の実施態様では、当該プローブは、長さが12〜30ヌクレオチドである。プローブの他の長さも可能であり、当業者の技能の範囲内である。
好ましい実施態様では、SNP多型を含む鋳型DNAは、検出の前にポリメラーゼ連鎖反応(PCR)によって増幅される。このような実施態様では、増幅されたDNAは、当該検出プローブおよび当該エンハンサープローブの鋳型として役立つ。
検出プローブのある実施態様は、PCRによる鋳型の増幅に使用されるエンハンサープローブおよび/またはプライマーは、修飾塩基(修飾されたAおよび修飾されたGを含む)の使用を含む。修飾塩基の使用は、鋳型DNAへのヌクレオチド分子(プローブおよび/またはプライマー)の融解温度を調整することに対して有用であり得、例えば、低い割合のGもしくはC塩基を含む領域の融解温度を高めるため、その相補的Tに3つの水素結合を形成できる修飾されたAが使用され得、または、高い割合のGまたはC塩基を含む領域の融解温度を下げるため、例えば、二本鎖DNA分子中のその相補的C塩基に2つの水素結合のみを形成する修飾されたG塩基を使用することによって、有用であり得る。好ましい実施態様では、修飾塩基は、検出ヌクレオチドプローブの設計において使用される。当業者に知られたいずれの修飾塩基もこれらの方法において選択され得、適した塩基の選択は、本願明細書の教示および当業者に知られた市販の供給源から利用可能な公知の塩基に基づき、当業者の範囲内である。
あるいは、ペプチド核酸(PNA)プローブは、本願明細書記載のハイブリダイゼーション法の核酸プローブに加えて、またはそれの代わりに使用され得る。PNAは、ペプチド様の無機の主鎖(有機の塩基(A、G、C、TまたはU)が、メチレンカルボニルリンカーを介してグリシンの窒素に結合している、N−(2−アミノエチル)グリシンユニットなど)を有するDNA模倣体である(例えば、Nielsen,P.ら、Bioconjug.Chem.5:3−7(1994)参照)。PNAプローブは、甲状腺癌に関連する1つ以上のマーカー対立遺伝子またはハプロタイプを含む疑いのある試料中の分子に特異的にハイブリダイズするように設計され得る。従って、このPNAプローブのハイブリダイゼーションは、甲状腺癌または甲状腺癌に対する感受性について診断する。
本発明の1つの実施態様では、被験者から入手されたゲノムDNAを含む試験試料が収集され、ポリメラーゼ連鎖反応(PCR)が、本発明の1つ以上のマーカーまたはハプロタイプを含む断片を増幅するために使用される。本願明細書記載のように、特定のマーカー対立遺伝子またはハプロタイプの同定は、様々な方法(例えば、配列分析、制限消化による分析、特異的なハイブリダイゼーション、一本鎖高次構造多型分析(SSCP)、電気泳動分析など)を使用して達成され得る。別の実施態様では、診断は、例えば定量的PCR(動力学的熱サイクル)を使用した発現分析によって達成される。当該技術は、例えば、市販の技術(TaqMan(登録商標)(アプライドバイオシステムズ社(Applied Biosystems)、カリフォルニア州、フォスターシティーなど)を利用し得る。当該技術は、ポリペプチドもしくはスプライシング変異体(単数または複数)の発現もしくは構成における変化の存在を評価できる。さらに、変異体(単数または複数)の発現は、物理的にまたは機能的に異なるとして数量化され得る。
別の本発明の方法では、制限消化による分析は、対立遺伝子が参照配列に対して制限部位の創造または除去をもたらす場合、特定の対立遺伝子の検出に使用され得る。制限断片長多型(RFLP)分析は、例えば、Current Protocols in Molecular Biology(上記参照)に記載のように行うことができる。関連するDNA断片の消化様式は、試料中の特定の対立遺伝子の存在または不存在を示す。
配列分析はまた、特定の対立遺伝子またはハプロタイプの検出に使用され得る。従って、1つの実施態様では、特定のマーカー対立遺伝子またはハプロタイプの存在または不存在の判定は、被験者または個体から入手したDNAまたはRNAの試験試料の配列分析を含む。PCRまたは他の適切な方法は、多型マーカーまたはハプロタイプを含む核酸の一部の増幅に使用され得、次いで、特定の対立遺伝子の存在は、試料中のゲノムDNAの多形性部位(またはハプロタイプの複数の多形性部位)の配列決定によって直接的に検出され得る。
別の実施態様では、被験者から得た標的の核酸配列の分節に相補的なオリゴヌクレオチドプローブのアレイは、多形性部位での特定の対立遺伝子を同定するために使用され得る。例えば、オリゴヌクレオチドアレイが使用され得る。オリゴヌクレオチドアレイは、典型的には、異なる既知の部位の基質の表面に結合される複数の異なるオリゴヌクレオチドプローブを含む。これらのアレイは、一般的に、フォトリソグラフィー法および固相オリゴヌクレオチド合成法の組み合わせを取り込んだ機械的合成法もしくは光指向合成法、または当業者に知られた他の方法(例えば、Bier,F.F.ら Adv Biochem Eng Biotechnol 109:433−53(2008);Hoheisel,J.D.、Nat Rev Genet 7:200−10(2006);Fan,J.B.、ら Methods Enzymol 410:57−73(2006);Raqoussis,J.およびElvidge,G.、Expert Rev Mol Diagn 6:145−52(2006);Mockler,T.C.ら Genomics 85:1−15(2005)、およびそれらの中で引用される参考文献を参照(それぞれの全体の教示を参照によって本願明細書に援用する))を使用して作製され得る。多型性の検出のためのオリゴヌクレオチドアレイの調製および使用についての多くの付加的な記載は、例えば、米国特許第6,858,394号明細書、米国特許第6,429,027号明細書、米国特許第5,445,934号明細書、米国特許第5,700,637号明細書、米国特許第5,744,305号明細書、米国特許第5,945,334号明細書、米国特許第6,054,270号明細書、米国特許第6,300,063号明細書、米国特許第6,733,977号明細書、米国特許第7,364,858号明細書、欧州特許第619 321号明細書、および欧州特許第373 203号明細書に見出すことができ、これらの全体の教示は、参照によって本願明細書に組み込まれる。
当業者に利用可能な核酸分析の他の方法は、多形性部位の特定の対立遺伝子を検出するために使用され得る。代表的な方法は、例えば、直接のマニュアル配列決定(ChurchおよびGilbert、Proc.Natl.Acad.Sci.USA、81:1991−1995(1988);Sanger F.ら、Proc.Natl.Acad.Sci.USA、74:5463−5467(1977);Beavisら、米国特許第5,288,644号明細書);自動化した蛍光配列決定;一本鎖高次構造多型性アッセイ(SSCP);クランプ変性ゲル電気泳動(clamped denaturing gel electrophoresis)(CDGE);変性剤濃度勾配ゲル電気泳動(DGGE)(Sheffield V.ら、Proc.Natl.Acad.Sci.USA、86:232−236(1989))、移動度シフトアッセイ(Orita M.ら、Proc.Natl.Acad.Sci.USA、86:2766−2770(1989))、制限酵素解析(Flavell R.ら、Cell、15:25−41(1978);Geever R.ら、Proc.Natl.Acad.Sci.USA、78:5081−5085(1981));ヘテロ二本鎖分析;化学的ミスマッチ切断(chemical mismatch cleavage)(CMC)(Cotton R.ら、Proc.Natl.Acad.Sci.USA、85:4397−4401(1985));リボヌクレアーゼプロテクションアッセイ(Myers R.ら、Science、230:1242−1246(1985);ヌクレオチドのミスマッチを認識するポリペプチド(E.coli mutSタンパク質など)の使用;および対立遺伝子特異的なPCRを含む。
本発明の別の実施態様では、甲状腺癌の診断または甲状腺癌に対する感受性の判定は、本発明の遺伝子マーカー(単数または複数)もしくはハプロタイプ(単数または複数)がポリペプチドの構成もしくは発現の変化をもたらす例において、甲状腺癌に関連した核酸によってコードされたポリペプチドの発現および/または構成を試験することでなされ得る。従って、甲状腺癌に対する感受性の診断は、本発明の遺伝子マーカーもしくはハプロタイプが当該ポリペプチドの構成または発現の変化をもたらす例において、これらのポリペプチドの1つ、または甲状腺癌に関連した核酸にコードされた別のポリペプチドの発現および/または構成を試験することによってなされ得る。甲状腺癌への関連を示すマーカーは、これらの近くの遺伝子のうちの1以上に対するそれらの効果を通してある役割を果たしているのかもしれない。ある実施態様では、このマーカーはFoxE1遺伝子に対してある効果を示す。これらの遺伝子(例えばFoxE1遺伝子)に影響する可能性のある機構は、例えば、転写への効果、RNAスプライシングへの効果、mRNAの別のスプライシングの形態の相対的な量の変化、RNAの安定性への効果、核から細胞質への輸送への効果、ならびに翻訳の効率および正確性への効果を含む。
従って、別の実施態様では、本願明細書に提示された変異体(マーカーまたはハプロタイプ)はFoxE1遺伝子の発現に影響を及ぼす。遺伝子発現に影響する調節エレメントは、遺伝子のプロモーター領域から数十キロベースまたは数百キロベースでさえ離れて位置しているかもしれないことは周知である。本発明の少なくとも1つの多型マーカーの少なくとも1つの対立遺伝子の存在または不存在をアッセイすることによって、このような近くの遺伝子の発現レベルを評価できる。従って、本願明細書に記載されたマーカー、またはこのようなマーカーを含むハプロタイプの検出は、FoxE1遺伝子、もしくは甲状腺癌のリスクを与えると本願明細書に示されるマーカーのうちのいずれか1つと関連する別の近くの遺伝子の発現を評価するおよび/または予測するために使用され得るということが企図される。
酵素結合免疫吸着検定法(ELISA)、ウエスタンブロット、免疫沈降および免疫蛍光を含む、様々な方法がタンパク質発現レベルの検出に使用され得る。被験者から得た試験試料は、発現の変化および/または特定の核酸にコードされたポリペプチドの構成の変化の存在について評価される。当該核酸にコードされたポリペプチドの発現の変化は、例えば、定量的ポリペプチドの発現(すなわち、産生されたポリペプチドの量)の変化であり得る。当該核酸によってコードされたポリペプチドの構成の変化は、定性的なポリペプチドの発現(例えば、変異ポリペプチドの発現または異なるスプライシング変異体の発現)の変化である。1つの実施態様では、甲状腺癌に対する感受性の診断は、甲状腺癌に関連する核酸によってコードされた特定のスプライシング変異体、またはスプライシング変異体の特定の様式の検出によってなされる。
このような変化の両方(定量的および定性的)もまた、存在し得る。ポリペプチドの発現または構成の「変化」は、本願明細書で使用される場合、対照試料のポリペプチドの発現または構成と比較した、試験試料の発現または構成の変化を意味する。対照試料は、試験試料に対応する試料(例えば、同様のタイプの細胞からもの)であり、甲状腺癌に罹患していない被験者および/または甲状腺癌に対する感受性を有さない被験者から得たものである。1つの実施態様では、対照試料は、本願明細書記載のマーカー対立遺伝子またはハプロタイプを有さない被験者から得たものである。同様に、対照試料と比較した、試験試料における1つ以上の異なるスプライシング変異体の存在、または試験試料における著しく異なる量の異なるスプライシング変異体の存在は、甲状腺癌に対する感受性を示し得る。対照試料と比較した、試験試料におけるポリペプチドの発現または構成の変化は、対立遺伝子が対照試料における参照に関連するスプライシングの部位を変化させる例において、特定の対立遺伝子を示し得る。核酸によってコードされたポリペプチドの発現または構成を試験する様々な手段が当業者に知られ、かつ、使用され得、分光法、比色分析、電気泳動、等電点電気泳動、および、イムノブロッティング(例えば、Current Protocols in Molecular Biology、特に10章、上記参照)などの、イムノアッセイ(例えば、Davidら、米国特許第4,376,110号明細書)を含む。
例えば、1つの実施態様では、甲状腺癌に関連した核酸にコードされたポリペプチドに結合できる抗体(例えば、検出可能な標識を有する抗体)が使用され得る。抗体は、ポリクローナル抗体またはモノクローナル抗体であり得る。インタクトな抗体、またはその断片(例えば、Fv、Fab、Fab’、F(ab’)2)が使用され得る。用語「標識された」は、プローブまたは抗体に関し、検出可能な物質をプローブまたは抗体に結合することによって(すなわち、物理的に連結することによって)プローブまたは抗体を直接的に標識すること、および直接的に標識された別の試薬との反応性によってプローブまたは抗体を間接的に標識することを含むことが意図される。間接的な標識の例は、標識された2次抗体(例えば、蛍光標識された2次抗体)を使用した1次抗体の検出、および蛍光標識されたストレプトアビジンによって検出され得るようにビオチンによるDNAプローブの末端標識を含む。
当該方法の1つの実施態様では、試験試料中のポリペプチドのレベルまたは量は、対照試料中のポリペプチドのレベルまたは量と比較される。相違が統計的に有意なほどに対照試料中のポリペプチドのレベルまたは量よりもより高く、またはより低い試験試料中のポリペプチドのレベルまたは量は、核酸によってコードされたポリペプチドの発現の変化を示し、これは発現の相違を引き起こす原因となる特定の対立遺伝子またはハプロタイプであると診断される。あるいは、試験試料中のポリペプチドの構成は、対照試料中のポリペプチドの構成と比較される。別の実施態様では、ポリペプチドのレベルまたは量ならびに構成の両方は、試験試料および対照試料において評価され得る。
別の実施態様では、甲状腺癌に対する感受性の判定は、本発明の少なくとも1つのマーカーまたはハプロタイプを、さらにタンパク質に基づいたアッセイ、RNAに基づいたアッセイまたはDNAに基づいたアッセイと組み合わせて検出することによってなされる。
(キット)
本発明の方法において有用なキットは、本願明細書記載の方法のいずれかにおいて有用な要素を含み、例えば、核酸増幅のためのプライマー、ハイブリダイゼーションプローブ、制限酵素(例えば、RFLP分析のため)、対立遺伝子特異的なオリゴヌクレオチド、本願明細書記載の本発明の核酸(例えば、本発明の少なくとも1つの多型マーカーおよび/またはハプロタイプを含むゲノム分節)によってコードされた変化したポリペプチドに結合する抗体、または、本願明細書記載の本発明の核酸によってコードされた変化していない(ネイティブな)ポリペプチドに結合する抗体、甲状腺癌に関連する核酸を増幅する手段、甲状腺癌に関連する核酸の核酸配列を分析する手段、甲状腺癌に関連する核酸によってコードされたポリペプチドのアミノ酸配列を分析する手段などを含む。当該キットは、例えば、必要なバッファー、本発明の核酸(例えば、本願明細書記載の1つ以上の多型マーカーを含む核酸分節)を増幅する核酸プライマー、ならびにこのようなプライマーおよび必要な酵素(例えば、DNAポリメラーゼ)を使用して増幅した断片の対立遺伝子特異的な検出のための試薬を含み得る。さらに、キットは、本発明の方法と組み合わせて使用されるアッセイのための試薬、例えば、甲状腺癌の他の診断のアッセイと使用するための試薬を提供し得る。
1つの実施態様では、本発明は、被験者における甲状腺癌の感受性を検出するために、被験者由来の試料をアッセイするためのキットに関し、当該キットは、当該個体のゲノムにおける本発明の少なくとも1つの多型の少なくとも1つの対立遺伝子を選択的に検出するために必要な試薬を含む。特定の実施態様では、当該試薬は、本発明の少なくとも1つの多型を含む当該個体のゲノムの断片にハイブリダイズする少なくとも1つの近接するオリゴヌクレオチドを含む。別の実施態様では、当該試薬は、被験者から入手したゲノム分節の逆ストランドにハイブリダイズする少なくとも1対のオリゴヌクレオチドを含み、各オリゴヌクレオチドプライマー対は、甲状腺癌に関する少なくとも1つの多型を含む当該個体のゲノムの断片を選択的に増幅するように設計される。1つのそのような実施態様では、当該多型は、本願明細書中の表2に記載された多型からなる群から選択される。別の実施態様では、当該多型は、rs965513(配列番号:1)、rs907580(配列番号:81)およびrs7024345(配列番号:66)から選択される。さらに別の実施態様では、当該断片は、サイズが少なくとも20塩基対である。このようなオリゴヌクレオチドまたは核酸(例えば、オリゴヌクレオチドプライマー)は、甲状腺癌のリスクと関連する多型(例えば、SNPまたはマイクロサテライト)に隣接する核酸配列の部分を使用して設計され得る。別の実施態様では、当該キットは、1つ以上の特定の多型マーカーまたはハプロタイプを対立遺伝子特異的に検出できる1つ以上の標識された核酸、および当該標識の検出のための試薬を含む。適した標識は、例えば、放射性同位元素、蛍光標識、酵素標識、酵素共因子標識、磁性標識、スピン標識、エピトープ標識を含む。
特定の実施態様では、当該キットの試薬によって検出される当該多型マーカーまたはハプロタイプは、表2に記載されたマーカーからなる群から選択される1つ以上のマーカー、2つ以上のマーカー、3つ以上のマーカー、4つ以上のマーカーまたは5つ以上のマーカーを含む。別の実施態様では、検出されるマーカーまたはハプロタイプは、マーカーrs965513(配列番号:1)、rs907580(配列番号:81)およびrs7024345(配列番号:66)からなる群から選択される1以上のマーカー、2以上のマーカー、3以上のマーカー、4以上のマーカーまたは5以上のマーカーを含む。別の実施態様では、検出されるマーカーは、マーカーrs965513(配列番号:1)、またはそれと連鎖不平衡のマーカーから選択される。
1つの好ましい実施態様では、本発明のマーカーを検出するためのキットは、検出されるべきSNP多型を含む鋳型DNAの分節にハイブリダイズする検出オリゴヌクレオチドプローブ、エンハンサーオリゴヌクレオチドプローブおよびエンドヌクレアーゼを含む。上で説明されたように、Kutyavinら(Nucleic Acid Res.34:e128(2006))によって記載されているように、検出オリゴヌクレオチドプローブは3’末端に蛍光部分または基、および5’末端に消光剤を含み、エンハンサーオリゴヌクレオチドが使用される。蛍光部分は、Gig Harbor GreenまたはYakima Yellow、または他の適した蛍光部分であり得る。検出プローブは、検出されるSNP多型を含む短いヌクレオチド配列にハブリダイズするように設計される。好ましくは、SNPは、末端残基から、当該検出プローブの3’末端から−6残基のどこでもよい。エンハンサーは、当該検出プローブに対して3’の鋳型DNAにハイブリダイズする短いオリゴヌクレオチドプローブである。当該検出プローブと当該エンハンサーヌクレオチドプローブとが当該鋳型に結合すると、両方の間に1つのヌクレオチドの間隙が存在するように、当該プローブが設計される。間隙は、エンドヌクレアーゼ(エンドヌクレアーゼIVなど)によって認識される合成の脱塩基の部位を作る。酵素は、色素を完全に相補的な検出プローブから切断するが、ミスマッチを含む検出プローブを切断することはできない。従って、放出された蛍光部分の蛍光を測定することで、検出プローブのヌクレオチド配列によって定められる特定の対立遺伝子の存在の評価を行い得る。
検出プローブは、いずれの適したサイズでもあり得るが、好ましくは、当該プローブは相対的に短い。1つの実施態様では、当該プローブは長さが5〜100ヌクレオチドである。別の実施態様では、当該プローブは、長さが10〜50ヌクレオチドであり、別の実施態様では、当該プローブは、長さが12〜30ヌクレオチドである。プローブの他の長さも可能であり、当業者の技能の範囲内である。
好ましい実施態様では、SNP多型を含む鋳型DNAは、検出の前にポリメラーゼ連鎖反応(PCR)によって増幅され、そしてこのような増幅のためのプライマーは当該キットの中に含められる。このような実施態様では、増幅されたDNAは、当該検出プローブおよび当該エンハンサープローブの鋳型として役立つ。
1つの実施態様では、当該DNA鋳型は、本願明細書に記載される特定の多型マーカーの存在についての評価に先立って、全ゲノム増幅(WGA)法によって増幅される。WGAを実施するための当業者に周知の標準的な方法が利用され得、それらは本発明の範囲内にある。1つのこのような実施態様では、WGAを実施するための試薬は試薬キットの中に含められる。
検出プローブのある実施態様は、PCRによる鋳型の増幅に使用されるエンハンサープローブおよび/または当該プライマーは、修飾塩基(修飾されたAおよび修飾されたGを含む)の使用を含む。修飾塩基の使用は、鋳型DNAへのヌクレオチド分子(プローブおよび/またはプライマー)の融解温度を調整することに対して有用であり得、例えば、低い割合のGもしくはC塩基を含む領域の融解温度を高めるため、その相補的Tに3つの水素結合を形成できる修飾されたAが使用され得、または、高い割合のGまたはC塩基を含む領域の融解温度を下げるため、例えば、二本鎖DNA分子中のその相補的C塩基に2つの水素結合のみを形成する修飾されたG塩基を使用することによって、有用であり得る。好ましい実施態様では、修飾塩基は、検出ヌクレオチドプローブの設計において使用される。当業者に知られたいずれの修飾塩基もこれらの方法において選択され得、適した塩基の選択は、本願明細書の教示および当業者に知られた市販の供給源から利用可能な公知の塩基に基づき、当業者の範囲内である。
1つのそのような実施態様では、マーカーまたはハプロタイプの存在の判定は、甲状腺癌に対する感受性(増加した感受性または減少した感受性)を示す。別の実施態様では、当該マーカーまたはハプロタイプの存在の判定は、甲状腺癌治療薬に対する反応を示す。別の実施態様では、マーカーまたはハプロタイプの存在は、甲状腺癌の予後診断を示す。さらに別の実施態様では、マーカーまたはハプロタイプの存在は、甲状腺癌治療の進行を示す。このような治療は、手術、薬物療法、または他の手段(例えば、生活スタイルの変化)による介入を含んでいてもよい。
本発明のさらなる態様では、医薬品パック(キット)が提供され、当該パックは、本願明細書に開示される、治療薬および本発明の1以上の変異について診断上試験された当該治療薬のヒトへの投与のための一連の指示を含む。当該治療薬は、小分子薬物、抗体、ペプチド、アンチセンスもしくはRNAi分子、または他の治療用分子であり得る。1つの実施態様では、本発明の少なくとも1つの変異体の保有者として同定された個体は、当該治療薬の処方される用量を摂取するように指示される。1つのこのような実施態様では、本発明の少なくとも1つの変異体のホモ接合保有者として同定された個体は、当該治療薬の処方される用量を摂取するように指示される。別の実施態様では、本発明の少なくとも1つの変異体の非保有者として同定された個体は、当該治療薬の処方される用量を摂取するように指示される。
ある実施態様では、当該キットはさらに、当該キットを含む試薬を使用するための一連の指示を含む。
(治療薬)
甲状腺癌についての治療の選択肢としては、現在の標準的な治療方法および臨床治験にある治療方法が挙げられる。
甲状腺癌についての現在の治療の選択肢としては、以下のものが挙げられる:
手術 − 甲状腺癌が見出される葉が取り除かれる肺葉切除、甲状腺の非常に小さい部分を除いてすべてが取り除かれる甲状腺摘除術、甲状腺全体が取り除かれる甲状腺全摘出術、および癌の増殖を含む頚部のリンパ節が取り除かれるリンパ節郭清術を含む;
放射線治療 −放射性化合物を使用する外部放射線治療および放射線治療を含む。放射線治療は、いずれかの生存している癌細胞を取り除くために、手術後に与えられてもよい。また、甲状腺濾胞癌および甲状腺乳頭癌は、放射性ヨウ素(RAI)治療で処置されることがある;
化学療法 − 化学療法化合物の経口投与または静脈内投与を使用することを含む;
甲状腺ホルモン治療 − この治療は、体内での甲状腺刺激ホルモン(TSH)の生成を予防する薬物の投与を含む。
甲状腺癌の治療および処置のためのいくつかの臨床治験が現在進行中であり、その例としては、18F−フルオロデオキシグルコース(FluGlucoScan);111In−ペンテトレオチド(Pentetreotide)(NeuroendoMedix);甲状腺未分化癌の治療におけるコンブレタスタチンおよびパクリタキセル/カルボプラチン、外科的治療後のための甲状腺刺激ホルモンを伴うまたは伴わない131I、XL184−301(Exelixis)、バンデタニブ(Vandetanib)(ザクティマ(Zactima);Astra Zeneca)、CS−7017(Sankyo)、デシタビン(Decitabine)(ダコゲン(Dacogen);5−アザ−2’−デオキシシチジン)、イリノテカン(Pfizer、Yakult Honsha)、ボルテゾミブ(ベルケード(Velcade);Millenium Pharmaceuticals);17−AAG(17−N−アリルアミノ−17−デメトキシゲルダナマイシン)、ソラフェニブ(ネクサバール(Nexavar)、Bayer)、組み換えサイロトロピン、レナリドミド(レブリミド(Revlimid)、Celgene)、スニチニブ(スーテント(Sutent))、ソラフェニブ(ネクサバール、Bayer)、アキシチニブ(AG−013736、Pfizer)、バルプロ酸(2−プロピルペンタン酸)、バンデタニブ(ザクティマ、Astra Zeneca)、AZD6244(Astra Zeneca)、ベバシズマブ(アバスチン、Genetech/Roche)、MK−0646(Merck)、パゾパニブ(GlaxoSmithKline)、アフリベルセプト(Sanofi−Aventis & Regeneron Pharmaceuticals)、およびFR901228(ロミデプシン(Romedepsin))についての試験が挙げられるが、これらに限定されない。
甲状腺癌の増加したリスクを与えると本願明細書に開示される変異体(マーカーおよび/またはハプロタイプ)は、甲状腺癌についての新規な治療標的を同定するためにも使用され得る。例えば、これらの変異体のうちの1以上を含むもしくはそれらと連鎖不平衡の遺伝子、またはそれらの産物(例えば、FoxE1遺伝子およびその遺伝子産物)、ならびにこれらの変異体遺伝子もしくはそれらの産物によって直接もしくは間接的に制御されるかまたはこれらの変異体遺伝子もしくはそれらの産物と相互作用する遺伝子もしくはその産物は、甲状腺癌を治療するため、または甲状腺癌と関連する症候の発生を予防するもしくは遅延させるための治療薬の開発のための標的とされ得る。治療薬は、例えば、標的遺伝子もしくはそれらの遺伝子産物の機能および/またはレベルを調節することができる小さい非タンパク質および非核酸分子、タンパク質、ペプチド、タンパク質断片、核酸(DNA、RNA)、PNA(ペプチド核酸)、またはそれらの誘導体もしくは模倣体のうちの1以上を含み得る。
本発明の核酸および/もしくは変異体、またはこれらの相補的な配列を含む核酸は、細胞、組織もしくは器官における遺伝子発現を制御するためのアンチセンス構築物として使用されてもよい。アンチセンス技術に関連する方法論は当業者に周知であり、AntisenseDrug Technology:Principles、Strategies,and Applications、Crooke、編集、Marcel Dekker Inc.、New York(2001)において記載され、概説されている。一般に、アンチセンス核酸分子は、遺伝子によって発現されるmRNAの領域に相補的であるように設計され、そのためアンチセンス分子はmRNAにハイブリダイズし、従ってタンパク質へのmRNAの翻訳をブロックする。アンチセンスオリゴヌクレオチドのいくつかのクラスは当業者に公知であり、切断剤(cleaver)および遮断剤(blocker)を含む。前者は標的RNA部位に結合し、当該標的RNAを切断する細胞内ヌクレアーゼ(例えば、リボヌクレアーゼHまたはリボヌクレアーゼL)を活性化する。遮断剤は、標的RNAに結合し、リボソームの立体的な障害によってタンパク質の翻訳を阻害する。遮断剤の例は、核酸、モルホリノ化合物、ロックド核酸およびメチルホスホン酸を含む(Thompson、Drug Discovery Today、7:912−917(2002))。アンチセンスオリゴヌクレオチドは、治療薬として直接的に有用であり、また、例えば、遺伝子ノックアウトまたは遺伝子ノックダウン実験によって、遺伝子機能を判定し、検証するのにも有用である。アンチセンス技術は、さらに、Laveryら、Curr.Opin.Drug Discov.Devel.6:561−569(2003)、Stephensら、Curr.Opin.Mol.Ther.5:118−122(2003)、Kurreck、Eur.J.Biochem.270:1628−44(2003)、Diasら、Mol.Cancer Ter.1:347−55(2002)、Chen、Methods Mol.Med.75:621−636(2003)、Wangら、Curr.Cancer Drug Targets 1:177−96(2001)、およびBennett、Antisense Nucleic Acid Drug.Dev.12:215−24(2002)に記載される。
本願明細書に記載された変異は、特定の変異に特異的なアンチセンス試薬の選択および設計のために使用され得る。本願明細書に記載された変異についての情報を使用して、本発明の1以上の変異を含むmRNA分子を特異的に標的とするアンチセンスオリゴヌクレオチドまたは他のアンチセンス分子が設計され得る。このようにして、本発明の1以上の変異体(すなわちマーカーおよび/またはハプロタイプ)を含むmRNA分子の発現は、阻害され得またはブロックされ得る。1つの実施態様では、当該アンチセンス分子は、標的核酸の特定の対立遺伝子の形態(すなわち、1つまたはいくつかの変異(対立遺伝子および/またはハプロタイプ))に特異的に結合して、これによりこの特定の対立遺伝子またはハプロタイプに由来する産物の翻訳を阻害するが、当該標的核酸分子の特定の多形性部位での他のまたは別の変異には結合しないように設計される。
アンチセンス分子は、遺伝子発現、従ってタンパク質発現を阻害するようにmRNAを不活化するために使用され得るので、当該分子は疾病治療のために使用され得る。この方法論は、mRNAが翻訳される能力を減弱させるmRNAの中の1以上の領域に相補的なヌクレオチド配列を含むリボザイムによる切断を含み得る。このようなmRNA領域としては、例えば、タンパク質コード領域、特にタンパク質の触媒活性、基質および/もしくはリガンド結合部位、または他の機能ドメインに対応するタンパク質コード領域が挙げられる。
RNA干渉(RNAi)の現象は、C.elegans(Fireら、Nature 391:806−11(1998))でのその最初の発見から、過去10年間で活発に研究されており、近年、ヒト疾病の治療におけるその有望な使用が、活発に探究されている(KimおよびRossi、Nature Rev.Genet.8:173−204(2007)における概説)。RNA干渉(RNAi)はまた、遺伝子サイレンシングとも呼ばれ、特定の遺伝子を遮断するための二本鎖RNA分子(dsRNA)の使用に基づく。細胞では、細胞質二本鎖RNA分子(dsRNA)は、細胞の複合体によって、低分子干渉RNA(siRNA)に処理される。siRNAは、標的mRNA上の特定の部位へとタンパク質とRNAの複合体のターゲティングを導き、mRNAの切断を引き起こす(Thompson、Drug Discovery Today、7:912−917(2002))。siRNA分子は、典型的には、長さが約20、21、22または23ヌクレオチドである。従って、本発明の1つの態様は、単離した核酸分子、およびRNA干渉のためのこれらの分子の使用、すなわち低分子干渉RNA分子(siRNA)としての使用に関する。1つの実施態様では、単離された核酸分子は長さが18〜26ヌクレオチド、好ましくは長さが19〜25ヌクレオチド、より好ましくは長さが20〜24ヌクレオチド、より好ましくは長さが21、22または23ヌクレオチドである。
RNAiを介した遺伝子サイレンシングの別の経路は、miRNA前駆体(pre−miRNA)を生じるために細胞内で処理される、内因的にコードされたプライマリーマイクロRNA(pri−miRNA)転写物に始まる。これらのmiRNA分子は、核から細胞質に輸送され、そこでこれらは成熟したmiRNA分子(miRNA)を生じるための処理を経て、mRNAの3’の非翻訳領域の標的部位を認識することによって翻訳の阻害に方向付けられ、引き続いて、P体(P−bodies)の処理によってmRNAが分解する(KimおよびRossi、Nature Rev.Genet.8:173−204(2007)における概説)。
RNAiの臨床的適用は、好ましくはサイズが約20〜23ヌクレオチド、および好ましくは2ヌクレオチドの3’重複を有する合成二本鎖siRNAを組み入れることを含む。遺伝子発現のノックダウンは、標的mRNAの配列特異的な設計によって確立される。このような分子の至適な設計および合成のためのいくつかの市販の部位は、当業者に知られている。
他の適用は、より長いsiRNA分子(典型的には長さが25〜30ヌクレオチド、好ましくは約27ヌクレオチド)、および低分子ヘアピン型RNA(shRNA;典型的には長さが約29ヌクレオチド)を提供する。後者は、Amarzguiouiら(FEBS Lett.579:5974−81(2005))が記載しているように、自然に発現される。化学的に合成したsiRNAおよびshRNAは、in vivoでの処理のための基質であり、いくつかの場合では、より短い設計よりも、より強力な遺伝子サイレンシングを提供する(Kimら、Nature Biotechnol.23:222−226(2005);Siolasら、Nature Biotechnol.23:227−231(2005))。一般的に、siRNAは、その細胞内濃度が、引き続く細胞分裂によって希釈されるため、遺伝子発現の一過性のサイレンシングを提供する。対照的に、発現されたshRNAは、shRNAの転写が起こっている限り、標的転写物の、長期間の安定したノックダウンを媒介する(Marquesら、Nature Biotechnol.23:559−565(2006);Brummelkampら、Science 296:550−553(2002))。
siRNA、miRNAおよびshRNAを含めたRNAi分子は、配列依存性様式で作用するため、本願明細書で提示された変異体(例えば、表2に記載されたマーカーおよびハプロタイプ)は、特定の対立遺伝子および/またはハプロタイプ(例えば、本発明の対立遺伝子および/またはハプロタイプ)を含む特定の核酸分子を認識する一方、他の対立遺伝子またはハプロタイプを含む核酸分子を認識しないRNAi試薬を設計するために使用され得る。従って、これらのRNAi試薬は、標的核酸分子を認識し、破壊できる。アンチセンス試薬と同様に、RNAi試薬は治療薬として(すなわち、疾病に関連する遺伝子または疾病に関連する遺伝子変異を遮断するために)有用であり得るが、遺伝子機能を特徴付け、検証すること(例えば、遺伝子ノックアウト実験または遺伝子ノックダウン実験による)にもまた、有用であるかもしれない。
RNAiの送達は、当業者に知られた方法論の範囲によって行ってもよい。非ウイルスデリバリーを利用する方法は、コレステロール、安定した核酸脂質粒子(SNALP)、重鎖抗体の断片(Fab)、アプタマーおよびナノ粒子を含む。ウイルスデリバリー方法は、レンチウイルス、アデノウイルスおよびアデノ随伴ウイルスの使用を含む。siRNA分子は、いくつかの実施態様では、その安定性を増加するために化学的に修飾される。これは、2’−O−メチルプリンおよび2’−フルオロピリミジンを含む、リボースの2’位での修飾を含むことができ、リボヌクレアーゼ活性に対する抵抗性を提供する。他の化学的修飾も可能であり、当業者に知られている。
下記の参考文献は、RNAiのさらなる概略、およびRNAiを用いた特定の遺伝子のターゲティングの可能性を提供する:KimおよびRossi、Nat.Rev.Genet.8:173−184(2007)、ChenおよびRajewsky、Nat.Rev.Genet.8:93−103(2007)、Reynoldsら、Nat.Biotechnol.22:326−330(2004)、Chiら、Proc.Natl.Acad.Sci.USA 100:6343−6346(2003)、Vickersら、J.Biol.Chem.278:7108−7118(2003)、Agami、Curr.Opin.Chem.Biol.6:829−834(2002)、Laveryら、Curr.Opin.Drug Discov.Devel.6:561−569(2003)、Shi、Trends Genet.19:9−12(2003)、Shueyら、Drug Discov.Today 7:1040−46(2002)、McManusら、Nat.Rev.Genet.3:737−747(2002)、Xiaら、Nat.Biotechnol.20:1006−10(2002)、Plasterkら、curr.Opin.Genet.Dev.10:562−7(2000)、Bosherら、Nat.Cell Biol.2:E31−6(2000)、およびHunter、Curr.Biol.9:R440−442(1999)。
疾病(甲状腺癌など)の発生について増加した素因またはリスクを引き起こす遺伝的欠陥、または当該疾病の原因となる欠陥は、欠陥を有する被験者に、通常の/野生型のヌクレオチド(単数または複数)を遺伝的欠陥部位で提供する修復配列を取り込む核酸断片を投与することによって、持続的に矯正されるかもしれない。このような部位特異的な修復配列は、被験者のゲノムDNAの内因性修復を促進するように機能するRNA/DNAオリゴヌクレオチドを含んで(concompass)もよい。修復配列の投与は、アニオン性リポソームに被包されたポリエチレンイミンとの複合体、ウイルスベクター(アデノウイルスベクターなど)、または投与した核酸の細胞内吸収を促進するのに適した他の医薬組成物などの、適切な媒体によって行われてもよい。次いで、遺伝的欠陥は、キメラのオリゴヌクレオチドが被験者のゲノムへの、通常の配列の組み込みを引き起こし、通常の/野生型の遺伝子産物の発現を導くため、克服されるかもしれない。置換が増加し、従って、持続性の修復および疾病もしくは疾患に関連する症候の軽減を与える。
本発明は、甲状腺癌の治療に使用され得る化合物または薬剤を同定するための方法を提供する。従って、本発明の変異体は、治療薬の同定および/または開発の標的として有用である。ある実施態様では、このような方法は、本発明の少なくとも1つの変異体(マーカーおよび/もしくはハプロタイプ)、または核酸のコードされた生成物を含む核酸の活性および/もしくは発現を調節するための薬剤または化合物の能力のアッセイを含む。ある実施態様では、当該薬剤または化合物はFoxE1遺伝子の活性または発現を調節する。この薬剤または化合物は、コードされた核酸産物、すなわちFoxE1タンパク質産物の所望でない活性もしくは発現を、阻害もしくは変化させ得る。このような実験を行うためのアッセイは、当業者に知られているように、細胞系または無細胞系で行われ得る。細胞系は、興味ある核酸分子を自然に発現している細胞、または、ある所望の核酸分子を発現するために、遺伝的に修飾された組み換え細胞を含む。
患者における変異遺伝子の発現は、変異を含む核酸配列(例えば、少なくとも1つの変異を含むRNAに転写されることができ、次にタンパク質に翻訳されることができる、少なくとも1つの本発明の変異を含む遺伝子)の発現、または通常の転写物の発現のレベルもしくは様式に影響する変異(例えば、遺伝子の制御領域または調節領域における変異)に起因して、通常の/野生型の核酸配列が変化した発現によって評価され得る。遺伝子発現のアッセイは、直接の核酸アッセイ(mRNA)、発現したタンパク質レベルのアッセイ、または経路(例えば、シグナル経路)に関連する付随化合物のアッセイを含む。さらに、シグナル経路に反応して上方制御または下方制御される遺伝子の発現もまた、アッセイされ得る。1つの実施態様は、興味ある遺伝子(単数または複数)の制御領域に、レポーター遺伝子(ルシフェラーゼなど)を操作可能に結合すること含む。
遺伝子発現の調節因子は、1つの実施態様では、細胞が候補化合物または候補薬と接触された場合に同定されることができ、mRNAの発現が判定される。候補化合物または候補薬の存在下でのmRNAの発現レベルは、当該化合物または薬剤の不存在下での発現レベルと比較される。当該比較に基づき、甲状腺癌の治療のための候補化合物または候補薬は、変異遺伝子の遺伝子発現を調節するものとして同定され得る。候補化合物または候補薬の存在下で、その不存在下よりも、mRNAまたはコード化タンパク質の発現が統計的に有意に大きい場合、当該候補化合物または候補薬は、核酸の発現の刺激剤または上方制御因子として同定される。候補化合物または候補薬の存在下で、その不存在下よりも、核酸の発現またはタンパク質レベルが統計的に有意に低い場合、その候補化合物は、核酸の発現の阻害剤または下方制御因子として同定される。
本発明は、さらに、遺伝子の修飾因子(すなわち、遺伝子発現の刺激剤および/または阻害剤)としての薬剤(drug)(化合物および/または薬剤(agent))スクリーニングを通じて同定される化合物を使用した治療方法を提供する。
(治療薬に対する反応の可能性の評価方法、治療の進展をモニターする方法および治療方法)
当該技術分野で公知のように、個体は、特定の治療(例えば、治療薬または治療方法)に対する反応差を有し得る。薬理ゲノミクスは、変化した薬剤処分および/または薬剤の異常な作用もしくは変化した作用によって、遺伝的変異(例えば、本発明の変異体(マーカーおよび/またはハプロタイプ))がどのように薬剤反応に影響するか、という問題点について取り組んでいる。従って、反応差の基盤は部分的に遺伝的に判定されてもよい。薬剤反応に影響する遺伝的変異に起因する臨床的成果は、ある個体(例えば、本発明の遺伝的変異の保有者または非保有者)における薬剤毒性、または当該薬剤の治療不全をもたらすかもしれない。従って、本発明の変異は、治療薬および/または方法が、身体に作用する様式、または身体が治療薬を代謝する方法を判定してもよい。
従って、1つの実施態様では、多形性部位の特定の対立遺伝子またはハプロタイプ(例えば、rs965513多型マーカー、またはそれと連鎖不平衡のマーカー)の存在は、特定の治療様式に対する異なる反応、例えば異なる反応の速度を示す。これは、甲状腺癌と診断され、本発明の、多型における特定の対立遺伝子またはハプロタイプ(例えば、本発明の、リスクがありかつ保護的な対立遺伝子および/またはハプロタイプ)を有する患者は、疾病の治療に使用される、特定の治療上の薬剤および/または他の治療に対して、より良好に、または悪化して反応することを意味する。従って、マーカー対立遺伝子またはハプロタイプの存在または不存在は、患者に対して使用されるべき治療の決定の助けとなり得る。例えば、新規に診断された患者について、本発明のマーカーまたはハプロタイプの存在が(例えば、本願明細書記載のように、血液試料由来のDNAの試験を通じて)評価されてもよい。患者が、マーカー対立遺伝子またはハプロタイプに対して陽性である場合(つまり、マーカーの少なくとも1つの特定の対立遺伝子、またはハプロタイプが存在している)、医師は、1つの特定の治療方法を推奨し、一方、患者がマーカーの少なくとも1つの対立遺伝子、またはハプロタイプに陰性である場合、異なるコースの治療方法が推奨されてもよい(疾病の進行の連続的なモニター以外は、緊急な治療方法は行われないことを推奨することを含んでいてもよい)。従って、患者の保有者状態は、特定の治療様式が施されるべきかどうかを判定するのを補助するために使用され得る。その価値は、最も適切な治療を適用できるようにするため、早期の段階で疾病を診断でき、最も適切な治療を選択でき、疾病の予後診断/悪性度について臨床医に情報を提供できる可能性の中にある。
治療薬の節で上に記載された治療方法および化合物のずれも、このような方法で使用することができる。すなわち、上で記載されたかまたは企図された化合物または方法のいずれかを使用する甲状腺癌に対する治療は、ある実施態様では、本願明細書に記載された多型マーカーのうちの少なくとも1つについての特定の対立遺伝子の存在についてのスクリーニングから利益が得られ得、このときその特定の対立遺伝子の存在は、その特定の化合物または方法についての治療成績を予測する。
ある実施態様では、甲状腺癌を治療するための治療薬(薬物)は、本願明細書に記載された多型マーカー(例えば、rs965513、またはそれと連鎖不平衡のマーカー)における対立遺伝子の状態を判定するためのキットと一緒に提供される。ある個体が、試験されている特定の対立遺伝子または複数の対立遺伝子に対して陽性である場合、その個体は、その対立遺伝子の非保有者よりも、その特定の化合物から利益を受ける可能性が高い。ある他の実施態様では、当該特定の化合物の治療成績を予測する当該少なくとも1つの多型マーカーについての遺伝子型情報は、予め定められて、データベースの中に、検査表の中にまたは他の適した手段によって保存され、例えば、当業者に公知の従来のデータクエリ方法によってデータベースまたは検査表から評価され得る。特定の個体が、甲状腺癌を治療するための特定の化合物または薬物の陽性の治療成績を予測するある対立遺伝子を保有していると判定される場合は、その個体は、その特定の化合物の投与から利益を得る可能性が高い。
本発明はまた、甲状腺癌の治療の進行または有効性をモニターする方法に関する。これは、本発明のマーカーおよびハプロタイプの遺伝子型および/またはハプロタイプの状態に基づいて行われ得、すなわち、本願明細書で開示された少なくとも1つの多型マーカーの少なくとも1つの対立遺伝子の不存在または存在の評価、または本発明の変異体(マーカーおよびハプロタイプ)に関連する遺伝子の発現のモニターによってなされ得る。リスク遺伝子のmRNAまたはコードされたポリペプチドは、組織試料(例えば、抹消血試料、または生検試料)において測定され得る。従って、発現レベルおよび/またはmRNAレベルは、治療の有効性をモニターするために、治療の前および治療の間に判定され得る。代わりに、または同時に、本願明細書に示された甲状腺癌の少なくとも1つのリスク変異の遺伝子型および/またはハプロタイプの状態は、治療の有効性をモニターするために、治療の前および治療の間に判定される。
あるいは、本発明のマーカーおよびハプロタイプに関連する生物学的ネットワークまたは代謝経路は、mRNAおよび/またはポリペプチドレベルの測定によってモニターされ得る。例えば、これは、治療前および治療後に得られた試料中の、ネットワークおよび/または経路に属するいくつかの遺伝子について、発現レベルまたはポリペプチドをモニターすることによってなされ得る。あるいは、生物学的ネットワークまたは代謝経路に属する代謝物を、治療前および治療後に測定してもよい。治療の有効性は、治療の間に、発現レベル/代謝物レベルで認められた変化を、健康な被験者から得た対応するデータと比較することによって判定される。
さらなる態様では、本発明のマーカーは、臨床試験の効力および有効性を増加するために使用され得る。従って、本発明の少なくとも1つのリスクのある変異の保有者である個体は、特定の治療様式に対し、より好ましく反応する可能性があってもよい。1つの実施態様では、特定の治療(例えば、小分子薬剤)が標的にしている経路および/または代謝ネットワークの遺伝子(単数または複数)についてリスクのある変異を保有する個体は、当該治療に対してより反応する可能性がある。別の実施態様では、発現および/または機能がリスクのある変異によって変化された遺伝子についてリスクのある変異を保有する個体は、その遺伝子、その発現またはその遺伝子産物を標的とした治療様式に対してより反応する可能性がある。本願は臨床治験の安全性を改良し得るが、また、臨床治験が統計的に有意な有効性を実証するであろう(当該集団のあるサブグループに限定され得る)可能性を高め得る。従って、このような試験の1つの可能性のある結末は、ある遺伝的変異、例えば本発明のマーカーおよびハプロタイプの保有者は、処方される治療薬または薬物を摂取したときに治療薬に対する陽性反応を示す、すなわち甲状腺癌と関連する症候の軽減を経験する可能性が統計的に有意に高い。
さらなる態様では、本発明のマーカーおよびハプロタイプは、特定の個体の医薬品の選択のターゲティングに使用され得る。治療様式の個別化された選択、生活習慣の変化、または生活習慣の変化および特定の治療の投与の組み合わせは、本発明のリスクのある変異体の利用によって実現され得る。従って、本発明の特定のマーカーについての個体の状態の知識は、本発明のリスクのある変異によって影響される遺伝子または遺伝子産物を標的にする、治療上の選択肢の選択について有用であり得る。変異の特定の組み合わせは、治療上の選択肢の1つの選択に適してもよく、一方で他の遺伝子変異の組み合わせは他の治療上の選択肢を標的としてよい。治療要素の選択を臨床的に信頼できる正確性をもって判定するために必要に応じて、このような変異の組み合わせは、1つの変異、2つの変異、3つの変異、または4つ以上の変異を含んでもよい。
(コンピューターで実施される態様)
当業者が理解するとおり、本願明細書に記載される方法および情報は、全体がまたは一部が、公知のコンピューター可読媒体上のコンピューターが実行可能な命令として実施され得る。例えば、本願明細書に記載される方法は、ハードウェアで実施され得る。あるいは、当該方法は、例えば、1以上のメモリまたは他のコンピューター可読媒体に保存されたソフトウェアで実施され得、そして1以上のプロセッサ上で実施され得る。公知のように、当該プロセッサは、1以上の制御装置、計算ユニットおよび/またはコンピューターシステムの他のユニットに関連付けられ得るか、または所望に応じてファームウェアに埋め込まれ得る。ソフトウェアで実施される場合、ルーチンは、公知のようにRAM、ROM、フラッシュメモリ、磁気ディスク、レーザーディスク、または他の記憶媒体などのいずれかのコンピューター可読メモリの中に保存され得る。同様に、このソフトウェアは、いずれかの公知の配信方法を介して(例えば、電話線、インターネット、無線接続などの通信チャネルにわたることを含む)、またはコンピューター可読ディスク、フラッシュドライブなどの持ち運びできる媒体を介して計算装置へと配信され得る。
より一般的には、そして当業者が理解するように、上記の種々の工程は、種々のブロック、演算、ツール、モジュールおよび技術として実施され得、これらは、ひいてはハードウェア、ファームウェア、ソフトウェア、またはハードウェア、ファームウェア、および/もしくはソフトウェアのいずれかの組み合わせで実施され得る。ハードウェアで実施される場合、当該ブロック、演算、技術などのうちのいくつかまたはすべては、例えば、カスタム集積回路(IC)、特定用途向け集積回路(ASIC)、フィールドプログラマブル論理アレイ(FPGA)、プログラマブル論理アレイ(PLA)などで実施され得る。
ソフトウェアで実施される場合、当該ソフトウェアは、いずれかの公知のコンピューター可読媒体に、例えば磁気ディスク、光ディスク、もしくは他の記憶媒体上に、コンピューターのRAMまたはROMまたはフラッシュメモリに、プロセッサ、ハードディスクドライブ、光ディスクドライブ、テープドライブなどに保存され得る。同様に、当該ソフトウェアは、いずれかの公知の配信方法を介して(例えば、コンピューター可読ディスクまたは他の持ち運びできるコンピューター記憶装置上でなど)ユーザーまたはコンピューターシステムへと配信され得る。
図1は、請求項に係る方法および装置の工程のためのシステムが実施され得る、適したコンピューターシステム環境100の例を図示する。コンピューターシステム環境100は、適したコンピューター環境の1つの例に過ぎず、請求項の方法または装置の使用または機能性の範囲に関して何らかの限定を示唆することを意図するものではない。コンピューター環境100は、代表的な動作環境100に図示された構成要素のいずれか1つまたは組み合わせに関して何らかの依存性または必要条件を有すると解釈されるべきでもない。
請求項に係る方法およびシステムの工程は、多数の他の一般的な目的または特別の目的のコンピューターシステム環境または機器構成を用いて動作できる。請求項の方法またはシステムとの使用に適切であり得る周知のコンピューターシステム、環境、および/または機器構成の例としては、パーソナルコンピューター、サーバーコンピューター、携帯端末またはラップトップ型装置、マルチプロセッサシステム、マイクロプロセッサを用いるシステム、セットトップボックス、プログラムできる家庭用電化製品、ネットワークPC、ミニコンピューター、メインフレームコンピューター、上記のシステムまたは装置のいずれかを含む分散コンピューティング環境などが挙げられるが、これらに限定されない。
請求項に係る方法およびシステムの工程は、コンピューターによって実行される、プログラムモジュールなどのコンピューターが実行可能な命令の一般的なコンテクストで記述され得る。一般的に、プログラムモジュールは、特定のタスクを実行し、または特定の抽象データ型を実施するルーチン、プログラム、オブジェクト、構成要素、データ構造などを含む。当該方法および装置は、通信ネットワークを通してリンクされている遠隔の処理装置によってタスクが実行される、分散コンピューティング環境においても実行され得る。統合コンピューティング環境および分散コンピューティング環境の両方において、プログラムモジュールは、メモリ記憶装置を含むローカルのおよび遠隔のコンピューター記憶媒体の両方に位置し得る。
図1を参照して、請求項に係る方法およびシステムの工程を実施するための代表的なシステムは、コンピューター110の形態の一般的な目的の計算装置を含む。コンピューター110の構成要素としては、処理装置120、システムメモリ130、およびシステムメモリを含む種々のシステム構成要素を処理装置120に結合するシステムバス121が挙げられ得るが、これらに限定されない。システムバス121は、メモリバスまたはメモリコントローラ、周辺機器用バス、および様々なバスアーキテクチャのうちのいずれかを使用するローカルバスを含めたいくつかの種類のバス構造のいずれかであり得る。例として、このようなアーキテクチャとしては、業界標準アーキテクチャ(ISA)バス、マイクロ・チャネル・アーキテクチャ(MCA)バス、拡張ISA(EISA)バス、ビデオ・エレクトロニクス・スタンダーズ・アソシエーション(Video Electronics Standards Association)(VESA)ローカルバス、およびMezzanine(中二階)バスとしても知られるペリフェラル・コンポーネント・インターコネクト(Peripheral Component Interconnect)(PCI)バスが挙げられるが、これらに限定されない。
コンピューター110は、典型的には様々なコンピューター可読媒体を含む。コンピューター可読媒体は、コンピューター110によってアクセスされ得るいずれの利用可能な媒体であり得、例としては揮発性媒体および不揮発性媒体の両方、リムーバブル媒体および非リムーバブル媒体が挙げられる。例として、コンピューター可読媒体は、コンピューター記憶媒体および通信媒体を含み得るが、これらに限定されない。コンピューター記憶媒体としては、コンピューター可読命令、データ構造、プログラムモジュールまたは他のデータなどの情報の保存のためのいずれかの方法または技術で実施される、揮発性および不揮発性の両方の、リムーバブル媒体および非リムーバブル媒体が挙げられる。コンピューター記憶媒体としては、RAM、ROM、EEPROM、フラッシュメモリもしくは他のメモリ技術、CD−ROM、デジタルバーサタイルディスク(DVD)もしくは他の光ディスク記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置または他の磁気記憶装置、あるいは所望の情報を保存するために使用され得かつコンピューター110によってアクセスされ得るいずれかの他の媒体が挙げられるが、これらに限定されない。通信媒体は、典型的には、搬送波または他の輸送機構などの変調されたデータ信号の中にコンピューター可読命令、データ構造、プログラムモジュールまたは他のデータを具現化し、いずれかの情報配信媒体を含む。用語「変調されたデータ信号」は、ある信号の特性集合のうちの1以上が、情報を当該信号の中でコード化するような様式で変更されている、その信号を意味する。例として、通信媒体としては、有線ネットワークまたは直接配線接続などの有線媒体、ならびに音響、RF、赤外線および他の無線媒体などの無線媒体が挙げられるが、これらに限定されない。上記のもののうちのいずれの組み合わせも、コンピューター可読媒体の範囲内に包含されるはずである。
システムメモリ130は、読み出し専用メモリ(ROM)131およびランダムアクセスメモリ(RAM)132などの揮発性メモリおよび/または不揮発性メモリの形態のコンピューター記憶媒体を含む。起動中などにコンピューター110内の要素間で情報を転送することを助ける基本ルーチンを含む基本入出力システム133(BIOS)は、典型的にはROM 131に保存される。RAM 132は、典型的には、処理装置120が直ちにアクセス可能であり、かつ/または現在処理装置120が演算しているデータおよび/またはプログラムモジュールを含む。例として、図1は、オペレーティングシステム134、アプリケーションプログラム135、他のプログラムモジュール136、およびプログラムデータ137を図示するが、これらに限定されない。
コンピューター110はまた、他のリムーバブル/非リムーバブル、揮発性/不揮発性のコンピューター記憶媒体を含み得る。例にすぎないが、図1は、非リムーバブルの、不揮発性の磁気媒体から読み取りまたは非リムーバブルの、不揮発性の磁気媒体に書き込むハードディスクドライブ140、リムーバブルの、不揮発性の磁気ディスク152から読み取りまたはリムーバブルの、不揮発性の磁気ディスク152に書き込む磁気ディスクドライブ151、およびCD ROMまたは他の光媒体などのリムーバブルの、不揮発性の光ディスク156から読み取りまたはリムーバブルの、不揮発性の光ディスク156に書き込む光ディスクドライブ155を図示する。代表的な動作環境で使用され得る他のリムーバブル/非リムーバブルの、揮発性/不揮発性のコンピューター記憶媒体としては、磁気テープカセット、フラッシュメモリカード、デジタルバーサタイルディスク、デジタルビデオテープ、ソリッドステートRAM、ソリッドステートROMなどが挙げられるが、これらに限定されない。ハードディスクドライブ141は、典型的には、非リムーバブルメモリインターフェース(インターフェース140など)を介してシステムバス121に接続され、磁気ディスクドライブ151および光ディスクドライブ155は、典型的にはリムーバブルメモリインターフェース(インターフェース150など)によってシステムバス121に接続される。
上で論じ図1に図示したドライブおよびそれらの関連するコンピューター記憶媒体は、コンピューター110のためのコンピューター可読命令、データ構造、プログラムモジュールおよび他のデータの保存をもたらす。図1では、例えば、ハードディスクドライブ141は、保存用(storing)オペレーティングシステム144、アプリケーションプログラム145、他のプログラムモジュール146、およびプログラムデータ147として図示されている。これらの構成要素は、オペレーティングシステム134、アプリケーションプログラム135、他のプログラムモジュール136、およびプログラムデータ137と同じであってもよいし、異なっていてもよいことに留意されたい。オペレーティングシステム144、アプリケーションプログラム145、他のプログラムモジュール146、およびプログラムデータ147は、最小限それらが異なるコピーであることを図示するために、ここでは異なる数が与えられている。ユーザーは、キーボード162およびポインティングデバイス161(一般にマウスと呼ばれる)、トラックボールまたはタッチパッドなどの入力装置を通して、コマンドおよび情報をコンピューター20へと入力し得る。他の入力装置(図示せず)は、マイクロホン、ジョイスティック、ゲームパッド、パラボラアンテナ、スキャナーなどを含み得る。これらおよび他の入力装置は、システムバスに結合されているユーザー入力インターフェース160を通して処理装置120に接続されることが多いが、パラレルポート、ゲームポートまたはユニバーサル・シリアル・バス(USB)などの他のインターフェースおよびバス構造によって接続されてもよい。モニター191または他の種類のディスプレイ装置はまた、ビデオインターフェース190などのインターフェースを介してシステムバス121に接続されている。モニターに加えて、コンピューターはまた、スピーカー197およびプリンタ196などの他の周辺出力装置を含み得、これらは出力用周辺インターフェース190を通して接続され得る。
コンピューター110は、リモートコンピューター180などの1以上のリモートコンピューターへの論理結合を使用して、ネットワーク化された環境の中で動作し得る。リモートコンピューター180は、パーソナルコンピューター、サーバー、ルーター、ネットワークPC、ピア装置(peer device)または他の共通のネットワークノードであり得、そして典型的には、コンピューター110に対する上記の要素のうちの多くまたはすべてを含むが、メモリ記憶装置181だけが図1に図示されている。図1に図示される論理結合は、ローカルエリアネットワーク(LAN)171および広域ネットワーク(WAN)173を含むが、他のネットワークも含み得る。このようなネットワーク環境は、オフィス、企業規模のコンピューターネットワーク、イントラネットおよびインターネット内では普通のものである。
LANネットワーク環境で使用される場合、コンピューター110は、ネットワークインターフェースまたはアダプター170を通してLAN171に接続される。WANネットワーク環境で使用される場合、コンピューター110は、典型的には、モデム172またはインターネットなどのWAN 173にわたって通信を確立するための他の手段を含む。モデム172(内蔵モデムまたは外付けモデムであり得る)は、ユーザー入力インターフェース160、または他の適切な機構を介してシステムバス121に接続され得る。ネットワーク化された環境では、コンピューター110に対して示されたプログラムモジュール、またはその一部分は、遠隔のメモリ記憶装置に保存され得る。例として、図1は、遠隔のアプリケーションプログラム185をメモリ装置181上に存在するとして図示しているが、これに限定されない。示されるネットワーク接続は代表的なものであり、コンピューター間の通信リンクを確立するための他の手段が使用され得ることは分かるであろう。
上記の本文は本発明の多数の異なる実施態様の詳細な説明を記載するが、本発明の範囲は、添付の特許請求の範囲の文言によって定められるということを理解されたい。この詳細な説明は、代表的なものにすぎないと解釈されるべきであり、あらゆる可能性のある本発明の実施態様を記載しているわけではない。なぜなら、あらゆる可能性のある実施態様を記載することは、不可能ではないかもしれないが、実益がないと思われるからである。多数の代替の実施態様が、現在の技術または本特許の出願日以後に開発される技術のいずれかを使用して実施され得、それらは、依然として本発明を画定する特許請求の範囲の範囲内に含まれることになる。
リスク評価システムおよび方法、ならびに他の要素が、好ましくはソフトウェアで実施されるとして記載されてきたが、それらはハードウェア、ファームウェアなどで実施され得、いずれかの他のプロセッサによって実施され得る。従って、本願明細書に記載された要素は、標準的な多目的CPUでまたは所望に応じて特定用途向け集積回路(ASIC)または他の配線接続された装置などの特定的に設計されたハードウェアまたはファームウェア(図1のコンピューター110が挙げられるが、これに限定されない)上で実施され得る。ソフトウェアで実施される場合、当該ソフトウェアルーチンは、磁気ディスク、レーザーディスク、または他の記憶媒体上などのいずれかのコンピューター可読メモリに、コンピューターまたはプロセッサのRAMまたはROMに、いずれかのデータベースなどに保存され得る。同様に、このソフトウェアは、例えばコンピューター可読ディスクもしくは他の持ち運びできるコンピューター記憶装置上、または電話線、インターネット、無線通信など通信チャネルにわたって(これらは、持ち運びできる記憶媒体を介してこのようなソフトウェアを提供することと同じまたは置き換え可能であると考えられる)、を含めた、いずれかの公知のまたは所望の配信方法を介してユーザーまたは診断システムに配信され得る。
従って、本発明の趣旨および範囲から逸脱せずに、本願明細書に記載および図示された技術および構造の中で、多くの改変態様および変更態様がなされ得る。従って、本願明細書に記載された方法および装置は例示的なものに過ぎず、本発明の範囲に対する限定にはならないということを理解されたい。
従って、本発明は、本願明細書に記載された多型マーカーおよびハプロタイプ、ならびにそれらから誘導された遺伝子型および/または疾病関連データを使用するコンピューターで実施される応用例に関する。このような応用例は、本発明の方法で有用な遺伝子型データの保存、操作、または別の態様での分析のために有用であり得る。1つの例は、遺伝子型情報を第三者(例えば、個体、その個体の保護者、医療提供者または遺伝学的解析サービスの提供者)に提供することができるように、または例えば当該遺伝子型データを甲状腺癌に対する増加した感受性に寄与する遺伝的危険因子についての情報と比較することにより、当該遺伝子型データから情報を誘導し、そしてこのような比較に基づいて結果を報告するために、個体由来の遺伝子型情報を可読媒体上に保存することに関する。
一般的に言えば、コンピューター可読媒体は、(i)本願明細書に記載された少なくとも1つの多型マーカーまたはハプロタイプの識別子の情報、(ii)甲状腺癌の個体における、当該少なくとも1つのマーカーの少なくとも1つの対立遺伝子の頻度の指標もしくはハプロタイプの頻度の指標、および参照集団における、当該少なくとも1つのマーカーの少なくとも1つの対立遺伝子の頻度の指標もしくはハプロタイプの頻度の指標、を保存する性能を有する。当該参照集団は、個体の疾病フリーの集団であり得る。あるいは、当該参照集団は、一般的な集団から得た確率標本であり、従って、集団全体を代表する。頻度の指標は、算出された頻度、対立遺伝子および/またはハプロタイプのコピーの数、または、特定の媒体に適した実際の頻度の規準化された値もしくは別の態様で操作された値であってもよい。
本願明細書で、甲状腺癌の増加した感受性(例えば増加したリスク)に関連すると記載されたマーカーおよびハプロタイプは、ある実施態様では、遺伝子型のデータの解釈および/または分析に有用である。従って、ある実施態様では、本願明細書で示された、甲状腺癌のリスクのある対立遺伝子の同定、または甲状腺癌と関連すると本願明細書に示されたマーカーのうちのいずれか1つとLDである多型マーカーの対立遺伝子の同定は、遺伝子型のデータの由来である個体が甲状腺癌について増加したリスクを有することを示す。そのような1つの実施態様では、遺伝子型のデータは、本願明細書で甲状腺癌に関連すると示された少なくとも1つの多型マーカー、またはそれらと連鎖不平衡のマーカーについて生じる。当該遺伝子型のデータは、例えば、インターネットに接続可能なユーザーインターフェースを介して、当該遺伝子型のデータの解釈とともに、例えば、疾病についてのリスク判定基準(絶対的なリスク(AR)、リスク比(RR)またはオッズ比(OR)など)の形態で、その後に、当該データの由来である個体、その個体の保護者または代表者、医師または医療従事者、遺伝子カウンセラー、または保険代理業者などの第三者に利用可能となる。別の実施態様では、個体由来の遺伝子型のデータセットで同定されたリスクのあるマーカーが評価され、当該データセットにおけるこのようなリスクのある変異体の存在によって与えられるリスクの評価から得た結果は、例えば、安全なウェブインターフェースを介して、または他の伝達手段によって当該第三者に利用可能となる。このようなリスクアセスメントの結果は、数値的な形態(例えば、絶対的なリスク、相対リスク、および/もしくはオッズ比などのリスク値、または参照と比較したリスクの増加した割合による)、図面による方法、または当該遺伝子型のデータの由来である個体のリスクを図解するのに適した他の手段で報告され得る。
(核酸およびポリペプチド)
本願明細書記載の核酸およびポリペプチドは、本発明の方法およびキットで使用され得る。「単離された」核酸分子は、本願明細書で使用される場合、(ゲノム配列における)遺伝子またはヌクレオチド配列に通常に隣接した核酸から分離され、かつ/または、(例えば、RNAライブラリーにおける)他の転写された配列から完全にもしくは部分的に精製したものである。例えば、本発明の単離された核酸は、自然に生じる複雑な細胞環境、または組み換え技術によって産生された場合の培養培地、または化学的に合成された場合の化学的前駆体または他の化学物質に対して実質的に単離され得る。いくつかの例では、単離された物質は、組成物(例えば、他の物質を含む粗抽出物)、バッファーシステムまたは試薬混合物の一部を形成するだろう。他の状況では、当該物質は、例えば、ポリアクリルアミドゲル電気泳動(PAGE)またはカラムクロマトグラフィー(例えば、HPLC)によって判定されるように、基本的に均一に精製され得る。本発明の単離された核酸分子は、存在するすべての高分子の種のうち、少なくとも約50%、少なくとも約80%または少なくとも約90%(モルベースによる)を構成し得る。ゲノムDNAに関しては、用語「単離された」はまた、当該ゲノムDNAが本来関連する染色体から分離される核酸分子も意味し得る。例えば、単離した核酸分子は、約250kb、200kb、150kb、100kb、75kb、50kb、25kb、10kb、5kb、4kb、3kb、2kb、1kb、0.5kbまたは0.1kb未満の、当該核酸分子が由来する細胞のゲノムDNAの核酸分子に隣接するヌクレオチドを含み得る。
当該核酸分子は、他のコード配列または制御配列に融合され得、依然として単離されたものとみなされ得る。従って、ベクターに含有された組み換えDNAは、本願明細書で使用される「単離された」の定義に含まれる。また、単離された核酸分子は、異種の宿主細胞もしくは異種生命体中の組み換えDNA分子、および部分的にもしくは実質的に精製された溶液中のDNA分子を含む。「単離された」核酸分子はまた、in vivoおよびin vitroでの本発明のDNA分子のRNA転写物を含む。単離した核酸分子またはヌクレオチド配列は、化学的に合成された、または組み換え手段によって合成された核酸分子またはヌクレオチド配列を含み得る。このような単離されたヌクレオチド配列は、例えば、コードされたポリペプチドの製造において、(例えば、他の哺乳類の種からの)相同配列の単離のため、(例えば、染色体とのインサイツハイブリダイゼーションによる)遺伝子マッピングのため、または組織(例えば、ヒト組織)中の遺伝子発現の検出(ノーザンブロット分析または他のハイブリダイゼーション技術などによる)のためのプローブとして有用である。
本発明はまた、高いストリンジェンシーハイブリダイゼーション条件下(選択的ハイブリダイゼーションなど)で、本願明細書記載のヌクレオチド配列にハイブリダイズする核酸分子(例えば、本願明細書記載のマーカーまたはハプロタイプに関連する多形性部位を含むヌクレオチド配列に特異的にハイブリダイズする核酸分子)に関する。このような核酸分子は、(例えば、高いストリンジェンシー条件下での)対立遺伝子特異的なハイブリダイゼーションまたは配列特異的なハイブリダイゼーションによって検出および/または単離され得る。核酸ハイブリダイゼーションのストリンジェンシー条件および方法は、当業者に周知(例えば、Current Protocols in Molecular Biology、Ausubel,F.ら、John Wiley & Sons、(1998)、およびKraus,M.およびAaronson,S.、Methods Enzymol.、200:546−556(1991)を参照、その全体の教示は参照によって本願明細書に援用する)である。
2つのヌクレオチドまたはアミノ酸配列の同一性(%)は、至適な比較目的で配列を整列することによって判定され得る(例えば、間隙は、第1の配列の配列に導入され得る)。対応する位置のヌクレオチドまたはアミノ酸は、次いで、比較され、2つの配列間の同一性(%)は、当該配列によって共有される同一の位置の数の関数である(すなわち、同一性(%)=同一の位置の数/位置の総数×100)。ある実施態様では、比較目的で整列させた配列の長さは、参照配列の長さのうち、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、または少なくとも95%である。2つの配列の実際の比較は、周知の方法、例えば、数学的アルゴリズムを使用することによって達成され得る。このような数学的アルゴリズムの非限定的な例は、Karlin,S.およびAltschul,S.、Proc.Natl.Acad.Sci.USA、90:5873−5877(1993)に記載される。このようなアルゴリズムは、Altschul S.ら、Nucleic Acids Res.、25:3389−3402(1997)に記載されるように、NBLASTプログラムおよびXBLASTプログラム(バージョン2.0)に取り込まれる。BLASTプログラムおよびGapped BLASTプログラムを利用する場合、それぞれのプログラム(例えば、NBLAST)の初期状態のパラメータが使用され得る。ワールドワイドウェブ上のウェブサイト(ncbi.nlm.nih.gov.)を参照。1つの実施態様では、配列比較のパラメータはスコア=100、語長=12に設定し得るし、または、異なり得る(例えば、W=5またはW=20)。アルゴリズムの別の例はBLAT(Kent,W.J. Genome Res. 12:656−64(2002))である。
他の例は、MyersおよびMiller、CABIOS(1989)のアルゴリズム、Torellis A.およびRobotti C.、Comput.Appl.Biosci.10:3−5(1994)に記載されたADVANCEおよびADAM、ならびにPearson W.およびLipman,D.、Proc.Natl.Acad.Sci.USA、85:2444−48(1988)に記載されたFASTAを含む。
別の実施態様では、2つのアミノ酸配列間の同一性(%)は、GCGソフトウェアパッケージ(アクセルリス(Accelrys)、英国、ケンブリッジ)におけるGAPプログラムを使用して達成され得る。
本発明はまた、配列番号:1〜229のうちのいずれか1つのヌクレオチド配列を含むまたはこれらからなる核酸;あるいは配列番号:1〜229のうちのいずれか1つのヌクレオチド配列の補完物を含むまたはこれらからなる核酸に、高度にストリンジェントな条件下でハイブリダイズする断片または部分を含む、単離した核酸分子を提供し、当該ヌクレオチド配列は、本願明細書に記載されたマーカーおよびハプロタイプに含まれる少なくとも1つの多型の対立遺伝子を含む。本発明の核酸断片は、長さが少なくとも約15、少なくとも約18、20、23または25ヌクレオチドであり、30、40、50、100、200、500、1000、10,000またはこれより多いヌクレオチドである。
本発明の核酸断片は、本願明細書記載のようなアッセイにおけるプローブまたはプライマーとして使用される。「プローブ」または「プライマー」は、塩基特異的様式で核酸分子の相補鎖にハイブリダイズする、オリゴヌクレオチドである。DNAおよびRNAに加えて、このようなプローブおよびプライマーは、Nielsen P.ら、Science 254:1497−1500(1991)において記載されたように、ポリペプチド核酸(PNA)を含む。プローブまたはプライマーは、核酸分子の少なくとも約15、典型的には約20〜25、およびある実施態様では約40、50または75の、核酸分子の連続的ヌクレオチドにハイブリダイズするヌクレオチド配列領域を含む。1つの実施態様では、当該プローブまたはプライマーは、本願明細書記載の少なくとも1つの多型マーカーの少なくとも1つの対立遺伝子もしくは少なくとも1つのハプロタイプ、またはその補完物を含む。特定の実施態様では、プローブまたはプライマーは、100またはより少ないヌクレオチド(例えば、ある実施態様では、6〜50ヌクレオチド、または、例えば、12〜30ヌクレオチド)を含み得る。他の実施態様では、当該プローブまたはプライマーは、近接するヌクレオチド配列もしくは当該近接するヌクレオチド配列の補完物と、少なくとも70%の同一性、少なくとも80%の同一性、少なくとも85%の同一性、少なくとも90%の同一性、または少なくとも95%の同一性である。別の実施態様では、当該プローブまたはプライマーは、近接するヌクレオチド配列または当該近接するヌクレオチド配列の補完物に、選択的にハイブリダイズできる。しばしば、当該プローブまたはプライマーは、さらに、標識(例えば、放射性同位元素、蛍光標識、酵素標識、酵素共因子標識、磁性標識、スピン標識、エピトープ標識)を含む。
上記などの本発明の核酸分子は、当業者に周知の標準的な分子生物学技術を使用して同定され、単離され得る。増幅したDNAは、標識(例えば、放射標識、蛍光標識)され得、ヒト細胞由来のcDNAライブラリーのスクリーニングのためのプローブとして使用され得る。cDNAは、mRNA由来であり得、適したベクター中に含まれ得る。対応するクローンが単離され得、DNAはin vivoでの切除の後に得ることができ、クローン化された挿入断片は、一方向または両方向で、当該技術分野で承認されている方法によって配列決定され、適切な分子量のポリペプチドをコードする正しい読み枠が同定され得る。これらの方法または同様の方法を使用して、ポリペプチドおよびポリペプチドをコードするDNAは単離され、配列決定され、さらに特徴付けられ得る。
(抗体)
当該遺伝子産物の1つの形態に特異的に結合するが当該遺伝子産物の他の形態には特異的に結合しないポリクローナル抗体および/またはモノクローナル抗体もまた提供される。当該多形性部位(単数もしくは複数)を含む変異体または参照遺伝子産物のいずれかの一部分に結合する抗体もまた、提供される。用語「抗体」は、本願明細書で使用される場合、免疫グロブリン分子および免疫グロブリン分子の免疫学的に活性な部分、すなわち、特異的に抗原に結合する抗原結合部位を含む分子を意味する。本発明のポリペプチドに特異的に結合する分子は、そのポリペプチドまたはその断片に結合するが、試料中、例えば、自然に当該ポリペプチドを含む生物学的試料中の他の分子には実質的に結合しない分子である。免疫グロブリン分子の免疫学的に活性な部分の例は、抗体をペプシンなどの酵素で処理することによって生じ得るF(ab)およびF(ab’)2断片を含む。本発明は、本発明のポリペプチドに結合するポリクローナル抗体およびモノクローナル抗体を提供する。用語「モノクローナル抗体」または「モノクローナル抗体の組成物」は、本願明細書で使用される場合、本発明のポリペプチドの特定のエピトープと免疫反応できる1種のみの抗原結合部位を含む抗体分子の集団を意味する。従って、モノクローナル抗体の組成物は、典型的には、免疫反応する本発明の特定のポリペプチドに対する単一の結合アフィニティーを示す。
ポリクローナル抗体は、適した被験者に、所望の免疫原(例えば、本発明のポリペプチドまたはその断片)で免疫することによって、上記のように、調製され得る。免疫された被験者における抗体力価は、酵素結合免疫吸着検定法(ELISA)などの標準的な技術によって、固定化されたポリペプチドを使用して、経時的にモニターされ得る。所望であれば、ポリペプチドに対して作られた抗体分子は、哺乳類から(例えば、血液から)単離され得、さらに、IgG分画を得るために、プロテインAクロマトグラフィーなどの周知の技術によって精製され得る。免疫後の適切な時期に、例えば、抗体力価が最も高いときに、抗体産生細胞が被験者から入手され、標準的な技術(KohlerおよびMilstein、Nature 256:495−497(1975)に最初に記載された融合細胞法、ヒトB細胞の融合細胞法(Kozborら、Immunol.Today 4:72(1983))、EBV融合細胞法(Coleら、Monoclonal Antibodies and Cancer Therapy、Alan R.Liss、1985、Inc.、77−96頁)またはトリオーマ(trioma)法など)によってモノクローナル抗体を調製するために使用され得る。融合細胞を産生する技術は周知である(概括的に、Current Protocols in Immunology(1994)Coliganら、(編集)John Wiley & Sons社、New York、NY参照)。簡潔に言えば、不死の株化細胞(典型的にはミエロ−マ)は、上記の免疫原で免疫された哺乳類から得たリンパ球(典型的には脾細胞)と融合され、得られた融合細胞の培養上清は、本発明のポリペプチドに結合するモノクローナル抗体を産生する融合細胞を同定するためにスクリーニングされる。
リンパ球および不死化株化細胞を融合するために使用される多くの周知の手順のいずれも、本発明のポリペプチドに対するモノクローナル抗体を生じる目的で適用され得る(例えば、Current Protocols in Immunology、前出;Galfreら、Nature 266:55052(1977);R.H.Kenneth、Monoclonal Antibodies:A New Dimension In Biological Analyses中、Plenum Publishing Corp.、New York、New York(1980);およびLerner、Yale J.Biol.Med.54:387−402(1981)参照)。さらに、当業者は、同様に有用であるこのような方法の多くのバリエーションがあることを理解するだろう。
モノクローナル抗体分泌融合細胞の調製の代わりに、本発明のポリペプチドに対するモノクローナル抗体が、当該ポリペプチドとの組み換えコンビナトリアル免疫グロブリンライブラリー(例えば、抗体ファージディスプレイライブラリー)をスクリーニングし、それにより、当該ポリペプチドに結合する免疫グロブリンライブラリーメンバーを単離することによって、同定および単離され得る。ファージディスプレイライブラリーを生じ、かつスクリーニングするためのキットは、市販されている(例えば、ファルマシア社(Pharmacia)組み換えファージ抗体システム、カタログ番号27−9400−01;およびストラタジーン社(Stratagene)SurfZAP(商標)ファージディスプレイキット、カタログ番号240612)。その上、方法および試薬の例、特に、抗体のディスプレイライブラリーの生成およびスクリーニングにおける使用において受け入れられる例は、例えば、米国特許第5,223,409号明細書、国際公開第92/18619号パンフレット、国際公開第91/17271号パンフレット、国際公開第92/20791号パンフレット、国際公開第92/15679号パンフレット、国際公開第93/01288号パンフレット、国際公開第92/01047号パンフレット、国際公開第92/09690号パンフレット、国際公開第90/02809号パンフレット;Fuchsら、Bio/Technology 9:1370−1372(1991);Hayら、Hum.Antibod.Hybridomas 3:81−85(1992);Huseら、Science 246:1275−1281(1989);およびGriffithsら、EMBO J.12:725−734(1993)において見出され得る。
その上、ヒト部分および非ヒト部分の両方を含み、標準的な組み換えDNA技術を使用して産生され得る組み換え抗体(キメラのモノクローナル抗体およびヒト化モノクローナル抗体など)は、本発明の範囲内である。このようなキメラのモノクローナル抗体およびヒト化モノクローナル抗体は、当該技術分野で公知の組み換えDNA技術によって産生され得る。
通常は、本発明の抗体(例えば、モノクローナル抗体)は、標準的な技術(アフィニティークロマトグラフィーまたは免疫沈降など)によって本発明のポリペプチドを単離するのに使用され得る。ポリペプチド特異的な抗体は、細胞からの自然のポリペプチドの精製および宿主細胞で発現した組み換えによって産生されたポリペプチドの精製を促進できる。さらに、本発明のポリペプチドに特異的な抗体は、当該ポリペプチドの存在量および発現様式を評価するために、(例えば、細胞溶解物、細胞上清、または組織試料中の)当該ポリペプチドを検出するのに使用され得る。抗体は、臨床試験過程の一部として、例えば、所定の治療計画の有効性の判定などのため、組織中のタンパク質レベルをモニターするために診断的に使用され得る。抗体は、その検出を促進するための検出可能な物質と結合され得る。検出可能な物質の例は、様々な酵素、補欠分子族、蛍光物質、発光物質、生物発光物質、および放射性物質を含む。適した酵素の例は、西洋わさびペルオキシダーゼ、アルカリホスファターゼ、βガラクトシダーゼ、またはアセチルコリンエステラーゼを含む。適した補欠分子族複合体の例は、ストレプトアビジン/ビオチンおよびアビジン/ビオチンを含む。適した蛍光物質の例は、ウンベリフェロン、フルオレセイン、フルオレセインイソチオシアネート、ローダミン、ジクロロトリアジニルアミンフルオレセイン(dichlorotriazinylamine fluorescein)、塩化ダンシルまたはフィコエリトリンを含む。発光物質の例は、ルミノールを含む。生物発光物質の例は、ルシフェラーゼ、ルシフェリン、およびエクオリンを含み、ならびに、適した放射性物質の例は125I、131I、35Sまたは3Hを含む。
抗体はまた、薬理ゲノミクス分析において有用であってもよい。このような実施態様では、本発明に関する核酸によってコードされた変異タンパク質に対する抗体(少なくとも1つの本発明の多型マーカーを含む核酸によってコードされた変異タンパク質など)は、改変された治療様式を必要とする個体の同定のために使用され得る。
抗体は、さらに、疾病の活性段階などの疾病の状態、またはタンパク質の機能に関連した疾病(特に甲状腺癌)に対する素因のある個体における変異タンパク質の発現の評価のために有用であり得る。本願明細書記載の少なくとも1つの多型マーカーまたはハプロタイプを含む核酸によってコードされた本発明の変異タンパク質に特異的な抗体は、変異タンパク質の存在のスクリーニング、例えば、変異タンパク質の存在によって示された甲状腺癌への素因についてのスクリーニング、に使用され得る。
抗体は他の方法で使用され得る。従って、抗体は、電気泳動の移動度、等電点、トリプシンまたは他のプロテアーゼ消化による分析と組み合わせて、タンパク質(本発明の変異タンパク質など)を評価するための診断の手段として、または当業者に知られた他の物理的なアッセイにおける使用において有用である。抗体はまた、組織適合試験に使用してもよい。そのような1つの実施態様では、特定の変異タンパク質は、特定の組織型の発現に関連し、変異タンパク質に特異的な抗体は、次いで、特定の組織型の同定に使用され得る。
変異タンパク質を含むタンパク質の細胞内局在はまた、抗体を使用して判定され得、様々な組織の細胞のタンパク質の異常な細胞内局在を評価するために適用され得る。このような使用は遺伝子検査に適用され得るが、特定の治療様式をモニターすることにも適用され得る。治療が、変異タンパク質の発現レベルもしくは存在または変異タンパク質の異常な組織分布もしくは発生上の発現を矯正することを目的にしている場合、当該変異タンパク質またはその断片に特異的な抗体は治療有効性をモニターするために使用され得る。
抗体は、さらに、例えば、結合分子またはパートナーへの、変異タンパク質の結合をブロックすることによる変異タンパク質の機能の阻害において有用である。このような使用はまた、治療が変異タンパク質の機能の阻害に関連する治療上の構成においても適用され得る。抗体は、例えば、結合をブロックまたは競合的に阻害し、それによりタンパク質の活性を調節(すなわち、刺激または拮抗)するのに使用され得る。抗体は、特定の機能に必要とされる部位を含む特定のタンパク質断片、または、細胞または細胞膜に関連するインタクトなタンパク質に対して調製され得る。in vivoにおける投与について、抗体はさらなる治療上の負荷量(放射性核種、酵素、免疫原性エピトープ、または細菌毒素(ジフテリアまたは、リシンなどの植物毒素)を含む細胞毒など)に関連してもよい。in vivoでの抗体またはその断片の半減期は、ポリエチレングリコールとの結合によるペグ化によって増加されてもよい。
本発明は、さらに、本願明細書記載の方法において抗体を使用するためのキットに関する。これは、試験試料における変異タンパク質の存在を検出するためのキットを含むが、これに限定されない。1つの好ましい実施態様は、抗体(標識された抗体または標識できる抗体など)および生物学的試料中の変異タンパク質を検出するための化合物もしくは薬剤、試料中の変異タンパク質の量もしくは存在および/もしくは不存在を判定する手段、ならびに試料中の変異タンパク質の量を標準物質と比較する手段、ならびに当該キットの使用についての説明書を含む。
本発明は、これから下記の非限定的な実施例によって例証される。
(実施例1)
(甲状腺癌のリスクを与える染色体9q22.33上のリスク変異体の同定)
アイスランドにおける甲状腺癌の発生率は隣接する諸国よりも高く、かつ世界中で最も高いものの中に入る。100,000人あたりのアイスランドにおける年齢標準化発生率は、男性および女性についてそれぞれ5および12.5である。診断時の平均年齢は、男性について61歳、女性について47歳である。組織学的亜型間の分布は、アイスランドでは他の先進国と同様である。乳頭癌の組織学的亜型は最も頻度が高く、全甲状腺癌のうちの最高80%を占め、第2の最も頻度が高いものは濾胞癌の型(約14%)であり、第3は未分化癌型であって全甲状腺の症例の約5%を占め、最も一般的でないのは髄様癌型(約1%)である。
(被験者)
本研究の承認は、アイスランド国立生命倫理委員会(the National Bioethics Committee of Iceland)およびアイスランドデータ保護機関(the Icelandic Data Protection Authority)から得た。
甲状腺癌研究のために使用した試料の本発明者らの収集物は、まったく十分に、アイスランドにおける全体の分布を表していた。本発明者らが遺伝子型を同定した406症例のうちで、309(82%)は乳頭癌型であり、53(14%)は濾胞癌であり、7(1.5%)は甲状腺髄様癌であり、37は不明または未定の組織学的表現型のものである。
異なる組織学的亜型間で統計的有意差は観察されなかったため、以下の表1に提示される結果は、すべての本発明者らの症例についての結果を合わせたものである。
28,858のアイスランド人の対照は、ディコーデジェネティクス(deCODE genetics)での他の進行中のゲノム全体での関連研究からの個体からなっていた。甲状腺癌と診断された個体は排除した。男性および女性の両方を含めた。
(遺伝子型の同定)
甲状腺癌に対する感受性変異体についてのゲノム全体での検索(search)において、甲状腺癌と診断されたアイスランド人の患者および集団対照から得た試料を、国際HapMap計画の第I相に由来する317,503のSNPを含むイルミナ Hap300 SNP ビーズマイクロアレイ(イルミナ社(Illumina)、米国、カリフォルニア州、サンディエゴ)上で遺伝子型を同定した。このチップは、r2≧0.8の共通のSNPについてのユタ州のCEPH(CEU)HapMap試料の約75%のゲノムの網羅を与える(BarrettおよびCardon、(2006)、Nat Genet、38、659−62)。単形性(すなわち、合わせた患者および対照群における少ない対立遺伝子頻度が0.001未満であった)であったためか、低い(<95%)収率を有していたためか、のいずれかの理由で不適であるとみなしたマーカーは分析の前に除去した。
マーカーrs907580、rs7024345およびrs965513を、ケンタウルス(Centaurus) SNP 遺伝子型同定(Kutyavinら、(2006)、Nucleic Acids Res、34、e128)によってさらに評価した。
すべての遺伝子型の同定を、ディコーデジェネティクス(deCODE genetics)の施設で実施した。
(統計解析)
発明者らは、複合モデルを仮定して、すなわちヒトが保有する2つの対立遺伝子の相対リスクが乗算で表されると仮定してSNP対立遺伝子のオッズ比(OR)を算出した。保有者頻度よりも対立遺伝子の頻度が、当該マーカーについて提示される。関連したP値は、NEMOソフトウェアパッケージにおいて実行されるように、標準的な尤度比のカイ2乗統計量で算出した(Gretarsdottirら、(2003)、Nat Genet、35、131−8)。信頼区間は、ORの評価が対数正規分布を有すると仮定して算出した。
すべてのP値は、両側として報告した。
(結果)
イルミナ Hap300 チップから得た遺伝子型の分析の際に、本発明者らは、甲状腺癌に対する非常に有意な関連を与える、染色体9q22.33上の3つのマーカー、rs965513、rs907580およびrs7024345を見出した。本発明者らは、ケンタウルス遺伝子型同定アッセイを使用してさらなる症例の遺伝子型を同定することにより、この結果を追跡した。結果を表1Aに示す。
すべての3つのマーカーは、甲状腺癌に対するゲノム全体の有意な関連を与え(317,000の検定に対する補正は、0.05/317,000〜1.5×10−8未満のP値を必要とする)、最も有意な結果は、rs965513について得られた(OR 1.77、P値 1.18×10−15)。rs907580およびrs702345マーカーは、0.90のr2値(表1B)でrs965513と相関しており、従ってこれらのマーカーは、同じ関連シグナルを捕捉する可能性が非常に高い。
(実施例2)
甲状腺癌のリスクを与える配列変異について検索するために、本発明者らは、イルミナ HumanHap300およびHumanCNV370−duo Bead Chip遺伝子型同定プラットフォームを使用して遺伝子型同定した192の組織病理学的に確認されたアイスランド人の甲状腺癌の症例および37,196の対照を用いてゲノム全体での関連研究(GWAS)を行った。さらに、平均して1SNPあたり、さらなる186の甲状腺癌患者と等価である遺伝子型を加えるために、本発明者らは、遺伝子型同定されていない甲状腺癌の症例に関する情報を提供するために近親者の既知の遺伝子型が使用される方法(コンピューターでの(in silico)遺伝子型の同定)を使用した(Gudbjartsson,DFら、Nat Genet 40:609−15(2008))。品質検査に合格しなかったSNPを除いた後、全部で304,083のSNPを関連について検定した。本発明者らは、複合モデルを仮定して各SNPについて対立遺伝子のオッズ比(OR)を算出し、検定の目的で標準的な尤度比χ2統計量を計算した。結果を、ゲノム制御の方法を使用して個体間での家族性の関連性について、および潜在的な集団の層別化について調整した(Devlin BおよびRoeder K Biometrics 55:997−1004(1999));χ2統計量を、見積もられた膨張因子1.09で除算した。
本発明者らは、9q22.33上のフォークヘッド因子E1(FOXE1)遺伝子と同じ連鎖不平衡(LD)領域に位置するいくつかの強いシグナルを観察した(図2;表3)。これらの結果を裏付けるために、本発明者らは、ケンタウルス・シングルトラックアッセイ(Centaurus single track assay)での遺伝子型同定を使用して、さらなる241のアイスランド人の甲状腺癌の症例においてこれらのSNPの遺伝子型の同定を進めた。これらの結果および上記GWASから得た結果を合わせて、最も強い関連シグナルは、rs965513の対立遺伝子A(rs965513−A)およびrs10759944の対立遺伝子A(rs10759944−A)について観察され、ORは、両方の変異体について1.77であった(rs965513およびrs10759944について、それぞれP=6.8×10−20およびP=1.7×10−19)(表3および表4)。これらの2つのSNPは、互いのほぼ完全な代用物であり(ユタ州のCEPH(CEU)HapMap試料においてr2=1およびアイスランド人の試料においてr2=0.998)、これらの変異体の効果は互いに区別できないため、本発明者らは、この後の検討ではrs965513−Aに焦点を当てることを選択した。多変量解析においてrs965513−Aについてコントロールすれば、9q22.33上の残りのSNPの中で有意なものは何もない。
本発明者らは、米国(US)、オハイオ州、コロンバス由来(342の症例および384の対照)ならびにスペイン由来(90の症例および1,343の対照)の集団を用いて、ヨーロッパ人の子孫の2つの症例−対照群において甲状腺癌に対するrs965513の関連を次に検定した。rs965513に対する関連は、両方の研究群において再現した(表4)。これら3つの研究集団の間でのORの不均一性の検定は、有意差を示さなかった(rs965513についてP=0.58)。アイスランド、コロンバスおよびスペインから得た結果を合わせると、rs965513−Aについて1.75の見積もられたORが得られた(P=1.7×10−27)。
遺伝形式を検討するために、本発明者らは、遺伝子型特異的ORを計算し、当該複合モデルが両方の変異体に対して適切な合致を与えるということを見出した(表5)。この一般的集団の中の個体の約11%は、rs965513−Aのホモ接合保有者である。rs965513−Aのホモ接合保有者は、非保有者よりも、当該疾病を発症するリスクがそれぞれ3.1倍大きいと見積もられる。さらに、本発明者らは、rs965513−Aの頻度が、すべての3つの集団の中で、より若年で診断された症例の中でより高いということを観察した。これらのデータを合わせると、保有される各対立遺伝子について、診断時の年齢は2.42歳だけ下がると見積もられる(P=0.0014)(表6)。
本発明者らは、甲状腺癌の4つの主要な組織学的分類に対するrs965513の効果を分析した。スペイン人およびアイスランド人の試料収集物の大部分はPTC(約85%)およびFTC(約12%)からなり、コロンバス由来の症例のすべてはPTCであった。rs965513−Aについて、上記3つの集団の合わせた分析でPTCについて観察されたORは1.80(P=4.7×10−23)であり、FTCについては、ORは、アイスランド人およびスペイン人の試料のみに基づいて1.55であった(P=0.016)(表7)。これは、この変異体が甲状腺癌の2つの主要な組織学的な種類のリスクに影響を及ぼすということを実証する。他の組織学的な甲状腺癌の種類の数は、有意義な結論を導くにはあまりに限られていた。
SNP rs965513は、以下の遺伝子が局在していたLD領域内に、9q22.33上に存在する:XPA、FOXE1、C9orf156およびHEMGN(図2)。最も近い遺伝子は、rs965513のテロメア側約57kbに位置するFOXE1である。FOXE1は、下垂体形成および甲状腺形成の両方において重要であり(Dathan,Nら、Dev Dyn 224:450456(2002);De Felice,Mら、Nat Genet 19:395−98(1998))、胎生期に甲状腺分化を惹起する転写因子および補助因子の制御ネットワークの中心にある(Parlato Rら、Dev Biol 276:464−75(2004))。さらに、FOXE1遺伝子の変異は、表現型の中でもとりわけ、甲状腺無形成と関連するヒトの症候群の原因となる(De Felice,Mら、Nat Genet 19:395−98(1998);Clifton−Bligh RJら、Nat Genet 19:399−1401(1998))。FOXE1は、サイログロブリン(Tg)および甲状腺ペルオキシダーゼ(TPO)遺伝子などの甲状腺特異的遺伝子の転写の制御におけるその関与に基づき、甲状腺の分化した状態の維持のためにも必要である。これらの遺伝子の両方の制御された発現は、甲状腺ホルモン、トリヨードチロニン(T3)およびチロキシン(T4)の合成のために極めて重要である。なぜなら、TgはT3およびT4の前駆体であり、それらの合成はTPOによって触媒されるからである。主要な制御因子として作用する甲状腺刺激ホルモン(TSH)は、甲状腺ホルモンの合成および分泌の制御にとって中心的な役割を果たす。
甲状腺の生物学におけるFOXE1の関与が与えられ、本発明者らは、TSH(N=12,035)、遊離T4(N=7,108)、および遊離T3(N=3,593)の血清中の循環濃度に対するrs965513−Aの効果を評価した。使用したデータは、甲状腺癌を有するとは分かっていないアイスランド人から11年間の期間(1997〜2008)にわたって集めた一連の測定から得た(表8)。rs965513−Aは、rs965513−Aの1コピーあたり5.9%だけ減少したTSHの血清レベル(P=2.90×10−14;表9)と関連しており、またなお逆方向にT3およびT4の血清レベルと関連しており、つまりrs965513−Aの1コピーあたり1.2%のT3レベルの上昇および1.2%のT4レベルの減少と関連していた(T3およびT4について、それぞれP=3.00×10−3および6.10×10−5)(表9)。これらのデータは、9q22.33変異体が甲状腺の内分泌機能のいくつかの態様に影響を及ぼすということを実証する。
一緒にして考えると、甲状腺および甲状腺関連ホルモンに対する9q22.33上のrs965513の効果、FOXE1に対するrs965513の近接性、および甲状腺特異的遺伝子に対するFOXE1の制御効果は、甲状腺癌とrs965513との間の関連はFOXE1が関与するプロセスを介して媒介されるということを強く示唆する。さらに、FOXE1の発現は、甲状腺腫瘍においては異常であることが示されている(Sequeira,MJら、Thyroid 995−1001(2001))。従って、この変異体は、甲状腺癌に対する遺伝的感受性の最も重要な決定因子の1つである可能性が高い。
(方法)
被験者。アイスランド人の研究集団。甲状腺癌と診断された個体は、1955年1月1日〜2007年12月31日に診断されたすべての1,110のアイスランド人の甲状腺癌患者を含む、アイスランド癌登録所(the Icelandic Cancer Registry、ICR)(http://www.krabbameinsskra.is/)からの全国的なリストに基づいて同定された。そのうちの1.097は非甲状腺髄様癌であった。このアイスランド人の甲状腺癌研究集団は、2000年11月から2008年4月までに補充された(1974年12月〜2007年6月に診断された)460の患者からなり、そのうちの454(98%)は本研究で成功裏に遺伝子が同定された。本研究で使用したすべての甲状腺癌の組織学は、再検討され確認された。合計で192の患者が、イルミナSentrix HumanHap300(n=96)およびHumanCNV370−duo Bead Chip(n=96)マイクロアレイ(イルミナ(Illumina)、米国、カリフォルニア州、サンディエゴ)を使用するゲノム全体でのSNP遺伝子型同定の取り組みに含まれ、本発明者らの品質管理基準に従って成功裏に遺伝子型が同定され、本発明の症例−対照関連分析で使用された。残りの241症例は、ケンタウルス・シングルトラック遺伝子型同定プラットフォームを使用して遺伝子型が同定された。承諾した患者についての診断時の平均年齢は44歳(中央値43歳)であり、範囲は13〜87歳であったが、ICRの中のすべての甲状腺癌患者については診断時の平均年齢は56歳であった。診断から採血までの時間の中央値は10年であった(0〜46年の範囲)。本発明者らが、1998年より前に診断された個体と1998年以降に診断された個体との間でA−rs965513の頻度を比較したとき、有意差は観察されなかった(P=0.97)。この研究で使用した37,202の対照(16,109の男性(43.3%)および21,093の女性(56.7%))は、ディコーデ(deCODE)での異なる遺伝子研究プロジェクトに属する個体からなっていた。これらの個体は、循環器系の一般的な病気(例えば脳卒中または心筋梗塞)、精神病および神経疾患(例えば統合失調症、双極性障害)、内分泌系および自己免疫系(例えば2型糖尿病、喘息)、悪性疾患(例えば乳房または前立腺の癌)と診断されており、また個体はアイスランド人の系統学データベースから無作為に選択された。対照の総数の6%を超える割合を占める単一の疾病プロジェクトはなかった。この対照は84歳の平均年齢を有し、範囲は8〜105歳であった。直線回帰分析は、アイスランド人の対照の間で、A−rs965513の対立遺伝子頻度と生年との間に相関は示さなかった(P>0.2)。これらの対照は、ICRによる甲状腺癌患者の全国的なリストには存在しない。アイスランド人の症例および対照の両方についてのDNAは、標準的な方法を使用して全血から単離した。
本研究は、アイスランドデータ保護委員会(the Data Protection Commission of Iceland)およびアイスランド国立生命倫理委員会(the National Bioethics Committee of Iceland)によって承認された。すべての被験者において、書面によるインフォームドコンセントが得られている。医療情報および血液試料と関連する個人の識別子を以前に記載された第三者の暗号化システム(Gulcher,JGら、Eur J Hum Genet 8:739−42(2000))を用いて暗号化した。
米国、オハイオ州、コロンバス。この研究は、オハイオ州立大学の施設内倫理委員会(Institutional Review Board of Ohio State University)によって承認された。すべての被験者は、書面によるインフォームドコンセントを提供している。症例(n=342)は、甲状腺乳頭癌患者である(従来のPTCおよび濾胞性異型PTCを含む)と組織学的に確認された。これらの患者は、協同ヒト組織ネットワーク(Cooperative Human Tissue Network、CHTN)を通して得た1つの症例を除いて、オハイオ州立大学総合癌センター(the Ohio State University Comprehensive Cancer Center)に収容された。この1つの症例は、ペンシルベニア大学医療センター(the University of Pennsylvania Medical Center)に収容された。すべての症例はコーカサス人であり、92人の男性、250人の女性、年齢の中央値40歳、範囲13〜88であった。ゲノムDNAは、PTC患者由来の血液試料、または新しい凍結した正常な甲状腺組織のいずれかから抽出した。対照(n=384)は、オハイオ中央部出身の甲状腺癌と臨床的に診断されていない個体であった。すべての対照はコーカサス人であり、143人の男性、241人の女性、年齢の中央値51歳、範囲18〜94であった。
スペイン。スペイン人の研究集団は90の甲状腺癌の症例からなっていた。これらの症例は、スペイン、サラゴサ(Zaragoza)のサラゴサ病院の癌科から、2006年10月から2007年6月まで補充した。すべての患者は、ヨーロッパ人の子孫と自己申告した。発生時の年齢、グレードおよび段階を含めた臨床情報は診察記録から得た。患者についての診断時の平均年齢は48歳(中央値49歳)であり、範囲は22〜79歳であった。51歳という平均年齢(年齢の中央値50歳および範囲12〜87歳)を有する1,343人のスペイン人の対照個体(579人(43%)の男性および764人(57%)の女性)は、スペイン、サラゴサの大学病院で接触され、これら対照は甲状腺癌を有するとは知られていなかった。スペイン人の症例および対照の両方についてのDNAは、標準的な方法を使用して全血から単離した。研究の手順は、サラゴサ大学病院(Zaragoza University Hospital)の施設内倫理委員会によって承認された。すべての被験者において、書面によるインフォームドコンセントが得られている。
(統計解析)
関連分析。これまでに記載され(Gretarsdottir Sら、Nat Genet 35:131−38(2003))NEMOソフトウェアで実行された尤度手順を関連分析のために使用した。報告されたSNPについてすべての個体の遺伝子型を同定するための試みがなされた。収率は、あらゆる群のSNPについて95%よりも高かった。本発明者らは、被験者が無関係であれば、帰無仮説下で、漸近的に1自由度のχ2分布を有するであろう標準的な尤度比統計量を使用して、甲状腺癌に対するある対立遺伝子の関連を検定した。保有者頻度よりはむしろ対立遺伝子の頻度が、本文で、マーカーについて提示される。対立遺伝子特異的なORおよび関連するP値は、個体の2つの染色体についての複合モデルを仮定して算出した(Falk CTおよびRubinstein P Ann Hum Genet 51(Pt 3):227−33(1987))。上記3つの症例−対照群の各々について、対照においてはHWEからの有意な偏差はなかった(P>0.3)。複数の症例−対照群からの結果は、マンテル・ヘンツェルモデル(Mantel,NおよびHaenszel,W J Natl Cancer Inst 22:719−48(1959))を使用して合わせた。このモデルでは、群は、対立遺伝子についての異なる集団頻度、および遺伝子型を持つことはできたが、共通の相対リスクを有すると仮定された(Gudmundssonら、Nat Genet 39:977−83(2007)も参照のこと)。
関連性の補正およびゲノム制御。アイスランド人のGWAS群のいくらかの個体は互いに関連し、上述のχ2検定統計量が1より大きい平均を有するということを引き起こした。本発明者らは、ゲノム制御の方法を使用することによって膨張因子を見積もり(Devlin B. Roeder K. Biometrics 55:997−1004(1999)、304,083のχ2統計量の平均を算出した。この方法によれば、膨張因子は1.09であると見積もられた。単一のアッセイの遺伝子型の同定に起因する遺伝子型が同定された症例およびコンピューターで遺伝子型が同定された症例の試料サイズの変化に基づいて、本発明者らは、合わせたアイスランド人の試料の膨張因子を見積もり、1.12であると設定した。合わせたアイスランド人の試料における甲状腺癌との関連についての検定に対するχ2統計量は、これに応じて調整した。
(遺伝子型の同定)
イルミナ(Illumina)による遺伝子型の同定。それぞれ192および37,202のアイスランド人の症例試料および対照試料を、Illumina Sentrix HumanHap300またはHumanCNV370−duo Bead Chips(イルミナ、米国、カルフォルニア州、サンディエゴ)のいずれかを用いてアッセイし、本発明者らの品質管理基準に従って成功裏に遺伝子型を同定した。このチップ上でアッセイしたSNPのうちで、95%未満の収率を有するか、症例および対照の合わせた集団において0.01未満の非常に低い対立遺伝子頻度を有しているか、または単形性であるSNPは、この分析から除いた。さらなる4,632のSNPは、対照において、ハーディ・ワインベルグ平衡からの非常に有意な歪みを示した(p<1×10−3)。合計で、13,420のユニークなSNPをこの研究から除外した。従って、本文に報告された分析は、304,083のSNPを利用している。98%未満のコールレート(call rate)のあるチップのいずれもまた、分析から除去した。
シングルトラックアッセイでのSNP遺伝子型同定。アイスランドおよびスペインからの2つの症例−対照群に対する単一のSNP遺伝子型同定が、ケンタウルス(Centaurus)(ナノゲン(Nanogen))プラットフォームを適用して、アイスランド、レイキャビク(Reykjavik)のディコーデジェネティクス(deCODE genetics)によって実施された(Kutyavin,IVら、Nucleic Acids Res 34:e128(2006))。各ケンタウルスSNPアッセイの品質は、CEUおよび/またはYRI HapMap試料における各アッセイの遺伝子型を同定して、その結果をHapMapの公的に発表されたデータと比較することにより、評価された。1.5%を超えるミスマッチ率を有するアッセイは使用せず、LDであることが既知のマーカーについては連鎖不平衡(LD)試験を使用した。本発明者らは、イルミナ Hap300チップおよびケンタウルス・シングルトラックSNPアッセイの両方を使用して330の個体の遺伝子型を同定し、0.5%未満のミスマッチ率を観察した。
オハイオの研究集団由来の試料の遺伝子型の同定は、以前の記載のように(He H.ら、Thyroid 15:660−667(2005))、SNaPshot(ピーイー・アプライドバイオシステムズ(PE Applied Biosystems)、カリフォルニア州、フォスターシティー(Foster City))遺伝子型同定プラットフォームを使用して、オハイオ州立大学で行った。
(TSH、遊離T4および遊離T3の測定)
内科に特化したクリニックであるアイスランド医療センター(the Iceland Medical Center)(Laeknasetrid)で1997年〜2008年の間に医師の診察を受けたアイスランド人に対して、TSH、遊離T4および遊離T3のレベルを測定した。この測定は、アイスランド、レイキャビク、ミョッド(Mjodd)の研究所で行った。特定された範囲外の測定値は、捨てた。対数変換された測定値を、一般化された加法モデルを使用して、性別および測定時の年齢について調整した。単一の個体に対して複数の測定値が利用可能である場合は、あとの分析では対数調整された測定値の平均を使用した。年齢および性別で調整した対数変換された測定値を、古典的な直線回帰を使用して、対立遺伝子数に対して回帰した。