甲状腺病変の正確な診断のための探索における努力の積み重ねにもかかわらず、多数の技術的問題が未だ解決のめどが立たないままである。得られた物質の品質の結果により、穿刺吸引(FNA)サンプルでの甲状腺病変の診断は今なお困難を伴う。このサンプルにおける少数の細胞、血液の量、甲状腺腫瘍細胞と非甲状腺腫瘍細胞との比により、決定的な結果をもたらし得るのに十分な物質を抽出することは困難である。
本発明は、悪性の甲状腺腫瘍と良性の甲状腺腫瘍とを判別し、甲状腺腫瘍の特定の亜型を更に判別する、敏感な、特異的な及び正確な方法を提供する。甲状腺腫瘍の様々な亜型の判別は、最良の及び最適な処置を患者に施すのに必須である。本発明は、甲状腺腫瘍の分類及び診断の分野で現在利用可能な技法を著しく改善させる。
本発明者らは、FNA生検により得られた甲状腺の臨床サンプルにおけるマイクロRNA発現のプロファイリング及びキャラクタライジングにより、甲状腺病変の分類用の統合プラットフォームを開発しており、マイクロRNAのプロファイリングにより、このサンプル中の少数の細胞及びこのサンプル中の血液の量等の障害も克服している。この技術的プラットフォームを甲状腺結節の術前管理での補助ツールとして適用し、甲状腺病変を良性新生物又は悪性新生物へと分類し、甲状腺腫瘍の亜型を更に分類する。本発明者らは、マイクロRNAプロファイリングに基づいて特定のアルゴリズムを実行することにより、準最適なサンプルを除去するためのステップを統合しつつ、良性甲状腺病変及び悪性甲状腺病変の並びに甲状腺がん及び濾胞性病変の具体的な亜型の分類方法を例外的に開発している。本法は全体のプロトコルの一部であり、このプロトコルでは、患者から追加の物質を生成する又は採取する必要なく、FNAサンプル由来の塗抹標本を有する既存の又は利用可能な臨床的で細胞学的なスライドを使用することができる。
本方法は、細胞学的サンプルからのRNA物質の微量なマイクロRNAの分析を更に組み入れる。FNAサンプルを採取すると、物質を1回から複数回通過させて物質をスライド上に塗抹する。現在利用可能な方法では通常、分析に十分な物質を有するために、複数回通過させることが必要である。本発明者らは、1回のみのFNAスライドであってもマイクロRNA検出に十分な物質が提供される方法を開発した。更に、本発明者らは、0.1cm程の小さい甲状腺結節から得たFNAサンプル中で豊富なマイクロRNAを測定することもできた。このことは、甲状腺病変の約50%が1cmよりも小さいということを考慮すると特に関係がある[Jung他(2014)J Clin Endocrinol Metab 99:E276〜E285]。加えて、本発明者らが開発した方法により、50個の細胞を有するサンプル、最大で120個の細胞を有するサンプル及びより多くを有するサンプル等の、ごく少量の細胞を有するサンプルの分析が可能となる。
本方法は、甲状腺細胞を欠くサンプル及び/又は血液細胞等の非甲状腺細胞が大きな比率を占めるサンプルを除去する又は不適格にするステップを含む。
本発明者らは、配列番号1〜308で示されるマイクロRNAの発現のプロファイリングにより、甲状腺病変に対して固有のマイクロRNA発現シグネチャーを同定している。
より具体的には、本発明者らは、一連のマイクロRNAの発現レベルに基づいて、甲状腺臨床サンプルの分類用のプラットフォームを開発しており、この一連のマイクロRNAは少なくとも2種のマイクロRNAを含み、この2種のマイクロRNAは、hsa−miR−31−5p(配列番号5〜7)、hsa−miR−424−3p(配列番号16)、hsa−miR−222−3p(配列番号1〜2)、hsa−miR−146b−5p(配列番号10〜11)、hsa−miR−346(配列番号14)、MID−16582(配列番号25)、hsa−miR−342−3p(配列番号17〜18)、hsa−miR−181c−5p(配列番号15)、hsa−miR−125b−5p(配列番号9)、hsa−miR−375(配列番号8)、hsa−miR−486−5p(配列番号22)、hsa−miR−551b−3p(配列番号3〜4)、hsa−miR−152−3p(配列番号12〜13)、hsa−miR−200c−3p(配列番号23〜24)及びhsa−miR−138−5p(配列番号19〜21)又はこれらと少なくとも80%同一、少なくとも85%同一若しくは少なくとも90%同一の配列からなる群から選択される。このプラットフォームは、頑強なコホート(robust cohort)によるトレーニング研究に基づいて確立されており、正規化器としての役割を果たす追加のマイクロRNAの測定も含んだ。
本発明は、FNA検体が細胞病理学において決定的ではない結果を示し(通常は「未確定」と称される)、BethesdaカテゴリーIII IV及びVに分類された甲状腺病変サンプルを含むケースの25%に特に有用である。現在の医療行為では、このカテゴリーに含まれる検体を有する患者には、反復FNA手順並びに外科手術(肺葉切除及び甲状腺摘出等)が行なわれる。
そのため、一実施形態では、本発明は、「未確定」ケースに該当し、Bethesda System(本明細書で更に説明する)のカテゴリーIII、IV及びVに分類される甲状腺病変サンプルの分類方法を提供する。特定の一実施形態では、本発明は、Bethesda SystemのカテゴリーIVに分類される甲状腺病変サンプルの分類方法を提供し、このカテゴリーIVは「濾胞性腫瘍」又は「濾胞性腫瘍の疑い」に関し、分類するのが最も困難なカテゴリーであることが知られている。
そのため、本発明は、細胞病理学的分析で分類することに失敗した甲状腺病変サンプルを管理するためのプロトコルを主に示す。目的である特定のサンプルは、FNAにより得たサンプルである。一実施形態では、FNAサンプル由来の定常的な塗抹標本を使用する。別の実施形態では、保存溶液中のFNAサンプルを使用することができる。FNAサンプルから全RNAを抽出し、マイクロRNAの発現を測定する。一実施形態では、約2200種のマイクロRNAの発現を測定する。別の実施形態では、配列番号1〜182の配列を含む182種のマイクロRNAの発現を測定する。更なる実施形態では、配列番号1〜37の配列を含むマイクロRNAの発現を測定する。別の更なる実施形態では、hsa−miR−31−5p(配列番号5〜7)、hsa−miR−424−3p(配列番号16)、hsa−miR−222−3p(配列番号1〜2)、hsa−miR−146b−5p(配列番号10〜11)、hsa−miR−346(配列番号14)、MID−16582(配列番号25)、hsa−miR−342−3p(配列番号17〜18)、hsa−miR−181c−5p(配列番号15)、hsa−miR−125b−5p(配列番号9)、hsa−miR−375(配列番号8)、hsa−miR−486−5p(配列番号22)、hsa−miR−551b−3p(配列番号3〜4)、hsa−miR−152−3p(配列番号12〜13)、hsa−miR−200c−3p(配列番号23〜24)及びhsa−miR−138−5p(配列番号19〜21)又はこれらと少なくとも80%同一、少なくとも85%同一若しくは少なくとも90%同一の配列から選択される群からの少なくとも3種の、少なくとも4種、少なくとも5種、少なくとも6種、少なくとも7種、少なくとも8種、少なくとも9種、少なくとも10種、少なくとも11種、少なくとも12種、少なくとも13種、少なくとも14種若しくは全てのマイクロRNAを測定し、分類で使用する。
更なる実施形態では、甲状腺サンプルの悪性又は良性への分類は、hsa−miR−222−3p(配列番号1〜2)、hsa−miR−551b−3p(配列番号3〜4)、hsa−miR−31−5p(配列番号5〜7)、hsa−miR−375(配列番号8)、hsa−miR−125b−5p(配列番号9)、hsa−miR−146b−5p(配列番号10〜11)、hsa−miR−152−3p(配列番号12〜13)、hsa−miR−346(配列番号14)、hsa−miR−181c−5p(配列番号15)、hsa−miR−424−3p(配列番号16)、hsa−miR−342−3p(配列番号17〜18)、hsa−miR−138−5p(配列番号19〜21)、hsa−miR−486−5p(配列番号22)、hsa−miR−200c−3p(配列番号23〜24)、MID−16582(配列番号25)又はこれらの組合せ又はこれらと少なくとも80%同一、少なくとも85%同一若しくは少なくとも90%同一の配列の発現レベルを測定することを含み、この発現レベルを、サンプルを分析して悪性又は良性に分類する分類器に提供する。
そのため、本発明は、必要とする対象において悪性の甲状腺腫瘍病変と良性の甲状腺腫瘍病変とを判別する方法であって、前記対象から甲状腺腫瘍病変サンプルを得ること、又は前記対象から得た生体サンプルの場合には、ハイブリダイゼーションにより又は増幅により、配列番号1〜25又はこれらと少なくとも80%同一、少なくとも85%同一若しくは少なくとも90%同一の配列を含む1種若しくは複数種の又は少なくとも4種のマイクロRNA又は前記マイクロRNAの任意の組合せの前記サンプル中での発現プロファイルを決定すること、分類器アルゴリズムを使用することにより、前記発現プロファイルを参照閾値と比較すること、及び甲状腺病変が悪性であるか良性であるかを決定することを含む方法を提供する。特定の一実施形態では、本発明の方法は、悪性の又は良性の甲状腺腫瘍病変の亜型を判別することを目的とする。
一実施形態では、本発明の方法は、配列番号1〜25を含むマイクロRNAのうちの少なくとも4種の発現を測定すること、前記サンプルのマイクロRNA発現プロファイル値を得ること、及び分類器を使用して、前記値に基づいて甲状腺病原が悪性であるか良性であるかを確立することを含み、任意選択で、サンプルを悪性の亜型又は良性の亜型の一方に分類することを更に含む。
特定の一実施形態では、前記ハイブリダイゼーションにより発現プロファイルを決定することは、サンプルと、配列番号1〜25それぞれに又はこれらと少なくとも80同一、少なくとも85%同一若しくは少なくとも90%同一の配列にハイブリダイズするプローブとを接触させることを含む。別の実施形態では、前記ハイブリダイゼーションにより発現プロファイルを決定することは、サンプルと、配列番号1〜25を含む前記マイクロRNAの少なくとも8個、少なくとも10個、少なくとも12個、少なくとも14個又は少なくとも16個の連続したヌクレオチドとハイブリダイズするプローブとを接触させることを含む。
本発明は、サンプルを悪性若しくは良性に分類する及び/又は前記サンプルを亜型分類する方法であって、サンプル中のマイクロRNAの発現レベルを測定することに加えて、発現プロファイルを得て、任意選択でマイクロRNAの比を算出し、発現データの多段階分析を適用する方法を更に提供する。前記多段階分析は、マイクロRNA発現プロファイル、マイクロRNAの比又はこれらの組合せのうちの少なくとも1つに1種又は複数種のアルゴリズムを同時に又は逐次的に適用することを含む。前記多段階分析は、サンプルの全体的な品質を示すことができる1種又は複数種の単一マイクロRNAレベルの発現を分析することも更に含むことができる。
任意の順序で及び任意の組合せで多段階分析に含まれ得る判断基準の例は、非悪性細胞マーカーの発現、甲状腺腫瘍の具体的な亜型と相関するマイクロRNAの発現等である。そのため、例えば、ある1つのステップでは、サンプルを不適格にする可能性がある場合に、非甲状腺細胞マーカーの発現が、データセット(例えばトレーニングデータセット)で規定された閾値と比べて高いか低いかを調べることができる。別の更なるステップでは、マイクロRNAの発現、又は甲状腺腫瘍亜型と相関するマイクロRNA比を調べることができ、例えば、hsa−miR−342−3p(配列番号17〜18)の発現が、データセット(例えばトレーニングデータセット)で規定された閾値と比較して非常に高い場合に、サンプルを良性と分類することができ、橋本であると更に亜型分類することができる。或いは、hsa−miR−342−3p(配列番号17〜18)の発現が、データセット(例えばトレーニングデータセット)で規定された閾値と比較して非常に高い場合に、甲状腺細胞が不十分であるためにサンプルを不適格にすることができる。別の更に任意選択のステップは、MID−16582(配列番号25)の発現のレベルに関連することができ、この発現レベルは、サンプルを廃棄してよいかどうかを決定するために使用され得る、又はMID−16582(配列番号25)が(トレーニングセットで規定された閾値と比較して)高いこれらのサンプルに特異的な分類器を使用して分析される。
本発明の特定の一実施形態では、前記非甲状腺細胞マーカーは血液細胞マーカーである。
本発明の別の特定の実施形態では、前記細胞マーカーは上皮細胞マーカーである。
本発明の更に特定の実施形態では、前記細胞マーカーは、血液細胞マーカー、白血球マーカー又は上皮細胞マーカーである。血液細胞マーカーの例は、hsa−miR−486−5p(配列番号22)、hsa−miR−320a(配列番号173)、hsa−miR−106a−5p(配列番号150)、hsa−miR−93−5p(配列番号182)、hsa−miR−17−3p(配列番号160)、hsa−let−7d−5p(配列番号144)、hsa−miR−107(配列番号152)、hsa−miR−103a−3p(配列番号149)、hsa−miR−17−5p(配列番号161)、hsa−miR−191−5p(配列番号163)、hsa−miR−25−3p(配列番号167)、hsa−miR−106b−5p(配列番号151)、hsa−miR−20a−5p(配列番号166)、hsa−miR−18a−5p(配列番号40)、hsa−miR−144−3p(配列番号154)、hsa−miR−140−3p(配列番号51)、hsa−miR−15b−5p(配列番号157)、hsa−miR−16−5p(配列番号159)、hsa−miR−92a−3p(配列番号181)、hsa−miR−484(配列番号179)、hsa−miR−151a−5p(配列番号156)、hsa−let−7f−5p(配列番号、hsa−let−7a−5p(配列番号141)、hsa−let−7c−5p(配列番号143)、hsa−let−7b−5p(配列番号142)、hsa−let−7g−5p(配列番号146)、hsa−let−7i−5p(配列番号147)、hsa−miR−185−5p(配列番号162)、hsa−miR−30d−5p(配列番号172)、hsa−miR−30b−5p(配列番号170)、hsa−miR−30c−5p(配列番号171)、hsa−miR−19b−3p、hsa−miR−26a−5p(配列番号168)、hsa−miR−26b−5p(配列番号169)、hsa−miR−425−5p(配列番号176)、MID−19433(配列番号133)及びhsa−miR−4306(配列番号177)である。白血球マーカーの例は、hsa−miR−342−3p(配列番号17〜18)、hsa−miR−146a−5p及びhsa−miR−150a−5p(配列番号59)である。上皮マーカーの例は、hsa−miR−200c−3p(配列番号23〜24)、hsa−miR−138−5p(配列番号19〜21)、hsa−miR−3648(配列番号174)、hsa−miR−125b−5p(配列番号9)、hsa−miR−125a−5p(配列番号153)、hsa−miR−192−3p(配列番号164)、hsa−miR−4324(配列番号178)、hsa−miR−376a−3p(配列番号175)である。
本明細書で言及する場合、前記マイクロRNA比は、1対のマイクロRNAの正規化発現レベル間の比であり、一方のマイクロRNAの正規化発現レベルは分子として使用され、他方のマイクロRNAの正規化発現レベルは分母である。
別の特定の実施形態では、前記発現プロファイルを決定することは、サンプルとRT−PCR試薬(実施例において本明細書で例示されたフォワードプライマー及びリバースプライマーを含む)とを接触させること、及びRT−PCR産物を生成することを含む。
更に特定の実施形態では、前記方法は、実施例において本明細書で例示したように、RT−PCR産物と特定の若しくは一般的なプローブ又はこれらの組合せとを接触させること、PCR産物を検出すること及び測定することを含む。
更なる実施形態では、前記発現プロファイルを決定することは、マイクロアレイ等を使用して、ハイブリダイゼーションによりマイクロRNA発現を測定することを含む。別の更なる実施形態では、前記発現プロファイルを決定することは、次世代シークエンシングによりマイクロRNA発現を測定することを含む。
別の実施形態では、前記方法は、正規化器として使用する少なくとも1種のマイクロRNAの発現プロファイルを決定することを任意選択で更に含む。一実施形態では、表1に記載の任意のマイクロRNAを正規化器として使用することができる。特定の一実施形態では、配列番号26〜37又はこれらと少なくとも80%同一、85%同一、90%同一若しくは95%同一の配列を含むマイクロRNAのうちのいずれかを正規化器として使用する。
本発明者らは驚いたことに、本明細書で定義された及び例示された様々なカテゴリーからの多くのマーカーを使用する場合に、甲状腺腫瘍サンプルの分類が改善されることを発見した。前記マーカーは、悪性マーカー、二次マーカー及び細胞型マーカー又はこれらの任意の組合せのうちのいずれか1つであることができ、配列番号1〜25又はこれらと少なくとも80%同一、85%同一、90%同一若しくは95%同一の配列を含む。本発明の方法を実施するために、フルセットのマーカーを使用することができる。或いは、悪性マーカー、二次マーカー及び細胞型マーカーの任意の組合せを使用することができる。そのため、本方法は、少なくとも1種の悪性マーカーを、少なくとも1種の二次マーカー及び/又は少なくとも1種の細胞型マーカーと共に含むことができる。
データの分析に応じて、各細胞型マーカーを生シグナル又は正規化シグナルの形で使用することができる。或いは、サンプルが、分類を実施するのに十分な関連物質を有するかどうかを決定するために、又はサンプルを廃棄すべきであるかどうかを決定するために、細胞型マーカーを、分類の実施前に予備試験として使用することができる。更に別の選択肢は、細胞型マーカーを、この細胞型マーカーのシグナルが分類器により使用される最終分類器の一部として使用することである。更なる選択肢は、細胞型マーカーを、分類器により任意選択で使用されるmiR比の基準として使用することである。例えば、悪性マーカー又は二次マーカーの発現レベルを細胞型マーカーの発現レベルで除算することができ、結果として生じるmiR比を分類器で使用する。
そのため、必要とする対象において悪性の甲状腺腫瘍病変と良性の甲状腺腫瘍病変とを判別する方法の更なる実施形態では、前記分類器は、単一分類器、多段階分類器、全ての悪性マーカーを使用する分類器、一部の悪性マーカーを使用する分類器、全ての悪性マーカー及び二次マーカーを使用する分類器、一部の悪性マーカー及び一部の二次マーカーを使用する分類器、全ての悪性マーカー及び二次マーカー及び細胞型マーカーを使用する分類器、全ての悪性マーカーの一部及び二次マーカー及び細胞型マーカーを利用する分類器、全ての又は一部の悪性マーカー及び全ての又は一部の細胞型マーカーを使用する分類器のうちのいずれか1つであることができる。
本発明の方法又はプロトコルの別の更なる実施形態では、アルゴリズム分類器からの結果と、分析される甲状腺サンプルに利用可能な追加の臨床データ又は分子データとを更に組み合わせることにより、分類の性能を改善することができる。利用可能な追加のデータを甲状腺病変(例えば小結節のサイズ、小結節の数)に関連付けることができ、この追加のデータは、サンプルを得た対象に利用可能なその他の臨床情報(例えば、その他の分子マーカー、遺伝子マーカーの発現のような分子試験結果、生化学的試験結果、血液試験結果、尿試験結果、再発、予後結果、家族歴、患者の病歴等)に関連することができる。組み合わせることもできるその他のデータは、甲状腺遺伝子データ、例えば変異分析、遺伝子融合、染色体再配置、遺伝子発現、タンパク質発現等である。
治療指標は、本発明の方法又はプロトコルで得た診断に従って異なることができる。典型的には、甲状腺がん患者に施され得る下記の5種の治療が存在する:外科手術、放射線療法、化学療法、甲状腺ホルモン療法及び標的療法。
外科手術は甲状腺がんの最も一般的な処置である。下記の手順のうちの1つを使用することができる。
− 肺葉切除:甲状腺がんが発見されている小葉の切除。この領域でのリンパ節の生検を行なって、このリンパ節ががんを含むかどうかを確認することができる。
− 甲状腺准全摘:甲状腺の極一部を除いた全ての除去。
− 甲状腺全摘:全甲状腺の除去。
− リンパ節切除:がんを含む頸部でのリンパ節の除去。
甲状腺摘除術は、下記を含むいくつかの潜在的な合併症又は後遺症を有する外科的手順である:声の一時的な又は永続的な変化、一時的な又は永続的な低カルシウム、生涯にわたる甲状腺ホルモン補充の必要性、出血、感染、及び両側性声帯麻痺に起因する気道閉塞の極わずかな可能性。従って、甲状腺の不必要な除去を予防するであろう正確な診断が非常に望ましい。
放射線療法は、高エネルギーX線又はその他の種類の放射線を使用して、がん細胞を除去する、又はこのがん細胞の増殖を抑制する。放射線療法には2種類が存在する。外部放射線療法は、体外の機械を使用して、がんに放射線を放出する。内部放射線療法は、がんの中に直接留置される又はがんの近くに留置される針、シード、ワイヤ又はカテーテルに密封された放射性物質を使用する。最適な放射線療法を、甲状腺がんの種類及びステージによって決めることができる。放射線療法は、うまく除去されなかったがん細胞を除去するための外科手術に対する補助であることができる。濾胞性甲状腺がん及び甲状腺乳頭がんを放射性ヨード(RAI)療法で処置することができる。RAIを経口投与し、RAIは任意の残余の甲状腺組織中に集まり、この甲状腺組織として、身体中のその他の場所に転移している甲状腺がん細胞が挙げられる。甲状腺組織のみがヨウ素を取り込むことから、RAIは、その他の組織を傷つけることなく甲状腺組織及び甲状腺がん細胞を破壊する。完全処置用量のRAIを投与する前に、少量の時化用量を投与して、腫瘍がヨウ素を取り込むかどうかを確認する。
化学療法は、甲状腺がん処置の別の選択肢である。化学療法を、経口で、静脈内注射で又は筋肉内注射で投与することができる。化学療法を、全身の代わりに、がん患部に直接投与することもできる。投与の選択を、がんの種類及びステージによって決めることができる。甲状腺がん処置に認可されている薬剤のいくかの例は、アドリアマイシンPFS(ドキソルビシンヒドロクロリド)、アドリアマイシンRDF(ドキソルビシンヒドロクロリド)、カボザンチニブ−2−マラート、カプレルサ(バンデタニブ)、コメトリック(カボザンチニブ−S−マラート)、ドキソルビシンヒドロクロリド、ネクサバール(ソラフェニブトシラート)、ソラフェニブトシラート及びバンデタニブである。
甲状腺ホルモン療法は、ホルモンを除去する又はホルモンの作用を遮断する及びがん細胞の増殖を抑制する、がんの処置である。甲状腺がんの処置では、甲状腺刺激ホルモン(TSH)により甲状腺がんの成長又は再発が誘発されることになるのを避けるために、薬剤を投与して甲状腺刺激ホルモン(TSH)の産生を防ぐことができる。
また、甲状腺がんの処置は甲状腺細胞を特異的に標的とすることから、甲状腺は甲状腺ホルモンを十分に作ることができない。患者には甲状腺ホルモン補充錠剤が投与される。
標的療法は、正常な細胞を傷つけることなくがん細胞を特異的に同定して攻撃するための薬剤又はその他の物質を使用する。チロシンキナーゼ阻害剤(TKI)療法は、甲状腺がん細胞中でのシグナル伝達を遮断し、甲状腺がん細胞の成長を抑制する。バンデタニブは、甲状腺がんを処置するために使用されるTKIである。
任意の治療の薬用量及び持続期間を、患者の個々の評価及び医療提供者に既知の標準的技法によって決めることができる。処置の持続時間は、医薬品又は医薬組成物の用量が投与される期間である。
甲状腺腫瘍の同定及び識別(最初に良性又は悪性として、続いて差次的に発現されたマイクロRNAの分析による様々な亜型への分類)は、亜型間の生物学的差異への手掛かり(分岐している個体発生的プロセス及び型特異的な標的療法への新たな標的の可能性)を更に提供することができる。
本発明は、本明細書に記載の特定のマイクロRNA分子のレベルを比較することにより、甲状腺がんを検出するための、診断するための、モニタリングするための、ステージ分類するための及び予知するための診断アッセイ及び診断方法(定量的及び定性的の両方)を提供する。そのようなレベルを患者のサンプルで測定し、この患者のサンプルは、生検試料、腫瘍サンプル、細胞、組織及び/又は体液に由来することができる。
そのため、本発明の方法は、悪性甲状腺腫瘍の様々亜型間の識別(そのような型は、濾胞腺癌、乳頭癌、濾胞型乳頭癌(FVPC又はFVPTC)、被包性FVPC(又は被包性FVPTC)、髄様癌、甲状腺未分化がん、低分化甲状腺がんである)及び診断後に続ける治療方針の決定に特に有用である。更なる実施形態では、本発明は、良性甲状腺がんの亜型(例えば濾胞腺腫、橋本甲状腺炎、過形成(甲状腺腫))を分類する方法を提供する。
本発明は、甲状腺がんの処置方法であって、本明細書に記載したように良性甲状腺がん又は悪性甲状腺がんを判別する方法を含み、任意選択で、甲状腺腫瘍型を亜型分類すること、及び本方法により提供される診断に従って処置を施すことを含む方法も提供する。
本発明の全ての方法は、その他のがんマーカーのレベルを測定することを任意選択で更に含むことができる。本発明で有用な前記マイクロRNA分子に加えて、その他のがんマーカーを、試験されている及び当業者に既知であるがんによって決めることができる。
患者に由来するサンプル中での本発明の核酸配列等の遺伝子発現のレベルを決定するために使用され得るアッセイ技法は当業者に公知である。そのようなアッセイ方法として、ラジオイムノアッセイ、逆転写PCR(RT−PCR)アッセイ、免疫組織化学アッセイ、in situハイブリダイゼーションアッセイ、競合結合アッセイ、ノーザンブロット分析、RLISAアッセイ、核酸マイクロアレイ及びバイオチップ分析が挙げられるがこれらに限定されない。
1種又は複数種の核酸配列の発現レベルに関する任意の閾値を、サンプル又は腫瘍サンプルを1つ又は2つの群に割り当てるために設定することができる。或いは、好ましい実施形態では、2種の核酸配列の発現レベルの比を取ることにより、及び/又は既に測定されたサンプル若しくは閾値とその後に比較される測定基準を定義するためのロジスティック回帰等の方法により、本発明の1種又は複数種の核酸配列の発現レベルを組み合わせることができる。割り当て用の閾値はパラメーターとして扱われ、サンプルが各クラスに割り当てられる信頼度を定量化するために使用され得る。割り当て用の閾値を、臨床シナリオに応じて感度又は特異度を支持するために調整することができる。参照データとの相関値から、調整され得る連続スコアが生成される、及びサンプルが甲状腺亜型のある特定のクラスに属する可能性についての診断情報が提供される。多変量解析では、マイクロRNAシグネチャーは高レベルの予後情報を提供する。
本発明はまた、新規のマイクロRNA分子も提供し、この新規のマイクロRNA分子は、配列番号27〜29、配列番号33、配列番号34、配列番号139、配列番号140、配列番号307及び配列番号308で示される核酸を含む。配列番号27〜29、配列番号33、配列番号34、配列番号139、配列番号140、配列番号307及び配列番号308のうちのいずれか1つに対応するcDNA(相補配列)及び抗miRも本発明に包含されることを理解しなければならない。
更に、本出願は、本明細書に記載のマイクロRNAを含む組成物、製剤及び薬剤を提供する。特定の一実施形態では、本発明は、配列番号27〜29、配列番号33、配列番号34、配列番号139、配列番号140、配列番号307及び配列番号308のうちのいずれか1つ、そのバリアント、又はそれと少なくとも80%同一、少なくとも85%同一若しくは少なくとも90%同一の配列を含むマイクロRNAを有効作用物質として含む組成物、製剤及び薬剤を提供する。前記組成物、製剤及び薬剤は、アジュバント、担体、賦形剤及び添加剤のうちのいずれか1つを任意選択で更に含むことができる。本明細書に記載のマイクロRNAを、適切な薬学的に許容される担体又は賦形剤と組み合わせて、組成物、製剤及び製剤に配合することができ、(錠剤、カプセル、粉末、顆粒、軟膏、液剤、坐薬、注射剤、吸入剤及びエアロゾル等の)固体状、半固体状、液状又は気体状の調製品に配合することができる。従って、マイクロRNA又はこのマイクロRNAを含む医薬組成物の投与を様々な方法で達成することができ、この方法として、経口、口腔、直腸、非経口、腹腔内、皮内、経皮、気管内等が挙げられる。
ある特定の実施形態では、本発明の医薬組成物は、本発明の1種又は複数種の核酸と、1種又は複数種の添加剤とを含む。ある特定のそのような実施形態では、添加剤は、水、塩類溶液、アルコール、ポリエチレングリコール、ゼラチン、ラクトース、アミラーゼ、ステアリン酸マグネシウム、タルク、ケイ酸、粘性パラフィン、ヒドロキシメチルセルロース及びポリビニルピロリドンから選択される。
ある特定の実施形態では、本発明の医薬組成物を既知の技法を使用して調製し、この技法として、混合プロセス、溶解プロセス、造粒プロセス、糖衣錠製造プロセス、湿式粉砕プロセス、乳化プロセス、カプセル化プロセス、封入プロセス又は錠剤化プロセスが挙げられるがこれらに限定されない。医薬組成物の調製方法を文献中に見出すことができ、例えば、Gennaro,A.R.(2000)Remington:The Science and Practice of Pharmacy、第20版中に見出すことができる。
ある特定の実施形態では、本発明の医薬組成物は液体(例えば懸濁液、エリキシル剤及び/又は溶液)である。ある特定のそのような実施形態では、液体医薬組成物を、当分野で既知の成分を使用して調製し、この成分として、水、グリコール、油、アルコール、香味料、防腐剤及び着色剤が挙げられるがこれらに限定されない。
ある特定の実施形態では、本発明の医薬組成物は固体(例えば粉末、錠剤及び/又はカプセル)である。ある特定のそのような実施形態では、本発明の1種又は複数種の核酸を含む固体医薬組成物を、当分野で既知の成分を使用して調製し、この成分として、デンプン、糖、賦形剤、造粒剤、潤滑剤、結合剤及び崩壊剤が挙げられるがこれらに限定されない。
更に、本出願は、本明細書で開示された化合物(核酸)を含むベクター及びプローブを提供する。特定の一実施形態では、本出願は、配列番号27〜29、配列番号33、配列番号34、配列番号139、配列番号140、配列番号307及び配列番号308又はそのバリアント又はそれと少なくとも80%同一、少なくとも85%同一若しくは少なくとも90%同一の配列で示される核酸を含むベクター及びプローブを提供する。
本明細書で使用する用語は特定の実施形態を説明することのみを目的とし、限定するように意図されていないことを理解しなければならない。明細書及び添付した特許請求の範囲で使用する場合、別途文脈が明確に指示しない限り、単数形「a」、「an」、「the」は複数の指示対象を含むことに留意すべきである。
本明細書での数値範囲の列挙の場合、同程度の精度で間に介在する数字が明確に予期される。例えば6〜9の範囲の場合、6及び9に加えて数字7及び8が予期され、範囲6.0〜7.0の場合、例えば数字6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9及び7.0が明確に予期される。
本明細書で使用する場合、用語「異常な増殖」は、正常な、適切な又は予想される経過から逸脱する細胞増殖を意味する。異常な細胞増殖として、特徴が、不適切な高レベルの細胞分裂、不適切な低レベルのアポトーシス又は両方により引き起こされる、媒介される、又はこれらを生じる徴候と関連する細胞増殖を挙げることができる。そのような徴候を、がん性か非がん性かにかかわらず、即ち良性か悪性かにかかわらず、例えば細胞、細胞群又は組織の単発性の又は多発性の局所的な異常増殖で特徴付けることができる。異常な増殖は、がんの主要な特徴の1つである。
本明細書で使用する場合、用語「約」は+/−10%を意味する。
「付着した」又は「固定された」は、本明細書においてプローブ及び固体支持体に言及するために使用する場合、プローブ及び固体支持体の間の結合が、結合、洗浄、分析及び除去の条件下で十分に安定であることを意味する。この結合は共有結合でもよいし非共有結合でもよい。プローブと固体支持体との間に共有結合を直接作ることができる、又は架橋剤により又は固体支持体上での若しくはプローブ上での若しくは両方の分子上での特定の反応基の包含により共有結合を作ることができる。非共有結合は、静電気的相互作用、親水性相互作用及び疎水性相互作用のうちの1つ又は複数であることができる。非共有結合に含まれるのは、ストレプトアビジン等の分子の支持体への共有結合性の付着、及びビオチン化プローブのストレプトアビジンへの非共有結合である。固定化には、共有結合性相互作用及び非共有結合性相互作用の組合せも含まれ得る。
「生体サンプル」又は「サンプル」は本明細書で使用する場合、核酸を含み、特にマイクロRNAを含む生体組織又は体液のサンプルを意味する。そのようなサンプルとして、対象から単離した組織又は液体が挙げられるがこれらに限定されない。生体サンプルとして組織の切片も挙げられ、例えば、生検サンプル及び部検サンプル、穿刺吸引(FNA)サンプル、組織学的目的のために採取された凍結切片、血液、血液分画、血漿、血清等も挙げられる。生体サンプルを、対象から細胞のサンプルを取り出すことにより得ることができるが、既に単離された細胞(例えば、別人により、別の時間で、及び/又は別の目的のために単離された細胞)を使用することにより達成することもでき、次いで、培養してもよいし培養しなくてもよい。処置歴又は転帰歴(outcome history)を有するもの等の保存組織も使用することができる。
本発明の別の実施形態では、FNA生検試料を塗抹標本として調製する。
用語「分類」は、個々の項目を、この項目に固有の1種又は複数種の特徴(形質、変数、特徴、特性等を称される)についての定量的情報に基づいて、並びに統計モデル及び/又は既に標識された項目のトレーニングセットに基づいて、群又はクラスに配置する手順及び/又はアルゴリズムを意味する。
本明細書で使用する場合、用語「甲状腺腫瘍を分類すること」は、甲状腺組織サンプルの1つ又は複数の性質(例えば、がん組織中で発現されたマイクロRNAの存在、がんになる可能性がある前がん組織中で発現されたマイクロRNAの存在、及び転移する可能性があるがん組織中で発現されたマイクロRNAの存在が挙げられるがこれらに限定されない)の同定を意味する。
用語「分類器」は本明細書で使用する場合、甲状腺腫瘍(若しくは甲状腺病変)を良性若しくは悪性に分類するために、判別するために若しくは同定するために又は甲状腺腫瘍の亜型を分類するために、判別するために若しくは同定するために使用されるアルゴリズムを意味する。任意の研究コホートのサンプルのマイクロRNA発現プロファイルを取得すると、例えばトレーニングコホートから、コホートのサンプル中の全てのマイクロRNAの発現レベルが記憶されているデータベースを作成する。このデータベースはまた、「トレーニングデータ」とも称され、分類に最適なアルゴリズムを選択するために使用される。甲状腺サンプルの分類用アルゴリズムは、核酸比(又はマイクロRNA比)を、単独で又は核酸レベル(若しくはマイクロRNAレベル)と組み合わせて使用することもできる。
一実施形態では、本発明の方法又はプロトコルで使用するアルゴリズムは機械学習アルゴリズムである。機械学習アルゴリズムの例は、判別分析、K最近傍分類器(KNN)、サポートベクターマシン(SUV)分類器、ロジスティック回帰分類器、ニューラルネットワーク分類器、ガウス混合モデル(GMM)、最近傍重心分類器、直線回帰分類器、決定木分類器、及びランダムフォレスト分類器、分類器のアンザンブル、又はこれらの任意の組合せである。
判別分析分類器を使用する場合、判別式は、一次、二次、一次共分散行列の対角線、二次共分散行列の対角線、一次共分散行列の一般逆行列、及び二次共分散行列の一般逆行列のうちのいずれか1つであることができる。KNN分類器を使用する場合、kを変更することができ、距離メトリックはPearson相関、spearman相関、Euclidean距離又はcityblock(Manhattan)距離のいずれかであることができる。SVM分類器を使用する場合、カーネルは、一次、ガウス又は多項式であることができる。アンサンブル法分類器を使用する場合、通常は、分類木、KNN等のアルゴリズムを適用する、又は分析分類器を識別する。ブースティングアルゴリズム又はバギングアルゴリズムのいずれかを使用してアンサンブルを作成することができ、アンサンブルの学習サイクルの数は2から数千の範囲であることができる。
本明細書で使用する場合、「混合行列」は、アルゴリズム(典型的には教師あり学習アルゴリズム)の性能の可視化が可能な特定の表レイアウトを意味する。「混合行列」は、分割表又は誤差行列とも称され得る。
「相補体」又は「相補的」は本明細書で使用する場合、核酸を意味しており、核酸分子のヌクレオチド間の又はヌクレオチド類似体間のWatson−Crick塩基対(例えばA−T/U及びC−G)又はHoogsteen塩基対を意味することができる。完全な相補体又は完全に相補的は、核酸分子のヌクレオチド間の又はヌクレオチド類似体間の100%相補的な塩基対を意味する。一部の実施形態では、相補的配列は逆方向を有する(5’−3’)。本発明はまた、配列番号7〜29、配列番号33、配列番号34、配列番号139及び配列番号140で示される核酸の相補体も提供する。
本明細書で使用する場合「CTシグナル」又は「CT」は、増幅が蛍光の閾値(サイクル閾値)を超えるPCRの最初サイクルを表す。従って、低い値のCTは、マイクロRNAの高い存在量又は発現レベルを表す。一部の実施形態では、PCRのCTシグナルは、正規化されたCTが発現レベルから逆位となるように正規化される。その他の実施形態では、PCRのCTシグナルを正規化し、次いで、低正規化−逆位CTがマイクロRNAの低い存在量又は発現レベルを表すように逆位にすることができる。
本明細書で使用する場合、「データ処理ルーチン」は、1種又は複数種のサンプルに関して得られたデータ(即ち、アッセイ又は分析の最終的な結果)の生物学的意義を決定するソフトウェア中に具体化され得るプロセスを意味する。例えば、データ処理ルーチンは、収集されたデータに基づいて、サンプルが採取された若しくは得られた甲状腺病変が良性か悪性かの決定又は具体的な亜型の決定を下すことができる。本明細書のシステム及び方法では、データ処理ルーチンは、決定された結果に基づいてデータ収集ルーチンを制御することもできる。データ処理ルーチン及びデータ収集ルーチンを統合することができ、これらのルーチンは、データ収集を操作するためのフィードバックを提供し、従ってアッセベースの判定方法を提供する。
「検出」は、サンプル中における、ある成分の存在を検出することを意味する。検出はまた、ある成分の非存在を検出することも意味する。検出はまた、定量的に又は定性的のいずれかで、ある成分のレベルを決定することも意味する。
「差次的発現」又は「発現レベルの差異」は、甲状腺サンプル中におけるマイクロRNA発現パターンの定性的な又は定量的な差異を意味する。そのため、差次的に発現されたマイクロRNAは、例えば正常な甲状腺組織対病的な甲状腺組織において、このマイクロRNAの発現が定性的に変更(活性化又は不活性化等)され得る。定性的に制御されたマイクロRNAは、標準的な技法により検出可能である甲状腺サンプル内の又は細胞型内の発現パターンを示すことができる。一部のマイクロRNAは、ある甲状腺サンプル中で若しくはある細胞型中で発現され得るが、その他では発現され得ない、又は様々な細胞型若しくは様々なサンプルの間で異なるレベルで発現され得る。そのため、例えば、発現が調節される、上方制御される(その結果、マイクロRNAの量が増加する)又は下方制御される(その結果、マイクロRNAの量が低下する)という点で、発現の差異は定量的であることができる。発現が異なる程度は、発現アレイ、次世代シークエンシング(NGS)、定量的逆転写PCR、ノーザンブロット分析、リアルタイムPCR、in situハイブリダイゼーション及びRNase保護等の標準的なキャラクタリゼーション技法により定量化するのに十分な大きさであることのみを必要とする。
用語「発現プロファイル」は、遺伝子発現プロファイル及び例えばマイクロRNAの発現プロファイルを含むように広く使用される。本明細書で使用する場合、発現プロファイルは、核酸(又はマイクロRNA)発現に関して得られたデータのセットを意味する。発現プロファイルは、生データ又は正規化された発現値を意味することができる。核酸配列のレベルを測定するのに便利な任意の手段により、例えば、マイクロRNA、標識が付されたマイクロRNA、増幅されたマイクロRNA、cDNA等の定量的ハイブリダイゼーション、定量的PCR等により、発現プロファイルを作成することができる。核酸配列レベルを測定することに加えて、得られたデータを正規化することができ、データの正規化を本出願の他の箇所で論じている。発現プロファイルにより、2種以上のサンプル間の及びサンプルと閾値との間の差次的な遺伝子発現の分析が可能になる。更に、サンプルに関する情報(例えば分類、診断、サンプルの亜型分類等)を得るために、分類器を発現プロファイルに適用することができる。目的の核酸配列は、予測的であることが分かる核酸配列であり、本明細書において表1に記載の核酸配列を含み、発現プロファイルは、列挙された核酸配列のうちの5種、10種、20種、25種、50種、100種又はより多く(列挙された核酸配列の全て等)の発現データを含むことができる。一部の実施形態によれば、用語「発現プロファイル」は、測定されたサンプル中における核酸配列の存在量を測定することを意味する。ある具体的な実施形態では、各甲状腺サンプル中でマイクロRNA発現プロファイルをキャラクタライズする。
「発現比」は本明細書で使用する場合、甲状腺サンプル等の生体サンプル中の対応する核酸の相対的な発現レベルを検出することにより決定される、2種以上の核酸(即ちマイクロRNA)の相対的な発現レベルを意味する。マイクロRNA発現レベルはCT(対数スケールで得られる)として表されることから、実際には、発現比は除算ではなくCTの減算により得られる。
本明細書で使用する場合、「FDR」又は「偽発見率」は、多重比較を補正するために多重仮説検定で使用される統計的方法である。例えば、複数のデータの特徴での2つの群の間のシグナルの比較において、多重の統計的検定を実施する場合、普通は統計的に有意と見なされるはずのレベルに達することができる群の間のランダムな差異により、偽陽性の結果を得る可能性がますます高くなる。そのような偽発見の割合を制限するために、統計的有意性は、差異が閾値未満の(両側t検定による)p値に達したデータの特徴に関してのみ定義され、閾値は、実施された検定の数及びこれらの検定で得られたp値の分布によって決まる。
本明細書で使用する場合、「FNA」は「穿刺吸引」を意味する。穿刺吸引生検(FNAB、FNA若しくはNAB)又は穿刺吸引細胞診(FNAC)は、表在性の(皮膚の真下の)塊(lump)又は塊(mass)を研究するために使用される診断手順であり、甲状腺病変生検に特に有用である。生検試料は、細胞のサンプリングのために薄い中空の針を塊中に挿入することにより採取され、細胞は、染色後に顕微鏡下で調査され得る。吸引液(細胞検体評価、FNAC)又は組織(生検−組織検体評価、FNAB)の細胞診であるかもしれない。FNAは、甲状腺結節に使用される一般的な生検方法である。なぜならば、代わりに針穿刺吸引生検を実施することにより、大きな外科的(切除又は開口)生検を避けることができるからである。検体の採取及び調製の詳細な説明を、Henryk A.Domanski(2014)による「穿刺吸引細胞診の図譜(Atlas of Fine Needle Aspiration Cytology)」に見出すことができ、この内容は参照により本明細書に援用される。吸引検体の調製は当分野で十分に説明されている。通常、適切な量の吸引物(通常は約1滴)を顕微鏡スライド全体にわたり薄く及び均等に広げ、次いで染色してマウントする。このようにして調製されたFNA検体は「塗抹標本」とも称される。結果は、検体の厚さ及び均一性に関して、切片化組織スライドに適合しなければならない。FNA塗抹標本は通常、空気乾燥(一般に「定常的な空気乾燥FNAB」と称される)又は定着剤として95%エタノール若しくはサイトスプレー(cyto−spray)のいずれかを使用する湿式定着により定着される。その他の適切な液状定着剤は、メタノール、アセトン、イソプロピルアルコール、アセトン/メタノール等である。或いは、FNAサンプルを、チューブ中で防腐剤に添加することができる、又は防腐剤と混合することができる。
本明細書で言及する場合、「濾胞性」病変は、濾胞腺腫(FA)、濾胞腺癌(FC)及び濾胞型乳頭癌(FVPCA)のうちのいずれか1つであることができる。
「断片」は本明細書において、核酸の非完全長部分を示すために使用される。そのため、断片それ自体も核酸である。
「溝結合剤」及び/又は「副溝結合剤(minor groove binder)」(MGB)は本明細書で使用する場合、互換的に使用され得、典型的には配列特異的な様式で二本鎖DNAの副溝に収まる小分子を意味する。副溝結合剤は、三日月のような形状を取ることができる長くて平坦な分子であることができ、そのため、二重らせんの副溝にぴったりと収まり、水と置き換わることが多い。副溝結合剤分子は典型的には、自由にねじれた結合により接続されたいくつかの芳香環、例えばフラン環、ベンゼン環又はピロール環を含むことができる。副溝結合剤は、抗生物質、例えばネトロプシン、ジスタマイシン、ベレニル、ペンタミジン及びその他の芳香ジアミン、Hoechst 33258、SN 6999、オーレオリン抗腫瘍剤、例えばクロモマイシン及びミトラマイシン、CC−1065、ジヒドロシクロピロロインドールトリペプチド(DPI3)、1,2−ジヒドロ−(3H)−ピロロ[3,2−e]インドール−7−カルボキシラート(CDPI3)、並びに関連化合物及び類似体であることができ、化学及び生物学における核酸(Nucleic Acids in Chemistry and Biology)、第2版、Blackburn及びGait編、Oxford University Press、1996並びに国際公開出願第WO03/078450号(これらの内容は参照により本明細書に援用される)に記載されているものが挙げられる。副溝結合剤は、プライマーの成分、プローブ、ハイブリダイゼーションタグ補体又はこれらの組合せであることができる。副溝結合剤は、この副溝結合剤が付着するプライマー又はプローブのTmを増加させ、そのようなプライマー又はプローブが高温で効果的にハイブリダイズするのを可能にする。
「同一の」又は「同一性」は、2種以上の核酸配列と関連して本明細書で使用する場合、指定領域にわたり同じである残基を指定割合で有する配列を意味する。この割合を、2種の配列を最適に整列させ、指定領域にわたり2種の配列を比較し、両方の配列で同一の残基が生じる位置の数を決定して、一致した位置の数を得、一致した位置の数を指定領域中の位置の全数で除算し、結果に100を乗算して配列同一性をの割合を得ることにより算出することができる。2種の配列の長さが異なる場合、又は整列によって1つ若しくは複数のねじれ型末端が生じ、比較の指定領域が単一の配列のみを含む場合、単一の配列の残基は、算出において分母に含まれるが分子には含まれない。DNA配列及びRNA配列を比較する場合、チミン(T)及びウラシル(U)を等価と見なすことができる。同一性を手動で実施することができる、又は例えばBLAST、BLAST2.0等のコンピュータ配列アルゴリズムを使用して実施することができる。
「in situ検出」は本明細書で使用する場合、最初の部位での発現又は発現レベルの検出を意味しており、その結果、生検試料等の組織サンプル中での発現又は発現レベルの検出を意味する。
「標識」は本明細書で使用する場合、分光学的手段、光化学的手段、生化学的手段、免疫化学的手段、化学的手段又はその他の物理的手段により検出可能な組成物を意味する。標識は、タンパク質中に又は核酸中に天然では存在しないあらゆる構成要素であることができ、核酸又はタンパク質を検出可能にする。例えば、有用な標識として、32P、蛍光色素、高電子密度試薬、酵素、ビオチン、ジゴキシゲニン又はヘプタン、及び検出可能にすることができるその他の構成要素等が挙げられる。標識を、任意の位置で核酸及びタンパク質に組み込むことできる。
「ロジスティック回帰」は、一般化線形モデルと呼ばれる統計モデルのカテゴリーの一部である。ロジスティック回帰により、連続、離散、二分又はこれらの任意の混合であることができる変数のセットから群構成員等の離散的な結果を予測することが可能になる。従属変数又は応答変数は二分であることができ、例えば、がんの2種の可能なタイプのうちの一方であることができる。ロジスティック回帰モデルは、(対数空間での)様々な発現レベルの線形組合せとしてのオッズ比の自然対数であり、即ち第2の群に属する確率(1−P)に対する第1の群に属する確率(P)の比の自然対数である。ロジスティック回帰の結果は、Pが0.5又は50%を超える場合に症例又はサンプルが第1のタイプに分類され得ることを規定することにより、分類器として使用され得る。或いは、算出された確率Pは、1Dの又は2Dの閾値分類器等のその他の文脈において変数として使用され得る。
本明細書で使用する場合、用語「事前分布(prior)」は、各クラスの確率(例えば様々なクラスに付与された確率)であり、分類においてサンプルの発現プロファイルに関するいかなる付加的知識なしに、サンプルが悪性又は良性であるという可能性により使用される確率を意味する。事前分布を様々な比率で設定することができ、例えば、80%〜20%の悪性−良性、75%〜25%の悪性−良性、70%〜30%の悪性−良性、65%〜35%の悪性−良性、60%〜40%の悪性−良性、50%〜50%の悪性−良性(即ち均一)で設定することができる。加えて、事前分布は経験的であることができ、即ち、トレーニングコホートでのサンプルの分布に基づくことができる。事前分布を調整して所定の感度又は特異度を達成することができる。
本明細書で使用する場合、「マーカー」は、存在及び潤沢がサンプル中で測定されるマイクロRNA又は核酸配列である。「マーカー」は、サンプルの状態の指標を更に提供する。
本明細書で使用する場合、「悪性マーカー」は、良性サンプルに対して悪性サンプル中においてより高いレベルで存在するマイクロRNA又は核酸配列である。悪性マーカーは試験サンプル中に存在してもよし存在しなくてもよい。
本明細書で使用する場合、「二次マーカー」は、悪性サンプルと良性サンプルとを区別するために使用され、悪性サンプル及び良性サンプルでの前記二次マーカーの発現レベルの差異又は比が悪性マーカーの発現レベルの差異又は比よりも小さいマイクロRNA又は核酸配列である。二次マーカーは試験サンプル中に存在してもよいし存在しなくてもよい。
本明細書で使用する場合、「細胞型マーカー」は、発現がある特定の細胞型と相関するマイクロRNA又は核酸配列を意味する。前記細胞型はサンプル中で概して見出され得、例えば血液細胞、白血球、赤血球、上皮細胞、Hurthle細胞、ミトコンドリアリッチ細胞、リンパ球、濾胞細胞、傍濾胞細胞(C細胞)、転移細胞、免疫細胞、マクロファージ等で一般に見出され得る。「細胞型マーカー」として含まれるその他のマーカーは種特異的マーカーであることができ、例えば細菌、真菌等に由来のマーカーであることができる。
「正規化器」は本明細書で使用する場合、各サンプルを正規化するためにシグナル(即ち発現のレベル)が使用されるマイクロRNA又は核酸配列を意味する。正規化器を、単独で使用することができる(正規化器として1種のマイクロRNAを使用することができる)、又は一連の正規化器の一部として使用することができる(正規化として複数種のマイクロRNAを使用することができ、例えば2種、3種、4種、5種、6種、7種、8種、9種、10種、11種、12種、13種、14種、16種又は17種のマイクロRNAを一連の正規化器として使用することができる)。本明細書で述べたように、サンプル中で検出された任意のマイクロRNAを正規化器として使用することができる。この趣旨で、本明細書において「マーカー」と定義されたマイクロRNAを「正規化器」として使用することもできる。本質的に、あらゆるマイクロRNAを正規化器として使用することができる。この趣旨で、配列番号1〜182のうちのいずれか1つで示されるマイクロRNAを正規化器として使用することができる。配列番号1〜37のうちのいずれか1つで示されるマイクロRNAを正規化器として使用することができる。正規化器として使用され得るマイクロRNAの特定の例は、hsa−miR−23a−3p、MID−20094、MID−50969、hsa−miR−345−5p、hsa−miR−3074−5p、MID−50976、MID−50971、hsa−miR−5701及びhsa−miR−574−3pである。
データ値の「正規化」は、最初のデータ範囲を別のスケールへとマッピングすることを意味する。正規化器のセットの発現の平均を減算し、正規化器のセットの発現の中央値を減算し、(多項式フィットを使用して)正規化器の発現値を値の参照セットにフィットさせ、このフィットを全てのシグナルに適用させることにより、正規化を行なうことができる。全ての正規化器又は正規化器のサブセットを使用することができる。
「核酸」又は「オリゴヌクレオチド」又は「ポリヌクレオチド」は本明細書で使用する場合、互いに共有結合的に連結された少なくとも2個のヌクレオチドを意味する。一本鎖の描写により相補鎖の配列も定義される。そのため、核酸は、描写された一本鎖の相補鎖も包含する。核酸の多くのバリアントを、与えられた核酸と同じ目的で使用することができる。そのため、核酸は、実質的に同一の核酸及びこの核酸の相補体も包含する。一本鎖から、ストリンジェントなハイブリダイゼーション条件下で標的配列にハイブリダイズするプローブを生成することができる。そのため、核酸は、ストリンジェントなハイブリダイゼーション条件下でハイブリダイズするプローブも包含する。
核酸は、一本鎖でもよいし二本鎖でもよい、又は二本鎖配列及び一本鎖配列の両方の一部を含んでもよい。核酸は、DNA(ゲノム及びcDNAの両方)、RNA又はハイブリッドであることができ、ここで、核酸は、デオキシリボヌクレオチド及びリボヌクレオチドの組合せとウラシル、アデニン、チミン、シトシン、グアニン、イノシン、キサンチン、ヒポキサンチン、イソシトシン及びイソグアニンを含む塩基の組合せとを含むことができる。核酸を、化学合成法又は組換え法により得ることができる。
核酸類似体が含まれ得るが、核酸は概してリン酸ジエステル結合を含むであろう。この類似体は、天然には存在しない連結、骨格又はヌクレオチドを含むことができる。この類似体は、少なくとも1つの異なる連結(例えば、ホスホアミダート連結、ホスホロチオアート連結、ホスホロジチオアート連結、又はO−メチルホスホロアミダイト連結)、ペプチド核酸骨格、及びペプチド核酸連結を有することができる。その他の類似体核酸として、陽性骨格;非イオン性骨格、並びにUS5,235,033及びUS5,034,506(これらは参照により本明細書に援用される)に記載されたもの等の非リボース骨格を有するものが挙げられる。1つ又は複数の天然には存在しない又は修飾されたヌクレオチドを含む核酸も核酸の1つの定義に含まれる。修飾されたヌクレオチド類似体は、例えば核酸分子の5’末端及び/又は3’末端に位置することができる。ヌクレオチド類似体の代表例を、糖修飾リボヌクレオチド又は骨格修飾リボヌクレオチドから選択することができる。しかしながら、核酸塩基修飾リボヌクレオチド(即ち、天然に存在する核酸塩基の代わりに、天然には存在しない核酸塩基を含むリボヌクレオチド)、例えば、5位で修飾されたウリジン又はシチジン、例えば5−(2−アミノ)プロピルウリジン、5−ブロモウリジン;8位で修飾されたアデノシン及びグアノシン、例えば8−ブロモグアノシン;デアザヌクレオチド、例えば7−デアザ−アデノシン;O−アルキル化ヌクレオチド及びN−アルキル化ヌクレオチド、例えばN6−メチルアデノシンも適していることに留意すべきである。2’−OH基を、H、OR、R、ハロ、SH、SR、NH2、NHR、NR2又はCN(RはC1〜C6のアルキル、アルケニル若しくはアルキニルであり、ハロはF、Cl、Br若しくはIである)から選択される基で置換することができる。修飾ヌクレオチドとして、例えばKrutzfeldt他(Nature 2005;438:685〜689)、Soutschek他(Nature 2004;432:173〜178)及びWO2005/079397(これらは参照により本明細書に援用される)に記載のヒドロキシピロリノール連結によりコレステロールとコンジュゲートとしたヌクレオチドも挙げられる。リボース−リン酸骨格の修飾を様々な理由により行なうことができ、例えば、生理環境中でのそのような分子の安定性及び半減期を増加させるために、細胞膜をまたぐ拡散を増強するために、又はバイオチップでのプローブとして行なうことができる。骨格修飾により、例えば細胞の厳しいエンドサイトーシス環境中での、分解に対する耐性を増強することもできる。骨格修飾により、例えば肝臓中における及び甲状腺中における、肝細胞による核酸クリアランスを減少させることもできる。天然に存在する核酸と類似体との混合物を作ることもできる。或いは、様々な核酸類似体の混合物、及び天然に存在する核酸と類似体との混合物も作ることができる。
そのため、新規の単離核酸が本明細書で提供される。本明細書で提供される核酸は、天然には存在しない合成された核酸であることができる。そのため、本明細書で提供される核酸は合成核酸であることができる。核酸を合成する方法は当業者に既知であり、例えばUS7,579,451(この内容は参照により本明細書に援用される)に記載されている。この核酸は、配列番号1〜308の配列のうちの少なくとも1つ又はそのバリアントを含むことができる。一実施形態では、この核酸は、配列番号1〜182の配列のうちの少なくとも1つを含む。バリアントは、参照ヌクレオチド配列の相補体であることができる。バリアントは、参照ヌクレオチド配列と70%、75%、80%、85%、90%若しくは95%同一であるヌクレオチド配列又はこの相補体であることができる。バリアントは、参照ヌクレオチド配列にストリンジェントな条件下でハイブリダイズするヌクレオチド配列、このヌクレオチド配列の相補体又はこのヌクレオチド配列と実質的に同一のヌクレオチド配列であることができる。
本明細書に記載の核酸は、約10個から約250個のヌクレオチドの長さを有することができる。この核酸は、少なくとも10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、21個、22個、23個、24個、25個、26個、27個、28個、29個、30個、35個、40個、45個、50個、60個、70個、80個、90個、100個、125個、150個、175個、200個又は250個のヌクレオチドの長さを有することができる。この核酸を合成することができる、又は合成遺伝子を使用して(in vitroで又はin vivoで)細胞中で発現させることができる。この核酸を一本鎖分子として合成し、実質的に相補的な核酸にハイブリダイズさせて二本鎖を形成することができる。この核酸を、一本鎖若しくは二本鎖の形態で細胞、組織又は器官に導入することができる、又はUS6,506,559(この内容は参照により本明細書に援用される)に記載された方法等の当業者に公知の方法を使用して合成遺伝子により発現させることができる。
この核酸は、表1に示すマイクロRNA配列又はこのマイクロRNA配列のバリアントを含むことができる。一部の例では、同じマイクロRNAのバリアントも表1に示す。表1の配列番号1〜180が、天然に存在するマイクロRNAの配列に対応するcDNAを示す(即ち、これらの配列はウラシル(U)の代わりにチミン(T)を示す)ことに留意しなければならない。
核酸は、一本鎖又は二本鎖の形態の、デオキシリボヌクレオチド、リボヌクレオチド、又は修飾ヌクレオチド、及びこれらのポリマーを意味することを理解しなければならない。この用語は、既知のヌクレオチド類似体又は修飾骨格残基若しくは修飾骨格連結を含む核酸を包含し、この核酸は合成であり、天然に存在し、及び天然には存在せず、参照核酸と同様の結合特性を有し、参照ヌクレオチドと同様の様式で代謝される。そのような類似体の例として、ホスホロチオアート、ホスホルアミダート、メチルホスホナート、キラル−メチルホスホナート、2−O−メチルリボヌクレオチド、ペプチド−核酸(PNA)及びアンロックド核酸(UNA;例えばJensen他、Nucleic Acids Symposium Series 52:133〜4を参照されたい)並びにこれらの誘導体が挙げられるがこれらに限定されない。
ヌクレオチドは、天然塩基(標準)及び当分野で公知の修飾塩基を有するものを含むように、当分野で認識されている通りに使用される。そのような塩基は概して、ヌクレオチド糖部分の1’位に位置する。ヌクレオチドは概して、塩基、糖及びリン酸基を含む。ヌクレオチドは未修飾であることができ、又は糖、リン酸及び/若しくは塩基部分で修飾され得、ヌクレオチド類似体、修飾ヌクレオチド、非天然ヌクレオチド、非標準ヌクレオチド等とも互換的に称される(例えばWO92/07065、WO93/15187(これらの内容は参照により本明細書に援用される)を参照されたい)。Limbach他、Nucleic Acids Res.22:2183、1994に概説されているように、当分野で既知の修飾核酸塩基のいくかの例が存在する。核酸分子に導入され得る塩基修飾の非限定的な例の一部として、ヒポキサンチン、プリン、ピリジン−4−オン、ピリジン−2−オン、フェニル、偽ウラシル(pseudouracil)、2,4,6−トリメトキシベンゼン、3−メチルウラシル、ジヒドロウリジン、ナフチル、アミノフェニル、5−アルキルシチジン(例えば5−メチルシチジン)、5−アルキルウリジン(例えばリボチミジン)、5−ハロウリジン(例えば5−ブロモウリジン)又は6−アザピリミジン又は6−アルキルピリミジン(例えば6−メチルウリジン)、プロピン等が挙げられる(Burgin他、Biochemistry 35:14090、1996)。この態様における「修飾塩基」は、1’位でのアデニン、グアニン、シトシン及びウラシル以外のヌクレオチド塩基又はこれらの等価物を意味する。
修飾ヌクレオチドは、ヌクレオシド、核酸塩基、ペントース環又はリン酸基に対する1つ又は複数の修飾を有するヌクレオチドを意味する。修飾として、メチルトランスフェラーゼ等のヌクレオチドを修飾する酵素による修飾で生じる天然に存在するものが挙げられる。修飾ヌクレオチドとして、合成ヌクレオチド又は天然には存在しないヌクレオチドも挙げられる。ヌクレオチドにおける合成による又は天然には存在しない修飾として、2’修飾を有するもの、例えば2’−メトキシエトキシ、2’−フルオロ、2’−アリル、2’−O−[2−(メチルアミノ)−2−オキソエチル]、4’−チオ、4’−CH2−O−2’−架橋、4’−(CH2)2−O−2’−架橋、2’−LNA又はその他の二環式の若しくは「架橋された」ヌクレオシド類似体及び2’−O−(N−メチルカルバマート)、又は塩基類似体を含むものが挙げられる。本開示に関して説明されているような2’−修飾ヌクレオチドに関連して、「アミノ」は、2’−NH2又は2’−O−NH2を意味しており、これらは修飾され得る、又は未修飾であることができる。そのような修飾基は、例えばUS5,672,695及びUS6,248,878に記載されている。本発明の「修飾ヌクレオチド」として、上記に記載のヌクレオチド類似体も挙げることができる。
本明細書で使用する場合、「塩基類似体」は、核酸二本鎖に組み込まれ得る修飾ヌクレオチド中のヌクレオチド糖部分の1’位(又は核酸二本鎖に組み込まれ得るヌクレオチド糖部分置換での同等の位置)に位置する複素環部分を意味する。塩基類似体は概して、一般的な塩基であるグアニン(G)、シトシン(C)、アデニン(A)、チミン(T)及びウラシル(U)を除いて、プリン塩基又はピリミジン塩基であることができる。塩基類似体は、dsRNA中においてその他の塩基又は塩基類似体と二本鎖を形成することができる。塩基類似体として、本発明の化合物及び方法で有用なものが挙げられ、例えばUS5,432,272、US6,001,983及びUS7,579,451(これらは参照により本明細書に援用される)に開示されたものが挙げられる。塩基の非限定的な例として、ヒポキサンチン(I)、キサンチン(X)、313−D−リボフラノシル−(2,6−ジアミノピリミジン)(K)、3−ガンマ−D−リボフラノシル−(1−メチル−ピラゾロ[4,3−d]ピリミジン−5,7(4H,6H)−ジオン)(P)、イソ−シトシン(イソ−C)、イソ−グアニン(イソ−G)、1−ガンマ−D−リボフラノシル−(5−ニトロインドール)、1−ガンマ−D−リボフラノシル−(3−ニトロピロール)、5−ブロモウラシル、2−アミノプリン、4−チオ−dT、7−(2−チエニル−イミダゾ[4,5−b]ピリジン(Ds)及びピロール−2−カルバルデヒド(Pa)、2−アミノ−6−(2−チエニル)プリン(S)、2−オキソピリジン(Y)、ジフルオロトリル、4−フルオロ−6−メチルベンゾイミダゾール、4−メチルベンゾイミダゾール、3−メチルイソカルボスチリリル(methyl isocarbostyrilyl)、5−メチルイソカルボスチリリル、及び3−メチル−7−プロピニルイソカルボスチリリル、7−アザインドリル、6−メチル−7−アザインドリル、イミジゾピリジニル、9−メチル−イミジゾピリジニル、ピロロピリジニル、イソカルボスチリリル、7−ピロピニルイソカルボスチリリル、ピロピニル−7−アザインドリル、2,4,5−トリメチルフェニル、4−メチルインドリル、4,6−ジメチルインドリル、フェニル、ナフタレニル、アントラセニル、フェナントラセニル、ピレニル、スチルベンジル、テトラセニル、ペンタセニル並びにこれらの構造誘導体が挙げられる(Schweitzer他、J.Org.Chem.、59:7238〜7242(1994)、Berger他、Nucleic Acids Research、28(15):2911〜2914(2000)、Moran他、J.Am.Chem.Soc.、119:2056〜2057(1997)、Morales他、J.Am.Chem.Soc.、121:2323〜2324(1999)、Guckian他、J.Am.Chem.Soc.、118:8182〜8183(1996)、Morales他、J.Am.Chem.Soc.、122(6):1001〜1007(2000)、McMinn他、J.Am.Chem.Soc.、121:11585〜11586(1999)、Guckian他、J.Org.Chem.、63:9652〜9656(1998)、Moran他、Proc.Natl.Acad.Sci.、94:10506〜10511(1997)、Das他、J.Chem.Soc.、Perkin Trans.、1:197〜206(2002)、Shibata他、J.Chem.Soc.、Perkin Trans.、1:1605〜1611(2001)、Wu他、J.Am.Chem.Soc.、122(32):7621〜7632(2000)、O’Neill他、J.Org.Chem.、67:5869〜5875(2002)、Chaudhuri他、J.Am.Chem.Soc.、117:10434〜10442(1995)及び米国特許第6,218,108号明細書)。塩基類似体はユニバーサル塩基であることもできる。
「ユニバーサル塩基」は、核酸二本鎖中に存在する場合には二重らせん構造(例えばリン酸骨格の構造)を改変することなく複数種の塩基に対向して配置され得る修飾ヌクレオチド中におけるヌクレオチド糖部分の1’位(又はヌクレオチド糖部分置換での同等の位置)に位置する複素環部分を意味する。加えて、ユニバーサル塩基は、標的核酸に対して一本鎖核酸の能力を破壊しない。
核酸は、表2に示すmiRヘアピン配列又はこのmiRヘアピン配列のバリアントも含むことができる。
表2の配列番号183〜306は、天然に存在するプレ−miRの配列に対応するcDNAを示す(即ち、この配列はウラシル(U)の代わりにチミン(T)を示す)ことに留意しなければならない。
核酸は核酸複合体の形態であることもでき、下記のうちの1つ又は複数を更に含むことができる:ペプチド、タンパク質、RNA−DNAハイブリッド、抗体、抗体断片、Fab断片又はアプタマー。
核酸は、プリ−miRNAの配列又はこのプリ−miRNAのバリアントを含むことができる。プリ−マイクロRNA配列は、45〜30,000個、50〜25,000個、100〜20,000個、1,000〜1,500個又は80〜100個のヌクレオチドを含むことができる。プリ−miRNAの配列は、本明細書に記載のプレ−miRNA、miRNA及びmiRNA*並びにこれらのバリアントを含むことができる。プリ−miRNAの配列は、配列番号183〜308の配列のうちのいずれか又はこのバリアントを含むことができる。
プリ−miRNAはヘアピン構造を含むことができる。このヘアピンは、実質的に相補的である第1の核酸配列及び第2の核酸配列を含むことができる。第1の核酸配列及び第2の核酸配列は、37〜50個のヌクレオチドであることができる。第1の核酸配列及び第2の核酸配列は、8〜12個のヌクレオチドの第3の配列により隔てられ得る。このヘアピン構造は、Hofacker他(Monatshefte f.Chemie 1994;125:167〜188)(この内容は参照により本明細書に援用される)に記載されているような、デフォルトパラメーターを有するViennaアルゴリズムにより算出された−25Kcal/モル未満の自由エネルギーを有することができる。このヘアピンは、4〜20個、8〜12個又は10個のヌクレオチドの末端ループを含むことができる。プリ−miRNAは、少なくとも19%のアデノシンヌクレオチド、少なくとも16%のシトシンヌクレオチド、少なくとも23%のチミンヌクレオチド及び少なくとも19%のグアニンヌクレオチドを含むことができる。
核酸はまた、プレ−miRNAの配列又はこのプレ−miRNAのバリアントを含むこともできる。プレ−miRNA配列は、45〜90個、60〜80個又は60〜70個のヌクレオチドを含むことができる。プレ−miRNAの配列は、本明細書に記載のmiRNA及びmiRNA*を含むことができる。プレ−miRNAの配列はまた、プリ−RNAの5’末端及び3’末端から0〜160個のヌクレオチドを除いたプリ−miRNAの配列であることもできる。プレ−miRNAの配列は、配列番号183〜308の配列又はそのバリアントを含むことができる。
本明細書に記載したように、核酸は、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、21個、22個、23個、24個、25個、30個、35個、40個、45個、50個又はより多くのヌクレオチドの領域にわたり、(80から99%まで1%の増加で)表1又は表2の核酸配列と少なくとも70%同一、75%同一、80%同一、85%同一、90%同一、95%同一、97%同一、98%同一又は99%同一であることができる。
核酸はまた、マイクロRNA(miRNA*等)の配列又はそのバリアントを含むこともでき、このマイクロRNAとして、MID−[数字]で表される推定上のマイクロRNAが挙げられる。本明細書で言及する場合、マイクロRNAには、miRBase登録名称(リリース20)で列挙されたmiR、並びにRosetta Genomicsにより予想された及び/又はクローニングされた並びにMID−[数字]で表される推定上のマイクロRNAが含まれる。マイクロRNA配列は、13〜33個、18〜24個又は21〜23個のヌクレオチドを含むことができる。マイクロRNAはまた、合計で少なくとも5個、67個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、21個、22個、23個、24個、25個、26個、27個、28個、29個、30個、31個、32個、33個、34個、35個、36個、37個、38個、39個又は40個のヌクレオチドを含むこともできる。マイクロRNAの配列は、プレ−miRNAの最初の13〜33個のヌクレオチドであることができる。マイクロRNAの配列はまた、プレ−miRNAの最後の13〜33個のヌクレオチドであるこもできる。マイクロRNAの配列は、配列番号1〜182のうちのいずれか1つの配列又はそのバリアントを含むことができる。本発明は、甲状腺結節の同定、分類及び診断にマイクロRNAを利用する。
「バリアント」は、核酸に関して本明細書で使用する場合、(i)参照ヌクレオチド配列の一部;(ii)参照ヌクレオチド配列の相補体若しくはこの一部;(iii)点変位により参照ヌクレオチド配列とは異なる核酸若しくはこの相補体;(iv)集合体中に存在する参照ヌクレオチド配列の天然に存在するバリアント若しくはこの相補体;又は(iv)参照核酸にストリンジェントな条件下でハイブリダイズする核酸若しくはこの相補体を意味する。
「プローブ」は本明細書で使用する場合、1種又は複数種の化学結合により、通常は(通常は水素結合形成による)相補的塩基結合により、相補配列の標的核酸に結合することができるオリゴヌクレオチドを意味する。プローブは、ハイブリダイゼーション条件のストリンジェンシーによっては、プローブ配列との完全な相補性を欠く標的配列に結合する場合がある。例えば、ハイブリダイゼーションアッセイに関して、プローブは、検出されるマイクロRNAの配列の少なくとも8個の、少なくとも9個の、少なくとも10個の、少なくとも11個の、少なくとも12個の、少なくとも13個の、少なくとも14個の、少なくとも15個の、少なくとも16個の、少なくとも17個の、少なくとも18個の、少なくとも19個の、少なくとも20個の連続したヌクレオチドに対して相補的であることができる。或いは、PCRアッセイに関して、プローブは、検出されるPCR産物の配列の少なくとも8個の、少なくとも9個の、少なくとも10個の、少なくとも11個の、少なくとも12個の、少なくとも13個の、少なくとも14個の、少なくとも15個の、少なくとも16個の、少なくとも17個の、少なくとも18個の、少なくとも19個の、少なくとも20個の連続したヌクレオチドに対して相補的であることができる。
そのため、プローブは、この標的核酸の少なくとも60%、65%、70%、75%、80%、85%、90%、95%、97%、98%又は99%に対して相補的であることができる、又はハイブリダイズすることができる。
プローブは一本鎖であることができる、又は部分的に一本鎖で部分的に二本鎖であることができる。プローブの鎖性(strandedness)は、標的配列の構造、組成及び特性により決定される。プローブは、本明細書に記載の核酸中において天然には存在しない標識、アタッチメント又はヌクレオチド配列を含むことができる。プローブを直接的に標識することができる、又は例えばストレプトアビジン複合体が結合することができるビオチンにより間接的に標識することができる。
「プローブ」は、本明細書に記載の核酸配列を検出するための作用物質であることができる。プローブは、本発明の核酸配列の一部又はこの核酸配列の一部に由来する増幅産物にハイブリダイズすることができる標識核酸プローブであることができる。一部の実施形態では、核酸プローブは、本明細書で開示した核酸配列の逆相補的核酸分子である。プローブは、本明細書で開示した核酸に対してストリンジェントな条件下で十分に特異的にハイブリダイズする核酸配列であることができる。プローブは、蛍光分子、例えばフルオレセイン(例えば6−カルボキシフルオレセイン(FAM))、インドカルボシアニン(例えばQUASAR−670(QUA))、ヘキサフルオロシン(例えば6−カルボキシヘキサフルオレセイン)(HEX)又はその他のフルオロフォア分子及び任意選択で消光剤により、任意選択で標識される。消光剤は、フルオロフォアに適合すると認識されている。消光剤の具体例として、ブラックホール消光剤BHQ1及びBHQ2、又は副溝結合剤(MGB)、例えばジヒドロシクロピロロインドールトリペプチドが挙げられる。その他のフルオロフォア及び消光剤が当分野で既知であり、本明細書において同様に使用可能である。
そのため、本発明はまた、プローブであって、本明細書に記載の新規の核酸配列を含むプローブも提供し、新規の核酸配列は、配列番号27〜29、配列番号33、配列番号34、配列番号139、配列番号140、配列番号307及び配列番号308のうちのいずれか1つ又はそのバリアントで定義される。プローブを、スクリーニング方法及び診断方法に使用することができる。プローブを、バイオチップ等の固体基材に付着させることができる、又は固定することができる。プローブの長さは、8から500個、10から100個又は20から60個のヌクレオチドであることができる。プローブの長さは、少なくとも8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、21個、22個、23個、24個、25個、26個、27個、28個、29個、30個、35個、40個、45個、50個、60個、70個、80個、90個、100個、120個、140個、160個、180個、200個、220個、240個、260個、280個又は300個のヌクレオチドであることができる。プローブは、10〜60個のヌクレオチドのリンカー配列を更に含むことができる。プローブはリンカーを更に含むことができる。リンカーは、本明細書に記載の核酸中に天然では存在しない配列を含むことができる。リンカーは10〜60個のヌクレオチドの長さであることができる。リンカーは20〜27個のヌクレオチドの長さであることができる。リンカーは、プローブを全長で40〜50個のヌクレオチドにするのに十分な長さであることができる。リンカーは、安定した二次構造を形成することができなくてもよいし、このリンカー上で折り重なることができなくてもよいし、又はプローブに含まれる核酸の非リンカー部分上で折り重なることできなくてもよい。リンカーの配列は異種であり、プローブ非リンカー核酸が由来する動物のゲノム中では見られ得ない。
本明細書で使用する場合、用語「参照値」は、アッセイ結果を比較した場合に特定の結果に統計学的に対応する値を意味する。一実施形態では、参照値を、マイクロRNA発現と既知の臨床結果とを比較する検定の統計分析から決定する。別の実施形態では、参照値は、使用する分類器(即ちアルゴリズム)に従って変動することができる。従って、参照値は、トレーニングデータ中の全てのマイクロRNAの発現レベル(又は発現値)であることができる。参照値は、分類器により確立される1つ又は複数の閾値であることができる。参照値は更に、係数又は係数のセットであることができる。本質的に、参照値は、アルゴリズムに必要な又はアルゴリズムで使用される、あらゆるパラメーターを意味する。
「感度」は本明細書で使用する場合、2項分類検定が条件をどれくらい正確に同定するかの統計的尺度を意味することができ、例えば、がんが2種の可能なタイプの中からの正確なタイプに正確に分類される頻度の統計的尺度を意味することができる。クラスAの感度は、いくつかの絶対的又は至適基準(gold standard)により決定した場合に、クラス「A」であるケースの中から検定によりクラスAに属するとケースされる場合の割合である。
「感度」は本明細書で使用する場合、分類検定が条件(単数又は複数)をどれくらい正確に同定するかの統計的尺度を意味することができ、例えば、がんが2種以上の可能なタイプの中からの正確なタイプに正確に分類される頻度の統計的尺度を意味することができる。クラスAの感度は、いくつかの絶対的又は至適基準により決定した場合に、クラス「A」であるケースの中から検定によりクラスAに属すると決定されるケースの割合である。
「塗抹標本」は本明細書で使用する場合、検査(典型的には医療診断)のために顕微鏡スライド上に薄く広げられた甲状腺組織のサンプルを意味する。FNAからの塗抹標本は通常、非常に少量の細胞を有し、この細胞から少量のRNAが得られ、従って、このRNAは、1〜1000ng、1〜100ng、1〜50ng、1〜40ngの範囲であることができる。塗抹標本を、細胞学、組織学又は病理学の当業者に既知の任意の染色剤(例えば病理検体中の細胞を識別するために使用される任意の染色剤)で染色することができる。染色剤の例は、パパニコロウのような多色染色剤(核染色剤と細胞質染色剤との組合せである);細胞構造染色剤、例えばWright、Giemsa、Romanowsky等;核染色剤、例えばHoescht染色剤等;細胞生存性染色剤、例えばTrypanブルー等、酵素活性、例えば沈殿物等を可視にするためのHRP用のベンジジンである。
「特異度」は本明細書で使用する場合、2項分類検定が、特定の条件を有しないケースをどれくらい正確に同定するかの統計的尺度を意味することができ、例えば、実際には非がんサンプルである場合にサンプルが非がんと正確に分類される頻度の統計的尺度を意味することができる。クラスAの特異度は、いくつかの絶対的又は至適基準により決定した場合に、「Aではない」クラスであるケースの中から検定により「Aではない」クラスに属すると決定されるケースの割合である。
「特異度」は本明細書で使用する場合、分類検定が、特定の条件を有しないケースをどれくらい正確に同定するかの統計的尺度を意味することができる。クラスAの特異度は、いくつかの絶対的又は至適基準により決定した場合に、クラス「A」ではないケースの中からクラスAには属しないと検定により決定されるケースの割合である。
本明細書で使用する場合、用語「がんのステージ」は、がんの発達のレベルの数字による測定値を意味する。がんのステージを決定するために使用される基準として、腫瘍のサイズ(腫瘍が身体の他の部分にまで広がっているかどうか)及び(例えば、身体の同じ器官内で若しくは領域内で又は別の器官に)がんが広がっている場所が挙げられるがこれらに限定されない。
「ストリンジェントなハイブリダイゼーション条件」は本明細書で使用する場合、例えば核酸の複合混合物中で、第1の核酸配列(例えばプローブ)が第2の核酸配列(例えば標的)にハイブリダイズすることができる条件を意味する。ストリンジェントな条件は配列依存的であり、異なる状況では異なるであろう。ストリンジェントな条件を、規定されたイオン強度pHで特定の配列に関する熱的融点(Tm)よりも約5〜10℃低くなるように選択することができる。Tmは、平衡で標的に対して相補的なプローブの50%が標的配列にハイブリダイズする(規定されたイオン強度、pH及び核濃度下の)温度であることができる(標的配列がTmで過剰に存在することから、平衡でプローブの50%が占める)。ストリンジェントな条件は、塩濃度が、pH7.0〜8.3で約1.0Mのナトリウムイオン未満(例えば、約0.01〜1.0Mのナトリウムイオン濃度(又はその他の塩))であり、温度が、短いプローブ(例えば約10〜50個のヌクレオチド)で少なくとも約30℃であり、長いプローブ(例えば約50個を超えるヌクレオチド)で少なくとも約60℃である条件であることができる。ストリンジェントな条件を、ホルムアミド等の不安定化剤の添加により達成することもできる。選択的な又は特異的なハイブリダイゼーションのために、陽性シグナルは少なくとも2〜10回のバックグラウンドハイブリダイゼーションであることができる。例示的なストリンジェントハイブリダイゼーション条件として下記が挙げられる:50%ホルムアミド、5×SSC、及び1%SDS、42℃でのインキュベーション、又は5×SSC、1%SDS、65℃でのインキュベーション、65℃での0.2×SSC及び0.1%SDSでの洗浄、DMSO、6×SSPE+0.005%N−ラウロイルサルコシン+0.005%Triton X−102、0.06×SSPE+0.005%N−ラウロイルサルコシン+0.005%Triton X−102。
本明細書で使用する場合、用語「対象」は哺乳類を意味しており、この哺乳類には、ヒト及びその他の哺乳類の両方が含まれる。本発明の方法は、好ましくはヒト対象に適用される。
本明細書で使用する場合、用語「がんの亜型」は、同じ器官に影響を及ぼす、がんの異なる型(例えば、甲状腺の乳頭、濾胞腺癌及び濾胞型乳頭癌)を意味する。
「甲状腺病変」は本明細書で使用する場合、甲状腺腫瘍を意味することができ、この甲状腺腫瘍には、甲状腺腫瘍の亜型、例えば橋本病、濾胞腺癌、乳頭癌、濾胞型乳頭癌(FVPC又はFVPTC)、被包性FVPC(又は被包性FVPTC)、非被包性(浸潤性/びまん性)FVPC又はFVPTC、髄様癌、退形成性甲状腺がん又は低分化甲状腺がんが含まれる。
本明細書で使用する場合、語句「閾値発現プロファイル」は、腫瘍を分類するために測定値が比較される判断基準発現プロファイルを意味する。
本明細書で使用する場合、組織サンプルは、関連する医療分野の当業者に公知の方法を使用する組織生検により得られる組織である。語句「がんの疑いがある」は本明細書で使用する場合、がん細胞を含むと医療分野の当業者に信じられているがん組織サンプルを意味する。生検によりサンプルを得る方法として、細胞塊の粗分割(gross apportioning of a mass)、マイクロダイセクション、レーザーベースのマイクロダイセクション又はその他の当分野で既知の細胞分離法が挙げられる。
「腫瘍」は本明細書で使用する場合、悪性か良性かにかかわらず全ての新生細胞の成長及び増殖、並びに全ての前がんの及びがんの細胞及び組織を意味する。本明細書で使用する甲状腺病変又は腫瘍サンプルの細胞学的分類は、「甲状腺細胞病理学報告に関するBethesda System(The Bethesda System for Reporting Thyroid Cytopathology)」、the 「BSRTC」(Syed,Z.Ali及びEdmund S.Cibas編;DOI 10.1007/978−0−387−87666−5_1;Springer Science+Business Media、LLC 2010)をベースとする。BSRTCは、一般的な診断カテゴリー(各カテゴリーは、暗示されたがんリスクを有する)を伴う各甲状腺FNA報告を推奨する。
Bethesdaカテゴリーに関する推奨される命名法は下記の通りである:
I.非診断又は不十分
嚢胞液のみ
実質的に無細胞の検体
その他(不明瞭な血液、凝固人工物等)
II.良性
良性の濾胞性結節(腺腫様結節、コロイド結節等を含む)との一致
適切な臨床状況でのリンパ性(橋本)甲状腺炎との一致
肉芽腫性(亜急性)甲状腺炎との一致
その他
III.意義不明の異型又は意義不明の濾胞性病変
IV.濾胞性新生物又は濾胞性新生物の疑い
Hurthle細胞(オンコサイト)型で特異的
V.悪性の疑い
乳頭癌の疑い
髄様癌の疑い
転移性癌の疑い
リンパ腫の疑い
その他
VI.悪性
甲状腺乳頭癌
低分化癌
甲状腺髄様癌
未分化(退形成性)癌
扁平上皮癌
特徴が混ざり合った癌
転移性癌
非ホジキンリンパ腫
その他。
本明細書で使用する場合、「未確定」は、細胞診を受ける並びにBethesda分類に従ってカテゴリーIII、IV及びVに分類される甲状腺病変又は腫瘍サンプルを意味する。
本発明は、対象において甲状腺病変の亜型を同定する方法であって、前記甲状腺病変の亜型は悪性又は良性の甲状腺腫瘍の前記亜型である、方法を更に提供する。亜型は、濾胞腺癌、乳頭癌、濾胞型乳頭癌(FVPC若しくはFVPTC)、被包性FVPC(若しくは被包性FVPTC)、非被包性FVPC(若しくは非被包性FVPTC)、髄様癌、退形成性甲状腺がん又は低分化甲状腺がんのうちのいずれか1つである。
別の更なる実施形態では、前記亜型は、橋本甲状腺炎、濾胞腺腫又は過形成のうちのいずれか1つである。
別の更なる実施形態では、前記亜型はHurthle細胞癌である。
別の態様では、本発明は、濾胞腺腫と濾胞腺癌とを判別する方法を提供する。
別の更なる態様では、本発明は、乳頭癌から濾胞腺腫を判別する方法を提供する。
別の更なる態様では、本発明は、濾胞型乳頭癌から濾胞腺腫を判別する方法を提供する。
別の更なる態様では、本発明は、良性病変から非被包性の濾胞型乳頭癌を判別する方法を提供する。
別の更なる態様では、本発明は、乳頭癌と橋本甲状腺炎とを判別する方法を提供する。
「ベクター」は、プラスミドベクター、ファージベクター、ファージミドベクター、コスミドベクター又はウイルスベクター等のあらゆる既知のベクターを意味する。本明細書に記載の核酸はベクター中に含まれ得る。ベクターを、この核酸の送達用に使用することができる。ベクターは好ましくは、担持される核酸の発現を増強するプロモーターを少なくとも含み、この場合、核酸は好ましくはそのようなプロモーターに作動可能に連結される。ベクターは宿主細胞中で複製可能でもよいし複製不能でもよく、遺伝子の転写を宿主細胞の核外又は核内のいずれかで実行することができる。後者の場合、核酸を宿主細胞のゲノム中に組み込むことができる。ベクターはDNAベクターでもよいしRNAベクターでもよい。ベクターは、自己複製する染色体外ベクター又は宿主ゲノム中に組み込むベクターのいずれかであることができる。
本発明の方法又はプロトコルの一実施形態では、マイクロRNAのレベルを、逆転写ポリメラーゼ連鎖反応(RT−PCR)で測定する。cDNAの標的配列を標的RNAの逆転写により生成し、標的RNAは本明細書に記載の核酸(表1及び表2に記載の配列を含む)であることができる。cDNAを生成する既知の方法として、ポリアデニル化RNA或いはアダプター配列が連結されたRNAのいずれかを逆転写することが挙げられる。
逆転写前に、RNAをアダプター配列に連結することができる。RNAの3’末端でアダプター配列を連結するためのT4 RNAリガーゼにより、連結反応を実施することができる。次いで、アダプター配列の3’末端に相補的である配列を含むプライマーを使用して逆転写(RT)反応を実施することができる。
或いは、ポリアデニル化RNAを、5’アダプター配列を含むポリ(T)プライマーを使用する逆転写(RT)反応で使用することができる。ポリ(T)配列は、8個、9個、10個、11個、12個、13個又は14個の連続したチミンを含むことができる。
次いで、RNAの逆転写産物をリアルタイムPCRで増幅させることができ、このリアルタイムPCRでは、標的核酸に相補的な少なくとも15個の核酸及び5’テール配列を含む特定のフォワードプライマー、アダプター配列の3’末端に相補的であるリバースプライマー、並びに標的核酸に相補的な少なくとも8個の核酸を含むプローブを使用する。このプローブは、アダプター配列の5’末端に部分的に相補的であることができる。
標的核酸(マイクロRNA、本明細書に記載の推定上のマイクロRNAを含む)の逆転写産物をPCR等で増幅することができる。PCR反応の最初のサイクルのアニーリング温度は、56℃、57℃、58℃、59℃又は60℃であることができる。最初のサイクルは1〜10サイクルを含むことができる。PCR反応の残りのサイクルは60℃であることができる。残りのサイクルは2〜40サイクルを含むことができる。
PCR反応はフォワードプライマーを含む。一実施形態では、フォワードプライマーは、標的核酸と同一の15個、16個、17個、18個、19個、20個又は21個のヌクレオチドを含むことができる。フォワードプライマーの3’末端は、標的核酸と高度に類似の配列との間の配列の差異に敏感である場合がある。
フォワードプライマーはまた、5’突出テールも含むことができる。この5’テールにより、フォワードプライマーの融点が上昇する場合がある。この5’テールの配列は、標的核酸と同一ではない配列を含むことができる。5’テールの配列は合成であることもできる。この5’テールは、8個、9個、10個、11個、12個、13個、14個、15個又は16個のヌクレオチドを含むことができる。本発明で使用するフォワードプライマーの例を表8に示す。
PCR反応はリバースプライマーを含む。このリバースプライマーは標的核酸に相補的であることができる。このリバースプライマーはまた、アダプター配列に相補的な配列も含むことができる。本発明で使用するリバースプライマーの例を実施例8に示す。
RT−PCR増幅の産物を検出するために使用するプローブは、一般的なプローブ又は配列特異的プローブであることができる。一般的なプローブは、非配列特異的な方法でRT−PCR増幅産物を検出するように(又はRT−PCR増幅産物とハイブリダイズするように)設計されている。前記プローブは、16個と20個との間のヌクレオチドの長さであり、好ましくは18個のヌクレオチドの長さであり、RTプライマーの逆相補体である配列を含み、5’末端で4個のアデニン(A)を含む。配列特異的プローブは、プローブの配列とRT−PCR産物の配列との間の全体的な又は部分的な相補性に基づいて、RT−PCR増幅産物を検出するように(又はRT−PCR増幅産物とハイブリダイズするように)設計されている。前記プローブは、20個と28個との間のヌクレオチドの長さであり、好ましくは24個のヌクレオチドの長さであり、5’末端で、少なくとも2個はRTプライマーに相補的である3個のヌクレオチド、続いて10〜14個の(好ましくは12個の)チミン(T)、続いて特定の対応するマイクロRNAの逆相補配列に対応する6〜10個の(好ましくは8個の)連続したヌクレオチドを含む。
本明細書に記載の新規の核酸を含むバイオチップが提供される。一実施形態では、このバイオチップは、本明細書に記載の新規の核酸を認識するプローブを含むことができる。前記核酸は、配列番号27〜29、配列番号33、配列番号34、配列番号139、配列番号140、配列番号307及び配列番号308のうちのいずれか1つの配列と少なくとも80%同一の少なくとも12個の連続したヌクレオチドを含む単離核酸である。一実施形態では、前記単離核酸は、配列番号27〜29、配列番号33、配列番号34、配列番号139、配列番号140、配列番号307及び配列番号308のうちのいずれか1つの配列と同一の少なくとも13個、少なくとも14個、少なくとも15個、少なくとも16個、少なくとも17個、少なくとも18個、少なくとも19個又は少なくとも20個の連続したヌクレオチドを含む。このバイオチップは、本明細書に記載の核酸、プローブ(単数又は複数)が付着した固体基材を含むことができる。このプローブは、ストリンジェントなハイブリダイゼーション条件下で標的配列にハイブリダイズすることできる。このプローブを、基材上の空間的に定義されたアドレスで付着させることができる。重複するプローブか、又は特定の標的配列の異なるセクションに対するプローブかのいずれかで、1種の標的配列当たり複数種のプローブを使用することができる。このプローブは、当業者により認識される単一の障害を伴う標的配列にハイブリダイズすることができる。このプローブを最初に合成し、続いてバイオチップに付着させてもよいし、このプローブをバイオチップ上で直接合成してもよい。
固体基材は、プローブの付着又は会合に適した別々の個々の部位を含むように修飾され得る及び少なくとも1種の検出方法に適している物質であることができる。基材の代表例として、ガラス及び修飾された又は官能化されたガラス、プラスチック(アクリル樹脂、ポリスチレン及びスチレンとその他の物質とのコポリマー、ポリプロピレン、ポリエチレン、ポリブチレン、ポリウレタン、TeflonJ等が挙げられる)、多糖、ナイロン又はニトロセルロース、樹脂、シリコン及び修飾シリコンを含むシリカ又はシリカベースの物質、炭素、金属、無機ガラス及びプラスチックが挙げられる。この基材により、認識できるほどに蛍光することなく光学的検出が可能になる。
基材のその他の形状も同様に使用することができるが、この基材は平面であることができる。例えば、流れるサンプルの分析の場合にサンプル体積を最小化するために、チューブの内表面上にプローブを配置することができる。同様に、基材は軟質であることができ、例えば、特定のプラスチックで作られた独立気泡フォーム等の軟質フォームであることができる。
バイオチップ及びプローブを、この2つを後に付着させるための化学官能基で誘導体化することができる。例えば、バイオチップを、アミノ基、カルボキシル基、オキソ基又はチオール基が挙げられるがこれらに限定されない化学官能基で誘導体化することができる。この官能基を使用して、プローブを、このプローブ上の官能基を使用して、直接的に又はリンカーを介して間接的に付着させることができる。プローブを、5’末端、3’末端又は内部ヌクレオチドを介して、固体支持体に付着させることができる。
プローブを、非共有結合的に固体支持体に付着させることもできる。例えば、ビオチン化オリゴヌクレオチドを作ることができ、このビオチン化オリゴヌクレオチドは、ストレプトアビジンで共有結合的にコーティングされた表面に結合することができ、その結果、付着する。或いは、プローブを、光重合及びフォトリソグラフィー等の技法を使用して表面上で合成することができる。
本発明の更なる実施形態では、甲状腺病変の分類のためにマイクロRNAを測定することを、高スループットシークエンシングにより達成することができる。高スループットシークエンシングとして、合成によるシークエンシング、連結によるシークエンシング、及びウルトラディープシークエンシングを挙げることができる。核酸タグ上のシークエンシング要素に相補的なシークエンシングプライマーを使用して、合成によるシークエンシングを開始することができる。この方法は、ポリメラーゼ反応中に相補核酸配列の成長している鎖への標識ヌクレオチド又はヌクレオチド類似体の組み込みの直後の(実質的にリアルタイムの)又は組み込み時の(リアルタイムの)各ヌクレオチドの同一性を検出することを含む。標識ヌクレオチドの組み込みの成功後、シグナルを測定し、次いで当分野で既知の方法によりゼロにする。合成によるシークエンシングの方法の例は当分野で既知であり、例えばUS7,056,676、US8,802,368及びUS7,169,560(これらの内容は参照により本明細書に援用される)に記載されている。合成によるシークエンシング用の標識ヌクレオチド又はヌクレオチド類似体に使用することができる標識の例として、発色団、蛍光部分、酵素、抗原、重金属、磁気プローブ、色素、リン光基、放射性物質、化学発光部分、散乱ナノ粒子又は蛍光ナノ粒子、Ramanシグナル生成部分、及び電気化学検出部分が挙げられるがこれらに限定されない。合成によるシークエンシングは、1時間当たり少なくとも1,000個、少なくとも5,000個、少なくとも10,000個、少なくとも20,000個、30,000個、少なくとも40,000個、少なくとも50,000個、少なくとも100,000個又は少なくとも500,000個の読み取りデータを作ることができる。そのような読み取りデータは、1個の読み取りデータ当たり少なくとも40個、少なくとも45個、少なくとも50個、少なくとも60個、少なくとも70個、少なくとも80個、少なくとも90個、少なくとも100個、少なくとも120個又は少なくとも150個の塩基を有することができる。
フォールドバックPCR及びアンカープライマーを使用して、合成によるシークエンシングを固体表面(又はチップ)上で実施することができる。マイクロRNAは小さい核酸断片として生じることから、この断片の5’末端及び3’にアダプターを付加する。フローセルチャネルの表面に付着している核酸断片を伸張させ、ブリッジ増幅させる。この断片は二本鎖になり、この二本鎖分子を変性させる。固相増幅、その後の変性の複数回のサイクルにより、フローセルの各チャネル中において、同じテンプレートの一本鎖核酸分子の約1,000コピーからなる数百万個のクラスターを生成することができる。プライマー、ポリメラーゼ、及び4種のフルオロフォアで標識した可逆的終端ヌクレオチドを使用して、逐次的シークエンシングを実施する。ヌクレオチドの組み込み後、レーザーを使用してフルオロフォアを励起させ、画像を取得し、最初の塩基の同一性を記録する。組み込んだ各塩基から3’ターミネーター及びフルオロフォアを除去し、組み込みステップ、検出ステップ及び同定ステップを繰り返す。この技法を、例えばIllumina(登録商標)シークエンシングプラットフォームで使用する。
別のシークエンシング法は、増幅領域を、LST(fastaファイルの名称を列挙するファイル)中の配列要素に相補的なプライマーにハイブリダイズさせることを含む。このハイブリダイゼーション複合体を、ポリメラーゼ、ATPスルフリラーゼ、ルシフェラーゼ、アピラーゼ、並びに基質であるルシフェリン及びアデノシン5’ホスホ硫酸と共にインキュベートする。次に、塩基A、C、G及びT(U)に対応するデオキシヌクレオチド三リン酸を逐次的に追加する。各塩基の組み込みはピロリン酸塩の放出を伴い、スルフリラーゼによりATPに変換され、これにより、オキシルシフェリンの合成及び可視光の放出が駆動される。ピロリン酸塩の放出は、組み込まれた塩基の数と等モルであることから、放出された光は、任意の一ステップで添加するヌクレオチドの数に比例する。全配列が特定されるまで、このプロセスを繰り返す。更に別のシークエンシング法は、連結スキーム(縮重連結)による4色シークエンシングを含み、この4色シークエンシングは、アンカープライマーを4箇所のうちの1箇所にハイブリダイズさせることを含む。次いで、アンカープライマーの、蛍光色素で標識されている縮重九量体の集合体への酵素連結反応を実施する。任意の所与のサイクルで、使用される九量体の集合体は、その位置のうちの1つの同一性が、九量体に付着したフルオロフォアの同一性と相関するような構造である。リガーゼが、問われている位置での相補性を識別する限りにおいて、蛍光シグナルにより塩基の同一性の推測が可能である。連結及び4色画像化の実施後、アンカープライマー:九量体複合体を取り除き、新たなサイクルを始める。連結の実施後に配列情報を画像化する方法は当分野で既知である。いくつかの場合では、高スループットシークエンシングは、例えばMarguiles他、Nature 437(7057):376〜80(2005)に記載されている、ウルトラディープシークエンシングの使用を含む。
マイクロRNAシークエンシング(miRNA−seq)は、マイクロRNAを配列決定するために次世代シークエンシング又は超並列高スループットDNAシークエンシングを使用するRNAシークエンシング(RNA−Seq)の一種である。miRNA−seqは、投入される物質は低分子RNAが富化されることが多いRNA−seqのその他の形態とは異なる。miRNA−seqは組織特異的発現パターンを提供し、疾患会合及びマイクロRNAアイソフォームにつながる場合がある。miRNA−seqはまた、配列番号139〜140及び配列番号307〜308で示す核酸配列等のこれまで特徴付けられていないマイクロRNAの発見にも使用される。
本明細書で使用する場合、用語「診断すること」は、病状又は症状を分類すること、病状の重症度(グレード又はステージ)を決定すること、病状の進行をモニタリングすること、病状の予後及び/又は回復の見込みを予測することを意味する。
本明細書で使用する場合、語句「それを必要とする対象」は、がんを有することが分っているヒト対象、がんを有するリスクがあるヒト対象(例えば、遺伝的に罹りやすい対象、がんの病歴及び/若しくは家族歴がある対象、発がん性物質、職業上の危険、環境的な危険に曝露されている対象)並びに/又はがんの疑わしい臨床徴候(例えば甲状腺中の小結節)を示す対象を意味する。加えて又は或いは、それを必要とする対象は、定期的な健康診断(well−being check−up)を受ける健康なヒト対象であることができる。
悪性細胞又は前悪性細胞の存在を分析することをin vivoで又はex vivoで達成することができ、そのため生体サンプル(例えば生検試料)が回収される。そのような生検サンプルは細胞を含み、切開生検又は切除生検であることができる。このサンプルを、対象の甲状腺から回収することができ、FNAを使用して回収することができる。或いは、細胞を完全切除から回収することができる。
本教示を用いる間、処置レジメン、処置方針の決定及び/又は疾患の重症度の測定値に関する追加の情報を得ることができる。
本明細書で使用する場合、語句「処置レジメン」は、それを必要とする対象(例えば病的状態と診断された対象)に提供される処置の種類、薬用量、スケジュール及び/又は処置の持続期間を特定する処置計画を意味する。選択された処置レジメンは、最良の臨床転帰(例えば病状の全快)をもたらすと期待される積極的な処置レジメンであることができる、又は病状の不完全な回復をもたらすにもかかわらず病状の症状を緩和することができるより中程度の処置レジメンであることができる。ある特定の場合では、処置レジメンは、対象へのある程度の不快感又は有害な副作用(例えば、健康な細胞若しくは組織へのダメージ)を伴う場合があることが認識されるだろう。処置の種類として、外科的介入(例えば、病変、病的な細胞、組織若しくは器官の除去)、細胞置換療法、局所的な若しくは全身的な方法での治療薬(例えば、受容体作動薬、拮抗薬、ホルモン、化学療法剤)の投与、外部源(例えば外部ビーム)及び/若しくは内部源(例えば密封小線源治療)を使用する放射線治療への曝露、並びに/又はこれらの任意の組合せを挙げることができる。薬用量、スケジュール及び処置の持続期間は、病状の重症度及び処置の選択された種類に応じて変動することができ、当業者は、薬用量、スケジュール及び処置の持続期間と共に処置の種類を調整することができる。
診断方法も提供される。この方法は、生体サンプル中における特定のがん関連核酸の発現レベルを検出することを含む。患者での特定のがんの状態の診断により、予後及び治療戦略の選択が可能になる場合がある。更に、一時的に発現された特定のがん関連核酸を決定することにより、細胞の発達段階を分類することができる。
標識されたプローブの組織切片又はFNA塗抹標本へのin situハイブリダイゼーションを実施することができる。個々のサンプル間のフィンガープリントを比較する場合、当業者は、所見に基づいて、診断、予後又は予測を行なうことができる。診断を示す核酸配列は予後を示す核酸配列と異なる場合があり、細胞の状態の分子プロファイリングから応答性の条件又は不応性の条件の区別が得られる場合がある又は転帰が予測される場合があることが更に理解される。
キットも提供され、このキットは、本明細書に記載の核酸を、下記のうちのいずれか又は全てと一緒に含むことができる:アッセイ用試薬、緩衝液、プローブ及び/又はプライマー、並びに無菌の食塩水又は別の薬学的に許容されるエマルション用の及び懸濁液用の基剤。加えて、このキットは、本明細書に記載の方法を実行するための指示(例えばプロトコル)を含む指示書を含むことができる。このキットは、発現プロファイルのデータ分析用のソフトウェアパッケージを更に含むことができる。
例えば、このキットは、標的核酸配列の増幅用の、検出用の、同定用の又は定量化用のキットであることできる。このキットは、ポリ(T)プライマー、フォワードプライマー、リバースプライマー及びプローブを含むことができる。
本明細書に記載のいかなる組成物もキットに含めることができる。非限定的な例では、キットには、アレイを使用してマイクロRNAを単離するための、マイクロRNAを標識するための及び/又はマイクロRNA集団を評価するための試薬が含まれる。このキットは、マイクロRNAプローブを作るための又は合成するための試薬を更に含むことができる。そのため、このキットは、適切な容器手段中に、標識されたヌクレオチド又は後に標識される未標識のヌクレオチドを組み込むことによりマイクロRNAを標識する酵素を含むことができる。このキットはまた、1種又は複数種の緩衝液、例えば反応用緩衝液、標識用緩衝液、洗浄用緩衝液又はハイブリダイゼーション用緩衝液、マイクロRNAプローブを調製するための化合物、in situハイブリダイゼーション用の成分、及びマイクロRNAの単離するための成分も含むことができる。本発明のその他のキットは、マイクロRNAを含む核酸アレイを作るための成分を含むことができ、そのため、例えば固体支持体を含むことができる。
本発明の一部の実施形態をより完全に説明するために、下記に実施例を示す。しかしながら、この実施例は本発明の広い範囲を限定すると決して解釈されるべきではない。
材料及び方法
1.マイクロRNA分析
甲状腺腫瘍サンプル中におけるマイクロRNAの存在及び/又はレベルを当分野で既知の方法を使用して評価することができ、例えば、ノーザンブロット、RNA発現アッセイ(例えばマイクロアレイ分析)、RT−PCR、高スループットシークエンシング(次世代シークエンシング)、クローニング及び定量的リアルタイムポリメラーゼ連鎖反応(qRT−PCR)を使用して評価することができる。RNA発現を測定するための分析技法は当分野で既知であり、例えばSambrook他、「分子クローニング:実験マニュアル(Molecular Cloning:A Laboratory Manual)」、第3版、Cold Spring Harbor Press、Cold Spring Harbor、N.Y.(2001)を参照されたい。本明細書で使用する具体的な方法の例を下記でより詳細に説明する。
2.RNA抽出
FNA細胞塊サンプル
7から10個の10μm厚組織片から全RNAを単離した。切片を5分にわたり57℃にてキシレン中で数回(1〜3回)インキュベートして過剰なパラフィンを除去し、その後、10,000gで2分にわたり周囲温度にて遠心分離した。次いで、検体を1mlの100%エタノールで数回(約3回)洗浄して組織からキシレンを洗い流し、その後、10,000gで10分にわたり周囲温度にて遠心分離した。上清を廃棄し、組織を5分にわたり65℃にて乾燥させた。数時間(約16時間)にわたり45℃にて、プロテイナーゼK溶液(500μlの緩衝液B(10mM NaCl、500mM Tris pH7.5、20mM EDTA pH8、1%SDS)中の5〜12μlのプロテイナーゼK(例えばSigma又はABI))でタンパク質を分解した。プロテイナーゼKを、7分にわたり95℃でのインキュベーションにより不活性化させた。チューブを冷却した後、10μlのRNA合成スパイク(RNA synthetic spike)を添加した(例えば、0.15fmol/μlの2種のスパイク)。酸フェノール/クロロホルム等量を使用してRNAを抽出し、ボルテックスし、その後、12000gで15分にわたり4℃にて遠心分離した。次いで、30分から16時間にわたり、8μlの直鎖状アクリルアミド、0.1体積の3M NaOAc pH5.2及び3体積の無水100%エタノールを使用してRNAを沈殿させ、その後、20000g(14,000rpm)で少なくとも40分にわたり4℃にて遠心分離した。1mlの85%冷エタノールを添加してペレットを洗浄した。DNAseを60分にわたり37℃にて導入してDNAを消化し(例えば10μlのTurbo(商標)DNase)、その後、酸フェノール/クロロホルムを使用して抽出し、上記に記載したようにエタノール沈殿させた。
FNA塗抹サンプル(例)
スライド中でFNA塗抹サンプルから全RNAを単離し、このスライドを、周囲温度にてキシレン中に数時間(約2〜20時間、通常は約16時間)浸漬して過剰なパラフィン又は接着剤を除去することによりカバーガラス(存在する場合)を取り外した後、染色しなかった、又は(例えば、パパニコロウ、ギムザ若しくはDiff−Quickで)染色した。更に、このスライドを100%エタノールで数回(約3回)洗浄し、キシレンを洗い流した。スライドを再蒸留水(DDW)中に1分にわたり浸漬した。メスを使用して、このスライドから細胞を擦り落とした。次いで、このスライドを500μlの緩衝液B(10mM NaCl、500mM Tris pH7.5、20mM EDTA pH8、1%SDS)で洗浄し、1.7mlチューブに移した。数時間(約16時間)にわたり45℃にて、プロテイナーゼK(例えば5〜12μl、Sigma又はABI)でタンパク質を分解した。7分にわたり95℃にてチューブをインキュベートすることにより、プロテイナーゼKを不活性化させた。チューブの冷却後、10μlのRNA合成スパイク(例えば0.15fmol/μlの2種のスパイク)を添加した。酸フェノール/クロロホルム等量を使用してRNAを抽出し、ボルテックスし、12000gで15分にわたり4℃にて遠心沈殿させた。次いで、30分から16時間にわたり、8μlの直鎖状アクリルアミド、0.1体積の3M NaOAc pH5.2及び3体積の無水エタノールを使用して、RNAを沈殿させた。次いで、チューブを、20000g(14,000rpm)で少なくとも40分にわたり4℃にて遠心沈殿させた。約1mlの85%冷エタノールでペレットを洗浄した。DNAseを60分にわたり37℃にて導入してDNAを消化し(例えば10μlのTurbo(商標)DNase、Ambion、Life Technologies)、その後、酸フェノール/クロロホルムを使用して抽出し、上記に記載したようにエタノール沈殿させた。
3.全RNAの定量化
RiboGreen(登録商標)色素(Thermo Fisher Scientific(登録商標)、デラウェア州、ウィルミントン(Wilmington))を使用するNanoDrop3300(ND3300)蛍光分光計での蛍光分光分析により、全RNAの定量化を実施した。ND3300によるRNA検出範囲は、高濃度のRiboGreen(登録商標)色素(1:200の希釈度)を使用する場合には25ng/ml〜1000ng/mlであり、1:2000の希釈度のRiboGreen(登録商標)色素を使用する場合には5ng/ml〜50ng/mlである。ND3300により測定されるRNA量は、検出される発現マイクロRNAに高度に相関した。
4.マイクロアレイでのマイクロRNAプロファイリング
2172種のmiRs配列、17種の陰性コントロール、23種のスパイク及び10種の陽性コントロールにDNAオリゴヌクレオチドプローブを印刷することにより(合計で2222種のプローブ)、カスタムマイクロアレイ(Agilent Technologies、カリフォルニア州、サンタクララ(Santa Clara))を作成した。各マイクロRNAプローブ(3重で印刷した)は、マイクロRNAの相補配列の3’末端で最大で28個のヌクレオチド(nt)のリンカーを保持した。陰性スパイク及び陽性プローブを3から200回印刷した。ゲノムと一致しない配列を使用して、17種の陰性コントロールプローブを設計した。下記の2群の陽性コントロールプローブを、マイクロRNAアレイにハイブリダイズするように設計した:(i)合成低分子RNAをRNAにスパイクさせた後、標識効率を検証するために標識した、(ii)RNA品質を検証するために、大量の低分子RNA(例えば、核内低分子RNA(U43、U24、Z30、U6、U48、U44)、5.8sリボソームRNA及び5sリボソームRNA)用のプローブをアレイ上にスポットした。
5.マイクロアレイ用のマイクロRNAのCy色素標識
全RNA(20〜1000ng)を、RNAリンカー、p−rCrU−Cy/色素又はいくつかの一連のCy(BioSpring GmbH、IBA GmbH若しくは等価物)の、Cy3又はCy5を有する3’末端への連結(Thomson他、Nature Methods 2004;1:47〜53)により標識した。標識反応は、全RNA、スパイク(0.1〜100fmol)、250〜400ngのRNAリンカー色素、15%DMSO、1×リガーゼ緩衝液及び20ユニットのT4RNAリガーゼ(NEB又は等価物)を含み、この標識反応を1時間にわたり4℃にて進行させ、その後、37℃にて1時間にわたり進行させ、その後、最大で40分にわたり4℃にて進行させた。
標識したRNAを、30μlのハイブリダイゼーション混合物(45μlの10×GE Agilent Blocking Agent及び246μlの2×Hi−RPM Hybridizationの混合物)と混合した。この標識混合物を5分にわたり100℃にてインキュベートし、その後、5分にわたり水浴中で氷インキュベートした。スライドを16〜20時間にわたり54〜55℃にてハイブリダイズさせ、その後2回洗浄した。1回目の洗浄を、5分にわたりAgilent GE Wash Buffer1(例えば6×SSPE+0.005%N−ラウロイルサルコシン+0.005%Triton X−102)で室温にて行ない、その後、5分にわたり37℃にてAgilent GE Wash Buffer2(例えば、0.06×SSPE+0.005%N−ラウロイルサルコシン+0.005%Triton X−102)で2回目の洗浄を行なった。
マイクロアレイスキャナ(Agilent Microarray Scanner Bundle G2565BA、XDR Hi 100%、XDR Lo 10%で5μmの分解能)を使用して、アレイをスキャンした。適切なソフトウェア(Feature Extraction 10.7ソフトウェア、Agilent)を使用して、アレイ画像を分析した。
6.RT−PCR
1〜500ngの全RNAでポリアデニル化及び逆転写を実施した。37℃にて1時間にわたり、ポリ(A)ポリメラーゼ(Poly(A) Polymerase NEB−M0276L)、ATP、コンセンサス配列を含むオリゴdTプライマー及び逆転写酵素(SuperScript(登録商標)II RT、Invitrogen、カリフォルニア州、カールスバッド(Carlsbad))の存在下でRNAをインキュベートした。次に、RT−PCRでcDNAを増幅させた。増幅反応には、マイクロRNA特異的フォワードプライマー(特定のマイクロRNA配列の3’末端又はポリAアダプター配列の一部に相補的なTaqMan(登録商標)(MGB)プローブである)及びオリゴdTテールのコンセンサス3’配列に相補的なユニバーサルリバースプライマーが含まれていた。RT−PCR法の詳細な説明を公報WO2008/029295中に見出すことができ、この内容は参照により本明細書に援用される。
各マイクロRNAに関してサイクル閾値(CT、プローブシグナルが閾値に達するPCRサイクル)を決定した。
RT−PCRからのマイクロRNA発現結果とマイクロアレイからのマイクロRNA発現結果との比較を可能にするために、RT−PCRにより得られた各値を50から減算した(50−CT)。各患者に関する各マイクロRNAの50−CT発現を、マイクロアレイ法により得られたシグナルと比較した。
7.アレイデータの正規化
最初のデータセットは、サンプル毎に複数のプローブに関して測定されたシグナルからなった。分析するために、シグナルを、既知の又は検証済みのヒトマイクロRNAの発現レベルを測定するように設計されているプローブに関してのみ使用した。
信頼できるスポットの対数平均を取ることにより、3重のスポットを組み合わせて1つのシグナルにした。全てのデータを対数変換し、分析を対数空間で実施した。2つの代表的なサンプル(各腫瘍型から1つ)において、各プローブの平均発現レベルを取ることにより、正規化用の参照データベクトルRを算出した。
データベクトルSkを有する各サンプルkに関して、サンプルデータと参照データとの間の最良のフィットをもたらすように2次多項式Fkを見出し、その結果、R≒Fk(Sk)であった。多項式Fをフィットさせるために、離れたデータ点(「外れ値」)を使用しなかった。サンプル中の各プローブ(ベクトルSk中の要素
)に関して、
となるように初期値
を多項式関数Fkで変換することにより、この初期値から(対数空間中の)正規化値
を算出する。対数空間中で統計分析を実施する。倍数変化を提示するために及び算出するために、指数を取ってデータを線形空間に戻す。
8.miRNA−seq配列ライブラリーの構築
用いる高スループットシークエンシングプラットホームに応じて多種多様なキットを使用して、配列ライブラリーの構築を実施することができる。しかしながら、低分子RNAシークエンシングの準備のためのいくつかの共通のステップが存在する。連結ステップではDNAアダプターが低分子RNAの両末端に付加され、このDNAアダプターは、逆転写及びPCR増幅の最中にプライマー結合部位として作用する。T4 RNAリガーゼ等の連結酵素を使用して、又は5’RACE反応2を使用して5’アダプターを付加することにより、5’アダプターを伴うアデニル化一本鎖DNA3’アダプターを低分子RNAに連結させる。このアダプターはまた、5’ヒドロキシル基を有するRNA分解産物ではなく、特徴的なマイクロRNAである5’リン酸基を有する低分子RNAを捕捉するように設計されている。逆転写ステップ及びPCR増幅ステップでは、低分子アダプター連結RNAが、シークエンシング反応で使用されるcDNAクローンへと変換される。次いで、PCRを実行してcDNA配列のプールを増幅させる。このステップでは、特徴のあるヌクレオチドタグを考慮して設計されているプライマーを使用して、プールされたライブラリーの多重シークエンシングでIDタグを作成することもできる。
9.次世代シークエンシング(NGS)
各FFPEサンプルからの500ngのRNAを低分子RNAディープシークエンシング(miRSeq)に使用した。ライブラリーを、配列分析装置(Illumina(登録商標)HiSeq(商標)2000 DNA)の2つのレーン上にローディングした。ライブラリー1つの当たり平均して約6300000個の読み取りデータを得た。新規のマイクロRNAを発見するために、生配列データに配列分析ソフトウェア(miRDeep2、Friedlander MR他、Nucleic Acids Res.2012 Jan;40(1):37〜52)を適用した(プライマー−アダプター配列を取り除いた)。
10.統計分析
対数変換された正規化蛍光シグナルに両側(独立)スチューデントのt検定を使用して、p値を算出した。多重仮説検定の影響を補正するために0.05から1の偽陽性率(FDR)を設定することにより有意差の閾値を決定し、0.01〜0.06の範囲のp値カットオフを得た。それぞれ差次的に発現されたマイクロRNAに関して、倍数差異(正規化蛍光の中央値(median normalized fluorescence)の比)及び受信者動作特性(ROC)曲線の曲線下面積(AUC)を算出した。下記の3つのセットのmiRを統計分析から除外した:(a)血液サンプル中で高度に発現されることが既に分かっているmiR(FNAサンプル中の血液の高い割合に起因する)、(b)発現レベルがRNAの減少量と相関しないmiR(即ち、測定されたRNA量の減少と関連してシグナルの線形減少を示さないmiR)、及び(c)発現レベルがセット(b)のmiRと相関しているmiR。
(例1:手術前サンプルでのマイクロRNAの検出)
この方法の実行可能性を確保するために、マイクロRNAプロファイリングのパイロット研究を、ex−vivoでのFNA生検サンプルからの少量のパパニコロウ染色塗抹標本、ギムザ染色塗抹標本及びDiff−Quick染色塗抹標本で行なった。FNA塗抹標本は細胞をほとんど有しないことが多いことから、ごく少量のRNA(例えば1〜1000ng)を分析に提供する場合に、そのように低いRNA量でマイクロRNAが検出可能であるかどうかを最初に評価する必要があった。そのため、ギムザ染色した乳頭癌塗抹標本及び非乳頭癌塗抹標本において、約2200種の個々のマイクロRNAのマイクロRNA発現レベルを測定した。乳頭癌と相関することが既に分かっている5種のマイクロRNA(hsa−miR−146b−5p、hsa−miR−31−5p、hsa−miR−222−3p、hsa−miR−221−3p及びhsa−miR−21−5p)が乳頭癌塗抹標本中で過剰発現されることが判明した。図1は、ギムザ染色した乳頭癌サンプルと非乳頭癌サンプルとの間でのマイクロRNA発現の比較を示しており、この図1から、乳頭癌中で高度の上方制御されたマイクロRNAマーカーが明らかになる。この結果は、FNA塗抹標本でのマイクロRNAプロファイルの決定に成功することがきることを強く示唆した。
(例2:悪性の甲状腺病変と良性の甲状腺病変との間のマイクロRNA発現の差異)
実験分析で使用するサンプルのコホートは、Department of Pathology Temple University Hospital(米国、フィラデルフィア)で保存されていた試料から選択された73種の手術前甲状腺FNA細胞塊からなった。この73種の検体には、35種の良性の甲状腺病変のサンプル及び38種の悪性の甲状腺病変のサンプルが含まれていた。35種の良性腫瘍は、18種の濾胞腺腫サンプル、8種の橋本甲状腺炎サンプル及び9種の過形成(甲状腺腫)サンプルからなった。38種の悪性腫瘍は、10種の濾胞状腺癌及び28種の乳頭癌からなった。28種の乳頭癌サンプルの内、9種は乳頭癌であり、13種は被包性濾胞型乳頭癌(papillary carcinoma follicular variant encapsulated)であり、6種は非被包性濾胞型乳頭癌(papillary carcinoma follicular variant non−encapsulated)であった。甲状腺病変の悪性又は良性を最終的には組織学的診断で評価した。「甲状腺細胞病理を報告するためのBethesdaシステム(The Bethesda System for Reporting Thyroid Cytopathology)」(Syed,Z.Ali及びEdmund S.Cibas編;DOI 10.1007/978−0−387−87666−5_1;Springer Science+Business Media,LLC 2010)に基づいて細胞学的分類を行なった。研究プロコトルは、提供機関のInstitutional Review Board(IRB、Ethical Review Boardと等価)の承認を得た。World Health Organization(WHO)ガイドラインに基づいて腫瘍分類を行なった。追加のコホートは13種の甲状腺ex−vivoFNA塗抹標本(甲状腺摘除術後に調製されている)からなり、University Milano−Bicocca(イタリア、ミラノ)から得た。
これらのサンプルから全RNA(少なくも10ng)を抽出し、約2200種のmiRを含むカスタムマイクロアレイを使用してマイクロRNA発現をプロファイリングした。結果は、表3に列挙するいくつかのmiRの良性病変と悪性病変との間の発現パターンに有意差を示した(良性に対して悪性で上方制御された、又は下方制御された)。
35種の良性FNAサンプル及び38種の悪性FNAサンプルでのmiRNA発現に基づいて、悪性甲状腺腫瘍と良性甲状腺腫瘍とを区別するための分類アルゴリズムを開発した。良性若しくは悪性で又は特定の甲状腺腫瘍サブタイプ間(データを示さない)で、これらの条件で差次的に発現されることが分かっている8種のmiR(hsa−miR−125b−5p、hsa−miR−21−5p、hsa−miR−222−3p、hsa−miR−221−3p、hsa−miR−146b−5p、hsa−miR−181a−5p、hsa−miR−138−5p及びMID−23794)に基づいて、悪性甲状腺病変と良性甲状腺病変とを区別するために、ロジスティック回帰分類器をトレーニングした。この分類器は、悪性サンプルを同定するために87%の感度及び91%の特異度で89%の精度に達した。hsa−miR−125b−5p、hsa−miR−21−5p、hsa−miR−222−3p、hsa−miR−221−3p、hsa−miR−146b−5p及びhsa−miR−181a−5pは悪性病変でより高い発現を示し、hsa−miR−138−5p及びMID−23794は良性病変でより高い発現を示した(データを示さない)。
(例3:悪性の甲状腺病変及び良性の甲状腺病変の様々なサブタイプの判別)
18種の濾胞腺腫サンプル及び10種の濾胞腺癌サンプルでmiRの発現レベルを比較した。濾胞腺癌に対して濾胞腺腫で上方制御された又は下方制御されたマイクロRNAを表4に示す。
9種の乳頭癌(非濾胞型)サンプルに対して18種の濾胞腺腫でmiRの発現レベルを比較し、hsa−miR−146b−5p及びhsa−miR−21−5pの発現レベルを使用して、濾胞腺腫サンプルと乳頭癌サンプルとを判別するための100%の精度(データを示さない)の分類器を作成した。
19種の濾胞型乳頭癌サンプルに対して18種の濾胞腺腫サンプルでmiRの発現レベルを比較した。濾胞腺腫に対して濾胞型乳頭癌で上方制御された又は下方制御されたマイクロRNAを表5に示す。
35種の良性サンプルに対して6種の非被包性濾胞型乳頭癌サンプルでmiRの発現レベルを比較し、hsa−miR−221−3p及びhsa−miR−200b−3pの発現レベルを使用して、98%の精度、83%の感度及び100%の特異度(データを示さない)の分類器を作成した。
8種の橋本甲状腺炎サンプル及び9種の(非濾胞)乳頭癌サンプルでmiRの発現レベルを比較した。橋本甲状腺炎に対して乳頭癌で上方制御された又は下方制御されたマイクロRNAを表6に示す。これら2種の甲状腺病変を比較するためのプロファイルシグネチャー(profile signature)の最良の候補であるmiRは、hsa−miR−146b−5p、hsa−miR−200a−3p及びMID−23794である。
(例4:ディープシークエンシングによる新規のマイクロRNAバイオマーカーの同定)
濾胞性病変からの11種のFFPE(ホルマリン固定パラフィン包埋)甲状腺切除サンプル(外科的生検から得られ、ホルマリン中で固定され、パラフィン中で保存されている)を、Department of Pathology at Rabin Medical Centerから得た。これらの検体には、6種の濾胞腺腫及び5種の濾胞腺癌が含まれていた。全てのサンプルで、腫瘍細胞含有量は50%超であった。
配列分析ソフトウェアにより合計で386種の新規の候補マイクロRNAを発見し、qPCRで実施する場合に、これらの候補マイクロRNAのうちの27種を検証用に選択した。2種の新規のマイクロRNA(MD2−495及びMD2−437)が本明細書で開示されており、これらのマイクロRNAの配列を表1に示し、これらのマイクロRNAそれぞれのヘアピンを表2に示す。図2Aは、配列分析ソフトウェアにより予測した場合の、これら2種の新規のマイクロRNAの二次構造を示す。図2Bは、11種のサンプルそれぞれにおける、これら2種の新規のマイクロRNAの発現(読み取りデータの正規化数)を示す。右側の色分けされたバーは発現のスケールを表す。
(例5:特定のマイクロRNAは、良性甲状腺病変と悪性甲状腺病変との間で差次的に発現される)
イスラエルの医療センターから、染色された甲状腺FNA塗抹標本を得て(コホートI)、米国の医療センターから甲状腺FNA細胞塊を得た(コホートII)。両方のコホートに関して、切除された腫瘍の組織学的診断に基づいて、甲状腺病変を最終的には悪性又は良性に分類した。これら2種のコホートからのサンプルの分解の概要を表7に示す。
上記に記載の組織内で開発したプロトコルを使用して、サンプルから高純度RNA(マイクロRNA画分を含む)を抽出した。差次的に発現されたマイクロRNAを同定するために及び分類器を開発するために2000種超のマイクロRNAを測定するカスタム印刷マイクロアレイにより、FFPEサンプル及び細胞学的(FNA)サンプルをプロファイリングした。
2000種超のマイクロRNAを測定するカスタム印刷マイクロアレイにより及びqPCRによる96種のマイクロRNAで、150種超の甲状腺FNAサンプル(表7)をプロファイリングした。図3A(コホートI)及び図3B(コホートII)は、悪性小結節を有する患者でのマイクロアレイによるマイクロRNA発現レベルの中央値(y軸)及び良性小結節を有する患者でのマイクロアレイによるマイクロRNA発現レベルの中央値(x軸)を示す。各マイクロRNAに関して、FDR=0.1であるMann−Whitney検定により、2つの群の値を比較した。
良性新生物と悪性新生物との間でのマイクロRNAの差次的発現を発見した。2種のマイクロRNA、即ちhsa−miR−146b−5p及びhsa−miR−375に基づく悪性塗抹標本対良性塗抹標本の分類は85%超の精度である(10回実行した10倍交差検証の中央値に基づく、データを示さず)。
(例6:hsa−miR−375は、FNAサンプルにおいて甲状腺髄様癌の有意なマーカーである)
FNAコホートIでのhsa−miR−375(配列番号8)の発現レベルを、甲状腺髄様がんサンプル(n=6)とその他の甲状腺結節からのサンプル(n=75)との間で比較した。結果を図4に示す。結果として、hsa−miR−375は甲状腺髄様癌の有意なマーカーである。
(例7:染色された甲状腺塗抹標本をマイクロRNAプロファイリングに使用することができる)
様々な色素で染色したサンプルでのマイクロRNA発現レベルを比較して、染色時のマイクロRNAの安定性及びマイクロRNAレベル検出の再現性を評価した。FNAコホートIからの合計で143種の塗抹標本を下記の通りに染色した:60種をメイグリュンワルドギムザ染色し、64種をDiffQuikで染色し、19種をパパニコロウ染色した。様々な色素で染色した同じサンプルの2重のマイクロRNA発現レベルは、(予測を超える)有意な相関性を示した。異なる染色間でのmiR−146b−5p発現レベルの類似性を図5A〜図5Bで更に実証しており、図5A〜図5Bは、52組のメイグリュンワルドギムザ−DiffQuikペア(図5A)で分かるように、及び15組のDiffQuik−パパニコロウペア(図5B)で分かるように、hsa−miR−146b−5p(配列番号10〜11)の正規化発現レベルは同じサンプルを様々な色素で染色する場合に類似することを示す。
従って、臨床設定で使用した様々な細胞学的色素(パパニコロウ、メイグリュンワルドギムザ及びDiffQuik)は、マイクロRNA発現の検出及び定量化に影響を及ぼさない。
(例8:甲状腺の分類−アッセイの開発)
甲状腺サンプルの状態を悪性又は良性と確定するために、全体で合計24種のマイクロRNAを選択した(表12)。マイクロRNA発現を、上記に記載したようにRT−PCRで測定した。miR及びこれらmiRの各フォワードプライマーのリストを表8に示す。最初の鎖生成を、下記に示すポリTアダプターを使用して行なった。フォワードプライマーは配列特異的であるが、リバースプライマーはユニバーサルであった。下記のmiR用のユニバーサルMGBプローブ:hsa−miR−31−5p(配列番号5〜7)、hsa−miR−5701(配列番号35)、hsa−miR−424−3p(配列番号16)、MID−50971(配列番号34)、MID−20094(配列番号27〜28)、MID−50976(配列番号33)、hsa−miR−3074−5p(配列番号32)、hsa−miR−222−3p(配列番号1〜2)、MID−50969(配列番号29)、hsa−miR−146b−5p(配列番号10〜11)、hsa−miR−346(配列番号14)、MID−16582(配列番号25)により、又は表9に示したmiRに特異的なプローブにより、RT−PCR産物の検出を行なった。
リバースプライマー、ポリTアダプター及びMGBプローブの配列を下記に示す:
− リバースプライマー
GCGAGCACAGAATTAATACGAC(配列番号309)、
− ポリTアダプター
GCGAGCACAGAATTAATACGACTCACTATCGGTTTTTTTTTTTTVN(配列番号310)(この配列中、「V」はA、G又はCのいずれか1つであることができ、「N」はG、C、A又はU/Tのいずれか1つであることができる)、
− ユニバーサルMGBプローブ
AAAACCGATAGTGAGTCG(配列番号311)。
本発明者らが実施したいくつかの予備的研究での発現パターン(データを示さない)に基づいてマーカーマイクロRNAを選択し、このマーカーマイクロRNAを「悪性」「細胞型」又は正規化器として使用すべきものに分類するための根拠を形成した。
「悪性マーカー」hsa−miR−222−3p、hsa−miR−551b−3p、hsa−miR−31−5p、hsa−miR−375、hsa−miR−125b−5p、hsa−miR−152−3p、hsa−miR−346、hsa−miR−181c−5p、hsa−miR−424−3p及びhsa−miR−146b−5pを、これらのマイクロRNAの良性サンプルでの発現と比較した悪性サンプルでの発現レベルに従って確立した。
本発明者らは、「細胞型」マーカーhsa−miR−486−5p、hsa−miR−342−3p、hsa−miR−138−5p、hsa−miR−200c−3p及びMID−16582を、下記に例示するパターン又は発現に従って選択した。
hsa−miR−486−5p(配列番号22)は、甲状腺上皮細胞と比較して全血中で富化されていることが分かった。その他のマイクロRNA(データを示さず)と共に、甲状腺FNAサンプル中の血液量と関連することが分かった。そのため、hsa−miR−486−5p(配列番号22)は全血マーカーの一例である。miR−486−5pと高い相関(>0.85)で数種のマイクロRNAを検出し、これらのマイクロRNAも血液マーカーと考えられ得、これらのマイクロRNAとして、hsa−miR−320a、hsa−miR−106a−5p、hsa−miR−93−5p、hsa−miR−17−3p、hsa−let−7d−5p、hsa−miR−107、hsa−miR−103a−3p、hsa−miR−17−5p、hsa−miR−191−5p、hsa−miR−25−3p、hsa−miR−106b−5p、hsa−miR−20a−5p、hsa−miR−18a−5p、hsa−miR−144−3p、hsa−miR−140−3p、hsa−miR−15b−5p、hsa−miR−16−5p、hsa−miR−92a−3p、hsa−miR−484、hsa−miR−151a−5p、hsa−let−7f−5p、hsa−let−7a−5p、hsa−let−7c−5p、hsa−let−7b−5p、hsa−let−7g−5p、hsa−let−7i−5p、hsa−miR−185−5p、hsa−miR−30d−5p、hsa−miR−30b−5p、hsa−miR−30c−5p、hsa−miR−19b−3p、hsa−miR−26a−5p、hsa−miR−26b−5p、hsa−miR−425−5p、MID−19433及びhsa−miR−4306が挙げられる。
本発明者らは、血液成分のマイクロRNAプロファイルの測定時に、多くのマイクロRNAの様々な血液細胞型での上昇の発見を観測している(データを示さない)。例えば、中でも特にhsa−miR−342−3p(配列番号17〜18)は白血球中で富化されたマイクロRNAのうちの1つであり、従って、白血球マーカーの一例と考えられ得る。興味深いことに、hsa−miR−342−3pがhsa−miR−150−5pと相関して発現されることが示され、このことは、hsa−miR−150−5pも白血球マーカーであることを示唆する。加えて、hsa−miR−146a−5pも白血球細胞中で発現されることが示された(データを示さない)。
hsa−miR−200c−3p(配列番号23〜24)及びhsa−miR−138−5p(配列番号19〜21)が上皮細胞中で富化されていることが分かった。予備的実験では、甲状腺組織物質を欠いた血液で塗抹標本を生成し、甲状腺組織由来の塗抹標本と比較した。hsa−miR−200c−3p(配列番号23〜24)及びhsa−miR−138−5p(配列番号19〜21)の両方が、血液塗抹標本と比べて甲状腺塗抹標本(良性及び悪性の両方)ではるかに高いレベルで発現されることが分かった(データを示さない)。上皮細胞中で富化されているその他のマイクロRNAも発見した(データを示さない)。そのため、hsa−miR−200c−3p(配列番号23〜24)及びhsa−miR−138−5p(配列番号19〜21)は上皮細胞マーカーの例である。興味深いことに、本発明者らは、hsa−miR−138−5pの発現が上皮細胞の存在と相関性があることを発見し、データのある種のサブセットでは、hsa−miR−138−5pが良性サンプルで上方制御されることが分かった(データを示さない)。
MID−16582(配列番号25)は、Hurthle細胞ではより高い発現レベルで存在した。予備的研究では、本発明者らは驚いたことに、このマイクロRNAが、Hurthle細胞が認められない濾胞腺腫に対して、Hurthle細胞を提示する濾胞腺腫で上方制御されることを発見した(図6A〜図6B)。この結果は、Hurthle細胞で発見されたミトコンドリアの富化に起因することができる。本発明者らは、MID−16582の配列(配列番号25)及びHurthle細胞で発見されたその他の核酸配列をミトコンドリアDNAにマッピングすることができることを発見した(データを示さない)。そのため、MID−16582はHurthle細胞マーカーの一例である。
アッセイ開発用トレーニングセットには、約360種の特徴的なサンプルが含まれていた。サンプルの大部分は、染色されたFNA塗抹標本(パパニコロウ、メイグリュンワルドギムザ又はDiff−Quik)であった。45種のFNAサンプルは細胞塊であった。これらのサンプルを、イスラエル、欧州及び米国の医療センターから採取した。サンプルの大部分は「未確定」FNA(Bethesda分類に従う、71種のクラスIII、113種のクラスIV及び74種のクラスV)であり、その他は「確定」(38種のクラスII、60種のクラスVI)であった。このトレーニングセットは悪性甲状腺結節(n=197)及び良性甲状腺結節(n=155)で構成され、このトレーニングセットには、代表で8種の主な組織学的亜型の甲状腺結節が含まれていた。33種のサンプルは、1cm未満のサイズである甲状腺結節に由来した。最小の結節サイズは0.1cmであった。示した場合を除き、髄様癌のサンプルを大部分の分析から除外した。表10は、1つのカテゴリー当たりのサンプルの分布を示す。
定常的に調製されたFNA塗抹標本由来のサンプル及び細胞塊を、全RNA抽出及びRT−PCR増幅に使用した。全てのサンプルを、15種のマーカーマイクロRNA及び正規化器として使用する9種のマイクロRNAのパネルで試験した(表11)。
サンプルの一部(n=353)でのトレーニングの結果を図7に示す。閾値を超えるマイクロRNA:hsa−miR−222−3p(配列番号1〜2)、hsa−miR−551b−3p(配列番号3〜4)、hsa−miR−31−5p(配列番号5〜7)、hsa−miR−125b−5p(配列番号9)、hsa−miR−146b−5p(配列番号10〜11)、hsa−miR−346(配列番号14)、hsa−miR−181c−5p(配列番号15)及びhsa−miR−375(配列番号8)の発現が、悪性サンプルと相関して見出される。図7に示す発現レベルを、下記式:[50−各マーカーの正規化Ct]により得た。正規化を、正規化器の平均シグナルを減算することにより行なった。使用した全てのサンプルを超える正規化器の平均シグナルの値を、検出した全ての発現値に加算して、この発現値を、算出でより扱いやすい範囲にした。興味深いことに、hsa−miR−125a−5pの発現レベルはhsa−miR−125b−5pの発現レベルと相関する。
(例9:甲状腺アッセイ用の分類器の確立)
下記の4種のアルゴリズム:判別分析、K最近傍(KNN)、サポートベクターマシン(SUV)、及び判別分析分類器のアンサンブル(判別分析アンサンブル)を使用して、甲状腺アッセイで実行される最良の分類器を確立した。
下記のパラメーターを経験的に確立した。
− 事前分布:使用した全てのアルゴリズムに関して、事前分布を悪性サンプルの場合には70%に設定し、良性サンプルの場合には30%に設定した。
− サンプルセット:本例では、3つのサンプルセットを分析した。1つのサンプルセットには、悪性サンプル(n=183)及び良性サンプル(n=155)が含まれており、悪性の髄質サンプルが除外されており、下記及び図中では「悪性+良性」と称される。別のサンプルセットには全て「未確定」サンプルが含まれおり、これらのサンプルに含まれるのは全て、Bethesda III、IV及びVと分類されたサンプルであり、下記及び図中では「未確定」と称される。第3のサンプルセットには、Bethesda IVのみに分類されたサンプルが含まれており、下記及び図中では「Bethesda」と称される。Bethesda IVと分類された甲状腺病変由来のサンプルは通常、組織学的パラメーターによる分類が困難である。従って、サンプルのサブグループに基づいている分類器を確立することが重要である。加えて、様々な理由に起因して技術的問題を示す特定のサンプル(例えば、Bethesda IIの悪性サンプル、リンパ節から採取されたサンプル)を除外した。
− 髄質サンプルを分類から除外した。従って、本例では、悪性サンプルに言及する場合には非髄質の悪性を意味する。
− マイクロRNA発現レベルの正規化:マイクロRNA発現レベルを、いわゆる正規化器マイクロRNA[hsa−miR−23a−3p、MID−20094、MID−50969、hsa−miR−345−5p、hsa−miR−3074−5p、MID−50976、MID−50971、hsa−miR−5701及びhsa−miR−574−3p]で正規化し、50から減算し、より低いCTをより高い発現値と関連付けた。
− マイクロRNA比:分類器からある種の係数を減算するために、マイクロRNAの対から比を得た。そのため、例えばhsa−miR−31−5p:hsa−miR−342−3pの比率により、hsa−miR−31−5pの発現(分子)における(分母であるhsa−miR−342−3pの発現による)白血球の寄与を低減させることができる。CTは対数スケールであることから、あるmiR発現をその他から減算することにより比を作成した。定数を加算することにより各比を更に正規化し、これらの比をマイクロRNAの正規化値と同じ範囲内にした。
(例9.1:判別分析分類器)
判別分析をアルゴリズムとして使用した場合、(マイクロRNA発現レベルの様々な組合せ(図8A〜図8C、図23A〜図23C及び図37A〜図37C)、マイクロRNA比(図9A〜図9C、図24A〜図24C及び図38A〜図38C)、又はマイクロRNA発現レベルとマイクロRNA比との組合せ(図10A〜図10C、図25A〜図25C及び図39A〜図39C)のいずれかを特徴として使用する)上記で述べた3セットのサンプルにおいて、線形判別型の判別分析を適用した。
上記で述べたように、3セットのサンプルをこのアルゴリズムで実行した。図8A〜図8C、図9A〜図9C及び図10A〜図10Cは、悪性サンプル+良性サンプルに関するこのアルゴリズムの結果を示す。図23A〜図23C、図24A〜図24C及び図25A〜図25Cは、未確定サンプルに関するこのアルゴリズムの結果を示す。図37A〜図37C、図38A〜図38C及び図39A〜図39Cは、BethesdaIVサンプルに関するこのアルゴリズムの結果を示す。
(例9.2:KNN分類器)
アルゴリズムとしてKNN(k最近傍)を使用して1つの分析を実施し、この分析では、k=5をPearson相関の距離メトリックと共に使用した。KNNアルゴリズムにより分析を、マイクロRNA発現レベルの様々な組合せ(図11A〜図11C、図26A〜図26C及び図40A〜図40C)、マイクロRNA比(図12A〜図12B、図27A〜図27B及び図41A〜図41B)、又はマイクロRNA発現レベルとマイクロRNA比との組合せ(図13A〜図13C、図28A〜図28C及び図42A〜図42C)のいずれかを特徴として使用して、上記で述べた3セットのサンプル(悪性+良性、未確定及びBethesda IV)に適用した。
上記で述べたように、3セットのサンプルをこのアルゴリズムで実行した。図11A〜図11C、図12A〜図12B及び図13A〜図13Cは、悪性サンプル+良性サンプルに関するこのアルゴリズムの結果を示す。図26A〜図26C、図27A〜図27B及び図28A〜図28Cは、未確定サンプルに関するこのアルゴリズムの結果を示す。図40A〜図40C、図41A〜図41C及び図42A〜図42Cは、Bethesda IVサンプルに関するこのアルゴリズムの結果を示す。
(例9.3:SVM分類器)
アルゴリズムとして、線形カーネルを使用するSVM(サポートベクターマシン)を適用することにより、第3の分析を実施した。SVMアルゴリズムによる分析を、マイクロRNA発現レベルの様々な組合せ(図14A〜図14C、図29A〜図29C及び図43A〜図43C)、マイクロRNA比(図15A〜図15C、図30A〜図30C及び図44A〜図44C)、又はマイクロRNA発現レベルとマイクロRNA比との組合せ(図16A〜図16C、図31A〜図31C及び図45A〜図45C)のいずれかを特徴としてそれぞれ使用して、上記で述べた3セットのサンプル(悪性+良性、未確定及びBethesda IV)に適用した。
上記で述べたように、3セットのサンプルをこのアルゴリズムで実行した。図14A〜図14C、図15A〜図15C及び図16A〜図16Cは、悪性サンプル+良性サンプルに関するこのアルゴリズムの結果を示す。図29A〜図29C、図30A〜図30C及び図31A〜図31Cは、未確定サンプルに関するこのアルゴリズムの結果を示す。図43A〜図43C、図44A〜図44C及び図45A〜図45Cは、Bethesda IVサンプルに関するこのアルゴリズムの結果を示す。
(例9.4:アンサンブル法分類器)
アルゴリズムとしてアンサンブル法を適用することにより、第4の分析を実施した。AdaBoostを使用して、最大で100種の判別分析分類器のアンサンブルを作成し、データに適用した。アンサンブルアルゴリズムによる分析を、マイクロRNA発現レベルの様々な組合せ(図17A〜図17C、図32A〜図32C及び図46A〜図46C)、マイクロRNA比(図18A〜図18C、図33A〜図33C及び図47A〜図47C)、又はマイクロRNA発現レベルとマイクロRNA比との組合せ(図19A〜図19C、図34A〜図34C及び図48A〜図48C)のいずれかを特徴として使用して、上記で述べた3セットのサンプル(悪性+良性、未確定及びBethesda IV)に適用した。
上記で述べたように、3セットのサンプルをこのアルゴリズムで実行した。図17A〜図17C、図18A〜図18C及び図19A〜図19Cは、悪性サンプル+良性サンプルに関するこのアルゴリズムの結果を示す。図32A〜図32C、図33A〜図33C及び図34A〜図34Cは、未確定サンプルに関するこのアルゴリズムの結果を示す。図46A〜図46C、図47A〜図47C及び図48A〜図48Cは、Bethesda IVサンプルに関するこのアルゴリズムの結果を示す。
(例10.髄質を含む悪性サンプルに関する分類器)
例9で使用したものと同じサンプルセットではあるが、髄質の悪性サンプルを更に含むサンプルセットを使用して、分類器を確立した。このサンプルのセットで全ての分類器を適用し、このサンプルのセットで適用された判別分析アルゴリズムからの結果の代表的なセットを図51及び図52で表す。2種のマイクロRNA比(hsa−miR−125b−5p:hsa−miR−138−5p及びhsa−miR−146b−5p:hsa−miR−342−3p)の正規化値を分類用の特徴として使用した場合、この分類器の感度は84.7%であり、特異度は80.8%であった。2種のマイクロRNA(hsa−miR−222−3p及びhsa−miR−551b−3p)の正規化値を分類用の特徴として使用した場合、感度は85.2%であり、特異度は53.6%であった。
(例11:細胞特異的マーカーの発現によるサンプルの除去)
この研究中の1つの重要な検討事項は、FNAサンプルを採取した患者に提供される結果の精度であった。検査室は、偽陰性結果を提供しないようにとミスを犯しがちである。その一方で、FNA検体の分析では、疑わしい診断により患者に外科手術が行なわれており、このケースでの25%超で不必要であることが判明している。例えば、文献での少なくとも1つの報告には、大量の血液を含む甲状腺腫瘍サンプル又は純粋な血液は、9例のケースのうちの7例で疑わしいと誤診されていると記載されている(Walsh他(2012)J Clin Endocrin Metab.doi:10.1210/jc.2012〜1923)。
この目標を念頭において、本発明者らは、細胞型マーカーとして使用することができる及び調べる検体の品質のスクリーニングに役立つマイクロRNAを探した。そのため、良性及び悪性の(非髄質の)甲状腺病変からのサンプル並びに血液のみからなる4種のサンプル(この目的のために血液塗抹標本のスライドを生成し、本明細書に記載したようにRNAを抽出した)を有するトレーニングコホート(細胞塊を含む)において、hsa−miR−486−5p(配列番号22)及びhsa−miR−200c−3p(配列番号23〜24)の発現を評価した。図53は、この実験の結果を示す。トレーニングセットで規定された閾値と比較して、血液マイクロRNAマーカーhsa−miR−486−5pは非常に高く、上皮マーカーhsa−miR−200c−3pは非常に低い。従って、これらのマーカーを使用して血液塗抹サンプルを除去した。この発現パターンは、これらのサンプルが、(上皮細胞マーカーを欠いているために)試験を続けるのに十分な上皮細胞を有していないことを示す。試験の場面では、血液塗抹標本のこれら4種のサンプルは不適格であると見なされて廃棄されるだろう。血液塗抹標本では、この閾値と比較してhsa−miR−138−5p(配列番号19〜21)の発現も低いことが分かっている(データを示さない)。このプロファイルを有するサンプルを、不適格であると見なすことができる、及び/又は甲状腺病変サンプルの分類用のプロトコルから廃棄することができる。
本発明者らは、hsa−miR−342−3p(配列番号17〜18)の発現が白血球と相関することを既に立証している(データを示さない)。従って、閾値と比較して高いhsa−miR−342−3pの発現は十分な甲状腺細胞の欠如を示しており、このプロファイルを有するサンプルを不適格であると見なすことができる、及び/又は甲状腺病変サンプルの分類用のプロトコルから廃棄することができる。
平行して、高発現のhsa−miR−200c−3pは、一般に上皮細胞の存在の指標であり、特に甲状腺細胞の存在の指標である(データを示さない、及び図53)。従って、閾値を超えるhsa−miR−200c−3pの発現を、サンプル中における十分な量の甲状腺細胞の指標として使用することができる。
(例12:甲状腺腫瘍亜型の分類)
トレーニングコホートから、橋本(n=6)由来の及び濾胞腺腫(FA、n=81)由来のサンプルを使用して、良性の甲状腺腫瘍亜型の分類を行なった。結果を図54に示す。橋本サンプル中におけるhsa−miR−342−3p(配列番号17〜18)及びhsa−miR−31−5pの発現は、トレーニングセットで規定された閾値と比べて高かった。そのため、高発現のhsa−miR−342−3pのみ又はhsa−miR−31−5pとの組合せを使用して、サンプルを良性に分類することができ、橋本に更に亜型分類することができる。
更に、本発明者らは、良性の甲状腺腫瘍を亜型分類するために、マイクロRNA比も試験した。これに関連して、hsa−miR−125b−5p:hsa−miR−200c−3pのmiR比は、橋本サンプルに対する濾胞腺腫(FA)の分類に有意であった(データを示さない)。
トレーニングコホートのサンプルの一部(n=177)を使用して、悪性の甲状腺腫瘍亜型の分類を行なった。図55は、146b−5p、222−3p、31−5p、125b−5p、551−3p及び375が乳頭癌でより高度に発現されることが分かり、MID−16582が濾胞腺癌でより高度に発現されることが分かった分析の一例を提供する。
下記のmiR対の比は、濾胞腺癌サンプルに対する乳頭癌(PC)サンプルの分類に有意であった:hsa−miR−146b−5p:hsa−miR−342−3p、hsa−miR−125b−5p:hsa−miR−200c−3p、hsa−miR−222−3p:hsa−miR−486−5p、hsa−miR−31−5p:hsa−miR−342−3p、MID−16582:hsa−miR−200c−3p、MID−16582:hsa−miR−138−5p(データを示さない)。
従って、本発明者らは、miR比を使用して、特に分母がhsa−miR−486−5p、hsa−miR−200c−3p、hsa−miR−138−5p及びhsa−miR−342−3p等の細胞マーカーマイクロRNAであるmiR比を使用して、悪性の甲状腺腫瘍の亜型分類を実施することができることを実証した。
(例13:甲状腺結節の悪性又は良性への分類用のプロトコル)
図56は、FNAサンプルの採取から検査室での分析及び診断までの、甲状腺結節サンプル分析用のプロトコルを有するフローチャートを示す。甲状腺結節を有する患者からFNAサンプルを採取し、定常的に処理する。このFNAサンプルから塗抹標本を調製する。第1のステップとして、細胞病理学の専門家はFNAサンプルを検査して分析を行なう。この分析が決定的ではない場合には、特にBethesda III、IV又はV(即ち、いわゆる「未確定」)と分類されているサンプルにおいて、この分析が決定的ではない場合には、サンプルをRosetta Genomics検査室に送付してマイクロRNAプロファイリング及び決定的な診断にかける。サンプルから全RNAを抽出してマイクロRNAプロファイリングにかける。上記の例で示したように、増幅(RT−PCR若しくはNGS)又はハイブリダイゼーション(マイクロアレイ)により、マイクロRNAプロファイリングを実施することができる。
このプロトコルは、下記のうちのいずれか1つを含むことできる。
− 1種又は複数種のアルゴリズムを分類中に使用することができ、このアルゴリズムを、単一のマイクロRNA発現、マイクロRNA比又はこれらの組合せを含むデータに適用することができる。
− 図4(アレイにより分析された発現)及び図20(PCRにより分析された発現)での例に関して実証されているように、hsa−miR−375の発現レベルが特定の閾値を超えるサンプルを悪性と決定することができる(例えば少なくとも10の閾値又は少なくとも18の閾値)。この閾値は、サンプルの正規化によって及びマイクロRNAを測定するために使用した方法によって決まる。この閾値はまた、標的の感度及び特異度の関数でもある。
− 図21、図35及び図49での例に関して実証されているように、hsa−miR−146b−5pの発現レベルが特定の閾値を超えるサンプルを悪性と決定することができる(例えば少なくとも16の閾値)。この閾値は、サンプルの正規化によって及びマイクロRNAを測定するために使用した方法によって決まる。この閾値はまた、標的の感度及び特異度の関数でもある。
− 図22、図36及び図50での例に関して実証されているように、比hsa−miR−146b−5p:hsa−miR−342−3p(更に正規化した比)が特定の閾値を超えるサンプルを悪性と決定することができる(例えば少なくとも16の閾値)。この閾値は、サンプルの正規化によって及びマイクロRNAを測定するために使用した方法によって決まる。
− 不十分な腫瘍由来物質に起因して、正規化器の発現のレベルを、サンプルを廃棄するための指標として使用することができる。そのため、低レベルの正規化器のいずれか又は正規化器に関する発現の最小値、中央値若しくは最大値を示すサンプルが廃棄され得る。例えば、(コホートでのhsa−miR−23a−3p発現の全体的なレベルと比較して)低レベルのhsa−miR−23a−3pは誤分類される可能性がある。対照的に、高レベルのhsa−miR−23a−3pは、感度及び特異度を改善することで分類を改善する(データを示さない)。
マイクロRNAプロファイリングデータの分析から、甲状腺結節を良性又は悪性と診断する。図54及び図55に示すように、甲状腺腫瘍亜型と関連付けることができるマイクロRNAの発現を含む結果が許容される場合、例えば、サンプルを、その甲状腺腫瘍亜型に従って更に分類する。
具体的な実施形態の上述の説明は本発明の一般的な性質を十分に明らかにすることから、当業者は、現在の知識を適用することにより、必要以上に実験することなく及び一般的な概念から逸脱することなく、そのような具体的な実施形態を容易に改変することができ、及び/又は様々な用途に適合させることができ、従って、そのような適合及び改変は、開示された実施形態の等価の意味内に及び範囲内に含まれるべきである、及び含まれるように意図されている。本発明がこの具体的な実施形態と共に説明されているが、多くの代替、改変及び変更が当業者に明白であろうことは明らかである。従って、添付した特許請求の範囲の趣旨及び広い範囲に含まれる全てのそのような代替、改変及び変更を包含するように意図されている。
詳細な説明及び具体的な実施例は、本発明の好ましい実施形態を示すが、本発明の趣旨及び範囲内の様々な変化及び改変がこの詳細な説明から当業者に明白であると予想されることから、これらは単に説明のために記載されていることが理解されるものとする。