[関連出願とのクロスリファレンス]
本出願は2017年7月18日に出願された米国仮出願第62/534,072号の優先権を主張し、その開示は参照により本明細書に組み込まれる。
本開示は、概して、頭蓋内動脈瘤のためのバイオマーカーに関する。本開示はまた、動脈瘤の存在の評価に続く医学的イメージングによる動脈瘤のサイズおよび位置の決定に関する。本開示はまた、個体が頭蓋内動脈瘤破裂のリスクがあること、および/またはクモ膜下出血(SAH)のリスクがあることを決定することに関する。
頭蓋内動脈瘤(IA)は、破裂した場合に破壊的なクモ膜下出血を引き起こす、脳血管系における潜在的に致命的な病変である。動脈瘤性クモ膜下出血を経験した米国の年間約3万人の人々のうち、約半数は1ヶ月以内に死亡し、一方、生存者の半数は永久的な障害をもって生きている。アメリカ人の5%が未破裂のIAを有すると推定されているが、正確な有病率は不明である。未破裂動脈瘤の大部分は完全に無症候性であるので、大部分は休眠状態であり、検出されないままである。他の目的のために行われた医学的イメージングにおける偶然の発見は別として、IAはしばしば破裂後にのみ発見される。
破裂する前のIAの早期検出は、医学的イメージングによる慎重なモニタリングおよび予防的処置を可能にするので、明らかに重要である。外科的リスクにもかかわらず、最近の研究は、未破裂IAの処置が破裂の割合を劇的に減少させられることを示している。50歳の男性では患者の残存寿命中の破裂の確率は22.8%であるが、外科用クリッピング後には1.6%、血管内コイリング後には3.4%に低下する。さらに、IAの予防的処置は、質調整生存年(quality adjusted life years)を増加させ、費用対効果が高いことが見出されている。IAの検出およびその後の管理は、破滅的な結果および関連する医療費を劇的に減少させることができ、ゆえに、未破裂IAを有する患者を同定することができるスクリーニングツールは、患者のケアのための大きな進歩をもたらすものとなりうる。
残念ながら、未破裂IAを有する個体についてのスクリーニングは問題がある。一般集団におけるIAのリスクを環境的および遺伝的危険因子(例えば、年齢、女性、および高血圧)によって層別化することは、未破裂動脈瘤を有する患者を確実に同定しない。これらの危険因子はしばしば、他の心血管疾患と共有され、IAの存在と独立して相関しない。
未破裂IAは、大部分は他の理由のために実施された磁気共鳴画像法(MRI)、コンピュータ断層撮影血管造影法(CTA)またはデジタルサブトラクション血管造影法(DSA)によって、偶然に検出されてきた。しかし、American Stroke Associationによって述べられているように、これらのイメージング方法はIAスクリーニングに適していない。なぜなら、IAスクリーニングに伴う潜在的なリスク(例えば、侵襲的な方法があり、合併症を引き起こし得る)が、特にそれらの高いコストを考慮すると、未だ正当化されていないためである。動脈瘤ハイリスク集団(例えば、IAの家族歴を有する)においてさえ、その費用対効果が明確に示されていないため、患者をイメージングによってスクリーニングすべきかどうかが議論されている。これは、最小限の侵襲性、手頃な価格、および信頼性のある動脈瘤検出のための代替的なストラテジーに対する決定的なニーズを提起するものである。本開示はこのニーズに関連する。
本開示は、動脈瘤、特にIAの分析のための方法を提供する。実施形態において、本開示は、本明細書に記載のバイオマーカーの任意の組合せの発現を決定することを提供する。実施形態において、本開示は、本開示の実施例1、表2、および/または実施例2、表3に記載されるバイオマーカーの組合せの発現について、対象からの生物学的サンプルを分析することによって、対象におけるIAの存在(または非存在)を決定するための方法を提供する。実施形態において、本開示は、コントロールと比較して、本明細書中に記載されるバイオマーカーの組合せの発現の相違を決定することによって、個体におけるIAの存在を決定することを提供する。実施形態において、本明細書中に記載されるようなバイオマーカーが正常なコントロールと同じであることを決定することは、個体がIAを有さないことを示す。実施形態において、本開示は、以下のバイオマーカーのうちの少なくとも1つの発現がコントロールに対して増加することを決定することによって、IAの存在を決定することを提供する:PVRL2、CYP1B1、CD177、PDE9A、ARMC12、OLAH、TGS1、CD163、LOC100506229、OCLN、SEMA6B、ADTRP、VWA8、MTRNR2L1、HOXB2、EPCAM、およびIL18R1、および/または、以下のバイオマーカーのうちの少なくとも1つの発現がコントロールに対して減少することを決定することによってIAの存在を決定することを提供する:IGSF23、PTGES、G0S2、FCRL5、C1orf226、UTS2、HBG2、CYP26B1、およびC1QL1。
実施形態において、本開示は、以下のバイオマーカーのうちの少なくとも1つの発現がコントロールと比較して増加することを決定することを含む:PVRL2、PDE9A、TGS1、LOC100506229、OCLN、SEMA6B、MTRNR2L1、HOXB2、EPCAM、またはIL18R1;および/または、以下のバイオマーカーのうちの少なくとも1つの発現がコントロールと比較して減少することを決定することを含む:IGSF23、PTGES、UTS2、HBG2、CYP26B1、またはC1QL1。
実施形態では、C21orf15、CYP1B1、FLT3、XKR3、SLC12A7、PAM、GPC4、FBN1、IL-8、GBP5、ETV7、MFSD9、SERPING1、TCL1A、CARD17の少なくとも1つの発現が分析される。
実施形態において、本開示は、コントロールと比較して、C21orf15、CYP1B1、FLT3、XKR3、SLC12A7、およびPAMの発現の増加を決定して、および/または、コントロールと比較した、GPC4、FBN1、およびIL-8の発現の減少を決定して、IAの存在を示すことを提供する。
実施形態において、本開示は、IAの有無を決定するために、コントロールと比較して、C21orf15、CYP1B1、FLT3、XKR3、SLC12A7、PAMおよびTCL1Aの発現の増加を決定すること、および/または、コントロールと比較して、GPC4、FBN1、IL-8、GBP5、ETV7、MFSD9、SERPING1およびCARD17の発現の減少を決定することを含む。
実施形態では、本開示は、バイオマーカーの発現に基づいて個体におけるIAの存在を決定すること、および個体に対して医療処置を実施することを含む。特定のアプローチでは、医療処置は、動脈瘤をイメージングすることを含む。特定のアプローチでは、イメージングは、頭蓋内動脈瘤のサイズおよび位置を決定することを含む。実施形態において、医療処置は、頭蓋内動脈瘤が紡錘状頭蓋内動脈瘤であることを決定することを含み、任意的に、フローダイバーターで紡錘状頭蓋内動脈瘤を処置することを含む。実施形態において、医療処置は、頭蓋内動脈瘤が嚢状頭蓋内動脈瘤であることを決定することを含み、任意的に、血管内コイリングまたは外科用クリッピングによって嚢状頭蓋内動脈瘤を処置することを含む。
実施形態において、本開示は、頭蓋内動脈瘤のサイズおよび/または位置および/または処置に対する応答に関して対象をモニターするために、本明細書に記載の方法を繰り返すことを含む。
特定のアプローチにおいて、本開示は、個体におけるIAの存在を決定すること、およびさらに、個体がIA破裂を起こすリスクおよび/またはクモ膜下出血(SAH)についてのリスクがあることを決定することを含む。
IAを有する患者とコントロールの間の発現差、およびIAに伴う発現のシグネチャ。ボルケーノプロットは、2つの群の間のRNA発現差異を示す。グレーの円は、有意に差異的に発現された転写産物のIAに伴うシグネチャ(p<0.05)を絶対倍率変化≧2で示す。
RT-qPCRによるRNA発現差異の検証。顕著に差次的に発現された(differentially expressed)5つの転写産物に対して行われた定量的PCRは、RNA配列決定によって測定された発現の比の強度および傾向の両方がqPCRによって測定されたものと同様であることを示す。21サンプルのみがRT-qPCRによって分析された。なぜなら、1つのコントロールサンプルが追加反応に十分なRNAを持っていなかったためである。(負の倍率比の逆数によって計算された負の倍率比、データ点=平均値、エラーバー=標準誤差。)
IA患者およびコントロールからの分離血液サンプルの次元削減分析。(A)全てのトランスクリプトームのデータを用いる主成分分析(PCA)は、IA患者(黒塗りの点)およびコントロール(白色の点)のサンプルの集合を示す。トランスクリプトームデータはさらに、動脈瘤サイズによってIA患者からのサンプルを分離し、大きなIA(≧8mm、1つの例外はアスタリスクを参照)および小さなIA(≦5mm)の群が形成された。(B)トランスクリプトームデータの多次元スケーリング(MDS)が次元数をさらに低減し、PCA結果を反映し、IAサンプル(黒塗り点)とコントロールサンプル(白色の点)との分離も示す。(C)IA関連シグネチャの82転写産物のみを使用する階層的クラスタリングもまた、IA群とコントロール群との分離を示す。右側の4つの動脈瘤サンプルは他のサンプルよりも明確であったが、残りのサンプルは3つの主要なクラスターに分かれた。3つのうち2つは全てコントロールを含み、1つは全てIAを含む(1つを除く)。全体として、サンプルの91%がそれぞれの群に分類された。
4つの最も調節されたネットワーク。ネットワークは、IA患者およびコントロール由来の好中球において差次的に発現された転写産物(p<0.05)のIPAに由来したものである。倍率比は、グレーシェーディングの強度によって表される。既知の相互作用を有する、差次的に発現されない転写産物は、グレーにされていない。(A)このネットワーク(p-スコア=41)は、ERK1/2およびAP1による増加した発現を伴う転写産物の調節を示す。IL8は、IAを有する患者からのサンプルにおいてより低い発現を有する転写産物を調節する。(B)このネットワーク(p-スコア=30)は、UBCによる転写産物の調節を示す。(C)このネットワーク(p-スコア=30)は、AKTおよびVEGFの調節の2つのノードを示す。(D)このネットワーク(p-スコア=23)は、IFNGによるIAサンプルにおけるより低い発現を有する転写産物の調節を示す。
10人の新規患者(5人がIAを有する)のコホートにおける繰り返し研究。(A)82のIA関連転写産物を用いて行われた主成分分析は、この非マッチングコホートにおけるコントロール(白色ドット)からのIA患者(黒い塗りつぶされたドット)の分離を示す。(B)階層クラスター分析は、コントロールとともにグループ化されたIAの1サンプルを除き、IAおよびコントロールのサンプルの分離を示す。
IA群およびコントロール群の白血球数。IAを有する患者(n=11)とコントロール(n=7、コントロールのうちの4つについては利用可能なデータがなかった)との間で、白血球数または白血球比に有意な相違はなかった。(A)採血から3ヶ月以内に記録された全血球数データは、白血球、赤血球、血小板、好中球、リンパ球、または単球の濃度において群間で有意差を示さなかった(p>0.05、スチューデントt検定)。(B)また、好中球、リンパ球、単球、好酸球、および好塩基球について、IAを有する患者と有さない患者との間で、100白血球当たりのパーセンテージ(%)に有意な相違はなかった(p>0.05、スチューデントt検定)。(データ点=平均値、エラーバー=標準誤差)。
IAの患者およびIAフリーのコントロールの患者間での好中球RNA発現の相違、および、分類モデル作成のための特徴選択。(A)トランスクリプトームプロファイリングは、頭蓋内動脈瘤(IA)を有する患者とコントロールの患者との間で、95の異なる発現転写産物(q値<0.05)を示した。これらのうち26は、FDR<0.05および絶対倍率比≧1.5であった(グレー)。(B)これらの26の転写産物を使用した主成分分析(PCA)は、IAを有する患者(黒塗り点-「IA」とラベルされ、60%が丸囲いされている)とコントロール(白い点-「コントロール」とラベル付けされ、80%が丸囲いされている)との間の、一般的な分離を示した。(C)トレーニングコホートにおけるLOOクロスバリデーション中のモデル性能の推定は、ほとんどのモデルが0.50~0.73の精度で実施されたことを示した。全体的な対角線形判別分析(DLDA)が、感度、特異度、および精度の最も高い組み合わせを有した(0.67、0.80、0.73)。(D)トレーニングデータセットにおける分類を使用する受信者動作特性(ROC)分析は、モデルが0.54(SVM)~0.72(DLDA)の曲線下面積(AUC)を有することを示した。
モデルトレーニングおよびテスト中の4つの分類モデルの性能。(A)26の転写産物を使用する主成分分析は、IAを有する患者(黒塗り点-「IA」とラベル付けされ、100%が丸囲いされている)とコントロール(白い点-「コントロール」とラベル付けされ、80%が丸囲いされている)との間の一般的な分離を示した。(B)患者の独立したテストコホートにおける分類モデルの検証は、DLDAがそれぞれ、0.80、1.0、および0.90の感度、特異度、および精度で、最良の性能を有することを示した。(C)テストコホートにおけるROC分析は、DLDAが最良のAUC(0.80)も有することを示した。
すべてのデータにわたるLOOクロスバリデーションによるモデル性能の評価、および陽性予測値(PPV)/陰性予測値(NPV)。(A)モデル性能の推定は、モデルが0.63~0.80の精度で実行されることを示した。DLDAは、感度、特異度、および精度の最も高い組合せを有した(0.65、0.95、0.80)。(B)ROC分析は、モデルが0.68(最近接収縮重心(NSC))~0.84(DLDA)のAUCを有することを示した。(C)全ての可能な有病率にわたる全てのモデルの陽性予測値。最良の性能モデル(DLDA)は最も高いPPVを有し、サポートベクターマシン(SVM)が最も低いPPVを示した。(D)DLDAモデルはまた、最良のNPVを有したが、コサインNN、NSC、およびSVMのNPVよりもわずかに良好であったに過ぎなかった。
定量的ポリメラーゼ連鎖反応(qPCR)による7つの転写産物に関するRNA-Seqデータのバリデーション。独立したコホートにおけるqPCRにおいて、IAを有する患者および有さない患者における7の差次的に発現された転写産物のうち6が、好中球においても差次的に発現された。
発明の詳細な説明
本明細書で別段の定義がない限り、本開示で使用されるすべての技術用語および科学用語は、本開示が関係する当業者によって一般に理解されるものと同じ意味を有する。
本明細書全体を通して与えられるあらゆる数値範囲はその上限値および下限値を含む。また、その中に入るあらゆるより狭い数値範囲も、そのようなより狭い数値範囲はすべて本明細書で明示的に記載されているものとして、含む。
本開示は、動脈瘤の診断および/または予測および/またはインターベンションおよび/または処置のための方法を提供する。実施形態において、本開示は、頭蓋内動脈瘤に関する。本開示はまた、動脈瘤の存在の決定に続いて、医用イメージングによって動脈瘤のサイズおよび位置を決定するための方法を提供する。本開示はまた、頭蓋内動脈瘤は全ての非外傷性SAHの90%にも及ぶ原因であるため、クモ膜下出血(SAH)のリスク決定するための方法およびそのようなリスクを予測するのに有用なバイオマーカーを提供する。
本開示は頭蓋内動脈瘤を有することが疑われるか、または頭蓋内動脈瘤を発症するリスクがある対象における頭蓋内動脈瘤の存在または非存在を決定するための方法を提供し、この方法は、本明細書中に記載されるようなバイオマーカーの差次的発現について対象からの生物学的サンプルを分析することを包含する。頭蓋内動脈瘤を有するか、または頭蓋内動脈瘤のリスクがあると疑われる対象は、頭痛(眼の上および後ろの疼痛など)、瞳孔の拡張、有意な視力変化、物が二重に見える、瞼の垂れ下がり、側部のしびれ、側部の脱力、側部の麻痺、記憶または言語の困難、発作を経験し得る対象である。実施形態では、側部は顔面側部である。また、頭蓋内動脈瘤を有することが疑われるかまたは頭蓋内動脈瘤のリスクがある対象は、全く症状を有さないことがありえる。対象は、高齢、女性、喫煙、動脈瘤の家族歴、高血圧、高脂血症、および/または心疾患のいずれかによる頭蓋内動脈瘤のリスクがあり得る。本出願において、用語「バイオマーカー」は、RNAまたは前記RNAから翻訳されたタンパク質を意味するために使用される。決定されるRNAは、代表的には本明細書中に記載されるタンパク質をコードするmRNAの断片のようなコーディングRNAであるか、または非コーディングRNAであり得る。当業者によって認識されるように、RNAの存在、不在、および/または量は例えば、RNAテンプレートから増幅されたDNAから、ならびに本明細書中に記載される他の方法によって、決定され得る。
本開示の途上で、循環する好中球が非破裂IAの転写シグネチャを有するかどうかを問うた。理論的根拠は2つあった。第一に、動脈瘤病変は持続性血管壁炎症を伴うことが知られており、最も多い白血球である好中球を含む循環免疫細胞と直接接触している。第二に、好中球はその機能において一般に非特異的であると考えられるが、炎症を特徴とする疾患においてそのトランスクリプトームを変化させることが示されている-特定の生理学的状況への短時間の暴露でさえ、その転写プログラムを微妙に変化させることができる。実際、循環好中球におけるRNA発現の相違が、特発性関節炎、敗血症、肺癌、および異種移植片に対する応答において示されている。全血トランスクリプトームの分析はまた、発現差が、アテローム性動脈硬化症、胸部大動脈瘤、冠状動脈疾患、および動静脈奇形を含む局所的血管疾患と相関することを示している。
循環する好中球は動脈瘤組織と継続的に相互作用しており、それらのトランスクリプトームにおいてIAのシグネチャを保有することもできる。ゆえに、本開示の少なくとも第1の実施例では、IAを有する患者が、動脈瘤を有さない対象と比較して、異なる好中球RNA発現プロフィールを示すかどうかを問うた。この目的のために、人口統計学的および併存疾患別にIAを有する患者と有さない患者の2つのコホートをマッチさせ、循環好中球におけるIA関連発現差を同定および特徴づけるために、次世代RNA配列決定および一連のバイオインフォマティクス分析を実施した。さらに、より広い集団において安価な方法を用いて、RNA配列決定によって明らかになったバイオマーカーの相違を検出することができるかどうかを判断するために、新規な非マッチング患者コホートにおいてRT-qPCRを用いて実証を行った。
実施形態において、本開示は、バイオマーカーのシグネチャを提供する。本明細書中で使用される「シグネチャ」とは、有益なバイオマーカーの組合せを意味するが、本開示の方法において使用され得るマーカーの組合せから他のバイオマーカーを除外することを意味しない。例えば、82のバイオマーカーシグネチャが以下の実施例1に記載されるが(実施例1、表2を参照のこと)、シグネチャは代替および/または追加のバイオマーカーを含み得、そのうちの16は実施例2に記載される。特に、実施例2は実施例1を拡張し、26のバイオマーカーの組合せを提供するが、これは、実施例1、表2に提供される82のバイオマーカーからの10のマーカーのセットを含む。実施例2に記載されるバイオマーカーは、分類モデルトレーニングのために選択され、本明細書に記載されるバイオマーカーシグネチャも構成する。
実施例1、表2は、RNAが転写される82の遺伝子の各々についてのEntrezGeneID番号、および各転写産物についてのGenBank受託番号を含む。実施例2、表3は26のバイオマーカーを提供し、そのうち10は実施例1に記載のバイオマーカーと重複し、各転写産物についてのGenBank受託番号を含む。追加の16のバイオマーカーは、実施例2、表3において太字である。「転写産物」は本明細書中で使用される場合、mRNAのcDNA配列を含む。
各RNA(または対応するcDNA)の配列は、本明細書中に提供されるGeneID番号および受託番号を使用して、当業者によって決定され得る。本明細書中に記載される全てのGenBank受託番号についての全ての配列は、本出願または特許の優先日の時点でGenBankデータベース中に存在するので、本明細書中に参照によって引用される。本開示はこれらのデータベースエントリーにおける全てのポリヌクレオチドおよびアミノ酸配列、任意のcDNAエントリーのmRNA等価物、任意のRNAエントリーのcDNA等価物を含み、そしてこのような配列の全てのアイソフォームおよびスプライスバリアント(存在する場合)を含む。
post hoc検定力分析および発現差の独立的な確証が、本明細書に記載されるバイオマーカーシグネチャがIAを有する患者に一貫して存在することを示すことが、本開示から認識されるであろう。したがって、いかなる特定の理論にも束縛されることを意図するものではないが、これは、非破裂IAのバイオマーカーシグネチャの最初の説明、特に、循環好中球において差次的に発現されるバイオマーカーについてのバイオマーカーシグネチャの最初の説明であると考えられる。
本開示は、本明細書に記載のバイオマーカーの少なくとも1つの存在、非存在、発現レベルおよび/または量を決定することを含む。したがって、本開示は、ここに記載されるバイオマーカーのうち1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、または98を分析することを含む。
特定の実施形態において、本発明は、C21orf15、CYP1B1、FLT3、XKR3、SLC12A7、PAM、GPC4、FNB1、IL-8、GBP5、ETV7、MFSD9、SERPING1、TCL1AおよびCARD17からなるグループから選択される少なくとも1つのバイオマーカーの存在、非存在、発現レベルおよび/または量を決定する方法を含む。特定の実施形態において、これらのバイオマーカーの2、3、4、5、6、7、8、9、10、11、12、13、14または15の存在、非存在、発現レベルおよび/または量が分析される。特定の実施形態において、開示は、IL8、GBP5、ETV7、MFSD9、SERPING1、TCL1A、CARD17、PAM、XKR3、CYP1B1およびFBN1からなる群より選択される少なくとも1つのバイオマーカーの存在、非存在、発現レベルおよび/または量を決定する方法を含む。IL8、GBP5、ETV7、MFSD9、SERPING1、TCL1A、CARD17、PAM、XKR3、CYP1B1は、実施例1に記載の最近接収縮重心分析からの上位10の転写産物である。FBN1、XKR3、ETV7、およびMFSD9は、実施例1にも記載されるように、動脈瘤存在の確率を予測するための回帰モデルにおいて使用され得る。
実施例2に記載されるように、実施形態において、本発明は、PVRL2、CYP1B1、CD177、PDE9A、ARMC12、OLAH、TGS1、CD163、LOC100506229、OCLN、SEMA6B、ADTRP、VWA8、MTRNR2L10、HOXB2、EPCAM、IL18R1、IGSF23、PTGES、G0S2、FCRL5、C1orf226、UTS2、HBG2、CYP26B1、C1QL1、およびそれらの組合せからなる群より選択される少なくとも1つのバイオマーカーの存在、非存在、発現レベルおよび/または量を決定する方法を包含する。特定の実施形態では、本発明がPVRL2、PDE9A、TGS1、LOC100506229、OCLN、SEMA6B、MTRNR2L10、HOXB2、EPCAM、IL18R1、IGSF23、PTGES、UTS2、HBG2、CYP26B1、およびC1QL1のうちの少なくとも1つを含む少なくとも1つのバイオマーカーの存在、非存在、発現レベルおよび/または量を決定することを含む。
実施形態において、本開示は、以下のマーカーの全てまたは任意の組合せが、コントロールに対して、アップレギュレートされることを決定することを含む:PVRL2 (NM_002856.2);CYP1B1 (NM_000104.3);CD177 (NM_020406.3);PDE9A (NM_002606.2);ARMC12 (NM_145028.4);OLAH (NM_018324.2);TGS1 (NM_024831.7);CD163 (NM_004244.5);LOC100506229 (NR_039975.1);OCLN (NM_002538.3);SEMA6B (NM_032108.3);ADTRP (NM_001143948.1);VWA8 (NM_015058.1);MTRNR2L1 (NM_001190708.1);HOXB2 (NM_002145.3);EPCAM (NM_002354.2);およびIL18R1 (NM_003855.3)。一実施形態では、本開示は、以下のマーカーのいずれか1つまたは任意の組合せが、コントロールに対して、ダウンレギュレートされることを決定することを含む:IGSF23, (NM_001205280.1);PTGES, (NM_004878.4);G0S2, (NM_015714.3);FCRL5, (NM_031281.2);C1orf226, (NM_001135240.1);UTS2, (NM_021995.2);HBG2, (NM_000184.2);CYP26B1, (NM_019885.3);およびC1QL1, (NM_006688.4)。実施形態において、本開示はこの段落におけるマーカーの全てが、コントロールに対してそれぞれアップレギュレートおよびダウンレギュレートされることを決定することを包含する。
本発明は一般に、個体から得られる任意の生物学的サンプルに使用するのに適している。生物学的サンプルは、直接試験され得るか、または試験の前にサンプルの成分を単離、増幅または精製するための処理工程に供され得る。特定の実施形態において、生物学的サンプルは液体生物学的サンプル(例えば、全血)を含む。所望であれば、全血は例えば、試験のために特定の血液成分および/または細胞型を分離することによって、試験の前に処理され得る。特定の実施形態では、試料は好中球などの免疫細胞を含む。特定のアプローチにおいて、好中球は他の血液成分(例えば、末梢血単核細胞および血漿)から分離され得る。実施形態において、試料は好中球および赤血球を含むことができる。実施形態において、サンプルは、好酸球、好塩基球、および肥満細胞、またはそれらの任意の組合せを有する好中球を含む。実施形態において、赤血球は、好中球を試験する前に溶解され得る。好中球は例えば、遠心分離によって、生物学的サンプルから単離され得る。好中球は所望であれば、フローサイトメトリーなどによってCD66b+バイオマーカーを決定することによって同定することができる。いくつかの実施形態において、試験される生物学的サンプルはフローサイトメトリーによって決定されるように、CD14+細胞を含まない。
本明細書中に記載されるバイオマーカーの存在、非存在、発現レベルおよび/または量の決定は、任意の適切なアプローチを使用して実施され得る。バイオマーカーがタンパク質である1つのアプローチにおいて、タンパク質は、免疫学に基づくアプローチ(例えば、任意の形態のELISAアッセイ)を使用することによって決定される。実施形態において、RNAは、RNA配列決定を含む任意の適切なアプローチを使用して検出および/または定量される。特定の実施態様においては、PCR増幅が用いられ、また、全RNAまたはmRNAのようなRNAをサンプルから分離し、そのRNAからcDNAを作り、測定すること、および/または定量的な逆転写PCR(RT-qPCR)のようなリアルタイムPCRを含む定量的なPCRアプローチを使用することを含むことができる。実施形態において、バイオマーカーを決定することは、RNA配列決定、SAGE(遺伝子発現の連続分析)、RNAマイクロアレイ、DNAマイクロアレイ、またはタイリングアレイを使用して行われるものを含むがこれらに限定されず、ハイブリダイゼーションに基づく技術、およびインサイチュハイブリダイゼーション、ノーザンブロッティング、およびキャピラリー電気泳動を含む。
「アップレギュレートされた」という文言および本明細書で使用されるその様々な活用形は、特定のmRNAの発現がコントロールと比較して増加することを意味し、「ダウンレギュレートされた」および本明細書で使用されるその様々な活用形は、特定のmRNAの発現がコントロールと比較して減少することを意味する。アップレギュレーションおよびダウンレギュレーションの程度の非限定的な例は、本開示の表、図、および例に提供される。
任意の特定のバイオマーカーの発現がアップレギュレートされるかダウンレギュレートされるかを含むがこれらに限定されない、本開示によるサンプル中の各バイオマーカーの量の定量的または定性的決定は、任意の適切な技術を使用して測定され得、そして任意の適切なリファレンス(確立された正常範囲、標準化された曲線、陽性、陰性、またはマッチングされたコントロールなどを含むがこれらに必ずしも限定されない)と比較され得る。実施形態において、バイオマーカーの量は適切なコントロール値(例えば、リファレンスにおける同じバイオマーカーの量を決定することから得られる値)と比較され、ここで、リファレンスは、正常であると決定された1以上の個体(それ自体、検出可能な頭蓋内動脈瘤を有さない)、または各々が破裂していない頭蓋内動脈瘤を有する1以上の個体、または各々が破裂した頭蓋内動脈瘤を有する1以上の個体を含む。実施形態において、本明細書中に記載される1以上のバイオマーカーが、正常コントロールのようなコントロールと同一または類似であることを決定することは、個体が動脈瘤を有さないことを示し得る。実施形態において、コントロールに対する相違を決定することは、統計的な有意差を決定することを含む。実施形態において、p値が決定される。実施形態において、p<0.05と決定されることは、統計的な有意差である。実施形態において、区別基準として適格であるバイオマーカー間の差異は、統計的に有意な差異である。
特定の実施形態において、コントロールは、特定のサイズの動脈瘤または特定のサイズ範囲の動脈瘤であり得る、頭蓋内動脈瘤を有すると決定された個体または複数個体由来のバイオマーカーを含む。サイズは、頭蓋内動脈瘤(IA)の破裂リスクを評価するために最も広く使用されている測定基準である。この評価基準は、典型的には医用イメージング上の動脈瘤の最大寸法の長さとして測定され、より大きな動脈瘤がより破裂しやすいことを見出した縦断的な前向き研究から採用されている。具体的には、脳動脈瘤を有する5720人の患者を含む2012年の非破裂脳動脈瘤研究(UCAS)は、破裂のリスクは動脈瘤のサイズの増加と共に増加することを見出した(UCAS Japan Investigatorsら、NEJM 2012)。5mm未満の動脈瘤の破綻リスクは5mm以上のものより小さかった。この分析は、5mmを超える破裂していない動脈瘤が処置のために考慮されるべきより高い優先度を有するべきであることを示す。Malhotraらによる現在の文献の最近の系統的レビューも、これらの知見を支持している(Malhotraら、Ann Intern Med 2017)。文献の26件中25件の研究では3~5mmの動脈瘤の年率破裂率は0.5%であったが、5mm以上の動脈瘤では1%以上であった。したがって、実施形態において、本開示は、本明細書に記載のバイオマーカーの決定に基づいて動脈瘤のサイズを予測することに関する。実施形態において、動脈瘤のサイズの予測または推定に基づいて、動脈瘤が破裂するリスクがあると判定された後に、本明細書に記載されるように、医療的インターベンションが行われる。実施形態において、IA破裂のリスクの決定は、本明細書中に記載されるようなバイオマーカーの組合せを決定することによって、5mmを超える動脈瘤のサイズを予測または推定することに基づく。
mRNAから翻訳された差次的RNAおよびタンパク質、発現プロフィールは、本開示の実施形態において展開され、使用され得る。特定の局面において、本開示は、1つ以上の適切なコントロールに対して、バイオマーカーの増加した発現および減少した発現を決定することを包含する。
特定の実施形態において、本開示は、コントロールと比較して、C21orf15、CYP1B1、FLT3、XKR3、SLC12A7、およびPAMのうちの少なくとも1つの増加した発現を決定することを含む。特定の実施形態では、本開示は、コントロールと比較して、GPC4、FBN1、およびIL-8のうちの少なくとも1つの減少した発現を決定することを含む。特定の実施形態では、本開示は、コントロールと比較して、C21orf15、CYP1B1、FLT3、XKR3、SLC12A7およびPAMのうちの少なくとも1つの発現の増加を決定すること、ならびにGPC4、FBN1およびIL-8のうちの少なくとも1つの発現の減少を決定することを含む。特定の実施形態では、本開示は、コントロールと比較して、C21orf15、CYP1B1、FLT3、XKR3、SLC12A7およびPAMのうち2、3、4、5または6つの発現の増加を決定することを含む。特定の実施形態では、本開示は、コントロールと比較して、GPC4、FBN1、およびIL-8の2つまたは3つすべての発現の減少を決定することを含む。特定の実施形態では、本開示は、適切なコントロールと比較して、C21orf15、CYP1B1、FLT3、XKR3、SLC12A7およびPAMのすべての発現の増加を決定すること、ならびにGPC4、FBN1およびIL-8のすべての発現の減少を決定することを含む。特定の実施形態において、分析は、コントロールと比較した、C21orf15、CYP1B1、FLT3、XKR3、SLC12A7、PAMおよびTCL1Aの少なくとも1つの発現の増加を決定すること、および/または、コントロールと比較した、GPC4、FBN1、IL-8、GBP5、ETV7、MFSD9、SERPING1、CARD17の少なくとも1つの発現の減少を決定することを含む。
特定の実施形態では、本開示は、コントロールと比較して、PVRL2、CYP1B1、CD177、PDE9A、ARMC12、OLAH、TGS1、CD163、LOC100506229、OCLN、SEMA6B、ADTRP、VWA8、MTRNR2L10、HOXB2、EPCAM、IL18R1の少なくとも1つの増加した発現を決定することを含む。特定の実施形態では、本開示は、コントロールと比較して、PVRL2、PDE9A、TGS1、LOC100506229、OCLN、SEMA6B、MTRNR2L10、HOXB2、EPCAM、およびIL18R1のうちの少なくとも1つの増加した発現を決定することを含む。
特定の実施形態では、本開示は、コントロールと比較して、IGSF23、PTGES、G0S2、FCRL5、C1orf226、UTS2、HBG2、CYP26B1、およびC1QL1のうちの少なくとも1つの減少した発現を決定することを含む。特定の実施形態では、本開示は、コントロールと比較して、IGSF23、PTGES、UTS2、HBG2、CYP26B1、およびC1QL1のうちの少なくとも1つの減少した発現を決定することを含む。
実施形態では、本開示は、バイオマーカー発現を決定するかまたはさもなければ分析し、および/またはコントロールに対するバイオマーカー発現を比較するための、コンピュータ実施プロセスを含み、また、本明細書に記載される任意のソフトウェアプログラムの使用を含む。実施形態では、本開示は、本明細書に開示されるバイオマーカーの決定を、コンパクトディスク、DVD、または任意の他の形態の電子ファイルなどの有形の表現メディア中に固定することを含む。したがって、ここに開示されるのバイオマーカーの決定を含むメディアの実体は、本開示に含まれる。実施形態では、本発明は、診断判定を含む実体メディアをヘルスケア提供者に通信するか、さもなければ転送すること、例えば判定を含むファイルをヘルスケア提供者に電子的に送信すること、を含む。
特定の実施形態では、サンプルは、動脈瘤を発症するリスクのある個体から得られる。
特定の局面において、コントロールに対する、バイオマーカーの1つまたは任意の組合せの発現の相違を決定することは、動脈瘤の存在の診断、および/または動脈瘤の存在の可能性の診断を含む。実施形態では、コントロールに対するバイオマーカーの1つまたは任意の組合せの発現の相違を決定することが、動脈瘤の医師の診断を補助する。特定の実施態様では、コントロールに対するバイオマーカーの1つまたは任意の組合せにおける発現の相違を決定することに、医学的インターベンションが続くことができる。医学的インターベンションは、血管造影図、コンピュータ断層撮影血管造影(CTA)、デジタルサブトラクション血管造影(DSA)、または磁気共鳴血管造影(MRA)、ならびにステント、血管内クリッピング、コイリング、ステント留置、Onyx処置、頸動脈結紮、他の閉塞手術、バイパス、または上記の任意の組合せ、または動脈瘤の破裂を抑制するための任意の他の医療デバイスの導入などの外科的介入を含むが、必ずしもこれらに限定されない。コンピュータ断層撮影血管造影法(CTA)、デジタルサブトラクション血管造影法(DSA)または磁気共鳴血管造影法(MRA)のようなイメージング技術は、動脈瘤の存在または非存在の確認のために使用され得る。したがって、本発明は、頭蓋内動脈瘤の存在、その位置、およびイメージングによる幾何学的形状の確認を必要とする対象を同定するための方法を含み得る。本発明は、動脈瘤破裂のリスクの評価、また任意的に、処置計画をさらに含むことができる。
一実施形態では、バイオマーカーの差異の分析に続いて、イメージングによって頭蓋内動脈瘤のサイズ、表現型および位置を決定する。動脈瘤表現型(または病理学的サブタイプ)を決定することは、どの動脈瘤表現型が危険であり(破裂し)、処置を必要とするか、またはどの動脈瘤表現型が危険ではなく、定期的にモニターできるかを示すことができるので、臨床的意思決定に重要である。動脈瘤サイズは動脈瘤の破裂リスクを判断するために使用される1つの臨床パラメータである:UCAS研究(UCAS Japan Investigatorsら、NEJM 2012)は、5mmを超える動脈瘤はより大きな破裂の確率を有することを示した。本発明者らのデータは、RNA発現の相違が、動脈瘤サイズによって患者を分けることを示す。(図2BおよびC)。
本発明はまた、本明細書中に記載されるようなバイオマーカーの差次的発現について生物学的サンプルを分析することを包含する、くも膜下出血(SAH)のリスクを決定するための方法を提供する。くも膜下出血(SAH)は、典型的には脳の基部でウィリス環を取り囲むくも膜下腔内の破裂した頭蓋内動脈瘤の出血によって生じる。AANSは、90%ものSAHがIAの破裂に起因し得ると報告している。したがって、IAの存在は、非外傷性SAHに最も相関するリスク因子である可能性が高い。SAHを予防する唯一の既知の方法は、脳血管合併症の可能性を、それらが起こる前に同定することである。破裂前に破裂していないIAを検出することは、SAHを早期に同定する唯一の方法である。一旦検出されると、IAを処置することができ、これは、将来のSAHのリスクを減少させることが現在の文献において示されている。(D'Souza J Neurosurg Anesthesiol 2015):米国におけるSAHの発生率は、年間約30,000である。(Brismanら、NJM 2006)。破裂したIAは、非外傷性SAHの75%~85%を占める(van GijnおよびRinkel Brain 2001)。
特定のアプローチにおいて、本開示は、動脈瘤破裂のリスクまたはSAHのリスクを評価するために使用され得る。現在の医学研究は、破裂のリスクのある動脈瘤を表すためにサイズを使用する。図2BおよびCならびに本明細書中に提示される他のデータは、好中球の発現が動脈瘤の大きさによって動脈瘤患者を分離し得ることを示す。図中の分析は、全トランスクリプトームデータを用いて行った。トランスクリプトームデータは主成分空間における動脈瘤サイズによって動脈瘤サンプルを分離し、大きなIAおよび小さなIAのグループを形成した。
これらのバイオマーカーはまた、動脈瘤のサイズが増加することにつれて増加または減少し得る。同様に、バイオマーカーのいくつかは、動脈瘤が破裂した場合、劇的に増加または減少し得る。従って、これらは、動脈瘤の大きさまたは破裂への進行のリスクをモニターするために使用され得る。
バイオマーカー発現の相違はまた、紡錘状動脈瘤をベリー動脈瘤から、薄壁IAを厚壁IAから、破裂しやすい動脈瘤を安定した動脈瘤からなど、区別し得る。紡錘状動脈瘤は、血管全体が拡張される動脈瘤である。嚢状動脈瘤またはベリー動脈瘤では、動脈瘤が血管の一部に「ベリー」を形成する。紡錘状動脈瘤は、嚢状動脈瘤よりも処置の選択肢が少なく、外科用クリッピングおよび血管内コイル形成には一般に適していない。紡錘状病変を処置するための適切な方法は最近出現したフローダイバーター処置である-動脈瘤の血栓症(凝固)および親血管の再建が起こることに依拠して、流れをそらすための新しい導管として親血管の経路に沿って密に織られたステントメッシュを配置する。バイパスは別の処置選択肢である。不規則な形状の動脈瘤は、規則的な形状の動脈瘤よりも破裂しやすいと考えられる。
実施形態において、本開示は個体をモニターするために使用され、したがって、バイオマーカーの存在、非存在、発現レベル、および/または量の複数の分析が、動脈瘤の存在を確認するための医学的インターベンション、または動脈瘤を処置するための医学的インターベンション、および/または動脈瘤破裂のリスクを低減するための医学的インターベンションの、前、間、および/または後に得られる。この評価は、対象をモニターするために定期的に実施されてもよい。従って、特定の局面において、本開示は、動脈瘤モニタリングを必要とする対象における、本明細書中に記載されるようなバイオマーカーの分析を包含する。対象は、本開示の任意のアプローチを使用して最初に検出されたか、または任意の他のアプローチを使用して検出された動脈瘤についてモニタリングする必要があり得る。
実施形態において、本開示は、本明細書中に記載されるようなサンプルが動脈瘤の存在を示す個体に対して、本明細書中に記載される医療処置の1つまたは組合せを実施することを包含する。実施形態において、サンプルは、本明細書に記載されるように、破裂のリスクがある、および/または閾値サイズ値などのサイズ値を超えるIAの存在を示す。したがって、実施形態では、本開示は、本明細書に記載の方法を実施することによって得られた結果に少なくとも部分的に基づいて、個体に対して医療処置を実施することを含む。したがって、本開示は本明細書に記載されるように、バイオマーカーの組合せの値を含む結果に少なくとも部分的に基づいて、医療処置を受ける個体を選択することを含む。実施形態において、医療処置は、1つ以上のIAの存在、非存在、位置、サイズ、破裂または非破裂状態などを確認するために、個体の脳の領域のイメージングを含む。実施形態では、医用イメージング手順は、X線、磁気共鳴イメージング(MRI)、磁気共鳴血管造影(MRA)、コンピュータ断層撮影(CT)、またはデジタルサブトラクション血管造影(DSA)のいずれかを含む。実施形態では、医療処置は外科的処置を含む。実施形態では、外科的処置は、動脈瘤を処置するための外科的処置として当技術分野で周知のクリッピングを含み、動脈瘤の基部にクリップを導入して、動脈瘤の位置への血流を阻止することを含む。別の実施形態では、外科的処置は、動脈瘤を処置するための周知の処置でもある血管内コイリングを含み、血液が動脈瘤に入るのを阻止するために動脈瘤にコイルを挿入することを含む。実施形態では、この医療手順は、個体に対して1つ以上の医薬品を投与することを包含する。実施形態では、医薬品が血液凝固を促進する薬剤、例えば、アミノカプロン酸またはトラネキサム酸などの抗線溶剤を含む。
実施形態では、本開示はさらに、本明細書中に記載されるように、1つ以上のバイオマーカーを決定することによってなされる診断に少なくとも部分的に基づいて、個体に対して処置プロトコルを推奨することを包含する。医療的インターベンションまたは推奨処置プロトコルは、任意的に、高血圧コントロールなどの補足処置、および/または禁煙および/または減量などのライフスタイルの修正を含むことができる。
以下の実施例は、本発明を例示することを意味するが、限定するものではない。
[実施例1]
この実施例において、トランスクリプトームプロファイリングは、IAを有する患者および有さない患者において258の差次的に発現された転写産物を同定した。発現差は末梢好中球活性化と一致した。IA関連RNA発現シグネチャが82の転写産物で同定された(p<0.05、倍率変化≧2)。このシグネチャは、階層的クラスタリングにおいて、IAを有する患者と有さない患者とを分離することができた。さらに、IAを有する患者(n=5)およびコントロール(n=5)の独立した、対応のない、レプリケーションコホートにおいて、82の転写産物が、10人の患者のうち9人をそれぞれの群に分離した。
より詳細にはこの実施例において、発明者らは、好中球がIAを有する患者において、IAを有さない患者と比較して、異なるRNA発現プロフィールを有するかどうかを調査した。動脈瘤を有する患者および有さない患者(血管造影で確認)を募集し、人口統計学および併存疾患に基づいてそれらを対にした。循環好中球の次世代RNA配列決定を行って、トランスクリプトームにおけるIA関連発現シグネチャを同定した。本発明者らはさらに、IA関連発現シグネチャが、患者の異種の独立コホートにおいてIAを有する患者と有さない患者とを区別することができるかどうかを評価した。遺伝子オントロジー分析および生理学的経路モデリングを用いて、IAにおいて差次的に発現される転写産物の生物学的機能を決定した。
以下の材料および方法を使用して、本実施例に記載の結果を得た。
臨床試験
本実施例に記載の研究は、研究施設の審査委員会によって承認された。試験は、承認されたプロトコルに従って実施された。書面によるインフォームド・コンセントを全ての被験者から得た。末梢血サンプルを、脳デジタルサブトラクション血管造影(DSA)を受けている患者から収集した:35人の患者がIA診断において陽性、42人がIA診断において陰性であった(コントロール)。IA陽性または陰性の診断は画像診断によって確認され、患者の医療記録がIAを有する患者をコントロールとペアリングするために収集された。さらに、採血から3ヶ月以内に取り込まれた各患者の全血球数を記録した。
陽性および陰性の頭蓋内動脈瘤(IA)診断を有する脳デジタルサブトラクション血管造影(DSA)を受けた患者を、本研究に登録した。DSAを受けた理由としては、IAの存在の非侵襲的画像診断、血管奇形、頸動脈狭窄または以前に検出されたIAの追跡非侵襲的画像診断からの所見の確認が挙げられた。同意した患者はすべて18歳以上で、英語を話し、以前にIAに対する処置を受けていなかった。循環好中球における相違が固有の炎症状態に影響されないことを確認するために、白血球トランスクリプトームが変化した可能性のある患者を除外した;これには、妊娠中の患者、最近侵襲的手術を受けた患者、化学療法を受けている患者、体温が37.78℃(100F)を超えている患者、臓器移植を受けた患者、自己免疫疾患の患者、およびプレドニゾンまたは他の免疫調節薬を服用している患者が含まれた。さらに、含まれた患者は、腹部大動脈瘤を含む、他の既知の脳血管奇形または頭蓋外動脈瘤を有さなかった。
試料の調製
16mLの血液を、大腿動脈中のアクセスカテーテルから採取し、そして2つの8mLのクエン酸処理細胞調製管(BD、Franklin Lakes、NJ)に移した。好中球を、公知の技術に従って、末梢血収集の1時間以内に単離した。細胞調製管を1,700×gで25分間遠心分離し、末梢血試料中の単核細胞および血漿から赤血球および好中球を分離した。赤血球と好中球を3mLシリンジに収集し、所内で作成した赤血球溶解バッファーに入れた。すべての赤血球を溶解した後、好中球を400×gで10分間の遠心分離によって単離し、破壊し、さらなる処理まで-80℃でTRIzol試薬(Life Technologies、Carlsbad、CA)中に保存した。この様式で単離された好中球はフローサイトメトリーによって98%を超えるCD66b+であり、CD14+のコンタミネーションを含まなかった。
全好中球RNAを、TRIzolを使用して、製造業者の説明書に従って抽出した。微量DNAをDNase I(Life Technologies、Carlsbad、CA)処理によって除去した。RNAを、RNeasy MinElute Cleanup Kit(Qiagen、Venlo、Limburg、Netherlands)を用いて精製し、RNaseを含まない水に懸濁した。RNA単離後、各サンプル中のRNAの純度および濃度を、NanoDrop 2000(Thermo Scientific、Waltham、MA)で260nmでの吸光度によって測定し、200~400ngのRNAを、さらなる品質管理のために、発明者らの大学の次世代配列決定および発現分析コア施設に送った。正確なRNA濃度はTBS-380蛍光光度計(Promega、Madison、WI)を用いたQuant-iT RiboGreen Assay(Invitrogen、Carlsbad、CA)を介してコア施設で測定し、一方、RNA試料の品質はAgilent 2100 BioAnalyzer RNA 6000 Pico Chip(Agilent、Las Vegas、NV)を用いて測定した。RNA配列決定のために、260/280≧1.9およびRNA完全性数(RIN)≧6.0を有するRNA試料を検討した。
コホートの作成
配列決定の前に、IA患者およびコントロール被験体からのサンプルを、交絡変数についてコントロールするために、人口統計学および併存疾患によって対にした。第一に、配列決定のために許容可能なRNA品質を有さなかったサンプルを除外した。次に、IA群の各患者を、文献でIAと相関することが報告されている因子によってコントロール被験者と対にした。これらは、(重要性の低い順に)年齢、性別、喫煙状態(はいまたはいいえ)、高血圧の存在、高脂血症の存在、および心疾患の存在を含んだ。可能な場合、マッチング基準はまた、卒中歴、真性糖尿病の存在、および変形性関節症の存在を含んだ。年齢を除いて、マッチングに使用した因子をバイナリーデータポイントとして定量化した。臨床因子は、イメージングの前に管理されていた患者医療履歴フォームを介して患者の医療記録から検索された。この医療記録は自己報告情報を含んでいたため、各患者の報告された投薬リスト(例えば、リシノプリルで高血圧、シンバスタチンで高脂血症、メトプロロールで心疾患、クロピドグレルで卒中歴、メトホルミンで糖尿病、およびNSAID/トラマドールで変形性関節症)によって、各併存疾患の存在が確証された。患者の併存疾患に対する臨床データポイントの84%を、患者の投薬歴を通して確証することができた。
IA関連好中球発現シグネチャを同定するための最初の実験を行った後、発明者らは、同じ臨床プロトコルを使用して、追加のIAを有する5人の患者およびIAを有さないコントロール5人の患者を、小さなレプリケーションコホート(n=10)に動員して、IA関連シグネチャが第二のコホートにおけるコントロールからIA患者を分離することができるかどうかを試験した。血液サンプルおよびRNAを元のコホートと同じ方法で取り扱い、同じRNA配列決定およびデータ分析プロトコルに従った。しかし、より不均一なコホートを得るために、配列決定の前に、人口統計学および併存疾患についてコントロールしなかった。
RNA配列決定
これらのサンプルのRNAライブラリーを、TruSeq RNAライブラリー調製キット(Illumina、San Diego、CA)を使用して、本発明者らの大学の次世代配列決定および発現分析コア施設で構築した。全てのサンプルを、HiSeq2500(Illumina)中で50サイクル、単一読み取り配列決定に供し、そしてBcl2Fastq v2.17.1.14(Illumina)を使用して逆多重化した。遺伝子発現分析は、Tuxedo Suiteを用いて完了した。短いRNA断片データをFASTQフォーマットでコンパイルし、TopHat v2.1.13を用いてヒト参照ゲノム(ヒトゲノム19[hg19])に整列させた。遺伝子発現レベルはCuffLinks v2.2.1 RNA配列決定データファイルにおける100万マッピング読取り(FPKM)標準化あたりの転写産物のキロベース当たりのフラグメントを用いて計算され、処理された転写産物の発現は、NCBIのGEOで利用可能にされている(受託No. GSE106520)。RNA配列決定の質を評価するために、アラインメント前にFASTQCおよびアラインメント後にMultiQCの両方を使用して、品質管理分析を行った。
差次的発現分析
遺伝子発現差異解析をCuffDiff v2.2.1で行い、RのCummeRbund v2.7.1パッケージで可視化した。CuffDiff v2.2.1(Trapnell Laboratory)を使用し、IA群およびコントロール群のFPKM値の対数比をIA群のFPKM値の対数比と比較し、検定統計量を計算した。検定統計量は、負の二項分布を用いて、各サンプルの分散とイェンセン=シャノンダイバージェンスの平方根をモデル化し、相対的な存在度の差異を評価した。イェセン=シャノンダイバージェンスの変化は、既知のアプローチに従い、p値を割り当てられた。
転写産物は、p<0.05で有意に差次的に発現されたと考えられた。発明者らは、IA関連発現シグネチャを、絶対的な倍数変化≧2を有する有意な転写産物と定義した。Hartら(Hart SN、Therneau TM、Zhang Y、Poland GA、Kocher JP(2013)Colculating sample size estimates for RNA sequencing data,J Comput Biol 20: 970-978)に従って、post hoc検定力推定を行った。(α=0.05、平均変動係数0.404(FPKMから計算)、およびマッピングされた100万あたり、38リード)。Benjamini-Hochbergの方法(Benjamini Y、Hochberg Y(1995)Controlling False Discovery Rate: A Pratical and Powful Approach to Multiple Testing,Journal of Royal Statistical Society Series B(Methodological)57: 289-300)を用いて多重試験補正を行い、各転写産物についてq値がレポートされた。
RT-qPCRによる検証
RNA配列決定によって測定された発現差を検証するために、定量的逆転写ポリメラーゼ連鎖反応(RT-qPCR)を行った。RNA材料を保存するために、5つの差次的に発現された転写産物(CD177、SERPING1、GBP5、IL8、NAAA)の発現差を検証した。これらの5つの転写産物を選択したのは、それらが最も顕著に差次的に発現された転写産物の中にあったからであり、すなわち、それらは非常に豊富であり(FPKM>10)、そして有意に差次的に発現され(p<0.05)、絶対倍率変化>1.5であったからである。各転写産物について、オリゴヌクレオチドプライマーを~60℃の融解温度および15~25ヌクレオチド長で設計して、Primer3ソフトウェアおよびPrimer BLAST(NCBI、Bethesda、MD)を使用して、50~200塩基対の長さのPCR産物を生成した。各プライマーセットの複製効率を、cDNAサンプルの連続希釈物に対してqPCRを実施することによって試験した(プライマー配列、アニーリング温度、効率、および生成物長さを実施例1、S1表に示す)。
逆転写のために、OmniScript Reverse Transcriptaseキット(Qiagen、Venlo、Limburg、netherlands)を製造業者の説明書に従って使用して、全RNAから一本鎖cDNAを生成した。ABI SYBR Green Master Mix (Applied Biosystems、Foster City、CA)および遺伝子特異的プライマーをそれぞれ0.02μMの濃度で用いて、Bio-Rad CFX Connect system(Bio-Rad、Hercules、CA)において、25μ反応液中で10ngのcDNAを用いて、3連で定量PCRを行った。温度プロフィールは、95℃で10分間の最初の工程、続いて95℃で15秒間および60℃で1分間の40サイクル、次いで60℃から95℃で20分間の最終的な融解曲線分析からなった。Bio-Radの解離融解曲線を用いた単一ピークにより、遺伝的特異的な増幅が示された。既報のように(Jiang K、Sun X、Chen Y、Shen Y、Jarvis JN(2015)、RNA sequencing from human neutrophils reveals distinct transcriptional differences associated with chronic inflammatory state, BMC Med Genomics 8: 55)、GAPDH発現を標準化に使用し、2-ΔΔCt法を使用して群間の倍数変化を計算した。
次元低減
デフォルト設定下で、R Bioconductor中のCummeRbundおよびprcompパッケージ中で、各サンプルのトランスクリプトームを用いて、教師なし主成分分析(PCA)および多次元スケーリング(MDS)による次元数低減を行った。階層的クラスタリングのために、Rにおいてhclustパッケージを使用した。樹状図を、zスコア正規化転写産物レベルからWardリンケージを使用して作成した。
バイオインフォマティクス
オープンソースソフトウェアGO::TermFinder(Stanford University School of Medicine、Stanford、CA)を用いて遺伝子セットエンリッチメント分析を行った。このツールは、いずれかの遺伝子オントロジータームが遺伝子の2つのリスト(すなわち、IAを有さない患者よりもIAを有する患者からの試料においてより高い発現を有する遺伝子、およびIAを有さない患者からの試料よりもIAを有する患者からの試料においてより低い発現を有する遺伝子)に、偶然に予想されるものよりも大きい注釈付けをしたかどうかを決定した。Q値が<0.05である場合、超幾何分布を用いた有意性検定に基づいて、有意に豊富なオントロジーが報告された。
潜在的相互作用のネットワークは、Ingenuity Pathway Analysis(IPA)ソフトウェア(Qiagen Inc、www.qiagenbioinformatics.com/products/Ingenuity pathway-analysis)を使用して生成した。IPAについては、各遺伝子識別子をIngenuity Knowledge Base中の対応する遺伝子オブジェクトにマッピングし、Knowledge Base中に蓄積された情報に由来する分子ネットワーク上に照合した。遺伝子ネットワークは、これらの遺伝子の産物間の既知の相互作用に由来するそれらの「連結性」に基づいてアルゴリズム的に生成された。ネットワークは、それらのpスコアが>21である場合、有意であるとみなされた。
上記の材料および方法を用いて、以下の結果が得られた。
試験参加者
6ヶ月の研究期間中に、著者らは、77の血液サンプル(IAを有する患者から35、コントロール被験者から42)、ならびに脳DSAを受けている個体からの血管造影画像および医療記録データを収集した。採取した血液試料のうち、37(IA患者から16、コントロールから21)は、配列決定のために十分な品質の好中球RNAを有していた。人口統計学および併存疾患に基づいてペアリングすると、11人のIA患者および11人のIA非保有コントロールを含む、22個人の最終コホートが得られた(実施例1、表1)。これらの試料は十分な品質であり、平均260/280が2.02であり、平均RINが7.04であった(実施例1、S2表)。IAを有する患者は1.5~19mmの大きさの範囲の動脈瘤を有し、複数のIAを有する3個人を含んだ(実施例1、S3表)。年齢(p>0.05、スチューデントt検定)および他の因子(p>0.05、χ2検定)(実施例1、表1)ならびに2つの群間の白血球集団(p>0.05、スチューデントt検定)に統計的な差異はなかった(図6)。
好中球はIA関連RNA発現シグネチャを有する
発明者らは、IA患者11人と対になったコントロール11人との間で特異的に発現された好中球転写産物を同定するためにRNA配列決定を行った。配列決定は、サンプルあたり平均5205万の配列および96.3%のリードマッピング率(%aligned)を有した(実施例1、S4表)。図1のボルケーノプロットは、IA患者とコントロールとの間の好中球発現の差を、発現の平均倍率変化および有意水準に関して示す。試験可能な発現差を有する13,377個の転写産物から、2群間で有意に差次的に発現した(p<0.05)258の転写産物を同定した。本発明者らは、IA関連RNA発現シグネチャを、2倍以上増加または減少した有意な転写産物と定義した。258の転写産物から、82がこれらの基準を満たした。それらを図1に斜線の円で示し、実施例1、表2に詳述する。Post hoc検定力分析は、α=0.05で少なくとも1.68倍の発現差が検出される時、0.8の検定力が達成されたと推定した。したがって、p<0.05および絶対倍率変化≧2の本発明者らの統計的基準は、このシグネチャを検出する際に>0.8の検定力を有した。
多重仮説補正は、FDR<0.20である9つの転写産物;C21orf15、CYP1B1、FLT3、XKR3、SLC12A7、PAM、IL8、FBN1、およびGPC4を同定した。この補正は有意な転写産物の数を効果的に減少させたが、実施形態では、動脈瘤関連シグネチャ中の82の有意な転写産物の全てが分析される。それ自体では有意でない(すなわち、生物学的に関連する転写産物を見つけるように設計されていない統計学的試験の厳密なカットオフに合う)各遺伝子は、依然としてIA病態生理学において重要な役割を果たし得る。潜在的に有益な転写産物の欠失を避けるために、発明者らは、IA関連シグネチャおよびクラスタリング分析において、82の転写産物すべてを含めた。
著者らは、RT‐qPCRを用いて、5つの顕著な差次的発現転写産物(CD177、NAAA、SERPING1、GBP5、およびIL8)の差次的発現を確認した。図2は、IAを有する患者とIAを有さない患者の間における発現の差異は、RNA配列決定から計算されたものとRT-qPCRから計算されたものとに関わらず、同じ方向で、同じ大きさであることを示している。2つの方法によって測定された発現の倍数変化に統計的に有意な差はなかった(全てのp値>0.05)スチューデントのt検定)。
好中球RNA発現は、コントロール群からIAを識別する
好中球RNA発現がコントロールサンプルから動脈瘤サンプルをどの程度よく区別させたかを視覚化するために、発明者らは、すべての好中球トランスクリプトームデータ(13,377転写産物)を使用して、PCAおよびMDSによる次元数減少分析を行った。図3Aは、IAおよびコントロール群が主成分空間において分離されていることを示す。同様に、MDSはまた、IAを有する患者とコントロール被験体との分離を示した(図3B)。本発明者らはまた、各患者の最大IAのサイズによってトランスクリプトームデータがIAを有する患者を分離し、PCAおよびMDSプロットの両方で2つの群を形成することを見出した:大きい(≧8mm、1つの例外を除く)および小さい(≦5mm)(図3Aおよび3B)。
82の転写産物の発現シグネチャ(p<0.05および絶対倍率変化≧2)を用いて、本発明者らはIAを有する患者をコントロールから識別することもできるかどうかを決定するために、教師付き階層的クラスタリングを行った。図3Cの樹状図では、IA群のサンプルとコントロール群からのサンプルとが、分離された。右側のIA群からの4つのサンプルは、他のサンプルよりも明確であった。残りのサンプルでは、1つのコントロール(左側)が分離され、他の全てのサンプルが3つの群に分離された。2群はすべてのコントロール試料を含み、1群はすべてのIA試料を含んだ(1例外を除く)。概要的には、階層的クラスタリングは、サンプルの91%をそれぞれのグループに集合させた。
発現の相違は、白血球活性化と一致する
本発明者らは、遺伝子セットエンリッチメント解析と生理学的経路モデリングを用いて、バイオインフォマティクス解析を行った。いくつかの厳密にコントロールされた経路が、小さいが有意な変化を示す転写産物によって調節され得る。本発明者らは、258の差次的に発現された転写産物(p<0.05)すべてを、倍数変化に関係なく使用して、バイオインフォマティクス分析を行った。実施例1、表3に詳述されるように、遺伝子オントロジー分析は、IA群においてより高い好中球発現レベルを有する遺伝子が、防御応答、白血球活性化、幹細胞維持、細胞数の維持、細胞活性化、および幹細胞発生に関与することを明らかにした。IA群においてより低い発現レベルを有する遺伝子は、免疫応答および免疫システムプロセスに関与した(表3)。
潜在的相互作用のネットワークを同定するための生理学的経路モデリングは、ネットワーク内にハブを形成する7つのシグナリングノードを有する4つのネットワークを明らかにした(図4)。これらのハブには、ERK1/2およびAP1;IL8(CXCL8)、AKTおよびVEGF;UBC;ならびにIFNGが含まれた。IPAは、これらのネットワークが細胞運動および心血管系機能(ネットワークA)、脂質代謝(ネットワークB)、細胞間シグナル伝達およびエネルギー産生(ネットワークC)、ならびに器官損傷、細胞増殖、および組織形態(ネットワークD)の活性化と一致することを示した。これらの機能は、血管内摂動に対する好中球応答に関連する。これらの4つのネットワークにおける転写産物の名称および生物学的機能のリストについては、実施例1、S5表を参照のこと。
新規の非ペアリング集団における繰り返し試験
IA関連シグネチャの発現が、独立したコホートにおいてIAを有する患者をコントロールから分離することができるかどうかを決定するために、本発明者らは、繰り返し研究を行った。これを行うために、本発明者らは、不均一な集団における患者を分離するシグネチャの潜在力を評価するために10名の追加患者を集めた(IAを有する患者5名、IAを有さないコントロール5名)が、人口統計学的および併存疾患についてはコントロールしなかった(臨床特性については例1、S6のテーブルを参照)。IAを有する患者は1.4~7mmの大きさの範囲の動脈瘤を有し、複数の動脈瘤を有する1人の個体を含んでいた(実施例1、S7表)。これらの患者の末梢血試料から、好中球を単離し、好中球RNAを抽出し、次世代RNA配列決定を行って82のIA関連転写産物のFPKMレベルを得た。これらの転写産物がIA群をコントロール群とどのように区別できるかを視覚化するために、PCAおよび階層的クラスタリングを行った。1つのIAサンプルを除いて、PCAは、主成分空間における2つのグループの分離を示した(図5A)。階層的クラスタリングはこの結果を反映し、1つのIAサンプルを除いて、IAサンプルとコントロールサンプルを別々にグループ化した(図5B)。同定されなかった患者メタデータを実施例1、S8テーブルに示す。
本実施例における上記の説明により、IAを有する患者と有さない患者との対からの循環好中球でのトランスクリプトームプロファイリングを実施し、82の転写産物の動脈瘤関連シグネチャを同定したことが認識されるだろう。これらの転写産物は、階層的クラスター分析において、IAを有する患者と有さない患者とを識別した。繰り返し研究において、このシグネチャはまた、ペアリングされていないコホートにおいて、IAを有する患者をコントロールから区別した。
循環動脈瘤バイオマーカーの探索における以前の努力
非破裂IAに対する循環バイオマーカーの探索は、20年以上にわたる。1994~2015年のIAに関するバイオマーカー刊行物のメタ分析(Hussain S、Barbarite E、Chaudhry NS、Gupta K、Dellarole Aら(2015)Search for Biomarkers of Intracenial Aneurysms: A Systematic Review、World Neurosurg 84:1473~1483)は、血液中の特定の生体分子にIAの存在を関連づける5つの研究を見出した。これらの研究では、血清のエラスターゼ-A1AT比およびLPA、VEGF、MCP-1、IL-1β、TNF-αおよびGM-CSFレベルが、非破裂動脈瘤を有する患者において高かったことを見出している。しかし、本実施例では、IAを有する患者の好中球において、これらのタンパク質について有意に高いmRNAレベルは観察されなかった。これは、これらのタンパク質が好中球以外の供給源に由来するか、または本発明者らの分析によって同定されるほどIAに十分に特異的でないかもしれないからであり得る。
以前に同定された潜在的タンパク質マーカーの1つの共通の特徴は、それらが遍在的であり、広範囲の生理学的および病理学的機能に関与することである。従って、IAに加えて、それらはまた、種々の血管疾患を示し得る。例えば、血清VEGFはまた、末梢動脈狭窄の間に増加し、血漿MCP-1はまた、血栓塞栓性高血圧において増加し、そしてLPAは、血管性認知症を有する患者の血漿において増加する。おそらく、この理由のために、これらの研究に基づくその後のバイオマーカーの開発およびバリデーションに向けて、有意な追跡調査の努力はなされていない。
潜在的なバイオマーカーを同定するための代替的なアプローチは、循環血液のトランスクリプトームをプロファイルすることであり、これは、多数の潜在的なマーカーについてのスクリーニングを提供し、IAに特異的であり得る新規の疾患メカニズムへの洞察を提供し得る。最近、非破裂IAの循環RNA発現シグネチャがマイクロアレイ研究において見出された。IA患者では、Jinら(Jin H、Li C、Ge H、Jiang Y、Li Y(2013))Circulating microRNA: a novel potential biomarker for early diagnosis of intracranial aneurysm rupture a case control study、J Transl Med 11: 296)が、増殖、アポトーシス、分子活性化、輸送、および分化に関与する77の差次的に発現された血漿マイクロRNAを見出した;Liら(Li P、Zhang Q、Wu X、Yang X、Zhang Yら(2014)Circulating microRNAs serve as novel biological markers for intracranial aneurysms、J Am Heart Assoc 3: e000972)は、炎症応答および結合組織障害に関連する119個の差次的に発現された血漿マイクロRNAを発見した;またSabatinoら(Sabatino G、Rigante L、Minella D、Novelli G、Della Pepa GMら(2013)Transcriptional profile characterization for the identification of peripheral blood biomarkers in patients with cerebral aneurysms、J Biol Regul Homeost Agents 27:729-738)は、細胞増殖およびアポトーシスの増加に関連する、末梢血単核細胞からの53の差次的に発現されたmRNAを同定した。これらの知見は、IAが種々の循環血液成分からの多数の転写産物の発現の変化を伴うことを示す。示されるように、本明細書中に提示されるいくつかの実施例は、次世代RNA配列決定を使用して行われた。この最新のハイスループット技術は、以前の研究において使用されたマイクロアレイに対して2つの重要な利点を提供する:(1)それはより大きなダイナミックレンジを提供し、低存在量の転写産物における発現差の検出を容易にする;また(2)それは、予め決められたプローブを回避して、新規なRNA(すなわち、スプライシングバリアント、非コードRNA、遺伝子アイソフォーム)の試験を可能にする。これらの能力が、発明者らに、従来のマイクロアレイでは検出できない、いくつかの特徴付けられていないおよび/または非コードのRNAを含む、82の転写産物のシグネチャを発見させた。それらには、C21orf15、LOC100131289、FLJ27354、LOC100507387、LINC00482、C1orf226、およびLOC730441が含まれる。発明者らの知見では、これらの新規転写産物は他のいかなる疾患とも関連していない。
本発明者らはまた、発現プロファイリング研究の共通の落とし穴を避けるために、本アプローチを設計した。まず、誤分類を避けるために、コントロール被験者が動脈瘤を有していないことを確認するためにDSAを使用した。以前の研究は、このようなイメージングを行わなかった。第二に、交絡因子ではなくIAの存在によるRNA発現の相違点を見出すために、人口統計学および併存疾患によって被験者を対にした。以前の研究は、典型的には健康な被験体または配偶者をコントロールとして使用した。第三に、本発明者らはシグネチャが一般集団の中でIA患者を識別することができるかどうかを調査するために、独立した、ペアリングされていないコホートにおいて繰り返し研究を行った。これらの測定は、発見されたシグネチャがIAの存在に関連する可能性を高めるのに役立った。
循環好中球および頭蓋内動脈瘤
頭蓋内動脈瘤の自然経過は、マトリックスメタロプロテイナーゼ(MMP)の過剰産生をもたらす平滑筋細胞における初期の炎症誘発性変化から始まる、炎症反応の増加および動脈瘤壁の進行性分解を特徴とする。いったん動脈瘤性の小さな嚢が形成されると、それは壁中へのマクロファージや好中球の侵入を誘発する血液動態環境を形成するが、それは、内腔におけるプラズマケモカインやサイトカイン(IL-1β、IL-17、TNF-α)の局所的増加によって促進される。これらの炎症性浸潤はMMPを大量に産生し、動脈瘤壁をさらに分解し、その成長および破裂を前進させる。これはヒト動脈瘤組織の遺伝子発現研究によって証明され、この研究は、マトリックス分解プロセス、炎症プロセス、ならびにIA壁における炎症性サイトカインおよび化学走化性タンパク質の産生の増加を見出している。さらに、Yuらは、動脈瘤組織におけるDNAメチル化における相違が、NF‐KB,JNK‐STATおよびERK/JNK経路を通じた炎症性シグナリングをプロモートするよう機能することを見出したが(Yu L、Wang J、Wang S、Zhang D、Zhao Yら、(2017)DNA Methylation Regulates Gene Expression in Intracranial Aneurysms、World Neurosurg 105:28-36)、IAの間の調節不全炎症に対する潜在的なエピジェネティックな根拠付けはカバーしていない。
IA病態生理における好中球の役割は複雑であり、十分に理解されていない。MMP-9の分泌に加えて、活性化された好中球はNGALとMPOも放出し、それぞれ細胞外マトリックスの分解と細胞毒性に間接的に寄与する。動脈瘤組織におけるNGALの増加はMMP-9の活動を調節し、それを分解から保護し、ひいては動脈瘤の進行を助ける。炎症性酵素であるMPOの増加は、活性酸素種の産生を介して酸化ストレスおよび炎症誘発性細胞シグナル伝達を誘発する。NGALおよびMPOの血漿レベルは、動脈瘤を有する患者の血液中で増加することが観察されている。さらに、これらのタンパク質の両方は好中球活性化を促進するオートクリン作用を有し得、これは本発明者らの試験において観察される発現変化をもたらし得る。興味深いことに、本発明者らは、IAを有する患者由来の好中球において、NGAL受容体であるSLC22A17の発現の有意な増加を見出した。これは、循環するNGALとの相互作用の可能性を反映し得る。しかし、本発明者らは、循環好中球において有意に高いレベルのNGALまたはMPOを観察せず、これらのタンパク質は動脈瘤嚢自体または他の循環細胞に由来し得ることが示唆された。
この実施例に記載される発現データのさらなる分析は、活性化された循環好中球とIA存在との間の関連を支持する。遺伝子セットエンリッチメント分析は、IA患者由来の好中球が白血球活性化に関連するより高いレベルの遺伝子発現を有することを明らかにする。これは、「白血球活性化」オントロジー(CD1D、CD7、CD86、およびCD247)ならびに好中球活性化のマーカーであるCD177由来のいくつかのCD抗原の発現レベルの増加によって証明される。IPAはまた、活性化された好中球を示唆する機能を明らかにし、細胞運動、細胞間シグナル伝達、および細胞増殖の活性化と一致するネットワークを示す。好中球発現データがPCAおよびMDSにおけるサイズによって動脈瘤を分離したという事実(図3AおよびB)は、IAの進行の程度と好中球活性化との間の相関を示し得る。従って、本開示は、末梢好中球活性化がIA発生において役割を果たし得ることを示す。具体的には、この実施例では、循環好中球中の82の転写産物のIA関連RNA発現シグネチャを同定した。このシグネチャは>0.80の検定力を示し、いくつかの分析において、IAを有する患者をペアリングされたコントロールから区別することができた。これらの転写産物はまた、小集団において、ペアリングされていないコントロールからIAを有する患者を分離した。
[実施例2]
この実施例は、実施例1の開示を拡張する。特に、この実施例では、40人の患者(非破裂IAを有する20人、IAを有さないコントロール20人)からの血液サンプルから抽出された好中球RNAを、次世代RNA配列決定に供して、好中球トランスクリプトームを得た。30サンプルの無作為に選択したトレーニングコホート(IAでn=15、コントロールでn=15)において、差次的発現分析を行った。有意に差次的に発現された転写産物(False Discovery Rate(FDR)<0.05、倍数変化≧1.5)を使用して、4つの公知の教育された機械学習アプローチ(線形判別分析、k最近傍、最近接収縮重心、およびサポートベクターマシン)を使用して、IAの予測モデルを構築した。これらのモデルは残りの10人の患者(試験コホート)において試験され、それらの性能は受信者動作特性曲線によって評価された。リアルタイムPCRを用いて、新規の独立したコホート(n=10)由来の好中球サンプルにおける7つのモデル転写産物の発現差を確証した。訓練コホートは、26の高度に有意に差次的に発現された好中球転写産物を生じた。これらの転写産物を使用するモデルは、試験コホートにおいて、0.60~0.90の範囲の精度でIA患者を同定した。最良の性能モデルは、対角線形判別分析分類子(曲線下面積(AUC)=0.80および精度=0.90)であった。別々の患者コホートから単離した好中球を用いた定量的PCRにより、7つの差次的に発現した遺伝子のうち6つを確認した。したがって、この実施例はIA症例を分類し、循環好中球トランスクリプトームデータを使用して非破裂IAの予測モデルを作成するための機械学習方法の使用を示す。
以下の材料および方法を用いて、本実施例に記載の結果を得た。
コホート生成
治験対象集団
この試験は、大学のバッファロー・ヘルス・サイエンス研修施設の審査委員会によって承認された。方法は、承認されたプロトコルに従って実施した。書面によるインフォームド・コンセントを全ての被験者から得た。106の末梢血試料を、ニューヨーク州バッファローのGates Vascular Instituteで脳デジタルサブトラクション血管造影(DSA)を受けている患者から採取した: 51人の患者がIA診断陽性であり、55人がIA診断陰性であった(コントロール)。画像診断によりIA診断陽性または陰性を確認し、患者の医療記録を収集した。
陽性および陰性の頭蓋内動脈瘤(IA)診断を有する脳デジタルサブトラクション血管造影(DSA)を受けた患者を本研究に登録した。DSAを受けた理由としては、IAの存在の非侵襲的画像診断、血管奇形、頸動脈狭窄、または以前に検出されたIAの追跡非侵襲的画像診断からの所見の確認が挙げられた。同意した患者はすべて18歳以上で、英語を話し、IAに対する以前の治療を受けていなかった。免疫系が変化している可能性のある患者は除外した;この患者には、妊娠中、最近侵襲的手術を受けた患者、化学療法を受けている患者、体温が37.78℃(100F)を超えている患者、固形臓器移植を受けている患者、自己免疫疾患を有する患者、プレドニゾンまたは他の免疫調節薬を服用している患者が含まれた。さらに、含まれた患者は、腹部大動脈瘤を含む、他の既知の脳血管奇形または頭蓋外動脈瘤を有さなかった。
好中球単離
16mLの血液を、大腿動脈中のアクセスカテーテルから採取し、そして2つの8mLのクエン酸処理細胞調製管(BD、Franklin Lakes、NJ)に移した。好中球を、他の記載のように(Jiang K、Sun X、Chen Y、Shen Y、Jarvis JN(2015)RNA sequencing from human neutrophils reveals distinct transcriptional differences associated with chronic inflammatory states. BMC Med Genomics 8: 55)、末梢血収集から1時間以内に単離した。細胞調製管を1,700×gで25分間遠心分離し、フィコール密度勾配を介して末梢血試料中の単核細胞および血漿から赤血球および好中球を分離した。赤血球および好中球を3mLシリンジに回収した。赤血球の低張溶解後、好中球を400×gで10分間の遠心分離によって単離し、破砕し、さらなる処理まで-80℃でTRIzol試薬(Life Technologies、Carlsbad、CA)中に保存した。この様式で単離された好中球はフローサイトメトリーによって98%を超えるCD66b+であり、そしてCD14+単球のコンタミネーションを含まない。(Jarvis JN、Dozmorov I、Jiang K、Frank MB、Szodoray Pら(2004) Novel approaches to gene expression analysis of active polyarticular juvenile rheumatoid arthritis. Arthritis Res Ther 6: R15-r32)
RNA調製
好中球RNAを、TRIzolを使用して、製造業者の説明書に従って抽出した。微量DNAをDNase I(Life Technologies、Carlsbad、CA)処理によって除去した。RNAを、RNeasy MinElute Cleanup Kit(Qiagen、Venlo、Limburg、Netherlands)を用いて精製し、RNaseを含まない水に懸濁した。各試料中のRNAの純度および濃度を、NanoDrop 2000(Thermo Scientific、Waltham、MA)で260nmでの吸光度によって測定し、200~400ngのRNAを、さらなる品質管理のために、本発明者らの大学の次世代配列決定および発現分析コア施設に送った。Quant-iT RiboGreen Assay(Invitrogen、Carlsbad、CA)を用いて、TBS-380 Fluorometer(Promega、Madison、WI)を用いて、コア施設で正確なRNA濃度を測定したが、RNA試料の品質はAgilent 2100 BioAnalyzer RNA 6000 Pico Chip(Agilent、Las Vegas、NV)を用いて測定した。RNA配列決定のために許容できる純度(≧1.9の260/280比)および完全性(RIN≧5.0)のRNA試料を考慮した。
RNA配列決定
RNAライブラリーは、Illuminal TruSeq RNA Library Preparation Kit(Illumina、San Diego、CA)を用いて構築した。全てのサンプルを、HiSeq2500(Illumina)中で50サイクル、単一読み取り配列決定に供し、そしてBcl2Fastq v2.17.1.14(Illumina)を使用して逆多重化した。遺伝子発現分析は、Tuxedo Suiteを用いて行った。各サンプルについて、FASTQフォーマットの短いRNA断片データをコンパイルし、TopHat v2.1.13を用いてヒト参照ゲノム(ヒトゲノム19-hg19)に整列させた。RNA配列決定の品質を評価するために、FASTQCを用いて品質管理分析を行い、MultiQCを用いて総合品質管理データを可視化し、比較した。
転写発現レベルはサンプル間のRNAレベルの比較のために、Transcripts Per Million(TPM)標準化を用いてカウントから計算した。サンプルを2つのバッチで処理した。そこで、Rのデフォルト設定でComBatを用いてバッチ効果補正を行った。これは、平均TPM>1.0のすべての転写産物の発現データについて、2群のうち少なくとも1群で行った。(バッチ情報については、実施例2、補足表1を参照のこと)。
差次的発現分析
差次的発現分析の前に、好中球トランスクリプトームを、2つのコホート:それぞれ半分のIAおよび半分のコントロールトランスクリプトームを含む、トレーニングコホート(n=30)および試験コホート(n=10)に無作為に分割した。トレーニングコホートにおける差次的遺伝子発現分析を、F統計を用いて行い、転写産物ごとに平均についての差次的変動を評価した。Benjamini-Hochberg法を用いて複数の試験補正を行い、各転写産物についてq値を報告した。転写産物は、FDR調整p値(q値)<0.05で有意に差次的に発現されたと考えられた。
バイオインフォマティクス
本発明者らはオープンソースGene Ontology enRIchment anaLysis and visuaLizAtionツール(GORILLA)を用いて、差次的に発現されるすべての転写産物(q<0.05)について遺伝子オントロジータームエンリッチメント分析を実施した。これは、他所で記載されるように(Jiang K、Sun X、Chen Y、Shen Y、Jarvis JN(2015) RNA sequencing from human neutrophils reveals distinct transcriptional differences associated with chronic inflammatory states. BMC Med Genomics 8:55)3人の健康な個体の好中球RNA発現のバックグラウンド遺伝子リスト(100万マッピング読取り(FPKM)標準化あたりの転写産物のキロベース当たりのフラグメント、FPKM>1.0)を用いて行った。このツールは、標準的な超幾何学的統計を使用して、バックグラウンド好中球発現と比較して、IAにおいて増加または減少した発現を有する遺伝子に富む遺伝子オントロジー(GO)タームを同定した。エンリッチメントFDRがp値(q値)<0.20(20%FDR)であると算出した場合に、関連する遺伝子オントロジープロセスおよび機能が報告された。
分類モデルの開発
特徴の選択
モデルトレーニングの前に、差次的に発現された転写産物のセットを、フィルタリングによって減らした。本発明者らは、FDR<0.05および絶対倍率変化≧1.5を有する転写産物のみを残した。残る転写産物がコントロール試料からIAをどのように分離したかを可視化するために、デフォルト設定下でprcompパッケージを用いてRで主成分分析(PCA)を行った。
モデルトレーニング
選択した転写産物を用いて、MATLAB Statistics and Machine Learning ToolboxおよびR bioconductorを用いて、分類モデルをトレーニングした。具体的には、遺伝子発現データから疾患分類に成功裏に使用された4つのアルゴリズムを検討した。これらの方法は、K-最近傍分類(Baker CJ, Fiore A, Connolly ES, Jr., Baker KZ, Solomon RA (1995) Serum elastase and alpha-1-antitrypsin levels in patients with ruptured and unruptured cerebral aneurysms. Neurosurgery 37: 56-61; discussion 61-5)、線形判別分析(Phillips J, Roberts G, Bolger C, el Baghdady A, Bouchier-Hayes D, et al. (1997) Lipoprotein (a): a potential biological marker for unruptured intracranial aneurysms. Neurosurgery 40: 1112-1115; discussion 1115-1117)、最近接重心分類(Sandalcioglu IE, Wende D, Eggert A, Regel JP, Stolke D, et al. (2006) VEGF plasma levels in non-ruptured intracranial aneurysms. Neurosurg Rev 29: 26-29)、サポートベクターマシン(SVM)(Zhang HF, Zhao MG, Liang GB, Song ZQ, Li ZQ (2013) Expression of pro-inflammatory cytokines and the risk of intracranial aneurysm. Inflammation 36: 1195-1200)を含んだ。各方法をトレーニングコホートに別々に適用し、リーブ・ワン・アウト(LOO)クロスバリデーションで評価して、モデル性能を推定し、オーバーフィッティングを防止した。最近傍分類:コサインメトリック(コサイン最近傍(コサインNN))を有するK-最近傍法(Chalouhi N、Theofanis T、Starke RM、Zanaty M、Jabbour Pら(2015)Potential role of granulocyte-monocyte-stimulating factor in progression of cranial aneurysms、DNA Cell Biol 34: 78-8)を使用した。隣接数kは、コサインNNに対して5に設定された。得られたモデルは、各トレーニングサンプルまでの距離を計算することによって試験サンプルを分類した。試験サンプルのラベルは、多数決によって予測され、k個の最近傍の中で最も共通するクラスを選択した。線形判別分析:本発明者らは他の箇所に記載されるように、対角線形線形判別分析(DLDA)を使用して分類ツールをトレーニングした。(Baker CJ、Fiore A、Connolly ES、Jr.、Baker KZ、Solomon RA(1995) Serum elastase and alpha-1-antitrypsin levels in patients with ruptured and unruptured cerebral aneurysms. Neurosurgery 37: 56-61; discussion 61-52)。この方法は、対角共分散行列を用いて2つのクラスを最良に分離する転写産物の線形な組み合わせを求める。転写産物に関連する線形モデル係数(判別スコア)は、各転写産物の重要性を予測モデルに繋いだ。(Chen J, Han L, Xu X, Tang H, Wang H, et al. (2015) Serum biomarkers VEGF-C and IL-6 are associated with severe human Peripheral Artery Stenosis. J Inflamm (Lond) 12: 50)。分類は、判別スコアによって決定された最大分離方向に試験サンプルを投影し、IAの対応する事後的確率を計算することによって行った。最近接重心分類:最近重心法(Nearest Shrunken Centroids(NSC))の修正を用いた。(Sandalcioglu IE、Wende D、Eggert A、Regel JP、Stolke Dら(2006) VEGF plasma levels in non-ruptured intracranial aneurysms. Neurosurg Rev 29:26-29)。この方法は、各転写産物について分類に特異的な重心(標準偏差正規化平均)を計算し、可変的な発現を有する転写産物を排除することによってそれらを洗練する。分類は、含まれるモデル転写産物の発現を2つの分類の重心と比較し、それを二乗距離において最も近いクラスに割り当てることによって行った。(Sandalcioglu IE、Wende D、Eggert A、Regel JP、Stolke Dら(2006) VEGF plasma levels in non-ruptured intracranial aneurysms. Neurosurg Rev 29:26-29)。サポートベクターマシン:本発明者らが実施した最も複雑な分類アルゴリズムはSVMであった。(Kimura H、Okada O、Tanabe N、Tanaka Y、Terai Mら(2001) Plasma monocyte chemoattractant protein-1 and pulmonary vascular resistance in chronic thromboembolic pulmonary hypertension. Am J Respir Crit Care Med 164:319-324)。バイナリラベル付きトレーニングサンプルを分離するために、SVMは、いずれかの分類のサンプルから最大限に離れた超平面を見つける。線形カーネルをモデル作成に使用した。得られたモデルは、テストサンプルを高次元空間にマッピングし、超平面までのそれらの距離に基づいて決定を行うことによって、テストサンプルを分類した。
分類モデル評価
トレーニングコホートにおけるモデル評価
トレーニングコホートにおける各モデルの性能を、LOOクロスバリデーションの結果を用いて推定した。モデル分類を、イメージングからの各患者の臨床診断と比較し、真陽性(TP)、真陰性(TN)、偽陽性(FP)、および偽陰性(FN)を計数した。各モデルの性能は最初に、モデルの感度、特異度、および精度を計算することによって評価した:
モデル予測に基づいて、受信者動作特性(ROC)曲線を作成し、ROC曲線下面積(AUC)を計算してモデル性能を評価した。
独立した試験コホートにおけるモデルのバリデーション
分類モデルを、試験コホートからのトランスクリプトームについて独立して試験した。これらのモデル特徴のTPM値を、IA存在の分類のためのモデルに入力した。分類結果を臨床診断と比較して、各モデルについて真の感度、特異度、および精度を計算した。ROC曲線を構築し、AUCを用いて各分類ツールの性能を評価した。
全検体のクロスバリデーション
モデルはランダムに選択されたトレーニングデータセット(n=30)からのデータポイントを使用して適合されたので、選択バイアスがモデル予測に不一致を導入し得る。モデルの予測の信頼性を高め、誰にでもより一般化可能なアルゴリズムを作成するために、本発明者らは、各モデルについて40人の患者全員からの26の選択された転写産物の発現レベルを用いて、LOOクロスバリデーションを実施した。これは、39のサンプルからなる40の異なるトレーニングセットにおいてモデルを本質的に再トレーニングし、残りのサンプルについて試験を行った。前述のように、分類結果を使用して、各モデルについての感度、特異度、および精度を計算し、ならびに各修正された分類ツールについてのROC曲線のAUCを算出した。
モデルの陽性および陰性予測値
さらに、分類モデルの陽性予測値(PPV)および陰性予測値(NPV)を計算することによって、分類モデルの予測値を評価した。(Li P、Zhang Q、Wu X、Yang X、Zhang Y、et al.(2014) Circulating microRNA serve as novel biological markers for intracranial aneurysms. J Am Heart Assoc 3: e000972)、PPVおよびNPVは、ベイズの定理に基づく以下の式を用いて推定した:
PPVおよびNPVは、0~100%の有病率範囲にわたって計算され、確立されたアプローチに従って、IA有病率の報告された範囲(3.2%~7%)を指摘した。(Meng H, Tutino VM, Xiang J, Siddiqui A (2014) High WSS or low WSS? Complex interactions of hemodynamics with intracranial aneurysm initiation, growth, and rupture: toward a unifying hypothesis. AJNR Am J Neuroradiol 35: 1254-1262; Chalouhi N, Points L, Pierce GL, Ballas Z, Jabbour P, et al. (2013) Localized increase of chemokines in the lumen of human cerebral aneurysms. Stroke 44: 2594-2597; Frosen J, Tulamo R, Paetau A, Laaksamo E, Korja M, et al. (2012) Saccular intracranial aneurysm: pathology and mechanisms. Acta Neuropathol 123: 773-786; Yu L, Wang J, Wang S, Zhang D, Zhao Y, et al. (2017) DNA Methylation Regulates Gene Expression in Intracranial Aneurysms. World Neurosurg 105: 28-36)。
独立コホートにおけるqPCRによる発現差のバリデーション
26のモデル遺伝子における発現差を検証するために、定量的ポリメラーゼ連鎖反応(qPCR)を行った。mRNA量の限界のため、qPCRは、実施例1に記載されるように、10人のさらなる患者(5人はIAを有し、5人はコントロール)において7つのモデル転写産物に対して行なわれた。簡単に述べると、オリゴヌクレオチドプライマーは、Primer3ソフトウェアおよびPrimer BLAST(NCBI、Bethesda、MD)を用いて、60℃の融解温度および15~25ヌクレオチド長で設計して、50~250塩基対の長さのPCR産物を生成した。各プライマーセットの複製効率を、cDNAサンプルの連続希釈物に対してqPCRを行うことによって試験した(プライマー配列、アニーリング温度、効率、および製品長さを実施例2、補足表2に示す)。
逆転写のために、OmniScript Reverse Transcriptaseキット(Qiagen、Venlo、Limburg、Netherlands)を製造業者の指示に従って使用して、全RNAから一本鎖cDNAを生成した。ABI SYBR Green I Master Mix (Applied Biosystems、Foster City、California)および遺伝子特異的プライマーをそれぞれ0.02μMの濃度で使用して、Bio-Rad CFX Connect(Bio-Rad、Hercules、California)中で、25μL反応液中の10ngのcDNAを用いて、3連で定量PCRを行った。温度プロフィールは、95℃で10分間の最初の工程、続いて95℃で15秒間および60℃で1分間の40サイクル、次いで60℃から95℃への20分間にわたる最終融解曲線分析からなった。
Bio-Rad解離融解曲線を用いた単一ピークにより、遺伝的特異的な増幅が示された。サンプルはGAPDH、18s rRNA、およびGPIの発現に基づいて標準化された。これら遺伝子は、目的の遺伝子に対して平行して反応された。これらの値を用いて、2-ΔΔCt法を用いて2群間の平均倍率変化を計算した。(Leopold JA (2015) The Central Role of Neutrophil Gelatinase-Associated Lipocalin in Cardiovascular Fibrosis. Hypertension 66:20~22)。これらの値を各ハウスキーピング遺伝子について計算し、平均した。次いで、新しいコホートにおけるqPCRデータによって測定された遺伝子発現の平均倍率変化を、トレーニングコホートにおけるRNA配列決定から計算された倍率変化と比較した。
以下の結果は、本実施例に記載される前述の材料および方法を使用して得られた。
試験参加者
研究期間中、本発明者らは、106の血液サンプル(IA患者から51、コントロール被験者から55)、ならびに脳デジタルサブトラクション血管造影(DSA)を受けた個体からの血管造影画像および医療記録データを収集した。採取した血液サンプルのうち、43(IA患者から20、コントロールから23)が我々の基準を満たし、配列決定に十分な質および量の好中球RNAも有していた。次いで、合計40人の患者(IAを有する20人およびコントロール20人)を選択し、30人の患者訓練コホート(n=15IAおよびn=15コントロール)および10人の患者試験コホート(n=5IAおよびn=5コントロール)に無作為に分割した。2つのコホートの特徴については、実施例2、表1を参照されたい。これらの試料は十分な品質であり、平均260/280が2.02(範囲1.90~2.12)であり、平均RNA完全性数(RIN)が6.88(範囲5.2~8.2)であった(実施例2、補足表3)。IAを有する患者は1~19mmの大きさの範囲の動脈瘤を有し、そして複数のIAを有する5人の個体を含んだ(実施例2、補足表4を参照のこと)。これらのサンプルの一部(n=22)を実施例1に記載し、IAを有する患者と有さない患者との間の好中球発現差を分析した。
IA患者とコントロール患者の好中球における差次的RNA発現
RNA配列決定データを用いて、訓練コホートにおけるIAを有する15人の患者と15人のコントロールとの間で差次的に発現された好中球転写産物を同定した。全体として、本発明者らの配列決定実験は、サンプルあたり平均5384万配列および95.4%のリードマッピング率(%aligned)を有した(実施例2、補足表5を参照のこと)。図7Aのボルケーノプロットは、発現の平均倍率変化および有意水準に関して、IA患者とコントロールとの間の好中球発現の差を示す。いずれかの群において平均TPM>1.0を有する12,775の転写産物から、差次的発現分析は、有意に差次的に発現された(q<0.05)95の転写産物を同定した。これらの95の差次的に発現された転写産物を使用して行われた遺伝子セットエンリッチメント分析は、IA群においてより高いレベルである遺伝子は、防御応答、白血球活性化、幹細胞維持、細胞数の維持、細胞活性化、および幹細胞発生に関与することを示した。IAにおいてより低いレベルである遺伝子は、グルタチオンおよびテトラピロール結合の調節に関与した(実施例2、表2)。
モデルトレーニングのための選択された転写産物
モデルトレーニングの前に、疾患関連転写産物を同定し、データ次元を減少させて下流分析を容易にするために、フィルタリングによる特徴選択を行った。偽発見率(false discovery rate)(FDR)<0.05および絶対倍率変化≧1.5の本発明者らの統計的基準は、図7Aに影付きで示され、実施例2、表3に列挙される26の転写産物を残した。図7BのPCAは、これらの26の転写産物が一般に、IAを有する患者をコントロールから識別することができることを示す。上位3つの主成分は変動の47.8%を占め、PC1は22.4%の変動を含み、PC2は15.3%の変動を含み、PC3は10.1%の変動を含んでいた。全体として、動脈瘤試料の60%およびコントロール試料の80%をPCAによって一緒にグループ化することができた。
IAの分類モデルは、訓練および試験データセットにおいて高い性能を有する
これら26の転写産物の発現を用いて、コサイン最近傍(コサインNN)、対角線線形判別分析(DLDA)、最近接収縮重心(NSC)、およびサポートベクターマシン(SVM)を用いて、4つの分類モデルをトレーニングした。図7Cは、LOOクロスバリデーションから推定されたモデルの感度、特異度、および精度を示す。各分類法による性能は中程度であり、精度は0.50~0.73の範囲であった。ROC曲線分析による評価は、全ての方法にわたって0.54~0.72のAUCの範囲を示した(図7D)。このデータセットにおいて、DLDAは、0.67の感度、0.80の特異度、0.73の精度、および0.72のAUCで、最良に機能した。
モデルを独立して検証するために、10人の患者からの試験コホート好中球トランスクリプトームにおいてそれらを実施した。図8AのPCAは、26の転写産物が試験コホートにおいても、IAを有する患者をコントロールから識別することができることを示す。全体として、動脈瘤試料の100%およびコントロール試料の80%をPCAによって一緒にグループ化することができた。試験コホートにおいて、モデルは、0.60~0.90の精度範囲で動脈瘤状態を予測した(図8B)。図8CのROC分析は、モデルのAUCが0.62~0.80の範囲であったことを示す。このコホートでは、DLDA分類モデルがまた最良の性能を示し、感度は0.80、特異度は1.0、精度は0.90、AUCは0.80であった。
モデルの信頼性を高めるためのクロスバリデーション
モデルの信頼性を高めるために、我々は全ての患者トランスクリプトームを用いたLOOクロスバリデーションを採用し、それらを全40のデータセット(39のトレーニングサンプルおよび1の試験サンプルの全部)において再フィッティングした。この分析はモデルの精度が0.63~0.80(図9A)の範囲であり、それらのAUCが0.69~0.84(図9B)の範囲であることを明らかにした。再び、DLDAモデルは、0.65の感度、0.95の特異度、0.80の精度、および0.84のAUCで最良の性能を示した。
モデルの陰性予測値は高い
それらの性能の範囲を考えて、本発明者らは、モデルがIAを検出する際にどの程度有用であるかを知ることを望んだ。しかしながら、それらの値は、所与の標的集団におけるIAの有病率によって本質的に影響されるのであろう。これを推定するために、本発明者らは、すべてのデータセットにおいてLOOクロスバリデーション後に報告された感度および特異度を用いて、各モデルについて陽性予測値(PPV)および陰性予測値(NPV)をプロットした(図9CおよびD)。公開刊行物で発見された動脈瘤発生率は3.2%(Meng H, Tutino VM, Xiang J, Siddiqui A (2014) High WSS or low WSS? Complex interactions of hemodynamics with intracranial aneurysm initiation, growth, and rupture: toward a unifying hypothesis. AJNR Am J Neuroradiol 35: 1254-1262)~7%(Chalouhi N, Points L, Pierce GL, Ballas Z, Jabbour P, et al. (2013) Localized increase of chemokines in the lumen of human cerebral aneurysms. Stroke 44: 2594-2597)の範囲であり、グラフに示される。動脈瘤の発生率5%で、モデルのPPVは0.10~0.41の範囲であり、NPVは0.96~0.98の範囲であった。DLDA分類ツールは、最も高いPPV(0.41)およびNPV(0.98)を有した。
RT-qPCRによる発現差の独立したバリデーション
本発明者らは、7つのモデル遺伝子の差次的発現がIAおよびコントロール患者の新しい集団において検出され得るかどうかを決定するために、確証研究を行った。本発明者らは、好中球RNAを収集したが配列決定しなかった10人のさらなる患者(IAを有する5人およびコントロール5人)からのサンプルを使用した(このコホートの患者情報については実施例2、補足表6、およびこのコホートにおけるIA患者からの動脈瘤情報については実施例2、補足表7を参照のこと)。これらのサンプルを、CD177、CYP1B1、ARMC12、OLAH、CD163、G0S2、およびFCRL5の差次的な定量的ポリメラーゼ連鎖反応(qPCR)分析に使用したが、これらは、実施例1に記載されるようにも発現されたために選択された。図10は、トレーニングコホートにおけるRNA配列決定から得られた発現差と比較した、この確証的研究のqPCR結果を示す。7つの遺伝子のうち6つは、元のコホートにおけるものと同じ方向および同様の大きさの平均倍率変化を示した。これは、IA患者とコントロール患者との間のこれらの転写産物の発現の差が一致することを示した。
好中球が、IAを代表する進行性炎症において役割を果たすことが、この実施例における上記の説明から認識されるだろう。そこで、循環好中球における遺伝子発現パターンが疾患の存在を反映し得るかどうかを分析した。実施例1に記載されるように、本発明者らは、非破裂IA患者および動脈瘤のないコントロール患者が循環好中球において有意なRNA発現差を有することを見出した。本実施例において、本発明者らは、IAの存在を予測するために、血液サンプルからの好中球RNA発現レベルを使用してバイオマーカーを分析した。本発明者らは、循環好中球におけるRNA発現プロファイリングを使用して、IAの存在と高度に関連する26の転写産物を同定した。次いで、機械学習アルゴリズムを実施して、これらの26の転写産物を使用して動脈瘤の存在を予測する分類モデルを開発した。
IAの分類モデル
いかなる特定の理論によっても拘束されることを意図するものではないが、本開示は血液中のRNA発現パターンからのIA予測を示す、最初のものであると考えられる。本発明者らがトレーニングした4つのモデルは80%の平均分類精度で実施され、このレベルはIAについてのRNA発現バイオマーカーのさらなる研究の有望性を示す。全体として、DLDAによる分類は、本発明者らのデータにおいて最良の性能を達成した。このモデルはモデルトレーニング中のクロスバリデーション(精度=0.73、AUC=0.72)、独立モデルバリデーション(精度=0.90、AUC=0.80)、およびデータセット全体にわたるクロスバリデーション(精度=0.80、AUC=0.84)を含む、複数の分析にわたって一貫して最高の精度およびAUCを有した。すべてのモデルの性能の詳細なまとめについては、実施例2、補足表8を参照されたい。
DLDA分類ツールは、26の転写産物におけるサンプル間変動性に適応したため、他の方法よりも良好に機能した可能性がある。各転写産物の平均発現はIAとコントロールとの間で有意に異なるが、それらの発現レベルは個体間で変化し得、従って、遺伝子発現のパターンを広く調査するモデリング技術はより良好なIA分類を提供し得る。いかなる特定の理論にも拘束されることを意図するものではないが、DLDA法は(1)重要性によって転写産物をランク付けし、(最近傍などのノンパラメトリックアプローチとは異なり)最も一貫して情報を与える転写産物により多くの重みを与えるため、本明細書に記載されるように機能した可能性があると考えられる。そして、(2)それは、全ての転写産物からの情報を使用して、分類を最も良く分離する方向に試験サンプルを投影する。従って、転写産物の線形な組み合わせが、安定なIA予測を生成し得、そしてサンプル間変動性に適応し得る。さらに、DLDAが行うような遺伝子間の相関を無視することは、単純なモデルを提供し、SVMなどのより高度な分類ツールよりも低い誤分類率をもたらし得る。
本開示において、分類ツールは、全ての利用可能なデータ(n=40)から無作為に選択された30のトランスクリプトームに基づいて開発された。無作為化を用いて、共変量(共存症および人口統計学)を交絡させる可能性のある患者におけるIA予測の生存率を検定した。実施例2、表1は、トレーニングコホートにおいて、IA群とコントロール群との間で喫煙率に差があったことを示し、これは、IAと喫煙との間の確立された関連を反映し得る。この実施例におけるアプローチは実施例1に記載されるものとは異なって設計され、ここで、本発明者らは、患者のコホートコントロール群(cohort-controlled group)のトランスクリプトームプロファイリングによって、IAの82の転写発現シグネチャを見出した。しかし、この差異があっても、26の分類子転写産物のうちの38%(10)は、本明細書に記載される82転写産物シグネチャの一部であった。これらには、CYP1B1、CD177、ARMC12、OLAH、CD163、ADTRP、VWA8、G0S2、FCRL5、およびC1orf226が含まれる。注目すべきは、これら7つの遺伝子について独立した患者の新たなコホートでqPCRバリデーションを実施したところ、7つの遺伝子のうち6つ(CYP1B1、MCAR12、OLAH、CD163、G0S2、FCRL5)が一貫した発現の差異を示したことである。
分類子転写産物の生物学的役割
本発明者らのデータは、IAを有する患者と有さない患者との間の差次的発現が好中球活性化を反映することを示している。トレーニングデータセット中に見出された95個の差次的に発現された転写産物(q<0.05)について実施された遺伝子セットエンリッチメント分析は、IAを有する患者由来の好中球において、炎症応答および防御応答ならびにシグナル伝達(特にIL-1、主要な好中球アクチベーター)の調節不全を示した。これらの結果は実施例1の結果を反映し、これはまた、差次的発現は末梢活性化の増加の特徴であることを示した。実際、26の分類子転写産物のいくつかは、好中球活性化に関与し得る。CD177は好中球の活性化および遊走において役割を果たす細胞表面糖タンパク質であり、一方、IL18R1は、IL-18シグナリングを介して好中球の活性化に寄与する。膜糖蛋白質であるNectin-2(PVRL2)とcGMP特異的ホスホジエステラーゼであるPDE9Aは共に細胞接着に関与している。さらに、PTGES発現の低下は、p53誘導アポトーシスに関与するので、好中球の寿命を増加させることに部分的に関与し得る。これらの知見に基づいて、IAに動的に関与し得る好中球活性化応答は本発明者らの分類モデルに反映され、これらの転写産物の異常な発現はIA分類の可能性を増加させる。
多くの他の分類子転写産物の差次的発現は、IAを有する患者における好中球における複雑な炎症応答を反映する。例えば、CD163は敗血症の間、好中球において増加することが示されており、そしてIAの間、血管炎症に寄与し得る。TGS1およびCYP26B1(それぞれ結核および若年性特発性関節炎において差次的に発現される)のような他の転写産物の発現差異は、IAの間の血管内摂動に対する多くの応答に関連する好中球機能に関連し得る。ADTRP(冠状動脈プラーク中のマクロファージによって発現される)、OCLN(活性化Tリンパ球および敗血症中の全血において増加する)、およびOLAH(非小細胞肺癌中のPBMCにおいて増加する)のような他の転写産物は炎症に関与するが、好中球において差次的に発現されることは報告されていない。さらに、いくつかの他のモデル転写産物(例えば、MTRNR2L10、ARMC12、およびLOC100506299)の役割は、広く知られていない。従って、本開示は、血液中のRNA発現パターンからのIA予測の最初の実証を提供すると考えられる。
この表における26のバイオマーカーのcDNAヌクレオチド配列は、それぞれ配列番号13~38として提供される。
[実施例3]
本実施例は、大動脈瘤と小動脈瘤とを識別するためのバイオマーカーの使用を実証するデータを提供する。動脈瘤破裂のリスクを評価するために最も広く使用されている指標は動脈瘤サイズであるため、これは、有意義である。このサイズ指標は、より大きな動脈瘤は破裂しやすく、より危険であると報告した縦断的な前向き研究から採用された。
動脈瘤の循環シグネチャにおける遺伝子が動脈瘤破裂のリスクを評価するために使用され得るかどうかを決定するために、本発明者らは、小さな頭蓋内動脈瘤と大きな頭蓋内動脈瘤(小は<5mm、大は≧5mmとして定義される)との間の有意差を同定するためにトランスクリプトームプロファイリングの能力を評価した。
研究対象集団
この研究は、バッファロー・ヘルス・サイエンス研究所のレビューにおいて大学によって承認された。方法は、承認されたプロトコルに従って実施した。書面によるインフォームド・コンセントを全ての被験者から得た。陽性および陰性の頭蓋内動脈瘤(IA)診断を有する脳デジタルサブトラクション血管造影(DSA)を受けた患者を本研究に登録した。DSAを受けた理由としては、IAの存在の非侵襲的画像診断、血管奇形、頸動脈狭窄、または以前に検出されたIAの追跡非侵襲的画像診断からの所見の確認が挙げられた。同意した患者はすべて18歳以上で、英語を話し、IAに対する以前の治療を受けていなかった。免疫系が変化している可能性のある患者は除外した;この患者には、妊娠中、最近侵襲的手術を受けた患者、化学療法を受けている患者、体温が37.78℃(100F)を超えている患者、固形臓器移植を受けている患者、自己免疫疾患を有する患者、プレドニゾンまたは他の免疫調節薬を服用している患者が含まれた。さらに、含まれた患者は、腹部大動脈瘤を含む、他の既知の脳血管奇形または頭蓋外動脈瘤を有さなかった。
好中球の単離
16mLの血液を、大腿動脈中のアクセスカテーテルから採取し、そして2つの8mLのクエン酸処理細胞調製管(BD、Franklin Lakes、NJ)に移した。好中球を、末梢血収集の1時間以内に単離した。wwCell調製管を1,700×gで25分間遠心分離し、Ficoll密度勾配を介して末梢血試料中の単核細胞および血漿から赤血球および好中球を分離した。赤血球および好中球を3mLシリンジに回収した。赤血球の低張溶解後、好中球を400×gで10分間の遠心分離によって単離し、破砕し、さらなる処理まで-80℃でTRIzol試薬(Life Technologies、Carlsbad、CA)中に保存した。この様式で単離された好中球はフローサイトメトリーによって98%を超えるCD66b+であり、そしてCD14+単球コンタミネーションを含まない。
RNA調製
好中球RNAを、TRIzolを使用して、製造業者の説明書に従って抽出した。微量DNAをDNAse I(Life Technologies、Carlsbad、CA)処理によって除去した。RNAを、RNeasy MinElute Cleanup Kit(QIAgen、Venlo、Limburg、Netherlands)を用いて精製し、RNAseを含まない水に懸濁した。各試料中のRNAの純度および濃度を、NanoDrop 2000(Thermo Scientific、Waltham、MA)で260nmでの吸光度によって測定し、200~400ngのRNAを、さらなる品質管理のために、本発明者らの大学の次世代配列決定および発現分析コア施設に送った。TBS-380 Fluorometer(Promega、Madison、WI)を用いて、Quant-iT RiboGreen Assay(Invitrogen、Carlsbad、CA)を用いて、コア施設で正確なRNA濃度を測定したが、RNA試料の品質はAgilent 2100 BioAnalyzer RNA 6000 Pico Chip(Agilent、Las Vegas、NV)を用いて測定した。RNA配列決定のために、許容できる純度(≧1.9の260/280比)および完全性(RIN≧5.0)のRNA試料を検討した。
結果
オリジナルのコホート(実施例1に記載された)は、22個体(IAを有する11、11を有さない11)を含み、本発明者らはそこからの82の転写産物シグネチャで進めた。続いて、本発明者らは、18人の患者(実施例2に記載された)を加え、本発明者らの40個体のコホート(IAを有する20、IAを有さない20)を構成した。このグループを用いて、本発明者らは26の転写産物モデルで進めた。この実施例では、さらに26のサンプルを追加し、66サンプルのコホートとした(IAを含む31、IAを含まない35)。
動脈瘤患者31サンプルのデータセットでは、15例の小さな動脈瘤(<5mm)サンプルと16例の大きな動脈瘤(≧5mm)サンプルがあった。コントロール患者と動脈瘤患者との間の循環好中球のトランスクリプトームにおける相違を評価するために、実施例2に記載したのと同じ統計的要件を適用した(TPM>1、q値<0.05、および絶対倍率変化>2)。本発明者らは、9つの差次的に発現された遺伝子(ARMC12、C1orf226、CD177、OLAH、HRK、ITGA7、LYPD2、PTGDS、RPL39L)が、11v11分析(実施例1)で開発された元の82遺伝子リストに存在することを見出した。さらに、6つの有意に差次的に発現された遺伝子(ARMC12、C1orf226、CD177、HBG2、LOC100506229、OLAH)が、実施例2に記載の26遺伝子シグネチャ/モデル(15v15分析から開発された)に存在した。これらの転写産物を、実施例3、表1に「遺伝子セット1」として報告する。太字の転写産物は、それらが82遺伝子シグネチャおよび26遺伝子モデルの両方に存在することを示す。LYPD2およびPTGDSを除いて、シグネチャおよびモデルからの発現の増加する遺伝子は、より大きな動脈瘤においてさらに高い発現を有し、また、シグネチャおよびモデルに基づくIAにおいて発現の減少する遺伝子は、より大きな動脈瘤においてさらに低い発現を有した。これは、本開示が、動脈瘤のサイズまたはサイズ範囲、したがって破裂のリスクの予測を生成するための方法を提供することを示す。HRK、ITGA7、RPL39Lは、元の82遺伝子セットの一部であったが、26遺伝子パネルの一部ではなかった。しかしながら依然として、大動脈瘤および小動脈瘤を有する個体間で有意に異なる。したがって、本開示は、これらのバイオマーカーを決定することを包含する。特定の実施形態では、本開示は、大きなIAを有する患者と小さなIAを有する患者との区別において使用するためのこれらのバイオマーカーの分析を含む。
このデータセットにおいて、本発明者らは11個のIA関連遺伝子のセットをIAの大きさ(小<5mm、大≧5mm)に関連付けるために、二次判別解析モデルを用いて機械学習アルゴリズムを作成した。MATLABの機械学習ツールボックスを用いてバイオマーカーモデルをトレーニングするために、これらの転写産物の発現レベルを用いた。このコホートにおける5倍のクロスバリデーションはモデルの精度を0.61と推定し、AUCは0.61であった。
本発明を特定の実施形態を通して説明してきたが、当業者には日常的な修正が明らかであり、そのような修正は本発明の範囲内にあることが意図されている。