JP2014158468A - 検出方法 - Google Patents

検出方法 Download PDF

Info

Publication number
JP2014158468A
JP2014158468A JP2014043282A JP2014043282A JP2014158468A JP 2014158468 A JP2014158468 A JP 2014158468A JP 2014043282 A JP2014043282 A JP 2014043282A JP 2014043282 A JP2014043282 A JP 2014043282A JP 2014158468 A JP2014158468 A JP 2014158468A
Authority
JP
Japan
Prior art keywords
probe number
affymetrix probe
genes detected
detected
genes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014043282A
Other languages
English (en)
Inventor
C Lapointe Lawrence
ラポインテ,ローレンス,シー.
Dunne Robert
ダン,ロバート
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Commonwealth Scientific and Industrial Research Organization CSIRO
Clinical Genomics Pty Ltd
Original Assignee
Commonwealth Scientific and Industrial Research Organization CSIRO
Clinical Genomics Pty Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Commonwealth Scientific and Industrial Research Organization CSIRO, Clinical Genomics Pty Ltd filed Critical Commonwealth Scientific and Industrial Research Organization CSIRO
Priority to JP2014043282A priority Critical patent/JP2014158468A/ja
Publication of JP2014158468A publication Critical patent/JP2014158468A/ja
Pending legal-status Critical Current

Links

Abstract

【課題】発現プロファイルが大腸内の細胞若しくは細胞集団の解剖学的起源を特徴付ける核酸分子のアレイを用いる検出方法の提供。
【解決手段】個体の大腸に由来する細胞又は細胞集団の解剖学的起源を決定するための方法であって、少なくとも1つの大腸の近位−遠位起源に由来する細胞又は細胞集団における遺伝子の発現を表す発現トレーニングデータ及び前記細胞若しくは細胞集団と前記近位−遠位起源との関連を表す近位−遠位起源トレーニングデータを含むトレーニングデータを入手し、前記遺伝子の発現レベルの線形若しくは非線形組み合わせを表す分類データを生成するために前記トレーニングデータを処理する、方法。
【選択図】なし

Description

発明の分野
本発明は一般に、その発現プロファイルが大腸内の細胞若しくは細胞集団の解剖学的起
源を特徴付ける核酸分子のアレイに関する。より詳細には、本発明は、その発現プロファ
イルが大腸内の細胞若しくは細胞集団の近位若しくは遠位起源を特徴付ける核酸分子のア
レイに関する。本発明の発現プロファイルは、大腸に由来する細胞若しくは細胞集団の解
剖学的起源を決定することを含むがそれには限定されない範囲の用途において有用である
。さらに、腫瘍状態への正常細胞の進行は表現型脱分化を特徴とすることが多いので、本
発明の方法は、結腸内のそれらの解剖学的所在位置を考慮に入れて考察した場合に対象細
胞によって発現されるべき発現プロファイルに比較して不正確な発現プロファイルの発現
に基づく細胞異常を同定する手段をさらに提供する。従って、本発明のこの態様は、大腸
内の異常、例えば結腸直腸腫瘍などの状態の発症若しくは発症への素因の指標となる大腸
結腸細胞の存在を同定する貴重な手段を提供する。
発明の背景
本明細書において著者が言及する刊行物の書誌の詳細は、本明細書の最後にアルファベ
ット順で集められている。
本明細書における任意の先行技術に関する言及は、その先行技術がオーストラリアにお
ける共通の一般的知識の一部を形成することの承認若しくは提案の何らかの形態ではなく
、そうであると見なすべきではない。
腺腫は、腺組織に由来する、若しくは明確に規定された腺構造を示す上皮起源の良性腫
瘍である。一部の腺腫は、認識できる組織要素、例えば線維組織(線維腺腫)を示すが、
他の腺腫、例えば気管支腺腫は、臨床的症候群を発症させる活性化合物を産生する。脳下
垂体を含む特定の器官における腫瘍は、しばしばそれらの組織学的染色親和性、例えば、
好酸性、好塩基性及び嫌色素性腺腫によって分類される。
腺腫は発癌性となることがあり、その場合は腺癌と呼ばれる。従って、腺癌は、身体の
ほとんどの器官の構成要素である腺構造から発生する悪性上皮腫瘍であると規定されてい
る。この用語は、腺成長パターンを示す腫瘍にも適用される。これらの腫瘍は、それらが
産生する物質によって、例えば粘液分泌性及び漿液性腺癌へ、又はそれらの細胞のパター
ンへの顕微鏡的配列によって、例えば乳頭状及び濾胞状腺癌へ下位分類することができる
。これらの癌は、中実性又は嚢胞性(嚢胞腺癌)の場合がある。各器官は、様々な組織学
的タイプを示す腫瘍を生成することがあり、例えば卵巣は粘液腺癌及び嚢胞腺癌のどちら
も生じさせることがある。一般に、腺腫内の癌の全発生率は、およそ5%である。しかし
、これはサイズに関連し、1cm未満の腺腫においてはまれであるが、4cmを超える絨
毛病変では40〜50%であると推定される。高度の形成異常を備える腺腫は、より高い
癌の発生率を有する。散発性腺腫が発生すると、26カ月間以内に新規の腺腫が発生する
可能性はおよそ30%である。
結腸直腸腺腫は、特により豊かな国々では、発生率の増加を示している腺腫のクラスを
表している。腺腫の原因、及びそれから腺癌への移行については、依然として集中的研究
の対象となっている。現在までに、遺伝的素因に加えて、環境因子(例えば、食生活)が
この状態の発生にある役割を果たすのではないかと推測されてきた。大多数の研究は、関
連する環境因子は、高脂肪食、低繊維食及び高精製炭水化物に関連すると指摘している。
結腸腺腫は、最初は扁平である形成異常性上皮の局所的増殖である。それらは無柄性(
sessile)(扁平)若しくは有茎性(penduculated)(茎を有する)いずれかの肉眼的形
態によって分類される。小さな腺腫(0.5mm未満)は平滑な黄褐色の表面を示すが、
有茎性腺腫は敷石状若しくは分葉状の赤褐色の表面を備える頭部を有する。無柄性腺腫は
より繊細な絨毛表面を示す。有茎性腺腫は、管状若しくは線管絨毛性である可能性が高い
が、無柄性病変は絨毛性である可能性が高い。無柄性腺腫は盲腸及び直腸において最も一
般的であるが、すべての有茎性腺腫はS状結腸及び大腸の残りの部分の間で同等に分かれ
る。
腺腫は、一般には無症候性であるため、それらの早期診断及び治療を困難にする。腺腫
の肉眼的形態に基づいて癌の存在の有無を予測することは技術的に不可能であるが、大き
な腺腫は小さな腺腫より悪性腫瘍の高い併発率を示すと考えられる。無柄性腺腫は、同一
サイズの有茎性腺腫よりも高い悪性腫瘍発生率を示す。一部の腺腫は、顕微鏡的便失血の
生成を生じさせる。しかし、便潜血は非腺腫性状態の指標となる場合もあり、悪性変化の
不在下では閉塞症状は一般に観察されないので、腺腫の正確な診断は、高度に侵襲性の手
技、例えば生検解析の適用を行わないと困難になる。従って、腺腫の原因及び悪性腫瘍へ
の移行を解明するだけではなくより有益な情報の得られる診断プロトコール、詳細には早
期、例えば前悪性腫瘍期に腺腫及び腺癌腫の迅速でルーチン的かつ正確な診断を可能にす
るプロトコールを開発する持続的な必要が依然としてある。このために、結腸直腸腺癌に
ついての研究は、近位腫瘍と遠位腫瘍との間で発生率、組織病理学及び予後が相違するこ
とを示唆してきた。
この研究方針の追求に関して、遺伝子発現プロファイリングの出現は、腸粘膜発達に関
する理解の向上をもたらしてきた。例えば、腺窩基部から内腔への放射軸平衡を生成かつ
維持することに関係する転写因子及び上皮細胞分化を発生させる転写因子の調節は、マイ
クロアレイ遺伝子発現分析の結果として現在ではより明確に理解されている(Peifer, 20
02, Nature 420:274-5,277、Traber, 1999, Adv Exp Med Biol 470:1-14)。同様に、胎
児の腸内での発達的にプログラムされた遺伝的事象、特に小腸と大腸との上皮の局所的な
相違の原因となるそれらの分子制御機構に関する理解も向上してきた(de Santa Barbara
et al., 2003, Cell Mol Life Sci 60:1322-1332、Park et al., 2005, Genesis 41:1-1
2)。他方、大腸の長手軸に沿った近位−遠位遺伝子発現変動についてはほとんど何も分
かっていない(Bates et al. 2002, Gastroenterology 122:1467-1482)。結腸直腸腺癌
についての疫学的研究は、近位腫瘍と遠位腫瘍との間で発生率、組織病理学及び予後が相
違することへの支持を示唆している(Bonithon-Kopp and Benhamiche, 1999, Eur J Canc
er Prev 8 Suppl 1:S3-12、Bufill, 1990, Ann Intern Med 113:779-788、Deng et al.,
2002, Br J Cancer 86:574-579、Distler and Holt, 1997, Dig Dis 15:302-311)。そこ
で、位置特異的変動に関する理解は、結腸直腸癌を含む結腸直腸に沿った特徴的分布パタ
ーンを有する疾患についての貴重な洞察を提供できよう(Birkenkamp-Demtroder et al.,
2005, Gut 54:374-384、Caldero et al., 1989, Virchows Arch A Pathol Anat Histopa
thol 415:347-356、Garcia-Hirschfeld Garcia et al., 1999, Rev Esp Enferm Dig 91:4
81-488)。
結腸直腸(大腸とも呼ばれる)は、臨床的便宜性のために回腸の末端領域から始まる6
つの解剖学的領域、盲腸;上行結腸;横行結腸;下行結腸;S状結腸;及び直腸へ分けら
れることが多い。又は、これらの区間は近位及び遠位大腸を含む2つの領域モデルに大腸
を分けるように分類することもできる。近位(「右」)領域は、一般には盲腸、上行結腸
、及び横行結腸を含むと見なされ、他方遠位(「左」)領域は脾湾曲部、下行結腸、S状
結腸湾曲部及び直腸を含んでいる。この分割線は、それらの分岐部が横行結腸に沿って3
分の2であるこれらの領域の別個の胎児個体発生及びさらに各器官への別個の動脈供給に
よって支持される。近位大腸は胎児の中腸から発生し、上腸間膜動脈によって供給される
が、遠位大腸は胎児の後腸から形成され、下腸間膜動脈によって供給される(Yamada and
Alpers, 2003, Textbook of Gastroenterology, 2 Vol. Set.)。近位−遠位差に関する
包括的概観は、(Iacopetta, 2002, Int J Cancer 101:403-408)に提供されている。
本発明に通じる研究において、1パネルの遺伝子がヒト大腸の近位区間と遠位区間との
間で示差的に発現することが決定されている。そこで、これにより目的の大腸由来細胞が
近位起源であるのか、遠位起源であるのかを決定するための手段の開発が可能になった。
このため正常大腸由来細胞若しくは組織のサンプルは、大腸内のそれらの解剖学的起源に
関してルーチン的に特徴付けることができる。さらになお、大多数の疾患状態は疾患細胞
の表現型プロファイル若しくは遺伝子転写における何らかの変化によって特徴付けられ、
これは特に腫瘍性の素因がある、又は腫瘍性になっている細胞について当てはまるので、
本発明の方法は、異常な細胞若しくは異常になる素因のある細胞を同定する便宜的手段を
提供する。より詳細には、大腸の解剖学的起源が公知である細胞がその位置に特徴的では
ない1個又はそれ以上の遺伝子若しくは遺伝子プロファイルを発現する場合は、その細胞
は異常であると分類され、次にその異常の性質を解明するためにさらなる分析を受けさせ
ることができる。
発明の概要
本明細書及び添付の特許請求項を通して、文脈が他のことを必要としない限り、用語「
含む(comprise)」、並びに例えば「含む(comprises)」、「含んでいる(comprising
)」などの変形は、表示した整数若しくは工程又は整数若しくは工程の群を含むが、任意
の他の整数若しくは工程又は整数若しくは工程の群を排除しないことを意味すると理解さ
れたい。
本明細書で使用する用語「由来する」は、特定の整数若しくは整数の群が規定された種
から始まっているが、必ずしも規定された起源から直接的に得られていないと見なすべき
である。さらに、本明細書で使用する「1つの(a)」、「及び(and)」及び「その(th
e)」の単数形には、文脈が明確に他のことを指示しない限り複数の指示対象が含まれる
他に規定しない限り、本明細書で使用するすべての技術用語及び科学用語は、本発明が
属する分野の当業者が一般に理解している意味と同一の意味を有する。
本発明の1つの態様は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を
決定するための方法であって、前記個体由来の生物学的サンプル中において、
(i)
Affymetrixプローブ番号:218888_s_atによって検出された1個
又はそれ以上の遺伝子、
Affymetrixプローブ番号:225290_atによって検出された遺伝子、
Affymetrixプローブ番号:226432_atによって検出された遺伝子、
Affymetrixプローブ番号:231576_atによって検出された遺伝子、
Affymetrixプローブ番号:235733_atによって検出された遺伝子、
Affymetrixプローブ番号:236894_atによって検出された遺伝子、
Affymetrixプローブ番号:239656_atによって検出された遺伝子、
Affymetrixプローブ番号:242059_atによって検出された遺伝子、
Affymetrixプローブ番号:242683_atによって検出された遺伝子、
AFARP1、若しくはAffymetrixプローブ番号:202234_s_at
によって検出された1個又はそれ以上の遺伝子、
ANPEP、若しくはAffymetrixプローブ番号:202888_s_atに
よって検出された1個又はそれ以上の遺伝子、
CCL13、若しくはAffymetrixプローブ番号:206407_s_atに
よって検出された1個又はそれ以上の遺伝子、
CRYL1、若しくはAffymetrixプローブ番号:220753_s_atに
よって検出された1個又はそれ以上の遺伝子、
CYP2B6、若しくはAffymetrixプローブ番号:206754_s_at
によって検出された1個又はそれ以上の遺伝子、
CYP2C18、若しくはAffymetrixプローブ番号:208126_s_a
tによって検出された1個又はそれ以上の遺伝子、
CYP2C9、若しくはAffymetrixプローブ番号:214421_x_at
又は220017_x_atによって検出された1個又はそれ以上の遺伝子、
EPB41L3、若しくはAffymetrixプローブ番号:211776_s_a
tによって検出された1個又はそれ以上の遺伝子、
ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若
しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
FAM45A、若しくはAffymetrixプローブ番号:221804_s_at
若しくは222955_s_atによって検出された1個又はそれ以上の遺伝子、
FGFR2、若しくはAffymetrixプローブ番号:203639_s_atに
よって検出された1個又はそれ以上の遺伝子、
GBA3、若しくはAffymetrixプローブ番号:219954_s_atによ
って検出された1個又はそれ以上の遺伝子、
GSPT2、若しくはAffymetrixプローブ番号:205541_s_atに
よって検出された1個又はそれ以上の遺伝子、
GULP1、若しくはAffymetrixプローブ番号:215913_s_atに
よって検出された1個又はそれ以上の遺伝子、
HOXA9、若しくはAffymetrixプローブ番号:205366_s_at若
しくは214551_s_atによって検出された1個又はそれ以上の遺伝子、
HOXC6、若しくはAffymetrixプローブ番号:206858_s_atに
よって検出された1個又はそれ以上の遺伝子、
HOXD3、若しくはAffymetrixプローブ番号:206601_s_atに
よって検出された1個又はそれ以上の遺伝子、
ME2、若しくはAffymetrixプローブ番号:210153_s_atによっ
て検出された1個又はそれ以上の遺伝子、
MESP1、若しくはAffymetrixプローブ番号:224476_s_atに
よって検出された1個又はそれ以上の遺伝子、
MOCS1、若しくはAffymetrixプローブ番号:213181_s_atに
よって検出された1個又はそれ以上の遺伝子、
MSCP、若しくはAffymetrixプローブ番号:218136_s_at若し
くは221920_s_atによって検出された1個又はそれ以上の遺伝子、
NETO2、若しくはAffymetrixプローブ番号:222774_s_atに
よって検出された1個又はそれ以上の遺伝子、
OASL、若しくはAffymetrixプローブ番号:210757_s_atによ
って検出された1個又はそれ以上の遺伝子、
PITX2、若しくはAffymetrixプローブ番号:207558_s_atに
よって検出された1個又はそれ以上の遺伝子、
PRAP1、若しくはAffymetrixプローブ番号:243669_s_atに
よって検出された1個又はそれ以上の遺伝子、
SCUBE2、若しくはAffymetrixプローブ番号:219197_s_at
によって検出された1個又はそれ以上の遺伝子、
SEC6L1、若しくはAffymetrixプローブ番号:225457_s_at
によって検出された1個又はそれ以上の遺伝子、
SLC16A1、若しくはAffymetrixプローブ番号:202236_s_a
t若しくは209900_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A3、若しくはAffymetrixプローブ番号:208596_s_at
によって検出された1個又はそれ以上の遺伝子、
UGT1A8、若しくはAffymetrixプローブ番号:221305_s_at
によって検出された1個又はそれ以上の遺伝子;
又は
(ii)
Affymetrixプローブ番号:230105_atによって検出された遺伝子、
Affymetrixプローブ番号:230269_atによって検出された遺伝子、
Affymetrixプローブ番号:238378_atによって検出された遺伝子、
Affymetrixプローブ番号:239814_atによって検出された遺伝子、
Affymetrixプローブ番号:239994_atによって検出された遺伝子、
Affymetrixプローブ番号:240856_atによって検出された遺伝子、
Affymetrixプローブ番号:242414_atによって検出された遺伝子、
Affymetrixプローブ番号:244553_atによって検出された遺伝子、
ARF4、若しくはAffymetrixプローブ番号:201097_s_atによ
って検出された1個又はそれ以上の遺伝子、
BTG3、若しくはAffymetrixプローブ番号:213134_x_at若し
くは205548_s_atによって検出された1個又はそれ以上の遺伝子、
CHST5、若しくはAffymetrixプローブ番号:221164_x_at又
は223942_x_atによって検出された1個又はそれ以上の遺伝子、
CMAH、若しくはAffymetrixプローブ番号:205518_s_atによ
って検出された1個又はそれ以上の遺伝子、
CRYBA2、若しくはAffymetrixプローブ番号:220136_s_at
によって検出された1個又はそれ以上の遺伝子、
CTSE、若しくはAffymetrixプローブ番号:205927_s_atによ
って検出された1個又はそれ以上の遺伝子、
DKFZp761N1114、若しくはAffymetrixプローブ番号:2423
72_s_atによって検出された1個又はそれ以上の遺伝子、
EPB41L4A、若しくはAffymetrixプローブ番号:228256_s_
atによって検出された1個又はそれ以上の遺伝子、
EPHA3、若しくはAffymetrixプローブ番号:206070_s_atに
よって検出された1個又はそれ以上の遺伝子、
FAS、若しくはAffymetrixプローブ番号:204781_s_atによっ
て検出された1個又はそれ以上の遺伝子、
FER1L3、若しくはAffymetrixプローブ番号:201798_s_at
若しくは211864_s_atによって検出された1個又はそれ以上の遺伝子、
FLJ20152、若しくはAffymetrixプローブ番号:218532_s_
at若しくは218510_x_atによって検出された1個又はそれ以上の遺伝子、
FLJ23548、若しくはAffymetrixプローブ番号:218187_s_
atによって検出された1個又はそれ以上の遺伝子、
FN1、若しくはAffymetrixプローブ番号:211719_s_at若しく
は210495_x_at若しくは212464_at若しくは216442_x_at
によって検出された1個又はそれ以上の遺伝子、
FOXA2、若しくはAffymetrixプローブ番号:210103_s_atに
よって検出された1個又はそれ以上の遺伝子、
FRZB、若しくはAffymetrixプローブ番号:203698_s_atによ
って検出された1個又はそれ以上の遺伝子、
GDF15、若しくはAffymetrixプローブ番号:221577_x_atに
よって検出された1個又はそれ以上の遺伝子、
GJB3、若しくはAffymetrixプローブ番号:205490_s_atによ
って検出された1個又はそれ以上の遺伝子、
HOXD13、若しくはAffymetrixプローブ番号:207397_s_at
によって検出された1個又はそれ以上の遺伝子、
INSM1、若しくはAffymetrixプローブ番号:206502_s_atに
よって検出された1個又はそれ以上の遺伝子、
MGC4170、若しくはAffymetrixプローブ番号:212959_s_a
tによって検出された1個又はそれ以上の遺伝子、
MLPH、若しくはAffymetrixプローブ番号:218211_s_atによ
って検出された1個又はそれ以上の遺伝子、
NEBL、若しくはAffymetrixプローブ番号:203962_s_atによ
って検出された1個又はそれ以上の遺伝子、
PLA2G2A、若しくはAffymetrixプローブ番号:203649_s_a
tによって検出された1個又はそれ以上の遺伝子、
PTPRO、若しくはAffymetrixプローブ番号:208121_s_atに
よって検出された1個又はそれ以上の遺伝子、
PYY、若しくはAffymetrixプローブ番号:207080_s_at又は2
11253_x_atによって検出された1個又はそれ以上の遺伝子、
SH3BP4、若しくはAffymetrixプローブ番号:222258_s_at
によって検出された1個又はそれ以上の遺伝子、
SLC28A2、若しくはAffymetrixプローブ番号:207249_s_a
tによって検出された1個又はそれ以上の遺伝子、
SLC2A10、若しくはAffymetrixプローブ番号:221024_s_a
tによって検出された1個又はそれ以上の遺伝子、
SPON1、若しくはAffymetrixプローブ番号:213994_s_at若
しくは209437_s_atによって検出された1個又はそれ以上の遺伝子、
STS、若しくはAffymetrixプローブ番号:203769_s_atによっ
て検出された1個又はそれ以上の遺伝子、
TM4SF11、若しくはAffymetrixプローブ番号:204519_s_a
tによって検出された1個又はそれ以上の遺伝子、
TUSC3、若しくはAffymetrixプローブ番号:213432_s_at若
しくは209228_x_atによって検出された1個又はそれ以上の遺伝子から選択さ
れる1個又はそれ以上の遺伝子の発現レベルを測定する工程を含み、
正常遠位大腸コントロールレベルに比較して(i)群の遺伝子の発現レベルが高い場合
は近位大腸起源であることを示し、及び正常近位大腸コントロールレベルに比較して(i
i)群の遺伝子の発現レベルが高い場合は遠位大腸起源であることを示す方法。
また別の態様では、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定
するための方法であって、前記個体由来の生物学的サンプル中において、
(i)
PITX2、若しくはAffymetrixプローブ番号:207558_s_atに
よって検出された1個又はそれ以上の遺伝子、
ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若
しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
FAM3B、
CYP2C18、若しくはAffymetrixプローブ番号:208126_s_a
tによって検出された1個又はそれ以上の遺伝子、
GBA3、若しくはAffymetrixプローブ番号:219954_s_atによ
って検出された1個又はそれ以上の遺伝子、
MEP1B、
ADRA2A、
HSD3B2、
CYP2B6、若しくはAffymetrixプローブ番号:206754_s_at
によって検出された1個又はそれ以上の遺伝子、
SLC14A2、若しくはAffymetrixプローブ番号:226432_s_a
tによって検出された1個又はそれ以上の遺伝子、
CYP2C9、若しくはAffymetrixプローブ番号:231576_s_at
によって検出された1個又はそれ以上の遺伝子、
DEFA5、
OASL、若しくはAffymetrixプローブ番号:210797_s_atによ
って検出された1個又はそれ以上の遺伝子、
SLC37A3、
REG1A、
MEP1B、
NR1H4;又は
(ii)
DKFZp761N1114、若しくはAffymetrixプローブ番号:2423
74_s_atによって検出された1個又はそれ以上の遺伝子、
PRAC、
INSL5、
HOXB13、又は
WFDC2から選択される1個又はそれ以上の遺伝子の発現レベルを測定する工程を含
み、
正常遠位大腸コントロールレベルに比較して(i)群の遺伝子の発現レベルが高い場合
は近位大腸起源であることを示し、及び正常近位大腸コントロールレベルに比較して(i
i)群の遺伝子の発現レベルが高い場合は遠位大腸起源であることを示す方法が提供され
る。
また別の態様では、本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的
起源を決定するための方法であって、
公知の大腸の近位−遠位起源に由来する細胞若しくは細胞集団における遺伝子の発現を
表す発現トレーニングデータ、及び前記細胞若しくは細胞集団と前記近位−遠位起源との
関連を表す近位−遠位起源トレーニングデータを含むトレーニングデータを入手する工程
と;及び
大腸に由来するまた別の細胞若しくは細胞集団における遺伝子発現を表すまた別の発現
データに基づいて、前記また別の細胞若しくは細胞集団の近位−遠位起源の指標となる近
位−遠位起源データを生成するための分類データを生成するために、多変量分析を使用し
て前記トレーニングデータを処理する工程とを含む方法を提供する。
本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するため
の検出方法であって、
公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団におけ
る遺伝子発現を表す第1発現データを入手する工程と;
前記細胞若しくは細胞集団の第1発現データと近位−遠位起源との関連を表す多変量モ
デルデータを生成するために多変量分析を用いて前記第1発現データを処理する工程と;
個体の大腸に由来する細胞若しくは細胞集団における遺伝子発現を表す第2発現データ
を入手する工程と;
前記細胞若しくは細胞集団の近位−遠位起源を表す近位−遠位起源データを生成するた
めに前記第2発現データ及び前記多変量モデルデータを処理する工程とを含む方法をさら
に提供する。
好ましくは、第1発現データを入手する工程は、前記第1発現データがそれのサブセッ
トである第3発現データを入手する工程を含んでおり、そして本方法は、前記大腸の近位
−遠位軸に沿って、単独若しくは組み合わせてのいずれかで、示差的に発現した1サブセ
ットの遺伝子に対応する第3発現データのサブセットを選択するために前記第3発現デー
タを処理する工程を含んでおり、選択されたサブセットは前記第1発現データである。
本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するため
の方法であって、
大腸に由来する公知の大腸の近位−遠位起源に由来する細胞若しくは細胞集団における
遺伝子発現を表す第1発現データを入手する工程と;
少なくとも1つの第2細胞若しくは細胞集団の近位−遠位起源を表す近位−遠位起源デ
ータを生成するために、大腸の前記少なくとも1つの第2細胞若しくは細胞集団における
前記遺伝子の発現を表す第2発現データを処理するための分類データを生成するためにカ
ーネル法を用いて前記第1発現データを処理する工程とを含む方法をさらに提供する。
本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するため
の検出方法であって、
大腸に由来する公知の大腸の近位−遠位起源に由来する細胞若しくは細胞集団における
遺伝子発現を表す第1発現データを入手する工程と;
前記遺伝子の発現の少なくとも1つの線形組み合わせに対応する主成分データを生成す
るために主成分分析を用いて前記第1発現データを処理する工程であって、前記主成分デ
ータは前記細胞若しくは細胞集団の近位−遠位起源の少なくとも1つを示す工程とを含む
方法をさらに提供する。
本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するため
の方法であって、
公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団におけ
る遺伝子の発現を表す発現データを入手する工程と;及び
前記細胞若しくは細胞集団の近位−遠位起源の少なくとも1つを示す正準変量データを
生成するために、正準変量分析を用いて前記発現データを処理する工程とを含む方法をさ
らに提供する。
本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するため
の方法であって、
公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団におけ
る遺伝子の発現を表す発現トレーニングデータ、及び前記細胞若しくは細胞集団と前記近
位−遠位起源との関連を表す近位−遠位起源トレーニングデータを含むトレーニングデー
タを入手する工程と;
前記遺伝子の発現レベルの線形若しくは非線形組み合わせを表す分類データを生成する
ために前記トレーニングデータを処理する工程であって、前記分類データは、大腸から採
取されたまた別の細胞若しくは細胞亜集団における前記遺伝子の発現を表すまた別の発現
データに基づいて、前記また別の細胞若しくは細胞亜集団の近位−遠位起源を示すまた別
の近位−遠位起源データを生成するために適合させられる工程とを含む方法をさらに提供
する。
本発明は、上記の方法のいずれか1つを実行するための成分を有する検出システムをさ
らに提供する。
本発明は、上記の方法のいずれか1つを実行するためのそこに保存されたプログラム取
扱説明書を有するコンピュータ可読記憶媒体をさらに提供する。
本発明は、
少なくとも1つの大腸に由来する細胞若しくは細胞集団における遺伝子の発現を表す発
現トレーニングデータ、及び前記細胞若しくは細胞集団と前記近位−遠位起源との関連を
表す近位−遠位起源トレーニングデータを含むトレーニングデータを入手するための手段
と;
前記遺伝子の発現レベルの線形若しくは非線形組み合わせを表す分類データを生成する
ために前記トレーニングデータを処理するための手段であって、前記分類データは、大腸
から採取されたまた別の細胞若しくは細胞集団における前記遺伝子の発現を表すまた別の
発現データに基づいて、前記また別の細胞若しくは細胞集団の近位−遠位起源を示す近位
−遠位起源データを生成するために適合させられる手段とを含む検出システムをさらに提
供する。
また別の態様では、大腸における細胞異常又は細胞異常を特徴とする状態の発症又は発
症に対する素因を決定するための方法であって、上記に記載した方法の1つに従って、大
腸における公知の近位若しくは遠位起源に由来する生物学的サンプルの近位−遠位遺伝子
発現プロファイルを決定する工程を含み、正常近位−遠位大腸遺伝子発現プロファイルと
一致しない遺伝子発現プロファイルの検出は前記プロファイルを発現する細胞若しくは細
胞集団の異常の指標となる方法が提供される。
本発明の関連する態様は、核酸アレイであって、そのアレイが複数の、
(i)上述した位置マーカー遺伝子のいずれか1つに対応するヌクレオチド配列若しく
はそれと少なくとも80%の同一性を示す配列を含む核酸分子又は前記核酸分子の官能的
誘導体、フラグメント、変異体若しくはホモログ;又は
(ii)42℃の低ストリンジェンシー条件下で(i)の配列のいずれか1つ又はそれ
以上にハイブリダイズすることのできるヌクレオチド配列を含む核酸分子、又は前記核酸
分子の官能的誘導体、フラグメント、変異体若しくはホモログ;
(iii)42℃の低ストリンジェンシー条件下で(i)の配列のいずれか1つ又はそ
れ以上にハイブリダイズすることのできるヌクレオチド配列を含む核酸プローブ若しくは
オリゴヌクレオチド、又は前記核酸分子の官能的誘導体、フラグメント、変異体若しくは
ホモログ;
(iv)(i)若しくは(ii)の核酸分子によってコードされたタンパク質、又は誘
導体、フラグメント、変異体若しくはホモログを含み、
前記核酸の発現のレベルは、大腸に由来する細胞若しくは細胞亜集団の近位−遠位起源
を示す核酸アレイを提供する。
近位領域と遠位領域との間の分割線が移動した場合の示差プローブセットの数を比較したグラフ表示である。 近位及び遠位大腸において上昇した転写産物の相対数のグラフ表示である。 2遺伝子モデルの典型的な例のグラフ表示である。 結腸直腸に沿って段階的変化を示す転写産物の発現増加の相対方向のグラフ表示である。 5セグメントモデル挙動を示す遺伝子のグラフ表示である。 図6a:もしあれば小さな構造を解明する、「ディスカバリ用」(Discover)データセットの全44,928プローブセットへ主成分分析(PCA)を適用することによって生成された第1及び第2主成分の典型的な例のグラフ表示である。図6b:大腸の近位及び遠位部分に対応する2つのクラスを解明する、盲腸及び直腸(即ち、大腸の最近位端及び最遠位端)から組織サンプル中で各々示差的に発現する1サブセットの115プローブセットへPCAを適用することによって生成された第1及び第2主成分のグラフである。 図7A:大腸の近位−遠位軸に沿った組織の位置の関数としての図6Aの第1主成分のグラフである。図7B:大腸の近位−遠位軸に沿った組織の位置の関数としての図6Bの第1主成分のグラフである。 図8A:プロファイル分析によって生成された第1及び第2正準変量のグラフである。図8B:大腸の近位−遠位軸に沿った組織の位置の関数としての図8Aの第1正準変量のグラフである。 各サブセット内の遺伝子の数の関数としての各サブセットの遺伝子から生成されたサポートベクターのクロスバリデーション誤差推定のグラフである。 検出システムの好ましい実施形態のブロック図である。 検出システムによって実行される検出方法の好ましい実施形態のフロー図である。
発明の詳細な説明
本発明は、一部には近位起源対遠位起源に関して、大腸からの細胞若しくは細胞集団の
解剖学的起源を特徴付ける遺伝子発現プロファイルの解明を基礎としている。この所見は
、現在はその解剖学的起源に関して、大腸に由来する細胞集団を特徴付けるルーチン手段
の開発を促進してきた。それでも今後、一部の細胞障害は対応する正常細胞に比較して疾
患細胞の遺伝子発現プロファイルにおける変化によって特徴付けられるので、本発明は、
大腸内の公知の解剖学的位置に由来している大腸細胞を、それらがその特定位置に基づい
て発現することが予測されるであろう遺伝子発現プロファイルへの何らかの変化について
ルーチン的にスクリーニングする手段をさらに提供する。正確な遺伝子発現プロファイル
が観察されない場合は、その細胞は異常を示しているので、その異常の詳細を診断する方
法によって詳細に評価すべきである。特別には、腫瘍細胞、又はそれに対する素因のある
細胞は、時々は脱分化を経験する−これは細胞の遺伝子発現表現型から余り分化していな
い表現型への変化によって証明されることは当業者には理解されるであろう。従って、近
位若しくは遠位起源の大腸細胞に特徴的な遺伝子発現プロファイルへの何らかの変化は、
大腸腫瘍、例えば腺腫若しくは腺癌の発症若しくは発症に対する素因の指標となることが
ある。さらに本発明によって提供されるのは、本発明の方法において使用するための核酸
アレイ、例えばマイクロアレイである。
従って、本発明の1つの態様は、個体の大腸に由来する細胞若しくは細胞集団の解剖学
的起源を決定するための方法であって、前記個体由来の生物学的サンプル中において、
(i)
Affymetrixプローブ番号:218888_s_atによって検出された1個
又はそれ以上の遺伝子、
Affymetrixプローブ番号:225290_atによって検出された遺伝子、
Affymetrixプローブ番号:226432_atによって検出された遺伝子、
Affymetrixプローブ番号:231576_atによって検出された遺伝子、
Affymetrixプローブ番号:235733_atによって検出された遺伝子、
Affymetrixプローブ番号:236894_atによって検出された遺伝子、
Affymetrixプローブ番号:239656_atによって検出された遺伝子、
Affymetrixプローブ番号:242059_atによって検出された遺伝子、
Affymetrixプローブ番号:242683_atによって検出された遺伝子、
AFARP1、若しくはAffymetrixプローブ番号:202234_s_at
によって検出された1個又はそれ以上の遺伝子、
ANPEP、若しくはAffymetrixプローブ番号:202888_s_atに
よって検出された1個又はそれ以上の遺伝子、
CCL13、若しくはAffymetrixプローブ番号:206407_s_atに
よって検出された1個又はそれ以上の遺伝子、
CRYL1、若しくはAffymetrixプローブ番号:220753_s_atに
よって検出された1個又はそれ以上の遺伝子、
CYP2B6、若しくはAffymetrixプローブ番号:206754_s_at
によって検出された1個又はそれ以上の遺伝子、
CYP2C18、若しくはAffymetrixプローブ番号:208126_s_a
tによって検出された1個又はそれ以上の遺伝子、
CYP2C9、若しくはAffymetrixプローブ番号:214421_x_at
若しくは220017_x_atによって検出された1個又はそれ以上の遺伝子、
EPB41L3、若しくはAffymetrixプローブ番号:211776_s_a
tによって検出された1個又はそれ以上の遺伝子、
ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若
しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
FAM45A、若しくはAffymetrixプローブ番号:221804_s_at
若しくは222955_s_atによって検出された1個又はそれ以上の遺伝子、
FGFR2、若しくはAffymetrixプローブ番号:203639_s_atに
よって検出された1個又はそれ以上の遺伝子、
GBA3、若しくはAffymetrixプローブ番号:219954_s_atによ
って検出された1個又はそれ以上の遺伝子、
GSPT2、若しくはAffymetrixプローブ番号:205541_s_atに
よって検出された1個又はそれ以上の遺伝子、
GULP1、若しくはAffymetrixプローブ番号:215913_s_atに
よって検出された1個又はそれ以上の遺伝子、
HOXA9、若しくはAffymetrixプローブ番号:205366_s_at若
しくは214551_s_atによって検出された1個又はそれ以上の遺伝子、
HOXC6、若しくはAffymetrixプローブ番号:206858_s_atに
よって検出された1個又はそれ以上の遺伝子、
HOXD3、若しくはAffymetrixプローブ番号:206601_s_atに
よって検出された1個又はそれ以上の遺伝子、
ME2、若しくはAffymetrixプローブ番号:210153_s_atによっ
て検出された1個又はそれ以上の遺伝子、
MESP1、若しくはAffymetrixプローブ番号:224476_s_atに
よって検出された1個又はそれ以上の遺伝子、
MOCS1、若しくはAffymetrixプローブ番号:213181_s_atに
よって検出された1個又はそれ以上の遺伝子、
MSCP、若しくはAffymetrixプローブ番号:218136_s_at若し
くは221920_s_atによって検出された1個又はそれ以上の遺伝子、
NETO2、若しくはAffymetrixプローブ番号:222774_s_atに
よって検出された1個又はそれ以上の遺伝子、
OASL、若しくはAffymetrixプローブ番号:210757_s_atによ
って検出された1個又はそれ以上の遺伝子、
PITX2、若しくはAffymetrixプローブ番号:207558_s_atに
よって検出された1個又はそれ以上の遺伝子、
PRAP1、若しくはAffymetrixプローブ番号:243669_s_atに
よって検出された1個又はそれ以上の遺伝子、
SCUBE2、若しくはAffymetrixプローブ番号:219197_s_at
によって検出された1個又はそれ以上の遺伝子、
SEC6L1、若しくはAffymetrixプローブ番号:225457_s_at
によって検出された1個又はそれ以上の遺伝子、
SLC16A1、若しくはAffymetrixプローブ番号:202236_s_a
t若しくは209900_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A3、若しくはAffymetrixプローブ番号:208596_s_at
によって検出された1個又はそれ以上の遺伝子、
UGT1A8、若しくはAffymetrixプローブ番号:221305_s_at
によって検出された1個又はそれ以上の遺伝子;又は
(ii)
Affymetrixプローブ番号:230105_atによって検出された遺伝子、
Affymetrixプローブ番号:230269_atによって検出された遺伝子、
Affymetrixプローブ番号:238378_atによって検出された遺伝子、
Affymetrixプローブ番号:239814_atによって検出された遺伝子、
Affymetrixプローブ番号:239994_atによって検出された遺伝子、
Affymetrixプローブ番号:240856_atによって検出された遺伝子、
Affymetrixプローブ番号:242414_atによって検出された遺伝子、
Affymetrixプローブ番号:244553_atによって検出された遺伝子、
ARF4、若しくはAffymetrixプローブ番号:201097_s_atによ
って検出された1個又はそれ以上の遺伝子、
BTG3、若しくはAffymetrixプローブ番号:213134_x_at若し
くは205548_s_atによって検出された1個又はそれ以上の遺伝子、
CHST5、若しくはAffymetrixプローブ番号:221164_x_at若
しくは223942_x_atによって検出された1個又はそれ以上の遺伝子、
CMAH、若しくはAffymetrixプローブ番号:205518_s_atによ
って検出された1個又はそれ以上の遺伝子、
CRYBA2、若しくはAffymetrixプローブ番号:220136_s_at
によって検出された1個又はそれ以上の遺伝子、
CTSE、若しくはAffymetrixプローブ番号:205927_s_atによ
って検出された1個又はそれ以上の遺伝子、
DKFZp761N1114、若しくはAffymetrixプローブ番号:2423
72_s_atによって検出された1個又はそれ以上の遺伝子、
EPB41L4A、若しくはAffymetrixプローブ番号:228256_s_
atによって検出された1個又はそれ以上の遺伝子、
EPHA3、若しくはAffymetrixプローブ番号:206070_s_atに
よって検出された1個又はそれ以上の遺伝子、
FAS、若しくはAffymetrixプローブ番号:204781_s_atによっ
て検出された1個又はそれ以上の遺伝子、
FER1L3、若しくはAffymetrixプローブ番号:201798_s_at
若しくは211864_s_atによって検出された1個又はそれ以上の遺伝子、
FLJ20152、若しくはAffymetrixプローブ番号:218532_s_
at若しくは218510_x_atによって検出された1個又はそれ以上の遺伝子、
FLJ23548、若しくはAffymetrixプローブ番号:218187_s_
atによって検出された1個又はそれ以上の遺伝子、
FN1、若しくはAffymetrixプローブ番号:211719_s_at若しく
は210495_x_at若しくは212464_at若しくは216442_x_at
によって検出された1個又はそれ以上の遺伝子、
FOXA2、若しくはAffymetrixプローブ番号:210103_s_atに
よって検出された1個又はそれ以上の遺伝子、
FRZB、若しくはAffymetrixプローブ番号:203698_s_atによ
って検出された1個又はそれ以上の遺伝子、
GDF15、若しくはAffymetrixプローブ番号:221577_x_atに
よって検出された1個又はそれ以上の遺伝子、
GJB3、若しくはAffymetrixプローブ番号:205490_s_atによ
って検出された1個又はそれ以上の遺伝子、
HOXD13、若しくはAffymetrixプローブ番号:207397_s_at
によって検出された1個又はそれ以上の遺伝子、
INSM1、若しくはAffymetrixプローブ番号:206502_s_atに
よって検出された1個又はそれ以上の遺伝子、
MGC4170、若しくはAffymetrixプローブ番号:212959_s_a
tによって検出された1個又はそれ以上の遺伝子、
MLPH、若しくはAffymetrixプローブ番号:218211_s_atによ
って検出された1個又はそれ以上の遺伝子、
NEBL、若しくはAffymetrixプローブ番号:203962_s_atによ
って検出された1個又はそれ以上の遺伝子、
PLA2G2A、若しくはAffymetrixプローブ番号:203649_s_a
tによって検出された1個又はそれ以上の遺伝子、
PTPRO、若しくはAffymetrixプローブ番号:208121_s_atに
よって検出された1個又はそれ以上の遺伝子、
PYY、若しくはAffymetrixプローブ番号:207080_s_at若しく
は211253_x_atによって検出された1個又はそれ以上の遺伝子、
SH3BP4、若しくはAffymetrixプローブ番号:222258_s_at
によって検出された1個又はそれ以上の遺伝子、
SLC28A2、若しくはAffymetrixプローブ番号:207249_s_a
tによって検出された1個又はそれ以上の遺伝子、
SLC2A10、若しくはAffymetrixプローブ番号:221024_s_a
tによって検出された1個又はそれ以上の遺伝子、
SPON1、若しくはAffymetrixプローブ番号:213994_s_at若
しくは209437_s_atによって検出された1個又はそれ以上の遺伝子、
STS、若しくはAffymetrixプローブ番号:203769_s_atによっ
て検出された1個又はそれ以上の遺伝子、
TM4SF11、若しくはAffymetrixプローブ番号:204519_s_a
tによって検出された1個又はそれ以上の遺伝子、
TUSC3、若しくはAffymetrixプローブ番号:213432_s_at若
しくは209228_x_atによって検出された1個又はそれ以上の遺伝子から選択さ
れる1個又はそれ以上の遺伝子の発現レベルを測定する工程を含み、
正常遠位大腸コントロールレベルに比較して(i)群の遺伝子の発現レベルが高い場合
は近位大腸起源であることを示し、及び正常近位大腸コントロールレベルに比較して(i
i)群の遺伝子の発現レベルが高い場合は遠位大腸起源であることを示す方法に向けられ
る。
上記に詳述したように、本発明の方法は、大腸内の細胞の遠位対近位位置が現在ではこ
れらの位置の各々の細胞に固有である遺伝子発現プロファイルによって究明できるという
決定に基礎を置いている。従って、「大腸に由来する」細胞若しくは細胞集団の「解剖学
的起源」若しくは「解剖学的位置」を決定するとの言及は、問題の細胞が大腸の遠位領域
又は大腸の近位領域を起源とするかどうかを決定することについての言及であると理解さ
れたい。これに加えて、「起源」若しくは「位置」は、細胞が大腸から採取された時点の
直前、又はその細胞が大腸から自然に剥離した場所(例、それが剥がれ落ちて便サンプル
中で見いだされる場所)で細胞が大腸から離れる直前の時点のいずれかのその細胞若しく
は調査中の細胞の位置を意味する。本発明を任意の1つの理論若しくは作用機序に限定せ
ずとも、大腸のそれ自体は消化機能を有していないが、しかし小腸を通過した未消化の食
物から大量の水及び電解質を吸収する。定期的な間隔で、蠕動運動は直腸へ向けて脱水さ
れた内容物(便)を移動させる。臨床的便宜性のために大腸は一般に、回腸の末端領域後
に始まる6つの解剖学的領域に分けられる−これらは次のとおりである。
(i)盲腸;
(ii)上行結腸;
(iii)横行結腸;
(iv)下行結腸;
(v)S状結腸;及び
(vi)直腸。
これらの区間は、近位及び遠位大腸を含む2つの領域モデルに大腸を分けて分類するこ
ともできる。近位領域は、一般には盲腸及び上行結腸を含むと理解され、他方遠位領域は
脾湾曲部、下行結腸、S状結腸湾曲部及び直腸を含んでいる。この大腸の近位領域と遠位
領域との分割線は、横行結腸に沿っておよそ3分の2に存在すると考えられている。この
分割線は、それらの分岐部が横行結腸に沿って3分の2であるこれらの領域の別個の胎児
個体発生及びさらに各器官への別個の動脈供給によって支持される。従って、横行結腸の
組織は、それらの起源点に対応するこの分岐部の側に依存して近位若しくは遠位のいずれ
かである可能性がある。本発明の方法は必ずしも細胞がそれを起源とする近位若しくは遠
位大腸の部分を示さない可能性はあるが、その組織が近位起源若しくは遠位起源のいずれ
であるかに関連する貴重な情報を提供することは理解されるであろう。近位大腸は胎児の
中腸から発生して上腸間膜動脈によって供給されるが、遠位大腸は胎児の後腸から形成さ
れて下腸間膜動脈によって供給される。
従って、大腸の「近位」領域は盲腸及び上行結腸を含む大腸の区間についての言及であ
ると理解すべきであり、大腸の「遠位」領域についての言及は、脾湾曲部、下行結腸、S
状結腸湾曲部及び直腸についての言及であると理解されたい。横行結腸領域は近位及び遠
位の両方の領域を含んでおり、それらの相対比率は近位及び遠位組織の分岐部が存在する
場所に依存するであろう。詳細には、横行結腸の組織は肝湾曲部及び脾湾曲部の間の相対
間隔に依存して近位若しくは遠位領域のいずれかに由来する可能性がある。
本発明によると、上記の段落(i)及び(ii)に詳述した遺伝子が、その遺伝子を発
現する細胞が大腸の近位領域若しくは大腸の遠位領域に位置するかどうかに依存してそれ
らの発現レベルへの示差的変化に関して変調されることが決定されている。参照の容易さ
のために、これらの遺伝子及びそれらのmRNA転写産物はイタリック体の文字列で表示
されるが、他方それらのタンパク質発現産物は非イタリック体の文字列で表示される。こ
れらの遺伝子は、包括的に「位置マーカー」と呼ばれる。
上記の副段落(i)及び(ii)に列挙した遺伝子の各々は、それらのコードされたタ
ンパク質発現産物と同様に、当業者には周知であろう。結腸直腸(大腸)細胞位置のマー
カーとしてのこれらの遺伝子の同定は、Affymetrix HG133A若しくはH
G133B遺伝子チップを用いる示差的発現分析によって発生した。このために、各遺伝
子チップは、およそ35,000個の遺伝子から転写されたRNAを検出するおよそ45
,000個のプローブセットによって特徴付けられる。平均して、およそ11個のプロー
ブ対が単一遺伝子のRNA転写産物の重複若しくは連続する領域を検出する。一般に、そ
れからRNA転写産物がAffymetrixプローブによって同定可能な遺伝子は周知
であり、特徴付けられた遺伝子である。しかし、一部のプローブが未だ規定されていない
RNA転写産物を検出する限りにおいて、これらの遺伝子は「Affymetrixプロ
ーブxによって検出された1個又はそれ以上の遺伝子」と表示される。一部の場合には単
一プローブによって多数の遺伝子を検出することができる。これは、さらに必要に応じて
示される。しかし、これは対象遺伝子の発現レベルを検出できる方法に関しての制限であ
るとは意図されていないことを理解されたい。最初の例では、対象遺伝子転写産物は、A
ffymetrix遺伝子チップ上に存在するであろう他のプローブによって検出できる
ことも理解されるであろう。単一プローブについての言及は、単に目的の遺伝子転写産物
の識別子として含まれている。しかし転写産物を実際にスクリーニングすることによって
、Affymetrixプローブが一般に向けられる末端600bp転写産物領域に向け
られるだけでなく、転写産物の任意の領域に向けられるプローブを利用することができる
このため上で列挙した遺伝子及びそれらの転写かつ翻訳された発現産物の各々について
の言及は、これらの分子のすべての形態及びそれらのフラグメント、変異体若しくは変異
形についての言及と理解されたい。当業者であれば理解するように、一部の遺伝子は個体
間の対立遺伝子変異を示すことが公知である。従って、本発明は、本発明の診断用途に関
して実際の核酸配列間の小さな遺伝的変異形が個体間に存在する可能性があるという事実
にもかかわらず、同一転帰を達成するそのような変異形に及ぶと理解されたい。このため
本発明は、すべてのRNA(例えば、mRNA、一次RNA転写産物、miRNA、tR
NA、rRNAなど)、cDNA及び選択的スプライシング又は任意の他の変異、多型若
しくは対立遺伝子変異から発生するペプチドアイソフォームに及ぶと理解されたい。さら
にこれは、任意のサブユニットポリペプチド、例えばモノマー、マルチマー、融合タンパ
ク質若しくは他の複合体として存在するかどうかにかかわらず、生成できる前駆形態につ
いての言及を含むと理解されたい。
本発明を任意の1つの理論若しくは作用機序に限定せずとも、上述した遺伝子の各々は
、遠位及び近位大腸の細胞間と同様に、単独若しくは組み合わせてのいずれかで示差的に
発現し、このために任意の所与の細胞サンプルの解剖学的起源に特徴的であるが、これら
の遺伝子の一部の発現は特に有意なレベルの感受性、特異性、陽性予測値及び/又は陰性
予測値を示した。従って、好ましい実施形態では、これらの遺伝子の1つ又はそれ以上の
発現レベルがスクリーニングして評価されるであろう。
このため本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定
するための方法であって、前記個体由来の生物学的サンプル中において、
(i)
PITX2、若しくはAffymetrixプローブ番号:207558_s_atに
よって検出された1個又はそれ以上の遺伝子、
ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若
しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
FAM3B、
CYP2C18、若しくはAffymetrixプローブ番号:208126_s_a
tによって検出された1個又はそれ以上の遺伝子、
GBA3、若しくはAffymetrixプローブ番号:219954_s_atによ
って検出された1個又はそれ以上の遺伝子、
MEP1B、
ADRA2A、
HSD3B2、
CYP2B6、若しくはAffymetrixプローブ番号:206754_s_at
によって検出された1個又はそれ以上の遺伝子、
SLC14A2、若しくはAffymetrixプローブ番号:226432_s_a
tによって検出された1個又はそれ以上の遺伝子、
CYP2C9、若しくはAffymetrixプローブ番号:231576_s_at
によって検出された1個又はそれ以上の遺伝子、
DEFA5、
OASL、若しくはAffymetrixプローブ番号:210797_s_atによ
って検出された1個又はそれ以上の遺伝子、
SLC37A3、
REG1A、
MEP1B、
NR1H4;又は
(ii)
DKFZp761N1114、若しくはAffymetrixプローブ番号:2423
74_s_atによって検出された1個又はそれ以上の遺伝子、
PRAC、
INSL5、
HOXB13、又は
WFDC2から選択される1個又はそれ以上の遺伝子の発現レベルを測定する工程を含
み、
正常遠位大腸コントロールレベルに比較して(i)群の遺伝子の発現レベルが高い場合
は近位大腸起源であることを示し、及び正常近位大腸コントロールレベルに比較して(i
i)群の遺伝子の発現レベルが高い場合は遠位大腸起源であることを示す方法を提供する
好ましくは、前記遺伝子は、ETNK1及び/又はGBA3及び/又はPRACである
本発明の検出方法は、任意の適切な生物学的サンプル上で実行できる。このために、「
生物学的サンプル」との言及は、例えば細胞物質、生体液(例、血液)、便、組織生検標
本、外科標本又は動物の身体に導入されて引き続き除去された液体(例えば、腸洗浄液か
ら回収された溶液)などであるがそれらに限定されない動物に由来する生物学的物質の任
意のサンプルについての言及であると理解されたい。本発明の方法によって試験される生
物学的サンプルは、直接的に試験できる、又は試験前に何らかの処理形態を必要とするこ
とがある。例えば、生検若しくは外科的サンプルは試験前にホモジナイズ化を必要とする
ことがある、又は個々の遺伝子の定量的発現レベルのインサイチュー試験のために切片作
製を必要とすることがある。
または、細胞サンプルは、試験前に透過処理を必要とすることがある。さらに、生物学
的サンプルが液体形にはない範囲内で、(試験のためにそのような形態が必要とされる場
合は)、サンプルを動員するためには試薬、例えばバッファーの添加を必要とすることが
ある。
位置マーカー遺伝子が生物学的サンプル中に存在する範囲内で、生物学的サンプルは直
接的に試験できる、さもなければ生物学的サンプル中に存在する核酸物質の全部若しくは
一部を試験の前に単離することができる。さらにまた別の例では、サンプルは、部分的に
精製できる、さもなければ分析前に濃縮することができる。例えば、生物学的サンプルが
極めて多様な細胞集団を含む範囲内で、特に重要な亜集団について濃縮することが望まし
い場合がある。それに由来する標的細胞集団若しくは分子について、試験前に前処理する
、例えば生きているウイルスの不活性化若しくはゲル上でのランは本発明の範囲内に含ま
れる。さらに、生物学的サンプルは新しく採取されてよい、又は試験前に(例えば凍結乾
燥によって)保存されていてよい、又はさもなければ試験前に(例えば、培養を受けさせ
ることによって)処理されてよいことも理解されたい。
本明細書に開示した方法によって試験するために最も適合するサンプルのタイプの選択
は、その状況の性質に依存するであろう。好ましくは、前記サンプルは、便サンプル、腸
洗浄液、外科的切除物若しくは組織生検である。
上記に詳述したように、本発明は、大腸内のその解剖学的起源に関して、大腸に由来す
る細胞若しくは細胞集団を特徴付けるために設計されている。従って、「細胞若しくは細
胞集団」との言及は、個々の細胞若しくは細胞群についての言及と理解されたい。前記細
胞群は、広汎性の細胞集団、細胞懸濁液、被嚢性の細胞集団若しくは組織の形態を取る細
胞集団であってよい。
「発現」との言及は、核酸分子の転写及び/又は翻訳についての言及と理解されたい。
この点で、本発明は、RNA転写産物(例えば、一次RNA、mRNA、miRNA、t
RNA、rRNA)の形態を取っている位置マーカーについてのスクリーニングに関して
例示される。「RNA」との言及は、RNAの任意の形態、例えば一次RNA、mRNA
、miRNA、tRNA若しくはrRNAなどについての言及を含むと理解されたい。本
発明を多少なりとも限定することなく、増加若しくは減少したRNA合成を導く遺伝子転
写の調節は、発現産物を産生するためのこれらのRNA転写産物(例、mRNA)の一部
の翻訳とも相関しているであろう。従って、本発明は、細胞若しくは細胞集団の近位若し
くは遠位起源の指標としての位置マーカー発現産物の変調した発現のレベル若しくはパタ
ーンについてのスクリーニングに向けられる検出方法にもさらに及ぶ。1つの方法はmR
NA転写産物及び/又は対応するタンパク質発現産物についてスクリーニングすることで
あるが、本発明はこれには限定されず、任意の他の形態の位置マーカー、例えば一次RN
A転写産物についてのスクリーニングにも及ぶと理解されたい。任意の所与の状態に対し
て最も適切なスクリーニング標的を決定することは明確に当業者の技術の範囲内に含まれ
る。好ましくは、タンパク質発現産物は、分析のサブセットである。
「核酸分子」との言及は、デオキシリボ核酸分子及びリボ核酸分子の両方についての言
及と理解されたい。このため本発明は、生物学的サンプル中のmRNAレベルについての
直接的スクリーニング又は目的のmRNA集団から逆転写されている相補的cDNAにつ
いてのスクリーニングの両方に及ぶ。DNA若しくはRNAいずれかについてのスクリー
ニングに向けられる方法を設計することは明確に当業者の技術の範囲内に含まれる。上記
で詳述したように、本発明の方法は、対象mRNAから翻訳されたタンパク質発現産物に
ついてのスクリーニングにさらに及ぶ。
本発明の方法は、生物学的サンプルの位置マーカーの発現レベルとこれらのマーカーの
正常な近位及び遠位レベルとの相関を基礎としている。「正常レベル」は、大腸内の近位
起源の細胞若しくは細胞集団によって発現されたマーカーのレベル及び遠位起源の細胞若
しくは細胞集団によって発現されたマーカーのレベルである。従って、本発明の検出方法
に関連する2種の正常レベル値がある。これらの正常レベル値は、これらのマーカーの発
現レベル若しくはパターンを変化させるであろう異常若しくは異常に対する素因を示さな
い大腸由来細胞の発現レベルに基づいて計算されることは理解されるであろう。
正常レベルは、試験の被験者である同一個体由来の組織を用いて決定することができる
。しかし、これは関係する個体にとって極めて侵襲性である可能性があり、このため本方
法は、問題の患者以外の、健常個体から入手された個別若しくは包括的結果を反映する標
準的結果に比較して試験結果を分析するためにより便宜的である可能性が高いことは理解
されるであろう。この後者の分析の形態は、実際に好ましい分析方法であるが、それは目
的の試験サンプルである単一生物学的サンプルの収集及び分析を必要とするキットの設計
を可能にするからである。近位及び遠位正常参照レベルを提供する標準的結果は、当業者
には周知であろう任意の適切な手段によって計算できる。例えば、正常組織の集団は、本
発明の位置マーカーの発現レベルに関して評価できるので、それに対してすべての今後の
試験サンプルが分析される標準値若しくはある範囲の数値を提供する。近位及び遠位正常
参照レベルは、特定のコホートの被験者から、そのコホートに由来する試験サンプルに関
して使用するために決定できることもまた理解されたい。従って、特性、例えば年齢、性
別、民族若しくは健康状態に関して相違するコホートに対応する多数の標準値又は範囲を
決定できる。前記「正常レベル」は、離散的レベル若しくはある範囲のレベルであってよ
い。試験される生物学的サンプルの結果は、好ましくは近位及び遠位正常参照レベルの両
方に対して評価される。上記に規定した、正常遠位レベルに比較した(i)群の遺伝子の
発現における増加は、試験組織が近位起源であることを示しているが、他方上記に規定し
た、正常近位レベルに比較した(ii)群の遺伝子の発現における増加は、組織が遠位起
源であることを示している。しかし、得られた結果が正常若しくは遠位レベルと“同一”
であり、これにより試験サンプルはそれに比較して評価されている正常参照レベルサンプ
ルと同一起源であることを示すかどうかを決定するという観点から得られる結果を分析す
ることによって、規定された相関的工程にアプローチできることもまた理解されるであろ
う。
試験の対象である「個体」は任意の霊長類であってよいことを理解されたい。好ましく
は、霊長類は、ヒトである。
上記に詳述したように、本発明は核酸分子の検出に関して例示されているが、対象位置
マーカーの発現産物についての試験に基づく検出方法をさらに含んでいると理解されたい
。本発明は、1つ又はそれ以上の生物学的サンプル中のタンパク質産物若しくは核酸物質
いずれかを同定することに基づく検出方法を意味するとさらに理解されたい。しかし、位
置マーカーの一部は、タンパク質発現産物をコードしない遺伝子若しくは遺伝子フラグメ
ントに相関する可能性があることを理解されたい。従って、これが発生する範囲内では、
発現産物について試験することはおそらく可能ではなく、対象マーカーは核酸発現プロフ
ァイルに基づいて評価されなければならない。
用語「タンパク質」は、ペプチド、ポリペプチド及びタンパク質を含むと理解されたい
。タンパク質は、グリコシル化若しくは非グリコシル化であってよい、及び/又はタンパ
ク質、例えばアミノ酸、脂質、炭水化物又は他のペプチド、ポリペプチド若しくはタンパ
ク質に融合した、連結した、結合した、又はさもなければ結び付いているある範囲の他の
分子を含有していてよい。本明細書での「タンパク質」との言及には、ある配列のアミノ
酸を含むタンパク質、並びに他の分子、例えばアミノ酸、脂質、炭水化物、又は他のペプ
チド、ポリペプチド若しくはタンパク質と結び付いたタンパク質が含まれる。
本発明の位置マーカータンパク質は、2つ又はそれ以上の分子が一緒に結び付いている
ことを意味するマルチマー形態にあってよい。同一タンパク質分子が一緒に結び付いてい
る場合、その複合体はホモマルチマーである。ホモマルチマーの例は、ホモダイマーであ
る。少なくとも1つのマーカータンパク質が少なくとも1つの非マーカータンパク質と結
び付いている場合は、その複合体は、ヘテロマルチマー、例えばヘテロダイマーである。
「フラグメント」との言及は、対象核酸分子の部分についての言及と理解されたい。こ
れは特に便サンプル中の変調したRNAレベルについてのスクリーニングに関して重要で
あるが、それは対象RNAが腸の環境に起因して分解、さもなければフラグメント化され
ている可能性が高いためである。このため実際に対象RNA分子のフラグメントを検出す
ることができ、そのフラグメントは適切に特異的なプローブを使用することによって同定
される。
また別の態様では、本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的
起源を決定するための方法であって、
公知の大腸の近位−遠位起源に由来する細胞若しくは細胞集団における遺伝子の発現を
表す発現トレーニングデータ、及び前記細胞若しくは細胞集団と前記近位−遠位起源との
関連を表す近位−遠位起源トレーニングデータを含むトレーニングデータを入手する工程
と;
大腸に由来するまた別の細胞若しくは細胞集団の近位−遠位起源の指標となる近位−遠
位起源データを生成するために前記また別の細胞若しくは細胞集団における遺伝子発現を
表すまた別の発現データに基づいて分類データを生成するために、多変量分析を使用して
前記トレーニングデータを処理する工程とを含む方法を提供する。
本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するため
の検出方法であって、
公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団におけ
る遺伝子発現を表す第1発現データを入手する工程と;
前記細胞若しくは細胞集団の選択された発現データと近位−遠位起源との関連を表す多
変量モデルデータを生成するために多変量分析を用いて前記選択された発現データを処理
する工程と;
個体の大腸に由来する細胞若しくは細胞集団における遺伝子発現を表す第2発現データ
を受け入れる工程と;
前記細胞若しくは細胞集団の近位−遠位起源を表す近位−遠位起源データを生成するた
めに前記第2発現データ及び前記多変量モデルデータを処理する工程とを含む方法をさら
に提供する。
好ましくは、第1発現データを入手する工程は、前記第1発現データがそれのサブセッ
トである第3発現データを入手する工程を含んでおり、そして本方法は、前記大腸の近位
−遠位軸に沿って、単独若しくは組み合わせてのいずれかで、示差的に発現した1サブセ
ットの遺伝子に対応する第3発現データのサブセットを選択するために前記第3発現デー
タを処理する工程を含んでおり、選択されたサブセットは前記第1発現データである。
好ましくは、本方法は、前記近位−遠位起源を表す前記近位−遠位起源データを生成す
るために前記また別の発現データ及び前記多変量分類データを処理する工程を含んでいる
最も好ましくは、選択された発現データは、
Affymetrixプローブ番号:218888_s_atによって検出された1個
又はそれ以上の遺伝子、
Affymetrixプローブ番号:225290_atによって検出された遺伝子、
Affymetrixプローブ番号:226432_atによって検出された遺伝子、
Affymetrixプローブ番号:231576_atによって検出された遺伝子、
Affymetrixプローブ番号:235733_atによって検出された遺伝子、
Affymetrixプローブ番号:236894_atによって検出された遺伝子、
Affymetrixプローブ番号:239656_atによって検出された遺伝子、
Affymetrixプローブ番号:242059_atによって検出された遺伝子、
Affymetrixプローブ番号:242683_atによって検出された遺伝子、
Affymetrixプローブ番号:230105_atによって検出された遺伝子、
Affymetrixプローブ番号:230269_atによって検出された遺伝子、
Affymetrixプローブ番号:238378_atによって検出された遺伝子、
Affymetrixプローブ番号:239814_atによって検出された遺伝子、
Affymetrixプローブ番号:239994_atによって検出された遺伝子、
Affymetrixプローブ番号:240856_atによって検出された遺伝子、
Affymetrixプローブ番号:242414_atによって検出された遺伝子、
Affymetrixプローブ番号:244553_atによって検出された遺伝子、
Affymetrixプローブ番号:217320によって検出された遺伝子、
Affymetrixプローブ番号:236141によって検出された遺伝子、
Affymetrixプローブ番号:236513によって検出された遺伝子、
Affymetrixプローブ番号:238143によって検出された遺伝子、
AFARP1、若しくはAffymetrixプローブ番号:202234_s_at
によって検出された1個又はそれ以上の遺伝子、
ANPEP、若しくはAffymetrixプローブ番号:202888_s_atに
よって検出された1個又はそれ以上の遺伝子、
CCL13、若しくはAffymetrixプローブ番号:206407_s_atに
よって検出された1個又はそれ以上の遺伝子、
CRYL1、若しくはAffymetrixプローブ番号:220753_s_atに
よって検出された1個又はそれ以上の遺伝子、
CYP2B6、若しくはAffymetrixプローブ番号:206754_s_at
によって検出された1個又はそれ以上の遺伝子、
CYP2C18、若しくはAffymetrixプローブ番号:208126_s_a
tによって検出された1個又はそれ以上の遺伝子、
CYP2C9、若しくはAffymetrixプローブ番号:214421_x_at
若しくは220017_x_atによって検出された1個又はそれ以上の遺伝子、
EPB41L3、若しくはAffymetrixプローブ番号:211776_s_a
tによって検出された1個又はそれ以上の遺伝子、
ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若
しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
FAM45A、若しくはAffymetrixプローブ番号:221804_s_at
若しくは222955_s_atによって検出された1個又はそれ以上の遺伝子、
FGFR2、若しくはAffymetrixプローブ番号:203639_s_atに
よって検出された1個又はそれ以上の遺伝子、
GBA3、若しくはAffymetrixプローブ番号:219954_s_atによ
って検出された1個又はそれ以上の遺伝子、
GSPT2、若しくはAffymetrixプローブ番号:205541_s_atに
よって検出された1個又はそれ以上の遺伝子、
GULP1、若しくはAffymetrixプローブ番号:215913_s_atに
よって検出された1個又はそれ以上の遺伝子、
HOXA9、若しくはAffymetrixプローブ番号:205366_s_at若
しくは214551_s_atによって検出された1個又はそれ以上の遺伝子、
HOXC6、若しくはAffymetrixプローブ番号:206858_s_atに
よって検出された1個又はそれ以上の遺伝子、
HOXD3、若しくはAffymetrixプローブ番号:206601_s_atに
よって検出された1個又はそれ以上の遺伝子、
ME2、若しくはAffymetrixプローブ番号:210153_s_atによっ
て検出された1個又はそれ以上の遺伝子、
MESP1、若しくはAffymetrixプローブ番号:224476_s_atに
よって検出された1個又はそれ以上の遺伝子、
MOCS1、若しくはAffymetrixプローブ番号:213181_s_atに
よって検出された1個又はそれ以上の遺伝子、
MSCP、若しくはAffymetrixプローブ番号:218136_s_at若し
くは221920_s_atによって検出された1個又はそれ以上の遺伝子、
NETO2、若しくはAffymetrixプローブ番号:222774_s_atに
よって検出された1個又はそれ以上の遺伝子、
OASL、若しくはAffymetrixプローブ番号:210757_s_atによ
って検出された1個又はそれ以上の遺伝子、
PITX2、若しくはAffymetrixプローブ番号:207558_s_atに
よって検出された1個又はそれ以上の遺伝子、
PRAP1、若しくはAffymetrixプローブ番号:243669_s_atに
よって検出された1個又はそれ以上の遺伝子、
SCUBE2、若しくはAffymetrixプローブ番号:219197_s_at
によって検出された1個又はそれ以上の遺伝子、
SEC6L1、若しくはAffymetrixプローブ番号:225457_s_at
によって検出された1個又はそれ以上の遺伝子、
SLC16A1、若しくはAffymetrixプローブ番号:202236_s_a
t若しくは209900_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A3、若しくはAffymetrixプローブ番号:208596_s_at
によって検出された1個又はそれ以上の遺伝子、
UGT1A8、若しくはAffymetrixプローブ番号:221305_s_at
によって検出された1個又はそれ以上の遺伝子、
ARF4、若しくはAffymetrixプローブ番号:201097_s_atによ
って検出された1個又はそれ以上の遺伝子、
BTG3、若しくはAffymetrixプローブ番号:213134_x_at若し
くは205548_s_atによって検出された1個又はそれ以上の遺伝子、
CHST5、若しくはAffymetrixプローブ番号:221164_x_at若
しくは223942_x_atによって検出された1個又はそれ以上の遺伝子、
CMAH、若しくはAffymetrixプローブ番号:205518_s_atによ
って検出された1個又はそれ以上の遺伝子、
CRYBA2、若しくはAffymetrixプローブ番号:220136_s_at
によって検出された1個又はそれ以上の遺伝子、
CTSE、若しくはAffymetrixプローブ番号:205927_s_atによ
って検出された1個又はそれ以上の遺伝子、
DKFZp761N1114、若しくはAffymetrixプローブ番号:2423
72_s_atによって検出された1個又はそれ以上の遺伝子、
EPB41L4A、若しくはAffymetrixプローブ番号:228256_s_
atによって検出された1個又はそれ以上の遺伝子、
EPHA3、若しくはAffymetrixプローブ番号:206070_s_atに
よって検出された1個又はそれ以上の遺伝子、
FAS、若しくはAffymetrixプローブ番号:204781_s_atによっ
て検出された1個又はそれ以上の遺伝子、
FER1L3、若しくはAffymetrixプローブ番号:201798_s_at
若しくは211864_s_atによって検出された1個又はそれ以上の遺伝子、
FLJ20152、若しくはAffymetrixプローブ番号:218532_s_
at若しくは218510_x_atによって検出された1個又はそれ以上の遺伝子、
FLJ23548、若しくはAffymetrixプローブ番号:218187_s_
atによって検出された1個又はそれ以上の遺伝子、
FN1、若しくはAffymetrixプローブ番号:211719_s_at若しく
は210495_x_at若しくは212464_at若しくは216442_x_at
によって検出された1個又はそれ以上の遺伝子、
FOXA2、若しくはAffymetrixプローブ番号:210103_s_atに
よって検出された1個又はそれ以上の遺伝子、
FRZB、若しくはAffymetrixプローブ番号:203698_s_atによ
って検出された1個又はそれ以上の遺伝子、
GDF15、若しくはAffymetrixプローブ番号:221577_x_atに
よって検出された1個又はそれ以上の遺伝子、
GJB3、若しくはAffymetrixプローブ番号:205490_s_atによ
って検出された1個又はそれ以上の遺伝子、
HOXD13、若しくはAffymetrixプローブ番号:207397_s_at
によって検出された1個又はそれ以上の遺伝子、
INSM1、若しくはAffymetrixプローブ番号:206502_s_atに
よって検出された1個又はそれ以上の遺伝子、
MGC4170、若しくはAffymetrixプローブ番号:212959_s_a
tによって検出された1個又はそれ以上の遺伝子、
MLPH、若しくはAffymetrixプローブ番号:218211_s_atによ
って検出された1個又はそれ以上の遺伝子、
NEBL、若しくはAffymetrixプローブ番号:203962_s_atによ
って検出された1個又はそれ以上の遺伝子、
PLA2G2A、若しくはAffymetrixプローブ番号:203649_s_a
tによって検出された1個又はそれ以上の遺伝子、
PTPRO、若しくはAffymetrixプローブ番号:208121_s_atに
よって検出された1個又はそれ以上の遺伝子、
PYY、若しくはAffymetrixプローブ番号:207080_s_at若しく
は211253_x_atによって検出された1個又はそれ以上の遺伝子、
SH3BP4、若しくはAffymetrixプローブ番号:222258_s_at
によって検出された1個又はそれ以上の遺伝子、
SLC28A2、若しくはAffymetrixプローブ番号:207249_s_a
tによって検出された1個又はそれ以上の遺伝子、
SLC2A10、若しくはAffymetrixプローブ番号:221024_s_a
tによって検出された1個又はそれ以上の遺伝子、
SPON1、若しくはAffymetrixプローブ番号:213994_s_at若
しくは209437_s_atによって検出された1個又はそれ以上の遺伝子、
STS、若しくはAffymetrixプローブ番号:203769_s_atによっ
て検出された1個又はそれ以上の遺伝子、
TM4SF11、若しくはAffymetrixプローブ番号:204519_s_a
tによって検出された1個又はそれ以上の遺伝子、
TUSC3、若しくはAffymetrixプローブ番号:213432_s_at若
しくは209228_x_atによって検出された1個又はそれ以上の遺伝子、
SCD、若しくはAffymetrixプローブ番号:200832_s_atによっ
て検出された1個又はそれ以上の遺伝子、
ABCB1、若しくはAffymetrixプローブ番号:211994_s_atに
よって検出された1個又はそれ以上の遺伝子、
BTBD3、若しくはAffymetrixプローブ番号:202946_s_atに
よって検出された1個又はそれ以上の遺伝子、
CA1、若しくはAffymetrixプローブ番号:205950_s_atによっ
て検出された1個又はそれ以上の遺伝子、
DHRS9、若しくはAffymetrixプローブ番号:224009_x_at若
しくは223952_x_atによって検出された1個又はそれ以上の遺伝子、
DKFZP564I1171、若しくはAffymetrixプローブ番号:2254
57_s_atによって検出された1個又はそれ以上の遺伝子、
EIF5A、若しくはAffymetrixプローブ番号:201123_s_atに
よって検出された1個又はそれ以上の遺伝子、
IGHD、若しくはAffymetrixプローブ番号:214973_x_atによ
って検出された1個又はそれ以上の遺伝子、
PCK1、若しくはAffymetrixプローブ番号:208383_s_atによ
って検出された1個又はそれ以上の遺伝子、
RBP4、若しくはAffymetrixプローブ番号:219140_s_atによ
って検出された1個又はそれ以上の遺伝子、
TRPM6、若しくはAffymetrixプローブ番号:224412_s_atに
よって検出された1個又はそれ以上の遺伝子、
UGT1A6、若しくはAffymetrixプローブ番号:215125_s_at
によって検出された1個又はそれ以上の遺伝子から選択される遺伝子に対応する。
本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するため
の方法であって、
公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団におけ
る遺伝子発現を表す第1発現データを入手する工程と;及び
少なくとも1つの第2細胞若しくは細胞集団の近位−遠位起源を表す近位−遠位起源デ
ータを生成するために、大腸の前記少なくとも1つの第2細胞若しくは細胞集団における
前記遺伝子の発現を表す第2発現データを処理するために、分類データを生成するために
カーネル法を用いて前記第1発現データを処理する工程とを含む方法をさらに提供する。
好ましくは、本方法は、前記位置を表す近位−遠位起源データを生成するために前記第
2発現データ及び前記分類データを処理する工程を含んでいる。
好ましくは、前記カーネル法は、サポートベクターマシン(SVM)を含んでいる。
より好ましくは、前記分類データは、
Affymetrixプローブ番号:218888_s_atによって検出された1個
又はそれ以上の遺伝子、
Affymetrixプローブ番号:225290_atによって検出された遺伝子、
Affymetrixプローブ番号:226432_atによって検出された遺伝子、
Affymetrixプローブ番号:231576_atによって検出された遺伝子、
Affymetrixプローブ番号:235733_atによって検出された遺伝子、
Affymetrixプローブ番号:236894_atによって検出された遺伝子、
Affymetrixプローブ番号:239656_atによって検出された遺伝子、
Affymetrixプローブ番号:242059_atによって検出された遺伝子、
Affymetrixプローブ番号:242683_atによって検出された遺伝子、
Affymetrixプローブ番号:230105_atによって検出された遺伝子、
Affymetrixプローブ番号:230269_atによって検出された遺伝子、
Affymetrixプローブ番号:238378_atによって検出された遺伝子、
Affymetrixプローブ番号:239814_atによって検出された遺伝子、
Affymetrixプローブ番号:239994_atによって検出された遺伝子、
Affymetrixプローブ番号:240856_atによって検出された遺伝子、
Affymetrixプローブ番号:242414_atによって検出された遺伝子、
Affymetrixプローブ番号:244553_atによって検出された遺伝子、
Affymetrixプローブ番号:217320によって検出された遺伝子、
Affymetrixプローブ番号:236141によって検出された遺伝子、
Affymetrixプローブ番号:236513によって検出された遺伝子、
Affymetrixプローブ番号:238143によって検出された遺伝子、
AFARP1、若しくはAffymetrixプローブ番号:202234_s_at
によって検出された1個又はそれ以上の遺伝子、
ANPEP、若しくはAffymetrixプローブ番号:202888_s_atに
よって検出された1個又はそれ以上の遺伝子、
CCL13、若しくはAffymetrixプローブ番号:206407_s_atに
よって検出された1個又はそれ以上の遺伝子、
CRYL1、若しくはAffymetrixプローブ番号:220753_s_atに
よって検出された1個又はそれ以上の遺伝子、
CYP2B6、若しくはAffymetrixプローブ番号:206754_s_at
によって検出された1個又はそれ以上の遺伝子、
CYP2C18、若しくはAffymetrixプローブ番号:208126_s_a
tによって検出された1個又はそれ以上の遺伝子、
CYP2C9、若しくはAffymetrixプローブ番号:214421_x_at
若しくは220017_x_atによって検出された1個又はそれ以上の遺伝子、
EPB41L3、若しくはAffymetrixプローブ番号:211776_s_a
tによって検出された1個又はそれ以上の遺伝子、
ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若
しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
FAM45A、若しくはAffymetrixプローブ番号:221804_s_at
若しくは222955_s_atによって検出された1個又はそれ以上の遺伝子、
FGFR2、若しくはAffymetrixプローブ番号:203639_s_atに
よって検出された1個又はそれ以上の遺伝子、
GBA3、若しくはAffymetrixプローブ番号:219954_s_atによ
って検出された1個又はそれ以上の遺伝子、
GSPT2、若しくはAffymetrixプローブ番号:205541_s_atに
よって検出された1個又はそれ以上の遺伝子、
GULP1、若しくはAffymetrixプローブ番号:215913_s_atに
よって検出された1個又はそれ以上の遺伝子、
HOXA9、若しくはAffymetrixプローブ番号:205366_s_at若
しくは214551_s_atによって検出された1個又はそれ以上の遺伝子、
HOXC6、若しくはAffymetrixプローブ番号:206858_s_atに
よって検出された1個又はそれ以上の遺伝子、
HOXD3、若しくはAffymetrixプローブ番号:206601_s_atに
よって検出された1個又はそれ以上の遺伝子、
ME2、若しくはAffymetrixプローブ番号:210153_s_atによっ
て検出された1個又はそれ以上の遺伝子、
MESP1、若しくはAffymetrixプローブ番号:224476_s_atに
よって検出された1個又はそれ以上の遺伝子、
MOCS1、若しくはAffymetrixプローブ番号:213181_s_atに
よって検出された1個又はそれ以上の遺伝子、
MSCP、若しくはAffymetrixプローブ番号:218136_s_at若し
くは221920_s_atによって検出された1個又はそれ以上の遺伝子、
NETO2、若しくはAffymetrixプローブ番号:222774_s_atに
よって検出された1個又はそれ以上の遺伝子、
OASL、若しくはAffymetrixプローブ番号:210757_s_atによ
って検出された1個又はそれ以上の遺伝子、
PITX2、若しくはAffymetrixプローブ番号:207558_s_atに
よって検出された1個又はそれ以上の遺伝子、
PRAP1、若しくはAffymetrixプローブ番号:243669_s_atに
よって検出された1個又はそれ以上の遺伝子、
SCUBE2、若しくはAffymetrixプローブ番号:219197_s_at
によって検出された1個又はそれ以上の遺伝子、
SEC6L1、若しくはAffymetrixプローブ番号:225457_s_at
によって検出された1個又はそれ以上の遺伝子、
SLC16A1、若しくはAffymetrixプローブ番号:202236_s_a
t若しくは209900_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A3、若しくはAffymetrixプローブ番号:208596_s_at
によって検出された1個又はそれ以上の遺伝子、
UGT1A8、若しくはAffymetrixプローブ番号:221305_s_at
によって検出された1個又はそれ以上の遺伝子、
ARF4、若しくはAffymetrixプローブ番号:201097_s_atによ
って検出された1個又はそれ以上の遺伝子、
BTG3、若しくはAffymetrixプローブ番号:213134_x_at若し
くは205548_s_atによって検出された1個又はそれ以上の遺伝子、
CHST5、若しくはAffymetrixプローブ番号:221164_x_at若
しくは223942_x_atによって検出された1個又はそれ以上の遺伝子、
CMAH、若しくはAffymetrixプローブ番号:205518_s_atによ
って検出された1個又はそれ以上の遺伝子、
CRYBA2、若しくはAffymetrixプローブ番号:220136_s_at
によって検出された1個又はそれ以上の遺伝子、
CTSE、若しくはAffymetrixプローブ番号:205927_s_atによ
って検出された1個又はそれ以上の遺伝子、
DKFZp761N1114、若しくはAffymetrixプローブ番号:2423
72_s_atによって検出された1個又はそれ以上の遺伝子、
EPB41L4A、若しくはAffymetrixプローブ番号:228256_s_
atによって検出された1個又はそれ以上の遺伝子、
EPHA3、若しくはAffymetrixプローブ番号:206070_s_atに
よって検出された1個又はそれ以上の遺伝子、
FAS、若しくはAffymetrixプローブ番号:204781_s_atによっ
て検出された1個又はそれ以上の遺伝子、
FER1L3、若しくはAffymetrixプローブ番号:201798_s_at
若しくは211864_s_atによって検出された1個又はそれ以上の遺伝子、
FLJ20152、若しくはAffymetrixプローブ番号:218532_s_
at若しくは218510_x_atによって検出された1個又はそれ以上の遺伝子、
FLJ23548、若しくはAffymetrixプローブ番号:218187_s_
atによって検出された1個又はそれ以上の遺伝子、
FN1、若しくはAffymetrixプローブ番号:211719_s_at若しく
は210495_x_at若しくは212464_at若しくは216442_x_at
によって検出された1個又はそれ以上の遺伝子、
FOXA2、若しくはAffymetrixプローブ番号:210103_s_atに
よって検出された1個又はそれ以上の遺伝子、
FRZB、若しくはAffymetrixプローブ番号:203698_s_atによ
って検出された1個又はそれ以上の遺伝子、
GDF15、若しくはAffymetrixプローブ番号:221577_x_atに
よって検出された1個又はそれ以上の遺伝子、
GJB3、若しくはAffymetrixプローブ番号:205490_s_atによ
って検出された1個又はそれ以上の遺伝子、
HOXD13、若しくはAffymetrixプローブ番号:207397_s_at
によって検出された1個又はそれ以上の遺伝子、
INSM1、若しくはAffymetrixプローブ番号:206502_s_atに
よって検出された1個又はそれ以上の遺伝子、
MGC4170、若しくはAffymetrixプローブ番号:212959_s_a
tによって検出された1個又はそれ以上の遺伝子、
MLPH、若しくはAffymetrixプローブ番号:218211_s_atによ
って検出された1個又はそれ以上の遺伝子、
NEBL、若しくはAffymetrixプローブ番号:203962_s_atによ
って検出された1個又はそれ以上の遺伝子、
PLA2G2A、若しくはAffymetrixプローブ番号:203649_s_a
tによって検出された1個又はそれ以上の遺伝子、
PTPRO、若しくはAffymetrixプローブ番号:208121_s_atに
よって検出された1個又はそれ以上の遺伝子、
PYY、若しくはAffymetrixプローブ番号:207080_s_at若しく
は211253_x_atによって検出された1個又はそれ以上の遺伝子、
SH3BP4、若しくはAffymetrixプローブ番号:222258_s_at
によって検出された1個又はそれ以上の遺伝子、
SLC28A2、若しくはAffymetrixプローブ番号:207249_s_a
tによって検出された1個又はそれ以上の遺伝子、
SLC2A10、若しくはAffymetrixプローブ番号:221024_s_a
tによって検出された1個又はそれ以上の遺伝子、
SPON1、若しくはAffymetrixプローブ番号:213994_s_at若
しくは209437_s_atによって検出された1個又はそれ以上の遺伝子、
STS、若しくはAffymetrixプローブ番号:203769_s_atによっ
て検出された1個又はそれ以上の遺伝子、
TM4SF11、若しくはAffymetrixプローブ番号:204519_s_a
tによって検出された1個又はそれ以上の遺伝子、
TUSC3、若しくはAffymetrixプローブ番号:213432_s_at若
しくは209228_x_atによって検出された1個又はそれ以上の遺伝子、
SCD、若しくはAffymetrixプローブ番号:200832_s_atによっ
て検出された1個又はそれ以上の遺伝子、
ABCB1、若しくはAffymetrixプローブ番号:211994_s_atに
よって検出された1個又はそれ以上の遺伝子、
BTBD3、若しくはAffymetrixプローブ番号:202946_s_atに
よって検出された1個又はそれ以上の遺伝子、
CA1、若しくはAffymetrixプローブ番号:205950_s_atによっ
て検出された1個又はそれ以上の遺伝子、
DHRS9、若しくはAffymetrixプローブ番号:224009_x_at若
しくは223952_x_atによって検出された1個又はそれ以上の遺伝子、
DKFZP564I1171、若しくはAffymetrixプローブ番号:2254
57_s_atによって検出された1個又はそれ以上の遺伝子、
EIF5A、若しくはAffymetrixプローブ番号:201123_s_atに
よって検出された1個又はそれ以上の遺伝子、
IGHD、若しくはAffymetrixプローブ番号:214973_x_atによ
って検出された1個又はそれ以上の遺伝子、
PCK1、若しくはAffymetrixプローブ番号:208383_s_atによ
って検出された1個又はそれ以上の遺伝子、
RBP4、若しくはAffymetrixプローブ番号:219140_s_atによ
って検出された1個又はそれ以上の遺伝子、
TRPM6、若しくはAffymetrixプローブ番号:224412_s_atに
よって検出された1個又はそれ以上の遺伝子、
UGT1A6、若しくはAffymetrixプローブ番号:215125_s_at
によって検出された1個又はそれ以上の遺伝子から選択された遺伝子を表している。
さらにより好ましくは、前記分類データは、13遺伝子のサブセットを表している。
最も好ましくは、前記13遺伝子は、
PRAC、
CCL11、
FRZB、若しくはAffymetrixプローブ番号:203698_s_atによ
って検出された1個又はそれ以上の遺伝子、
GDF15、若しくはAffymetrixプローブ番号:221577_x_atに
よって検出された1個又はそれ以上の遺伝子、
CLDN8、
SEC6L1、若しくはAffymetrixプローブ番号:221577_x_at
によって検出された1個又はそれ以上の遺伝子、
GBA3、若しくはAffymetrixプローブ番号:279954_s_atによ
って検出された1個又はそれ以上の遺伝子、
DEFA5、
SPINK5、
OSTalpha、
ANPEP、若しくはAffymetrixプローブ番号:202888_s_atに
よって検出された1個又はそれ以上の遺伝子、及び
MUC5である。
本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するため
の検出方法であって、
公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団におけ
る遺伝子発現を表す第1発現データを入手する工程と;
前記遺伝子の発現の少なくとも1つの線形組み合わせに対応する主成分データを生成す
るために主成分分析を用いて前記第1データを処理する工程であって、前記主成分データ
は前記細胞若しくは細胞集団の前記近位−遠位起源の少なくとも1つを示す工程とを含む
方法をさらに提供する。
好ましくは、第1発現データを入手する前記工程は、前記第1発現データがそれのサブ
セットである第3発現データを入手する工程を含んでおり、そして本方法は、前記少なく
とも1つの大腸の近位−遠位軸に沿って示差的に発現した1サブセットの遺伝子に対応す
る第3の選択された発現データのサブセットを選択するために前記第3発現データを処理
する工程を含んでおり、選択されたサブセットは前記第1発現データである。
好ましくは、選択された発現データは、
Affymetrixプローブ番号:218888_s_atによって検出された1個
又はそれ以上の遺伝子、
Affymetrixプローブ番号:225290_atによって検出された遺伝子、
Affymetrixプローブ番号:226432_atによって検出された遺伝子、
Affymetrixプローブ番号:231576_atによって検出された遺伝子、
Affymetrixプローブ番号:235733_atによって検出された遺伝子、
Affymetrixプローブ番号:236894_atによって検出された遺伝子、
Affymetrixプローブ番号:239656_atによって検出された遺伝子、
Affymetrixプローブ番号:242059_atによって検出された遺伝子、
Affymetrixプローブ番号:242683_atによって検出された遺伝子、
Affymetrixプローブ番号:230105_atによって検出された遺伝子、
Affymetrixプローブ番号:230269_atによって検出された遺伝子、
Affymetrixプローブ番号:238378_atによって検出された遺伝子、
Affymetrixプローブ番号:239814_atによって検出された遺伝子、
Affymetrixプローブ番号:239994_atによって検出された遺伝子、
Affymetrixプローブ番号:240856_atによって検出された遺伝子、
Affymetrixプローブ番号:242414_atによって検出された遺伝子、
Affymetrixプローブ番号:244553_atによって検出された遺伝子、
Affymetrixプローブ番号:217320によって検出された遺伝子、
Affymetrixプローブ番号:236141によって検出された遺伝子、
Affymetrixプローブ番号:236513によって検出された遺伝子、
Affymetrixプローブ番号:238143によって検出された遺伝子、
AFARP1、若しくはAffymetrixプローブ番号:202234_s_at
によって検出された1個又はそれ以上の遺伝子、
ANPEP、若しくはAffymetrixプローブ番号:202888_s_atに
よって検出された1個又はそれ以上の遺伝子、
CCL13、若しくはAffymetrixプローブ番号:206407_s_atに
よって検出された1個又はそれ以上の遺伝子、
CRYL1、若しくはAffymetrixプローブ番号:220753_s_atに
よって検出された1個又はそれ以上の遺伝子、
CYP2B6、若しくはAffymetrixプローブ番号:206754_s_at
によって検出された1個又はそれ以上の遺伝子、
CYP2C18、若しくはAffymetrixプローブ番号:208126_s_a
tによって検出された1個又はそれ以上の遺伝子、
CYP2C9、若しくはAffymetrixプローブ番号:214421_x_at
若しくは220017_x_atによって検出された1個又はそれ以上の遺伝子、
EPB41L3、若しくはAffymetrixプローブ番号:211776_s_a
tによって検出された1個又はそれ以上の遺伝子、
ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若
しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
FAM45A、若しくはAffymetrixプローブ番号:221804_s_at
若しくは222955_s_atによって検出された1個又はそれ以上の遺伝子、
FGFR2、若しくはAffymetrixプローブ番号:203639_s_atに
よって検出された1個又はそれ以上の遺伝子、
GBA3、若しくはAffymetrixプローブ番号:219954_s_atによ
って検出された1個又はそれ以上の遺伝子、
GSPT2、若しくはAffymetrixプローブ番号:205541_s_atに
よって検出された1個又はそれ以上の遺伝子、
GULP1、若しくはAffymetrixプローブ番号:215913_s_atに
よって検出された1個又はそれ以上の遺伝子、
HOXA9、若しくはAffymetrixプローブ番号:205366_s_at若
しくは214551_s_atによって検出された1個又はそれ以上の遺伝子、
HOXC6、若しくはAffymetrixプローブ番号:206858_s_atに
よって検出された1個又はそれ以上の遺伝子、
HOXD3、若しくはAffymetrixプローブ番号:206601_s_atに
よって検出された1個又はそれ以上の遺伝子、
ME2、若しくはAffymetrixプローブ番号:210153_s_atによっ
て検出された1個又はそれ以上の遺伝子、
MESP1、若しくはAffymetrixプローブ番号:224476_s_atに
よって検出された1個又はそれ以上の遺伝子、
MOCS1、若しくはAffymetrixプローブ番号:213181_s_atに
よって検出された1個又はそれ以上の遺伝子、
MSCP、若しくはAffymetrixプローブ番号:218136_s_at若し
くは221920_s_atによって検出された1個又はそれ以上の遺伝子、
NETO2、若しくはAffymetrixプローブ番号:222774_s_atに
よって検出された1個又はそれ以上の遺伝子、
OASL、若しくはAffymetrixプローブ番号:210757_s_atによ
って検出された1個又はそれ以上の遺伝子、
PITX2、若しくはAffymetrixプローブ番号:207558_s_atに
よって検出された1個又はそれ以上の遺伝子、
PRAP1、若しくはAffymetrixプローブ番号:243669_s_atに
よって検出された1個又はそれ以上の遺伝子、
SCUBE2、若しくはAffymetrixプローブ番号:219197_s_at
によって検出された1個又はそれ以上の遺伝子、
SEC6L1、若しくはAffymetrixプローブ番号:225457_s_at
によって検出された1個又はそれ以上の遺伝子、
SLC16A1、若しくはAffymetrixプローブ番号:202236_s_a
t若しくは209900_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A3、若しくはAffymetrixプローブ番号:208596_s_at
によって検出された1個又はそれ以上の遺伝子、
UGT1A8、若しくはAffymetrixプローブ番号:221305_s_at
によって検出された1個又はそれ以上の遺伝子、
ARF4、若しくはAffymetrixプローブ番号:201097_s_atによ
って検出された1個又はそれ以上の遺伝子、
BTG3、若しくはAffymetrixプローブ番号:213134_x_at若し
くは205548_s_atによって検出された1個又はそれ以上の遺伝子、
CHST5、若しくはAffymetrixプローブ番号:221164_x_at若
しくは223942_x_atによって検出された1個又はそれ以上の遺伝子、
CMAH、若しくはAffymetrixプローブ番号:205518_s_atによ
って検出された1個又はそれ以上の遺伝子、
CRYBA2、若しくはAffymetrixプローブ番号:220136_s_at
によって検出された1個又はそれ以上の遺伝子、
CTSE、若しくはAffymetrixプローブ番号:205927_s_atによ
って検出された1個又はそれ以上の遺伝子、
DKFZp761N1114、若しくはAffymetrixプローブ番号:2423
72_s_atによって検出された1個又はそれ以上の遺伝子、
EPB41L4A、若しくはAffymetrixプローブ番号:228256_s_
atによって検出された1個又はそれ以上の遺伝子、
EPHA3、若しくはAffymetrixプローブ番号:206070_s_atに
よって検出された1個又はそれ以上の遺伝子、
FAS、若しくはAffymetrixプローブ番号:204781_s_atによっ
て検出された1個又はそれ以上の遺伝子、
FER1L3、若しくはAffymetrixプローブ番号:201798_s_at
若しくは211864_s_atによって検出された1個又はそれ以上の遺伝子、
FLJ20152、若しくはAffymetrixプローブ番号:218532_s_
at若しくは218510_x_atによって検出された1個又はそれ以上の遺伝子、
FLJ23548、若しくはAffymetrixプローブ番号:218187_s_
atによって検出された1個又はそれ以上の遺伝子、
FN1、若しくはAffymetrixプローブ番号:211719_s_at若しく
は210495_x_at若しくは212464_at若しくは216442_x_at
によって検出された1個又はそれ以上の遺伝子、
FOXA2、若しくはAffymetrixプローブ番号:210103_s_atに
よって検出された1個又はそれ以上の遺伝子、
FRZB、若しくはAffymetrixプローブ番号:203698_s_atによ
って検出された1個又はそれ以上の遺伝子、
GDF15、若しくはAffymetrixプローブ番号:221577_x_atに
よって検出された1個又はそれ以上の遺伝子、
GJB3、若しくはAffymetrixプローブ番号:205490_s_atによ
って検出された1個又はそれ以上の遺伝子、
HOXD13、若しくはAffymetrixプローブ番号:207397_s_at
によって検出された1個又はそれ以上の遺伝子、
INSM1、若しくはAffymetrixプローブ番号:206502_s_atに
よって検出された1個又はそれ以上の遺伝子、
MGC4170、若しくはAffymetrixプローブ番号:212959_s_a
tによって検出された1個又はそれ以上の遺伝子、
MLPH、若しくはAffymetrixプローブ番号:218211_s_atによ
って検出された1個又はそれ以上の遺伝子、
NEBL、若しくはAffymetrixプローブ番号:203962_s_atによ
って検出された1個又はそれ以上の遺伝子、
PLA2G2A、若しくはAffymetrixプローブ番号:203649_s_a
tによって検出された1個又はそれ以上の遺伝子、
PTPRO、若しくはAffymetrixプローブ番号:208121_s_atに
よって検出された1個又はそれ以上の遺伝子、
PYY、若しくはAffymetrixプローブ番号:207080_s_at若しく
は211253_x_atによって検出された1個又はそれ以上の遺伝子、
SH3BP4、若しくはAffymetrixプローブ番号:222258_s_at
によって検出された1個又はそれ以上の遺伝子、
SLC28A2、若しくはAffymetrixプローブ番号:207249_s_a
tによって検出された1個又はそれ以上の遺伝子、
SLC2A10、若しくはAffymetrixプローブ番号:221024_s_a
tによって検出された1個又はそれ以上の遺伝子、
SPON1、若しくはAffymetrixプローブ番号:213994_s_at若
しくは209437_s_atによって検出された1個又はそれ以上の遺伝子、
STS、若しくはAffymetrixプローブ番号:203769_s_atによっ
て検出された1個又はそれ以上の遺伝子、
TM4SF11、若しくはAffymetrixプローブ番号:204519_s_a
tによって検出された1個又はそれ以上の遺伝子、
TUSC3、若しくはAffymetrixプローブ番号:213432_s_at若
しくは209228_x_atによって検出された1個又はそれ以上の遺伝子、
SCD、若しくはAffymetrixプローブ番号:200832_s_atによっ
て検出された1個又はそれ以上の遺伝子、
ABCB1、若しくはAffymetrixプローブ番号:211994_s_atに
よって検出された1個又はそれ以上の遺伝子、
BTBD3、若しくはAffymetrixプローブ番号:202946_s_atに
よって検出された1個又はそれ以上の遺伝子、
CA1、若しくはAffymetrixプローブ番号:205950_s_atによっ
て検出された1個又はそれ以上の遺伝子、
DHRS9、若しくはAffymetrixプローブ番号:224009_x_at若
しくは223952_x_atによって検出された1個又はそれ以上の遺伝子、
DKFZP564I1171、若しくはAffymetrixプローブ番号:2254
57_s_atによって検出された1個又はそれ以上の遺伝子、
EIF5A、若しくはAffymetrixプローブ番号:201123_s_atに
よって検出された1個又はそれ以上の遺伝子、
IGHD、若しくはAffymetrixプローブ番号:214973_x_atによ
って検出された1個又はそれ以上の遺伝子、
PCK1、若しくはAffymetrixプローブ番号:208383_s_atによ
って検出された1個又はそれ以上の遺伝子、
RBP4、若しくはAffymetrixプローブ番号:219140_s_atによ
って検出された1個又はそれ以上の遺伝子、
TRPM6、若しくはAffymetrixプローブ番号:224412_s_atに
よって検出された1個又はそれ以上の遺伝子、
UGT1A6、若しくはAffymetrixプローブ番号:215125_s_at
によって検出された1個又はそれ以上の遺伝子から選択される遺伝子に対応する。
本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するため
の方法であって、
公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団におけ
る遺伝子発現を表す第1発現データを入手する工程と;及び
前記細胞若しくは細胞集団の近位−遠位起源の少なくとも1つを示す正準変量データを
生成するために正準変量分析を用いて前記発現データを処理する工程とを含む方法をさら
に提供する。
好ましくは、前記正準変量分析は、プロファイル分析を含んでいる。
好ましくは、前記サブセットの遺伝子は、
Affymetrixプローブ番号:218888_s_atによって検出された1個
又はそれ以上の遺伝子、
Affymetrixプローブ番号:225290_atによって検出された遺伝子、
Affymetrixプローブ番号:226432_atによって検出された遺伝子、
Affymetrixプローブ番号:231576_atによって検出された遺伝子、
Affymetrixプローブ番号:235733_atによって検出された遺伝子、
Affymetrixプローブ番号:236894_atによって検出された遺伝子、
Affymetrixプローブ番号:239656_atによって検出された遺伝子、
Affymetrixプローブ番号:242059_atによって検出された遺伝子、
Affymetrixプローブ番号:242683_atによって検出された遺伝子、
Affymetrixプローブ番号:230105_atによって検出された遺伝子、
Affymetrixプローブ番号:230269_atによって検出された遺伝子、
Affymetrixプローブ番号:238378_atによって検出された遺伝子、
Affymetrixプローブ番号:239814_atによって検出された遺伝子、
Affymetrixプローブ番号:239994_atによって検出された遺伝子、
Affymetrixプローブ番号:240856_atによって検出された遺伝子、
Affymetrixプローブ番号:242414_atによって検出された遺伝子、
Affymetrixプローブ番号:244553_atによって検出された遺伝子、
Affymetrixプローブ番号:217320によって検出された遺伝子、
Affymetrixプローブ番号:236141によって検出された遺伝子、
Affymetrixプローブ番号:236513によって検出された遺伝子、
Affymetrixプローブ番号:238143によって検出された遺伝子、
AFARP1、若しくはAffymetrixプローブ番号:202234_s_at
によって検出された1個又はそれ以上の遺伝子、
ANPEP、若しくはAffymetrixプローブ番号:202888_s_atに
よって検出された1個又はそれ以上の遺伝子、
CCL13、若しくはAffymetrixプローブ番号:206407_s_atに
よって検出された1個又はそれ以上の遺伝子、
CRYL1、若しくはAffymetrixプローブ番号:220753_s_atに
よって検出された1個又はそれ以上の遺伝子、
CYP2B6、若しくはAffymetrixプローブ番号:206754_s_at
によって検出された1個又はそれ以上の遺伝子、
CYP2C18、若しくはAffymetrixプローブ番号:208126_s_a
tによって検出された1個又はそれ以上の遺伝子、
CYP2C9、若しくはAffymetrixプローブ番号:214421_x_at
若しくは220017_x_atによって検出された1個又はそれ以上の遺伝子、
EPB41L3、若しくはAffymetrixプローブ番号:211776_s_a
tによって検出された1個又はそれ以上の遺伝子、
ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若
しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
FAM45A、若しくはAffymetrixプローブ番号:221804_s_at
若しくは222955_s_atによって検出された1個又はそれ以上の遺伝子、
FGFR2、若しくはAffymetrixプローブ番号:203639_s_atに
よって検出された1個又はそれ以上の遺伝子、
GBA3、若しくはAffymetrixプローブ番号:219954_s_atによ
って検出された1個又はそれ以上の遺伝子、
GSPT2、若しくはAffymetrixプローブ番号:205541_s_atに
よって検出された1個又はそれ以上の遺伝子、
GULP1、若しくはAffymetrixプローブ番号:215913_s_atに
よって検出された1個又はそれ以上の遺伝子、
HOXA9、若しくはAffymetrixプローブ番号:205366_s_at若
しくは214551_s_atによって検出された1個又はそれ以上の遺伝子、
HOXC6、若しくはAffymetrixプローブ番号:206858_s_atに
よって検出された1個又はそれ以上の遺伝子、
HOXD3、若しくはAffymetrixプローブ番号:206601_s_atに
よって検出された1個又はそれ以上の遺伝子、
ME2、若しくはAffymetrixプローブ番号:210153_s_atによっ
て検出された1個又はそれ以上の遺伝子、
MESP1、若しくはAffymetrixプローブ番号:224476_s_atに
よって検出された1個又はそれ以上の遺伝子、
MOCS1、若しくはAffymetrixプローブ番号:213181_s_atに
よって検出された1個又はそれ以上の遺伝子、
MSCP、若しくはAffymetrixプローブ番号:218136_s_at若し
くは221920_s_atによって検出された1個又はそれ以上の遺伝子、
NETO2、若しくはAffymetrixプローブ番号:222774_s_atに
よって検出された1個又はそれ以上の遺伝子、
OASL、若しくはAffymetrixプローブ番号:210757_s_atによ
って検出された1個又はそれ以上の遺伝子、
PITX2、若しくはAffymetrixプローブ番号:207558_s_atに
よって検出された1個又はそれ以上の遺伝子、
PRAP1、若しくはAffymetrixプローブ番号:243669_s_atに
よって検出された1個又はそれ以上の遺伝子、
SCUBE2、若しくはAffymetrixプローブ番号:219197_s_at
によって検出された1個又はそれ以上の遺伝子、
SEC6L1、若しくはAffymetrixプローブ番号:225457_s_at
によって検出された1個又はそれ以上の遺伝子、
SLC16A1、若しくはAffymetrixプローブ番号:202236_s_a
t若しくは209900_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A3、若しくはAffymetrixプローブ番号:208596_s_at
によって検出された1個又はそれ以上の遺伝子、
UGT1A8、若しくはAffymetrixプローブ番号:221305_s_at
によって検出された1個又はそれ以上の遺伝子、
ARF4、若しくはAffymetrixプローブ番号:201097_s_atによ
って検出された1個又はそれ以上の遺伝子、
BTG3、若しくはAffymetrixプローブ番号:213134_x_at若し
くは205548_s_atによって検出された1個又はそれ以上の遺伝子、
CHST5、若しくはAffymetrixプローブ番号:221164_x_at若
しくは223942_x_atによって検出された1個又はそれ以上の遺伝子、
CMAH、若しくはAffymetrixプローブ番号:205518_s_atによ
って検出された1個又はそれ以上の遺伝子、
CRYBA2、若しくはAffymetrixプローブ番号:220136_s_at
によって検出された1個又はそれ以上の遺伝子、
CTSE、若しくはAffymetrixプローブ番号:205927_s_atによ
って検出された1個又はそれ以上の遺伝子、
DKFZp761N1114、若しくはAffymetrixプローブ番号:2423
72_s_atによって検出された1個又はそれ以上の遺伝子、
EPB41L4A、若しくはAffymetrixプローブ番号:228256_s_
atによって検出された1個又はそれ以上の遺伝子、
EPHA3、若しくはAffymetrixプローブ番号:206070_s_atに
よって検出された1個又はそれ以上の遺伝子、
FAS、若しくはAffymetrixプローブ番号:204781_s_atによっ
て検出された1個又はそれ以上の遺伝子、
FER1L3、若しくはAffymetrixプローブ番号:201798_s_at
若しくは211864_s_atによって検出された1個又はそれ以上の遺伝子、
FLJ20152、若しくはAffymetrixプローブ番号:218532_s_
at若しくは218510_x_atによって検出された1個又はそれ以上の遺伝子、
FLJ23548、若しくはAffymetrixプローブ番号:218187_s_
atによって検出された1個又はそれ以上の遺伝子、
FN1、若しくはAffymetrixプローブ番号:211719_s_at若しく
は210495_x_at若しくは212464_at若しくは216442_x_at
によって検出された1個又はそれ以上の遺伝子、
FOXA2、若しくはAffymetrixプローブ番号:210103_s_atに
よって検出された1個又はそれ以上の遺伝子、
FRZB、若しくはAffymetrixプローブ番号:203698_s_atによ
って検出された1個又はそれ以上の遺伝子、
GDF15、若しくはAffymetrixプローブ番号:221577_x_atに
よって検出された1個又はそれ以上の遺伝子、
GJB3、若しくはAffymetrixプローブ番号:205490_s_atによ
って検出された1個又はそれ以上の遺伝子、
HOXD13、若しくはAffymetrixプローブ番号:207397_s_at
によって検出された1個又はそれ以上の遺伝子、
INSM1、若しくはAffymetrixプローブ番号:206502_s_atに
よって検出された1個又はそれ以上の遺伝子、
MGC4170、若しくはAffymetrixプローブ番号:212959_s_a
tによって検出された1個又はそれ以上の遺伝子、
MLPH、若しくはAffymetrixプローブ番号:218211_s_atによ
って検出された1個又はそれ以上の遺伝子、
NEBL、若しくはAffymetrixプローブ番号:203962_s_atによ
って検出された1個又はそれ以上の遺伝子、
PLA2G2A、若しくはAffymetrixプローブ番号:203649_s_a
tによって検出された1個又はそれ以上の遺伝子、
PTPRO、若しくはAffymetrixプローブ番号:208121_s_atに
よって検出された1個又はそれ以上の遺伝子、
PYY、若しくはAffymetrixプローブ番号:207080_s_at若しく
は211253_x_atによって検出された1個又はそれ以上の遺伝子、
SH3BP4、若しくはAffymetrixプローブ番号:222258_s_at
によって検出された1個又はそれ以上の遺伝子、
SLC28A2、若しくはAffymetrixプローブ番号:207249_s_a
tによって検出された1個又はそれ以上の遺伝子、
SLC2A10、若しくはAffymetrixプローブ番号:221024_s_a
tによって検出された1個又はそれ以上の遺伝子、
SPON1、若しくはAffymetrixプローブ番号:213994_s_at若
しくは209437_s_atによって検出された1個又はそれ以上の遺伝子、
STS、若しくはAffymetrixプローブ番号:203769_s_atによっ
て検出された1個又はそれ以上の遺伝子、
TM4SF11、若しくはAffymetrixプローブ番号:204519_s_a
tによって検出された1個又はそれ以上の遺伝子、
TUSC3、若しくはAffymetrixプローブ番号:213432_s_at又
は209228_x_atによって検出された1個又はそれ以上の遺伝子、
SCD、若しくはAffymetrixプローブ番号:200832_s_atによっ
て検出された1個又はそれ以上の遺伝子、
ABCB1、若しくはAffymetrixプローブ番号:211994_s_atに
よって検出された1個又はそれ以上の遺伝子、
BTBD3、若しくはAffymetrixプローブ番号:202946_s_atに
よって検出された1個又はそれ以上の遺伝子、
CA1、若しくはAffymetrixプローブ番号:205950_s_atによっ
て検出された1個又はそれ以上の遺伝子、
DHRS9、若しくはAffymetrixプローブ番号:224009_x_at若
しくは223952_x_atによって検出された1個又はそれ以上の遺伝子、
DKFZP564I1171、若しくはAffymetrixプローブ番号:2254
57_s_atによって検出された1個又はそれ以上の遺伝子、
EIF5A、若しくはAffymetrixプローブ番号:201123_s_atに
よって検出された1個又はそれ以上の遺伝子、
IGHD、若しくはAffymetrixプローブ番号:214973_x_atによ
って検出された1個又はそれ以上の遺伝子、
PCK1、若しくはAffymetrixプローブ番号:208383_s_atによ
って検出された1個又はそれ以上の遺伝子、
RBP4、若しくはAffymetrixプローブ番号:219140_s_atによ
って検出された1個又はそれ以上の遺伝子、
TRPM6、若しくはAffymetrixプローブ番号:224412_s_atに
よって検出された1個又はそれ以上の遺伝子、
UGT1A6、若しくはAffymetrixプローブ番号:215125_s_at
によって検出された1個又はそれ以上の遺伝子から選択される。
本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するため
の方法であって、
公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団におけ
る遺伝子の発現を表す発現トレーニングデータ、及び前記細胞若しくは細胞集団と前記近
位−遠位起源との関連を表す近位−遠位起源トレーニングデータを含むトレーニングデー
タを入手する工程と;
前記遺伝子の発現レベルの線形若しくは非線形組み合わせを表す分類データを生成する
ために前記トレーニングデータを処理する工程であって、前記分類データは、前記また別
の細胞若しくは細胞亜集団における前記遺伝子の発現を表すまた別の発現データに基づい
て、大腸から採取されたまた別の細胞若しくは細胞亜集団の近位−遠位起源を示すまた別
の近位−遠位起源データを生成するために適合させられる工程とを含む方法をさらに提供
する。
有益にも、前記処理する工程は、GeneRaveを用いて前記トレーニングデータを
処理する工程を含むことができる。
好ましくは、前記サブセットの遺伝子は、
Affymetrixプローブ番号:218888_s_atによって検出された1個
又はそれ以上の遺伝子、
Affymetrixプローブ番号:225290_atによって検出された遺伝子、
Affymetrixプローブ番号:226432_atによって検出された遺伝子、
Affymetrixプローブ番号:231576_atによって検出された遺伝子、
Affymetrixプローブ番号:235733_atによって検出された遺伝子、
Affymetrixプローブ番号:236894_atによって検出された遺伝子、
Affymetrixプローブ番号:239656_atによって検出された遺伝子、
Affymetrixプローブ番号:242059_atによって検出された遺伝子、
Affymetrixプローブ番号:242683_atによって検出された遺伝子、
Affymetrixプローブ番号:230105_atによって検出された遺伝子、
Affymetrixプローブ番号:230269_atによって検出された遺伝子、
Affymetrixプローブ番号:238378_atによって検出された遺伝子、
Affymetrixプローブ番号:239814_atによって検出された遺伝子、
Affymetrixプローブ番号:239994_atによって検出された遺伝子、
Affymetrixプローブ番号:240856_atによって検出された遺伝子、
Affymetrixプローブ番号:242414_atによって検出された遺伝子、
Affymetrixプローブ番号:244553_atによって検出された遺伝子、
Affymetrixプローブ番号:217320によって検出された遺伝子、
Affymetrixプローブ番号:236141によって検出された遺伝子、
Affymetrixプローブ番号:236513によって検出された遺伝子、
Affymetrixプローブ番号:238143によって検出された遺伝子、
AFARP1、若しくはAffymetrixプローブ番号:202234_s_at
によって検出された1個又はそれ以上の遺伝子、
ANPEP、若しくはAffymetrixプローブ番号:202888_s_atに
よって検出された1個又はそれ以上の遺伝子、
CCL13、若しくはAffymetrixプローブ番号:206407_s_atに
よって検出された1個又はそれ以上の遺伝子、
CRYL1、若しくはAffymetrixプローブ番号:220753_s_atに
よって検出された1個又はそれ以上の遺伝子、
CYP2B6、若しくはAffymetrixプローブ番号:206754_s_at
によって検出された1個又はそれ以上の遺伝子、
CYP2C18、若しくはAffymetrixプローブ番号:208126_s_a
tによって検出された1個又はそれ以上の遺伝子、
CYP2C9、若しくはAffymetrixプローブ番号:214421_x_at
若しくは220017_x_atによって検出された1個又はそれ以上の遺伝子、
EPB41L3、若しくはAffymetrixプローブ番号:211776_s_a
tによって検出された1個又はそれ以上の遺伝子、
ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若
しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
FAM45A、若しくはAffymetrixプローブ番号:221804_s_at
若しくは222955_s_atによって検出された1個又はそれ以上の遺伝子、
FGFR2、若しくはAffymetrixプローブ番号:203639_s_atに
よって検出された1個又はそれ以上の遺伝子、
GBA3、若しくはAffymetrixプローブ番号:219954_s_atによ
って検出された1個又はそれ以上の遺伝子、
GSPT2、若しくはAffymetrixプローブ番号:205541_s_atに
よって検出された1個又はそれ以上の遺伝子、
GULP1、若しくはAffymetrixプローブ番号:215913_s_atに
よって検出された1個又はそれ以上の遺伝子、
HOXA9、若しくはAffymetrixプローブ番号:205366_s_at若
しくは214551_s_atによって検出された1個又はそれ以上の遺伝子、
HOXC6、若しくはAffymetrixプローブ番号:206858_s_atに
よって検出された1個又はそれ以上の遺伝子、
HOXD3、若しくはAffymetrixプローブ番号:206601_s_atに
よって検出された1個又はそれ以上の遺伝子、
ME2、若しくはAffymetrixプローブ番号:210153_s_atによっ
て検出された1個又はそれ以上の遺伝子、
MESP1、若しくはAffymetrixプローブ番号:224476_s_atに
よって検出された1個又はそれ以上の遺伝子、
MOCS1、若しくはAffymetrixプローブ番号:213181_s_atに
よって検出された1個又はそれ以上の遺伝子、
MSCP、若しくはAffymetrixプローブ番号:218136_s_at若し
くは221920_s_atによって検出された1個又はそれ以上の遺伝子、
NETO2、若しくはAffymetrixプローブ番号:222774_s_atに
よって検出された1個又はそれ以上の遺伝子、
OASL、若しくはAffymetrixプローブ番号:210757_s_atによ
って検出された1個又はそれ以上の遺伝子、
PITX2、若しくはAffymetrixプローブ番号:207558_s_atに
よって検出された1個又はそれ以上の遺伝子、
PRAP1、若しくはAffymetrixプローブ番号:243669_s_atに
よって検出された1個又はそれ以上の遺伝子、
SCUBE2、若しくはAffymetrixプローブ番号:219197_s_at
によって検出された1個又はそれ以上の遺伝子、
SEC6L1、若しくはAffymetrixプローブ番号:225457_s_at
によって検出された1個又はそれ以上の遺伝子、
SLC16A1、若しくはAffymetrixプローブ番号:202236_s_a
t若しくは209900_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A3、若しくはAffymetrixプローブ番号:208596_s_at
によって検出された1個又はそれ以上の遺伝子、
UGT1A8、若しくはAffymetrixプローブ番号:221305_s_at
によって検出された1個又はそれ以上の遺伝子、
ARF4、若しくはAffymetrixプローブ番号:201097_s_atによ
って検出された1個又はそれ以上の遺伝子、
BTG3、若しくはAffymetrixプローブ番号:213134_x_at若し
くは205548_s_atによって検出された1個又はそれ以上の遺伝子、
CHST5、若しくはAffymetrixプローブ番号:221164_x_at若
しくは223942_x_atによって検出された1個又はそれ以上の遺伝子、
CMAH、若しくはAffymetrixプローブ番号:205518_s_atによ
って検出された1個又はそれ以上の遺伝子、
CRYBA2、若しくはAffymetrixプローブ番号:220136_s_at
によって検出された1個又はそれ以上の遺伝子、
CTSE、若しくはAffymetrixプローブ番号:205927_s_atによ
って検出された1個又はそれ以上の遺伝子、
DKFZp761N1114、若しくはAffymetrixプローブ番号:2423
72_s_atによって検出された1個又はそれ以上の遺伝子、
EPB41L4A、若しくはAffymetrixプローブ番号:228256_s_
atによって検出された1個又はそれ以上の遺伝子、
EPHA3、若しくはAffymetrixプローブ番号:206070_s_atに
よって検出された1個又はそれ以上の遺伝子、
FAS、若しくはAffymetrixプローブ番号:204781_s_atによっ
て検出された1個又はそれ以上の遺伝子、
FER1L3、若しくはAffymetrixプローブ番号:201798_s_at
若しくは211864_s_atによって検出された1個又はそれ以上の遺伝子、
FLJ20152、若しくはAffymetrixプローブ番号:218532_s_
at若しくは218510_x_atによって検出された1個又はそれ以上の遺伝子、
FLJ23548、若しくはAffymetrixプローブ番号:218187_s_
atによって検出された1個又はそれ以上の遺伝子、
FN1、若しくはAffymetrixプローブ番号:211719_s_at若しく
は210495_x_at若しくは212464_at若しくは216442_x_at
によって検出された1個又はそれ以上の遺伝子、
FOXA2、若しくはAffymetrixプローブ番号:210103_s_atに
よって検出された1個又はそれ以上の遺伝子、
FRZB、若しくはAffymetrixプローブ番号:203698_s_atによ
って検出された1個又はそれ以上の遺伝子、
GDF15、若しくはAffymetrixプローブ番号:221577_x_atに
よって検出された1個又はそれ以上の遺伝子、
GJB3、若しくはAffymetrixプローブ番号:205490_s_atによ
って検出された1個又はそれ以上の遺伝子、
HOXD13、若しくはAffymetrixプローブ番号:207397_s_at
によって検出された1個又はそれ以上の遺伝子、
INSM1、若しくはAffymetrixプローブ番号:206502_s_atに
よって検出された1個又はそれ以上の遺伝子、
MGC4170、若しくはAffymetrixプローブ番号:212959_s_a
tによって検出された1個又はそれ以上の遺伝子、
MLPH、若しくはAffymetrixプローブ番号:218211_s_atによ
って検出された1個又はそれ以上の遺伝子、
NEBL、若しくはAffymetrixプローブ番号:203962_s_atによ
って検出された1個又はそれ以上の遺伝子、
PLA2G2A、若しくはAffymetrixプローブ番号:203649_s_a
tによって検出された1個又はそれ以上の遺伝子、
PTPRO、若しくはAffymetrixプローブ番号:208121_s_atに
よって検出された1個又はそれ以上の遺伝子、
PYY、若しくはAffymetrixプローブ番号:207080_s_at若しく
は211253_x_atによって検出された1個又はそれ以上の遺伝子、
SH3BP4、若しくはAffymetrixプローブ番号:222258_s_at
によって検出された1個又はそれ以上の遺伝子、
SLC28A2、若しくはAffymetrixプローブ番号:207249_s_a
tによって検出された1個又はそれ以上の遺伝子、
SLC2A10、若しくはAffymetrixプローブ番号:221024_s_a
tによって検出された1個又はそれ以上の遺伝子、
SPON1、若しくはAffymetrixプローブ番号:213994_s_at若
しくは209437_s_atによって検出された1個又はそれ以上の遺伝子、
STS、若しくはAffymetrixプローブ番号:203769_s_atによっ
て検出された1個又はそれ以上の遺伝子、
TM4SF11、若しくはAffymetrixプローブ番号:204519_s_a
tによって検出された1個又はそれ以上の遺伝子、
TUSC3、若しくはAffymetrixプローブ番号:213432_s_at若
しくは209228_x_atによって検出された1個又はそれ以上の遺伝子、
SCD、若しくはAffymetrixプローブ番号:200832_s_atによっ
て検出された1個又はそれ以上の遺伝子、
ABCB1、若しくはAffymetrixプローブ番号:211994_s_atに
よって検出された1個又はそれ以上の遺伝子、
BTBD3、若しくはAffymetrixプローブ番号:202946_s_atに
よって検出された1個又はそれ以上の遺伝子、
CA1、若しくはAffymetrixプローブ番号:205950_s_atによっ
て検出された1個又はそれ以上の遺伝子、
DHRS9、若しくはAffymetrixプローブ番号:224009_x_at若
しくは223952_x_atによって検出された1個又はそれ以上の遺伝子、
DKFZP564I1171、若しくはAffymetrixプローブ番号:2254
57_s_atによって検出された1個又はそれ以上の遺伝子、
EIF5A、若しくはAffymetrixプローブ番号:201123_s_atに
よって検出された1個又はそれ以上の遺伝子、
IGHD、若しくはAffymetrixプローブ番号:214973_x_atによ
って検出された1個又はそれ以上の遺伝子、
PCK1、若しくはAffymetrixプローブ番号:208383_s_atによ
って検出された1個又はそれ以上の遺伝子、
RBP4、若しくはAffymetrixプローブ番号:219140_s_atによ
って検出された1個又はそれ以上の遺伝子、
TRPM6、若しくはAffymetrixプローブ番号:224412_s_atに
よって検出された1個又はそれ以上の遺伝子、
UGT1A6、若しくはAffymetrixプローブ番号:215125_s_at
によって検出された1個又はそれ以上の遺伝子から選択された遺伝子を含んでいる。
有益にも、前記サブセットの遺伝子は、7個の遺伝子を含むことができる。
好ましくは、前記7個の遺伝子は、SEC6L1、PRAC、SPINK5、SEC6
L1、ANPEP、DEFA5、及びCLDN8である。
また別の好ましい実施形態では、前記サブセットの遺伝子は、以下のサブセット、
(i)
SCD、若しくはAffymetrixプローブ番号:200832_s_atによっ
て検出された1個又はそれ以上の遺伝子、
MMP12、
P2RY14、
CLDN8、
ETNK1;
(ii)
PCP4、
SLC28A2、若しくはAffymetrixプローブ番号:207249_s_a
tによって検出された1個又はそれ以上の遺伝子、
CCL18、
RBP4、若しくはAffymetrixプローブ番号:219140_s_atによ
って検出された1個又はそれ以上の遺伝子、
DKFZP564I1171、
PRAC;
(iii)
EIF5A、若しくはAffymetrixプローブ番号:201123_s_atに
よって検出された1個又はそれ以上の遺伝子、
IGFBP2、
GDF15、若しくはAffymetrixプローブ番号:221577_s_atに
よって検出された1個又はそれ以上の遺伝子、
DKFZP564I1171、若しくはAffymetrixプローブ番号:2254
57_s_atによって検出された1個又はそれ以上の遺伝子、
MUC12;
(iv)
HLA−DRB4、
HOXB13、
INSL5、
ETNK1、若しくはAffymetrixプローブ番号:222262_s_atに
よって検出された1個又はそれ以上の遺伝子;
(v)
ANPEP、若しくはAffymetrixプローブ番号:202888_s_atに
よって検出された1個又はそれ以上の遺伝子、
DEFA5、
CHST5、若しくはAffymetrixプローブ番号:221164_x_atに
よって検出された1個又はそれ以上の遺伝子、
Affymetrixプローブ番号:226432_atによって検出された遺伝子、
COLM;
(vi)
SCNN1B、
FN1、若しくはAffymetrixプローブ番号:211719_x_atによっ
て検出された1個又はそれ以上の遺伝子、
ETNK1、若しくはAffymetrixプローブ番号:224453_s_atに
よって検出された1個又はそれ以上の遺伝子、
Affymetrixプローブ番号:225290_atによって検出された遺伝子、
OSTalpha、
HOXD10、
プローブ番号:230269;
(vii)
SLC20A1、
HSPCA、
Affymetrixプローブ番号:217320_atによって検出された遺伝子、
CCL18、
HOXB13;
(viii)
CD69、
OLFM4、若しくはAffymetrixプローブ番号:212768_s_atに
よって検出された1個又はそれ以上の遺伝子、
UGT1A6、若しくはAffymetrixプローブ番号:215125_s_at
によって検出された1個又はそれ以上の遺伝子、
CHST5、若しくはAffymetrixプローブ番号:223942_x_atに
よって検出された1個又はそれ以上の遺伝子、
Affymetrixプローブ番号:231576_atによって検出された遺伝子、
MUC11;
(ix)
PLA2G2A、若しくはAffymetrixプローブ番号:203649_s_a
tによって検出された1個又はそれ以上の遺伝子、
REG3A、
CCL13、若しくはAffymetrixプローブ番号:206407_s_atに
よって検出された1個又はそれ以上の遺伝子、
GCG、
UGT1A3、若しくはAffymetrixプローブ番号:208596_s_at
によって検出された1個又はそれ以上の遺伝子、
FN1、若しくはAffymetrixプローブ番号:210485_x_atによっ
て検出された1個又はそれ以上の遺伝子、
MT1M、
OR51E2;
(x)
SLC16A1、若しくはAffymetrixプローブ番号:202236_s_a
tによって検出された1個又はそれ以上の遺伝子、
WFDC2、
S100P、
PTPRO、若しくはAffymetrixプローブ番号:208121_s_atに
よって検出された1個又はそれ以上の遺伝子、
CCL11、
ASPN、
FAM3B;
(xi)
EMP1、
NEBL、若しくはAffymetrixプローブ番号:203962_s_atによ
って検出された1個又はそれ以上の遺伝子、
TFF1、
CMAH、若しくはAffymetrixプローブ番号:205518_s_atによ
って検出された1個又はそれ以上の遺伝子、
PYY、若しくはAffymetrixプローブ番号:207080_s_atによっ
て検出された1個又はそれ以上の遺伝子、
ECAT11、
NETO2、若しくはAffymetrixプローブ番号:222774_s_atに
よって検出された1個又はそれ以上の遺伝子;
(xii)
HSD17B2、
HGD、
CA1、若しくはAffymetrixプローブ番号:205950_s_atによっ
て検出された1個又はそれ以上の遺伝子、
CPM、
LGALS2、
IGHD、若しくはAffymetrixプローブ番号:214973_x_atによ
って検出された1個又はそれ以上の遺伝子、
FN1、若しくはAffymetrixプローブ番号:216442_xs_atによ
って検出された1個又はそれ以上の遺伝子;
(xiii)
CLC、
DEFA6、
FN1、若しくはAffymetrixプローブ番号:212464_s_atによっ
て検出された1個又はそれ以上の遺伝子、
FST、
Affymetrixプローブ番号:236513_atによって検出された遺伝子、
Affymetrixプローブ番号:240856_atによって検出された遺伝子、
ETNK1;
(xiv)
PITX2、若しくはAffymetrixプローブ番号:207558_s_atに
よって検出された1個又はそれ以上の遺伝子、
DHRS9、若しくはAffymetrixプローブ番号:224009_x_atに
よって検出された1個又はそれ以上の遺伝子、
DKFZp761N1114;
KIAA1913;
(xv)
GHR、
HSD3B2、
MEP1B、
HOXA9、若しくはAffymetrixプローブ番号:213651_s_atに
よって検出された1個又はそれ以上の遺伝子、
TRPM6、若しくはAffymetrixプローブ番号:224412_s_atに
よって検出された1個又はそれ以上の遺伝子、
Affymetrixプローブ番号:239994_atによって検出された遺伝子;
(xvi)
SPINK5、
PCK1、若しくはAffymetrixプローブ番号:208383_s_atによ
って検出された1個又はそれ以上の遺伝子、
ADRA2A、
NQO1、若しくはAffymetrixプローブ番号:210519_s_atによ
って検出された1個又はそれ以上の遺伝子、
GBA3、
Affymetrixプローブ番号:228004_atによって検出された遺伝子;
(xvii)
SCGB2A1、
NR1H4、
NETO2、若しくはAffymetrixプローブ番号:218888_s_atに
よって検出された1個又はそれ以上の遺伝子、
ST6GALNAC6;
(xviii)
NEBL、
PROM1、若しくはAffymetrixプローブ番号:204304_s_atに
よって検出された1個又はそれ以上の遺伝子、
AGR2、
REG1A、
UGT1A8、若しくはAffymetrixプローブ番号:221305_s_at
によって検出された1個又はそれ以上の遺伝子、
DKFZp761N1114、若しくはAffymetrixプローブ番号:2423
72_s_atによって検出された1個又はそれ以上の遺伝子;
(xix)
ACSL1、
ST3GAL4、
GBA3、若しくはAffymetrixプローブ番号:219954_s_atによ
って検出された1個又はそれ以上の遺伝子、
SLC2A10、若しくはAffymetrixプローブ番号:221024_s_a
tによって検出された1個又はそれ以上の遺伝子、
DHRS9、若しくはAffymetrixプローブ番号:223952_s_atに
よって検出された1個又はそれ以上の遺伝子、
LAMA1;
(xx)
EFNA1、
BTBD3、若しくはAffymetrixプローブ番号:202946_s_atに
よって検出された1個又はそれ以上の遺伝子、
PI3、
ABCB1、若しくはAffymetrixプローブ番号:209994_s_atに
よって検出された1個又はそれ以上の遺伝子、
C10orf45、
BCMP11、
C6orf105、
CAPN13、
CPM、
Affymetrixプローブ番号:236141_atによって検出された遺伝子、
Affymetrixプローブ番号:238143_atによって検出された遺伝子の
うちの1つ又はそれ以上である。
「近位−遠位起源」との言及は、近位起源若しくは遠位起源いずれかの細胞若しくは発
現データについての言及と理解されたい。「細胞若しくは細胞亜集団」、「大腸」、「近
位」、「遠位」、「起源」、「位置」、「遺伝子」及び「発現」との言及は、上記に提供
した意味と同一の意味を有すると理解されたい。
本発明は、上記の方法のいずれか1つを実行するための成分を有する検出システムをさ
らに提供する。
本発明は、上記の方法のいずれか1つを実行するためのそこに保存されたプログラム取
扱説明書を有するコンピュータ可読記憶媒体をさらに提供する。
本発明は、
少なくとも1つの大腸に由来する細胞若しくは細胞集団における遺伝子の発現を表す発
現トレーニングデータ、及び前記細胞若しくは細胞集団と前記近位−遠位起源との関連を
表す近位−遠位起源トレーニングデータを含むトレーニングデータを入手するための手段
と;
前記遺伝子の発現レベルの線形若しくは非線形組み合わせを表す分類データを生成する
ために多変量分析を用いて前記トレーニングデータを処理するための手段であって、前記
分類データは、また別の細胞若しくは細胞集団における前記遺伝子の発現を表すまた別の
発現データに基づいて、大腸から採取された前記また別の細胞若しくは細胞集団の近位−
遠位起源を示す近位−遠位起源データを生成するために適合させられる手段とを含む検出
システムをさらに提供する。
上記に詳述したように、本発明の方法は、その解剖学的起源に特徴的な遺伝子発現プロ
ファイルを発現していない遠位若しくは近位起源の細胞が異常な発現プロファイルを示し
ており、このため対象異常の完全な範囲及び性質を決定するために詳細な分析を受けるべ
きであることに基づいて異常な細胞を同定するために有用である。例えば、一部の結腸直
腸腺腫若しくは腺癌細胞は、これらの細胞の腫瘍性(neoplastic)形質転換に特徴的であ
る脱分化事象に起因して正しくない近位−遠位大腸発現プロファイルを示す可能性がある
従って、また別の態様では、大腸における細胞異常又は細胞異常を特徴とする状態の発
症若しくは発症に対する素因を決定するための方法であって、上記に記載した方法の1つ
に従って、大腸における公知の近位若しくは遠位起源に由来する生物学的サンプルの近位
−遠位遺伝子発現プロファイルを決定する工程を含み、正常近位−遠位大腸遺伝子発現プ
ロファイルと一致しない遺伝子発現プロファイルの検出は前記プロファイルを発現する細
胞若しくは細胞集団の異常の指標となる方法が提供される。
「遺伝子発現プロファイル」との言及は、上記に記載した単変量若しくは多変量遺伝子
発現結果についての言及と理解されたい。例えば、「プロファイル」は、上記で考察した
1つ又はそれ以上のマーカー遺伝子の発現レベル又は上記に記載した遺伝子及び/又は遺
伝子セットの多変量分析の結果と相関付けることができる。従って、「近位−遠位遺伝子
発現プロファイル」との言及は、近位大腸起源の細胞に特徴的な遺伝子発現プロファイル
及び遠位大腸起源の細胞に特徴的な遺伝子発現プロファイルについての言及である。
本発明の状況における分析の対象である細胞は、公知の近位若しくは遠位起源であるこ
とは理解されるであろう。この情報は、任意の適切な方法によって決定できるが、最も便
宜的には生検を介して大腸内の規定の位置から生物学的サンプルを単離する工程によって
満たされる。しかし、生物学的サンプルを採取する、さもなければその解剖学的起源を決
定する他の適切な方法は除外されない。
生物学的サンプルの細胞若しくは細胞集団の異常は、通常はその特定の近位若しくは遠
位起源の細胞を特徴付けるであろうプロファイルの検出に一致していない遺伝子発現プロ
ファイルの検出に基づいている。「一致しない」とは、分析される1個又はそれ以上の遺
伝子の発現レベルが正常コントロールにおいて典型的に観察される遺伝子の発現レベルと
一致しないことを意味する。
本発明の方法は、単発試験として、又は疾患が発症するリスク状態にあると考えられる
個体の継続的モニターとして、又は治療的若しくは予防的処置レジメン、例えば異常な遺
伝子発現プロファイルを特徴とする疾患細胞のアブレーション(ablation)の有効性のモニ
ターとして有用である。これらの状況では、生物学的サンプルの任意の1つ又はそれ以上
のクラスにおける位置マーカー発現レベル若しくは発現プロファイルの変調についてのマ
ッピングは、個体の状態又は現在使用されている治療的若しくは予防的レジメンの有効性
についての貴重な指標である。従って、本発明の方法は、正常レベル(上記に規定した)
に比較して、又は前記個体の生物学的サンプルから決定された1つ又はそれ以上の以前の
遺伝子マーカーレベル若しくは発現プロファイルに比較して個体における位置マーカーレ
ベル若しくは発現プロファイルの変調についてのモニタリングに及ぶと理解されたい。
生物学的サンプル中の対象の発現した位置マーカーについて試験する手段は以下などで
あるが、それらに限定されない当業者には周知であろう任意の適切な方法によって達成で
きる。
(i)インビボ検出。
分子イメージングは、腸組織内のマーカーの変化した発現を明らかにできるイメージン
グプローブ若しくは試薬の投与後に使用できる。
分子イメージング(Moore et al., BBA, 1402:239-249, 1988、Weissleder et al., Na
ture Medicine 6:351-355, 2000)は、「古典的」診断イメージング技術、例えばX線、
コンピュータ断層撮影(CT)、MRI、陽電子断層撮影法(PET)若しくは内視鏡検
査を使用して現在視認されるマクロ特徴と相関する分子発現のインビボイメージングであ
る。
(ii)蛍光インサイチューハイブリダイゼーション(FISH)による細胞中での、又
は例えば定量的逆転写酵素ポリメラーゼ連鎖反応(QRTPCR)若しくは競合的RT−
PCR産物のフローサイトメトリー定性などの技術による細胞由来の抽出物中でのRNA
発現のアップレギュレーションの検出(Wedemeyer et al., Clinical Chemistry 48:9 13
98-1405, 2002)。
(iii)例えばアレイ技術による、細胞抽出物由来のRNAの発現プロファイルの評価
(Alon et al., Proc. Natl. Acad. Sci. USA:96, 6745-6750, June 1999)。
「マイクロアレイ」は、各々が固体支持体の表面上で形成された規定領域を有する、好
ましくは別個の領域の線形若しくは多次元のアレイである。マイクロアレイ上の別個の領
域の密度は、単一固相支持体の表面、好ましくは少なくとも約50/cm、より好まし
くは少なくとも約100/cm、一層より好ましくは少なくとも約500/cm、及
びさらに一層より好ましくは少なくとも約1,000/cmの表面上で検出される標的
ポリヌクレオチドの総数によって決定される。本明細書で使用するように、DNAマイク
ロアレイは、標的ポリヌクレオチドを増幅又はクローニングするために使用されるチップ
若しくは他の表面上に配置されたオリゴヌクレオチドプローブのアレイである。アレイ内
の各特定群のプローブの位置は公知であるので、標的ポリヌクレオチドの同一性は、マイ
クロアレイ内の特定位置へのそれらの結合に基づいて決定できる。
DNAマイクロアレイ技術における近年の発達は、単一固相支持体上の複数の標的核酸
分子の大規模アッセイを実行することを可能にする。米国特許第5,837,832号明
細書(Chee et al.)及び関連出願は、サンプル中での特定核酸配列をハイブリダイゼー
ション及び検出するためのオリゴヌクレオチドプローブのアレイを固定化する工程を記載
している。当該の組織から単離された当該の標的ポリヌクレオチドは、DNAチップへハ
イブリダイゼーションさせられ、そして別個のプローブ位置での標的ポリヌクレオチドの
優先性及びハイブリダイゼーション度に基づいて特異的配列が検出される。アレイの1つ
の重要な使用は示差的遺伝子発現の分析にあるが、様々な細胞若しくは組織、しばしば当
該の組織及びコントロール組織における遺伝子の発現プロファイルが比較され、そして各
組織間の遺伝子発現における何らかの差が同定される。そのような情報は、特定組織タイ
プにおいて発現した遺伝子のタイプの同定及び発現プロファイルに基づく状態の診断のた
めに有用である。
1つの例では、当該のサンプル由来のRNAは、標識したcDNAを入手するために逆
転写を受けさせられる。米国特許第6,410,229号明細書(Lockhart et al.)を
参照されたい。cDNAは、次に公知の順序でチップ若しくは他の表面上に配列された公
知の配列のオリゴヌクレオチド若しくはcDNAへハイブリダイズさせられる。また別の
例では、RNAは、生物学的サンプルから単離され、その上にcDNAプローブが固定さ
れているチップへハイブリダイズさせられる。標識されたcDNAがハイブリダイズする
オリゴヌクレオチドの位置はcDNA上の配列情報を提供し、他方標識されてハイブリダ
イズしたRNA若しくはcDNAの量は、当該のRNA若しくはcDNAの相対発現量の
推定値を提供する。Schena, et al. Science 270:467-470 (1995)を参照されたい。例え
ば、ヒト癌における遺伝子発現パターンを分析するためのcDNAマイクロアレイの使用
については、DeRisi, et al. (Nature Genetics 14:457-460 (1996))によって記載され
ている。
好ましい実施形態では、対象核酸に対応する核酸プローブが作製される。バイオチップ
に付着した核酸プローブは、本発明の標的配列及びプローブの特異的ハイブリダイゼーシ
ョンが発生するように生物学的サンプルの核酸に実質的に相補的であるように設計される
。この相補性は、本発明の標的配列と一本鎖核酸との間のハイブリダイゼーションを妨害
するであろう任意の数の塩基対ミスマッチが存在していてよいという点で完全である必要
はない。ヌクレオチドレベルでの遺伝子の全体的ホモロジーはおそらく約40%以上、お
そらくは約60%以上、及び一層よりおそらくは約80%以上であろう;さらに約8〜1
2ヌクレオチド以上の対応する隣接配列が存在するであろうと予測されている。しかし、
突然変異の数が極めて多いと、最小ストリンジェントのハイブリダイゼーション条件下で
さえハイブリダイゼーションが発生できなくなり、配列は相補的標的配列ではなくなる。
そこで、本明細書での「実質的に相補的」は、プローブが通常の反応条件下、特別には高
ストリンジェンシー条件下でハイブリダイズするために標的配列へ十分に相補的であるこ
とを意味する。
核酸プローブは、一般に一本鎖であるが、部分的一本鎖及び部分的二本鎖であってよい
。プローブの鎖の数(strandedness)は、標的配列の構造、組成、及び特性によって決定
される。一般に、オリゴヌクレオチドプローブは、約6、8、10、12、15、20、
30〜約100塩基長の範囲に及び、約10〜約80塩基が好ましく、約15〜約40塩
基が特に好ましい。即ち、一般に全遺伝子がプローブとして使用されることはまれである
。一部の実施形態では、数百塩基までというはるかに長い核酸を使用できる。プローブは
、当業者には公知の条件下で相補的テンプレート配列へハイブリダイズするために十分に
特異的である。プローブの配列とそれらがハイブリダイゼーション中にハイブリダイズす
るそれらの相補的テンプレート(標的)配列との間のミスマッチの数は、BLAST(デ
フォルト設定)によって決定されるように、一般に15%を超えず、通常は10%を超え
ず、及び好ましくは5%を超えない。
オリゴヌクレオチドプローブは、通常は核酸(ウラシル、シトシン、チミン、アデニン
及びグアニン)内で見いだされる天然型複素環式塩基、並びに修飾された塩基及び塩基ア
ナログを含むことができる。標的配列へのプローブのハイブリダイゼーションと適合する
任意の修飾された塩基若しくは塩基アナログは、本発明の実践において有用である。プロ
ーブの糖若しくはグリコシド部分は、デオキシリボース、リボース、及び/又はこれらの
糖の修飾形、例えば2’−O−アルキルリボースを含むことができる。好ましい実施形態
では、糖部分は2’−デオキシリボースである;しかしプローブが標的配列にハイブリダ
イズする能力と適合する任意の糖部分を使用できる。
1つの実施形態では、プローブのヌクレオシドユニットは、当分野においては周知であ
るように、ホスホジエステル骨格によって連結されている。追加の実施形態では、ヌクレ
オチド間結合は、ホスホロチオエート、メチルホスホネート、スルファメート(例、米国
特許第5,470,967号明細書)及びポリアミド(即ち、ペプチド核酸)を含むがそ
れらに限定されないプローブの特異的ハイブリダイゼーションと適合する当業者には公知
の任意の結合を含むことができる。ペプチド核酸は、Nielsen et al. (1991) Science 25
4:1497-1500、米国特許第5,714,331号明細書、及びNielsen (1999) Curr. Opin
. Biotechnol. 10:71-75に記載されている。
所定の実施形態では、プローブは、キメラ分子であってよい;即ち1つより多いタイプ
の塩基若しくは糖サブユニットを含んでいてよい、及び/又は結合は同一プライマー内の
1つより多いタイプの結合であってよい。プローブは、当分野において公知であるように
、その標的配列へのハイブリダイゼーションを促進する部分、例えば、インタカレータ及
び/又はマイナーグルーブ・バインダを含むことができる。塩基、糖、及びヌクレオシド
間骨格の変形、並びにプローブ上の任意のペンダント基の存在は、配列特異的方法でプロ
ーブがその標的配列と結合する能力と適合するであろう。これらの結合内では、極めて多
数の構造的修飾が可能である。有益にも、本発明によるプローブは、それらがシグナル増
幅を可能にするような構造的特性を有していてよく、そのような構造的特性は、例えばUr
dea et al. (Nucleic Acids Symp. Ser., 24:197-200 (1991))又は欧州特許第0225
,807号明細書に記載されたような分枝状DNAプローブである。さらに、プローブを
形成する様々な複素環式の塩基、糖、ヌクレオシド及びヌクレオチドを調製するための合
成方法、並びに特に所定の配列のオリゴヌクレオチドの調製は、十分に開発され、当分野
において公知である。オリゴヌクレオチド合成のための好ましい方法は、米国特許第5,
419,966号明細書の教示を組み込んでいる。
標的核酸内の多型及び/又は二次構造、データの重複性等について明らかにするために
、特定の標的核酸のための複数のプローブを設計することができる。一部の実施形態では
、1配列当たり1つより多いプローブが使用される場合は、オーバーラッピングプローブ
又は単一標的遺伝子の相違する区間に対するプローブのいずれかが使用される。つまり、
2つ、3つ、4つ又はそれ以上のプローブが特定標的のために重複する状態で構築するた
めに使用される。これらのプローブは、オーバーラッピング(即ち、共通する一部の配列
を有していてよい)であってよい、又は遺伝子の別個の配列に対して特異的である。複数
の標的ポリヌクレオチドが本発明によって検出されるべきである場合は、特定標的ポリヌ
クレオチドに対応する各プローブ若しくはプローブ群がマイクロアレイの別個の領域に配
置される。
プローブは、溶液中、例えばウエル内若しくはマイクロアレイの表面上にあってもよい
し、又は固体支持体へ付着していてもよい。使用できる固体支持体材料の例には、プラス
チック、セラミック、金属、樹脂、ゲル及び膜が含まれる。固体支持体の有用なタイプに
は、プレート、ビーズ、磁気材料、マイクロビーズ、ハイブリダイゼーションチップ、膜
、結晶、セラミック及び自己集合性単層が含まれる。1つの例は、二次元若しくは三次元
マトリックス、例えば複数のプローブ結合部位を備えるゲル若しくはハイブリダイゼーシ
ョンチップを含んでいる(Pevzner et al., J. Biomol. Struc. & Dyn. 9:399-410, 1991
、Maskos and Southern, Nuc. Acids Res. 20:1679-84, 1992)。
ハイブリダイゼーションチップは、引き続いて標的核酸とハイブリダイズする極めて大
きなプローブアレイを構築するために使用できる。チップのハイブリダイゼーションパタ
ーンの分析は、標的ヌクレオチド配列の同定に役立つことができる。パターンは手動若し
くはコンピュータ援用で分析できるが、ハイブリダイゼーションによる位置シーケンシン
グはコンピュータ分析及び自動化に役立つことは明白である。また別の例では、蛍光ビー
ズをベースとするアプローチと組み合わせて固相構造支持体上でAffymetrixチ
ップを使用することができる。また別の例では、cDNAマイクロアレイを使用できる。
これに関連して、Lockkart et al.(即ち固相上のインサイチューでのAffymetr
ix合成プローブ)によって記載されたオリゴヌクレオチドが特に好ましく、即ちフォト
リソグラフィである。
当業者には理解されるように、核酸は、様々な方法で固体支持体へ付着又は固定化させ
ることができる。本明細書における「固定化」は、結合、洗浄、分析、及び除去の条件下
で核酸プローブと固体支持体との間の結び付き若しくは結合が十分に安定性であることを
意味する。結合は、共有若しくは非共有であってよい。本明細書における「非共有結合」
及び文法的同等語は、静電性、親水性、及び疎水性の相互作用いずれかの1つ又はそれ以
上を意味する。非共有結合には、分子、例えばストレプトアビジンの支持体への共有的付
着、及びビオチン化プローブのストレプトアビジンへの非共有結合が含まれる。本明細書
における「共有結合」及び文法的同等語は、2つの部分である支持体及びプローブが、σ
結合、π結合及び配位結合を含む少なくとも1つの結合によって付着させられていること
を意味する。共有結合は、プローブと固体支持体との間で直接的に形成される場合もある
し、あるいは、架橋剤によってか、又は固体支持体若しくはプローブのいずれか又は両方
の分子上に特異的反応基を包含することによって形成される場合もある。固定化は、さら
に又共有及び非共有相互作用の組み合わせを含むことができる。
核酸プローブは、共有結合、例えば結合剤とのコンジュゲート化によって、又は共有結
合若しくは非共有結合(例えば静電性相互作用、水素結合若しくは抗体−抗原結合)によ
って、或いはそれらの組み合わせによって固体支持体へ付着させることができる。典型的
な結合剤には、ビオチン/アビジン、ビオチン/ストレプトアビジン、黄色ブドウ球菌(
Staphylococcus aureus)タンパク質A/IgG抗体Fフラグメント、及びストレプト
アビジン/タンパク質Aキメラ(T. Sano and C.R. Cantor, Bio/Technology 9:1378-81
(1991)))、又はこれらの物質の誘導体若しくは組み合わせが含まれる。核酸は、固体支
持体へ光切断可能結合、静電結合、ジスルフィド結合、ペプチド結合、ジエステル結合又
はこれらの種類の結合の組み合わせによって付着させることができる。アレイもまた、選
択的に解除できる結合、例えば4,4’−ジメトキシトリチル若しくはその誘導体によっ
て固体支持体へ付着させることができる。有用であることが見いだされている誘導体には
、3若しくは4[ビス−(4−メトキシフェニル)]−メチル−安息香酸、N−スクシン
イミジル−3若しくは4[ビス−(4−メトキシフェニル)]−メチル−安息香酸、N−
スクシンイミジル−3若しくは4[ビス−(4−メトキシフェニル)]−ヒドロキシメチ
ル−安息香酸、N−スクシンイミジル−3若しくは4[ビス−(4−メトキシフェニル)
]−クロロメチル−安息香酸、及びこれらの酸の塩が含まれる。
一般に、プローブは、当業者には理解されるように、様々な方法でバイオチップに付着
させられる。本明細書に記載したように、核酸は、最初に合成して、続いてバイオチップ
へ付着させることができる、又はバイオチップ上で直接的に合成することができる。
バイオチップは、適切な固体基質を含んでいる。本明細書における「基質」若しくは「
固体支持体」若しくは他の文法的同等語は、核酸プローブの付着若しくは結び付きのため
に適切な別個の個別部位(discrete individual site)を含有するように修飾することが
でき、そして少なくとも1つの検出方法に従順である任意の物質を意味する。本発明の固
相支持体は、ヌクレオチドのハイブリダイゼーション及び合成を支持するために適合する
任意の固体の材料及び構造であってよい。好ましくは、固相支持体は、その上にプライマ
ーを固定化して逆転写酵素反応を実行できる少なくとも1つの実質的に剛性の表面を含ん
でいる。ポリヌクレオチドマイクロアレイ要素が安定的に結び付けられる基質は、プラス
チック、セラミック、金属、アクリルアミド、セルロース、ニトロセルロース、ガラス、
ポリスチレン、ポリエチレンビニルアセテート、ポリプロピレン、ポリメタクリレート、
ポリエチレン、ポリエチレンオキシド、ポリシリケート、ポリカーボネート、Teflo
n RTM、フルオロカーボン、ナイロン、シリコンラバー、ポリアンヒドリド、ポリグ
リコール酸、ポリ乳酸、ポリオルトエステル、ポリプロピルフメレート、コラーゲン、グ
リコサミノグリカン、及びポリアミノ酸を含む様々な物質から作製できる。基質は、二次
元形若しくは三次元形、例えばゲル、膜、薄いフィルム、ガラス、プレート、シリンダ、
ビーズ、磁気ビーズ、光ファイバ、織繊維などであってよい。アレイの好ましい形態は、
三次元アレイである。好ましい三次元アレイは、タグ付ビーズの集合である。各タグ付ビ
ーズは、それに付着した様々なプライマーを有する。タグはシグナリング手段、例えば色
(Luminex、Illumina)及び電磁場(Pharmaseq)などによって
検出可能であり、タグ付ビーズ上のシグナルは(例、光ファイバを使用して)遠隔的に検
出することさえできる。固体支持体のサイズは、DNAマイクロアレイテクノロジーのた
めに有用ないずれかの標準的マイクロアレイサイズであってよく、サイズは本発明の反応
を実施するために使用される特定の機械に適応させるために特別仕立てすることができる
。一般に、基質は光学検出を可能にし、感知できる蛍光を発しない。
1つの実施形態では、バイオチップ及びプローブの表面は、それら2つのその後の付着
のために化学的官能基を用いて誘導体化することができる。そこで、例えば、バイオチッ
プは、アミノ基、カルボキシ基、オキソ基及びチオール基を含むがそれらに限定されない
化学的官能基を用いて誘導体化されるが、特に好ましいのはアミノ基である。これらの官
能基を用いると、プローブは、プローブ上の官能基を使用して付着させることができる。
例えば、アミノ基を含有する核酸は、アミノ基を含む表面に、例えば当分野において公知
であるようにリンカーを用いて付着させることができる;例えば、ホモ−二官能リンカー
又はヘテロ−二官能リンカーは周知である(参照して本明細書に組み込まれる1994 Pierc
e Chemical Company catalog, technical section on cross-linkers, pages 155-200を
参照されたい)。さらに、一部の場合には、追加のリンカー、例えばアルキル基(置換基
及びヘテロアルキル基を含む)を使用できる。
この実施形態では、オリゴヌクレオチドは、当分野において公知であるように合成され
、次に固体支持体の表面に付着させられる。当業者には理解されるように、5’若しくは
3’の末端を固体支持体へ付着させることができる、又は付着は内部ヌクレオシドを介し
てであってよい。追加の実施形態では、固体支持体への固定化は、極めて強力であってよ
いが、それでも非共有であってよい。例えば、ストレプトアビジンを用いて共有的にコー
ティングされた表面へ結合し、結果として付着を生じさせるビオチン化オリゴヌクレオチ
ドを作製できる。
アレイは、任意の便宜的方法、例えばポリヌクレオチドマイクロアレイ要素を前形成し
、次にそれらを表面と安定的に結び付ける方法によって生成できる。又は、オリゴヌクレ
オチドは、当分野において公知であるように、表面上で合成できる。多数の様々なアレイ
構成及びそれらの製造方法は当業者には公知であり、国際出願第95/25116号パン
フレット及び国際出願第95/35505号パンフレット(photolithographic techniqu
es)、米国特許第5,445,934号明細書(in situ synthesis by photolithograph
y)、米国特許第5,384,261号明細書(in situ synthesis by mechanically dir
ected flow paths)、及び米国特許第5,700,637号明細書(synthesis by spott
ing, printing or coupling)に開示されている;それらの開示は、全体として参照して
本明細書に組み込まれる。DNAをビーズへ結合させるためのまた別の方法は、ビーズに
付着させたリガンド結合分子へ連結させるためにDNAの末端に付着した特異的リガンド
を使用する。可能性のあるリガンド結合パートナー対には、ビオチン−アビジン/ストレ
プトアビジン、様々な抗体/抗原対、例えばジゴキシゲニン−抗ジゴキシゲニン抗体が含
まれる(Smith et al., Science 258:1122-1126 (1992))。支持体へのDNAの共有化学
結合は、ホスホアミデート結合を通してDNA上の5’−ホスフェートを被覆されたマイ
クロスフェアへ連結させるための標準結合剤を使用することによって遂行できる。固体基
質へオリゴヌクレオチドを固定化するための方法は、明確に確立されている。Pease et a
l., Proc. Natl. Acad. Sci. USA 91(11):5022-5026 (1994)を参照されたい。オリゴヌク
レオチドを固体基質へ付着させるために好ましい方法は、Guo et al., Nucleic Acids Re
s. 22:5456-5465 (1994)によって記載されている。固定化は、インサイチューDNA合成
(Maskos and Southern、上記)又はロボットによるアレイ作成技術と組み合わせた化学
的に合成されたオリゴヌクレオチドの共有結合(Guo et al.、上記)によって遂行できる
バイオチップアレイを代表とする固相技術に加えて、遺伝子発現は液相アレイを用いて
定量することもできる。1つのそのようなシステムは、動的ポリメラーゼ連鎖反応(PC
R)である。動的PCRは、特異的核酸配列の同時の増幅及び定量を可能にする。この特
異性は、標的部位を囲んでいる一本鎖核酸配列へ優先的に付着するように設計された合成
オリゴヌクレオチドプライマーに由来する。このオリゴヌクレオチドプライマーの対は、
標的配列の各鎖上で特異的な、非共有結合複合体を形成する。これらの複合体は、反対方
向における二本鎖RNAのインビトロ転写を促進する。反応混合物の温度サイクリングは
、連続サイクルのプライマー結合、転写及び核酸から個別鎖への再溶融を作り出す。その
結果は、標的dsDNA産物の指数的増加である。この産物は、インターカレート色素若
しくは配列特異的プローブのいずれかを使用してリアルタイムで定量できる。SYBR(
r) Green 1は、dsDNAへ優先的に結合するインターカレート色素の1例で
あり、蛍光シグナルにおける同時増加を生じさせる。配列特異的プローブ、例えばTaq
Man.RTM.法とともに使用されるプローブは、蛍光色素及びオリゴヌクレオチドの
反対側の末端へ共有結合した消光分子からなる。プローブは、2つのプライマー間で標的
DNA配列へ選択的に結合するように設計される。DNAストランドがPCR反応中に合
成される場合は、蛍光色素は、ポリメラーゼのエキソヌクレアーゼ活性によってプローブ
から切断され、シグナル脱消光(dequenching)が生じる。プローブシグナリング法は、イ
ンターカレート色素法よりより特異的であり得るが、各場合には、シグナル強度は生成さ
れたdsDNA産物に比例している。当該の核酸配列に対して特異的なプライマー及び/
又はプローブを表す各ウエルを備えるマルチウエル液相アレイにおいて、各タイプの定量
方法を使用できる。組織若しくは細胞系のメッセンジャーRNA調製物と一緒に使用する
と、1アレイのプローブ/プライマー反応は当該の複数の遺伝子産物の発現を同時に定量
することができる。Germer et al., Genome Res. 10:258-266 (2000)、Heid et al., Gen
ome Res. 6:986-994 (1996)を参照されたい。
(iv)例えばイムノアッセイによる、細胞抽出物中での変化した位置マーカータンパク
質レベルの測定。
生物学的サンプル中のタンパク様の位置マーカー発現産物についての試験は、当業者に
は周知である多数の適切な方法のいずれか1つによって実施できる。適切な方法の例には
、組織切片の抗体スクリーニング、生検標本若しくは体液サンプルが含まれるが、それら
に限定されない。
抗体をベースとする診断方法が使用される範囲内で、マーカータンパク質の存在は多数
の方法、例えばウェスタンブロッティング、ELISA又はフローサイトメトリー法で決
定できる。当然ながら、これらには、非競合的タイプの一部位及び二部位の両方又は「サ
ンドイッチ」アッセイ、並びに伝統的競合的結合アッセイが含まれる。これらのアッセイ
は、標識抗体の標的への直接結合もまた含んでいる。
サンドイッチアッセイは特に最も有用かつ一般に使用されるアッセイであり、本発明に
おいて使用するために好都合である。サンドイッチアッセイ技術の多数の変形が存在し、
すべてが本発明によって包含されることが意図されている。手短には、典型的なフォーワ
ードアッセイでは、未標識抗体は固体基板上に固定化され、試験対象のサンプルは結合分
子と接触させられる。適切な期間のインキュベーション後、抗体−抗原複合体の形成を可
能にするために十分な期間に渡り、抗原に対して特異的な、検出可能なシグナルを生成で
きるレポーター分子で標識された二次抗体が次に添加されて、抗体−抗原標識抗体のまた
別の複合体を形成するために十分な時間にわたりインキュベートされる。任意の未反応物
質は洗い流され、抗原の存在はレポーター分子によって生成するシグナルの観察によって
決定される。これらの結果は、可視シグナルの単純な観察によって定性的であってよい、
又はコントロールサンプルとの比較によって定量することができる。フォーワードアッセ
イについての変形には、サンプル及び標識された抗体の両方が同時に結合抗体へ添加され
る同時アッセイが含まれる。これらの技術は当業者には周知であり、容易に明白なように
任意の小さな変形を含んでいる。
典型的なフォーワードサンドイッチアッセイでは、マーカー若しくはその抗原性部分に
対する特異性を有する一次抗体は、固体表面へ共有的結合若しくは受動的結合のいずれか
で結合させられる。固体表面は、典型的にはガラス若しくはポリマーであり、最も一般的
に使用されるポリマーは、セルロース、ポリアクリルアミド、ナイロン、ポリスチレン、
ポリビニルクロライド若しくはポリプロピレンである。固体支持体は、チューブ、ビーズ
、マイクロプレートのディスク、又はイムノアッセイを実施するために適切な任意の他の
表面の形態であってよい。結合プロセスは当分野において周知であり、一般に架橋結合、
共有結合若しくは物理的吸着からなり、ポリマー抗体複合体は、試験サンプルのための調
製において洗浄される。試験対象のサンプルのアリコートは次に固相複合体へ加えられ、
抗体内に存在する任意のサブユニットの結合を可能にするために十分な時間(例、2〜4
0分間)及び適切な条件(例、25℃)下でインキュベートされる。インキュベーション
期間に続いて、抗体サブユニット固相は洗浄され、乾燥させられ、抗原の一部分に対して
特異的な二次抗体と一緒にインキュベートされる。二次抗体は、抗原への二次抗体の結合
を示すために使用されるレポーター分子へ連結させられる。
代替法は、生物学的サンプル中の標的分子を固定化し、次に固定化された標的を、レポ
ーター分子で標識されていても標識されていなくてもよい特異的抗体へ曝露させる工程を
含んでいる。標的の量及びレポーター分子シグナルの強度に依存して、結合標的は抗体を
用いた直接標識化によって検出することができる。又は、一次抗体に対して特異的な二次
標識抗体は、標的−一次抗体−二次抗体三次複合体を形成するために標的−一次抗体複合
体へ曝露させられる。複合体は、レポーター分子によって放出されたシグナルによって検
出される。
本明細書において使用される「レポーター分子」は、その化学的性質によって、抗原−
結合抗体の検出を可能にする分析によって同定可能なシグナルを提供する分子を意味する
。検出は、定性的又は定量的のいずれであってもよい。このタイプのアッセイにおいて最
も一般に使用されるレポーター分子は、酵素、蛍光体若しくは放射性核種含有分子(即ち
、放射性同位体)及び化学発光分子のいずれかである。
酵素イムノアッセイの場合は、酵素は、一般にグルタルアルデヒド若しくはペリオデー
トによって、二次抗体へコンジュゲート化される。しかし容易に理解されるように、当業
者が容易に利用できる極めて広範囲の様々なコンジュゲート技術が存在する。一般に使用
される酵素には、特にホースラディッシュペルオキシダーゼ、グルコースオキシダーゼ、
β−ガラクトシダーゼ及びアルカリホスファターゼが含まれる。特異的酵素とともに使用
できる基質は、一般に、対応する酵素による加水分解を受けると検出可能な変色を生成す
るために選択される。適切な酵素の例には、アルカリホスファターゼ及びペルオキシダー
ゼが含まれる。さらにまた、上述した発色性基質よりむしろ蛍光産物を産生する蛍光源基
質を使用することもまた可能である。すべての場合に、酵素標識抗体は一次抗体ハプテン
複合体へ添加され、結合させられ、次に過剰な試薬が洗い流される。適切な基質を含有す
る溶液が次に抗体−抗原−抗体の複合体へ添加される。基質は二次抗体に連結した抗体と
反応し、定性的可視シグナルを生じさせるが、これはさらに通常は分光測光法によって、
サンプル中に存在していた抗原の量の指標を提供するために定量することができる。「レ
ポーター分子」は、さらに細胞の凝集若しくは凝集の阻害(例えばラテックスビーズ上の
赤血球等)についての使用にも及ぶ。
又は、蛍光化合物、例えばフルオレセイン及びローダミンは、それらの結合能力を変化
させずに抗体へ化学的に結合させることができる。特定波長の光線を用いた照明により活
性化すると、蛍光色素標識抗体は光線エネルギーを吸収し、分子内の興奮性への状態を誘
導し、光線顕微鏡を用いて視覚的に検出可能な特徴的な色での光線放出が続く。EIAに
おけるのと同様に、蛍光標識抗体は、一次抗体−ハプテン複合体へ結合させられる。未結
合試薬を洗い流した後、残留している三次複合体は次に、適切な波長の光線に曝露させら
れ、観察された蛍光は当該のハプテンの存在を示す。免疫蛍光及びEIA法は、どちらも
当分野において明確に確立され、本方法のために特に好ましい。しかし、その他のレポー
ター分子、例えば放射性同位体、化学発光若しくは生物発光分子もまた使用できる。
(v)細胞表面上の、例えば免疫組織化学によるタンパク質位置マーカーの変化した発現
を決定する。
(vi)上記の項目(iv)及び(vi)に詳述したものに加えて、任意の適切な機能試
験、酵素試験若しくは免疫学的試験に基づく変化したタンパク質発現を決定する。
当業者であれば、ルーチン方法の問題として、所与の方法を特定タイプの生物学的サン
プルへ適用する適切性を決定することができよう。
決して本発明を限定するわけではなく、そして上記で詳述したように、遺伝子発現レベ
ルは、当分野において公知の様々な方法によって測定できる。例えば、遺伝子転写若しく
は翻訳産物を測定できる。遺伝子転写産物、即ちRNAは、例えば、ハイブリダイゼーシ
ョンアッセイ、ラン−オフアッセイ、ノーザンブロット、又は当分野において公知の他の
方法によって測定できる。
ハイブリダイゼーションアッセイは、一般に、一本鎖RNA転写産物へハイブリダイズ
するオリゴヌクレオチドプローブの使用を含んでいる。そこで、オリゴヌクレオチドプロ
ーブは、転写されたRNA発現産物に相補的である。典型的には、配列特異的プローブは
、RNA若しくはcDNAへハイブリダイズするように指令することができる。本明細書
で使用する「核酸プローブ」は、相補的配列へハイブリダイズするDNAプローブ若しく
はRNAプローブであってよい。当業者であれば、配列特異的ハイブリダイゼーションが
発生するようなプローブを設計する方法を知っているであろう。当業者であれば、さらに
特異的RNAを生成するために転写された遺伝子のための遺伝子発現の量の尺度として配
列特異的ハイブリダイゼーションの量を定量する方法をさらに知っているであろう。
ハイブリダイゼーションサンプルは、特異的遺伝子発現産物への核酸プローブの特異的
ハイブリダイゼーションを可能にするために十分な条件下で維持される。本明細書で使用
する「特異的ハイブリダイゼーション」は、ほぼ正確なハイブリダイゼーション(例、た
とえミスマッチが存在したとしても、ごく少数である)を示す。特異的ハイブリダイゼー
ションは、高ストリンジェンシー条件下又は中ストリンジェンシー条件下で実施できる。
1つの実施形態では、特異的ハイブリダイゼーションのためのハイブリダイゼーション条
件は高ストリンジェンシーである。例えば、特定の高ストリンジェンシー条件は、低相補
的核酸から完全相補的核酸を識別するために使用できる。核酸ハイブリダイゼーションの
ための「高ストリンジェンシー条件」、「中ストリンジェンシー条件」及び「低ストリン
ジェンシー条件」は、Current Protocols in Molecular Biologyの第2.10.1〜2.
10.16及び第6.3.1〜6.3.6頁(Ausubel, F. et al., “Current Protocol
s in Molecular Biology”, John Wiley & Sons, (1998)(それらの全教示は参照して本
明細書に組み込まれる))に説明されている。ハイブリダイゼーションのストリンジェン
シーを決定する正確な条件は、イオン強度(例、0.2×SSC、0.1×SSC)、温
度(例、室温、42℃、68℃)及び不安定化剤(例えばホルムアミド又は変性剤(例え
ばSDS))の濃度だけではなく、核酸配列の長さ、塩基組成、ハイブリダイジング配列
間のミスマッチ率及び他の非同一配列内のその配列のサブセットの発生頻度にも依存する
。そこで、同等条件は、2つの核酸分子間の同一性若しくは類似性の類似度を維持しなが
ら、これらのパラメータの1つ又はそれ以上を変化させることによって決定できる。典型
的には、条件は、相互に対して少なくとも約60%、少なくとも約70%、少なくとも約
80%、少なくとも約90%又は少なくとも95%以上同一である配列がもう一方にハイ
ブリダイズしたままであるように使用される。ハイブリダイゼーション条件をハイブリダ
イゼーションが発生しないストリンジェンシーレベルからハイブリダイゼーションが最初
に観察されるレベルへ変化させることによって、サンプル中の最も相補的な配列を備えて
(例、選択的に)所与の配列をハイブリダイズさせる条件を決定できる。
中ストリンジェンシー若しくは低ストリンジェンシーの条件についての洗浄条件の決定
を記載する代表的条件は、Kraus, M. and Aaronson, S., 1991. Methods Enzymol., 200:
546-556及びAusubel et al., Current Protocols in Molecular Biology, John Wiley &
Sons, (1998)に記載されている。洗浄は、通常はハイブリッドの相補性の最小レベルを決
定できるように条件が設定されている工程である。一般に、相同性ハイブリダイゼーショ
ンだけが発生する最低温度から開始して、(SSC濃度定数を保持しながら)最終洗浄温
度が減少させられる各℃は、ハイブリダイズする配列間の最高ミスマッチ率を1%増加さ
せる。一般に、SSCの濃度を2倍にすると、Tにおいて約17℃の増加が生じる。こ
れらのガイドラインを用いると、洗浄温度は、求められるミスマッチのレベルに依存して
、高ストリンジェンシー、中ストリンジェンシー若しくは低ストリンジェンシーに対して
経験的に決定できる。例えば、低ストリンジェンシー洗浄は、0.2×SSC/0.1%
SDSを含有する溶液中で10分間に渡り室温での洗浄を含むことができる;中ストリ
ンジェンシー洗浄は、0.2×SSC/0.1% SDSを含有する予備加温(42℃)
した溶液中で42℃で15分間に渡る洗浄を含むことができる;及び高ストリンジェンシ
ー洗浄は、0.1×SSC/0.1% SDSを含有する予備加温(68℃)した溶液中
で68℃で15分間に渡る洗浄を含むことができる。さらに、洗浄は、当分野において公
知であるように所望の結果を入手するために反復して、又は連続的に実施できる。同等条
件は、当分野において公知であるように、標的核酸分子と使用されるプライマー若しくは
プローブ(例、ハイブリダイズされる配列)との間の相補性の類似度を維持しながら、1
例として示したパラメータの1つ又はそれ以上を変化させることによって決定できる。
本発明の関連する態様は、核酸アレイであって、そのアレイが複数の、
(i)上述した位置マーカー遺伝子のいずれか1つに対応するヌクレオチド配列若しくは
それと少なくとも80%の同一性を示す配列を含む核酸分子又は前記核酸分子の官能的な
誘導体、フラグメント、変異体若しくはホモログ;又は
(ii)42℃の低ストリンジェンシー条件下で(i)の配列のいずれか1つ又はそれ以
上にハイブリダイズすることのできるヌクレオチド配列を含む核酸分子、又は前記核酸分
子の官能的な誘導体、フラグメント、変異体若しくはホモログ;
(iii)42℃の低ストリンジェンシー条件下で(i)の配列のいずれか1つ又はそれ
以上にハイブリダイズすることのできるヌクレオチド配列を含む核酸プローブ若しくはオ
リゴヌクレオチド、又は前記核酸分子の官能的な誘導体、フラグメント、変異体若しくは
ホモログ;
(iv)(i)若しくは(ii)の核酸分子によってコードされたタンパク質、又はそれ
らの誘導体、フラグメント、若しくはホモログを含み、
前記核酸の発現のレベルは、大腸に由来する細胞若しくは細胞亜集団の近位−遠位起源
を示す核酸アレイを提供する。
本明細書において42℃での低ストリンジェンシーとの言及は、ハイブリダイゼーショ
ンのための少なくとも約1%(v/v)〜少なくとも約15%(v/v)のホルムアミド
及び少なくとも約1M〜少なくとも約2Mの塩、及び洗浄条件のための少なくとも約1M
〜少なくとも約2Mの塩を含み、そしてこれらを包含している。必要な場合にはまた別の
ストリンジェンシー条件、例えばハイブリダイゼーションのための少なくとも約16%(
v/v)〜少なくとも約30%(v/v)のホルムアミド及び少なくとも約0.5M〜少
なくとも約0.9Mの塩、並びに洗浄条件のための少なくとも約0.5M〜少なくとも約
0.9Mの塩を含み、これらを包含する中ストリンジェンシー、又はハイブリダイゼーシ
ョンのための少なくとも約31%(v/v)〜少なくとも約50%(v/v)のホルムア
ミド及び少なくとも約0.01M〜少なくとも約0.15Mの塩、並びに洗浄条件のため
の少なくとも約0.01M〜少なくとも約0.15M塩を含み包含する高ストリンジェン
シーを適用してもよい。一般に、洗浄はT=69.3+0.41(G+C)%[19]
=−12°Cで実施される。しかし、二本鎖DNAのTは、ミスマッチ塩基対の数にお
ける1%の増加に伴って1℃ずつ低下する(Bonner et al (1973) J. Mol. Biol. 81:123
)。
1ライブラリ若しくは1アレイの核酸若しくはタンパク質マーカーは、豊富かつ高度に
貴重な情報を提供する。さらに、そのような配列の2つ又はそれ以上のアレイ若しくはプ
ロファイル(アレイの使用から得られた情報)は、1セットの試験結果と基準、例えばま
た別のサンプル若しくは保存されたキャリブレータと比較するための有用なツールである
。アレイを使用する際には、個々の核酸メンバーは、典型的には離れた位置へ固定化され
、結合反応のために反応させられる。集合したマーカーセットと関連付けられたプライマ
ーは、配列ライブラリを調製する、又は他の生物学的サンプルからのマーカーを直接的に
検出するいずれかのために有用である。
1ライブラリ(若しくは、ライブラリ内の少なくとも一部の配列に対応する物理的に分
離した核酸について言及する場合は、アレイ)の遺伝子マーカーは、高度に望ましい特性
を示す。これらの特性は、特異的条件と結び付き、調節プロファイルとして特徴付けるこ
とができる。本明細書で言及するプロファイルは、それをマーカーが起源とする組織の診
断情報を提供する1セットのメンバーを意味する。多くの例におけるプロファイルは、預
託された配列から作製されたアレイ上の一連のスポットを含んでいる。
特徴的な患者プロファイルは、一般にアレイの使用によって調製される。アレイプロフ
ァイルは、1つ又はそれ以上の他のアレイプロファイル若しくは他の参照プロファイルと
比較することができる。比較結果は、疾患状態、発達状態、治療に対する受容性に関する
豊富な情報及び患者についてのその他の情報を提供できる。
本発明のまた別の態様は、生物学的サンプルをアッセイするための診断用キットであっ
て、1つ又はそれ以上の近位−遠位マーカーを検出するための作用物質及び第1区画内に
おけるその作用物質による検出を促進するために有用な試薬を含むキットを提供する。例
えば、生物学的サンプルを受領するためのまた別の手段も含めることができる。作用物質
は、任意の適切な検出分子であってよい。
以下では、本発明を非限定的実施例によってさらに記載する。
正常な大腸内での示差的転写産物発現のマップ
材料及び方法
遺伝子発現データ
非腫瘍性大腸に沿ってヒト遺伝子発現の変化を探索するために、本発明者らは、(Lips
hutz et al., 1999, Nat Genet 21:20-24)に記載されているAffymetrix社(
米国カリフォルニア州サンタクララ)製GeneChip(登録商標)オリゴヌクレオチ
ドマイクロアレイシステムを使用して収集された遺伝子発現データを使用した。これらの
データは、2つの独立したAffymetrix社(米国カリフォルニア州サンタクララ
)製ヒトゲノム133 GeneChipデータセット:「ディスカバリ(discov
ery)」のためのHGU−133 A&Bチップデータの大規模商業的マイクロアレイ
データベース、及び本発明者らが「バリデーション(validation)」のために
作製した小規模のHGU−133 Plus 2.0マイクロアレイデータセットである
大規模データセットは、遺伝子発現パターンを同定するために分析し、独立して引き出
した第2発現セットを使用してこれらのパターンをバリデート(確認)した。そこで、第
1データセットは仮説を作成するために検索し、第2セットは仮説を試験するために使用
した。
本試験のためのデータは、結腸直腸組織標本から単離したポリ−A mRNA転写産物
から合成した標識cRNAへハイブリダイズさせたオリゴヌクレオチドマイクロアレイで
ある。本発明者らが使用するAffymetrixプラットフォームは、プローブセット
と呼ばれる1パネルの11完全マッチ25bpオリゴヌクレオチドプローブ(及び11ミ
スマッチプローブ)を用いて標的mRNA転写産物を定量するために設計されている。プ
ローブセット結合強度の生物学的関連性を決定するために、本発明者らは、入手可能な最
も新しいAffymetrixメタファイル及びBioConductorライブラリを
用いて、生じたプローブセットのリストに注釈を付けた。本発明者らは、任意の所与の標
的「遺伝子」に対して理論的に反応性であるマイクロアレイプラットフォーム上には多数
のプローブセットが存在することに注目している。本発明者らの関心の焦点は大腸に沿っ
て転写産物発現動力学を探索することであり、基礎にあるゲノム機構を解明することでは
ないので、この現象を詳細には探索しない。
それでも、この基本的な注釈の詳細は、これらのデータの生物学的関連性を解釈する場
合には考慮に入れなければならず、本発明者らは読者(及びこれらの技術を使用する他の
研究者)には用語「遺伝子」及び「プローブセット」を互換的に使用する危険性に警戒を
払うように注意を促しておく。
「ディスカバリ」用データセット
184片の結腸直腸組織標本についての遺伝子発現及び臨床的記述は、GeneLog
ic社(米国メリーランド州ゲーサーズバーグ)から購入した。
以下の特性を備える個々の組織マイクロアレイデータを選択した。盲腸、上行結腸、下
行結腸、S状結腸、若しくは直腸の1つと指定される解剖学的に同定可能な切除部位を備
える他の点では健常な(即ち、標本部位で炎症若しくは他の疾患の証拠が見られない)組
織標本由来の非腫瘍性結腸直腸粘膜(組織学検査によって確証した)。
GeneLogicデータベースから選択した各組織について、本発明者らは、計44
,928個のプローブセット(HGU133A及びHGU133Bを合わせて)、各組織
についての実験及び臨床的記述子、並びに組織学的標本のデジタル保存された顕微鏡写真
を含有する生データの電子ファイルを受領した。各データの記録は、臨床的一貫性のため
に手作業により評価し、記録のサンプルは、デジタル保管された組織学検査画像を用いる
組織病理学的検査のために無作為に選択した。品質管理分析は、製造業者によって規定さ
れた必須の品質管理尺度を満たしていないアレイを同定かつ除去するために実施した(Af
fymetrix, 2001、Wilson and Miller, 2005, Bioinformatics)。
遺伝子発現レベルは、Microarray Suite(MAS) 5.0(Aff
ymetrix社)及びRobust Multichip Average(RMA)
標準化技術の両方によって計算した。(Affymetrix, 2001、Hubbell et al., 2002, Bioi
nformatics 18:1585-1592、Irizarry et al., 2003, Nucleic Acids Res 31:e15]。MA
S標準化データは、標準品質管理ルーチンを実施するために使用し、その後の全分析につ
いて最終データセットはRMAを用いて標準化した。
「バリデーション」用データセット
「バリデーション」用セット内の結腸直腸標本は、大都市であるアデレードにある第3
紹介病院組織銀行(tertiary referral hospital tissue bank)(Repatriation General
Hospital and Flinders Medical Centre)から収集した。組織銀行及び本プロジェクト
は、Repatriation General Hospitalの研究倫理審査委員
会による承認を受け、試験対象の各組織については患者からの同意を受領した。外科的切
除に続いて、標本は無菌容器内に配置され、手術室から収集された。手術による切除から
手術室からの収集までの時間は、様々であったが30分間以内であった。サンプルは、サ
イズがおよそ125mm(5×5×5mm)であり、結腸領域並びに病変に近位若しく
は遠位のいずれかの距離の両方で規定された、可能な限り病変から離れた場所で肉眼的に
は正常な組織が採取された。組織はクリオバイアル(cryovial)中に配置され、その後直
ちに液体窒素中に浸漬させられ、処理時まで−150℃で保存された。
本発明者らは、標準プロトコール及び市販で入手できるキットを使用して冷凍サンプル
を処理した。手短には、冷凍組織は、RNase活性を中和するために冷却したProm
ega SV RNA溶解バッファー(Promega社、オーストラリア国シドニー)
の存在下でカーバイドビーズミル(Mixer Mill MM 300、Qiagen
社、オーストラリア国メルボルン)を使用してホモジナイズした。各組織についてのホモ
ジナイズした組織溶解物は、便宜的容量に等分し、−80℃で保存した。全RNAは、P
romega SV Total RNAシステムを製造業者の取扱説明書に従って使用
して組織溶解物から抽出し、完全性はゲルエレクトロフォレーシスによって視覚的に評価
した。
mRNA転写産物の相対発現を測定するために、組織RNAサンプルはAffymetrix HG
U133 Plus 2.0 GeneChips
(Affymetrix社、米国カリフォルニア州サンタクララ)を製造業者のプロトコ
ル(Affymetrix, 2004)に従って使用して分析した。ビオチン標識cRNAは、「One
−Cycle cDNA」キット(T7−oligo(dT)プライマーを組み込んでい
る)及びGeneChip IVT標識キットとともに5μg(1.0μg/μL)の全
RNA(約1μgのmRNA)を用いて調製した。インビトロ転写cRNAは、フラグメ
ント化し(20μg)、品質管理のためにハイブリダイゼーションの前に分光法及びゲル
エレクトロフォレーシスによって分析した。最後に、ハイブリダイゼーションカクテルは
、15μgのcRNA(0.5μg/μL)を用いて調製し、Affymetrixハイ
ブリダイゼーションチャンバ640内で16時間にわたり45℃でHG U133 Pl
us 2.0マイクロアレイへハイブリダイズさせた。各cRNAサンプルには、品質モ
ニタリングのために標準真核生物ハイブリダイゼーションコントロールを用いてスパイク
した。
ハイブリダイズしたマイクロアレイは、ストレプトアビジンフィコエリトリンを用いて
染色し、Affymetrix Fluidics Station 450を使用して
ビオチン化抗ストレプトアビジン抗体を含有する溶液を用いて洗浄した。最後に、染色か
つ洗浄したマイクロアレイをAffymetrixスキャナ3000によってスキャンし
た。
マイクロアレイ画像生ファイルをデジタル化フォーマットへ変換させるためには、Af
fymetrixソフトウエアパッケージを使用した。上述したディスカバリ用セットと
同様に、バリデーション用データセットのための遺伝子発現レベルは、品質管理目的には
MAS 5.0(Affymetrix社)を、そして発現データについてはRMA標準
化法を用いて作成した。
統計学的分析
図10に示したように、検出システムは、サポートベクターマシン(SVM)モジュー
ル1002、プロファイルアナライザ1004、主成分アナライザ1006、及び分類器
モジュール1007を含む検出モジュール1002〜1007を含んでいる。本検出シス
テムは、大腸の近位−遠位軸に沿って、その腸由来の細胞、若しくは細胞集団の起源を表
す位置データを生成する検出方法を実行する。位置データは、その細胞若しくは細胞集団
内の遺伝子の発現を表す遺伝子発現データを処理する工程によって生成される。上述した
実施形態では、検出システムは、標準的なコンピュータシステム、例えばIntel I
A−32をベースとするコンピュータシステムであり、そして検出モジュール1002〜
1007は、そのコンピュータシステムと結び付けられた非揮発性(例、ハードディスク
)記憶装置1020上に保存されたソフトウエアモジュールとして実行される。しかし、
本明細書に記載した検出モジュール1002〜1007若しくは検出方法の少なくとも一
部は、或いは1つ又はそれ以上の専用ハードウエア成分、例えば特定用途向け集積回路(
ASIC)として実行できることは明白であろう。
本明細書に記載した実施形態では、本検出システムはさらに、C++ライブラリを含む
C++言語サポートを提供するためのC++モジュール1008、及び(Venables and R
ipley, 2002)に記載されてhttp://cran.r−project.orgでの
CRANオープンソース保管場所から入手できるR統計プログラミング言語及びMASS
ライブラリのためのサポートを提供するRモジュール1012もまた含んでいる。本シス
テムはさらに、http://www.r−project.orgで記載されているよ
うに、プロファイルアナライザ1004及び主成分アナライザ1006と一緒に、Rプロ
グラミング言語において実行されるhttp://www.bioconductor.
orgから入手できるBioConductorソフトウエアアプリケーション1010
も含んでいる。SVM 1002は、C++プログラミング言語で実行される。分類器モ
ジュール1007は、http://www.bioinformatics.csir
o.au/products.shtml及びその中で提供された参考文献に記載された
ように、GeneRaveアプリケーションである。本システムはさらに、Microa
rray Suite(MAS) 5.01014、及びRobust Multich
ip Average(RMA)標準化アプリケーション1016もまた含んでいるが、
どちらもAffymetrix社から入手でき、http://www.affymet
rix.comに記載されている。ソフトウエアアプリケーションは、標準オペレーティ
ングシステム1018、例えばLinux若しくはMac0S 10.4の制御下で実行
され、本コンピュータシステムは、少なくとも1基のプロセッサ1022、ランダムアク
セスメモリ1024、キーボード1026、標準ポインティングデバイス、例えばマウス
1028、及びディスプレイ1030を含む標準コンピュータハードウエア成分を含んで
いるが、それらは全部、図示したようにシステムバス1032を介して相互接続されてい
る。
本検出方法は、図11の一般形に記載の分類方法を含んでいる。最初に工程1102で
は、本システムは公知の近位−遠位起源の細胞内での遺伝子の発現を表す発現データを受
信する、さもなければ発現データを入手する。工程1104では、多変量若しくはその他
の分類法若しくは決定法の形態が、以下で説明するように、分類データを生成するために
発現データに適用される。典型的には、発現データは、単独若しくは組み合わせて、既に
大腸の近位−遠位軸に沿って示差的に発現することが公知である遺伝子の発現を表す。し
かし、本方法は、以下で説明するように、そのような遺伝子及び/又は遺伝子の組み合わ
せを同定するためにも使用できる。工程1106では、分類データは、大腸に沿ってその
細胞の近位−遠位起源を予測するために、未知の起源の細胞内での同一遺伝子の発現を表
すまた別の発現データに適用される。
さらに、当業者には、最初に生成された分類データによって表される結果として生じた
分類子(classifier)若しくは識別機能は、分類の結果及びそれらの有用性を向上させる
ために決定の理論的原理に基づいて調整できることは明白であろう。例えば、結果の見込
みにおいて以前の意見を組み込むことができる、及び/又は様々な誤分類のケースのコス
トに基づいて決定表面(decision surface)を修飾することができる。決定理論、損失関
数を最小限に抑える、及び誤分類のコストについてのこれらの方法およびその他の関連の
方法は、(Krzanowski and Marriott, 1995)に記載されている。
全ての統計学的分析のためには、本発明者らは、R統計学環境のためにBioCond
uctor社から入手できるオープンソースソフトウエアを使用した(Rは、S統計学分
析環境のオープンソース実行である)(Bioconductor社、www.bioconductor.org)(Gaut
ier et al., 2004, Bioinformatics 20:307-315、Gentleman et al., 2004, Genome Biol
5:R80)。
遺伝子発現レベルの線形及び非線形組み合わせを生成かつ処理するために使用される、
線形回帰、多重線形回帰、線形判別分析、ロジスティック回帰、一般化線形モデル、及び
主成分分析を含む線形方法は、全部が例えば(Hastie, 2001)に記載されている。これら
の方法はRで実行される。
遺伝子発現勾配は、3種の分析技術を用いて分析した。第1に、本発明者らは、通常の
単変量法で大腸に沿って個別遺伝子の遺伝子発現変化を比較した。次に、本発明者らは、
二分性(近位 対 遠位)発現変化を段階的(マルチセグメント)変化モデルと比較する
ために線形モデルを用いて発現の統計的有意差を示している特定遺伝子を詳細に探索した
。最後に、本発明者らは、近位−遠位軸に沿った繊細なゲノム全般に及ぶ発現変動を理解
するために多変量法を適用した。そのようなゲノム全般に及ぶ発現変動は、ニアレストネ
イバー(nearest−neighbour)法を含む、(Ripley, 1996)に記載され
たノンパラメトリック法を用いてデータを得た(interrogate)。
個別遺伝子発現マップ
単変量示差的発現
近位及び遠位の大腸間で示差的に発現した遺伝子転写産物は、Rについての「limm
a」Bioconductorライブラリ(Smyth, 2005)において実行された中等度の
t検定を用いて同定した。有意性推定値(p値)は、多重仮説試験(MHT)について調
整するために保守的ボンフェローニ(conservative Bonferroni)補正を用いて補正した
。盲腸 対 直腸に限定した組織のサブセットを同様に試験した。
示差的に発現したと同定された遺伝子転写産物についても、修飾t検定を用いてプロー
ブセット毎に「バリデーション」用標本において評価した。バリデーション用データにお
いて同様に示差的であった示差的プローブセットの総数の有意性を評価するために、「バ
リデーションされた」プローブセットの数はモンテカルロ・シミュレーションを用いて推
定したヌル分布と比較した。
マルチセグメント大腸モデル対2セグメント大腸モデルの比較
セグメント間の遺伝子発現変動の性質を評価するために、本発明者らは、マルチセグメ
ント 対 2セグメントフレームワーク内で線形モデルへの相対適合性について示差的に
発現したプローブセットを分析した。この分析の目的は、大腸の末端間で示差的に発現す
ることが公知であるプローブセットのセグメント間発現が、継続的段階化に近似する5セ
グメント線形モデルによって、又はより単純な二分の「近位」対「遠位」勾配のいずれに
よってより良好にモデリングされるのかを探索することである。本発明者らのデータは、
結腸直腸セグメントの指定によってのみ同定され、大腸の全長に沿った連続的測定によっ
て同定されるものではないので、本発明者らは、組織セグメントの位置を用いて連続モデ
ルに近似させる。本発明者らは、大腸の近位−遠位軸に沿って変動する転写産物を同定す
る可能性を最大化するために、最も末端のセグメント(盲腸及び直腸)間で示差的に発現
しているプローブセットを選択する。
本発明者らは、各組織について結腸直腸セグメントによって規定した指標マトリックス
に従って5因子ロバスト線形モデルを使用して、最初に大腸の近位−遠位軸に沿ったこれ
らのプローブセットの発現をモデリングした。このモデルについて、各組織は、生検位置
によって、盲腸、上行結腸、下行結腸、S状結腸、又は直腸の1つへ指定した(以下に記
載する理由から、横行組織はこの分析には含めなかった)。この5セグメントモデルを次
に、大腸の理論的な近位及び遠位の領域に対応する設計マトリックスを備える2因子ロバ
スト線形モデルと比較した。両方のモデル比較には同一データを使用したが、2セグメン
トモデルについては、第1因子(近位組織に対応する)は盲腸及び上行結腸由来の組織全
部を含んでいたが、第2因子(遠位大腸に対応する)は、下行結腸、S状結腸及び直腸セ
グメント由来の全組織を含んでいた。
これらの別個のモデルを各プローブセットについて比較する場合には、本発明者らは、
より複雑な5セグメントモデルによって提供される改良された当てはめ(減少した回帰残
留)は単純な2セグメントモデルより有意に優れているという仮説Haを評価するために
F検定を使用した。非有意な残留減少は、ヌル仮説を拒絶しないことを示す。
H0:単純な代替モデルに比してより複雑な5セグメントモデルを採用することに固有
の価値はない。
多変量遺伝子発現パターンのマッピング
結果
遺伝子発現データの収集
ディスカバリ用及びバリデーション用データセット
ディスカバリ用データセットは、GeneLogic社から購入したAffymetr
ix HG U133A/B GeneChipマイクロアレイへのcRNAのハイブリ
ダイゼーションからのデータを用いて生成した。
HG U133A/B GeneChipについての包含基準及び品質保証基準を満た
している184片の正常組織由来のデータを分析し、仮説作成のために使用した。組織は
、以下のセグメントサブセット(29片の盲腸、45片の上行結腸、13片の下行結腸、
54片のS状結腸、及び43片の直腸)を含んでいた。各組織について、44,928個
のプローブセットについてバックグラウンドを補正し、RMA前処理を用いて標準化した
「バリデーション」用データセットを構築するために、8片の近位組織標本及び11片
の遠位標本から調製した標識cRNAへ19HG U133 Plus2.0 Gene
Chipをハイブリダイズさせた。組織及びGeneChip容認性についてのストリン
ジェントな品質管理パラメータのために、このバリデーション用データセットは、マルチ
セグメントモデルを探索するために十分な組織を含んでいなかった。各マイクロアレイは
、54,675個のプローブセットについて転写産物の発現を測定した。
近位及び遠位の大腸間の理論的接合点は、肝湾曲部から測定して横行結腸の全長のおよ
そ3分の2である。(Yamada and Alpers, 2003、上記)。サンプルデータは、横行結腸
に沿った間隔に対して特異的ではなかったので、これらの組織はディスカバリ分析からは
除外した。
大腸に沿った遺伝子の変動
個別遺伝子の発現変化
単変量示差的発現
大腸の解剖学的セグメント間の「天然」分割点を探索するために、本発明者らは、仮説
的「分割線」を盲腸から直腸へ段階的に移動させた場合のプローブセット発現変化の絶対
数を測定した。図1は、全連続的セグメント間の組み合わせについて示差的に発現したプ
ローブセットの数を示している。統計的有意ではないが、プローブセット差の最高数20
6は、近位及び遠位の領域が上行結腸及び下行結腸セグメント間で分割された場合に発生
する。この分割点は胚発生並びに近位及び遠位セグメントの通例の分離の両方に関する本
発明者らの理解と一致しているので、本発明者らの研究は、近位及び遠位の組織はこの様
式で分離されていると仮定した。
およそ154個の公知の遺伝子標的に対応する計206個のプローブセットは、対応す
る領域に比較して近位若しくは遠位の結腸直腸サンプル中でより高度に示差的に発現した
(ボンフェローニ補正、p<0.05)。これらの206個のプローブセット中、31個
(16.5%)はさらに有意差を伴ってバリデーション用データにおいても示差的に発現
した(31/206、モンテカルロ推定による、p<<0.05)。
計115個のプローブセットは、盲腸(n=29)及び直腸(n=43)からのみ選択
した組織間で示差的に発現した。これらのプローブセット中102個(89%)は上述し
た近位及び遠位の大腸間で異なる206個のプローブセット中に含まれているが、基本的
には、大腸の最末端間で相違する遺伝子発現転写産物を単離するためには、盲腸対直腸の
遺伝子発現が有用である。このサブセットでは、28個(24.3%)のプローブセット
がバリデーション用データにおいても直腸 対 盲腸で同様に示差的に発現した(28/
115、モンテカルロ推定による、p<<10−5)。
示差的に発現したプローブセット並びに近位及び遠位組織において上昇した発現を伴う
プローブセットについての差分統計量は、各々表1及び2に示されている。図2は、各々
近位(n=94)又は遠位(n=126)腸(若しくは盲腸及び直腸)において有意に高
く発現したプローブセットの数を比較している。
マルチセグメント遺伝子発現モデル
示差的発現についての分析もまた、盲腸から直腸へ順に全5つのセグメント間移動につ
いて実施した(即ち、盲腸 対 上行結腸、上行結腸 対 横行結腸など)。興味深いこ
とに、任意の2つの隣接セグメント間で有意な程度に示差的に発現した転写産物は見られ
なかった(中等度t検定;p<0.05)。
これらの遺伝子転写産物の発現変化の正確な性質を探索するために、本発明者らは、各
組織サンプルについての位置に基づいて発現データに当てはめたロバスト線形モデルを構
築かつ比較した。単変量プローブセット発現の2つのロバスト線形モデルを、大腸の2つ
の末端セグメントである盲腸及び直腸間で示差的に発現した115個のプローブセット各
々について比較した。詳細には、本発明者らは、これらの末端セグメント間で示差的に発
現した転写産物の発現が単純な2セグメントモデルによって、又はより記述的な5セグメ
ントモデルによってより良好に説明(残留当てはめに関して)されるかどうかをクエリー
した。
示差的に発現した115個のプローブセット中、本分析は複雑なモデルが65例(57
%)のケースについて観察された遺伝子発現データへ当てはめたモデルを有意に改善しな
いというヌル仮説を拒絶しなかった(F検定、p>0.05)。そこで、大腸に沿ってこ
れらの示差的に発現した転写産物の半分超は2セグメント発現モデルによってモデリング
することに成功したので、これにより発現は二分性であり、近位 対 遠位いずれかの位
置によって規定される。盲腸及び直腸間で最も示差的に発現したプローブセットは、PR
ACに対する転写産物である。この転写産物についての2セグメントモデル及びマルチセ
グメントモデルの比較は、図3に示されている。
残りの50個(43%)のプローブセットについては、ヌル仮説は拒絶され(p<0.
05)たが、これはセグメント位置に依存する5因子モデルが実際に有意な方法で、近位
−遠位軸に沿ってそのような転写産物の発現の予測有効性を向上させることを示唆してい
る。これらのモデルについての検討は、大多数のモデルが、大腸に沿って進行する組織中
で単調に増加するか、又は単調に減少することを確証している。
興味深いことに、50個のマルチセグメントモデル中41個(82%)は大腸を横断し
て段階的増加を示すが、近位から遠位発現へ段階的減少を示すのは9個(18%)のモデ
ルに過ぎないことである(図4に示した)。両方の有機溶質トランスポーターについての
モデルであるα(OSTalpha)及びホメオボックス遺伝子B13(HOXB13)
は、図5に例示したように、5セグメントモデルを用いると有意に向上する。
大腸に沿った遺伝子発現パターン
大腸に沿った個別遺伝子変化の分析に加えて、本発明者らは、多変量分析法を使用して
、近位−遠位軸に沿った遺伝子変化のパターンを探索した。
監視主成分分析(Supervised Principal Components Analysis)
器官レベルでの発現変動性の構造を可視化かつ探索するために、本検出システムの主成
分アナライザ(PCA)1006を用いて主成分分析(PCA)及び監視PCAとして公
知であるPCAの変形を遺伝子発現データへ適用した。PCAは、(Venables and Riple
y, 2002)に記載され、Rで実行した。監視PCAについての詳細な記述は、(Bair et a
l., 2004)に見いだすことができる。
最初に、「ディスカバリ用」データセットの全44,928個のプローブセットの遺伝
子発現を表す発現データを、主成分分析(PCA)を使用してPCAモジュール1006
によって処理した。PCAは、次元数を減少させるためにデータセットの次元の線形変換
を生じさせることによって多次元データセットを単純化するための標準方法である。変換
されたデータは、「主成分」の分類されたセットを表す主成分データとして提供されるの
で、第1主成分は最大分散を有し、第2主成分は2番目に大きい分散を有するなどである
。完全データセットへPCAを適用した結果は、第1主成分がx軸にプロットされ、第2
主成分がy軸にプロットされているグラフである図6Aに示した多変量若しくは主成分デ
ータを含んでいる。この低次元見込み収益(perspective yield)についての検査は、組
織セグメントと一致するデータ内で明白な構造を生じさせないが、これは全遺伝子に渡っ
て測定された遺伝子発現変動の主要起源が組織の位置とは独立していることを示唆してい
る。
全遺伝子のサブセットを使用して組織位置を示す1つ又はそれ以上の主成分を生成でき
るかどうかを調査するために、発現データを監視PCAによって分析した。(Bair et al
., 2004)に記載されたように、監視PCAは標準主成分分析に類似するが、主成分を生
成するためには1サブセットの特徴/遺伝子(通常は、一部の単変量手段によって選択さ
れる)しか使用しない。この場合には、盲腸と直腸(即ち、大腸の両末端(extreme ends)
)間で示差的に発現した遺伝子のセットをPCA分析のために選択した。しかし、他の形
態の特徴選択もまた代わりに使用できよう。詳細には、大腸の全セグメント由来の全18
4の正常組織を別にして、減少したデータマトリックスは盲腸及び直腸から採取した組織
サンプル間で示差的に発現する115個のプローブセットだけを含めることによって生成
した。標準PCAは、次にこの特徴特異的データに関して実施した。図6Bに示したよう
に、最初の2つの主成分のグラフは、近位 対 遠位の分割線にほぼ対応する184片の組
織サンプル内での2つの大きな亜集団の存在を示唆している。この細胞起源への依存性は
、図7Bに図示したように、第1主成分を大腸に沿った細胞起源の関数としてグラフ表示
するとより明白に視認される。図7Bに示した記号は、四分位範囲(即ち、データの半分
)を表し、「エラーバー」は、1.5×四分位範囲を示している。これらの限度外のデー
タは、外れ値と見なされ、個別にプロットされている。おそらくS状結腸と直腸との間に
は弱い分離が示唆されているようであるが、盲腸及び上行結腸の前方組織は強度に重複し
、分離は不良である。
主成分データを使用するとこれらの細胞由来の遺伝子の発現に基づいて細胞の起源を予
測することができたが、以下で説明するように、この作業のためには他の分析方法が好ま
しい。
プロファイル分析(正準変量分析)
腸に沿った発現パターンもまた、セグメント間 対 セグメント内の発現変動を可視化
するためにProfile Analysisを用いてプロファイルアナライザ1004
によって分析した。(Kiiveri, 1992)に記載されたように、プロファイル分析は変量の
数が観察結果の数を超えるケースに適合する標準正準変量分析の変法である。この方法は
相当に少数の独立因子を用いて因子分析モデル(Kiiveri, 1992)によってp×pクラス
内共分散マトリックス(p x p within-class covariance matrix)Sをモデリングする
。正準変量の各々における各項(即ち、遺伝子)の有意性を決定するためには、順列試験
を使用する。有意な項だけを含めることによって、プロファイル分析は、特徴選択能力を
提供する。
この方法は、クラス変動構造を特性付けるための探索用ツールとして一般に有用である
。正準変量分析は、(Venables and Ripley, 2002)に記載されたように、R MASS
ライブラリ内で実行される。プロファイル分析は、(Kiiveri, 1992)に記載されたよう
に、Rにおける著作権を有するライブラリ(proprietary library)内で実行される。
組織についてのセグメント標識に関する推測的知識を前提にして、プロファイル分析は
クラス内(即ち、各セグメントを用いて)変動を最小限に抑えながら大腸の5つのセグメ
ント各々の最大のクラス間分離を提供する限定された遺伝子転写産物サブスペースを同定
することを試みる。完全データセットのプロファイル分析の結果は、第1正準変量がx軸
に沿ってプロットされ、第2正準変量がy軸に沿ってプロットされているグラフとして図
8Aに示した正準変量データを含んでいる。組織セグメントが第1正準変量と相関するこ
とは明白であるが、第2及びそれ以降の正準変量はクラス分離情報をほとんど、又は全く
提供しない。この結果は、結腸直腸セグメント各々を分離することに同一プローブセット
が含まれること、即ち組織セグメントの観点からの差の最大の原因は第1正準変量次元を
生成するために使用されるセグメントであり、従って全セグメントがこの同一特徴セット
のプローブセットによって最高に分類されることを示唆している。図8Bに示したように
、第1正準変量が使用される場合でさえ、いずれのセグメントも完全には分離されないが
、セグメントの自然な順序付けは明らかに保存されている。上述したPCAを用いた場合
と同様に、正準変量データは、起源が未知である細胞の近位−遠位起源を分類するために
使用できようが、この目的には以下に記載する方法が好ましい。
サポートベクターマシン
上述した多変量方法は大腸に沿った遺伝子発現変動を調査するためには有用であるが、
ロバスト方法で組織の位置も予測する遺伝子を同定するために、そして低いクロスバリデ
ーション・エラー率で組織の位置を予測するために使用できる最小サブセットのプローブ
セット/遺伝子を同定するために監視機械学習(surpervised machine leaning)を使用
した。
記載した実施形態では、使用される特定形態の機械学習は、SVM(サポートベクター
マシン)モジュール1002によって提供されるサポートベクターマシン(SVM)であ
る;しかし、当業者には、その代りに他のカーネル法を使用できることは明白であろう。
(Scholkopf, 2004)に記載されたように、カーネル法は、このマッピングの本質的特徴
が単純なカーネルによって捕捉されると、それによって変量が別のスペースへマッピング
される線形方法の拡張法である。カーネル法は、カーネルスペース内では観察結果が線形
に分離可能であるがオリジナルのデータスペース内では分離可能でないケースにおいて特
に有益な可能性がある。
SVM 1002は、(Cristianini and Shawe-Taylor, 2000)に記載されたように、
標準SVM法を使用して、クラス決定分割線に沿って観察結果(即ち、組織)を最大限に
分離する特徴(遺伝子転写産物)の組み合わせを決定する。
詳細には、サポートベクターマシン(SVM)1002を使用して、その発現が盲腸及
び直腸を起源とする細胞の最高の分離を可能にする完全データセットから最小サブセット
のプローブセットを表す分類データを生成した。SVM 1002は、線形カーネルを用
いてトレーニングし、各反復で生成された分類データは10倍クロスバリデーションを用
いて評価した。転写産物の各サブセットからの最小寄与遺伝子転写産物(lowest contribu
ting gene transcript)は、高予測精度を備える最小セットの転写産物を同定するために
再帰的に排除した。
モデル内に含まれたプローブセットの数の関数としてのクロスバリデーションSVMエ
ラー率(それらは除外に成功したので)は、図9に示されている。完全(0%)クロスバ
リデーション・エラー率を生じさせる最小特徴セットは、表3に示した13個のプローブ
セットを含んでいる。
独立データセットにおけるこのモデルの有用性を測定するために、13特徴モデルにつ
いての分類データをバリデーション用データ内の近位 対 遠位の予測性能について試験し
た。これらの13個のプローブセットを用いて構築した伝統的な線形判別分析モデルを使
用して、8個の近位組織及び11個の遠位組織が100%の精度で予測された。
分類器モデル
SVM 1002の代替手段として、大腸に沿って起源が未知である細胞若しくは細胞
集団の起源を同定するために使用できる遺伝子の組み合わせを同定するために、大腸の近
位−遠位軸に沿って公知の位置から採取された組織サンプルから完全発現データを処理す
るために分類器1007もまた使用した。記載した実施形態では、http://www
.bioinformatics.csiro.au/overview.shtmlで
記載されたように、線形GeneRave分類器を使用した。GeneRaveは、変量
の数が観察結果の数を超えるケースにおいて好ましい。しかし当業者には、非線形分類器
及び正規化ロジスティック回帰に基づく分類器を含む、他の分類器を代わりに使用できる
ことは明白であろう。
(Kiiveri 2002)に記載されたように、GeneRave分類器1007は、位置が未
知であるサンプルの位置を正確に同定するために使用できるサブセットの遺伝子を同定す
るために発現レベルの線形組み合わせを表す分類データを生成する。GeneRave
1007は、ベイジアン(Bayesian)ネットワークモデルを使用して、他の遺伝
子の線形組み合わせにおいてそれから対応する組織サンプルが採取される位置との何ら相
関を有していない遺伝子を除外することによって遺伝子を選択する。
完全データセットのGeneRave分析の結果は、それらの発現レベルを使用すると
大腸の近位−遠位軸に沿って対応する細胞の起源を正確に同定することができる1セット
の7個の遺伝子に対応する分類データである。7個の遺伝子は、SEC6L1、PRAC
、SPINK5、SEC6L1、ANPEP、DEFA5、及びCLDN8である。
考察
大腸に沿った遺伝子示差的発現のマップ
単変量発現分析は、ヒト成人における正常近位大腸領域と正常遠位大腸領域との間で示
差的に発現する154個の固有の遺伝子標的に対応する206個のプローブセットを同定
した。1サブセットの115個のプローブセット(近位 対 遠位のリストに89%共通
)は、盲腸及び直腸の末端結腸直腸セグメント間で同様に示差的に発現する。興味深いこ
とに、本発明者らは、任意の2つの隣接セグメント間で有意に示差的に発現する転写産物
はないことを見いだした。
これらの所見の妥当性を推測するために、本発明者らは、独立セットのマイクロアレイ
データ内でこれらの遺伝子転写産物の発現変化についても測定した。本発明者らの最初の
184片の結腸直腸組織サンプルのディスカバリ用データセット内の206個の示差的に
発現したプローブセット中31個は、19片の標本についてのバリデーション用データに
おいてもまた示差的に発現した。
モンテカルロシミュレーションを用いて、本発明者らは、両方のデータセット内で示差
的であるそのような多数のプローブセットは極めて可能性が低いことを証明した。
これらの「バリデートされた」転写産物中ほぼすべて(28/31、90%)が同様に
盲腸及び直腸の2つの末端セグメント間で示差的に発現した。対応する遺伝子標的154
個中57個(37%)は、独立手段によって近位大腸と遠位大腸との間で示差的に発現す
ることが確証された。
個々の遺伝子についての転写産物の示差的発現
ディスカバリ用データ内で本発明者らが観察した最も有意に示差的なプローブセットは
、PRACについての遺伝子転写産物に対してであった。PRACは、近位組織に比較し
て遠位大腸内で高度に発現する。さらに、PRACは上行及び下行の結腸直腸組織標本間
で発生する急激な発現変化を伴って大腸に沿って低−高パターンで発現すると思われる。
本発明者らは、近位大腸と遠位大腸との間で示差的に発現する7個のHOX遺伝子に対
応する8個のプローブセットを見いだした。哺乳動物ホメオボックス遺伝子ファミリーの
39個のメンバーは、発生中の胚の前後軸に沿って身体セグメントの同一性を規定する高
度に保存された転写因子からなる(Hostikka and Capecchi, 1998, Mech Dev 70:133-145
、Kosaki et al., 2002, Teratology 65:50-62)。4群のHOX遺伝子パラログは前から
後への順序、例えばHOXA1からHOX13に発現する(Montgomery et al., 1999, G
astroenterology 116:702-731)。近位組織内では小さな番号のHOX遺伝子が高度に発
現するが(HOXD3、HOXD4、HOXB6、HOXC6及びHOXA9)、遠位大
腸内では大きな番号の遺伝子がより多く発現する(HOXB13及びHOXD13)こと
が見いだされている。
興味深いことに、本発明者らの所見では近位−遠位軸に沿って示差的に発現することが
以前に証明されている一部の遺伝子転写産物が明確に存在しなかった。本発明者らのデー
タは、脊椎動物の範囲を超えて腸パターン発達に含まれていることが証明されていた転写
因子である尾側ホメオボックス遺伝子であるCDX1若しくはCDX2について有意な発
現勾配を証明していない(Chalmers et al., 2000)(James et al., 1994)(Silberg e
t al., 2000)。詳細には、CDX2は成人大腸内での結腸表現型を維持することに役割
を果たすと考えられ、近年近位大腸では相当に高濃度で存在するが、遠位大腸内には存在
しないことが証明された(James et al., 1994)(Silberg et al., 2000)。この遺伝子
についてのプローブセット発現の統計学的分析も視覚的検査も、本発明者らのデータでは
大腸に沿った示差的発現を示していない(データは示していない)。
本発明者らは、溶質キャリア輸送遺伝子の数について有意な示差的転写産物発現を観察
した。SLC2A10、SLC13A2及びSLC28A2についてのプローブセット発
現は遠位大腸内では高かったが、溶質キャリアファミリーメンバーであるSLC9A3、
SLC14A2、SLC16A1、SLC20A1、SCL23A3、及びSLC37A
2は近位組織内の方が高かった。
本発明者らの結果は、大腸内で発現すると以前に考えられていた膜結合ムチンの染色体
7q22クラスタの5つのメンバー中3つ全部に対するプローブセットであるMUC11
、MUC12及びMUC17は遠位腸内で高レベルで示差的に発現することを証明してい
る(Byrd and Bresalier, 2004, Cancer Metastasis Rev 23:77-99、Williams et al., 1
999, Cancer Res 59:4083-4089、Gum et al., 2002, Biochem Biophys Res Commun 291:4
66-475)。本発明者らはさらに、独立バリデーション用データにおいてMUC12及びM
UC17についての示差的発現パターンも確証した。以前の報告は、MUC11及びMU
C12についてのゲノム配列が密接に関連する遺伝子由来であるか、又はおそらく同一遺
伝子であるかさえについての問題を提起していた(Byrd and Bresalier, 2004、上記)。
MUC11及びMUC12プローブセットの相関分析は、発現が増加するにつれて相関が
弱まるプローブセット発現範囲の下端で強力かつ正の相関を示している(データは示して
いない)。この相関プロファイルは、高い発現レベルで増加する変動性に起因し得るか、
又はおそらく遠位大腸(それらが高い場所)内での発現レベルが明確な転写制御を反映し
ているからである。
さらに、以前の研究は、分泌されたゲル形成ムチンMUC5Bは大腸内では弱くしか発
現しないと示唆していたが(Byrd and Bresalier, 2004、上記)、本発明者らの研究結果
は、この転写産物に反応性のプローブセットは、膜結合ムチンに関しては遠位大腸内で高
度に発現することを証明している。
本発明者らがヒトについてここで報告する発現パターンの一部は、齧歯類モデルの消化
管内で同様にパターン化されることが証明されている。しかし、以前にマウス及びラット
の大腸に沿って示差的に発現すると証明されていた多数の特異的遺伝子は、本発明者らに
よってはそのように発現するとは見いだされなかった。そのような遺伝子転写産物標的に
は、カルボニックアンヒドラーゼIV(Fleming et al., 1995)、溶質キャリアファミリ
ー4メンバー1(alias AE1)(Rajendran et al., 2000)、CD36/脂肪酸
トランソロカーゼ(Chen et al., 2001)、及びtoll様受容体4(Ortega-Cava et al
., 2003)が含まれる。他方、本発明者らのデータは、その発現産物は正常ラット大腸内
での水分吸収に関係することが疑われている遺伝子であるアクアポリン−8(AQP8)
の発現に関する以前の研究とは一致している(Calamita et al., 2001)。本発明者らは
、AQP8が遠位組織に比較してヒト近位大腸内で高レベルで有意に発現することを観察
している(p<0.006、データは示していない)。claudin接着結合タンパク
質のファミリーもまた大腸内の水分障壁完全性を維持することに役割を果たす可能性があ
る(Jeansonne et al., 2003)。本発明者らは、claudin−8(CLDN8)が遠
位結腸直腸組織においてはるかにより高度に発現することを見いだした。これとは逆に、
同様に接着結合原線維内に局在すると考えられているclaudin−15(CLDN1
5)は、近位結腸直腸組織において高レベルで発現した(Colegio et al., 2002)。
大腸に沿った遺伝子発現変化の性質
この研究の1つの目的は、どの遺伝子転写産物が大腸に沿って示差的に発現するのかを
理解することであり、第2の目的は、領域若しくはセグメントの特異的詳細において近位
−遠位軸に沿ったこれらの発現変化の性質を探索することであった。
本発明者らは、結腸直腸に沿って統計的有意な転写産物の発現変化の2つの大まかなパ
ターンを観察した。主要パターンは、2セグメント発現モデルによってよく当てはめられ
た65個の遺伝子転写産物によって記述される。本発明者らは、これらの転写産物の発現
は、事実上二分的であり、近位セグメントでは上昇し、遠位セグメントでは減少する、又
はその逆も真であると提案する。
そのようなデータは、近位大腸と遠位大腸との間の「天然」分割線(divide)が上行結
腸及び下行結腸の間で発生するという従来の解剖学的見解と一致している。この所見は、
下行結腸及びS状結腸間の区切り点が最大の示差発現を生じさせるというKomuroら
による近年の報告とは相容れない(Komuro et al., 2005)。しかし本発明者らは、結腸
直腸癌組織標本においてこのパターンを分析することに加えて、Komuroらがさらに
分析に横行結腸を含めることを選択したことに注目している。本発明者らは、横行結腸の
全長のほぼ3分の2の地点にある予測中腸−後腸融合点に関する可能性のある交絡影響(
confounding affect)を回避するためにそのセグメント由来の組織を意図的に排除してい
る。
第2セットの50個の転写産物は二分性変化を示さず、むしろ5セグメントモデルへ発
現データを適用することによって当てはめにおける有意な向上を示し、これは盲腸から直
腸へ大腸に沿って移動するより緩やかな発現勾配があることを支持している。
これらの2つの特徴的な発現パターンは、近位−遠位軸に沿った遺伝子発現はおそらく
組織体の2つの基礎となるシステムによって調整されることを暗示している。
本発明者らは、ここで測定した成人正常組織中での示差的に発現した転写産物の大多数
は、胚発生の中腸 対 後腸のパターンと一致するパターンで発現することを観察した。
さらに、監視PCA及び正準変量分析を含む多変量方法もまた、これらのデータ間の変動
の主要原因は、近位 対 遠位の分割線によって説明されることを示唆している。近年の
試験において、Glebovらは、成人における上行結腸及び下行結腸の間で示差的に発
現した遺伝子の数は、17〜24週齢の胎児大腸内で同様に同定された遺伝子の数より実
質的に多いことを見いだした。Glebovらは、成人大腸の遺伝子発現パターンはおそ
らく妊娠約30週時に成人結腸表現型の発現と同時に、又はおそらく消化管の出生後管腔
内容物に反応してさえ設定されるという仮説を立てている。本発明者らは、胎児大腸内で
の遺伝子発現については探索しなかったが、中腸−後腸融合点と一致する胚起源を支持す
る成人における発現パターンを観察している。
盲腸及び直腸の間で段階的発現変化を示すそれらの転写産物の大多数は、盲腸から直腸
へ移動する増加した発現のプロトタイプ的パターンを示す。このパターンは、近位で上昇
した転写産物の数はおそらく遠位領域内で上昇した数と同等である中腸−後腸の示差的転
写産物においては観察されない。本発明者らは、それらの転写産物における特徴的な遠位
に向かって増加するパターンは、内因的に規定された中腸−後腸パターンと比較して外因
性因子の関数(function)であろうと提案する。そのような因子は、盲腸から直腸への一
方向方法で移動する管腔内容物及び/又は大腸に沿ったマイクロフローラにおける領域的
変化の影響を含むことができよう。そのような外因性制御が転写活性を誘導する積極的方
法で機能するか又は減少した転写サイレンシングを通して機能するかを調査するためには
、今後の研究が必要とされるであろう。
大腸に沿って一致した遺伝子発現変化
大腸に沿って一致した遺伝子の発現を探索するために、本発明者らは、さらにこれらの
発現データへ主成分分析及びプロファイル分析を適用する。近位 対 遠位の遺伝子発現
パターンとこれらの多変量可視化技術との間には強力な証拠がある。さらに、セグメント
内変動を縮めようとしながら同時にセグメント間発現の差を最大にするプロファイル分析
は、盲腸から直腸の間の変動性の原因となる同一セットの遺伝子がさらに個別セグメント
を最良に分離することを示唆している。これらの多変量分析の結果はわずかな近位−遠位
勾配を排除しないが、これらの多変量プロットの見掛けの2相性の性質は、これらの組織
における発現変動の主な原因が中腸由来パターン 対 後腸由来パターンと一致している
ことを示唆している。
より小さなセットの遺伝子の方が有益な可能性がある
最後に、サポートベクターマシンの洗練された分類方法を使用して、近位 対遠位の組
織の安定かつ強固な分類を提供するために使用できる1サブセットの情報を提供するプロ
ーブセットを選択する。SVM 1002によって「選択された」プローブセットは、上
記の単変量法によって同定された示差的転写産物のサブセットである。独立バリデーショ
ンセット内の13転写産物モデルを評価することによって、これらの予測因子の強固性が
さらに証明される。
当業者であれば、本明細書に記載した本発明は、詳細に記載した以外に変形及び修飾さ
れる余地があることを理解するであろう。本発明がすべてのそのような変形及び修飾を含
むことを理解されたい。本発明はさらに、本明細書に個別若しくは包括的に言及又は指示
したすべての工程、特徴、組成物及び化合物、並びに前記工程若しくは特徴の任意の2つ
又はそれ以上のいずれか及びすべての組み合わせを含んでいる。
結論
本発明者らの研究は、転写産物の富裕度及びおそらくは転写調節は、大腸の近位−遠位
軸に沿って2つの大まかなパターンに従うことを示唆している。優勢なパターンは、近位
腸及び遠位腸の中腸−後腸の胚起源と一致する二分性発現パターンである。このパターン
に従う転写産物は、遠位で上昇するパターン及び近位で上昇するパターンへほぼ同等に分
割される。本発明者らが観察した第2パターンは、盲腸から直腸へ向かう転写産物レベル
における段階的変化を特徴とし、それらのほぼ全部が遠位組織に向かって増加する発現を
示す。本発明者らは、二分性中腸−後腸パターンを示す組織はおそらく大腸の内因性胚起
源を反映する可能性が高いが、段階的変化を示す組織は内腔の流れ(luminal flow)及び
マイクロフローラの変化などの外因性因子を反映することを提案する。これらをまとめる
と、これらのパターンは大腸の遺伝子発現マップを構成する。これは、全ヒト起源の初め
てのそのようなマップである。

Claims (50)

  1. 個体の大腸に由来する細胞又は細胞集団の解剖学的起源を決定するための方法であって

    公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団におけ
    る遺伝子の発現を表す発現トレーニングデータ、及び前記細胞若しくは細胞集団と前記近
    位−遠位起源との関連を表す近位−遠位起源トレーニングデータを含むトレーニングデー
    タを入手する工程と;ならびに
    前記遺伝子の発現レベルの線形若しくは非線形組み合わせを表す分類データを生成する
    ために前記トレーニングデータを処理する工程であって、前記分類データは、また別の細
    胞若しくは細胞亜集団における前記遺伝子の発現を表すまた別の発現データに基づいて、
    大腸から採取された前記また別の細胞若しくは細胞亜集団の近位−遠位起源を示すまた別
    の近位−遠位起源データを生成するために適合させられる工程とを含む方法。
  2. 前記また別の近位−遠位起源データを生成するために前記分類データ及び前記また別の
    発現データを処理する工程を含む、請求項1に記載の方法。
  3. 前記処理する工程は、統計的回帰、一般化線形方法、及び/又は多重線形回帰に基づく
    、請求項1又は2に記載の方法。
  4. 前記処理する工程は、GeneRaveを用いて前記トレーニングデータを処理する工
    程を含む、請求項1〜3のいずれか一項に記載の方法。
  5. 個体の大腸に由来する細胞又は細胞集団の解剖学的起源を決定するための方法であって

    公知の大腸の近位−遠位起源に由来する細胞若しくは細胞集団における遺伝子の発現を
    表す発現トレーニングデータ、及び前記細胞若しくは細胞集団と前記近位−遠位起源との
    関連を表す近位−遠位起源トレーニングデータを含むトレーニングデータを入手する工程
    と;ならびに
    また別の細胞若しくは細胞集団における遺伝子発現を表すまた別の発現データに基づい
    て、大腸に由来する前記また別の細胞若しくは細胞集団の近位−遠位起源の指標となる近
    位−遠位起源データを生成するための分類データを生成するために、多変量分析を使用し
    て前記トレーニングデータを処理する工程とを含む方法。
  6. 前記近位−遠位起源データを生成するために前記また別の発現データ及び前記分類デー
    タを処理する工程を含む、請求項5に記載の方法。
  7. 個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するための検出方法
    であって、
    公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団におけ
    る遺伝子発現を表す第1発現データを入手する工程と;ならびに
    前記細胞若しくは細胞集団の第1発現データと近位−遠位起源との関連を表す多変量モ
    デルデータを生成するために多変量分析を用いて第1発現データを処理する工程であって
    、前記多変量モデルデータは個体の大腸に由来する前記細胞若しくは細胞集団における遺
    伝子の発現を表す第2発現データに基づいて細胞若しくは細胞集団の近位−遠位起源を表
    す近位−遠位起源データを生成するために適合させられる工程とを含む方法。
  8. 個体の大腸に由来する細胞若しくは細胞集団における遺伝子発現を表す前記第2発現デ
    ータを入手する工程と;ならびに
    前記細胞若しくは細胞集団の近位−遠位起源を表す前記近位−遠位起源データを生成す
    るために前記発現データ及び前記多変量モデルデータを処理する工程とを含む、請求項7
    に記載の方法。
  9. 前記第1発現データを入手する工程は、前記第1発現データがそれのサブセットである
    第3発現データを入手する工程を含み、そして前記方法は、前記大腸の近位−遠位軸に沿
    って、単独若しくは組み合わせてのいずれかで、示差的に発現した1サブセットの遺伝子
    に対応する第3発現データのサブセットを選択するために前記第3発現データを処理する
    工程を含み、選択されたサブセットは前記第1発現データである、請求項7に記載の方法
  10. 個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するための方法であ
    って、
    公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団におけ
    る遺伝子発現を表す第1発現データを入手する工程と;ならびに
    少なくとも1つの第2細胞若しくは細胞集団の近位−遠位起源を表す近位−遠位起源デ
    ータを生成するために、大腸の前記少なくとも1つの第2細胞若しくは細胞集団における
    前記遺伝子の発現を表す前記発現データを処理するために、分類データを生成するために
    カーネル法を用いて前記第1発現データを処理する工程とを含む方法。
  11. 前記カーネル法は、サポートベクターマシン(SVM)を含む、請求項10に記載の方
    法。
  12. 前記方法は、前記近位−遠位起源データを生成するために前記第2発現データ及び前記
    分類データを処理する工程を含む、請求項10又は11に記載の方法。
  13. 個体の大腸に由来する細胞又は細胞集団の解剖学的起源を決定するための検出方法であ
    って、
    公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団におけ
    る遺伝子発現を表す第1発現データを入手する工程と;ならびに
    前記遺伝子の発現の少なくとも1つの線形組み合わせに対応する主成分データを生成す
    るために主成分分析を用いて前記第1発現データを処理する工程であって、前記主成分デ
    ータは前記細胞若しくは細胞集団の少なくとも1つの前記近位−遠位起源を示す工程とを
    含む方法。
  14. 前記第1発現データを入手する工程は、前記第1発現データがそれのサブセットである
    第3発現データを入手する工程を含み、そして前記方法は、前記少なくとも1つの大腸の
    近位−遠位軸に沿って示差的に発現した1サブセットの遺伝子に対応する第3発現データ
    のサブセットを選択するために前記第3発現データを処理する工程を含み、選択されたサ
    ブセットは前記第1発現データである、請求項13に記載の方法。
  15. 少なくとも1つの第2細胞若しくは細胞集団の近位−遠位起源を表す近位−遠位起源デ
    ータを生成するために、大腸の前記少なくとも1つの第2細胞若しくは細胞集団における
    前記遺伝子の発現を表す前記主成分データ及び第2発現データを処理する工程を含む、請
    求項13又は14に記載の方法。
  16. 個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するための方法であ
    って、
    公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団におけ
    る遺伝子発現を表す第1発現データを入手する工程と;ならびに
    前記細胞若しくは細胞集団の近位−遠位起源の少なくとも1つを示す正準変量データを
    生成するために正準変量分析を用いて前記発現データを処理する工程とを含む方法。
  17. 前記正準変量分析は、プロファイル分析を含む、請求項16に記載の方法。
  18. 前記正準変量データは、1サブセットの前記遺伝子に対応する、請求項16又は17に
    記載の方法。
  19. 少なくとも1つの第2細胞若しくは細胞集団の近位−遠位起源を表す近位−遠位起源デ
    ータを生成するために、大腸の前記少なくとも1つの第2細胞若しくは細胞集団における
    前記遺伝子の発現を表す前記正準変量データ及び第2発現データを処理する工程を含む、
    請求項25〜27のいずれか一項に記載の方法。
  20. 前記近位−遠位起源データによって指示された近位−遠位起源の正確さ若しくは有用性
    を改善するために以前の意見及び/又は1又はそれ以上の誤分類の見積もりに基づいて分
    類データを修飾する工程を含む、請求項1〜19のいずれか一項に記載の方法。
  21. 前記近位−遠位起源は、ノンパラメトリック法を用いて決定される、請求項1〜10の
    いずれか一項に記載の方法。
  22. 前記ノンパラメトリック法は、ニアレストネイバー(nearest−neighbo
    ur)法を含む、請求項21に記載の方法。
  23. 前記遺伝子は、
    Affymetrixプローブ番号:218888_s_atによって検出された1個
    又はそれ以上の遺伝子、
    Affymetrixプローブ番号:225290_atによって検出された遺伝子、
    Affymetrixプローブ番号:226432_atによって検出された遺伝子、
    Affymetrixプローブ番号:231576_atによって検出された遺伝子、
    Affymetrixプローブ番号:235733_atによって検出された遺伝子、
    Affymetrixプローブ番号:236894_atによって検出された遺伝子、
    Affymetrixプローブ番号:239656_atによって検出された遺伝子、
    Affymetrixプローブ番号:242059_atによって検出された遺伝子、
    Affymetrixプローブ番号:242683_atによって検出された遺伝子、
    Affymetrixプローブ番号:230105_atによって検出された遺伝子、
    Affymetrixプローブ番号:230269_atによって検出された遺伝子、
    Affymetrixプローブ番号:238378_atによって検出された遺伝子、
    Affymetrixプローブ番号:239814_atによって検出された遺伝子、
    Affymetrixプローブ番号:239994_atによって検出された遺伝子、
    Affymetrixプローブ番号:240856_atによって検出された遺伝子、
    Affymetrixプローブ番号:242414_atによって検出された遺伝子、
    Affymetrixプローブ番号:244553_atによって検出された遺伝子、
    Affymetrixプローブ番号:217320によって検出された遺伝子、
    Affymetrixプローブ番号:236141によって検出された遺伝子、
    Affymetrixプローブ番号:236513によって検出された遺伝子、
    Affymetrixプローブ番号:238143によって検出された遺伝子、
    ABHD5、FAM3B、IGFBP2、POPDC3、
    ADRA2A、FLJ10884、KCNG1、REG1A、
    APOBEC1、FLJ22761、KIFAP3、SLC14A2、
    C10orf45、FTHFD、LOC375295、SLC20A1、
    C10orf58、GCNT1、ME3、SLC23A3、
    CCL8、HAS3、MEP1B、SLC38A2、
    CLDN15、HOXB6、NPY6R、SLC9A3、
    DEFA5、HOXD4、NR1H3、TBCC、
    EYA2、HSD3B2、HR1H4、ZNF493、
    OSTalpha、
    PAP、
    AFARP1、若しくはAffymetrixプローブ番号:202234_s_at
    によって検出された1個又はそれ以上の遺伝子、
    ANPEP、若しくはAffymetrixプローブ番号:202888_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    CCL13、若しくはAffymetrixプローブ番号:206407_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    CRYL1、若しくはAffymetrixプローブ番号:220753_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    CYP2B6、若しくはAffymetrixプローブ番号:206754_s_at
    によって検出された1個又はそれ以上の遺伝子、
    CYP2C18、若しくはAffymetrixプローブ番号:208126_s_a
    tによって検出された1個又はそれ以上の遺伝子、
    CYP2C9、若しくはAffymetrixプローブ番号:214421_x_at
    若しくは220017_x_atによって検出された1個又はそれ以上の遺伝子、
    EPB41L3、若しくはAffymetrixプローブ番号:211776_s_a
    tによって検出された1個又はそれ以上の遺伝子、
    ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若
    しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
    FAM45A、若しくはAffymetrixプローブ番号:221804_s_at
    若しくは222955_s_atによって検出された1個又はそれ以上の遺伝子、
    FGFR2、若しくはAffymetrixプローブ番号:203639_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    GBA3、若しくはAffymetrixプローブ番号:219954_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    GSPT2、若しくはAffymetrixプローブ番号:205541_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    GULP1、若しくはAffymetrixプローブ番号:215913_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    HOXA9、若しくはAffymetrixプローブ番号:205366_s_at若
    しくは214551_s_atによって検出された1個又はそれ以上の遺伝子、
    HOXC6、若しくはAffymetrixプローブ番号:206858_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    HOXD3、若しくはAffymetrixプローブ番号:206601_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    ME2、若しくはAffymetrixプローブ番号:210153_s_atによっ
    て検出された1個又はそれ以上の遺伝子、
    MESP1、若しくはAffymetrixプローブ番号:224476_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    MOCS1、若しくはAffymetrixプローブ番号:213181_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    MSCP、若しくはAffymetrixプローブ番号:218136_s_at若し
    くは221920_s_atによって検出された1個又はそれ以上の遺伝子、
    NETO2、若しくはAffymetrixプローブ番号:222774_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    OASL、若しくはAffymetrixプローブ番号:210757_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    PITX2、若しくはAffymetrixプローブ番号:207558_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    PRAP1、若しくはAffymetrixプローブ番号:243669_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    SCUBE2、若しくはAffymetrixプローブ番号:219197_s_at
    によって検出された1個又はそれ以上の遺伝子、
    SEC6L1、若しくはAffymetrixプローブ番号:225457_s_at
    によって検出された1個又はそれ以上の遺伝子、
    SLC16A1、若しくはAffymetrixプローブ番号:202236_s_a
    t若しくは209900_s_atによって検出された1個又はそれ以上の遺伝子、
    UGT1A3、若しくはAffymetrixプローブ番号:208596_s_at
    によって検出された1個又はそれ以上の遺伝子、
    UGT1A8、若しくはAffymetrixプローブ番号:221305_s_at
    によって検出された1個又はそれ以上の遺伝子、
    ACACA、FMOD、LOC151162、S100P、
    C13orf11、FRMD3、MCF2L、SCGB2A1、
    C20orf56、GALNT5、MMP28、SCNN1B、
    CAPN13、GARNL4、MUC11、SHANK2、
    CLDN8、GCG、MUC12、SIAT2、
    COLM、GNE、MUC17、SIAT4C、
    CRIP1、HGD、MUC5B、SIAT7F、
    DNAJC12、HOXB13、NEDD4L、SIDT1、
    FAM3C、INSL5、PARP8、SLC13A2、
    FBX025、IRS1、PCDH21、SLPI、
    FLJ20366、ISL1、PI3、SPINK5、
    FLJ20989、KIAA0703、PRAC、SST、
    KIAA0830、PRAC2、TFF1、
    KIAA1913、PTTG1IP、TNFSF11、
    LAMA1、QPRT、TPH1、
    LGALS2、QSCN6、WFDC2、
    RBM24、
    ARF4、若しくはAffymetrixプローブ番号:201097_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    BTG3、若しくはAffymetrixプローブ番号:213134_x_at若し
    くは205548_s_atによって検出された1個又はそれ以上の遺伝子、
    CHST5、若しくはAffymetrixプローブ番号:221164_x_at若
    しくは223942_x_atによって検出された1個又はそれ以上の遺伝子、
    CMAH、若しくはAffymetrixプローブ番号:205518_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    CRYBA2、若しくはAffymetrixプローブ番号:220136_s_at
    によって検出された1個又はそれ以上の遺伝子、
    CTSE、若しくはAffymetrixプローブ番号:205927_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    DKFZp761N1114、若しくはAffymetrixプローブ番号:2423
    72_s_atによって検出された1個又はそれ以上の遺伝子、
    EPB41L4A、若しくはAffymetrixプローブ番号:228256_s_
    atによって検出された1個又はそれ以上の遺伝子、
    EPHA3、若しくはAffymetrixプローブ番号:206070_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    FAS、若しくはAffymetrixプローブ番号:204781_s_atによっ
    て検出された1個又はそれ以上の遺伝子、
    FER1L3、若しくはAffymetrixプローブ番号:201798_s_at
    若しくは211864_s_atによって検出された1個又はそれ以上の遺伝子、
    FLJ20152、若しくはAffymetrixプローブ番号:218532_s_
    at若しくは218510_x_atによって検出された1個又はそれ以上の遺伝子、
    FLJ23548、若しくはAffymetrixプローブ番号:218187_s_
    atによって検出された1個又はそれ以上の遺伝子、
    FN1、若しくはAffymetrixプローブ番号:211719_s_at若しく
    は210495_x_at若しくは212464_at若しくは216442_x_at
    によって検出された1個又はそれ以上の遺伝子、
    FOXA2、若しくはAffymetrixプローブ番号:210103_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    FRZB、若しくはAffymetrixプローブ番号:203698_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    GDF15、若しくはAffymetrixプローブ番号:221577_x_atに
    よって検出された1個又はそれ以上の遺伝子、
    GJB3、若しくはAffymetrixプローブ番号:205490_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    HOXD13、若しくはAffymetrixプローブ番号:207397_s_at
    によって検出された1個又はそれ以上の遺伝子、
    INSM1、若しくはAffymetrixプローブ番号:206502_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    MGC4170、若しくはAffymetrixプローブ番号:212959_s_a
    tによって検出された1個又はそれ以上の遺伝子、
    MLPH、若しくはAffymetrixプローブ番号:218211_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    NEBL、若しくはAffymetrixプローブ番号:203962_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    PLA2G2A、若しくはAffymetrixプローブ番号:203649_s_a
    tによって検出された1個又はそれ以上の遺伝子、
    PTPRO、若しくはAffymetrixプローブ番号:208121_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    PYY、若しくはAffymetrixプローブ番号:207080_s_at若しく
    は211253_x_atによって検出された1個又はそれ以上の遺伝子、
    SH3BP4、若しくはAffymetrixプローブ番号:222258_s_at
    によって検出された1個又はそれ以上の遺伝子、
    SLC28A2、若しくはAffymetrixプローブ番号:207249_s_a
    tによって検出された1個又はそれ以上の遺伝子、
    SLC2A10、若しくはAffymetrixプローブ番号:221024_s_a
    tによって検出された1個又はそれ以上の遺伝子、
    SPON1、若しくはAffymetrixプローブ番号:213994_s_at若
    しくは209437_s_atによって検出された1個又はそれ以上の遺伝子、
    STS、若しくはAffymetrixプローブ番号:203769_s_atによっ
    て検出された1個又はそれ以上の遺伝子、
    TM4SF11、若しくはAffymetrixプローブ番号:204519_s_a
    tによって検出された1個又はそれ以上の遺伝子、
    TUSC3、若しくはAffymetrixプローブ番号:213432_s_at若
    しくは209228_x_atによって検出された1個又はそれ以上の遺伝子、
    AQP8、LGALS2、EFNA1、ORF51E2、
    CCL11、C6ORF105、EMP1、PROM1、
    CLDN8、CCL11、FST、REG3A、
    MMP12、CD69、GHR、SCNN1B、
    P2RY14、CLC、HLA−DRB4、ST3GAL4、
    CCL18、CPM、HOXD10、ST6GALNAC6、
    ACSL1、DEFA6、HSD17B2、
    AGR2、DHRS9、HSPCA、
    ASPN、IGHD、
    MT1M、
    SCD、若しくはAffymetrixプローブ番号:200832_s_atによっ
    て検出された1個又はそれ以上の遺伝子、
    ABCB1、若しくはAffymetrixプローブ番号:211994_s_atに
    よって検出された遺伝子、
    BTBD3、若しくはAffymetrixプローブ番号:202946_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    CA1、若しくはAffymetrixプローブ番号:205950_s_atによっ
    て検出された1個又はそれ以上の遺伝子、
    DHRS9、若しくはAffymetrixプローブ番号:224009_x_at若
    しくは223952_x_atによって検出された1個又はそれ以上の遺伝子、
    DKFZP564I1171、若しくはAffymetrixプローブ番号:2254
    57_s_atによって検出された1個又はそれ以上の遺伝子、
    EIF5A、若しくはAffymetrixプローブ番号:201123_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    IGHD、若しくはAffymetrixプローブ番号:214973_x_atによ
    って検出された1個又はそれ以上の遺伝子、
    PCK1、若しくはAffymetrixプローブ番号:208383_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    RBP4、若しくはAffymetrixプローブ番号:219140_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    TRPM6、若しくはAffymetrixプローブ番号:224412_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    UGT1A6、若しくはAffymetrixプローブ番号:215125_s_at
    によって検出された1個又はそれ以上の遺伝子から選択された遺伝子を含む、請求項1〜
    22のいずれか一項に記載の方法。
  24. 前記遺伝子は7個の遺伝子のみ含む、請求項1〜23のいずれか一項に記載の方法。
  25. 前記遺伝子は、SEC6L1、PRAC、SPINK5、SEC6L1、ANPEP、
    DEFA5、及びCLDN8を含む、請求項1〜24のいずれか一項に記載の方法。
  26. 前記遺伝子は以下の遺伝子の群、
    (i)
    SCD、若しくはAffymetrixプローブ番号:200832_s_atによっ
    て検出された1個又はそれ以上の遺伝子、
    MMP12、
    P2RY14、
    CLDN8、
    ETNK1;
    (ii)
    PCP4、
    SLC28A2、若しくはAffymetrixプローブ番号:207249_s_a
    tによって検出された1個又はそれ以上の遺伝子、
    CCL18、
    RBP4、若しくはAffymetrixプローブ番号:219140_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    DKFZP564I1171、
    PRAC;
    (iii)
    EIF5A、若しくはAffymetrixプローブ番号:201123_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    IGFBP2、
    GDF15、若しくはAffymetrixプローブ番号:221577_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    DKFZP564I1171、若しくはAffymetrixプローブ番号:2254
    57_s_atによって検出された1個又はそれ以上の遺伝子、
    MUC12;
    (iv)
    HLA−DRB4、
    HOXB13、
    INSL5、
    ETNK1、若しくはAffymetrixプローブ番号:222262_s_atに
    よって検出された1個又はそれ以上の遺伝子;
    (v)
    ANPEP、若しくはAffymetrixプローブ番号:202888_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    DEFA5、
    CHST5、若しくはAffymetrixプローブ番号:221164_x_atに
    よって検出された1個又はそれ以上の遺伝子、
    Affymetrixプローブ番号:226432_atによって検出された遺伝子、
    COLM;
    (vi)
    SCNN1B、
    FN1、若しくはAffymetrixプローブ番号:211719_x_atによっ
    て検出された1個又はそれ以上の遺伝子、
    ETNK1、若しくはAffymetrixプローブ番号:224453_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    Affymetrixプローブ番号:225290_atによって検出された遺伝子、
    OSTalpha、
    HOXD10、
    プローブ番号:230269;
    (vii)
    SLC20A1、
    HSPCA、
    Affymetrixプローブ番号:217320_atによって検出された遺伝子、
    CCL18、
    HOXB13;
    (viii)
    CD69、
    OLFM4、若しくはAffymetrixプローブ番号:212768_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    UGT1A6、若しくはAffymetrixプローブ番号:215125_s_at
    によって検出された1個又はそれ以上の遺伝子、
    CHST5、若しくはAffymetrixプローブ番号:223942_x_atに
    よって検出された1個又はそれ以上の遺伝子、
    Affymetrixプローブ番号:231576_atによって検出された遺伝子、
    MUC11;
    (ix)
    PLA2G2A、若しくはAffymetrixプローブ番号:203649_s_a
    tによって検出された1個又はそれ以上の遺伝子、
    REG3A、
    CCL13、若しくはAffymetrixプローブ番号:206407_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    GCG、
    UGT1A3、若しくはAffymetrixプローブ番号:208596_s_at
    によって検出された1個又はそれ以上の遺伝子、
    FN1、若しくはAffymetrixプローブ番号:210485_x_atによっ
    て検出された1個又はそれ以上の遺伝子、
    MT1M、
    OR51E2;
    (x)
    SLC16A1、若しくはAffymetrixプローブ番号:202236_s_a
    tによって検出された1個又はそれ以上の遺伝子、
    WFDC2、
    S100P、
    PTPRO、若しくはAffymetrixプローブ番号:208121_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    CCL11、
    ASPN、
    FAM3B;
    (xi)
    EMP1、
    NEBL、若しくはAffymetrixプローブ番号:203962_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    TFF1、
    CMAH、若しくはAffymetrixプローブ番号:205518_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    PYY、若しくはAffymetrixプローブ番号:207080_s_atによっ
    て検出された1個又はそれ以上の遺伝子、
    ECAT11、
    NETO2、若しくはAffymetrixプローブ番号:222774_s_atに
    よって検出された1個又はそれ以上の遺伝子;
    (xii)
    HSD17B2、
    HGD、
    CA1、若しくはAffymetrixプローブ番号:205950_s_atによっ
    て検出された1個又はそれ以上の遺伝子、
    CPM、
    LGALS2、
    IGHD、若しくはAffymetrixプローブ番号:214973_x_atによ
    って検出された1個又はそれ以上の遺伝子、
    FN1、若しくはAffymetrixプローブ番号:216442_xs_atによ
    って検出された1個又はそれ以上の遺伝子;
    (xiii)
    CLC、
    DEFA6、
    FN1、若しくはAffymetrixプローブ番号:212464_s_atによっ
    て検出された1個又はそれ以上の遺伝子、
    FST、
    Affymetrixプローブ番号:236513_atによって検出された遺伝子、
    Affymetrixプローブ番号:240856_atによって検出された遺伝子、
    ETNK1;
    (xiv)
    PITX2、若しくはAffymetrixプローブ番号:207558_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    DHRS9、若しくはAffymetrixプローブ番号:224009_x_atに
    よって検出された1個又はそれ以上の遺伝子、
    DKFZp761N1114、
    KIAA1913;
    (xv)
    GHR、
    HSD3B2、
    MEP1B、
    HOXA9、若しくはAffymetrixプローブ番号:213651_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    TRPM6、若しくはAffymetrixプローブ番号:224412_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    Affymetrixプローブ番号:239994_atによって検出された遺伝子;
    (xvi)
    SPINK5、
    PCK1、若しくはAffymetrixプローブ番号:208383_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    ADRA2A、
    NQO1、若しくはAffymetrixプローブ番号:210519_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    GBA3、
    Affymetrixプローブ番号:228004_atによって検出された遺伝子;
    (xvii)
    SCGB2A1、
    NR1H4、
    NETO2、若しくはAffymetrixプローブ番号:218888_s_atに
    よって検出された遺伝子、
    ST6GALNAC6;
    (xviii)
    NEBL、
    PROM1、若しくはAffymetrixプローブ番号:204304_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    AGR2、
    REG1A、
    UGT1A8、若しくはAffymetrixプローブ番号:221305_s_at
    によって検出された1個又はそれ以上の遺伝子、
    DKFZp761N1114、若しくはAffymetrixプローブ番号:2423
    72_s_atによって検出された1個又はそれ以上の遺伝子;
    (xix)
    ACSL1、
    ST3GAL4、
    GBA3、若しくはAffymetrixプローブ番号:219954_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    SLC2A10、若しくはAffymetrixプローブ番号:221024_s_a
    tによって検出された1個又はそれ以上の遺伝子、
    DHRS9、若しくはAffymetrixプローブ番号:223952_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    LAMA1;
    (xx)
    EFNA1、
    BTBD3、若しくはAffymetrixプローブ番号:202946_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    PI3、
    ABCB1、若しくはAffymetrixプローブ番号:209994_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    C10orf45、
    BCMP11、
    C6orf105、
    CAPN13、
    CPM、
    Affymetrixプローブ番号:236141_atによって検出された遺伝子、
    Affymetrixプローブ番号:238143_atによって検出された遺伝子の
    うちの1つ又はそれ以上を含む、請求項1〜23のいずれか一項に記載の方法。
  27. 前記分類データは、13個の遺伝子のサブセットを表す、請求項1〜23のいずれか一
    項に記載の方法。
  28. 前記遺伝子は、
    PRAC、
    CCL11、
    FRZB、若しくはAffymetrixプローブ番号:203698_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    GDF15、若しくはAffymetrixプローブ番号:221577_x_atに
    よって検出された1個又はそれ以上の遺伝子、
    CLDN8、
    SEC6L1、若しくはAffymetrixプローブ番号:221577_x_at
    によって検出された1個又はそれ以上の遺伝子、
    GBA3、若しくはAffymetrixプローブ番号:279954_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    DEFA5、
    SPINK5、
    OSTalpha、
    ANPEP、若しくはAffymetrixプローブ番号:202888_s_atに
    よって検出された1個又はそれ以上の遺伝子、及び
    MUC5を含む、請求項1〜27のいずれか一項に記載の方法。
  29. 請求項1〜28のいずれか一項に記載の方法を実行するための成分を有する検出システ
    ム。
  30. 請求項1〜28のいずれか一項に記載の方法を実行するためのプログラム取扱説明書を
    その上に保存しているコンピュータ可読記憶媒体。
  31. 少なくとも1つの大腸に由来する細胞若しくは細胞集団における遺伝子の発現を表す発
    現トレーニングデータ、及び前記細胞若しくは細胞集団と近位−遠位起源との関連を表す
    前記近位−遠位起源トレーニングデータを含むトレーニングデータを入手するための手段
    と;
    前記遺伝子の発現レベルの線形若しくは非線形組み合わせを表す分類データを生成する
    ために前記トレーニングデータを処理するための手段であって、前記分類データは、また
    別の細胞若しくは細胞集団における前記遺伝子の発現を表すまた別の発現データに基づい
    て、大腸から採取された前記また別の細胞若しくは細胞集団の近位−遠位起源を示す近位
    −遠位起源データを生成するために適合させられる手段とを含む、検出システム。
  32. 個体の大腸に由来する細胞又は細胞集団の解剖学的起源を決定するための方法であって
    、前記個体由来の生物学的サンプル中において、
    (i)
    PITX2、若しくはAffymetrixプローブ番号:207558_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若
    しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
    FAM3B、
    CYP2C18、若しくはAffymetrixプローブ番号:208126_s_a
    tによって検出された1個又はそれ以上の遺伝子、
    GBA3、若しくはAffymetrixプローブ番号:219954_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    MEP1B、
    ADRA2A、
    HSD3B2、
    CYP2B6、若しくはAffymetrixプローブ番号:206754_s_at
    によって検出された1個又はそれ以上の遺伝子、
    SLC14A2、若しくはAffymetrixプローブ番号:226432_s_a
    tによって検出された1個又はそれ以上の遺伝子、
    CYP2C9、若しくはAffymetrixプローブ番号:231576_s_at
    によって検出された1個又はそれ以上の遺伝子、
    DEFA5、
    OASL、若しくはAffymetrixプローブ番号:210797_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    SLC37A3、
    REG1A、
    MEP1B、
    NR1H4;又は
    (ii)
    DKFZp761N1114、若しくはAffymetrixプローブ番号:2423
    74_s_atによって検出された1個又はそれ以上の遺伝子、
    PRAC、
    INSL5、
    HOXB13又は
    WFDC2から選択される1個又はそれ以上の遺伝子の発現レベルを測定する工程を含
    み、
    正常遠位大腸コントロールレベルに比較して(i)群の遺伝子のより高い発現レベルは
    近位大腸起源であることを示し、及び正常近位大腸コントロールレベルに比較して(ii
    )群の遺伝子のより高い発現レベルは遠位大腸起源であることを示す方法。
  33. 個体の大腸に由来する細胞又は細胞集団の解剖学的起源を決定するための方法であって
    、前記個体由来の生物学的サンプル中において、
    (i)
    Affymetrixプローブ番号:218888_s_atによって検出された1個
    又はそれ以上の遺伝子、
    Affymetrixプローブ番号:225290_atによって検出された遺伝子、
    Affymetrixプローブ番号:226432_atによって検出された遺伝子、
    Affymetrixプローブ番号:231576_atによって検出された遺伝子、
    Affymetrixプローブ番号:235733_atによって検出された遺伝子、
    Affymetrixプローブ番号:236894_atによって検出された遺伝子、
    Affymetrixプローブ番号:239656_atによって検出された遺伝子、
    Affymetrixプローブ番号:242059_atによって検出された遺伝子、
    Affymetrixプローブ番号:242683_atによって検出された遺伝子、
    ABHD5、FAM3B、IGFBP2、POPDC3、
    ADRA2A、FLJ10884、KCNG1、REG1A、
    APOBEC1、FLJ22761、KIFAP3、SLC14A2、
    C10orf45、FTHFD、LOC375295、SLC20A1、
    C10orf58、GCNT1、ME3、SLC23A3、
    CCL8、HAS3、MEP1B、SLC38A2、
    CLDN15、HOXB6、NPY6R、SLC9A3、
    DEFA5、HOXD4、NR1H3、TBCC、
    EYA2、HSD3B2、HR1H4、ZNF493、
    OSTalpha、
    PAP、
    AFARP1、若しくはAffymetrixプローブ番号:202234_s_at
    によって検出された1個又はそれ以上の遺伝子、
    ANPEP、若しくはAffymetrixプローブ番号:202888_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    CCL13、若しくはAffymetrixプローブ番号:206407_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    CRYL1、若しくはAffymetrixプローブ番号:220753_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    CYP2B6、若しくはAffymetrixプローブ番号:206754_s_at
    によって検出された1個又はそれ以上の遺伝子、
    CYP2C18、若しくはAffymetrixプローブ番号:208126_s_a
    tによって検出された1個又はそれ以上の遺伝子、
    CYP2C9、若しくはAffymetrixプローブ番号:214421_x_at
    若しくは220017_x_atによって検出された1個又はそれ以上の遺伝子、
    EPB41L3、若しくはAffymetrixプローブ番号:211776_s_a
    tによって検出された1個又はそれ以上の遺伝子、
    ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若
    しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
    FAM45A、若しくはAffymetrixプローブ番号:221804_s_at
    若しくは222955_s_atによって検出された1個又はそれ以上の遺伝子、
    FGFR2、若しくはAffymetrixプローブ番号:203639_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    GBA3、若しくはAffymetrixプローブ番号:219954_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    GSPT2、若しくはAffymetrixプローブ番号:205541_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    GULP1、若しくはAffymetrixプローブ番号:215913_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    HOXA9、若しくはAffymetrixプローブ番号:205366_s_at若
    しくは214551_s_atによって検出された1個又はそれ以上の遺伝子、
    HOXC6、若しくはAffymetrixプローブ番号:206858_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    HOXD3、若しくはAffymetrixプローブ番号:206601_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    ME2、若しくはAffymetrixプローブ番号:210153_s_atによっ
    て検出された1個又はそれ以上の遺伝子、
    MESP1、若しくはAffymetrixプローブ番号:224476_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    MOCS1、若しくはAffymetrixプローブ番号:213181_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    MSCP、若しくはAffymetrixプローブ番号:218136_s_at若し
    くは221920_s_atによって検出された1個又はそれ以上の遺伝子、
    NETO2、若しくはAffymetrixプローブ番号:222774_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    OASL、若しくはAffymetrixプローブ番号:210757_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    PITX2、若しくはAffymetrixプローブ番号:207558_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    PRAP1、若しくはAffymetrixプローブ番号:243669_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    SCUBE2、若しくはAffymetrixプローブ番号:219197_s_at
    によって検出された1個又はそれ以上の遺伝子、
    SEC6L1、若しくはAffymetrixプローブ番号:225457_s_at
    によって検出された1個又はそれ以上の遺伝子、
    SLC16A1、若しくはAffymetrixプローブ番号:202236_s_a
    t若しくは209900_s_atによって検出された1個又はそれ以上の遺伝子、
    UGT1A3、若しくはAffymetrixプローブ番号:208596_s_at
    によって検出された1個又はそれ以上の遺伝子、
    UGT1A8、若しくはAffymetrixプローブ番号:221305_s_at
    によって検出された1個又はそれ以上の遺伝子;又は
    (ii)
    Affymetrixプローブ番号:230105_atによって検出された遺伝子、
    Affymetrixプローブ番号:230269_atによって検出された遺伝子、
    Affymetrixプローブ番号:238378_atによって検出された遺伝子、
    Affymetrixプローブ番号:239814_atによって検出された遺伝子、
    Affymetrixプローブ番号:239994_atによって検出された遺伝子、
    Affymetrixプローブ番号:240856_atによって検出された遺伝子、
    Affymetrixプローブ番号:242414_atによって検出された遺伝子、
    Affymetrixプローブ番号:244553_atによって検出された遺伝子、
    ACACA、FMOD、LOC151162、S100P、
    C13orf11、FRMD3、MCF2L、SCGB2A1、
    C20orf56、GALNT5、MMP28、SCNN1B、
    CAPN13、GARNL4、MUC11、SHANK2、
    CLDN8、GCG、MUC12、SIAT2、
    COLM、GNE、MUC17、SIAT4C、
    CRIP1、HGD、MUC5B、SIAT7F、
    DNAJC12、HOXB13、NEDD4L、SIDT1、
    FAM3C、INSL5、PARP8、SLC13A2、
    FBX025、IRS1、PCDH21、SLPI、
    FLJ20366、ISL1、PI3、SPINK5、
    FLJ20989、KIAA0703、PRAC、SST、
    KIAA0830、PRAC2、TFF1、
    KIAA1913、PTTG1IP、TNFSF11、
    LAMA1、QPRT、TPH1、
    LGALS2、QSCN6、WFDC2、
    RBM24、
    ARF4、若しくはAffymetrixプローブ番号:201097_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    BTG3、若しくはAffymetrixプローブ番号:213134_x_at若し
    くは205548_s_atによって検出された1個又はそれ以上の遺伝子、
    CHST5、若しくはAffymetrixプローブ番号:221164_x_at若
    しくは223942_x_atによって検出された1個又はそれ以上の遺伝子、
    CMAH、若しくはAffymetrixプローブ番号:205518_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    CRYBA2、若しくはAffymetrixプローブ番号:220136_s_at
    によって検出された1個又はそれ以上の遺伝子、
    CTSE、若しくはAffymetrixプローブ番号:205927_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    DKFZp761N1114、若しくはAffymetrixプローブ番号:2423
    72_s_atによって検出された1個又はそれ以上の遺伝子、
    EPB41L4A、若しくはAffymetrixプローブ番号:228256_s_
    atによって検出された1個又はそれ以上の遺伝子、
    EPHA3、若しくはAffymetrixプローブ番号:206070_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    FAS、若しくはAffymetrixプローブ番号:204781_s_atによっ
    て検出された1個又はそれ以上の遺伝子、
    FER1L3、若しくはAffymetrixプローブ番号:201798_s_at
    若しくは211864_s_atによって検出された1個又はそれ以上の遺伝子、
    FLJ20152、若しくはAffymetrixプローブ番号:218532_s_
    at若しくは218510_x_atによって検出された1個又はそれ以上の遺伝子、
    FLJ23548、若しくはAffymetrixプローブ番号:218187_s_
    atによって検出された1個又はそれ以上の遺伝子、
    FN1、若しくはAffymetrixプローブ番号:211719_s_at若しく
    は210495_x_at若しくは212464_at若しくは216442_x_at
    によって検出された1個又はそれ以上の遺伝子、
    FOXA2、若しくはAffymetrixプローブ番号:210103_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    FRZB、若しくはAffymetrixプローブ番号:203698_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    GDF15、若しくはAffymetrixプローブ番号:221577_x_atに
    よって検出された1個又はそれ以上の遺伝子、
    GJB3、若しくはAffymetrixプローブ番号:205490_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    HOXD13、若しくはAffymetrixプローブ番号:207397_s_at
    によって検出された1個又はそれ以上の遺伝子、
    INSM1、若しくはAffymetrixプローブ番号:206502_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    MGC4170、若しくはAffymetrixプローブ番号:212959_s_a
    tによって検出された1個又はそれ以上の遺伝子、
    MLPH、若しくはAffymetrixプローブ番号:218211_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    NEBL、若しくはAffymetrixプローブ番号:203962_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    PLA2G2A、若しくはAffymetrixプローブ番号:203649_s_a
    tによって検出された1個又はそれ以上の遺伝子、
    PTPRO、若しくはAffymetrixプローブ番号:208121_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    PYY、若しくはAffymetrixプローブ番号:207080_s_at若しく
    は211253_x_atによって検出された1個又はそれ以上の遺伝子、
    SH3BP4、若しくはAffymetrixプローブ番号:222258_s_at
    によって検出された1個又はそれ以上の遺伝子、
    SLC28A2、若しくはAffymetrixプローブ番号:207249_s_a
    tによって検出された1個又はそれ以上の遺伝子、
    SLC2A10、若しくはAffymetrixプローブ番号:221024_s_a
    tによって検出された1個又はそれ以上の遺伝子、
    SPON1、若しくはAffymetrixプローブ番号:213994_s_at若
    しくは209437_s_atによって検出された1個又はそれ以上の遺伝子、
    STS、若しくはAffymetrixプローブ番号:203769_s_atによっ
    て検出された1個又はそれ以上の遺伝子、
    TM4SF11、若しくはAffymetrixプローブ番号:204519_s_a
    tによって検出された1個又はそれ以上の遺伝子、
    TUSC3、若しくはAffymetrixプローブ番号:213432_s_at若
    しくは209228_x_atによって検出された1個又はそれ以上の遺伝子から選択さ
    れる1個又はそれ以上の遺伝子の発現レベルを測定する工程を含む方法であって、
    正常遠位大腸コントロールレベルに比較して(i)群の遺伝子のより高い発現レベルは
    近位大腸起源であることを示し、及び正常近位大腸コントロールレベルに比較して(ii
    )群の遺伝子のより高い発現レベルは遠位大腸起源であることを示す方法。
  34. 前記近位領域は、盲腸及び上行結腸を含む、請求項32又は33に記載の方法。
  35. 前記遠位領域は、脾湾曲部、下行結腸、S状結腸湾曲部及び直腸を含む、請求項33に
    記載の方法。
  36. 前記遺伝子は、ETNK1である、請求項32又は33、34又は35に記載の方法。
  37. 前記遺伝子は、GBA3である、請求項32又は33又は34又は35に記載の方法。
  38. 前記遺伝子は、PRACである、請求項32又は33又は34又は35に記載の方法。
  39. 前記生物学的サンプルは、便サンプル、浣腸洗浄液、外科的切除物又は組織生検である
    、請求項32〜38のいずれか一項に記載の方法。
  40. アレイが、複数の、
    (i)請求項33に列挙した位置マーカー遺伝子のいずれか1つに対応するヌクレオチド
    配列若しくはそれと少なくとも80%の同一性を示す配列を含む核酸分子又は前記核酸分
    子の官能的誘導体、フラグメント、変異体若しくはホモログ;
    (ii)42℃の低ストリンジェンシー条件下で(i)の配列のいずれか1つ又はそれ以
    上にハイブリダイズすることのできるヌクレオチド配列を含む核酸分子、又は前記核酸分
    子の官能的誘導体、フラグメント、変異体若しくはホモログ;
    (iii)42℃の低ストリンジェンシー条件下で(i)の配列のいずれか1つ又はそれ
    以上にハイブリダイズすることのできるヌクレオチド配列を含む核酸プローブ若しくはオ
    リゴヌクレオチド、又は前記核酸分子の官能的誘導体、フラグメント、変異体若しくはホ
    モログ;
    (iv)(i)若しくは(ii)の核酸分子によってコードされたタンパク質、又は前記
    タンパク質の誘導体、フラグメント、若しくはホモログを含む核酸アレイであって、
    前記核酸の発現のレベルは、大腸に由来する細胞若しくは細胞亜集団の近位−遠位起源
    を示す核酸アレイ。
  41. 前記位置マーカーは、請求項32又は33に列挙したマーカーである、請求項40に記
    載のアレイ。
  42. アレイが、複数の、
    (i)ETNK1及び/又はGBA3及び/又はPRACに対応するヌクレオチド配列又
    はそれと少なくとも80%の同一性を示す配列を含む核酸分子又は前記核酸分子の官能的
    誘導体、フラグメント、変異体若しくはホモログ;又は
    (ii)42℃の低ストリンジェンシー条件下で(i)の配列のいずれか1つ又はそれ以
    上にハイブリダイズすることのできるヌクレオチド配列を含む核酸分子、又は前記核酸分
    子の官能的誘導体、フラグメント、変異体若しくはホモログ;
    (iii)42℃の低ストリンジェンシー条件下で(i)の配列のいずれか1つ又はそれ
    以上にハイブリダイズすることのできるヌクレオチド配列を含む核酸プローブ若しくはオ
    リゴヌクレオチド、又は前記核酸分子の官能的誘導体、フラグメント、変異体若しくはホ
    モログ;
    (iv)(i)若しくは(ii)の核酸分子によってコードされたタンパク質、又は前記
    タンパク質の誘導体、フラグメント、変異体若しくはホモログを含む核酸アレイであって

    前記核酸の発現のレベルは、大腸に由来する細胞若しくは細胞亜集団の近位−遠位起源
    を示す核酸アレイ。
  43. 前記アレイは、請求項32〜39のいずれか一項に記載の方法において使用される、請
    求項40〜42のいずれか一項に記載のアレイ。
  44. 個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するための請求項4
    0〜42のいずれか一項に記載のアレイの使用。
  45. 前記遺伝子は、
    PITX2、若しくはAffymetrixプローブ番号:207558_s_atに
    よって検出された1個又はそれ以上の遺伝子、
    ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若
    しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
    FAM3B、
    CYP2C18、若しくはAffymetrixプローブ番号:208126_s_a
    tによって検出された1個又はそれ以上の遺伝子、
    GBA3、若しくはAffymetrixプローブ番号:219954_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    MEP1B、
    ADRA2A、
    HSD3B2、
    CYP2B6、若しくはAffymetrixプローブ番号:206754_s_at
    によって検出された1個又はそれ以上の遺伝子、
    SLC14A2、若しくはAffymetrixプローブ番号:226432_s_a
    tによって検出された1個又はそれ以上の遺伝子、
    CYP2C9、若しくはAffymetrixプローブ番号:231576_s_at
    によって検出された1個又はそれ以上の遺伝子、
    DEFA5、
    OASL、若しくはAffymetrixプローブ番号:210797_s_atによ
    って検出された1個又はそれ以上の遺伝子、
    SLC37A3、
    REG1A、
    MEP1B、
    NR1H4;又は
    DKFZp761N1114、若しくはAffymetrixプローブ番号:2423
    74_s_atによって検出された1個又はそれ以上の遺伝子、
    PRAC、
    INSL5、
    HOXB13、又は
    WFDC2から選択される、請求項23に記載の方法。
  46. 前記発現レベルはタンパク質発現である、請求項1〜39又は45のいずれか一項に記
    載の方法。
  47. 前記発現レベルはmRNA発現である、請求項1〜39又は45のいずれか一項に記載
    の方法。
  48. 大腸における細胞異常又は細胞異常を特徴とする状態の発症又は発症に対する素因を決
    定するための方法であって、前記方法は請求項1〜39又は45〜47のいずれか一項に
    記載の方法に従って、大腸における公知の近位若しくは遠位起源に由来する生物学的サン
    プルの近位−遠位遺伝子発現プロファイルを決定する工程を含み、正常近位−遠位大腸遺
    伝子発現プロファイルと一致しない遺伝子発現プロファイルの検出は前記プロファイルを
    発現する細胞若しくは細胞集団の異常の指標となる方法。
  49. 1つ又はそれ以上の近位−遠位マーカーを検出するための作用物質(agent)及び前記
    作用物質による検出を促進するために有用な試薬を含む、生物学的サンプルをアッセイす
    るための診断用キット。
  50. 請求項1〜39又は45〜47のいずれか一項に記載の方法において使用する場合の、
    請求項49に記載のキット。
JP2014043282A 2014-03-05 2014-03-05 検出方法 Pending JP2014158468A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014043282A JP2014158468A (ja) 2014-03-05 2014-03-05 検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014043282A JP2014158468A (ja) 2014-03-05 2014-03-05 検出方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2009511302A Division JP2010527577A (ja) 2006-05-22 2007-05-22 検出方法

Publications (1)

Publication Number Publication Date
JP2014158468A true JP2014158468A (ja) 2014-09-04

Family

ID=51610758

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014043282A Pending JP2014158468A (ja) 2014-03-05 2014-03-05 検出方法

Country Status (1)

Country Link
JP (1) JP2014158468A (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001512666A (ja) * 1997-08-07 2001-08-28 トーマス・ジェファーソン・ユニバーシティ 結腸直腸癌細胞に特異的に結合する組成物およびその使用法
JP2005507997A (ja) * 2001-10-26 2005-03-24 イムニベスト・コーポレイション 同一試料についての包括的核酸および形態学的特徴のマルチパラメーター分析
JP2006246895A (ja) * 1993-10-26 2006-09-21 Univ Thomas Jefferson 結腸直腸癌細胞に特異的に結合する組成物およびその使用方法
WO2006108087A2 (en) * 2005-04-05 2006-10-12 Cellpoint Diagnostics Devices and methods for enrichment and alteration of circulating tumor cells and other particles

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006246895A (ja) * 1993-10-26 2006-09-21 Univ Thomas Jefferson 結腸直腸癌細胞に特異的に結合する組成物およびその使用方法
JP2001512666A (ja) * 1997-08-07 2001-08-28 トーマス・ジェファーソン・ユニバーシティ 結腸直腸癌細胞に特異的に結合する組成物およびその使用法
JP2005507997A (ja) * 2001-10-26 2005-03-24 イムニベスト・コーポレイション 同一試料についての包括的核酸および形態学的特徴のマルチパラメーター分析
WO2006108087A2 (en) * 2005-04-05 2006-10-12 Cellpoint Diagnostics Devices and methods for enrichment and alteration of circulating tumor cells and other particles

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6012044845; Cancer Epidemiol. Biomarkers Prev., 12(2003) p.755-762 *
JPN6012044846; J. Surg. Res., 124(2005) p.216-224 *

Similar Documents

Publication Publication Date Title
JP2010527577A (ja) 検出方法
JP6106636B2 (ja) 2型腫瘍症(neoplasms−ii)の診断法
US10344334B2 (en) Method of diagnosing neoplasms
ES2692333T3 (es) Resolución de fracciones de genoma usando recuento de polimorfismos
US8299233B2 (en) Molecular in vitro diagnosis of breast cancer
TW201930598A (zh) 使用不含細胞之dna片段大小以測定複製數變異之方法
JP4435259B2 (ja) 微量胃癌細胞の検出法
CA3081061A1 (en) Method for using expression of klk2 to determine prognosis of prostate cancer
KR20100058421A (ko) 신규 발병 심부전증에 대한 개별 위험 평가용 전사체 바이오마커
WO2012093821A2 (ko) 초기유방암의 예후 예측용 유전자 및 이를 이용한 초기유방암의 예후예측 방법
JP4317854B2 (ja) 微量胃癌細胞の検出法
CN101457254B (zh) 用于肝癌预后的基因芯片和试剂盒
BR112020012280A2 (pt) composições e métodos para diagnosticar cânceres de pulmão usando perfis de expressão de gene
EP1683862B1 (en) Microarray for assessing neuroblastoma prognosis and method of assessing neuroblastoma prognosis
JP2014158468A (ja) 検出方法
AU2015203005B2 (en) A method of diagnosing neoplasms
Uchida Gene expression profiling for biomarker discovery
JP2019187361A (ja) メチル含有基修飾核酸を精製、分離または濃縮する方法
Delano et al. Genomics in Surgery, Trauma, and Critical Care: How Do We Control the Future?
Westbrook et al. Novel Targets for Diagnosis and Treatment of Breast Cancer Identified by Genomic Analysis

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150526

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20160202