発明の詳細な説明
当該出願は、2002年11月21日に出願され、「腎細胞癌および/または固形腫瘍の診断法」と題した米国仮出願番号60/427,982に開示される全てを、出典明示によって本明細書の一部とする。当該出願はまた、2003年4月3日に出願され、「腎細胞癌および/または固形腫瘍の診断法」と題した米国仮出願番号60/459,782に開示される全てを、出典明示によって本明細書の一部とする。それに加えて、「コピー1」、「コピー2」および「コピー3」のコンパクトディスクに記録された全ての資料を、出典明示によって本明細書の一部とする。各々のコンパクトディスクは、「AM101080L配列記載ST25テキストファイル」と題された配列記載ファイル(2206キロバイト、2003年11月20日に作成)を含む。
(技術分野)
本発明は、腎細胞癌および他の固形腫瘍の診断の方法、システムおよび設備に関する。
(背景技術)
腎細胞癌(RCC)は、全腎癌の症例の大部分を含み、先進国において最も一般的な癌の一つである。早期に発見された場合は、根治的な腎摘出によって、腎細胞癌患者の生存率は非常に良くなり得る。しかしながら、転移した腎細胞癌の患者の生存率は、劇的に低下する。それゆえに、腎細胞癌を早期に診断するための方法論、システムおよび設備を提供する必要がある。
腎細胞癌の患者は、しばしば非特異的な症状を呈するか、または完全に無症状である。実際に、有意な割合の腎病変が、非侵襲的画像化技術によって偶然発見されている。腎細胞癌の一般的なスクリーニング法が利用されているが、これらの方法は、幅広く適用するには、十分な感度および特異性に欠ける。最近の米国特許第6087098号は、RT−PCRに基づいて末梢血の試料におけるMN遺伝子の発現を検出する方法を一般的に記述している。MNタンパクは、悪性の腎細胞のマーカーと考えられている。それゆえに、末梢血においてMN遺伝子の発現を検出すれば、腎細胞癌の存在を示唆する。
本発明は、腎細胞癌、および/または前立腺癌および頭部/頸部の癌のような他の固形腫瘍の診断において、重大な進歩を示す。本発明の診断テストは、腫瘍細胞そのものよりもむしろ、末梢血細胞における遺伝子発現パターンを検出することを想定している。そのようなものとして、本発明は、固形腫瘍の進行を早い段階で幅広くスクリーニングすることを可能にする。
(発明の開示)
本発明は、腎細胞癌または他の固形腫瘍を有する患者の末梢血において、疾患のないヒトに比べて、特異的に発現している非常に多くの疾患遺伝子を同定する。これらの疾患遺伝子は、腎細胞癌または他の固形腫瘍の有無を検出するための代用的なマーカーとして用いられ得る。
本発明のある側面に従うと、腎細胞癌または他の固形腫瘍の診断に有用な方法が与えられる。本方法は、少なくとも一つのヒトの末梢血試料を供給する工程を含み、少なくとも一つのヒトの末梢血試料中の一つまたはそれ以上の遺伝子の発現プロフィールを、少なくとも一つの基準の一つまたはそれ以上の遺伝子の発現プロフィールと比較する工程を含む。もし一つまたはそれ以上の遺伝子が単一の遺伝子からなり、その遺伝子がIL1B、IL6、MMP−9およびFCGR3Bからなる群から選ばれないとすれば、さらに一つまたはそれ以上の遺伝子が二つの遺伝子からなり、二つの遺伝子がIL1BおよびIL6ではないとすれば、各々の一つまたはそれ以上の遺伝子は、疾患のないヒトのPBMCと比較して、固形腫瘍を有する患者のPBMCにおいて特異的に発現されている。
末梢血試料は、全血試料または濃縮した(enriched)末梢血単核細胞(PBMC)を含む試料であってよい。他の末梢血試料もまた、使用され得る。固形腫瘍は、例えば腎細胞癌、前立腺癌または頭部/頸部癌であってよい。調査されるヒトは、固形腫瘍を有していても良く、または固形腫瘍または他の疾患に罹患していなくても良い。
基準(reference)の発現プロフィールは、疾患のないヒトの末梢血試料における一つまたはそれ以上の遺伝子の発現プロフィールを含み得る。基準の発現プロフィールはまた、固形腫瘍を有する患者の末梢血試料における一つまたはそれ以上の遺伝子の発現プロフィールを含み得る。それに加えて、基準の発現プロフィールはまた、さらに他の固形腫瘍を有する患者の末梢血試料における一つまたはそれ以上の遺伝子の発現プロフィールを含み得る。調査されるヒトの発現プロフィールは、加重多数決アルゴリズム(weighted voting algorithm)を用いて、異なる基準の発現プロフィールと比較され得る。
調査されるヒトの発現プロフィールおよび基準の発現プロフィールは、定量的RT−PCR、ノーザンブロット、in situハイブリダイゼーション、サザンブロット、スロットブロッテイング、ヌクレアーゼ保護アッセイまたは核酸アレーを用いて決定し得る。発現プロフィールはまた、ELISA(酵素結合免疫吸着アッセイ)、RIA(放射免疫アッセイ法)、FACS(蛍光活性化細胞選別器)またはウエスタンブロットのような免疫アッセイ法を用いて決定し得る。それに加えて、2次元SDSポリアクリルアミドゲル電気泳動に基づいた方法が用いられ得る。
好ましい具体例として、一つまたはそれ以上の遺伝子は、遺伝子表4から選ばれる、少なくとも1,2,3,4,5,6,7,8,9,10,12,14,16,18,20またはそれ以上の遺伝子を含む。他の好ましい具体例として、一つまたはそれ以上の遺伝子は、遺伝子表6から選ばれる、少なくとも1,2,3,4,6,8,10,12,14,16,18,20またはそれ以上の遺伝子を含む。さらに他の好ましい具体例として、一つまたはそれ以上の遺伝子は、二重または多重相関計量アルゴリズムを用いて識別可能な分類子を含む。
さらに他の具体例として、一つまたはそれ以上の遺伝子は、EEF1A2、TLR2、BRF2、LGALS3、SNRPG、DKFZP586E1621、NUMA1、SOD2、AKR1B1、DUSP6、SMARCE1、KIAA0669、MSF、IL1RN、PTMA、KIAA0410、PSMD3、T54、C1QBPおよびOSR1からなる群から選ばれる、少なくとも1,2,3,4,5,6,7,8,9,10,12,14,16,18または20の遺伝子を含む。
さらなる具体例として、一つまたはそれ以上の遺伝子は、CD44、KIAA0410、MARCO、MAP3K8、NSP−CL、PIP5K1C、NRG1、RAB31、LGALS3、MEF2D、ITGA7、LHFPL2、ETS2、KHSRP、ENIGMA、UNK_AF038187、RAB13、TLR2、T54およびDUSP6からなる群から選ばれる、少なくとも1,2,3,4,5,6,7,8,9,10,12,14,16,18または20の遺伝子を含む。
さらに他の具体例として、一つまたはそれ以上の遺伝子は、CD44、CRADD、CCRL2、KIAA0837、KIAA0707、KIAA1113、EREG、UNK_AL050119、PPARD、CTSL、ATP2B1、UNK_AF052115、MITF、STAT3、KIAA0410、TPD52L2、UNK_AI732885、MARCO、LOC64116およびPDNP2からなる群から選ばれる、少なくとも1,2,3,4,5,6,7,8,9,10,12,14,16,18または20の遺伝子を含む。
その上にさらに他の具体例として、一つまたはそれ以上の遺伝子は、FABP5、SCYA20、ADM、COPEB、FCGR3B、UNK_M62896、FNI、HMOX1、ITGA7、DGCR5、CBP2、SLC1A4、MMP9、SLC16A3、LILRB3、FCGR1A、LHFPL2、PLEC1、S100A11、SPOP、CCR1、TLR2およびKIAA0750からなる群から選ばれる、少なくとも1,2,3,4,5,6,7,8,9,10,12,14,16,18、20またはそれ以上の遺伝子を含む。
他の具体例として、一つまたはそれ以上の遺伝子は、ADM、COPEB、AQP9、PTGS2、STIP1、SOD2、PDXK、IL1RN、ANXA5、IFIT4、IL1B、GRO1、PLAUR、NP、MMP9、SLC16A3、LILRB3、FCGR1A、LHFPL2、PLEC1、S100A11、SPOP、CCR1、TLR2、KIAA0750、CDC34、POLR2J、ETS2、MAD、GPR3、PIP5K1C、PRF1、PSMA7、INPP4A、TCFL1、DGAT、S100P、DOC−1R、C8FW、PDI2、GEF−2、TNNT1、BSG、IL17R、HK3、RALBP1、RNASE2、TPM1、BLVRB、APS、PPARD、NFE2、IL1RAP、S100A12、CD9、ENIGMA、HAGH、NCF1、FLOT1、ITGA2GB、KIAA0750、FKBP8、DUSP6およびCBFA2T3からなる群から選ばれる、少なくとも1,2,3,4,5,6,7,8,9,10,12,14,16,18、20またはそれ以上の遺伝子を含む。
さらに他の具体例として、一つまたはそれ以上の遺伝子は、NUMA1、CXCR4、IL10RA、M9、FAU、BRF2、RPS6、EEF1A2、BAG5、AKR1B1、UNK_AL022721、C1QBP、DKZP586E0820、NONO、PSMD3、UNK_N74607、UNK_AI743507、MAPKAPK5およびUNK_U79297からなる群から選ばれる、少なくとも1,2,3,4,5,6,7,8,9,10,12,14,16,18またはそれ以上の遺伝子を含む。
他の好ましい具体例として、一つまたはそれ以上の遺伝子は、少なくとも1,2,3,4,5,6,7,8,9,10,12,14,16,18,20またはそれ以上の遺伝子を含み、各々ストリンジェントな条件下でCPS表2から選ばれる異なるそれぞれの区分プローブ配列(CPS)にハイブリダイゼーションが可能なRNA転写産物を有する。ある特定の例として、一つまたはそれ以上の遺伝子が単一の遺伝子である場合は、遺伝子のRNA転写産物は、ストリンジェントな条件下でCPSs58、211、221および241からなる群から選ばれるCPSにハイブリダイズすることができない。他の特定の例として、一つまたはそれ以上の遺伝子が二つの遺伝子である場合は、二つの遺伝子のRNA転写産物は、ストリンジェントな条件下でCPSs211および241にハイブリダイズすることができない。
ある具体例として、一つまたはそれ以上の遺伝子は、少なくとも1,2,3,4,5,6,7,8,9,10,12,14,16,18または20の遺伝子を含み、各々ストリンジェントな条件下で、CPS1、CPS3、CPS4、CPS6、CPS18、CPS38、CPS53、CPS255、CPS256、CPS257、CPS258、CPS259、CPS260、CPS261、CPS262、CPS263、CPS264、CPS265、CPS266およびCPS267からなる群から選ばれる異なるそれぞれのCPSにハイブリダイゼーションが可能なRNA転写産物を有する。
他の具体例として、一つまたはそれ以上の遺伝子は、少なくとも1,2,3,4,5,6,7,8,9,10,12,14,16,18または20の遺伝子を含み、各々ストリンジェントな条件下で、CPSs1,3,4,5,6,7,9,10,11,16,28,31,268,264,279,280,281,282,283および284からなる群から選ばれる異なるそれぞれのCPSにハイブリダイゼーションが可能なRNA転写産物を有する。
さらに他の具体例として、一つまたはそれ以上の遺伝子は、少なくとも1,2,3,4,5,6,7,8,9,10,12,14,16,18または20の遺伝子を含み、各々ストリンジェントな条件下で、CPSs17,31,37,50,59,64,69,71,264、268,269,270,271,272,273,274,275,276,277および278からなる群から選ばれる異なるそれぞれのCPSにハイブリダイゼーションが可能なRNA転写産物を有する。
その上さらに他の具体例として、一つまたはそれ以上の遺伝子は、少なくとも1,2,3,4,5,6,7,8,9,10,12,14,16,18,20またはそれ以上の遺伝子を含み、各々ストリンジェントな条件下で、CPSs1,2,8,16,19,26,28,57,58,61,91,92,99,138,143,148,152,191,192,207,221,229,236および245からなる群から選ばれる異なるそれぞれのCPSにハイブリダイゼーションが可能なRNA転写産物を有する。
さらに他の具体例として、一つまたはそれ以上の遺伝子は、少なくとも1,2,3,4,5,6,7,8,9,10,12,14,16,18,20またはそれ以上の遺伝子を含み、各々ストリンジェントな条件下で、CPSs1,4,9,10,11,12,14,17,18,19,21,25,28,34,35,40,47,52,53,58,61,62,84,87,91,92,94,99,104,105,109,111,115,125,128,130,133,135,138,143,146,147,148,151,154,157,158,165,173,174,178,191,192,194,195,201,211,220,222,227,244,247および250からなる群から選ばれる異なるそれぞれのCPSにハイブリダイゼーションが可能なRNA転写産物を有する。
あるさらなる具体例として、一つまたはそれ以上の遺伝子は、少なくとも1,2,3,4,5,6,7,8,9,10,12,14,16,18またはそれ以上の遺伝子を含み、各々ストリンジェントな条件下で、CPSs107,131,255,256,258,259,265,266,285,286,287,288,289,290,291,292,293,294および295からなる群から選ばれる異なるそれぞれのCPSにハイブリダイゼーションが可能なRNA転写産物を有する。
さらに他の具体例として、一つまたはそれ以上の遺伝子は、少なくとも1,2,3,4,5,6,7,8,9,10,12,14,16,18,20またはそれ以上の遺伝子を含み、各々ストリンジェントな条件または核酸アレーハイブリダイゼーション条件下で、ATTACHMENT Aから選ばれる異なるそれぞれの限定子にハイブリダイゼーションが可能なRNA転写産物を有する。ある特定の例としては、一つまたはそれ以上の遺伝子が単一の遺伝子である場合は、遺伝子のRNA転写産物は、ストリンジェントな条件または核酸アレーハイブリダイゼーション条件下で、37148_at、39402_at、31859_atおよび38299_atからなる群から選ばれる限定子にハイブリダイズすることができない。他の特定の例として、一つまたはそれ以上の遺伝子が二つの遺伝子である場合は、二つの遺伝子のRNA転写産物は、ストリンジェントな条件または核酸アレーハイブリダイゼーション条件下で、限定子39402_atおよび38299_atにハイブリダイズすることができない。
本発明の他の側面に従うと、非血液疾患の診断および確診に有用な方法が与えられる。非血液疾患は、腎細胞癌、前立腺癌または頭部/頸部癌のような固形腫瘍であって良い。非血液疾患はまた、腎障害を引き起こし得る疾患を含めた非腫瘍性疾患であってよい。本方法は、少なくとも一つの非血液疾患を有するヒトの末梢血試料を供給し、少なくとも一つの末梢血試料における一つまたはそれ以上の遺伝子の発現プロフィールを、一つまたはそれ以上の遺伝子の少なくとも一つの基準の発現プロフィールと比較する工程を含み、その各々の一つまたはそれ以上の遺伝子は、疾患に罹患していないヒトのPBMCと比較して、非血液疾患を有する患者のPBMCにおいて特異的に発現している。
ある具体例として、一つまたはそれ以上の遺伝子は、遺伝子表4から選ばれる少なくとも1,2,3,4,5,6,7,8,9,10,12,14,16,18,20またはそれ以上の遺伝子を含み、末梢血試料は全血試料であるかまたは濃縮したPBMCを含む試料である。他の具体例として、基準の発現プロフィールは、非血液疾患を有していないかまたは疾患に罹患していないヒトの末梢血試料における一つまたはそれ以上の遺伝子の発現プロフィールを含む。さらに他の具体例として、非血液疾患を有する患者のPBMCにおける一つまたはそれ以上の遺伝子各々の平均発現量は、非血液疾患を有していないかまたは疾患に罹患していないヒトのPBMCより十分に高いか、または十分に低い。
本発明のさらに他の側面に従うと、基準のヒトの末梢血試料と比較して、非血液疾患の患者の末梢血試料において特異的に発現している遺伝子を識別するのに有用な方法が与えられる。本方法は、非血液疾患の患者の末梢血試料における一つまたはそれ以上の遺伝子の発現プロフィールを提供し、基準のヒトの末梢血試料における一つまたはそれ以上の遺伝子の基準の発現プロフィールを提供し、基準のヒトと比較して非血液疾患の患者において特異的に発現している遺伝子を識別するために、発現プロフィールを基準の発現プロフィールに比較する工程を含む。発現プロフィールおよび基準の発現プロフィールは、例えば末梢血試料から調製したcRNAまたはcDNAを一つまたはそれ以上の核酸アレーにハイブリダイズすることによって、決定し得る。基準のヒトは、疾患に罹患していないヒトであってよい。基準のヒトはまた、非血液疾患を有するが、調査される患者と異なる病期または異なる臨床反応を有し得る。ある具体例として、非血液疾患は固形腫瘍である。
本発明のその上さらに他の側面に従うと、腎細胞癌または他の固形腫瘍の診断に有用なキットが与えられる。ある具体例として、キットは、少なくとも1,2,3,4,5,6,7,8,9,10,15,20,25,30またはそれ以上のポリヌクレオチドを含み、各々のポリヌクレオチドは、ストリンジェントな条件下で、疾患に罹患していないヒトのPBMCと比較して固形腫瘍を有する患者のPBMCにおいて特異的に発現している異なる各々の遺伝子のRNA転写産物またはその相補体にハイブリダイズすることができる。他の具体例として、キットは、少なくとも1,2,3,4,5,6,7,8,9,10,15,20,25,30またはそれ以上の抗体を含み、各々の抗体は、疾患に罹患していないヒトと比較して固形腫瘍を有する患者のPBMCにおいて特異的に発現している異なる各々の遺伝子によってコード化された、ポリヌクレオチドに結合することができる。
本発明のさらに他の側面に従うと、非血液疾患の診断に有用なシステムが与えられる。非血液疾患は、腎細胞癌、前立腺癌または頭部/頸部癌のような固形腫瘍であって良い。本システムは、基準のヒトの末梢血試料における少なくとも一つの遺伝子の、一つまたはそれ以上の基準の発現プロフィールを格納するメモリーを含む。各々の遺伝子は、疾患に罹患していないヒトのPBMCと比較して、非血液疾患を有する患者のPBMCにおいて特異的に発現している。末梢血試料は、全血試料または濃縮したPBMCを含む試料であって良い。一つまたはそれ以上の基準の発現プロフィールは、疾患に罹患していないヒトの末梢血発現プロフィールを含み得る。一つまたはそれ以上の基準の発現プロフィールはまた、非血液疾患を有する患者の末梢血発現プロフィールを含み得る。それに加えて、一つまたはそれ以上の基準の発現プロフィールは、さらに他の非血液疾患を有する患者の末梢血発現プロフィールを含み得る。本システムは、さらに目的とする発現プロフィールを一つまたはそれ以上の基準の発現プロフィールと比較することのできるプログラム、およびそのプログラムを実行することのできる処理装置を含む。ある具体例として、そのプログラムは加重多数決アルゴリズムを使用する。
(図面の簡単な記載)
本出願書は、2003年11月21日に提出され、「腎細胞癌および他の固形腫瘍の診断法」と題した米国実用特許出願書において開示される全てを、全ての図面を含めて、出典明示によって本明細書の一部とする。
本図面は、実例を与えるものであり、その範疇を制限するものではない。
図1は、本発明において認識された腎細胞癌疾患遺伝子の統計的検証を描写している。
図2は、発現した遺伝子発現値を用いた試料の関係の樹状図を示す。
図3は、大きさを拡大したプレディクター遺伝子セットについてのトレーニングセットクロスバリデーションの結果を要約した図面である。
図4は、トレーニングセットにおける8つのプレディクター遺伝子のセットの相対的発現量を図示している。
図5Aは、図4において図示した8つのプレディクター遺伝子のセットを用いた、トレーニングセットにおける各々の試料についてのクロスバリデーション結果を説明している。
図5Bは、図4において図示した8つのプレディクター遺伝子のセットを用いた、腎細胞癌および正常PBMC試料の残りのテストセットについての予測結果を示す。
(詳細な説明)
1. 定義
本明細書において用いられる「CPS表2」は、表2に列挙される全区分プローブ配列(CPS)を指す。
「遺伝子表4」は、表4に列挙される全ての遺伝子を指す。
「遺伝子」は、少なくともそれから一つのRNA分子が転写し得る、ヒトゲノムにおけるDNA配列を指す。本発明において用いられる遺伝子は、ESTまたはmRNAデータによってその発現が支持される、仮定または推定遺伝子であって良い。
「疾患に罹患していないヒト」は、医学的処置または治療が必要となる、検出し得る何らかの癌または他の疾患を有さないヒトを指す。
「ストリンジェントな条件」は、少なくとも、例えば表1に示される条件GLと同等に厳しい。「非常にストリンジェントな条件」は、少なくとも、例えば表1に示される条件AFと同等に厳しい。表1に用いられているハイブリダイゼーションは、ハイブリダイゼーション条件(ハイブリダイゼーション温度および緩衝剤)下で約4時間実行され、続いて対応する洗浄条件(洗浄温度および緩衝剤)下で2回20分間洗浄する。
1:ハイブリッドの長さは、ポリヌクレオチドのハイブリダイゼーションのハイブリダイゼーションした領域について予想されたものである。ポリヌクレオチドを未知の配列の標的ポリヌクレオチドにハイブリダイズする場合、ハイブリッドの長さは、ポリヌクレオチドのハイブリダイゼーションのものと想定される。既知の配列のポリヌクレオチドをハイブリダイズする場合、ハイブリッドの長さは、ポリヌクレオチドの配列を整列し、最適の配列の相補性を有する領域または領域群を認識することによって、決定され得る。
H:SSPE(1×SSPEは、0.15Mの塩化ナトリウム、10mMのリン酸二水素ナトリウムおよび1.25mMのEDTA、pH7.4である)は、ハイブリダイゼーションおよび洗浄緩衝剤において、SSC(1×SSCは0.15Mの塩化ナトリウムおよび15mMのクエン酸ナトリウム)の代わりに用いられ得る。
T
B *−T
R *:長さが50塩基対未満であると予想されるハイブリッドのハイブリダイゼーション温度は、ハイブリッドの融解温度(T
m)より5−10度低くあるべきであり、T
mは次の等式に従って決定される。長さが18塩基対未満のハイブリッドについては、T
m(℃)=2(Aの♯+T塩基)+4(Gの♯+C塩基)である。長さが18および49塩基対の間のハイブリッドについては、T
m(℃)=81.5+16.6(log
10Na
+)+0.41(%G+C)−(600/N)であり、Nはハイブリッドにおける塩基数であり、Na
+はハイブリダイゼーション緩衝剤(1×SSCについてのNa
+=0.165M)中のナトリウムイオンのモル濃度である。
本発明の様々な側面は、次の節および小節でさらに詳細に記述している。節および小節の利用は、本発明の範疇を制限するものではなく、各々の節および小節は本発明のあらゆる側面に適用して良い。
II.発明
本発明は、末梢血における遺伝子発現パターンを検出することによって、腎細胞癌および他の固形腫瘍を診断する方法を提供する。本発明は、疾患に罹患していないヒトと比較して、腎細胞癌患者の末梢血において特異的に発現している、多量の腎細胞癌疾患遺伝子を同定する。少なくともこれら腎細胞癌疾患遺伝子の部分集合はまた、前立腺癌および頭部/頸部の癌のような他の固形腫瘍において特異的に発現している。それゆえに、これらの遺伝子は、腎細胞癌および/または他の固形腫瘍の有無を検出するための代用的なマーカーとして用いられ得る。ある具体例として、末梢血におけるこれらの遺伝子の発現パターンは、末梢血試料においてこれらの遺伝子のRNA転写産物の量を評価することによって決定され得る。末梢血試料は、全血試料であるか、または濃縮したPBMCを含む血液試料であって良い。RNA量を検出するための適当な方法には、定量的RT−PCR、ノーザンブロット、in situハイブリダイゼーション、サザンブロット、スロットブロッテイング、ヌクレアーゼ保護アッセイまたは核酸アレーを含むが、それだけに限定されるものではない。他の具体例として、遺伝子発現パターンは、固形腫瘍の疾患遺伝子によってコード化されるポリペプチドの量を検出することによって決定し得る。適当な方法には、ELISA(酵素結合免疫吸着アッセイ)、RIA(放射免疫アッセイ法)、FACS(蛍光活性化細胞選別器)またはウエスタンブロットを含むが、それだけに限定されるものではない。2次元SDSポリアクリルアミドゲル電気泳動に基づいた方法もまた用いられ得る。
A.末梢血における腎細胞癌および他の固形腫瘍の疾患遺伝子の認識の一般的方法
DNAマイクロアレー、プロテオミックスおよび生命情報科学のような、新しい技術上の発達と共に、ヒトゲノム配列が利用できれば、様々な疾患についての体系的な遺伝子発現の研究が可能となる。本発明は、体系的遺伝子発現分析技術を使用し、遺伝子、および/または腎細胞癌、前立腺癌および頭部/頸部の癌のような固形腫瘍を有する患者の末梢血において特異的に発現しているマーカーを認識する。これらの遺伝子は、本明細書において「固形腫瘍疾患遺伝子」と呼んでいる。特に、疾患に罹患していないヒトに比べて、腎細胞癌患者の末梢血に特異的に発現している遺伝子は、「腎細胞癌疾患遺伝子」と呼ばれている。
固形腫瘍の疾患遺伝子は、疾患に罹患していないヒトに比べて、固形腫瘍の患者の末梢血において、過剰に発現しているかまたは発現不足(無発現を含めて)のいずれかである。それゆえに、固形腫瘍の疾患遺伝子は、固形腫瘍の患者の遺伝子発現のパターンを、疾患に罹患していないヒトの対応する遺伝子の発現パターンと比較することによって同定できる。遺伝子の発現パターンの検出および比較の方法は、当業者によく知られている。
ある具体例として、遺伝子の発現パターンは、末梢血におけるRNA転写産物濃度を測定することによって検出される。例えば、全RNAまたはポリARNAは、末梢血試料から単離しえる。本明細書で用いられている、ポリヌクレオチド、ポリペプチド、細胞または血液試料のような生物学的試料は、生物学的試料が本来の環境から除去されていれば単離されたことになる。例えば、ポリヌクレオチドまたはポリペプチドは、精製または抽出工程を通して単離される。血液試料は、人体から除去された場合に単離されたことになる。
単離したRNAは、その後増幅させてcDNAまたはcRNAを生成する。末梢血試料における遺伝子発現の濃度は、対応するcDNAまたはcRNAの量を測定することによって決定し、その後増幅し得る。
ある典型的増幅プロトコールでは、逆転写酵素を用いる。例えば、単離したmRNAは、最初に逆転写酵素、およびオリゴd(T)およびファージT7プロモーターをコードする配列からなるプライマーを用いてcDNAに逆転写し得る。こうして生成したcDNAは一本鎖である。cDNAの二番目の鎖はDNAポリメラーゼを用いて合成し、RNAアーゼと結合してDNA/RNAハイブリッドを分離する。二本鎖cDNAの合成後、T7RNAポリメラーゼを付加し、cRNAをその後二本鎖cDNAの二番目の鎖から転写される。
他の具体例として、遺伝子の発現パターンは、末梢血におけるポリペプチド濃度を測定することによって分析し得る。末梢血試料におけるポリペプチド量は、当業者によく知られた様々な方法を用いて検出し得る。適当な方法には、ELISA、RIA、FACSおよびウエスタンブロットのような免疫アッセイを含むが、それだけに限定されない。2次元ゲル電気泳動および質量分光測定に基づいた方法のような、高速タンパク質配列決定および同定の方法もまた用いられ得る。
好ましい具体例として、RNAまたはポリペプチドの単離のために用いられる末梢血試料は、濃縮するかまたは精製した末梢血単核細胞(PBMC)を含む。濃縮したPBMCを有する血液試料を調製する方法は、当該分野においてよく知られている。例えば、ヒトの患者から単離した全血は、Ficoll勾配法またはCPTs(細胞精製管)によって遠心分離に付すことができ、濃縮したPBMCを含む断片が収集される。「濃縮した」は、試料中のPBMCのパーセンテージが、最初の全血より高いことを意味する。例えば、濃縮した試料におけるPBMCのパーセンテージは、最初の全血より少なくとも2倍、3倍、4倍、5倍またはそれ以上高い。ある具体例として、全血は固形腫瘍の疾患遺伝子を選別するために、直接用いられ得る。
他の好ましい具体例として、cDNAのようなポリヌクレオチドアレーまたはオリゴヌクレオチドアレーは、固形腫瘍患者の末梢血における遺伝子発現プロフィールを検出し、さらに/または疾患に罹患していないヒトと比較するために用いられ得る。ポリヌクレオチドアレーは、多量の遺伝子のRNA転写産物の濃度を一度に定量的に検出し、調整することを可能にする。この大規模な遺伝子発現分析に適したポリヌクレオチドアレーには、Affimetrix社(Santa Clara、CA)のジーンチップ(商標登録)アレー、またはAgilent Technology社(Palo Alto、CA)のcDNAマイクロアレーのような市販で入手できるアレーを含むが、それだけに限定されない。
マイクロアレーにハイブリダイズするポリヌクレオチドは、一つまたはそれ以上の標識部分によって標識することができ、ハイブリダイゼーションしたポリヌクレオチド複合体の検出を可能にしている。標識部分には、分光器的、光化学的、生化学的、生物電子工学的、免疫化学的、電気的、光学的または化学的方法によって検出し得る組成物を含む。標識部分には、放射性同位体、化学ルミネセンス化合物、標識した結合タンパク質重金属原子、蛍光マーカーおよび色素のような分光器のマーカー、磁気標識、結合した酵素、質量分光測定タグ、スピン標識、電子輸送体および受容体、およびその類似物を含む。マイクロアレーにハイブリダイズするポリヌクレオチドは、DNAまたはRNAのいずれかであって良い。
ハイブリダイゼーション反応は、絶対的または差別的ハイブリダイゼーションの形式で行われ得る。絶対的ハイブリダイゼーションの形式において、腎細胞癌患者または疾患に罹患していないヒトの末梢血試料のような、一つの試料に由来するポリヌクレオチドは、マイクロアレーにおいてプローブにハイブリダイゼーションされる。ハイブリダイゼーション複合体の形成後に検出されるシグナルは、試料におけるポリヌクレオチド濃度に対応する。特異的なハイブリダイゼーションの形式において、固形腫瘍患者の試料および疾患に罹患していないヒトの試料のような、二つの生物学的試料に由来するポリヌクレオチドは、異なる標識部分によって標識される。これらの異なった形で標識したポリヌクレオチドの混合物を、マイクロアレーに付加する。マイクロアレーは、その後二つの異なる標識からの放出が個別に検出可能な条件下で検査される。ある具体例として、蛍光物質Cy3およびCy5(Amersham Pharmacia Biotech、Piscataway N.J.)は、特異的なハイブリダイゼーションの形式に対する標識部分として用いられる。
マイクロアレーから集めたシグナルは、Affimetrix社またはAgilent Technology社によって供給されるような、市販で入手可能なソフトウェアを用いて分析し得る。スキャン感受性、プローブ標識およびcDNAの定量のための対照群が、好ましくは、ハイブリダイゼーション実験に含まれる。マイクロアレー発現シグナルは、さらなる分析にふす前に、測定し、または標準化し得る。例えば、各々の遺伝子に対する発現シグナルは、一つ以上のアレーが類似した検査条件下で用いられる場合は、ハイブリダイゼーション強度の変異を考慮に入れるために標準化し得る。個別のポリヌクレオチド複合体ハイブリダイゼーションについてのシグナルはまた、各々のアレー上に含まれる内部標準化対照群に由来する強度を用いて標準化し得る。それに加えて、試料全てについて発現レベルに比較的一致した遺伝子は、他の遺伝子の発現レベルを標準化するために用いられ得る。ある具体例として、遺伝子の発現レベルは、平均が0で標準偏差が1であるような試料全てについて標準化される。他の具体例として、マイクロアレーによって検出された発現データは、全ての試料について最小限のまたは重要でない変異を示す遺伝子を排除する変異フィルターに付される。
固形腫瘍の患者の末梢血における遺伝子発現プロフィールは、疾患に罹患していないヒトの末梢血試料における対応する遺伝子の発現プロフィールと比較し得る。疾患に罹患していないヒトと比較して、固形腫瘍患者において特異的に発現している遺伝子を同定する。好ましくは、固形腫瘍の疾患遺伝子の発現レベルは、疾患に罹患していないヒトにおいてよりも、固形腫瘍患者において十分に高いかまたは低い。「十分に高い」とは、固形腫瘍患者の末梢血試料における平均遺伝子発現レベルが、疾患に罹患していないヒトの末梢血試料における平均遺伝子発現レベルよりも少なくとも1.5倍高いことを意味する。例えば、固形腫瘍患者における平均発現レベルは、疾患に罹患していないヒトにおける平均発現レベルよりも、少なくとも2倍、3倍、4倍、5倍、10倍、20倍またはそれ以上高くて良い。「十分に低い」とは、固形腫瘍患者の末梢血試料における遺伝子の平均発現レベルが、疾患に罹患していないヒトの末梢血試料における遺伝子の平均発現レベルの0.67倍よりも高くないことを意味する。例えば、固形腫瘍患者における平均発現レベルは、疾患に罹患していないヒトにおける平均発現レベルの0.5倍、0.33倍、0.25倍、0.1倍、0.05倍またはそれ未満より高くない。
ある具体例として、固形腫瘍の疾患遺伝子は、マイクロアレー遺伝子発現データに基づいたクラスタリングアルゴリズムを用いて同定し得る。例えば、管理されていない(unsupervised)クラスター分析は、異なる発現パターンを有する遺伝子を分析し、分類し、それによって固形腫瘍の疾患遺伝子を同定するために用いられ得る。管理されていないクラスター分析についてのアルゴリズムには、自己組織化マップ(SOMs)、主成分分析、平均結合クラスタリングおよび階層クラスタリングを含むが、それだけに限定されない。
管理されていないクラスター分析はまた、固形腫瘍の疾患遺伝子を組織化し、同定するために使用される。管理されていないクラスター分析の下では、遺伝子発現パターンの由来するもとの病態はすでに知られている。管理されていないクラスター分析についてのアルゴリズムには、最近隣者分析法、サポートベクターマシーンおよびSPLASHを含むが、それだけに限定されない。二重または多重相関測定法のいずれかが用いられ得る。
好ましい具体例として、並べ替え検定に基づく近隣者分析は、固形腫瘍の疾患遺伝子を同定するために、マイクロアレー遺伝子発現データを分析するために用いられる。近隣者分析についてのアルゴリズムは、T.R.Golubら、Science、286;531−537(1999)およびD.K.Slonimら、Procs.of the Fourth Annual International Conference on Computational Morecular Biology、東京、日本、4月8−11、p263−272(2000)に記述されており、両方とも出典明示によって本明細書の一部とする。
近隣者分析のある形式の下で、各々の遺伝子の発現プロフィールを、e1が一番目の試料の遺伝子「g」の発現レベルに対応する、発現ベクターg=(e1,e2,e3,・・・,en)によって表現されている。クラスの区分は、c1=1または−1であり、それは一番目の試料がクラス0またはクラス1のどちらから単離されるかに依存するところの、同定された発現パターンc=(c1,c2,c3,・・・,cn)によって表現されている。クラス0は、腎細胞癌のような特定の固形腫瘍を有する患者からなっていてよく、クラス1は疾患に罹患していないヒトを表していて良い。クラス0はまた、異なる固形腫瘍を有する患者からなっていてもよい。
遺伝子「g」のクラス区分に対する相関は、シグナルノイズスコア:
[式中、x0(g)およびx1(g)は、それぞれクラス0およびクラス1における遺伝子「g」の発現レベルの対数を表し、sd0(g)およびsd1(g)は、それぞれクラス0およびクラス1における遺伝子「g」の発現の対数の標準偏差を表す]
を用いて算出され得る。シグナルノイズスコアの絶対値の高さは、対応する遺伝子が、他方のクラスよりも一方のクラスにおいてより高く発現していることを示す。無作為パターンと比較して、クラス区分の近隣者中の異常に高い密度の遺伝子は、多くの遺伝子がクラス区分と有意に相関する発現パターンを有していることを示唆している。
多くの固形腫瘍の疾患遺伝子が、近隣者分析を用いて選別され得る。ある具体例として、このようにして選別された各々の固形腫瘍の疾患遺伝子は、固形腫瘍患者のPMBCsにおいて、疾患に罹患していないヒトのPBMCよりも十分高いか、または十分低い発現レベルを有している。他の具体例として、選別した固形腫瘍の疾患遺伝子はP(g,c)の最大絶対値を有する。さらに他の具体例として、選別した固形腫瘍の疾患遺伝子には、(腎細胞癌患者のような)クラス0において高く発現している遺伝子、および(疾患に罹患していないヒトのような)クラス1において高く発現している遺伝子を共に含む。本発明において選別した固形腫瘍の疾患遺伝子は、異なる生物学的経路または機構に含まれ得る。
ある具体例として、選別した固形腫瘍の疾患遺伝子の数は、並べ替え検定によって、1%または2%有意水準のように、有意に相関することが示されるものに限られる。本明細書において用いられている、x%の有意水準は、x%の無作為近隣者が、全クラス区分における実際の近隣者と同数の遺伝子を含むことを意味する。
固形腫瘍の疾患遺伝子を同定する一般的な方法は、末梢血またはPBMCにおける発現レベルが、固形腫瘍の異なる発生、進行、治療と相関している、遺伝子を同定するために用いられ得る。患者は、異なる発生または治療期に基づいてグループ化され得る。大規模な遺伝子発現分析は、他の段階と比べて、ある段階において特異的に発現する遺伝子を探すために使用して良い。このようにして同定された遺伝子は、固形腫瘍の進行または治療をモニターするためのマーカーとして用いられ得る。
腎細胞癌疾患遺伝子の同定
ある具体例として、HG−U95Av2遺伝子チップ(Affymetrixによって製造されている)が、腎細胞癌患者および疾患に罹患していないヒトから調製したPBMC濃縮末梢血試料におけるRNA転写産物の濃度を検出し、比較するために用いられる。表2は、HG−U95Av2遺伝子チップ上の限定子の例を列挙している。各々の限定子は、遺伝子チップ上の別々の領域に安定に結合している、多数のオリゴヌクレオチドプローブを表す。出典明示によって本明細書の一部とするところの、ATTACHMENT Aは、限定子および対応するオリゴヌクレオチドプローブの例を列挙している。表2中の各々の限定子は、疾患に罹患していないヒトと比較して、腎細胞癌患者の末梢血において特異的に発現している、少なくとも一つの腎細胞癌の疾患遺伝子に対応している。一般に、限定子の対応する腎細胞癌の疾患遺伝子は、ストリンジェントな条件または核酸アレーハイブリダイゼーション条件下で、ATTACHMENT Aにおいて同じ限定子の下に記載されているオリゴヌクレオチドプローブに、ハイブリダイズすることができる。
表2において各々の限定子の下に記載した配列番号は、対応する腎細胞癌の疾患遺伝子の、cDNAまたはゲノム配列、またはそれらの相補的配列を示している。配列番号の断片は、対応する腎細胞癌の疾患遺伝子のRNA転写産物を検出するためのオリゴヌクレオチドプローブを作るために用いられ得る。ATTACHMENT Aには、このようにして作られたオリゴヌクレオチドプローブのいくつかの例を含む。
各々の配列番号は、対応するEntrezヌクレオチド配列データーベースアクセッション番号を有する。配列番号および対応するアクセッション番号は、表3に図示している。Entrezヌクレオチド配列データーベースは、国立バイオテクノロジー情報センター(NCBI)、国立医学図書館、ワシントンD.C.アメリカによって管理されている。データーベースは、一般に知られており、容易に利用できる。Entrezヌクレオチド配列データーベースは、遺伝子バンク、EMBLおよびDDBI由来の配列データを含む。各々の配列番号の下に記載した配列は、対応するEntrezアクセッション番号の下に開示されている配列に由来してよい。
配列番号の不明瞭なヌクレオチド残基(「n」)は、当業者によって認められている方法を用いて決定し得る。例えば、不明瞭な残基は、配列番号に対応する遺伝子を整列させることによって決定し得る。これらの遺伝子の配列は、様々なヒトゲノム配列データーベースから得ることができる。不明瞭なヌクレオチド残基はまた、対応する配列番号、または対応するEntrezアクセッション番号の下の配列を再び配列決定することによって決定し得る。一般に、各々の不明瞭な位置は、a、c、gまたはtから選ばれる少なくとも一つのヌクレオチドを表すか、またはヌクレオチド残基を含まないかのいずれかである。
各々の限定子は、同じ限定子の下に記載した配列番号に由来する、対応する区分プローブ配列(CPS)を有する。対応するCPSは、少なくとも配列番号の一部またはそれらの相補的配列からなる。好ましくは、各々のCPSは、不明瞭なヌクレオチド残基を全く含まない。より好ましくは、各々のCPSは、ATTACHMENT A中の対応する限定子の下に記載した、少なくとも一つのオリゴヌクレオチドプローブを含む。各々のCPSは、ストリンジェントな条件または非常にストリンジェントな条件の下で、対応する限定子によって表された腎細胞癌の疾患遺伝子のRNA転写産物に、ハイブリダイズすることができる。表2に記載した全てのCPSは、集合的にCPS表2と呼ばれている。
mRNAのような、RNA転写産物は、腎細胞癌患者および疾患に罹患していないヒトのPBMC濃縮末梢血試料から単離され得る。その後cRNAは、Affymetrix発現分析技術マニュアルに記述されているプロトコールを用いて調製し得る。本明細書の小節Gは、試料調製、HG−U95Av2遺伝子チップハイブリダイゼーションおよびその後のデータ分析についての、詳細な実施例を提供している。
ハイブリダイゼーションシグナルは、遺伝子チップ上の各々のオリゴヌクレオチドプローブについて収集される。同一の限定子を有するオリゴヌクレオチドプローブについてのシグナルは、平均化される。疾患のない人の試料と比較して、腎細胞癌の試料において、異なるハイブリダイゼーションシグナルを生成する限定子を同定する。同定した限定子の例は、表2に記載している。
表2(「腎細胞癌患者中の平均化した発現レベル」)中の各々の腎細胞癌の発現プロフィールは、45人の腎細胞癌患者の平均であり、一方各々の疾患に罹患していないヒトについての発現プロフィール(「疾患に罹患していないヒトの平均化した発現レベル」)は、20人の疾患に罹患していないヒトの平均である。表2における各々の限定子の下の平均化した発現レベルは、対応する腎細胞癌の疾患遺伝子のRNA転写産物の濃度を表す。対応する疾患に罹患していないヒトの発現プロフィールに対する各々の腎細胞癌発現プロフィールの比率は、以下で「フォールドチェンジ」として与えられる。各々の限定子のスチューデントのt検定(両側分布、分散の同一でない二つの試料)の有意確率もまた与えられる。有意確率は、腎細胞癌の発現プロフィールおよび対応する疾患に罹患していないヒトの発現プロフィールの間の相違の統計的有意性を示唆している。有意確率が低いことは、腎細胞癌患者および疾患に罹患していないヒトの間に観察される相違についてのより統計的に有意であることを示している。
表2における各々の限定子は、疾患に罹患していないヒトと比較して、腎細胞癌患者の末梢血において特異的に発現している、少なくとも一つの腎細胞癌の疾患遺伝子を表している。腎細胞癌の疾患遺伝子のRNA転写産物は、ストリンジェントな条件または核酸アレーハイブリダイゼーション条件の下で、対応する限定子にハイブリダイズすることができる。本明細書において用いられている、「限定子にハイブリダイズする」は、ATTACHMENT Aにおいて限定子の下に記載されている、少なくとも一つのオリゴヌクレオチドプローブに、ハイブリダイズすることを意味する。例えば、腎細胞癌の疾患遺伝子のRNA転写産物は、ストリンジェントな条件または核酸アレーハイブリダイゼーション条件の下で、ATTACHMENT Aにおける対応する限定子の下に記載されている、少なくとも2、4、6、8、10、12、14または16のオリゴヌクレオチドプローブに、ハイブリダイズすることができる。腎細胞癌の疾患遺伝子のRNA転写産物はまた、ストリンジェントな条件または非常にストリンジェントな条件下で、対応する限定子のCPSにハイブリダイズすることができる。
表2の限定子およびCPSによって表される腎細胞癌の疾患遺伝子は、Affymetrixによって提供されるHG−U95Av2遺伝子チップの注釈に基づいて決定し得る。それらはまた、当業者に認められているように、表3に記載したEntrezアクセション番号に基づいて決定され得る。それに加えて、腎細胞癌の疾患遺伝子の同定は、ヒトゲノム配列データーベースに対する、表2またはATTACHMENT Aに記載されているもののような、対応するCPSまたはオリゴヌクレオチドプローブを、BLAST検索することによって評価し得る。この目的に対して適当なヒトゲノム配列データーベースには、NCBIで管理されるEntrezヒトゲノムデーターベースを含むが、それだけに限定されない。Entrezヒトゲノムデーターベースは、全ヒトゲノム配列の約97.8%を含み、その中で約63%が完成配列であり、約34.8%が未完成配列である。NCBIは、「blastn」のような、その配列データーベースをBLAST検索するための公共的に利用可能なBLASTプログラムを提供する。
各々のCPSは、対応する腎細胞癌の疾患遺伝子のタンパク質コード鎖によって整列する。好ましくは、各々のCPSは、少なくとも97%の配列認識によって、対応する腎細胞癌の疾患遺伝子は整列する。各々のCPSは、ストリンジェントな条件または非常にストリンジェントな条件下で、対応する腎細胞癌の疾患遺伝子にハイブリダイズすることができる。表4は、CPSおよび対応する腎細胞癌の疾患遺伝子を記載している。表4において記載されている全ての遺伝子は、集合的に「遺伝子−表4」と呼ばれている。
CPS1は、トルライクレセプター2をコード化したTLR2に対応する。TLR2は、LocusID:7097を有し、4番染色体に局在し、細胞遺伝学的位置は4q32と報告されている。TLR2遺伝子によってコード化されたタンパク質は、病原体認識および先天性の免疫の活性化において基本的な役割を果たすと考えられている、トルライクレセプター(TLR)ファミリーの一員である。TLRsは、黄色ショウジョウバエからヒトに至るまで高度に保存されており、構造的および機能的類似点を共有している。それらは、感染性病原体上に発現している病原体関連分子パターン(PAMPs)を認識し、効果的な免疫の発達のために必要なサイトカインの生成を媒介する。様々なTLRsは、異なる発現パターンを示す。TLR2は、末梢血白血球において豊富に発現していて、NF−カッパーBの刺激を介して、グラム陽性細菌および酵母菌に対する宿主反応を媒介すると報告されている。TLR2はまた、アポトーシスのシグナルを媒介する。
CPS2は、溶質キャリアファミリー1(グルタミン酸/中性アミノ酸輸送体)のメンバー4をコード化した、SLC1A4に対応している。SLC1A4は、LocusID:6509を有し、2番染色体に局在し、細胞遺伝学的位置は2p15−p13と報告されている。遺伝子産物は、ナトリウム依存性中性アミノ酸輸送体であり、独立した塩化物イオンチャネル活性を有する。それは中性アミノ酸プールの平衡を保つ機能を果たす可能性がある。
CPS3は、レクチン、ガラクトシド結合、可溶性、3(ガレクチン3)をコード化したLGALS3に対応する。LGALS3は、LocusID:3958を有し、14番染色体に局在し、細胞遺伝学的位置は14q21−q22と報告されている。LGALS3は、細胞成長の調節に関わる可能性がある。
CPS4は、二元特異性ホスファターゼ6をコード化したDUSP6に対応する。DUSP6は、LocusID:1848を有し、12番染色体に局在し、細胞遺伝学的位置は12q22−q23と報告されている。
DUSP6遺伝子によってコード化されたタンパク質は、二元特異性タンパク質ホスファターゼサブファミリーの一員である。これらのホスファターゼは、ホスホセリン/トレオニンおよびホスホチロシン残基両方を脱ホスホリル化することによって、標的のキナーゼを不活化する可能性がある。それらは、細胞増殖および分化と関連する、分裂活性化タンパク質(MAP)キナーゼスーパーファミリー(MAPK/ERK、SAPK/JNK、p38)の一員を、負の方向に調節する可能性がある。二元特異性ホスファターゼのファミリーの異なる一員は、様々なMAPキナーゼに対する明確な基質特異性、異なる組織分布および細胞内局在、および細胞外の刺激による発現誘導の異なる方法を示す。DUSP6遺伝子産物はERK2を不活化し、様々な組織において発現しており、心臓および膵臓において高い発現レベルであり、細胞室内に局在していることが報告されている。二元特異性タンパク質ホスファターゼ6は、MAPキナーゼを選択的に脱ホスホリル化し、不活化する可能性がある。
CPS5は、KHタイプスプライシング調節タンパク質(FUSE結合タンパク質2)をコード化した、KHSRPに対応する。KHSRPはLocusID:8570を有し、19番染色体に局在し、細胞遺伝学的位置は19p13.3と報告されている。KHSRP遺伝子産物は、多数タンパク質複合体の成分であり、SRCのN1エクソンのスプライシングに関わっている可能性がある。CPSに整列したゲノム配列(19番染色体のヌクレオチド544983から544793)は、KHSRPのポリペプチドコード配列に3'局在する。このゲノム配列はまた、LOC125980のポリペプチドコード配列に3'局在する。LOC125980は、補体C3前駆体(ヒト)に類似したタンパク質をコード化する。細胞遺伝学的局在は19q13.3と報告している。
配列番号241(AA628946)のヌクレオチド1−501は、KHSRPと約99%同一な配列を有する。結果として、配列番号241は、KHSRPの発現プロフィールを検出するためのプローブを構築するために用いられ得る。配列番号241(AA628946)のヌクレオチド1−286はまた、推定される遺伝子LOC138679のポリペプチドコード配列の近傍のゲノム配列と、約89−93%同一な配列を示す。LOC138679は、KHタイプスプライシング調節タンパク質(FUSE結合タンパク質2)に類似したタンパク質およびKHタイプスプライシング調節タンパク質(FUSE結合タンパク質2)をコード化する。LOC138679は、9番染色体に局在し、細胞遺伝学的位置は9p21.1と報告されている。
CPS6は、T54タンパク質をコード化した、T54に対応する。T54はLocusID:27238を有し、X染色体に局在し、細胞遺伝学的位置はZp11.23と報告されている。T54タンパク質は、S.cerevisiaeのSpp2pに類似性の低い領域を有する。
CPS7はRAB13、RASオンコジーンファミリーのメンバーに対応する。RAB13はLocusID:5872を有し、1番染色体に局在し、細胞遺伝学的位置は1q21.2と報告されている。RAB13遺伝子産物は、GTP−結合タンパク質13として知られており、小胞輸送に関わっている可能性がある。それが小さいGTPアーゼのRABファミリーのメンバーである。配列番号7(X75593)のヌクレオチド106−1212はまた、12番染色体上に局在したゲノム配列に整列し、細胞遺伝学的位置は12q13と報告されている。
CPS8は、22番染色体上のディジョージ症候群責任領域5のゲノム配列(DGCR5)に対応する。対応しているゲノム配列は、推定される遺伝子LOC128966(炭酸脱水酵素15に類似)のコード配列の3'局在する。LOC128966は、LocusID:9993を有し、細胞遺伝子の位置22q11.1に局在している。
CPS8はまた、22番染色体上の推定される遺伝子LOC91208の近傍のゲノム配列に、約97%同一な配列を示す。LOC91208は、細胞遺伝子の位置が22q11.21と報告されている。
X91348(配列番号8)のBLAST検索は、22番染色体上に局在している対応するゲノム配列を示す。ゲノム配列は、推定される遺伝子LOC200301(KIAA1647タンパク質に類似)およびディジョージ症候群遺伝子A(DGS−A)を含む。DGS−AはLocusID:25787を有する。22q11.2の近傍の領域の欠失は、頭字語CATCH22の下で分類された、広範な発達不全(特にディジョージ症候群、口蓋・心・顔面症候群、錐体・脳幹変性顔面症候群および孤発性錐体・顔面・心不全)に関連してきた。
それに加えて、X91348のヌクレオチド132ないし699の断片は、カドヘリン、EGF LAG7回貫通型Gタイプ受容体1(フラミンゴ様、キイロショウジョウバエ)をコード化するCELSR1に91%同一な配列を有する。CELSR1はLocusID:9620を有し、また22番染色体上に局在している。
CPS9は、エニグマ(LIMドメインタンパク質)をコード化する、ENIGMAに対応する。ENIGMAはLocusID:9260を有し、5番染色体に局在し、細胞遺伝学的位置は5q35.3と報告されている。この遺伝子によってコード化されるタンパク質は、保存されたPDZおよびLIMドメインからなるタンパク質のファミリーの代表である。LIMドメインは、遺伝子転写および発現を含めた様々な文脈において、および細胞骨格の相互作用において、タンパク質−タンパク質認識において機能すると提案されている。ENIGMA遺伝子産物のLIMドメインは、タンパク質キナーゼに結合する可能性があるのに対して、PDZドメインはアクチンフィラメントに結合する可能性がある。遺伝子産物は、ret/ptc2分裂促進シグナルの伝達に不可欠なアクチンフィラメント結合複合体の重合に関わっている可能性がある。ENIGMA遺伝子産物の生物学的機能は、PDZドメインが、LIM結合タンパク質を、骨格筋および非筋肉組織両方のアクチンフィラメントに局在させるアダプター機能であると提案されている。また、ENIGMA遺伝子産物はインスリン受容体(INSR)に結合できることが報告されている。
CPS9はまた、エニグマ(LIMドメインタンパク質)に類似したタンパク質をコード化するLOC220783に約99%同一な配列を有する。LOC220783は、5番染色体に局在し、細胞遺伝学的位置は5q35.3と報告されている。
CPS10は、v−ets赤芽球症ウィルスE26オンコジーン類似物2(鳥類)をコード化するETS2に対応する。ETS2はLocusID:2114を有し、21番染色体上に局在し、細胞遺伝学的位置は21q22.2と報告されている。ETS2遺伝子産物は、転写因子であると考えられており、ダウン症候群におけるいくつかの骨格の異常において役割を果たしている可能性がある。
CPS11は、ホスファチジルイノシトール4リン酸5−キナーゼ、タイプ1、ガンマをコード化するPIP5KICに対応する。PIP5KICはLocusID:23396を有し、19番染色体上に局在し、細胞遺伝学的位置は19p13.3と報告されている。
CPS12は、転写因子様1をコード化する、TCFL1に対応する。その遺伝子はLocusID:6944を有し、1番染色体に局在し、細胞遺伝学的位置は1q21と報告されている。推定される遺伝子LOC148320のコード配列は、TCFL1中に局在している。LOC148320はまた、CPS12によって整列される。
CPS13は、ホモサピエンスの肝臓の不明なオーファンについてのmRNAに由来し得る。CPS13に対応し、CPSに対するストリンジェントな条件下でハイブリダイゼーションできるRNA転写産物を生成する仮定的遺伝子は、本明細書においてUNK−AF055000と呼ばれている。
CPS14は、インターロイキン1受容体アクセサリータンパク質をコード化する、IL1RAPに対応する。その遺伝子はLocusID:3556を有し、3番染色体に局在し、細胞遺伝学的位置は3q28と報告されている。遺伝子産物はIL−1RI(IL1R1)に対する共受容体である。
CPS15は、v−rel網内系ウィルスオンコジーン類似物(鳥類)をコードする、RFLに対応する。その遺伝子はLocusID:5966を有し、2番染色体上に局在し、細胞遺伝学的位置は2q13−p12と報告されている。その遺伝子産物は転写因子であると考えられている。
CPS16は、インテグリンα7をコード化する、ITGA7に対応する。その遺伝子はLocusID:3679を有し、12番染色体上に局在し、細胞遺伝学的位置は12q13と報告されている。
ITGA7はインテグリンα鎖7をコード化している。インテグリンは、α鎖およびβ鎖からなるヘテロ正方晶系膜内在性タンパク質である。α鎖7は、細胞外ドメイン内で翻訳後解離され、β1と結合して細胞外マトリックスラミニン1に結合するインテグリンを形成する、ジスルフィド結合した軽鎖および重鎖を生成する。α7β1は、分化した筋細胞において発現した主要なインテグリン複合体である。細胞外および細胞質ドメインが異なる、α7のスプライシング変異はマウスにおいて存在する。しかしながら、今までに単一のヒト転写型が単離されたにすぎない。それは、マウスX2およびB変異体に対応する細胞外および細胞質ドメインを、それぞれ含んでいる。独特細胞外スプライシング変異体が、ヒトにおいて認識されてきたが、少数の種である可能性があり、その生物学的意義は不明である。インテグリンのα7サブユニットは、ラミニン受容体である。
Affymetrixの注釈では、CPS17がPPARDに対応することを示唆している。Entrezヒトゲノムデーターベースに対するBlast検索は、CPS17はまたLOC221486に整列し、98%以上の配列の同一性を有することを示している。LOC221486は、ペルオキシゾーム増殖活性化受容体β(PPAR−β)(PPAR−δ)核内ホルモン受容体1(NUC1)(NUCI)に類似したタンパク質をコード化する。その遺伝子は6番染色体に局在し、細胞遺伝学的位置は6p21.1と報告されている。
CPS18は、インターロイキン1受容体アンタゴニストをコード化する、IL1RNに対応する。その遺伝子はLocusID:3557を有し、2番染色体上に局在し、細胞遺伝学的位置は2q14.2と報告されている。その遺伝子産物は、IL−1受容体に結合してそれを抑制することができる。その遺伝子産物は、インターロイキン1(IL−1)ファミリーのメンバーである。
CPS19は、白血球免疫グロブリン様受容体、(TMおよびITIMドメインを有する)サブファミリーB、メンバー3をコード化する、LILRB3に対応する。その遺伝子はLocusID:11025を有し、19番染色体上に局在し、細胞遺伝学的位置は19q13.4と報告されている。その遺伝子産物は、免疫応答の抑制における役割を果たしている可能性がある。それは免疫グロブリンスーパーファミリーのメンバーである。
CPS19はまた、LOC163021と約99%の同一性を示している。LOC163021は、免疫グロブリン様転写産物5をコード化している。その遺伝子は、19番染色体上に局在しており、細胞遺伝学的位置は19q13.42と報告されている。
CPS20は、フォークヘッドボックスO3Aをコード化する、FOXO3Aに対応する。その遺伝子はLocusID:2309を有し、6番染色体上に局在し、細胞遺伝学的位置は6q21と報告されている。その遺伝子産物は、明確なフォークヘッドドメインによって特徴づけられる、転写因子のフォークヘッドファミリーに属している。この遺伝子は、細胞死に必要な遺伝子の発現を介して、アポトーシスの引き金として機能する可能性がある。この遺伝子の転座は、MLL遺伝子とともに、二次性の急性白血病に関係している可能性がある。
配列番号245(AF032886)のヌクレオチド1−3183は、FOXO3Aと少なくとも99%同一な配列を共有している。結果として、配列番号245は、FOXO3Aの発現を検出するためのプローブを構築するために用いられ得る。配列番号245のヌクレオチド672ないし3182はまた、LOC147167と98%同一な配列を有している。LOC147167は、bA653O20.1(フォークヘッドボックスO3A(フォークヘッドキイロショウジョウバエ類似物様1、FKHRL1))に類似している。LOC147167は17番染色体上に局在し、細胞遺伝学的位置は17p11.1と報告されている。
CPS21は、アネキシンA5をコード化する、ANXA5に対応している。その遺伝子はLocusID:308を有し、4番染色体上に局在し、細胞遺伝学的位置は4q28−q32と報告されている。その遺伝子産物はエキソサイトーシスおよびエンドサイトーシス経路に伴う細胞膜関連の事象に影響を与える、カルシウム依存性リン脂質結合タンパク質のアネキシンファミリーに属している。その遺伝子産物は、ホスホリパーゼA2およびカルシウムチャネル活性を有するタンパク質キナーゼC抑制タンパク質であり、細胞内シグナル伝達、炎症、成長および分化における潜在的な役割がある。その遺伝子産物はまた、胎盤性抗凝固タンパク質1、血管性抗凝固物質α、エンドネキシンII、リポコルチンV、胎盤性タンパク質4およびアンコリンCIIとして記述されてきた。その遺伝子は、少なくとも13のエクソンを含み、少なくともひとつのおよそ1.6kbの転写産物、および少なくとも一つの約35kDaの分子量を有するタンパク質生成物をコード化する。
CPS22は、溶質キャリアファミリー17(ナトリウム依存性無機リン酸共輸送体)、メンバー7をコード化する、SLC17A7に対応する。その遺伝子は、LocusID:57030を有し、19番染色体上に局在し、細胞遺伝学的位置は19q13と報告されている。この遺伝子によってコード化されたタンパク質は、脳特異的ナトリウム依存性無機リン酸共輸送体[ドブネズミ]に非常によく似ている。そのタンパク質は、小胞結合、ナトリウム依存性リン酸輸送体である。シナプス小胞の膜と結合して、グルタミン酸輸送に働く可能性がある。そのタンパク質は、分化関連性のナトリウム依存性無機リン酸共輸送体と、82%の同一性を共有する。
CPS23は、N−アセチルグルコサミン−1−ホスホジエステル α−N−アセチルグコサミニダーゼをコード化する、LOC51172(APAA)に対応する。その遺伝子はLocusID:51172を有し、16番染色体上に局在し、細胞遺伝学的位置は16p13.13と報告されている。N−アセチルグルコサミン−1−ホスホジエステルα−N−アセチルグコサミニダーゼ(ホスホジエステルα−N−グルコサミナーゼ)は、マンノース6リン酸の合成の第2工程を触媒し、リソソーム酵素上のマンノース6リン酸認識シグナルの形成に関わっている可能性がある。
CPS24は、細胞膜タンパク質、パルミトイル化1(55kDa)をコード化する、MPP1に対応する。その遺伝子はLocusID:4354を有し、X染色体上に局在し、細胞遺伝学的位置はXq28と報告されている。パルミトイル化細胞膜タンパク質1は、MAGUKs(細胞膜結合グアニル酸キナーゼ類似物)と呼ばれる、細胞膜結合タンパク質ファミリーの原型である。MAGUKsは、細胞骨格と相互作用し、細胞増殖、シグナル経路および細胞間連結を抑制する。パルミトイル化細胞膜タンパク質1は、SH3(srcホモロジー3)モチーフと呼ばれ、細胞骨格と結合してシグナルの変換において重要な役割を果たすと考えられるいくつかの他のタンパク質において発見されている、保存された配列を含む。パルミトイル化細胞膜タンパク質1は、キイロショウジョウバエdlg(癌抑制遺伝子)およびグアニル酸キナーゼに類似している。
CPS25は、トロポミオシン1(アルファ)をコード化する、TPM1に対応する。その遺伝子はLocusID:7168を有し、15番染色体に局在し、細胞遺伝学的位置は15q22.1と報告されている。α−トロポミオシン1は、アクチンおよびトロポニンと結合し、アクチン結合およびトロポニン結合タンパク質ファミリーのメンバーである。
CPS26は、TRIM2遺伝子の非タンパク質コード鎖と約99%同一な配列を示す、UNK_M62896に対応する。TRIM2は三部分モチーフ含有2をコード化し、LocusID:23321を有し、細胞遺伝学的位置は4q31.23と報告されている。
CPS26は、LOC221025およびANXA2P2と約86−90%類似した配列を示す。LOC221025は、M62895によって支持される仮定の遺伝子である。LOC221025は、10番染色体上に局在する。ANXA2P2は9番染色体上に局在し、アネキシンA2偽遺伝子2をコード化する。それに加えて、CPS26は、ANXA2の二つのエクソンと91−93%同一の配列を有する。ANXA2は、アネキシンA2をコード化し、LocusID:302を有し、細胞遺伝学的位置は15q21−q22と報告されている。
CPS27は、コロニー刺激因子2(顆粒球−マクロファージ)をコード化する、CSF2に対応する。その遺伝子はLocusID:1437を有し、5番染色体上に局在し、細胞遺伝学的位置は5q31.1と報告されている。顆粒球−マクロファージコロニー刺激因子2は、造血細胞の分化、遺伝子発現および成長を調節する。
CPS28は、脂肪腫HMGIC融合パートナー様2をコード化する、LHFPL2に対応する。その遺伝子はLocusID:10184を有し、5番染色体上に局在し、細胞遺伝学的位置は5q13.3と報告されている。CPS28の一部は、LOC220397と90%の配列の同一性を有する。LOC220397は、高移動度群タンパク質4(HMG−4)(高移動度群タンパク質2a)(HMG−2a)をコード化し、11番染色体上に局在し、細胞遺伝学的位置は11q14.2と報告されている。
CPS29は、パルヴィン、ベータをコード化するPARVBに対応する。その遺伝子はLocusID:29780を有し、22番染色体上に局在し、細胞遺伝学的位置は22q13.2−q13.33と報告されている。その遺伝子産物は、CGI−56タンパク質として知られている。
CPS30は、ムチン1,膜貫通をコード化する、MUC1に対応する。その遺伝子はLocusID:4582を有し、1番染色体上に局在し、細胞遺伝学的位置は1q21と報告されている。MUC1遺伝子産物は、細胞表面の膜貫通糖タンパク質である。グリコシル化における変化が、上皮性の癌においてみられてきた。MUC1遺伝子は、少なくとも7つのエクソンを含み、いくつかの他のスプライシング変異が報告されてきた。
CPS30はまた、LOC245755と少なくとも99%同一な配列を有し、NM002456およびX52228によって支持される仮定の遺伝子である。LOC245755は、MUC1中に局在している。
CPS31は、コラーゲン構造を有するマクロファージ受容体をコード化する、MARCOに対応する。その遺伝子はLocusID:8685を有し、2番染色体上に局在し、細胞遺伝学的位置は2q12−q13と報告されている。その遺伝子のタンパク質は、細菌結合領域を含むコラーゲン構造を有している。
CPS32は、ドーパミン受容体D2をコード化する、DRD2に対応する。その遺伝子はLocusID:1813を有し、11番染色体上に局在し、細胞遺伝学的位置は11q23と報告されている。この遺伝子は、ドーパミン受容体のD2サブタイプをコード化している。このGタンパク質結合受容体は、カリウムチャネル活性を高め、アデニリルシクラーゼ、カルシウム流入およびリン脂質のターンオーバーを抑制することができる。この遺伝子におけるミスセンス変異は、ミオクローヌスジストニアを引き起こす。他の変異は、統合失調症と関連している。この遺伝子の他のスプライシング変異によって、異なるアイソフォームをコード化する二つの転写変異体が生じる。第3の変異体が記載されているが、この形態が正常であるかまたは異常なスプライシングによるものであるかは解っていない。
CPS33は、膵ポリペプチドをコード化する、PPYに対応する。その遺伝子はLocusID:5539を有し、17番染色体上に局在し、細胞遺伝学的位置は17q21と報告されている。その遺伝子産物は、膵ポリペプチドおよび膵イコサペプチドの前駆体である。成熟した膵ペプチドは、膵臓の外分泌機能を抑制することができる。
CPS34は、アクアポリン9をコード化する、AQP9に対応する。その遺伝子はLocusID:366を有し、15番染色体上に局在し、細胞遺伝学的位置は15q22.1−22.2と報告されている。アクアポリン/主要な内在タンパク質は、水選択的細胞膜チャネルファミリーである。アクアポリン9は、AQP3およびAQP7と非常に類似した配列を有し、それらはサブファミリーとして良い。アクアポリン9は、広く様々な荷電していない溶質の通過を可能にする。アクアポリン9は、尿素輸送および浸透圧による水の透過性を刺激する。グリセロール透過性を与える役割については否定的な報告もある。アクアポリン9はまた、免疫応答および殺菌活性のような分化した白血球の機能においていくつかの役割を果たしている可能性がある。アクアポリン9は、白血球において発現している。
CPS35は、プレックストリンホモロジーおよびsrcホモロジー2ドメインを有するアダプタータンパク質をコードする、APSに対応する。その遺伝子はLocusID:10603を有し、7番染色体上に局在し、細胞遺伝学的位置は7q22と報告されている。Bリンパ球において発現している、APSタンパク質は、プレックストリンホモロジーおよびsrcホモロジー2(SH2)ドメインを含む。バーキットリンパ腫細胞系において、それはB細胞受容体の刺激に対する応答においてチロシンリン酸化される。それは刺激とは関係なくShcと結合し、刺激後はGrb2と結合するので、受容体からShc/Grb2へのシグナルの変換の役割を果たしているように思われる。それは活性化したチロシンキナーゼをシグナル経路に関係づける可能性がある。
CPS36は、アミノレブリン酸、δ−シンターゼ(鉄芽球性/低色素性貧血)をコード化する、ALAS2に対応する。その遺伝子はLocusID:212を有し、X染色体上に局在し、細胞遺伝学的位置はXp11.21と報告されている。ALAS2遺伝子産物は、ヘム生合成経路の最初の工程を触媒する。二番目のδ−アミノレブリン酸合成遺伝子(ALAS1)は、3番染色体に局在し、様々な組織において発現している。ALAS2遺伝子が欠損すると、X連鎖ピリドキシン反応性鉄芽球性貧血(低色素性貧血)を引き起こす可能性がある。遺伝子産物はまた、赤血球特異的δ−アミノレブリン酸シンターゼとして知られている。
CPS36は、LOC203568と約99%の同一な配列を有している。LOC203568は、5−アミノレブリン酸シンターゼ、赤血球特異的、ミトコンドリア前駆体(δ−アミノレブリン酸シンターゼ)(δ−ALAシンターゼ)(ALAS−E)に類似したタンパク質をコード化している。その遺伝子はX染色体上に局在し、細胞遺伝学的位置はXp11.22と報告されている。
CPS37は、カテプシンLをコード化する、CTSLに対応する。その遺伝子はLocusID:1514を有し、9番染色体上に局在し、細胞遺伝学的位置は9q21−q22と報告されている。その遺伝子産物は、コラーゲンおよびエラスチンを解離できる、リソソームのシステイン(チオール)プロテアーゼである。
CPS37は、ある他の遺伝子と80−90%同一の配列を有している。これらの遺伝子には、LOC118945、LOC119215およびLOC219343を含む。LOC118945は、カテプシンL前駆体(主要排出タンパク質)(MEP)に類似している。それは10番染色体上に局在し、細胞遺伝学的位置は10q23.32と報告されている。LOC119215もまたカテプシンL前駆体(主要排出タンパク質)(MEP)に類似している。細胞遺伝学的位置は10q21.1と報告されている。LOC219343は、細胞遺伝学的位置は10q23.2と報告されている。
CPS38は、Ras誘導性老化1をコード化する、DKFZP586E1621に対応する。その遺伝子はLocusID:25907を有し、3番染色体上に局在し、細胞遺伝学的位置は3p21.3と報告されている。その遺伝子はまた、RIS1として知られている。
CPS39は、仮定のタンパク質をコード化する、PRO2389に対応する。その遺伝子はLocusID:80344を有し、14番染色体上に局在し、細胞遺伝学的位置は14q11.2と報告されている。その遺伝子産物は、38kDaスプライシング因子[ホモサピエンス]にあまり類似していない。
CPS40は、ビリベルジン還元酵素B(フラビン還元酵素(NADPH))をコード化する、BLVRBに対応する。その遺伝子はLocusID:645を有し、19番染色体上に局在し、細胞遺伝学的位置は19q13.1−q13.2と報告されている。
CPS41は、グアニンヌクレオチド結合タンパク質(Gタンパク質)、α13をコード化する、GNA13に対応する。その遺伝子はLocusID:10672を有し、17番染色体上に局在し、細胞遺伝学的位置は17q22−q24と報告されている。その遺伝子産物は、ヘテロ三量体Gタンパク質複合体の成分である。
CPS41は、LOC130117の近傍のゲノム配列に約75−80%類似した配列を示す。LOC130117は亜鉛フィンガータンパク質10(KOX1)に類似しており、2番染色体上に局在し、細胞遺伝学的位置は2p11.2と報告されている。
CPS42は、マイトジェン活性化タンパク質キナーゼキナーゼ3をコード化する、MAP2K3に対応する。その遺伝子はLocusID:5606を有し、17番染色体上に局在し、細胞遺伝学的位置は17q11.2と報告されている。この遺伝子によってコード化されたタンパク質は、MAPキナーゼキナーゼファミリーに属している、二元特異性タンパク質キナーゼである。このキナーゼは、マイトジェンおよび環境ストレスによって活性化され、MAPキナーゼ媒介シグナルカスケードに関わっている可能性がある。それは、MAPK14/p38−MAPKをリン酸化し、それによって活性化することができる。このキナーゼはまた、インスリンによって活性化されることができ、グルコース輸送体の発現に必要である可能性がある。RASオンコジーンの発現が発見されることで、このキナーゼの活性体が蓄積し、そのようにしてMAPK14の構造性活性化を導き、一次細胞のオンコジーン変形を与えることになる。このキナーゼの抑制は、エルシニア偽結核の病因に関わっている。三つの異なるスプライシングした、独特のアイソフォームをコード化するこの遺伝子の転写変異体が報告されている。
CPS42は、LOC146732と約96−98%同一な配列を有する。LOC146732は、MAPキナーゼキナーゼ3bに類似しており、細胞遺伝学的位置は17p13.1と報告されている。
CPS43は、脳豊富、細胞膜結合シグナルタンパク質をコード化する、BASP1に対応する。その遺伝子はLocusID:10409を有し、5番染色体上に局在し、細胞遺伝学的位置は5p15.1−p14と報告されている。AA135683のヌクレオチド433ないし554はまた、推定される遺伝子LOC222467と91%同一の配列を有し、その遺伝子は13番染色体上に局在し、細胞遺伝学的位置は13q12.11と報告されている。
CPS44は、タンパク質3様と相互作用するBCI.2/アデノウイルスE1B19kDaをコード化する、BNIP3Lに対応する。その遺伝子はLocusID:665を有し、8番染色体上に局在し、細胞遺伝学的位置は8p21と報告されている。この遺伝子は、BCI.2/アデノウイルスE1B19kDa相互作用タンパク質(BNIP)ファミリーのメンバーである。BNIP3L遺伝子産物は、ウィルス誘導性細胞死に対する防護する役割を持つE1B19kDaタンパク質と相互作用し得る。遺伝子産物は、BNIP3の機能的類似物、アポトーシスを促進するタンパク質である。遺伝子産物は、BNIP3と同時に機能し、腫瘍抑制の機能を果たす可能性がある。
その遺伝子産物はまた、細胞のBcl2またはNcl2L.1と結合でき、アポトーシスを促進する可能性がある。
CPS45は、タンパク質と結合するアルブミンプロモーターのD部位(アルブミンDボックス)をコード化する、BNIP3Lに対応する。その遺伝子はLocusID:1628を有し、19番染色体上に局在し、細胞遺伝学的位置は19q13.3と報告されている。その遺伝子産物は、転写因子として機能し、肝特異的遺伝子の日周的調節の役割を果たしている可能性がある。それは、PAR(プロリンおよび酸性アミノ酸豊富)b/ZIPファミリーのメンバーである。
CPS46は、脳アシルCoA加水分解酵素をコード化する、BACH(hBACH)に対応する。その遺伝子はLocusID:11332を有し、1番染色体上に局在し、細胞遺伝学的位置は1p36.31−p36.11と報告されている。その遺伝子産物は、アシル補酵素ファミリーのメンバーである。それは、パルミトイルCoAおよび他の長鎖脂肪酸CoAチオエステルを加水分解し得る。その遺伝子産物はまた、細胞質ゾルのアシル補酵素Aチオエステル加水分解酵素として知られている。
配列番号46(U91316)のヌクレオチド76−1101は、細胞質ゾルのアシル補酵素Aチオエステル加水分解酵素(長鎖アシルCoAチオエステル加水分解酵素)(CTE−II)(脳アシルCoA加水分解酵素)(BACH)に類似したタンパク質をコード化する、LOC132927に約89%同一な配列を有する。LOC132927は、4番染色体上に局在し、細胞遺伝学的位置は4p14と報告されている。
CPS47は、ジアシルグリセロールO−アシルトランスフェラーゼ類似物1(マウス)をコード化する、DGAT1に対応する。その遺伝子はLocusID:8694を有し、8番染色体上に局在し、細胞遺伝学的位置は8qterと報告されている。この遺伝子によってコード化された酵素は、ジアシルグリセロールおよび脂肪アシルCoAを、トリアシルグリセロール合成の最終段階を触媒するために基質として利用する。それはまた、生理学的代謝過程と同様に、細胞内においても関わっている。
CPS48は、グアニル酸キナーゼ1をコード化する、GUK1に対応する。その遺伝子はLocusID:2987を有し、1番染色体上に局在し、細胞遺伝学的位置は1q32−q41と報告されている。その遺伝子産物は、cGMPサイクルの一部としてGMPをGTPに変換し得る。
CPS49は、インターロイキン10受容体、ベータをコード化する、IL10RBに対応する。その遺伝子はLocusID:3588を有し、21番染色体上に局在し、細胞遺伝学的位置は21p22.11と報告されている。インターロイキン10受容体βサブユニットは、インターロイキン10(IL−10)と結合したシグナルを変換する。それは、サイトカイン受容体ファミリー(CRF2)のクラスIIメンバーである。
CPS49に整列する染色体領域はまた、fIFNAR2のポリペプチドコード配列に3'局在している。IFNAR2は、インターフェロン(α、βおよびω)受容体2をコード化している。その遺伝子はLocusID:3455を有し、21番染色体上に局在し、細胞遺伝学的位置は21q22.11と報告されている。
CPS50は、エクトヌクレオチドピロホスファターゼ/ホスホジエスタラーゼ2(オートタキシン)をコード化する、ENPP2(PDNP2)に対応する。その遺伝子はLocusID:5168を有し、8番染色体上に局在し、細胞遺伝学的位置は8q24.1と報告されている。オートタキシンは、強力な腫瘍細胞運動性刺激タンパク質である。その遺伝子産物はまた、ホスホジエスタラーゼ1/ヌクレオチドピロホスファターゼ2(オートキシン)として知られている。
配列番号50(D45421)のヌクレオチド375−452、1241−1277、1576−1761および1399−1488はまた、8番染色体上のLOC206890の近傍のゲノム配列に97−100%同一な配列を有する。LOC206890は、シトクロムC(生体の)に類似しており、細胞遺伝学的位置は8q12.3と報告されている。
CPS51は、溶質キャリアファミリー5(ナトリウム依存性ビタミン輸送体)をコード化する、SLC5A6に対応する。その遺伝子はLocusID:8884を有し、2番染色体上に局在し、細胞遺伝学的位置は2p23と報告されている。その遺伝子産物は、パントテン酸ビオチンおよびリポ酸の経胎盤輸送において機能している。配列番号51(AL096737)のヌクレオチド962ないし1314は、転写因子23をコード化するTCF23(LocusID:150921)と約90%の同一性を有し、2番染色体上に局在し、細胞遺伝学的位置は2p23.3と報告されている。
CPS52は、Gタンパク質結合受容体3をコード化する、GPR3に対応する。その遺伝子はLocusID:2827を有し、1番染色体上に局在し、細胞遺伝学的位置は1p36.1−p35と報告されている。その遺伝子産物は、細胞系においてアデニル酸シクラーゼを活性化でき、Gタンパク質結合受容体ファミリーのメンバーである。
CPS53は、ミトコンドリアのスーパーオキシドジスムターゼ2をコード化する、SOD2に対応する。その遺伝子はLocusID:6648を有し、6番染色体上に局在し、細胞遺伝学的位置は6q25.3と報告されている。その遺伝子産物は、ミトコンドリア内の遊離基除去酵素であり、ネズミのSod2に強い類似性を有する。
CPS54は、三つの主要な修復エキソヌクレアーゼ1をコード化する、TREX1に対応する。その遺伝子はLocusID:6648を有し、3番染色体上に局在し、細胞遺伝学的位置は3p21.3−p21.2と報告されている。この遺伝子は、少なくとも二つの異なる読み取り枠を用いる。上流のORFは、毛細管拡張性失調症と相互作用するタンパク質、およびRad3関連タンパク質、チェックポイントキナーゼをコード化する。この上流のORFによってコード化したタンパク質は、DNA損傷に続く核内病巣に局在化し、DNA損傷チェックポイントの重要な成分であって良い。下流のORFは、3'エキソヌクレアーゼ活性を有するタンパク質をコード化する。この活性を有する他の酵素は、DNA複製、修復および組み換えに関わっている。イー・コリタンパク質に対する類似性は、このORFによってコード化した酵素は、DNAポリメラーゼIIIのサブユニットであって良く、固有のエキソヌクレアーゼ活性を有していないことを示唆している。両ORFは、異なるスプライシングに付し、少なくとも6つの転写変異体を生じる。
CPS54はまた、少なくともLOC200884およびLOC152456の一部と約99%同一な配列を有する。両遺伝子は、TREX1中に局在している。LOC200884は、3つの主要な修復エキソヌクレアーゼ1(アイソフォームb)、3つの修復エキソヌクレアーゼ1、デオキシリボヌクレアーゼIII(dnaQ/mutD (イー・コリ)様)、およびATR相互作用タンパク質と類似したタンパク質をコード化する。LOC200884は、細胞遺伝学的位置は3p21.31と報告されている。LOC152456は、3つの主要な修復エキソヌクレアーゼ1(アイソフォームb)、3つの修復エキソヌクレアーゼ1、デオキシリボヌクレアーゼIII(dnaQ/mutD (イー・コリ)様)、およびATR相互作用タンパク質と類似したタンパク質をコード化する。それは、細胞遺伝学的位置は3p21.31と報告されている。
CPS55は、無翼型MMTV組み込み部位ファミリー、メンバー6をコード化する、WNT6に対応する。その遺伝子はLocusID:7475を有し、2番染色体上に局在し、細胞遺伝学的位置は2q35と報告されている。WNT遺伝子ファミリーは、分泌したシグナルタンパク質をコード化する構造的関連遺伝子からなる。これらのタンパク質は、細胞の運命の抑制および胚形成のパターニングを含めて、発癌、いくつかの発達過程に包含された。この遺伝子は、WNT遺伝子ファミリーのメンバーである。それは、子宮頸癌の細胞系において過剰発現しており、他のファミリーのメンバー、WNT10Aとともに、結腸直腸癌の細胞系において強く共発現している。遺伝子の過剰発現は、発癌において鍵となる役割を果たす可能性がある。この遺伝子およびWNT10A遺伝子は、染色体2q35領域においてクラスター形成する。この遺伝子によってコード化したタンパク質は、アミノ酸レベルがマウスのWnt6タンパク質に97%同一である。
CPS56は、ホスファチジルイノシトール−4−リン酸5−キナーゼ、タイプ2αをコード化する、PIP5K2Aに対応する。その遺伝子はLocusID:5305を有し、10番染色体上に局在し、細胞遺伝学的位置は10p11.23と報告されている。ホスファチジルイノシトール−4,5−二リン酸、ホスホイノシチドシグナル変換経路の二番目のメッセンジャーの前駆体は、分泌、細胞増殖、分化および運動性の抑制に関わっていると考えられている。この遺伝子によってコード化されたタンパク質は、ホスファチジルイノシトール−4−リン酸の、ミオイノシトール環の5番目のヒドロキシのホスホリル化を触媒し、ホスファチジルイノシトール−4,5−二リン酸を形成することができる酵素のファミリーの一つである。遺伝子産物は、キナーゼ活性を示す。この遺伝子は、ホスファチジルイノシトール−4−リン酸5−キナーゼファミリーのメンバーである。その遺伝子産物はまた、1−ホスファチジルイノシトール−4−リン酸5−キナーゼアイソフォームCとして知られている。
CPS57は、脂肪酸結合タンパク質5(乾癬関連)をコード化する、FABP5に対応する。その遺伝子はLocusID:2171を有し、8番染色体上に局在し、細胞遺伝学的位置は8q21.13と報告されている。その遺伝子は、上皮細胞にみられる脂肪酸結合タンパク質をコード化し、乾癬組織においてアップレギュレートされていると同定された。脂肪酸結合タンパク質は、長鎖脂肪酸および他の疎水性リガンドに結合する、小さい、高度に保存された、細胞質のタンパク質のファミリーである。脂肪酸結合タンパク質は、脂肪酸の取り込み、輸送および代謝に関わっていると考えられている。FABP5遺伝子産物は、ステアリン酸に結合し、ケラチン生成細胞の分化の役割がある可能性がある。
CPS57はまた、シンタキシン3Aをコード化するSTX3Aのイントロン配列と100%の配列配置構造を示す。その遺伝子はLocusID:6809を有し、11番染色体上に局在し、細胞遺伝学的位置は11q12.3と報告されている。シンタキシン3Aは、細胞内タンパク質輸送に関わっている。
それに加えて、CPS57は、LOC95551、LOC220113、LOC114948、LOC220832およびLOC150161と約95−97%同一な配列を有する。LOC95551は、脂肪酸結合タンパク質上皮細胞(E−FABP)(乾癬関連脂肪酸結合タンパク質類似物)(PA−FABP)に類似している。LOC95551は、13番染色体上に局在し、細胞遺伝学的位置は13q21.33と報告されている。LOC220113は、脂肪酸結合タンパク質上皮細胞(E−FABP)(乾癬関連脂肪酸結合タンパク質類似物)(PA−FABP)をコード化している。LOC220113は、細胞遺伝学的位置は13q14.13と報告されている。LOC220113は、ATPアーゼ、Cu++輸送、βポリペプチド(ウィルソン病)をコード化するATP7Bのイントロン中に存在し、LocusID:540を有する。
LOC114948は、脂肪酸結合タンパク質上皮細胞(E−FABP)(乾癬関連脂肪酸結合タンパク質類似物)(PA−FABP)に類似しているタンパク質をコード化している。それは、15番染色体上に局在しており、細胞遺伝学的位置は15q25.3と報告されている。LOC220832はまた、脂肪酸結合タンパク質上皮細胞(E−FABP)(乾癬関連脂肪酸結合タンパク質類似物)(PA−FABP)に類似しているタンパク質をコード化している。それは、細胞遺伝学的位置は7q26.1と報告されている。同様に、LOC150161は、脂肪酸結合タンパク質上皮細胞(E−FABP)(乾癬関連脂肪酸結合タンパク質類似物)(PA−FABP)に類似しているタンパク質をコード化している。それは、22番染色体上に局在し、細胞遺伝学的位置は22q11.1と報告されている。
その上、CPS57は、BTBD1、LOC130962、LOC152940およびLOC204114と約89−93%同一な配列を有している。BTBD1は、1を含むBTB(POZ)ドメインをコード化している。それは、LocusID:53339を有し、15番染色体上に局在し、細胞遺伝学的位置は15q24と報告されている。その遺伝子産物は、BTB/POZドメインを含み、DNAまたはアクチン結合タンパク質として機能する可能性がある。LOC130962は、脂肪酸結合タンパク質上皮細胞(E−FABP)(乾癬関連脂肪酸結合タンパク質類似物)(PA−FABP)に類似しているタンパク質をコード化している。その遺伝子は、細胞遺伝学的位置は2q23.3と報告されている。同様に、LOC152940は、無名のタンパク質生成物に類似したタンパク質をコード化している。それは、4番染色体上に局在し、細胞遺伝学的位置は4q31.3−q32.1と報告されている。LOC204114は、脂肪酸結合タンパク質類似物に類似したタンパク質をコード化している。それは、細胞遺伝学的位置は13q31.3と報告されている。
CPS58はまた、マトリックスメタロプロテイナーゼ(ゼラチナーゼB、92kDゼラチナーゼ、92kDタイプIVコラゲナーゼ)をコード化する、MMP9に対応する。その遺伝子はLocusID:4318を有し、20番染色体上に局在し、細胞遺伝学的位置は20q11.2−q13.1と報告されている。マトリックスメタロプロテイナーゼタンパク質(MMP)ファミリーは、関節炎および転移のような病的過程におけるのと同様に、胚の発達、再生および組織リモデリングのような正常な生理的過程においての細胞外マトリックスの分解にも関わっている。ほとんどのMMPsは、細胞外のプロテアーゼによって解離されると活性化されるような不活性な前駆体タンパク質として分泌される。この遺伝子によってコード化される酵素は、タイプIVおよびVコラーゲンを分解し得る。アカゲザルにおける研究は、その酵素が、骨髄由来の造血前駆細胞のIL−8誘導による動員に関わっていることを示唆しており、ネズミの研究は、腫瘍関連の組織リモデリングにおける役割を果たすことを示唆している。
CPS59は、ATPアーゼ、CA++輸送、細胞膜1をコード化する、ATP2B1に対応する。その遺伝子はLocusID:490を有し、12番染色体上に局在し、細胞遺伝学的位置は12q21−q23と報告されている。
配列番号59(J04027)のヌクレオチド2623ないし2814は、ATPアーゼ、CA++輸送、細胞膜4をコード化する、ATP2B4と約81%同一な配列を有する。ATP2B4は、LocusID:493を有し、1番染色体上に局在している。配列番号59のヌクレオチド4365−4398は、仮定のタンパク質FLJ14075をコード化する、FLJ14075に100%同一な配列を有する。FLJ14075はLocusID:79954を有し、2番染色体上に局在している。
CPS60は、ニューロd4(ラット)類似物をコード化する、NEUD4に対応する。その遺伝子はLocusID:8193を有し、19番染色体上に局在し、細胞遺伝学的位置は19q13.13と報告されている。その遺伝子産物は、少なくともzincフィンガーDNA結合ドメインを含む。U43843のヌクレオチド61−198は、cer−d4(マウス)類似物をコード化する、CERD4と86%同一な配列を有する。CERD4はLocusID:8110を有し、14番染色体上に局在し、細胞遺伝学的位置は14q24.3−q31.1と報告されている。
CPS61は、ケモカイン(C−Cモチーフ)受容体1をコード化する、CCR1に対応する。その遺伝子はLocusID:1230を有し、3番染色体上に局在し、細胞遺伝学的位置は3p21と報告されている。その遺伝子産物は、βケモカイン受容体ファミリーのメンバーであり、Gタンパク質結合受容体に類似した7回膜貫通タンパク質であると予測されている。この受容体のリガンドには、マクロファージ炎症性タンパク質1α(MIP−1α)、単球化学誘因タンパク質3(MCP−3)、ミエロイド前駆体抑制因子1(MPIF−1)を含む。ケモカインおよびそれらの受容体によって媒介されるシグナル変換は、炎症部位にエフェクター免疫細胞を補充するために重要であると考えられている。マウス類似物のノックアウト研究は、免疫応答から宿主を保護においての、およびウィルスおよび寄生虫に対する感受性における、この遺伝子の役割を示唆している。CCR2、CCRL2、CCR3、CCR5およびCCXCR1を含めた、この遺伝子および他のケモカイン受容体遺伝子は、染色体3p上で遺伝子クラスターを形成することが分かっている。この遺伝子によってコード化されたタンパク質は、CCサブファミリーのケモカインに結合し、細胞内カルシウム流入を媒介することができる。
CPS62は、分裂促進経路によって調節されるリンタンパク質をコード化する、C8FWに対応する。その遺伝子はLocusID:490を有し、12番染色体上に局在し、細胞遺伝学的位置は12q21−q23と報告されている。そのタンパク質はタンパク質キナーゼに類似している。その遺伝子はLocusID:10221を有し、8番染色体上に局在し、細胞遺伝学的位置は8q24.13と報告されている。
CPS63は、クラスタリン(補足溶菌阻害剤、SP−40,40、硫酸化糖タンパク質2、テストステロン抑制前立腺伝達暗号2、アポリポタンパク質J)をコード化する、CLUに対応する。その遺伝子はLocusID:1191を有し、8番染色体上に局在し、細胞遺伝学的位置は8p21−p12と報告されている。クラスタリンは、糖タンパク質であり、高密度リポタンパク質および内分泌物およびニューロン顆粒においてみられ得る。それは、末端補完反応における役割を有する。
CPS64は、エピレグリンをコード化する、EREGに対応する。その遺伝子はLocusID:2069を有し、4番染色体上に局在し、細胞遺伝学的位置は4q13.3と報告されている。エピレグリンは、上皮成長因子ファミリーのメンバーである。エピレグリンは、チロシンキナーゼ受容体のERBB(v−erb−b2オンコジーン類似物)ファミリーのメンバーのリガンドと同様に、EGFR(上皮成長因子受容体)のリガンドとして機能し得る。エピレグリンは、細胞増殖を促進する可能性がある。
CPS65は、ホスファチジン酸ホスファターゼタイプ2Bをコード化する、PPAP2Bに対応する。その遺伝子はLocusID:8613を有し、1番染色体上に局在し、細胞遺伝学的位置は1pter−p22.1と報告されている。その遺伝子産物は、マグネシウム依存性ホスファチジン酸ホスファターゼタイプ2bである。それはホスファチジン酸をジアシルグリセロールに変換し得る。それはまた、リソフォスファチジン酸、セラミド−1−リン酸およびスフィンゴシン−1−リン酸を加水分解し得る。
CPS66は、チューブリン、βポリペプチドをコード化する、TUBBに対応する。その遺伝子はLocusID:7280を有し、6番染色体上に局在し、細胞遺伝学的位置は6p21.3と報告されている。βチューブリンは、重合して微小管を形成し得る。それは、構造タンパク質のファミリーのメンバーである。
配列番号66(X79535)のヌクレオチド119−231および340−939はまた、TUBBおよびLOC221753の間のゲノム配列に99%以上同一な配列を有する。LOC221753は、6番染色体上に局在している。
それに加えて、X79535のヌクレオチド58−120および340−1397は、LOC221753と約98%同一な配列を有する。LOC221753は、細胞遺伝学的位置は6p24.3と報告されている。
その上、X79535の断片は、ある他の遺伝子に約82−92%同一な配列を示す。これらの遺伝子には、TUBB5、TUBB4、LOC139112、LOC157586、LOC203068、LOC92755およびGABRR2を含む。TUBB5は、チューブリン、β、5をコード化している。それはLocusID:10382を有し、19番染色体上に局在し、細胞遺伝学的位置は19p13.3と報告されている。TUBB5遺伝子は、19番染色体のヌクレオチド637115ないし644163を有する。β5−チューブリンは、重合して微小管を形成し得る。TUBB4は、チューブリン、β、4をコード化している。それはLocusID:10381を有し、16番染色体上に局在しており、細胞遺伝学的位置は6q24.3と報告されている。β4−チューブリンはまた、重合して微小管を形成し得る。LOC139112は、チューブリンβに類似したタンパク質をコード化している。その遺伝子は、細胞遺伝学的位置はXq25と報告されている。LOC157586およびLOC203068は、仮定のタンパク質DKFZp564N123.1−ヒト(断片)に類似したタンパク質をコード化している。両遺伝子は、細胞遺伝学的位置は8p21.1と報告されている。LOC92755は、仮定の遺伝子であり、細胞遺伝学的位置は8p21.1と報告されている。GABRR2は、γアミノ酪酸(GABA)受容体、rho2をコード化している。それはLocusID:2570を有し、細胞遺伝学的位置は6q13−q16.3と報告されている。GABAは、哺乳類の脳における主要な抑制性神経伝達物質であり、リガンドゲート塩化物イオンチャネルであるGABA受容体で作用し得る。GABRR2は、rhoサブユニットファミリーのメンバーである。
CPS67は、ヌクレオポリン214kD(CAIN)をコード化する、NUP214に対応する。その遺伝子はLocusID:8021を有し、9番染色体上に局在し、細胞遺伝学的位置は9q34.1と報告されている。ヌクレオポリン214kDは、核膜孔複合体の細胞質側に局在しているタンパク質である。それはFXFGリピートを含む。
D14689(配列番号67)のヌクレオチド3712ないし5515の断片は、LOC158306と100%同一な配列を有する。LOC158306は、ヌクレオポリン214kD(CAIN)に類似したタンパク質をコード化し、細胞遺伝学的位置は9q34.2と報告されている。LOC158306は、NUP214遺伝子のエクソン中に局在している。
CPS68は、アルデヒド脱水素酵素5ファミリー、メンバーA1(コハク酸セミアルデヒド脱水素酵素)をコード化する、ALDH5A1に対応する。その遺伝子はLocusID:7915を有し、6番染色体上に局在し、細胞遺伝学的位置は6p22と報告されている。CPS68は、6番染色体のヌクレオチド32909278ないし32909827に整列し、ALDH5A1の3'非翻訳領域に局在している。アルデヒド脱水素酵素5A1(コハク酸セミアルデヒド脱水素酵素)は、4−アミノ酪酸分解を伴う。
配列番号68(AL031230)のヌクレオチド45212ないし44763は、ヒートショック95kDタンパク質1、α様3をコード化するHSPCAL3と約90%同一な配列を有する。HSPCAL3遺伝子はLocusID:3324を有し、細胞遺伝学的位置は11p14.2−p14.1と報告されている。それに加えて、AL031230のヌクレオチド11858ないし12096は、1番染色体上のゲノム配列に86%同一な配列を示す。
CPS69は、LOC64116に対応する。その遺伝子はLocusID:64116を有し、4番染色体上に局在し、細胞遺伝学的位置は4q22−q24と報告されている。その遺伝子はBCG−CWSによってアップレギュレーションされる。
CPS70は、Kell血液群前駆体(McLeod フェノタイプ)をコード化する、XKに対応する。その遺伝子はLocusID:7504を有し、X染色体上に局在し、細胞遺伝学的位置はXp21.1と報告されている。この座は、Kell血液群(「前駆体基質、Kx)の合成を抑制する。この遺伝子における変異は、神経筋系および造血系における異常によって特徴づけられる、McLeod症候群、X連鎖、退行性疾患と関連している。コード化したタンパク質は、トランスポーターファミリーのメンバーであり、原核細胞および真核細胞の細胞膜輸送タンパク質の構造的特徴を有する。
CPS71は、長鎖脂肪アシルCoAシンセターゼ2遺伝子(脂肪酸補酵素Aリガーゼ、長鎖6)をコード化する、KIAA0837(FACL6)に対応する。その遺伝子はLocusID:23305を有し、5番染色体上に局在し、細胞遺伝学的位置は5q31と報告されている。
CPS72は、グリコフォリンC(Gerbich血液群)をコード化する、GYPCに対応する。その遺伝子はLocusID:2995を有し、2番染色体上に局在し、細胞遺伝学的位置は2q14−q21と報告されている。グリコフォリンC(GYPC)は、膜内在性糖タンパク質である。それはヒトの赤血球によって運ばれる小さい種であるが、赤血球の機械的安定性を調節する上で重要な役割を果たしている。グリコフォリンCの変異の数が記述されてきた。GerbichおよびYusフェノタイプは、それぞれエクソン3および2の検出によるものである。WebbおよびDuch抗原はまた、グリコフォリンCとして知られており、グリコフォリンC遺伝子の単一の点変異から生じる。グリコフォリンCタンパク質は、グリコフォリンAおよびBと相同性を有している。
CPS73は、転写因子Dp−1をコード化する、TFDP1に対応する。その遺伝子はLocusID:7027を有し、13番染色体上に局在し、細胞遺伝学的位置は13q34と報告されている。遺伝子産物は、E2Fとともに、G1期からS期への細胞周期の進行に関わっているトランザクション遺伝子にヘテロ二量体形成してよい。TFDP1、CUL4AおよびCDC16は、増幅機構の確実な標的であり、肝細胞癌の発達および/または進行に、一緒にまたは別々に関わっている可能性がある。
L23959(配列番号:73)のヌクレオチド9ないし1440と同様に、CPS73は、8番染色体上のLOC245788と約95%同一な配列を有する。LOC245788は、転写因子DP−1(E2F二量体化パートナー1)(DRTF1−ポリペプチド−1)(DRTF1)をコード化していると報告されている。
それに加えて、CPS73は、LOC126611およびLOC51270と約85%同一な配列を有する。LOC126611は、転写因子DP−1(E2F二量体化パートナー1)(DRTF1−ポリペプチド−1)(DRTF1)に類似したタンパク質をコード化する。それは1番染色体上に局在し、細胞遺伝学的位置は1q31.3と報告されている。LOC51270は、ヒト転写因子Dp−1の領域に類似したE2F様タンパク質をコード化する。その遺伝子はLocusID:51270を有し、X染色体上に局在し、細胞遺伝学的位置はXq26.2と報告されている。
配列番号:73(L23959)のヌクレオチド1001ないし1440は、CD36抗原(コラーゲンタイプI受容体、トロンボスポンジン受容体)をコード化する、CD36と約87%同一な配列を有する。その遺伝子はLocusID:948を有し、7番染色体上に局在し、細胞遺伝学的位置は7q11.2と報告されている。CD36は、血小板中のトロンボスポンジンおよびコラーゲンに対する受容体である。それは細胞接着に機能する。それは、血小板−コラーゲン接着における役割を有し、長鎖脂肪酸に結合し得る。そのタンパク質は、ラットのFATに非常に類似している。配列番号:73のヌクレオチド9ないし947は、転写因子DP−1(E2F二量体化パートナー1)(DRTF1−ポリペプチド−1)(DRTF1)に類似したタンパク質をコード化する、LOC123741に95%同一な配列を有する。LOC123741は、細胞遺伝学的位置が15q23と報告されている。
CPS74は、20番染色体の読み取り枠16をコード化する、C20orf16に対応する。その遺伝子はLocusID:54498を有し、20番染色体上に局在し、細胞遺伝学的位置は20p13と報告されている。そのタンパク質は、フラビン含有アミンオキシダーゼファミリーのメンバーである。それは、モノアミンMAOB(オキシダーゼB)にはあまり類似していない。
CPS75は、IgAのFc断片に対する受容体をコード化する、FCARに対応する。その遺伝子はLocusID:2204を有し、19番染色体上に局在し、細胞遺伝学的位置は19q13.2−q13.4と報告されている。この遺伝子は、免疫グロブリン遺伝子スーパーファミリーのメンバーであり、IgAのFc領域に対する受容体をコード化する。受容体は、好中球、単球、マクロファージおよび好酸球のような、病原体に対する免疫応答を媒介する、骨髄系細胞の表面に存在する膜貫通糖タンパク質である。それは、IgAでオプソニン化した標的と相互作用し、貪食、抗体依存性細胞媒介細胞傷害、および炎症メディエーターの解離の刺激を含めた、いくつかの免疫学的防御過程の引き金となる可能性がある。少なくとも10の、異なるアイソフォームをコード化する転写産物変異体は、この遺伝子について記述されている。遺伝子産物はまた、FcαRとして知られている。
CPS76は、インテグリン、β3(血小板糖タンパク質IIIa、抗原CD61)をコード化する、ITGB3に対応する。その遺伝子はLocusID:3690を有し、17番染色体上に局在し、細胞遺伝学的位置は17q21.32と報告されている。ITGB3タンパク質生成物は、インテグリンβ鎖β3である。インテグリンは、α鎖およびβ鎖からなる貫通性細胞表面タンパク質である。その鎖は多数のパートナーと結合し、異なるインテグリンを生成する可能性がある。インテグリンβ3は、血小板中にαIIb鎖に沿って見つかっている。インテグリンは、細胞表面媒介シグナルとともに、細胞接着にも関わっていることが知られている。この遺伝子産物は、血小板凝集の媒介に関わっている可能性がある。
CPS77は、MAX相互作用タンパク質をコード化する、MXI1に対応する。その遺伝子はLocusID:4601を有し、10番染色体上に局在し、細胞遺伝学的位置は10q24−q25と報告されている。発癌性転写因子を生成する、c−myc遺伝子の発現は、正常細胞においては厳格に制御されているが、ヒトの癌においては、しばしば制御が解除されている。この遺伝子によってコード化されたタンパク質は、MYU機能を負の方向に制御すると考えられている転写抑制因子であり、それゆえに潜在的な腫瘍抑制因子である。そのタンパク質は、MAXと競争することによってMYCの転写活性を阻害し、MYCに結合し得る他の基本的ならせん−環−らせんタンパク質が、その機能のために必要とされる。この遺伝子の検出は、しばしば前立腺腫瘍の患者においてみられる。異なるアイソフォームをコード化する、二つの転写変異体はこの遺伝子において同定されてきた。
配列番号:77(L07648)のヌクレオチド1ないし64は、ras類似遺伝子、メンバーAをコード化する、ARHAと100%同一な配列を示す。その遺伝子はLocusID:387を有し、3番染色体上に局在し、細胞遺伝学的位置は3p21.3と報告されている。その遺伝子産物は、rhoサブファミリーのras関連GTP結合タンパク質であり、アクチン細胞骨格の再編成の調節に関わっている可能性がある。
CPS78は、コールドショックドメインタンパク質Aをコード化する、CSDAに対応する。その遺伝子はLocusID:8531を有し、12番染色体上に局在し、細胞遺伝学的位置は12p13.1と報告されている。その遺伝子産物は、転写調節因子のファミリーのメンバーである。それは、(GM−CSF)遺伝子のプロモーターと結合し、抑制することができる。その遺伝子産物は、コールドショックドメインを含む。
M24069(配列番号:78)のヌクレオチド14ないし1568とともに、CPS78は、LOC220558と少なくとも94%同一な配列を示す。LOC220558はまた、コールドショックドメインタンパク質Aまたはコールドショックドメインタンパク質Aをコード化する。それは、16番染色体上に局在し、細胞遺伝学的位置は16p11.1と報告されている。
CPS79は、オプチンウリンをコード化する、OPTN(FIP2)に対応する。その遺伝子はLocusID:10133を有し、10番染色体上に局在し、細胞遺伝学的位置は10p12.33と報告されている。その遺伝子産物は、腫瘍壊死因子αによって誘導される細胞溶解を抑制する、ヘテロ二量体複合体の成分である。それはロイシンジッパーを含む。それはまた、ロイシンジッパードメインを含む腫瘍壊死因子α誘導細胞タンパク質、またはハンチントン相互作用タンパク質Lとして知られている。
CPS80は、セレン結合タンパク質1をコード化する、SELENBP1に対応する。その遺伝子はLocusID:8991を有し、1番染色体上に局在し、細胞遺伝学的位置は1q21−q22と報告されている。この遺伝子産物は、セレン結合タンパク質ファミリーに属する。セレンは、強力な抗発癌性を示す栄養素であり、セレンの欠乏はある種の神経疾患を引き起こす可能性がある。セレンの癌および神経疾患を予防する効果は、セレン結合タンパク質によって媒介される可能性があることが提唱されてきた。この遺伝子の正確な機能は、未知である。
CPS81は、タンパク質ホスファターゼ1、調節(抑制)サブユニット2をコード化する、PPP1R2に対応する。その遺伝子はLocusID:5504を有し、3番染色体上に局在し、細胞遺伝学的位置は3q29と報告されている。タンパク質ホスファターゼ1の抑制性サブユニット2は、タンパク質ホスファターゼ1のγアイソフォームと関連している可能性がある。
配列番号:81(U68111)のヌクレオチド25ないし556はまた、LOC153743と96%同一な配列を有する。この遺伝子は、タンパク質ホスファターゼ1、調節(抑制)サブユニット2に類似したタンパク質をコード化する。その遺伝子は、細胞遺伝学的位置は5q33.2と報告されている。
それに加えて、U68111のヌクレオチド25ないし556は、ある他の遺伝子と85−90%同一な配列またはゲノム配列を有する。これらの遺伝子またはゲノム配列には、PPP1R2P1、LOC160817についての3'領域、LOC130957の非コード領域、LOC220419の非コード領域、および7番および21番染色体上のある領域を含む。PPP1R2P1は、タンパク質ホスファターゼ1、調節(抑制)サブユニット2偽遺伝子1をコード化している。PPP1R2P1はLocusID:5505を有し、6番染色体上に局在し、細胞遺伝学的位置は6p21.1と報告されている。LOC160817は、タンパク質ホスファターゼ1、調節(抑制)サブユニット2に類似したタンパク質をコード化し、細胞遺伝学的位置は13q21.1と報告されている。LOC130957は、タンパク質ホスファターゼ1、調節(抑制)サブユニット2に類似したタンパク質をコード化し、染色体の2q12.1に局在している。LOC220419は、タンパク質ホスファターゼ1、調節(抑制)サブユニット2をコード化していると報告され、染色体の13q14.11に局在している。
CPS82は、ヒドロキシプロスタグランジン脱水素酵素15−(NAD)をコード化する、HPGDに対応する。その遺伝子はLocusID:3248を有し、4番染色体上に局在し、細胞遺伝学的位置は4q34−q35と報告されている。遺伝子産物は、C−15残基を酸化することによって、多くのプロスタグランジンを不活化することができる。
CPS83は、溶質キャリアファミリー4、陰イオン交換体、メンバー1(赤血球細胞膜タンパク質バンド3、Diego血液群)をコード化する、SLC4A1に対応する。その遺伝子はLocusID:6521を有し、17番染色体上に局在し、細胞遺伝学的位置は17q21−q22と報告されている。CPS83に整列するゲノム配列は、遺伝子のポリペプチドコード配列に3'局在している。その遺伝子はまた、CD233遺伝子として知られている。その遺伝子産物はまた、バンド3陰イオン交換体として知られ、陰イオン交換体(AE)ファミリーの一部である。遺伝子産物は、塩化物イオンおよび重炭酸イオンを輸送することによって、イオンの恒常性を維持するために機能している可能性がある。
配列番号259(M27819)はまた、98%以上同一な配列を有するSLC4A1に整列し、SLC4A1に対するプローブとして用いられ得る。配列番号259のヌクレオチド2206ないし2426はまた、SLC4A1と約76%同一な配列を示す。この遺伝子は、溶質キャリアファミリー4、陰イオン交換体、メンバー2(赤血球細胞膜タンパク質バンド3様1をコード化する、ALDH5A1に対応する。その遺伝子はLocusID:6522を有する。
CPS84は、インターロイキン17受容体をコード化する、IL17Rに対応する。その遺伝子はLocusID:23765を有し、22番染色体上に局在し、細胞遺伝学的位置は22q11.1と報告されている。その遺伝子産物は、ネズミのI117rに非常に類似しており、T細胞活性化およびIL−2(IL2)の誘導の役割を果たす可能性がある。
CPS87は、核結合因子、runtドメイン、αサブユニット2、転位させられた3をコード化する、CBFA2T3に対応する。その遺伝子はLocusID:863を有し、16番染色体上に局在し、細胞遺伝学的位置は16q24と報告されている。その遺伝子産物は、MTG8(ETO/CDR)タンパク質ファミリーのメンバーである。
CPS89は、RAP1GA1のイントロン配列に対応する。RAP1GA1は、rap1に対するGTPアーゼ活性化タンパク質1をコード化する。RAP1GA1遺伝子はLocusID:5909を有し、1番染色体上に局在し、細胞遺伝学的位置は1p36.1−p35と報告されている。その遺伝子産物はまた、KIAA0470遺伝子ファミリーとして知られている。
CPS90は、BCL2様1をコード化する、BCL2L1に対応する。その遺伝子はLocusID:598を有し、20番染色体上に局在し、細胞遺伝学的位置は20q11.1と報告されている。この遺伝子によってコード化されるタンパク質は、BCL−2タンパク質ファミリーに属する。BCL−2ファミリーのメンバーは、ヘテロまたはホモ二量体を形成し、幅広い種類の細胞活動に関わっている、抗アポトーシスまたはアポトーシス促進調節因子として作用する。この遺伝子によってコード化されるタンパク質は、ミトコンドリア外膜に局在し、ミトコンドリア外膜チャネル(VDAC)の開放を調節していることが示されてきた。VDACは、ミトコンドリアの膜電位を調節し、それによって、それら両方が細胞のアポトーシスの強力な誘導因子である、反応性の酸素核種の生成、およびミトコンドリアによるチトクロムCの解離を統制する。明確なアイソフォームをコード化する、少なくとも二つの別の形でスプライシングされた転写産物の変異体が報告されてきた。長いアイソフォームは、アポトーシス抑制因子として作用する可能性があり、短いアイソフォームは、アポトーシス活性化因子として作用する可能性がある。
CPS91は、核プロモーター分子結合タンパク質をコード化する、COPEBに対応する。その遺伝子はLocusID:1316を有し、10番染色体上に局在し、細胞遺伝学的位置は10p15と報告されている。この遺伝子は、核タンパク質(核プロモーター分子結合タンパク質)をコード化する。このタンパク質は、そのC末端ドメインの末端の三つの亜鉛フィンガー、セリン/トレオニンの多い中央領域およびN末端領域中に存在する酸ドメインを有する。このタンパク質の亜鉛フィンガーは、特定のDNAの、グアニンの多い核プロモーター分子との結合させる役割があると考えられている。中央領域は、活性化または翻訳後の調節経路に関わっている可能性があり、酸のN末端のドメインは転写活性化の過程で重要な役割を果たしている可能性がある。このタンパク質は、いくつかの組織において発現しており、胎盤においては高いレベルを有している。それは転写活性化因子である。同種のまたは異種のプロモーターよりもおよそ4倍転写を活性化することができる。発現パターンに関連した、このタンパク質のDNA結合および転写活性は、このタンパク質が、妊娠特異的糖タンパク質遺伝子、およびことによると他のTATAボックスのない遺伝子の基礎発現の調節および/または維持に関わっている可能性があることを示唆している。CPS91に整列するゲノム配列は、その遺伝子の配列をコードするポリペプチドに3'局在している。
CPS92は、アドレノメデュリンをコード化する、ADMに対応する。その遺伝子はLocusID:133を有し、11番染色体上に局在し、細胞遺伝学的位置は11p15.4と報告されている。アドレノメデュリンは、ヒトのクロム親和性細胞腫にみられる降圧性のペプチドであり、52のアミノ酸からなり、分子内ジスルフィド結合を有しており、カルシトニン遺伝子関連ペプチドとわずかな相同性を示す。それは血液中に相当量みられるため、循環コントロールにおけるホルモンとして機能する可能性がある。プレプロアドレノモデュリンと呼ばれる前駆体は、185のアミノ酸の長さである。RNAブロット分析によって、ヒトアドレノメデュリンmRNAは、いくつかの組織において高く発現していることが判明した。ゲノムADMDNAは、少なくとも4つのエクソンおよび3つのイントロンからなり、5つの主要側面領域は、TATA、CAATおよびGCボックスを含む。これらはまた、活性化タンパク質2およびcAMP調節エンハンサー分子に対する多数の結合部位が存在する。その遺伝子はまた、アドレノメデュリン(AM)の前駆体、および推定上20アミノ酸のペプチドproAM−N20をコード化する。その遺伝子産物は、血圧および心拍数を調節する可能性がある。
CPS93は、スペクトリン、β、赤血球をコード化する、SPTBに対応する(球状赤血球症、臨床型1を含む)。その遺伝子はLocusID:6710を有し、14番染色体上に局在し、細胞遺伝学的位置は14q23−q24.2と報告されている。βスペクトリン(βフォドリン)は、膜結合細胞骨格のアクチンタンパク質に架橋結合して良い。それは、アクチン架橋結合タンパク質ファミリーのメンバーである。
CPS94は、インテグリン、α2bをコード化する、ITGA2Bに対応する(IIb/IIIa複合体の血小板糖タンパク質IIb、抗原CD41B)。その遺伝子はLocusID:3674を有し、17番染色体上に局在し、細胞遺伝学的位置は17q21.32と報告されている。インテグリンは、α鎖およびβ鎖からなるヘテロ二量体膜貫通タンパク質である。α鎖2bは、転写後に解離を受け、β3と共に、凝集に重要な役割を果たす血小板において発現しているフィブロネクチン受容体を形成する、ジスルフィド結合した軽鎖および重鎖を生成する。この役割を妨げる変異が起こると、血小板無力症になる可能性がある。接着に加えて、インテグリンは、細胞表面媒介シグナル伝達に関わっていることが知られている。その遺伝子産物は、フィブリノーゲン、フォンウィルブラント因子およびフィブロネクチンに対する受容体として作用し得る。
CPS95は、カテニン(カドヘリン関連タンパク質)、α様1をコード化する、CTNNAL1に対応する。その遺伝子はLocusID:8727を有し、9番染色体上に局在し、細胞遺伝学的位置は9q31.2と報告されている。α様1カテニン(カドヘリン関連タンパク質)は、カドヘリンを細胞骨格に結合する。タンパク質は、カドヘリン結合タンパク質のカテニンファミリーのメンバーである。
CPS96は、小さい誘導性サイトカインA2(単球走化性タンパク質1)をコード化する、SCYA2に対応する。その遺伝子はLocusID:6347を有し、17番染色体上に局在し、細胞遺伝学的位置は17q11.2−q21.1と報告されている。サイトカインA2は、単球に対する走化性因子である。
CPS97は、NADH脱水素酵素(ユビキノン)1β副複合体、7(18kD、B18)をコード化する、NDUFB7に対応する。その遺伝子はLocusID:4713を有し、19番染色体上に局在し、細胞遺伝学的位置は19p13.12−p13.11と報告されている。その遺伝子産物は、NADH−ユビキノン酸化還元酵素(複合体1)の部分集合である。
CPS98は、小さい誘導性サイトカインA7(単球走化性タンパク質3)をコード化する、SCYA7に対応する。その遺伝子はLocusID:6354を有し、17番染色体上に局在し、細胞遺伝学的位置は17q11.2−q12と報告されている。この遺伝子は、炎症および転移の間マクロファージに影響を与える、分泌されたケモカインである単球走化性タンパク質3をコード化する。それは、二つの隣接したシステイン残基を有することによって特徴づけられる、ケモカインのC−Cサブファミリーのメンバーである。そのタンパク質は、細胞外マトリックス成分を分解する酵素である、マトリックス金属タンパク質分解酵素2の生体内の基質である。SCYA7は、17q染色体上のC−Cケモカインファミリーメンバーのクラスターの一部である。
配列番号:95(X72308)のヌクレオチド1ないし246は、少なくとも二つの他のゲノム配列と約95%同一な配列を有する。一番目のゲノム配列は、AMPD3およびZFP26のポリペプチド−コード配列の間に局在している。二番目のゲノム配列は、LOC139170の近傍に局在している。AMPD3は、アデノシン一リン酸デアミナーゼ(アイソフォームE)をコード化し、LocusID:272を有している。その遺伝子は、染色体11p15に局在している。ZFP26は、C3HC4様亜鉛フィンガータンパク質をコード化し、LocusID:50862を有している。その遺伝子は、染色体11p15.3に局在している。LOC139170は、KIAA1892に類似したタンパク質をコード化し、染色体Xq25に局在している。
CPS99は、IgGのFc断片、高親和性Ia、(CD64)に対する受容体をコード化する、FCGR1Aに対応する。その遺伝子はLocusID:2209を有し、1番染色体上に局在し、細胞遺伝学的位置は1q21.2−q21.3と報告されている。その遺伝子産物は、免疫応答における役割を有し、免疫グロブリンスーパーファミリーのメンバーである。
CPS100は、赤血球膜タンパク質バンド4.9(デマチン)をコード化する、EPB49に対応する。その遺伝子はLocusID:2039を有し、8番染色体上に局在し、細胞遺伝学的位置は8p21.1と報告されている。デマチンは、アクチンと結合して良い。アクチン結合タンパク質のビリンファミリーのメンバーである。
CPS101は、癌腫においてアップレギュレーションされている上皮のタンパク質、膜結合タンパク質17をコード化する、DD96に対応する。その遺伝子はLocusID:10158を有し、1番染色体上に局在し、細胞遺伝学的位置は1p33と報告されている。その遺伝子は、結腸、胸部および肺の癌腫と同様に、腎細胞癌という悪性の上皮細胞において、アップレギュレーションされていることが報告されている。
配列番号:98(U21049)のヌクレオチド1ないし87は、LOC222094と約98%同一な配列を示す。LOC222094は、細胞分裂周期2様5(アイソフォーム1)、コリンエステラーゼ関連細胞分裂コントローラー、およびCDC2関連タンパク質キナーゼ5をコード化する。それは、染色体7p15.2に局在している。
CPS102は、ペルオキシゾーム増殖活性化受容体、γをコード化する、PPARGに対応する。その遺伝子はLocusID:5468を有し、3番染色体上に局在し、細胞遺伝学的位置は3p25と報告されている。この遺伝子によってコード化されるタンパク質は、核受容体のペルオキシゾーム増殖活性化受容体(PPAR)サブファミリーのメンバーである。PPARは、レチノイドX受容体(RXRs)を有するヘテロ二量体を形成し、これらのヘテロ二量体は、様々な遺伝子の転写を調節する。PPARの三つのサブタイプが知られている:PPAR−α、PPAR−ΔおよびPPAR−γ。この遺伝子によってコード化されるタンパク質はPPAR−γであり、脂肪細胞の分化の調節因子である。それに加えて、PPAR−γは、肥満、糖尿病、アテローム性動脈硬化症および癌を含めた、非常の多くの疾患の病理に含まれてきた。代わりのプロモーターおよびスプライシングを用いる多数の転写産物の変異が、この遺伝子について同定されてきた。これらの変異の内少なくとも三つが、同じアイソフォームをコード化する。
配列番号:99(L40904)のヌクレオチド1ないし77は、HBA2と100%同一な配列を有する。HBA2は、ヘモグロビン、α2をコード化し、LocusID:3040を有する。その遺伝子は16番染色体上に局在し、細胞遺伝学的位置は16p13.3と報告されている。
Affymetrixの注釈は、CPS103がSPINK1に対応することを示唆している。Entrezヒトゲノムデーターベースに対するBlast検索は、CPS103がまた、少なくとも97%同一な配列を有する、SCGB3A2およびKIAA0555の間のゲノム配列に整列する。SCGB3A2は、分泌グロビン、ファミリー3A、メンバー2をコード化する。SCGB3A2およびKIAA0555は、染色体5q32に局在している。
CPS104は、プラスミノーゲン活性化物質、ウロキナーゼ受容体をコード化する、PLAURに対応する。その遺伝子はLocusID:5329を有し、19番染色体上に局在し、細胞遺伝学的位置は19q13と報告されている。その遺伝子産物である
、ウロキナーゼ型プラスミノーゲン活性化物質受容体は、細胞付近のプラスミノーゲン活性化において機能する可能性がある。
CPS105は、細胞分裂周期34をコード化する、CDC34に対応する。その遺伝子はLocusID:997を有し、19番染色体上に局在し、細胞遺伝学的位置は19p13.3と報告されている。この遺伝子によってコード化されるタンパク質は、ユビキチン結合酵素ファミリーのメンバーである。ユビキチン結合酵素は、他のタンパク質へのユビキチンの共有結合を触媒する。CDC34遺伝子産物は、大きい多数のタンパク質の複合体の一部であって良く、細胞周期G1調節因子のユビキチン媒介分解、およびDNA複製の開始に関わっている。遺伝子産物は、S.cerevisiaeCdc34pに類似しており、基質タンパク質にユビキチンを共有結合する可能性がある。
CPS106は、CG005のイントロン配列と100%同一の配列を示す、UNK_AI732885に対応する。CG005は、BCRA2領域に由来する仮定上のタンパク質をコード化する。CG005遺伝子はLocusID:10443を有し、13番染色体上に局在し、細胞遺伝学的位置は13q12−q13と報告されている。その遺伝子産物は、ラットの2',3'−環状ヌクレオチド3'−ホスホジエステラーゼの領域にあまり類似性のない領域を含む。
CPS107は、インターロイキン10受容体αをコード化する、IL10RAに対応する。その遺伝子はLocusID:3587を有し、11番染色体上に局在し、細胞遺伝学的位置は11q23と報告されている。U00672のヌクレオチド3467ないし3496は、染色体1p34.3に局在しているLOC200074と100%同一な配列を有する。
CPS108は、Fボックス唯一のタンパク質7をコード化する、FBXO7(FBX7)に対応する。その遺伝子はLocusID:25793を有し、22番染色体上に局在し、細胞遺伝学的位置は22q12−q13と報告されている。この遺伝子は、おおよそ40アミノ酸モチーフであるFボックスによって特徴づけられる、Fボックスタンパク質ファミリーのメンバーをコード化する。Fボックスのタンパク質は、ホスホリル化依存性ユビキチン化において機能する、SCFs(SKP1−クリン−Fボックス)と呼ばれるユビキチンタンパク質リガーゼ複合体の4つのサブユニットの一つを構成する。Fボックスタンパク質は、3つのクラスに分けられる:WD−40ドメインを含むFbws、ロイシンに富む反復配列を含むFblsおよび異なるタンパク質−タンパク質相互作用単位を含むか、または認識可能なモチーフを含まないFbxs。FBXO7によってコード化されるタンパク質は、Fbxsクラスに属し、造血の調節の役割を果たす可能性がある。この遺伝子の別途スプライシングされた転写変腫も報告されているが、その変種の全長は未だ限定されていない。
CPS109は、テトラトリコペプチド反復4つを有する、インターフェロン誘導性タンパク質をコード化する、IFIT4に対応する。その遺伝子はLocusID:3437を有し、10番染色体上に局在し、細胞遺伝学的位置は10q24と報告されている。
CPS110は、BCL2関連Xタンパク質をコード化する、BAXに対応する。その遺伝子はLocusID:581を有し、19番染色体上に局在し、細胞遺伝学的位置は19q13.3−q13.4と報告されている。この遺伝子によってコード化されるタンパク質は、BCL2タンパク質ファミリーに属する。BCL2ファミリーのメンバーは、ヘテロまたはホモ二量体を形成し、幅広い種類の細胞活動に関わっている、抗アポトーシスまたはアポトーシス促進調節因子として作用する。BAX遺伝子産物は、BCL2と共にヘテロ二量体を形成し、アポトーシス活性化因子として機能する可能性がある。この遺伝子産物は、ミトコンドリア電位依存性陰イオンチャネル(VDAC)と相互作用し、その開放数を増加させ、それが膜電位の喪失およびチトクロムcの解離を導くことが報告されている。この遺伝子の発現は、腫瘍抑制遺伝子P53によって調節され、P53媒介アポトーシスに関わっていることが示されてきた。6つの異なるスプライシングを受けた転写産物の変異は、異なるアイソフォームをコード化し、この遺伝子について報告されてきた。その遺伝子産物は、ミトコンドリア透過性を上昇させることによってカスパーゼ活性化を誘導し、アデニンヌクレオチド輸送体(ANT)と共同して機能する可能性がある。
CPS111は、ベイジジン(OK血液型)をコード化する、BSGに対応する。その遺伝子はLocusID:682を有し、19番染色体上に局在し、細胞遺伝学的位置は19p13.3と報告されている。ベイジジン(腫瘍細胞由来コラゲナーゼ刺激因子、細胞外マトリックス金属タンパク質分解酵素誘導、M6抗原としても知られる)は、線維芽細胞中のマトリックス金属タンパク質分解酵素合成を刺激する可能性がある。それは、免疫グロブリンスーパーファミリーのメンバーである。
CPS111はまた、97%以上の配列の同一性を有するLOC199717に整列する。LOC199717は、ベイジジンに類似したタンパク質をコード化する。LOC199717は、19番染色体上に局在し、細胞遺伝学的位置は19p13.3と報告されている。
CPS112は、トロンボスポンジン1をコード化する、THBS1に対応する。その遺伝子はLocusID:7057を有し、15番染色体上に局在し、細胞遺伝学的位置は15q15と報告されている。トロンボスポンジン1は、血液凝固および造血における役割を有している可能性がある。それは、接着分子のファミリーのメンバーである。
CPS113は、アダプター関連タンパク質複合体1、γ2サブユニットをコード化する、AP1G2(G2AD)に対応する。その遺伝子はLocusID:8906を有し、14番染色体上に局在し、細胞遺伝学的位置は14q11.2と報告されている。アダプチンは、細胞膜またはトランスゴルジネットワークからリソソームにリガンド受容体複合体を輸送する、クラスリン被覆小胞の重要な成分である。タンパク質のアダプチンファミリーは、α、β、β第一、およびγアダプチンと名付けられた4つのクラスの分子からなる。アダプチンは、培地および小さなサブユニットと共に、クラスリン被覆ピットおよび小胞の形成を促進することが役割である、アダプターと呼ばれるヘテロ四量体複合体を形成する。この遺伝子によってコード化されるタンパク質は、アダプター複合体の大型サブユニットファミリーに属する、γアダプチンタンパク質である。γアダプチンは、トランスゴルジネットワークおよび細胞表面の間の複合体経路における、トラフィッキング工程で機能すると考えられている。同じタンパク質をコード化する、この遺伝子の二つの異なるスプライシングを受けた、転写産物の変異が存在する。遺伝子産物は、AP−1複合体のβ1アダプチンおよびシグマ1鎖と相互作用し得る。
CPS115は、ralA結合タンパク質1をコード化する、RALBP1に対応する。その遺伝子はLocusID:10928を有し、18番染色体上に局在し、細胞遺伝学的位置は18p11.3と報告されている。RalA結合タンパク質1は、活性化したRalと相互作用し得る。
CPS115はまた、約99%同一な配列を有する、KIAA1634に整列する。KIAA1634は、KIAA1634タンパク質をコード化し、染色体1p12−p11.2に局在している。それに加えて、CPS115は、LOC129522、LOC131054および2番染色体上のゲノム配列と約89−92%同一な配列を示す。LOC129522は、ralA結合タンパク質1に類似したタンパク質をコード化し、染色体2q11.2に局在している。LOC131054はralA結合タンパク質1に類似したタンパク質をコード化し、染色体3q27.2に局在している。L42542のヌクレオチド3565ないし3875は、LOC221511のポリペプチドコード配列の近傍に局在している、6番染色体ゲノム配列と94%同一な配列を有する。LOC221511は、MHCクラスIIDP3−αをコード化しており、染色体6p21.2に局在している。
CPS116は、仮定上の遺伝子のLOC196932のイントロンに局在している、UNK_AF070587に対応する。LOC196932遺伝子は、仮定上のタンパク質のLOC55580に類似したタンパク質をコード化している。LOC196932は、14番染色体上に局在し、細胞遺伝学的位置は14q32.12と報告されている。
Affymetrixの注釈は、CPS117がDUX1に対応していることを示唆している。Entrezヒトゲノムデーターベースに対するBlast検索は、CPS117がまた、約82−86%同一な配列を有する、LOC200133およびLOC131115に整列する。LOC200133は、二重のホメオボックス、4(二重のホメオボックスタンパク質4)に類似したタンパク質をコード化する。それは、染色体1p31.3に局在している。LOC131115は、二重のホメオボックスタンパク質に類似したタンパク質をコード化しており、染色体3p14.1に局在している。
配列番号:113(AJ001481)のヌクレオチド1ないし698は、DUX4、LOC201498、LOC132684の近傍のゲノム配列、および仮定の遺伝子LOC132684の近傍のゲノム配列と約88%同一な配列を示す。DUX4は、二重のホメオボックス、4をコード化する。それはLocusID:22947を有し、4番染色体上に局在し、細胞遺伝学的位置は4q35と報告されている。LOC201498は、FSHD領域遺伝子2タンパク質をコード化しており、18番染色体上に局在している。LOC131308は、FSHD領域遺伝子2タンパク質に類似したタンパク質をコード化しており、染色体3p14.1に局在している。LOC132684は、染色体4q35.2に局在している。
CPS118は、溶質キャリアファミリー6(神経伝達物質輸送体、クレアチン)、メンバー8をコード化する、SLC6A8に対応する。その遺伝子はLocusID:6535を有し、X染色体上に局在し、細胞遺伝学的位置はXq28と報告されている。その遺伝子産物は、ナトリウムおよび塩化物依存性クレアチン輸送体である。それは、神経伝達物質輸送体ファミリーのメンバーである。
CPS118はまた、16番染色体上のゲノム領域と、約95%同一な配列を有する。この領域は、遺伝子LOC162151およびLOC146488を含むか、または部分的に重なる。LOC146488は、ディスインテグリン様精巣金属タンパク質分解酵素(EC3.4.24.−)IVbに類似したタンパク質、カニクイザル(断片)をコード化する。その領域は、細胞遺伝学的位置は16p11.1と報告されている。それに加えて、CPS118は、仮定上の遺伝子LOC204478およびLOC146493を含むか、または部分的に重なる、ゲノム配列と約98%同一な配列を有する。LOC146493は、ナトリウムおよび塩化物依存性クレアチン輸送体2(CT2)に類似したタンパク質をコード化する。
配列番号:114(U36341)のヌクレオチド13923ないし14462は、5'がCTAG2に位置し、3'がGAB3に位置する染色体領域と約94%同一な配列を有する。CTAG2は、癌/精巣抗原2をコード化し、LocusID:30848を有する。それは染色体Xq28に局在している。GAB3は、GRB2関連結合タンパク質3をコード化し、LocusID:139716を有する。それもまた染色体Xq28に局在している。
CPS119は、トロンボモデュリンをコード化する、THBDに対応する。その遺伝子はLocusID:7056を有し、20番染色体上に局在し、細胞遺伝学的位置は20p12−cenと報告されている。トロンボモデュリンは、凝血促進性のトロンビンを抗凝固性に変換し得る。
配列番号:115(J02973)のヌクレオチド3867ないし4212は、約97%同一な配列を有する2番染色体上のゲノム配列に整列する。ゲノム配列は、ソマトスタチン受容体に類似したタンパク質をコードするLOC200422、およびLOC205172の間に局在している。LOC200422およびLOC205172は共に、細胞遺伝学的位置は2p12と報告されている。
Entrezヒトゲノムデーターベースに対するBlast検索は、配列番号:116(CPS120)が、チューブリン、β5に類似したタンパク質をコード化するLOC203068のタンパク質コード鎖と約99%同一な配列を有する。LOC203068は、6番染色体上に局在している。それに加えて、配列番号116は、LOC157586およびLOC157584と、少なくとも99%同一な配列を有する。LOC157586およびLOC157584は、仮定のタンパク質DKFZp564N123.1(ヒト断片)に類似したタンパク質をコード化する。LOC157586およびLOC157584は共に、6番染色体上に局在している。配列番号:116(AF141349)はまた、LOC92755のタンパク質コード鎖と97%同一な配列を有している。LOC92755は、染色体8q21.1に局在している。
配列番号:116のヌクレオチド14ないし1586は、染色体7q14.1に局在しているLOC222017と91%同一な配列を有する。配列番号:116のヌクレオチド15ないし1572は、SCP2のイントロン配列と87%同一な配列を有する。SCP2は、ステロールキャリアタンパク質2をコード化し、LocusID:6342を有する。それは染色体1p32に局在している。6番染色体上に局在し、細胞遺伝学的位置は6p22と報告されている。ステロールキャリアタンパク質2は、ステロイド生成の調節の役割を果たしている。その上、配列番号116のヌクレオチド439ないし1474は、チューブリン、β、5をコード化するTUBB5と85%同一な配列を共有する。TUBB5はLocusID:10382を有し、染色体19p13.3に局在している。β5チューブリンは、重合して微小管を形成することができ、構造タンパク質ファミリーのメンバーである。配列番号:116のヌクレオチド421ないし1444はまた、TUBB4と84%同一な配列を有する。TUBB4は、チューブリン、β、4をコード化しており、LocusID:10381を有する。それは染色体16q24.3に局在している。配列番号:116のヌクレオチド142ないし1474は、80%同一な配列を有するLOC139112に整列する。LOC139112は、チューブリンβに類似したタンパク質をコード化しており、染色体Xq25に局在している。
CPS123は、ヘモグロビンε1をコード化する、HBE1に対応する。その遺伝子はLocusID:3046を有し、11番染色体上に局在し、細胞遺伝学的位置は11p15.5と報告されている。εグロビン遺伝子(HBE)は、胚の卵黄嚢において発現している。二つのε鎖は、二つのζ鎖(α様グロビン)と共に、胚のヘモグロビンHbGowerIを構成し、二つのε鎖は二つのα鎖と共に胚のヘモグロビンHbGowerIIを形成する。これら胚のヘモグロビンは共に、正常では胎児の、およびそれ以降の、成人のヘモグロビンに取って代わられる。5つのβ様グロビン遺伝子は、次の順序で11番染色体上の45kbのクラスター内にみられる:5'−ε−Gγ−Aγ−δ−β−3'。ヘモグロビンε1(胚のβ様)は、胚および組織の間で酸素および二酸化炭素を輸送でき、赤血球の代謝および老化を調節する。
CPS125は、MAX二量体化タンパク質をコード化する、MADに対応する。その遺伝子はLocusID:4084を有し、2番染色体上に局在し、細胞遺伝学的位置は2p13−p12と報告されている。MAX二量体化タンパク質は、MAX相互作用タンパク質のサブファミリーに属する。MAD遺伝子産物は、MAXとの結合についてMYCと競争し、配列特異的なDNA結合複合体を形成する。MAD遺伝子産物は、MYCが活性化因子として機能しているように思われるのに対して、転写抑制因子として機能し得る。MAD遺伝子産物は腫瘍抑制候補遺伝子である。遺伝子産物は、MAXと二量体形成する塩基性螺旋−ループ−螺旋のロイシンジッパータンパク質であって、MAXとヘテロ二量体を形成して転写を抑制する。遺伝子産物はまた、c−Myc(MYC)に拮抗し、細胞分化を促進する可能性がある。
CPS126は、テトラスパン5をコード化する、TSPAN−5に対応する。その遺伝子はLocusID:10098を有し、4番染色体上に局在し、細胞遺伝学的位置は4q23と報告されている。この遺伝子によってコード化されるタンパク質は、膜貫通4スーパーファミリーのメンバーであり、またテトラスパンファミリーとして知られている。そのスーパーファミリーにおける多くのメンバーが、四つの疎水性ドメインの存在によって特徴づけられる細胞表面タンパク質である。これらのタンパク質は、細胞の発育、活性化、成長および運動性の調節に関わっているシグナル伝達を媒介する可能性がある。
CPS127は、BCL−2結合蛋白質をコード化する、BAG−1に対応する。その遺伝子はLocusID:573を有し、9番染色体上に局在し、細胞遺伝学的位置は9p12と報告されている。オンコジーンBCL2は、アポトーシスまたはプログラムされた細胞死を誘導する経路の工程をブロックする膜タンパク質である。BAG1タンパク質はBCL2に結合し、BCL−2結合蛋白質と呼ばれる。BAG1は、BCL2の抗アポトーシス作用を高め、成長因子受容体および抗アポトーシス機構の間の連結に相当する。BAG1は、肝細胞成長因子受容体および血小板由来成長因子受容体の両方と相互作用し、両方の場合において、成長因子の媒介するアポトーシスからの保護を向上させる。少なくとも三つのタンパク質、BAG−1L、BAG−1MおよびBAG−1は、異なる翻訳開始部位を利用することによって、BAG−1mRNAによってコード化される。
配列番号:120(Z35491)のヌクレオチド454ないし1006はX染色体上の染色体領域と88%同一な配列を有する。それに加えて、配列番号:120のヌクレオチド517ないし646は、100%同一な配列を有するLOC205900に整列する。LOC205900は、セリンプロテアーゼ阻害剤Kazalタイプ4前駆体(ペプチドPEC−60類似物)に類似したタンパク質をコード化する。LOC205900は、4番染色体上に局在している。
CPS128は、ペプチジルアルギニンデイミナーゼ、タイプIIをコード化する、PADI2(PDI2)に対応する。その遺伝子はLocusID:11240を有し、1番染色体上に局在し、細胞遺伝学的位置は1p35.2−p35.1と報告されている。その遺伝子産物は、ラットの骨格筋のペプチジルアルギニンデイミナーゼタイプIIに類似しており、タンパク質中のアルギニン残基をシトルリン残基に変換する可能性がある。
配列番号:121(AB023211)のヌクレオチド3315ないし4119は、79%同一な配列を有するPRKG1に整列する。PRKG1は、タンパク質キナーゼ、cGMP依存性、タイプ1をコード化し、LocusID:5592を有する。タイプ1cGMP依存性タンパク質キナーゼは、血管平滑筋を弛緩させ、血小板凝集を阻害する可能性がある。その遺伝子は染色体10q11.2に局在している。配列番号:121のヌクレオチド1375ないし1500は、ペプチジルアルギニンデイミナーゼ、タイプIをコード化するPADI1と85%同一な配列を有する。PADI1は、LocusID:29943を有し、1番染色体上に局在し、細胞遺伝学的位置は1p36.13と報告されている。
CPS129は、インターロイキン1受容体、タイプ1をコード化する、IL1R1に対応する。その遺伝子はLocusID:3554を有し、2番染色体上に局在し、細胞遺伝学的位置は2q12と報告されている。タイプIインターロイキン1受容体は、インターロイキン−1(IL1A、IL1BおよびIL1RN)の三つ全ての型に結合し得る。タンパク質は、免疫グロブリンドメインを含む。
CPS130は、ヌクレオシドホスホリラーゼをコード化する、NPに対応する。その遺伝子はLocusID:4860を有し、14番染色体上に局在し、細胞遺伝学的位置は14q13.1と報告されている。NPは、酵素プリンヌクレオシドホスホリラーゼをコード化している。アデノシンデアミナーゼ(ADA)と共にコード化したタンパク質は、プリンの異化において重要な役割を果たし、救済経路と呼ばれている。コード化したタンパク質における変異は、重症複合免疫不全症(SCID)に至る可能性がある。
CPS131は、アクアポリン3をコード化する、AQP3の3'非翻訳領域に対応する。その遺伝子はLocusID:360を有し、9番染色体上に局在し、細胞遺伝学的位置は9p13と報告されている。CPS131は、AQP3の3'非翻訳領域に局在している。アクアポリン3は、水チャネルタンパク質である。アクアポリンは、主要な内在タンパク質(MIPまたはAQP0)に関連した、小さな膜貫通タンパク質のファミリーである。アクアポリン3は、腎臓の導管細胞が集合した基底側膜に局在している。水チャネル機能に加えて、アクアポリン3は、尿素およびグリセロールのような、非イオン性小溶質の輸送を、わずかではあるが、容易にすることが判明してきた。水チャネルは機能的に異成分からなり、水および溶質の浸透機構を有しうることを示唆している。
CPS132は、G1期からS期への遷移1をコード化する、GSPT1に対応する。その遺伝子はLocusID:2935を有し、16番染色体上に局在し、細胞遺伝学的位置は16p13.1と報告されている。その遺伝子産物はGTP結合タンパク質であり、GTP結合活性を有する。生成物は、ポリペプチド伸長因子EF1α(EEF1A1)に類似しており、G1期からS期への遷移における役割を果たす。
CPS132は、LOC120337と約85%同一な配列を有する。LOC120337は、G1期からS期への遷移タンパク質1類似物(GTP結合タンパク質GST1−HS)に類似したタンパク質をコード化する。LOC120337は、染色体11q22.3に局在している。X17644のヌクレオチド2301ないし2587は、83%の配列の同一性を有するGNB2に5'局在しているゲノム配列に整列する。GNB2は、グアニンヌクレオチド結合タンパク質(Gタンパク質)、βポリペプチド2をコード化する。GNB2はLocusID:2783を有し、7番染色体上に局在し、細胞遺伝学的位置は7q22と報告されている。配列番号:125(X17644)のヌクレオチド291ないし576および585ないし2494は、G1期からS期への遷移2をコード化するGSPT2と82−87%同一な配列を有する。GSPT2はLocusID:23708を有し、5番染色体に局在している。配列番号:125のヌクレオチド2522ないし2587は、LOC153643のイントロン配列と約93%同一な配列を有する。LOC153643は、仮定のタンパク質FLJ14957に類似したタンパク質をコード化しており、染色体5q21.1に局在している。
CPS133は、GABA(A)受容体結合タンパク質様2をコード化する、GABARAPL2(GEF−2)に対応する。その遺伝子はLocusID:11345を有し、16番染色体上に局在し、細胞遺伝学的位置は16q22.3−q24.1と報告されている。その遺伝子産物はリンタンパク質であり、推定されるアクチンおよびヌクレオチド結合部位を含む。その遺伝子産物の代わりの名前には、GEF2またはガングリオシド発現因子2を含む。
CPS133はまた、LOC206774に3'局在するゲノム配列、およびRAB3−GAP150のイントロン配列と約81−82%同一な配列を有する。LOC206774は、染色体8q24.12に局在している。RAB3−GAP150は、rab3GTPアーゼ活性化タンパク質の非触媒サブユニット(150kD)をコード化する。そRAB3−GAP150はLocusID:25782を有し、染色体1q42.12に局在している。配列番号:126(AI565760)のヌクレオチド26ないし253は、ACCN1のイントロン配列と約84%同一な配列を有する。ACCN1はLocusID:40を有し、染色体17q11.2−q12に局在している。
CPS134は、ヘモグロビン、δをコード化する、HBDに対応する。その遺伝子は11番染色体上に局在し、細胞遺伝学的位置は11p15.5と報告されている。その遺伝子はLocusID:3043を有する。ヘモグロビン、δをコード化する、HBDはまた、この染色体領域に局在している。α(HBA)およびβ(HBB)の座は、成人のヘモグロビン、HbA中のポリペプチド鎖の2タイプの構造を決定する。正常成人ヘモグロビン4量体は、二つのα鎖および二つのβ鎖からなる。変異βグロビンは、鎌状細胞貧血を引き起こす。β鎖の欠損は、β−0−サラセミアを引き起こす。βグロビンクラスターにおける遺伝子の順序は、5'−ε−γG−γA−δ−β−3'である。
CPS134の断片(配列番号:127のヌクレオチド2ないし366)は、93−96%同一な配列を有するHBBに整列する。その上、CPS134の他の断片(配列番号:127のヌクレオチド157ないし364)は、HBE1と80%同一な配列を有する。HBE1は、ヘモグロビン、ε1をコード化する。それはLocusID:3046を有し、染色体11p15.5に局在している。
CPS135は、ヒドロキシアシルグルタチオン加水分解酵素をコード化する、HAGHに対応する。その遺伝子はLocusID:3029を有し、16番染色体上に局在し、細胞遺伝学的位置は16p13.3と報告されている。この遺伝子によってコード化された酵素は、チオールエステラーゼとして分類され、S−ラクトイルグルタチオンを還元したグルタチオンおよびD−乳酸に加水分解する役割がある。
CPS136は、ERから核へのシグナル伝達1をコード化する、ERN1に対応する。その遺伝子はLocusID:2081を有し、17番染色体上に局在している。その遺伝子産物は、酵母のIre1遺伝子産物のヒト類似物である。ERN1タンパク質は、小胞体に基づくストレスシグナルに対する応答として遺伝子発現を変更する上で重要である。ERN1タンパク質は、膜貫通の小胞体タンパク質であり、折りたたまれていないタンパク質反応経路のセンサーとして作用する可能性がある。
配列番号:129(AF059198)のヌクレオチド1504ないし1536は、3番染色体上の染色体領域と96%同一な配列を有する。その領域は、ホメオボックスタンパク質グースコイドに類似したタンパク質をコード化するLOC152282の近傍にある。LOC15228は、染色体3p25.1に局在している。
CPS137は、コラーゲン、タイプIX、α1をコード化する、COL9A1に対応する。その遺伝子はLocusID:1297を有し、6番染色体上に局在し、細胞遺伝学的位置は6q12−q14と報告されている。この遺伝子は、タイプIXコラーゲンの三つのα鎖のうち一つ、硝子軟骨の主要なコラーゲン成分をコード化する。タイプIXコラーゲンは、通例タイプIIコラーゲンであるフィブリルコラーゲンを含む組織においてみられる。ノックアウトマウス研究は、α1鎖の合成がタイプIXコラーゲン分子、ヘテロ三量体分子の組み立てに不可欠であり、タイプIXコラーゲンの欠如が多発性骨端異形成症と関連している可能性があることを明らかにした。二つの転写産物の変異は、この遺伝子において同定されてきた。
CPS138は、S100カルシウム結合タンパク質A11(カルギザリン)をコード化する、S100A11に対応する。その遺伝子はLocusID:6282を有し、1番染色体上に局在し、細胞遺伝学的位置は1q21と報告されている。この遺伝子によってコードされるタンパク質は、2つのEF−ハンドカルシウム結合モチーフを含むタンパク質のS100ファミリーのメンバーである。S100タンパク質は、幅広い範囲の細胞の細胞質および/または核に局在し、細胞周期の進行および分化のような、いくつかの細胞の過程の調節に関わっている可能性がある。S100遺伝子は、少なくとも染色体1q21上のクラスターとして局在している13のメンバーを含む。S100A11遺伝子産物は、運動、侵入およびチューブリン重合において機能する可能性がある。染色体の転座およびS100A11の発現の変化は、腫瘍の転移に関わっていた。S100A11の5'UTRの異なるスプライシングによって、二つの遺伝子産物を生じる。
CPS138はまた、S100A14、LOC222128、LOC202763と約88−90%同一な配列、およびLOC221948を含むゲノム配列を有する。S100A14は、S100カルシウム結合タンパク質A14(カルギザリン)をコード化する。S100A14はLocusID:30013を有し、染色体7q22−q31.1に局在している。S100A14遺伝子産物は、ヒトカルグラヌリンCタンパク質に類似しており、S100タンパク質ファミリーに属していて良い。LOC222128は、タンパク質dpy−19qをコード化し、染色体7p15.3に局在している。LOC221948は、カルギザリン(S100Cタンパク質)(MLN70)をコード化し、染色体7p22.3に局在している。LOC202763は、タンパク質dpy−19に類似したタンパク質をコード化しており、17番染色体上に局在している。配列番号:131(D38583)のヌクレオチド103ないし149は、90%以上同一な配列を有するX染色体上のゲノム配列に整列する。
CPS139は、FK506結合タンパク質1B(12.6kD)をコード化する、FKBP1Bに対応する。その遺伝子はLocusID:2281を有し、2番染色体上に局在し、細胞遺伝学的位置は2p23.3と報告されている。この遺伝子によってコード化されたタンパク質は、イムノフィリンタンパク質ファミリーのメンバーである。このタンパク質のファミリーは、免疫調節および基本的細胞工程、例えば、タンパク質の折りたたみおよびトラフィッキングにおいて一の役割を果たす可能性がある。FKBP1B遺伝子産物は、免疫抑制剤のFK506およびラパマイシンと結合できる、シス−トランスプロピルイソメラーゼである。それは、FK506結合タンパク質1Aに類似している。その生理的役割は、心筋における刺激と収縮の連動にあると考えられている。少なくとも二つの異なるスプライシングを受けた、異なるアイソフォームをコード化するこの遺伝子の転写産物の変異が存在する。
CPS139はまた、LOC145581のイントロン配列と約83%同一な配列を有する。LOC145581は、仮定上のタンパク質MGC2656に類似したタンパク質をコード化し、それは染色体14q13.3に局在している。
CPS141は、RNAヘリカーゼファミリーをコード化する、RNAHに対応する。その遺伝子はLocusID:10973を有し、6番染色体上に局在し、細胞遺伝学的位置は6p16と報告されている。CPS141は、遺伝子の3'非翻訳領域に局在している。
CPS142は、ミオシン、軽いポリペプチド9、調節性をコード化する、MYL9(MYRL2)に対応する。その遺伝子はLocusID:10398を有し、20番染色体上に局在し、細胞遺伝学的位置は20q11.22と報告されている。その遺伝子産物はまた、ミオシン調節性軽鎖2としても知られている。その遺伝子産物は、ミオシンヘッドのATPアーゼ活性を調節する可能性があり、ミオシン活性を調節するタンパク質ファミリーのメンバーである。
CPS143は、斑点型POZタンパク質をコード化する、SPOPに対応する。その遺伝子はLocusID:8405を有し、17番染色体上に局在し、細胞遺伝学的位置は17q22と報告されている。遺伝子産物は、自己抗原タンパク質であり、DNAまたはアクチン結合タンパク質であってよい。生成物は、POZドメインを含み、タンパク質−タンパク質の相互作用を媒介して良い。
CPS144は、溶質キャリアファミリー11(プロトン結合二価の金属イオンの輸送体)、メンバー1をコード化する、SLC11A1の3'非翻訳領域に対応する。その遺伝子はLocusID:6556を有し、2番染色体上に局在し、細胞遺伝学的位置は2q35と報告されている。その遺伝子産物は、ネズミのBcg(Nramp1)に類似しており、マクロファージの抗菌活性を制御する可能性がある。
CPS145は、不在の7つの類似物2(キイロショウジョウバエ)をコード化する、SIAH2に対応する。その遺伝子はLocusID:6478を有し、3番染色体上に局在し、細胞遺伝学的位置は3q25と報告されている。遺伝子産物は、Vavおよび腎細胞癌媒介シグナル経路の負の調節因子である可能性がある。
CPS146は、S100カルシウム結合タンパク質Pをコード化する、S100Pに対応する。その遺伝子はLocusID:6286を有し、4番染色体上に局在し、細胞遺伝学的位置は4p16と報告されている。この遺伝子によってコード化されたタンパク質は、2つのEFハンドカルシウム結合モチーフを含むタンパク質の、S100ファミリーのメンバーである。S100タンパク質は、幅広い範囲の細胞の細胞質および/または核に局在し、細胞周期の進行および分化のような、いくつかの細胞の過程の調節に関わっている可能性がある。S100遺伝子は、少なくとも染色体1q21上のクラスターとして局在している13のメンバーを含む。しかしながら、S100Pは、染色体4p16に局在している。S100Pタンパク質は、Ca2+への結合に加えて、Zn2+およびMg2+とも結合する。このタンパク質は、前立腺癌の病因論において役割を果たす可能性がある。
CPS147は、骨格のトロポニンT1をゆっくりとコード化する、TNNT1に対応する。その遺伝子はLocusID:7138を有し、19番染色体上に局在し、細胞遺伝学的位置は19q13.4と報告されている。
配列番号:139(AJ011712)のヌクレオチド15639ないし15571は、染色体領域の4q32.3において84%同一な配列を有する。配列番号:139のヌクレオチド15562ないし15604は、TRAF5の近傍の染色体領域と93%同一な配列を有する。TRAF6はTNF受容体結合因子6をコード化しており、LocusID:7189を有する。TRAF6は染色体11p11.2に局在している。
CPS148は、KIAA0570遺伝子産物をコード化する、KIAA0750に対応する。その遺伝子はLocusID:9645を有し、11番染色体上に局在し、細胞遺伝学的位置は11p15.2と報告されている。
CPS149は、v−fosFBJネズミの骨肉腫ウィルスオンコジーン類似物をコード化する、FOSに対応する。その遺伝子はLocusID:2353を有し、14番染色体上に局在し、細胞遺伝学的位置は14q24.3と報告されている。Fos遺伝子ファミリーは、少なくとも四つのメンバーからなる:FOS、FOSB、FOSL1およびFOSL2。これらの遺伝子は、JUNファミリーのタンパク質と二量体を形成し、それによって転写因子複合体AP−1を形成することのできるロイシンジッパータンパク質をコード化する。そのように、FOSタンパク質は、細部増殖、分化および変形の調節因子として関わってきた。ある場合においては、FOS遺伝子の発現は、アポトーシスによる細胞死と関連してきた。FOS遺伝子産物は、転写因子として機能する可能性がある。それはまた、DNAのメチル化の調節に関わっている可能性がある。CPS149に整列する染色体領域はまた、LOC196923を含む。LOC196923は、プロトオンコジーンタンパク質c−fos(細胞内オンコジーンfos)(G0/G1スイッチ調節タンパク質7)に類似したタンパク質をコード化する。
配列番号:141(K00650)のヌクレオチド1ないし6210はまた、と約99%同一な配列を有する14番染色体上の染色体領域に整列する。この染色体領域は、LOC196937、LOC196936およびLOC196935を含む。これら三つの推定遺伝子は全て細胞遺伝学的位置14q23.2を報告している。LOC196936は、プロトオンコジーンタンパク質c−fos(細胞内オンコジーンfos)(G0/G1スイッチ調節タンパク質7)に類似したタンパク質をコード化する。LOC196935は、プロトオンコジーンタンパク質c−fos(細胞内オンコジーンfos)(G0/G1スイッチ調節タンパク質7)に類似したタンパク質をコード化する。
CPS150は、セリン(またはシステイン)プロテアーゼ阻害剤、クレードB(オバルブミン)、メンバー2をコード化する、SERPINB2(PAI2)に対応する。その遺伝子はLocusID:5055を有し、18番染色体上に局在し、細胞遺伝学的位置は18q21.3と報告されている。その遺伝子産物は、プラスミノーゲン活性化物質阻害剤、タイプII(アルギニン−セルピン)としても知られている。それは、セリンプロテアーゼ阻害剤のセルピンファミリーのメンバーである。この遺伝子産物についての代わりの名前は、PAIまたはPLANH2を含む。
CPS151は、ピリドキサル(ピリドキシン、ビタミンB6)キナーゼをコード化する、PDXKに対応する。その遺伝子はLocusID:8566を有し、21番染色体上に局在し、細胞遺伝学的位置は21q22.3と報告されている。
CPS152は、ホモサピエンスmRNAまたはcDNAのDKFZp564D113(クローンDKFZp564D113由来)に由来するものであって良い。CPS152は、ストリンジェントな条件下でCPS152にハイブリダイズすることができるRNA転写産物を生成する遺伝子または遺伝子群を表す、仮定の遺伝子UNK_AL049250に対応する。CPS152は、97−98%同一な配列を有する様々な染色体領域に整列する。ある領域は、LOC143518のイントロン配列中に局在するLOC196123を含む。LOC14358は、11番染色体上に局在する。他の領域は、染色体16p12.1に局在し、LOC146384、LOC197204およびLOC146136を含むか、または部分的に重なる。LOC146136は、タンパク質と相互作用する核膜孔複合体に類似したタンパク質をコード化する。3番目の領域はまた、染色体16p12.1に局在しており、仮定のタンパク質KIAA0220をコード化するLOC220548と部分的に重なる。4番目の領域は、KIAA0220タンパク質をコード化するkKIAA0220に隣接しており、染色体16p12.1に局在している。5番目の領域は、16p12.2であり、LOC146172と隣接している。6番目の領域は、7番染色体上であり、LOC202736、LOC154729およびLOC154725を含むか、または部分的に重なる。LOC154729は、タンパク質と相互作用する核膜孔複合体に類似したタンパク質をコード化する。LOC154725は、仮定のタンパク質KIAA0220に類似したタンパク質をコード化する。7番目の領域は、染色体16q13に局在しているLOC146385の近傍である。8番目の領域は、染色体16q13に局在しているLOC197445を含み、BTG3結合核タンパク質に類似したタンパク質、アイソフォーム(BNAP類似物またはSMAR1類似物)をコード化する。9番目の領域は、16q22.3であり、KIAA0251仮定のタンパク質に類似したタンパク質をコード化するLOC146452を含む。細胞遺伝学的位置は6p22と報告されている。10番目の領域は16p13.2であり、推定される遺伝子LOC146613に整列する。11番目の領域は、NPIPのポリペプチド配列に5'局在している。NPIPは、タンパク質と相互作用する核膜孔複合体をコード化し、LocusID:9284を有する。NPIPは、染色体16p13−p11に局在している。さらに他の領域は、LOC124155の近傍に局在している。LOC124155は、タンパク質と相互作用する核膜孔複合体に類似したタンパク質をコード化しており、染色体16p11.2に局在している。他の領域には、16p11.2にあるLOC197366、16p12.1−p11.2にあるKIAA0370、16p11.1にあるLOC146130および16p11.2にあるLOC197362を含む。
それに加えて、CPS152は、BANPと約97%同一な配列を有する。BANPは、BTG3結合核タンパク質をコード化し、LocusID:54971を有する。その遺伝子は18番染色体上に局在している。BTG3は、一般的な転写多サブユニット複合体の成分であるCAF1と相互作用するタンパク質である。BTG3は、細胞周期の負の調節に関与していると考えられている。BANPによってコード化されたタンパク質は、BTG3に結合し得る。マウスの類似物を用いた研究は、このコード化したタンパク質もまた、特定の核マトリックス/骨格結合領域(MAR)と相互作用する可能性があることを示唆している。異なるアイソフォームをコード化する転写変異体は、BANP遺伝子について記述されてきた。
CPS152はまた、約92%同一な配列を有するLOC118735に整列する。LOC118735は、アポトーシス反応タンパク質に類似したタンパク質、または前立腺アポトーシス反応タンパク質4をコード化する。この遺伝子は、10番染色体上に局在し、細胞遺伝学的位置は10q24.2と報告されている。
その上、AL049250(配列番号:144)の断片は、約75−85%同一な配列を有する他の染色体領域に整列する。例えば、AL049250のヌクレオチド182ないし2001は、LOC139011の近傍のゲノム配列に整列する。LOC139011は、シロイヌナズナDNA依存性RNAポリメラーゼ(EC2.7.2.6)II最大鎖(JDMU1)に類似したタンパク質をコード化する。LOC139011は、染色体11p15.5に局在している。配列番号144(AL049250)のヌクレオチド1720ないし2185は、ラット腎臓特異的(KS)遺伝子に類似した配列を有するLOC220178に整列し、染色体10q23.2に局在している。配列番号144のヌクレオチド1463ないし1911は、キャットアイ症候群染色体領域、候補7をコード化するCECR7に整列する。CECR7は、LocusID:27438を有し、22番染色体上に局在している。その上、配列番号144のヌクレオチド1483ないし1943は、SAラット高血圧関連類似物に類似したタンパク質をコード化し、15番染色体上に局在しているLOC204354に整列する。配列番号144のヌクレオチド1483ないし1943は、ブチル補酵素Aシンターゼ1をコード化するBUCS1に配列する。BUCS1はLocusID:116285を有し、16番染色体上に局在し、細胞遺伝学的位置は16p12.2と報告されている。
CPS153は、GRO2オンコジーンをコード化する、GRO2に対応する。その遺伝子はLocusID:2920を有し、4番染色体上に局在し、細胞遺伝学的位置は4q21と報告されている。その遺伝子産物は、多形核白血球に対する走化薬であってよい。
CPS153はまた、約85%同一な配列を有するGRO1に整列する。GRO1はGRO1オンコジーン(メラノーマ成長刺激活性、α)を表す。その遺伝子はLocusID:2919を有し、4番染色体に局在している。その遺伝子産物は、メラノーマ成長刺激活性を有し、炎症過程に関わる分裂促進因子であってよい。
それに加えて、X79535(配列番号145)のヌクレオチド2ないし298は、GRO3と約89−94%同一な配列を有する。GRO3はGRO3オンコジーンを表し、LocusID:2921を有する。その遺伝子は染色体4q21に局在している。GRO3遺伝子産物は、分裂促進因子であってよい。配列番号145(M36820)のヌクレオチド184−299は、LOC201963と91%同一な配列を有する。LOC201963は、核リボ核タンパク質A1(らせん不安定化タンパク質)(一本鎖結合タンパク質)(HDP)に類似したタンパク質をコードする。LOC201963は、染色体4q13.3に局在している。
CPS154は、イノシトールポリリン酸−4−ホスファターゼ、タイプI、107kDをコード化する、INPP4Aに対応する。その遺伝子はLocusID:3631を有し、2番染色体上に局在し、細胞遺伝学的位置は2q11.2と報告されている。INPP4A遺伝子産物は、ホスファチジルイノシトールシグナル経路に含まれる。この生成物は、イノシトール3,4−二リン酸からイノシトール環の4位のリン酸基を除去する。
CPS155は、グルタミン酸−ピルビン酸トランスアミナーゼ(アラニンアミノトランスフェラーゼ)をコード化する、GPTに対応する。その遺伝子はLocusID:2875を有し、8番染色体上に局在し、細胞遺伝学的位置は8q24.3と報告されている。
配列番号147(U70732)のヌクレオチド9ないし1550は、96%同一な配列を有する染色体領域に整列する。染色体領域は、FBXL6に3'局在している。FBXL6は、Fボックスおよびロイシンの多い反復タンパク質6をコード化し、LocusID:26233を有している。FBXL6は、染色体8q24.3に局在している。FBXL6は、およそ40アミノ酸モチーフであるFボックスによって特徴づけられるFボックスタンパク質ファミリーのメンバーである。配列番号147のヌクレオチド1962ないし2110は、グルタミン酸ピルビン酸トランスアミナーゼ(アラニンアミノトランスフェラーゼ)2をコード化する、GPT2と83%以上同一な配列を有する。GPT2はLocusID:84706を有し、16番染色体上に局在している。
CPS156は、ミオシン、軽鎖ポリペプチド4、アルカリ;心房、胚をコード化する、MYL4に対応する。その遺伝子はLocusID:4635を有し、17番染色体上に局在し、細胞遺伝学的位置は17q21−qterと報告されている。ミオシンは、六量体ATPアーゼ細胞内モータータンパク質である。それは、二つのミオシン重鎖、二つのリン酸化不可能なミオシンアルカリ軽鎖、および二つのリン酸化可能なミオシン調節性軽鎖からなる。MYL4は、胚の筋および成人の心房にみられるミオシンアルカリ軽鎖をコード化する。MYL4遺伝子産物は、ミオシンおよびアクチンの間の相互作用を調節する可能性がある。それは、ミオシンおよびアクチン調節タンパク質のファミリーのメンバーである。
CPS157は、核因子(赤血球由来2)、45kDをコード化する、NFE2に対応する。その遺伝子はLocusID:4778を有し、12番染色体上に局在し、細胞遺伝学的位置は12q13と報告されている。NFE2遺伝子産物は、bZIP二量体転写因子の45kDのサブユニットである。転写因子は、βグロビン遺伝子(HBB)の発現を調節する可能性がある。CPS157は、NFE2と同様に、ATF7のイントロン中に局在している。ATF7は、活性化転写因子7をコード化しており、LocusID:11016を有する。ATF7は、染色体12q13に局在している。遺伝子産物は、ロイシンジッパーDNA結合タンパク質であり、cAMP反応要素(CRE)を認識する可能性がある。遺伝子産物はまた、アデノウィルスE1a反応性プロモーターおよび細胞のcAMP誘導性プロモーターの調節に関わっている可能性がある。
CPS158は、ポリメラーゼ(RNA)II(DNA依存性)ポリペプチドJ(13,3kD)をコード化する、POLR2Jに対応する。その遺伝子はLocusID:5439を有し、7番染色体上に局在し、細胞遺伝学的位置は7q11.2と報告されている。この遺伝子は、真核細胞におけるメッセンジャーRNAを合成するために必要なポリメラーゼである、RNAポリメラーゼIIのサブユニットをコード化する。この遺伝子の生成物は、他のポリメラーゼのサブユニットと共にヘテロ二量体として存在し、ヘテロ二量体はポリメラーゼの核のサブアセンブリー単位を形成する。二つの類似した遺伝子は、染色体7q11.2の近傍に局在し、他の類似した座は染色体7p15にみられる。
配列番号150(L37127)のヌクレオチド11ないし382は、LOC245815と94%同一な配列を有する。LOC245815はまたPOLR2J2として知られ、DNA依存性RNAポリメラーゼIIポリペプチドJ結合遺伝子である。LOC245815はLocusID:246721を有し、染色体7q11.22に局在している。結合した座の類似性は、LOC245815がRNAポリメラーゼIIのサブユニットをコード化していることを示唆している。この遺伝子の異なるスプライシングは、異なるアイソフォームをコード化した、少なくとも三つの転写産物変異体を生じる。
それに加えて、L37127のヌクレオチド11ないし382は、LOC154696の近傍の染色体領域、および7番染色体上の染色体領域と94%同一な配列を有する。LOC154696は、HSPC047タンパク質に類似したタンパク質をコード化し、染色体7q15.1に局在している。
CPS159は、協力結合したアルギニンメチルトランスフェラーゼをコード化する、CARM1に対応する。その遺伝子はLocusID:10498を有し、19番染色体上に局在し、細胞遺伝学的位置は19p13.2と報告されている。
CPS160は、LOC206073のイントロン配列中に局在している、UNK_AF038171に対応する。LOC206073は4番染色体上に局在し、細胞遺伝学的位置は4q24と報告されている。
CPS161は、RAB2、メンバーRASオンコジーンファミリーをコード化する、RAB2に対応する。その遺伝子はLocusID:5862を有し、8番染色体上に局在し、細胞遺伝学的位置は8q11.23と報告されている。RAB2遺伝子産物はまた、GTP結合タンパク質2としても知られており、ERからゴルジ複合体への小胞輸送に関わっている可能性がある。その遺伝子産物はRABサブファミリーのメンバーである。
Affymetrixの注釈では、CPS162が、6H9Aに対応していることを示唆している。Entrezヒトゲノムデーターベースに対するBlast検索は、CPS162が、94%同一な配列を有するMYO1Eのイントロン配列に整列することを示している。MYO1Eは、ミオシンIEをコード化し、LocusID:4643を有する。MYOO1Eは15番染色体上に局在し、細胞遺伝学的位置は15q21−q22と報告されている。MYOO1E遺伝子産物はクラスIミオシンに類似しており、プロリンの多いペプチドに結合する可能性がある。その遺伝子産物は、Src相同部3(SH3)およびミオシンヘッドドメイン(モータードメイン)を含む。
CPS163は、赤血球膜タンパク質バンド4.2をコード化する、EPB42に対応する。その遺伝子はLocusID:2038を有し、15番染色体上に局在し、細胞遺伝学的位置は15q15−q21と報告されている。赤血球膜タンパク質バンド4.2は、タンパク質3のアンキリンとの結合を調節し得るATP結合タンパク質である。それは、恐らく赤血球の形態および機構の適当な調節について役割を果たすであろう。EPB42遺伝子における変異は、劣性球状楕円状赤血球症および劣性遺伝遺伝性溶血性貧血と関連している。
CPS163はまた、約97%同一な配列を有するLOC203401に整列する。LOC203401は、赤血球膜タンパク質バンド4.2(P4.2)(パリジン)に類似したタンパク質をコード化している。LOC203401の染色体上の局在は知られていない。
CPS164は、「αグロビンクラスターにテトメアである保存された遺伝子」を意味する、CGTHBAに対応する。その遺伝子はLocusID:8131を有し、16番染色体上に局在し、細胞遺伝学的位置は16p13.3と報告されている。
CPS165は、口腔癌関連1において欠失した腫瘍抑制因子をコード化する、DOC−1Rに対応する。その遺伝子はLocusID:10623を有し、11番染色体上に局在し、細胞遺伝学的位置は11q13と報告されている。その遺伝子産物は、ハムスターのdoc−1に類似している。CPS165はまた、約89%同一な配列を有するLOC222984に整列する。LOC222984は、口腔癌関連1において欠失した腫瘍抑制因子に類似したタンパク質をコード化し、染色体7p22.2に局在している。
配列番号157(AF089814)のヌクレオチド3ないし663は、LOC169609およびLOC169607と約86%同一な配列を有する。両遺伝子は、ミオシンVb(ミオシン5B)に類似したタンパク質をコード化する。LOC169609は染色体9q12に局在する。LOC169607は染色体9q21.11に局在する。それに加えて、AF089814のヌクレオチド3ないし777は、LOC138403と86−93%同一な配列を有する。LOC138403は、ミオシンVb(ミオシン5B)に類似したタンパク質をコード化し、染色体9q13に局在する。
CPS166は、デスマスリンをコード化する、KIAA0353(DMN)に対応する。その遺伝子はLocusID:23336を有する。DMNは、15番染色体上に局在し、細胞遺伝学的位置は15q26.3と報告されている。
CPS166の断片(A1077476のヌクレオチド477ないし602)は、約97%同一な配列を有するLOC120511に整列する。LOC120511は、rig−1タンパク質(マウス)に類似したタンパク質をコード化しており、染色体11q23.3に局在している。
Affymetrixの注釈では、CPS167はCSH1に対応することを示唆している。Entrezヒトゲノムデーターベースに対するBlast検索は、CPS167がまた、約98%同一な配列を有するCSH2に整列することを示している。CSH2は絨毛性ソマトトロフィンホルモン2をコード化している。その遺伝子はLocusID:1443を有し、17番染色体上に局在し、細胞遺伝学的位置は17q24.2と報告されている。この遺伝子によってコード化されたタンパク質は、ホルモンのソマトトロフィン/プロラクチンファミリーのメンバーであり、成長の調節において重要な役割を果たす可能性がある。CSH2は、同じ転写方向で4つの他の関連遺伝子と共に、17番染色体上の成長ホルモン座に局在している。この配列は、一連の遺伝子複製によって考案された。五つの遺伝子は高度の同一性を有する配列を共有するけれども、異なる組織において発現していることが報告されている。異なるスプライシングは五つの成長因子各々の追加のアイソフォームを生成する。CSH2は、胎盤において発現しており、多数の転写開始部位を利用する。絨毛性ソマトトロフィンホルモン1および2についての成熟タンパク質の発現は発達の間にアップレギュレートされる。
CPS168は、ディックコップ類似物3(アフリカツメガエル)(RIG様5−6)をコード化する、LOC51048(DKK3)に対応する。その遺伝子はLocusID:27122を有し、11番染色体上に局在し、細胞遺伝学的位置は11p15.2と報告されている。DKK3遺伝子産物はまた、RIG様7−1としても知られ、Wntシグナルに拮抗するタンパク質に関連している可能性がある。
配列番号160(AF034209)のヌクレオチド3ないし92は、RIG(神経膠腫において調節される)約90%以上同一な配列を有する。RRRIGはLocusID:10530を有し、染色体11p15.1に局在している。
CPS169は、セレクチンP(顆粒膜タンパク質140kD、抗原CD62)をコード化する、SELPに対応する。その遺伝子はLocusID:6403を有し、1番染色体上に局在し、細胞遺伝学的位置は1q22−q25と報告されている。SELP遺伝子産物は、血小板活性化および脱顆粒の間、原形質膜に再分配する分子量140000の血小板α−顆粒膜タンパク質である。それは、接着/ホーミング受容体ファミリーのメンバーである。異なるスプライシング変異体は生じる可能性があるが、あまり報告されていない。遺伝子産物は、白血球の血管壁との相互作用を媒介する可能性がある。それは、EGFドメインおよび相補的調節(CR)タンパク質ドメインを含む。
CPS170は、RAP1に対するGTPアーゼ活性化タンパク質をコード化する、RAP1GA1に対応する。その遺伝子はLocusID:5909を有し、1番染色体上に局在し、細胞遺伝学的位置は1p36.1−p35と報告されている。配列番号162(M64788)のヌクレオチド916ないし1044は、KIAA1039と約85%同一な配列を有する。KIAA1039は、KIAA1039タンパク質をコード化し、LocusID:23108を有する。その遺伝子は、細胞遺伝学的位置は17p13.3と報告されている。
CPS171は、トロンボスポンジン1をコード化する、THBS1に対応する。その遺伝子はLocusID:7057を有し、15番染色体上に局在し、細胞遺伝学的位置は15q15と報告されている。トロンボスポンジン1は、血液凝固および造血において役割を果たす可能性がある。それは、接着分子ファミリーのメンバーである。
CPS172は、コリン作動性受容体、ニコチン性、αポリペプチドをコード化する、CHRNA4に対応する。その遺伝子はLocusID:1137を有し、20番染色体上に局在し、細胞遺伝学的位置は20q13.2−q13.3と報告されている。配列番号164(U62433)のヌクレオチド615ないし1995はまた、LOC149656に整列する。LOC149656は、ニューロンアセチルコリン受容体タンパク質、α−4鎖前駆体をコード化し、染色体20q13.33に局在する。
U62433のヌクレオチド602ないし1313の断片(配列番号:164)は、約79−89%同一の配列を有するCHRNA2、CHRNA3およびCHRNB2に整列する。CHRNA2は、コリン作動性受容体、ニコチン性、αポリペプチド2(ニューロン)をコード化する、CHRNA2はLocusID:1135を有し、染色体8p21に局在している。CHRNA3は、コリン作動性受容体、ニコチン性、αポリペプチド3をコード化する、CHRNA2はLocusID:1136を有し、染色体15q24に局在している。CHRNB2は、コリン作動性受容体、ニコチン性、βポリペプチド2(ニューロン)をコード化する、CHRNA2はLocusID:1141を有し、染色体1q21.3に局在している。
CPS173は、S100カルシウム結合タンパク質A12(カルグラヌリンC)をコード化する、S100A12に対応する。その遺伝子はLocusID:6283を有し、1番染色体上に局在し、細胞遺伝学的位置は1q21と報告されている。この遺伝子によってコード化されたタンパク質は、2つのEFハンドカルシウム結合モチーフを含むタンパク質のS100ファミリーのメンバーである。S100タンパク質は、幅広い範囲の細胞の細胞質および/または核に局在しており、細胞周期の進行および分化のような、いくつかの細胞の過程の調節に関わっている可能性がある。S100遺伝子は、少なくとも染色体1q21上のクラスターとして局在している13のメンバーを含む。S100A12遺伝子産物は、特定のカルシウム依存性シグナル変換経路に関わっていると考えられ、細胞骨格成分に対する調節効果は様々な好中球活性を調節する可能性がある。
CPS174は、CD9抗原(p24)をコード化する、CD9に対応する。その遺伝子はLocusID:928を有し、12番染色体上に局在し、細胞遺伝学的位置は12p13.3と報告されている。この遺伝子によってコード化されたタンパク質は、膜貫通4スーパーファミリーのメンバーであり、またテトラスパニンファミリーとしても知られている。これらメンバーのほとんどは、四つの疎水ドメインの存在によって特徴づけられる細胞表面タンパク質である。これらのタンパク質は、細胞の発育、活性化、成長および運動性の調節に関わっているシグナル伝達を媒介する。CD9コード化したタンパク質は、インテグリンおよび他の四つの膜貫通スーパーファミリーのタンパク質と複合体を形成することが知られている、細胞表面の糖タンパク質である。それは、細胞接着および遊走を調節でき、また血小板活性化および凝集の引き金となり得る。それに加えて、コード化したタンパク質は、筋細胞の融合を促進し、微小管の維持を支えると思われる。
CPS175は、ペルオキシレドキシン2をコード化する、PPDX2(TDPX1)に対応する。ペルオキシレドキシン2はまた、チオレドキシン依存性ペルオキシド還元酵素(チオール特異的抗酸化剤1、ナチュラルキラー賦活因子B)としても知られ、抗酸化ストレスに対して保護してよい。PPDX2遺伝子はLocusID:7001を有し、19番染色体上に局在し、細胞遺伝学的位置は19p13.2と報告されている。
CPS175は、MGC2599およびLOC134602と約88%同一な配列を有する。MGC2599は、カテニンp60サブユニットA12599に類似した仮定上のタンパク質MGC2599をコード化する。その遺伝子はLocusID:84056を有し、染色体13q12.2に局在している。LOC134602は、チオール特異的抗酸化剤(TSA)に類似したタンパク質をコード化し、染色体6q21に局在している。
配列番号167(L19285)のヌクレオチド497ないし767は、89%同一な配列を有するLOC219772に整列する。LOC219772は、ペルオキシレドキシン2(チオレドキシンペルオキシダーゼ1)(チオレドキシン依存性ペルオキシド還元酵素1)(チオール特異的抗酸化剤タンパク質)(TSA)(PRP)(ナチュラルキラー細胞賦活因子B)(NKEF−B)をコード化する。LOC219772は、染色体10q11.21に局在している。その上、L19185のヌクレオチド5ないし65は、LOC204141およびLOC205227と100%同一な配列を示す。LOC205227は、マロニルCoA脱炭酸酵素(EC4.1.1.9)(ガチョウ)に類似したタンパク質をコード化し、2番染色体に局在している。
CPS176は、B7タンパク質をコード化する、B7に対応する。その遺伝子はLocusID:10233を有し、12番染色体上に局在し、細胞遺伝学的位置は12p13と報告されている。B7タンパク質は、タンパク質ホスファターゼの調節サブユニットに対して低い配列の類似性を有する。B7タンパク質は、ロイシンの多い反復配列を含み、タンパク質−タンパク質相互作用を媒介する可能性がある。
CPS177は、2,3−ビスホスホグリセリン酸ムターゼをコード化する、BPGMに対応する。その遺伝子はLocusID:669を有し、7番染色体上に局在し、細胞遺伝学的位置は7q31−q34と報告されている。2,3−ビスホスホグリセリン酸ムターゼは、シンターゼ、ムターゼおよびホスファターゼ活性を有する。それは、2,3−ビスホスホグリセリン酸代謝の制御に関わっている。
CPS178は、プロテアソーム(プロソーム、マクロパイン)サブユニット、αタイプ、7をコード化する、PSMA7に対応する。その遺伝子はLocusID:5688を有し、20番染色体上に局在し、細胞遺伝学的位置は20q13.33と報告されている。プロテアソーム(プロソーム、マクロパイン)のαサブユニットは、B型肝炎ウィルスXタンパク質に対する可能な標的である。
CPS179は、グアノシン一リン酸還元酵素をコード化する、GMPRに対応する。その遺伝子はLocusID:2766を有し、6番染色体上に局在し、細胞遺伝学的位置は6p23と報告されている。グアノシン一リン酸還元酵素は、熱産生を容易にし、ラットのグアノシン一リン酸還元酵素に非常に強い類似性を有する。
CPS180は、トロポモデュリンをコード化する、TMODに対応する。その遺伝子はLocusID:7111を有し、9番染色体上に局在し、細胞遺伝学的位置は9q22.3と報告されている。トロポモデュリンは、赤血球トロポミオシンの末端に結合し得る。
CPS181は、補体成分4Aをコード化する、C4Aに対応する。その遺伝子はLocusID:720を有している。その遺伝子は6番染色体上に局在している。この遺伝子は、古典的活性化経路の一部である、補体因子4の酸型をコード化する。その遺伝子産物は、α、βおよびγ鎖の三量体に、分泌する前にタンパク質分解によって解離される一本鎖の前駆体として発現している。三量体は、抗原抗体複合体および他の補体成分の間の相互作用のための表面を与える。α鎖は切断され、局所炎症のメディエーターである、C4アナフィラキシー毒素を放出するかもしれない。補体成分4Aの欠損は、全身性エリテマトーデスおよび1型糖尿病と関連している。C4A遺伝子は、6番染色体上の主要組織適合遺伝子複合体(MHC)クラスIII領域に局在する。個体がこの遺伝子の1、2または3コピーを有するような、この遺伝子クラスターの様々なハプロタイプが存在する。
CPS181(配列番号173のヌクレオチド1ないし45およびヌクレオチド199ないし248)の断片はまた、100%同一な配列を有するLOC220819に整列する。LOC220819は、dJ34F7.4(補体成分4A)に類似したタンパク質をコード化する。LOC220819は、6番染色体上に局在している。
それに加えて、CPS181は、94%以上同一な配列を有するC4Bに整列する。C4Bは補体成分4Bをコード化し、LocusID:721を有する。C4Bは、染色体6p21.3に局在している。C4B遺伝子は、補体因子4の基本型、古典的活性化経路の一部をコード化する。この遺伝子は、イントロン9中の6.4kbの内在性HERV−Kレトロウィルスが存在するかまたは存在しないかによって、長い形態および短い形態として存在する。
CPS182は、Gタンパク質結合受容体12をコード化する、GPR12に対応する。その遺伝子はLocusID:2835を有し、13番染色体上に局在し、細胞遺伝学的位置は13q12と報告されている。その遺伝子産物は、Gタンパク質結合受容体ファミリーのメンバーである。それは、ネズミのGpcr12およびラットのRn.10218に類似している。
CPS182はまた、97%同一な配列を有するLOC202175の近傍の配列に整列する。LOC202175は、染色体5p15.33に局在している。
CPS183は、脂肪分化関連タンパク質をコード化する、ADFPに対応する。その遺伝子はLocusID:123を有し、9番染色体上に局在し、細胞遺伝学的位置は9p21.2と報告されている。脂肪細胞分化関連タンパク質は、顆粒表面膜物質と関連している。このタンパク質は、顆粒表面の主成分である。mRNAレベルの上昇は、脂肪細胞の分化の早期の指標の一つである。タンパク質は、乳液の顆粒の成分である。タンパク質はまた、アジポフィリンとして知られている。
配列番号175(X97324)のヌクレオチド1ないし1314は、インターロイキン賦活結合因子2、45kDをコード化するILF2と91−92%同一な配列を有する。ILF2はLocusID:3608を有し、染色体1q21.1に局在している。遺伝子産物は、活性化T細胞の核因子(NF−AT)の部分集合である。それはDNA結合転写因子である。
CPS184は、ミオシン、軽鎖ポリペプチド5、調節性をコード化する、MYL5に対応する。その遺伝子はLocusID:4636を有し、4番染色体上に局在し、細胞遺伝学的位置は4p16.3と報告されている。この遺伝子は、ミオシン軽鎖のうちの一つ、六量体ATPアーゼ細胞モータータンパク質ミオシンの成分をコード化する。ミオシンは、二つの重鎖、二つのリン酸化不可能なアルカリ軽鎖、および二つのリン酸化可能な調節的軽鎖からなる。この遺伝子産物、調節的軽鎖の一つは、胎児の筋、および成人の網膜、小脳および脳幹神経節において発現している。その遺伝子産物は、ミオシンおよびアクチンの間の相互作用を媒介している可能性がある。それは、ミオシンおよびアクチン調節タンパク質ファミリーのメンバーである。
CPS185は、ドリチルリン酸マンノシルトランスフェラーゼポリペプチド2、調節性サブユニットをコード化する、DPM2に対応する。その遺伝子はLocusID:8818を有し、9番染色体上に局在し、細胞遺伝学的位置は9q34.13と報告されている。
CPS186は、結腸直腸癌において変異したタンパク質をコード化する、MCCに対応する。その遺伝子はLocusID:4163を有し、5番染色体上に局在し、細胞遺伝学的位置は5q21−q22と報告されている。MCCは、結腸直腸癌抑制推定遺伝子の候補遺伝子である。MCC遺伝子産物は、孤発性および家族性腫瘍両方の早期の結腸直腸の腫瘍形成に関わっている可能性がある。その遺伝子産物は、Gタンパク質と結合した、ムスカリン性アセチルコリン受容体に類似している。
CPS187は、凝固因子III(トロンボプラスチン、組織因子)をコード化する、F3に対応する。その遺伝子はLocusID:2152を有し、1番染色体上に局在し、細胞遺伝学的位置は1p22−p21と報告されている。この遺伝子は、細胞表面の糖タンパク質である凝固因子IIIをコード化している。この因子は、細胞に血液凝固カスケードを開始させることができ、凝固因子VIIの高親和性受容体として機能する。得られた複合体は、特に限定されたタンパク質分解によって、凝固プロテアーゼカスケードの開始と関連する触媒性事象を提供する。非機能性の前駆体として循環している、これらのプロテアーゼカスケードの他のいくつかの補因子と異なり、凝固因子IIIは、細胞表面に発現された際に完全な機能を持つ強力な開始物質である。この因子には3つの異なったドメインが存在する:細胞外ドメイン、膜貫通ドメイン、および細胞質ドメイン。凝固因子IIIは、凝固プロテアーゼカスケードの集合および伝搬を開始させ、正常の止血において機能する可能性がある。その因子は、細胞の免疫応答の成分である。
CPS188は、クルッペル様因子1(赤血球)をコード化する、KLF1に対応する。その遺伝子はLocusID:10661を有し、19番染色体上に局在し、細胞遺伝学的位置は19p13.13−p13.12と報告されている。赤血球のクルッペル様因子1は、成人のβグロブリンプロモーターの転写活性化因子である。
CPS188はまた、94%同一な配列を有するLOC146544に整列する。LOC146544は、16番染色体に局在している。
CPS189は、HBG2に対応する。HBG2は、ヘモグロビン、γGをコード化する。その遺伝子はLocusID:3047を有し、11番染色体上に局在し、細胞遺伝学的位置は11p15.5と報告されている。HBG1はまた、同じ染色体領域に局在している。γグロビン遺伝子(HBG1およびHBG2)は、通常胎児の肝臓、脾臓および骨髄において発現されている。二つのγ鎖は、二つのα鎖と共に胎児のヘモグロビン(HbF)を構成し、それは通常生まれたときに成人のヘモグロビン(HbA)によって置き換えられる。βサラセミアはおよび関連疾患においては、γ鎖生成が成人期まで継続する。二つのタイプのγ鎖は、136残基が、Gγ生成物(HBG2)においてはグリシンであり、Aγ生成物(HBG1)においてはアラニンであるという点で異なる。前者は、生まれたときに優勢である。βグロビンクラスター中の遺伝子の順序は、5'−ε−γG−γA−δ−β−3'である。遺伝子産物は、酸素および二酸化炭素を、肺および組織の間で運搬する。
CPS189の断片(配列番号:181のヌクレオチド332.234)は、ヘモグロビン、ε1をコード化するHBE1と86%同一な配列を有する。
それに加えて、配列番号:277(M91036)は、HBG2を検出するためのプローブを構築するために用いられ得る。配列番号:277のヌクレオチド2162−2268、2391−2614および3501−3565は、100%同一な配列を有するHBG2に整列する。配列番号:277のヌクレオチド2379ないし2626および7309ないし7556は、ヘモグロビン、ε1をコード化するHBE1と86%同一な配列を有する。HBE1遺伝子は、LocusID:3046を有し、染色体11p15.5に局在している。配列番号:277の2384ないし2621および7314ないし7551はまた、11番染色体上の染色体領域と84%同一な配列を有する。
CPS190は、GRO3オンコジーンをコード化する、GRO3に対応する。その遺伝子はLocusID:2921を有し、4番染色体上に局在し、細胞遺伝学的位置は4q21と報告されている。その遺伝子産物は、分裂促進因子である可能性がある。
配列番号:182(M36821)のヌクレオチド6ないし298は、GRO1およびGRO2と86−95%同一な配列を有する。GRO1は、GRO1オンコジーン(メラノーマ成長刺激活性、α)をコード化し、LocusID:2919を有する。GRO1は、染色体の4q21に局在している。GRO1遺伝子産物は、メラノーマ成長刺激活性を有し、炎症過程に関与している分裂促進因子である可能性がある。GRO2は、GRO2オンコジーンをコード化し、LocusID:2920を有する。GRO2は、染色体の4q21に局在している。GRO2遺伝子産物は、多形核白血球についての走化性因子である可能性がある。
Affymetrixの注釈では、CPS191がPLEC1に対応することを示唆している。Entrezヒトゲノムデーターベースに対するBlast検索は、配列番号:183(U53204)のヌクレオチド14629ないし14800は、LOC162613およびLOC93232の近傍の染色体領域と93%同一な配列を有することを示している。LOC162613およびLOC93232は共に、染色体17q25.3に局在し、KIAA1640タンパク質に類似したタンパク質をコード化する。それに加えて、配列番号:183(U53204)のヌクレオチド14629ないし14800は、88%同一な配列を有するLOC160535に整列する。LOC160535は、染色体12q12に局在している。
CPS192は、溶質キャリアファミリー16(モノカルボキシル酸輸送体)、メンバー3をコード化する、SLC16A3に対応する。その遺伝子はLocusID:9123を有し、17番染色体上に局在している。その遺伝子産物は、モノカルボキシル酸輸送体ファミリーのメンバーであり、輸送体として機能する可能性がある。配列番号:184(U81800)のヌクレオチド34ないし945は、96%以上の配列同一性を有するLOC201281に整列する。LOC201281は、モノカルボキシル酸輸送体に類似したタンパク質をコード化し、染色体17q25.3に局在している。
CPS194は、FK506結合タンパク質8(38kD)をコード化する、FKBP8に対応する。その遺伝子はLocusID:23770を有し、19番染色体上に局在し、細胞遺伝学的位置は19p12と報告されている。この遺伝子によってコード化されたタンパク質は、イムノフィリンタンパク質ファミリーのメンバーであり、免疫調節、タンパク質の折りたたみおよびトラフィッキングを伴う基本的細胞過程における役割を果たしている。コード化したタンパク質は、PPIアーゼ/ロータマーゼ活性を有していないように思われる。それは三つの単位のテトラトリコペプチド反復配列およびコンセンサスロイシンジッパー反復配列を有し、記憶機能に関連したニューロンにおいて役割を果たしている可能性がある。
CPS194はまた、約88%同一な配列を有するPPP1R12Bのイントロン配列に整列する。PPP1R12Bは、タンパク質ホスファターゼ1、調節性(抑制性)サブユニット12Bをコード化する。その遺伝子はLocusID:4660を有し、1番染色体上に局在し、細胞遺伝学的位置は1q32.1と報告されている。ミオシン軽鎖ホスファターゼ(MLCP)は、三つのサブユニットからなる:触媒サブユニット、大きいサブユニット/ミオシン結合サブユニット(MBS)および小さいサブユニット(sm−M20)PPP1R12Bは、MBSおよびsm−M20をコード化する多機能性遺伝子である。MLCPはミオシンを調節し、脱リン酸化がMBSの存在によって促進される。sm−M20サブユニットは、MBSに結合することによって、筋収縮を調節する役割を果たしていることが示唆されている。MBSはまた、他の遺伝子、ミオシン軽鎖ホスファターゼ標的サブユニット1によってコード化される。両MBSはMLCPの活性を増加させるけれども、ミオシン軽鎖ホスファターゼ標的サブユニット1−MBSは、より有効な賦活剤である。記載されているPPP1R12Bの別個にスプライスされた転写変種が少なくとも4種あり、そのうちの2種はMBSコード領域を改変し、そのうちの2種はsm−M20コード領域を改変する。
CPS195は、リボヌクレアーゼ、RNAアーゼAファミリー、2(肝臓、好酸球由来神経毒をコード化する、RNASE2に対応する。その遺伝子はLocusID:6036を有し、14番染色体上に局在し、細胞遺伝学的位置は14q24−q31と報告されている。好酸球由来神経毒は、神経毒性およびリボヌクレアーゼ活性を有する。それは、リボヌクレアーゼスーパーファミリーのメンバーである。
CPS195はまた、約92%同一な配列を有するLOC122661に整列する。LOC122661は、非分泌リボヌクレアーゼ前駆体(リボヌクレアーゼUS)(好酸球由来神経毒)(RNAアーゼUpI−2)(リボヌクレアーゼ2)(RNAアーゼ2)に類似したタンパク質をコード化する。LOC122661は、染色体14q11.1に局在している。それに加えて、CPS195は、RNASE3と約88−94%同一な配列を有する。RNASEは、リボヌクレアーゼ、RNAアーゼAファミリー、3(好酸球陽イオンタンパク質)をコード化する。RNASEはLocusID:6037を有し、染色体14q24−q31に局在している。RNASE3遺伝子産物は、神経毒性およびリボヌクレアーゼ活性を有する。それは、リボヌクレアーゼスーパーファミリーのメンバーである。
配列番号:186(X55988)のヌクレオチド639ないし735は、LOC159655のイントロン配列と95%同一な配列を有していることを示す。LOC159655は、染色体10q23.33に局在している。
CPS196は、分枝鎖アミノトランシフェラーゼ1、細胞質ゾルをコード化する、BCAT1に対応する。その遺伝子はLocusID:586を有し、12番染色体上に局在し、細胞遺伝学的位置は12qter−q12と報告されている。細胞質ゾル酵素の分枝鎖アミノ酸トランスアミナーゼ(BCT)は、細胞成長抑制を引き起こす。分枝鎖アミノ酸アミノ基転移の検出による、二つの異なる臨床的障害:高バリン血症および高ロイシン−イソロイシン血症、が存在してよい。細胞質ゾル分枝鎖アミノ酸アミノトランシフェラーゼ1は、分枝鎖a−ケト酸のL−アミノ酸への転換を触媒する。
CPS199は、分泌されたリンタンパク質1(オステオポンチン、骨シアロタンパク質I、早期T−リンパ球活性化1)をコード化する、SPP1に対応する。その遺伝子はLocusID:6696を有し、4番染色体上に局在し、細胞遺伝学的位置は4q21−q25と報告されている。オステオポンチン(骨シアロタンパク質)は、石灰化およびアテローム性動脈硬化に関わる、骨および血管細胞外マトリックスタンパク質である。
CPS201は、GRO1オンコジーン(メラノーマ成長刺激活性、α)をコード化する、GRO1に対応する。その遺伝子はLocusID:2919を有し、4番染色体上に局在し、細胞遺伝学的位置は4q21と報告されている。その遺伝子産物はメラノーマ成長刺激活性を有し、炎症過程に関わる分裂促進因子であってよい。
CPS201はまた、87−89%同一な配列を有するGRO2オンコジーンをコード化する、GRO2に整列する。GRO2はLocusID:2920を有し、染色体4q21に局在している。GRO2は、多形核白血球についての走化性因子である可能性がある。
配列番号:189(X54489)のヌクレオチド1ないし830は、GRO3オンコジーンをコード化するGRO3と約90%同一な配列を有している。GRO3はLocusID:2921を有し、染色体4q21に局在している。GRO3遺伝子産物は、分裂促進因子であって良い。配列番号:189のヌクレオチド2ないし466は、不均一な核のリボ核タンパク質A1(らせん不安定化タンパク質)(一本鎖結合タンパク質)(hnRNP核タンパク質A1)(HDP)に類似したタンパク質をコード化する、LOC201963と85%同一な配列を有する。LOC201963は、染色体4q13.3に局在している。
CPS202は、ASC−1複合体サブユニットP100をコード化する、FLJ21588(DKFZP586O0223)に対応する。その遺伝子はLocusID:84164を有し、22番染色体上に局在し、細胞遺伝学的位置は22q12.1と報告されている。
CPS205は、脂肪酸シンターゼをコード化する、FASNに対応する。その遺伝子はLocusID:2194を有し、17番染色体上に局在し、細胞遺伝学的位置は17q25と報告されている。この遺伝子によってコード化された酵素は、多機能性のタンパク質である。その機能のうちの一つは、NADPH存在下でアセチルCoAおよびマロニルCoAからのパルミチン酸の合成を触媒し、長鎖飽和脂肪酸にすることである。いくつかの癌細胞系において、このタンパク質は、FASのN末端がERαのC末端と枠内にて融合する点において、エステロゲン受容体α(ERα)と融合していることが判明した。
配列番号:192(U29344)のヌクレオチド7777ないし8199および8270ないし8457は、LOC133934と約94−96%同一な配列を有する。その遺伝子は、仮定の遺伝子であり、染色体5p15.2に局在する。配列番号:192のヌクレオチド7528ないし8223は、リンパ球抗原9をコード化するLY9のイントロン配列と84%同一な配列を示す。LY9はLocusID:4063を有し、染色体1q21.3−q22に局在している。リンパ球抗原9は、T細胞およびアクセサリー細胞の間の接着に関わっている可能性がある。それは免疫グロブリンスーパーファミリーのメンバーである。それに加えて、U29344のヌクレオチド8299ないし8377は、97%同一な配列を有するDDX27に配列する。DDX27は、DEAD/H(Asp−Glu−Ala−Asp/His)ボックスポリペプチド27をコード化し、LocusID:55661を有する。DDX27は、染色体の20q13.13に局在している。保存されたモチーフのAsp−Glu−Ala−Asp(DEAD)によって特徴づけられる、DEADボックスタンパク質は、RNAヘリカーゼと推定される。それは、翻訳開始、核およびミトコンドリアのスプライシングおよびリボソームおよびスプライソーム集合のような、RNA二次構造の変化を伴ういくつかの細胞過程に含まれる。分配パターンに基づいて、ファミリーのいくつかのメンバーは、胚発生、精子形成および細胞成長および分裂に関与していると考えられている。DDX27は、DEAD/DEAHボックスATP依存性RNAまたはDNAヘリカーゼファミリーのメンバーである、DEADボックスタンパク質をコード化する。
CPS206は、ホメオボックスA1をコード化する、HOXA1に対応する。その遺伝子はLocusID:3198を有し、7番染色体上に局在し、細胞遺伝学的位置は7p15.3と報告されている。ホメオボックスA1は、DNA結合タンパク質のホメオドメインファミリーのメンバーであり、遺伝子発現、形態形成および分化を調節する可能性がある。
CPS207は、ヘム酸化酵素(脱環化)1をコード化する、HMOX1に対応する。その遺伝子はLocusID:3162を有し、22番染色体上に局在し、細胞遺伝学的位置は22q13.1と報告されている。CPS207は、100%同一な配列を有する22番染色体のヌクレオチド15085942ないし15086457に整列する。ヘムの代謝において不可欠な酵素である、ヘム酸化酵素は、ヘムを開裂させて、その後ビリベルジン還元酵素によってビリルビンに変換されるビリベルジン、および神経伝達物質と推定される一酸化炭素を形成する。ヘム酸化酵素活性は、その基質であるヘムおよび様々なヘム以外の基質によって誘導される。ヘム酸化酵素は、2つのイソ酵素、誘導可能なヘム酸化酵素−1および構成性ヘム酸化酵素−2として生じる。HMOX1およびHMOX2は、ヘム酸化酵素ファミリーに属している。
CPS207の整列する染色体領域は、他の遺伝子の近傍にある。これらの遺伝子は、MCM5およびLOC129121を含む。MCMSは、MCM5ミニ染色体の維持欠損5、細胞分裂周期46(S.cerevisiae)をコード化する。それはLocusID:4174であり、染色体22q.13.1に局在している。MCMSによってコード化されたタンパク質は、DNA合成の開始に関わっているS.cerevisiaeのCDC46に類似している。MCMS遺伝子産物は、クロマチン結合タンパク質のMCMファミリーのメンバーである。LOC129121は、染色体22q12.3に局在している仮定の遺伝子LOC129121である。
配列番号:194(Z82244)のヌクレオチド26880ないし28079は、79%同一な配列を有するLOC168550に整列する。LOC168550は、ポルタンパク質に類似したタンパク質をコード化する。LOC168550は、染色体7q36.1に局在している。配列番号:194のヌクレオチド26774ないし28057は、76%同一な配列を有するLOC205176に整列する。LOC205176は、染色体2p12に局在している。
Affymetrixの注釈は、CPS208がBNIP3に対応していることを示唆している。Entrezヒトゲノムデーターベースに対するBlast検索は、CPS208がまた、98%以上同一な配列を有する、LOC159348に整列する。LOC159348は10番染色体上に局在し、細胞遺伝学的位置は10q26.3と報告されている。それに加えて、CPS208は、約97%同一な配列を有する14番染色体上の染色体領域に整列する。CPS208はまた、LOC146062のイントロン配列と約81%同一な配列を有する。LOC146062は、FLJ00088に類似したタンパク質をコード化し、染色体15q14に局在している。
配列番号:195(AF002697)のヌクレオチド152ないし1081は、78%同一な配列を有するLOC152687の近傍の染色体領域に整列する。LOC152687は、亜鉛フィンガータンパク質91(亜鉛フィンガータンパク質HTF10)(HPF7)に類似したタンパク質をコード化し、染色体4p16.3に局在している。
CPS209は、亜鉛フィンガータンパク質261をコード化する、ZNF261に対応する。その遺伝子はLocusID:9203を有し、X染色体上に局在し、細胞遺伝学的位置はXq13.1と報告されている。
CPS210は、ミオシン、重鎖ポリペプチド7、心筋、βをコード化する、MYH7に対応する。その遺伝子はLocusID:4625を有し、14番染色体上に局在し、細胞遺伝学的位置は14q12と報告されている。MYH7は、ミオシンの心筋β(または遅筋)アイソフォームをコード化する。MYH7遺伝子産物およびNYH6遺伝子産物(心臓のミオシン重鎖のα、または速筋アイソフォーム)の相対存在量の変化は、心筋の収縮速度と相関する。MYH7の遺伝子産物は、心筋の収縮力を与えるモータータンパク質ファミリーのメンバーである。
配列番号:197(M58018)のヌクレオチド432ないし5869は、88−98%同一な配列を有する、MYH6に配列する。特に、ヌクレオチド5741ないし5869は、96%同一な配列を有するMYH6に整列する。MYH6は、ミオシン、重鎖ポリペプチド6、心筋、α(肥大型心筋症1)をコード化する。それはLocusID:4624を有し、染色体14q12に局在している。心筋重鎖6αは、筋収縮力を与えるモータータンパク質ファミリーのメンバーである。
M58018のヌクレオチド432ないし5543中の様々な断片は、MYH1、MYH2、MYH3、MYH4およびMYH13と約77−90%同一な配列を有する。MYH1は、ミオシン、重鎖ポリペプチド1、骨格筋、成人をコード化し、LocusID:4619を有する。MYH2は、ミオシン、重鎖ポリペプチド2、骨格筋、成人をコード化し、LocusID:4620を有する。MYH3は、ミオシン、重鎖ポリペプチド3、骨格筋、胚をコード化し、LocusID:4621を有する。MYH4は、ミオシン、重鎖ポリペプチド4、骨格筋をコード化し、LocusID:4622を有する。MYH13は、ミオシン、重鎖ポリペプチド13、骨格筋をコード化し、LocusID:8735を有する。MYH1、MYH2、MYH3およびMYH4は、伝えるところによると、全て染色体17p13.1に局在する。MYH13は、細胞遺伝学的位置は17p13と報告されている。
ミオシンは、ATPの加水分解を通じて化学エネルギーを機械エネルギーに変換する、主要な収縮性タンパク質である。ミオシンは、ミオシン重鎖の組(MYH)および二組の異なる軽鎖からなる六量体タンパク質である。ミオシン重鎖は、多数の遺伝子ファミリーによってコード化される。哺乳類においては、少なくとも10の異なるミオシン重鎖(MYH)のアイソフォームが、横紋筋、平滑筋および非筋肉細胞から記述されている。これらのアイソフォームは、発育の間、空間的にそして時間的に調節される発現を示す。MYH1、MYH4およびMYH13によってコード化されたタンパク質は、ATPアーゼ頭部および棒状の尾部ドメインを含む。ミオシン重鎖1および13は、筋収縮、細胞分裂および貪食の力を与える可能性がある。骨格筋のミオシン重鎖3および4は、筋収縮力を与える可能性がある。
それに加えて、M58018のヌクレオチド1494ないし1654は、MYH7B、および約88−92%同一な配列を有するFLJ22037の近傍の染色体領域に整列する。FLJ22037は、仮定のタンパク質FLJ22037をコード化し、LocusID:84176を有する。それは7番染色体上に局在し、細胞遺伝学的位置は7q11.21と報告されている。MYH7Bは、ミオシン、重鎖ポリペプチド7B、心筋、βをコード化する。MYH7BはLocusID:57644を有し、染色体20q11.21に局在している。
CPS211は、インターロイキン1、βをコード化する、IL1Bに対応する。その遺伝子はLocusID:3553を有し、2番染色体上に局在し、細胞遺伝学的位置は2q14と報告されている。インターロイキン1βは、免疫応答および炎症反応を開始させ、増幅させる可能性がある。
CPS212は、シンタキシン1A(脳)をコード化する、STX1Aに対応する。その遺伝子はLocusID:6804を有し、7番染色体上に局在し、細胞遺伝学的位置は7q11.23と報告されている。シンタキシン1A(脳)は、細胞内輸送および神経伝達物質遊離に関与している可能性がある。
CPS213は、ATPアーゼタイプIV、リン脂質輸送(Pタイプ)(推定上)(ATPアーゼ、クラスII、タイプ9B)をコード化する、ATPASEP(ATP9B)に対応する。その遺伝子はLocusID:11071を有し、18番染色体上に局在し、細胞遺伝学的位置は18q23と報告されている。
CPS214は、クノップ血液型システムを含めて、補体成分(3b/4b)受容体1をコード化する、CR1に対応する。その遺伝子はLocusID:1378を有し、1番染色体上に局在し、細胞遺伝学的位置は1q32と報告されている。その遺伝子は、1番染色体のヌクレオチド2769865ないし2857756を含む。この遺伝子は、末梢血細胞、糸球体足細胞および濾胞性樹状細胞にみられる細胞膜糖タンパク質をコード化する。その遺伝子によってコード化されるタンパク質は、補体成分C3b
およびC4bの受容体であり、補体カスケードの活性を調節する。コード化したタンパク質における変異は、クノップ血液型システムを基礎にしている。二つの共通アレル、FおよびSは、8つのエクソンによって異なり、不均一な交叉が起こった結果と考えられている。細胞質に存在するコード化されたタンパク質の分泌された形が記述されているが、その天然の全長は決定されていない。コード化されたタンパク質は、短いコンセンサス反復配列(SCRs)を有する。
CPS214はまた、約93%同一な配列を有するCR1Lに整列する。CR1Lは、補体成分(3b/4b)受容体1様をコード化する。それはLocusID:1379を有し、染色体1q32.1に局在している。
CPS215は、DKFZP586M1523タンパク質をコード化する、DKFZP586M1523に対応する。その遺伝子はLocusID:25941を有し、18番染色体上に局在し、細胞遺伝学的位置は18q12.1と報告されている
CPS215はまた、99%以上同一な配列を有するLOC201347に配列する。LOC201347は、ブルーノ様4、RNA結合タンパク質(キイロショウジョウバエ)をコード化するBRUNOL4のイントロンに局在する。BRUNOL4はLocusID:56853を有し、18番染色体上に局在し、細胞遺伝学的位置は18q12.1と報告されている。
CPS216は、ケラチン1(表皮剥離性角質増殖症)をコード化する、KRT1に対応する。その遺伝子はLocusID:3848を有し、12番染色体上に局在し、細胞遺伝学的位置は12q12−q13と報告されている。この遺伝子によってコード化されたタンパク質は、ケラチン遺伝子ファミリーのメンバーである。タイプII細胞ケラチンは、単層および層状上皮組織の分化の間共発現した異型ケラチン鎖の組において配列された、塩基性または中性タンパク質を含む。KRT1によってコード化されたタイプII細胞ケラチンは、上皮の有棘細胞層および顆粒細胞層において、ファミリーメンバーKRT10とともに発現され得る。KRT1およびKRT10遺伝子における変異は、水疱性先天性魚鱗紅皮症と関連している可能性がある。タイプII細胞ケラチンは、染色体12q12q−13の領域においてクラスター形成される。
配列番号:203(M98776)のヌクレオチド4076ないし4275は、KRT2Aと87%同一な配列を有する。KRT2Aは、ケラチン2A(シーメンスの上皮性魚鱗癬水疱)をコード化する。その遺伝子はLocusID:3849を有し、12番染色体上に局在し、細胞遺伝学的位置は12q11−q13と報告されている。KRT2A遺伝子は、ケラチン遺伝子ファミリーのメンバーである。KRT2A遺伝子によってコード化されたタンパク質は、細胞ケラチンの上部の有棘細胞層において発現している。この遺伝子の変異は、水疱性先天性魚鱗紅皮症と関連している可能性がある。ケラチン2Aは、上皮ケラチン細胞の末端の角化に役割を果たす可能性のある中間フィラメント成分である。配列番号:203のヌクレオチド3203ないし3246は、染色体6p21.3に局在しているLOC221618のイントロン配列と93%同一な配列を有する。
CPS217は、UNK_AF070571(EXT1)に対応する。CPS217は、EXT1の3'非翻訳領域に整列する。EXT1は外骨腫(複数)1をコード化し、LocusID:2131を有し、細胞遺伝学的位置は8q24.11−q24.13と報告されている。外骨腫(複数)1(EXT1)は、ヘパラン硫酸生合成の鎖伸長工程二関与する、ER内在型II膜貫通グリコシルトランスフェラーゼである。それは、四肢の骨の骨幹の末端付近の軟骨突出物によって特徴づけられる疾患である、遺伝性多発外骨腫に関わっている。
CPS218は、タンパク質ホスファターゼ3(以前は2B)、触媒サブユニット、βアイソフォーム(カルシニューリンAβ)をコード化する、PPP3CBに対応する。その遺伝子はLocusID:5532を有し、10番染色体上に局在し、細胞遺伝学的位置は10q21−q22と報告されている。その遺伝子によってコード化された生成物は、カルモデュリン調節タンパク質ホスファターゼ3の触媒サブユニットとしても知られており、シグナル伝達および成長の制御に関わった転写因子の活性を調節する可能性がある。
CPS219は、クイエシンQ6をコード化する、QSCN6に対応する。その遺伝子はLocusID:5768を有し、1番染色体上に局在し、細胞遺伝学的位置は1q24と報告されている。その遺伝子によってコード化された生成物は、二つの長期持続遺伝子ファミリーのメンバーである、チオレドキシンおよびERV1のドメインを含む。QSCN6遺伝子は、繊維芽細胞が増殖周期を出て、休止期に入り始める時に誘導され、QSCN6が成長調節に役割を果たしている可能性があることを示唆している。クイエシンQ6は、チオレドキシンおよびS.cerevisiaeErv1pに類似性を有する。
CPS220は、パーフォリン(孔形成タンパク質)をコード化する、PRF1に対応する。その遺伝子はLocusID:5551を有し、10番染色体上に局在し、細胞遺伝学的位置は10q22と報告されている。パーフォリン1は、細胞溶解性、チャネル形成タンパク質であり、ウィルス感染した宿主細胞および腫瘍細胞において役割を果たす可能性がある。CPS220は、遺伝子の3'非翻訳領域に局在している。
Affymetrixの注釈は、CPS221がFCGR3Bに対応することを示唆している。FCGR3Bは、IgGのFc断片、低親和性IIIb、(CD16)に対する受容体をコード化する。その遺伝子はLocusID:2215を有し、染色体1q23に局在している。
Entrezヒトゲノムデーターベースに対するBlast検索は、CPS221がまた、97%以上同一な配列を有するFCGR3Aに整列する。FCGR3Aは、IgGのFc断片、低親和性IIIa、(CD16)に対する受容体をコード化する。FCGR3AはLocusID:2214を有し、1番染色体上に局在し、細胞遺伝学的位置は6p221q23と報告されている。FCGR3A遺伝子産物は、タイプIIIFcγ受容体である。それは、T細胞受容体複合体(CD3Z)のζ鎖と関連し、免疫グロブリンスーパーファミリーのメンバーである。FCGR3B遺伝子は、1番染色体上のFCGR3Aに3'局在している。
CPS222は、プロスタグランジン−エンドペルオキシドシンターゼ2(プロスタグランジンG/Hシンターゼおよびシクロオキシゲナーゼ)をコード化する、PTGS2に対応する。その遺伝子はLocusID:5743を有し、1番染色体上に局在し、細胞遺伝学的位置は1q25.2−q25.3と報告されている。プロスタグランジン−エンドペルオキシドシンターゼ(PTGS)はまた、シクロオキシゲナーゼとして知られており、プロスタグランジン生合成における重要な酵素であり、ジオキシゲナーゼとしておよびペルオキシダーゼとして作用する。PTGSの二つのイソ酵素が存在する:構成性PTGS1および誘導性PTGS2。二つのアイソフォームは、発現および組織分布の調節において異なる。PTGS遺伝子は、マウス、ラット、羊、牛、馬およびウサギのPTGS2タンパク質と86−89%同一なアミノ酸配列を示す、PTGS2タンパク質をコード化している。ヒトPTGS2遺伝子は、限られた数の細胞型において発現され特定の刺激事象によって調節されると思われ、炎症および有糸分裂に関与するプロスタノイドの生合成をする働きを持つことを示唆している。PTGS2遺伝子の発現は、上皮性の腫瘍においては統制が解除されている可能性がある。PTGS2タンパク質は、血管新生および細胞分裂を調節し、炎症性プロスタグランジンの形成における速度制限工程を触媒する可能性がある。
CPS223は、オリゴフレニン1をコード化する、OPHN1に対応する。その遺伝子はLocusID:4983を有し、X染色体上に局在し、細胞遺伝学的位置はXq12と報告されている。オリゴフレニン1は、少なくとも25のエクソンを有し、Rho−GTPアーゼ活性化タンパク質をコード化している可能性がある。Rhoタンパク質は、細胞分裂および細胞形態形成に影響を与える、細胞内シグナル伝達において重要な媒介物質である。OPHN1における変異は、非特異的X連鎖精神遅延の原因である可能性がある。配列番号:210(AJ001189)のヌクレオチド2971ないし3363は、染色体3p24.1に局在している推定上の遺伝子LOC200861のイントロン配列と84%同一な配列を有する。
CPS224は、ビジニン様1をコード化する、VSNL1に対応する。その遺伝子はLocusID:7447を有し、2番染色体上に局在し、細胞遺伝学的位置は2p24.3と報告されている。ビジニン様タンパク質1は、カルシウムと結合する可能性がある。そのタンパク質はラットのVsnl1に類似している。
CPS225は、鉄(II)キレーターゼ(プロトポルフィリン症)をコード化する、FECHに対応する。その遺伝子はLocusID:2235を有し、18番染色体上に局在し、細胞遺伝学的位置は18q21.3と報告されている。鉄キレーターゼは、ミトコンドリアに局在し、ヘム合成経路において、鉄(II)の形の鉄をプロトポルフィリンIXに挿入することを触媒する。鉄(II)キレーターゼの欠損は、プロトポルフィリン症と関連している。CPS225は、遺伝子の3'非翻訳領域に局在している。
配列番号:282(D00726)97%以上同一な配列を有するFECHに整列し、FECHの発現レベルを検出するためのプローブの構築に用いられ得る。配列番号:282のヌクレオチド167ないし9172は、LOC205467と82−84%同一な配列を有する。LOC205467は、推定上の遺伝子であり、3番染色体上に局在し、細胞遺伝学的位置は3p22.1と報告されている。
CPS226は、KIAA0483タンパク質をコード化する、KIAA0483に対応する。その遺伝子はLocusID:23219を有し、1番染色体上に局在し、細胞遺伝学的位置は1q41と報告されている。CPS227は、ヘキソキナーゼ3(白血球)をコード化する、HK3に対応する。その遺伝子はLocusID:3101を有し、5番染色体上に局在し、細胞遺伝学的位置は5q35.2と報告されている。ヘキソキナーゼは、グルコースをリン酸化してグルコース−6−リン酸を生成し、それによってグルコースは解糖系に送られる。HK3遺伝子は、ヘキソキナーゼ1および2に類似した、ヘキソキナーゼ3をコード化する。ヘキソキナーゼ3は、アロステリック酵素であり、その生成物のグルコース−6−リン酸によって抑制され得る。
CPS228は、膜貫通4ドメイン、サブファミリーA、メンバー3(造血細胞特異的)をコード化する、MS4A3に対応する。その遺伝子はLocusID:932を有し、11番染色体上に局在し、細胞遺伝学的位置は11q12−q13.1と報告されている。その遺伝子産物は、CD20およびFCER1Bのβサブユニットと類似性が低い。それは、四つの予測される膜貫通ドメインを含み、シグナル伝達において役割を果たしている可能性がある。
CPS229は、小さい誘導性サイトカインサブファミリーA(Cys−Cys)、メンバー20をコード化する、SCYA20に対応する。その遺伝子はLocusID:6364を有し、2染色体上に局在し、細胞遺伝学的位置は2q33−q37と報告されている。その遺伝子産物サイトカインA20(エクソダス)は、リンパ球の走化性因子であるが、単球の走化性因子ではない。
CPS230は、補体成分1、q副補体成分、受容体1をコード化する、C1QR1に対応する。その遺伝子はLocusID:22918を有し、20番染色体上に局在し、細胞遺伝学的位置は20p11.21と報告されている。その遺伝子は、タイプ1膜タンパク質をコード化する。コード化したタンパク質は、補体成分C1q、マンノース結合レクチンおよび肺表面活性タンパク質Aに対する受容体として作用する。そのタンパク質は、貪食のリガンド媒介活性化に関与する機能性受容体である。それは、病原体および免疫複合体の貪食による破壊において役割を果たしている可能性がある。
CPS230は、99%同一な配列を有する推定上の遺伝子LOC200421の近傍の染色体領域に整列する。LOC200421は、細胞遺伝学的位置は2p12と報告されている。
CPS231は、POUドメイン、クラス1、転写因子1(Pit1、成長ホルモン因子1)をコード化する、POU1F1に対応する。その遺伝子はLocusID:5449を有し、3番染色体上に局在し、細胞遺伝学的位置は3p11と報告されている。その遺伝子産物はまた、POUホメオドメイン転写因子1としても知られ、PRL、GHおよびTSH遺伝子を調節する可能性がある。
CPS232は、トランスケトラーゼ様1をコード化する、TKTL1に対応する。その遺伝子はLocusID:8277を有し、X染色体上に局在し、細胞遺伝学的位置はXq28と報告されている。トランスケトラーゼ1は、ペントースリン酸経路におけるチアミンピロリン酸依存性酵素である。
CPS234は、サイクリンT2をコード化する、CCNT2に対応する。その遺伝子はLocusID:905を有し、2番染色体上に局在し、細胞遺伝学的位置は2q14.3と報告されている。この遺伝子によってコード化されるタンパク質は、高度に保存されたサイクリンファミリーに属し、そのメンバーは、細胞周期を通したタンパク質の存在量の動的な周期性によって特徴づけられる。サイクリンは、CDKキナーゼの調節因子として機能する。異なるサイクリンは、各々の細胞分裂事象の時間的協調に寄与する異なる発現および分解パターンを阻害する。サイクリンT2およびそのキナーゼパートナーCDK9は、転写延長因子p−TEFbのサブユニットにみられている。サイクリンT2を含むp−TEFb複合体は、ヒト免疫不全ウィルスタイプ1(HIV−1)のTatタンパク質と相互作用し、その負の調節因子として作用すると報告されている。異なるアイソフォームをコード化する、少なくとも二つの異なるスプライシングを受けた転写産物変異体が、記述されてきた。
配列番号:220(AF048732)のヌクレオチド261ないし723は、1番染色体上の染色体領域と約88%同一な配列を有する
CPS235は、ATPアーゼ、プロトン輸送、リソソーム50/57kDV1サブユニットHをコード化する、ATP6V1Hに対応する。その遺伝子はLocusID:51606を有し、8番染色体上に局在し、細胞遺伝学的位置は8p22−q22.3と報告されている。その遺伝子によってコード化されたポリペプチドはまた、CG1−11タンパク質[ホモサピエンス]として知られている。ATP6V1H遺伝子のイントロンは、RGS20遺伝子を含む。RGS20は、Gタンパク質シグナル20の調節因子をコード化し、LocusID:8601を有する。
CPS236は、フィブロネクチン1をコード化する、FN1に対応する。その遺伝子はLocusID:2335を有し、2番染色体上に局在し、細胞遺伝学的位置は2q34と報告されている。フィブロネクチンは、細胞質中で可溶性二量体で、細胞表面および細胞外マトリックスで二量体または多量体で存在する糖タンパク質である。フィブロネクチンは、胚形成、傷の治癒、血液凝固、宿主防御および転移を含めた、細胞接着および分裂過程に関与している。FN1遺伝子は、異なるスプライシングを受ける三つの領域を有し、20の異なる転写産物変異体を生成する可能性がある。
CPS237は、HEXAのイントロンに局在するUNK_J04178に対応する。HEXAは、ヘキソサミニダーゼA(αポリペプチド)をコード化する。HEXAはLocusID:3073を有し、15番染色体上に局在し、細胞遺伝学的位置は12q23−q24と報告されている。ヘキソサミニダーゼAは、リソソーム酵素βヘキソサミニダーゼのαサブユニットであり、補因子GM2活性化タンパク質と共に、ガングリオシドGM2、およびN−アセチルヘキソサミン末端を含む他の分子の分解を触媒する。βヘキソサミニダーゼは、二つのサブユニット、αおよびβからなり、別の遺伝子によってコード化される。βヘキソサミニダーゼαおよびβサブユニット遺伝子は、共にグリコシル加水分解酵素のファミリー20のメンバーである。αまたはβサブユニット遺伝子における変異は、ニューロン中のGM2ガングリオシドの蓄積、およびGM2ガングリオシドーシスと呼ばれる神経変性疾患につながる可能性がある。αサブユニット遺伝子変異は、テイ−サックス病(GM2ガングリオシドーシスタイプ1)につながる可能性がある。CPS237に整列する染色体領域は、HEXAのイントロンに局在している。
CPS237はまた、J04178によって支持される仮定の遺伝子であるLOC145709に整列する。LOC145709は、細胞遺伝学的位置は15q22.32と報告されている。
CPS239は、核受容体サブファミリー2、グループC、メンバー1をコード化する、NR2C1に対応する。その遺伝子はLocusID:7181を有し、12番染色体上に局在し、細胞遺伝学的位置は12q21.32−q21.33と報告されている。その遺伝子産物は、異なるリガンド結合ドメインを有する多数のアイソフォーム中に存在し得る。
CPS240は、RAS関連(RalGDS/AF−6)ドメインファミリー2をコード化する、RASSF2(KIAA0168)に対応する。その遺伝子はLocusID:9770を有し、20番染色体上に局在し、細胞遺伝学的位置は20pter−p12.1と報告されている。この遺伝子産物の代わりの名前は、KIAA0168タンパク質である。
CPS241は、インターロイキン6(インターフェロン、β2)をコード化する、IL6に対応する。その遺伝子はLocusID:3569を有し、7番染色体上に局在し、細胞遺伝学的位置は7p21と報告されている。インターロイキン6(インターフェロン、β2)は、B細胞の成熟を誘導して、免疫グロブリン分泌細胞にする可能性がある。
CPS242は、KIAA0372遺伝子産物をコード化する、KIAA0732に対応する。その遺伝子はLocusID:9652を有し、5番染色体上に局在し、細胞遺伝学的位置は5q21.1−q21.2と報告されている。
CPS243は、チトクロムP450、サブファミリーIVF、ポリペプチド2をコード化する、CYP4F2に対応する。その遺伝子はLocusID:8529を有し、19番染色体上に局在し、細胞遺伝学的位置は19pter−p13.11と報告されている。この遺伝子は、酵素のチトクロムP450スーパーファミリーのメンバーをコード化する。チトクロムP450タンパク質は、薬剤代謝およびコレステロール、ステロイドおよび他の脂質の合成に関与する多くの反応を触媒するモノオキシゲナーゼである。チトクロムP450タンパク質は、小胞体に局在している。それらは、炎症の強力な媒介物質であるロイコトリエンB4の不活化および分解の過程を開始させる可能性がある。CYP4F2遺伝子は、19番染色体上のチトクロムP450遺伝子クラスターの一部である。このファミリーの他のメンバー、CYP4F11は、およそ16kb離れている。
CPS243はまた、約97%同一な配列を有するCYP4F3に整列する。CYP4F3は、チトクロムP450、サブファミリーIVF、ポリペプチド3(ロイコトリエンB4ωヒドロキシラーゼ)をコード化する、CYP4F3に対応する。それはLocusID:4051を有し、19番染色体上に局在し、細胞遺伝学的位置は19p13.2と報告されている。CYP4F3は、酵素のチトクロムP450スーパーファミリーのメンバーをコード化する。この遺伝子はまた、19番染色体上のチトクロムP450遺伝子クラスターの一部である。このファミリーの他のメンバー、CYP4F8は、およそ18kb離れている。CYP4F3遺伝子産物は、ロイコトリエンB4を、より活性の低い20−ヒドロキシロイコトリエンB4に変換する可能性がある。
U02388(配列番号:228)のヌクレオチド253ないし1639中の様々な断片は、約83−93%同一な配列を有する様々な遺伝子に整列する。これらの遺伝子は、LOC126538、LOC126537、LOC126407、CYP4F12およびCYP4F8を含む。LOC126538およびLOC126537は、チトクロムP450、サブファミリーIVF、ポリペプチド2(ロイコトリエンB4ωヒドロキシラーゼ)(ロイコトリエンB4ω20−モノオキシゲナーゼ)に類似したタンパク質をコード化する。両遺伝子は、染色体19p13.12に局在している。LOC126407は、チトクロムP450に類似したタンパク質をコード化し、19番染色体上に局在している。CYP4F12は、チトクロムP450、サブファミリーIVF、ポリペプチド12をコード化する。CYP4F12は、LocusID:66002を有する。CYP4F8は、チトクロムP450、サブファミリーIVF、ポリペプチド8をコード化し、LocusID:11283を有する。
配列番号:228(U02388)のヌクレオチド446ないし1457はまた、LOC222275およびCYP4F11のコード配列の間の染色体領域に整列する。LOC222275は、ミトコンドリアRNAポリメラーゼに類似したタンパク質をコード化し、細胞遺伝学的位置は19q13.12と報告されている。CYP4F11は、チトクロムP450、サブファミリーIVF、ポリペプチド11をコード化し、LocusID:57834を有する。CYP4F11は、細胞遺伝学的位置が19q13.1と報告されている。
CPS244は、ストレス誘導リンタンパク質1(Hsp70/Hsp90−構成タンパク質)をコード化する、STIP1に対応する。その遺伝子はLocusID:10963を有し、11番染色体上に局在し、細胞遺伝学的位置は11q13と報告されている。
配列番号:229(M86752)のヌクレオチド1ないし1086は、STIP1と100%同一な配列を有する。STIP1は、ストレス誘導リンタンパク質1(Hsp70/Hsp90−構成タンパク質)をコード化する。その遺伝子はLocusID:10963を有し、11番染色体上に局在し、細胞遺伝学的位置は11q13と報告されている。その遺伝子産物は、S.cerevisiae Sti1pに類似しており、TPR反復配列を有する。M86752のヌクレオチド1ないし1086およびSTIP1の間の配列は、推定上の遺伝子LRP16のイントロンに局在している。LRP16は、LRPタンパク質をコード化し、LocusID:28992を有する。LRP16は、細胞遺伝学的位置が11q11と報告されている。LRP16遺伝子産物は、H2Aヒストンファミリーにあまり類似していない領域を含んでいる。
配列番号:229のヌクレオチド69ないし1086は、NAALADASELおよびLOC220489のコード配列の間の染色体領域と99%以上同一な配列を有する。NAALADASELは、N−アセチル化α結合酸性ジペプチダーゼ様(ILEAL DIPEPTIDYLEPTIDASE)をコード化し、LocusID:10004を有する。LOC220489は、ストレス誘導リンタンパク質1に類似したタンパク質をコード化する。1
その上、CPS244は、LOC170030および85−93%同一な配列を有するLOC121392の近傍の領域に配列する。LOC170030は、形質転換感受性タンパク質IEFSSP3521(ヒト)に類似したタンパク質をコード化する。それは、染色体Xq21.1に局在している。LOC121392は、ケラチン複合体2、遺伝子6gに類似したタンパク質をコード化する。それは、染色体12q12に局在している。
CPS245は、セリン(またはシステイン)プロテイナーゼ阻害剤、クレードH(ヒートショックタンパク質47)、メンバー2をコード化する、SERPINH2(CBP2)に対応する。その遺伝子はLocusID:872を有し、11番染色体上に局在し、細胞遺伝学的位置は11q13.5と報告されている。その遺伝子産物はまた、コラーゲン結合タンパク質2またはコリゲン2として知られている。コラーゲン結合タンパク質は、ヒートショックタンパク質として作用する。
CPS245はまた、約91%同一な配列を有するLOC158172に整列する。LOC158172は、コラーゲン結合タンパク質2前駆体(コリジン2)(関節リウマチ関連抗原RA−A47)に類似したタンパク質好中球細胞質ゾル因子1(47kD、慢性肉芽腫症をコード化する。LOC158172は、染色体9q11.2に局在している。
CPS247は、好中球細胞質ゾル因子1(47kD、慢性肉芽腫症、1番常染色体)をコード化する、NCF1に対応する。その遺伝子はLocusID:4687を有し、7番染色体上に局在し、細胞遺伝学的位置は7q11.23と報告されている。NCF1は、好中球細胞質ゾル因子1、好中球中にみられるNADPHオキシダーゼとして知られる多数のタンパク質複合体の47キロダルトン細胞質ゾルサブユニットをコード化する。このオキシダーゼは、好中球食細胞の内腔に輸送される多量のスーパーオキシドを生成する。NCF1における変異は、他のNADPHオキシダーゼサブユニットと同様に、慢性肉芽腫症につながる可能性がある。
CPS247はまた、95%以上同一な配列を有するLOC220830に整列する。LOC220830は、好中球細胞質ゾル因子1(47kD、慢性肉芽腫症、1番常染色体)に類似したタンパク質をコード化する。LOC220830は、7番染色体上に局在し、細胞遺伝学的位置は7p13と報告されている。
Affymetrixの注釈は、CPS248がCHN2に対応することを示唆している。Entrezヒトゲノムデーターベースに対するBlast検索は、CPS248がまた99%同一な配列を有するLOC222172の3'非翻訳領域に整列することを示している。LOC222172は、βキマエリン(βキメリン)をコード化する。その遺伝子は7番染色体上に局在し、細胞遺伝学的位置は7p21.1−p15.3と報告されている。
配列番号:284(U07223)のヌクレオチド456ないし2446は、97%以上同一の配列を有するLOC222172に整列する。配列番号:284(U07223)のヌクレオチド4ないし473は、GFAPと97%同一の配列を有する。GFAPは、グリア線維酸性タンパク質をコード化する。それはLocusID:2670を有し、17番染色体上に局在し、細胞遺伝学的位置は17q21と報告されている。グリア線維酸性タンパク質は、中間フィラメントタンパク質である。
CPS249は、v−ablエイベルソンネズミ白血病ウィルスオンコジーン類似物をコード化する、ABL1に対応する。その遺伝子はLocusID:25を有し、9番染色体上に局在し、細胞遺伝学的位置は9q34.1と報告されている。ABL1プロトオンコジーンは、細胞分化、細胞分裂、細胞接着およびストレス反応の過程に含まれる、細胞質および核タンパク質チロシンキナーゼをコード化する。ABL1タンパク質の活性化は、SH3ドメインによって負の調節を受け、SH3ドメインの検出は、ABL1をオンコジーンに変える。t(9:22)転座は、BCR(MIM:151410)、慢性骨髄性白血病の多くの症例において存在するABL1遺伝子の頭−尾融合を生じる。至る所に発現しているABL1チロシンキナーゼのDNA結合活性は、CDC2媒介リン酸化によって調節され、ABL1に対する細胞周期機能を示唆している。ABL1遺伝子は、共通エキソン2−11にスプライスされる別途にスプライスされた第1エキソンを有する、6kbまたは7kbのmRNA転写産物として発現する。
CPS250は、フロチリン1をコード化する、FLOT1に対応する。その遺伝子はLocusID:10211を有し、6番染色体上に局在し、細胞遺伝学的位置は6p21.3と報告されている。カベオラは、小胞のトラフィッキングおよびシグナル伝達に関与する細胞内膜上の小さなドメインである。FLOT1は、カベオラ関連、膜貫通タンパク質をコード化する。フロチリン1の機能は、決定されていない。フロチリン1は、ネズミのフロチリン(Mn.2931)に類似している。
CPS250はまた、約91%同一な配列を有するLOC203011のイントロン配列に整列する。LOC203011は、染色体8q23.3に局在している。
CPS251は、REV−3様、DNAポリメラーゼζ(酵母菌)の触媒活性サブユニットをコード化する、REV3Lに対応する。その遺伝子はLocusID:5980を有し、6番染色体上に局在し、細胞遺伝学的位置は6p21と報告されている。DNAポリメラーゼζの触媒活性サブユニットは、翻訳複製において作用し、突然変異の誘発に関与している可能性がある。
Affymetrixの注釈では、CPS252が、ムチン3、腸管をコード化する、MUC3に対応することを示唆している。その遺伝子はLocusID:4584を有し、7番染色体上に局在し、細胞遺伝学的位置は7q22と報告されている。
CPS253は、SWI/SNF関連、マトリックス関連、クロマチンのアクチン依存性調節因子、サブファミリーa、メンバー4をコード化する、SMARCA4に対応する。その遺伝子はLocusID:6597を有し、19番染色体上に局在し、細胞遺伝学的位置は19p13.2と報告されている。この遺伝子によってコード化されるタンパク質は、タンパク質のSWI/SNFファミリーのメンバーであり、キイロショウジョウバエのブラーマタンパク質に類似している。このファミリーのメンバーは、ヘリカーゼ活性およびATPアーゼ活性を有し、それらの遺伝子の周囲のクロマチン構造を変化させることによって、ある種の遺伝子の転写を調節すると考えられている。コード化したタンパク質は、遺伝子の転写活性化がクロマチンによって通常は抑制されていることを必要とする、大きいATP依存性クロマチンリモデリング複合体SNF/SWIの一部である。それに加えて、コード化したタンパク質は、発癌性タンパク質CD44の発現を抑制すると共に、BRCA1に結合し得る。異なるスプライシングを受けた転写産物は、この遺伝子についてみられる。
配列番号:238(U29175)のヌクレオチド2063ないし2094は、ヒトゲノム中の様々な領域と100%同一な配列を有する。これらの領域には、染色体のXp22.31に局在するLOC203511、および1番染色体上のLOC200164近傍の染色体領域を含む。
CPS254は、AF035314によって支持される仮定の遺伝子をコード化する、LOC92684に対応する。その遺伝子は20番染色体上に局在し、細胞遺伝学的位置は20p11.21と報告されている。CPS254およびLOC92684の間の配列は、C20orf19のイントロンに局在する。C20orf19は、12番染色体の読み取り枠19を指す。それはLocusID:55857を有し、細胞遺伝学的位置は20pter−q11.23と報告されている。
CPS255は、真核細胞の翻訳伸長因子1α2をコード化する、EEF1A2に対応する。その遺伝子はLocusID:1917を有し、20番染色体上に局在し、細胞遺伝学的位置は20q13.3と報告されている。その遺伝子産物は、グアニンヌクレオチド結合部位を有し、ペプチド合成の間に、アミノアシル−tRNAをリボソームに結合することに含まれ得る。
CPS256は、亜鉛フィンガータンパク質36、C3Hタイプ様2をコード化する、BRF2(ZFP36L2)に対応する。その遺伝子はLocusID:678を有し、2番染色体上に局在し、細胞遺伝学的位置は2p22.3−p21と報告されている。この遺伝子は、早期反応遺伝子のTIS11ファミリーのメンバーである。ファミリーのメンバーは、ホルボールエステルTPAおよびポリペプチド分裂促進物質EGFのような様々なアゴニストによって誘導される。この遺伝子によってコード化されるタンパク質は、シスヒスモチーフの反復を有する顕著な推定上の亜鉛フィンガードメインを含む。コード化したタンパク質は、推定上の核転写因子であり、成長因子に対する反応を調節する上で機能する可能性がある。CPS256およびBRF2の間の配列は、LOC151103およびLOC165204と一部重複する。
配列番号:286のヌクレオチド3862ないし4187および4238ないし4907は、LOC143974の近傍の染色体領域に84−86%同一な配列を有する。LOC143974は、染色体11p14.1に局在している。配列番号:286のヌクレオチド5004ないし5497は、82%同一な配列を有するKIAA1301のイントロン配列に整列する。KIAA1301は、KIAA1301タンパク質をコード化し、染色体2q33.1に局在している。
CPS257は、小さい核のリボ核タンパク質ポリペプチドGをコード化する、SNRPGに対応する。その遺伝子はLocusID:6637を有し、2番染色体上に局在し、細胞遺伝学的位置は2p12と報告されている。その遺伝子産物はまた、スプライソソームsnRNA関連Sm核タンパク質Gとしても知られ、snRNPの生合成に関与している可能性がある。
CPS257、またはその断片は、約95−96%同一な配列を有する様々な領域または遺伝子に整列する。これらの領域または遺伝子には、LOC162681およびLOC125307の間の染色体領域、RGS19IP1のイントロン配列、FLJ10748のイントロン配列、SKD3の近傍の染色体領域、POLE2およびOPTNのイントロン配列を含む。LOC162681およびLOC125307は共に、細胞遺伝学的位置は18q21.2と報告されている。RGS19IP1は、Gタンパク質シグナル相互作用タンパク質1の調節因子をコード化し、LocusID:10755を有する。RGS19IP1は、19番染色体上に局在し、細胞遺伝学的位置は19p13.1と報告されている。FLJ10748は、仮定のタンパク質FLJ10748をコード化し、染色体1q31.2に局在していると報告されている。SKD3は、カリウム輸送体欠損3の抑制物質をコード化する。それはLocusID:81570を有し、細胞遺伝学的位置は11q13.3と報告されている。POLE2は、ポリメラーゼ(DNA依存性)、ε2(p59サブユニット)をコード化し、LocusID:5427を有する。それは、染色体の14q21−q22に局在している。OPTNは、オプティノーリンをコード化し、LocusID:10133を有する。OPTNは、染色体の10p12.33に局在している。
それに加えて、CPS257の断片は、約85−92%同一な配列を有する様々な領域または遺伝子に整列する。これらの領域または遺伝子には、LOC164917の近傍の染色体領域、ABCA5に5'局在した領域、KIAA1170のイントロン配列およびそれぞれSPG3A、LOC201203、LOC205322、LOC203775およびERGの近傍の染色体領域を含む。LOC164917は、染色体の2q12.2に局在している。ABCA5は、ATP結合カセット、サブファミリーA(ABC1)、メンバー5をコード化する。ABCA5はLocusID:23461を有し、染色体17q24.3に局在している。KIAA1170はKIAA1170タンパク質をコード化し、染色体7q31.1に局在している。SPG3Aは、強直性対麻痺3A(常染色体優性)をコード化する。SPG3AはLocusID:51062を有し、染色体14q21.3に局在している。LOC201203、LOC205322、LOC203775およびERGは、それぞれ染色体の17q22、2p23.3、10q26.2および21q22.3に局在している。LOC203775は、高運動性グループタンパク質4(HMG−4)(高運動性グループタンパク質2a)(HMG−2a)に類似したタンパク質をコード化する。ERGは、v−ets赤芽球ウィルスE26オンコジーン様(鳥類)をコード化し、LocusID:2078を有する。
CPS258は、核分裂機構タンパク質をコード化する、NUMA1に対応する。その遺伝子はLocusID:4296を有し、11番染色体上に局在し、細胞遺伝学的位置は11q13と報告されている。その遺伝子産物は、核の構造成分である。それは、予測された超螺旋ドメインを含み、分裂後期における核の再構成に役割を果たすと予測される。
CPS259は、アルド−ケト還元酵素ファミリー1、メンバーB1(アルドース還元酵素)をコード化する、AKR1B1に対応する。その遺伝子はLocusID:231を有し、7番染色体上に局在し、細胞遺伝学的位置は7p35と報告されている。その遺伝子産物はまた、アルド−ケト還元酵素1B1(アルドース還元酵素、アルデヒド脱水素酵素)としても知られている。それはグルコースおよび他のカルボニル基を含む基質を還元し得る。その遺伝子産物は、NADPH依存性アルド−ケト還元酵素スーパーファミリーのメンバーである。
配列番号:289は、約83−92%同一な配列を有する他の遺伝子または領域に整列する。これらの遺伝子または領域には、LOC126242、LOC163862、LOC131710、LOC145401、LOC170139、LOC125836およびLOC220082の近傍の領域を含む。LOC126242は、アルドース還元酵素(AR)(アルデヒド還元酵素)に類似したタンパク質をコード化し、染色体19q13.12に局在している。LOC163862はまた、アルドース還元酵素に類似したタンパク質をコード化している。それは染色体1q41に局在している。LOC131710およびLOC125836は、アルドース還元酵素(E.C.1.1.1.21)(NADP+およびクエン酸と複合体を形成した、ヒスチジンによって置き換えられたチロシンを有する変異)に類似したタンパク質をコード化し、それぞれ染色体3q13および18p11.21に局在している。LOC145401は、アルド−ケト還元酵素ファミリー1、メンバーB1(アルドース還元酵素)に類似したタンパク質をコード化する。LOC145401は、染色体の14q22.3に局在している。LOC170139は染色体のXq23に局在しており、アルドース還元酵素(AR)(アルデヒド還元酵素)に類似したタンパク質をコード化している。LOC220082は、染色体の13q14.11に局在している。
CPS260は、SWI/SNF関連、マトリックス関連、クロマチンのアクチン依存性調節因子、スーパーファミリーe、メンバー1をコード化する、SMARCE1に対応する。その遺伝子はLocusID:6605を有し、17番染色体上に局在し、細胞遺伝学的位置は17q21.1と報告されている。この遺伝子によってコード化されたタンパク質は、遺伝子の転写活性化がクロマチンによって通常は抑制されていることを必要とする、大きいATP依存性クロマチンリモデリング複合体SNF/SWIの一部である。コード化したタンパク質は、単独でまたはSWI/SNF複合体中において、4方向結合DNAに結合することができ、ヌクレオソームに入ったり、出たりするように、DNAの位相を模倣すると考えられている。コード化したタンパク質は、DNA結合HMGドメインを含むが、このドメインの破壊は、SWI/SNF複合体のDNA結合またはヌクレオソーム置換活性を失わせない。SNF/SWI複合体は、核マトリックスと結合し、クロマチン構造に作用することによる転写の調節に含まれる。
配列番号:290は、98%以上同一な配列を有するSMARCE1に整列し、それゆえにSMARCE1に対するプローブを調製するために用いられ得る。配列番号:290(AF035262)のヌクレオチド10ないし1377はまた、LOC160863、LOC145357およびLOC134699と、約90−94%同一な配列を示す。これら三つ全ての推定上の遺伝子は、SWI/SNF関連、マトリックス関連、クロマチンのアクチン依存性調節因子、サブファミリーe、メンバー1に類似したタンパク質をコード化する。LOC160863、LOC145357およびLOC134699は、それぞれ、染色体の13q14.11、14q11.1および6q16.1に局在している。
CPS261は、KIAA0669遺伝子産物をコード化する、KIAA0669に対応する。その遺伝子はLocusID:9819を有し、3番染色体上に局在し、細胞遺伝学的位置は3q25.1と報告されている。Affymetrixの注釈は、CPS262はMLLセプチン様融合をコード化する、MSFに対応することを示している。その遺伝子はLocusID:10801を有し、17番染色体上に局在し、細胞遺伝学的位置は17q25と報告されている。
配列番号:292は、99%以上同一な配列を有する17番染色体上の染色体領域に整列する。その領域は、LOC204508、FLJ12190、LOC204512およびLOC197453を含む。これら全ての遺伝子は、細胞遺伝学的位置は17q25.3と報告されている。FLJ12190は、LocusID:80141を有する。LOC197453は、仮定の遺伝子SBB123に類似したタンパク質をコード化する。
CPS263は、プロサイモシン、α(遺伝子配列28)をコード化する、PTMAに対応する。その遺伝子はLocusID:5757を有し、2番染色体上に局在し、細胞遺伝学的位置は2q35−q36と報告されている。プロサイモシンαは、細胞増殖と関連している。
配列番号293のヌクレオチド43ないし1200はまた、98%同一な配列を有するLOC220771に整列する。LOC220771は、プロサイモシンαをコード化し、染色体の5q23.2に局在していると報告されている。それに加えて、CPS263またはその断片は、LOC145123、LOC220508、PZPおよびDDX12の間の染色体領域、および94−95%同一な配列を有するTRIP11のイントロン配列に整列する。LOC145123は、染色体の13q22.3に局在している。LOC220508は、プロサイモシンαをコード化し、染色体の12q12.3に局在している。PZPは、妊娠領域タンパク質をコード化し、LocusID:5858を有する。それは、染色体の12p13−p12.2に局在している。DDX12は、DEAD/H(Asp−Glu−Ala−Asp/His)ボックスポリペプチド12(CHL1様ヘリカーゼ類似物、S.cerevisiae)をコード化し、LocusID:1664を有する。DDX12は、染色体の12p13に局在している。TRIP11は、甲状腺ホルモン受容体相互作用物質11をコード化し、LocusID:9321を有する。TRIP11は、染色体の14q31−q32に局在している。CPS263またはその断片はまた、90−95%同一な配列を有するヒトゲノム中の他の領域に整列する。
CPS264は、KIAA0410遺伝子産物をコード化する、KIAA0410に対応する。その遺伝子はLocusID:9818を有し、13番染色体上に局在し、細胞遺伝学的位置は13q12.12と報告されている。
CPS265は、プロテアソーム(プロソーム、マクロパイン)262サブユニット、非ATPアーゼ、3をコード化する、PSMD3に対応する。その遺伝子はLocusID:5709を有し、17番染色体上に局在し、細胞遺伝学的位置は17q12と報告されている。
CPS266は、補体成分1、q副成分結合タンパク質をコード化する、C1QBPに対応する。その遺伝子はLocusID:708を有し、17番染色体上に局在し、細胞遺伝学的位置は17q13.3と報告されている。ヒト補体副成分C1qは、C1rおよびC1sと結合して、血清補体系の最初の成分を生成する。C1QBP遺伝子によってコード化されるタンパク質は、C1q分子の球形の頭部に結合し、C1活性化を阻害することが知られている。このタンパク質はまた、ヒアルロン酸結合タンパク質と同様に、プレmRNAスプライシング因子SF2のp32サブユニットとして同定された。
配列番号:296のヌクレオチド58ないし1071および107ないし1037は、C1QBPP、および79−84%同一な配列を有するRYR3のイントロン配列に整列する。C1QBPPは、補体成分1、q副成分結合タンパク質、偽遺伝子をコード化する。それはLocusID:54098を有し、染色体21q21.1に局在している。RYR3は、リアノジン受容体3をコード化している。RYR3はLocusID:6263を有し、染色体の15q14−q15に局在している。
それに加えて、配列番号:296のヌクレオチド1070ないし1227は、100%同一な配列を有するLOC221903に整列する。LOC221903は、AF000974、BC004999、AF000974、BC021540、BC004249、AJ001902、AF025437、L40374、BC004999、AF025437、AK056773、BC002680、AK056773、BC004999およびBC002680によって支持される仮定の遺伝子である。その遺伝子は、染色体7q11.1に局在している。
CPS267は、酸化ストレス反応性1をコード化する、OSR1に対応する。その遺伝子はLocusID:9943を有し、3番染色体上に局在し、細胞遺伝学的位置は3p22−p21.3と報告されている。酸化ストレス反応性1遺伝子は、少なくとも18エクソンを有し、三つの他の遺伝子−GOLGA4、ITGA9およびHYA22の近傍に局在している。これら四つの遺伝子は、腫瘍抑制遺伝子の候補であると考えられている。酸化ストレス反応性1タンパク質は、ヒトSte20/酸化ストレス反応性キナーゼ1に類似しており、酸化ストレスに対する反応性に関与していると考えられている。酸化ストレス反応性1タンパク質は、SOK(Ste20/酸化ストレス反応性キナーゼ)ファミリーのメンバーと推定され、酸化ストレスによって活性化され得る。
CPS268は、CD44抗原(ホーミング機能およびインド血液型系)をコード化する、CD44に対応する。その遺伝子はLocusID:960を有し、11番染色体上に局在し、細胞遺伝学的位置は11p13と報告されている。
CPS269は、デスドメインを有する調節部を含むCASP2およびRIPK1ドメインをコード化する、CRADDに対応する。その遺伝子はLocusID:8738を有し、12番染色体上に局在し、細胞遺伝学的位置は12q21.33−q23.1と報告されている。その遺伝子産物は、アポトーシス調節分子であり、CASP2をタンパク質RIPと相互作用するFasL/TNF受容体に結合させるように機能する可能性がある。
CPS270は、ケモカイン(C−Cモチーフ)受容体様2をコード化する、CCRLに対応する。その遺伝子はLocusID:9034を有し、3番染色体上に局在し、細胞遺伝学的位置は3p21と報告されている。この遺伝子は、7回膜貫通タンパク質であり、CCR1に最も密接に結合していると予測される、ケモカイン受容体様タンパク質をコード化する。ケモカインおよびその受容体は、炎症部位にエフェクター免疫細胞を補充するために重要であると考えられている。CCRL2遺伝子は、最初の好中球および最初の単球において高いレベルで発現しており、好中球活性化の時におよび単球からマクロファージへの分化の間にさらにアップレギュレーションされる。CCRL2遺伝子は、ケモカイン受容体遺伝子クラスターが局在している領域に位置づけられる。その遺伝子産物は、Gタンパク質結合受容体ファミリーのメンバーである。
CPS271は、チオエステラーゼ脂肪関連をコード化する、KIAA0707(THEA)に対応する。その遺伝子はLocusID:26027を有し、1番染色体上に局在し、細胞遺伝学的位置は1p32.2と報告されている。
CPS272は、三部分モチーフ含有33ををコード化する、KIAA1113(TRIM33)に対応する。その遺伝子はLocusID:51592を有し、1番染色体上に局在し、細胞遺伝学的位置は1p13.1と報告されている。この遺伝子によってコード化されたタンパク質は、転写共抑制因子と考えられている。コード化したタンパク質は、三部分モチーフファミリーのメンバーである。三部分モチーフは、三つの亜鉛結合ドメイン、RING、Bボックスタイプ1およびBボックスタイプ2、および超螺旋領域を含む。少なくとも三つの異なるスプライシングを受けた、この遺伝子についての転写産物変異体が記述されている。
CPS273は、21番染色体上の染色体領域に対応する。この領域は、UNK_AL050119と呼ばれる。その領域は、膜貫通タンパク質1をコード化するTMEM1のイントロン中に局在している。TMEM1はLocusID:7109を有し、細胞遺伝学的位置は21q22.3と報告されている。TMEM1遺伝子産物は、ナトリウムチャネルタンパク質に類似している。
CPS274は、AF052115によって支持される仮定の遺伝子である、UNK_AF052115(LOC151405)に対応する。その遺伝子は、細胞遺伝学的位置は2q33.3と報告されている。LOC151405遺伝子は、ディスインテグリンおよび金属タンパク質分解酵素ドメイン23をコード化する、ADAM23のポリペプチドコード配列に3'局在している。ADAM23はLocusID:8745を有し、2番染色体上に局在し、細胞遺伝学的位置は2q33と報告されている。ADAM23遺伝子産物は、ADAMタンパク質ファミリーのメンバーである。このファミリーのメンバーは、構造的にヘビ毒ディスインテグリンに関連した膜に集まったタンパク質であり、受精、筋発達および神経発生を含めた、細胞−細胞および細胞−マトリックス相互作用を伴う様々な生物学的過程に含まれた。
CPS275は、小眼球症関連転写因子をコード化する、MITFに対応する。その遺伝子はLocusID:4286を有し、3番染色体上に局在し、細胞遺伝学的位置は3p14.1−p12.3と報告されている。MITF遺伝子産物は、塩基性らせん−ループ−らせんおよびロイシンジッパー構造的特徴を共に含む。MITFは、少なくとも二つの異なる転写産物:メラニン細胞においてのみ発現したM−アイソフォーム、および広い範囲の発現を有するA−アイソフォームを生成する。MITFにおける変異は、ワーデンブルヒ症候群につながる可能性がある。
CPS276は、シグナル変換および転写活性化因子3(急性期反応因子)をコード化する、STAT3に対応する。その遺伝子はLocusID:6774を有し、17番染色体上に局在し、細胞遺伝学的位置は17q21と報告されている。
この遺伝子によってコード化されるタンパク質は、STATタンパク質ファミリーのメンバーである。サイトカインおよび成長因子に反応して、STATファミリーメンバーは、受容体結合キナーゼによってリン酸化され、その後転写活性化因子として作用する細胞の核に転位させるホモまたはヘテロ二量体を形成する。STAT3遺伝子によってコード化されたタンパク質は、IFNs、EGF、IL5、IL6、HGF、LIFおよびBMP2を含めた、様々なサイトカインおよび成長因子に反応したリン酸化を介して活性化され得る。コード化したタンパク質は、細胞刺激に反応した様々な遺伝子の発現を媒介し、それによって細胞成長およびアポトーシスのような多くの細胞過程において役割を果たし得る。小さなGTPアーゼRac1は、結合してこのタンパク質の活性を調節することが示された。PIAS3タンパク質は、このタンパク質の特異的阻害剤である。異なるアイソフォームをコード化する、二つの異なるスプライシングを受けた転写産物変異体が記述された。
それに加えて、配列番号:315(L29277)のヌクレオチド16ないし2787は、STAT3と少なくとも95%同一な配列を有する。それゆえに、配列番号:315(L29277)またはその相補体は、STAT3の発現を検出するためのプローブ/プライマーを構築するために用いられ得る。配列番号:315(L29277)のヌクレオチド217ないし1502は、LOC254114と少なくとも98%同一な配列を有する。LOC254114は、シグナル変換に類似したタンパク質、および転写活性化因子3(急性期反応因子)をコード化する。LOC254114は、17番染色体上に局在している。
CPS277は、腫瘍タンパク質D52様2をコード化する、TPD52L2に対応する。その遺伝子はLocusID:7165を有し、20番染色体上に局在し、細胞遺伝学的位置は20q13.2−q13.3と報告されている。その遺伝子産物は、D52様タンパク質のファミリーのメンバーであり、細胞増殖を制御する役割を果たす可能性がある。その遺伝子産物は、超螺旋ドメインを含む。
CPS278は、(UNK_AI732885と呼ばれる)染色体領域に対応する。その染色体領域は、BCRA2領域由来の仮定のタンパク質をコード化するCG005のイントロンに局在している。CG005遺伝子はLocusID:10443を有し、細胞遺伝学的位置は13q12−q13と報告されている。CG005遺伝子産物は、ラットの2',3'―環状ヌクレオチド3'ホスホジエステラーゼ(Rn.31762)の領域にあまり類似性のない領域を含む。
CPS279は、分裂促進活性化タンパク質キナーゼキナーゼキナーゼ8をコード化する、MAP3K8に対応する。その遺伝子はLocusID:1326を有し、10番染色体上に局在し、細胞遺伝学的位置は10p11.2と報告されている。この遺伝子は、細胞中のオンコジーン形質転換活性によって同定された。コード化したタンパク質は、セリン/トレオニンタンパク質キナーゼファミリーのメンバーである。このキナーゼは、MAPキナーゼおよびJNKキナーゼ経路両方を活性化し得る。このキナーゼはまた、IカッパーBキナーゼを活性化し、それによってNFカッパーBの核での生成を誘導し得る。このキナーゼはまた、Tリンパ球活性化の間、TNFαおよびIL2の生成を促進することが判明した。ラットにおける類似した遺伝子の研究は、NFカッパーB1、p105(NFKB1)のタンパク質分解における、このキナーゼの直接的な関与を示唆した。MAP3K8遺伝子はまた、下流の枠組み内翻訳開始コドンを利用し、それによって短いN末端を含むアイソフォームを生成する可能性がある。短いアイソフォームは、弱い形質転換活性を示すことが示された。
CPS280は、レチキュロン4をコード化する、NSP−CL(RTN4)に対応する。その遺伝子はLocusID:57142を有し、2番染色体上に局在し、細胞遺伝学的位置は2p14−p13と報告されている。RTN4遺伝子は、2番染色体上のLOC200512と部分的に重なる。LOC200512は、レチキュロン4に類似したタンパク質をコード化する。LOC200512は、細胞遺伝学的位置は2p16.1と報告されている。
CPS281は、ニューレグリン1をコード化する、NRG1に対応する。その遺伝子はLocusID:3084を有し、8番染色体上に局在し、細胞遺伝学的位置は8p21−p12と報告されている。ニューレグリン1は、チロシン残基のリン酸化を増加させるために、NEU/ERBB2受容体チロシンキナーゼと相互作用する、44kDの糖タンパク質として最初に同定された。非常に多数の異なるアイソフォームは、異なるスプライシングによってNRG1から生成することが知られている。これらのアイソフォームは、ヘレギュリン(HRGs)、グリア成長因子(GGFs)および感覚ニューロンおよび運動ニューロン由来因子(SMDF)を含む。それらは、その構造において組織特異的に発現し、有意に異なる。HRGアイソフォームは、全て、免疫グロブリン(Ig)および上皮成長因子様(EGF様)ドメインを含む。GGFおよびGGF2アイソフォームは、クリングル様配列を加えたIgおよびEGF様ドメインを含み、SMDFアイソフォームは、他のアイソフォームとEGF様ドメインのみを共有する。全てのNRG1アイソフォームについての受容体は、チロシンキナーゼ膜貫通受容体のERBBファミリーである。ERBB受容体の相互作用によって、NRG1アイソフォームは、上皮、ニューロン、グリアおよび他のタイプの細胞の成長および分化を誘導する可能性がある。
CPS282は、RAB31、メンバーRASオンコジーンファミリーをコード化する、RAB31に対応する。その遺伝子はLocusID:11031を有し、18番染色体上に局在し、細胞遺伝学的位置は18p11.3と報告されている。その遺伝子産物はGTP結合タンパク質である。
CPS282はまた、83%同一な配列を有するLOC12414およびLOC200972に整列する。LOC124146は、細胞遺伝学的位置は16q11.2と報告されており、GTP結合タンパク質Rab0に類似したタンパク質をコード化する。LOC200972は3番染色体上に局在し、またGTP結合タンパク質Rab0に類似したタンパク質をコード化している。
CPS283は、MADSボックス転写促進因子2、ポリペプチドD(筋細胞促進因子2D)をコード化する、MEF2Dに対応する。その遺伝子はLocusID:4209を有し、1番染色体上に局在し、細胞遺伝学的位置は1q12−q23と報告されている。その遺伝子産物は、転写因子のMADSボックスファミリーのメンバーであり、筋特異的および分裂促進誘導性遺伝子を調節する可能性がある。
CPS285は、ケモカイン(C−X−Cモチーフ)受容体4をコード化する、CXCR4に対応する。その遺伝子はLocusID:7852を有し、2番染色体上に局在し、細胞遺伝学的位置は2q21と報告されている。CXCケモカイン受容体(フシン)は、細胞内カルシウム流入を媒介する可能性のあるGタンパク質結合受容体である。
CPS286は、筋の特定の遺伝子をコード化する、M9に対応する。その遺伝子はLocusID:27335を有し、19番染色体上に局在し、細胞遺伝学的位置は19q13.2と報告されている。
配列番号:318のヌクレオチド109ないし858は、筋の特定の遺伝子に類似したLOC134505と88%同一な配列を有する。LOC134505は5番染色体上に局在し、細胞遺伝学的位置は5q15と報告されている。配列番号:318のヌクレオチド109ないし858はまた、85%同一な配列を有する4番染色体上の染色体領域に整列する。染色体領域は、PRO1474に類似したLOC152771を含む。LOC152771は、細胞遺伝学的位置は4q26と報告されている。それに加えて、配列番号:318のヌクレオチド140ないし799は、約84%同一な配列を有するLOC131480に整列する。LOC131480は、PRO1474に類似したタンパク質をコード化し、細胞遺伝学的位置は3p24.1と報告されている。
CPS287は、普遍的に発現した(キツネ由来の)フィンケル−ビスキス−ライリー系ネズミ肉腫ウィルス(FBR−MuSV);リボソームタンパク質S30をコード化する、FAUに対応する。その遺伝子はLocusID:2197を有し、11番染色体上に局在し、細胞遺伝学的位置は11q13と報告されている。この遺伝子は、フィンケル−ビスキス−ライリー系ネズミ肉腫ウィルス(FBR−MuSV)におけるキツネの配列の細胞類似物である。それは、N末端のユビキチン様タンパク質fubi、およびC末端のリボソームタンパク質S30からなる融合タンパク質をコード化する。融合タンパク質は、翻訳後処理されて、遊離fubiおよび遊離リボソームタンパク質S30を生成する。fubiは、ユビキチンファミリーのメンバーであり、リボソームタンパク質S30は、リボソームタンパク質のS30Eファミリーに属する。この遺伝子由来の偽遺伝子が、ゲノムに存在している。
配列番号:319は、約92%同一な配列を有するFAUP1に整列する。FAUP1は、FBR−MuSVに関連した、普遍的に発現した(キツネ由来)偽遺伝子1をコード化する。その遺伝子はLocusID:140623を有し、18番染色体上に局在している。配列番号:319のヌクレオチド57ないし351は、LOC151661と約84%同一な配列を有する。LOC151661は、ユビキチン様/S30リボソーム融合タンパク質に類似したタンパク質をコード化する。LOC151661は、細胞遺伝学的位置は3q27.2と報告されている。それに加えて、配列番号:319のヌクレオチド454ないし490は、97%同一な配列を有するRHOBTB1のイントロン配列に整列する。RHOBTB1は、1を含むRho結合BTBドメインをコード化し、LocusID:9886を有し、細胞遺伝学的位置は10q22.1と報告されている。
CPS288は、リボソームタンパク質S6をコード化する、RPS6に対応する。その遺伝子はLocusID:6194を有し、9番染色体上に局在し、細胞遺伝学的位置は9q21と報告されている。この遺伝子は、リボソーム中の40Sサブユニットの成分である、細胞質リボソームタンパク質をコード化する。コード化したタンパク質は、リボソームタンパク質のS6Eファミリーに属する。それは、リボソームにおけるタンパク質キナーゼの主要な基質であり、五つのC末端のセリン残基の部分集合が異なるタンパク質キナーゼによってリン酸化される。リン酸化は、成長因子、腫瘍促進性試薬および分裂を含めた広い範囲の刺激によって誘導され得る。脱リン酸化は、成長抑制の際に起こる。コード化したタンパク質は、特定のクラスのmRNAの選別的翻訳を介した、細胞成長および増殖の制御に寄与する可能性がある。この遺伝子は、ゲノム中に分散した、多数の処理を受けた偽遺伝子を有する。
配列番号:320の断片は、約80−97%同一な配列を有する様々な染色体領域に整列する。これらの染色体領域には、例えば、LOC205865、LOC137397、LOC253482およびGCDHのイントロン配列を含む。LOC205865は、リボソームタンパク質S6に類似したタンパク質をコード化している。その遺伝子は、細胞遺伝学的位置は4q21.22と報告されている。LOC137397は、Rim2タンパク質に類似したタンパク質をコード化し、染色体の8q22.3に局在している。LOC253482は、リボソームタンパク質S6に類似したタンパク質をコード化し、9番染色体上に局在している。GCDHは、グルタリル補酵素A脱水素酵素をコード化する。GCDHはLocusID:2639を有し、染色体の19p13.2に局在している。
CPS289は、BCL2関連蛋白5をコード化する、BAG5に対応する。その遺伝子はLocusID:9529を有し、14番染色体上に局在し、細胞遺伝学的位置は14q32.33と報告されている。この遺伝子によってコード化されるタンパク質は、BAG1関連タンパク質ファミリーのメンバーである。BAG1は、様々な細胞のアポトーシスと相互作用することによって機能する抗アポトーシスタンパク質であり、BCL−2、Rafタンパク質キナーゼ、ステロイドホルモン受容体、成長因子受容体および70kDaのヒートショックタンパク質のメンバーを含めた成長関連タンパク質であると考えられている。BAG5遺伝子によってコード化されたタンパク質は、Hsc70/Hsp70に結合してシャペロン活性を阻害する可能性のある、C末端の近傍のBAGドメインを含む。
配列番号:321のヌクレオチド3913ないし4117は、DNAH11のイントロン配列と82%同一の配列を示す。DNAH11は、ダイニン、染色糸、重鎖ポリペプチド11をコード化する。その遺伝子はLocusID:8701を有し、細胞遺伝学的位置は7p21と報告されている。
CPS290は、リボソームタンパク質L10aをコード化する、UNK_AL022721(RPL10A)に対応する。RPL10AはLocusID:4736を有し、6番染色体上に局在し、細胞遺伝学的位置は6p21.3−p21.2と報告されている。その遺伝子産物は、大きい60Sリボソームサブユニットの成分である。
CPS290はまた、LOC253986およびLOC137107と96%同一な配列を有し、それらは共にリボソームタンパク質L10aに類似したタンパク質をコード化する。LOC253986は8番染色体上に局在し、LOC137107は染色体の8p11.23に局在している。それに加えて、CPS290は、PTPRG、BST1およびMARK3のイントロン配列と約90−96%同一な配列を有する。PTPRGは、タンパク質チロシンホスファターゼ、受容体タイプ、Gをコード化している。PTPRGはLocusID:5793を有し、染色体の3q21−p14に局在している。BST1は、骨髄基質細胞抗原1をコード化し、LocusID:683を有し、細胞遺伝学的位置は4p15と報告されている。MARK3は、MAP/微小管親和性調節性キナーゼ3をコード化し、LocusID:4140を有し、細胞遺伝学的位置は14q32.3と報告されている。CPS290は、84%同一な配列を有するLOC138030に整列する。LOC138030は、リボソームタンパク質L10aに類似したタンパク質をコード化し、染色体の8p21.3に局在している。
CPS290(配列番号:329)は、配列番号:322のヌクレオチド26623ないし27200がスプライシングを受けた生成物である。Entrezヒトゲノムデーターベースに対するBlast検索は、配列番号:322は6番染色体上の染色体領域と100%同一な配列を有することを示す。この染色体領域は、ゲノムの座NT_007592中に局在しており、次の遺伝子:TEAD3、RPL10A、FANCE、LOC221485およびLOC221486を含む。TEAD3は、TEAドメインファミリーのメンバー3をコード化し、LocusID:7005を有する。RPL10Aは、リボソームタンパク質L10aをコード化し、LocusID:4736を有する。FANCEは、ファンコーニ貧血、相補性グループEをコード化し、LocusID:2178を有する。LOC221486は、dJ109F14.3(推定上のZNF127様タンパク質)に類似したタンパク質をコード化する。LOC221486は、ペルオキソーム増殖因子活性化受容体β(PPARβ)(PPARδ)(核ホルモン受容体1)(NUC1)(NUC1)に類似したタンパク質をコード化する。配列番号:322は、TEADのタンパク質コード鎖に整列し、一方RPL10A、FANCE、LOC221485およびLOC221486の非タンパク質コード鎖に整列する。
配列番号:322の断片は、ヒトゲノムを介して、多量の染色体領域を有する、様々な程度の配列同一性を示す。
CPS291は、タンパク質キナーゼD2をコード化する、DKZP586E0820(PKD2)に対応する。その遺伝子はLocusID:25865を有し、19番染色体上に局在し、細胞遺伝学的位置は19q13.2と報告されている。その遺伝子産物は、タンパク質キナーゼCのアイソフォームの領域に類似しており、タンパク質−タンパク質およびタンパク質−脂質相互作用を媒介するために機能する可能性がある。その遺伝子産物は、キナーゼドメインおよびプレックストリン類似物(PH)ドメインを含む。
CPS292は、非POUドメインを含む、八量体結合をコード化する、NONOに対応する。その遺伝子はLocusID:4841を有し、X染色体上に局在し、細胞遺伝学的位置はXq13.1と報告されている。その遺伝子産物は、RNA認識モチーフを含む核タンパク質である。
配列番号:324はまた、約95−96%同一な配列を有するLOC146455に整列する。LOC146455は、54kDaの核RNAおよびDNA結合タンパク質に類似したタンパク質(p54(nrb))(p54nrb)(55kDaの核タンパク質)(NMT55)(八量体結合タンパク質を含む非POUドメイン)(DNA結合P52/P100複合体、52kDaサブユニット)をコード化する。LOC146455は、染色体の16q22.3に局在している。それに加えて、配列番号:324のヌクレオチド514ないし2591は、LOC130867と部分的に重なる染色体領域と約84−85%同一の配列を有する。LOC130867は、リボソームタンパク質S12(40Sリボソームタンパク質S12)に類似したタンパク質をコード化し、染色体の2p15に局在している。
CPS293は、亜鉛フィンガーRNA結合タンパク質をコード化する、UNK_AI743507(ZFR)に対応する。ZFRはLocusID:51663を有し、5番染色体上に局在し、細胞遺伝学的位置は5p13.2と報告されている。
CPS293はまた、オーソログのマウスの亜鉛フィンガータンパク質Zfrの様な、M期のリンタンパク質類似物に類似したタンパク質をコード化するLOC119355と92%同一の配列を示す。LOC119355は、細胞遺伝学的位置は10q23.33と報告されている。それに加えて、CPS293は、1番染色体上の染色体領域と94−96%同一な配列を有する。染色体領域は、トランスリン関連因子Xをコード化するTSNAXに近接しており、LocusID:7257を有し、細胞遺伝学的位置が1q42.1である。CPS293のヌクレオチド292ないし399は、1番染色体上の染色体領域と約92%同一な配列を有する。
CPS294は、分裂促進活性化タンパク質キナーゼ活性化タンパク質キナーゼ5をコード化する、MAPKAPK5に対応する。その遺伝子はLocusID:8550を有し、12番染色体上に局在し、細胞遺伝学的位置は12q24.12と報告されている。この遺伝子によってコード化されたタンパク質は、セリン/トレオニンキナーゼファミリーのメンバーである。細胞ストレスおよび前炎症性サイトカインに反応して、このキナーゼは、MAPK1/ERK、MAPK14/p38αおよびMAPK14/p38βを含めたMAPキナーゼによってリン酸化することによって、活性化し得る。少なくとも二つの異なるスプライシングを受けた、異なるアイソフォームをコード化しているこの遺伝子の転写産物変異体が報告されている。
CPS295は、仮定の遺伝子タンパク質MGC25673に類似したタンパク質をコード化する、UNK_U79297に対応する。LOC15767は、染色体の8q23.1に局在していることが報告されている。
表4に列挙した腎細胞癌の疾患遺伝子の重要性は、疾患なしに対する腎細胞癌の管理された分類に従った、相対的クラス分離測定の方法を用いて評価し得る。Golubら、Science286:531−537(1999)、およびSlonimら、Procs of the Fourth Annual International Conference on Computational Morecular Biology、東京、日本、4月8−11、p263−272(2000)参照。その後近隣者分析が実行され、測定した相関の有意性を決定し得る。例えば、この方法は、無作為に65の全試料(45の腎細胞癌患者および25の疾患なしのヒト)を、それぞれ45および20の試料の二つのグループに置き換えて、その後100の無作為化した試料のセットにおいて、最も高い相関度を有する遺伝子をランク付けする。この分析は、本発明において同定される腎細胞癌疾患遺伝子の大多数が、無作為に順序を変えたクラスのベクターと比べて、1%以上の有意なレベルの相関度を有することを示している。
末梢血において腎細胞癌の疾患遺伝子が特異的な発現パターンを呈することの基礎にある生物学的機構は、完全には分かっていない。特異的な発現パターンは、末梢血中に流れた腎細胞癌腫瘍細胞における変化した遺伝子発現パターンのためである可能性がある。例えば、表5は、腎細胞癌疾患遺伝子の部分集合がまた、疾患に罹患していないヒトの末梢血と比較して、腎細胞癌の腫瘍細胞において特異的に発現していることを示している。ある実験において、末梢血の単核細胞を疾患に罹患していないヒトから単離し、フィトヘマグルチニン(PHA)で処理する。表5に示すように、PHA刺激は、生体外では、本発明の有意な数の腎細胞癌の疾患遺伝子の特異的な発現パターンを再現しているように思われる。このことは、末梢血におけるいくつかの腎細胞癌疾患遺伝子の特異的な発現パターンは、生体内の白血球の活性化から生じている可能性があることを示唆している。
表5は、さらに末期腎不全の患者に特異的に発現している腎細胞癌疾患遺伝子の実質的な部分集合を同定している。それゆえに、末梢血における腎細胞癌の疾患遺伝子の部分集合の特異的な発現パターンが、腎細胞癌患者の腎障害に対する反応としての白血球の変化によるものである可能性がある。
C.他の固形腫瘍の疾患遺伝子
小節Bにおいて記述されている方法論は、他の固形腫瘍の疾患遺伝子の同定に容易に適用し得る。これらの固形腫瘍の疾患遺伝子は、疾患に罹患していないヒトと比較して、固形腫瘍の患者の末梢血またはPBMCにおいて、特異的に発現している。
ある具体例として、PBMCを濃縮した、腎細胞癌、前立腺癌、頭部/頸部癌および疾患に罹患していないヒトの末梢血試料に由来する遺伝子チップ発現データを収集し、多重相関測定法を用いて比較し、分析した。多重相関測定法は、末梢血遺伝子発現プロフィールの各々のクラスと最も高く相関している遺伝子を同定し、分類し得る。適当な多重相関測定法には、MIT Center for Genome Research at Whitehead Institute(Cambridge、MA)によって提供される遺伝子クラスター2ソフトウェアを含むが、それだけに限定されない。遺伝子クラスター2ソフトウェアは、管理された分類、遺伝子選別および置換テスト機能を有する。どれは、加重多数決およびk−近隣者アルゴリズムを用いた、管理されたモデルの構築およびテストについてのアルゴリズムを含む。
一例として、20の遺伝子セットは、トレーニングセットとして発現プロフィールの70%を用いて選別される。これらの20多重分類子遺伝子は、表10に記載している。これら20の遺伝子は、疾患に罹患していないヒトと比較して、固形腫瘍の三つ全てのクラス(すなわち腎細胞癌、前立腺癌および頭部/頸部癌)の末梢血において、特異的な発現パターンを有する。遺伝子セットは、各々の残りのプロフィールについての89%以上の予測精度を有する。腎細胞癌、前立腺癌、頭部/頸部癌および疾患に罹患していないヒトについての高い予測精度を有する他の遺伝子セットが、同様にして得られる。
他の具体例として、多重相関測定法は、特定のタイプの固形腫瘍にかかわらず、固形腫瘍なしに対して固形腫瘍を予測できる遺伝子を同定するために用いられる。腎細胞癌、前立腺癌、頭部/頸部癌および疾患に罹患していないヒト由来の末梢血遺伝子発現プロフィールを、多級比較を用いて分析する。19の遺伝子セットは、トレーニングセットとして全試料の70%を用いて選別する。このようにして選ばれた遺伝子セットは、表11に記載している。その遺伝子セットにおける各々の遺伝子は、疾患に罹患していないヒトと比較して、固形腫瘍患者の三つ全てのタイプ(すなわち腎細胞癌、前立腺癌および頭部/頸部癌)の末梢血において、特異的に発現している。19の遺伝子セットは、残りの発現プロフィールについて、固形腫瘍なしに対して固形腫瘍を正確に予測できる。固形腫瘍なしに対する固形腫瘍について高い予測精度を有する他の遺伝子が、同様にして得られる。
D.腎細胞癌、腎細胞癌なし、固形腫瘍および/または固形腫瘍なしの検出
表4において同定される腎細胞癌疾患遺伝子は、未知の疾患状態を有するヒトの患者において、腎細胞癌、腎細胞癌なし、固形腫瘍および/または固形腫瘍なしを検出するために用いられ得る。例えば、ヒトの患者の末梢血試料において、一つまたはそれ以上の腎細胞癌疾患遺伝子の発現パターンが、疾患に罹患していないヒトにおける対応する発現パターンと実質的に異なっていない場合は、診断されたヒトの患者は腎細胞癌なしであることを示唆している。反対に、ヒトの患者において、一つまたはそれ以上の腎細胞癌疾患遺伝子の発現パターンが、疾患に罹患していないヒトにおける対応する発現パターンと実質的に異なっている(ヒトの患者における遺伝子発現レベルが、疾患に罹患していないヒトにおける発現レベルよりも実質的に高いかまたは低い)場合は、ヒトの患者が腎細胞癌(または診断に用いられる遺伝子次第で、他の固形腫瘍)に罹患している可能性があることを示唆している。加重多数決プログラムのようなアルゴリズムは、診断を容易にするために用いられ得る。それに加えて、他の臨床的証拠は、誤った診断のリスクを低下させるために、遺伝子を基盤としたテストと組み合わせ得る。同様の方法が、前立腺癌および頭部/頸部癌のような他の固形腫瘍の有無を予測するために用いられ得る。
特異的に発現した遺伝子産物に基づいた診断法またはスクリーニング法は、当該分野においてよく知られている。本発明のある側面に従うと、腎細胞癌疾患遺伝子の異なる発現パターンは、末梢血試料におけるこれらの遺伝子のRNA転写産物のレベルを測定することによって決定し得る。この目的のための適当な方法には、RT−PCT、ノーザンブロット、in situハイブリダイゼーション、サザンブロット、スロットブロッテイング、ヌクレアーゼ保護アッセイおよびポリヌクレオチドアレーを含めるが、それだけに限定されない。末梢血試料は、全血または濃縮したPBMCを含む血液試料のいずれかであって良い。
一般に、末梢血試料から単離したRNAは、検出および/または定量化の前に、cDNAまたはcRNAに増幅し得る。単離したRNAは、全RNAまたはmRNAのいずれかであって良い。RNA増幅は、特異的または非特異的であって良い。適当な増幅法には、逆転写酵素PCR、等温増幅、リガーゼ連鎖反応およびQβレプリカーゼを含むが、それだけに限定されない。増幅した核酸生成物は、標識したプローブを介して、検出および/または定量化し得る。
腎細胞癌疾患遺伝子についての増幅プライマーまたはハイブリダイゼーションプローブは、当該分野においてよく知られた方法を用いて、遺伝子配列または対応するCPSから調製し得る。この目的に適した遺伝子配列には、エクソン、イントロン、または3'または5'非翻訳領域、またはそれらのあらゆる組み合わせを含む。ある具体例として、プローブまたはプライマーは、腎細胞癌疾患遺伝子の3'タンパク質−コード領域中のまたはその近傍の配列に基づいて構築される。例えば、腎細胞癌疾患遺伝子産物のC末端領域における最後の100ないし300アミノ酸残基をコード化するヌクレオチド配列は、プローブまたはプライマーを構築するために選別し得る。腎細胞癌疾患遺伝子のゲノム所在が決定しているか、またはその遺伝子が多数のゲノム所在に対応している場合は、プローブ/プライマーは遺伝子のCPSに基づいて構築することができ、またはオリゴヌクレオシドプローブが遺伝子の同定のために用いられたHG−U95Av2遺伝子チップに基づいて構築され得る。
表4は、対応する腎細胞癌疾患遺伝子の検出のためのプローブ/プライマーを作るのに適した配列を記載している。適当なオリゴヌクレオチドプローブ/プライマーは、ATTACHMENT Aに記載されている。
一つの具体例として、各々のプローブ/プライマーは、少なくとも15のヌクレオチドを含む。例えば、各々のプローブは、少なくとも20、25、50、75、100、125、150、175、200、225、250、275、300、325、350、400またはそれ以上のヌクレオチドを含み得る。好ましくは、各々のプローブ/プライマーは、相対的に高い配列の複雑性を有し、不明瞭な残基(決定されていない「n」残基)を有していない。プローブ/プライマーは、好ましくは、厳しいまたは非常にストリンジェントな条件下で、RNA転写産物を含めた標的遺伝子にハイブリダイゼーションし得る。
他の具体例として、遺伝子についてのプローブ/プライマーは、他の遺伝子の配列から有意に分かれた領域から選ばれる。そのような領域は、NCBIのEntrezデーターベースのような、ヒトゲノム配列データーベースプローブ/プライマー配列を調べることによって決定され得る。この目的に適した一つのアルゴリズムはBLASTアルゴリズムである。このアルゴリズムは、まず、疑いのある配列中の短い鎖の語Wを、データベースの配列中の同じ長さの語と一緒に並べた時に、適合するか、またはいくらか肯定的に評価された閾値Tを満足するかを同定することで高スコアの配列対(HSP)を識別することを含む。Tは近接する語のスコアの閾値と言われる。これらの最初の近接する語のヒットはそれらを含むより長いHSPを見つける検索を開始するための種子として作用する。語のヒットは、その後各々の配列に沿って両方向に伸長し、累積配列スコアを増加させる。累積スコアは、ヌクレオチド配列について、パラメーターM(適合残基の組についての報酬スコア;常に>0)およびN(適合残基の組についての刑罰スコア;常に<0)を用いて算出される。BLASTアルゴリズムパラメーターW、TおよびXは、配列の感受性およびスピードを決定する。これらのパラメーターは、当業者に評価されているような、異なる目的のために調節し得る。
好ましい具体例として、(TaqMan、ABIのような)定量的RT−PCRが、末梢血試料における腎細胞癌疾患遺伝子のRNA転写産物のレベルを検出し、比較するために用いられる。定量的RT−PCRは、RNAをcDNAに逆転写(RT)し、続いて相対的定量的PCR(RT−PCR)することを含む。
PCRにおいて、増幅した標的DNAの分子数は、ある試薬が極限に達するようになるまで、一の因子が反応の各サイクルで2に近づくまで増加する。その後、増幅速度は、周期の間増幅した標識が増加しない間は、ますます減少する。X軸上に周期数をとり、Y軸上に増幅した標的DNAの濃度の対数をとったグラフをプロットすると、特徴的な形の曲線が、プロットした点を結びつけることによって形成されることが観察される。最初の周期から始めると、線の勾配が正で一定である。これは曲線の直線部分と言われる。ある試薬が極限に達するようになると、線の勾配は低下し始め、最終的には0になる。この時点において、増幅した標的DNAの濃度がある固定値に次第に近づいていく。これは曲線のプラトー部分と言われる。
PCRの直線部分における標的DNAの濃度は、PCRが始まる前の標的の最初の濃度に比例する。同数の周期を完結し、直線部分にあるPCR反応における標的DNAのPCR生成物の濃度を決定することによって、最初のDNA混合物中の特定の標的配列の相対濃度を決定することが可能である。DNA混合物が、異なる組織または細胞から単離されたRNAより合成されたcDNAである場合は、標的配列が由来する特定のmRNAの相対的存在量が、それぞれの組織または細胞について決定される可能性がある。このPCR生成物の濃度および相対的mRNA存在量の間の正比例は、PCR反応の直線範囲の部分において当てはまる。
曲線のプラトー部分における標的DNAの最終濃度は、反応混合における試薬の効果によって決定され、標的DNAの最初の濃度とは無関係である。それゆえに、増幅したPCR生成物のサンプリングおよび定量化は、好ましくは、PCR反応が曲線の直線部にあるときに実行される。それに加えて、増幅したcDNAsの相対的濃度は、好ましくは、内在するRNA種または外部から導入されたRNA種のいずれかに基づいている可能性がある、いくつかの独立した基準に標準化する。特定のmRNA種の存在量はまた、試料中の全てのmRNA種の平均存在量と比較して決定して良い。
一つの具体例として、PCR増幅は、標的とおよそ同じくらい豊富である内部のPCR基準を利用する。この戦略は、PCR増幅の生成物が直線相の間にサンプリングする場合に有効である。反応がプラトー相に近づく時に生成物をサンプリングする場合は、あまり多くない生成物が相対的に過剰発現する可能性がある。特異的な発現についてRNA試料にを検査する場合のような、多くの異なるRNA試料についてなされる相対的存在量の比較は、実際よりも少なく思われるRNAの相対的な存在量の違いをなすための方法のように歪曲している。これは、内部基準が標的よりもずっと多量である場合は、改良され得る。内部基準が標的よりも多量である場合は、直接的な直線比較はRNA試料間でなされて良い。
臨床的試料に内在する問題は、様々な量および/または質を有していることである。この問題は、標的cDNA断片より大きい増幅可能なcDNA断片であり、内部基準をコード化するmRNAの存在量が、標的をコード化するmRNAよりもおおよそ5−100倍高い内部基準を有する、RT−PCRが相対的定量的RT−PCRのように実行された場合に克服し得る。このアッセイは、各々のmRNA種の絶対的存在量ではなく、相対的存在量を測定する。
他の具体例として、相対的定量的RT−PCRは、外部の標準プロトコールを用いる。このプロトコールの下、PCR生成物を増幅曲線の直線部分でサンプリングする。サンプリングを最適化するPCR周期の数は、各々の標的cDNA断片について経験的に決定され得る。それに加えて、様々な試料から単離した各々のRNA数の逆転写生成物は、等濃度の増幅可能なcDNAについて標準化され得る。増幅曲線の直線範囲の経験的決定およびcDNA調製の標準化は、退屈で時間のかかる工程であるが、生じたRT−PCRアッセイは、ある場合においては、内部基準を有する相対的定量的RT−PCRに由来するものより優れている可能性がある。
核酸アレーはまた、末梢血試料における腎細胞癌疾患遺伝子の特異的な発現パターンを検出し、比較するために用いられ得る。対応する腎細胞癌疾患遺伝子を検出するために適したプローブは、固形の基質上の既知の別々の領域に安定に結合し得る。本明細書で用いられているように、プローブが別の領域と比較してハイブリダイゼーションおよびその後の洗浄の間その位置を維持する場合、プローブは別々の領域に「安定に結合している」。核酸アレーの構築は、当該分野においてよく知られている。ポリヌクレオチドアレーを作るための適当な基質には、膜、フィルム、プラスチックおよび水晶のウエハースを含むが、それだけに限定されない。
本発明の核酸アレーは、少なくとも2、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250またはそれ以上の異なるポリヌクレオチドプローブを含み、各々の異なるプローブは異なるそれぞれの腎細胞癌疾患遺伝子にハイブリダイズすることが可能である。同一の遺伝子についての多数のプローブが、一本鎖核酸アレー上で用いられ得る。本発明に適当なプローブの例は、ATTACHMENT Aに記載している。他の疾患遺伝子についてのプローブはまた、本発明の核酸アレーに含まれ得る。アレー上のプローブ密度は、あらゆる範囲にあって良い。例えば、密度は50、100、200、300、400、500またはそれ以上のプローブ/cm2であってよい。
一つの具体例として、ヌクレアーゼ保護アッセイは、末梢血試料に由来するRNAを定量化するために用いられる。当業者に知られた多くの異なる型のヌクレアーゼ保護アッセイが存在する。ヌクレアーゼ保護アッセイの一般的特徴は、RNAが定量化されるアンチセンス核酸のハイブリダイゼーションを伴うことである。生じたハイブリッド二本鎖分子は、一本鎖核酸を二本鎖核酸よりも効率的に消化するヌクレアーゼでその後消化する。消化の後に残ったアンチセンス核酸の量は、定量すべき標的RNA種の量の尺度である。市販で入手できるヌクレアーゼ保護アッセイの例は、Ambion、Inc.(Austin、Texas)で製造されているRNAアーゼ保護アッセイである。
上で記述した方法はまた、CPS表2に記載されているCPSにハイブリダイゼーション可能な末梢血におけるRNA種のレベルを決定するために用いられ得る。末梢血におけるこれらRNA種のレベルは、ヒトの患者が腎細胞癌を有しているかまたは腎細胞癌に罹患していないかに関して示唆するものであって良い。
本発明の他の側面に従うと、腎細胞癌疾患遺伝子の特異的な発現パターンは、末梢血中のこれらの遺伝子によってコード化されるポリペプチドのレベルを測定することによって決定し得る。この目的のために適当な方法には、ELISA、RIA、FACS、ドットブロット、ウエスタンブロット、免疫組織化学および抗体を基礎とした放射線画像化のような免疫アッセイ法を含むが、それだけに限定されない。これらの免疫アッセイを実行するためのプロトコールは、当該分野においてよく知られている。2次元SDSポリアクリルアミドゲル電気泳動のような他の方法がまた用いられ得る。
末梢血試料中の標的タンパク質のレベルを検出するために適した一つの典型的方法は、ELISAである。典型的なELISAにおいて、一つまたはそれ以上の腎細胞癌疾患遺伝子によってコード化される標的タンパク質に結合可能な抗体は、ポリエチレンまたはポリ塩化ビニルマイクロ滴定プレート中のウェルのように、タンパク質親和性を示す選別された表面に固定される。その後、検査すべき末梢血試料をウェルに付加する。結合し、非特異的に結合した免疫複合体を除去するために洗浄した後、結合した抗原は検出し得る。検出は、標的タンパク質に特異的で、検出可能な標識に結合している二次抗体を付加することによって達成され得る。検出はまた、二次抗体を付加し、続いて二次抗体に対する結合親和性を有し、検出可能な標識と結合している三次抗体を付加することによって達成され得る。マイクロ滴定プレートに付加される前に、末梢血試料中の細胞は、当該分野で知られている様々な方法を用いて溶解され得る。適当な抽出過程は、潜在的阻害物質から標的タンパク質を分離するために用いられ得る。
他の典型的なELISAにおいて、標的タンパク質を含んでいると思われる末梢血試料は、ウェルの表面に固定され、その後本発明の抗体と接触させる。結合し、非特異的に結合した免疫複合体を除去するために洗浄した後、結合した抗原は検出し得る。最初の抗体が検出可能な標識に結合している場合は、免疫複合体は直接検出され得る。免疫複合体はまた、一次抗体に対する結合親和性を有し、検出可能な標識に結合している二次抗体を用いて検出され得る。
他の典型的ELISAは、検出における抗体の競争を利用することを伴う。このELISAにおいて、標的タンパク質はウェル表面に固定される。標識した抗体をウェルに付加し、標的タンパク質に結合することを可能にし、標識の方法によって検出される。未知の試料中の標的タンパク質の量は、その後、被覆したウェルでインキュベーションする前にまたはその間に、試料を標識した抗体と混合することによって決定される。未知の試料中に標的タンパク質が存在すれば、ウェルに結合可能な抗体の量を低下させ、それによって最終的なシグナルを低下させるように作用する。
異なるELISAの型は、被覆、インキュベーションまたは結合、非特異的に結合した種を除去するための洗浄、および結合した免疫複合体の検出のような、ある特徴を共通に持ち得る。例えば、抗原または抗体のいずれかを有するプレートの被覆において、プレートのウェルを、一晩中または規定された時間のいずれかの間、抗原または抗体の溶液によってインキュベーションし得る。プレートのウェルを、その後不完全に吸着された物質を除去するために洗浄する。あらゆる残りの利用できるウェルの表面は、その後テスト試料に関して中立的な抗原性である非特異的タンパク質で「被覆」する。非特異的なタンパク質の例には、牛血清アルブミン(BSE)、カゼインおよびミルクパウダーの溶液を含む。被覆は、固定された表面上の非特異的吸着部位をブロックすることを可能にし、それによって表面への抗血清の非特異的結合によって引き起こされるバックグラウンドを低下させる。
ELISAにおいて、二次的または三次的検出法がまた用いられ得る。タンパク質または抗体のウェルに対して結合し、バックグラウンドを低下させるために非反応性物質で被覆し、非結合物質を除去するために洗浄した後、固定する表面は、対照群および/または免疫複合体(抗原/抗体)の形成を可能にする効率的な条件下で検査すべき臨床的または生物学的試料と接触させる。これらの条件には、例えば、BSA、牛γグロブリン(BGG)およびリン酸緩衝食塩水(PBS)/ツゥイーンのような溶液によって抗原および抗体を希釈し、抗体および抗原を室温で約1ないし4時間、または4℃で一晩中インキュベーションすることを含む。免疫複合体の検出は、その後標識した二次結合リガンドまたは抗体、または標識した三次抗体または三次結合リガンドと結合した、二次結合リガンドまたは抗体を必要とする。
ELISAにおいてインキュベーション工程に続いて、接触した表面は、非結合物質を除去するために洗浄し得る。例えば、表面は、PBS/ツゥイーンまたはホウ酸緩衝剤のような溶液によって洗浄して良い。テスト試料および最初に結合した物質の間の特定の免疫複合体の形成、およびその後の洗浄に続いて、免疫複合体の量の存在を決定し得る。
検出法を提供するために、二次または三次抗体は、検出を可能にする標識を結合していてよい。一つの具体例として、標識は、適当な色素産生基質とともにインキュベーションすることで発色を呈する酵素である。従って、例えば、ウレアーゼ、グルコースオキシダーゼ、アルカリホスファターゼまたはペルオキシダーゼ結合抗体を有する最初または二次免疫複合体を接触させ、長時間さらなる免疫複合体形成の発達に好都合である条件下でインキュベーションしてよい(例えば、PBS−ツゥイーンのようなPBSを含む溶液中で室温で2時間インキュベーションする)。
標識した抗体とともにインキュベーションし、その後非結合物質を除去した後、例えば酵素標識としてペルオキシダーゼを用いる場合は、尿素およびブロモクレゾールパープルまたは2,2−アジド−ジ−(3−エチル)−ベンズチアゾリン−6−スルホン酸(ABTS)のような色素産生基質、および過酸化水素とインキュベーションすることによって、標識の量を定量化した。定量化は、例えば分光光度計を用いて、色素産生の程度を測定することによって達成し得る。
本発明に適した他の方法はRIA(放射免疫アッセイ)である。典型的RIAは、放射標識したポリペプチドおよび非標識ポリペプチドの間の、限られた量の抗体に結合するための競争に基づいている。適当な放射標識には、I125を含むが、それだけに限定されない。一つの具体例として、一定の濃度のI125標識したポリペプチドを、ポリペプチドに特異的な抗体の一連の希釈液とともにインキュベーションする。非結合ポリペプチドをこの系に付加する場合、抗体に結合するI125ポリペプチドの量は減少する。それゆえに標準曲線は、抗体結合I125ポリペプチドの量を、非結合ポリペプチドの濃度の機能として表すように構築され得る。標準曲線から、未知の試料中のポリペプチドの濃度が決定され得る。末梢血試料におけるポリペプチドのレベルを測定するためにRIAを行うための様々なプロトコールが、当該分野にいてよく知られている。
本発明についての適当な抗体には、ポリクローナル抗体、モノクローナル抗体、キメラ抗体、ヒト化抗体、一本鎖抗体、Fab断片およびFab発現ライブラリーによって生成した断片を含むが、それだけに限定されない。中和抗体(すなわち、二量体形成を阻害する抗体)もまた用いられ得る。
ポリクローナル抗体は、腎細胞癌疾患遺伝子産物またはそれらの断片を有する適当な患者に免疫を与えることによって調製し得る。免疫化した患者における抗体力値は、ELISAのような標準的技術を用いてずっとモニターすることができる。抗体は、当該分野においてよく知られた技術を用いて、免疫化した患者から単離し得る。
一つの具体例として、腎細胞癌疾患遺伝子産物に対する抗体を生成し得るハイブリドーマを調製する。腎細胞癌疾患遺伝子産物は、遺伝子産物をコード化するポリヌクレオチド配列によって変形またはトランスフェクションした、細菌または他の細胞を用いて調製し得る。精製した遺伝子産物、またはそれらの断片は、哺乳類のような脊椎動物を免疫化するために用いられている。適当な哺乳類には、マウス、ウサギおよび羊を含む。好ましくは、免疫化に用いられる断片は少なくとも8のアミノ酸残基を含み、より好ましくは、少なくとも12のアミノ酸残基を含み、非常に好ましくは少なくとも16のアミノ酸残基を含み、最も好ましくは少なくとも20のアミノ酸残基を含む。
遺伝子産物中の免疫原性を有する断片(エピトープ)は、既知の技術を用いて同定し得る。好ましいエピトープは、遺伝子産物の表面に局在している領域である。これらの領域は通例親水性である。
脾臓細胞は、免疫化した脊椎動物から単離され、(骨髄腫のような)不死化した細胞系に融合させてハイブリドーマを形成する。好ましくは、不死化した細胞系はリンパ球と同じ哺乳類の種に由来する。例えば、ネズミのハイブリドーマは、不死化したマウスの細胞系を、本発明の免疫原性調製によって免疫化したマウスから単離したリンパ球と融合させることによって作成し得る。好ましい不死化した細胞系には、ヒポキサンチン、アミノプテリンおよびチミジンを含む培養培地(「HAT培地」)に感受性の、マウス骨髄腫細胞系を含む。適当な骨髄腫系には、P3−NS1/1−Ag4−1、P3−x63−Ag8.653またはSp210−Ag14骨髄腫系を含むが、それだけには限定されず、それら全てはATCCから購入できる。一つの具体例として、HAT感受性マウス骨髄腫細胞を、ポリエチレングリコール(PEG)を用いてマウスの脾臓細胞に融合させる。そのようにして生成したハイブリドーマ細胞を、融合していないかまたは無効な融合をした骨髄腫細胞を殺す、HAT培地に対して選別する。腎細胞癌疾患遺伝子産物に対するモノクローナル抗体を生成するハイブリドーマ細胞を、ハイブリドーマ培養の上澄みをスクリーニングすることによって検出し得る。
モノクローナル抗体はまた、免疫グロブリンライブラリー(例えば抗体相呈示ライブラリー)の組み合わせの組み換えをスクリーニングすることによって調製し得る。相呈示ライブラリーを生成し、スクリーニングするためのキットは市販で入手できる。(例えば、the Pharmacia Recombinant Phase Antibody System、カタログ番号27−9400−01;およびthe Strtagene SurfZAP(商標登録) Phage Display Kit、カタログ番号240612)
本発明に適した抗体にはまた、「一本鎖Fv」または「scFv」を含む。scFv断片は、抗体のVHおよびVLドメインを含む。一般に、scFvポリペプチドは、VHおよびVLドメインの間のポリペプチドリンカーをさらに含む。ポリペプチドリンカーは、scFvが抗原結合に望ましい構造を形成することを可能にする。それに加えて、キメラおよびヒト化モノクローナル抗体のような組み換え抗体は、当業者によって評価されているようにして調製され得る。
ヒト化抗体もまた用いられ得る。非ヒト(例えばネズミ)抗体のヒト化体は、キメラ免疫グロブリン、免疫グロブリン鎖、または(Fv、Fab、Fab'、 F(ab')2または抗体の他の抗原結合配列のような)それらの断片であり、非ヒト免疫グロブリンに由来する最小限の配列を含む。ヒト化抗体は、相補的決定領域(CDRs)を形成する残基が、マウス、ラットまたはウサギ抗体のような望ましい特異性、親和性および容量を有する非ヒト抗体のCDR由来の残基によって置換されているところの、ヒト免疫グロブリンに由来する。いくつかの例として、ヒト免疫グロブリンのFvフレームワーク残基は、対応する非ヒト残基によって置換されている。ヒト化抗体はまた、レシピエントの抗体にも導入されたCDRにも見られない残基またはフレームワーク配列を含む。ヒト化抗体は、少なくとも一つまたは二つの可変ドメインを含み、全てまたは実質的に全てのCDR領域が非ヒト免疫グロブリンのそれらに対応し、全てまたは実質的に全ての定常領域がヒト免疫グロブリン共通配列のそれらである。ヒト化抗体は、好ましくは、少なくともヒト免疫グロブリンの免疫グロブリン定常領域(Fc)の一部分を含む。
ヒト化抗体は、マウス本来の免疫グロブリン軽鎖および重鎖は発現できないが、ヒト重鎖および軽鎖を発現することができる、トランスジェニックマウスを用いて生成し得る。トランスジェニックマウスは、選別した抗原を用いた標準的手法で免疫化する。抗原に対するモノクローナル抗体は、従来のハイブリドーマ技術を用いて得られる。トランスジェニックマウスに潜在しているヒト免疫グロブリンのトランスジーンは、B細胞の分化の間に再配列し、その後クラススイッチおよび体細胞変異を受ける。この技術を用いて、治療上有用なIgG、IgAおよびIgE抗体が調製され得る。
それに加えて、選別したエピトープを認識するヒト化抗体が、「ガイド選別」と呼ばれる技術を用いて生成し得る。この方法において、例えばネズミの抗体のような、選別した非ヒトモノクローナル抗体は、同じエピトープを認識するヒト化抗体の選別をガイドするために用いられる。
一つの具体例として、本発明の抗体は、対応する腎細胞癌疾患遺伝子産物、または少なくとも105M−1、106M−1、107M−1またはそれ以上のような少なくとも104M−1の、結合親和性定数Ka望ましい抗原と結合し得る。
本発明の抗体は、抗体−抗原複合体の検出を可能にするために、一つまたはそれ以上の検出可能な部分によって標識され得る。検出可能な部分には、分光器的、酵素的、光化学的、生化学的、生物電子工学的、免疫化学的、電気的、光学的または化学的方法によって検出し得る組成物を含み得る。検出可能な部分には、放射線測定器、化学ルミネセンス化合物、標識した結合タンパク質、重金属原子、蛍光マーカーおよび色素のような分光器のマーカー、磁気標識、結合した酵素、質量分光測定タグ、スピン標識、電子輸送体および受容体、およびその類似物を含むが、それだけに限定されない。
本発明のさらに他の側面に従うと、末梢血試料におけるポリペプチドのレベルが、ポリペプチドと関連した生物学的活性を検出することによって決定し得る。ポリペプチドの生物学的機能/活性が既知る場合は、適当な試験管内バイオアッセイが生物学的機能/活性を評価するために構築し、それによって試料中のポリペプチドの量を決定し得る。
腎細胞癌疾患遺伝子またはそれぞれのCPSsの発現レベルは、様々な方法を用いて、基準の発現レベルと比較し得る。これらの基準のレベルは、疾患に罹患していないヒト、腎細胞癌またはその他の固形腫瘍患者から単離した末梢血試料を用いて決定し得る。比較は、比較すべき発現レベルの間のフォールドチェンジまたは絶対差異を用いて実行し得る。一つまたはそれ以上の腎細胞癌疾患遺伝子またはCPSsが、その比較に用いられ得る。例えば、少なくとも2、3、4、6、8、10、12、14、16、18、20、30、40、50、60、70、80、90、100、150、200またはそれ以上の腎細胞癌疾患遺伝子またはCPSsが用いられ得る。
発現パターンはまた、異なる疾患遺伝子の発現レベルの間の一つまたはそれ以上の比率を用いることによって比較し得る。他の適当な尺度または指標はまた、異なる発現パターンの間の関係または相違を評価するために利用し得る。
多数のCPSsまたは腎細胞癌疾患遺伝子の利用は、誤った予測のリスクを低下し得る。一つの具体例として、選別したCPSsまたは腎細胞癌疾患遺伝子の50%以上が(60%、70%、80%または90%のような)、テストのヒトが腎細胞癌を有しているかまたは腎細胞癌のないことを示唆する場合は、それぞれ腎細胞癌または腎細胞癌のないことの予測をなすであろう。他の具体例として、遺伝子発現を基盤にした比較は、腎細胞癌および/または他の固形腫瘍を予測する他の臨床的証拠と組み合わせる。
好ましい具体例として、腎細胞癌なしに対する腎細胞癌の予測に用いられる腎細胞癌疾患遺伝子は、EEF1A2、TLR2、BRF2、LGALS3、SNRPG、DKFZP586E1621、NUMA1、SOD2、AKR1B1、DUSP6、SMARCE1、KIAA0669、MSF、IL1RN、PTMA、KIAA0410、PSMD3、T54、C1QBPおよびOSR1からなる群から選ばれる一つまたはそれ以上の遺伝子を含むか、またはそれらからなり得る。例えば、腎細胞癌の予測に用いられる腎細胞癌疾患遺伝子は、その群から選ばれる少なくとも2、4、6、8、10、12、14、16、18または20の遺伝子を含むか、またはそれらからなり得る。他の例としては、診断に用いられる腎細胞癌疾患遺伝子は、(1)TLR2、LGALS3、DKFZP586E1621、SOD2、DUSP6、KIAA0669、IL1RN、KIAA0410、T54およびOSR1からなる群から選ばれる少なくとも1、2、3、4、5、6、7、8、9または10の遺伝子、および/または(2)EEF1A2、BRF2、SNRPGNUMA1、AKR1B1、SMARCE1、MSF、PTMA、PSMD3およびC1QBPからなる群から選ばれる少なくとも1、2、3、4、5、6、7、8、9または10の遺伝子を含み得る。
他の好ましい具体例として、腎細胞癌なしに対する腎細胞癌の予測に用いられるCPSsは、CPS1、CPS3、CPS4、CPS6、CPS18、CPS38、CPS53、CPS255、CPS256、CPS257、CPS258、CPS259、CPS260、CPS261、CPS262、CPS263、CPS264、CPS265、CPS266およびCPS267からなる群から選ばれる一つまたはそれ以上のCPSsを含むか、またはそれらからなり得る。例えば、腎細胞癌の予測に用いられるCPSsは、その群から選ばれる少なくとも2、4、6、8、10、12、14、16、18または20のCPSsを含むか、またはそれらからなり得る。他の例としては、診断に用いられる腎細胞癌疾患遺伝子は、(1)CPS1、CPS3、CPS4、CPS6、CPS18、CPS38、CPS53、CPS261、CPS264およびCPS267からなる群から選ばれる少なくとも1、2、3、4、5、6、7、8、9または10のCPSs、および/または(2)CPS255、CPS256、CPS257、CPS258、CPS259、CPS260、CPS262、CPS263、CPS265およびCPS266からなる群から選ばれる少なくとも1、2、3、4、5、6、7、8、9または10のCPSsを含み得る。
さらに他の好ましい具体例として、腎細胞癌なしに対する腎細胞癌の予測に用いられる腎細胞癌疾患遺伝子は、CD44、KIAA0410、MARCO、MAP3K8、NSP−CL、PIP5K1C、NRG1、RAB31、LGALS3、MEF2D、ITGA7、LHFPL2、ETS2、KHSRP、ENIGMA、UNK_AF038187、RAB13、TLR2、T54およびDUSP6からなる群から選ばれる一つまたはそれ以上の遺伝子を含むか、またはそれらからなり得る。例えば、予測に用いられる腎細胞癌疾患遺伝子は、その群から選ばれる少なくとも2、4、6、8、10、12、14、16、18または20の遺伝子を含むか、またはそれらからなり得る。
さらに他の好ましい具体例として、CPSs1,3,4,5,6,7,9,10,11,16,28,31,268,264,279,280,281,282,283および284からなる群から選ばれる一つまたはそれ以上のCPSsを含むか、またはそれらからなり得る。例えば、予測に用いられるCPSsは、その群から選ばれる少なくとも2、4、6、8、10、12、14、16、18または20のCPSsを含むか、またはそれらからなり得る。
他の好ましい具体例としては、腎細胞癌、および/または前立腺癌および頭部/頸部癌のような他の固形腫瘍の予測に用いられる、腎細胞癌疾患遺伝子は、CD44、CRADD、CCRL2、KIAA0837、KIAA0707、KIAA1113、EREG、UNK_AL050119、PPARD、CTSL、ATP2B1、UNK_AF052115、MITF、STAT3、KIAA0410、TPD52L2、UNK_AI732885、MARCO、LOC64116およびPDNP2からなる群から選ばれる一つまたはそれ以上の遺伝子を含むか、またはそれらからなり得る。例えば、予測に用いられる腎細胞癌疾患遺伝子は、その群から選ばれる少なくとも2、4、6、8、10、12、14、16、18または20の遺伝子を含むか、またはそれらからなり得る。
さらに他の好ましい具体例として、腎細胞癌、および/または前立腺癌および頭部/頸部癌のような他の固形腫瘍の予測に用いられる、CPSsは、CPSs17,31,37,50,59,64,69,71,264、268,269,270,271,272,273,274,275,276,277および278からなる群から選ばれる一つまたはそれ以上のCPSsを含むか、またはそれらからなり得る。例えば、予測に用いられるCPSsは、その群から選ばれる少なくとも2、4、6、8、10、12、14、16、18または20のCPSsを含むか、またはそれらからなり得る。
一つの具体例として、固形腫瘍なしに対する固形腫瘍の予測に用いられる腎細胞癌疾患遺伝子は、NUMA1、CXCR4、IL10RA、M9、FAU、BRF2、RPS6、EEF1A2、BAG5、AKR1B1、UNK_AL022721、C1QBP、DKZP586E0820、NONO、PSMD3、UNK_N74607、UNK_AI743507、MAPKAPK5およびUNK_U79297からなる群から選ばれる一つまたはそれ以上の遺伝子を含むか、またはそれらからなり得る。例えば、予測に用いられる腎細胞癌疾患遺伝子は、その群から選ばれる少なくとも2、4、6、8、10、12、14、16、18または20の遺伝子を含むか、またはそれらからなり得る。
他の具体例として、固形腫瘍なしに対する固形腫瘍の予測に用いられるCPSsは、CPSs258、285、107、286、287、256、288、255、289、259、290、266、291、292、265、131、293、294および295からなる群から選ばれる一つまたはそれ以上のCPSsを含むか、またはそれらからなり得る。例えば、予測に用いられるCPSsは、その群から選ばれる少なくとも2、4、6、8、10、12、14、16、18または20のCPSsを含むか、またはそれらからなり得る。
発現プロフィールの比較はまた、整列したDNAクローンの定量的ハイブリダイゼーション、遺伝子発現の連続分析(SAGE)技術、または転写画像化ツールまたはGEMTOOLS遺伝子発現分析プログラム(Incyte Pharmaceuticals)またはジーンコーリングおよび定量的発現分析技術(Curagen)のような電子分析に基づいて実行され得る。パターン認識プログラムのようなアルゴリズムは、腎細胞癌疾患遺伝子の発現プロフィールを基準の発現プロフィールと比較するために用いられ得る。
E.加重多数決アルゴリズムを用いた腎細胞癌および他の固形腫瘍の予測
本発明のある側面に従うと、加重多数決アルゴリズムは、診断中のヒトの腎細胞癌の疾患遺伝子の同じセットの発現プロフィールを、疾患に罹患していないヒト、既知の腎細胞癌または他の固形腫瘍の患者における腎細胞癌の疾患遺伝子の同じセットの発現プロフィールと比較するために用いられる。加重多数決アルゴリズムは、T.R.Golubら、Science、286:531−537(1999)、およびD.K.Slonimら、Procs of the Fourth Annual International Conference on Computational Morecular Biology、東京、日本、4月8−11、p263−272(2000)に」記述されている。そのアルゴリズムは、二重または多重の分析を伴い得る。遺伝子クラスター2ソフトウェアのような多重分析ソフトウェアは、MIT Center for Genome Research at Whitehead Instituteから入手できる。そのアルゴリズムは、診断中のヒトを、少なくとも二つのクラスの内の一つに割り振ることができる。
アルゴリズムの一つの形態の下で、診断すべきヒトを、二つのクラス(クラス0およびクラス1と呼ばれる)に割り振る。例えば、クラス0は疾患に罹患していないヒトを表してそれからなっていて良く、クラス1は腎細胞癌患者を表してそれからなっていて良い。腎細胞癌疾患遺伝子のセットは、クラス予測因子(分類子)を作るために選別される。クラス予測因子中の各々の遺伝子は、二つのクラス(クラス0およびクラス1)のうち一つについて加重した診断を割り当てる。遺伝子「g」の診断は、vg=ag(xg−bg)として定義され、式中ag=P(g,c)は、遺伝子「g」の発現レベルおよびクラス区分の間の相関を反映し、bg=[x0(g)+x1(g)]/2は、クラス0およびクラス1における遺伝子「g」の発現レベルの平均対数の平均であり、xgはテスト試料における遺伝子「g」の発現レベルの正規化した対数を表す。正のvgはクラス0についての診断を示し、負のvgはクラス0についての診断を示す。V0は全ての正の診断の和を意味し、V1は負の診断の和の絶対値を意味する。予測強度PSは、PS=(V0−V1)/(V0+V1)として定義される。
クロスバリデーションは、加重多数決アルゴリズムの下で作られた、クラス予測の精度を評価するために用いられ得る。簡潔に言うと、近隣者分析の下で腎細胞癌疾患遺伝子を同定するために用いられた試料は留められる。クラス予測因子は、残りの試料に基づいて作成され、その後留められた試料のクラスを予測するために用いられる。この過程は、近隣者分析に用いられた各々の試料について反復され得る。異なる腎細胞癌疾患遺伝子を含むクラス予測因子は、クロスバリデーション過程を用いて評価することができ、最も正確な予測ができる最良のクラス予測因子が同定され得る。それに加えて、適当な予測強度(PS)最低基準は、累積クロスバリデーション過誤率を予測強度に対してプロットすることによって評価し得る。
一つの具体例として、テスト試料がクラス0またはクラス1に属するという正の予測は、テスト試料についてのPSの絶対値が0.3未満である場合になされ得る。0.1または0,2未満のような、他のPSの最低基準もまたなされ得る。
他の具体例として、クラス予測因子または分類子は、近隣者分析の下で同定された腎細胞癌疾患遺伝子からなる。これら腎細胞癌疾患遺伝子の半分は、最大のP(g,c)スコアを有し、他方の半分は最大の−P(g,c)スコアを有する。数字nは、クラス予測因子を定義する上で唯一の自由な変数である。
本明細書の小節Gは、腎細胞癌疾患遺伝子の確立およびトレーニングの詳細な例を記述している。
このましい具体例として、クラス予測因子は、EEF1A2、TLR2、BRF2、LGALS3、SNRPG、DKFZP586E1621、NUMA1、SOD2、AKR1B1、DUSP6、SMARCE1、KIAA0669、MSF、IL1RN、PTMA、KIAA0410、PSMD3、T54、C1QBPおよびOSR1から選ばれる、少なくとも2、4、6、8、10、12、14、16、18または20の遺伝子を含むか、またはそれらからなる。例えば、2遺伝子クラス予測は、TLR2およびEEF1A2からなっていてよい。4遺伝子クラス予測は、TLR2、LGALS3、EEF1A2およびBRF2からなっていてよい。6遺伝子クラス予測は、TLR2、LGALS3、DKFZP586E1621、EEF1A2、BRF2およびSNRPGからなっていてよい。8遺伝子クラス予測は、TLR2、LGALS3、DKFZP586E1621、SOD2、EEF1A2、BRF2、SNRPGおよびNUMA1からなっていてよい。10遺伝子クラス予測は、TLR2、LGALS3、DKFZP586E1621、SOD2、DUSP6、EEF1A2、BRF2、SNRPG、NUMA1およびAKR1B1からなっていてよい。12遺伝子クラス予測は、TLR2、LGALS3、DKFZP586E1621、SOD2、DUSP6、KIAA0669、EEF1A2、BRF2、SNRPG、NUMA1、AKR1B1およびSMARCE1からなっていてよい。14遺伝子クラス予測は、TLR2、LGALS3、DKFZP586E1621、SOD2、DUSP6、KIAA0669、IL1RN、EEF1A2、BRF2、SNRPG、NUMA1、AKR1B1、SMARCE1およびMSFからなっていてよい。16遺伝子クラス予測は、TLR2、LGALS3、DKFZP586E1621、SOD2、DUSP6、KIAA0669、IL1RN、KIAA0410、EEF1A2、BRF2、SNRPG、NUMA1、AKR1B1、SMARCE1、MSFおよびPTMAからなっていてよい。18遺伝子クラス予測は、TLR2、LGALS3、DKFZP586E1621、SOD2、DUSP6、KIAA0669、IL1RN、KIAA0410、T54、EEF1A2、BRF2、SNRPG、NUMA1、AKR1B1、SMARCE1、MSF、PTMAおよびPSMD3からなっていてよい。最後に、20遺伝子クラス予測は、EEF1A2、TLR2、BRF2、LGALS3、SNRPG、DKFZP586E1621、NUMA1、SOD2、AKR1B1、DUSP6、SMARCE1、KIAA0669、MSF、IL1RN、PTMA、KIAA0410、PSMD3、T54、C1QBPおよびOSR1からなる。
他の好ましい具体例として、クラス予測因子は、(1)TLR2、LGALS3、DKFZP586E1621、SOD2、DUSP6、KIAA0669、IL1RN、KIAA0410、T54およびOSR1からなる群から選ばれる少なくとも1、2、3、4、5、6、7、8、9または10の遺伝子、および(2)EEF1A2、BRF2、SNRPGNUMA1、AKR1B1、SMARCE1、MSF、PTMA、PSMD3およびC1QBPからなる群から選ばれる少なくとも1、2、3、4、5、6、7、8、9または10の遺伝子を含む。
さらに他の好ましい具体例として、クラス予測因子は、CD44、KIAA0410、MARCO、MAP3K8、NSP−CL、PIP5K1C、NRG1、RAB31、LGALS3、MEF2D、ITGA7、LHFPL2、ETS2、KHSRP、ENIGMA、UNK_AF038187、RAB13、TLR2、T54およびDUSP6からなる群から選ばれる、2、4、6、8、10、12、14、16、18または20の遺伝子を含むか、またはそれらからなる。
他の一層好ましい具体例として、クラス予測因子は、CD44、CRADD、CCRL2、KIAA0837、KIAA0707、KIAA1113、EREG、UNK_AL050119、PPARD、CTSL、ATP2B1、UNK_AF052115、MITF、STAT3、KIAA0410、TPD52L2、UNK_AI732885、MARCO、LOC64116およびPDNP2からなる群から選ばれる、2、4、6、8、10、12、14、16、18または20の遺伝子を含むか、またはそれらからなる。この具体例のクラス予測因子は、腎細胞癌、前立腺癌、頭部/頸部癌および疾患なしを予測するために用いられ得る。
さらに他の一層好ましい具体例として、クラス予測因子は、NUMA1、CXCR4、IL10RA、M9、FAU、BRF2、RPS6、EEF1A2、BAG5、AKR1B1、UNK_AL022721、C1QBP、DKZP586E0820、NONO、PSMD3、UNK_N74607、UNK_AI743507、MAPKAPK5およびUNK_U79297からなる群から選ばれる、2、4、6、8、10、12、14、16、18または20の遺伝子を含むか、またはそれらからなる。この具体例のクラス予測因子は、特定のタイプの固形腫瘍に関わらず、固形腫瘍なしに対して固形腫瘍を予測するために用いられ得る。この具体例において予測可能な固形腫瘍には、腎細胞癌、前立腺癌および頭部/頸部癌を含む。
一つの具体例として、疾患に罹患していないヒト、または既知の腎細胞癌または固形腫瘍の患者に由来する発現レベルのような、基準の腎細胞癌疾患遺伝子の発現レベルは、データーベースに蓄積され、容易に検索できる。他の具体例として、様々な遺伝子の発現プロフィールの間の比較は、コンピューターシステムを用いるように、電子的に実行される。コンピューターシステムは、比較すべき発現プロフィールを表すデータを貯蔵ずるメモリーと結合した処理装置を含む。好ましくは、メモリーは、読み込めると共に書き換え可能である。メモリーに貯蔵された発現データは、変更され、検索され、他の方法で扱われ得る。メモリーはまた、貯蔵した発現プロフィールを処理装置に比較させることのできる、一つまたはそれ以上のプログラムも貯蔵している。例えば、プログラムは、加重多数決アルゴリズムを実行できる可能性がある。処理装置はまた、ポリヌクレオチドアレースキャナーに結合していて良く、スキャナーからのシグナルを受け取ることができる。
他の具体例として、信頼範囲は、予測の精度を最良にし、偽陽性および偽陰性の結果を最小限にするために構築される。正確に診断された患者および正確に診断されなかった疾患なしの個体の蓄積したプールについて収集した、平均信頼スコアが算出でき、診断上問題の特定の予測遺伝子セットについて、値の参考範囲が報告され得る。
F.他の出願
本発明の体系的な遺伝子発現分析は、腎細胞癌および/または他の固形腫瘍の異なる病期、進行、治療において単離された、末梢血試料において特異的に発現している遺伝子を同定するために用いられ得る。そのようにして同定された遺伝子は、腎細胞癌および/または他の固形腫瘍の病期、進行、治療をモニターする分子マーカーである。そのようにして同定された遺伝子はまた、腎細胞癌または他の固形腫瘍に対する治療の有効性を評価するための代用的なマーカーとしても用いられ得る。
腎細胞癌または他の固形腫瘍に関する臨床的な試みは、治療に対する患者の非常に変化に富む反応である。薬理遺伝子学の基本的概念は、患者の利用可能な治療選択肢に関する遺伝子型を理解し、その患者に対する最も適切な選択肢を個別に扱うことである。腎細胞癌および/または他の固形腫瘍患者の異なるクラスは、施すべき治療法に対する異なる反応性を基にして作成され得る。これらのクラスにおいて特異的に発現している遺伝子は、包括的な遺伝子発現分析を用いて同定し得る。そのようにして同定された遺伝子は、特定の患者が所定の治療法に良く反応するかまたはあまり反応しないかを予測するための、予測マーカーとして役に立ち得る。治療に対して好都合な結果が得られると予想される患者については、治療の毒性を最小限にするための努力を考慮して良く、一方治療に反応しないと予測される患者については、他の治療法または実験的養生法による治療が用いられ得る。
本発明はまた、腎細胞癌疾患遺伝子をコード化する発現ベクターを熟考している。腎細胞癌疾患遺伝子は、腎細胞癌腫瘍細胞において低発現であって良い。発現ベクターを患者に導入することによって、標的遺伝子の異常な発現が是正される可能性がある。
適当な発現ベクターおよび遺伝子輸送ベクターは、当該分野においてよく知られている。好ましくは、これらのベクターは、レトロウィルス、レンチウィルス、アデノウィルス、アデノ関連ウィルス(AAV)、ヘルペスウィルスまたはαウィルスベクターのような、ウィルスベクターである。これらウィルスベクターはまた、アストロウィルス、コロナウィルス、オルトミクソウィルス、パポーバウィルス、パラミクソウィルス、パルボウィルス、ピコルナウィルス、ポックスウィルスまたはトガウィルスベクターであってもよい。
発現した構築物の輸送は、上で述べたウィルスベクターに限定されない。他の輸送方法もまた利用され得る。これらの方法には、核酸発現ベクター、不活化したアデノウィルスと結合したまたは結合していないポリカチオン性縮合DNA、リガンド結合、遺伝子ガン、電離放射線、核酸電荷中和または細胞膜との融合を含む。裸のDNAを用いる実験的方法は、当該分野において知られている。取り込みの効率は、生物分解性のラテックスビードを用いて向上している可能性がある。この方法は、ビードを疎水性を高めるように処理することによって、さらに改良され得る。リポソームを基にした方法もまた用いられ得る。
それに加えて、本発明は、重要な腎細胞癌疾患遺伝子にアンチセンスである配列を発現させることのできる発現ベクターのことを熟考している。重要な腎細胞癌疾患遺伝子は、腎細胞癌または他の固形腫瘍において過剰発現していて良い。これらの患者にアンチセンス発現ベクターを導入することによって、標的遺伝子の異常な発現が是正される可能性がある。
「アンチセンス」ポリヌクレオチドは、タンパク質をコード化する「センス」ポリヌクレオチドに相補的なヌクレオチド配列を含む。アンチセンスポリヌクレオチドは、水素結合を介して、センスポリヌクレオチドに結合し得る。アンチセンスポリヌクレオチドは、標的遺伝子のコード鎖全体に相補的であって良く、またはそれらの一部に相補的であっても良い。一つの具体例として、アンチセンスポリヌクレオチド分子は、標的遺伝子のコード鎖中の「非コード領域」にアンチセンスである。
アンチセンスポリヌクレオチドは、WatsonおよびCrickの塩基対の法則に従って構築され得る。それらは、標的遺伝子の一部のみにアンチセンスであるオリゴヌクレオチドであって良い。アンチセンスポリヌクレオチドは、例えば長さが5、10、15、20、25、30、35、40、45または50ヌクレオチドであって良い。アンチセンスポリヌクレオチドは、当業者に評価されているような、化学合成および酵素的ライゲーション反応を用いて構築され得る。例えば、アンチセンスポリヌクレオチド(例えばアンチセンスオリゴヌクレオチド)は、自然に発生するヌクレオチド、または分子の生物学的安定性を高め、アンチセンスおよびセンスポリヌクレオチドの間で形成される二本鎖の物理的安定性を高めるように構築した多様な修飾を受けたヌクレオチドを用いて、化学的に合成し得る。あるいは、アンチセンスポリヌクレオチドは、ポリヌクレオチドがアンチセンス方向でサブクローニングする発現ベクターを用いて、生物学的に生成し得る(すなわち、挿入されたポリヌクレオチドから転写されるRNAが重要な標的ポリヌクレオチドにアンチセンス方向である。)。
アンチセンスポリヌクレオチドは、標的遺伝子の細胞内のmRNAおよび/またはゲノムDNAに、ハイブリダイゼーションまたは結合し、それによって標的遺伝子の発現を抑制するように、患者に投薬するか、または元の場所に適用され得る。ハイブリダイゼーションは、従来のヌクレオチドの相補性によって、安定な二本鎖を形成し得る。アンチセンスポリヌクレオチドを投薬するための経路の例には、組織の部位への直接注入を含む。アンチセンスポリヌクレオチドはまた、最初に修飾され、その後全身に投薬され得る。例えば、全身投薬のために、アンチセンス分子は、選別された細胞表面に発現している受容体または抗原に特異的に結合するように、修飾され得る。適当な修飾には、アンチセンスポリヌクレオチドの、細胞表面の受容体または抗原に結合するペプチドまたは抗体への結合を含む。それに加えて、アンチセンスポリヌクレオチドは、ベクターを用いて細胞に輸送し得る。アンチセンス分子の十分な細胞内濃度を達成するために、強力なpolIIまたはpolIIIプロモーターがベクターにおいて用いられる可能性がある。
一つの具体例として、アンチセンスポリヌクレオチドは、αアノマーポリヌクレオチドである。αアノマーポリヌクレオチド分子は、通常のβユニットと反対に、鎖が平行に走行する相補的RNAと、特定の二本鎖ハイブリッドを形成する。アンチセンスポリヌクレオチド分子はまた、2'−o−メチルリボヌクレオチドまたはキメラRNA−DNA類似物を含む。
他の具体例として、アンチセンスポリヌクレオチドは、リボザイムである。リボザイムは、相補的な領域を有する、mRNAのような、一本鎖ポリヌクレオチドを解離できるリボヌクレアーゼ活性を有する、触媒活性のあるRNAである。従って、リボザイムは、発現を抑制するために、標的遺伝子のmRNA転写産物を触媒活性で解離するために用いて良い。標的遺伝子から転写されるmRNAは、RNA分子のプールから、特定のリボヌクレアーゼ活性を有する触媒活性のあるRNAを選別するために用いられ得る。あるいは、標的遺伝子の発現は、調節領域に相補的なヌクレオチド配列(例えばプロモーターおよび/またはエンハンサー)を用いることによって、抑制し得る。これらのヌクレオチド配列は、標的細胞中の遺伝子の転写を阻害する、三重らせん構造を形成し得る。
標的遺伝子の発現はまた、RNA干渉(「RNAi」)を用いて抑制され得る。これは、転写後遺伝子サイレンシング(「PTGS」)において用いられる技術であり、標的となった遺伝子の活性が特異的に失われる。RNAiは、多くの側面において植物におけるPTGSに類似しており、トリパノソーマ、ヒドラ、プラナリア、線虫およびショウジョウバエ(Drosophila melanogaster)を含む、多くの無脊椎動物において検出された。それは輸送可能な要素の流動化および抗ウィルス状態形成の調整に含まれる可能性がある。哺乳類の系統におけるRNAiは、PCT出願WO00/63364において開示される。一つの具体例として、標的遺伝子と相同な、少なくとも約21ヌクレオチドのdsRNAは細胞に導入される。
腎細胞癌疾患遺伝子によってコード化されるポリペプチドに対する抗体はまた、腎細胞癌疾患遺伝子の機能に影響を与えるために、調製されて患者に投薬され得る。一つの具体例として、抗体は、標的遺伝子の活性の少なくとも25%を低下させ得る。好ましくは、抗体は、対応する遺伝子の活性の少なくとも約50%を低下させ得る。非常に好ましくは、抗体は、標的遺伝子の活性の少なくとも約95−100%を低下させ得る。
本発明の抗体または発現ベクターを含む医薬組成物が作成し得る。医薬組成物はまた、医薬上許容されるキャリアを含む。本明細書で用いられている、「医薬上許容されるキャリア」は、全ての溶媒、溶解剤、充填剤、安定剤、結合剤、吸収剤、塩基、緩衝試薬、潤滑剤、規制された解離媒介剤、希釈剤、乳化剤、湿潤剤、吸収剤、分散媒、被覆剤、抗菌剤または抗真菌剤、等張液および吸収遅延剤などを含むことを意図している。医薬活性のある基質に対して、そのような媒質および試薬の利用は、当該分野においてよく知られている。あらゆる従来の媒質または試薬が活性を有する化合物と不和性である範囲にあることを除いて、組成物においてそれらを利用することが熟考されている。補足の試薬がまた、組成物に組み込まれ得る。
医薬組成物は、意図された投薬経路と融和性であるように、処方され得る。投薬経路の例には、例えば静脈内、皮内、皮下のような非経口、経口(例えば吸入)、経皮(局所)、経粘膜および直腸投薬を含む。非経口、経皮または皮下の適用に用いられる溶液または懸濁液には次の成分を含む:注射用水のような無菌の希釈剤、塩溶液、不揮発性の油脂、ポリエチレングリコール、グリセリン;プロピレングリコールまたは他の合成溶媒;ベンジルアルコールまたはメチルパラベンのような抗菌薬;アスコルビン酸または重硫酸ナトリウムのような抗酸化剤;エチレンジアミンテトラ酢酸のようなキレート剤;酢酸、クエン酸またはリン酸のような緩衝剤および塩化ナトリウムまたはデキストロースのような張性調節薬。pHは、塩酸または水酸化ナトリウムのような酸または塩基によって調節し得る。非経口用調製は、アンプル、使い捨ての注射器またはガラスまたはプラスチック製の多容量の薬瓶中に封入し得る。
遺伝子治療または薬物治療の標的として用いられ得る適当な腎細胞癌疾患遺伝子の例には、DUSP6、DRD2、ABL1、GUK1、MAP2K3、BSG、PPARG、TNNT1、ERN1、C4A、CCR1、PPARD、PDXK、MMP9、PPP3CB、CHRNA4、C8FW、PDNP2、ALDH5A1およびGPR12を含むが、それだけに限定されない。他の例には、PBMCおよび腎細胞癌腫瘍組織両方において過剰発現または低発現している腎細胞癌疾患遺伝子を含む。
一つの具体例として、本発明は、一つまたはそれ以上のポリヌクレオチドを含むキットを提供し、各々の一つまたはそれ以上のポリヌクレオチドは、ストリンジェントな条件下で遺伝子表4から選ばれる遺伝子にハイブリダイゼーション可能である。本発明のあらゆるプライマー/プローブ、またはそれらの相補体が、キット中に含まれ得る。ポリヌクレオチドは、蛍光、放射能または他の検出可能な部分によって標識し得る。一例として、一つまたはそれ以上のポリヌクレオチドは、薬瓶、管、ボトルまたは他の保存方法において保存される。他の例として、一つまたはそれ以上のポリヌクレオチドは、固体の土台に安定に結合している。核酸ハイブリダイゼーションは、固体の土台上で直接実行され得る。さらに他の例として、キットは、少なくとも2、3、4、5、10、15、20またはそれ以上のポリヌクレオチドを含み、各々の異なるポリヌクレオチドは、ストリンジェントな条件下で、遺伝子表4から選ばれる異なるそれぞれの遺伝子とハイブリダイズすることができる。
他の具体例として、本発明のキットは、遺伝子表4から選ばれる遺伝子によってコード化されるポリペプチドに結合できる一つまたはそれ以上の抗体を含む。抗体は、標識されても良く、または標識されなくても良い。本発明のあらゆる抗体は、キットに含まれ得る。一例として、キットはまた、二次抗体、対照群または酵素の基質のような他の免疫検出試薬を含む。他の例として、抗体は、一つまたはそれ以上の容器に含まれる。さらに他の例として、抗体は、フィルム、膜、カラム基質またはマイクロ滴定プレートウェルのような固体の土台に安定に結合している。免疫アッセイは、固体の土台上で直接実行され得る。さらに一層他の例として、キットは、少なくとも2、3、4、5、10、15、20またはそれ以上の異なる抗体を含み、各々の異なる抗体は、遺伝子表4から選ばれる異なるそれぞれの遺伝子によってコード化されるポリペプチドに結合することができる。
上で記述した具体例および次の実施例が説明のために与えられているが、本発明の範囲を限定するものではないことを理解すべきである。本発明の範囲内における、様々な変更および修正が可能であることが、本明細書から当業者には明らかになるであろう。
G.実施例
実施例1.RNAの単離および標識したマイクロアレー標的の調製
臨床試験に由来するPBMCを、標準的手順に従ってCPT管に収集した全血試料(8mL)から単離した。全ての疾患なしおよび腎細胞癌血液試料を輸送するか、または処理前に一晩中貯蔵した。PBMCをFicoll勾配以上で精製し、PBSで2回洗浄し、数えた。全RNAを、RNeasyミニキット(Qiagen、Valencia、CA)を用いて、PBMCペレットから単離した。オリゴヌクレオチドアレーについての標識した標的を、Lockhartら、Nature Biotechnology、14:1675−80(1996)に記述されている手順の修正を用いて調製した。2μgの全RNAを、5'末端にT7DNAポリメラーゼプロモーターを含むオリゴ−dTプライマーを用いて起爆することによって、cDNAに変換した。cDNAは、T7DNAポリメラーゼキット(Ambion、Woodlands、TX)およびビオチニル化CTPおよびUTP(Enzo)を用いた、試験管内の転写のための鋳型として用いられた。標識したcRNAを、40mMのトリス酢酸pH8.0、100mM酢酸カリウム、30mM酢酸マグネシウム中で、35分間94℃で、最終体積40μlで分解した。
個別の腎細胞癌および疾患なしの試料を、HgU95A遺伝子チップ(Affymetrix)にハイブリダイゼーションした。試料をプールしなかった。45の腎細胞癌患者および20の疾患なしのボランティアが、本研究に関わった。腎細胞癌患者の腫瘍を、Kovacsら、J.Pathol、183:131−133(1997)に記述されている腎細胞癌のHeidelberg分類を用いて、特定の腎細胞癌サブタイプとして病理組織学的に分類した。45の腎細胞癌腫瘍試料のうち、24の試料を従来の(明細胞)癌として分類し、1の試料を顆粒細胞癌と分類し、3の試料を乳頭癌として分類し、7の試料を混合サブタイプと分類し、10の腫瘍試料を不明と分類した。
標識した標的10μgを、ニシンの精子DNA100μg/mlおよびセチル化した50μg/mlを含む1xMES緩衝剤中で希釈した。アレーを互いに標準化し、オリゴヌクレオチドアレーの感受性を評価するために、試験管内合成した11の細菌遺伝子の転写産物は、Hillら、Science、290:809−812(2000)に記述されているような、各々のハイブリダイゼーション反応に含まれた。これらの転写産物の存在量は、全転写産物あたりの対照群転写産物の数に関して述べると、1:300000(3ppm)から1:1000(1000ppm)まで変動した。これら対照群転写産物からのシグナル応答によって決定されるような、アレーの検出の感受性は、1:300000および1:100000コピー/100万の間で変動した。標識したプローブを99℃で5分間、その後45℃で5分間変性させ、12500以上のヒト遺伝子(HgU95A、Affymetrix)からなるオリゴヌクレオチドアレーにハイブリダイゼーションした。アレーを16時間45℃でハイブリダイゼーションした。ハイブリダイゼーション緩衝剤は、100mMのMES、1M[Na+]、20mMのEDTAおよび0.01%ツゥイーン20からなる。ハイブリダイゼーション後、カートリッジを洗浄緩衝剤(6xSSPET)で徹底的に洗浄し、例えば3回10分間室温で洗浄した。これらのハイブリダイゼーションおよび洗浄の条件は、集合的に「核酸アレーハイブリダイゼーション条件」と呼ばれる。洗浄したカートリッジを、その後ストレプトアビジンと結合したフィコエリトリンで染色した。
12xMESのストックは、1.22MのMESおよび0.89M[Na+]を含む。1000mlについて、ストックは、MES遊離酸一水化物70.4g、MESナトリウム塩193.3gおよび分子生物学等級水800mlを混合し、体積を1000mlに調節することによって調製し得る。pHは6.5および6.7の間であるべきである。2xハイブリダイゼーション緩衝剤は、12xMESストック8.3ml、5Mの塩化ナトリウム17.7ml、0.5MのEDTA4.0mL、10%ツゥイーン20を0.1mLおよび水19.9mLを混合することによって調製し得る。6xSSPETは、0.9M塩化ナトリウム、60mMのNaH2PO4、6mMのEDTA、pH7.4および0.005%トライトンX−100を含む。いくつかの場合には、洗浄緩衝剤は、より厳密な洗浄緩衝剤に置き換えられて良い。1000mlの厳密な洗浄緩衝剤は、12xMESストック83.3ml、5M塩化ナトリウム5.2mL、10%ツゥイーン20を1.0mLおよび水910.5mLを混合することによって調製し得る。
実施例3.遺伝子発現データ分析
データ分析を、GENECHIP3.2ソフトウェア(Affymetrix)を用いた、未処理の蛍光強度値に基づいて実行された。GENECHIP3.2ソフトウェアは、特異的ハイブリダイゼーション強度値、またはアレー上に表された各々の転写産物についての「平均差異」と同様に、遺伝子が「存在しない」かまたは「存在する」かに関する可能性を算出するために、アルゴリズムを利用する。この算出に用いられるアルゴリズムは、Affymetrix Genechip Analysis Suite User Guide(Affymetrix)に記述されている。各々の転写についての「平均差異」は、Hillら、Science、290:809−812(2000)の手順に従った「度数」値に標準化した。これは、各々のチップ上の平均差異の値を、各々のハイブリダイゼーション溶液に加えられた、存在量が既知の11の対照群転写産物についての平均差異から構築された較正曲線に照会することによって達成された。この過程はまた、アレー間の標準化に供する。
特定の転写産物が、さらに次の基準を満たすかを評価した。一番目に、GENECHIP3.2ソフトウェアによって、全ての試料において「存在していない」と示された遺伝子を、分析から排除した。二番目に、アレー間の転写レベルの比較において、遺伝子が少なくともアレーの一つに存在していることが必要であった。三番目に、グループ間の転写レベルの比較について、スチューデントのt検定を、「度数」値において有意差(p<0.05)が存在する転写産物の部分集合を同定するために適用した。ある場合においては、統計的に有意な全ての遺伝子の部分集合にわたる、「度数」値における平均フォールドチェンジが2倍またはそれより大きいことを必要とする、四番目の基準もまた用いられた。
発現プロフィールの類似性に基づいた、管理されていない遺伝子および/またはアレーの階層クラスタリングを、Eisenら、Proc.Nat.Acad.Sci.、U.S.A.、95:14863−14868(1998)に記述されている手順を用いて実行された。最近隣者予測分析および管理されたクラスター分析を、Golubら、Science、286:531−537(1999)において説明された尺度を用いて実行された。階層クラスタリングおよび最近隣者予測分析について、データを対数変形し、平均値が0で、分散が1になるように標準化した。スチューデントのt検定は、疾患なしのPBMC発現プロフィールを腎細胞癌PBMCプロフィールと比較するために用いられた。その比較において、p値<0.05は、統計的有意性を示すために用いられた。
様々な組織における発現プロフィールはまた、BioExpressデーターベース(GeneLogic、Gaitherburg MD)からアクセスおよびダウンロードし得る。フォールドチェンジ分析および電子的ノーザンブロットを含めた、GeneLogic GX2000ソフトウェアを基にした分析ツールは、フォールドチェンジおよび発現値の分布を算出するために利用されて良く、異なる試料についての発現プロフィールが、階層クラスタリングパッケージ(Eisenら、Proc.Nat.Acad.Sci.U.S.A.、95:14863−14868(1998))におけるさらなる分析のための発現分析ツールを用いて転送され得る。
k研究法は、相関尺度(P(g,c)=μ1−μ2/σ1+σ2)を用いた、真実で無作為に並び替えたデータの近隣者分析を実行するために用いられ、式中gは遺伝子の発現ベクターであり、cはクラスベクターであり、μ1およびσ1はクラス1中の遺伝子の平均発現レベルおよび標準偏差を定義し、μ2およびσ2はクラス2中の遺伝子の平均発現レベルおよび標準偏差を定義している。正しく定義されたクラス(腎細胞癌対疾患なし)の246の最も統計的に有意にアップレギュレーションされた遺伝子についての相関の尺度は、無作為に並び替えたクラス区分においてみられる相関の最も統計的に有意な尺度と比較された。腎細胞癌および疾患なしのクラスについてみられる距離測定と比較した、100の無作為に並び替えたクラスのトップの1%、5%および中央値距離測定をプロットした。図1は、本発明で同定された腎細胞癌疾患遺伝子の統計的な立証を描写している。
実施例4.末梢血における腎細胞癌疾患遺伝子の同定
表6および7は、遺伝子が存在すると考えられる試料の数(#Present)によってランクを付した、184の腎細胞癌疾患遺伝子を列挙している。184の腎細胞癌疾患遺伝子各々についてのスチューデントのt検定のp値(「T検定(p値)」)はまた、表6に記載している。「存在」のコールを、GENECHIP3.2ソフトウェアを用い、遺伝子シグナルの強度をバックグラウンドと比較することに基づいて、転写物が試料において検出されるかを評価することによって、算出した。GeneChip(商標登録)発現分析技術マニュアル、701021 Rev3(1999−2002 Affymetrix社)参照。
各々の転写産物についての「平均差異」値は、各々のハイブリダイゼーション溶液に加えられた存在量が既知である、11の対照群のcRNAについての平均差異が、包括的な較正曲線を作成するために用いられるところの、調整した度数標準化法を用いて、「度数」値に標準化された。出典明示によって本明細書の一部とした、Hillら、Genome Biol.、2(12):リサーチ0055.1−0055.13(2001)を参照のこと。この較正は、その後全ての転写産物についての平均差異値を度数評価に変換するために用いられ、それだけには限定されないが、1:300000(すなわち3ppm)から1:1000(1000ppm)まで変動し得る、100万あたりの要素(ppm)の単位で示された。
20の疾患なしのPBMCのRNA試料および45の腎細胞癌のPBMCのRNA試料の発現プロフィール分析は、HgU95Aチップ上の12626の転写産物のうちの、5249の転写産物がさらなる分析のための最初の基準を満たすことを明らかにした。最初の基準は、(1)少なくとも一つの存在している信号があること、および(2)少なくとも一つの度数が10ppmを超えていることであった。平均して、4023の転写産物が45の腎細胞癌のPBMCにおいて「存在している」として検出され、一方4254の発現した転写産物が20の疾患なしのPBMCにおいて「存在している」として検出された。
両群の試料(45の腎細胞癌、20の疾患なしまたは正常PBMC)全てにわたる、各々の5249の最初の転写産物のレベルの変動パーセント率(すなわち、平均度数/S.D.X100)を算出した(%COV)。転写産物を、腎細胞癌試料全てにわたって最も変動しない遺伝子がRCC COVランク=1を受け取り、腎細胞癌試料全てにわたって最も変動する遺伝子がRCC COVランク=5249を受け取るようにランク付けした。この過程を、20の疾患なしの(正常の)PBNC試料についても反復し、正常COVランクを同様の方法で算出した、すなわち、腎細胞癌なしの試料全てにわたって最も変動しない遺伝子がNormCOVランク=1を受け取り、腎細胞癌なし試料全てにわたって最も変動する遺伝子がNormCOVランク=5249を受け取った。それに加えて、フォールドチェンジを、腎細胞癌平均度数/正常平均度数として算出し、2.0と同数またはそれより大きい数を腎細胞癌PBMCにおいて誘導される転写産物を表しているとみなした。5249の転写産物の各々のフォールドチェンジは、表6に記述している。10ppmより高いレベルを有する試料の数(「♯Freq>10」)もまた、表6中に各々の転写産物について呈示している。その上、45の腎細胞癌全てにわたって存在すると信号が出され(「♯Present RCC」)、20の正常全てにわたって存在すると信号が出され(「♯Present Normal」)、45の腎細胞癌全てにわたって10ppmより高いレベルで存在し(「♯Freq>10RCC」)、20の正常全てにわたって10ppmより高いレベルで存在し(「♯Freq>10Norm」)試料の数が、表6および7に報告されている。
フォールドチェンジ分析およびスチューデントのt検定(両側分布;分散の等しくない二つの試料)は、腎細胞癌のPBMCおよび疾患なしのPBMCの間で特異的に発現された転写産物を同定した。表6および7に示された184の腎細胞癌疾患遺伝子の転写産物のレベルは、群の間のt検定において0.001以下の未調節のp値を有する、疾患なしおよび腎細胞癌のPBMCの間で、2倍またはそれ以上異なっていた。これらのうち、132の転写産物が、PBMC試料の少なくとも15%において発現していた(65のプロフィールのうち10またはそれ以上に存在する)。
その上、CPT精製した腎細胞癌PBMCペレットおよびCPT精製した疾患なしのPBMCペレットの発現プロフィールにおいて相違が観察される可能性を、単純に調査した。PBMC試料において測定された顆粒球、リンパ球および単球のレベルとの、各々の遺伝子の発現レベルについての相関係数を算出した。各々の遺伝子の発現の各々の細胞型のレベルとの相対的な相関関係は、腎細胞癌PBMCにおいて検出された疾患関連転写産物が、その細胞集団において過剰発現しているかを決定するためにランク付けされた。PBMC試料において測定された顆粒球、リンパ球および単球の絶対数との、各々の転写産物の相関の相対的なランク(最初のデータフィルターを通過する5249の転写産物のうちの)が得られた。これらの分析は、腎細胞癌患者のPBMCにおいて同定された大多数の疾患関連転写産物が、末梢血中の特定の細胞の副集団と単純に相関していないことを示している。
相関係数に基づいて試料および遺伝子を階層的に分類する、最初の管理されていないクラスター分析法は、最初のフィルター基準を通過する5249の転写産物を用いて実行された。図2は、発現した遺伝子の発現値を用いて、試料の関係の系統樹を描いている。腎細胞癌患者のPBMC発現プロフィールを白い棒で示し、疾患に罹患していないボランティアのPBMC発現プロフィールを黒い棒によって示した。系統樹は大多数の腎細胞癌PBMC(42/45)を単一の腎細胞癌特異的クラスターに分類し、一方疾患に罹患していないPBMCおよび腎細胞癌のPBMCの小さい部分集合(3/45)の発現パターンは別のクラスターを形成した。
表6aおよび7に記載された184の腎細胞癌疾患遺伝子の中に、トルライクレセプター2、ガレクチン3、IL−1受容体アンタゴニストおよび白血球の遊走に関わる水チャネルであるアクアポリン9を含めた、いくつかの炎症関係遺伝子が存在する。正常および腎細胞癌PBMCの間の、多くの他のサイトカイン、ケモカインおよびそれぞれの受容体のレベルが変化しないことは、特異的な、むしろ包括的なPBMCの活性化が、腎細胞癌末梢血における疾患のサインの一部を構成していることを示唆している。
腎細胞癌患者に由来するPBMCにおける有意な変化として検出された転写産物の実数は、全ての腎細胞癌のPBMCプロフィールにわたる有意な程度の変異を有する。これは、これらの転写産物のレベルが有意に正常のPBMCにおけるレベルと区別できるけれども、全ての腎細胞癌患者にわたるこれらの転写産物の発現には相対的な不均一性があったことを示す。これらの患者において結果及びフォローアップの臨床的指標が十分に測定されれば、腎細胞癌PBMC中のさらに有意に変異したこれら疾患関連転写産物の全てが、あらゆる臨床的反応のカテゴリーと相関しているかを決定することが非常に重要になるであろう。
実施例5.PBMC中の腎細胞癌疾患遺伝子分類セットの分子基盤の探査
腎細胞癌のPBMCにおける発現プロフィールを、腎細胞癌の原発腫瘍におけるプロフィールと比較した。これらの実験において、本研究の20の正常PBMCおよび45の腎細胞癌PBMCについての(標準曲線で正規化した度数よりもむしろ)平均差異を、57の正常腎生検材料および腎細胞癌腫瘍組織の生検材料の発現プロフィールにおいて検出された平均差異と共に、ジーンロジック社GLGC正規化アルゴリズムを用いて正規化した。正常の腎および原発性腎細胞癌腫瘍組織の発現プロフィールを、コンピューター上でバイオエクスプレスデーターベース(ジーンロジック社、Giathersburg MD)からダウンロードした。正常の対照群と比較して、腎細胞癌のPBMCおよび腎細胞癌の腫瘍組織両方において誘導される何らかの遺伝子を同定するために、165のアレーについて遺伝子発現値を、Eisenら、Proc,Nat.Acad.Sci.U.S.A.,95:14863−14868(1998)の方法に従ってクラスター形成させた。これらの分析において、遺伝子のみがクラスターにされ、記述されているアレーの最初の配列は、腎細胞癌の末梢血に存在する腎細胞癌腫瘍マーカーと一致した調節パターンをもつ一連の遺伝子を視覚的に検出するために保存されている。
腎細胞癌のPBMCの発現プロフィールをまた、生体外でPHAで刺激したPBMCにおけるプロフィールと比較した。これらの実験において、20の正常PBMCおよび45の腎細胞癌PBMCの発現プロフィールを、生体外で培養した未処理の(n=3)または6時間PHAで刺激したPBMCにおいて検出された発現プロフィールと比較した。度数を生成するために、標準曲線を用いた正規化を実行し、遺伝子の階層クラスタリングをその後実行した。
それに加えて、腎細胞癌のPBMCにおける発現プロフィールを、腎不全の非腎細胞癌患者のPBMCにおけるプロフィールと比較した。20の正常PBMCおよび45の腎細胞癌PBMCの平均差異を、コンピューター上でバイオエクスプレスデーターベース(ジーンロジック社、Giathersburg MD)からダウンロードした、8人の非腎細胞癌の腎不全患者のPBMCの発現プロフィールにおいて検出された平均差異と共に、ジーンロジック社GLGC正規化アルゴリズムを用いて正規化した。遺伝子の階層クラスタリングのみを、その後実行した。
その上、表6および7に記載した184の腎細胞癌の疾患遺伝子を、バイオエクスプレスデーターベース(ジーンロジック社、Giathersburg MD)からダウンロードしたプロフィールを用いて、正常の腎組織(n=60)と比較して、腎細胞癌腫瘍(n=40)において最も強くアップレギュレーションされる10の転写産物と比較した。腎細胞癌腫瘍組織および正常腎の間の発現において最も高い倍率差を有する、腎細胞癌腫瘍に特異的な転写産物は、正常および腎細胞癌のPBMCの間においては不変であり、分離された腎細胞癌腫瘍細胞は、腎細胞癌患者から単離されたPBMCにおいて同定された疾患関連転写産物に有意に寄与していないことを示唆している。
表6および7に記載した184の腎細胞癌の疾患遺伝子をまた、未刺激のCD4+T細胞(n=3の正常ドナー)、および生体外で培養液中の抗CD3抗体および抗CD28抗体で刺激されたCD4+T細胞(n=3の正常ドナー)の間で特異的に発現している遺伝子と比較した。刺激されたCD4+T細胞は、表7の最後のカラムで示されるように、腎細胞癌のPBMC中の疾患関連転写因子と同方向に(誘導されるかまたは抑制される)2倍以上変化した転写産物を有していた。
表6および7に記載した184の腎細胞癌の疾患遺伝子を、さらに非腎細胞癌の末期腎不全患者(n=9個体)由来のPBMC、および正常のボランティア(n=4個体)のPBMCの間で特異的に発現している遺伝子と比較した。これらのうち、腎不全患者由来のPBMCにおいて特異的に発現している9の転写産物はまた、表7の最後のカラムで示されるように、腎細胞癌のPBMC中の疾患関連転写因子であった。従って、表6および7に記載した184の腎細胞癌の疾患遺伝子は、生体外で測定した免疫応答(CD4+T細胞活性化)に一般に関わり、生体内でみられる腎障害に対する循環白血球の反応に関わるマーカーの部分集合を含む。本発明を何らかの特定の理論に制限することなく、これらの結果は、少なくとも腎細胞癌のPBMC中にみられる疾患関連遺伝子の部分集合の発現レベルが、腫瘍の存在に対する反応において、循環T細胞および/または他の白血球が活性化されることから生じる可能性があるという仮説を支持している。それに加えて、腎細胞癌のPBMCにおいて検出された疾患関連転写因子の他の部分集合の調節が、腎細胞癌患者の腎障害に対する反応における白血球発現プロフィールの変化によるものである可能性がある。
実施例6.末梢血細胞における遺伝子発現プロフィールを用いた腎細胞癌および腎細胞癌のない状態の分類
腎細胞癌疾患分類子を確立し、トレーニングするために、腎細胞癌のPBMCの発現パターンの70%(n=31)および疾患に罹患していないPBMCの発現パターンの70%(n=14)を無作為に選別し、トレーニングセットとして用いた。残りの腎細胞癌および疾患に罹患していないPBMCの発現パターンは、テストセットとして用いた。相対的クラス分離測定は、相関の程度を算出し、トレーニングセットの特徴的な分類ベクターと最も高く相関した発現レベルを有する遺伝子を順序づけるために用いた。この相関の程度は、平均発現値および分散からなる。
試料のテストセットの分類を、腎細胞癌または疾患に罹患していないPBMCに特徴的な、残りのPBMCの発現プロフィールを分類するために、加重多数決アルゴリズムを用いて実行した。この方法において、分類子セット中の各々の遺伝子の発現レベルは、試料の分類を決定する全ての予測強度に寄与する。この実施例における予測強度は、本質的に、一方のクラスまたは他方対する「診断」の数を示し、0(誤差範囲が狭い)および1(誤差範囲が広い)の間で予測されたクラスに合わせて変化し得ることを合わせて変化する。この予測方法の精度を定量化するために、信号が確実に作られ得る以上の予測強度水準として、0.3の値が課せられた。
この実施例において、全ての分類子遺伝子セットについての予測精度は、試料を確実に分類する0.3より大きい信号のパーセンテージとして定義される。この実施例において用いられるクラス予測因子には、(1)TLR2およびEEF1A2からなる2遺伝子クラス予測因子、(2)TLR2、LGALS3、EEF1A2およびBRF2からなる4遺伝子クラス予測因子、(3)TLR2、LGALS3、DNFZP586E1621、EEF1A2、BRF2およびSNRPGからなる6遺伝子クラス予測因子、(4)TLR2、LGALS3、DNFZP586E1621、SOD2、EEF1A2、BRF2、SNRPGおよびNUMA1からなる8遺伝子クラス予測因子、(5)TLR2、LGALS3、DNFZP586E1621、SOD2、DUSP6、EEF1A2、BRF2、SNRPG、NUMA1およびAKR1B1からなる10遺伝子クラス予測因子、(6)TLR2、LGALS3、DNFZP586E1621、SOD2、DUSP6、KIAA0669、EEF1A2、BRF2、SNRPG、NUMA1、AKR1B1およびSMARCE1からなる12遺伝子クラス予測因子、(7)TLR2、LGALS3、DNFZP586E1621、SOD2、DUSP6、KIAA0669、IL1RN、EEF1A2、BRF2、SNRPG、NUMA1、AKR1B1、SMARCE1およびMSFからなる14遺伝子クラス予測因子、(8)TLR2、LGALS3、DNFZP586E1621、SOD2、DUSP6、KIAA0669、IL1RN、KIAA0410、EEF1A2、BRF2、SNRPG、NUMA1、AKR1B1、SMARCE1、MSFおよびPTMAからなる16遺伝子クラス予測因子、(9)TLR2、LGALS3、DNFZP586E1621、SOD2、DUSP6、KIAA0669、IL1RN、KIAA0410、T54、EEF1A2、BRF2、SNRPG、NUMA1、AKR1B1、SMARCE1、MSF、PTMAおよびPSMD3からなる18遺伝子クラス予測因子、および(10)EEF1A2、TLR2、BRF2、LGALS3、SNRPG、DKFZP586E1621、NUMA1、SOD2、AKR1B1、DUSP6、SMARCE1、KIAA0669、MSF、IL1RN、PTMA、KIAA0410、PSMD3、T54、C1QBPおよびOSR1からなる20遺伝子クラス予測因子を含む。
各々のセットの予測遺伝子を有する、腎細胞癌のPBMCのトレーニングセットおよびテストセット両方の予測精度を算出した。トレーニングセットについての分類の精度を算出すると、いかに一様に予測遺伝子セットがトレーニングセットにおける各々の個別の試料と正の相関をもつかを示しているが、一方テストセットについての予測の精度を算出すると、いかにこの遺伝子の発現が「未知の」群における個別の試料の同定をよく予測しているかを示している。表8は、上記のクラス予測因子各々の予測精度を示している。加重多数決アルゴリズムにおいて10またはそれ以上の遺伝子を用いた分類子遺伝子セットは、テストセットの予測において100%の精度をもたらした。これらの研究は、末梢血の画分中の限られた数の遺伝子転写産物においてみられる発現パターンを用いて、腎細胞癌のない状態に対する腎細胞癌の単純ペアワイズ予測を実行できる可能性を立証している。
図3は、サイズを大きくした予測遺伝子セットについてのトレーニングセットクロスバリデーション結果の要約を示す。腎細胞癌および正常のPBMC試料(70%)の部分集合は、分類子遺伝子セットを生成するために「トレーニングセット」として用いられ、その後各々の予測因子セットを、トレーニングセットにおける試料の分類について高い精度で予測因子セットを同定するために、クロスバリデーションによって評価した。遺伝子クラスターのデフォルト相関測定(Golubら、上記)が、トレーニングセットに特徴的な分類ベクターと最も高く相関した発現レベルを有する遺伝子を同定するために用いられた。最初のフィルター基準を満たす5249の遺伝子全てが、この方法を用いてスクリーニングされた。
予測はまた、加重多数決法を用いて遺伝子クラスターにおいて行われた。この方法において、分類子セットにおける各々の遺伝子の発現レベルは、試料の分類上の全ての診断に寄与する(Slonimら、上記)。予測強度は、一方のクラスまたは他方のクラスに対する支持を示し、0(誤差範囲が狭い)および1(誤差範囲が広い)の間で予測されたクラスに合わせて変化し得ることを合わせて変化する。2および20の間の遺伝子を含む予測因子セットを、トレーニングセットにおける試料の分類について高い精度で予測因子セットを同定するために、クロスバリデーションを省略することによって評価した(図3)
8つの遺伝子の予測セット(89%の精度)を、テストセット予測のために選別した。8つの遺伝子のセットは、TLR2、LGALS3、DKFZP586E1621、SOD2、EEF1A2、BRF2、SNRPGおよびNUMA1からなる。図4は、トレーニングセットにおける8つの予測遺伝子の相対的な発現レベルを示す。各々の遺伝子は、それぞれの限定子によって表現される。正常のPBMC(TLR2、LGALS3、DKFZP586E1621およびSOD2)と比較して、腎細胞癌において上昇する4つの遺伝子、および正常のPBMC(EEF1A2、BRF2、SNRPGおよびNUMA1)と比較して、腎細胞癌において抑制される4つの遺伝子をグラフで呈示する。発現レベルは、暗い色から明るい色へ、その後灰色へおおよそ上昇する。(またはより正確には、2003年に11月21日に編集され、「腎細胞癌および他の固形腫瘍の診断法」と題した対応する米国実用特許出願書の図4に示されるように、発現レベルは青から赤に上昇する)
トレーニングセットにおける各々の試料に対する、この8つの遺伝子分類子を用いた個別の予測信頼度スコアを、図5Aに呈示する。説明上の目的のため、陽性のサインを腎細胞癌の診断に至る予測強度順に整列し、陰性のサインを正常PBMCあの診断に至る予測強度順に整列した。リーブワンアウトクロスバリデーションを実行し、予測強度をトレーニングセットにおける各々の試料について算出した。トレーニングセット試料を、図4と同じ順序で配列した。
図5Bは、8つの遺伝子の予測因子セットを用いて、腎細胞癌およびPBMC試料の残りのテストセットについての予測結果を説明している。テストセットで、予測されたクラスは全ての症例において正しいクラスに適合したが、19のテスト試料のうちの1つについては予測強度は無視できるものであった。これらの研究は、末梢血由来の単核細胞の限られた数の遺伝子に見られる発現パターンを用いた、疾患に罹患していない状態に対して腎細胞癌を予測できる可能性を立証している。
実施例7.腎細胞癌の腫瘍組織、および非腎細胞癌の末期腎不全患者において特異的に発現している遺伝子
腎細胞癌のPBMCの発現プロフィールを、腎細胞癌の腫瘍組織または腎不全の患者由来のPBMCと比較した。各々の比較において、多変量(階層クラスタリング)分析を、グループ間の互いに調節される一連の遺伝子を探すために利用し、続いてフォールドチェンジ分析、スチューデントのt検定を何らかの結果を支持するために利用した。最初の分析において、腎細胞癌のPBMCの発現プロフィールを、ジーンロジック社バイオエクスプレスデーターベース由来の腎細胞癌腫瘍組織(n=43の生検)の発現プロフィールと、コンピューター上で比較した(Gaithersburg、MD)。全ての試料を管理された方法で(すなわち、どのアレーもクラスター形成していない)配列し、腎細胞癌患者のPBMCおよび腎細胞癌腫瘍組織両方において、疾患に罹患していない対照群と比較してアップレギュレーションされる遺伝子セットを同定するために、遺伝子を階層クラスタリング法を用いて配列した。フォールドチェンジ分析では、統計的に有意であり(p<0.05、スチューデントのt検定)、疾患に罹患していないPBMCと比較して腎細胞癌のPBMCにおいて、および疾患に罹患していない腎組織と比較して腎細胞癌腫瘍において2倍以上誘導される24のRNA種を同定した。
これら24のRNA種は、FABP5、SCYA20、ADM、COPEB、FCGR3B、UNK_M62896、FN1、HMOX1、ITGA7、DGCR5、CBP2、UNK_AL049250、SLC1A4、MMP9、SLC16A3、LILRB3、FCGR1A、LHFPL2、PLEC1、S100A11、SPOP、CCR1、TLR2およびKIAA0750にそれぞれ対応する。それに加えて、これら24のRNA種は、ストリンジェントな条件下で、CPSs57、229、92、91、221、26、236、207、16、8、245、152、2、58、192、19、99、28、191、138、143、61、1および148とそれぞれハイブリダイズすることが可能である。
二番目の分析において、非腎細胞癌の末期腎不全患者(n=8個体)由来のPBMCを、疾患に罹患していないボランティアおよび腎細胞癌患者のPBMCと比較した。これらのグループの試料中の遺伝子の階層クラスタリングは、進行した腎細胞癌患者および末期腎不全患者の間で同様に調節されているように思われる、いくつかの遺伝子クラスターを同定した。フォールドチェンジ分析では、統計的に有意であり(p<0.05、スチューデントのt検定)、疾患に罹患していないPBMCと比較して、腎細胞癌のPBMC、および末期腎不全の非腎細胞癌患者のPBMCにおいて2倍以上誘導される、多量のRNA転写産物を同定した。ストリンジェントな条件下でこれらのRNA転写産物とハイブリダイズすることが可能なCPSsは、表9に記述している。そのCPSsに対応する遺伝子もまた示している。
表9に記載された遺伝子群およびCPSsは、腎不全および他のタイプの腎障害に対するマーカーとして用いられ得る。
実施例8.疾患に罹患していないボランティアおよび他の固形腫瘍患者に対する、腎細胞癌の状態の予測
本分析において、発現プロフィールは、腎細胞癌のPBMC、疾患に罹患していないヒトのPBMC、前立腺癌のPBMCおよび頭部/頸部の癌のPBMCを含む、4つのクラスのPBMCの間で同時に比較された。最初の階層分析は、PBMC発現プロフィールの拡張したデーターベースの間の包括的な転写関係を立証している。試料の70%は、その後トレーニングセットとして用いられ、データーベースにおけるPBMC発現プロフィール(腎細胞癌、疾患なし、前立腺癌、頭部および頸部)の各々のクラスと最も高く相関する遺伝子を同定し、分類するために、多重相関測定法が利用された。20の遺伝子分類子が決定された。これらの遺伝子および対応するCPSsは、表10に図示している。この20遺伝子セットは、他の全てのクラスに対して各々のクラスを予測するために用いられ得る。
腎細胞癌対非腎細胞癌として、この遺伝子セットの残りの30%の試料を予測する能力が算定された。遺伝子セットは、それぞれ89%または92%の精度で、腎細胞癌または非腎細胞癌として、テストセットにおいて各々の残りのPMBCプロフィールを予測することができた。当業者によって評価されているような、2、4、6、8、10、12、14、16または18の遺伝子のような、これら20の遺伝子の部分集合が、非腎細胞癌から腎細胞癌を予測するために用いられ得る。非腎細胞癌には、前立腺癌または頭部/頸部癌のような他の固形腫瘍を含む。
実施例9.固形腫瘍を有さない予測遺伝子セットの同定
疾患を有さないPBMC、および異なる固形腫瘍に由来するPBMCにおける発現プロフィールの、管理された分析が行われた。5人の頭部/頸部癌の患者のうち3人、20人の疾患に罹患していないボランティアのうち14人、15人の前立腺癌患者のうち11人、および45人の腎細胞癌患者のうち32人由来のPBMCの発現プロフィールを分類し、k−最近傍アルゴリズムは、各々のクラス区分と最も高く相関した遺伝子を算定した。頭部/頸部癌の患者、疾患に罹患していないボランティア、前立腺癌患者および腎細胞癌患者由来のPBMCと最も高く相関した発現パターンを有する19のトップの遺伝子が同定された。このようにして同定された19のトップの遺伝子は、その後残存しているPBMC試料における、固形腫瘍に罹患していない状態に対する、固形腫瘍の予測の精度を決定するために用いられた。調整した診断法は、各々の試料に対する予測強度を決定するために用いられた。これら19の遺伝子は、表11に記載されている。
本発明の前の記述は、実例および説明を与えているが、本発明を網羅したり、または本発明を開示した通りに制限したりすることを意図したものではない。修正および変更が上記の指示と矛盾せずに可能であり、本発明の実行でもたらされる可能性がある。従って、本発明の範疇は請求書およびそれに相当するものによって定義されることに注意すべきである。
(原文に記載なし)