JPH07330799A - Mdc蛋白質およびそれをコードするdna - Google Patents

Mdc蛋白質およびそれをコードするdna

Info

Publication number
JPH07330799A
JPH07330799A JP6084470A JP8447094A JPH07330799A JP H07330799 A JPH07330799 A JP H07330799A JP 6084470 A JP6084470 A JP 6084470A JP 8447094 A JP8447094 A JP 8447094A JP H07330799 A JPH07330799 A JP H07330799A
Authority
JP
Japan
Prior art keywords
gly
leu
ser
arg
cys
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6084470A
Other languages
English (en)
Other versions
JP3670030B2 (ja
Inventor
Yusuke Nakamura
祐輔 中村
Mitsuru Emi
充 江見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japanese Foundation for Cancer Research
Eisai Co Ltd
Original Assignee
Japanese Foundation for Cancer Research
Eisai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japanese Foundation for Cancer Research, Eisai Co Ltd filed Critical Japanese Foundation for Cancer Research
Priority to JP08447094A priority Critical patent/JP3670030B2/ja
Publication of JPH07330799A publication Critical patent/JPH07330799A/ja
Application granted granted Critical
Publication of JP3670030B2 publication Critical patent/JP3670030B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

(57)【要約】 【目的】乳癌および卵巣癌における染色体上の共通欠失
領域に存在する新規蛋白質をコードする遺伝子、該遺伝
子がコ−ドする蛋白質(MDC蛋白質)、または該蛋白
質と結合する抗体を用いた癌の診断方法等の提供。 【構成】ヒト第17番染色体について、詳細な遺伝子地
図を作製して、乳癌および卵巣癌の組織の染色体を解析
し、新規蛋白質をコードする遺伝子をクロ−ニングし構
造決定した。該遺伝子由来のDNAプロ−ブを用いて遺
伝子解析を行った結果、乳癌組織に遺伝子変異を確認し
た。また、該遺伝子を含むプラスミドを保持する形質転
換体を培養し、MDC蛋白質を取得した。更に、該蛋白
質を抗原としてモノクロ−ナル抗体を得た。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はMDC蛋白質、それをコ
ードする遺伝子DNAおよび該DNAを用いる遺伝子解
析法に関し、医療、診断等の分野で利用される。
【0002】
【従来の技術】癌の発症には細胞の蛋白質の変異が重要
な役割を演ずるという考え方は古くから知られている。
近年の遺伝子工学の発達は特定蛋白質をコードする遺伝
子DNAの増幅や癌細胞における遺伝子変異の解析を可
能にし、癌研究の分野においても飛躍的な発展をもたら
した。これまでに細胞の癌化、癌細胞の異常増殖に関与
すると考えられている蛋白質をコードする遺伝子(癌遺
伝子)の解析、同定が進み、その数は数十に及んでい
る。一方これと反対に作用するもの(癌抑制遺伝子)が
ここ数年脚光を浴びており、これまでに癌抑制遺伝子と
して、網膜芽細胞腫のRb遺伝子(Friend,S.H.et al.,
Proc. Natl. Acad. Sci. USA. 84, 9095, 1987)、大腸
癌のp53遺伝子(Lane,D.P. et al., Nature, 278, 2
61, 1979) およびAPC遺伝子( Kenneth,W.K., et al,
Science 253, 661, 1991)、Wilms腫瘍のWT1遺
伝子(Call,K.M. et al., Cell, 60, 509, 1990) などが
発見されており、 p53遺伝子の場合には、変異遺伝子
を家系を通じて伝えている例がある(”Li-Fraumeni 症
候群”(Makin, D. et al, Science 250, 1233, 1990; S
rivastava,S. et al, Nature348, 747, 1990 ) )こと
が知られている。また、癌の発生、進展悪性化、転移な
どには一つの遺伝子の異常だけでなく複数の遺伝子の異
常が関与していることが次第に明らかになりつつあり、
さらに多くの未同定の癌遺伝子、癌抑制遺伝子が存在す
るものと考えられている。それらの発見、解明は研究、
臨床の専門家はもとより全世界の人々から期待されてい
るところである。
【0003】乳癌は遺伝性(家族性)乳癌と非遺伝性
(散発性)乳癌に分けられ、遺伝性乳癌は発症年齢の区
分から早発型と晩発型に分けられる。このうち少なくと
も遺伝性で早発型の乳癌においては、家系解析によって
第17番染色体のごく一部が欠けている頻度が極めて高
いことが明らかとなっている( Hall,J.M. et al., Sci
ence, 250, 1684-1689, 1990) 。また、これと同じ部位
は遺伝性卵巣癌でも高頻度に欠失していることが示され
ている( Narod,S.A. et al., Lancet, 338,82-83,199
1)。従って、この欠失部位に癌抑制遺伝子が存在し、そ
の欠損や変異によってひき起こされる蛋白質の欠損や異
常が乳癌や卵巣癌の原因の一つであると考えられてい
る。また一般の(散発性)乳癌の発生においても、この
部位の遺伝子の後天的な変異や欠損による蛋白質の異常
や欠損が起こり、その細胞が癌となるケースとして関与
しているものと考えられている(Sato et al.,Cancer R
es.,51, 5794-5799,1991) 。このためこの部位に存在す
る原因遺伝子を単離し、蛋白質を同定することは、今や
世界中の医師や研究者のみならず一般の人々、特に乳癌
患者の多い欧米では女性にとって切実な問題として期待
されている。
【0004】
【発明が解決しようとする課題】本発明は、乳癌および
卵巣癌に関わる新規な蛋白質と、それをコードする遺伝
子、さらにそれらを用いた癌の検査方法、診断方法等を
提供することにある。
【0005】
【課題を解決するための手段】本発明者らは、ヒト第1
7番染色体のDNA断片を導入したコスミド・クローン
を多数作成した。さらにその多数のコスミド・クローン
について、そのDNA断片をプローブとした蛍光 in si
tu ハイブリダイゼーション法(FISH法;Inazawa
et al., Genomics, 10, 1075-1078, 1991 )によって染
色体上での存在位置を決定した。これら染色体上の位置
を決定したコスミド・クローン(コスミド・マーカー)
によって第17番染色体についての非常に詳細な物理的
染色体地図を作成した。プローブとした各コスミドのク
ローン名と、決定された染色体上の位置についての一覧
を表1〜3および図1に示した。図1ではクローン名は
クローン番号でのみ示してある。
【0006】
【表1】
【0007】
【表2】
【0008】
【表3】
【0009】これらのマーカーの中から、個体によって
制限酵素断片の長さが異なる性質(RFLP:Restrict
ion Fragment Length Polymorphism:制限酵素断片長多
型)を持つもの、すなわちRFLPマーカーを選び出し
た。表4〜6に、選ばれたマーカークローンと、使用す
る制限酵素名、およびそれによって検出される複数種の
断片の具体的断片長を記載した。
【0010】
【表4】
【0011】
【表5】
【0012】
【表6】
【0013】RFLPマーカーは、これを用いることに
よって両親から受け継いだ2本の相同染色体を多型性の
差により識別できる( informative,ただし、両方が同
じ多型パターンを示す場合には識別できない: not inf
ormative )という特徴を有している。この2本の相同
染色体の多型性パターンの差(ヘテロ接合性)が、正常
組織で存在し、癌組織で消失している現象(LOH:lo
ss of heterozygosity) が検出されることは、片方の染
色体でそのRFLPマーカー部位が欠失していることを
意味する。また一般的に、一対の染色体のうち一方の欠
失と他方の変異などによる両方の染色体上の癌抑制遺伝
子の不活化が癌化につながるものと考えられており、多
くの癌に共通して欠失している領域に癌抑制遺伝子が存
在しているものと考えられている。本発明者らは、この
ようにして得た詳細な染色体地図とRFLPマーカーを
使用して、約300例の乳癌と約100例の卵巣癌につ
いて第17番染色体のLOHを調べた結果、ヘテロ接合
性が識別可能なケースにおいて、17q21付近のcC
I17−701とcCI17−730の二つのコスミド
・マーカーの間の領域(2.4cM)が高頻度に欠失し
ていることが明らかとなった。卵巣癌における第17番
染色体染色体長腕の部分的欠失を図2に示した。黒丸は
ヘテロ接合性の消失(LOH)、白丸は保持を表してい
る。2カ所の共通欠失領域は傍線で示した。乳癌におけ
る第17番染色体染色体長腕の部分的欠失を図3に示し
た。黒丸はヘテロ接合性の消失(LOH)、白丸は保持
を表している。2カ所の共通欠失領域は傍線で示した。
【0014】この領域は遺伝性乳癌の家系解析から原因
遺伝子の存在が示唆されている領域と一部が重なりあっ
ていた。両者の重なりあう領域の中のコスミド・クロー
ンをプローブとして、650例の乳癌症例における変異
を、サザンブロット解析によって調べたところ、2例に
おいて、上記で選別されたコスミド・クローンcCI1
7−904に含まれるDNAの一部の領域が数倍に増幅
していることが明らかとなった。この異常について詳細
に調べたところ、約6〜9Kbの断片が4〜6コピー程
度の異常な繰り返しとしてつながっていることが分かっ
た。さらに、このコスミド・クローンの制限酵素断片の
うち種を越えて保存されている配列を有する断片をプロ
ーブとして、cDNA(メッセンシ゛ャーRNAから逆翻訳され
た相補配列DNA)ライブラリーをスクリーニングした
結果、新規な蛋白質をコードする遺伝子を単離した。こ
の遺伝子の配列構造を決定し、乳癌についての遺伝子異
常の有無を調べたところ、明らかな遺伝子変異が同定さ
れた。これらのことから、本蛋白質の欠損や異常および
これをコードする遺伝子DNAの欠失や変異が乳癌・卵
巣癌の発生に深く関与していることが明らかとなった。
上記の、マーカー群から該遺伝子の単離までの過程、さ
らに乳癌組織で遺伝子の異常が起きていた箇所を図4に
示した。クローン名はクローン番号でのみ示してある。
【0015】本発明は、例えば本蛋白質の欠損や異常の
有無あるいはそれをコードする遺伝子の欠失や変異の有
無を調べることによって、少なくとも、乳癌・卵巣癌の
一部についてのリスク診断、早期発見、経過観察、治療
方針の決定、予後の推定などの困難な問題に対する解決
方法と材料を提供し、この分野の技術を飛躍的に進歩さ
せ得るという点できわめて重要である。すなわち本発明
は、(1)配列番号1、2、3または4に示されたアミ
ノ酸配列を有する蛋白質の、全部または一部を含むもの
からなる蛋白質、(2)配列番号5、6、7、8または
9に示された塩基配列を有するDNAの全部または一部
を含むものからなるDNA、(3)配列番号5、6、
7、8または9に示された塩基配列を有するDNAの、
全部または一部を組み込んだプラスミド、該プラスミド
で形質転換された宿主細胞および該宿主細胞培養物より
発現産物を回収することを含む蛋白質の製造方法、
(4)配列番号1、2、3または4で表される蛋白質の
全部または一部を含むものを抗原とする抗体、(5)配
列番号5、6、7、8または9で表されるDNA配列の
一部を含むプライマー、プローブまたはマーカー、また
はこれらを使用することを特徴とする遺伝子解析方法、
からなる。これら蛋白質とDNAに関しては、それと実
質的に同等であるものも本発明に含まれる。
【0016】以下に本発明を詳細に説明する。 (1)cDNAクローンの単離 ヒト第17番染色体のコスミド・クローンは、例えばヒ
ト第17染色体だけを含むヒト−マウスの雑種細胞から
染色体DNAを抽出し、時野らの報告した方法(Tokino
et al., Am.J.Hum.Genet., 48, 258-268, 1991) によ
り、その染色体DNA断片をpWEX15などのベクタ
ーに組み込むことにより作成することができる。この中
から、全ヒトDNAをプローブとしてコロニーハイブリ
ダイゼーションを行って、ヒト染色体由来の挿入配列
(インサート)を持つクローンを選び出すことができ
る。こうして得られるヒト第17染色体由来DNAを含
む多数のコスミド・クローンについて、FISH法によ
り、染色体上の位置を決定してマーカーとし、詳細な物
理的染色体地図を作成することができる。また、制限酵
素を用いて切断した断片長のパターンからRFLPマー
カーを選別することができる(Nakamura etal., Am.J.H
um.Genet.43, 854-859,1988) 。この地図とRFLPマ
ーカーを利用して癌患者癌組織のDNAについてLOH
(ヘテロ接合性の消失)を調べ、癌組織における染色体
上の共通欠失領域を第17番染色体のq21付近のきわ
めて小さい領域に限局化することができる。この限局化
された領域内に存在するコスミド・クローンをプローブ
として癌組織DNAのサザンブロット解析を行うことに
より、癌組織における遺伝子異常に関わっている配列を
有するクローンを選択することができる。さらにコスミ
ド・クローンの制限酵素断片をプローブとして、種々の
哺乳動物の染色体DNAに対するサザンブロット法を行
うことにより、種を越えて保存されている基本的な細胞
機能に関わるDNA配列を含む断片を選択することがで
きる。重要な蛋白質をコードしているDNA配列領域は
種を越えて保存されていることが多く、実際、現在まで
に単離された遺伝性疾患の遺伝子はその多くが種を越え
て保存されている(Call,K.M. et al. Cell, 60, 509-5
20, 1990)。このようにして得られたDNA断片をプロ
ーブとして用いることにより、ヒト第17番染色体のq
21付近の限局化された領域に存在する遺伝子のcDN
Aをクローニングすることができる。cDNAの塩基配
列は常法に従って決定することができる(Maniatis,J.
et al. Molecular Cloning 2nd.ed., Cold Spring Harb
or Laboratory Press, N.Y.1989)。このようにして得ら
れた遺伝子DNAのクローンは、その配列についてのS
SCP法( Orita,M. et al, Genomics, 5, 874-879, 19
84 )( Orita,M. et al. Cell, 60, 509-520, 1990 ) 、
RNase Protection法( Winter, E., Perucho,M. etal. P
roc. Natl. Acad. Sci. USA, 82, 7575-7579, 1985 )(
Myers,R.M., et al. Science, 230, 1242-1246, 1985 )
などを用いた癌患者での異常の有無、異常の出現頻度
の検索により、目的の原因遺伝子のクローンであること
を確かめることができる。
【0017】(2)遺伝子の全構造の確認 上記の方法により得られたcDNAは、配列番号6およ
び7の新規なDNA配列であることが確認され、対応す
る配列番号2および3のアミノ酸配列が判明した。さら
に5′RACE法、RT−PCR法などによって、配列
番号8に示されるDNA配列と対応する配列番号4に示
されるアミノ酸配列が明らかにされた。さらに染色体D
NAについては、もとのコスミドクローンcCI17−
904の塩基配列を解析し、cDNAの塩基配列と比較
することによって、イントロン−エクソン結合部が確認
され、イントロン/エクソンを含む配列番号9の構造が
明らかにされた。本発明者らは、これらすべてに共通の
アミノ酸配列であるところの配列番号1で示される配列
の全部または一部を含む蛋白質をMDC蛋白質と命名
し、以下MDC蛋白質と記載する。同様に配列番号5に
は、MDC蛋白質をコードするDNAに共通のDNA配
列が示されている。本発明のDNAは、その一部をプラ
イマーまたはプローブとして用いることにより、遺伝子
解析、診断に利用することができる。「一部」とは、プ
ライマーまたはプローブとして使用するオリゴヌクレオ
チドが本発明のDNA配列と相補的な少なくとも約6個
の塩基配列からなり、好ましくは少なくとも約8個の塩
基配列、さらに好ましくは約10〜12個の、さらに好
ましくは約15〜25個の塩基配列からなる対応するポ
リヌクレオチドを意味する。このDNAがコードするM
DC蛋白質は全部または一部をエピトープとして用い
て、抗体の作成およびその抗体を用いる研究用、診断用
試薬として利用することができる。「エピトープ」と
は、ポリペプチドの抗原決定基を意味し、一般に少なく
とも5個のアミノ酸で構成される。(例えば、6個のア
ミノ酸で構成されるポリペプチドが抗体と結合すること
は公知である。公表特許公報60-500684 号)MDC蛋白
質の一部とは、本発明のMDC蛋白質の連続するアミノ
酸配列を有する少なくとも約3〜5個のアミノ酸、好ま
しくは少なくとも約8〜10個のアミノ酸、さらに好ま
しくは少なくとも約11〜20個のアミノ酸からなるポ
リペプチドを意味する。また約20個以上のアミノ酸か
らなるポリペプチドであっても使用できることは言うま
でもない。「実質的に同等である」とは、MDC蛋白質
およびその一部からなるものにおいて、それらのアミノ
酸配列が1つまたは複数個のアミノ酸の置換、欠失、挿
入を伴うものであって、MDC蛋白質を用いる研究、診
断に同等の効果を奏するものを意味し、これら均等物も
本発明に含まれる。また本発明のDNAの場合も、「実
質的に同等である」とは上記蛋白質の場合と同様の意味
(ただし、1つまたは複数個の塩基配列の置換、欠失、
挿入を伴うもの)を示すものである。
【0018】(3)組換え発現ベクターとその形質転換
体 上記記載の方法により得られたヒトMDC蛋白質をコー
ドする遺伝子DNAあるいはその断片を適切なベクター
に組み込み、該ベクターを適切な宿主細胞に移入するこ
とにより形質転換体を得ることができる。これを常法に
より培養し培養物よりヒトMDC蛋白質を大量に生産す
ることができる。さらに具体的には、ヒトMDC蛋白質
をコードするDNAまたはその断片を、その発現に適し
たベクターのプロモーター下流に制限酵素とDNAリガ
ーゼを用いる公知の方法により再結合して組換え発現ベ
クターを作成することができる。使用できるベクターと
しては、例えば大腸菌由来のプラスミドpRB322,
pUC18,枯草菌由来のプラスミドpUB110,酵
母菌由来のプラスミドpRB15,ファージベクタ−λ
gt10,λgt11あるいは動物ウイルス由来のベク
タ−SV40などが挙げられるが宿主内で複製、増幅可
能なベクターであれば特に限定されない。プロモーター
およびターミネーターに関してもヒトMDC蛋白質をコ
ードするDNA塩基配列の発現に用いられる宿主に対応
したものであれば特に限定されず、宿主に応じて適切な
組み合わせも可能である。用いるDNAはヒトMDC蛋
白質をコードするDNAであれば何れでも良く、配列番
号1、2、3または4記載の塩基配列に限定されるもの
ではなく、意図的であるか否かにかかわらず塩基配列の
一部が置換、欠損、挿入、あるいはこれらが組み合わさ
れた塩基配列を有するDNAであってもよい。また化学
合成によって合成されたものでも良い。
【0019】このようにして得られた組換え発現ベクタ
ーはコンピテント細胞法(J. Mol.Biol., 53, 154, 197
0)、プロトプラスト法(Proc. Natl. Acad. Sci. USA,
75, 1929, 1978)、リン酸カルシウム法(Science, 22
1, 551, 1983)、インビトロパッケージング法(Proc. N
atl, Acad. Sci. USA, 72, 581, 1975)、ウイルスベク
ター法(Cell, 37, 1053, 1984)などにより宿主に導入
し、形質転換体が作製される。宿主としては大腸菌、枯
草菌、酵母および動物細胞などが用いられ、得られた形
質転換体はその宿主に応じた適切な培地中で培養され
る。培養は通常20℃〜45℃、pH5〜8の範囲で行われ、
必要に応じて通気、撹拌が行われる。培養物からのMD
C蛋白質の分離・精製は公知の分離・精製法を適宜組み
合わせて実施すれば良い。これらの公知の方法としては
塩析、溶媒沈殿法、透析ゲルろ過法、電気泳動法、イオ
ン交換クロマトグラフィー、アフィニティクロマトグラ
フィー、逆相高速液体クロマトグラフィーなどが挙げら
れる。
【0020】(4)抗体の作成 抗体は、MDC蛋白質の全部あるいは一部分を抗原とし
て、通常の方法で作成することができる。例えば、ポリ
クローナル抗体はマウス、モルモット、ウサギ等の動物
の皮下、筋肉内、腹腔内、静脈に複数回接種し十分に免
疫した後、斯かる動物から採血、血清分離して作製す
る。なお、市販のアジュバントも使用できる。モノクロ
ーナル抗体は、例えば、MDC蛋白質で免疫したマウス
の脾細胞と市販のマウスミエローマ細胞との細胞融合に
より得られるハイブリドーマを作成後、該ハイブリドー
マ培養上清、または該ハイブリドーマ投与マウス腹水か
ら調製することができる。抗原とするMDC蛋白質は必
ずしも全アミノ酸構造を有する必要はなく、部分構造を
有するペプチド、その変異体、誘導体、あるいは他のペ
プチドとの融合ペプチドであってもよく、調製法は生物
学的手法、化学合成手法いずれでもよい。これら抗体は
ヒト生体試料中のMDC蛋白質の同定や定量を可能とし
癌診断試薬などに使用できる。MDC蛋白質の免疫学的
測定法は、公知の方法に準ずればよく、たとえば蛍光抗
体法、受身凝集反応法、酵素抗体法などいずれの方法に
おいても実施できる。
【0021】(5)ヒト癌組織の遺伝子解析 遺伝子解析される生体試料はヒト正常組織、各種ヒト癌
組織をはじめヒト血液、体液、分泌液などを用いること
ができる。DNAの抽出・調製は、たとえば(Sato T.,
et al. Cancer Res., 50, 7184, 1990 )の方法で行
う。本発明により提供されるヒトMDC蛋白質をコード
する遺伝子DNAの制限酵素断片をプローブとして、ま
たは該遺伝子DNAの中から適切な位置の塩基配列を適
宜選択し、その合成オリゴヌクレオチドをプライマーと
して用いることにより該遺伝子の変異の有無を解析する
ことができる。また、試料中の該遺伝子における挿入、
欠失などの異常もこれらの解析により検知することがで
きる。選択する塩基配列の部位は該遺伝子のエクソン部
分、イントロン部分あるいは両部分の結合部分など、い
ずれも選択し得る。また用いる塩基配列を人為的に改変
したものを用いることができるのは言うまでもなく、こ
れにより対応する遺伝子変異を検出することができる。
解析の方法としては、例えば選ばれた2種の配列のプラ
イマーによりPCR法で部分配列を増幅させ、増幅産物
の塩基配列を直接解析するか、あるいはこの増幅産物を
前記と同様にプラスミドに組み込み、宿主細胞を形質転
換させて培養し、得られるクローンの塩基配列を解析す
ることができる。あるいはまた、LigaseChain Reaction
法(Wu et al., Genomics, 4, 560-569, 1989) 、さら
に、変異配列特異的PCR法(Ruano and Kidd, Nucleic
Acid Research, 17, 8392, 1989) 、(C.R.Newton et a
l., Nucleic Acid Research, 17, 2503-2517, 1989) を
利用することにより試料中の該遺伝子の特定の変異の有
無を直接検出することができる。また同様に、選ばれた
DNA配列あるいはこれに由来するRNA配列を含むプ
ローブを用いて、SSCP法、RNase-Protection法によ
り点突然変異の検出を行うことができる。またこれらの
プローブを用いることにより、サザンハイブリダイゼー
ション法での試料中の該遺伝子の変異の検出、ノーザン
ハイブリダイゼーション法での試料中の該遺伝子の発現
量の異常を検出することができる。
【0022】なお、このMDC蛋白質をコードする遺伝
子DNAを含むプラスミドを保有するEscherichia coli
DH5/pBR1 、Escherichia coli XL1-Blue MRF'Kan/pCR-
5P2、および該遺伝子の染色体DNAを含むコスミドを
保有するEscherichia coli 490A/cCI 17-904は通商産業
省工業技術院生命工学工業技術研究所にそれぞれ寄託番
号FERM BP-4286、FERM BP-4555、FERM BP-4287、として
平成5年4月28日、平成6年2月8日、平成5年4月
28日寄託された。
【0023】
【発明の効果】本発明の、ヒトMDC蛋白質および該蛋
白質をコードする遺伝子DNAの、全部またはその一部
を含むものは、癌の研究試薬、検査・診断試薬および治
療薬として期待される。
【0024】
【実施例】以下の実施例により本発明を詳細に且つ具体
的に説明するが、本発明はこれらの実施例に限定される
ものではない。
【0025】(実施例1)ヒト第17番染色体特異的コ
スミド・クローンの単離と染色体地図の作成 時野らの方法(Tokino et al., Am.J.Hum.Genet., 48, 2
58-268, 1991) によりヒトの正常細胞とマウスの株化細
胞とを融合させた雑種細胞の中から、ヒト染色体のうち
第17番染色体のみを保有するヒト・マウス雑種細胞株
(GM10331)を選択した。この雑種細胞株の染色
体DNAを制限酵素Sau3AIで適度に切断し、断片
の末端をdATPとdGTPを用いた部分的フィルイン
によって処理した。このうち35〜42kbのサイズの
断片を分画し、予め制限酵素XhoIで切断し同様に末
端をdCTPとdTTPを用いた部分的フィルインによ
って処理したコスミドベクターpWEX15に挿入し
た。こうして得られたコスミド・クローンの中から、32
Pラベルしたヒト染色体DNAをプローブとしたコロニ
ーハイブリダイゼーション法で、ヒトのDNA断片を含
むクローンを選び出すことによって342個のヒト第1
7番染色体特異的コスミド・クローンを単離した。これ
らそれぞれのヒト第17番染色体特異的コスミド・クロ
ーンについて、そのDNA断片がハイブリダイズする染
色体上の位置をFISH法(Inazawa et al., Genomics,
10, 1075-1078, 1991) によって決定し、第17番染色
体の物理的染色体地図を作成した(表1〜3)(図
1)。染色体上の位置を決定したコスミド・クローン
(コスミド・マーカー)について、RFLPを検出しう
るか否かを、6人の非血縁者のDNAを用い、既知の方
法(Nakamura et al., Am.J.Hum.Genet., 43, 854-859,
1988) によって検索した。制限酵素は、Msp I,Ta
q I,BglII,Pst I,PvuII,Rsa I,Ec
oR Iのいずれかを用いた。この結果43個のクローン
がRFLPを検出した(表4〜6)、すなわちRFLP
マーカーとして使用可能であった。
【0026】(実施例2)卵巣癌および乳癌におけるヒ
ト第17番染色体長腕の共通欠失領域の検索 卵巣癌94症例と乳癌246症例の手術材料より腫瘍組
織を得た。対応する正常組織あるいは末梢血サンプルを
各々の患者より得た。これらの組織、サンプルよりDN
Aを既知の方法(Sato et al., Cancer Res., 50, 7184-
7189, 1990) で抽出した。DNAは適当な制限酵素で切
断し、1.0%アガロースゲル電気泳動を行い、ナイロ
ンメンブレンに0.1N−NaOH/0.1M−NaC
lでサザントランスファーした(Sato et al., Cancer R
es., 50, 7184-7189, 1990) 。これらのメンブレンに対
して、実施例1の方法で得られたヒト第17番染色体長
腕(17q)上に位置付けられたRFLPマーカーをプ
ローブとしてサザンハイブリダイゼーション(Sato et a
l., Cancer Res., 50, 7184-7189, 1990) を行うことに
よりLOH(ヘテロ接合性の消失)を検索した。結果を
表7に示す。
【0027】
【表7】
【0028】卵巣癌においては94例中84例で少なく
とも1つのマーカーによりヘテロ接合性を識別可能(inf
ormative) であり、そのうち33例(39.3%)で少
なくとも1つのマーカーによりLOHが検出された。乳
癌では246例中214例が少なくとも1つのマーカー
についてヘテロ接合性が識別可能であり、そのうち88
例(41.4%)で少なくとも1つのマーカーがLOH
を検出した。
【0029】上記の結果からヒト第17番染色体長腕
(17q)に部分的欠失があると判定できる例、すなわ
ち2つ以上のマーカーでヘテロ接合性を識別可能(infor
mative) であり、なおかつ欠失部分(LOH検出)と保
持部分(LOH不検出)とを示す例を集めて解析した。
その結果、卵巣癌では8例で2つの共通欠失領域が見出
された(図2)。1つはCI17−316(17q12
−21.1)とCI17−507(17q21.3)の
2つのマーカー間の領域であり、もう一つはCI17−
516(17q25.1)マーカーより末端側の領域で
ある。同様に、乳癌では35例で2つの共通欠失領域が
見いだされた(図3)。1つは卵巣癌においても見いだ
されたCI17−701(17q21.3)とCI17
−730(17q21.3)の2つのマーカー間の領域
でありさらに狭い領域に限局化されている、もう1つは
CI17−516(17q25.1)マーカーより末端
側の領域であり、これも卵巣癌で欠失の認められた領域
である。上記の欠失領域の解析(deletion mapping) で
得られた2つの共通欠失領域のうち、CI17−701
とCI17−730の二つのマーカーの間の領域は、遺
伝性乳癌および卵巣癌の家系解析(linkage mapping) の
結果から発症と強く連関を示す領域17q21(Hall e
t al., Am.J.Hum.Genet., 50, 1235-1242, 1992)に近い
ものであった。この領域の長さ(二つのマーカーの間の
遺伝学的距離)はリンケージ解析法(Lathrop at al., A
m.J.Hum.Genet., 37, 482-498, 1985 ;Donis-Keller et
al., Cell, 51, 319-337, 1987)により2.4cMと推
定された。
【0030】(実施例3)最小限局領域に含まれるコス
ミド・クローンの単離 家系解析の結果から限局化された領域は17q21上の
THRA1とMfd188の2つのマーカー間の領域で
あることが示されている(Hall et al., Am.J.Hum.Gene
t., 50, 1235-1242, 1992) (Bowcock A.M. et al., Am.
J.Hum.Genet.,52,718-22, 1933)ので、これらのマーカ
ーとCI17−701とCI17−730マーカーの相
対的順序を決定することにより2つの別々の戦略によっ
て得られたマッピング情報を統合することを試みた。各
マーカーの相対的順序の決定は、本発明者らが新たに開
発した2色FISH法( 2-color Fish method )によっ
て行った。この方法は、細胞の同調操作によって高度に
伸展した染色体標本を作製して用いることにより精密度
を増し、さらに異なる色の蛍光体で標識したプローブに
よっておこなうFISH法であり、これにより極めて近
接したマーカーの相対的順序の決定が可能である。
【0031】その結果、Mfd188マーカーはCI1
7−701とCI17−730のマーカーの中間に位置
し、THRA1マーカーはCI17−701よりもセン
トロメア側に位置することが見出された(図4a)。す
なわち、家系解析によって限局化された遺伝性乳癌と連
関する領域と、欠失領域の解析で限局化された散発性乳
癌における共通欠失領域とは互いに重なり合っており、
重なり合っている最小領域はCI17−701とMfd
188の2つのマーカーにはさまれる領域であることを
見出した(図4a)。パルスフィールドゲル電気泳動に
よりこの領域の物理的地図を作製したところ、重複領域
の長さは約500kbと非常に限局化された。さらに、
実施例1の方法で得られたコスミド・クローンのうち1
7q21.3に位置づけられた37個のクローンと既知
のマーカーTHRA1、Mfd188およびPPYにつ
いて2色FISH法による精密なマッピングを行った。
その結果、CI17−701とCI17−730の2つ
のマーカーに囲まれる領域に15個のコスミド・クロー
ンが位置づけられ、そのうち、上記重複領域上にはCI
17−527とCI17−904の2つのコスミド・ク
ローンが位置していることが判明した(図4a、b)。
【0032】(実施例4)乳癌における遺伝子異常の検
出 重複領域約500kbのうち約150kbはすでに4つ
のコスミド・クローンCI17−701、CI17−5
27、CI17−904およびMfd188でカバ−さ
れているので、まず650例の散発性乳癌組織のDNA
の制限酵素(SacI、PvuIIまたはPstI)断片
に対してこれらのコスミド・クローンのDNAあるいは
その断片をプローブとしたサザンブロット解析によっ
て、癌細胞に生じている欠失、重複、増幅、転座などの
大きな構造的遺伝子異常、いわゆる遺伝子再構成を検出
することを試みた。その結果、CI17−904のDN
Aまたはその9.5kbHindIII 断片(図4c)を
プローブとしたとき、2例の乳癌組織において遺伝子再
構成が検出された(図5a,b)。これらの遺伝子再構
成は癌組織においてのみ起きており、正常組織では認め
られない、サイズの異なる余分のバンドが認められ、さ
らにいくつかのバンドの濃度が増大していた。すなわ
ち、このプローブに対応する一定のDNA領域に遺伝子
増幅が生じていた。2例のうち、1例においては、9.
5kbHindIII 断片(図4c)と隣接するE−H
5.2もしくはHind6.1断片をプローブとして乳
癌組織のDNASacI断片に対してサザンブロット解
析を行った時には遺伝子増幅は検出されなかった(図
6、Case 1)。すなわち、この Case の遺伝子増幅は
9.5kbHindIII 断片に対応する領域内に起きて
おり、4〜5倍に増幅していることが示された。これ
を、より詳細に検討するため9.5kbHindIII 断
片内の6個のSacI断片、A、B、C、D、E、F
(図4c)の各々をプローブとして乳癌組織のDNAS
acI 断片に対してサザンブロット解析を行った。その
結果、プローブA、Bで2.5kb、プローブB、C、
Dで3.0kb、プローブE、Fで2.5kb、プロー
ブFで0.9kbの異常サイズの増幅バンドが認められ
た(図7)。
【0033】他の1例においては、乳癌組織のDNAS
acI断片に対してE−H5.2をプローブとした時に
遺伝子増幅が検出された(図6、Case 2)が、Hind
6.1断片をプローブとした時には検出されなかった
(図6、Case 2)。この時、E−H5.2をプローブと
した時にはサイズ異常を示すバンドは認められず、増幅
のみが認められた。すなわち、この Case の遺伝子増幅
は9.5kbHindIII 断片に対応する領域内から E
-H5.2 に対応する領域のさらに外側(テロミア側)にわ
たる範囲に起きていることが示された。
【0034】(実施例5)cDNAの単離と構造決定 2例の乳癌組織において遺伝子再構成の認められた領域
内あるいはその近傍から、発現されている遺伝子を単離
するために、コスミド・クローンCI17−904のD
NA断片について、種を越えて保存されている基本的な
細胞機能に関わるDNA配列を含むものの選択を行っ
た。すなわち、コスミド・クローンCI17−904の
DNA断片の各々をプローブとして、ウシ、ブタ、マウ
ス、ラット、ニワトリのDNA断片のサザンブロットに
対してハイブリダイゼーションを行った。その結果、コ
スミド・クローンCI17−904の3.5kbHin
dIII −KspI断片(図4c)がウシ、ブタ、マウ
ス、ラットのDNAとハイブリダイズし、種を越えてよ
く保存されていた。この3.5kbHindIII −Ks
pI断片をプローブとして乳腺、乳癌細胞株、胎児脳、
大脳、小脳の5つの異なる臓器由来のヒトcDNAライ
ブラリーをスクリーニングした。このうち、小脳cDN
Aライブラリーから最長のcDNAがクローニングされ
た。このcDNAはコスミド・クローンCI17−90
4の3.5kbHindIII −KspI断片および隣接
する複数の制限酵素断片とハイブリダイズし、その範囲
は染色体上で20kbを超える領域に広がっていた。こ
のcDNAの塩基配列を解析した結果、2923bpよ
りなり、27bpの5′非翻訳領域、1575bpのコ
ーディング領域、1306bpの3′非翻訳領域および
15bpのpoly(A)テールを含む新規なDNA塩
基配列であることを確認した(配列番号6)。このcD
NA配列に含まれるオープンリーディングフレームは、
524アミノ酸よりなる新規な蛋白質(MDC蛋白質:
配列番号2)をコードしていた。オープンリーディング
フレームの最初のATGのすぐ上流にはイン・フレーム
の停止コドンが存在した。ポリアデニル化シグナルAA
TAAAはポリアデニル化部位から約20bp上流に認
められた。
【0035】(実施例6)染色体DNAの構造決定 実施例5で得られたcDNAに対応する染色体DNAの
構造を明らかにするために、コスミド・クローンCI1
7−904について、このcDNAの塩基配列を含む部
分とその周辺の塩基配列を決定し、両者の配列を比較す
ることにより、エクソン−イントロン結合部を決定し
た。その結果、実施例5で得られたcDNAに対応する
25個のエクソンを含む新規な遺伝子DNAの配列構造
が明らかとなった(配列番号9)。25個のエクソンは
比較的小さなサイズで、染色体上約20kbの領域にま
たがって存在していることが示された。
【0036】(実施例7)乳癌における該遺伝子エクソ
ン構造の異常の検出 実施例6で明らかとなったエクソン/イントロンを含む
該遺伝子DNAの構造から、実施例4で2例の乳癌組織
に共通して異常を検出したプローブ(コスミド・クロー
ンCI17−904の9.5kbHindIII 断片)の
配列領域中に、第2、第3、第4エクソンが存在してい
ることが明らかとなった。さらに、第2エクソンはプロ
ーブEの配列領域中に存在し、第3、第4エクソンはプ
ローブFの配列領域中に存在する(図4c)。従って、
実施例4の9.5kbのHindIII 断片領域を含む遺
伝子再構成は該遺伝子の3つのエクソンを含む領域にお
いて正常なエクソン構造を破壊していると考えられる。
このことを確認するために、第2、第3、第4エクソン
に対応するDNA配列のプローブによって、上記2例の
乳癌組織の染色体DNAに対するサザンブロット解析を
行った結果、先に示したプローブEあるいはプローブF
を用いて行った結果(図7)と同様の異常サイズの増幅
バンドが認められた。
【0037】(実施例8)遺伝子発現の組織特異性 実施例5で得られたcDNAをプローブとして、種々の
ヒト組織(脳、心臓、腎臓、肝臓、肺、膵臓、胎盤、骨
格筋、大腸、末梢血リンパ球、卵巣、小腸、脾臓、睾
丸、胸腺)由来のmRNAについてのノーザンブロット
解析を行った結果、脳に最も強い発現が、心臓、卵巣、
睾丸に弱い発現が認められた。さらに、より微弱な発現
を検出するためにRT- PCR(reverse-transcriptase
PCR) による増幅での検出をおこなった。すなわち、種
々のヒト組織由来のmRNAから逆転写酵素反応によ
り、ランダムヘキサマーをプライマーとして1本鎖cD
NAを合成した。これを鋳型として実施例6で明らかと
なったエクソン21および23の配列にそれぞれ由来す
るプライマーBCO9およびBCO12を用いてPCR
をおこなった。その結果、期待される大きさのPCR産
物は主に中枢神経系(大脳、小脳および胎児脳)と内分
泌系または生殖系臓器(睾丸、卵巣、乳腺、副腎、胸腺
および膵臓)に認められた。用いたプライマーの配列は
下記のとおりである。 BCO9 5'-GCACCTGCCCCGGCAGT-3' ( コーディング鎖、配列番号6の塩基番号 1764-1780に
相当) BCO12 5'-CCAGGACAGCCCCAGCGATG-3' ( アンチセンス鎖、配列番号6の塩基番号 1976-1957に
相当) 。
【0038】(実施例9)RT−PCRによるmRNA
の直接塩基配列決定 ヒト胎児脳およびヒト睾丸mRNAをもとに、エクソン
19上の配列に由来するプライマ−GMA701とエク
ソン21上の配列に由来するプライマ−GMB704を
用いてRT−PCRを行い、増幅されたDNAの塩基配
列をプライマーGMA702またはプライマーGMB7
03を用いて直接決定した。その結果、実施例5で得ら
れた配列番号6の小脳由来の cDNA配列から10塩基
(塩基番号1512-1521 の欠失した配列が発見され、配列
番号7のDNA配列に対応するmRNAが発現している
ことが明らかとなった。胎児脳、睾丸のいずれのmRN
Aでも同一の結果が得られた。配列番号7のcDNA配
列に含まれるオープンリーディングフレームは、670
アミノ酸よりなるMDC蛋白質(配列番号3)をコード
していた。これは配列番号9の染色体DNA上のエクソ
ン20の開始が塩基番号6073番ではなく塩基番号6
083番から始まる別のRNAスプライシングによって
いるものと考えられた。このようなスプライシングのバ
リエーションは例えばOdaらの報告によっても知られ
ている(Biochem. Biophys. Res. Commun. 193, 897-90
4 (1993)) 。これにより配列番号6のcDNAと配列番
号7のcDNAのコードするアミノ酸配列(配列番号2
と配列番号3)は、この部分以降で異なっている。すな
わち配列番号6のcDNAではエクソン20内の部分で
停止コドンを生じるが、配列番号7のcDNAではリー
ディングフレームがシフトしてさらに下流までオープン
リーディングフレームが続いている。PCR および塩基配
列決定に用いたプライマーの配列は下記のとおりであ
る。 GMA701 5'-GGCTGCTGATCGCTTCTGCTAC-3' ( コーディング鎖、配列番号6の塩基番号 1413-1434に
相当) GMA702 5'-GAGAAGCTGAATGTGGAGGG-3' ( コーディング鎖、配列番号6の塩基番号 1435-1456に
相当) GMB703 5'-GTCAGAGCCGTCCGCCAGC-3' ( アンチセンス鎖、配列番号6の塩基番号 1675-1657に
相当) GMB704 5'-GCCATCCTCCACATAGCTCAGG-3' ( アンチセンス鎖、配列番号6の塩基番号 1696-1675に
相当) 。
【0039】(実施例10)RACE法による5’末端
配列の増幅 配列番号7のcDNAの全長cDNAを得るため、5’
−cDNA末端のPCR増幅(5’−RACE;Frohma
n, et al, Proc. Natl. Acad. Sci. USA, 85,8998-900
2, 1988 ;Belyavski, et al, Nucleic Acid Res. 1
7, 2919-2932, 1988 )を行った。ヒト脳由来 poly A
(+) RNA 2μg (Clontech社)をもとに特異的オリゴマ
ーSGN012をプライマーとし市販の合成キットを使
用して一本鎖cDNAを合成した。一本鎖cDNA末端
にアンカーオリゴマーを結合する Edwards らの方法
(Nucleic Acid Res. 19, 5227-5232, 1991 )を応用し
た市販キットを用いて5’RACEを行った。キットの
アンカーオリゴマーと特異的オリゴマーSGN012を
プライマーとしてPCRを行った結果、約580bpの
増幅産物を電気泳動法で検出した。この増幅産物を電気
泳動ゲルより抽出、精製し、プラスミドベクター pCR-S
cript (Stratagene 社)のSrf I 切断部位に挿入しク
ローニングした。各クローンよりプラスミドDNAを精
製し、塩基配列を決定した。そのうちの一つであるpCR-
5P2 はアンカーオリゴマーの配列に続いてATGから
始まる501bpのcDNAインサートを有し、その3
15番目以降の塩基配列は配列番号7の塩基番号45
(エクソン2の開始位置)以降の配列と、後述する1塩
基を除いて、まったく一致した。さらに、 pCR-5P2 の
最初のATGから始まるリーディングフレームは、配列
番号7のcDNAのコードするポリペプチドとフレーム
が一致した。また、これによって得られたポリペプチド
配列のN末端領域には疎水性に富むアミノ酸が連続する
シグナルペプチドがコードされていた。
【0040】以上の、5’RACEによって得られた、
5’末端配列がmRNA上で真に配列番号7の塩基番号
45以降の配列とつながっていることを確認するために
RT−PCRを行った。ヒトの脳、胎児脳、卵巣、およ
び睾丸由来の poly A(+) RNA(Clontech社)をもとにラ
ンダムヘキサマーをプライマーとして一本鎖cDNAを
合成し、次いで pCR-5P2 の最初の20塩基の配列を有
するオリゴマー(SGN013)をセンスプライマー、
SGN011またはSGN012をアンチセンスプライ
マーとした。その結果、いずれの組織のRNAを用いた
場合においても、期待される増幅産物(SGN013/
SGN011で約500bp、SGN013/SGN0
12で約750bp)を電気泳動法で検出した。従っ
て、 5’RACEによって得られたpCR-5P2 の5’末
端配列がmRNA上で配列番号7の塩基番号45以降の
配列とつながっていることが確認され、配列番号8のc
DNAが構成された。配列番号8のcDNAのオープン
リーディングフレームは、769アミノ酸よりなるMD
C蛋白質(配列番号4)をコードしている。用いた特異
的オリゴマーの配列は以下の通りである。 SGN011 5’-GATGTAAGTCAAGTTCCCATCAGAGA-3’ ( アンチセンス鎖、配列番号7の塩基番号 231-206に相
当) SGN012 5’-AACAGCTGGTGGTCGTTGATCACAA- 3’ ( アンチセンス鎖、配列番号7の塩基番号 485-461に相
当) SGN013 5’-ATGAGGCTGCTGCGGCGCTG-3’ ( コーディング鎖、配列番号8の塩基番号 1-20 に相
当) なお、エクソン2の開始位置以降で配列番号8が配列番
号6または7と相違している1塩基は、エクソン2の開
始位置から4番目の塩基(配列番号8の 318番目の
C、配列番号6および7の48番目のA)に当たり、コ−
ドするアミノ酸は配列番号4の 106番目His、配列番
号2および3の7番目Glnである。これは多型を反映
しているものと考えられる。これら3つのMDC蛋白質
(配列番号2、3および4)のバリエ−ションに共通な
アミノ酸配列は、488 アミノ酸からなる配列(配列番号
1)であり、この部分をコ−ドするDNA配列も共通の
配列(配列番号5)である。
【0041】(実施例11)既知蛋白質とのホモロジー MDC蛋白質のアミノ酸配列は、蛇毒の出血性毒素であ
るHR1B(Takeya etal., J.Biol.Chem.,265,16068-16
073,1990)、 Prorhodostomin (Au et al.,Biochem.Biop
hys.Res.Commun.,181,585-593,1991) 、Protrigramin(N
eeper et al.,Nucleic Acid Res.,18,4255,1990) とホ
モロジーを有していた。また、モルモット精子表層蛋白
であるPH30(Blobel et al., Nature, 356, 248-25
2,1992)、ラットまたはサル副睾丸の蛋白であるEAP
I (Perry et al., Biochem.J.,286,671-675,1992 )と
もホモロジーを有していた。MDC蛋白質、配列番号2
(524 アミノ酸)、配列番号4(769 アミノ酸)とのホ
モロジーの「一致%/対象領域アミノ酸数」は次のとお
りであった。左が配列番号2について、右が配列番号4
についての値である。 HR1B 32.5/335 32.2/379 Prorhodostomin 29.0/420 29.0/420 Protrigramin 27.7/430 28.1/438 PH30b 38.1/147 30.8/302 EAP1 rat 36.0/364 33.1/475 EAP1 monkey 30.4/503 29.9/599。
【0042】(実施例12)形質転換体の作製 MDC蛋白質(配列番号2)をコードするDNA(配列
番号6)を基質として、プライマーSGN006とSG
N008を用いて、MDC蛋白質の一部をコードするD
NA断片をPCRで増幅した。用いたプライマーの配列
は以下の通りである。 SGN006 5’-CACAGATCTGGGGGCATATGCTCCCTG-
3’ ( コーディング鎖、配列番号6 の塩基番号 766-783に相
当) SGN008 5’-AACAAGCTTCTACTGATGTCTCCCACC-
3’ ( アンチセンス鎖、配列番号6 の塩基番号 1602-1585に
相当、下線は終止コドンを示す) ベクター構築用に、プライマーの5’端にはそれぞれ B
gl II 、Hind III の切断部位配列を付加してある。P
CR増幅産物をアガロースゲル電気泳動によって分取
し、 Bgl II と HindIII で切断した。こうして得られ
たMDC蛋白質の一部をコードするDNA断片を、予め
BamH I と Hind III で切断しておいた pMAL-c2 (New
England Biolabs 社製) ベクターに結合してプラスミド
pMAL-MDC(C1) を構築した。同様に、予め BamH I と H
ind III で切断しておいた pQE-13 (Diagen 社製)ベク
ターに結合してプラスミド pH6-MDC(C1) を構築した。
さらに、 pMAL-MDC(C1) のMDC蛋白質コーディング領
域から BamH I 切断部位(配列番号6 の塩基番号 1483
)以降を除き、MDC蛋白質の2つのバリエーション
(配列番号2および3)に共通する部分のコーディング
領域となるようにした。すなわち pMAL-MDC(C1) を Bam
H I と Hind III で切断し、末端を平滑化したのち再結
合して、プラスミド pMAL-MDC(dC1) を構築した。
【0043】pMAL-c2 ベクターに組み込んだ断片は、
N末端側にマルトース結合蛋白質(MBP)を有する融
合蛋白質として発現されるので、その融合蛋白質はアミ
ロースカラムによってアフィニティー精製した。また、
pQE-13 ベクターに組み込んだ断片は、N末端側に6個
のヒスチジン残基よりなるペプチド(His 6)を有する
融合蛋白質として発現されるので、その融合蛋白質は金
属キレートカラムによってアフィニティー精製した。各
プラスミド pMAL-MDC(C1) pMAL-MDC(dC1) および pH6
-MDC(C1) を用いてE.coli JM109 をトランスフォーム
し、アンピシリン耐性で選択してそれぞれの形質転換体
を得た。
【0044】(実施例13)組換えMDC蛋白質の発現
と精製 実施例12で得られたそれぞれの形質転換体を培養し、
培養物より組換えMDC融合蛋白質を抽出、精製した。
すなわち、各形質転換体を 100ml のLB培地 (1%ポリ
ペプトン、 0.5% 酵母抽出物, 1%NaCl) で 37 ℃ 一夜
振とう培養した。培養液を予め 37 ℃ に加温したLB
培地で10倍に希釈したうえ、さらに30分〜90分培
養して、対数増殖期の培養物を得た。培養物1リッタ−
にIPTG( Isopropyl-beta-D-thiogalactopyranosid
e )を終濃度1mMとなるように添加して3〜4時間培
養した。培養物から遠心分離により菌体を集めた。プラ
スミド pMAL-MDC(C1) 、pMAL-MDC(dC1) による形質転換
体の場合は、菌体に10mlのカラムバッファー(20mM
Tris-HCl pH7.4, 200mM NaCl)を加え超音波によって
破砕した。組換えMDC融合蛋白質は、破砕液の不溶性
画分に存在したので、これを遠心分離して変性バッファ
ー(8M 尿素、 20mM Tris-HCl pH8.5, 10mM ジチオス
ライト−ル)に溶解した。次いで、これをカラムバッフ
ァーに透析後、遠心分離して上清可溶画分を集めた。透
析不溶性画分は、さらに変性、透析、遠心分離を繰返し
て上清可溶画分を回収した。集めた可溶性画分をアミロ
ースカラム (New England Biolabs 社製) にかけ、カラ
ムバッファーで洗浄後、10mMマルトースを含むカラ
ムバッファーで溶出した。溶出画分は、280nmの吸
光度およびSDSポリアクリルアミド電気泳動法(クマ
シーブルー染色)で解析して分画した。この結果、プラ
スミド pMAL-MDC(C1) および pMAL-MDC(dC1) による形
質転換体のそれぞれで、期待される約68KdのMBP
融合蛋白質が主要バンドとして検出される画分が得られ
た。収量はそれぞれ46.4mg、10.0mgであっ
た(OD280 =1のとき、1mg/ml としたとき)。これ
らの融合蛋白質を以下、それぞれ MBP-MDC(C1)、 MBP-M
DC(dC1) と称する。
【0045】同様に、プラスミド pH6-MDC(C1) による
形質転換体の場合は、菌体に10mlのソニケーション
バッファー(10mM リン 酸ナトリウム pH8.0, 200mM NaCl)を
加え超音波によって破砕した。組換えMDC融合蛋白質
は、破砕液の不溶性画分に存在したので、これを遠心分
離してバッファーA(6M塩酸ク゛アニシ゛ン, 100mM NaH2PO4,
10mMTris-HCl, pH8.0 ) に溶解し、遠心分離して上清可
溶画分を集め、Ni−NTAカラム (Diagen社製) にか
け、バッファーA、次いでバッファーB(8M尿素, 100m
M NaH2PO4, 10mMTris-HCl, pH8.0 )で洗浄後、バッファ
ーC(8M尿素,100mM NaH2PO4, 10mMTris-HCl, pH6.3
)、バッファーD(8M尿素, 100mM NaH2PO4, 10mMTris-
HCl, pH5.9 )、バッファーE(8M尿素, 100mM NaH2PO4,
10mMTris-HCl, pH4.5 )およびバッファーF(6M塩酸ク゛
アニシ゛ン, 200mM酢酸) で段階的に溶出した。溶出画分
は、280nmの吸光度およびSDSポリアクリルアミ
ド電気泳動法(クマシーブルー染色)で解析して分画し
た。この結果、バッファーFによる溶出液に、期待され
る約34Kdの His6融合蛋白質が単一バンドとして検
出される画分が得られた。収量は51.9mgであった
(OD280 =1のとき、1mg/ml としたとき)。この融
合蛋白質を以下、His 6-MDC(C1)と称する。
【0046】(実施例14)モノクローナル抗体および
ウサギポリクローナル抗体の作製 実施例13で得られた3種の組換え融合蛋白質、His 6
-MDC(C1)、 MBP-MDC(dC1) 、および MBP-MDC(C1) を、
それぞれ、免疫抗原、抗体精製・スクリーニング用抗
原、測定用標準抗原として用いた。抗MDC蛋白特異的
モノクローナル抗体は、His 6-MDC(C1) をマウスに免
疫して作製した。すなわち、His 6-MDC(C1) の3M尿
素/PBS溶液(500−1000μg/ml)を完全
アジュバントと1:1の割合で混合しマウスの腹腔内に
100μg/匹にて2週間隔で4〜6回免疫を行った。
免疫終了後、P3U1細胞とB細胞とのハイブリドーマ
をPEG1500を用いて作製し、培養上清中の抗体価
をモニターし、抗MDC蛋白特異的抗体を産生するハイ
ブリドーマの選択を行った。抗体価の測定は、実施例1
3で得た MBP-MDC(dC1) 融合蛋白質を固相化(5μg/
ml)したポリスチレン製カップに培養上清100μl
を加え第一反応を行い、洗浄後、抗マウスIgG−HR
P(Horse-raddish peroxidase)を加え第二反応を行っ
た。洗浄後、酵素基質溶液(過酸化水素水およびABT
S(2,2’−アジノ−ビス−(3−エチルベンゾチア
ゾリン−6−スルホン酸)混合液)を添加し、発色反応
(第三反応)を行いモニターした。ハイブリドーマを9
6ウエルマルチプレートにて培養し、HAT選択を行
い、約2週間後に培養上清中の抗体価を測定し抗原と特
異的に反応するクローンを選択した。更に、クローニン
グ操作を行い、3クローン(G1−5A2−2C8,G
2−2F2−3D11,G2−2D10−3F5)を抗
体産生ハイブリドーマとして樹立した。樹立したクロー
ンの産生抗体のクラスおよびサブクラスは、G1−5A
2−2C8はIgG1 ,G2−2F2−3D11は、I
gG2b、G2−2D10−3F5はIgMであった。各
ハイブリドーマ細胞300万個を、予め約1週間前に
0.5ml のプリスタンを腹腔内に投与しておいた BALB/
c マウスの腹腔内に接種し、8〜10日後に腹水を採取
した。各腹水よりプロテインGカラムによるアフィニテ
ィークロマトグラフィーで抗体を精製した。
【0047】同様に、実施例13で得られた His6-MDC
(C1) を免疫抗原として、ウサギに免疫し、抗MDC蛋
白ポリクローナル抗体を作製した。すなわち、マウスと
同様、 His6-MDC(C1) の3M尿素/PBS溶液(50
0−1000μg/ml)を完全アジュバントと1:1
の割合で混合し免疫を行った。免疫終了後、抗血清を
得、実施例13で得た MBP-MDC(dC1) 融合蛋白質を固相
化したポリスチレン製カップを用いて、抗体価を測定し
た。抗血清を500倍から64000倍まで希釈し、そ
の100μlをウエルに添加し、抗体価をヤギ抗ウサギ
IgG−HRPを用いて検討したところ、64000倍
まで検出が可能であった。また、免疫前の血清中には、
MBP-MDC(dC1) と反応する抗体が存在しなかったことか
ら、MDC蛋白質に特異的に反応する抗体が産生されて
いることが確認することができた。さらに、この抗血清
を、プロテインGカラムおよび MBP-MDC(dC1) 融合蛋白
質を固相化したセファロースカラムによるアフィニティ
ークロマトグラフィーで精製した。
【0048】このようにして得られた精製モノクローナ
ル抗体および精製ウサギポリクローナル抗体を用いたE
LISA法によるMDC蛋白質の定量法を確立した。す
なわち、ハイブリドーマ(G2−2F2−3D11)由
来の精製モノクローナル抗体を96ウエルプレートに固
相化し、BSA(Bovine serum albumin)でブロッキン
グ後、精製 MBP-MDC(C1) 溶液を被検液として、0.156
〜5.00 ug/mlの範囲で 100 ul /ウエルずつ添加して室
温1時間反応させた。ウエルを洗浄後、精製ウサギポリ
クローナル抗体溶液(5ug/ml)を 100 ul /ウエルずつ
添加して室温1時間反応させた。ウエルを洗浄後、抗ウ
サギIgG−HRP(5ug/ml)を 100 ul /ウエルずつ
添加して室温1時間反応させた。反応終了後2mMアジ
化ナトリウムを 100 ul /ウエルずつ添加し、405nm と
490nm の吸光値を測定した。得られた差分吸光値は、
被検液濃度とよく相関した値を示し、0〜2.5μg/
mlの間でほぼ直線的な関係であることが確かめられた
(図8)。このことは、これらのモノクローナル抗体お
よびウサギポリクローナル抗体によるELISA法がM
DC蛋白質の定量法として充分に使用できることを示し
ている。
【0049】
【配列表】配列番号:1 配列の長さ:488 配列の型:アミノ酸 配列の種類:タンパク質 トポロジー:直鎖状 起源 生物名:ホモサピエンス 直接の起源 ライブラリー名:ヒト胎児脳cDNAライブラリー 配列 Leu Leu Ser Ser Gln Tyr Val Glu Arg His Phe Ser Arg Glu Gly Thr 1 5 10 15 Thr Gln His Ser Thr Gly Ala Gly Asp His Cys Tyr Tyr Gln Gly Lys 20 25 30 Leu Arg Gly Asn Pro His Ser Phe Ala Ala Leu Ser Thr Cys Gln Gly 35 40 45 Leu His Gly Val Phe Ser Asp Gly Asn Leu Thr Tyr Ile Val Glu Pro 50 55 60 Gln Glu Val Ala Gly Pro Trp Gly Ala Pro Gln Gly Pro Leu Pro His 65 70 75 80 Leu Ile Tyr Arg Thr Pro Leu Leu Pro Asp Pro Leu Gly Cys Arg Glu 85 90 95 Pro Gly Cys Leu Phe Ala Val Pro Ala Gln Ser Ala Pro Pro Asn Arg 100 105 110 Pro Arg Leu Arg Arg Lys Arg Gln Val Arg Arg Gly His Pro Thr Val 115 120 125 His Ser Glu Thr Lys Tyr Val Glu Leu Ile Val Ile Asn Asp His Gln 130 135 140 Leu Phe Glu Gln Met Arg Gln Ser Val Val Leu Thr Ser Asn Phe Ala 145 150 155 160 Lys Ser Val Val Asn Leu Ala Asp Val Ile Tyr Lys Glu Gln Leu Asn 165 170 175 Thr Arg Ile Val Leu Val Ala Met Glu Thr Trp Ala Asp Gly Asp Lys 180 185 190 Ile Gln Val Gln Asp Asp Leu Leu Glu Thr Leu Ala Arg Leu Met Val 195 200 205 Tyr Arg Arg Glu Gly Leu Pro Glu Pro Ser Asn Ala Thr His Leu Phe 210 215 220 Ser Gly Arg Thr Phe Gln Ser Thr Ser Ser Gly Ala Ala Tyr Val Gly 225 230 235 240 Gly Ile Cys Ser Leu Ser His Gly Gly Gly Val Asn Glu Tyr Gly Asn 245 250 255 Met Gly Ala Met Ala Val Thr Leu Ala Gln Thr Leu Gly Gln Asn Leu 260 265 270 Gly Met Met Trp Asn Lys His Arg Ser Ser Ala Gly Asp Cys Lys Cys 275 280 285 Pro Asp Ile Trp Leu Gly Cys Ile Met Glu Asp Thr Gly Phe Tyr Leu 290 295 300 Pro Arg Lys Phe Ser Arg Cys Ser Ile Asp Glu Tyr Asn Gln Phe Leu 305 310 315 320 Gln Glu Gly Gly Gly Ser Cys Leu Phe Asn Lys Pro Leu Lys Leu Leu 325 330 335 Asp Pro Pro Glu Cys Gly Asn Gly Phe Val Glu Ala Gly Glu Glu Cys 340 345 350 Asp Cys Gly Ser Val Gln Glu Cys Ser Arg Ala Gly Gly Asn Cys Cys 355 360 365 Lys Lys Cys Thr Leu Thr His Asp Ala Met Cys Ser Asp Gly Leu Cys 370 375 380 Cys Arg Arg Cys Lys Tyr Glu Pro Arg Gly Val Ser Cys Arg Glu Ala 385 390 395 400 Val Asn Glu Cys Asp Ile Ala Glu Thr Cys Thr Gly Asp Ser Ser Gln 405 410 415 Cys Pro Pro Asn Leu His Lys Leu Asp Gly Tyr Tyr Cys Asp His Glu 420 425 430 Gln Gly Arg Cys Tyr Gly Gly Arg Cys Lys Thr Arg Asp Arg Gln Cys 435 440 445 Gln Val Leu Trp Gly His Ala Ala Ala Asp Arg Phe Cys Tyr Glu Lys 450 455 460 Leu Asn Val Glu Gly Thr Glu Arg Gly Ser Cys Gly Arg Lys Gly Ser 465 470 475 480 Gly Trp Val Gln Cys Ser Lys Gln 485 488 。
【0050】配列番号:2 配列の長さ:524 配列の型:アミノ酸 配列の種類:タンパク質 トポロジー:直鎖状 起源 生物名:ホモサピエンス 直接の起源 ライブラリー名:ヒト胎児脳cDNAライブラリー 配列 Met Cys Trp Leu Ser His Gln Leu Leu Ser Ser Gln Tyr Val Glu Arg 1 5 10 15 His Phe Ser Arg Glu Gly Thr Thr Gln His Ser Thr Gly Ala Gly Asp 20 25 30 His Cys Tyr Tyr Gln Gly Lys Leu Arg Gly Asn Pro His Ser Phe Ala 35 40 45 Ala Leu Ser Thr Cys Gln Gly Leu His Gly Val Phe Ser Asp Gly Asn 50 55 60 Leu Thr Tyr Ile Val Glu Pro Gln Glu Val Ala Gly Pro Trp Gly Ala 65 70 75 80 Pro Gln Gly Pro Leu Pro His Leu Ile Tyr Arg Thr Pro Leu Leu Pro 85 90 95 Asp Pro Leu Gly Cys Arg Glu Pro Gly Cys Leu Phe Ala Val Pro Ala 100 105 110 Gln Ser Ala Pro Pro Asn Arg Pro Arg Leu Arg Arg Lys Arg Gln Val 115 120 125 Arg Arg Gly His Pro Thr Val His Ser Glu Thr Lys Tyr Val Glu Leu 130 135 140 Ile Val Ile Asn Asp His Gln Leu Phe Glu Gln Met Arg Gln Ser Val 145 150 155 160 Val Leu Thr Ser Asn Phe Ala Lys Ser Val Val Asn Leu Ala Asp Val 165 170 175 Ile Tyr Lys Glu Gln Leu Asn Thr Arg Ile Val Leu Val Ala Met Glu 180 185 190 Thr Trp Ala Asp Gly Asp Lys Ile Gln Val Gln Asp Asp Leu Leu Glu 195 200 205 Thr Leu Ala Arg Leu Met Val Tyr Arg Arg Glu Gly Leu Pro Glu Pro 210 215 220 Ser Asn Ala Thr His Leu Phe Ser Gly Arg Thr Phe Gln Ser Thr Ser 225 230 235 240 Ser Gly Ala Ala Tyr Val Gly Gly Ile Cys Ser Leu Ser His Gly Gly 245 250 255 Gly Val Asn Glu Tyr Gly Asn Met Gly Ala Met Ala Val Thr Leu Ala 260 265 270 Gln Thr Leu Gly Gln Asn Leu Gly Met Met Trp Asn Lys His Arg Ser 275 280 285 Ser Ala Gly Asp Cys Lys Cys Pro Asp Ile Trp Leu Gly Cys Ile Met 290 295 300 Glu Asp Thr Gly Phe Tyr Leu Pro Arg Lys Phe Ser Arg Cys Ser Ile 305 310 315 320 Asp Glu Tyr Asn Gln Phe Leu Gln Glu Gly Gly Gly Ser Cys Leu Phe 325 330 335 Asn Lys Pro Leu Lys Leu Leu Asp Pro Pro Glu Cys Gly Asn Gly Phe 340 345 350 Val Glu Ala Gly Glu Glu Cys Asp Cys Gly Ser Val Gln Glu Cys Ser 355 360 365 Arg Ala Gly Gly Asn Cys Cys Lys Lys Cys Thr Leu Thr His Asp Ala 370 375 380 Met Cys Ser Asp Gly Leu Cys Cys Arg Arg Cys Lys Tyr Glu Pro Arg 385 390 395 400 Gly Val Ser Cys Arg Glu Ala Val Asn Glu Cys Asp Ile Ala Glu Thr 405 410 415 Cys Thr Gly Asp Ser Ser Gln Cys Pro Pro Asn Leu His Lys Leu Asp 420 425 430 Gly Tyr Tyr Cys Asp His Glu Gln Gly Arg Cys Tyr Gly Gly Arg Cys 435 440 445 Lys Thr Arg Asp Arg Gln Cys Gln Val Leu Trp Gly His Ala Ala Ala 450 455 460 Asp Arg Phe Cys Tyr Glu Lys Leu Asn Val Glu Gly Thr Glu Arg Gly 465 470 475 480 Ser Cys Gly Arg Lys Gly Ser Gly Trp Val Gln Cys Ser Lys Gln Pro 485 490 495 Gln Gln Gly Arg Ala Val Trp Leu Pro Pro Leu Cys Gln His Leu Trp 500 505 510 Ser Ser Ser Ala Arg Gly Pro Gly Gly Arg His Gln 515 520 524 。
【0051】配列番号:3 配列の長さ:670 配列の型:アミノ酸 配列の種類:タンパク質 トポロジー:直鎖状 起源 生物名:ホモサピエンス 直接の起源 ライブラリー名:ヒト胎児脳cDNAライブラリー 配列 Met Cys Trp Leu Ser His Gln Leu Leu Ser Ser Gln Tyr Val Glu Arg 1 5 10 15 His Phe Ser Arg Glu Gly Thr Thr Gln His Ser Thr Gly Ala Gly Asp 20 25 30 His Cys Tyr Tyr Gln Gly Lys Leu Arg Gly Asn Pro His Ser Phe Ala 35 40 45 Ala Leu Ser Thr Cys Gln Gly Leu His Gly Val Phe Ser Asp Gly Asn 50 55 60 Leu Thr Tyr Ile Val Glu Pro Gln Glu Val Ala Gly Pro Trp Gly Ala 65 70 75 80 Pro Gln Gly Pro Leu Pro His Leu Ile Tyr Arg Thr Pro Leu Leu Pro 85 90 95 Asp Pro Leu Gly Cys Arg Glu Pro Gly Cys Leu Phe Ala Val Pro Ala 100 105 110 Gln Ser Ala Pro Pro Asn Arg Pro Arg Leu Arg Arg Lys Arg Gln Val 115 120 125 Arg Arg Gly His Pro Thr Val His Ser Glu Thr Lys Tyr Val Glu Leu 130 135 140 Ile Val Ile Asn Asp His Gln Leu Phe Glu Gln Met Arg Gln Ser Val 145 150 155 160 Val Leu Thr Ser Asn Phe Ala Lys Ser Val Val Asn Leu Ala Asp Val 165 170 175 Ile Tyr Lys Glu Gln Leu Asn Thr Arg Ile Val Leu Val Ala Met Glu 180 185 190 Thr Trp Ala Asp Gly Asp Lys Ile Gln Val Gln Asp Asp Leu Leu Glu 195 200 205 Thr Leu Ala Arg Leu Met Val Tyr Arg Arg Glu Gly Leu Pro Glu Pro 210 215 220 Ser Asn Ala Thr His Leu Phe Ser Gly Arg Thr Phe Gln Ser Thr Ser 225 230 235 240 Ser Gly Ala Ala Tyr Val Gly Gly Ile Cys Ser Leu Ser His Gly Gly 245 250 255 Gly Val Asn Glu Tyr Gly Asn Met Gly Ala Met Ala Val Thr Leu Ala 260 265 270 Gln Thr Leu Gly Gln Asn Leu Gly Met Met Trp Asn Lys His Arg Ser 275 280 285 Ser Ala Gly Asp Cys Lys Cys Pro Asp Ile Trp Leu Gly Cys Ile Met 290 295 300 Glu Asp Thr Gly Phe Tyr Leu Pro Arg Lys Phe Ser Arg Cys Ser Ile 305 310 315 320 Asp Glu Tyr Asn Gln Phe Leu Gln Glu Gly Gly Gly Ser Cys Leu Phe 325 330 335 Asn Lys Pro Leu Lys Leu Leu Asp Pro Pro Glu Cys Gly Asn Gly Phe 340 345 350 Val Glu Ala Gly Glu Glu Cys Asp Cys Gly Ser Val Gln Glu Cys Ser 355 360 365 Arg Ala Gly Gly Asn Cys Cys Lys Lys Cys Thr Leu Thr His Asp Ala 370 375 380 Met Cys Ser Asp Gly Leu Cys Cys Arg Arg Cys Lys Tyr Glu Pro Arg 385 390 395 400 Gly Val Ser Cys Arg Glu Ala Val Asn Glu Cys Asp Ile Ala Glu Thr 405 410 415 Cys Thr Gly Asp Ser Ser Gln Cys Pro Pro Asn Leu His Lys Leu Asp 420 425 430 Gly Tyr Tyr Cys Asp His Glu Gln Gly Arg Cys Tyr Gly Gly Arg Cys 435 440 445 Lys Thr Arg Asp Arg Gln Cys Gln Val Leu Trp Gly His Ala Ala Ala 450 455 460 Asp Arg Phe Cys Tyr Glu Lys Leu Asn Val Glu Gly Thr Glu Arg Gly 465 470 475 480 Ser Cys Gly Arg Lys Gly Ser Gly Trp Val Gln Cys Ser Lys Gln Asp 485 490 495 Val Leu Cys Gly Phe Leu Leu Cys Val Asn Ile Ser Gly Ala Pro Arg 500 505 510 Leu Gly Asp Leu Val Gly Asp Ile Ser Ser Val Thr Phe Tyr His Gln 515 520 525 Gly Lys Glu Leu Asp Cys Arg Gly Gly His Val Gln Leu Ala Asp Gly 530 535 540 Ser Asp Leu Ser Tyr Val Glu Asp Gly Thr Ala Cys Gly Pro Asn Met 545 550 555 560 Leu Cys Leu Asp His Arg Cys Leu Pro Ala Ser Ala Phe Asn Phe Ser 565 570 575 Thr Cys Pro Gly Ser Gly Glu Arg Arg Ile Cys Ser His His Gly Val 580 585 590 Cys Ser Asn Glu Gly Lys Cys Ile Cys Gln Pro Asp Trp Thr Gly Lys 595 600 605 Asp Cys Ser Ile His Asn Pro Leu Pro Thr Ser Pro Pro Thr Gly Glu 610 615 620 Thr Glu Arg Tyr Lys Gly Pro Ser Gly Thr Asn Ile Ile Ile Gly Ser 625 630 635 640 Ile Ala Gly Ala Val Leu Val Ala Ala Ile Val Leu Gly Gly Thr Gly 645 650 655 Trp Gly Phe Lys Asn Ile Arg Arg Gly Arg Ser Gly Gly Ala 660 665 670 。
【0052】配列番号:4 配列の長さ:769 配列の型:アミノ酸 配列の種類:タンパク質 トポロジー:直鎖状 起源 生物名:ホモサピエンス 直接の起源 ライブラリー名:ヒト胎児脳cDNAライブラリー 配列 Met Arg Leu Leu Arg Arg Trp Ala Phe Ala Ala Leu Leu Leu Ser Leu 1 5 10 15 Leu Pro Thr Pro Gly Leu Gly Thr Gln Gly Pro Ala Gly Ala Leu Arg 20 25 30 Trp Gly Gly Leu Pro Gln Leu Gly Gly Pro Gly Ala Pro Glu Val Thr 35 40 45 Glu Pro Ser Arg Leu Val Arg Glu Ser Ser Gly Gly Glu Val Arg Lys 50 55 60 Gln Gln Leu Asp Thr Arg Val Arg Gln Glu Pro Pro Gly Gly Pro Pro 65 70 75 80 Val His Leu Ala Gln Val Ser Phe Val Ile Pro Ala Phe Asn Ser Asn 85 90 95 Phe Thr Leu Asp Leu Glu Leu Asn His His Leu Leu Ser Ser Gln Tyr 100 105 110 Val Glu Arg His Phe Ser Arg Glu Gly Thr Thr Gln His Ser Thr Gly 115 120 125 Ala Gly Asp His Cys Tyr Tyr Gln Gly Lys Leu Arg Gly Asn Pro His 130 135 140 Ser Phe Ala Ala Leu Ser Thr Cys Gln Gly Leu His Gly Val Phe Ser 145 150 155 160 Asp Gly Asn Leu Thr Tyr Ile Val Glu Pro Gln Glu Val Ala Gly Pro 165 170 175 Trp Gly Ala Pro Gln Gly Pro Leu Pro His Leu Ile Tyr Arg Thr Pro 180 185 190 Leu Leu Pro Asp Pro Leu Gly Cys Arg Glu Pro Gly Cys Leu Phe Ala 195 200 205 Val Pro Ala Gln Ser Ala Pro Pro Asn Arg Pro Arg Leu Arg Arg Lys 210 215 220 Arg Gln Val Arg Arg Gly His Pro Thr Val His Ser Glu Thr Lys Tyr 225 230 235 240 Val Glu Leu Ile Val Ile Asn Asp His Gln Leu Phe Glu Gln Met Arg 245 250 255 Gln Ser Val Val Leu Thr Ser Asn Phe Ala Lys Ser Val Val Asn Leu 260 265 270 Ala Asp Val Ile Tyr Lys Glu Gln Leu Asn Thr Arg Ile Val Leu Val 275 280 285 Ala Met Glu Thr Trp Ala Asp Gly Asp Lys Ile Gln Val Gln Asp Asp 290 295 300 Leu Leu Glu Thr Leu Ala Arg Leu Met Val Tyr Arg Arg Glu Gly Leu 305 310 315 320 Pro Glu Pro Ser Asn Ala Thr His Leu Phe Ser Gly Arg Thr Phe Gln 325 330 335 Ser Thr Ser Ser Gly Ala Ala Tyr Val Gly Gly Ile Cys Ser Leu Ser 340 345 350 His Gly Gly Gly Val Asn Glu Tyr Gly Asn Met Gly Ala Met Ala Val 355 360 365 Thr Leu Ala Gln Thr Leu Gly Gln Asn Leu Gly Met Met Trp Asn Lys 370 375 380 His Arg Ser Ser Ala Gly Asp Cys Lys Cys Pro Asp Ile Trp Leu Gly 385 390 395 400 Cys Ile Met Glu Asp Thr Gly Phe Tyr Leu Pro Arg Lys Phe Ser Arg 405 410 415 Cys Ser Ile Asp Glu Tyr Asn Gln Phe Leu Gln Glu Gly Gly Gly Ser 420 425 430 Cys Leu Phe Asn Lys Pro Leu Lys Leu Leu Asp Pro Pro Glu Cys Gly 435 440 445 Asn Gly Phe Val Glu Ala Gly Glu Glu Cys Asp Cys Gly Ser Val Gln 450 455 460 Glu Cys Ser Arg Ala Gly Gly Asn Cys Cys Lys Lys Cys Thr Leu Thr 465 470 475 480 His Asp Ala Met Cys Ser Asp Gly Leu Cys Cys Arg Arg Cys Lys Tyr 485 490 495 Glu Pro Arg Gly Val Ser Cys Arg Glu Ala Val Asn Glu Cys Asp Ile 500 505 510 Ala Glu Thr Cys Thr Gly Asp Ser Ser Gln Cys Pro Pro Asn Leu His 515 520 525 Lys Leu Asp Gly Tyr Tyr Cys Asp His Glu Gln Gly Arg Cys Tyr Gly 530 535 540 Gly Arg Cys Lys Thr Arg Asp Arg Gln Cys Gln Val Leu Trp Gly His 545 550 555 560 Ala Ala Ala Asp Arg Phe Cys Tyr Glu Lys Leu Asn Val Glu Gly Thr 565 570 575 Glu Arg Gly Ser Cys Gly Arg Lys Gly Ser Gly Trp Val Gln Cys Ser 580 585 590 Lys Gln Asp Val Leu Cys Gly Phe Leu Leu Cys Val Asn Ile Ser Gly 595 600 605 Ala Pro Arg Leu Gly Asp Leu Val Gly Asp Ile Ser Ser Val Thr Phe 610 615 620 Tyr His Gln Gly Lys Glu Leu Asp Cys Arg Gly Gly His Val Gln Leu 625 630 635 640 Ala Asp Gly Ser Asp Leu Ser Tyr Val Glu Asp Gly Thr Ala Cys Gly 645 650 655 Pro Asn Met Leu Cys Leu Asp His Arg Cys Leu Pro Ala Ser Ala Phe 660 665 670 Asn Phe Ser Thr Cys Pro Gly Ser Gly Glu Arg Arg Ile Cys Ser His 675 680 685 His Gly Val Cys Ser Asn Glu Gly Lys Cys Ile Cys Gln Pro Asp Trp 690 695 700 Thr Gly Lys Asp Cys Ser Ile His Asn Pro Leu Pro Thr Ser Pro Pro 705 710 715 720 Thr Gly Glu Thr Glu Arg Tyr Lys Gly Pro Ser Gly Thr Asn Ile Ile 725 730 735 Ile Gly Ser Ile Ala Gly Ala Val Leu Val Ala Ala Ile Val Leu Gly 740 745 750 Gly Thr Gly Trp Gly Phe Lys Asn Ile Arg Arg Gly Arg Ser Gly Gly 755 760 765 Ala 769 。
【0053】配列番号:5 配列の長さ:1464 配列の型:核酸 鎖の数:二本鎖 トポロジー:直鎖状 配列の種類:cDNA to mRNA 起源 生物名:ホモサピエンス 直接の起源 ライブラリー名:ヒト胎児脳cDNAライブラリー 配列の特徴 特徴を表す記号:CDS 存在位置:1..1464 特徴を決定した方法:E 配列 CTC CTC TCC TCG CAA TAC GTG GAG CGC CAC TTC AGC CGG GAG GGG ACA 48 Leu Leu Ser Ser Gln Tyr Val Glu Arg His Phe Ser Arg Glu Gly Thr 1 5 10 15 ACC CAG CAC AGC ACC GGG GCT GGA GAC CAC TGC TAC TAC CAG GGG AAG 96 Thr Gln His Ser Thr Gly Ala Gly Asp His Cys Tyr Tyr Gln Gly Lys 20 25 30 CTC CGG GGG AAC CCG CAC TCC TTC GCC GCC CTC TCC ACC TGC CAG GGG 144 Leu Arg Gly Asn Pro His Ser Phe Ala Ala Leu Ser Thr Cys Gln Gly 35 40 45 CTG CAT GGG GTC TTC TCT GAT GGG AAC TTG ACT TAC ATC GTG GAG CCC 192 Leu His Gly Val Phe Ser Asp Gly Asn Leu Thr Tyr Ile Val Glu Pro 50 55 60 CAA GAG GTG GCT GGA CCT TGG GGA GCC CCT CAG GGA CCC CTT CCC CAC 240 Gln Glu Val Ala Gly Pro Trp Gly Ala Pro Gln Gly Pro Leu Pro His 65 70 75 80 CTC ATT TAC CGG ACC CCT CTC CTC CCA GAT CCC CTC GGA TGC AGG GAA 288 Leu Ile Tyr Arg Thr Pro Leu Leu Pro Asp Pro Leu Gly Cys Arg Glu 85 90 95 CCA GGC TGC CTG TTT GCT GTG CCT GCC CAG TCG GCT CCT CCA AAC CGG 336 Pro Gly Cys Leu Phe Ala Val Pro Ala Gln Ser Ala Pro Pro Asn Arg 100 105 110 CCG AGG CTG AGA AGG AAA AGG CAG GTC CGC CGG GGC CAC CCT ACA GTG 384 Pro Arg Leu Arg Arg Lys Arg Gln Val Arg Arg Gly His Pro Thr Val 115 120 125 CAC AGT GAA ACC AAG TAT GTG GAG CTA ATT GTG ATC AAC GAC CAC CAG 432 His Ser Glu Thr Lys Tyr Val Glu Leu Ile Val Ile Asn Asp His Gln 130 135 140 CTG TTC GAG CAG ATG CGA CAG TCG GTG GTC CTC ACC AGC AAC TTT GCC 480 Leu Phe Glu Gln Met Arg Gln Ser Val Val Leu Thr Ser Asn Phe Ala 145 150 155 160 AAG TCC GTG GTG AAC CTG GCC GAT GTG ATA TAC AAG GAG CAG CTC AAC 528 Lys Ser Val Val Asn Leu Ala Asp Val Ile Tyr Lys Glu Gln Leu Asn 165 170 175 ACT CGC ATC GTC CTG GTT GCC ATG GAA ACA TGG GCA GAT GGG GAC AAG 576 Thr Arg Ile Val Leu Val Ala Met Glu Thr Trp Ala Asp Gly Asp Lys 180 185 190 ATC CAG GTG CAG GAT GAC CTC CTG GAG ACC CTG GCC CGG CTC ATG GTC 624 Ile Gln Val Gln Asp Asp Leu Leu Glu Thr Leu Ala Arg Leu Met Val 195 200 205 TAC CGA CGG GAG GGT CTG CCT GAG CCC AGT AAT GCC ACC CAC CTC TTC 672 Tyr Arg Arg Glu Gly Leu Pro Glu Pro Ser Asn Ala Thr His Leu Phe 210 215 220 TCG GGC AGG ACC TTC CAG AGC ACG AGC AGC GGG GCA GCC TAC GTG GGG 720 Ser Gly Arg Thr Phe Gln Ser Thr Ser Ser Gly Ala Ala Tyr Val Gly 225 230 235 240 GGC ATA TGC TCC CTG TCC CAT GGC GGG GGT GTG AAC GAG TAC GGC AAC 768 Gly Ile Cys Ser Leu Ser His Gly Gly Gly Val Asn Glu Tyr Gly Asn 245 250 255 ATG GGG GCG ATG GCC GTG ACC CTT GCC CAG ACG CTG GGA CAG AAC CTG 816 Met Gly Ala Met Ala Val Thr Leu Ala Gln Thr Leu Gly Gln Asn Leu 260 265 270 GGC ATG ATG TGG AAC AAA CAC CGG AGC TCG GCA GGG GAC TGC AAG TGT 864 Gly Met Met Trp Asn Lys His Arg Ser Ser Ala Gly Asp Cys Lys Cys 275 280 285 CCA GAC ATC TGG CTG GGC TGC ATC ATG GAG GAC ACT GGG TTC TAC CTG 912 Pro Asp Ile Trp Leu Gly Cys Ile Met Glu Asp Thr Gly Phe Tyr Leu 290 295 300 CCC CGC AAG TTC TCT CGC TGC AGC ATC GAC GAG TAC AAC CAG TTT CTG 960 Pro Arg Lys Phe Ser Arg Cys Ser Ile Asp Glu Tyr Asn Gln Phe Leu 305 310 315 320 CAG GAG GGT GGT GGC AGC TGC CTC TTC AAC AAG CCC CTC AAG CTC CTG 1008 Gln Glu Gly Gly Gly Ser Cys Leu Phe Asn Lys Pro Leu Lys Leu Leu 325 330 335 GAC CCC CCA GAG TGC GGG AAC GGC TTC GTG GAG GCA GGG GAG GAG TGC 1056 Asp Pro Pro Glu Cys Gly Asn Gly Phe Val Glu Ala Gly Glu Glu Cys 340 345 350 GAC TGC GGC TCG GTG CAG GAG TGC AGC CGC GCA GGT GGC AAC TGC TGC 1104 Asp Cys Gly Ser Val Gln Glu Cys Ser Arg Ala Gly Gly Asn Cys Cys 355 360 365 AAG AAA TGC ACC CTG ACT CAC GAC GCC ATG TGC AGC GAC GGG CTC TGC 1152 Lys Lys Cys Thr Leu Thr His Asp Ala Met Cys Ser Asp Gly Leu Cys 370 375 380 TGT CGC CGC TGC AAG TAC GAA CCA CGG GGT GTG TCc TGC CGA GAG GCC 1200 Cys Arg Arg Cys Lys Tyr Glu Pro Arg Gly Val Ser Cys Arg Glu Ala 385 390 395 400 GTG AAC GAG TGC GAC ATC GCG GAG ACC TGC ACC GGG GAC TCT AGC CAG 1248 Val Asn Glu Cys Asp Ile Ala Glu Thr Cys Thr Gly Asp Ser Ser Gln 405 410 415 TGC CCG CCT AAC CTG CAC AAG CTG GAC GGT TAC TAC TGT GAC CAT GAG 1296 Cys Pro Pro Asn Leu His Lys Leu Asp Gly Tyr Tyr Cys Asp His Glu 420 425 430 CAG GGC CGC TGC TAC GGA GGT CGC TGC AAA ACC CGG GAC CGG CAG TGC 1344 Gln Gly Arg Cys Tyr Gly Gly Arg Cys Lys Thr Arg Asp Arg Gln Cys 435 440 445 CAG GTT CTT TGG GGC CAT GCG GCT GCT GAT CGC TTC TGC TAC GAG AAG 1392 Gln Val Leu Trp Gly His Ala Ala Ala Asp Arg Phe Cys Tyr Glu Lys 450 455 460 CTG AAT GTG GAG GGG ACG GAG CGT GGG AGC TGT GGG CGC AAG GGA TCC 1440 Leu Asn Val Glu Gly Thr Glu Arg Gly Ser Cys Gly Arg Lys Gly Ser 465 470 475 480 GGC TGG GTC CAG TGC AGT AAG CAG 1464 Gly Trp Val Gln Cys Ser Lys Gln 485 。
【0054】配列番号:6 配列の長さ:2923 配列の型:核酸 鎖の数:二本鎖 トポロジー:直鎖状 配列の種類:cDNA to mRNA 起源 生物名:ホモサピエンス 直接の起源 ライブラリー名:ヒト胎児脳cDNAライブラリー 配列の特徴 特徴を表す記号:5’UTR 存在位置:1..27 特徴を決定した方法:E 特徴を表す記号:3’UTR 存在位置:1600..2923 特徴を決定した方法:E 特徴を表す記号:CDS 存在位置:28..1599 特徴を決定した方法:E 配列 GCGTTTACTG GCAAACCGCA TTTGTAA ATG TGC TGG CTG AGC CAC CAA CTC 51 Met Cys Trp Leu Ser His Gln Leu 1 5 CTC TCC TCG CAA TAC GTG GAG CGC CAC TTC AGC CGG GAG GGG ACA ACC 99 Leu Ser Ser Gln Tyr Val Glu Arg His Phe Ser Arg Glu Gly Thr Thr 10 15 20 CAG CAC AGC ACC GGG GCT GGA GAC CAC TGC TAC TAC CAG GGG AAG CTC 147 Gln His Ser Thr Gly Ala Gly Asp His Cys Tyr Tyr Gln Gly Lys Leu 25 30 35 40 CGG GGG AAC CCG CAC TCC TTC GCC GCC CTC TCC ACC TGC CAG GGG CTG 195 Arg Gly Asn Pro His Ser Phe Ala Ala Leu Ser Thr Cys Gln Gly Leu 45 50 55 CAT GGG GTC TTC TCT GAT GGG AAC TTG ACT TAC ATC GTG GAG CCC CAA 243 His Gly Val Phe Ser Asp Gly Asn Leu Thr Tyr Ile Val Glu Pro Gln 60 65 70 GAG GTG GCT GGA CCT TGG GGA GCC CCT CAG GGA CCC CTT CCC CAC CTC 291 Glu Val Ala Gly Pro Trp Gly Ala Pro Gln Gly Pro Leu Pro His Leu 75 80 85 ATT TAC CGG ACC CCT CTC CTC CCA GAT CCC CTC GGA TGC AGG GAA CCA 339 Ile Tyr Arg Thr Pro Leu Leu Pro Asp Pro Leu Gly Cys Arg Glu Pro 90 95 100 GGC TGC CTG TTT GCT GTG CCT GCC CAG TCG GCT CCT CCA AAC CGG CCG 387 Gly Cys Leu Phe Ala Val Pro Ala Gln Ser Ala Pro Pro Asn Arg Pro 105 110 115 120 AGG CTG AGA AGG AAA AGG CAG GTC CGC CGG GGC CAC CCT ACA GTG CAC 435 Arg Leu Arg Arg Lys Arg Gln Val Arg Arg Gly His Pro Thr Val His 125 130 135 AGT GAA ACC AAG TAT GTG GAG CTA ATT GTG ATC AAC GAC CAC CAG CTG 483 Ser Glu Thr Lys Tyr Val Glu Leu Ile Val Ile Asn Asp His Gln Leu 140 145 150 TTC GAG CAG ATG CGA CAG TCG GTG GTC CTC ACC AGC AAC TTT GCC AAG 531 Phe Glu Gln Met Arg Gln Ser Val Val Leu Thr Ser Asn Phe Ala Lys 155 160 165 TCC GTG GTG AAC CTG GCC GAT GTG ATA TAC AAG GAG CAG CTC AAC ACT 579 Ser Val Val Asn Leu Ala Asp Val Ile Tyr Lys Glu Gln Leu Asn Thr 170 175 180 CGC ATC GTC CTG GTT GCC ATG GAA ACA TGG GCA GAT GGG GAC AAG ATC 627 Arg Ile Val Leu Val Ala Met Glu Thr Trp Ala Asp Gly Asp Lys Ile 185 190 195 200 CAG GTG CAG GAT GAC CTC CTG GAG ACC CTG GCC CGG CTC ATG GTC TAC 675 Gln Val Gln Asp Asp Leu Leu Glu Thr Leu Ala Arg Leu Met Val Tyr 205 210 215 CGA CGG GAG GGT CTG CCT GAG CCC AGT AAT GCC ACC CAC CTC TTC TCG 723 Arg Arg Glu Gly Leu Pro Glu Pro Ser Asn Ala Thr His Leu Phe Ser 220 225 230 GGC AGG ACC TTC CAG AGC ACG AGC AGC GGG GCA GCC TAC GTG GGG GGC 771 Gly Arg Thr Phe Gln Ser Thr Ser Ser Gly Ala Ala Tyr Val Gly Gly 235 240 245 ATA TGC TCC CTG TCC CAT GGC GGG GGT GTG AAC GAG TAC GGC AAC ATG 819 Ile Cys Ser Leu Ser His Gly Gly Gly Val Asn Glu Tyr Gly Asn Met 250 255 260 GGG GCG ATG GCC GTG ACC CTT GCC CAG ACG CTG GGA CAG AAC CTG GGC 867 Gly Ala Met Ala Val Thr Leu Ala Gln Thr Leu Gly Gln Asn Leu Gly 265 270 275 280 ATG ATG TGG AAC AAA CAC CGG AGC TCG GCA GGG GAC TGC AAG TGT CCA 915 Met Met Trp Asn Lys His Arg Ser Ser Ala Gly Asp Cys Lys Cys Pro 285 290 295 GAC ATC TGG CTG GGC TGC ATC ATG GAG GAC ACT GGG TTC TAC CTG CCC 963 Asp Ile Trp Leu Gly Cys Ile Met Glu Asp Thr Gly Phe Tyr Leu Pro 300 305 310 CGC AAG TTC TCT CGC TGC AGC ATC GAC GAG TAC AAC CAG TTT CTG CAG 1011 Arg Lys Phe Ser Arg Cys Ser Ile Asp Glu Tyr Asn Gln Phe Leu Gln 315 320 325 GAG GGT GGT GGC AGC TGC CTC TTC AAC AAG CCC CTC AAG CTC CTG GAC 1059 Glu Gly Gly Gly Ser Cys Leu Phe Asn Lys Pro Leu Lys Leu Leu Asp 330 335 340 CCC CCA GAG TGC GGG AAC GGC TTC GTG GAG GCA GGG GAG GAG TGC GAC 1107 Pro Pro Glu Cys Gly Asn Gly Phe Val Glu Ala Gly Glu Glu Cys Asp 345 350 355 360 TGC GGC TCG GTG CAG GAG TGC AGC CGC GCA GGT GGC AAC TGC TGC AAG 1155 Cys Gly Ser Val Gln Glu Cys Ser Arg Ala Gly Gly Asn Cys Cys Lys 365 370 375 AAA TGC ACC CTG ACT CAC GAC GCC ATG TGC AGC GAC GGG CTC TGC TGT 1203 Lys Cys Thr Leu Thr His Asp Ala Met Cys Ser Asp Gly Leu Cys Cys 380 385 390 CGC CGC TGC AAG TAC GAA CCA CGG GGT GTG TCc TGC CGA GAG GCC GTG 1251 Arg Arg Cys Lys Tyr Glu Pro Arg Gly Val Ser Cys Arg Glu Ala Val 395 400 405 AAC GAG TGC GAC ATC GCG GAG ACC TGC ACC GGG GAC TCT AGC CAG TGC 1299 Asn Glu Cys Asp Ile Ala Glu Thr Cys Thr Gly Asp Ser Ser Gln Cys 410 415 420 CCG CCT AAC CTG CAC AAG CTG GAC GGT TAC TAC TGT GAC CAT GAG CAG 1347 Pro Pro Asn Leu His Lys Leu Asp Gly Tyr Tyr Cys Asp His Glu Gln 425 430 435 440 GGC CGC TGC TAC GGA GGT CGC TGC AAA ACC CGG GAC CGG CAG TGC CAG 1395 Gly Arg Cys Tyr Gly Gly Arg Cys Lys Thr Arg Asp Arg Gln Cys Gln 445 450 455 GTT CTT TGG GGC CAT GCG GCT GCT GAT CGC TTC TGC TAC GAG AAG CTG 1443 Val Leu Trp Gly His Ala Ala Ala Asp Arg Phe Cys Tyr Glu Lys Leu 460 465 470 AAT GTG GAG GGG ACG GAG CGT GGG AGC TGT GGG CGC AAG GGA TCC GGC 1491 Asn Val Glu Gly Thr Glu Arg Gly Ser Cys Gly Arg Lys Gly Ser Gly 475 480 485 TGG GTC CAG TGC AGT AAG CAG CCC CAA CAG GGA CGT GCT GTG TGG CTT 1539 Trp Val Gln Cys Ser Lys Gln Pro Gln Gln Gly Arg Ala Val Trp Leu 490 495 500 CCT CCT CTG TGT CAA CAT CTC TGG AGC TCC TCG GCT AGG GGA CCT GGT 1587 Pro Pro Leu Cys Gln His Leu Trp Ser Ser Ser Ala Arg Gly Pro Gly 505 510 515 520 GGG AGA CAT CAG TAGTGTCACC TTCTACCACC AGGGCAAGGA GCTGGACTGC 1639 Gly Arg His Gln AGGGGAGGCC ACGTGCAGCT GGCGGACGGC TCTGACCTGA GCTATGTGGA GGATGGCACA 1699 GCCTGCGGGC CTAACATGTT GTGCCTGGAC CATCGCTGCC TGCCAGCTTC TGCCTTCAAC 1759 TTCAGCACCT GCCCCGGCAG TGGGGAGCGC CGGATTTGCT CCCACCACGG GGTCTGCAGC 1819 AATGAAGGGA AGTGCATCTG TCAGCCAGAC TGGACAGGCA AAGACTGCAG TATCCATAAC 1879 CCCCTGCCCA CGTCCCCACC CACGGGGGAG ACGGAGAGAT ATAAAGGTCC CAGCGGCACC 1939 AACATCATCA TTGGCTCCAT CGCTGGGGCT GTCCTGGTTG CAGCCATCGT CCTGGGCGGC 1999 ACGGGCTGGG GATTTAAAAA CATTCGCCGA GGAAGGTCCG GAGGGGCCTA AGTGCCACCC 2059 TCCTCCCTCC AAGCCTGGCA CCCACCGTCT CGGCCCTGAA CCACGAGGCT GCCCCCATCC 2119 AGCCACGGAG GGAGGCACCA TGCAAATGTC TTCCAGGTCC AAACCCTTCA ACTCCTGGCT 2179 CCGCAGGGGT TTGGGTGGGG GCTGTGGCCC TGCCCTTGGC ACCACCAGGG TGGACCAGGC 2239 CTGGAGGGCA CTTCCTCCAC AGTCCCCCAC CCACCTCCTG CGGCTCAGCC TTGCACACCC 2299 ACTGCCCCGT GTGAATGTAG CTTCCACCTC ATGGATTGCC ACAGCTCAAC TCGGGGGCAC 2359 CTGGAGGGAT GCCCCCAGGC AGCCACCAGT GGACCTAGCC TGGATGGCCC CTCCTTGCAA 2419 CCAGGCAGCT GAGACCAGGG TCTTATCTCT CTGGGACCTA GGGGGACGGG GCTGACATCT 2479 ACATTTTTTA AAACTGAATC TTAATCGATG AATGTAAACT CGGGGGTGCT GGGGCCAGGG 2539 CAGATGTGGG GATGTTTTGA CATTTACAGG AGGCCCCGGA GAAACTGAGG TATGGCCATG 2599 CCCTAGACCC TCCCCAAGGA TGACCACACC CGAAGTCCTG TCACTGAGCA CAGTCAGGGG 2659 CTGGGCATCC CAGCTTGCCC CCGCTTAGCC CCGCTGAGCT TGGAGGAAGT ATGAGTGCTG 2719 ATTCAAACCA AAGCTGCCTG TGCCATGCCC AAGGCCTAGG TTATGGGTAC GGCAACCACA 2779 TGTCCCAGAT CGTCTCCAAT TCGAAAACAA CCGTCCTGCT GTCCCTGTCA GGACACATGG 2839 ATTTTGGCAG GGCGGGGGGG GGTTCTAGAA AATATAGGTT CCTATAATAA AATGGCACCT 2899 TCCCCCTTTA AAAAAAAAAA AAAA 2923 。
【0055】配列番号:7 配列の長さ:2913 配列の型:核酸 鎖の数:二本鎖 トポロジー:直鎖状 配列の種類:cDNA to mRNA 起源 生物名:ホモサピエンス 直接の起源 ライブラリー名:ヒト胎児脳cDNAライブラリー 配列の特徴 特徴を表す記号:5’UTR 存在位置:1..27 特徴を決定した方法:E 特徴を表す記号:3’UTR 存在位置:2038..2913 特徴を決定した方法:E 特徴を表す記号:CDS 存在位置:28..2037 特徴を決定した方法:E 配列 GCGTTTACTG GCAAACCGCA TTTGTAA ATG TGC TGG CTG AGC CAC CAA CTC 51 Met Cys Trp Leu Ser His Gln Leu 1 5 CTC TCC TCG CAA TAC GTG GAG CGC CAC TTC AGC CGG GAG GGG ACA ACC 99 Leu Ser Ser Gln Tyr Val Glu Arg His Phe Ser Arg Glu Gly Thr Thr 10 15 20 CAG CAC AGC ACC GGG GCT GGA GAC CAC TGC TAC TAC CAG GGG AAG CTC 147 Gln His Ser Thr Gly Ala Gly Asp His Cys Tyr Tyr Gln Gly Lys Leu 25 30 35 40 CGG GGG AAC CCG CAC TCC TTC GCC GCC CTC TCC ACC TGC CAG GGG CTG 195 Arg Gly Asn Pro His Ser Phe Ala Ala Leu Ser Thr Cys Gln Gly Leu 45 50 55 CAT GGG GTC TTC TCT GAT GGG AAC TTG ACT TAC ATC GTG GAG CCC CAA 243 His Gly Val Phe Ser Asp Gly Asn Leu Thr Tyr Ile Val Glu Pro Gln 60 65 70 GAG GTG GCT GGA CCT TGG GGA GCC CCT CAG GGA CCC CTT CCC CAC CTC 291 Glu Val Ala Gly Pro Trp Gly Ala Pro Gln Gly Pro Leu Pro His Leu 75 80 85 ATT TAC CGG ACC CCT CTC CTC CCA GAT CCC CTC GGA TGC AGG GAA CCA 339 Ile Tyr Arg Thr Pro Leu Leu Pro Asp Pro Leu Gly Cys Arg Glu Pro 90 95 100 GGC TGC CTG TTT GCT GTG CCT GCC CAG TCG GCT CCT CCA AAC CGG CCG 387 Gly Cys Leu Phe Ala Val Pro Ala Gln Ser Ala Pro Pro Asn Arg Pro 105 110 115 120 AGG CTG AGA AGG AAA AGG CAG GTC CGC CGG GGC CAC CCT ACA GTG CAC 435 Arg Leu Arg Arg Lys Arg Gln Val Arg Arg Gly His Pro Thr Val His 125 130 135 AGT GAA ACC AAG TAT GTG GAG CTA ATT GTG ATC AAC GAC CAC CAG CTG 483 Ser Glu Thr Lys Tyr Val Glu Leu Ile Val Ile Asn Asp His Gln Leu 140 145 150 TTC GAG CAG ATG CGA CAG TCG GTG GTC CTC ACC AGC AAC TTT GCC AAG 531 Phe Glu Gln Met Arg Gln Ser Val Val Leu Thr Ser Asn Phe Ala Lys 155 160 165 TCC GTG GTG AAC CTG GCC GAT GTG ATA TAC AAG GAG CAG CTC AAC ACT 579 Ser Val Val Asn Leu Ala Asp Val Ile Tyr Lys Glu Gln Leu Asn Thr 170 175 180 CGC ATC GTC CTG GTT GCC ATG GAA ACA TGG GCA GAT GGG GAC AAG ATC 627 Arg Ile Val Leu Val Ala Met Glu Thr Trp Ala Asp Gly Asp Lys Ile 185 190 195 200 CAG GTG CAG GAT GAC CTC CTG GAG ACC CTG GCC CGG CTC ATG GTC TAC 675 Gln Val Gln Asp Asp Leu Leu Glu Thr Leu Ala Arg Leu Met Val Tyr 205 210 215 CGA CGG GAG GGT CTG CCT GAG CCC AGT AAT GCC ACC CAC CTC TTC TCG 723 Arg Arg Glu Gly Leu Pro Glu Pro Ser Asn Ala Thr His Leu Phe Ser 220 225 230 GGC AGG ACC TTC CAG AGC ACG AGC AGC GGG GCA GCC TAC GTG GGG GGC 771 Gly Arg Thr Phe Gln Ser Thr Ser Ser Gly Ala Ala Tyr Val Gly Gly 235 240 245 ATA TGC TCC CTG TCC CAT GGC GGG GGT GTG AAC GAG TAC GGC AAC ATG 819 Ile Cys Ser Leu Ser His Gly Gly Gly Val Asn Glu Tyr Gly Asn Met 250 255 260 GGG GCG ATG GCC GTG ACC CTT GCC CAG ACG CTG GGA CAG AAC CTG GGC 867 Gly Ala Met Ala Val Thr Leu Ala Gln Thr Leu Gly Gln Asn Leu Gly 265 270 275 280 ATG ATG TGG AAC AAA CAC CGG AGC TCG GCA GGG GAC TGC AAG TGT CCA 915 Met Met Trp Asn Lys His Arg Ser Ser Ala Gly Asp Cys Lys Cys Pro 285 290 295 GAC ATC TGG CTG GGC TGC ATC ATG GAG GAC ACT GGG TTC TAC CTG CCC 963 Asp Ile Trp Leu Gly Cys Ile Met Glu Asp Thr Gly Phe Tyr Leu Pro 300 305 310 CGC AAG TTC TCT CGC TGC AGC ATC GAC GAG TAC AAC CAG TTT CTG CAG 1011 Arg Lys Phe Ser Arg Cys Ser Ile Asp Glu Tyr Asn Gln Phe Leu Gln 315 320 325 GAG GGT GGT GGC AGC TGC CTC TTC AAC AAG CCC CTC AAG CTC CTG GAC 1059 Glu Gly Gly Gly Ser Cys Leu Phe Asn Lys Pro Leu Lys Leu Leu Asp 330 335 340 CCC CCA GAG TGC GGG AAC GGC TTC GTG GAG GCA GGG GAG GAG TGC GAC 1107 Pro Pro Glu Cys Gly Asn Gly Phe Val Glu Ala Gly Glu Glu Cys Asp 345 350 355 360 TGC GGC TCG GTG CAG GAG TGC AGC CGC GCA GGT GGC AAC TGC TGC AAG 1155 Cys Gly Ser Val Gln Glu Cys Ser Arg Ala Gly Gly Asn Cys Cys Lys 365 370 375 AAA TGC ACC CTG ACT CAC GAC GCC ATG TGC AGC GAC GGG CTC TGC TGT 1203 Lys Cys Thr Leu Thr His Asp Ala Met Cys Ser Asp Gly Leu Cys Cys 380 385 390 CGC CGC TGC AAG TAC GAA CCA CGG GGT GTG TCc TGC CGA GAG GCC GTG 1251 Arg Arg Cys Lys Tyr Glu Pro Arg Gly Val Ser Cys Arg Glu Ala Val 395 400 405 AAC GAG TGC GAC ATC GCG GAG ACC TGC ACC GGG GAC TCT AGC CAG TGC 1299 Asn Glu Cys Asp Ile Ala Glu Thr Cys Thr Gly Asp Ser Ser Gln Cys 410 415 420 CCG CCT AAC CTG CAC AAG CTG GAC GGT TAC TAC TGT GAC CAT GAG CAG 1347 Pro Pro Asn Leu His Lys Leu Asp Gly Tyr Tyr Cys Asp His Glu Gln 425 430 435 440 GGC CGC TGC TAC GGA GGT CGC TGC AAA ACC CGG GAC CGG CAG TGC CAG 1395 Gly Arg Cys Tyr Gly Gly Arg Cys Lys Thr Arg Asp Arg Gln Cys Gln 445 450 455 GTT CTT TGG GGC CAT GCG GCT GCT GAT CGC TTC TGC TAC GAG AAG CTG 1443 Val Leu Trp Gly His Ala Ala Ala Asp Arg Phe Cys Tyr Glu Lys Leu 460 465 470 AAT GTG GAG GGG ACG GAG CGT GGG AGC TGT GGG CGC AAG GGA TCC GGC 1491 Asn Val Glu Gly Thr Glu Arg Gly Ser Cys Gly Arg Lys Gly Ser Gly 475 480 485 TGG GTC CAG TGC AGT AAG CAG GAC GTG CTG TGT GGC TTC CTC CTC TGT 1539 Trp Val Gln Cys Ser Lys Gln Asp Val Leu Cys Gly Phe Leu Leu Cys 490 495 500 GTC AAC ATC TCT GGA GCT CCT CGG CTA GGG GAC CTG GTG GGA GAC ATC 1587 Val Asn Ile Ser Gly Ala Pro Arg Leu Gly Asp Leu Val Gly Asp Ile 505 510 515 520 AGT AGT GTC ACC TTC TAC CAC CAG GGC AAG GAG CTG GAC TGC AGG GGA 1635 Ser Ser Val Thr Phe Tyr His Gln Gly Lys Glu Leu Asp Cys Arg Gly 525 530 535 GGC CAC GTG CAG CTG GCG GAC GGC TCT GAC CTG AGC TAT GTG GAG GAT 1683 Gly His Val Gln Leu Ala Asp Gly Ser Asp Leu Ser Tyr Val Glu Asp 540 545 550 GGC ACA GCC TGC GGG CCT AAC ATG TTG TGC CTG GAC CAT CGC TGC CTG 1731 Gly Thr Ala Cys Gly Pro Asn Met Leu Cys Leu Asp His Arg Cys Leu 555 560 565 CCA GCT TCT GCC TTC AAC TTC AGC ACC TGC CCC GGC AGT GGG GAG CGC 1779 Pro Ala Ser Ala Phe Asn Phe Ser Thr Cys Pro Gly Ser Gly Glu Arg 570 575 580 CGG ATT TGC TCC CAC CAC GGG GTC TGC AGC AAT GAA GGG AAG TGC ATC 1827 Arg Ile Cys Ser His His Gly Val Cys Ser Asn Glu Gly Lys Cys Ile 585 590 595 600 TGT CAG CCA GAC TGG ACA GGC AAA GAC TGC AGT ATC CAT AAC CCC CTG 1875 Cys Gln Pro Asp Trp Thr Gly Lys Asp Cys Ser Ile His Asn Pro Leu 605 610 615 CCC ACG TCC CCA CCC ACG GGG GAG ACG GAG AGA TAT AAA GGT CCC AGC 1923 Pro Thr Ser Pro Pro Thr Gly Glu Thr Glu Arg Tyr Lys Gly Pro Ser 620 625 630 GGC ACC AAC ATC ATC ATT GGC TCC ATC GCT GGG GCT GTC CTG GTT GCA 1971 Gly Thr Asn Ile Ile Ile Gly Ser Ile Ala Gly Ala Val Leu Val Ala 635 640 645 GCC TAC GTC CTG GGC GGC ACG GGC TGG GGA TTT AAA AAC ATT CGC CGA 2019 Ala Ile Val Leu Gly Gly Thr Gly Trp Gly Phe Lys Asn Ile Arg Arg 650 655 660 GGA AGG TCC GGA GGG GCC TAAGTGCCAC CCTCCTCCCT CCAAGCCTGG 2067 Gly Arg Ser Gly Gly Ala 665 670 CACCCACCGT CTCGGCCCTG AACCACGAGG CTGCCCCCAT CCAGCCACGG AGGGAGGCAC 2127 CATGCAAATG TCTTCCAGGT CCAAACCCTT CAACTCCTGG CTCCGCAGGG GTTTGGGTGG 2187 GGGCTGTGGC CCTGCCCTTG GCACCACCAG GGTGGACCAG GCCTGGAGGG CACTTCCTCC 2247 ACAGTCCCCC ACCCACCTCC TGCGGCTCAG CCTTGCACAC CCACTGCCCC GTGTGAATGT 2307 AGCTTCCACC TCATGGATTG CCACAGCTCA ACTCGGGGGC ACCTGGAGGG ATGCCCCCAG 2367 GCAGCCACCA GTGGACCTAG CCTGGATGGC CCCTCCTTGC AACCAGGCAG CTGAGACCAG 2427 GGTCTTATCT CTCTGGGACC TAGGGGGACG GGGCTGACAT CTACATTTTT TAAAACTGAA 2487 TCTTAATCGA TGAATGTAAA CTCGGGGGTG CTGGGGCCAG GGCAGATGTG GGGATGTTTT 2547 GACATTTACA GGAGGCCCCG GAGAAACTGA GGTATGGCCA TGCCCTAGAC CCTCCCCAAG 2607 GATGACCACA CCCGAAGTCC TGTCACTGAG CACAGTCAGG GGCTGGGCAT CCCAGCTTGC 2667 CCCCGCTTAG CCCCGCTGAG CTTGGAGGAA GTATGAGTGC TGATTCAAAC CAAAGCTGCC 2727 TGTGCCATGC CCAAGGCCTA GGTTATGGGT ACGGCAACCA CATGTCCCAG ATCGTCTCCA 2787 ATTCGAAAAC AACCGTCCTG CTGTCCCTGT CAGGACACAT GGATTTTGGC AGGGCGGGGG 2847 GGGGTTCTAG AAAATATAGG TTCCTATAAT AAAATGGCAC CTTCCCCCTT TAAAAAAAAA 2907 AAAAAA 2913 。
【0056】配列番号:8 配列の長さ:3183 配列の型:核酸 鎖の数:二本鎖 トポロジー:直鎖状 配列の種類:cDNA to mRNA 起源 生物名:ホモサピエンス 直接の起源 ライブラリー名:ヒト脳cDNAライブラリー 配列の特徴 特徴を表す記号:3’UTR 存在位置:2308..3183 特徴を決定した方法:E 特徴を表す記号:CDS 存在位置:1..2307 特徴を決定した方法:E 配列 ATG AGG CTG CTG CGG CGC TGG GCG TTC GCG GCT CTG CTG CTG TCG CTG 48 Met Arg Leu Leu Arg Arg Trp Ala Phe Ala Ala Leu Leu Leu Ser Leu 1 5 10 15 CTC CCC ACG CCC GGT CTT GGG ACC CAA GGT ccT GCT GGA GCT CTG Cga 96 Leu Pro Thr Pro Gly Leu Gly Thr Gln Gly Pro Ala Gly Ala Leu Arg 20 25 30 TGG GGG GGC TTA CCC CAG CTG GGA GGC CCA GGA GCC CCT GAG GTC ACG 144 Trp Gly Gly Leu Pro Gln Leu Gly Gly Pro Gly Ala Pro Glu Val Thr 35 40 45 GAA CCC AGC CGT CTG GTT AGG GAG AGC TCC GGG GGA GAG GTC CGA AAG 192 Glu Pro Ser Arg Leu Val Arg Glu Ser Ser Gly Gly Glu Val Arg Lys 50 55 60 CAG CAG CTG GAC ACA AGG GTC CGC CAG GAG CCA CCA GGG GGC CCG CCT 240 Gln Gln Leu Asp Thr Arg Val Arg Gln Glu Pro Pro Gly Gly Pro Pro 65 70 75 80 GTC CAT CTG GCC CAG GTG AGT TTC GTC ATC CCA GCC TTC AAC TCA AAC 288 Val His Leu Ala Gln Val Ser Phe Val Ile Pro Ala Phe Asn Ser Asn 85 90 95 TTC ACC CTG GAC CTG GAG CTG AAC CAC CAC CTC CTC TCC TCG CAA TAC 336 Phe Thr Leu Asp Leu Glu Leu Asn His His Leu Leu Ser Ser Gln Tyr 100 105 110 GTG GAG CGC CAC TTC AGC CGG GAG GGG ACA ACC CAG CAC AGC ACC GGG 384 Val Glu Arg His Phe Ser Arg Glu Gly Thr Thr Gln His Ser Thr Gly 115 120 125 GCT GGA GAC CAC TGC TAC TAC CAG GGG AAG CTC CGG GGG AAC CCG CAC 432 Ala Gly Asp His Cys Tyr Tyr Gln Gly Lys Leu Arg Gly Asn Pro His 130 135 140 TCC TTC GCC GCC CTC TCC ACC TGC CAG GGG CTG CAT GGG GTC TTC TCT 480 Ser Phe Ala Ala Leu Ser Thr Cys Gln Gly Leu His Gly Val Phe Ser 145 150 155 160 GAT GGG AAC TTG ACT TAC ATC GTG GAG CCC CAA GAG GTG GCT GGA CCT 528 Asp Gly Asn Leu Thr Tyr Ile Val Glu Pro Gln Glu Val Ala Gly Pro 165 170 175 TGG GGA GCC CCT CAG GGA CCC CTT CCC CAC CTC ATT TAC CGG ACC CCT 576 Trp Gly Ala Pro Gln Gly Pro Leu Pro His Leu Ile Tyr Arg Thr Pro 180 185 190 CTC CTC CCA GAT CCC CTC GGA TGC AGG GAA CCA GGC TGC CTG TTT GCT 624 Leu Leu Pro Asp Pro Leu Gly Cys Arg Glu Pro Gly Cys Leu Phe Ala 195 200 205 GTG CCT GCC CAG TCG GCT CCT CCA AAC CGG CCG AGG CTG AGA AGG AAA 672 Val Pro Ala Gln Ser Ala Pro Pro Asn Arg Pro Arg Leu Arg Arg Lys 210 215 220 AGG CAG GTC CGC CGG GGC CAC CCT ACA GTG CAC AGT GAA ACC AAG TAT 720 Arg Gln Val Arg Arg Gly His Pro Thr Val His Ser Glu Thr Lys Tyr 225 230 235 240 GTG GAG CTA ATT GTG ATC AAC GAC CAC CAG CTG TTC GAG CAG ATG CGA 768 Val Glu Leu Ile Val Ile Asn Asp His Gln Leu Phe Glu Gln Met Arg 245 250 255 CAG TCG GTG GTC CTC ACC AGC AAC TTT GCC AAG TCC GTG GTG AAC CTG 816 Gln Ser Val Val Leu Thr Ser Asn Phe Ala Lys Ser Val Val Asn Leu 260 265 270 GCC GAT GTG ATA TAC AAG GAG CAG CTC AAC ACT CGC ATC GTC CTG GTT 864 Ala Asp Val Ile Tyr Lys Glu Gln Leu Asn Thr Arg Ile Val Leu Val 275 280 285 GCC ATG GAA ACA TGG GCA GAT GGG GAC AAG ATC CAG GTG CAG GAT GAC 912 Ala Met Glu Thr Trp Ala Asp Gly Asp Lys Ile Gln Val Gln Asp Asp 290 295 300 CTC CTG GAG ACC CTG GCC CGG CTC ATG GTC TAC CGA CGG GAG GGT CTG 960 Leu Leu Glu Thr Leu Ala Arg Leu Met Val Tyr Arg Arg Glu Gly Leu 305 310 315 320 CCT GAG CCC AGT AAT GCC ACC CAC CTC TTC TCG GGC AGG ACC TTC CAG 1008 Pro Glu Pro Ser Asn Ala Thr His Leu Phe Ser Gly Arg Thr Phe Gln 325 330 335 AGC ACG AGC AGC GGG GCA GCC TAC GTG GGG GGC ATA TGC TCC CTG TCC 1056 Ser Thr Ser Ser Gly Ala Ala Tyr Val Gly Gly Ile Cys Ser Leu Ser 340 345 350 CAT GGC GGG GGT GTG AAC GAG TAC GGC AAC ATG GGG GCG ATG GCC GTG 1104 His Gly Gly Gly Val Asn Glu Tyr Gly Asn Met Gly Ala Met Ala Val 355 360 365 ACC CTT GCC CAG ACG CTG GGA CAG AAC CTG GGC ATG ATG TGG AAC AAA 1152 Thr Leu Ala Gln Thr Leu Gly Gln Asn Leu Gly Met Met Trp Asn Lys 370 375 380 CAC CGG AGC TCG GCA GGG GAC TGC AAG TGT CCA GAC ATC TGG CTG GGC 1200 His Arg Ser Ser Ala Gly Asp Cys Lys Cys Pro Asp Ile Trp Leu Gly 385 390 395 400 TGC ATC ATG GAG GAC ACT GGG TTC TAC CTG CCC CGC AAG TTC TCT CGC 1248 Cys Ile Met Glu Asp Thr Gly Phe Tyr Leu Pro Arg Lys Phe Ser Arg 405 410 415 TGC AGC ATC GAC GAG TAC AAC CAG TTT CTG CAG GAG GGT GGT GGC AGC 1296 Cys Ser Ile Asp Glu Tyr Asn Gln Phe Leu Gln Glu Gly Gly Gly Ser 420 425 430 TGC CTC TTC AAC AAG CCC CTC AAG CTC CTG GAC CCC CCA GAG TGC GGG 1344 Cys Leu Phe Asn Lys Pro Leu Lys Leu Leu Asp Pro Pro Glu Cys Gly 435 440 445 AAC GGC TTC GTG GAG GCA GGG GAG GAG TGC GAC TGC GGC TCG GTG CAG 1392 Asn Gly Phe Val Glu Ala Gly Glu Glu Cys Asp Cys Gly Ser Val Gln 450 455 460 GAG TGC AGC CGC GCA GGT GGC AAC TGC TGC AAG AAA TGC ACC CTG ACT 1440 Glu Cys Ser Arg Ala Gly Gly Asn Cys Cys Lys Lys Cys Thr Leu Thr 465 470 475 480 CAC GAC GCC ATG TGC AGC GAC GGG CTC TGC TGT CGC CGC TGC AAG TAC 1488 His Asp Ala Met Cys Ser Asp Gly Leu Cys Cys Arg Arg Cys Lys Tyr 485 490 495 GAA CCA CGG GGT GTG TCC TGC CGA GAG GCC GTG AAC GAG TGC GAC ATC 1536 Glu Pro Arg Gly Val Ser Cys Arg Glu Ala Val Asn Glu Cys Asp Ile 500 505 510 GCG GAG ACC TGC ACC GGG GAC TCT AGC CAG TGC CCG CCT AAC CTG CAC 1584 Ala Glu Thr Cys Thr Gly Asp Ser Ser Gln Cys Pro Pro Asn Leu His 515 520 525 AAG CTG GAC GGT TAC TAC TGT GAC CAT GAG CAG GGC CGC TGC TAC GGA 1632 Lys Leu Asp Gly Tyr Tyr Cys Asp His Glu Gln Gly Arg Cys Tyr Gly 530 535 540 GGT CGC TGC AAA ACC CGG GAC CGG CAG TGC CAG GTT CTT TGG GGC CAT 1680 Gly Arg Cys Lys Thr Arg Asp Arg Gln Cys Gln Val Leu Trp Gly His 545 550 555 560 GCG GCT GCT GAT CGC TTC TGC TAC GAG AAG CTG AAT GTG GAG GGG ACG 1728 Ala Ala Ala Asp Arg Phe Cys Tyr Glu Lys Leu Asn Val Glu Gly Thr 565 570 575 GAG CGT GGG AGC TGT GGG CGC AAG GGA TCC GGC TGG GTC CAG TGC AGT 1776 Glu Arg Gly Ser Cys Gly Arg Lys Gly Ser Gly Trp Val Gln Cys Ser 580 585 590 AAG CAG GAC GTG CTG TGT GGC TTC CTC CTC TGT GTC AAC ATC TCT GGA 1824 Lys Gln Asp Val Leu Cys Gly Phe Leu Leu Cys Val Asn Ile Ser Gly 595 600 605 GCT CCT CGG CTA GGG GAC CTG GTG GGA GAC ATC AGT AGT GTC ACC TTC 1872 Ala Pro Arg Leu Gly Asp Leu Val Gly Asp Ile Ser Ser Val Thr Phe 610 615 620 TAC CAC CAG GGC AAG GAG CTG GAC TGC AGG GGA GGC CAC GTG CAG CTG 1920 Tyr His Gln Gly Lys Glu Leu Asp Cys Arg Gly Gly His Val Gln Leu 625 630 635 640 GCG GAC GGC TCT GAC CTG AGC TAT GTG GAG GAT GGC ACA GCC TGC GGG 1968 Ala Asp Gly Ser Asp Leu Ser Tyr Val Glu Asp Gly Thr Ala Cys Gly 645 650 655 CCT AAC ATG TTG TGC CTG GAC CAT CGC TGC CTG CCA GCT TCT GCC TTC 2016 Pro Asn Met Leu Cys Leu Asp His Arg Cys Leu Pro Ala Ser Ala Phe 660 665 670 AAC TTC AGC ACC TGC CCC GGC AGT GGG GAG CGC CGG ATT TGC TCC CAC 2064 Asn Phe Ser Thr Cys Pro Gly Ser Gly Glu Arg Arg Ile Cys Ser His 675 680 685 CAC GGG GTC TGC AGC AAT GAA GGG AAG TGC ATC TGT CAG CCA GAC TGG 2112 His Gly Val Cys Ser Asn Glu Gly Lys Cys Ile Cys Gln Pro Asp Trp 690 695 700 ACA GGC AAA GAC TGC AGT ATC CAT AAC CCC CTG CCC ACG TCC CCA CCC 2160 Thr Gly Lys Asp Cys Ser Ile His Asn Pro Leu Pro Thr Ser Pro Pro 705 710 715 720 ACG GGG GAG ACG GAG AGA TAT AAA GGT CCC AGC GGC ACC AAC ATC ATC 2208 Thr Gly Glu Thr Glu Arg Tyr Lys Gly Pro Ser Gly Thr Asn Ile Ile 725 730 735 ATT GGC TCC ATC GCT GGG GCT GTC CTG GTT GCA GCC ATC GTC CTG GGC 2256 Ile Gly Ser Ile Ala Gly Ala Val Leu Val Ala Ala Ile Val Leu Gly 740 745 750 GGC ACG GGC TGG GGA TTT AAA AAC ATT CGC CGA GGA AGG TCC GGA GGG 2304 Gly Thr Gly Trp Gly Phe Lys Asn Ile Arg Arg Gly Arg Ser Gly Gly 755 760 765 GCC TAAGTGCCAC CCTCCTCCCT CCAAGCCTGG CACCCACCGT CTCGGCCCTG 2357 Ala AACCACGAGG CTGCCCCCAT CCAGCCACGG AGGGAGGCAC CATGCAAATG TCTTCCAGGT 2417 CCAAACCCTT CAACTCCTGG CTCCGCAGGG GTTTGGGTGG GGGCTGTGGC CCTGCCCTTG 2477 GCACCACCAG GGTGGACCAG GCCTGGAGGG CACTTCCTCC ACAGTCCCCC ACCCACCTCC 2537 TGCGGCTCAG CCTTGCACAC CCACTGCCCC GTGTGAATGT AGCTTCCACC TCATGGATTG 2597 CCACAGCTCA ACTCGGGGGC ACCTGGAGGG ATGCCCCCAG GCAGCCACCA GTGGACCTAG 2657 CCTGGATGGC CCCTCCTTGC AACCAGGCAG CTGAGACCAG GGTCTTATCT CTCTGGGACC 2717 TAGGGGGACG GGGCTGACAT CTACATTTTT TAAAACTGAA TCTTAATCGA TGAATGTAAA 2777 CTCGGGGGTG CTGGGGCCAG GGCAGATGTG GGGATGTTTT GACATTTACA GGAGGCCCCG 2837 GAGAAACTGA GGTATGGCCA TGCCCTAGAC CCTCCCCAAG GATGACCACA CCCGAAGTCC 2897 TGTCACTGAG CACAGTCAGG GGCTGGGCAT CCCAGCTTGC CCCCGCTTAG CCCCGCTGAG 2957 CTTGGAGGAA GTATGAGTGC TGATTCAAAC CAAAGCTGCC TGTGCCATGC CCAAGGCCTA 3017 GGTTATGGGT ACGGCAACCA CATGTCCCAG ATCGTCTCCA ATTCGAAAAC AACCGTCCTG 3077 CTGTCCCTGT CAGGACACAT GGATTTTGGC AGGGCGGGGG GGGGTTCTAG AAAATATAGG 3137 TTCCTATAAT AAAATGGCAC CTTCCCCCTT TAAAAAAAAA AAAAAA 3183 。
【0057】配列番号:9 配列の長さ:9278 配列の型:核酸 鎖の数:二本鎖 トポロジー:直鎖状 配列の種類:Genomic DNA 起源 生物名:ホモサピエンス 直接の起源 ライブラリー名:ヒトDNAコスミドライブラリー 配列の特徴 特徴を表す記号:exon 1 存在位置:28..44 特徴を決定した方法:E 特徴を表す記号:exon 2 存在位置:308..374 特徴を決定した方法:E 特徴を表す記号:exon 3 存在位置:909..994 特徴を決定した方法:E 特徴を表す記号:exon 4 存在位置:1081..1156 特徴を決定した方法:E 特徴を表す記号:exon 5 存在位置:1591..1657 特徴を決定した方法:E 特徴を表す記号:exon 6 存在位置:1725..1792 特徴を決定した方法:E 特徴を表す記号:exon 7 存在位置:2182..2256 特徴を決定した方法:E 特徴を表す記号:exon 8 存在位置:2339..2410 特徴を決定した方法:E 特徴を表す記号:exon 9 存在位置:2588..2754 特徴を決定した方法:E 特徴を表す記号:exon 10 存在位置:3248..3332 特徴を決定した方法:E 特徴を表す記号:exon 11 存在位置:3445..3535 特徴を決定した方法:E 特徴を表す記号:exon 12 存在位置:3645..3696 特徴を決定した方法:E 特徴を表す記号:exon 13 存在位置:4014..4113 特徴を決定した方法:E 特徴を表す記号:exon 14 存在位置:4196..4267 特徴を決定した方法:E 特徴を表す記号:exon 15 存在位置:4386..4478 特徴を決定した方法:E 特徴を表す記号:exon 16 存在位置:4920..5000 特徴を決定した方法:E 特徴を表す記号:exon 17 存在位置:5347..5397 特徴を決定した方法:E 特徴を表す記号:exon 18 存在位置:5501..5564 特徴を決定した方法:E 特徴を表す記号:exon 19 存在位置:5767..5866 特徴を決定した方法:E 特徴を表す記号:exon 20 存在位置:6073..6202 特徴を決定した方法:E 特徴を表す記号:exon 21 存在位置:6300..6468 特徴を決定した方法:E 特徴を表す記号:exon 22 存在位置:6557..6671 特徴を決定した方法:E 特徴を表す記号:exon 23 存在位置:6756..6846 特徴を決定した方法:E 特徴を表す記号:exon 24 存在位置:7829..7846 特徴を決定した方法:E 特徴を表す記号:exon 25 存在位置:8165..9038 特徴を決定した方法:E 配列 GCGTTTACTG GCAAACCGCA TTTGTAA ATG TGC TGG CTG AGC CA NNNNNNNNNN 54 Met Cys Trp Leu Ser His 1 5 NNNNCCAGGT GAGTTTCGTC ATCCAGCCTT CAACTCAAAC TTCACCCTGG ACCTGGAGCT 114 GAACCAGTGA GNGTGGCCTT GAGCCCAAGA GGAAGGGCAG TGGTGGNNNG GGGGAGACAT 174 GGCTAGGGCC TGGCTGCTGG GGGTCTGGGG GTTGGGCCTG GCGAGAGGGG ACCTGGGTCC 234 TGACCTGAGG CGAGCCTAAA GCCCGACCTC ACCTCGCCCG TGACCCCCCT TCCTGCTGCC 294 CCCTCTGTCT CAG C CAA CTC CTC TCC TCG CAA TAC GTG GAG CGC CAC TTC 344 Gln Leu Leu Ser Ser Gln Tyr Val Glu Arg His Phe 10 15 AGC CGG GAG GGG ACA ACC CAG CAC AGC ACC GTGAGTGCCA CTGCTGGGGA 394 Ser Arg Glu Gly Thr Thr Gln His Ser Thr 20 25 CCGGGGCCGG GGATGGAAGG GAGGTGCTGT TTCTGTGGTT CTGTGGTCAC AGGTGTAGGG 454 ACAGGTGGCC ACTGGAGATG GGGTCCTGGG CCTGGCCCCT CAGCACCTTC CCTCTCTCCC 514 GACCCAGGAG GCTCTGAGGG TGGACAGTGG GCAGCTTAGT GCATAGGGCC CTGAAGTCCC 574 CTCACTTGGC CCCAGAGCTC TGACCCCCAG CCAGCCCACG TGGGGCCTAC AGGGACACTC 634 GTTCCGAGCA GGCTGCCAGG ATCCNNNNNN NNNNNNATAG ATGACGTGAA GGAGGCCCAG 694 AGGTTCCTAA CCCCAGAGGG CTAGGAACTT GCCCAGGGTG GCACGGCAAA TTAGGAGCAC 754 CAGCCATCTA GAAACAGGCT CCAGAGCCCC AGGNATACCC AGGGATNGTG GCCACCTGCA 814 CACAGGGCAG CTTCAGTGTC CCCCAAAAAG CCTTGAGGCC CATTGGCTGC CCCCGGCCTC 874 ATGCCAGCGT TCTGCTCACT GTTCTGCTCC TTAG GGG GCT GGA GAC CAC TGC TAC 929 Gly Ala Gly Asp His Cys Tyr 30 35 TAC CAG GGG AAG CTC CGG GGG AAC CCG CAC TCC TTC GCC GCC CTC TCC 977 Tyr Gln Gly Lys Leu Arg Gly Asn Pro His Ser Phe Ala Ala Leu Ser 40 45 50 ACC TGC CAG GGG CTG CA GTGAGTATGG GGAGGGGCCG GGCAGCTGGG 1024 Thr Cys Gln Gly Leu His 55 AGAAGCCTCT GGCCCAGGCC TGGGGACGGA GGGGAGCTGC GCCTCTCTCT CCACAG T 1081 GGG GTC TTC TCT GAT GGG AAC TTG ACT TAC ATC GTG GAG CCC CAA GAG 1129 Gly Val Phe Ser Asp Gly Asn Leu Thr Tyr Ile Val Glu Pro Gln Glu 60 65 70 GTG GCT GGA CCT TGG GGA GCC CCT CAG GTAAGCCCCA CACAACCCCT 1176 Val Ala Gly Pro Trp Gly Ala Pro Gln 75 80 TGCCATCCTC TCTGGTGGCC CTGCCAAGCT TGTCCCAACA GCTGTTGCTG CCACCTCTTC 1236 CTCCTCCGGC TCCTCCCTCA GTAACCCCAG CCTCACTGCC CTCTTCAGTG ACCCCAGCTC 1396 TGGTTCCCTC CCTCCTGTGC CCCAGCTCCC CCTGTGCCCC CAGCTCCAAT GTCCCATCTG 1356 TCCCATAAGT GACCTCCCAT TGGGCTCCAA TGTCCTTTGC CCCTGTCTCT CAGGGTGCCC 1416 CCAGGTCTTG ACCCCGGAAT CTGAGCATCT GGGAGATCAG ATCCGACATG GGAGCTGTGG 1476 CCAGTTCTGG GTCACCCCAG GGTGGGGTGG AGGCGAGGGC TGGATCTGGC CCCCGCCAAG 1536 TGGCCTGGAG CAGGCCCAGT TGGCACCCCA AGAACTAATT TCCCCTCATT GCAG GGA 1593 Gly CCC CTT CCC CAC CTC ATT TAC CGG ACC CCT CTC CTC CCA GAT CCC CTC 1641 Pro Leu Pro His Leu Ile Tyr Arg Thr Pro Leu Leu Pro Asp Pro Leu 85 90 95 GGA TGC AGG GAA CCA G GTAAGGGAGG GGAGGGGGGG TGGGGAGGGG CCNGGCTGTG 1697 Gly Cys Arg Glu Pro Gly 100 CCCCCCTCAC CTGCCCCTCC CCGACAG GC TGC CTG TTT GCT GTG CCT GCC CAG 1750 Cys Leu Phe Ala Val Pro Ala Gln 105 110 TCG GCT CCT CCA AAC CGG CCG AGG CTG AGA AGG AAA AGG CAG 1792 Ser Ala Pro Pro Asn Arg Pro Arg Leu Arg Arg Lys Arg Gln 115 120 125 GTACGGGGGC CCGCACAGAC CTCGGGCTGC AGAGACCTCG GGCTGCAGAG AGACCTCGGC 1852 CGTGGCCCAG AGCAGGAGGG CACCCTCATC TATGGCTGGG GCGAAGGAAG GCTCAGATGG 1912 ATGTGGCTGG GGGCCAGGGA CCGTGTCTGG GAGAAGCCCC CACCCCTTCC CTAATGCTGG 1972 CATCTACAGA GGCCCCATCC TGGGCAAACC GAGGCTGCCT GCCCTCATTC CAAAGCTGAG 2032 GAAGGACAGG ACCCTCTGCC AGTGGGGAGC TGGCACTGTC CCTGGCTGGA GTCCAGACCC 2092 CCCCATCCCC ACCGAGTCTG TTCCTGGCTT GGCCATGAGA TCAGTCAGAC ATGGAAGGGA 2152 CTGATTCCAA GTGCCCACCC ACCCCCCAG GTC CGC CGG GGC CAC CCT ACA GTG 2205 Val Arg Arg Gly His Pro Thr Val 130 135 CAC AGT GAA ACC AAG TAT GTG GAG CTA ATT GTG ATC AAC GAC CAC CAG 2253 His Ser Glu Thr Lys Tyr Val Glu Leu Ile Val Ile Asn Asp His Gln 140 145 150 CTG GTGAGTGCCA GGGCAGGGAC AGGGCGTGAC ACTGGGAGGC CCCTGAGGAG 2306 Leu CCTGGCCCTC CTCCCATTCT TCTCTCTCCC AG TTC GAG CAG ATG CGA CAG TCG 2359 Phe Glu Gln Met Arg Gln Ser 155 GTG GTC CTC ACC AGC AAC TTT GCC AAG TCC GTG GTG AAC CTG GCC GAT 2407 Val Val Leu Thr Ser Asn Phe Ala Lys Ser Val Val Asn Leu Ala Asp 160 165 170 175 GTG GTAAGCAGCT CTCCCTCCCT CCCTTCCCTC CTCCTCATGC CCCCCCACCC 2460 Val CACCACACAC ATTAGGGGGC ACTGTCAGCC CCTGGCTCCC ACTTCCTGGA GAGAACAGAC 2520 AGGCCCTCCT CCAGCCCTGG CCCCAACACC CACTCCCACC CTCCAGCCCC CCTCATCTTC 2580 TCCCCAG ATA TAC AAG GAG CAG CTC AAC ACT CGC ATC GTC CTG GTT GCC 2629 Ile Tyr Lys Glu Gln Leu Asn Thr Arg Ile Val Leu Val Ala 180 185 190 ATG GAA ACA TGG GCA GAT GGG GAC AAG ATC CAG GTG CAG GAT GAC CTC 2677 Met Glu Thr Trp Ala Asp Gly Asp Lys Ile Gln Val Gln Asp Asp Leu 195 200 205 CTG GAG ACC CTG GCC CGG CTC ATG GTC TAC CGA CGG GAG GGT CTG CCT 2725 Leu Glu Thr Leu Ala Arg Leu Met Val Tyr Arg Arg Glu Gly Leu Pro 210 215 220 GAG CCC AGT AAT GCC ACC CAC CTC TTC TC GTGAGTCCCC CACCCTGCAC 2774 Glu Pro Ser Asn Ala Thr His Leu Phe Ser 225 230 CTCCTGCCAG CCTCTGCTAG TTGCTACAGT GCTTGGGATT ACTTAACACC TGCCCTGTGC 2834 TGGCTGCTCC TCTCAGAGTC TGGGGACTGG GCTCACCTTG CACCTGCCAC CTACCCCCAG 2894 CCACATGCAA CAGCTGGGCA TCATCCCCTG AATCTGAGGT TGATGCCCTT GTCTTAGCCC 2954 TGGTGGTCCT CTTCTGCCTC TCACCTCCCC TTAGTTCTGT CTTTCCCTTC AACTGTCCCN 3014 NNNNNNNNNN NAGAGTGAAA CTCTGTCTCA AAAGAAAAAN AAAANAAAAG AAGAAAAAAA 3074 AGAACCCAAG GAGCGGGGGA AGGGTCTTGC CTGGGGTCAC CAAGGCTGAT GTAAAGGGCC 3134 AGGCTCACCT CCTGAGGAAG GACTCTAGTG TGAGGGGCTC CCCAAGGCCC CACCACCACC 3194 CGGGGAGCCA CAGGGGAGGG CAGAAGCCAT CCTGACAGCG CACTCCCTTC CAG G GGC 3251 Gly AGG ACC TTC CAG AGC ACG AGC AGC GGG GCA GCC TAC GTG GGG GGC ATA 3299 Arg Thr Phe Gln Ser Thr Ser Ser Gly Ala Ala Tyr Val Gly Gly Ile 235 240 245 TGC TCC CTG TCC CAT GGC GGG GGT GTG AAC GAG GTGAGCAGTG 3342 Cys Ser Leu Ser His Gly Gly Gly Val Asn Glu 250 255 260 GGGGGACATG GCTGGGGTGG CGGCTGAGGG AAAGGGGCTT AGGGGCACGA CGTGCCTGNT 3402 TGGAAGATGT AGACATCTGT GCCCCATCTT CCCCACCCCC AG TAC GGC AAC ATG 3456 Tyr Gly Asn Met GGG GCG ATG GCC GTG ACC CTT GCC CAG ACG CTG GGA CAG AAC CTG GGC 3504 Gly Ala Met Ala Val Thr Leu Ala Gln Thr Leu Gly Gln Asn Leu Gly 265 270 275 280 ATG ATG TGG AAC AAA CAC CGG AGC TCG GCA G GTATCCTCCC CCAGAGGCCC 3555 Met Met Trp Asn Lys His Arg Ser Ser Ala Gly 285 290 CCGTGTGGCC CAGCAGCTCT GGAACGGGAG GGTGACAGTG GGAGGGGTGG TCCTTGGCCT 3615 CCCTCATATC CGCCTGGCTC ACCCCTCAG GG GAC TGC AAG TGT CCA GAC ATC 3667 Asp Cys Lys Cys Pro Asp Ile 295 TGG CTG GGC TGC ATC ATG GAG GAC ACT GG GTGAGTTCTT GGGGACAACC 3716 Trp Leu Gly Cys Ile Met Glu Asp Thr Gly 300 305 GGGGGAAGGT CTTGGGCGAG GGGAGTCTTA GAGCGAGCAT TGTTTGGCAG TCTGGACCAG 3776 GGGNNNNNNN NNNNNGAACA CACCTTCCCT TCCAGGCCGG CTTGCGAGTC CCAGGTTCAA 3836 GCGAGGGATG GGAGCGACAA GGGACAAGGC GGAGGATTCT GGTGCAATCC CGGGGCAGAT 3896 CCTCCGCCTC CTCGCGATGG TGACGAAGTC CCCCAGTGTA CCCCCTCCCC AGCCTTGAGA 3956 GGGGTGAGGG TGGGTTGGAG GGGAGCAGCC AGCAGCACCT CCCCTCGCCC TATCCAG G 4014 TTC TAC CTG CCC CGC AAG TTC TCT CGC TGC AGC ATC GAC GAG TAC AAC 4062 Phe Tyr Leu Pro Arg Lys Phe Ser Arg Cys Ser Ile Asp Glu Tyr Asn 310 315 320 CAG TTT CTG CAG GAG GGT GGT GGC AGC TGC CTC TTC AAC AAG CCC CTC 4110 Gln Phe Leu Gln Glu Gly Gly Gly Ser Cys Leu Phe Asn Lys Pro Leu 325 330 335 340 AAG GTACCAGCCC CGCGGCGGGG AGCATGGGAG CGGGCCCTGG GCGGGGTCCG 4163 Lys GGCCAGACTC CCGACCTGTC CTCCCGGTCC AG CTC CTG GAC CCC CCA GAG TGC 4216 Leu Leu Asp Pro Pro Glu Cys 345 GGG AAC GGC TTC GTG GAG GCA GGG GAG GAG TGC GAC TGC GGC TCG GTG 4264 Gly Asn Gly Phe Val Glu Ala Gly Glu Glu Cys Asp Cys Gly Ser Val 350 355 360 CAG GTGAGCGGTG GTGCGGGCGC CAGGTGGGGA ACCGGGATGC GGGGGTGGGC 4317 Gln 365 ACCAGGGAGC GTCTGAGTGG GAGGATTAGG GCTCGCCCGC CTCCTTCCCC TCCTCCCGCG 4377 TCCCTCAG GAG TGC AGC CGC GCA GGT GGC AAC TGC TGC AAG AAA TGC ACC 4427 Glu Cys Ser Arg Ala Gly Gly Asn Cys Cys Lys Lys Cys Thr 370 375 CTG ACT CAC GAC GCC ATG TGC AGC GAC GGG CTC TGC TGT CGC CGC TGC 4475 Leu Thr His Asp Ala Met Cys Ser Asp Gly Leu Cys Cys Arg Arg Cys 380 385 390 395 AAG GTAAGCAGGA CCGGCCGGGA GGCGGGGCCA GGACGCAGGA GGAGCGATTG 4528 Lys GAGGCCTTCA TATAAGGGGT GGGAGCTAGG GAGGGAAGCG GAGCCTTCGG GGACGAAGGC 4588 CTCTGGGGCA GGGCTTGATG CGAAGACAGC GCCAATGGGA GCAAGGGCGG GCTGAAGGAT 4648 GTTGAAGGCN NNNNNNNNNN NNNCGGACGG GAAGCTCCCA GAATCAAGGA GGGCGGGAAG 4708 GTGGGCGGGC TTGGGGCGGT GCTGAGTGCG CTGGGAGCGA GGTGGGGAGC GTTCAAGAGG 4768 TGGTGGGAGC AGGGAAATAA GAACAGGCCT AAACGGGGCC CTGGGGAGCT GGAGGGCCCG 4828 GGGATGTGGG GGTCCAGAGA GCGGGGGGCC TGGGGAGGGC AGGGCCGAGG CATCCATCCT 4888 GCCTGACTCG AGGAGCGCGT CTCTTCCCTA G TAC GAA CCA CGG GGT GTG TCC 4940 Tyr Glu Pro Arg Gly Val Ser 400 TGC CGA GAG GCC GTG AAC GAG TGC GAC ATC GCG GAG ACC TGC ACC GGG 4988 Cys Arg Glu Ala Val Asn Glu Cys Asp Ile Ala Glu Thr Cys Thr Gly 405 410 415 GAC TCT AGC CAG GTCCGCCCGG CCCCGCCGTC TTGTGGAGCC CTGGGCGAGG 5040 Asp Ser Ser Gln 420 CAACCCCTAC CCTTGTCGAT TTGGTTTTCC CGGACGAGTG CTCAGCACTC CCCTCCTCTC 5100 CACAGCTGGC ATCGACCTTC ACTGATCAGA CTGTTTTCTT ATCTGAGAAA GGGGTTCTTC 5160 ATGCTCCTGG CCTTGTTCCT TCAATCATTA AACCAGAATG TATCGTCTGG CTGGTATCCC 5220 AGCGCCTGGG CCCGGTGNNN NNNNNNNNTA CCCAGATTCC TCCTGGGCAG CCCTCAGCTC 5280 CAGTCCTGGG CAGCCCTCAG CCCAGTCCTG GGACTGCTCC GCTCAACCCC ACCCCTCTCT 5340 CCACAG TGC CCG CCT AAC CTG CAC AAG CTG GAC GGT TAC TAC TGT GAC 5388 Cys Pro Pro Asn Leu His Lys Leu Asp Gly Tyr Tyr Cys Asp 425 430 435 CAT GAG CAG GTATGATGGC TGCCCCCTGA GCCTGGGATT CAGGGCAGTC 5437 His Glu Gln 440 TCTTATCTCC ACTCTGACCA CTCAGCATCT CCATCCCTTG CCTCTTAATT CTTGGACTCT 5497 CAG GGC CGC TGC TAC GGA GGT CGC TGC AAA ACC CGG GAC CGG CAG TGC 5545 Gly Arg Cys Tyr Gly Gly Arg Cys Lys Thr Arg Asp Arg Gln Cys 445 450 455 CAG GTT CTT TGG GGC CAT G GTGAGTCTGC TAGGGCTGGA GTGGGACTCC 5594 Gln Val Leu Trp Gly His Ala 460 GGAGGAGCCC AGAGCTGAGA AGCTGGGGAG AGTGGGTTCC AGCTGAACAG GCCCCCAAGT 5654 GTGTAGCTCC CCAGGATCTC AGGGAGCCCA GGCAGAGTGT GGGAGATGCA GGCCTGAGGT 5714 CTTGGGGTGG GTCCTGGGGC ACGTGGGGTC ACTTGGCATC CTCTCCCCAC AG CG GCT 5771 Ala GCT GAT CGC TTC TGC TAC GAG AAG CTG AAT GTG GAG GGG ACG GAG CGT 5819 Ala Asp Arg Phe Cys Tyr Glu Lys Leu Asn Val Glu Gly Thr Glu Arg 465 470 475 GGG AGC TGT GGG CGC AAG GGA TCC GGC TGG GTC CAG TGC AGT AAG CA 5866 Gly Ser Cys Gly Arg Lys Gly Ser Gly Trp Val Gln Cys Ser Lys Gln 480 485 490 495 GTGAGTACTG AGGCTCCCAG AGGGCCTCTC AGCTCCAGGG CAGGTGTGAG ACTTTTCAGA 5926 GATGGGGTAG TAGGTTCTCC CAGGAGGAGC CTGTCAGTCC CAATGGGCGG GCACGTGGCA 5986 AATGAGGTGG CAGGGTGCAG GGTGAGGGCA GATTAGAGTT CAGTAGTTGA GTCTGAGGTC 6046 AAACTTGGGG CTCACTGTCT CTATAT G CCC CAA CAG GGA CGT GCT GTG TGG 6097 Pro Gln Gln Gly Arg Ala Val Trp 500 CTT CCT CCT CTG TGT CAA CAT CTC TGG AGC TCC TCG GCT AGG GGA CCT 6145 Leu Pro Pro Leu Cys Gln His Leu Trp Ser Ser Ser Ala Arg Gly Pro 505 510 515 GGT GGG AGA CAT CAG TAGTGTCACC TTCTACCACC AGGGCAAGGA GCTGGACTGC 6200 Gly Gly Arg His Gln 520 AGGTGCTGAC CAGCACCAAA ACTCAGGGAG GGGACCTGGC AGCTGTGCTG GGGGTTAGAA 6260 GATCTGGGGG CTGGAGGCTG GGCTGTGTCA CTTCCCCAGG GGAGGCCACG TGCAGCTGGC 6320 GGACGGCTCT GACCTGAGCT ATGTGGAGGA TGGCACAGCC TGCGGGCCTA ACATGTTGTG 6380 CCTGGACCAT CGCTGCCTGC CAGCTTCTGC CTTCAACTTC AGCACCTGCC CCGGCAGTGG 6440 GGAGCGCCGG ATTTGCTCCC ACCACGGGGT GACTGCCTGG AGCCCGGGAT GGCGGGAGAA 6500 GCTTACAAGA GGGGACAGGC CCCTGCTCAC CTCTCCTGGC CCTGCCCTGC CTCTAGGTCT 6560 GCAGCAATGA AGGGAAGTGC ATCTGTCAGC CAGACTGGAC AGGCAAAGAC TGCAGTATCC 6620 ATAACCCCCT GCCCACGTCC CCACCCACGG GGGAGACGGA GAGATATAAA GGTGAGGCTG 6680 GAGCTGGCCG AGGGGGGTCT GTCTGTCCCG CTCTCTATGC CTGTCCTTGC CAGCTAAGCC 6740 CTGCCATCCT CCCAGGTCCC AGCGGCACCA ACATCATCAT TGGCTCCATC GCTGGGGCTG 6800 TCCTGGTTGC AGCCATCGTC CTGGGCGGCA CGGGCTGGGG ATTTAAGTAA GAGACACACA 6860 CACCCTGTGC CCCCTGGCAT CCTTGAGGGG GGATCAGAAT CCCTACTGGT GGAGCTGAGG 6920 GGGCCCTCCC TGAAAGCCCA ACTGAACCAG AGCTCACACG TCATAGGTCC AAGTAGCCTG 6980 CAGGGCTTAA CATTTAGAAA CTAGGAGATT TTAGGCTAGA TGAGGTGCTC ACGCCTGTAA 7040 TCCCAGCACT TTGGGAGGCC AAGGCAGGCG GATCACCTGA GGTCAGGAAT TCAAGACCAG 7100 TCTGGCCAAC ATGGTGAAAC CCGTCTCTAT TAAAAATACA AAAATTAGCC AGCCATGGTG 7160 GTGCACACCT GTAATCCCAG CTACTTGCGA GGCTGAGGCA GAGAATTGCT TGAACCCGGG 7220 AGGTGGAGGT TGCAGTGAGC TGAGATCGCA CCATTGCACT CCAGCCTTGG GTGACAGAGC 7280 AAGACTGCGT CAAAAAAAAA AAAAAAAAAA AAAAAAAGGA AAGAAAGAGA GAAAGAAAAG 7340 AAAAGAGAAA AGAAATCAGG AGATTTTACA CTAGCAATTC GGATTTCCAG CTCTGGAAAC 7400 ATGAAAAGGT TGAGCCCCAG CGTGCCTCTA AGCATCCCCA AATAGCCACA GAGTGGAGCT 7460 GGGCAGGGGC CACCCAAGCC AGGCATGTGT CCTCCAGTCT CCAGTTCCCA CCAGCCTATA 7520 CTCCTTTGTG CGTGTCTAAG TTTGGGGTCC TTGTGCCTGG TCTTACCCCC CTTAATGTGC 7580 AGAGGGAGGA ACCCACGGCC CAAGGTCACA TGATTGAGTT AGTAGCAGAG TCAGAGCTGG 7640 AACCGGGACG CATTTTTGTG GGTGCCCTGG GTAATTCTCC CTGGCCCTTA CATTAGTGTC 7700 CAGGCCCCGG GGACCCCGGC CCCGCTCTGG GGCAAGGGGT CGCATGGCAG CCAAAGGCCC 7760 CTCCCTGAGA GAAGCAAAAG GTCAGATGTC TCCTTTTCCT CTCCCCTTCC ACCATCCTCC 7820 CCCTGCAGAA ACATTCGCCG AGGAAGGTAC GACCCGACCC AGCTGGGGGC AGTGTGATGC 7880 CGGCCACGTC ATCCCTCCCG CTGTCCTTGT CTCCTCCATC TCATTCGTCA CCCGCGTTCT 7940 GTTGATGGGG TGCGGGGCCG ATCCCACCCT GCGTGCCNNN NNNNNNNNNN ATCTGTTTTG 8000 TCTTCCATAT CACCACTGTC TGACCTCCCG CAGATCCCTT CCCTGGCCAG CCTGTGACTT 8060 GCCGCCTGCC TCCAGGGCCC AGAACTGAGC TCCGGGGCCC TGCTGGGGGG CTCTCCCCGA 8120 GGCCCCTGCT CACGTCCTCC CCTGATGCCC CCTCTCCGTT CCAGGTCCGG AGGGGCCTAA 8180 GTGCCACCCT CCTCCCTCCA AGCCTGGCAC CCACCGTCTC GGCCCTGAAC CACGAGGCTG 8240 CCCCCATCCA GCCACGGAGG GAGGCACCAT GCAAATGTCT TCCAGGTCCA AACCCTTCAA 8300 CTCCTGGCTC CGCAGGGGTT TGGGTGGGGG CTGTGGCCCT GCCCTTGGCA CCACCAGGGT 8360 GGACCAGGCC TGGAGGGCAC TTCCTCCACA GTCCCCCACC CACCTCCTGC GGCTCAGCCT 8420 TGCACACCCA CTGCCCCGTG TGAATGTAGC TTCCACCTCA TGGATTGCCA CAGCTCAACT 8480 CGGGGGCACC TGGAGGGATG CCCCCAGGCA GCCACCAGTG GACCTAGCCT GGATGGCCCC 8540 TCCTTGCAAC CAGGCAGCTG AGACCAGGGT CTTATCTCTC TGGGACCTAG GGGGACGGGG 8600 CTGACATCTA CATTTTTTAA AACTGAATCT TAATCGATGA ATGTAAACTC GGGGGTGCTG 8660 GGGCCAGGGC AGATGTGGGG ATGTTTTGAC ATTTACAGGA GGCCCCGGAG AAACTGAGGT 8720 ATGGCCATGC CCTAGACCCT CCCCAAGGAT GACCACACCC GAAGTCCTGT CACTGAGCAC 8780 AGTCAGGGGC TGGGCATCCC AGCTTGCCCC CGCTTAGCCC CGCTGAGCTT GGAGGAAGTA 8840 TGAGTGCTGA TTCAAACCAA AGCTGCCTGT GCCATGCCCA AGGCCTAGGT TATGGGTACG 8900 GCAACCACAT GTCCCAGATC GTCTCCAATT CGAAAACAAC CGTCCTGCTG TCCCTGTCAG 8960 GACACATGGA TTTTGGCAGG GCGGGGGGGG GTTCTAGAAA ATATAGGTTC CTATAATAAA 9020 ATGGCACCTT CCCCCTTTNN NNNNNNNNNN NNNGGGATAC CTCTGAATAT GGGTATCTGG 9080 GGCTGGATAT GGGTGGGACA TGAGACTTCC TGTGACCAGC CACCCTGGCT CCCAGCTCTC 9140 TGTATCCTCC TGCCCCGCCC TGGGGGGTGC CTACCCTGGN AGAACCCAGG GAGGAGTGGA 9200 GGCTGCCTCT GCCTGGGCCT CCACACAGCA TCCTGACATA CGCCACCTGG GGTGGGGGTG 9260 GGGAGGCAGG GCCAGGAG 9278
【図面の簡単な説明】
【図1】342個のコスミド・クローンの第17番染色
体上の位置を示した図である。クローン名はクローン番
号のみで示してある。
【図2】卵巣癌における第17番染色体長腕の部分的欠
失を示した図である。黒丸はヘテロ接合性の消失(LO
H)、白丸は保持を表している。2カ所の共通欠失領域
は傍線で示した。
【図3】乳癌における第17番染色体長腕の部分的欠失
を示した図である。黒丸はヘテロ接合性の消失(LO
H)、白丸は保持を表している。2カ所の共通欠失領域
は傍線で示した。
【図4】第17番染色体長腕21.3領域に位置づけら
れたマーカーから該遺伝子の単離に至る過程、および乳
癌組織で遺伝子再構成の起きている箇所(斜線の矩形)
を示した図である。クローン名はクローン番号のみで示
してある。
【図5】乳癌における遺伝子再構成のサザンブロットに
よる検出を示した図であり、Nは正常組織のDNA、T
は癌組織DNAを示す。
【図6】乳癌における遺伝子再構成のサザンブロットに
よる検出を示した図であり、Nは正常組織のDNA、T
は癌組織DNAを示す。
【図7】乳癌における遺伝子再構成のサザンブロットに
よる検出を示した図であり、Nは正常組織のDNA、T
は癌組織DNAを示す。
【図8】モノクローナル抗体およびウサギポリクローナ
ル抗体でのELISA法によるMDC蛋白質の濃度測定
検量線の図である。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 C12N 15/02 15/09 ZNA C12P 21/02 C 9282−4B 21/08 9358−4B C12Q 1/68 A 9453−4B G01N 33/53 D 33/574 A //(C12N 1/21 C12R 1:19) (C12N 15/09 ZNA C12R 1:91) (C12P 21/02 C12R 1:19) (C12P 21/08 C12R 1:91) (C12N 15/00 ZNA A C12R 1:91) (31)優先権主張番号 特願平6−73328 (32)優先日 平6(1994)4月12日 (33)優先権主張国 日本(JP)

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】配列番号1に示される蛋白質の全部または
    一部を含むMDC蛋白質、またはそれと実質的に同等で
    あるMDC蛋白質。
  2. 【請求項2】配列番号2に示される蛋白質の全部または
    一部を含むものからなる請求項1記載のMDC蛋白質、
    またはそれと実質的に同等であるMDC蛋白質。
  3. 【請求項3】配列番号3に示される蛋白質の全部または
    一部を含むものからなる請求項1記載のMDC蛋白質、
    またはそれと実質的に同等であるMDC蛋白質。
  4. 【請求項4】配列番号4に示される蛋白質の全部または
    一部を含むものからなる請求項1記載のMDC蛋白質、
    またはそれと実質的に同等であるMDC蛋白質。
  5. 【請求項5】配列番号5に示される、請求項1記載のM
    DC蛋白質をコードするDNAの全部または一部を含む
    ものからなるDNA、またはそれと実質的に同等である
    DNA。
  6. 【請求項6】配列番号6に示されるDNAの全部または
    一部を含むものからなる請求項5記載のDNA、または
    それと実質的に同等であるDNA。
  7. 【請求項7】配列番号7に示されるDNAの全部または
    一部を含むものからなる請求項5記載のDNA、または
    それと実質的に同等であるDNA。
  8. 【請求項8】配列番号8に示されるDNAの全部または
    一部を含むものからなる請求項5記載のDNA、または
    それと実質的に同等であるDNA。
  9. 【請求項9】配列番号9に示される、エクソン/イント
    ロンを含むDNAの全部または一部を含むものからなる
    DNA、またはそれと実質的に同等であるDNA。
  10. 【請求項10】請求項5、6、7、8または9のいずれ
    かに記載のDNAを含むプラスミド。
  11. 【請求項11】請求項10記載のプラスミドを保持する
    形質転換体。
  12. 【請求項12】請求項11記載の形質転換体を培養し、
    発現産物を回収することを含む請求項1、2、3または
    4のいずれかに記載の蛋白質の製造方法。
  13. 【請求項13】請求項1、2、3または4のいずれかに
    記載の蛋白質と結合する抗体。
  14. 【請求項14】請求項5、6、7、8または9のいずれ
    かに記載のDNA配列の一部を含むプライマーまたはプ
    ローブ。
  15. 【請求項15】請求項14記載のプライマ−またはプロ
    −ブを被検DNAとハイブリダイズさせることを含む遺
    伝子解析方法。
JP08447094A 1993-05-14 1994-04-22 Mdc蛋白質およびそれをコードするdna Expired - Lifetime JP3670030B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP08447094A JP3670030B2 (ja) 1993-05-14 1994-04-22 Mdc蛋白質およびそれをコードするdna

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
JP13660293 1993-05-14
JP5-136602 1993-05-14
JP25745593 1993-09-22
JP5-257455 1993-09-22
JP4990494 1994-02-23
JP6-73328 1994-04-12
JP7332894 1994-04-12
JP6-49904 1994-04-12
JP08447094A JP3670030B2 (ja) 1993-05-14 1994-04-22 Mdc蛋白質およびそれをコードするdna

Publications (2)

Publication Number Publication Date
JPH07330799A true JPH07330799A (ja) 1995-12-19
JP3670030B2 JP3670030B2 (ja) 2005-07-13

Family

ID=27522829

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08447094A Expired - Lifetime JP3670030B2 (ja) 1993-05-14 1994-04-22 Mdc蛋白質およびそれをコードするdna

Country Status (1)

Country Link
JP (1) JP3670030B2 (ja)

Also Published As

Publication number Publication date
JP3670030B2 (ja) 2005-07-13

Similar Documents

Publication Publication Date Title
US6191268B1 (en) Compositions and methods relating to DNA mismatch repair genes
US20030064397A1 (en) Transmembrane protein differentially expressed in prostate and lung tumors
WO1997006256A2 (en) Isolated nucleic acid molecules useful as leukemia markers and in breast cancer prognosis
JP2006006331A (ja) 腫瘍の治療のための組成物と方法
US5552526A (en) MDC proteins and DNAS encoding the same
KR20050004773A (ko) 종양 치료용 조성물 및 방법
US20060275314A1 (en) Transmembrane protein differentially expressed in cancer
JP2002534087A (ja) 単球由来核酸および関連する組成物ならびに方法
CA2367468C (en) Rheumatoid arthritis gene and method for diagnosing rheumatoid arthritis
US5646249A (en) Isolation and characterization of a novel chaperone protein
WO1999009215A1 (en) Prognostic compositions for prostate cancer and methods of use thereof
JPH07289297A (ja) 癌抑制遺伝子
EP0809698B1 (en) NUCLEOTIDE AND DEDUCED AMINO ACID SEQUENCES OF TUMOR GENE Int6
JP3670030B2 (ja) Mdc蛋白質およびそれをコードするdna
US20030124543A1 (en) Breast cancer marker
US5231009A (en) Cdnas coding for members of the carcinoembryonic antigen family
US20030054446A1 (en) Novel retina-specific human proteins C7orf9, C12orf7, MPP4 and F379
US20030104418A1 (en) Diagnostic markers for breast cancer
US5834245A (en) PRLTS proteins and DNA's encoding the same
JP2003116562A (ja) Tsll2遺伝子
JP3729924B2 (ja) p53 標的蛋白質GML
JPH0892291A (ja) Prlts蛋白質およびそれをコードするdna
US20020146712A1 (en) Tumor suppressor
US20030120036A1 (en) Human NOC2-related gene variants associated with lung cancer
CA2245340A1 (en) Traf4-associating protein

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040106

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040225

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050201

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050301

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20050314

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050405

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050413

R150 Certificate of patent (=grant) or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080422

Year of fee payment: 3

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090422

Year of fee payment: 4

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090422

Year of fee payment: 4

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100422

Year of fee payment: 5

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100422

Year of fee payment: 5

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110422

Year of fee payment: 6

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120422

Year of fee payment: 7

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120422

Year of fee payment: 7

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120422

Year of fee payment: 7

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120422

Year of fee payment: 7

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130422

Year of fee payment: 8

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130422

Year of fee payment: 8

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140422

Year of fee payment: 9

EXPY Cancellation because of completion of term