JP2005124578A - 17q-LINKED BREAST AND OVARIAN CANCER SUSCEPTIBILITY GENE - Google Patents

17q-LINKED BREAST AND OVARIAN CANCER SUSCEPTIBILITY GENE Download PDF

Info

Publication number
JP2005124578A
JP2005124578A JP2004355724A JP2004355724A JP2005124578A JP 2005124578 A JP2005124578 A JP 2005124578A JP 2004355724 A JP2004355724 A JP 2004355724A JP 2004355724 A JP2004355724 A JP 2004355724A JP 2005124578 A JP2005124578 A JP 2005124578A
Authority
JP
Japan
Prior art keywords
brca1
ser
glu
leu
lys
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004355724A
Other languages
Japanese (ja)
Inventor
Mark H Skolnick
マーク・エイチ・スコルニック
David E Goldgar
デイビッド・イー・ゴールドガー
Yoshio Miki
義男 三木
Jeff Swenson
ジェフ・スウェンソン
Alexander Kamb
アレキサンダー・カム
Keith D Harshman
キース・ディ・ハーシュマン
Donna M Shattuck-Eidens
ドナ・エム・シャタック−エイデンズ
Sean V Tavtigian
シィーン・ブイ・タブティジアン
Roger W Wiseman
ロジャー・ダブリュー・ワイズマン
P Andrew Futreal
アンドリュー・ピー・ファトリール
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
US Department of Health and Human Services
University of Utah Research Foundation UURF
Myriad Genetics Inc
Original Assignee
US Department of Health and Human Services
University of Utah Research Foundation UURF
Myriad Genetics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US08/487,002 external-priority patent/US5710001A/en
Priority claimed from US08/483,554 external-priority patent/US5747282A/en
Application filed by US Department of Health and Human Services, University of Utah Research Foundation UURF, Myriad Genetics Inc filed Critical US Department of Health and Human Services
Publication of JP2005124578A publication Critical patent/JP2005124578A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To carry out diagnosis of germline mutations in the BRCA1 gene and predisposition to breast and ovarian cancer. <P>SOLUTION: The invention relates to the method and material used for isolation and detection of the predisposition gene (BRCA1) to breast and ovarian cancer of human. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は、一般的にヒト遺伝学の分野に関する。詳細には、本発明は、そのいくつかの突然変異対立遺伝子が、癌、特に乳癌および卵巣癌に感受性を引き起こすヒト乳癌および卵巣癌病気素因遺伝子(BRCA1)を単離し、検出するのに用いる方法および材料に関する。より詳細には、本発明は、BRCA1遺伝子における生殖細胞系突然変異、ならびに乳癌および卵巣癌に対する病気素因の診断におけるその使用に関する。本発明は、さらに、ヒト乳癌および卵巣癌におけるBRCA1遺伝子における体細胞突然変異、ならびにヒト乳癌および卵巣癌の診断および予診におけるその使用に関する。加えて、本発明は、他のヒト癌におけるBRCA1遺伝子の体細胞突然変異、ならびにヒト癌の診断および予診におけるその使用に関する。また、本発明は、遺伝子療法、蛋白質置換療法および蛋白質ミメティックスを包含する、BRCA1遺伝子中に突然変異を有するヒト癌の療法にも関する。本発明は、さらに、癌療法用薬剤のスクリーニングにも関する。最後に、本発明は、乳癌および卵巣癌の病気素因の診断に有用な、突然変異についてのBRCA1遺伝子のスクリーニングに関する。
本発明の背景、および特に、実施に関するさらなる詳細を提供する場合を明らかにするために本明細書中で用いる刊行物および他の材料は、出典明示して本明細書の一部とみなし、簡便のために、以下の明細書中の著者および日付けによって示し、添付する参照リスト中に各々グループ化する。
The present invention relates generally to the field of human genetics. Specifically, the present invention relates to a method used by several of its mutant alleles to isolate and detect a human breast and ovarian cancer disease predisposition gene (BRCA1) that causes susceptibility to cancer, particularly breast cancer and ovarian cancer. And material. More particularly, the invention relates to germline mutations in the BRCA1 gene and its use in the diagnosis of predisposition to breast and ovarian cancer. The invention further relates to somatic mutations in the BRCA1 gene in human breast cancer and ovarian cancer, and its use in the diagnosis and prognosis of human breast cancer and ovarian cancer. In addition, the present invention relates to somatic mutations of the BRCA1 gene in other human cancers and their use in the diagnosis and prognosis of human cancers. The present invention also relates to the therapy of human cancers having mutations in the BRCA1 gene, including gene therapy, protein replacement therapy and protein mimetics. The present invention further relates to screening for drugs for cancer therapy. Finally, the present invention relates to the screening of the BRCA1 gene for mutations useful in the diagnosis of predisposition to breast and ovarian cancer.
Publications and other materials used herein to clarify the background of the invention and, in particular, when providing additional details regarding implementation, are hereby expressly incorporated by reference. For this purpose, they are grouped in the reference list shown and attached by the author and date in the following specification.

トランスフォーム状態の優性で正の多くの調節遺伝子(オンコジーン)、ならびに劣性で負の多くの調節遺伝子(腫瘍サプレッサー遺伝子)を包含する癌の遺伝学は複雑である。百を超えるオンコジーンが特徴付けられている。1ダースに満たない腫瘍サプレッサー遺伝子しか同定されていないが、その数は50を超えて増加すると予想される(Knudson,1993)。   The genetics of cancer, including many dominant positive regulatory genes (oncogenes) in the transformed state, as well as many recessive negative regulatory genes (tumor suppressor genes), is complex. Over a hundred oncogenes have been characterized. Although less than a dozen tumor suppressor genes have been identified, the number is expected to increase beyond 50 (Knudson, 1993).

そのように多数の遺伝子の関与は、細胞で作動して正常組織の完全性を維持する増殖制御機構の複雑さを強調している。この複雑性は他の方法で明白である。現在まで、単一の遺伝子がすべての、または大部分のヒト癌の成長に関与していることが示されたことはない。最も普遍的なオンコジーン突然変異はH-ras遺伝子に存在し、全ての充実性腫瘍の10-15%に見出されている(Andersonら,1992)。最も頻繁に突然変異する腫瘍サプレッサー遺伝子は、全腫瘍のほぼ50%でホモ接合的に欠損したTP53遺伝子、および検査した腫瘍細胞系統の46%でホモ接合的に欠損したCDKN2である(Kambら,1994)。すべてのトランスフォーム細胞に共通する標的なしには、癌細胞を破壊または復帰させる一方で害されていない正常組織を残し得る「魔法の弾丸」の夢はありそうにない。特異的に標的化した抗癌剤の新たな創薬の望みは、細胞分裂の制御において一般的な役割を演じている腫瘍サプレッサー遺伝子またはオンコジーンを同定する能力に支えられ得る。   The involvement of such a large number of genes underscores the complexity of growth control mechanisms that operate in cells to maintain normal tissue integrity. This complexity is obvious in other ways. To date, no single gene has been shown to be involved in the growth of all or most human cancers. The most common oncogene mutation is present in the H-ras gene and has been found in 10-15% of all solid tumors (Anderson et al., 1992). The most frequently mutated tumor suppressor genes are the TP53 gene, which is homozygously deleted in nearly 50% of all tumors, and CDKN2, which is homozygously deleted in 46% of the tumor cell lines examined (Kamb et al., 1994). Without a common target for all transformed cells, it is unlikely that there will be a “magic bullet” dream that can destroy or revert cancer cells while leaving intact normal tissue intact. The desire for new drug discovery of specifically targeted anticancer agents may be supported by the ability to identify tumor suppressor genes or oncogenes that play a general role in the control of cell division.

クローン化され特徴付けられた腫瘍サプレッサー遺伝子は、1)網膜芽細胞腫(RB1);2)Wilms腫瘍(WT1);3)Li-Fraumeni症候群(TP53);4)家族性腺腫性茸腫症(APC);5)神経線維腫症1型(NF1);6)神経線維腫症2型(NF2);7)von Hippel-Lindau病(VHL);8)多発性内分泌腺腫症2A型(MEN2A);および9)メラノーマ(CDKN2)に対する感受性に影響する。   The tumor suppressor genes that have been cloned and characterized include: 1) retinoblastoma (RB1); 2) Wilms tumor (WT1); 3) Li-Fraumeni syndrome (TP53); 4) familial adenomatous edema ( APC); 5) neurofibromatosis type 1 (NF1); 6) neurofibromatosis type 2 (NF2); 7) von Hippel-Lindau disease (VHL); 8) multiple endocrine adenomatosis type 2A (MEN2A) And 9) affect susceptibility to melanoma (CDKN2).

遺伝子的にマッピングされているが未だ単離されていない腫瘍サプレッサー遺伝子座には:多発性内分泌腺腫症1型(MEN1);リンチ癌家族性症候群2型(LCFS2);神経芽細胞腫(NB);基底細胞母斑症候群(BCNS);Beckwith-Wiedemann症候群(BWS);腎細胞腫(RCC);結節性硬化症1型(TSC1);および結節性硬化症2型(TSC2)に関する遺伝子が包含される。今日までに特徴付けられている腫瘍サプレッサー遺伝子は、DNA結合蛋白質(WT1)、補助転写因子(RB1)、GTPアーゼ活性化蛋白質またはGAP(NF1)、細胞骨格因子(NF2)、膜結合受容体キナーゼ(MEN2A)、細胞サイクル調節因子(CDKN2)および公知の蛋白質に明白な同一性をなんら有しない他のもの(APCおよびVHL)を包含する、種々のタイプの蛋白質と同類の産物をコードする。   The genetically mapped but not yet isolated tumor suppressor loci include: multiple endocrine adenomatosis type 1 (MEN1); Lynch cancer familial syndrome type 2 (LCFS2); neuroblastoma (NB) Genes for basal cell nevus syndrome (BCNS); Beckwith-Wiedemann syndrome (BWS); renal cell tumor (RCC); tuberous sclerosis type 1 (TSC1); and tuberous sclerosis type 2 (TSC2) are included. The Tumor suppressor genes that have been characterized to date include DNA-binding protein (WT1), accessory transcription factor (RB1), GTPase-activating protein or GAP (NF1), cytoskeletal factor (NF2), membrane-bound receptor kinase It encodes products similar to various types of proteins, including (MEN2A), cell cycle regulator (CDKN2), and others that do not have any apparent identity to known proteins (APC and VHL).

多くの場合、遺伝的研究を通して元来同定された腫瘍サプレッサー遺伝子は、ある種の散発性腫瘍においては欠失または突然変異していることが示されている。この結果は、染色体異常の領域が、癌への遺伝的病気素因および散発性癌の両方に関与する重要な腫瘍サプレッサー遺伝子の位置を知り得ることを示している。   In many cases, tumor suppressor genes originally identified through genetic studies have been shown to be deleted or mutated in certain sporadic tumors. This result indicates that the region of chromosomal abnormalities can locate important tumor suppressor genes involved in both genetic predisposition to cancer and sporadic cancer.

今日までに特徴付けられた数種の腫瘍サプレッサー遺伝子の顕著な特徴の1つは、特定の腫瘍型においてそれが高率で欠失しているということである。該欠失には、しばしば、単一対立遺伝子の欠失、いわゆるヘテロ接合体の欠失(LOH)が含まれるが、また、両方の対立遺伝子のホモ接合体欠失も含まれ得る。LOHに関しては、予め存在する突然変異のためか、二次的散発性突然変異のためかのいずれかによって、残りの対立遺伝子が非機能性になると予想される。   One of the hallmarks of several tumor suppressor genes that have been characterized to date is that it is highly defective in certain tumor types. The deletions often include single allelic deletions, so-called heterozygous deletions (LOH), but can also include homozygous deletions of both alleles. For LOH, it is expected that the remaining alleles will become non-functional, either due to pre-existing mutations or due to secondary sporadic mutations.

乳癌は、女性に影響する最も重要な疾病の1つである。最近の比率では、米国女性は、95歳までに乳癌を発症する1/8の危険度を有する(American Cancer Society,1992)。後期ステージの乳癌の治療は、しばしば、無駄で、かつ醜く、疾病の医療管理において早期の検出を高い優先としている。乳癌よりもより頻繁ではないが、卵巣癌はしばしば迅速に死に至り、米国女性における癌致死率の第4番目の最も普遍的原因である。乳癌発症率の疾病-規定比率に寄与する遺伝的因子は全ケースの約5%と概算されるが、約25%のケースが40歳前に診断されている(Clausら,1991)。乳癌は50歳付近の年齢-特異的発症率曲線の変曲に基づき、2種のタイプ、すなわち、低齢発症および高齢発症に分けられる。1つの遺伝子、すなわちBRCA1の突然変異が家族性乳癌の約45%の原因と考えられるが、乳癌および卵巣癌の両方を有する家族の少なくとも80%の原因と考えられる(Eastonら,1993)。   Breast cancer is one of the most important diseases affecting women. In a recent ratio, US women have a 1/8 risk of developing breast cancer by age 95 (American Cancer Society, 1992). Treatment of late-stage breast cancer is often wasteful and ugly, and early detection is a high priority in medical management of disease. Less frequently than breast cancer, ovarian cancer often results in rapid death and is the fourth most common cause of cancer mortality in US women. The genetic factor contributing to the disease-specified ratio of breast cancer incidence is estimated at about 5% of all cases, but about 25% of cases are diagnosed before age 40 (Claus et al., 1991). Breast cancer is divided into two types: early-onset and older onset, based on the inflection of the age-specific incidence curve near 50 years of age. A mutation in one gene, BRCA1, is thought to cause about 45% of familial breast cancers, but at least 80% of families with both breast and ovarian cancers (Easton et al., 1993).

BRCA1遺伝子が1990年に最初にマッピングされてから、それを単離する激しい努力がなされてきている(Hallら,1990;Narodら,1991)。第2の遺伝子座、BRCA2は最近、染色体13qにマッピングされ(Woosterら,1994)、BRCA1とほぼ同等な低齢-発症乳癌の比率と考えられるようであるが、卵巣癌の低い危険性に寄与している。低齢-発症乳癌に対する残りの感受性は、家族性癌の未だマッピングされていない遺伝子と、TP53のごとき珍しい生殖細胞系突然変異との間に分けられる(Malkinら,1990)。また、血管拡張性失調症遺伝子のヘテロ接合体キャリアーが、乳癌につき高危険性であることも示唆されている(Swiftら,1976;Swiftら,1991)。高齢-発症乳癌はしばしば家族性であるが、血縁における危険度は低齢-発症乳癌ほど高くない(Cannon-Albrightら,1994;Mettlinら,1990)。しかしながら、遺伝的感受性によるかかるケースのパーセンテージは知られていない。   Since the BRCA1 gene was first mapped in 1990, intense efforts have been made to isolate it (Hall et al., 1990; Narod et al., 1991). A second locus, BRCA2, has recently been mapped to chromosome 13q (Wooster et al., 1994) and appears to have a proportion of early-onset breast cancer that is almost equivalent to BRCA1, but contributes to the low risk of ovarian cancer doing. The remaining susceptibility to early-onset breast cancer is divided between unmapped genes for familial cancer and rare germline mutations such as TP53 (Malkin et al., 1990). It has also been suggested that heterozygous carriers of vasodilatory schizophrenia genes are at high risk for breast cancer (Swift et al., 1976; Swift et al., 1991). Older-onset breast cancer is often familial, but the relative risk is not as high as in younger-onset breast cancer (Cannon-Albright et al., 1994; Mettlen et al., 1990). However, the percentage of such cases due to genetic susceptibility is unknown.

乳癌は、部分的に、家族性疾病であると長い間認識されている(Anderson,1972)。膨大な数の研究者が遺伝的受継の証拠を検査し、データは主要な感受性遺伝子座または遺伝子座群の優性遺伝とほとんど一致すると結論している(BishopおよびGardner,1980;Goら,1983;WilliamsおよびAnderson,1984;Bishopら,1988;Newmanら,1988;Clausら,1991)。最近の結果は、少なくとも3つの遺伝子座が存在し、これらが乳癌ならびに他の癌に対する感受性を運んでいることを証明している。これらの遺伝子座は染色体17p上のTP53遺伝子座
(Malkinら,1990)、BRCA1として知られている17q-連鎖感受性遺伝子座(Hallら,1990)、および未マッピングの残りのものに寄与する1または2以上の遺伝子座である。Hallら(1990)は、低齢発症を有する家系において遺伝した乳癌感受性が染色体17q21に連鎖していることを示したが;より適当な遺伝的モデルを使用したこのグループによるつづく研究は、低齢発症乳癌への限定を部分的に論駁された(Margaritteら,1992)。
Breast cancer has long been recognized as a familial disease (Anderson, 1972). A vast number of investigators have examined evidence of genetic inheritance and concluded that the data is almost consistent with the dominant inheritance of major susceptibility loci or loci (Bishop and Gardner, 1980; Go et al., 1983; Williams and Anderson, 1984; Bishop et al., 1988; Newman et al., 1988; Claus et al., 1991). Recent results demonstrate that there are at least three loci, which carry susceptibility to breast cancer as well as other cancers. These loci are TP53 loci on chromosome 17p
(Malkin et al., 1990), the 17q-linkage susceptibility locus known as BRCA1 (Hall et al., 1990), and one or more loci contributing to the remaining unmapped. Hall et al. (1990) have shown that breast cancer susceptibility inherited in families with younger onset is linked to chromosome 17q21; subsequent studies by this group using a more appropriate genetic model Limited to onset breast cancer was partially discussed (Margaritte et al., 1992).

17q-連鎖乳癌病気素因遺伝子(BRCA1)をクローン化する大部分の戦略は正確な遺伝的位置決定研究を要する。BRCA1の機能的な役割に関する最もシンプルなモデルは、癌となる病気素因であるBRCA1の対立遺伝子が野生型対立遺伝子に対して劣性であり;すなわち、少なくとも1つの野生型BRCA1対立遺伝子を含む細胞は癌にかからないことを支持している。しかしながら、1つの野生型BRCA1対立遺伝子および1つの病気素因対立遺伝子を含有する細胞は、ランダム突然変異によってか、または細胞分裂の間の染色体欠失(非染色体分離)によるかのいずれかで野生型対立遺伝子の欠失にしばしば遭遇し得る。かかる突然変異細胞の子孫はすべて、BRCA1の野生型機能を欠いており、腫瘍に発展し得る。このモデルによれば、BRCA1の病気素因対立遺伝子は劣性で、癌に対する感受性を優性で受け継いでいても:1つの病気素因対立遺伝子(および1つの野生型対立遺伝子)を有する女性は癌を発症する危険性を有する。なぜならば、彼女の乳房上皮細胞が、自然発生的に野生型BRCA1対立遺伝子を欠失し得るからである。このモデルは、網膜芽細胞腫遺伝子および神経芽細胞腫遺伝子を包含するクラスの遺伝子、腫瘍サプレッサーまたは抗オンコジーンとして知られている癌感受性対立遺伝子の群に適用する。推論により、このモデルは、最近示されているごとく(Smithら,1992)、BRCA1機能を説明することもできる。   Most strategies to clone the 17q-linked breast cancer disease predisposition gene (BRCA1) require accurate genetic location studies. The simplest model for the functional role of BRCA1 is that the BRCA1 allele, which is a predisposition to a cancerous disease, is recessive to the wild-type allele; Supports not to get cancer. However, cells containing one wild type BRCA1 allele and one disease predisposing allele are either wild type either by random mutation or by chromosomal deletions (non-chromosomal segregation) during cell division. Allele deletions can often be encountered. All progeny of such mutant cells lack the BRCA1 wild-type function and can develop into tumors. According to this model, even if the disease predisposing allele of BRCA1 is recessive and inherits susceptibility to cancer in a dominant manner, women with one disease predisposing allele (and one wild type allele) develop cancer Hazardous. This is because her breast epithelial cells can spontaneously delete the wild type BRCA1 allele. This model applies to a group of cancer susceptibility alleles known as classes of genes, including tumor retinoblastoma and neuroblastoma genes, tumor suppressors or anti-oncogenes. By inference, this model can also explain the BRCA1 function as recently shown (Smith et al., 1992).

第2の可能性は、BRCA1病気素因対立遺伝子が実際に優性であり;すなわち、BRCA1の野生型対立遺伝子は病気素因対立遺伝子の腫瘍形成役割を克服し得ないということである。したがって、野生型と突然変異対立遺伝子との両方を運ぶ細胞は、悪性腫瘍細胞を生じる前にBRCA1の野生型コピーを欠失しているとは限らない。その代わりに、病気素因個人における乳房細胞は、癌に通じるある種の他の確率的変化(群)が起きているであろう。   A second possibility is that the BRCA1 disease predisposition allele is actually dominant; that is, the wild type allele of BRCA1 cannot overcome the oncogenic role of the disease predisposition allele. Thus, cells carrying both wild type and mutant alleles do not necessarily lack a wild type copy of BRCA1 prior to generating malignant cells. Instead, breast cells in predisposed individuals will have certain other stochastic changes (groups) that lead to cancer.

BRCA1病気素因対立遺伝子が劣性である場合、該BRCA1遺伝子は正常な乳房組織で発現するが、乳癌で機能的に発現しないと予想される。それとは反対に、BRCA1病気素因対立遺伝子が優性である場合、野生型BRCA1遺伝子は正常な乳房組織で発現し得るか、またはし得ない。しかしながら、該病気素因対立遺伝子は、乳癌細胞で発現するようである。   If the BRCA1 disease predisposing allele is recessive, the BRCA1 gene is expected to be expressed in normal breast tissue but not functionally in breast cancer. In contrast, if the BRCA1 disease predisposition allele is dominant, the wild-type BRCA1 gene may or may not be expressed in normal breast tissue. However, the disease predisposing allele appears to be expressed in breast cancer cells.

BRCA1の17q連鎖は、乳癌と卵巣癌の両方を有する5人の家系のうちの3人で独立して確認された(Narodら,1991)。これらの研究は、連鎖したマーカーpCMM86(D17S74)のいずれか側に対して15センチモルガン(cM)、または約15Mbpの非常に広範な領域の中に該遺伝子が位置決定されると主張している。しかしながら、pCMMS6を取り囲むマーカーを用いた遺伝的研究によって該領域をさらに画定する試行は首尾よくいかないことが証明された。つづく研究は、該遺伝子がかなり接近していて(Eastonら,1993)、元来の分析が欠陥であったことを示している(Margaritteら,1992)。Hallら(1992)は、最近、BRCA1遺伝子を、基部側のMfdl5(D17S250)および末端側のヒトGIP遺伝子と境を接する約8cM(約8Mbp)の間隔に位置決定した。公的に入手可能なデータに基づくBRCA1対立遺伝子についてのわずかに狭い間隔は、1992年3月の「染色体17研究会」(Fain,1992)で合意に達した。これらの領域のサイズおよびそれと関連する不確実性は、BRCA1遺伝子を単離する物理的マッピングおよび/またはクローニング戦略の設計および器具を過剰に困難としている。   The 17q linkage of BRCA1 was independently confirmed in 3 of 5 families with both breast and ovarian cancer (Narod et al., 1991). These studies claim that the gene is located in a very extensive region of 15 centmorgan (cM), or about 15 Mbp, on either side of the linked marker pCMM86 (D17S74) . However, genetic studies with markers surrounding pCMMS6 have proven unsuccessful in attempting to further define the region. Subsequent studies indicate that the genes are fairly close (Easton et al., 1993) and the original analysis was defective (Margaritte et al., 1992). Hall et al. (1992) recently located the BRCA1 gene at an interval of approximately 8 cM (approximately 8 Mbp) bordering the proximal Mfdl5 (D17S250) and distal human GIP genes. A slightly narrower interval for the BRCA1 allele based on publicly available data was agreed at the March 1992 “Chromosome 17 Study Group” (Fain, 1992). The size of these regions and the uncertainties associated therewith make it too difficult to design and instrument physical mapping and / or cloning strategies to isolate the BRCA1 gene.

乳癌感受性対立遺伝子の同定により、感受性個人を早期に検出することができ、癌に通じる初期工程を理解する我々の能力を大きく増すであろう。感受性対立遺伝子は腫瘍が進展する間にしばしば変化するため、これらの遺伝子のクローニングも、より良好な診断および予診産物の開発、ならびにより良好な癌療法においても重要となり得る。   Identification of breast cancer susceptibility alleles will enable early detection of susceptible individuals and greatly enhance our ability to understand the early steps leading to cancer. Since susceptibility alleles often change during tumor progression, cloning of these genes can also be important in the development of better diagnostic and prognostic products, and better cancer therapy.

本発明は、一般的にヒト遺伝学の分野に関する。詳細には、本発明は、癌、特に乳癌および卵巣癌に対する感受性を生じるある種の対立遺伝子である、ヒト乳癌病気素因遺伝子(BRCA1)を単離し、かつ検出するのに用いる方法および材料に関する。より詳細には、本発明は、BRCA1遺伝子における生殖細胞系突然変異、ならびに乳癌および卵巣癌の病気素因の診断におけるその使用に関する。本発明は、さらに、ヒト乳癌におけるBRCA1遺伝子の体細胞突然変異、ならびにヒト乳癌および卵巣癌の診断および予診におけるその使用に関する。加えて、本発明は、他のヒト癌におけるBRCA1遺伝子の体細胞突然変異、ならびにヒト癌の診断および予診におけるその使用に関する。本発明は、また、遺伝子療法、蛋白質置換療法および蛋白質ミメティックスを包含する、BRCA1遺伝子に突然変異を有するヒト癌の療法に関する。本発明は、さらに、癌療法用の薬剤のスクリーニングに関する。最後に、本発明は、突然変異についてのBRCA1遺伝子のスクリーニングに関し、それは乳癌および卵巣癌の病気素因を診断するのに有用である。   The present invention relates generally to the field of human genetics. Specifically, the present invention relates to methods and materials used to isolate and detect the human breast cancer disease predisposition gene (BRCA1), a certain allele that produces susceptibility to cancer, particularly breast and ovarian cancer. More particularly, the invention relates to germline mutations in the BRCA1 gene and its use in the diagnosis of predisposition to breast and ovarian cancer. The invention further relates to somatic mutations of the BRCA1 gene in human breast cancer and its use in the diagnosis and prognosis of human breast cancer and ovarian cancer. In addition, the present invention relates to somatic mutations of the BRCA1 gene in other human cancers and their use in the diagnosis and prognosis of human cancers. The present invention also relates to the therapy of human cancers with mutations in the BRCA1 gene, including gene therapy, protein replacement therapy and protein mimetics. The invention further relates to screening for drugs for cancer therapy. Finally, the present invention relates to screening the BRCA1 gene for mutations, which are useful in diagnosing predisposition to breast and ovarian cancer.

本発明は、個人のBRCA1対立遺伝子をテストするのに用いる物質および方法ならびに該対立遺伝子の正常または病気素因性質の解釈を供する。正常の危険より高い個人はそのライフスタイルを適当に修飾するであろう。BRCA1の場合、最も有意な非−遺伝的危険因子は若年の全妊娠期間の保護効果である。従って、危険な婦人は早くに子供を作ることを考えるか、若年の全期間妊娠のホルモン効果を刺激するように設計した療法を考えることができよう。高い危険の婦人もまた早期検出に努力し、乳房の自己診断を学び実践する絶好の動機付けとなろう。かかる婦人は、一般の集団よりも早い年齢で始めて、規則的な乳房X線像を取るよう動機付けされるであろう。卵巣スクリーニングも、より高い頻度でなされるであろう。BRCA1遺伝子座の配列分析に基づく診断方法も腫瘍検出および分類に適用できるであろう。配列分析を用いて前駆体病巣を診断できるであろう。該方法の進歩およびBRCA1および他の原因的遺伝子座についての情報の蓄積と共に、癌を良性および悪性に分けることが可能となろう。   The present invention provides materials and methods used to test an individual's BRCA1 allele and an interpretation of the normal or disease-predisposing nature of the allele. Individuals who are higher than normal risk will appropriately modify their lifestyle. In the case of BRCA1, the most significant non-genetic risk factor is the protective effect of the entire gestation period of younger age. Thus, a risky lady could think of making a child early or could think of a therapy designed to stimulate the hormonal effects of pregnancies throughout the young. High-risk women will also strive for early detection and be a great motivation to learn and practice breast self-diagnosis. Such women will be motivated to take regular mammograms, starting at an earlier age than the general population. Ovarian screening will also be done more frequently. Diagnostic methods based on sequence analysis of the BRCA1 locus may also be applicable for tumor detection and classification. Sequence analysis could be used to diagnose precursor lesions. With the progress of the method and the accumulation of information about BRCA1 and other causal loci, it will be possible to separate cancer into benign and malignant.

乳癌を持つ婦人は、もしそれが病気素因でないというよりも、もしそれが病気素因であり、従ってさらに癌を有するであろうときは、異なる外科方法に従うであろう。ペプチドまたは小さい分子(合理的薬剤デザイン)いずれかを用いる他の療法が開発されるであろう。ペプチドはミッシング遺伝子産物それ自体またはミッシング遺伝子産物の一部であろう。別法として、治療剤は有害な遺伝子機能を模倣するもう1つの分子、受け継いだ遺伝子座の有害効果を妨げることが求められるペプチドまたは非ペプチド分子であろう。また、療法は正常なBRCA1対立遺伝子を個人に導入して、有害対立遺伝子の効果を妨げるであろう蛋白質を作製することを通じる、遺伝子ベースであり得る。これらの遺伝子療法は多くの形態を取ることができ、腫瘍が形成されるのを妨げる、一旦生じた癌を治癒する、または癌が転移するのを停止させることに向けられるであろう。   Women with breast cancer will follow different surgical procedures if they are predisposed to disease and therefore will have more cancer than it is not predisposed to disease. Other therapies will be developed using either peptides or small molecules (rational drug design). The peptide may be the missing gene product itself or part of the missing gene product. Alternatively, the therapeutic agent would be another molecule that mimics a deleterious gene function, a peptide or non-peptide molecule that is required to prevent the deleterious effects of inherited loci. Therapy can also be gene-based through introducing a normal BRCA1 allele into an individual to create a protein that would interfere with the effects of harmful alleles. These gene therapies can take many forms and will be aimed at preventing the tumor from forming, curing the cancer once it has occurred, or stopping the cancer from metastasizing.

本発明は、一般的にヒト遺伝学の分野に関する。詳細には、本発明は、癌、特に乳癌および卵巣癌に対して感受性を生じるある種の対立遺伝子である、ヒト乳癌病気素因遺伝子(BRCA1)を単離し、かつ検出するのに用いる方法および材料に関する。より詳細には、本発明は、BRCA1遺伝子における生殖細胞系突然変異、ならびに乳癌および卵巣癌の病気素因の診断におけるその使用に関する。本発明は、さらに、ヒト乳癌におけるBRCA1遺伝子における体細胞突然変異、ならびにヒト乳癌および卵巣癌の診断および予診におけるその使用に関する。加えて、本発明は、他のヒト癌におけるBRCA1遺伝子中の体細胞突然変異、ならびにヒト癌の診断および予診におけるその使用に関する。また、本発明は、遺伝子療法、蛋白質置換療法および蛋白質ミメティックスを包含する、BRCA1遺伝子中に突然変異を有するヒト癌の療法に関する。本発明は、さらに、癌治療用の薬剤のスクリーニングに関する。最後に、本発明は、突然変異についてのBRCA1遺伝子のスクリーニングに関し、それは乳癌および卵巣癌の病気素因を診断するのに有用である。   The present invention relates generally to the field of human genetics. In particular, the present invention relates to methods and materials used to isolate and detect the human breast cancer disease predisposition gene (BRCA1), a certain allele that is susceptible to cancer, particularly breast cancer and ovarian cancer. About. More particularly, the invention relates to germline mutations in the BRCA1 gene and its use in the diagnosis of predisposition to breast and ovarian cancer. The invention further relates to somatic mutations in the BRCA1 gene in human breast cancer and its use in the diagnosis and prognosis of human breast cancer and ovarian cancer. In addition, the present invention relates to somatic mutations in the BRCA1 gene in other human cancers and their use in the diagnosis and prognosis of human cancers. The present invention also relates to the therapy of human cancers with mutations in the BRCA1 gene, including gene therapy, protein replacement therapy and protein mimetics. The present invention further relates to screening for drugs for treating cancer. Finally, the present invention relates to screening the BRCA1 gene for mutations, which are useful in diagnosing predisposition to breast and ovarian cancer.

本発明は、好ましくは少なくとも8塩基長〜約100kb長の、BRCA1遺伝子座または突然変異BRCA1遺伝子座の全体または一部分よりなる単離ポリヌクレオチドを提供する。かかるポリヌクレオチドはアンチセンス・ポリヌクレオチドとし得る。本発明は、また、かかる単離ポリヌクレオチドよりなる組換え構築物、例えば、形質転換宿主細胞における発現に適した組換え構築物を提供する。   The present invention provides an isolated polynucleotide consisting of all or part of a BRCA1 locus or a mutated BRCA1 locus, preferably at least 8 bases to about 100 kb in length. Such a polynucleotide may be an antisense polynucleotide. The invention also provides a recombinant construct comprising such an isolated polynucleotide, eg, a recombinant construct suitable for expression in a transformed host cell.

また、本発明により、分析物中のBRCA1遺伝子座またはその発現産物の一部分を含むポリヌクレオチドを検出する方法を提供する。かかる方法は、さらに、BRCA1遺伝子座の一部分を増幅する工程を含んでよく、さらに、BRCA1遺伝子座の該一部分を増幅するためのプライマーである1セットのポリヌクレオチドを提供する工程を含んでよい。該方法は、癌に対する病気素因の診断、または癌の診断もしくは予診のいずれかに有用である。   The present invention also provides a method for detecting a polynucleotide comprising a portion of the BRCA1 locus or its expression product in an analyte. Such a method may further comprise amplifying a portion of the BRCA1 locus and further comprising providing a set of polynucleotides that are primers for amplifying the portion of the BRCA1 locus. The method is useful for either diagnosing a disease predisposition to cancer or diagnosing or prognosing cancer.

本発明は、また、BRCA1遺伝子座によってコードされる少なくとも5個のアミノ酸残基よりなる単離ポリペプチドに特異的に結合する単離抗体、好ましくはモノクローナル抗体も提供する。   The present invention also provides an isolated antibody, preferably a monoclonal antibody, that specifically binds to an isolated polypeptide consisting of at least 5 amino acid residues encoded by the BRCA1 locus.

本発明は、また、BRCA1遺伝子座の一部分よりなるポリヌクレオチドを分析物中で検出するためのキットを提供し、該キットは適当な容器中に密閉したBRCA1遺伝子座の一部分に相補的なポリヌクレオチドおよびそれを使用するための指示書を含む。   The present invention also provides a kit for detecting a polynucleotide comprising a portion of the BRCA1 locus in an analyte, the kit being a polynucleotide complementary to a portion of the BRCA1 locus sealed in a suitable container. And instructions for using it.

本発明は、さらに、重合性ヌクレオチドを含むポリヌクレオチドを調製し、BRCA1遺伝子座の少なくとも8つの隣接したヌクレオチドよりなる配列を得る方法;ならびに、重合性アミノ酸を含むポリペプチドを調製して、BRCA1遺伝子座内にコードされる少なくとも5個のアミノ酸を含む配列を得る方法を提供する。   The present invention further provides a method of preparing a polynucleotide comprising a polymerizable nucleotide and obtaining a sequence consisting of at least 8 adjacent nucleotides of the BRCA1 locus; and a polypeptide comprising a polymerizable amino acid to prepare a BRCA1 gene A method is provided for obtaining a sequence comprising at least 5 amino acids encoded within a locus.

本発明は、さらに、突然変異を同定するためにBRCA1遺伝子をスクリーニングする方法を提供する。かかる方法は、さらに、BRCA1遺伝子座の一部分を増幅する工程をさらに含み得、かつ、BRCA1遺伝子座の該一部分を増幅するためのプライマーである1セットのポリヌクレオチドを提供する工程を含み得る。該方法は、癌に対する病気素因の診断または癌の診断もしくは予診のいずれかで使用する突然変異の同定に有用である。   The present invention further provides a method of screening the BRCA1 gene to identify mutations. Such a method may further comprise amplifying a portion of the BRCA1 locus and providing a set of polynucleotides that are primers for amplifying the portion of the BRCA1 locus. The method is useful for identifying mutations for use in either diagnosing a predisposition to cancer or diagnosing or prognosing cancer.

本発明は、さらに、BRCA1遺伝子中の突然変異を同定するための予想BRCA1突然変異対立遺伝子をスクリーニングする方法を提供する。   The present invention further provides a method of screening for predicted BRCA1 mutant alleles to identify mutations in the BRCA1 gene.

加えて、本発明は、BRCA1遺伝子産物機能を回復するのに適当な薬剤を同定するために、癌療法用の薬剤をスクリーニングする方法を提供する。   In addition, the present invention provides a method for screening drugs for cancer therapy to identify drugs suitable for restoring BRCA1 gene product function.

最後に、本発明は、癌細胞に指向する遺伝子-ベースの療法の作成に必要な手段を提供する。これらの療法剤は、BRCA1蛋白質の機能が再構成されるように適当なベクターに設置するか、または、より直接的な方法で標的細胞にデリバリーするかのBRCA1遺伝子座の全体または一部分を含むポリヌクレオチドの形態を採り得る。療法剤は、また、BRCA1の部分的または全体的な蛋白質配列のいずれかに基づいたポリペプチドの形態も採り得る。これらは、イン・ビボ(in vivo)でBRCA1の活性を機能的に置換し得る。   Finally, the present invention provides the means necessary for the creation of gene-based therapies directed against cancer cells. These therapeutic agents can be placed on a suitable vector so that the function of the BRCA1 protein is reconstituted, or they can be delivered to target cells in a more direct manner, including all or part of the BRCA1 locus. Nucleotide forms may be taken. The therapeutic agent can also take the form of a polypeptide based on either a partial or complete protein sequence of BRCA1. They can functionally replace the activity of BRCA1 in vivo.

個人が乳癌および卵巣癌に対する病気素因を作るBRCA1遺伝子は、BRCA1蛋白質をコードする遺伝子であり、この蛋白質が、公知の蛋白質またはDNA配列となんら意味深い相同性を有しないことが判明したことは本発明の知見である。この遺伝子は、本明細書中でBRCA1と命名する。生殖細胞系におけるBRCA1遺伝子座中の突然変異が、乳癌および卵巣癌に対する病気素因の指標になるということは本発明の知見である。最後に、BRCA1遺伝子座における体細胞突然変異も、乳癌、卵巣癌および他の癌と関連しており、このことが、これらの癌の指標、またはこれらの癌の病気素因を表していることが本発明の知見である。BRCA1遺伝子座の突然変異事象には、コード配列および非-コード配列内における欠失、挿入および点突然変異が含まれ得る。   The BRCA1 gene that causes predisposition to individuals for breast cancer and ovarian cancer is a gene encoding the BRCA1 protein. It is knowledge of the invention. This gene is designated herein as BRCA1. It is a finding of the present invention that mutations in the BRCA1 locus in germline are indicative of disease predisposition to breast and ovarian cancer. Finally, somatic mutations at the BRCA1 locus are also associated with breast cancer, ovarian cancer and other cancers, which may represent an indication of these cancers, or a predisposition to these cancers. This is a finding of the present invention. Mutational events at the BRCA1 locus can include deletions, insertions and point mutations within the coding and non-coding sequences.

ヒトゲノムのヒト染色体17の長腕上の領域から開始する17qは、約8Mbpと概算されるサイズ、遺伝子座を含む領域、BRCA1を有し、乳癌および卵巣癌を含む癌に対して感受性を引き起こすことが突き止められている。   17q starting from the region on the long arm of human chromosome 17 of the human genome has a size estimated to be about 8 Mbp, a region containing the locus, BRCA1, and causes susceptibility to cancers including breast cancer and ovarian cancer Has been located.

BRCA1遺伝子座を含む領域は、種々の遺伝的技術を用いて同定した。遺伝子マッピング技術は、遺伝子マーカーでの組換えによりBRCA1領域を最初に画定した。多重ケースの乳癌(およびある家系では卵巣癌ケース)を有する大きく広がった家族(「家系」)の研究に基づいて、BRCA1遺伝子ならびにBRCA1遺伝子座中の他の予想感受性対立遺伝子を含む染色体領域の正確な位置を示した。2つの分裂中止点が、遺伝子マーカーと該疾病との間の組換体として、およびBRCA1遺伝子座の基部側の1つの組換体として発現されるBRCA1遺伝子座の末端側に発見された。したがって、BRCA1遺伝子座を含む領域はこれらのマーカーと物理的に境を接する。   The region containing the BRCA1 locus was identified using various genetic techniques. The gene mapping technique first defined the BRCA1 region by recombination with genetic markers. Based on the study of a large extended family ("family") with multiple cases of breast cancer (and ovarian cancer cases in some families) Indicated the position. Two mitotic breakpoints were found on the distal side of the BRCA1 locus expressed as a recombinant between the genetic marker and the disease and as one recombinant at the base of the BRCA1 locus. Therefore, the region containing the BRCA1 locus physically borders these markers.

本発明により提供される遺伝子マーカーの使用は、ヒト酵母人工染色体(YAC)またはヒト細菌人工染色体(BAC)ライブラリーからの領域をカバーするクローンの同定を許容する。また、この領域からのより簡便に操作したコスミド、P1およびBACクローンの同定および調製、ならびにサブセットのクローンからのコンチグ(contig)の構築も許容する。これらのコスミド、P1、YACおよびBACは、BRCA1遺伝子座のクローニングの基礎を提供し、例えば、乳癌および/または卵巣癌の診断および治療に有効な試薬を開発する基礎を提供する。BRCA1遺伝子および他の可能性のある感受性遺伝子はこの領域から単離した。単離は、cDNAライブラリーをスクリーニングする領域において、コスミド、P1およびBACからの全体または部分的cDNAインサートと共に、ソフトウェア・トラッピング(連続的または非連続的ゲノムDNA配列から、コードエキソンを含んでいそうな配列を同定するコンピュータ的方法)、ハイブリッド選抜技術および直接的スクリーニングを用いて行った。これらの方法を用いて、乳房および他の組織中に発現される遺伝子座の配列を得た。これらの候補遺伝子座を分析して、癌感受性を供する配列を同定した。本発明者らは、BRCA1として知られている17q-連鎖癌感受性の原因となる家系において、BRCA1遺伝子座のコード配列中に突然変異が存在することを発見した。この遺伝子がこの領域中に存在することは知られていなかった。本発明は、特定の癌の早期検出を容易にして患者の生存に活力を与えるのみならず、感受性の個人が癌を発症する前に彼らを検出することもできる。   The use of genetic markers provided by the present invention allows the identification of clones that cover regions from human yeast artificial chromosome (YAC) or human bacterial artificial chromosome (BAC) libraries. It also allows the easier manipulation of cosmids, P1 and BAC clones from this region, and the construction of contigs from subset clones. These cosmids, P1, YAC and BAC provide the basis for cloning the BRCA1 locus, for example, the basis for developing reagents effective in the diagnosis and treatment of breast and / or ovarian cancer. The BRCA1 gene and other possible susceptibility genes were isolated from this region. Isolation is a software trapping (possibly containing coding exons from continuous or non-contiguous genomic DNA sequences), along with whole or partial cDNA inserts from cosmids, P1 and BAC in the region of screening a cDNA library. Computational methods to identify unique sequences), hybrid selection techniques and direct screening. Using these methods, sequences of loci expressed in breast and other tissues were obtained. These candidate loci were analyzed to identify sequences that confer cancer susceptibility. The inventors have discovered that a mutation exists in the coding sequence of the BRCA1 locus in a family responsible for 17q-linked cancer susceptibility known as BRCA1. It was not known that this gene is present in this region. The present invention not only facilitates early detection of specific cancers to vitalize patient survival, but also allows sensitive individuals to detect them before they develop cancer.

母集団-源
広くよく記録されているユタ州の家系は、ヒト遺伝学研究の良好な入手源を提供する点において特に重要である。各大きな家系は、独立して、BRCA1感受性対立遺伝子がその家族中で分離しているか否かを決定する能力を提供する。BRCA1遺伝子座の位置決定および単離に関する組換え情報性は、感受性対立遺伝子の存在を確認するのに十分に大きな家系からのみ得ることができた。大きな兄弟姉妹は乳癌を研究する上で特に重要である。なぜならば、BRCA1感受性対立遺伝子の浸透度が年齢および性別の両方によって減じられ、情報的兄弟姉妹を発見することを困難としているためである。さらに、大きな兄弟姉妹はその接近した血縁のハロタイプからの影響によって、死亡した個人のハロタイプを構築するのに必須である。
Population-Sources The well-documented Utah family is particularly important in providing a good source of human genetics research. Each large family independently provides the ability to determine whether the BRCA1 susceptibility allele is segregating in the family. Recombination information about the location and isolation of the BRCA1 locus could only be obtained from a family that was large enough to confirm the presence of a susceptible allele. Large siblings are particularly important in studying breast cancer. This is because the penetrance of the BRCA1 susceptibility allele is reduced by both age and sex, making it difficult to find informational siblings. In addition, large siblings are essential to build the halotypes of individuals who have died due to the effects of their close relatives.

他の母集団も有益な情報を提供し得るが、かかる研究には一般的により大きな努力を要し、家族は通常遥かに小さく、それ故、あまり情報を得ることができない。ユタ州の年齢を調整した乳癌発症率は20%で、平均米国の比率よりも低い。ユタ州における低い発症率は、恐らく、大部分は、最初の妊娠の低年齢によるもので、遺伝的病気素因を運ぶユタ州の家系にそのケースが見出される確率は上昇する。   Other populations can also provide useful information, but such studies generally require more effort and families are usually much smaller and therefore less accessible. Utah's age-adjusted breast cancer incidence rate is 20%, lower than the average US rate. The low incidence in Utah is probably due mostly to the early age of the first pregnancy, and the probability that the case will be found in Utah families carrying a genetic predisposition is increased.

遺伝子マッピング
情報的な家族の組が与えられれば、疾病を染色体の領域に連鎖するために遺伝マーカーは必須である。かかるマーカーには、制限断片長多形(RELP)(Botsteinら,1980)、変動する数の縦列反復を有するマーカー(VNTR)(Jeffreysら,1985;Nakamuraら,1987)、および短縦列反復(STR)、特にCpAの反復(WeberおよびMay,1989;Littら,1989)に基づく豊富なクラスのDNA多形が含まれる。遺伝子地図を作製するためには、潜在的な遺伝子マーカーを選抜し、研究する家系構成員から抽出したDNAを用いてそれらを試験する。
Genetic Mapping Given an informative family set, genetic markers are essential to link disease to chromosomal regions. Such markers include restriction fragment length polymorphism (RELP) (Botstein et al., 1980), markers with varying numbers of tandem repeats (VNTR) (Jeffreys et al., 1985; Nakamura et al., 1987), and short tandem repeats (STR). ), A rich class of DNA polymorphisms, especially based on CpA repeats (Weber and May, 1989; Litt et al., 1989). To create a genetic map, potential genetic markers are selected and tested using DNA extracted from the family members being studied.

疾病と関連する遺伝子座を探索するのに有用な遺伝子マーカーは、特異的染色体を稠密にカバーするか、染色体の特異的領域の詳細な分析による特にこの問題に基づいて選抜し得る。疾病と連鎖する遺伝マーカーを選抜する好ましい方法には、家系の情報性の程度を評価して所与の程度の多形の遺伝子マーカーの間の理想的な距離を決定し、ついで、最大の効率で理想的に離れた公知の遺伝子地図からマーカーを選抜することが含まれる。家系の情報性は、該マーカーが無関係な個人においてヘテロ接合体である確率によって測定する。また、PCRを用いた標的核酸配列の増幅によって検出したSTRマーカーを用いることが最も効率的であり;かかるマーカーは非常に情報性が高く、アッセイし易く(WeberおよびMay,1989)、複合戦略を用いて同時にアッセイし得(SkolnickおよびWallace,1988)、要する実験数を顕著に低減し得る。   Genetic markers useful for searching for genetic loci associated with disease can be selected based on this problem, in particular by dense coverage of specific chromosomes or by detailed analysis of specific regions of the chromosome. The preferred method of selecting genetic markers linked to disease is to assess the degree of information in the family and determine the ideal distance between genetic markers of a given degree of polymorphism, followed by maximum efficiency. And selecting markers from known genetic maps that are ideally separated. Family information is measured by the probability that the marker is heterozygous in an unrelated individual. It is also most efficient to use STR markers detected by amplification of target nucleic acid sequences using PCR; such markers are very informative, easy to assay (Weber and May, 1989), and complex strategies Can be used and assayed simultaneously (Skolnick and Wallace, 1988), significantly reducing the number of experiments required.

連鎖性が確立されたら、疾病遺伝子座に隣接するマーカー、すなわち、該疾病遺伝子座に近い1または2以上のマーカー、および該疾病遺伝子座に対し基部側の1または2以上のマーカーを見付ける必要がある。可能ならば、公知の遺伝子地図から候補マーカーを選抜し得る。知られているものがない場合には、実施例で示すSTR技術によって新たなマーカーを同定し得る。   Once linkage has been established, it is necessary to find a marker adjacent to the disease locus, ie, one or more markers close to the disease locus, and one or more markers proximal to the disease locus. is there. If possible, candidate markers can be selected from known genetic maps. If nothing is known, a new marker can be identified by the STR technique shown in the examples.

遺伝子マッピングは通常は反復的工程である。本発明においては、BRCA1遺伝子座の周りの隣接遺伝子マーカーを画定し、ついで、これらの隣接マーカーをBRCA1遺伝子座に首尾よく近い他のマーカーに置き換えることによってそれを開始する。最初の工程、組換え事象では、広範な家系によって画定して、特異的な遺伝子マーカーから離れているか近いかとして、BRCA1遺伝子座を特異的に位置決定することを補助する(Goldgarら,1994)。   Gene mapping is usually an iterative process. In the present invention, we define adjacent gene markers around the BRCA1 locus and then begin by replacing these adjacent markers with other markers that are successfully close to the BRCA1 locus. The first step, a recombination event, is defined by a wide range of families and helps to specifically locate the BRCA1 locus as being away from or close to specific genetic markers (Goldgar et al., 1994). .

本発明が開示されるまでは、BRCA1を囲む領域はよくマッピングされておらず、マーカーもほとんどなかった。したがって、物理的にマッピングされたYACからサブクローン化したコスミド上の短い反復配列を分析して、新たな遺伝子マーカーを開発した。このアプローチを用いて、本発明の1つのマーカー、42D6が発見され、これは、BRCA1領域用の末端側隣接マーカーとしてpCMM86で置換した。42D6はpCMM86からほぼ14cMに存在するため、それ故、BRCA1領域はほぼ14センチモルガン分減少された(Eastonら,1993)。かくして、本発明は、BRCA1領域のより接近して連鎖した末端側隣接マーカーを見出すことによって開始した。ついで、BRCA1は、遺伝子マーカーMfdl5に対して末端側に存在することを発見した。したがって、BRCA1は、Mfdl5および42D6と境を接する6Mbp〜10Mbpの領域に存在することが示された。つづいて、マーカーMfdl9lはMfdl5から末端側であって、BRCA1から基部側にあることを発見した。かくして、Mdfl5を、最も基部側の遺伝子マーカーとしてMfdl9lで置換した。同様にして、遺伝子マーカーMfdl88は、BRCA1遺伝子座を含む領域をほぼ1.5Mbまで狭める、遺伝子マーカー42D6を置換し得ることを発見した。ついで、当該分野で知られており、かつ本明細書に記載した技術を用いて、マーカーMfdl9lを基部側マーカーとしてのtdj1474で置換し、Mfdl88を末端側マーカーとしてのU5Rで置き換えて、BRCA1遺伝子座を単離し、特徴付けを得るに十分に小さい領域までBRCA1領域を狭めた(図3参照)。   Until the present invention was disclosed, the region surrounding BRCA1 was not well mapped and there were few markers. Therefore, short repeats on cosmids subcloned from physically mapped YACs were analyzed to develop new genetic markers. Using this approach, one marker of the invention, 42D6, was discovered, which was replaced with pCMM86 as a terminal flanking marker for the BRCA1 region. Since 42D6 is present at approximately 14 cM from pCMM86, the BRCA1 region was therefore reduced by approximately 14 centmorgans (Easton et al., 1993). Thus, the present invention began by finding more closely linked terminal flanking markers in the BRCA1 region. Next, it was discovered that BRCA1 is present on the terminal side with respect to the gene marker Mfdl5. Therefore, it was shown that BRCA1 exists in the region of 6 Mbp to 10 Mbp bordering on Mfdl5 and 42D6. Subsequently, the marker Mfdl9l was found to be distal to Mfdl5 and proximal to BRCA1. Thus, Mdfl5 was replaced with Mfdl9l as the most proximal genetic marker. Similarly, it was discovered that the genetic marker Mfdl88 can replace the genetic marker 42D6, which narrows the region containing the BRCA1 locus to approximately 1.5 Mb. Then, using the techniques known in the art and described herein, the marker Mfdl9l is replaced with tdj1474 as the proximal marker, and Mfdl88 is replaced with U5R as the distal marker, and the BRCA1 locus And the BRCA1 region was narrowed to a region small enough to obtain characterization (see FIG. 3).

物理的マッピング
3つの異なる方法を用いて該領域を物理的にマッピングした。第一のものは、tdj1474およびU5Rによって隣接して挟まれた領域をクローン化するための酵母人工染色体(YAC)の使用であった。第二のものは、BRCA1遺伝子座を含む領域をカバーするP1、BACおよびコスミドクローンのセットの作製であった。
Physical mapping The area was physically mapped using three different methods. The first was the use of a yeast artificial chromosome (YAC) to clone a region flanked by tdj1474 and U5R. The second was the creation of a set of P1, BAC and cosmid clones covering the region containing the BRCA1 locus.

酵母人工染色体(YAC)
BRCA1遺伝子座を含む十分に小さな領域を同定したら、該領域をカバーする重複YACのセットを同定することによって、該領域中のDNAの物理的単離を続行した。有用なYACは、各々、広範に分布し、ほぼ50,000のYACを含むSt.LouisおよびCEPH YACライブラリーのごとき公知のライブラリーから単離し得る。YACをこれらの公的にアクセス可能なライブラリーから単離し、Michigan Genome Centerを含む多数の供給源から得ることができる。明らかに、これらのYACにアクセスしたものは、本発明を開示することなしに、本発明者らが選択した特異的YACの価値を理解しなかったであろう。なぜならば、彼らは、BRCA1遺伝子座を含む最小の領域の中にどのYACが存在し、どのYACがその外側に存在するかということを理解しなかったであろうからである。
Yeast artificial chromosome (YAC)
Once a sufficiently small region containing the BRCA1 locus was identified, physical isolation of DNA in the region was continued by identifying a set of overlapping YACs covering the region. Useful YACs can be isolated from known libraries such as the St. Louis and CEPH YAC libraries, each of which is widely distributed and contains approximately 50,000 YACs. YACs can be isolated from these publicly accessible libraries and obtained from a number of sources including Michigan Genome Center. Clearly, those accessing these YACs would not have understood the value of the specific YACs we chose without disclosing the present invention. This is because they would not have understood which YAC is in the minimal region containing the BRCA1 locus and which YAC is outside of it.

コスミド、P1およびBACクローン
本発明においては、コスミド、P1およびBACクローンにより続行してこの領域をカバーすることが有利である。YACインサートと比較してより小さなサイズのこれらのインサートは、特異的ハイブリダイゼーションプローブとしてそれをより有用としている。さらに、酵母細胞よりもむしろ細菌細胞中にクローン化DNAを有していれば、目的のDNAを操作し得る簡便性が大きく上昇し、ハイブリダイゼーション・アッセイのノイズに対する信号の比が改善される。YACのコスミドサブクローンについては、該DNAを制限酵素Sau3Aで部分消化し、pWE15コスミドベクター(Stratagene社,カタログ番号1251201)のBamHI部位にクローン化する。ヒト配列を含むコスミドは、実施例に詳記するごとく、ヒト反復DNA(例えば、Gibco/BRL社、ヒトCt-1 DNA、カタログ番号5279A)とのハイブリダイゼーションによってスクリーニングし、ついで、種々の技術によってフィンガープリンティングする。
Cosmid, P1 and BAC clones In the present invention, it is advantageous to continue with this region by cosmid, P1 and BAC clones. These smaller sized inserts compared to YAC inserts make it more useful as a specific hybridization probe. Furthermore, having cloned DNA in bacterial cells rather than yeast cells greatly increases the ease with which the target DNA can be manipulated and improves the signal to noise ratio of the hybridization assay. For the YAC cosmid subclone, the DNA is partially digested with the restriction enzyme Sau3A and cloned into the BamHI site of the pWE15 cosmid vector (Stratagene, catalog number 1251201). Cosmids containing human sequences were screened by hybridization with human repetitive DNA (eg, Gibco / BRL, human C 0 t-1 DNA, catalog number 5279A), as detailed in the Examples, followed by various Fingerprint by technology.

P1およびBACクローンは、前記のごとく単離した、YAC、コスミドまたはP1およびBAC由来の特異配列標識部位(STS)で全ヒトゲノムから構築したライブラリーをスクリーニングすることによって得る。   P1 and BAC clones are obtained by screening a library constructed from the entire human genome with a specific sequence labeling site (STS) derived from YAC, cosmid or P1 and BAC, isolated as described above.

これらのP1、BACおよびコスミドクローンは、散在反復配列(IRS)PCRおよび/または制限酵素消化につづくゲル電気泳動、および得られたDNAフラグメントの比較(フィンガープリント)(Maniatisら,1982)によって比較し得る。該クローンは、また、STSの存在によっても特徴付け得る。該フィンガープリントを用いて、該領域をカバーするが冗長すぎないクローンの重複隣接セット(本明細書においては、「最小限タイル路(minimum tiling path)という」)を画定する。かかる最小限タイル路は、つづく実験の基礎を形成し、BRCA1遺伝子座由来となり得るcDNAを同定する。   These P1, BAC and cosmid clones were compared by scattered repeat (IRS) PCR and / or gel electrophoresis following restriction enzyme digestion and comparison of the resulting DNA fragments (fingerprints) (Maniatis et al., 1982). obtain. The clone can also be characterized by the presence of STS. The fingerprint is used to define an overlapping contiguous set of clones that cover the region but are not too redundant (referred to herein as “minimum tiling paths”). Such a minimal tile path forms the basis for subsequent experiments and identifies cDNAs that can be derived from the BRCA1 locus.

P1およびBACクローンでのギャップの適用範囲
ゲノミッククローンを有する同定コスミド間のBRCA1コンチグ(contig)中のいずれのギャップもカバーするために、P1用のコスミドよりもほぼ2倍大きく、BACについてはなおより大きなゲノミックDNAのインサートを含むBACベクターとP1中のクローン(Sternberg,1990;Sternbergら,1990;Pierceら,1992;Shizuyaら,1992)とを用いた。P1クローンは、スクリーニング用に本発明らによって提供されるPCRプライマーを用いてGenome Sciences社によって単離した。BACは、Dr.Mel Simon's laboratoryにおけるハイブリダイゼーション技術によって得た。P1クローンを用いる戦略により、YAC由来でないクローンの独立セットでゲノム領域をカバーすることも許容される。これは、検出されていないYAC中の他の欠失の可能性に対して保護する。P1クローン由来のこれらの新たな配列は、以下に記載するごとく、候補遺伝子をさらにスクリーニングするための材料を提供する。
Coverage of gaps in P1 and BAC clones To cover any gaps in the BRCA1 contig between identified cosmids with genomic clones, almost twice as large as the cosmids for P1 and even more for BAC BAC vectors containing large genomic DNA inserts and clones in P1 (Sternberg, 1990; Sternberg et al., 1990; Pierce et al., 1992; Shizuya et al., 1992) were used. The P1 clone was isolated by Genome Sciences using PCR primers provided by the present inventors for screening. BAC was obtained by the hybridization technique in Dr. Mel Simon's laboratory. The strategy using P1 clones also allows the genomic region to be covered with an independent set of clones not derived from YAC. This protects against the possibility of other deletions in the YAC that have not been detected. These new sequences from the P1 clone provide material for further screening of candidate genes as described below.

遺伝子単離
単離しようと試行する遺伝子座のコード配列の候補となりそうな配列の存在につきゲノミッククローンを試験する多くの技術が存在し、これには、限定するものではないが:
a.ズー・ブロット(zoo blot)
b.HTF・アイランド(island)の同定
c.エキソントラッピング
d.コスミドまたはYACへのcDNAのハイブリダイゼーション
e.cDNAライブラリーのスクリーニング
が含まれる。
(a)ズー・ブロット 第一の技術はコスミドをサザンブロットにハイブリダイズさせて進化の過程で保存され、従って、ヒトに対し種々の程度の関係を有する種(サル、ウシ、ニワトリ、ブタ、マウスおよびラットのごとき)からのDNAと陽性のハイブリダイゼーション信号を与えるDNA配列を同定する。種々の種からのかかるDNAを含むサザンブロットは市販されている(Clonetech社,カタログ番号7753-1)。
(b)HTFアイランドの同定 第二の技術には、ヌクレオチドCおよびGに富む領域を見出すことが含まれ、この領域はしばしばコード配列の付近またはその中に生じる。かかる配列は、これらの領域において頻繁に切断されるCpG二量体を含む部位に特異的な制限酵素として、HTF(HpaI小フラグメント)またはCpGアイランドと呼称される(Lindsayら,1987)。
(c)エキソントラッピング 第三の技術は、スプライス結合部を含有し、したがって遺伝子のコード配列を含んでいそうなゲノミックDNA中の配列を同定する方法、エキソントラッピングである。エキソン増幅(Bucklerら,1991)を用いて、前記したDNAクローンからエキソンを選抜し、増幅する。エキソン増幅は、機能性5'および/または3'スプライス部位によって隣接して挟まれたRNA配列の選抜に基づいている。さらなる研究用の処理可能な数の候補遺伝子を同定するために、エキソン増幅の産物を用いて乳癌cDNAライブラリーをスクリーニングする。エキソントラッピングは、コンピュータプログラムを用いた配列決定DNAの小セグメントで、またはソフトウェア捕捉によっても行い得る。
(d)コスミド、P1、BACまたはYACに対してハイブリダイズする
cDNA 第四の技術は、コスミド、P1、BACまたはYACに対するcDNAのハイブリダイゼーションを利用し、転写された配列がクローン化ゲノムDNA中に同定され、かつ、それから回収されるのを可能とする選択的富化技術の修飾法である(Kandpalら,1990)。本目的に修飾した選択的富化技術には、YAC中に存在するBRCA1の領域からのDNAをカラムマトリックスに結合させ、ついで該結合DNAとハイブリダイズする適当なライブラリーからcDNAを選抜し、つづいて該結合DNAを増幅させて精製することが含まれ、クローン化ゲノムDNAによって代表される領域中のcDNAが非常に増大される。
(e)cDNAの同定 第五の技術は、BRCA1遺伝子座に対応するcDNAを同定することである。前記した技術のいずれかを用いて選抜した、予想コード配列を含むハイブリダイゼーション・プローブを用いて、乳房組織cDNAライブラリー、卵巣cDNAライブラリーおよびいずれかの他の必要なライブラリーを包含する種々のライブラリーをスクリーニングする。
Gene Isolation There are many techniques to test genomic clones for the presence of sequences that are likely candidates for the coding sequence of a locus to be isolated, including but not limited to:
a. Zoo blot
b. Identification of HTF island
c. Exon trapping
d. Hybridization of cDNA to cosmid or YAC
e. Includes screening of cDNA libraries.
(a) Zoo blotting The first technique is to preserve species during evolution by hybridizing cosmids to Southern blots, and thus species with varying degrees of relation to humans (monkeys, cows, chickens, pigs, mice). DNA sequences that give positive hybridization signals with DNA from (such as and rats). Southern blots containing such DNA from various species are commercially available (Clonetech, catalog number 7753-1).
(b) Identification of HTF islands The second technique involves finding a region rich in nucleotides C and G, which often occurs near or in the coding sequence. Such sequences are referred to as HTF (HpaI small fragment) or CpG islands as restriction enzymes specific for sites containing CpG dimers that are frequently cleaved in these regions (Lindsay et al., 1987).
(c) Exon trapping A third technique is exon trapping, a method for identifying sequences in genomic DNA that contain a splice junction and therefore are likely to contain the coding sequence of a gene. Using exon amplification (Buckler et al., 1991), exons are selected from the DNA clones described above and amplified. Exon amplification is based on the selection of RNA sequences flanked by functional 5 ′ and / or 3 ′ splice sites. To identify a processable number of candidate genes for further study, exon amplification products are used to screen a breast cancer cDNA library. Exon trapping can also be performed on small segments of sequencing DNA using a computer program or by software capture.
(d) cDNA that hybridizes to cosmid, P1, BAC, or YAC The fourth technique utilizes hybridization of cDNA to cosmid, P1, BAC, or YAC, and the transcribed sequence is incorporated into cloned genomic DNA. A modification of the selective enrichment technique that allows it to be identified and recovered from it (Kandpal et al., 1990). For the selective enrichment technique modified for this purpose, DNA from the region of BRCA1 present in the YAC is bound to a column matrix and then cDNA is selected from an appropriate library that hybridizes with the bound DNA, followed by Amplification of the bound DNA and purification, greatly increasing the cDNA in the region represented by the cloned genomic DNA.
(e) Identification of cDNA A fifth technique is to identify a cDNA corresponding to the BRCA1 locus. A variety of probes, including breast tissue cDNA libraries, ovarian cDNA libraries and any other required libraries, using hybridization probes containing the predicted coding sequences, selected using any of the techniques described above. Screen the library.

また、主題のcDNAの直接的選抜の他の変形を用いても、BRCA1の候補遺伝子を見い出した(Lovettら,1991;Futreal,1993)。この方法は、コスミド、P1またはBAC DNAをプローブとして用いる。プローブDNAは、HaeIIIのごとき平滑切断制限酵素で消化する。ついで、二本鎖アダプターを該DNAに連結し、これはビオチン化プライマーを用いる続くPCR増幅反応においてプライマーの結合部位として作用する。標的cDNAは、第一鎖のランダム起点合成またはオリゴ(dT)起点合成のいずれかの合成につづく第二鎖合成によって、組織試料、例えば、乳房組織由来のmRNAから作製する。cDNA末端を平滑にし、二本鎖アダプターに連結する。これらのアダプターは、PCR用の増幅部位として作用する。標的およびプローブ配列を変性させ、ヒトCt-1 DNAと混合して反復配列を遮断する。溶液ハイブリダイゼーションを高Ct-1/2値として、稀な標的cDNA分子のハイブリダイゼーションを保証する。ついで、アニーリングした材料をアビジンビーズ上に捕捉し、高ストリンジェンシーで洗浄し、保持されたcDNAを溶出し、PCRによって増幅する。選抜したcDNAは、分析用のプラスミドベクターにクローニングする前に増大のさらなるラウンドに付す。 In addition, candidate variants of BRCA1 were also found using other variants of direct selection of the subject cDNA (Lovett et al., 1991; Futreal, 1993). This method uses cosmid, P1 or BAC DNA as a probe. The probe DNA is digested with a blunt restriction enzyme such as HaeIII. A double stranded adapter is then ligated to the DNA, which acts as a primer binding site in subsequent PCR amplification reactions using biotinylated primers. Target cDNA is generated from tissue samples, eg, mRNA from breast tissue, by second strand synthesis followed by either first-strand random origin synthesis or oligo (dT) origin synthesis. The cDNA ends are blunted and ligated to a double stranded adapter. These adapters act as amplification sites for PCR. Target and probe sequences are denatured and mixed with human C 0 t-1 DNA to block repetitive sequences. Solution hybridization is set to a high C 0 t-1 / 2 value to ensure hybridization of rare target cDNA molecules. The annealed material is then captured on avidin beads, washed with high stringency and the retained cDNA is eluted and amplified by PCR. The selected cDNA is subjected to a further round of expansion before cloning into a plasmid vector for analysis.

候補性についてのcDNAの試験
cDNAが、異常BRCA1遺伝子産物または異常なレベルのBRCA1遺伝子産物を生成する羅患された家系構成員から抽出したDNA中に配列を見出すことによって得られるBRCA1遺伝子座であることを立証する。かかるBRCA1感受性対立遺伝子は、広範な家系中で該疾病に関し共-分離しているであろう。それは、また、乳癌および卵巣癌を有する非-家系個人、ついで一般集団中の個人において、より高頻度で存在するであろう。最後に、腫瘍は、他の例においては生殖細胞系で突然変異する遺伝子座でしばしば体細胞突然変異するため、本発明者らは、腫瘍組織から抽出したDNA中のBRCA1感受性対立遺伝子と同一または同様である配列に突然変異誘発した正常な生殖細胞系BRCA1対立遺伝子を見出すことが期待される。腫瘍組織からのBRCA1配列を同一個人の生殖細胞系からのBRCA1対立遺伝子と比較するか、癌ケースからの生殖細胞系BRCA1対立遺伝子を非羅患個人からのものと比較するかのいずれにせよ、遺伝子産物の正常機能を明らかに破壊するに十分に重大である突然変異を見出すことが鍵となる。これらの突然変異は多種の形態を採り得る。最も重大な形態はフレームシフト突然変異または広範な欠失であり、これらは、遺伝子に、異常蛋白質をコードさせるか、または重大に変化した蛋白質を発現させるであろう。より重大でない破壊的突然変異には、小規模な枠内欠失および非保存性塩基対置換が含まれ、これらは、システイン残基へのまたはシステイン残基からの変化、塩基性アミノ酸から酸性アミノ酸への変化またはその反対、疎水性アミノ酸から親水性アミノ酸への変化またはその反対、あるいは、蛋白質の二次、三次または四次の構造に影響するであろう他の突然変異のごとき、産生蛋白質に重大な影響を及ぼすであろう。サイレント突然変異または保存性アミノ酸置換を生じるものは、一般的に蛋白質機能を破壊するとは予想されない。
Testing a cDNA for Candidates A cDNA is a BRCA1 locus obtained by finding a sequence in DNA extracted from a diseased family member that produces an abnormal BRCA1 gene product or an abnormal level of BRCA1 gene product. Prove that. Such BRCA1 susceptibility alleles will be co-segregated for the disease in a wide range of families. It will also be present more frequently in non-family individuals with breast and ovarian cancer, and then in individuals in the general population. Finally, because tumors are often somatically mutated at loci that mutate in the germline in other examples, we are identical to BRCA1-sensitive alleles in DNA extracted from tumor tissue or It is expected to find a normal germline BRCA1 allele mutated to a sequence that is similar. Either the BRCA1 sequence from the tumor tissue is compared with the BRCA1 allele from the germline of the same individual or the germline BRCA1 allele from the cancer case is compared with that from a non-affected individual, The key is to find mutations that are significant enough to clearly disrupt the normal function of the gene product. These mutations can take many forms. The most critical form is a frameshift mutation or extensive deletion, which will cause the gene to encode an abnormal protein or to express a significantly altered protein. Less severe destructive mutations include small in-frame deletions and non-conservative base pair substitutions that change to or from cysteine residues, basic amino acids to acidic amino acids To the production protein, such as a change to or vice versa, a change from a hydrophobic amino acid to a hydrophilic amino acid or vice versa, or other mutations that may affect the secondary, tertiary or quaternary structure of the protein. It will have a serious effect. Those that result in silent mutations or conservative amino acid substitutions are generally not expected to disrupt protein function.

本発明の診断および予診によれば、野生型BRCA1遺伝子座の変化が検出される。加えて、該方法は、野生型BRCA1遺伝子座を検出し、BRCA1遺伝子座に癌の素因の欠失を確認することによって行い得る。「野生型遺伝子の変化」とは、コード領域および非コード領域における欠失、挿入および点突然変異を含むすべての形態の突然変異が包含される。欠失は、遺伝子全体のものであるか、または遺伝子の一部分のみのものであり得る。点突然変異は終止コドン、フレームシフト突然変異またはアミノ酸置換を生じ得る。体細胞突然変異は、特定の組織、例えば、腫瘍組織でのみ発生するものであり、生殖細胞系において遺伝されない。生殖細胞系突然変異は体のいずれの組織においても見出すことができ、遺伝される。単一の対立遺伝子のみが体細胞的に突然変異した場合、初期新生生物状態が示される。しかしながら、両方の対立遺伝子が体細胞的に突然変異した場合、後期の新生生物状態が示される。かくして、BRCA1突然変異の知見は、診断および予診の情報を両方提供する。欠失していないBRCA1対立遺伝子(例えば、姉妹染色体からBRCA1欠失を運ぶ染色体の姉妹染色体で見出された)は、挿入、小さな欠失および点突然変異のごとき他の突然変異につきスクリーニングし得る。腫瘍組織において見出された多くの突然変異はBRCA1遺伝子産物の発現を低下に通じるものであろうと考えられる。しかしながら、非-機能的遺伝子産物に通じる突然変異も、癌にかかった状態に通じるであろう。点突然変異事象は、遺伝子のプロモーターでのごとき、調節領域中で起こり得、mRNAの発現の欠失または減少に通じる。点突然変異も、また、適当なRNAプロセシングを破壊し得、BRCA1遺伝子産物の発現の欠失、あるいは、mRNA安定性または翻訳効率の低下に通じる。   According to the diagnosis and prognosis of the present invention, a change in the wild-type BRCA1 locus is detected. In addition, the method can be performed by detecting the wild-type BRCA1 locus and confirming a deletion of a predisposition to cancer at the BRCA1 locus. “Wild-type gene alterations” include all forms of mutations, including deletions, insertions and point mutations in coding and non-coding regions. Deletions can be for the entire gene or only for a portion of the gene. Point mutations can result in stop codons, frameshift mutations or amino acid substitutions. Somatic mutations occur only in certain tissues, such as tumor tissues, and are not inherited in the germline. Germline mutations can be found in any tissue of the body and are inherited. If only a single allele is somatically mutated, an early neoplastic state is indicated. However, if both alleles are somatically mutated, a late neoplastic state is indicated. Thus, the knowledge of the BRCA1 mutation provides both diagnostic and prognostic information. Non-deleted BRCA1 alleles (eg found on sister chromosomes of chromosomes carrying BRCA1 deletions from sister chromosomes) can be screened for other mutations such as insertions, small deletions and point mutations . It is believed that many mutations found in tumor tissue may lead to decreased expression of the BRCA1 gene product. However, mutations that lead to non-functional gene products will also lead to cancerous conditions. Point mutation events can occur in the regulatory region, such as at the promoter of a gene, leading to deletion or reduction of mRNA expression. Point mutations can also disrupt proper RNA processing, leading to loss of expression of the BRCA1 gene product, or reduced mRNA stability or translation efficiency.

有用な診断技術には、限定するものではないが、さらに以下で詳細に論じる蛍光イン・サイチュ(in situ)ハイブリダイゼーション(FISH)、直接DNA配列決定、PFGE分析、サザンブロット分析、一本鎖構造解析(SSCA)、RNアーゼ保護アッセイ、対立遺伝子-特異的オリゴヌクレオチド(ASO)、ドットブロット分析およびPCR-SSCPが包含される。   Useful diagnostic techniques include, but are not limited to, fluorescent in situ hybridization (FISH), direct DNA sequencing, PFGE analysis, Southern blot analysis, single-stranded structure, discussed in further detail below. Analysis (SSCA), RNase protection assay, allele-specific oligonucleotide (ASO), dot blot analysis and PCR-SSCP are included.

乳癌および卵巣癌および本明細書で同定した他の癌のごとき癌の素因は、BRCA1遺伝子の突然変異についてヒトのいずれかの組織を試験することによって確認し得る。例えば、生殖細胞系BRCA1突然変異を遺伝した個人は、癌を発症し易い傾向であろう。これは、該個人の体のいずれかの組織からのDNAを試験することによって決定し得る。最も単純には、採血しその血液の細胞からDNAを抽出する。加えて、BRCA1遺伝子の突然変異について、胎児細胞、胎盤細胞または羊膜細胞を試験することによっても出生前診断を行い得る。点突然変異または欠失のいずれによるにせよ、野生型BRCA1対立遺伝子の変化は、本明細書で論じるいずれかの手段によって検出し得る。   Cancer predisposition, such as breast and ovarian cancer and other cancers identified herein, can be confirmed by examining any human tissue for mutations in the BRCA1 gene. For example, individuals who have inherited germline BRCA1 mutations will be prone to developing cancer. This can be determined by examining DNA from any tissue of the individual's body. Most simply, blood is collected and DNA is extracted from cells of the blood. In addition, prenatal diagnosis can also be made by examining fetal, placental or amniotic cells for mutations in the BRCA1 gene. Whether by point mutation or deletion, changes in the wild type BRCA1 allele can be detected by any means discussed herein.

DNA配列変動を検出するのに用い得る幾つかの方法が存在する。手動配列決定または自動化蛍光配列決定のいずれかの直接DNA配列決定は、配列変動を検出し得る。BRCA1ほど大きな遺伝子については、非常に激しい労働であるが、最適条件下では遺伝子のコード配列における突然変異をめったに見失わない。別のアプローチは、一本鎖構造多形性アッセイ(SSCA)(Oritaら,1989)である。この方法は、特にDNAフラグメントが200bpよりも大きな場合、すべての配列変化を検出しないが、最適化して大部分のDNA配列変動を検出することができる。検出感度が低下することは不利であるが、SSCAで可能な処理量の増加は、それを、研究ベースの突然変異検出用の直接配列決定の魅力的な、可能な別法としている。SSCAゲル上でシフトした移動度を有するフラグメントをついで配列決定して、正確なDNA配列変動の性質を決定する。2つの相補的DNA鎖の間の誤対合の検出に基づく他のアプローチには、締付変性電気泳動法(clamped denaturing denaturing gel elctrophoresis)(CDGE)(Sheffieldら,1991)、ヘテロ二重らせん分析(heteroduplex analysis)(HA)(Whiteら,1992)および化学的誤対合切断(chemical mismatch cleavage)(CMC)(Grompeら,1989)が含まれる。前記した方法はいずれも大きな欠失、二本鎖形成または挿入を検出せず、あるいは、蛋白質の転写または翻訳に影響する調節的突然変異を検出しないであろう。蛋白質先端切断アッセイまたは非対称アッセイのごときこれらのクラスの突然変異を検出し得る他の方法は、特異的な型の突然変異のみを検出し、ミスセンス突然変異は検出しないであろう。DNA配列変動を検出する最近利用し得る方法の概説は、Grompe(1993)による最近の概説において見出すことができる。突然変異が判明したら、対立遺伝子特異的オリゴヌクレオチド(ASO)ハイブリダイゼーションのごとき対立遺伝子特異的検出アプローチを利用して、同突然変異につき、膨大な数の他の試料を迅速にスクリーニングすることができる。   There are several methods that can be used to detect DNA sequence variations. Direct DNA sequencing, either manual sequencing or automated fluorescent sequencing, can detect sequence variations. For genes as large as BRCA1, it is a very hard work, but rarely misses mutations in the coding sequence of the gene under optimal conditions. Another approach is the single strand structural polymorphism assay (SSCA) (Orita et al., 1989). This method does not detect all sequence changes, especially if the DNA fragment is larger than 200 bp, but can be optimized to detect most DNA sequence variations. Although the reduced detection sensitivity is disadvantageous, the increased throughput possible with SSCA makes it an attractive and possible alternative to direct sequencing for research-based mutation detection. Fragments with shifted mobility on the SSCA gel are then sequenced to determine the nature of the exact DNA sequence variation. Other approaches based on detection of mismatches between two complementary DNA strands include clamped denaturing denaturing gel elctrophoresis (CDGE) (Sheffield et al., 1991), heteroduplex analysis (heteroduplex analysis) (HA) (White et al., 1992) and chemical mismatch cleavage (CMC) (Grompe et al., 1989). None of the methods described above detect large deletions, duplex formations or insertions, or detect regulatory mutations that affect protein transcription or translation. Other methods that can detect these classes of mutations, such as protein truncation assays or asymmetric assays, will detect only specific types of mutations and not missense mutations. A review of recently available methods for detecting DNA sequence variations can be found in a recent review by Grompe (1993). Once the mutation is known, an allele-specific detection approach such as allele-specific oligonucleotide (ASO) hybridization can be used to rapidly screen a large number of other samples for the mutation. .

組織中の野生型BRCA1遺伝子の変化を検出するためには、周囲の正常組織から遊離した組織を単離することが有用である。腫瘍細胞の組織調製物を増やす方法は当該分野で知られている。例えば、該組織は、パラフィンまたはクライオスタット切片から単離し得る。癌細胞も、フローサイトメトリーによって正常細胞から分離し得る。これらの技術、ならびに、正常細胞から腫瘍細胞を分離する他の技術は当該分野でよく知られている。腫瘍組織が正常組織で非常に汚染されている場合、突然変異の検出はより困難である。   In order to detect a change in the wild-type BRCA1 gene in a tissue, it is useful to isolate a tissue released from the surrounding normal tissue. Methods for increasing tumor cell tissue preparations are known in the art. For example, the tissue can be isolated from paraffin or cryostat sections. Cancer cells can also be separated from normal cells by flow cytometry. These techniques, as well as other techniques for separating tumor cells from normal cells, are well known in the art. Mutation detection is more difficult when the tumor tissue is very contaminated with normal tissue.

DNA配列中の多形性を検出する迅速な予備分析は、1または2以上の制限酵素、好ましくは多数の制限酵素で切断したDNAの一連のサザンブロット法で見ることによって行い得る。各ブロットは一連の正常個人および一連の癌ケース、腫瘍またはその両方を含む。(BRCA1遺伝子座付近か、またはそれを包含する配列で釣り上げた場合に対照とは長さが異なる)ハイブリダイズしたフラグメントを示すサザンブロットは、可能性のある突然変異を示す。非常に大きな制限断片を生成する制限酵素を用いる場合には、パルスフィールド電気泳動(PFGE)を用いる。   Rapid preliminary analysis to detect polymorphisms in a DNA sequence can be performed by looking at a series of Southern blots of DNA cut with one or more restriction enzymes, preferably multiple restriction enzymes. Each blot contains a series of normal individuals and a series of cancer cases, tumors, or both. Southern blots showing hybridized fragments (possibly different in length when picked up near or encompassing the BRCA1 locus) show possible mutations. When a restriction enzyme that generates a very large restriction fragment is used, pulse field electrophoresis (PFGE) is used.

点突然変異の検出は、当該分野でよく知られている技術を用いて、BRCA1対立遺伝子(群)を分子クローン化し、該対立遺伝子(群)を配列決定することによってなし得る。別法として、該遺伝子配列は、公知技術を用いて、腫瘍組織からのゲノムDNA調製物から直接増幅し得る。ついで、増幅した配列のDNA配列を決定し得る。   Point mutation detection can be accomplished by molecular cloning of the BRCA1 allele (s) and sequencing the allele (s) using techniques well known in the art. Alternatively, the gene sequence can be amplified directly from a genomic DNA preparation from tumor tissue using known techniques. The DNA sequence of the amplified sequence can then be determined.

感受性対立遺伝子の存在を確認するためのより完全で、いまだ間接的である試験のよく知られた6種の方法が存在する:1)一本鎖形成構造分析(SSCA)(Oritaら,1989);2)変性勾配ゲル電気泳動(DGGE)(Wartellら,1990;Sheffieldら,1989);3)RAアーゼ保護アッセイ(Finkelsteinら,1990;Kinszlerら,1991);4)対立遺伝子-特異的オリゴヌクレオチド(AOS)(Connerら,1983);5)イー・コリ(E.coli)mutS蛋白質のごときヌクレオチド誤対合を認識する蛋白質の使用(Modrich,1991);ならびに6)対立遺伝子-特異的PCR(RanoおよびKidd,1989)。対立遺伝子-特異的PCRには、その3'末端で特定のBRCA1突然変異にハイブリダイズするプライマーを使用する。特定のBRCA1突然変異が存在しない場合、増幅産物は認められない。欧州特許公開第0332435号およびNewtonら,1989に開示された増幅耐性突然変異系(Amplification Refractory Mutation System,ARMS)も用い得る。   There are six well known methods of testing that are more complete and still indirect to confirm the presence of susceptibility alleles: 1) single strand formation structure analysis (SSCA) (Orita et al., 1989) 2) denaturing gradient gel electrophoresis (DGGE) (Wartell et al., 1990; Sheffield et al., 1989); 3) RAase protection assay (Finkelstein et al., 1990; Kinszler et al., 1991); 4) allele-specific oligonucleotides; (AOS) (Conner et al., 1983); 5) Use of proteins that recognize nucleotide mismatches, such as E. coli mutS protein (Modrich, 1991); and 6) Allele-specific PCR ( Rano and Kidd, 1989). Allele-specific PCR uses a primer that hybridizes at its 3 ′ end to a particular BRCA1 mutation. In the absence of a particular BRCA1 mutation, no amplification product is observed. Amplification Refractory Mutation System (ARMS) disclosed in EP 0332435 and Newton et al., 1989 may also be used.

遺伝子の挿入および欠失は、クローニング、配列決定および増幅によっても検出し得る。加えて、遺伝子または周辺マーカー遺伝子の制限酵素断片長多形(RFLP)プローブを用いても、対立遺伝子の変化または多形フラグメント中の挿入を記録し得る。かかる方法は、影響された個人において見出されたBRCA1突然変異の存在につき、該個人の親類をスクリーニングするのに特に有用である。当該分野で公知である挿入および欠失を検出する他の技術を用い得る。   Gene insertions and deletions can also be detected by cloning, sequencing and amplification. In addition, restriction fragment length polymorphism (RFLP) probes of genes or peripheral marker genes can also be used to record allelic changes or insertions in polymorphic fragments. Such a method is particularly useful for screening relatives of an individual for the presence of a BRCA1 mutation found in the affected individual. Other techniques for detecting insertions and deletions known in the art can be used.

最初の3種の方法(SSCA、DGGEおよびRAアーゼ保護アッセイ)においては、新たな電気泳動バンドが出現する。SSCAは、異なって移動するバンドを検出する。なぜならば、配列の変化が一本鎖、すなわち分子内塩基対合において差を生じるからである。RAアーゼ保護には、突然変異ポリヌクレオチドの2または3以上のより小さなフラグメントへの切断が含まれる。DGGEは、変性勾配ゲルを用いて、野生型配列と比較した突然変異配列の移動速度における差を検出する。対立遺伝子-特異的オリゴヌクレオチドアッセイにおいては、特異的な配列を検出するようにオリゴヌクレオチドが設計されており、ハイブリダイゼーション信号の存在または不存在を検出することによって該アッセイを行う。
mutSアッセイにおいては、突然変異と野生型配列との間のヘテロ二重らせん中にヌクレオチド誤対合を含む配列にのみ該蛋白質が結合する。
In the first three methods (SSCA, DGGE and RAase protection assay), a new electrophoretic band appears. SSCA detects bands that move differently. This is because sequence changes cause differences in single strands, ie intramolecular base pairing. RAase protection includes cleavage of the mutated polynucleotide into two or more smaller fragments. DGGE uses a denaturing gradient gel to detect differences in the migration rate of mutant sequences compared to wild type sequences. In an allele-specific oligonucleotide assay, the oligonucleotide is designed to detect a specific sequence, and the assay is performed by detecting the presence or absence of a hybridization signal.
In the mutS assay, the protein binds only to sequences that contain nucleotide mismatches in the heteroduplex between the mutation and the wild-type sequence.

本発明による誤対合とは、2本の鎖が100%相補性でない場合のハイブリダイズした核酸二重らせんである。全相補性の欠失は、欠失、挿入、逆位または置換に起因し得る。誤対合検出を用いて、遺伝子中またはそのmRNA産物中の点突然変異を検出し得る。これらの技術は配列決定よりも感度が低いが、それらは、膨大な数の腫瘍試料で行うのにより単純である。誤対合切断技術の一例は、RAアーゼ保護法である。本発明の実施においては、該方法は、ヒト野生型BRCA1遺伝子コード配列に相補的な標識リボプローブの使用が含まれる。該リボプローブと腫瘍組織から単離したmRNAまたはDNAのいずれかとは共にアニーリング(ハイブリダイズ)し、つづいて、二重らせんRNA構造中のある種の誤対合を検出し得る酵素RNアーゼAで消化する。誤対合をRAアーゼAによって検出する場合、それは誤対合の部位で切断する。かくして、アニーリングしたRNA調製物を電気泳動ゲルマトリックス上で分離する場合に、もし誤対合をRNアーゼAによって検出し切断したら、リボプローブおよびmRNAまたはDNAの完全長二重らせんRNAよりも小さいRNA産物が示されるであろう。該リボプローブは、完全長のBRCA1 mRNAまたは遺伝子である必要はないが、そのいずれかのセグメントとし得る。リボプローブがBRCA1 mRNAまたは遺伝子のセグメントのみを含む場合、多数のこれらのプローブを用いて、誤対合につき全mRNA配列をスクリーニングすることが望ましいであろう。   Mismatches according to the present invention are hybridized nucleic acid duplexes where the two strands are not 100% complementary. Fully complementary deletions can result from deletions, insertions, inversions or substitutions. Mismatch detection can be used to detect point mutations in a gene or its mRNA product. Although these techniques are less sensitive than sequencing, they are simpler to do with vast numbers of tumor samples. An example of a mispaired cutting technique is the RAase protection law. In the practice of the present invention, the method involves the use of a labeled riboprobe complementary to the human wild type BRCA1 gene coding sequence. The enzyme RNase A that anneals (hybridizes) together with either the riboprobe and either mRNA or DNA isolated from tumor tissue, followed by the detection of certain mismatches in the duplex RNA structure. Digest. When mispairing is detected by RAase A, it cleaves at the mispairing site. Thus, when isolating annealed RNA preparations on an electrophoresis gel matrix, if mismatches are detected and cleaved by RNase A, RNA smaller than the full-length duplex RNA of riboprobes and mRNA or DNA The product will be shown. The riboprobe need not be a full-length BRCA1 mRNA or gene, but can be any segment thereof. If the riboprobe contains only BRCA1 mRNA or gene segments, it may be desirable to use a large number of these probes to screen the entire mRNA sequence for mismatches.

同様にして、DNAプローブを用いて、酵素的または化学的切断を介して、誤対合を検出し得る(例えば、Cottonら,1988;Shenkら,1975;Novackら,1986参照)。別法として、対合二重らせんに対する誤対合二重らせんの電気泳動移動度のシフトによって、誤対合を検出し得る(例えば、Cariello,1988参照)。リボプローブまたはDNAプローブのいずれを用いるにせよ、突然変異を含有し得る細胞性mRNAまたはDNAは、ハイブリダイゼーション前にPCR(後記参照)を用いて増幅し得る。BRCA1遺伝子のDNAにおける変化は、特に、欠失および挿入のごとき、変化が全体の再配列の場合、サザン・ハイブリダイゼーションを用いても検出し得る。   Similarly, DNA probes can be used to detect mismatches through enzymatic or chemical cleavage (see, eg, Cotton et al., 1988; Shenk et al., 1975; Novack et al., 1986). Alternatively, mispairing can be detected by shifting the electrophoretic mobility of the mispairing duplex to the mating duplex (see, eg, Cariello, 1988). Whether using riboprobes or DNA probes, cellular mRNA or DNA that may contain mutations can be amplified using PCR (see below) prior to hybridization. Changes in the DNA of the BRCA1 gene can also be detected using Southern hybridization, particularly when the change is a global rearrangement, such as deletions and insertions.

PCRを使用することによって増幅したBRCA1遺伝子のDNA配列は、対立遺伝子-特異的プローブを用いてもスクリーニングし得る。これらのプローブは核酸オリゴマーで、その各々は、公知の突然変異を隠し持つBRCA1遺伝子配列の領域を含んでいる。例えば、1つのオリゴマーは、BRCA1遺伝子配列の一部分に対応する、約30ヌクレオチド長とし得る。かかる一式の対立遺伝子-特異的プローブを用いることにより、PCR増幅産物をスクリーニングして、BRCA1遺伝子中に予め同定した突然変異の存在を同定し得る。増幅したBRCA1配列と対立遺伝子-特異的プローブとのハイブリダイゼーションは、例えば、ナイロンフィルター上で行い得る。ストリンジェントなハイブリダイゼーション条件下の特定のプローブに対するハイブリダイゼーションは、対立遺伝子-特異的プローブ中のごとく腫瘍組織中に同突然変異が存在することを示している。 候補遺伝子座中の突然変異についての最も明確な試験は、対照集団からのゲノムBRCA1配列と癌患者からのものとを直接比較することである。別法として、例えばPCRによって、増幅した後にmRNAを配列決定し、それによって候補遺伝子のエキソン構造を決定する必要を削除することもできる。   The DNA sequence of the BRCA1 gene amplified by using PCR can also be screened using allele-specific probes. These probes are nucleic acid oligomers, each containing a region of the BRCA1 gene sequence that conceals known mutations. For example, one oligomer can be about 30 nucleotides in length, corresponding to a portion of the BRCA1 gene sequence. By using such a set of allele-specific probes, PCR amplification products can be screened to identify the presence of previously identified mutations in the BRCA1 gene. Hybridization of the amplified BRCA1 sequence with the allele-specific probe can be performed, for example, on a nylon filter. Hybridization to a specific probe under stringent hybridization conditions indicates that the mutation is present in the tumor tissue as in an allele-specific probe. The most obvious test for mutations in a candidate locus is to directly compare genomic BRCA1 sequences from a control population with those from cancer patients. Alternatively, mRNA may be sequenced after amplification, for example by PCR, thereby eliminating the need to determine the exon structure of the candidate gene.

BRCA1のコード領域の外側に落ちる癌患者からの突然変異は、BRCA1遺伝子の付近またはその中のイントロンおよび調節配列のごとき、非コード領域を検査することによって検出し得る。非コード領域中の突然変異が重要であるという初期の示唆は、対照個人と比較しての癌患者における異常なサイズの、または豊富なmRNA分子を明らかにするノザンブロット実験から出て来得る。   Mutations from cancer patients who fall outside the BRCA1 coding region can be detected by examining non-coding regions, such as introns and regulatory sequences near or within the BRCA1 gene. Early suggestions that mutations in non-coding regions are important can come from Northern blot experiments that reveal abnormally sized or abundant mRNA molecules in cancer patients compared to control individuals.

BRCA1 mRNA発現の変化は、当該分野で公知のいずれかの技術によって検出し得る。これらには、ノザンブロット分析、PCR増幅およびRAアーゼ保護が含まれる。mRNA発現の低下は、野生型BRCA1遺伝子の変化を示している。野生型BRCA1遺伝子の変化は、野生型BRCA1蛋白質の変化についてスクリーニングすることによっても検出し得る。例えば、BRCA1と免疫反応性であるモノクローナル抗体を用いて組織をスクリーニングし得る。同起源抗原を欠くことは、BRCA1突然変異を示しているであろう。突然変異対立遺伝子の産物に特異的な抗体を用いて突然変異BRCA1遺伝子産物を検出することもできる。かかる免疫学的アッセイは、当該分野で公知のいずれかの簡便な形式で行い得る。これらには、ウェスタンブロット、免疫組織化学的アッセイおよびELISAアッセイが含まれる。変化したBRCA1蛋白質を検出するいずれかの手段を用いて、野生型BRCA1遺伝子の変化を検出し得る。蛋白質結合性測定のごとき機能アッセイを用い得る。加えて、BRCA1生化学的機能を検出するアッセイを用いることができる。突然変異BRCA1遺伝子産物の発見は、野生型BRCA1遺伝子の変化を示している。   Changes in BRCA1 mRNA expression can be detected by any technique known in the art. These include Northern blot analysis, PCR amplification and RAase protection. A decrease in mRNA expression indicates a change in the wild type BRCA1 gene. Changes in the wild type BRCA1 gene can also be detected by screening for changes in the wild type BRCA1 protein. For example, a tissue can be screened with a monoclonal antibody that is immunoreactive with BRCA1. Lack of a cognate antigen will indicate a BRCA1 mutation. Mutant BRCA1 gene products can also be detected using antibodies specific for the product of the mutant allele. Such immunological assays can be performed in any convenient format known in the art. These include Western blots, immunohistochemical assays and ELISA assays. Any means of detecting altered BRCA1 protein can be used to detect changes in the wild-type BRCA1 gene. Functional assays such as protein binding measurements can be used. In addition, assays that detect BRCA1 biochemical function can be used. The discovery of the mutant BRCA1 gene product indicates a change in the wild type BRCA1 gene.

突然変異BRCA1遺伝子または遺伝子産物は、血清、便、尿および唾液のごとき、他のヒト身体試料中にも検出し得る。組織中の突然変異BRCA1遺伝子または遺伝子産物を検出するための前記に論じた同技術は、他の身体試料にも適用し得る。癌細胞は腫瘍から脱皮し、かかる身体試料中に出現する。加えて、BRCA1遺伝子産物それ自体は、細胞外空間に分泌され得、癌細胞が不存在でもこれらの身体試料中に発見し得る。かかる身体試料をスクリーニングすることによって、単純で早期の診断を多くのタイプの癌について達成し得る。加えて、突然変異BRCA1遺伝子または遺伝子産物についてかかる身体試料を試験することによって、化学療法または放射線療法の進展をより容易にモニターし得る。   The mutant BRCA1 gene or gene product can also be detected in other human body samples such as serum, stool, urine and saliva. The same techniques discussed above for detecting mutant BRCA1 genes or gene products in tissues can be applied to other body samples. Cancer cells shed from the tumor and appear in such body samples. In addition, the BRCA1 gene product itself can be secreted into the extracellular space and can be found in these body samples even in the absence of cancer cells. By screening such body samples, a simple and early diagnosis can be achieved for many types of cancer. In addition, the progress of chemotherapy or radiation therapy can be more easily monitored by testing such body samples for mutant BRCA1 genes or gene products.

本発明の診断方法は、BRCA1が腫瘍発生において役割を有するいずれの腫瘍にも適用し得る。本発明の診断方法は臨床医に有用で、彼は、治療の適当な過程で決定し得る。   The diagnostic method of the present invention can be applied to any tumor in which BRCA1 has a role in tumor development. The diagnostic methods of the present invention are useful to clinicians, who can determine during the appropriate course of treatment.

本発明のプライマー対は、PCRを用いた特定のBRCA1対立遺伝子のヌクレオチド配列の決定に有用である。一本鎖DNAプライマーの対は、染色体17q21上のBRCA1遺伝子の中か、または周辺の配列にアニーリングして、BRCA1遺伝子自体の増幅DNA合成を開始し得る。完全セットのこれらのプライマーにより、BRCA1遺伝子コード配列の全ヌクレオチド、すなわち、エキソンの合成が許容される。プライマーセットは、好ましくは、イントロンおよびエキソン配列の両方の合成を許容する。対立遺伝子-特異的プライマーも用い得る。かかるプライマーは特定のBRCA1突然変異対立遺伝子にのみアニーリングし、したがって、鋳型としての突然変異対立遺伝子存在下で産物を増幅するのみであろう。   The primer pairs of the present invention are useful for the determination of the nucleotide sequence of a particular BRCA1 allele using PCR. Single stranded DNA primer pairs can anneal to sequences in or around the BRCA1 gene on chromosome 17q21 to initiate amplified DNA synthesis of the BRCA1 gene itself. A complete set of these primers allows synthesis of all nucleotides of the BRCA1 gene coding sequence, ie exons. The primer set preferably allows for the synthesis of both intron and exon sequences. Allele-specific primers can also be used. Such primers will only anneal to a specific BRCA1 mutant allele and will therefore only amplify the product in the presence of the mutant allele as a template.

増幅した配列のつづくクローニングを促進するために、プライマーはその5'末端に付加した制限酵素部位配列を有し得る。かくして、プライマーの全ヌクレオチドは、制限酵素部位を形成するに必要な幾つかのヌクレオチド以外は、BRCA1配列またはBRCA1付近の配列に由来する。該プライマーそれ自体は、当該分野でよく知られている技術を用いて合成し得る。一般的に、該プライマーは、市販されているオリゴヌクレオチド合成器を用いて作製し得る。BRCA1オープンリーディングフレームの配列を配列番号:1に示す。特定のプライマーの設計は、当業者の十分に範囲内である。   In order to facilitate subsequent cloning of the amplified sequence, the primer may have a restriction enzyme site sequence added to its 5 ′ end. Thus, all nucleotides of the primer are derived from the BRCA1 sequence or sequences near BRCA1 except for some nucleotides necessary to form a restriction enzyme site. The primer itself can be synthesized using techniques well known in the art. In general, the primers can be made using commercially available oligonucleotide synthesizers. The sequence of the BRCA1 open reading frame is shown in SEQ ID NO: 1. The design of specific primers is well within the scope of those skilled in the art.

本発明により提供される核酸プローブは、多くの目的に有用である。それは、ゲノムDNAに対するサザンハイブリダイゼーション、およびすでに前記で論じた点突然変異を検出するRAアーゼ保護法に用い得る。該プローブを用いてPCR増幅産物を検出し得る。それを用いて、他の技術を用いたBRCA1遺伝子またはmRNAとの誤対合を検出することもできる。   The nucleic acid probes provided by the present invention are useful for many purposes. It can be used in Southern hybridization to genomic DNA and RAase protection methods to detect the point mutations already discussed above. The probe can be used to detect PCR amplification products. It can also be used to detect mispairing with BRCA1 gene or mRNA using other techniques.

野生型BRCA1遺伝子を有する個人はBRCA1対立遺伝子から生じた癌を有さないことが発見された。しかしながら、BRCA1蛋白質の機能を妨害する突然変異は癌の病理に関与している。したがって、機能を欠失したか、または変化した機能を有する蛋白質を産生する変化(または突然変異)したBRCA1遺伝子の存在は、癌の危険性の増加に直接関係する。BRCA1遺伝子突然変異を検出するためには、生物試料を調製し、分析するBRCA1対立遺伝子の配列と野生型BRCA1対立遺伝子の配列との間の相違を分析する。突然変異BRCA1対立遺伝子は、前記したいずれかの技術によって最初同定し得る。ついで、突然変異対立遺伝子を配列決定して、特定の突然変異対立遺伝子の特異的な突然変異を同定する。別法として、突然変異BRCA1対立遺伝子は、慣用的な技術を用いて、突然変異(変化)したBRCA1蛋白質を同定することによって最初に同定し得る。ついで、該突然変異対立遺伝子を配列決定して、各対立遺伝子の特異的突然変異を同定する。突然変異、特にBRCA1蛋白質の変化した機能に通じるものを、ついで、本発明の診断方法および予診方法に用いる。   It has been discovered that individuals with the wild type BRCA1 gene do not have cancers arising from the BRCA1 allele. However, mutations that interfere with the function of the BRCA1 protein are involved in cancer pathology. Thus, the presence of altered (or mutated) BRCA1 gene that produces a protein that has lost or altered function is directly related to an increased risk of cancer. To detect BRCA1 gene mutations, a biological sample is prepared and analyzed for differences between the BRCA1 allele sequence to be analyzed and the wild-type BRCA1 allele sequence. Mutant BRCA1 alleles can be initially identified by any of the techniques described above. The mutant allele is then sequenced to identify specific mutations of the particular mutant allele. Alternatively, a mutant BRCA1 allele can be initially identified by identifying a mutated (changed) BRCA1 protein using conventional techniques. The mutant alleles are then sequenced to identify specific mutations for each allele. Mutations, particularly those that lead to altered functions of the BRCA1 protein, are then used in the diagnostic and prognostic methods of the present invention.

定義
本発明は、以下の定義を用いる:
「ポリヌクレオチドの増幅」には、ポリメラーゼ連鎖反応(PCR)、連結増幅(またはリガーゼ鎖反応(ligase chain reaction,LCR))およびQ-ベータレプリカーゼの使用に基づく増幅法のごとき方法を用いる。これらの方法は、よく知られており、当該分野で広く実施されている(例えば、米国特許第4,683,195号および第4,683,202号、ならびに(PCRについては)Innisら,1990;および(LCRについては)Wuら,1989a参照)。PCRを行う試薬およびハードウェアは市販されている。BRCA1領域からの配列を増幅するのに有用なプライマーは、好ましくは、BRCA1領域中の配列、またはその中の標的領域に隣接する領域中の配列に相補的であって、それに特異的にハイブリダイズする。増幅によって作製したBRCA1配列は直接配列決定し得る。別法として、あまり望ましくはないが、増幅した配列(群)は配列分析に先んじてクローン化し得る。酵素的に増幅したゲノムセグメントの直接クローン化および配列分析は、Scharf,1986によって記載されている。
Definitions The present invention uses the following definitions:
“Polynucleotide amplification” uses methods such as polymerase chain reaction (PCR), ligation amplification (or ligase chain reaction (LCR)) and amplification methods based on the use of Q-beta replicase. These methods are well known and widely practiced in the art (eg, US Pat. Nos. 4,683,195 and 4,683,202, and (for PCR) Innis et al., 1990; and (for LCR) Wu. Et al., 1989a). Reagents and hardware for performing PCR are commercially available. Primers useful for amplifying sequences from the BRCA1 region are preferably complementary to and specifically hybridize to sequences in the BRCA1 region, or in regions adjacent to the target region therein. To do. The BRCA1 sequence generated by amplification can be directly sequenced. Alternatively, although less desirable, the amplified sequence (s) can be cloned prior to sequence analysis. Direct cloning and sequence analysis of enzymatically amplified genomic segments is described by Scharf, 1986.

「分析ポリヌクレオチド」および「分析鎖」とは、標的配列を含むと予想され、生物試料を包含する種々のタイプの試料中に存在し得る一本鎖または二本鎖ポリヌクレオチドをいう。   “Analytical polynucleotide” and “analytical strand” refer to single or double stranded polynucleotides that are expected to contain a target sequence and may be present in various types of samples, including biological samples.

「抗体」;本発明は、また、ポリクローナルおよび/またはモノクローナル抗体およびその断片、ならびにその免疫学的な結合同等物を提供し、これらは、BRCA1ポリペプチドおよびその断片、またはBRCA1領域からの、特にBRCA1遺伝子座またはその一部分からのポリヌクレオチド配列に特異的に結合し得る。「抗体」なる語は、均一な分子基、または複数の異なる分子基より構成される血清産物のごとき混合物をいうのに用法用いる。ポリペプチドは、ペプチド合成器中で合成的に調製し、(例えば、鍵穴吸着性ヘモシアニンのような)キャリアー分子にカップリングさせ、ウサギに数カ月にわたって注射し得る。ウサギ血清は、BRCA1ポリペプチドまたは断片に対する免疫反応性につき試験する。モノクローナル抗体は、蛋白質ポリペプチド、融合蛋白質またはそれらの断片でマウスを注射することにより作製し得る。モノクローナル抗体は、ELISAによってスクリーンし、BRCA1ポリペプチドまたはその断片との特異的免疫反応性について試験するであろう(HarlowおよびLane,1988参照)。これらの抗体は、アッセイならびに医薬に有用であろう。   The present invention also provides polyclonal and / or monoclonal antibodies and fragments thereof, and immunological binding equivalents thereof, which are derived from BRCA1 polypeptides and fragments thereof, or specifically from BRCA1 regions. It can specifically bind to a polynucleotide sequence from the BRCA1 locus or a portion thereof. The term “antibody” is used to refer to a uniform molecular group or a mixture such as a serum product composed of a plurality of different molecular groups. Polypeptides can be prepared synthetically in a peptide synthesizer, coupled to a carrier molecule (such as keyhole adsorbing hemocyanin) and injected into rabbits over several months. Rabbit serum is tested for immunoreactivity against the BRCA1 polypeptide or fragment. Monoclonal antibodies can be produced by injecting mice with protein polypeptides, fusion proteins or fragments thereof. Monoclonal antibodies will be screened by ELISA and tested for specific immunoreactivity with the BRCA1 polypeptide or fragment thereof (see Harlow and Lane, 1988). These antibodies will be useful in assays as well as in medicine.

十分な量の所望のポリペプチドを得たら、種々の目的にそれを用いることができる。典型的な用途は、結合について特異的な抗体の産生である。これらの抗体は、ポリクローナルまたはモノクローナルのいずれかであって、当該分野でよく知られているイン・ビトロ(in vitro)またはイン・ビボ(in vivo)技術によって作製し得る。ポリクローナル抗体の作製には、適当な標的免疫系、典型的にはマウスまたはウサギを選択する。実質的に純粋な抗原は、動物に適した方法によってか、または免疫学者によく知られている他の指標によって決定した様式で免疫系に提示する。注射の典型的な部位は、筋肉内、腹膜内または皮膚内的なフットパッドである。勿論、他の種をマウスまたはウサギと代替し得る。ついで、当該分野で公知の技術を用いてポリクローナル抗体を精製し、所望の特異性に調整する。   Once a sufficient amount of the desired polypeptide is obtained, it can be used for various purposes. A typical use is the production of antibodies specific for binding. These antibodies are either polyclonal or monoclonal and can be generated by in vitro or in vivo techniques well known in the art. For the production of polyclonal antibodies, an appropriate target immune system, typically a mouse or rabbit, is selected. Substantially pure antigen is presented to the immune system in a manner determined by methods appropriate for the animal or by other indicators well known to immunologists. A typical site of injection is an intramuscular, intraperitoneal or intradermal footpad. Of course, other species can be substituted for mice or rabbits. The polyclonal antibody is then purified and adjusted to the desired specificity using techniques known in the art.

免疫学的応答性は、通常、免疫アッセイでアッセイする。通常、かかる免疫アッセイには、例えば、抗原と同細胞かつ同様式によって作製した抗原源のある種の精製が含まれる。種々の免疫アッセイ法が当該分野でよく知られている(例えば、HarlowおよびLane,1988またはGoding,1986参照)。
10−8−1、もしくは好ましくは10−9〜10−10−1またより強い親和性を有するモノクローナル抗体は、典型的に、例えば、HarlowおよびLane,1988またはGoding,1986に記載されている標準的な方法によって作製するであろう。簡単には、適当な動物を選抜し、所望の免疫化プロトコールに従う。適当な時間の後に、かかる動物の脾臓を切除し、適当な選抜条件下にて個々の脾臓細胞を不死化メラノーマ細胞に融合する。その後に、該細胞をクローン化的に分離し、各クローンの上清を、抗原の所望の領域に特異的な適当な抗体のそれらの産生について試験する。
Immunological responsiveness is usually assayed with an immunoassay. Such immunoassays typically include some purification of the antigen source generated, for example, by the same cell and formula as the antigen. Various immunoassay methods are well known in the art (see, eg, Harlow and Lane, 1988 or Goding, 1986).
Monoclonal antibodies with 10 −8 M −1 , or preferably 10 −9 to 10 −10 M −1 or higher affinity are typically described, for example, in Harlow and Lane, 1988 or Goding, 1986. Will be made by standard methods. Briefly, appropriate animals are selected and the desired immunization protocol is followed. After an appropriate time, the spleen of such an animal is excised and individual spleen cells are fused to immortalized melanoma cells under appropriate selection conditions. Thereafter, the cells are clonally isolated and the supernatant of each clone is tested for their production of appropriate antibodies specific for the desired region of the antigen.

他の適当な技術には、抗原ポリペプチドへか、または別法としてファージまたは同様なベクター中の抗体の選抜したライブラリーへのリンパ球のイン・ビトロ(in vitro)暴露が含まれる(Huseら,1989参照)。本発明のポリペプチドおよび抗体は、修飾しても、しないでも用い得る。しばしば、ポリペプチドおよび抗体は、共有的または非共有的のいずれかで、検出可能なシグナルを供する物質を結合することによって標識されるであろう。広範な標識およびコンジュゲート技術が知られており、科学文献および特許文献の両方において広範に報告されている。適当な標識には、放射性核種、酵素、基質、補因子、インヒビター、蛍光剤、化学発光剤、磁性粒子他が含まれる。かかる標識の使用を教示する特許には、米国特許第3,817,837号;第3,850,752号;第3,939,350号;第3,996,345号;第4,277,437号;4,275,149号および第4,366,241号が含まれる。また、組換え免疫グロブリンを作製することもできる(米国特許第4,816,567号参照)。   Other suitable techniques include in vitro exposure of lymphocytes to antigenic polypeptides or alternatively to a selected library of antibodies in phage or similar vectors (Huse et al. , 1989). The polypeptides and antibodies of the present invention can be used with or without modification. Often polypeptides and antibodies will be labeled by binding substances that provide a detectable signal, either covalently or non-covalently. A wide range of labeling and conjugation techniques are known and have been extensively reported in both scientific and patent literature. Suitable labels include radionuclides, enzymes, substrates, cofactors, inhibitors, fluorescent agents, chemiluminescent agents, magnetic particles, and the like. Patents teaching the use of such labels include US Pat. Nos. 3,817,837; 3,850,752; 3,939,350; 3,996,345; 4,277,437; 4,275,149 and 4,366,241. Recombinant immunoglobulins can also be produced (see US Pat. No. 4,816,567).

「結合パートナー」とは、例えば、抗原および抗原-特異的抗体または酵素およびそのインヒビターのような、高い特異性でリガンド分子と結合する能力を有する分子をいう。一般的に、該特異的結合パートナーは、単離条件下にて、十分な親和性で結合して、分析物コピー/(ポリヌクレオチドハイブリダイゼーションの場合には)相補鎖二重らせんを固定化しなければならない。特異的結合パートナーは当該分野で公知であって、例えば、ビオチンおよびアビジンまたはストレプトアビジン、IgGおよびプロテインA、膨大な公知の受容体-リガンドカップリング物および相補的ポリヌクレオチド鎖が包含される。相補的ポリヌクレオチド結合パートナーの場合においては、該パートナーは、通常、少なくとも約15塩基長、少なくとも40塩基長とし得る。該ポリヌクレオチドは、DNA、RNAまたは合成ヌクレオチドアナログから構成され得る。   “Binding partner” refers to a molecule that has the ability to bind a ligand molecule with high specificity, such as, for example, antigens and antigen-specific antibodies or enzymes and inhibitors thereof. In general, the specific binding partner must bind with sufficient affinity under isolation conditions to immobilize analyte copy / complementary strand duplex (in the case of polynucleotide hybridization). I must. Specific binding partners are known in the art and include, for example, biotin and avidin or streptavidin, IgG and protein A, a vast number of known receptor-ligand couplings and complementary polynucleotide strands. In the case of a complementary polynucleotide binding partner, the partner can usually be at least about 15 bases long and at least 40 bases long. The polynucleotide can be composed of DNA, RNA or synthetic nucleotide analogs.

「生物試料」とは、個人からの分析物ポリヌクレオチドまたはポリペプチドを含むと予想される組織または流体の試料をいい、限定するものではないが、例えば、血漿、血清、髄液、リンパ液、皮膚の外部切片、呼吸器、腸および尿生殖器、涙、唾液、赤血球、腫瘍、器官、組織およびイン・ビトロ(in vitro)細胞培養構成物の試料が含まれる。   “Biological sample” refers to a sample of tissue or fluid expected to contain an analyte polynucleotide or polypeptide from an individual, including but not limited to, for example, plasma, serum, spinal fluid, lymph, skin Samples of external sections, respiratory, intestinal and urogenital organs, tears, saliva, red blood cells, tumors, organs, tissues, and in vitro cell culture constructs.

本明細書で用いるごとき、新生生物の文脈で用いる「診断」または「予診」なる語は、処理の前、間およびその後の1)新生生物として病巣の分類、2)新生生物の程度の測定、または3)疾病進展のモニターを示すのに用いる。   As used herein, the term “diagnosis” or “preliminary diagnosis” as used in the context of a neoplasm refers to 1) classification of a lesion as a neoplasm, 2) measurement of the extent of the neoplasm, before, during and after treatment. Or 3) used to indicate a monitor of disease progression.

「コードする」;ポリペプチドを「コードする」というポリヌクレオチドは、その天然状態または当業者によく知られている方法によって操作されている場合、それは、mRNAおよび/または該ポリペプチドもしくはその断片に転写および/または翻訳され得る。アンチセンス鎖は、かかる核酸、および、それから予想し得る配列コードの相補物である。   A polynucleotide that “encodes” a polypeptide that “encodes” a polypeptide when it is engineered in its native state or by methods well known to those of skill in the art, can be found in mRNA and / or the polypeptide or fragment thereof. It can be transcribed and / or translated. The antisense strand is the complement of such a nucleic acid and the sequence code that can be predicted therefrom.

「単離した」または「実質的に純粋な」;「単離した」または「実質的に純粋な」核酸(例えば、RNA、DNAまたは混合ポリマー)とは、天然のヒト配列または蛋白質(例えば、リボソーム、ポリメラーゼ、多くの他のヒトゲノム配列および蛋白質)を自然に付随する他の細胞成分から実質的に単離されたものである。該語には、核酸配列および蛋白質の自然に発生する環境から除去したそれらを包含し、組換えまたはクローン化DNA単離物、および化学合成したアナログまたは外来系によって生物学的に合成したアナログが含まれる。   “Isolated” or “substantially pure”; “isolated” or “substantially pure” nucleic acid (eg, RNA, DNA or mixed polymers) is a natural human sequence or protein (eg, Ribosomes, polymerases, and many other human genomic sequences and proteins) have been substantially isolated from other cellular components that naturally accompany them. The term includes nucleic acid sequences and proteins removed from the naturally occurring environment, including recombinant or cloned DNA isolates, and chemically synthesized analogs or analogs biologically synthesized by foreign systems. included.

「BRCA1対立遺伝子」とは、BRCA1遺伝子座の正常対立遺伝子、ならびに素因個人に、例えば、乳房、卵巣、結腸直腸および前立腺癌を含む、多くの部位の癌を発症させる変形を運んでいる対立遺伝子をいう。かかる素因対立遺伝子は、「BRCA1感受性対立遺伝子」とも呼称する。   “BRCA1 allele” refers to the normal allele of the BRCA1 locus and alleles that carry variants that predispose individuals to develop cancer at many sites, including, for example, breast, ovarian, colorectal and prostate cancer Say. Such a predisposing allele is also referred to as a “BRCA1 susceptibility allele”.

「BRCA1座」、「BRCA1遺伝子」、「BRCA1核酸」または「BRCA1ポリヌクレオチド」とは、各々、ポリヌクレオチドをいい、それら全部はBRCA1領域中に存在し、それらは、個人に乳癌、卵巣癌、結腸直腸癌および前立腺癌を発症する素因の特定の対立遺伝子を正常組織に発現するようである。BRCA1における突然変異は、他のタイプの腫瘍の発生および/または進行に関与し得る。遺伝子座は、素因個人に癌を発症させる突然変異によって部分的に示される。これらの突然変異は下記するBRCA1領域内に入る。BRCA1座は、コード配列、介在配列および転写および/または翻訳を制御する調節因子を含むよう意図される。BRCA1座は、該DNA配列の全ての対立遺伝子変形を含むよう意図される。   “BRCA1 locus”, “BRCA1 gene”, “BRCA1 nucleic acid” or “BRCA1 polynucleotide” each refers to a polynucleotide, all of which are present in the BRCA1 region, which can be used to treat breast cancer, ovarian cancer, It appears that specific alleles predisposed to developing colorectal and prostate cancers are expressed in normal tissues. Mutations in BRCA1 may be involved in the development and / or progression of other types of tumors. The locus is indicated in part by mutations that cause cancer in predisposed individuals. These mutations fall within the BRCA1 region described below. The BRCA1 locus is intended to include coding sequences, intervening sequences and regulatory elements that control transcription and / or translation. The BRCA1 locus is intended to include all allelic variations of the DNA sequence.

核酸に適用する場合、これらの語は、BRCA1ポリペプチド、断片、同等物または変形をコードする核酸をいい、例えば、蛋白質融合物または欠失物が包含される。本発明の核酸は、天然BRCA1-コード遺伝子、または天然BRCA1-コード遺伝子またはその一部分と実質的に相同性を有するものに由来するか、またはそれに実質的に同じものかのかのいずれかの配列を有するであろう。配列番号:2に示すアミノ酸配列を有するBRCA1ポリペプチドのコード配列を配列番号:1に示す。   When applied to nucleic acids, these terms refer to nucleic acids encoding BRCA1 polypeptides, fragments, equivalents or variants, and include, for example, protein fusions or deletions. The nucleic acids of the invention have a sequence that is either derived from or substantially identical to a native BRCA1-encoding gene, or a native BRCA1-encoding gene or a portion thereof. Would have. The coding sequence for the BRCA1 polypeptide having the amino acid sequence shown in SEQ ID NO: 2 is shown in SEQ ID NO: 1.

本発明のポリヌクレオチド組成物には、当業者によって容易に理解されるであろう、センス鎖またはアンチセンス鎖の両方の、RNA、cDNA、ゲノムDNA、合成形態、および混合ポリマーが含まれ、化学的または生化学的に修飾され得、あるいは非-天然または誘導化ヌクレオチド塩基を含み得る。かかる修飾物には、例えば、標識物、メチル化物、1または2以上の天然に発生するヌクレオチドのアナログでの置換物、(例えば、ホスホン酸メチル、ホスホトリエステル、ホスホアミデート、カルバメート他のような)非帯電リンケージのごときヌクレオチド間修飾物、(例えば、ホスホロチオエート、ホスホロジチオエート他のような)荷電リンケージ、(例えば、ポリペプチドのような)ペンダント型基、(アクリジン、プソラレン他のような)インターカレター、キレート剤、アルキル化剤および(例えば、アルファアノマー核酸他のような)修飾リンケージが含まれる。また、水素結合および他の化学的相互作用を介して指定した配列に結合する能力のポリヌクレオチドをミメティックスする合成分子も包含される。かかる分子は、当該分野で知られており、例えば、その中で分子骨格中のリン酸結合の代わりにペプチド結合を用いるものが含まれる。   Polynucleotide compositions of the present invention include both sense and antisense strand RNA, cDNA, genomic DNA, synthetic forms, and mixed polymers, as will be readily understood by those skilled in the art, May be chemically or biochemically modified, or may include non-natural or derivatized nucleotide bases. Such modifications include, for example, labels, methylates, substitutions of one or more naturally occurring nucleotide analogs (e.g., methyl phosphonate, phosphotriester, phosphoamidate, carbamate, etc. Internucleotide modifications such as uncharged linkages, charged linkages (such as phosphorothioates, phosphorodithioates, etc.), pendant groups (such as polypeptides), acridines, psoralens, etc. ) Intercalators, chelating agents, alkylating agents and modified linkages (such as alpha anomeric nucleic acids etc.). Also encompassed are synthetic molecules that mimic polynucleotides capable of binding to a specified sequence through hydrogen bonding and other chemical interactions. Such molecules are known in the art and include, for example, those that use peptide bonds instead of phosphate bonds in the molecular backbone.

本発明は、BRCA1領域の全体または一部分を含む組換え核酸を提供する。該組換え構築物は、宿主細胞中で自律的に複製し得る。別法として、該組換え構築物は、宿主細胞の染色体DNAに一体化するようになり得る。かかる組換えポリヌクレオチドは、その起源または操作による、1)天然では結合するポリヌクレオチドの全体または一部分と結合せず;2)天然では結合するもの以外のポリペプチドに結合し;または3)天然には生じない、ゲノム、cDNA、半-合成または合成起源のポリヌクレオチドを含む。   The present invention provides a recombinant nucleic acid comprising all or part of the BRCA1 region. The recombinant construct can replicate autonomously in the host cell. Alternatively, the recombinant construct can become integrated into the chromosomal DNA of the host cell. Such recombinant polynucleotides, depending on their origin or manipulation, 1) do not bind to all or part of a naturally binding polynucleotide; 2) bind to a polypeptide other than those that bind naturally; or 3) naturally Including polynucleotides of genomic, cDNA, semi-synthetic or synthetic origin.

したがって、天然には生じない他の配列を含む組換え核酸が本発明によって提供される。野生型配列を用いることができるが、それは、しばしば、例えば、欠失、置換または挿入によって改変されているであろう。   Accordingly, recombinant nucleic acids comprising other sequences that do not occur in nature are provided by the present invention. Wild type sequences can be used, but they will often have been modified, for example, by deletion, substitution or insertion.

種々のタイプのcDNAまたはゲノムライブラリーを、本発明の核酸の天然起源としてスクリーンし得、あるいはかかる核酸は、ゲノムDNAまたは他の天然起源に存在する配列の増幅によって(例えば、PCRによって)提供し得る。cDNAライブラリーの選択は、通常、所望の蛋白質のmRNAに富む組織起源に対応する。ファージライブラリーが通常好ましいが、他のタイプのライブラリーを用いることもできる。ライブラリーのクローンをプレートに拡げ、スクリーニング用基質に移し、変性し、所望の配列の存在につき釣上げる。   Various types of cDNA or genomic libraries can be screened as natural sources of the nucleic acids of the invention, or such nucleic acids are provided by amplification (eg, by PCR) of sequences present in genomic DNA or other natural sources. obtain. The selection of the cDNA library usually corresponds to a tissue source rich in mRNA of the desired protein. Phage libraries are usually preferred, but other types of libraries can be used. Library clones are spread on plates, transferred to screening substrates, denatured, and picked up for the presence of the desired sequence.

本発明で用いるDNA配列は、通常、少なくとも約5コドン(15ヌクレオチド)、より通常は少なくとも7-15コドン、最も好ましくは、少なくとも約35コドンを含む。また、1または2以上のイントロンが存在し得る。このヌクレオチド数は、通常、BRCA1-コード配列と特異的にハイブリダイズするであろう首尾よいプローブに要するおよそ最小限の長さである。   The DNA sequences used in the present invention usually comprise at least about 5 codons (15 nucleotides), more usually at least 7-15 codons, most preferably at least about 35 codons. There can also be one or more introns. This number of nucleotides is usually about the minimum length required for a successful probe that will specifically hybridize to the BRCA1-coding sequence.

核酸操作用の技術は、一般的に、例えば、Sambrookら,1989またはAusbelら,1992に記載されている。制限酵素他のごときかかる技術に適用する試薬は当該分野で広く知られており、New England BioLabs社、Boehringer Mannheim社、Amersham社、Promega Biotec社、U.S.Biochemicals社、New England Nuclear社および他の多くの供給源のごとき業者から市販されている。本発明の融合蛋白質を作製するのに用いる組換え核酸配列は、天然または合成配列由来とし得る。適当なプローブを用いて、種々のcDNAまたはゲノムライブラリー(GenBank,National Institute of Health参照)から多くの天然遺伝子配列を得ることができる。   Techniques for nucleic acid manipulation are generally described, for example, in Sambrook et al., 1989 or Ausbel et al., 1992. Reagents applicable to such technologies, such as restriction enzymes, are widely known in the art and include New England BioLabs, Boehringer Mannheim, Amersham, Promega Biotec, US Biochemicals, New England Nuclear and others. Commercially available from many sources such as: The recombinant nucleic acid sequences used to make the fusion proteins of the invention can be derived from natural or synthetic sequences. Many natural gene sequences can be obtained from various cDNA or genomic libraries (see GenBank, National Institute of Health) using appropriate probes.

「BRCA1領域」とは、マーカーtdj1474およびU5Rによって結合されるヒト染色体17q21の部分をいう。この領域には、BRCA1遺伝子を含むBRCA1座が含まれる。   “BRCA1 region” refers to the portion of human chromosome 17q21 that is bound by markers tdj1474 and U5R. This region includes the BRCA1 locus containing the BRCA1 gene.

本明細書で用いるごとく、「BRCA1座」、「BRCA対立遺伝子」および「BRCA領域」は、すべて、遺伝子座、対立遺伝子または領域を含む二本鎖DNA、ならびに遺伝子座、対立遺伝子または領域を含むいずれかの一本鎖DNAをいう。   As used herein, “BRCA1 locus”, “BRCA allele” and “BRCA region” all include double stranded DNA comprising a locus, allele or region, as well as a locus, allele or region. It refers to any single-stranded DNA.

本明細書で用いるごとく、BRCA1座または領域もしくは対立遺伝子の「部分」とは、少なくとも約8ヌクレオチド、または好ましくは約15ヌクレオチド、またはより好ましくは少なくとも約25ヌクレオチドの最小限サイズを有すると規定され、および少なくとも約40ヌクレオチドの最小限サイズを有し得る。   As used herein, a “part” of a BRCA1 locus or region or allele is defined as having a minimum size of at least about 8 nucleotides, or preferably about 15 nucleotides, or more preferably at least about 25 nucleotides. And a minimum size of at least about 40 nucleotides.

「BRCA1蛋白質」または「BRCA1ポリペプチド」とは、BRCA1座によってコードされる蛋白質またはポリペプチド、その変形または断片をいう。   “BRCA1 protein” or “BRCA1 polypeptide” refers to a protein or polypeptide encoded by the BRCA1 locus, variants or fragments thereof.

「ポリペプチド」なる語は、アミノ酸ポリマーまたはその相当物をいい、特異的な長さの生成物をいうのではなく;したがって、ペプチド、オリゴペプチドおよび蛋白質がポリペプチドの定義の中に含まれる。この語は、また、例えば、グルコシル化、アセチル化、リン酸化他のポリペプチドの修飾物をいうのではなく、または排除する。該定義の中に含まれるのは、天然および非天然に生じる(例えば、非天然アミノ酸他を包含する)1または2以上のアナログのアミノ酸を含むポリペプチド、置換結合を有するポリペプチド、ならびに当該分野で公知の他の修飾物が含まれる。通常、かかるポリペプチドは、天然のBRCA1配列に少なくとも約50%相同で、好ましくは約90%を超えて、より好ましくは少なくとも約95%相同性である。また、高または低ストリンジェンシー条件下にてBRCA1-コード核酸にハイブリダイズし、BRCA1蛋白質(群)に対する抗血清によって回収される酷似したポリペプチドまたは蛋白質も包含される。   The term “polypeptide” refers to an amino acid polymer or its equivalent and not a product of a specific length; thus, peptides, oligopeptides and proteins are included within the definition of polypeptide. The term also does not refer to, or excludes, for example, glucosylated, acetylated, phosphorylated and other polypeptide modifications. Included within the definition are polypeptides comprising one or more analog amino acids, naturally occurring and non-naturally occurring (eg, including non-natural amino acids, etc.), polypeptides having substitution bonds, and the art And other modifications known in the art. Usually, such polypeptides are at least about 50% homologous to the native BRCA1 sequence, preferably greater than about 90%, more preferably at least about 95% homologous. Also included are very similar polypeptides or proteins that hybridize to a BRCA1-encoding nucleic acid under high or low stringency conditions and are recovered by antisera against the BRCA1 protein (s).

相同性につき比較するポリペプチド配列の長さは、一般的に、少なくとも約16アミノ酸、通常、少なくとも約20残基、より通常は少なくとも約24残基で、典型的には、少なくとも約28残基、好ましくは約35残基を超えるであろう。   The length of polypeptide sequences compared for homology is generally at least about 16 amino acids, usually at least about 20 residues, more usually at least about 24 residues, typically at least about 28 residues. Will preferably exceed about 35 residues.

「作動可能に連結した」とは、かく記載した成分が、その意図した様式の機能を許容する関係にある並列(juxtaposition)をいう。例えば、プロモーターがコード配列の転写または発現に影響する場合には、該プロモーターは該配列に作動可能に連結されている。   “Operably linked” refers to a juxtaposition where the components thus described are in a relationship that allows their intended mode of function. For example, a promoter is operably linked to a sequence if the promoter affects the transcription or expression of the coding sequence.

「プローブ」;適当なストリンジェントハイブリダイゼーションおよび洗浄条件下にて、標的配列のポリペプチドと安定なハイブリッドを形成するポリヌクレオチドプローブとのハイブリダイゼーションによって検出し得る、特定の癌の素因または大部分の癌に関連するBRCA1対立遺伝子に関連するポリヌクレオチド多形性をいう。プローブが標的配列に対して完全に相補的であると予想される場合には、ストリンジェント条件を用いるであろう。例えば、変形が、プローブは完全に相補的でない結果を有すると予想される場合のような幾つかの誤対合が予想される場合、ハイブリダイゼーション・ストリンジェンシーを低下させ得る。非特異的/偶然の結合を排除する、すなわち、ノイズを最小限化する条件を選択する。かかる示唆は天然DNA多形性ならびに突然変異を同定し、これらの示唆はさらに分析して、BRCA1感受性対立遺伝子の検出を立証する必要がある。   “Probe”; a predisposition or most of a particular cancer that can be detected by hybridization with a polynucleotide probe that forms a stable hybrid with a polypeptide of the target sequence under appropriate stringent hybridization and wash conditions. Polynucleotide polymorphism associated with the BRCA1 allele associated with cancer. If the probe is expected to be perfectly complementary to the target sequence, stringent conditions will be used. For example, the deformation may reduce hybridization stringency if some mismatch is expected, such as when the probe is expected to have a result that is not perfectly complementary. Select conditions that eliminate non-specific / accidental binding, ie, minimize noise. Such suggestions identify natural DNA polymorphisms as well as mutations, and these suggestions need to be further analyzed to demonstrate the detection of BRCA1-sensitive alleles.

BRCA1対立遺伝子のプローブは、BRCA1領域またはそのcDNAの配列由来とし得る。該プローブは、BRCA1領域の全体または一部分に広がり、かつBRCA1領域への特異的なハイブリダイゼーションを許容するいずれの適当な長さともし得る。標的配列が該プローブと同一の配列を含む場合、該プローブは、例えば、約8-30塩基対の範囲に短くし得る。なぜならば、該ハイブリッドは、ストリンジェント条件下でさえ比較的安定であろうからである。プローブとある程度の誤対合が予想される場合、すなわち、該プローブが種々の領域にハイブリダイズすることが予想される場合、必要な特異性で標的配列にハイブリダイズするより長いプローブを用い得る。   The BRCA1 allele probe may be derived from the BRCA1 region or the sequence of its cDNA. The probe can be of any suitable length that extends throughout or a portion of the BRCA1 region and allows specific hybridization to the BRCA1 region. If the target sequence comprises the same sequence as the probe, the probe can be shortened, for example, in the range of about 8-30 base pairs. This is because the hybrid will be relatively stable even under stringent conditions. If some mispairing with the probe is expected, ie if the probe is expected to hybridize to various regions, longer probes that hybridize to the target sequence with the required specificity can be used.

プローブには、標識またはレポーター分子に結合する単離ポリヌクレオチドが含まれ、それを用いて、標準的な方法によって配列類似を有する他のポリヌクレオチド配列を単離し得るであろう。プローブの調製および標識の技術としては、例えば、Sambrookら,1989またはAusbelら,1992を参照せよ。他の同様なポリヌクレオチドは、相同ポリヌクレオチドを用いることによって選抜し得る。別法として、これらまたは同様のポリペプチドをコードするポリヌクレオチドは、遺伝子コード中の重複を用いることによって合成または選抜し得る。例えば、サイレント変化(それによって種々の制限部位を作製する)または特定の系を最適化することによって、種々のコドン置換を導入し得る。突然変異を導入して、ポリペプチドの特性(恐らくは、リガンド-結合親和性、鎖間親和性の変化またはポリペプチド分解または代謝回転速度の変化)を修飾することができる。   A probe includes an isolated polynucleotide that binds to a label or reporter molecule, which could be used to isolate other polynucleotide sequences having sequence similarity by standard methods. See, for example, Sambrook et al., 1989 or Ausbel et al., 1992 for probe preparation and labeling techniques. Other similar polynucleotides can be selected by using homologous polynucleotides. Alternatively, polynucleotides encoding these or similar polypeptides can be synthesized or selected by using duplications in the genetic code. Various codon substitutions can be introduced, for example, by silent changes (thus creating various restriction sites) or by optimizing specific systems. Mutations can be introduced to modify the properties of the polypeptide (possibly a change in ligand-binding affinity, interchain affinity or polypeptide degradation or turnover rate).

本発明の合成オリゴヌクレオチドまたは他のポリヌクレオチドを含むプローブは、天然に発生するか、または組換えの一本鎖または二本鎖ポリヌクレオチド、あるいは化学合成由来とし得る。プローブは、ニック・トランスレーション、クレノー酵素フィル-イン(fill-in)反応または当該分野で公知の他の方法によっても標識し得る。   Probes comprising the synthetic oligonucleotides or other polynucleotides of the present invention can be naturally occurring or derived from recombinant single- or double-stranded polynucleotides, or from chemical synthesis. The probe may also be labeled by nick translation, Klenow enzyme fill-in reaction or other methods known in the art.

BRCA1をコードするポリヌクレオチド配列からの、少なくとも約8ヌクレオチド、通常少なくとも約15ヌクレオチドで、約6kbより短い、通常約1.0kbより短いヌクレオチドを有するポリヌクレオチド配列の一部分が、プローブとして好ましい。また、該プローブを用いて、BRCA1をコードするmRNAが細胞または組織中に存在するか否かを決定することもできる。   A portion of a polynucleotide sequence from a polynucleotide sequence encoding BRCA1 having at least about 8 nucleotides, usually at least about 15 nucleotides, and shorter than about 6 kb, usually shorter than about 1.0 kb, is preferred as a probe. The probe can also be used to determine whether mRNA encoding BRCA1 is present in a cell or tissue.

BRCA1ポリペプチドまたはその断片について本発明によって提供される
「蛋白質修飾物または断片」は、一次構造配列に実質的に相同性であるが、例えば、イン・ビボ(in vivo)またはイン・ビトロ(in vitro)の化学的および生化学的修飾または異常なアミノ酸を取り込んだものが含まれる。かかる修飾には、当業者によって容易に理解されるであろう、例えば、アセチル化、カルボキシ化、リン酸化、グリコシル化、ユビキチン化、(例えば、放射線核種での)標識、ならびに種々の酵素的修飾が含まれる。かかる目的に有用なポリペプチドを標識する種々の方法およびその置換または標識は、当該分野でよく知られており、32Pのごとき放射性同位体が含まれ、これは、標識リガンドの特異的結合対メンバーとして作用し得る標識抗リガンド(例えば、抗体)、蛍光団、化学発色剤、酵素および抗リガンドに結合する。標識の選択は、要する感度、プライマーとコンジュゲート容易性、安定性要件および入手可能な機器に依存する。ポリペプチドを標識する方法は当該分野でよく知られている(例えば、Sambrookら,1989またはAusbelら,1992参照)。
A “protein modification or fragment” provided by the present invention for a BRCA1 polypeptide or fragment thereof is substantially homologous to the primary structural sequence, eg, in vivo or in vitro in vitro) chemical and biochemical modifications or those incorporating unusual amino acids. Such modifications will be readily understood by those skilled in the art, for example, acetylation, carboxylation, phosphorylation, glycosylation, ubiquitination, labeling (eg, with radionuclides), and various enzymatic modifications. Is included. Various methods of labeling polypeptides useful for such purposes and their substitutions or labels are well known in the art and include radioisotopes, such as 32 P, which contain specific binding pairs of labeled ligands. It binds to labeled anti-ligands (eg, antibodies), fluorophores, chemical chromogenic agents, enzymes and anti-ligands that can act as members. The choice of label depends on the sensitivity required, ease of primer and conjugation, stability requirements and available equipment. Methods for labeling polypeptides are well known in the art (see, eg, Sambrook et al., 1989 or Ausbel et al., 1992).

実質的に完全長のポリペプチドに加えて、本発明は、偽ポリペプチドの生物学的に活性な断片を提供する。重要な生物学的活性には、BRCA1ポリペプチドのリガンド-結合性、免疫学的活性および他の生物学的活性特性が含まれる。免疫学的活性には、標的免疫系の免疫源機能、ならびに結合用の免疫学的エピトープを分け持っていること、BRCA1蛋白質のエピトープにつき競合または置換抗原のいずれかとして作用することの両方が含まれる。本明細書で用いる「エピトープ」とは、ポリペプチドの抗原決定基をいう。エピトープは、エピトープにユニークな空間立体配置に3個のアミノ酸を含み得る。一般的に、エピトープは、少なくとも5個のかかるアミノ酸、およびより通常は少なくとも8-10個のかかるアミノ酸よりなる。かかるアミノ酸の空間立体配置を決定する方法は当該分野で知られている。   In addition to substantially full-length polypeptides, the present invention provides biologically active fragments of pseudopolypeptides. Important biological activities include ligand-binding properties, immunological activity and other biological activity properties of the BRCA1 polypeptide. Immunological activity includes both the immunogenic function of the target immune system, as well as sharing the immunological epitope for binding, and acting as either a competing or replacement antigen for the epitope of the BRCA1 protein. It is. As used herein, “epitope” refers to an antigenic determinant of a polypeptide. An epitope can comprise three amino acids in a spatial configuration unique to the epitope. Generally, an epitope consists of at least 5 such amino acids, and more usually at least 8-10 such amino acids. Methods for determining the spatial configuration of such amino acids are known in the art.

免疫学的目的には、直列反復ポリペプチド・セグメントを免疫原として用い、それによって抗原蛋白質を高度に産生し得る。別法として、かかるポリペプチドは、特異的結合につき高効率の競合物としても作用するであろう。BRCA1ポリペプチドまたはその断片に特異的な抗体の作製を以下に記載する。   For immunological purposes, a tandem repeat polypeptide segment can be used as an immunogen, thereby producing highly antigenic proteins. Alternatively, such polypeptides will also act as highly efficient competitors for specific binding. Production of antibodies specific for BRCA1 polypeptide or fragments thereof is described below.

また、本発明は、BRCA1ポリペプチドおよび断片を含む、融合ポリペプチドも提供する。ホモポリペプチドは、2または3以上のBRCA1ポリペプチド配列の間の、またはBRCA1の配列と関連蛋白質との間の融合とし得る。同様に、誘導蛋白質の特性または活性の組合せを示すであろうヘテロ融合物を構築し得る。例えば、リガンド-結合または他のドメインは、異なる新たな融合ポリペプチドまたは断片の間で「交換」し得る。かかるホモまたはヘテロ融合ポリペプチドは、例えば、変化した強さまたは特異性の結合を示し得る。融合パートナーには、免疫グロブリン、細菌β-ガラクトシダーゼ、trpE、プロテインA、β-ラクタマーゼ、α-アミラーゼ、アルコール・デヒドロゲナーゼおよび酵母アルファ接合因子が含まれる(例えば、Godowskiら,1988参照)。   The present invention also provides fusion polypeptides, including BRCA1 polypeptides and fragments. A homopolypeptide may be a fusion between two or more BRCA1 polypeptide sequences, or between a BRCA1 sequence and a related protein. Similarly, heterofusions may be constructed that will exhibit a combination of derived protein properties or activities. For example, ligand-binding or other domains can be “exchanged” between different new fusion polypeptides or fragments. Such homo- or hetero-fusion polypeptides can exhibit, for example, altered strength or specificity of binding. Fusion partners include immunoglobulins, bacterial β-galactosidase, trpE, protein A, β-lactamase, α-amylase, alcohol dehydrogenase and yeast alpha mating factor (see, eg, Godowski et al., 1988).

融合蛋白質は、典型的には、以下に記載するごとき、いずれかの組換え核酸法によって作製し得、あるいは化学合成法とし得る。ポリペプチドを合成する技術は、例えば、Merrifield,1963に記載されている。   The fusion protein can typically be made by any recombinant nucleic acid method, as described below, or can be a chemical synthesis method. Techniques for synthesizing polypeptides are described, for example, in Merrifield, 1963.

「蛋白質精製」とは、BRCA1をコードする組換え核酸で形質転換した細胞からのごとき、他の生物材料からBRCA1ポリペプチドを単離するための種々の方法、ならびに当該分野でよく知られている方法をいう。例えば、かかるポリペプチドは、例えば、本発明によって提供される抗体を用いる免疫アフィニティー・クロマトグラフィーによって精製し得る。蛋白質精製の種々の方法は当該分野でよく知られており、Deutscher,1990およびScopes,1982に記載されたものが含まれる。   “Protein purification” is well known in the art as well as various methods for isolating BRCA1 polypeptides from other biological materials, such as from cells transformed with a recombinant nucleic acid encoding BRCA1. Say the method. For example, such polypeptides can be purified, for example, by immunoaffinity chromatography using the antibodies provided by the present invention. Various methods of protein purification are well known in the art and include those described in Deutscher, 1990 and Scopes, 1982.

「単離した」、「実質的に純粋な」および「実質的に均一な」なる語は、天然状態では蛋白質またはポリペプチドを付随する成分からそれらを分離することを記載するために相互変換可能に用いる。少なくとも約60〜75%の試料が単一のポリペプチド配列を示す場合、単量体蛋白質は実質的に純粋である。実質的に純粋な蛋白質は、典型的には、約60%〜90%W/Wの蛋白質試料、より通常には約95%、好ましくは約99%純粋を超える蛋白質試料を含むであろう。蛋白質純度または均一性は、蛋白質試料のポリアクリルアミドゲル電気泳動につづく該ゲルの染色の際の単一ポリペプチドバンドの視覚化のごとき、当該分野でよく知られている多くの手段によって示し得る。特定の目的には、HPLCまたは精製に利用する当該分野でよく知られた他の手段を用いることによって高解像度を供し得る。   The terms “isolated”, “substantially pure” and “substantially uniform” are interchangeable to describe the separation of proteins or polypeptides from their associated components in the natural state. Used for. A monomeric protein is substantially pure when at least about 60-75% of the sample exhibits a single polypeptide sequence. Substantially pure protein will typically comprise about 60% to 90% W / W protein sample, more usually about 95%, preferably greater than about 99% pure protein sample. Protein purity or homogeneity can be demonstrated by a number of means well known in the art, such as visualization of a single polypeptide band upon staining of the gel following polyacrylamide gel electrophoresis of a protein sample. For certain purposes, high resolution may be provided by using HPLC or other means well known in the art utilized for purification.

BRCA1蛋白質は、その天然状態でそれに付随する天然の汚染物からそれを分離した場合、天然で関連する成分を実質的に含まない。かくして、化学的に合成したか、またはそれが天然に起源する細胞とは異なる細胞系で合成したポリペプチドは、その天然に付随する成分を実質的に含まないであろう。蛋白質は、当該分野でよく知られた蛋白質精製技術を用いて単離することによって、天然に付随する成分を実質的に含まないものとすることもできる。   A BRCA1 protein is substantially free of naturally associated components when it is separated from the natural contaminants associated with it in its native state. Thus, a polypeptide that is chemically synthesized or synthesized in a cell line that is different from the cell from which it naturally originates will be substantially free of its naturally associated components. Proteins can also be made substantially free of naturally associated components by isolation using protein purification techniques well known in the art.

単離および操作した遺伝子配列の発現産物として生成するポリペプチドは、ホモ細胞型で発現される場合でさえ、本明細書で用いる「単離ポリペプチド」である。ヘテロ細胞によって発現される合成作製形態または分子は、本来、単離分子である。   A polypeptide that is generated as an expression product of an isolated and engineered gene sequence is an “isolated polypeptide” as used herein, even when expressed in a homocellular form. A synthetic production form or molecule expressed by a heterologous cell is essentially an isolated molecule.

「組換え核酸」とは、天然に生じるものではない、または、配列の2の他の分離したセグメントの人工的組合せによって作製した核酸である。この人工的な組合せは、しばしば、いずれかの化学合成手段によってか、または核酸の単離セグメントの人工操作によって、例えば、遺伝子工学技術によってなされる。かかるものは、通常、同一または保存アミノ酸をコードする余分なコドンでコドンを置換して行うが、典型的には、配列認識部位を導入するか、または除去する。別法として、それを行って、所望の機能の核酸セグメントを一緒に結合し、所望の組合せの機能を生成する。   A “recombinant nucleic acid” is a nucleic acid that is not naturally occurring or made by the artificial combination of two other separated segments of sequence. This artificial combination is often made by any chemical synthesis means or by the artificial manipulation of isolated segments of nucleic acids, for example by genetic engineering techniques. Such is usually done by replacing the codon with an extra codon encoding the same or a conserved amino acid, but typically introduces or removes a sequence recognition site. Alternatively, it is performed to join together nucleic acid segments of the desired function to produce the desired combination of functions.

「調節配列」とは、通常、遺伝子座のコード領域の100kb以内の配列をいうが、それはコード領域からさらに離れていることもあり、それは、(遺伝子の転写、およびmRNAの翻訳、スプライシング、安定性などを含む)遺伝子の発現に影響する。   A “regulatory sequence” usually refers to a sequence within 100 kb of the coding region of a locus, but it may be further away from the coding region, which includes (gene transcription and mRNA translation, splicing, stability Affects gene expression (including sex).

「実質的に相同または同様な」;他の核酸(またはその相補鎖)と(適当なヌクレオチド挿入または欠失を有して)最適に並べた場合に、ヌクレオチド塩基の少なくとも約60%、通常少なくとも約70%、より通常は少なくとも約80%、好ましくは少なくとも約90%、より好ましくは少なくとも約95-98%のヌクレオチド塩基のヌクレオチド配列同一性が存在する場合、核酸またはその断片はもう1つのものに「実質的に相同性である」(「または実質的に同様である」)。   “Substantially homologous or similar”; at least about 60% of the nucleotide bases, usually at least about 60% when aligned optimally with other nucleic acids (or their complementary strands) (with appropriate nucleotide insertions or deletions) A nucleic acid or fragment thereof is another when there is a nucleotide sequence identity of about 70%, more usually at least about 80%, preferably at least about 90%, more preferably at least about 95-98% nucleotide bases Are “substantially homologous” (or “substantially similar”).

別法として、鎖またはその相補鎖に対して選択的なハイブリダイゼーション条件下で、他の核酸(またはその相補鎖)に、核酸またはその断片がハイブリダイズする場合、実質的な相補性または(同一性)が存在する。特異性の全体的な欠乏よりも実質的により選択的なハイブリダイゼーションが起こる場合に、ハイブリダイゼーションの選択性が存在する。典型的には、選択的ハイブリダイゼーションは、少なくとも約14ヌクレオチド、好ましくは少なくとも65%、より好ましくは少なくとも約75%、最も好ましくは少なくとも約90%のストレッチにわたって少なくとも約55%相同性が存在する場合に生じるであろう(Kanehisa,1984参照)。記載した相同性比較の長さは、より長いストレッチとすることもでき、特定の具体例においては、しばしば、少なくとも約9ヌクレオチド、通常は少なくとも約20ヌクレオチド、より通常は少なくとも約24ヌクレオチド、典型的には少なくとも約28ヌクレオチド、より典型的には少なくとも約32ヌクレオチド、好ましくは少なくとも約36またはそれを超えるヌクレオチドのストレッチにわたるであろう。   Alternatively, when a nucleic acid or fragment thereof hybridizes to another nucleic acid (or its complementary strand) under hybridization conditions selective for the strand or its complementary strand, substantial complementarity or (identical) Sex) exists. Hybridization selectivity exists when substantially more selective hybridization occurs than an overall lack of specificity. Typically, selective hybridization is where there is at least about 55% homology over a stretch of at least about 14 nucleotides, preferably at least 65%, more preferably at least about 75%, and most preferably at least about 90%. (See Kanehisa, 1984). The length of the homology comparison described can also be a longer stretch, and in certain embodiments, often at least about 9 nucleotides, usually at least about 20 nucleotides, more usually at least about 24 nucleotides, typically Will span a stretch of at least about 28 nucleotides, more typically at least about 32 nucleotides, preferably at least about 36 or more nucleotides.

核酸ハイブリダイゼーションは、当業者によって容易に理解されるであろう、塩基組成、相補鎖の長さ、およびハイブリダイズする核酸の間のヌクレオチド塩基誤対合の数に加えて、塩濃度、温度、または有機溶媒のごとき条件によって影響されるでろう。ストリンジェントな温度条件には、一般的に、30℃を超える、典型的には37℃を超える、好ましくは45℃を超える温度が含まれるであろう。ストインジェントな塩条件には、通常、1000mM未満、典型的には500mM未満、好ましくは200mM未満であろう。しかしながら、指標の組合せはいずれの単一の指標の測定よりも遥かにより重要である(例えば、WetmurおよびDavidson,1968参照)。プローブ配列は、また、特定の条件下にて二重らせんDNAに特異的にハイブリダイズして、三重らせんまたは他のより高次のDNA複合体を形成し得る。かかるプローブの調製および適当なハイブリダイゼーション条件は当該分野でよく知られている。   Nucleic acid hybridization, as will be readily understood by those skilled in the art, in addition to base composition, complementary strand length, and number of nucleotide base mismatches between hybridizing nucleic acids, salt concentration, temperature, Or it will be affected by conditions such as organic solvents. Stringent temperature conditions will generally include temperatures above 30 ° C, typically above 37 ° C, preferably above 45 ° C. Stoint salt conditions will usually be less than 1000 mM, typically less than 500 mM, preferably less than 200 mM. However, the combination of indicators is much more important than the measurement of any single indicator (see, eg, Wetmur and Davidson, 1968). Probe sequences can also specifically hybridize to duplex DNA under certain conditions to form triple helices or other higher order DNA complexes. The preparation of such probes and appropriate hybridization conditions are well known in the art.

「実質的相同性」または「実質的同一性」なる語は、ポリペプチドをいう場合、問題のポリペプチドまたは蛋白質が自然に発生する全体蛋白質またはその一部分と少なくとも約30%同一性、通常少なくとも約70%同一性、好ましくは少なくとも約95%同一性を表すことを示す。   The term “substantial homology” or “substantial identity” when referring to a polypeptide refers to at least about 30% identity, usually at least about about 30%, with the whole protein or portion thereof in which the polypeptide or protein in question naturally occurs. It represents 70% identity, preferably at least about 95% identity.

「実質的に同一の機能」とは、野生型BRCA1核酸または野生型BRCA1ポリペプチドに関しての、修飾核酸または修飾蛋白質の機能をいう。修飾ポリペプチドは野生型BRCA1ポリペプチドに実質的に相同性であって、同一の機能を実質的に有するであろう。修飾ポリペプチドは、変化したアミノ酸配列を有し、および/または修飾アミノ酸を含み得る。機能の同一性に加えて、修飾ポリペプチドは、より長い半減期のごとき他の有用な特性を有し得る。修飾ポリペプチドの機能(活性)の同一性は、実質的に野生型BRCA1ポリペプチドの活性と同一とし得る。別法として、修飾ポリペプチドの機能(活性)の同一性は、野生型BRCA1ポリペプチドの活性よりも高いものとし得る。修飾ポリペプチドは、慣用的な技術を用いて合成し、あるいは、修飾した核酸によってコードされ、慣用的な技術を用いて作製される。修飾核酸は慣用的な技術によって調製する。野生型BRCA1遺伝子機能と実質的に同様の機能を有する核酸は、前記した修飾蛋白質を産生する。   “Substantially the same function” refers to the function of the modified nucleic acid or protein with respect to the wild-type BRCA1 nucleic acid or wild-type BRCA1 polypeptide. The modified polypeptide will be substantially homologous to the wild type BRCA1 polypeptide and will have substantially the same function. A modified polypeptide has an altered amino acid sequence and / or can include modified amino acids. In addition to functional identity, modified polypeptides may have other useful properties such as longer half-life. The identity of the function (activity) of the modified polypeptide can be substantially the same as the activity of the wild-type BRCA1 polypeptide. Alternatively, the function (activity) identity of the modified polypeptide may be higher than the activity of the wild-type BRCA1 polypeptide. Modified polypeptides are synthesized using conventional techniques, or are encoded by modified nucleic acids and are generated using conventional techniques. Modified nucleic acids are prepared by conventional techniques. A nucleic acid having substantially the same function as the wild-type BRCA1 gene function produces the modified protein described above.

ポリペプチドの相同性は、典型的に、配列分析ソフトウェアを用いて測定する(例えば、Sequence Analysis Software Package of the Genetics Computer Group,University of Wisconsin Biotechnology Center,910 University Avenue,Madison,Wisconsin 53705参照)。蛋白質分析ソフトウェアは、種々の置換、欠失および他の修飾を指定した相同性の測定を用いて、同様配列を対合する。保存性置換には、典型的に、以下の群の中の置換が含まれる:グリシン、アラニン;バリン、イソロイシン、ロイシン;アスパラギン酸、グルタミン酸;アスパラギン、グルタミン;セリン、スレオニン;リジン、アルギニン;およびフェニルアラニン、チロシン。   Polypeptide homology is typically measured using sequence analysis software (see, eg, Sequence Analysis Software Package of the Genetics Computer Group, University of Wisconsin Biotechnology Center, 910 University Avenue, Madison, Wisconsin 53705). Protein analysis software pairs similar sequences using homology measurements specifying various substitutions, deletions and other modifications. Conservative substitutions typically include substitutions within the following groups: glycine, alanine; valine, isoleucine, leucine; aspartic acid, glutamic acid; asparagine, glutamine; serine, threonine; lysine, arginine; , Tyrosine.

ポリペプチド「断片」、「一部分」または「セグメント」とは、少なくとも約5〜7個の隣接したアミノ酸、しばしば、少なくとも約7〜9個の隣接したアミノ酸、典型的には少なくとも約9〜13の隣接したアミノ酸、最も好ましくは少なくとも約20〜30またはそれを超えて隣接したアミノ酸のアミノ酸残基のストレッチである。   A polypeptide “fragment”, “part” or “segment” refers to at least about 5-7 contiguous amino acids, often at least about 7-9 contiguous amino acids, typically at least about 9-13. A stretch of amino acid residues of adjacent amino acids, most preferably at least about 20-30 or more adjacent amino acids.

本発明のポリペプチドは、可溶性である場合、例えば、ニトロセルロース、ナイロン、カラム充填材(例えば、Sepharose beads)、磁性ビーズ、ガラスウール、プラスチック、金属、ポリマーゲル、細胞または他の基体のような固相支持体にカップリングし得る。かかる支持体は、例えば、ビーズ、ウェル、計深棒または膜のような形態を採り得る。   When the polypeptide of the present invention is soluble, such as, for example, nitrocellulose, nylon, column packing (eg, Sepharose beads), magnetic beads, glass wool, plastic, metal, polymer gel, cells or other substrates It can be coupled to a solid support. Such a support may take the form of, for example, a bead, well, dipstick or membrane.

「標的領域」とは、増幅および/または検出する核酸の領域をいう。「標的配列」なる語は、所望の条件下にて、それとプローブまたはプライマーとが安定なハイブリッドを形成するであろう配列をいう。   “Target region” refers to a region of a nucleic acid to be amplified and / or detected. The term “target sequence” refers to a sequence with which a probe or primer will form a stable hybrid under the desired conditions.

本発明の実施は、特に指摘しない限り、化学、分子生物学、微生物学、組換えDNA、遺伝学および免疫学の慣用的な技術を用いる(例えば、Maniatisら,1982;Sambrookら,1989;Ausubelら,1992;Glover,1985;Anand,1992;GuthrieおよびFink,1991参照)。ヒト染色体17qのマッピングを含むヒト遺伝子マッピングの技術および材料の一般的な議論は、例えば、WhiteおよびLalouel,1988に記載されている。   The practice of the present invention employs conventional techniques of chemistry, molecular biology, microbiology, recombinant DNA, genetics and immunology unless otherwise indicated (eg, Maniatis et al., 1982; Sambrook et al., 1989; Ausubel 1992; Glover, 1985; Anand, 1992; Guthrie and Fink, 1991). A general discussion of human gene mapping techniques and materials, including mapping of human chromosome 17q, is described, for example, in White and Lalouel, 1988.

組換えまたは化学的に合成した核酸;ベクター、形質転換、宿主細胞の調製
本発明の大量のポリヌクレオチドは、適当な宿主細胞中の複製によって産生し得る。所望の断片をコードする天然または合成ポリヌクレオチド断片は、原核生物または真核生物細胞に導入し、複製する能力を有する、組換えポリヌクレオチド構築物、通常DNA構築物に導入する。通常、ポリヌクレオチド構築物は、酵母または細菌のごとき単細胞宿主における複製に適しているであろうが、(ゲノム内に一体化されるか、またはされないで)培養した哺乳動物または植物あるいは他の真核生物細胞系統への導入を意図することもできる。本発明の方法によって作製した核酸の精製は、例えば、Sambrookら,1989またはAusubelら,1992に記載されている。
Recombinant or chemically synthesized nucleic acids; vector, transformation, host cell preparation Large quantities of the polynucleotides of the invention can be produced by replication in a suitable host cell. Natural or synthetic polynucleotide fragments encoding the desired fragment are introduced into a recombinant polynucleotide construct, usually a DNA construct, which has the ability to introduce and replicate into prokaryotic or eukaryotic cells. Typically, the polynucleotide construct will be suitable for replication in a unicellular host, such as yeast or bacteria, but in cultured mammals or plants or other eukaryotic cells (integrated or not integrated into the genome). It can also be intended for introduction into a biological cell line. Purification of nucleic acids produced by the methods of the present invention is described, for example, in Sambrook et al., 1989 or Ausubel et al., 1992.

本発明のポリヌクレオチドは、例えば、BeaucageおよびCarruthers,1981によって記載されているホスホルアミダイト法、またはMatteucciおよびCaruthers,1981によるトリエステル法による化学合成によって作製し得、市販の自動化オリゴヌクレオチド合成器で行うこともできる。二本鎖断片は、相補鎖を合成し、適当な条件下にてそれらの鎖を一緒にアニーリングさせることによって、あるいは、適当なプライマー配列と一緒にDNAポリメラーゼを用いて相補鎖を付加することによって、化学合成の一本鎖から得ることができる。   The polynucleotides of the present invention can be made, for example, by chemical synthesis by the phosphoramidite method described by Beaucage and Carruthers, 1981, or by the triester method by Matteucci and Caruthers, 1981, using commercially available automated oligonucleotide synthesizers. It can also be done. Double-stranded fragments are synthesized by synthesizing complementary strands and annealing the strands together under appropriate conditions, or by adding complementary strands using DNA polymerase together with appropriate primer sequences. Can be obtained from a single chain of chemical synthesis.

原核生物または真核生物宿主へ導入するために調製するポリヌクレオチド構築物は、所望のポリヌクレオチドをコードする目的のポリヌクレオチド断片を包含する宿主によって認識される複製系を含み得、好ましくは該ポリヌクレオチドコードセグメントに作動可能に連結した転写および翻訳の開始の調節配列も含むであろう。発現ベクターには、例えば、複製開始点または自律複製配列(ARS)、ならびに、リボソーム-結合部位、RNAスプライシング部位、ポリアデニル化部位、転写ターミネーター配列およびmRNA安定化配列のごとき、発現制御配列、プロモーター、エンハンサーおよび必須のプロセシング情報部位が含まれ得る。分泌シグナルには、適当には、天然BRCA1蛋白質からか、または他の受容体、あるいは同一または関連する種の分泌ポリペプチドからかのいずれかからのもので、蛋白質を細胞膜貫通および/または緊提させるもので、従って、その機能トポロジーを達成する、あるいは細胞から分泌されるものが含まれ得る。かかるベクターは、当該分野でよく知られ、例えば、Sambrookら,1989またはAusbelら,1992中で論じられている標準的な組換え技術によって調製し得る。   A polynucleotide construct prepared for introduction into a prokaryotic or eukaryotic host can include a replication system recognized by the host including the polynucleotide fragment of interest encoding the desired polynucleotide, preferably the polynucleotide. It will also contain regulatory sequences for transcription and translation initiation operably linked to the coding segment. Expression vectors include, for example, origins of replication or autonomously replicating sequences (ARS), and expression control sequences such as ribosome-binding sites, RNA splicing sites, polyadenylation sites, transcription terminator sequences and mRNA stabilizing sequences, promoters, Enhancers and essential processing information sites can be included. The secretory signal is suitably from either the native BRCA1 protein or from another receptor, or from a secreted polypeptide of the same or related species, and the protein is transmembrane and / or coveted. Thus, it can include those that achieve their functional topology or are secreted from the cell. Such vectors are well known in the art and can be prepared by standard recombinant techniques as discussed, for example, in Sambrook et al., 1989 or Ausbel et al., 1992.

適当なプロモーターおよび他の必須のベクター配列は、宿主で機能するように選択され、適当には、BRCA1遺伝子と天然で関連するものが含まれ得る。細胞系統および発現ベクターの作動し得る組合せの例は、Sambrookら,1989またはAusubelら,1992に記載されており;また、例えば、Metzgerら,1988を参照せよ。多くの有用なベクターが当該分野で公知であり、Stratagene社、New England Biolabs社、Promega Biotech社他のごとき業者から入手し得る。
trp、lacおよびファージプロモーター、tRNAプロモーターおよび解糖酵素プロモーターのごときプロモーターを原核生物宿主に用い得る。有用な酵母プロモーターには、メタロチオネイン、3-ホスホグリセレート・キナーゼ、または、エノラーゼもしくはグリセルアルデヒド-3-ホスフェート・デヒドロゲナーゼのごとき他の解糖酵素、マルトースおよびガラクトース利用に寄与する酵素他のプロモーター領域が含まれる。酵母発現の使用に適したベクターおよびプロモーターは、さらに、Hitzemanら,EP 73,675A号に記載されている。適当な非天然哺乳動物プロモーターには、SV40からの初期および後期プロモーター(Fiersら,1978)またはマウスモロニー白血病ウイルス、マウス腫瘍ウイルス、ニワトリ肉腫ウイルス、II型アデノウイルス、ウシ乳頭腫ウイルスまたはポリオーマ由来のプロモーターが含まれ得る。加えて、該構築物は、複数コピーの遺伝子を作製し得るように、増幅性遺伝子(例えば、DHFR)に連結し得る。適当なエンハンサーおよび他の発現制御配列に関しては、例えば、Enhancers and Eukaryotic Gene Expression,Cold Spring Harbor Press社,Cold Spring Harbor,New York(1983)を参照せよ。
Appropriate promoters and other essential vector sequences are selected to function in the host and may suitably include those naturally associated with the BRCA1 gene. Examples of operable combinations of cell lines and expression vectors are described in Sambrook et al., 1989 or Ausubel et al., 1992; see also, for example, Metzger et al., 1988. Many useful vectors are known in the art and are available from vendors such as Stratagene, New England Biolabs, Promega Biotech and others.
Promoters such as trp, lac and phage promoters, tRNA promoters and glycolytic enzyme promoters may be used for prokaryotic hosts. Useful yeast promoters include metallothionein, 3-phosphoglycerate kinase, or other glycolytic enzymes such as enolase or glyceraldehyde-3-phosphate dehydrogenase, other promoter regions that contribute to maltose and galactose utilization Is included. Suitable vectors and promoters for use in yeast expression are further described in Hitzeman et al., EP 73,675A. Suitable non-natural mammalian promoters include early and late promoters from SV40 (Fiers et al., 1978) or murine moloney leukemia virus, murine tumor virus, chicken sarcoma virus, type II adenovirus, bovine papilloma virus or polyoma. A promoter can be included. In addition, the construct can be linked to an amplifiable gene (eg, DHFR) so that multiple copies of the gene can be generated. For suitable enhancers and other expression control sequences, see, for example, Enhancers and Eukaryotic Gene Expression, Cold Spring Harbor Press, Cold Spring Harbor, New York (1983).

かかる発現ベクターは自律的に複製し得るが、それらは、当該分野でよく知られている方法によって、宿主細胞のゲノムに挿入することによって複製することもできる。   Such expression vectors can replicate autonomously, but they can also be replicated by insertion into the genome of a host cell by methods well known in the art.

発現およびクローニングベクターは、ベクターで形質転換した宿主細胞の生存または増殖に必須な蛋白質をコードする遺伝子である選択マーカーを含むようである。この遺伝子が存在することにより、該インサートを発現する宿主細胞のみの増殖が保証される。典型的な選択遺伝子は、a)抗生物質または他の毒性物質、例えば、アンピシリン、ネオマイシン、メトトレキセート他への抵抗性を付与する;b)栄養要求性欠損を補う、またはc)複合培地から入手できない重要な栄養を供給する(例えば、悍菌(Bacilli)にはD-アラニン・ラセマーゼをコードする遺伝子)蛋白質をコードしている。適当な選択マーカーの選択は宿主細胞に依存し、種々の宿主に対する適当なマーカーは当該分野でよく知られている。   Expression and cloning vectors appear to contain a selectable marker that is a gene encoding a protein essential for the survival or growth of host cells transformed with the vector. The presence of this gene ensures the growth of only host cells that express the insert. Typical selection genes confer resistance to a) antibiotics or other toxic substances such as ampicillin, neomycin, methotrexate, etc .; b) supplement auxotrophic deficiencies, or c) not available from complex media It encodes a protein that supplies important nutrients (for example, the gene encoding D-alanine racemase for Bacilli). The selection of the appropriate selectable marker depends on the host cell, and appropriate markers for various hosts are well known in the art.

目的の核酸を含むベクターはイン・ビトロ(in vitro)で転写し得、よく知られた方法(例えば、インジェクション(Kuboら,1988))によって、得られたRNAを宿主細胞に導入し得、あるいは、該ベクターは細胞宿主のタイプに依存して変動する当該分野でよく知られている方法(エレクトロポレーション;塩化カルシウム、塩化ルビジウム、リン酸カルシウム、DEAE-デキストランまたは他の物質を用いるトランスフェクション;マイクロプロジェクタイル衝撃;リポフェクション感染(ベクターがレトロウイルスゲノムのごとき感染性因子である);ならびに他の方法)によって宿主細胞に直接導入し得る(一般的に、Sambrookら,1989およびAusubelら,1992参照)。とりわけ前記したものを包含する当該分野で公知のいずれかの方法による宿主細胞へのポリヌクレオチドの導入は、本明細書中で「形質転換」という。前記の核酸を導入した細胞は、かかる細胞の子孫も含むことを意味する。   A vector containing the nucleic acid of interest can be transcribed in vitro, and the resulting RNA can be introduced into a host cell by well-known methods (eg, injection (Kubo et al., 1988)), or The vectors vary depending on the type of cell host, well-known methods in the art (electroporation; transfection using calcium chloride, rubidium chloride, calcium phosphate, DEAE-dextran or other substances; microprojectors; Can be directly introduced into host cells by lipofection infection (vector is an infectious agent such as a retroviral genome); and other methods) (see generally Sambrook et al., 1989 and Ausubel et al., 1992). Introduction of a polynucleotide into a host cell by any method known in the art, including those specifically mentioned above, is referred to herein as “transformation”. A cell into which the nucleic acid has been introduced is meant to include the progeny of such a cell.

本発明の大量の核酸およびポリヌクレオチドは、BRCA1核酸またはその一部分を原核生物または真核生物宿主細胞に和合性のベクターまたは他の発現ビヒクルで発現させることによって調製し得る。最も通常用いる原核生物宿主はエシェリキア・コリ(Escherichia coli)であるが、バチルス・ズブチリス(Bacillus subtilis)またはシュードモナス(Pseudomonas)のごとき他の原核生物も用い得る。   Large quantities of the nucleic acids and polynucleotides of the invention can be prepared by expressing a BRCA1 nucleic acid or portion thereof in a prokaryotic or eukaryotic host cell in a compatible vector or other expression vehicle. The most commonly used prokaryotic host is Escherichia coli, but other prokaryotes such as Bacillus subtilis or Pseudomonas can also be used.

哺乳類宿主細胞、あるいは、酵母、糸状菌、植物、昆虫、または両生類もしくは鳥類のごとき他の真核生物宿主細胞も、また、本発明の蛋白質の産生に有用となり得る。培養における哺乳動物細胞の増殖は、それ自体よく知られている(JakobyおよびPastan,1979参照)。通常用いられる哺乳動物宿主細胞系統の例はVEROおよびHeLa細胞、チャイニーズハムスター卵巣(CHO)細胞、ならびにWI38、BHKおよびCOS細胞系統であるが、他の細胞系統も、例えば、より高い発現、望ましいグリコシル化パターン、または他の特徴を供するに適当となり得ることは当業者によって理解されるであろう。   Mammalian host cells or other eukaryotic host cells such as yeast, filamentous fungi, plants, insects, or amphibians or birds can also be useful for the production of the proteins of the invention. The growth of mammalian cells in culture is well known per se (see Jakoby and Pastan, 1979). Examples of commonly used mammalian host cell lines are VERO and HeLa cells, Chinese hamster ovary (CHO) cells, and WI38, BHK and COS cell lines, although other cell lines also have higher expression, desirable glycosyls It will be appreciated by those skilled in the art that it may be appropriate to provide a pattern, or other features.

ベクター構築物の様式に依存するマーカーを用いることによって、クローンを選抜し得る。マーカーは、同一または異なるDNA分子上とし得るが、好ましくは同一DNA分子上である。原核生物宿主においては、例えば、アンピシリン、テトラサイクリンまたは他の抗生物質に対する抵抗性によって、形質転換体を選抜し得る。温度感受性に基づく特定の産物の産生も、適当なマーカーとして作用し得る。   Clones can be selected by using markers that depend on the mode of the vector construct. The marker may be on the same or different DNA molecule, but is preferably on the same DNA molecule. In prokaryotic hosts, transformants can be selected, for example, by resistance to ampicillin, tetracycline or other antibiotics. The production of specific products based on temperature sensitivity can also act as a suitable marker.

本発明のポリヌクレオチドで形質転換した原核生物または真核生物細胞は、本発明の核酸およびポリペプチドの産生のみならず、例えば、BRCA1ポリペプチドの特性の研究においても有用であろう。
アンチセンス・ポリヌクレオチド配列は、当業者によって理解されるであろうごとく、BRCA1座の発現を防ぐか、または減じるのに有用である。例えば、BRCA1座またはBRCA1領域からの他の配列(特に、BRCA1座に隣接するもの)の全体もしくは一部分を含有するポリヌクレオシドベクターは、アンチセンス方向でプロモーターの制御下に置き、細胞に導入することができる。細胞内におけるかかるアンチセンス構築物の発現は、BRCA1転写および/または翻訳および/または複製を妨害するであろう。
Prokaryotic or eukaryotic cells transformed with the polynucleotides of the invention will be useful not only in the production of nucleic acids and polypeptides of the invention, but also in, for example, studying the properties of BRCA1 polypeptides.
Antisense polynucleotide sequences are useful to prevent or reduce expression of the BRCA1 locus, as will be appreciated by those skilled in the art. For example, a polynucleoside vector containing all or part of the BRCA1 locus or other sequences from the BRCA1 region (especially those adjacent to the BRCA1 locus) should be placed under the control of the promoter in the antisense orientation and introduced into the cell. Can do. Expression of such an antisense construct in the cell will interfere with BRCA1 transcription and / or translation and / or replication.

本明細書で開示したBRCA1遺伝子配列に基づくプローブおよびプライマーを用いて、他の種における相同性BRCA1遺伝子配列および蛋白質を同定する。これらのBRCA1遺伝子配列および蛋白質は、それを単離した種についての、本明細書に記載した診断/予測、治療および薬剤スクリーニング方法に用いる。   Probes and primers based on the BRCA1 gene sequence disclosed herein are used to identify homologous BRCA1 gene sequences and proteins in other species. These BRCA1 gene sequences and proteins are used in the diagnostic / predictive, therapeutic and drug screening methods described herein for the species from which they were isolated.

使用方法:核酸診断および診断キット
個人が癌になる素因であるBRCA1対立遺伝子の存在を検出するためには、血液のごとき生物試料を調製し、BRCA1の感受性対立遺伝子の存在または不存在について分析する。新生生物の存在を検出するためには、前駆体病斑の悪性腫瘍に向けての進展、または、予測指標として、病斑の生物試料を調製し、BRCA1の突然変異対立遺伝子の存在または不存在について分析する。これらの試験の結果および解釈情報は、試験した個人に対するコミュニケーションのためにヘルスケア・プロバイダーに戻す。かかる診断は、診断研究所によって行うか、別法として、診断キットを製造し、ヘルスケア・プロバイダーまたは自己-診断用にプライベートな個人に対して販売し得る。
Methods of Use: Nucleic acid diagnostics and diagnostic kits To detect the presence of a BRCA1 allele that predisposes an individual to cancer, a biological sample such as blood is prepared and analyzed for the presence or absence of a sensitive allele of BRCA1 . In order to detect the presence of neoplasms, the progression of precursor lesions towards malignant tumors, or as a predictive indicator, a biological sample of lesions is prepared and the presence or absence of a mutant allele of BRCA1 Analyze about. The results of these trials and interpretation information are returned to the healthcare provider for communication to the individuals tested. Such a diagnosis may be performed by a diagnostic laboratory, or alternatively, a diagnostic kit may be manufactured and sold to healthcare providers or private individuals for self-diagnosis.

最初に、スクリーニング法は適当なBRCA1配列の増幅が含まれる。本発明のもう1つの好ましい具体例において、該スクリーニング方法は、非-PCRベースの戦略を含む。かかるスクリーニング法には、当該分野でよく知られている2-段階標識増幅方法論が含まれる。PCRおよび非-PCRの両方のベースのスクリーニング戦略は、高レベルの感度で標的配列を検出し得る。   Initially, the screening method involves amplification of the appropriate BRCA1 sequence. In another preferred embodiment of the invention, the screening method comprises a non-PCR based strategy. Such screening methods include 2-step label amplification methodologies well known in the art. Both PCR and non-PCR based screening strategies can detect target sequences with a high level of sensitivity.

今日用いられている最もポピュラーな方法は、標的増幅である。ここにおいては、標的核酸配列をポリメラーゼで増幅する。ポリメラーゼ作動増幅を用いる1つの特に好ましい方法は、ポリメラーゼ連鎖反応(PCR)である。ポリメラーゼ連鎖反応および他のポリメラーゼ-作動増幅アッセイにより、ポリメラーゼ-作動増幅サイクルの使用を通して、コピー数にして百万倍を超える増加を達成し得る。増幅したら、得られた核酸は配列決定し得るか、またはDNAプローブ用の基質として用い得る。   The most popular method used today is target amplification. Here, the target nucleic acid sequence is amplified with a polymerase. One particularly preferred method using polymerase-actuated amplification is the polymerase chain reaction (PCR). Polymerase chain reactions and other polymerase-actuated amplification assays can achieve over a million-fold increase in copy number through the use of polymerase-actuated amplification cycles. Once amplified, the resulting nucleic acid can be sequenced or used as a substrate for a DNA probe.

プローブを用いて標的配列の存在を検出する(例えば、癌感受性についてのスクリーニングにおいて)場合、所望により、血液または血清のごとき分析すべき生物試料を処理して核酸を抽出し得る。試料核酸を種々の方法で調製して、標的配列の検出;例えば、変性、制限消化、電気泳動またはドット・ブロットを容易ならしめることができる。分析核酸の標的化領域は、通常、少なくとも部分的に一本鎖であって、プローブの標的配列とハイブリッドを形成しなければならない。配列が天然に一本鎖である場合、変性は必要ないであろう。しかしながら、配列が二本鎖である場合、該配列は恐らく変性させる必要がある。変性は、当該分野で公知の種々の技術によって行い得る。   If the probe is used to detect the presence of a target sequence (eg, in screening for cancer susceptibility), a biological sample to be analyzed, such as blood or serum, can be processed to extract nucleic acids, if desired. Sample nucleic acids can be prepared in a variety of ways to facilitate detection of the target sequence; eg, denaturation, restriction digestion, electrophoresis or dot blot. The targeting region of the analytical nucleic acid is usually at least partially single stranded and must hybridize to the target sequence of the probe. If the sequence is naturally single stranded, denaturation will not be necessary. However, if the sequence is double stranded, the sequence probably needs to be denatured. Denaturation can be performed by various techniques known in the art.

分析核酸およびプローブは、分析物中の予想標的化配列とプローブ中の標的配列との安定なハイブリッド形成を促進する条件下にてインキュベートする。分析物に結合させるのに用いるプローブの領域は、ヒト染色体17qの標的化領域に完全に相補的とし得る。したがって、誤った陽性を防ぐためには、高ストリンジェンシー条件が望ましい。しかしながら、高ストリンジェンシー条件は、ゲノム中にユニークである染色体領域にプローブが相補的である場合にのみ使用する。ハイブリダイゼーションのストリンジェンシーは、ハイブリダイゼーションの間および洗浄工程の間の多数の因子によって決定され、これには、温度、イオン強度、塩基組成、プローブ長およびホルムアミド濃度が含まれる。これらの因子は、例えば、Maniatisら,1982およびSambrookら,1989に概説されている。特定の環境下においては、三重らせん、四重らせん他のごときより高次のハイブリッドを形成させて、標的配列を検出する手段を提供することが望ましいこともあり得る。   The analytical nucleic acid and probe are incubated under conditions that promote stable hybridization of the expected targeting sequence in the analyte with the target sequence in the probe. The region of the probe used to bind to the analyte can be completely complementary to the targeting region of human chromosome 17q. Therefore, high stringency conditions are desirable to prevent false positives. However, high stringency conditions are used only when the probe is complementary to a chromosomal region that is unique in the genome. Hybridization stringency is determined by a number of factors during the hybridization and wash steps, including temperature, ionic strength, base composition, probe length, and formamide concentration. These factors are reviewed, for example, in Maniatis et al., 1982 and Sambrook et al., 1989. Under certain circumstances, it may be desirable to provide a means of detecting the target sequence by forming higher order hybrids such as triple helices, quadruple helices and others.

いずれにせよ、得られたハイブリッドの検出は、通常、標的プローブを用いることによってなされる。別法として、該プローブは非標識であってもよいが直接または間接的に標識したリガンドとの特異的な結合によって検出し得る。適当な標識、ならびにプローブおよびリガンドを標識する方法は当該分野で公知であって、これには、例えば、公知の方法(例えば、ニック・トランスレーション、ランダム・プライミングまたはキナージング(kinasing))、ビオチン、蛍光基、化学発光基(例えば、ジオキセタン、特に励起(triggered)ジオキセタン)、酵素、抗体他によって取り込み得る放射能標識が含まれる。この基本スキームの変形は当該分野で公知であって、外来物質から検出すべきハイブリッドの分離を容易ならしめる変形、および/または標識基からの信号を増幅する変形が含まれる。多くのこれらの変形は、例えば、MatthewsおよびKricka,1988;Landegrenら,1988;Mittlin,1989;米国特許第4,868,105号およびEPO公開第225,807号に概説されている。   In any case, detection of the resulting hybrid is usually done by using a target probe. Alternatively, the probe may be unlabeled but can be detected by specific binding with a directly or indirectly labeled ligand. Appropriate labels and methods for labeling probes and ligands are known in the art and include, for example, known methods (e.g., nick translation, random priming or kinasing), biotin, Radioactive labels that can be incorporated by fluorescent groups, chemiluminescent groups (eg, dioxetanes, especially triggered dioxetanes), enzymes, antibodies, etc. are included. Variations on this basic scheme are known in the art and include variations that facilitate separation of hybrids to be detected from foreign materials and / or variations that amplify signals from labeling groups. Many of these variations are reviewed, for example, in Matthews and Kricka, 1988; Landegren et al., 1988; Mittlin, 1989; US Pat. No. 4,868,105 and EPO Publication No. 225,807.

前記したごとく、非-PCR-ベースのスクリーニングアッセイも本発明で意図される。例示的な非-PCRに基づく方法を実施例11に供する。この方法は、核酸プローブ(または、ホスホン酸メチル骨格を正常なホスホジエステルと置換えたごときアナログ)を低レベルのDNA標的にハイブリダイズする。このプローブは、共有結合がハイブリダイゼーションの特異性を妨害しないように、当該プローブに共有結合した酵素を有し得る。この酵素-プローブ-コンジュゲート-標的核酸複合体は、ついで、遊離プローブ酵素コンジュゲートから単離し得、酵素検出用に基質を添加する。酵素活性は、感度にして10-10の増加が得られる発色または発光出力における変化で観察認される。オリゴデオキシヌクレオチド-アルカリホスファターゼ・コンジュゲートの調製およびハイブリダイゼーション・プローブとしてのそれらの使用に関する一例としては、Jablonskiら,1986を参照せよ。 As noted above, non-PCR-based screening assays are also contemplated by the present invention. An exemplary non-PCR based method is provided in Example 11. This method hybridizes a nucleic acid probe (or an analog such as a methyl phosphonate backbone replaced with a normal phosphodiester) to a low level DNA target. The probe can have an enzyme covalently attached to the probe so that the covalent bond does not interfere with the specificity of the hybridization. This enzyme-probe-conjugate-target nucleic acid complex can then be isolated from the free probe enzyme conjugate and a substrate is added for enzyme detection. Enzymatic activity is observed with a change in color development or luminescence output that results in a 10 3 -10 6 increase in sensitivity. For an example of the preparation of oligodeoxynucleotide-alkaline phosphatase conjugates and their use as hybridization probes, see Jablonski et al., 1986.

二段階標識増幅方法論は、当該分野で公知である。これらのアッセイは、(ジゴキシゲニン、ビオチン他のごとき)小リガンドが、BRCA1に特異的に結合し得る核酸プローブに結合するという原理で行う。例示的なプローブを本明細書の表9および10に供し、これにはさらに、配列番号:1のヌクレオチド位3631〜3930に対応する核酸プローブが含まれる。対立遺伝子特異的プローブもまた、この例の範囲内にあることが意図されており、例示的な対立遺伝子特異的プローブには、本願明細書の表12および13中に要約した素因突然変異を包含するプローブが含まれる。   Two-step label amplification methodologies are known in the art. These assays are performed on the principle that small ligands (such as digoxigenin, biotin, etc.) bind to nucleic acid probes that can specifically bind to BRCA1. Exemplary probes are provided in Tables 9 and 10 herein, and further include nucleic acid probes corresponding to nucleotide positions 3631 to 930 of SEQ ID NO: 1. Allele-specific probes are also intended to be within the scope of this example, and exemplary allele-specific probes include the predisposing mutations summarized in Tables 12 and 13 herein. Probes to be included.

一例において、核酸プローブに結合する小プローブは、抗体-酵素コンジュゲートによって特異的に認識される。この例の1つの具体例において、ジゴキシゲニンが核酸プローブに結合する。ハイブリダイゼーションは、化学発光基質になる抗体-アルカリホスファターゼ・コンジュゲートによって検出する。この具体例による核酸プローブを標識する方法については、Martinら,1990を参照せよ。第二の実施例においては、第一リガンドに特異的にコンプレックスを形成し得る第二リガンド-酵素コンジュゲートによって小リガンドを認識する。この例のよく知られた具体例は、ビオチン-アビジン型の相互作用である。核酸プローブを標識する方法およびビオチン-アビジンに基づくアッセイにおけるそれらの使用については、Rigbyら,1977およびNguyenら,1992を参照せよ。   In one example, a small probe that binds to a nucleic acid probe is specifically recognized by an antibody-enzyme conjugate. In one embodiment of this example, digoxigenin binds to the nucleic acid probe. Hybridization is detected by an antibody-alkaline phosphatase conjugate that becomes a chemiluminescent substrate. See Martin et al., 1990 for a method for labeling nucleic acid probes according to this embodiment. In the second embodiment, small ligands are recognized by a second ligand-enzyme conjugate that can specifically form a complex with the first ligand. A well-known example of this example is the biotin-avidin type interaction. See Rigby et al., 1977 and Nguyen et al., 1992 for methods of labeling nucleic acid probes and their use in biotin-avidin based assays.

本発明の核酸プローブアッセイがBRCA1を検出し得る核酸プローブのカクテルを用いるであろうことも、本発明の範囲内で意図されている。かくして、細胞試料中のBRCA1の存在を検出する一例において、BRCA1に相補的な2以上のプローブを用い、特に、多くの異なるプローブを、別法として、2、3または5この異なる核酸プローブ配列を用いる。もう1つの例において、患者におけるBRCA1遺伝子配列中の突然変異の存在を検出するためには、BRCA1に相補的な2以上のプローブを用い、ここに、カクテルは、BRCA1中に変化を有する患者の集団において同定された対立遺伝子-特異的突然変異に結合し得るプローブを含む。この具体例においては、いずれの数のプローブを用いることができるが、好ましくは、個人が乳癌になる素因として同定された主遺伝子突然変異に対応するプローブを含むであろう。本発明の範囲内に意図される幾つかの候補プローブには、表12および13に同定した対立遺伝子-特異的突然変異を含むプローブ、ならびに、配列番号:1の5'および3'の両方の突然変異サイトに対応するBRCA1領域を有するプローブが含まれる。   It is also contemplated within the scope of the present invention that the nucleic acid probe assay of the present invention will use a cocktail of nucleic acid probes capable of detecting BRCA1. Thus, in one example of detecting the presence of BRCA1 in a cell sample, two or more probes complementary to BRCA1 are used, especially many different probes, alternatively two, three or five different nucleic acid probe sequences. Use. In another example, in order to detect the presence of a mutation in the BRCA1 gene sequence in a patient, two or more probes complementary to BRCA1 are used, where the cocktail is used in patients with changes in BRCA1. Includes probes capable of binding to allele-specific mutations identified in the population. In this embodiment, any number of probes can be used, but preferably will include probes corresponding to major gene mutations that have been identified as predisposing individuals to breast cancer. Some candidate probes contemplated within the scope of the present invention include probes containing allele-specific mutations identified in Tables 12 and 13, and both 5 'and 3' of SEQ ID NO: 1. Probes having a BRCA1 region corresponding to the mutation site are included.

使用方法:ペプチド診断および診断キット
病斑の新生生物状態は、野生型BCA1ポリペプチドの変化に基づいても検出し得る。かかる変化は、慣用的な技術による配列分析によって決定し得る。より好ましくは、抗体(ポリクローナルまたはモノクローナル抗体)を用いて、BRCA1ペプチド中の相違、または不存在を検出する。該抗体は、「抗体」なる標題下で前に論じ、実施例12および13にさらに示すごとく調製し得る。抗体を生起させて精製する他の技術は当該分野でよく知られており、いずれのかかる技術を用いても、本発明に請求する調製物をなし得る。本発明の好ましい具体例において、抗体は、溶液からBRCA1蛋白質を免疫沈降し、かつ、ポリアクリルアミドゲルのウェスタンまたはイムノブロット上でBRCA1蛋白質と反応するであろう。もう1つの好ましい具体例において、抗体は、免疫細胞化学的技術を用いて、パラフィンまたは凍結組織切片中のBRCA1蛋白質を検出するであろう。
Methods of Use: Peptide Diagnostics and Diagnostic Kits Neoplastic status of lesions can also be detected based on changes in wild type BCA1 polypeptide. Such changes can be determined by sequence analysis by conventional techniques. More preferably, antibodies (polyclonal or monoclonal antibodies) are used to detect differences or absence in the BRCA1 peptide. The antibodies may be prepared as discussed previously under the heading “antibodies” and as further illustrated in Examples 12 and 13. Other techniques for raising and purifying antibodies are well known in the art, and any such technique can be used to make the preparation claimed in the present invention. In a preferred embodiment of the invention, the antibody will immunoprecipitate the BRCA1 protein from solution and react with the BRCA1 protein on a Western or immunoblot of a polyacrylamide gel. In another preferred embodiment, the antibody will detect BRCA1 protein in paraffin or frozen tissue sections using immunocytochemical techniques.

BRCA1またはその突然変異を検出する方法に関する好ましい具体例には、モノクローナル抗体および/またはポリクローナル抗体を用いたサンドウィッチアッセイを含む、酵素結合免疫ソルベントアッセイ(ELISA)、ラジオイムノアッセイ(RIA)、イムノラジオ分析アッセイ(IRMA)およびイムノ酵素アッセイ(IEMA)が含まれる。例示的なサンドウィッチアッセイは、(出典明示して本明細書の一部とみなし、実施例14で例示する)米国特許第4,376,110号および第4,486,530号においてDavidらによって記載されている。   Preferred embodiments relating to methods for detecting BRCA1 or mutations thereof include enzyme-linked immunosorbent assay (ELISA), radioimmunoassay (RIA), immunoradioanalytical assay, including sandwich assays using monoclonal and / or polyclonal antibodies. (IRMA) and immunoenzyme assay (IEMA). An exemplary sandwich assay is described by David et al. In US Pat. Nos. 4,376,110 and 4,486,530 (which are hereby expressly incorporated by reference and illustrated in Example 14).

使用方法:薬剤スクリーニング
本発明は、いずれかの種々の薬剤スクリーニング技術においてBRCA1ポリペプチドまたはその結合フラグメントを使用することによって、化合物をスクリーニングするのに特に有用である。
Methods of Use: Drug Screening The present invention is particularly useful for screening compounds by using BRCA1 polypeptides or binding fragments thereof in any of a variety of drug screening techniques.

かかる試験において使用するBRCA1ポリペプチドまたはフラグメントは、溶液中で遊離させ得、固体支持体に固定化し得、あるいは細胞表面上に支持し得る。薬剤スクリーニングの1つの方法は、好ましくは競合結合アッセイにおいて、ポリペプチドまたはフラグメントを発現する組換えポリヌクレオチドで安定して形質転換した真核生物または原核宿主生物細胞を使用する。生存能力を有するか、または固定形態のいずれかのかかる細胞は、標準結合アッセイに用いることができる。例えば、BRCA1ポリペプチドまたはフラグメントと試験すべき剤との間の複合体の形成について測定し得、または、BRCA1ポリペプチドまたはフラグメントと既知リガンドとの間の複合体の形成が試験すべき剤によって妨害される程度を検査し得る。   The BRCA1 polypeptide or fragment used in such tests can be released in solution, immobilized on a solid support, or supported on the cell surface. One method of drug screening uses eukaryotic or prokaryotic host organism cells stably transformed with a recombinant polynucleotide expressing the polypeptide or fragment, preferably in a competitive binding assay. Such cells that are viable or in fixed form can be used in standard binding assays. For example, the formation of a complex between a BRCA1 polypeptide or fragment and an agent to be tested can be measured, or the formation of a complex between a BRCA1 polypeptide or fragment and a known ligand can be interfered with by the agent to be tested. The degree to which it is done can be inspected.

かくして、本発明は、薬剤とBRCA1ポリペプチドまたはフラグメントとを接触させ、当該分野でよく知られている方法によって、(i)該剤とBRCA1ポリペプチドまたはフラグメントとの間の複合体の存在につき、または(ii)BRCA1ポリペプチドまたはそのフラグメントとリガンドとの間の複合体の存在につきアッセイすることを特徴とする薬剤のスクリーニング方法を提供する。かかる競合結合アッセイにおいて、BRCA1ポリペプチドまたはフラグメントは、典型的に標識されている。遊離BRCA1ポリペプチドまたはフラグメントは、蛋白質:蛋白質複合体に存在するものから単離し、遊離(すなわち、非コンプレックス形成)標識の量は、各々、BRCA1に対して試験すべき剤の結合の測定値、またはBRCA1:リガンド結合で妨害された値である。   Thus, the present invention provides for contacting a drug with a BRCA1 polypeptide or fragment and, by methods well known in the art, (i) for the presence of a complex between the agent and the BRCA1 polypeptide or fragment, Or (ii) a method of screening for a drug, characterized by assaying for the presence of a complex between a BRCA1 polypeptide or fragment thereof and a ligand. In such competitive binding assays, the BRCA1 polypeptide or fragment is typically labeled. Free BRCA1 polypeptide or fragment is isolated from that present in the protein: protein complex, and the amount of free (ie uncomplexed) label is a measure of the binding of the agent to be tested to BRCA1, respectively. Alternatively, BRCA1: a value that is disturbed by ligand binding.

薬剤スクリーニングのもう1つの技術は、BRCA1ポリペプチドに対して適当な結合アフィニティーを有する化合物の高処理量スクリーニングを提供し、これは、Geysen,1984年9月13日に公開されたPCT国際公開WO84/03564号に詳記されている。簡単に説明すると、多数の異なる小ペプチド試験化合物を、プラスチックピンまたはある種の他の表面のごとき固体支持体上で合成する。ペプチド試験化合物をBRCA1ポリペプチドと反応させ、洗浄する。結合したBRCA1ポリペプチドを、ついで、当該分野でよく知られている方法によって検出する。   Another technique for drug screening provides high throughput screening of compounds with appropriate binding affinity for BRCA1 polypeptide, which is published in Geysen, 13 September 1984, PCT International Publication WO 84 It is described in detail in / 03564. Briefly, a number of different small peptide test compounds are synthesized on a solid support, such as a plastic pin or some other surface. Peptide test compounds are reacted with BRCA1 polypeptide and washed. Bound BRCA1 polypeptide is then detected by methods well known in the art.

精製したBRCA1は、前記した薬剤スクリーニング技術において使用するために、プレート上に直接コートし得る。しかしながら、該ポリペプチドに対する非-中和抗体を用いて抗体を捕捉し、該固相上にBRCA1ポリペプチドを固定化し得る。   Purified BRCA1 can be coated directly onto the plate for use in the drug screening techniques described above. However, a non-neutralizing antibody against the polypeptide can be used to capture the antibody and immobilize the BRCA1 polypeptide on the solid phase.

また、本発明は、競合薬剤スクリーニングアッセイの使用も意図しており、その中では、BRCA1ポリペプチドに特異的に結合し得る中和抗体を、BRCAポリペプチドまたはそのフラグメントに対する結合について、試験化合物と競合させる。このようにして、抗体を用いて、1または2以上のBRCA1ポリペプチドの抗原決定基を有するいずれのペプチドの存在も検出し得る。   The present invention also contemplates the use of competitive drug screening assays, in which neutralizing antibodies capable of specifically binding to BRCA1 polypeptide are combined with test compounds for binding to BRCA polypeptide or fragments thereof. Make it conflict. In this way, antibodies can be used to detect the presence of any peptide having an antigenic determinant of one or more BRCA1 polypeptides.

薬剤スクリーニングのさらなる技術には、非機能性BRCA1遺伝子を有する(前記したごとき)宿主真核生物細胞系統または細胞の使用が含まれる。これらの宿主細胞系統または細胞は、BRCA1ポリペプチドレベルで欠失している。宿主細胞系統または細胞は、薬剤化合物存在下で増殖する。宿主細胞の増殖速度を測定して、該化合物がBRCA1欠失細胞の増殖を調節し得るか否かを判断する。   Additional techniques for drug screening include the use of host eukaryotic cell lines or cells that have a non-functional BRCA1 gene (as described above). These host cell lines or cells are deleted at the BRCA1 polypeptide level. The host cell line or cell grows in the presence of the drug compound. The growth rate of the host cell is measured to determine whether the compound can modulate the growth of BRCA1-deficient cells.

使用方法:合理的薬剤デザイン
合理的薬剤デザインの目標は、例えば、より活性な、または安定な形態のポリペプチド、またはイン・ビボ(in vivo)でポリペプチドの機能を向上する、または妨害する薬剤を製造するために、目的の生物学的に活性なポリペプチド、または、当該薬剤が相互作用する小分子(例えば、アゴニスト、アンタゴニスト、インヒビター)の構造アナログを設計することである(例えば、Hodgson,1991参照)。1つのアプローチにおいて、最初に目的の蛋白質(例えば、BRCA1ポリペプチド)または、例えば、BRCA1-受容体もしくはリガンドコンプレックスの三次元構造を、X-線結晶学、コンピュータ・モデリング、または最も典型的には、組合せたアプローチによって決定する。あまり頻繁ではないが、相同蛋白質の構造に基づくモデリングによって、ポリペプチドの構造に関する有用な情報を得ることができる。合理的薬剤デザインの一例は、HIVプロテアーゼ・インヒビターの開発である(Ericksonら,1990)。加えて、ペプチド(例えば、BRCA1ポリペプチド)をアラニン・スキャンによって分析する(Wells,1991)。この技術においては、アミノ酸残基をAlaに置換し、ペプチド活性に対するその影響を測定する。ペプチドの各アミノ酸残基をこのようにして分析して、ペプチドの重要な領域を決定する。
Methods of Use: Rational Drug Design The goal of rational drug design is, for example, a more active or stable form of a polypeptide, or an agent that improves or interferes with the function of the polypeptide in vivo. To design a structural analog of a biologically active polypeptide of interest, or a small molecule (eg, agonist, antagonist, inhibitor) with which the drug interacts (eg, Hodgson, 1991). In one approach, the protein of interest (eg, BRCA1 polypeptide) or, for example, the three-dimensional structure of a BRCA1-receptor or ligand complex is first analyzed by X-ray crystallography, computer modeling, or most typically Determined by a combined approach. Less frequently, modeling based on the structure of homologous proteins can provide useful information about the structure of the polypeptide. An example of a rational drug design is the development of HIV protease inhibitors (Erickson et al., 1990). In addition, peptides (eg, BRCA1 polypeptide) are analyzed by alanine scanning (Wells, 1991). In this technique, an amino acid residue is substituted with Ala and its effect on peptide activity is measured. Each amino acid residue of the peptide is analyzed in this way to determine key regions of the peptide.

また、機能アッセイによって選抜した標的-特異的抗体を単離し、ついで、その結晶構造を解明することもできる。原則として、このアプローチにより、続く薬剤デザインに基づき得るファーマコア(pharmacore)が得られる。機能的な薬理学的に活性な抗体に対する抗-イディオタイプ抗体(抗-ids)を生起することによって、蛋白質結晶学を全く回避することができる。鏡像の鏡像のごとく、抗-idsの結合サイトは、元の受容体のアナログであると予想される。ついで、抗-idsを用いて、ペプチドの化学的または生物学的に作成したバンクのバンクからペプチドを同定し、単離し得る。ついで、選抜したペプチドは、ファーマコアとして作用するであろう。   It is also possible to isolate a target-specific antibody selected by a functional assay and then elucidate its crystal structure. In principle, this approach provides a pharmacore that can be based on subsequent drug design. By generating anti-idiotype antibodies (anti-ids) against functional pharmacologically active antibodies, protein crystallography can be avoided altogether. Like the mirror image, the anti-ids binding site is expected to be an analog of the original receptor. The anti-ids can then be used to identify and isolate peptides from banks of chemically or biologically generated banks of peptides. The selected peptide will then act as a pharmacore.

かくして、例えば、改善されたBRCA1ポリペプチド活性または安定性を有するか、または、例えば、BRCA1ポリペプチド活性のインヒビター、アゴニスト、アンタゴニスト他として作用する薬剤をデザインすることができる。クローン化BRCA1配列の有効性によって、十分な量のBRCA1ポリペプチドを利用して、x線結晶学のごとき分析実験を行い得る。加えて、本明細書に供するBRCA1蛋白質配列の知見は、x-線結晶学の代わりに、またはそれに加えて、コンピュータモデリング技術を利用するものに導くであろう。   Thus, agents can be designed that have, for example, improved BRCA1 polypeptide activity or stability, or that act, for example, as inhibitors, agonists, antagonists, etc. of BRCA1 polypeptide activity. Depending on the effectiveness of the cloned BRCA1 sequence, a sufficient amount of BRCA1 polypeptide can be utilized to perform analytical experiments such as x-ray crystallography. In addition, the knowledge of the BRCA1 protein sequence provided herein will lead to using computer modeling techniques instead of or in addition to x-ray crystallography.

使用方法:遺伝子療法
本発明により、野生型BRCA1機能を突然変異BRCA対立遺伝子を運ぶ細胞に供する方法が提供される。かかる機能の提供は、受容細胞の新生生物増殖を抑制するにちがいない。野生型BRCA1遺伝子またはその遺伝子の一部分は、遺伝子が染色体外に残るようベクターで細胞に導入し得る。かかる状態においては、遺伝子は、染色体外位置から細胞によって発現されるであろう。遺伝子フラグメントを突然変異BRCA1対立遺伝子を運ぶ細胞に導入し発現させた場合、該遺伝子フラグメントは、細胞の非-新生生物増殖に要するBRCA1蛋白質の一部分をコードしているにちがいない。
Method of Use: Gene Therapy The present invention provides a method of subjecting wild type BRCA1 function to cells carrying a mutant BRCA allele. Providing such a function must inhibit neoplastic growth of recipient cells. The wild type BRCA1 gene or a portion of that gene can be introduced into the cell with a vector such that the gene remains extrachromosomal. In such a state, the gene will be expressed by the cell from the extrachromosomal location. When a gene fragment is introduced and expressed in a cell carrying a mutant BRCA1 allele, the gene fragment must encode a portion of the BRCA1 protein required for non-neoplastic growth of the cell.

より好ましくは、野生型BRCA1遺伝子またはその一部分を、細胞に存在する内因性突然変異BRCA1遺伝子とそれが組換わるように、突然変異細胞に導入する状況である。かかる組換えには、二重組換え事象が必要であり、これはBRCA1遺伝子突然変異の訂正を生じる。組換えおよび染色体外維持の両方の遺伝子を導入するベクターは当該分野で公知であり、いずれかの適当なベクターを用い得る。エレクトロポレーション、リン酸カルシウム共沈およびウイルス形質導入のごとき細胞にDNAを導入する方法は当該分野で公知であり、方法の選択は日常従事者の能力の範囲内にある。野生型BRCA1遺伝子で形質転換した細胞をモデル系として使用し、癌の緩解およびかかる緩解を促進する薬剤処理を研究し得る。   More preferably, the situation is such that the wild type BRCA1 gene or a part thereof is introduced into the mutant cell so that it recombines with the endogenous mutant BRCA1 gene present in the cell. Such recombination requires a double recombination event, which results in correction of the BRCA1 gene mutation. Vectors for introducing both recombinant and extrachromosomal maintenance genes are known in the art and any suitable vector may be used. Methods for introducing DNA into cells, such as electroporation, calcium phosphate coprecipitation, and viral transduction, are known in the art, and the choice of method is within the capabilities of the daily worker. Cells transformed with the wild type BRCA1 gene can be used as a model system to study cancer remission and drug treatments that promote such remission.

一般的に前に論じたごとく、BRCA1遺伝子またはフラグメントは、適用し得る場合には、癌細胞中のかかる遺伝子の発現産物の量を増加させるために、遺伝子療法に用いることができる。かかる遺伝子療法は、癌性および前-癌性細胞の両方における使用に特に適しており、この療法においては、正常細胞に比して、BRCA1ポリペプチドのレベルがなくなるかまたは減じられる。また、「正常」レベルで突然変異遺伝子が発現しているが、該遺伝子産物は完全に機能的でない腫瘍細胞中でさえ、所与のBRCA1遺伝子の発現レベルを増加させるにも有用となり得る。   As generally discussed previously, the BRCA1 gene or fragment, if applicable, can be used in gene therapy to increase the amount of expression product of such gene in cancer cells. Such gene therapy is particularly suitable for use in both cancerous and pre-cancerous cells, in which the level of BRCA1 polypeptide is eliminated or reduced compared to normal cells. Also, although the mutated gene is expressed at a “normal” level, the gene product can also be useful in increasing the expression level of a given BRCA1 gene, even in tumor cells that are not fully functional.

遺伝子療法は、(例えば、Friedman,1991によって記載されたごとき)一般的に許容された方法によって行われるであろう。患者の腫瘍からの細胞は、まず、前記した診断方法によって分析して、腫瘍細胞におけるBRCA1ポリペプチドの産生を確認するであろう。発現制御因子につなげたBRCA1遺伝子のコピーを含み、腫瘍細胞の内側で複製能力を有するウイルスまたはプラスミドベクター(以下のさらなる詳細参照)を調製する。米国特許第5,252,479号およびPCT国際公開WO93/07282号に開示のごとき、適当なベクターは公知である。ついで、腫瘍部位に局所的にか、または(他のサイトに転移し得るいずれかの腫瘍細胞に達するために)全身的にかのいずれかでベクターを患者に注射する。トランスフェクト遺伝子が各標的化腫瘍細胞のゲノムに恒久的に取り込まれた場合、該処理を定期的に反復し得る。   Gene therapy will be performed by generally accepted methods (eg, as described by Friedman, 1991). Cells from the patient's tumor will first be analyzed by the diagnostic methods described above to confirm the production of BRCA1 polypeptide in the tumor cells. A viral or plasmid vector (see further details below) is prepared that contains a copy of the BRCA1 gene linked to an expression regulator and has the replication ability inside the tumor cell. Suitable vectors are known, such as those disclosed in US Pat. No. 5,252,479 and PCT International Publication No. WO 93/07282. The vector is then injected into the patient either locally at the tumor site or systemically (to reach any tumor cell that can metastasize to other sites). If the transfected gene is permanently incorporated into the genome of each targeted tumor cell, the treatment can be repeated periodically.

当該分野で公知である遺伝子移入系は、本発明の遺伝子療法の実施に有用となり得る。これらには、ウイルスおよび非ウイルス移入法が含まれる。SV40(Madzakら,1992)、アデノウイルス(Berkner,1992;Berknerら,1988;GorzigliaおよびKapikian,1992;Quantinら,1992;Rosenfeldら,1992;Wilkinsonら,1992;Stratford-Perricaudetら,1990)、ワクシニアウイルス(Moss,1992)、アデノ関連ウイルス(Muzyczka,1992;Ohiら,1992)を含むパポーバウイルス科、HSVおよびEBV(Margolskee,1992;Johnsonら,1992;Finkら,1992;BreakfieldおよびGeller,1987;Freeseら,1990)を含むヘルペスウイルス科、ならびにニワトリ(BrandyopadhyayおよびTemin,1984;Petropoulosら,1992)、ネズミ(Miller,1992;Milerら,1985;Sorgeら,1984;MannおよびBaltimore,1985;Millerら,1988)およびヒト起源(Shimadaら,1991;Helsethら,1990;Pageら,1990;BuchschacherおよびPanganiban,1992)のレトロウイルスを包含する、多数のウイルスが遺伝子移入ベクターとして用いられている。大部分のヒト遺伝子療法プロトコールは、不活化ネズミレトロウイルスに基づいている。   Gene transfer systems known in the art can be useful in the practice of gene therapy of the present invention. These include viral and non-viral transfer methods. SV40 (Madzak et al., 1992), adenovirus (Berkner, 1992; Berkner et al., 1988; Gorziglia and Kapikian, 1992; Quantin et al., 1992; Rosenfeld et al., 1992; Wilkinson et al., 1992; Stratford-Perricaudet et al., 1990), vaccinia Virus (Moss, 1992), papoviridae including adeno-associated virus (Muzyczka, 1992; Ohi et al., 1992), HSV and EBV (Margorskee, 1992; Johson et al., 1992; Fink et al., 1992; Breakfield and Geller, 1987; Freese 1990), and chickens (Brandyopadhyay and Temin, 1984; Petropoulos et al., 1992), mice (Miller, 1992; Miller et al., 1985; Sorge et al., 1984; Mann and Baltimore, 1985; Miller et al., 1988) and numerous viruses, including retroviruses of human origin (Shimada et al., 1991; Helseth et al., 1990; Page et al., 1990; Buchschacher and Panganiba, 1992) Used as a child transfer vector. Most human gene therapy protocols are based on inactivated murine retroviruses.

当該分野で公知の非ウイルス遺伝子移入法には、リン酸カルシウム共沈(Grahamおよびvan der Eb,1973;Pellicerら,1980)のごとき化学的技術;例えば、マイクロインジェクション(Andersonら,1980;Godonら,1980;Brinsterら,1981;ConstantiniおよびLacy,1981)のごとき機械的方法;リポソームを介した膜融合-介在移入(Felgnerら,1987;WangおよびHaung,1989;Kanedaら,1989;Stewartら,1992;Nabelら,1990;Limら,1992);ならびに直接DNA取り込みおよび受容体-媒介DNA移入(Wolffら,1990;Wuら,1991;Zenkeら,1990;Wuら,1989b;Wolffら,1991;Wagnerら,1990;Wagnerら,1991;Cottenら,1990;Curielら,1991a;Curielら,1991b)が含まれる。ウイルス-媒介遺伝子移入は、リポソームデリバリーを用いる直接イン・ビボ(in vivo)遺伝子移入と組み合わせることにより、周囲の非分割細胞にではなく、腫瘍細胞にウイルスベクターを指向することができる。別法として、レトロウイルスベクター産生細胞系統を腫瘍に注射し得る(Culverら,1992)。ついで、産生細胞の注射は、ベクター粒子の連続供給源を提供する。この技術は、手術不可能な脳腫瘍を有するヒトにおいて使用することが認可されている。   Non-viral gene transfer methods known in the art include chemical techniques such as calcium phosphate coprecipitation (Graham and van der Eb, 1973; Pellicer et al., 1980); for example, microinjection (Anderson et al., 1980; Godon et al., 1980). Mechanical methods such as Brinster et al., 1981; Constantanti and Lacy, 1981); Membrane fusion-mediated transfer via liposomes (Felgner et al., 1987; Wang and Haung, 1989; Kaneda et al., 1989; Stewart et al., 1992; Nabel; 1990; Lim et al., 1992); and direct DNA uptake and receptor-mediated DNA transfer (Wolff et al., 1990; Wu et al., 1991; Zenke et al., 1990; Wu et al., 1989b; Wolff et al., 1991; Wagner et al., 1990; Wagner et al., 1991; Cotten et al., 1990; Curiel et al., 1991a; Curiel et al., 1991b). Virus-mediated gene transfer can be combined with direct in vivo gene transfer using liposome delivery to direct viral vectors to tumor cells rather than surrounding non-dividing cells. Alternatively, retroviral vector-producing cell lines can be injected into tumors (Culver et al., 1992). The injection of production cells then provides a continuous source of vector particles. This technique is approved for use in humans with inoperable brain tumors.

生物および物理学的遺伝子移入法を組み合わせたアプローチにおいては、いずれかのサイズのプラスミドDNAを、アデノウイルス・ヘキソン蛋白質に特異的なポリリジン-コンジュゲート抗体と組み合わせ、得られたコンプレックスをアデノウイルスベクターに結合する。ついで、三分子コンプレックスを用いて細胞を感染する。アデノウイルスベクターは、カップル化DNAが損傷される前に、エンドソームの効率的な結合、内在化および消化を許容する。   In an approach that combines biological and physical gene transfer methods, plasmid DNA of either size is combined with a polylysine-conjugated antibody specific for adenovirus hexon protein and the resulting complex is converted to an adenovirus vector. Join. The trimolecular complex is then used to infect cells. Adenoviral vectors allow efficient binding, internalization and digestion of endosomes before the coupled DNA is damaged.

リポソーム/DNAコンプレックスは、直接イン・ビボ遺伝子移入を媒介し得ることが示された。標準的なリポソーム調製物において遺伝子移入プロセスは非特異的であるが、例えば、直接イン・サイチュ(in situ)投与後に、局在化イン・ビボ(in vivo)取り込みおよび発現が腫瘍沈着において報告されている(Nabel,1992)。DNAを、乳房組織および卵巣組織(例えば、乳房または卵巣の上皮細胞)にDNAを直接標的化する遺伝子移入技術が好ましい。受容体-媒介遺伝子移入は、例えば、ポリリジンを介して、蛋白質リガンドにDNA(通常、共有的に閉環したスーパーコイル化プラスミドの形態)をコンジュゲートすることによってなす。リガンドは、標的細胞/組織型の細胞表面上の対応するリガンド受容体の存在に基づいて選択する。1つの適当な受容体/リガンド対には、エストロゲン受容体およびそのリガンド、エストロゲン(およびエストロゲン・アナログ)が含まれ得る。これらのリガンド-DNAコンジュゲートは、所望により、血液に直接注射することができ、受容体結合およびDNA-蛋白質コンプレックスの内在化が起こる標的組織に指向し得る。DNAの細胞内破壊の問題を克服するため、アデノウイルスとの同時感染を関与させて、エンドソーム機能を崩壊し得る。   It has been shown that liposome / DNA complexes can mediate direct in vivo gene transfer. Although the gene transfer process is nonspecific in standard liposome preparations, for example, localized in vivo uptake and expression has been reported in tumor deposition after direct in situ administration. (Nabel, 1992). Gene transfer techniques that target DNA directly to breast and ovarian tissues (eg, breast or ovarian epithelial cells) are preferred. Receptor-mediated gene transfer is accomplished, for example, by conjugating DNA (usually in the form of a covalently closed supercoiled plasmid) to a protein ligand via polylysine. The ligand is selected based on the presence of the corresponding ligand receptor on the cell surface of the target cell / tissue type. One suitable receptor / ligand pair can include the estrogen receptor and its ligand, estrogen (and estrogen analogs). These ligand-DNA conjugates can be injected directly into the blood, if desired, and can be directed to target tissues where receptor binding and internalization of the DNA-protein complex occurs. In order to overcome the problem of intracellular destruction of DNA, co-infection with adenovirus can be involved to disrupt endosomal function.

該療法には、単独または結合して行い得る二工程が含まれる。第一工程においては、BRCA1感受性対立遺伝子を運ぶ思春期前女性を、彼女達の乳管上皮前駆細胞の幾つかまたは全部が機能正常BRCA1対立遺伝子の少なくとも1つのさらなるコピーを受けるように、遺伝子デリバリービヒクルで処理する。この工程においては、処理した個人は、正常な対立遺伝子が存在することによって感受性対立遺伝子の作用を押しとどめる程度まで低下した乳癌の危険性を有する。予防的な療法の第二工程においては、予め処理した若年女性、特に、提起した遺伝子療法治療を受けた女性をホルモン療法に付して、全期間妊娠の乳房に対する影響を最小限とする。   The therapy includes two steps that can be performed alone or in combination. In the first step, prepubertal women carrying a BRCA1 sensitive allele are treated with gene delivery so that some or all of their mammary epithelial progenitor cells receive at least one additional copy of a functional normal BRCA1 allele. Process with vehicle. In this process, the treated individual has a risk of breast cancer that is reduced to the extent that the presence of the normal allele precludes the action of the susceptible allele. In the second step of prophylactic therapy, pre-treated young women, especially those who have received the proposed gene therapy treatment, are subjected to hormone therapy to minimize the impact on the breasts of the full-term pregnancy.

使用方法:ペプチド療法
BRCA1活性を有するペプチドを、突然変異または欠失したBRCA1対立遺伝子を運ぶ細胞に提供し得る。BRCA1蛋白質の配列を開示する(配列番号:2)。蛋白質は、例えば、公知の発現ベクターを用いて、細菌中でcDNA配列を発現させることによって産生し得る。別法として、BRCA1ポリペプチドは、BRCA1産生-哺乳動物細胞から抽出することもできる。加えて、合成化学の技術を用いて、BRCA1蛋白質を合成することもできる。いずれのかかる技術も、BRCA1蛋白質を含む本発明の調製物を提供し得る。該調製物は、実質的に他のヒト蛋白質を含んでいない。このことは、微生物またはイン・ビトロ(in vitro)の合成によって最も容易になされる。
Methods of Use: Peptide Therapy Peptides having BRCA1 activity can be provided to cells carrying a mutated or deleted BRCA1 allele. The sequence of the BRCA1 protein is disclosed (SEQ ID NO: 2). The protein can be produced, for example, by expressing a cDNA sequence in bacteria using a known expression vector. Alternatively, BRCA1 polypeptides can be extracted from BRCA1 production-mammalian cells. In addition, the BRCA1 protein can be synthesized using synthetic chemistry techniques. Any such technique can provide a preparation of the invention comprising a BRCA1 protein. The preparation is substantially free of other human proteins. This is most easily done by the synthesis of microorganisms or in vitro.

活性BRCA1分子は、マイクロインジェクションによってか、または例えば、リポソームを使用することによって細胞に導入し得る。別法として、能動的または拡散によって、ある種の活性分子が細胞によって取り込まれ得る。BRCA1遺伝子産物の細胞外適用は、腫瘍増殖に十分に影響し得る。BRCA1活性を有する分子の適用は、新生生物状態の部分的逆転に通じるにちがいばい。BRCA1活性を有する他の分子(例えば、ペプチド、薬剤または有機化合物)を用いてもかかる逆転に影響し得る。実質的に同様の機能を有する修飾ペプチドも、ペプチド療法に用いられる。   Active BRCA1 molecules can be introduced into cells by microinjection or by using, for example, liposomes. Alternatively, certain active molecules can be taken up by cells, either actively or by diffusion. Extracellular application of the BRCA1 gene product can fully affect tumor growth. Application of molecules with BRCA1 activity must lead to partial reversal of the neoplastic state. Other molecules with BRCA1 activity (eg, peptides, drugs or organic compounds) can also be used to affect such reversal. Modified peptides having substantially similar functions are also used in peptide therapy.

使用方法:形質転換宿主
同様にして、突然変異BRCA1対立遺伝子を運ぶ細胞および動物をモデル系として用いて、治療剤としての潜在性を有する物質について実験および試験し得る。細胞は、典型的には、培養上皮細胞である。これらは、体細胞または生殖系列のいずれかのBRCA1突然変異を有する個人から単離し得る。別法として、該細胞系統を設計して、前記したごとく、BRCA1対立遺伝子中に突然変異を運ばせ得る。試験物質を該細胞に適用した後、該細胞の新生生物的に形質転換した表現型を測定する。アンカレッジ・インディペンデント増殖、ヌードマウスにおける腫瘍形成性、細胞の非侵入性、および増殖因子依存性を包含する、新生生物的に形質転換した細胞のいずれの特色も評価し得る。これらの各特色のアッセイは、当該分野で知られている。
Methods of Use: Transformed Hosts Similarly, cells and animals carrying mutant BRCA1 alleles can be used as model systems to test and test for substances with potential as therapeutic agents. The cell is typically a cultured epithelial cell. They can be isolated from individuals with either somatic or germline BRCA1 mutations. Alternatively, the cell line can be designed to carry mutations in the BRCA1 allele as described above. After the test substance is applied to the cells, the neoplastically transformed phenotype of the cells is determined. Any characteristics of neoplastically transformed cells can be assessed, including anchorage independent growth, tumorigenicity in nude mice, cell non-invasiveness, and growth factor dependence. Each of these feature assays is known in the art.

治療剤を試験する動物は、全体動物の突然変異誘発後または生殖系統細胞または接合体の処理後に選択し得る。かかる処理には、通常は、第二動物種からの突然変異BRCA1対立遺伝子の挿入、ならびに、破壊した相同遺伝子の挿入が含まれる。別法として、動物の内在性BRCA1遺伝子(群)は、挿入または欠失突然変異または従来技術を用いた他の遺伝的変化によって破壊し得る(Capecchi,1989;ValanciusおよびSmithies,1991;Hastyら,1991;Shinkaiら,1992;Mombaertsら,1992;Philpottら,1992;Snouwaertら,1992;Donehowerら,1992)。試験物質を動物に投与した後に、腫瘍の増殖を評価しなければならない。試験物質が腫瘍の増殖を防ぐか、または抑制した場合には、該試験物質は、本明細書にて同定した癌の治療の候補治療剤である。これらの動物モデルは、潜在的な治療製品に極めて重要な試験ビヒクルを提供する。   Animals to be tested for therapeutic agents can be selected after mutagenesis of whole animals or after treatment of germline cells or zygotes. Such treatment usually includes the insertion of a mutant BRCA1 allele from a second animal species, as well as the insertion of a disrupted homologous gene. Alternatively, the animal's endogenous BRCA1 gene (s) can be disrupted by insertion or deletion mutations or other genetic changes using conventional techniques (Capecchi, 1989; Valancius and Smithies, 1991; Hasty et al., 1991; Shinkai et al., 1992; Mombaerts et al., 1992; Philpott et al., 1992; Snouwaert et al., 1992; Donehower et al., 1992). Tumor growth must be assessed after administration of the test substance to the animal. If the test substance prevents or suppresses tumor growth, the test substance is a candidate therapeutic for the treatment of cancer identified herein. These animal models provide critical test vehicles for potential therapeutic products.

本発明を以下の実施例に参照することにより記載するが、これは説明目的で供するものであって、いかなる場合においても本発明を限定するものではない。当該分野でよく知られている標準技術、または以下に特別に記載する技術を利用した。   The invention is described by reference to the following examples, which are provided for illustrative purposes and are not intended to limit the invention in any way. Standard techniques well known in the art or the techniques specifically described below were utilized.

実施例1
17q−連鎖乳癌感受性遺伝子座を有するような確認家系および実験家系
広範な癌に罹り易い家系は、多くのケースの乳癌を持つ広範な家系および実験に利用できる血縁者の大きな一組を供する、はっきりとした集団から確認した。これらの大家系に存在する非常に多数の減数分裂は、BRCA1遺伝子座が分離しつつあるの否かを検出する能力を供し、調査すべき小領域内に起こる情報的組換え体についての機会を減少させた。これは、BRCA1領域への連鎖を確立する機会を大いに改良し、BRCA1領域の取り扱い易いサイズへの縮小を容易とし、BRCA1遺伝子座自体の同定を可能とする。
Example 1
Confirmed and experimental families with 17q-linked breast cancer susceptibility loci A wide range of cancer-susceptible families provides a large set of relatives available for a wide range of families and experiments with many cases of breast cancer. Confirmed from the group. The vast number of meiosis present in these large families provides the ability to detect whether the BRCA1 locus is segregating and provides an opportunity for informational recombinants that occur within the small region to be investigated. Decreased. This greatly improves the opportunity to establish linkage to the BRCA1 region, facilitates the reduction of the BRCA1 region to a manageable size, and allows identification of the BRCA1 locus itself.

各家系を、すべての利用可能な関連血縁者を通じて、各発端者または癌ケースのすべての情報的一親等血縁者まで拡大した。これらの家系については、さらなる乳癌ケース、および該家系で現れた注目する他の部位(例えば、卵巣)に癌を持つ個人を、腫瘍登録関連ファイルを通じて捜し当てた。ユタ州癌登録で確認されなかった家系で報告されているすべての乳癌を調査した。医学記録または死亡証明書を、すべての癌の確認のために入手した。DNAを抽出した血液試料を供することによって、各鍵となる個人およびすべての情報的個人を参加させた。また、我々は、故人ケースの遺伝子型がその血縁者の遺伝子型から推定できるように、故人ケースの配偶者および血縁者からサンプリングした。   Each family was expanded through all available related relatives to all probable relatives in each proband or cancer case. For these families, additional breast cancer cases and individuals with cancer at other sites of interest that appeared in the family (eg, ovaries) were sought through tumor registry-related files. We examined all breast cancers reported in families that were not identified in the Utah Cancer Registry. Medical records or death certificates were obtained for confirmation of all cancers. Each key individual and all informational individuals were allowed to participate by providing a blood sample from which DNA was extracted. We also sampled from the deceased case's spouse and relatives so that the deceased case's genotype could be inferred from the relative's genotype.

推定できる遺伝子型を持つ3以上の癌ケースを有する10の家系を、増殖性乳病および乳癌の研究用の関連データベータから元々は確認された29家系の組からの17qマーカーに対する連鎖実験のために選択した(Skolnickら、1990)。これらの家系の選択の基準は、乳癌を持つ2人の姉妹または母親および彼女の娘の存在であった。さらに、1980年以来我々の乳癌連鎖研究の一部として研究してきた2の家系(K1001、K9018)、乳癌および/または卵巣癌のクラスターの存在についての関連データベースから確認した6の家系(K2019、K2073、K2079、K2080、K2039、K2082)および早期開始乳癌を持つ自己推定家系(K2035)を含めた。これらの家系を調査し、前記したように我々の臨床で拡大させた。表1は、引き続いての実施例の主題であるこれらの19家系の特徴を示す。表1では、各家系につき、我々のデータベースにおける個人の合計数、タイプ分けした個人の数、および乳房/卵巣癌の診断時の最小、メジアンおよび最大年齢を報告する。乳癌の診断時のメジアン年齢が増加する順に家系を分類する。卵巣および乳癌双方と診断された4人の婦人は両方のカテゴリーに数える。   Ten families with more than three cancer cases with putative genotypes were linked to 17q markers from a set of 29 families originally identified from relevant data beta for studies of proliferative breast disease and breast cancer (Skolnick et al., 1990). The criteria for selection of these families was the presence of two sisters or mothers with breast cancer and her daughter. In addition, two families (K1001, K9018) that have been studied as part of our breast cancer chain study since 1980, six families (K2019, K2073) identified from the relevant database about the presence of breast and / or ovarian cancer clusters. , K2079, K2080, K2039, K2082) and self-estimated families with early-onset breast cancer (K2035) were included. These families were investigated and expanded in our clinical practice as described above. Table 1 shows the characteristics of these 19 families that are the subject of subsequent examples. Table 1 reports for each family, the total number of individuals in our database, the number of individuals typed, and the minimum, median, and maximum age at diagnosis of breast / ovarian cancer. Sort families by increasing median age at the time of breast cancer diagnosis. Four women diagnosed with both ovary and breast cancer count in both categories.

Figure 2005124578
Figure 2005124578

実施例2
染色体17qに連鎖した家系の選択およびインターバルMfd15−Mfd188へのBRCA1の位置決め
これらの19の家系で収集した各試料につき、標準的な実験プロトコルを用いて、血液(2のケースでは、パラフィン包埋組織ブロック)からDNAを抽出した。この実験における遺伝子型決定は、短い縦列反復(STR)マーカーに制限した。というのは、一般に、これらは高ヘテロ接合性を有し、PCR法は非常に少量のDNAを使用しつつ、迅速な回転を供するからである。この努力を助力するために、CA陽性クローン用の染色体特異的コスミドライブラリーをスクリーニングすることによって、染色体17上の4つのかかるSTRマーカーを開発した。これらのマーカーのうち3つが長腕:(46E6.Eastonら、1993);(42D6、Eastonら、1993);26C2(D17S514、Oliphantら、1991)に位置決定され、他方、外のもの12G6(D17S513、Oliphantら、1991)は、p53腫瘍サプレッサー遺伝子座近くの短腕に位置決定された。これらのうち2つの42D6および46E6を、全世界の研究者による乳癌家族のタイプ分けのためにBreast Cancer Linkage Consortiumに提出した。我々の研究所で開発したのではないマーカーについてのオリゴヌクレオチド配列は、発表された報告から、あるいはBreast Cancer Linkage Consortiumの一部として、あるいは他の研究者から入手した。
Example 2
Selection of family linked to chromosome 17q and positioning of BRCA1 in interval Mfd15-Mfd188 For each sample collected in these 19 families, blood (in 2 cases, paraffin-embedded tissue) was used. DNA was extracted from (block). Genotyping in this experiment was limited to short tandem repeat (STR) markers. This is because, in general, they are highly heterozygous and PCR methods provide rapid rotation while using very small amounts of DNA. To aid this effort, four such STR markers on chromosome 17 were developed by screening a chromosome-specific cosmid library for CA positive clones. Three of these markers are located in the long arm: (46E6. Easton et al., 1993); (42D6, Easton et al., 1993); 26C2 (D17S514, Oliphant et al., 1991), while the other 12G6 (D17S513). Oliphant et al., 1991) was located in the short arm near the p53 tumor suppressor locus. Two of these, 42D6 and 46E6, were submitted to the Breast Cancer Linkage Consortium for type classification of breast cancer families by researchers worldwide. Oligonucleotide sequences for markers not developed in our laboratory were obtained from published reports, as part of the Breast Cancer Linkage Consortium, or from other researchers.

すべての遺伝子型決定フィルムは、対立遺伝子の一貫したコード付けを維持するのに使用される標準的なレーンマーカーで、盲検によりスコアを取った。ここに示す4つの家系における鍵となる試料は、すべての関連マーカーにつき二連でタイプ分けした。すべての19の家系は、2の多形CA反復マーカー:42D6(D17S588)、我々の研究所で単離されたCA反復、およびMdf15(D17S250)、J. Weber (Weberら、1990)によって供されたCA反復につき、タイプ分けをした。いくつかの入手源からのプローブを用いて、染色体17上、特に染色体17コスミド上に遺伝マーカーを創製し、Los Alamos National Laboratories (van Dillaら、1986)による分類された染色体からラムダファージライブラリーを作製した。   All genotyping films were standard lane markers used to maintain consistent allele coding and scored blindly. The key samples in the four families shown here were typed in duplicate for all relevant markers. All 19 families were served by two polymorphic CA repeat markers: 42D6 (D17S588), CA repeats isolated in our laboratory, and Mdf15 (D17S250), J. Weber (Weber et al., 1990). Each CA repeat was typed. Using probes from several sources, create genetic markers on chromosome 17, especially on chromosome 17 cosmids, and create lambda phage libraries from classified chromosomes by Los Alamos National Laboratories (van Dilla et al., 1986). Produced.

これらの2つのマーカー(42D6、Mfd15)およびこれらの2のマーカーの間に概略位置決定された第3のマーカーMfd188(D17S579、Hallら、1992)を持つ各家系についてのLODスコアは、組換え分率の2つの値0.001および0.1につき計算した。(LODスコアの計算については、Oh,1985参照)。尤度は、Clausら,1991によって導かれたモデルで計算したが、これは、0.003の見積もった遺伝子頻度、約0.80の遺伝子キャリアにおける一生の危険、および非遺伝子キャリアにおける乳癌についての集団ベースの年齢特異的危険を推定するものである。LODスコア計算で用いる3つのマーカーについての対立遺伝子頻度は、CEPHパネル(WhiteおよびLalouel、1988)における非血縁個人の我々自身の研究所でのタイプ分けから計算した。表2は、3つのマーカー42D6、Mfd188、およびMfd15を持つ各家系の対での連鎖分析の結果を示す。   The LOD score for each family with these two markers (42D6, Mfd15) and a third marker Mfd188 (D17S579, Hall et al., 1992) roughly located between these two markers is Two fractional values were calculated for 0.001 and 0.1. (See Oh, 1985 for calculation of LOD score). Likelihood was calculated with the model derived by Claus et al., 1991, which estimated gene frequency of 0.003, lifetime risk in about 0.80 gene carriers, and breast cancer in non-gene carriers. Estimate population-based age-specific risks. Allele frequencies for the three markers used in the LOD score calculation were calculated from our own laboratory typing of unrelated individuals in the CEPH panel (White and Lalouel, 1988). Table 2 shows the results of linkage analysis for each family pair with three markers 42D6, Mfd188, and Mfd15.

Figure 2005124578
Figure 2005124578

CASHモデル(Clausら、1991)下、少なくとも1つの遺伝子座につきLODスコア>1.0の17qの連鎖についての基準を用いると、19の家系のうち4つが17qに連鎖しているようであった(K1901、K1925、K2035、K2082)。多数のさらなる家系は、いくらかの連鎖の証拠を示したが、この時点では連鎖カテゴリーに明確に帰属させることはできなかった。これらは、家系K1911、K2073、K2039およびK2080を含むものであった。17q−連鎖家系のうち3つはこの領域で情報的組換え体を有し、これらを後記にて詳述する。   Under the CASH model (Claus et al., 1991), using the criterion for 17q linkage with LOD score> 1.0 per at least one locus, 4 out of 19 families appeared to be linked to 17q. (K1901, K1925, K2035, K2082). A number of additional families showed some evidence of linkage, but at this point they could not be clearly assigned to the linkage category. These included the families K1911, K2073, K2039 and K2080. Three of the 17q-linked families have informational recombinants in this region, which are detailed below.

家系2082は、いくつかのグループによって現在報告されている最大の17q連鎖乳癌家族である。該家系は20ケースの乳癌、および10ケースの卵巣癌を持つ。2のケースは、卵巣癌および乳癌を持つ。この家族について17qへの連鎖の証拠は圧倒的である:散在的であるような乳癌の3ケースの存在に拘わらず、連鎖したハプロタイプを持つLODスコアは6.0を超える。すなわち、これらのケースは、Mfd15および42D6の間に連鎖したハプロタイプの一部を共には有しない。これらの3つの散在ケースは、年齢46、47および54歳にて乳癌を持つと診断された。より小さい家系では、このタイプの散在的癌は、連鎖の分析および鍵となる組換え体の正しい同定を大いに混乱させる。2082家系における鍵となる組換え体は、その母親および伯母が各々58歳および66歳の年齢で卵巣癌となった45歳で卵巣癌を発病した婦人である。彼女は、Mfd15における非連鎖対立遺伝子を受け継ぎつつ、Mfd188および42D6双方についてのハプロタイプの連鎖した一部を受け継いだ;この組換え事象により、はBRCA1はMfd15に対して末端側に位置決定された。   Family 2082 is the largest 17q-linked breast cancer family currently reported by several groups. The family has 20 cases of breast cancer and 10 cases of ovarian cancer. Two cases have ovarian cancer and breast cancer. The evidence of linkage to 17q for this family is overwhelming: Despite the presence of three cases of breast cancer that are scattered, the LOD score with linked haplotypes is over 6.0. That is, these cases do not have both of the haplotypes linked between Mfd15 and 42D6. These three scattered cases were diagnosed with breast cancer at ages 46, 47 and 54 years. In smaller families, this type of sporadic cancer greatly confounds linkage analysis and correct identification of key recombinants. The key recombinant in the 2082 family is the woman who developed ovarian cancer at age 45 when her mother and aunt became ovarian cancer at the age of 58 and 66 years, respectively. She inherited the linked part of the haplotype for both Mfd188 and 42D6, inheriting the unlinked allele in Mfd15; this recombination event resulted in BRCA1 being located distal to Mfd15.

K1901は、早期開始乳癌家系の典型的なものである。該家系は10ケースの乳癌を持ち、43.5齢のメジアン断時年齢を持つ;4ケースは40歳前に診断された。マーカー42D6でのこの家系についてのLODスコアは1.5であり、その結果、0.96の17q−連鎖の事後確率である。この家系でハプロタイプを調査すると、真性な男性キャリアおよび45歳で乳癌を持つと診断された彼の罹患娘において組換えハプロタイプが同定された。マーカーMfd15についてのそれらの連鎖対立遺伝子は、(彼女の子供から完全には推定できなかった1のケースを除き)該家系におけるすべての他のケースで見いだされるものとは異なる。2つのハプロタイプはMfd188および42D6につき同一である。従って、家系1901からのデータによってもBRCA1遺伝子座はMfd15に対して末端側に位置決定される。   K1901 is typical of an early-onset breast cancer family. The family had 10 cases of breast cancer and a median age of 43.5 years; 4 cases were diagnosed before 40 years of age. The LOD score for this family at marker 42D6 is 1.5, resulting in a 0.96 17q-chain posterior probability. Investigation of haplotypes in this pedigree identified a recombinant haplotype in a genuine male carrier and his affected daughter diagnosed with breast cancer at age 45. Their linked alleles for the marker Mfd15 are different from those found in all other cases in the family (except for one case that could not be completely inferred from her children). The two haplotypes are identical for Mfd188 and 42D6. Thus, the BRCA1 locus is also located distal to Mfd15 by data from family 1901.

家系2035は、病気の表現型において、K1901と同様である。この家系における乳癌の8ケースについてのメジアン診断年齢は37歳である。1のケースは60歳で卵巣癌も有していた。この家族における乳癌ケースは、共に80歳代におけるその死亡まで共に乳癌に罹らなかった2人の姉妹から受け継いだものにある。各分家は4ケースの乳癌を持ち、顕著な早期開始を有する各分家には少なくとも1のケースがあった。この家系はMfd15につき2.34のLODスコアを有する。2の分家において乳癌を分離しているハプロタイプはMfd15において同一の対立遺伝子を共に有するが、末端側遺伝子座Mfd188およびNM23(42D6に対して丁度末端側に位置する集団(consortium)の一部としてタイプ分けされたマーカー)については異なる。2のハプロタイプはマーカー42D6については一致するにも拘わらず、対立遺伝子は、血統によって同一(共通の先祖に由来する)というよりも、状態によって同一に共有されたものである(同一の対立遺伝子であるが、異なる先祖に由来する)。というのは、共有された対立遺伝子はこの遺伝子座で観察された第2の最も普通の対立遺伝子だからである。対照的に、Mfd15で共有された連鎖対立遺伝子は0.04の頻度を有する。これは、我々のデータベースでは鍵となる組換え体である。というのは、それは、BRCA1がハプロタイプの基部側で分離する唯一の組換えであり、かくして、BRCA1領域と境界を接する末端を供するからである。この事象については、鍵となる組換えではないことには、家系の両分家において乳癌につき分離する稀なMfd15対立遺伝子も共に有する家系に嫁いだ妻に第2の突然変異体BRCA1遺伝子が存在することを要する。この事象は1000分の1未満の確率を有する。従って、この家系からの証拠により、Mfd188に対してBRCA1遺伝子座は基部側に位置決定された。   Family 2035 is similar to K1901 in disease phenotype. The median age of diagnosis for 8 cases of breast cancer in this family is 37 years. One case was 60 years old and also had ovarian cancer. Breast cancer cases in this family are inherited from two sisters who both had not had breast cancer until their death in their 80s. Each branch had 4 cases of breast cancer, and each branch with a marked early onset had at least one case. This family has an LOD score of 2.34 per Mfd15. The haplotypes that segregate breast cancer in the two branch have both identical alleles at Mfd15, but as part of a consortium located just distal to loci Mfd188 and NM23 (42D6) Different for typed markers). The two haplotypes are identical for marker 42D6, but the alleles are identically shared by the state (same alleles) rather than identical by the pedigree (derived from a common ancestor). But from different ancestors). This is because the shared allele is the second most common allele observed at this locus. In contrast, the linked allele shared by Mfd15 has a frequency of 0.04. This is a key recombinant in our database. This is because BRCA1 is the only recombination that segregates at the base side of the haplotype, thus providing an end that borders the BRCA1 region. For this event, there is a second mutant BRCA1 gene in a wife who is married to a family that also has a rare Mfd15 allele that segregates for breast cancer in both ancestry families, which is not a key recombination. It is necessary to do. This event has a probability less than 1/1000. Thus, with evidence from this family, the BRCA1 locus was located proximal to Mfd188.

実施例3
微細構造地図の作成およびさらなるSTR多形を用いるMfd191−Mfd188に対するおよびBRCA1領域の精密決定
我々の組換え体の特徴付けを改良し、フランキングマーカーを明確とするためには、染色体17q上のこの比較的小さな領域の密な地図が必要であった。染色体17の研究により、遺伝的および物理的マッピング実験(Fain,1992)の組合せに基づき、この領域のコンセンサス地図を作成した(図1)。この地図は、高度に多形のSTR多形、および多数の多形的発現遺伝子を共に含有する。この地図はこの順序についての証拠につき詳細を与えず、また隣接遺伝子座の順序における逆転についての局所的支持のいずれの測定も与えなかったので、我々は、それを、新しいマーカーの開発で使用すべき源およびBRCA1を含有する小領域の我々の詳細な遺伝地図および物理的地図の作成を得るための粗いガイドとして総括した。我々のアプローチは、他の研究者によって提供された現行STRマーカー、およびCEPH関連家族からのDNAを用いて同定された減数分裂の(遺伝的)分裂中止点のパネルおよびこの領域につき構築された体細胞細胞ハイブリッド(物理的分裂中止点)のパネル双方に関し我々の研究所から新しく開発されたすべてのマーカーを分析することであった。これらのマーカーは、Mfd15、Mfd191(James Weberによって提供)、THRA1(Futrealら、1992a)、およびDonald Black博士によって提供された3つの多形、NM23(Hallら、1992)、SCG40(D17S181)、および6C1(D17S293)に対して基部側にマップされる、我々の研究所で開発された26C2を含むものであった。
Example 3
Refinement mapping and further determination of the BRCA1 region for Mfd191-Mfd188 using additional STR polymorphisms To improve the characterization of our recombinants and clarify the flanking markers, this on chromosome 17q A dense map of a relatively small area was needed. A study of chromosome 17 produced a consensus map of this region based on a combination of genetic and physical mapping experiments (Fain, 1992) (FIG. 1). This map contains both the highly polymorphic STR polymorphism and many polymorphic expressed genes. Since this map does not give details about the evidence for this order, nor does it give any measure of local support for reversals in the order of adjacent loci, we use it in the development of new markers. Summarized as a rough guide to obtain our detailed genetic and physical maps of the power region and subregions containing BRCA1. Our approach is based on current STR markers provided by other investigators, and a panel of meiotic (genetic) cessation points identified using DNA from CEPH-related families and bodies constructed for this region It was to analyze all newly developed markers from our laboratory for both panels of cell-cell hybrids (physical breakpoints). These markers are Mfd15, Mfd191 (provided by James Weber), THRA1 (Futreal et al., 1992a), and three polymorphisms provided by Dr. Donald Black, NM23 (Hall et al., 1992), SCG40 (D17S181), and It included 26C2 developed in our laboratory, mapped on the base side to 6C1 (D17S293).

マーカーの遺伝子位置決定
注目する領域内の新しいマーカーを遺伝子的に位置決定するために、我々は、CEPH文献パネルにおける、および我々の大きい乳癌家系(K2082)における、領域内の多数の鍵となる減数分裂分裂中止点を同定した。もしこの領域において小さな遺伝子距離があれば、それらは、この目的で使用できる比較的小さい組の組換え体であるに過ぎないらしく、また、それらは、組にグループ分けできるマーカーのようである。各組内におけるマーカーの順序は物理的マッピングによってのみ決定できる。しかしながら、新しいマーカーを位置決定するのに必要な遺伝子型決定の数は最小化される。これらの分裂中止点は表3および4に示す。このアプローチを用い、我々は、マーカーTHRA1、6C1、SCG40およびMfd191を遺伝子的に順序付けることができた。表3および4から分かるように、THRA1およびMfd191は共に、BRCA1遺伝子座を含有すると我々が従前に確認したMfd15−Mfd188領域の内側をマップする。表3および4において、M/Pは、母親または親の組換え体を示す。「1」は、遺伝された対立遺伝子は祖父起源であって、他方、「0」は祖母起源であり、「−」は該遺伝子座がタイプ分けされていないかまたは非情報的であることを示す。
Gene localization of markers To genetically locate new markers within a region of interest, we have a number of key reductions within the region in the CEPH literature panel and in our large breast cancer family (K2082). A mitotic breakpoint was identified. If there is a small genetic distance in this region, they appear to be only a relatively small set of recombinants that can be used for this purpose, and they appear to be markers that can be grouped into sets. The order of markers within each set can only be determined by physical mapping. However, the number of genotyping required to locate the new marker is minimized. These disruption points are shown in Tables 3 and 4. Using this approach, we were able to genetically order the markers THRA1, 6C1, SCG40 and Mfd191. As can be seen from Tables 3 and 4, both THRA1 and Mfd191 map inside the Mfd15-Mfd188 region we previously identified as containing the BRCA1 locus. In Tables 3 and 4, M / P indicates maternal or parental recombinant. “1” indicates that the inherited allele is of grandfather origin, while “0” is of grandmother origin and “−” indicates that the locus is untyped or non-informative. Show.

Figure 2005124578
Figure 2005124578

Figure 2005124578
Figure 2005124578

我々の組換え体家族におけるマーカーMfd15、Mfd188、Mfd191およびTHRA1の分析
Mfd15、Mfd188、Mfd191およびTHRA1を我々の組換え体家族においてタイプ分けし、BRCA1遺伝子座を位置決定するためのさらなる情報につき調べた。家系1901において、Mfd15組換え体はTHRA1についての組換え体であるが、Mfd191については非情報的であり、かくして、BRCA1をTHRA1に対して末端側に位置決定する。K2082において、Mfd15に関する組換え体はMfd191に関する組換え体でもあり、かくして、BRCA1遺伝子座をMfd191に対して末端側に位置決定する(Goldgarら、1994)。家系K2035におけるTHRA1およびMfd191の調査からは、さらなる位置決定情報は得られなかった。というのは、2の分家は両マーカーにつき一致したからである。しかしながら、SCG40および6C1は共にMfd188と同一のパターンを呈し、かくして、この家族におけるMfd188組換え体によって提供された位置決定情報における我々の信頼性を増大させる。BRCA1遺伝子座、または少なくともその一部は、従って、基部側のMfd191および末端側のMfd188と境界を接するインターバル内にある。
Analysis of markers Mfd15, Mfd188, Mfd191 and THRA1 in our recombinant family Mfd15, Mfd188, Mfd191 and THRA1 were typed in our recombinant family and examined for further information to locate the BRCA1 locus . In family 1901, the Mfd15 recombinant is a recombinant for THRA1, but Mfd191 is non-informative, thus positioning BRCA1 distal to THRA1. In K2082, the recombinant for Mfd15 is also a recombinant for Mfd191, thus positioning the BRCA1 locus distal to Mfd191 (Goldgar et al., 1994). No further positioning information was obtained from investigation of THRA1 and Mfd191 in family line K2035. This is because the two split houses matched for both markers. However, both SCG40 and 6C1 exhibit the same pattern as Mfd188, thus increasing our confidence in the positioning information provided by Mfd188 recombinants in this family. The BRCA1 locus, or at least a portion thereof, is thus in an interval bordering the proximal Mfd191 and the distal Mfd188.

実施例4
注目する領域における遺伝子的および物理的源の開発
Mfd191−Mfd188領域における高度に多形の遺伝子座の数を増加させるために、我々は、該領域に物理的にマップされるコスミドおよびYACから、我々の研究所で多数のSTRマーカーを開発した。これらのマーカーにより我々は該領域をさらに精密決定できた。
STR、はこれらの遺伝子座を含有し、次いでこれを用いて、コスミドP1またはBACにおいてサブクローンを同定するYACを同定するための所望の領域にあることが知られている遺伝子から同定した。次いで、これらのサブクローンを、(CA)オリゴヌクレオチド(Pharmacia)を用いてCA縦列反復の存在につきスクリーニングした。強力なシグナルを持つクローンを優先的に選択した。というのは、それらは、非常に多数の反復および/または(CA)パターンに対するほとんど完全な正確さを有するCA−反復を表すようだからである。これらの特徴は、共に、多形の確率を高めることが知られている(Weber, 1990)。これらのクローンをベクターから直接的に配列決定して、該反復の位置を決定した。我々は、(GT)10TのごときCA−反復の末端に相補的な可能なプライマーの組のうち1つを用いることによって、CA−反復の一方側のユニークな配列を得た。このユニーク配列に基づき、プライマーを、他の方向において反復を逆に横切る配列を作成し、CA−反復に隣接する第2のプライマーの設計用のユニーク配列を得た。次いで、STRを、無関係個人の小群についての多形につきスクリーニングし、ハイブリッドパネルに対してテストして、それの物理的位置を確認した。これらの基準を満たす新しいマーカーを、ユタ州およびCEPH家族からの40の無関係個人の組においてタイプ分けして、実験集団に適する対立遺伝子頻度を得た。本研究で報告する他のマーカーの多くを、CEPH無関係個人の小群でテストして、同様に適する対立遺伝子頻度を得た。
Example 4
Development of genetic and physical sources in the region of interest To increase the number of highly polymorphic loci in the Mfd191-Mfd188 region, we have derived from the cosmids and YACs physically mapped to the region A number of STR markers have been developed at laboratories. These markers allowed us to further refine the region.
STR contains these loci, which were then used to identify from genes known to be in the desired region to identify YACs that identify subclones in cosmid P1 or BAC. These subclones were then screened for the presence of CA tandem repeats using (CA) n oligonucleotide (Pharmacia). A clone with a strong signal was preferentially selected. This is because they appear to represent CA-repeats with a very large number of iterations and / or almost perfect accuracy for (CA) n patterns. Both of these features are known to increase the probability of polymorphism (Weber, 1990). These clones were sequenced directly from the vector to determine the location of the repeats. We have obtained a unique sequence on one side of the CA-repeat by using one of the possible primer sets complementary to the end of the CA-repeat, such as (GT) 10 T. Based on this unique sequence, a primer was created that crossed the repeat in the other direction, resulting in a unique sequence for the design of the second primer adjacent to the CA-repeat. The STR was then screened for polymorphisms for a small group of unrelated individuals and tested against a hybrid panel to confirm its physical location. New markers meeting these criteria were typed in a set of 40 unrelated individuals from the Utah and CEPH families to obtain allelic frequencies suitable for the experimental population. Many of the other markers reported in this study were tested in a small group of CEPH unrelated individuals to obtain similarly suitable allele frequencies.

前記手法を用い、合計8の多形STRがこれらのYACSから見い出された。このようにして同一の遺伝子座のうち、4つが、共に多形であってBRCA1領域に対して位置決定された。4つのマーカーは染色体17に位置決定されず、使用したYACのキメラ的性質を反映する。該領域にあった4つのマーカーをAA1、ED2、4−7およびYM29と命名した。AA1およびED2はRNU2遺伝子につき陽性のYACから開発し、4−7はEPB3 YACから、YM29はハイブリッドパネルによって該領域に位置決定されたコスミドから開発した。乳癌家系で分析した対立遺伝子の数、ヘテロ接合性およびこれらの4つのおよびすべての他のSTR多形の源の記載を表5に後記する。   Using the approach, a total of 8 polymorphic STRs were found from these YACS. Thus, four of the same loci were both polymorphic and located relative to the BRCA1 region. The four markers are not located on chromosome 17 and reflect the chimeric nature of the YAC used. The four markers that were in the region were named AA1, ED2, 4-7, and YM29. AA1 and ED2 were developed from a YAC positive for the RNU2 gene, 4-7 from an EPB3 YAC, and YM29 from a cosmid located in the region by a hybrid panel. A description of the number of alleles analyzed in breast cancer families, heterozygosity and the source of these four and all other STR polymorphisms is provided below in Table 5.

Figure 2005124578
Figure 2005124578

物理的に該領域にマップされた4つのSTR多形(4−7、ED2、AA1、YM29)を減数分裂で分析し、分裂中止点パネルを表3および4に示した。表6および7は、これらの4つのマーカーの位置決定についての関連するCEPHデータおよび家系2082データを含む。表において、M/Pは母系または父系組換え体を示す。「1」は、引き継がれた対立遺伝子が祖父系起源のものであることを示し、他方、「0」は祖母系起源を示し、「−」は該遺伝子座がタイプ分けされていないか、または非情報的であることを示す。   Four STR polymorphisms physically mapped to the region (4-7, ED2, AA1, YM29) were analyzed by meiosis and the mitotic breakpoint panels are shown in Tables 3 and 4. Tables 6 and 7 contain relevant CEPH data and pedigree 2082 data for the positioning of these four markers. In the table, M / P indicates a maternal or paternal recombinant. “1” indicates that the inherited allele is of grandpaternal origin, while “0” indicates grandma origin, and “−” indicates that the locus has not been typed, or Indicates non-informational.

Figure 2005124578
Figure 2005124578

Figure 2005124578
Figure 2005124578

CEPH1333−04から、我々は、AA1およびYM29がMfd191に対して末端側に位置するに違いないと見る。13292より、AA1およびED2は共に4−7、YM29およびMfd188に対して基部側であると推定できる。K2082で見い出された組換え体はいくつかのさらなる順序付けの情報を提供する。3つの独立した観察(個人番号22、40および63)には、AA1、ED2、4−7、およびYM29、およびMf188はMfd191に対して末端側に位置決定され、他方、ID125により、4−7、YM29、およびMfd188はSGC40に対して基部側に位置決定される。マーカーAA1/ED2および4−7/YM29/Mfd188の2つのクラスター内における相対的順序付けについての遺伝的情報は遺伝子組み換え分析からは得られなかった。インタースティシャル・ヒトDNAの小片が失われているらしい「ホール」を含有することが知られているハイブリッドに関する遺伝子座の順序付けは疑わしいが、ハイブリッドパターンは4−7がYM29およびMfd188の上方に存在することを示す。   From CEPH 1333-04 we see that AA1 and YM29 must be located distal to Mfd191. From 13292, it can be estimated that AA1 and ED2 are both on the base side with respect to 4-7, YM29 and Mfd188. The recombinant found in K2082 provides some additional ordering information. In three independent observations (individual numbers 22, 40 and 63), AA1, ED2, 4-7, and YM29, and Mf188 are located distal to Mfd191, whereas by ID125, 4-7 , YM29, and Mfd188 are positioned proximal to SGC40. Genetic information about the relative ordering within the two clusters of markers AA1 / ED2 and 4-7 / YM29 / Mfd188 was not obtained from genetic recombination analysis. The ordering of the loci for hybrids known to contain “holes” that appear to have lost pieces of interstitial human DNA is questionable, but the hybrid pattern is 4-7 above YM29 and Mfd188 Indicates to do.

実施例5
マーカーAA1、4−7、ED2およびYM29での乳癌家系の遺伝的分析
前記にて議論した鍵となる組換え体を含有する3つの家系以外に、家系2039は、新しく開発されたSTRマーカーの分析を通じて、当該領域に連鎖し、有用な組換え体を含有することが示された。
Example 5
Genetic analysis of breast cancer families with markers AA1, 4-7, ED2 and YM29 In addition to the three families containing the key recombinants discussed above, family 2039 is an analysis of newly developed STR markers It was shown to contain useful recombinants linked to the region.

表8は、各遺伝子座における特異的マーカー対立遺伝子およびその各頻度によって家系のハプロタイプ(コドン形で示す)を明らかにする。表8では、対立遺伝子は頻度が低下する順序でリストし;各遺伝子座についての対立遺伝子1−5の頻度を表5に示す。HをコードするハプロタイプはBRCA1関連ハプロタイプであり、Pは部分的Hハプロタイプを示し、Rは観測可能な組換えハプロタイプを示す。表8で明らかなごとく、すべての家系がすべてのマーカーにつきタイプ分けされたのではなく、特に家系K2082において、家系のうちすべての個人が同一組のマーカーにつきタイプ分けされたのではない。1の例外があるが、罹患したまたは危険な家系構成員から受け継がれたハプロタイプのみを示し;該家系と結婚した配偶者からのハプロタイプは記載しない。かくして、与えられた兄弟姉妹では、ハプロタイプXおよびYの様子は、罹患した/危険な個人からの両ハプロタイプが観察され、いずれも乳癌関連ハプロタイプではなかった。   Table 8 reveals the family haplotypes (shown in codon form) by specific marker alleles at each locus and their respective frequencies. In Table 8, alleles are listed in order of decreasing frequency; the frequency of alleles 1-5 for each locus is shown in Table 5. The haplotype encoding H is a BRCA1-related haplotype, P indicates a partial H haplotype, and R indicates an observable recombinant haplotype. As can be seen in Table 8, not all families were typed for all markers, especially in family K2082, not all individuals in the family were typed for the same set of markers. Only one haplotype inherited from affected or dangerous family members is shown with one exception; haplotypes from spouses married to the family are not listed. Thus, in a given sibling, the appearance of haplotypes X and Y was observed for both haplotypes from affected / risk individuals, neither of which was a breast cancer-related haplotype.

Figure 2005124578
Figure 2005124578

家系K1901において、新しいマーカーは乳癌感受性を持つ観察可能な組換え体を示さず、これは、この家系における組換え事象がTHRA1およびED2間で最も起こるらしいことを示す。かくして、この家系で4つの新しいマーカーを調べたことに基づいて、新しいBRCA1位置決定情報は得られなかった。家系2082において、鍵となる組換え体個人はED2、4−7、AA1、およびYM29につき連鎖した対立遺伝子を引き継ぎ、これはtdj1474についての組換え体であり、これは、組換え事象がtdj1474およびED2/AA1の間でこの個人で起こったことを示す。   In family K1901, the new marker does not show an observable recombinant with breast cancer susceptibility, indicating that recombination events in this family most likely occur between THRA1 and ED2. Thus, no new BRCA1 positioning information was obtained based on examining four new markers in this family. In pedigree 2082, the key recombinant individual takes over the allele linked for ED2, 4-7, AA1, and YM29, which is the recombinant for tdj1474, which is the recombination event tdj1474 and Indicates what happened to this individual during ED2 / AA1.

表8に示す家系K2035、H1、H2およびR2には注目する3つのハプロタイプがある。H1は4ケースおよび個人17からの1の真性な男性キャリア承継者に存在し、他方、H2は2ケースおよび個人10の承継者における2の真性な男性キャリアに存在する。R2はMfd15およびSCG40の間のおよびそれを含めた遺伝子座につきH2と同一であるが、SCG40と42D6との間で組換え体を有する。我々は、BRCA1が42D6に対して基部側にあることを確立したので、このH2/R2差異はさらなる位置決め情報を付加しない。H1およびR2はMfd15、THRA1、AA1およびED2において同一の対立遺伝子を共に有するが、ED2に対して末端側と推定される遺伝子座、すなわち4−7、Mfd188、SCG40および6C1につき異なる。2のハプロタイプはマーカーYM29(4−7およびMfd188の間に物理的にマップされるマーカー)にて第5番目の対立遺伝子につき一致するにも拘わらず、該対立遺伝子は血統により同一に保有されているというよりも状態により同一に保有されているようである。というのは、この対立遺伝子はこの遺伝子座で最も普通の対立遺伝子であり、CEPH親における推定頻度は0.42だからである。対照的に、Mfd15およびED2遺伝子座で共に保有された連鎖対立遺伝子は各々0.04および0.09の頻度を有する。また、それらは、Mfd191において(頻度=0.52)、THRA1、およびAA1(頻度=0.28)においてより普通の対立遺伝子を保有する。これは該組における鍵となる組換え体である。というのは、それは乳癌がハプロタイプの基部の部分に関して分離している唯一の組換え体であり、かくして、末端側境界を決めるからである。従って、この家系からの証拠により、BRCA1遺伝子座は4−7の基部側に位置決定される。   There are three haplotypes of interest in the families K2035, H1, H2 and R2 shown in Table 8. H1 is present in 1 genuine male carrier successor from 4 cases and individual 17, while H2 is present in 2 genuine male carriers in 2 cases and successor of individual 10. R2 is identical to H2 at the locus between and including Mfd15 and SCG40, but has a recombinant between SCG40 and 42D6. Since we established that BRCA1 is proximal to 42D6, this H2 / R2 difference does not add any additional positioning information. H1 and R2 have the same allele in Mfd15, THRA1, AA1 and ED2, but differ for loci putative to ED2, ie 4-7, Mfd188, SCG40 and 6C1. Although the two haplotypes match for the fifth allele at marker YM29 (a marker physically mapped between 4-7 and Mfd188), the allele is held identical by the pedigree It seems that they are held identically by state rather than being. This is because this allele is the most common allele at this locus and the estimated frequency in the CEPH parent is 0.42. In contrast, the linked alleles carried together at the Mfd15 and ED2 loci have a frequency of 0.04 and 0.09, respectively. They also carry the more common alleles in Mfd191 (frequency = 0.52), THRA1, and AA1 (frequency = 0.28). This is a key recombinant in the set. This is because breast cancer is the only recombinant that separates with respect to the base part of the haplotype, thus determining the terminal boundary. Thus, with evidence from this family, the BRCA1 locus is located on the 4-7 base side.

BRCA1をtdj1474の末端側に位置決めする家系2082における組換え事象は、直接的に推定できる記載した4つの事象のうちの1つだけである;すなわち、罹患母親の遺伝子型は彼女の配偶者および子孫から推定でき、組換えハプロタイプは彼女の罹患娘で観察できる。この家族において、BRCA1感受性対立遺伝子を担う罹患個人に有利な可能性は極めて高い;データの唯一の可能な解釈は、BRCA1がMfd191の末端側にあるというものであり、あるいは表明された組換え体が44歳の卵巣癌の散在ケースであるというものである。直接的に観察可能なまたは推定された組換え体というよりも、家系2033の解釈は、該家系の異なったかつ時々は遠い関連分家で分離する、区別される17q−ハプロタイプの観察に依存する。これらのハプロタイプの一部はいくつかのマーカーにつき共通する対立遺伝子を有し、他方、それらは、他のマーカーにおいて、共有された領域にBRCA1遺伝子座を位置決めする。この位置決めの信頼性は、いくつかの因子;各ハプロタイプを担う個人間の関係、共有された対立遺伝子の頻度、ハプロタイプがBRCA1遺伝子座に関して分離することが示された確実性、およびハプロタイプを決定する領域におけるマーカーの密度に依存する。家系2035の場合では、2つの分家が密接に関係しており、各分家は各ハプロタイプを担う多数の早期開始ケースを有する。共有された対立遺伝子のうち2つは共通である(Mfd191、THRA1)一方、Mfd15、AA1、およびED2における共有された対立遺伝子の推定頻度は各々0.04、0.28および0.09である。従って、これらの対立遺伝子は、状態によって同一である(同一対立遺伝子であるが一般的集団に由来)というよりも、血統によって同一である(共通の先祖に由来)。   The recombination event in pedigree 2082 that positions BRCA1 distal to tdj1474 is only one of the four described events that can be estimated directly; that is, the genotype of the affected mother is her spouse and offspring The recombinant haplotype can be observed in her affected daughter. In this family, it is very likely that the affected individual carrying the BRCA1 susceptibility allele will be favored; the only possible interpretation of the data is that BRCA1 is at the end of Mfd191 or the expressed recombinant Is a 44-year-old ovarian cancer scattered case. Rather than directly observable or putative recombinants, the interpretation of family 2033 relies on the observation of distinct 17q-haplotypes that segregate in different and sometimes distant related families of the family. . Some of these haplotypes have a common allele for some markers, while they locate the BRCA1 locus in a shared region in other markers. The reliability of this positioning determines several factors; the relationship between individuals bearing each haplotype, the frequency of shared alleles, the certainty that the haplotype has been shown to segregate with respect to the BRCA1 locus, and the haplotype. Depends on the density of markers in the area. In the case of family line 2035, the two branch houses are closely related, and each branch house has a number of early start cases for each haplotype. Two of the shared alleles are common (Mfd191, THRA1), while the estimated frequencies of shared alleles in Mfd15, AA1, and ED2 are 0.04, 0.28, and 0.09, respectively. . Thus, these alleles are identical by pedigree (derived from a common ancestor), rather than being identical by state (same allele but from the general population).

実施例6
精密な物理的マッピング研究は、tdj1474およびU5Rが挟み隣接する領域にBRCA1を位置付ける。
1990年における染色体17qへの最初の位置決定(Hallら、1990)以来、効果的な位置クローニング戦略の手段を可能として当該遺伝子を単離するのに十分な位小さな領域にBRCA1遺伝子を位置決めするのに多大の努力がなされてきた。世界的に収集した214家族よりなる共同性Breast Cancer Linkage Consortiumデータベースにおいて、多点連鎖分析(multipoint linkage analysis)(Eastonら、1993)によって、まずBRCA1遺伝子座がインターバルMfd15(D17S250)−42D6(D17S588)に位置決定された。引き続いての精密な位置決めは、特定の家族における個人の組換え事象に基づくものであった。領域THRA1−D17S183はBowcockら、1993によって明確化され;領域THRA1−D17S28はSimardら、1993によって明確化された。
Example 6
Precise physical mapping studies position BRCA1 in the region flanked by tdj1474 and U5R.
Since the first localization to chromosome 17q in 1990 (Hall et al., 1990), positioning the BRCA1 gene in a region small enough to allow for an effective positional cloning strategy and to isolate the gene A great deal of effort has been made. According to multipoint linkage analysis (Easton et al., 1993), the BRCA1 locus is first identified as interval Mfd15 (D17S250) -42D6 (D17S588) in the globally collected 214 Breast Cancer Linkage Consortium database. Was located. Subsequent precise positioning was based on individual recombination events in a particular family. Region THRA1-D17S183 was clarified by Bowcock et al., 1993; region THRA1-D17S28 was clarified by Simard et al., 1993.

我々は、さらに、BRCA1遺伝子座はマーカーMfd191(D17S776)に対して末端側に存在しなければならないことを示した(Goldgarら、1994)。このマーカーはTHRA1およびRARAに対して末端側に存在することが知られている。BRCA1遺伝子座についての最小の公表されている領域は、かくして、D17S776とD17S78との間にある。この領域は、約150万塩基のDNAを依然含有し、該領域におけるすべての遺伝子の単離およびテストを非常に困難な仕事としている。我々は、従って、該領域の物理的な地図を構築し、該領域に位置する多形STRマーカーの組を単離し、情報的家族の組におけるこれらの新しいマーカーを分析する仕事を行って、取り扱えるインターバルへのBRCA1遺伝子の位置決めの精度を上げた。   We further showed that the BRCA1 locus must be distal to the marker Mfd191 (D17S776) (Goldgar et al., 1994). This marker is known to be located distal to THRA1 and RARA. The minimal published region for the BRCA1 locus is thus between D17S776 and D17S78. This region still contains about 1.5 million bases of DNA, making isolation and testing of all genes in the region a very difficult task. We can therefore handle and work to build a physical map of the region, isolate a set of polymorphic STR markers located in the region, and analyze these new markers in the informational family set The accuracy of BRCA1 gene positioning in the interval was increased.

4つの家族が、位置クローニング戦略の適用のための十分に小さな領域へのBRCA1の位置決めについての重要な情報的遺伝的証拠を提供する。2つの家族(K2082、K1901)は、BRCA1についての基部側境界に関するデータを提供し、他の2つ(K2035、K1813)は末端側境界を定める。これらの家族を後記にて詳述する。PCRによってアッセイできる合計15の短鎖縦列反復マーカーを用いて、研究した家族におけるこの位置決定の精度を上げた。これらのマーカーはDS17S7654、DS17S975、tgj1474およびtgj1239を含む。これらのマーカー用のプライマー配列は配列番号3に、DS17S754については配列番号4に、DS17S975については配列番号5および配列番号6に、tgj1474については配列番号7および配列番号8に、tgj1239については配列番号9および配列番号10に供する。   Four families provide important informational genetic evidence for the positioning of BRCA1 in a sufficiently small region for application of position cloning strategies. Two families (K2082, K1901) provide data on the proximal boundary for BRCA1, and the other two (K2035, K1813) define the distal boundary. These families are detailed below. A total of 15 short tandem repeat markers that can be assayed by PCR were used to increase the accuracy of this localization in the studied families. These markers include DS17S7654, DS17S975, tgj1474 and tgj1239. The primer sequences for these markers are SEQ ID NO: 3, DS17S754 for SEQ ID NO: 4, DS17S975 for SEQ ID NO: 5 and SEQ ID NO: 6, tgj1474 for SEQ ID NO: 7 and SEQ ID NO: 8, and tgj1239 for SEQ ID NO: 9 and SEQ ID NO: 10.

家系2082
家系2082は現在までに研究された最大のBRCA1−連鎖乳癌/卵巣癌家族である。それは、8.6のLODスコアを有し、17q連鎖についての明白な証拠を提供する。この家族は従前に記載されており、BRCA1をMFD191(D17S776)の末端側に位置決めする臨界的組換え体を含有することが示されている。この組換え体は、その母親が63歳で卵巣癌を有した45歳で卵巣癌と診断された婦人で起こった。罹患した母親は他界し;しかしながら、彼女の子供から、彼女はMfd15およびMfd188の間の領域において家族の30の他のケースに存在する連鎖ハプロタイプを有すると推定できた。彼女の罹患した娘は遺伝子座ED2,4−7およびMfd188において連鎖対立遺伝子を受け継いだが、Mfd15およびMfd191における非−BRCA1染色体上の対立遺伝子を受け継いだ。この組換え分裂中止点をさらに位置付けするために、我々は物理的マッピング源に由来する以下のマーカーにつき、その家族の鍵となる構成員をテストした:tdj1474、tdj1239、CF4、D17S855。マーカーtdj1474およびCF4については、罹患娘は連鎖対立遺伝子を受け継がなかった。しかしながら、STR遺伝子座tdj1239については、該母親は情報的であって、彼女の娘はBRCA1関連対立遺伝子を受け継いだと推定できた。D17S855はこの家族では情報的でなかった。この分析に基づき、順序は17q動原体−Mfd191−17HSD−CF4−tdj1474−tdj1239−D17S855−ED2−4−7−Mfd188−17qテロメアである。従って、前記した組換え体はBRCA1をtdj1474に対して末端側に位置付け、分裂中止点はtdj1475とtdj1239との間のインターバルに位置付けた。tdj1474に対して末端側に位置付けられるBRCA1のもの以外のこの家族におけるデータについての唯一の別の説明は、組換え体個人に存在する卵巣癌はBRCA1遺伝子とは独立した理由によって引き起こされるというものである。50歳前に診断される卵巣癌が稀だとしたら、この別の解釈は全くありそうにもない。
Family 2082
Family 2082 is the largest BRCA1-linked breast / ovarian cancer family studied to date. It has a LOD score of 8.6 and provides clear evidence for the 17q linkage. This family has been previously described and has been shown to contain critical recombinants that position BRCA1 distal to MFD191 (D17S776). This recombinant occurred in a woman whose mother had been diagnosed with ovarian cancer at age 45 and had ovarian cancer at age 63. The affected mother passed away; however, from her children, it could be presumed that she had a linked haplotype that was present in 30 other cases of the family in the region between Mfd15 and Mfd188. Her affected daughter inherited alleles at loci ED2, 4-7 and Mfd188 but inherited alleles on the non-BRCA1 chromosome at Mfd15 and Mfd191. To further locate this recombination breakpoint, we tested key members of the family for the following markers from the physical mapping source: tdj1474, tdj1239, CF4, D17S855. For markers tdj1474 and CF4, the affected daughter did not inherit the linked allele. However, for the STR locus tdj1239, it could be assumed that the mother was informative and her daughter inherited the BRCA1-related allele. D17S855 was not informative in this family. Based on this analysis, the order is 17q centromere-Mfd191-17HSD-CF4-tdj1474-tdj1239-D17S855-ED2-4-7-Mfd188-17q telomere. Therefore, the above-mentioned recombinant positioned BRCA1 on the terminal side with respect to tdj1474, and the discontinuation point was positioned in the interval between tdj1475 and tdj1239. The only other explanation for data in this family other than that of BRCA1 located distal to tdj1474 is that ovarian cancer present in recombinant individuals is caused by reasons independent of the BRCA1 gene. is there. If ovarian cancer diagnosed before age 50 is rare, this alternative interpretation is unlikely.

家系1901
家系1901は、7ケースが50歳前に乳癌と診断され、そのうち4ケースが40歳前に診断された早期開始乳癌家族である。さらに、50歳および70歳の間に乳癌と診断された3ケースがあった。乳癌の1ケースは、61歳における卵巣癌も有していた。この家族は、現在、D17S855につき1.5のLODスコアを有する。この連鎖証拠および少なくとも1つの卵巣眼ケースの存在が与えられれば、この家族は0.99を超えるBRDA1による事後確率を有する。この家族では、組換えは、それから他のケースの大部分に遺伝した卵巣癌ケースの兄弟である個人が該家族における他のケースと共分離するハプロタイプの一部を共に有するという事実に由来する。しかしながら、彼はこの部分的ハプロタイプを彼の娘に渡し、彼女は44歳で乳癌を発病した。もしこのケースがBRDA1遺伝子によるものならば、この兄弟および彼の姉妹の間で共有されたハプロタイプの一部のみがBRDA1遺伝子を含有できる。この種の情報の解釈の困難性は、共有されていないマーカー、従って、組換え体を確認することはできるが、一致するマーカーは、それらが非組換え体であるゆえに、あるいはそれらの親がホモ接合体であったゆえに共有されているであろうということである。親の遺伝子型データがなければ、これらの別解釈を区別できない。K1901におけるハプロタイプに鑑みると、彼はMfd15(D17S250)、THRA1、CF4(S17S1320)、およびtdj1474(17S1321)において連鎖対立遺伝子を共に有していないことが示される。彼はMfd191(D17S776)、ED2(S17S1327)、tdj1239(D17S1328)およびMfd188(D17S579)において連鎖対立遺伝子を共に有している。Mfd191で共有された対立遺伝子は比較的稀(0.07)であるにも拘わらず、我々は、該親は、それらがいずれか側の近くに位置付けされるマーカーにて組換え体であるのでホモ接合体であり、この領域における二重組換え事象は極端にありそうにもないと推定する。かくして、この家族における証拠はtdj1474に対してBRCA1遺伝子座を末端側に位置決定する。しかしながら、この分裂中止点のより低い限界は親の遺伝子型情報なくしては決定するのが不可能である。この家族で鍵となる組換え分裂中止点は家系2082における結果を確認させることは当惑させるものである。前と同じように、この家族における位置決め情報は、もし乳癌がBRCA1遺伝子によるものならば意味のあるものにすぎない。しかしながら、診断における彼女の比較的早期年齢(44)はこれを非常にありそうなものとする。というのは、一般的集団では45歳前の乳癌の危険は低いからである(ほぼ1%)。
Family 1901
Family 1901 is an early-onset breast cancer family in which 7 cases were diagnosed with breast cancer before 50 years of age, 4 of which were diagnosed before 40 years of age. In addition, there were 3 cases diagnosed with breast cancer between the ages of 50 and 70. One case of breast cancer also had ovarian cancer at age 61. This family currently has a LOD score of 1.5 per D17S855. Given this linkage evidence and the presence of at least one ovarian eye case, this family has a posterior probability with BRDA1 greater than 0.99. In this family, recombination stems from the fact that individuals who are siblings of the ovarian cancer case that were then inherited in the majority of other cases have both haplotypes that co-segregate with other cases in the family. However, he gave this partial haplotype to his daughter, who developed breast cancer at age 44. If this case is due to the BRDA1 gene, only some of the haplotypes shared between this brother and his sister can contain the BRDA1 gene. The difficulty in interpreting this type of information can identify unshared markers, and therefore recombinants, but matching markers are not because they are non-recombinant or their parents It will be shared because it was a homozygote. Without the parental genotype data these distinct interpretations cannot be distinguished. In view of the haplotype at K1901, he is shown to have no linked alleles at Mfd15 (D17S250), THRA1, CF4 (S17S1320), and tdj1474 (17S1321). He has both linked alleles in Mfd191 (D17S776), ED2 (S17S1327), tdj1239 (D17S1328) and Mfd188 (D17S579). Despite the relatively rare (0.07) allele shared by Mfd191, we do not know that the parents are recombinant at the marker they are located near either side. It is homozygous and assumes that double recombination events in this region are extremely unlikely. Thus, evidence in this family locates the BRCA1 locus distal to tdj1474. However, the lower limit of this disruption point cannot be determined without parental genotype information. The key recombination breakpoint in this family is embarrassing to confirm the results in family 2082. As before, the positioning information in this family is only meaningful if the breast cancer is due to the BRCA1 gene. However, her relatively early age in diagnosis (44) makes this very likely. This is because the general population has a low risk of breast cancer before age 45 (almost 1%).

家系2035
この家族は、臨界的組換え事象についての情報が直接的には観察されないが、観察から、当該家族の2の分家における早期開始乳癌に関し共分離する2つのハプロタイプが17qBRCA1領域の基部側部分に位置決めされたマーカーにつき同一であるが、より末端側の遺伝子座では異なるようであると推定される点でK1901と同様である。これらの2のハプロタイプの各々は早期開始のまたは両側乳癌の少なくとも4ケースで起こる。この家族におけるED2での総じてのLODスコアは2.2であり、該家族に乳癌のケースがあり(これは、80%のBRCA1連鎖の事前確率を示す)、この家族がBRCA1に連鎖しているという得られた事後確率は0.998である。ハプロタイプは、マーカーMfd15、THRA1、Mfd191、ED2、AA1、D17S858およびD17S902につき同一である。Mfd15およびED2における共通の対立遺伝子は共にかなり稀であり、これは、このハプロタイプは子孫によって同一に共有されていることを示す。しかしながら、該ハプロタイプはCA375、4−7、およびMfd188、ならびにいくつかのより末端側マーカーにつき一致しない。これは、BRCA1遺伝子座がマーカーCA375上方に存在するにちがいないことを示す。このマーカーはD17S78よりも50kb下方に位置し、従って、それはSimardら(1993)に報告されているように、一義的には、この従前の低い境界のさらなる確認として働く。
Family 2035
In this family, information about critical recombination events is not directly observed, but the observation shows that two haplotypes co-segregating for early-onset breast cancer in the two branch of the family are in the proximal part of the 17qBRCA1 region Similar to K1901 in that it is presumed to be the same for the positioned marker but different at the more distal locus. Each of these two haplotypes occurs in at least 4 cases of early-onset or bilateral breast cancer. The overall LOD score for ED2 in this family is 2.2, and there is a case of breast cancer in this family (which indicates an 80% prior probability of BRCA1 linkage), and this family is linked to BRCA1 The obtained posterior probability is 0.998. The haplotype is the same for markers Mfd15, THRA1, Mfd191, ED2, AA1, D17S858 and D17S902. Both common alleles in Mfd15 and ED2 are fairly rare, indicating that this haplotype is shared equally by offspring. However, the haplotypes do not match for CA375, 4-7, and Mfd188, and some more distal markers. This indicates that the BRCA1 locus must be above the marker CA375. This marker is located 50 kb below D17S78, so it primarily serves as a further confirmation of this previous low boundary, as reported by Simard et al. (1993).

家系1813
家系1813は、その母親が45歳で乳癌と診断され61歳で卵巣癌診断された40歳前に乳癌と診断された4ケースを持つ小さな家族である。この状況は、該4ケースは3人の異なる父親を有し、それのうち1人のみが遺伝子型が決定されているという事実によって幾分複雑化している。しかしながら、BRCA1領域における多数の異なるマーカーならびにゲノムにおける他の場所の高度に多形のマーカーをタイプ分けすることによって、該家族におけるすべての子供の父親が誰であるかは、かなりの確実性をもって決定された。この家族は、17qマーカーに関し0.60の最大多点LODスコアを生じ、もし少なくとも1ケースの卵巣癌があれば、その結果、0.93のBRCA1連鎖家族であるという事後確率となる。この家族は、34歳で乳癌を発病した個人18において直接的に観察可能な組換え事象を含有する(Simardら,Human Mol.Genet.2:1193−1199(1993)における図5参照)。関連17q遺伝子座における罹患母親の遺伝子型は、彼女の遺伝子型、彼女の罹患姉妹の遺伝子型、および3人の他の非罹患兄弟姉妹の遺伝子型から推定できる。個人18は以下の遺伝子座:Mfd15、THRA1、D17S800、D17S855、AA1、およびD17S931につきBRCA1連鎖対立遺伝子を受け継ぐ。しかしながら、D17S931の下方のマーカー、すなわち、U5R、vrs31、D17S858およびD17S579については、彼女は病気を担わない染色体上に位置する対立遺伝子を受け継いだ。この家族からの証拠は、従って、BRCA1遺伝子座をマーカーUS5に対して基部側に位置付ける。彼女の診断の早期年齢(34)のため、組換え個人の癌はこの家族における乳癌/卵巣癌の他のケースの原因となる遺伝子によるものではないということは極めてありそうにもなく:この家族における不確実性は、この家族における乳癌は第2の、まだマップされていない、乳癌感受性遺伝子座よりむしろBRCA1によるものであるという我々の幾分少ない証拠に由来する。
Family 1813
Family 1813 is a small family with four cases whose mother was diagnosed with breast cancer at age 40 and before age 40 was diagnosed with breast cancer at age 61 and ovarian cancer at age 61. This situation is somewhat complicated by the fact that the four cases have three different fathers, of which only one is genotyped. However, by typing many different markers in the BRCA1 region as well as highly polymorphic markers elsewhere in the genome, it is determined with great certainty who is the father of all children in the family. It was. This family produces a maximum multipoint LOD score of 0.60 for the 17q marker, and if there is at least one case of ovarian cancer, this results in a posterior probability of being a 0.93 BRCA1 linked family. This family contains a recombination event that is directly observable in an individual 18 who developed breast cancer at age 34 (see FIG. 5 in Simard et al., Human Mol. Genet. 2: 1193-1199 (1993)). The genotype of an affected mother at the relevant 17q locus can be inferred from her genotype, her affected sister's genotype, and three other unaffected sibling genotypes. Individual 18 inherits the BRCA1 linked allele for the following loci: Mfd15, THRA1, D17S800, D17S855, AA1, and D17S931. However, for the markers below D17S931, ie U5R, vrs31, D17S858 and D17S579, she inherited alleles located on a chromosome that does not carry disease. Evidence from this family therefore positions the BRCA1 locus proximal to the marker US5. Due to her early age of diagnosis (34), it is very unlikely that the cancer of the recombinant individual is due to a gene responsible for other cases of breast / ovarian cancer in this family: this family The uncertainty in is from our somewhat less evidence that breast cancer in this family is due to BRCA1, rather than a second, unmapped, breast cancer susceptibility locus.

BRCA1を含有する領域のサイズ
前記で詳述した遺伝データに基くと、BRCA1遺伝子座は、共に我々の研究所で単離されたマーカーtdj474およびU5R間のインターバルに存在するにちがいない。図2および3に示す物理的地図に基づき、我々はこれらの2つの遺伝子座の間の物理的距離を見積もろうと試みることができる。それは、この領域にわたる約80kbの平均インサートサイズの約14 P1クローンとするる。しかしながら、いくつかの未知の程度のこれらのすべてのP1重複のため、該物理的領域は80kbの14倍よりも、どもうかなり小さいらしい。該領域をカバーするクローンの制限地図に基づき、我々はBRCA1を含有する領域のサイズはほぼ650bpであると見積もる。
Size of the region containing BRCA1 Based on the genetic data detailed above, the BRCA1 locus must be present in the interval between the markers tdj474 and U5R, both isolated in our laboratory. Based on the physical maps shown in FIGS. 2 and 3, we can try to estimate the physical distance between these two loci. It shall be about 14 P1 clones with an average insert size of about 80 kb over this region. However, due to some unknown degree of all these P1 overlaps, the physical area appears to be much smaller than 14 times 80 kb. Based on the restriction map of the clones covering the region, we estimate that the size of the region containing BRCA1 is approximately 650 bp.

実施例7
Contig領域のゲノム分析によるBRCA1遺伝子座についての候補cDNAクローンの同定
可能な領域の完全なスクリーニング
候補cDNAを同定する最初の方法は、かなり労力が必要だが、公知の技術を用いた。該方法は、該contigにおけるコスミドならびにP1およびBACクローンをスクリーニングして推定暗号配列を同定することよりなるものであった。次いで、推定暗号配列を含有するクローンをcDNAライブラリーのフィルター上のプロープとして使用して将来の分析用の候補cDNAクローンを同定した。該クローンを2つの方法のうちいずれかによって推定暗号配列につきスクリーニングした。
Example 7
Identification of candidate cDNA clones for the BRCA1 locus by genomic analysis of the Contig region Complete screening of possible regions The first method of identifying candidate cDNAs, which is quite labor intensive, used known techniques. The method consisted of screening the cosmid and P1 and BAC clones in the contig to identify the putative coding sequence. The clone containing the putative coding sequence was then used as a probe on the cDNA library filter to identify candidate cDNA clones for future analysis. The clones were screened for putative coding sequences by either of two methods.

ズー(zoo)ブロット
推定暗号配列を同定するための第1の方法は、いくつかの種にわたって進化を通じて保存された配列についてコスミドおよびP1クローンをスクリーニングすることによるものであった。この技術を「ズーブロット分析」といい、Monaco,1986によって記載されている。特に、ウシ、ニワトリ、ブタ、マウスおよびラットからのDNAを制限酵素EcoRIおよびHinDIIIで消化した(酵素当たりDNA8μg)。消化したDNAを20ボルトにて16時間0.7%ゲル上で一晩分離し(14cmゲル)、標準的なサザーンブロット技術を用いてDNAをナイロン膜に移した。例えば、65℃にて、0.1×SSC、0.5%SDSおよび0.2M トリス、pH8.0中で30分間処理し、次いで、42℃にて、5×SSC、10%PEG8000、20mM NaPO、pH6.8、100μg/ml サケ精子DNA、1×Denhardt’s、50%ホルムアミド、0.1%SDSおよび2μg/ml Ct−1DNA中でブロックした。
Zoo blot The first method for identifying putative coding sequences was by screening cosmids and P1 clones for sequences conserved throughout evolution across several species. This technique is referred to as “zoom analysis” and is described by Monaco, 1986. In particular, DNA from bovine, chicken, pig, mouse and rat was digested with the restriction enzymes EcoRI and HinDIII (8 μg DNA per enzyme). Digested DNA was separated on a 0.7% gel overnight at 20 volts for 16 hours (14 cm gel) and the DNA transferred to a nylon membrane using standard Southern blot techniques. For example, treatment at 65 ° C. in 0.1 × SSC, 0.5% SDS and 0.2M Tris, pH 8.0 for 30 minutes, followed by 5 × SSC, 10% PEG 8000, 20 mM at 42 ° C. Blocked in NaPO 4 , pH 6.8, 100 μg / ml salmon sperm DNA, 1 × Denhardt's, 50% formamide, 0.1% SDS and 2 μg / ml C 0 t-1 DNA.

分析すべきコスミドおよびP1クローンを制限酵素で消化して、ヒトDNAをベクターDNAから遊離させた。該DNAを20ボルトにて16時間14cmの0.5%アガロースゲル泳動にて一晩分離した。ヒトDNAバンドをゲルから切り出し、0.5×トリス酢酸緩衝液中、100ボルトにて、ゲルウェッジから少なくとも2時間で電気溶出させた(Maniatisら,1982)。次いで、溶出したNot I消化DNA(〜15kbないし25kb)をEcoRI制限酵素で消化して小さな断片(〜0.5kbないし5.0kb)が得られ、次いで、これは放射性ヌクレオチドでのDNAの標識の次工程にため容易に溶融した。該DNA断片を、ヘキサマーランダムプライミング標識方法(Boehringer−Mannhein,カタログ番号1004760)によって標識した。標識したDNAをスペルミン沈殿させて(100μl TE、5μl 0.1Mスペルミン、および5μl 10mg/mlサケ精子DNA添加)、取り込まれなかった放射性ヌクレオチドを除去した。次いで、標識したDNAを65℃の100μl TE、0.5M NaClに5分間で再懸濁し、次いで、製造業者の指示のごとくに(Gibco/BRL、カタログ番号5279SA)、ヒトCt−1DNAで2−4時間でブロックした。該Ct−1ブロックトプローブをブロッキング溶液中、42℃で、ズーブロットフィルター上でインキュベートした。該フィルターを室温にて2×SSC、0.1%SDS中で30分間洗浄し、次いで、55℃にて同一緩衝液中で30分間洗浄した。次いで、該フィルターを、−70℃にて、増感剤を含むKodak XAR−5フィルムに1ないし3日間暴露した。かくして、ズーブロットを当該インサートからのEco−R1断片のプールと、または各断片と個々にハイブリダイズさせた。 The cosmid and P1 clone to be analyzed were digested with restriction enzymes to release human DNA from vector DNA. The DNA was separated overnight on a 14% 0.5% agarose gel run at 20 volts for 16 hours. The human DNA band was excised from the gel and electroeluted from the gel wedge in 0.5 × Tris acetate buffer at 100 volts for at least 2 hours (Maniatis et al., 1982). The eluted Not I digested DNA (˜15 kb to 25 kb) is then digested with EcoRI restriction enzyme to give a small fragment (˜0.5 kb to 5.0 kb) which is then used to label the DNA with radioactive nucleotides. It melted easily for the next step. The DNA fragment was labeled by the hexamer random priming labeling method (Boehringer-Mannheim, catalog number 1004760). Labeled DNA was spermine precipitated (100 μl TE, 5 μl 0.1 M spermine, and 5 μl 10 mg / ml salmon sperm DNA added) to remove unincorporated radionucleotide. The labeled DNA is then resuspended in 100 μl TE, 0.5 M NaCl at 65 ° C. for 5 minutes and then as per manufacturer's instructions (Gibco / BRL, catalog number 5279SA) with human C 0 t-1 DNA. Blocked in 2-4 hours. The C 0 t-1 blocked probe was incubated on a zoom blot filter at 42 ° C. in blocking solution. The filter was washed for 30 minutes in 2 × SSC, 0.1% SDS at room temperature, then for 30 minutes in the same buffer at 55 ° C. The filter was then exposed to Kodak XAR-5 film containing sensitizer for 1 to 3 days at -70 ° C. Thus, the zoom blots were hybridized with a pool of Eco-R1 fragments from the insert or individually with each fragment.

HTFアイランド(island)分析
cDNAライブラリーについてのプローブとして使用するためのコスミドを同定する第2の方法はHTFアイランド分析であった。パルス場地図はHTFアイランドを明らかとできるので、これらのHTFアイランド領域にマップされるコスミドを優先的に分析した。HTFアイランドはDNAのセグメントであって、これは非常に高頻度の非メチル化CpGジヌクレオチドを含有し(Tonolioら、1990)、その認識配列がCpGジヌクレオチドを含む酵素の制限部位のクラスターリングによって明らかにされる。HTF−アイランド分析で有用であることが知られている酵素はAscI、NotI、BssHII、EagI、ScaII、NaeI、NarI、SmaIおよびMluIである(Anand,1992)。酵素NotI、NruI、EagI、SacIIおよびSalIを用いてパルス場地図を作成し、2つのHTFアイランドが見い出された。これらのアイランドは当該領域の末端に位置し、1つはGP2B遺伝子座の末端側であり、他のものは同遺伝子座よりも基部側であり、共にBRCA1領域の外部にある。これらの2つの位置をカバーするTACに由来するコスミドを分析して、これらの制限部位、かくしてHTFアイランドを含有するものを同定した。
HTF island analysis The second method of identifying cosmids for use as probes for cDNA libraries was HTF island analysis. Since the pulse field map can reveal HTF islands, cosmids mapped to these HTF island regions were preferentially analyzed. HTF islands are segments of DNA that contain a very high frequency of unmethylated CpG dinucleotides (Tonolio et al., 1990) and whose recognition sequence is due to clustering of restriction sites of enzymes containing CpG dinucleotides. Will be revealed. Enzymes known to be useful in HTF-island analysis are AscI, NotI, BssHII, EagI, ScaII, NaeI, NarI, SmaI and MluI (Anand, 1992). A pulse field map was created using the enzymes NotI, NruI, EagI, SacII and SalI and two HTF islands were found. These islands are located at the end of the region, one is at the end of the GP2B locus, the other is at the base of the locus, and both are outside the BRCA1 region. Cosmids derived from TAC covering these two positions were analyzed to identify those containing restriction sites and thus HTF islands.

cDNAスクリーニング
HTFアイランドを含有するか、あるいはヒト以外の他の種のDNAに対してハイブリダイゼーションを示すクローンは暗号配列を含有するようである。これらのクローンからのヒトDNAを全インサートとしてまたはEcoRI断片として単離し、前記したごとくに標識した。標識したDNAを用いて、cDNAフィルターが65℃で0.1×SSC、0.1%SDSのよりストリンジェントな洗液を30分間2回受けた以外は、ズーブロットと同一条件下で種々のcDNAライブラリーのフィルターをスクリーニングした。
我々の実験で現在まで使用したcDNAライブラリーのほとんどは(正常乳房組織、妊娠8カ月で乳房悪性の婦人からの乳房組織からのライブラリー)Clonetech,Inc.から調製した。8カ月妊婦の乳房組織から作成したcDNAライブラリーはラムダgt−10ベクター中にてClonetech(カタログ番号HL1037a)から入手でき、これを、C600Hfl細菌宿主細胞中で増殖させる。正常乳房組織および悪性乳房組織試料を37歳の白人女性から単離し、1グラムの各組織をmRNAプロセッシングおよびcDNAライブラリー構築のためにClonetechに送った。後者の2のライブラリーは、ランダムおよびオリゴ−dTプライミング双方を用いて作成し、最終産物のサイズを選択し、これを次いでラムダZapIIベクターにクローン化し、製造業者によって記載されているごとくに細菌のXL1−ブルー株で増殖させた。さらなる組織−特異的cDNAライブラリーは、ヒト胎児脳(Stratagene,カタログ番号936206)、ヒト精巣(Clonetech,カタログHL3024)、ヒト胸腺(Clonetech,カタログHL1127n)、ヒト脳(Clonetech,カタログHL11810)、ヒト胎盤(Clonetech,カタログ1075b)、およびヒト骨格筋(Clonetech,カタログHL1124b)を含む。
cDNA Screening Clones that contain HTF islands or show hybridization to other species of DNA other than humans appear to contain coding sequences. Human DNA from these clones was isolated as a total insert or as an EcoRI fragment and labeled as described above. A variety of cDNAs were used under the same conditions as the Zooblot except that the labeled DNA was used and the cDNA filter was subjected to 0.1 × SSC, 0.1% SDS twice more for 30 minutes at 65 ° C. Library filters were screened.
Most of the cDNA libraries used to date in our experiments (normal breast tissue, library from breast tissue from women with breast malignancy at 8 months of gestation) Clonetech, Inc. Prepared from A cDNA library made from mammary tissue of an 8-month pregnant woman is available from Clonetech (Cat. No. HL1037a) in the lambda gt-10 vector and is propagated in C600Hfl bacterial host cells. Normal and malignant breast tissue samples were isolated from a 37 year old Caucasian female and 1 gram of each tissue was sent to Clonetech for mRNA processing and cDNA library construction. The latter two libraries were generated using both random and oligo-dT priming, selecting the size of the final product, which was then cloned into the lambda ZapII vector and the bacterial strain as described by the manufacturer. Grown on XL1-blue strain. Additional tissue-specific cDNA libraries include human fetal brain (Stratagene, catalog number 936206), human testis (Clonetech, catalog HL3024), human thymus (Clonetech, catalog HL1127n), human brain (Clonetech, catalog HL11810), human placenta. (Clonetech, catalog 1075b), and human skeletal muscle (Clonetech, catalog HL1124b).

該cDNAライブラリーをNZCYMプレート上でその宿主細胞と共に平板培養し、フィルターリフトをManiatisら(1982)におけるごとくに各プレートから二連にて作成する。候補ゲノムクローンからのインサート(ヒト)DNAを精製し、高比活性まで放射能標識した。次いで、放射能DNAを該cDNAフィルターにハイブリダイズさせて、候補コスミドクローン内に位置する遺伝子に対応するcDNAを同定した。この方法によって同定されたcDNAを拾い、再度平板培養し、標識クローンインサートまたはそに由来するEcoRI断片DNAで再度スクリーニングして、それらの陽性状態を確認した。第2ラウンドのスクリーニング後に陽性であったクローンを次いで増殖させ、サザーンブロット分析および配列決定のためにそれらのDNAを精製した。製造業者からのプロトコルに記載されてごとくに、ラムダファージベクターからのプラスミドのイン・ビボ切出を通じて、クローンをプラスミドとして精製するか、あるいはクローンを制限断片としてラムダファージから単離し、プラスミドベクターにサブクローン化した。   The cDNA library is plated with its host cells on NZCYM plates and filter lifts are made in duplicate from each plate as in Maniatis et al. (1982). Insert (human) DNA from candidate genomic clones was purified and radiolabeled to high specific activity. Radioactive DNA was then hybridized to the cDNA filter and the cDNA corresponding to the gene located within the candidate cosmid clone was identified. The cDNAs identified by this method were picked, re-plated and screened again with labeled clone inserts or EcoRI fragment DNA derived therefrom to confirm their positive status. Clones that were positive after the second round of screening were then expanded and their DNA purified for Southern blot analysis and sequencing. As described in the manufacturer's protocol, the clone is purified as a plasmid through in vivo excision of the plasmid from the lambda phage vector, or the clone is isolated from the lambda phage as a restriction fragment and subcultured into the plasmid vector. Cloned.

サザーンブロット分析を二連で行い、1つは、元のゲノムインサートDNAをプローブとして用いて、cDNAインサーがハイブリダイズする配列を含有することを確認した。第2のブロットを最大cDNAインサートからのcDNAインサートDNAとハイブリダイズさせて、いずれのクローンが同一遺伝子を表すかを確認した。ゲノムクローンとハイブリダイズし、かつユニークであるすべてのcDNAを配列決定し、DNA分析を行って、該配列が公知またはユニークな遺伝子を表すか否かを判断した。ユニークであるらしいすべてのcDNAクローンをさらに候補BRCA1遺伝子座として分析した。具体的には、該クローンをノーザーンブロットにハイブリダイズさせて、乳房特異的発現および正常−乳房腫瘍RNAにおける異なる発現を探す。また、それらをBRCA1領域におけるクローンについてPCRによって分析してそれらの位置を確認した。遺伝子座の広がりをマップするために、全長cDNAを単離し、YACならびに元の同一クローンの回りのおよびそれを含むクローンに対するPCRプローブとしてそれらの配列を使用する。次いで、イントロン−エキソン境界をさらに配列分析により明確とした。   Southern blot analysis was performed in duplicate and one confirmed that the cDNA inserter contained a hybridizing sequence using the original genomic insert DNA as a probe. A second blot was hybridized with cDNA insert DNA from the largest cDNA insert to determine which clones represent the same gene. All cDNAs that hybridize with the genomic clone and are unique were sequenced and DNA analysis was performed to determine whether the sequence represents a known or unique gene. All cDNA clones that appeared to be unique were further analyzed as candidate BRCA1 loci. Specifically, the clone is hybridized to a Northern blot looking for differential expression in breast specific expression and normal-breast tumor RNA. They were also analyzed by PCR for clones in the BRCA1 region to confirm their location. To map the locus spread, full length cDNAs are isolated and their sequences used as PCR probes for the YAC and clones around and including the original identical clone. The intron-exon boundary was then further defined by sequence analysis.

我々は、当該領域におけるコスミドBACおよびP1クローンからのズーブロット陽性EcoRI断片で、正常乳房、妊娠8ケ月の乳房および胎児脳cDNAライブラリーをスクリーニングした。潜在的BRCA1 cDNAクローンを3つのライブラリー間で同定した。クローンを拾い、再度平板培養し、元のプローブで再度スクリーニングして、それらが陽性であることを確認した。   We screened normal breast, 8-month-old breast and fetal brain cDNA libraries with zoomid positive EcoRI fragments from cosmid BAC and P1 clones in the region. Potential BRCA1 cDNA clones were identified among the three libraries. Clones were picked, plated again, and screened again with the original probe to confirm that they were positive.

ハイブリッド−選択cDNAの分析
直接選択から得られたcDNA断片を、プローブDNAに対するサザーンブロットハイブリダイゼーションによってチェックして、それらがcontigに由来することを確認した。このテストをパスしたものをその全体について配列決定した。次いで、このようにした得られたDNA配列のセットを相互に対してチェックして、重複する独立したクローンを見いだした。例えば、クローン694−65、1240−1および1240−33が独立して得られ、引き続いて、EST:489:1と命名された同一の近接cDNA配列に由来することが示された。
Analysis of Hybrid-Selected cDNA cDNA fragments obtained from direct selection were checked by Southern blot hybridization to probe DNA to confirm that they originated from contig. Those that passed this test were sequenced in their entirety. The set of DNA sequences thus obtained was then checked against each other to find overlapping independent clones. For example, clones 694-65, 1240-1 and 1240-33 were obtained independently and were subsequently shown to be derived from the same adjacent cDNA sequence designated EST: 489: 1.

候補クローンの分析
前記からの候補遺伝子の1以上を配列決定し、当該情報を各発現された遺伝子の同定および分類に使用した。DNA配列を、ヌクレオチド配列比較によって、およびすべてのフレームにおける翻訳、続いての公知のアミノ酸配列との比較によって、公知の遺伝子と比較した。これは、局所および遠隔配列データバンク(例えば、GenBank)双方に対する配列比較のため、クライアント/サーバーソフトウェアパッケージ(例えば、BLASTN 1.3.13MP)のGenetic Data Environment (GDE)バージョン2.2ソフトウェアおよびBasic Local Alignment Search Tool (Blast)シリーズを用い、Sun SPARCワークステーションで作動させて達成された。コスミドおよびP1で同定されたcDNAクローンのクレクションから再度構築した配列が得られた。新しい配列を表すすべて候補遺伝子をさらに分析して、推定BRCA1遺伝子座につきそれらの候補をテストした。
Analysis of candidate clones One or more of the candidate genes from above were sequenced and this information was used to identify and classify each expressed gene. DNA sequences were compared to known genes by nucleotide sequence comparison and by translation in all frames followed by comparison to known amino acid sequences. This is because of the sequence comparison for both local and remote sequence databanks (eg GenBank), the Client / Server software package (eg BLASTN 1.3.13MP) Genetic Data Environment (GDE) version 2.2 software and Basic This was accomplished using the Local Alignment Search Tool (Blast) series and running on a Sun SPARC workstation. A reconstructed sequence was obtained from a cosmid and a clone of the cDNA clone identified in P1. All candidate genes representing the new sequence were further analyzed and tested for the putative BRCA1 locus.

突然変異スクリーニング
罹患血統における突然変異をスクリーニングするために、2の異なるアプローチを行った。まず、BRCA1の感受性対立遺伝子を担うことが知られている家族構成員から単離したゲノムDNAをPCRによる候補遺伝子配列の増幅用鋳型として使用した。もしPCRプライマーがイントロン/エキソン境界に隣接しまたはそれと重複すると、増幅した断片はcDNA配列から予測されるものよりも大きいか、あるいは増幅混合物には存在しないであろう。かかる増幅実験および設計したプライマーを用いたP1、BACまたはコスミドクローンの配列決定を組み合わせることによって、イントロン/エキソン構造を確立し、最終的には該血統からのゲノムDNAのDNA配列を得ることができる。
Mutation Screening Two different approaches were taken to screen for mutations in the affected pedigree. First, genomic DNA isolated from a family member known to bear a sensitive allele of BRCA1 was used as a template for amplification of candidate gene sequences by PCR. If the PCR primer is adjacent to or overlaps the intron / exon boundary, the amplified fragment will be larger than expected from the cDNA sequence or will not be present in the amplification mixture. By combining such amplification experiments and sequencing of P1, BAC or cosmid clones using the designed primers, intron / exon structures can be established and ultimately the DNA sequence of genomic DNA from the pedigree can be obtained .

もし候補遺伝子のイントロン/エキソン構造が複雑であると、かなりより迅速である第2のアプーチは、血統リンパ球cDNAから増幅した断片の配列決定を含む。血統血液から抽出したリンパ球mRNAから合成したcDNAを、設計したプライマーのセットを用いるPCR増幅の基質として用いた。もし候補遺伝子がリンパ球で有意な程度発現されたならば、かかる実験は通常増幅された断片を生じ、これはイントロン/エキソン結合の知識なくして直接的に配列決定できる。   A second approach, which is much more rapid if the intron / exon structure of the candidate gene is complex, involves sequencing fragments amplified from lineage lymphocyte cDNA. CDNA synthesized from lymphocyte mRNA extracted from pedigree blood was used as a substrate for PCR amplification using the designed primer set. If the candidate gene is expressed to a significant extent in lymphocytes, such experiments usually yield amplified fragments that can be sequenced directly without knowledge of intron / exon binding.

かかる配列決定反応の産物をゲル電気泳動によって分析して、失欠または挿入のごとき突然変異、あるいはアミノ酸変化または他の有害効果を引き起こす塩基対置換いずれかを含有する配列における位置を決定した。   The products of such sequencing reactions were analyzed by gel electrophoresis to determine the position in the sequence containing either mutations such as deletions or insertions, or base pair substitutions that caused amino acid changes or other deleterious effects.

乳房で発現されるBRCA1領域内のいずれの配列もBRCA1についての候補遺伝子であると考えられる。所与の候補遺伝子がBRCA1に対応するという強力な証拠は、血統家族が候補の欠陥対立遺伝子を含有するという証拠に由来する。   Any sequence within the BRCA1 region expressed in the breast is considered a candidate gene for BRCA1. The strong evidence that a given candidate gene corresponds to BRCA1 comes from the evidence that the pedigree family contains the candidate defective allele.

実施例8
BRCA1の同定
BRCA1の同定
いくつかの戦略を用い、D17S1321およびD17S1324間の17q21の600kb領域につき、転写体の詳細なマップを開発した。候補を発現する配列は:1)乳房、胎児脳、またはリンパ球cDNAライブラリーの直接的スクリーニング、2)乳房、リンパ球または卵巣cDNAのハイブリッド選択、または3)ゲノムDNAのランダム配列決定およびXPOUND(ThomasおよびSkolnick,1994)によるコーディングエキソンの産生、から得られたDNA配列として定義された。多くの場合におけるこれらの発現された配列を、いくつかの独立して同定された配列からなるcontigに組み立てた。候補遺伝子はこれらの候補発現配列のうちの1を超えるものからなってよい。この領域内の65の候補発現配列を、ハイブリッド選択によって、cDNAライブラリーの直接的スクリーニングによって、およびP1サブクローンのランダム配列決定によって同定した。転写体サイズ、DNA配列、データベース比較、発現パターン、ゲノム構造、および最も重要には、17q−連鎖乳房および卵巣癌感受性を分離する家系からの個人におけるDNA配列分析によって発現配列を特徴付けた。
Example 8
Identification of BRCA1 Identification of BRCA1 A number of strategies were used to develop a detailed map of the transcript for the 17q21 600 kb region between D17S1321 and D17S1324. Candidate expressing sequences are: 1) direct screening of breast, fetal brain or lymphocyte cDNA libraries, 2) hybrid selection of breast, lymphocyte or ovarian cDNA, or 3) random sequencing of genomic DNA and XPOUND ( Defined as the DNA sequence obtained from the production of coding exons by Thomas and Skolnick, 1994). These expressed sequences in many cases were assembled into contigs consisting of several independently identified sequences. A candidate gene may consist of more than one of these candidate expression sequences. 65 candidate expression sequences within this region were identified by hybrid selection, by direct screening of cDNA libraries, and by random sequencing of the P1 subclone. Expression sequences were characterized by DNA sequence analysis in transcript size, DNA sequence, database comparison, expression pattern, genomic structure, and most importantly, individuals from families separating 17q-linked breast and ovarian cancer susceptibility.

発現配列、1141:1(649bp)、694:5(213bp)および754:2(1079bp)の3つの独立contigを単離し、結局、BRCA1の一部を表すことが示された。これらのcontigについてのESTをノーザン分析用のハイブリダイゼーションプローブとして用いた場合、ほぼ7.8kbの単一転写体が正常乳房mRNAで観察され、これは、それらが単一遺伝子の異なる部分をコードすることを示唆する。乳房、胎児脳、胸腺、精巣、リンパ球および胎盤cDNAのスクリーニングおよび乳房mRNAでのPCR実験は、1141:1、694:5および754:2contigを連鎖させた。胸腺、精巣および乳房mRNAでの5’RACE実験はcontigを推定5’末端まで延長し、複合全長配列が得られた。PCRおよびP1の直接配列決定および当該領域におけるBACを用いて、イントロンの位置を突き止め、スプライスドナーおよびアクセプター部位の決定を可能とした。これらの3つの発現配列を単一の転写転移単位に併合し、これは最終分析でBTCA1であることが判明した。この転写単位は600kb領域の中心におけるD17S855に隣接して位置決定された(図4)。   Three independent contigs of the expression sequence, 1141: 1 (649 bp), 694: 5 (213 bp) and 754: 2 (1079 bp) were isolated and were shown to eventually represent a portion of BRCA1. When ESTs for these contigs were used as hybridization probes for northern analysis, a single transcript of approximately 7.8 kb was observed in normal breast mRNA, which encodes different parts of a single gene I suggest that. Screening of breast, fetal brain, thymus, testis, lymphocyte and placental cDNA and PCR experiments with breast mRNA linked 1141: 1, 694: 5 and 754: 2 contigs. 5'RACE experiments with thymus, testis and breast mRNA extended contig to the putative 5 'end, resulting in a composite full-length sequence. PCR and direct sequencing of P1 and BAC in the region were used to locate the intron and allow determination of splice donor and acceptor sites. These three expressed sequences were merged into a single transcriptional transfer unit, which was found to be BTCA1 in the final analysis. This transcription unit was positioned adjacent to D17S855 at the center of the 600 kb region (FIG. 4).

cDNAクローンから得られた配列、ハイブリッド選択配列、および増幅されたPCR産物の組合せにより、複合全長BTCA1 cDNAの構築が可能となった(配列番号:1)。BRCA1 cDNAの配列(停止コドンまで)もまたGenBankに寄託し、受託番号U−14680が与えられた。この寄託配列を参照して一体化させる。3’方向に最も遠くに伸びるcDNAクローンは、ポリアデニル化シグナルに先行されるポリ(A)トラクトを含有する。cDNAの概念的翻訳により、Kozakコンセンサス配列(Kozak,1987)に似た配列に囲まれ隣接された潜在的開始コドンと共に208キロダルトン(アミノ酸配列、配列番号2)の単一の長いオープンリーディングフレームが明らかとされた。Smith−Waterman(SmithおよびWaterman,1981)およびBLAST(Altschylら、1990)のサーチは、亜鉛−フィンガードメインに対してかなりの相同性を持つアミノ末端に近い配列を同定した(図5)。この配列は、コンセンサスCHC亜鉛−フィンガーモチーフに存在するシステインおよびヒスチジン残基を含有し、データベースにおける亜鉛−フィンガー蛋白質に関する多数の他の残基を共に有する。BRCA1遺伝子はゲノムDNAの100kbを超えて配置された23コーディングエキソンからなる(図6)。BRCA1 cDNAの断片をプローブとして用いるノーザンブロットは、最も豊富には乳房、胸腺および精巣に存在し、また卵巣にも存在する約7.8kbの単一転写体を同定した(図7)。4つの別にスプライスされた産物が独立したcDNAクローンで検出され;これらのうちの3つが乳房、2つが卵巣mRNAで観察された(図6)。組織cDNAからのPCR概観により、この遺伝子からの転写体の5’末端近くにかなりのヘテロ接合性があるという考えがさらに支持され;該ヘテロ結合性についての分子的ベースは、最初のスプライスドナー部位の異なる選択を含み、検出された変化はすべて同定された開始コドンよりも5’側の領域における転写体を改変する。我々は、この5’非翻訳領域で6つの潜在的別のスプライスドナーを検出し、最長の失欠は1,155bpである。乳房および卵巣におけるBRCA1蛋白質の支配的形態はエキソン4を欠く。BRCA1エキソン4のヌクレオチド配列を配列番号11に示し、予測されるアミノ酸配列を配列番号12に示す。 The combination of the sequence obtained from the cDNA clone, the hybrid selection sequence, and the amplified PCR product allowed the construction of a composite full length BTCA1 cDNA (SEQ ID NO: 1). The sequence of BRCA1 cDNA (up to the stop codon) has also been deposited with GenBank and given accession number U-14680. Integrate with reference to this deposited sequence. The cDNA clone that extends furthest in the 3 'direction contains a poly (A) tract preceded by a polyadenylation signal. The conceptual translation of the cDNA results in a single long open reading frame of 208 kilodaltons (amino acid sequence, SEQ ID NO: 2) with a potential start codon surrounded by and adjacent to a sequence similar to the Kozak consensus sequence (Kozak, 1987). It was made clear. A search by Smith-Waterman (Smith and Waterman, 1981) and BLAST (Altschyl et al., 1990) identified sequences near the amino terminus with significant homology to the zinc-finger domain (FIG. 5). This sequence, a consensus C 3 HC 4 zinc - containing cysteine and histidine residues present in the finger motif, zinc in the database - having both a number of other residues regarding finger proteins. The BRCA1 gene consists of 23 coding exons located over 100 kb of genomic DNA (FIG. 6). Northern blots using a fragment of BRCA1 cDNA as a probe identified a single transcript of approximately 7.8 kb, most abundant in the breast, thymus and testis, and also in the ovary (FIG. 7). Four separately spliced products were detected in independent cDNA clones; three of these were observed in breast and two in ovarian mRNA (FIG. 6). A PCR overview from tissue cDNA further supports the notion that there is considerable heterozygosity near the 5 'end of transcripts from this gene; the molecular basis for the heterozygosity is the initial splice donor site All detected changes alter the transcript in the region 5 'to the identified start codon. We have detected 6 potential alternative splice donors in this 5 ′ untranslated region, the longest missing being 1,155 bp. The predominant form of BRCA1 protein in the breast and ovary lacks exon 4. The nucleotide sequence of BRCA1 exon 4 is shown in SEQ ID NO: 11, and the predicted amino acid sequence is shown in SEQ ID NO: 12.

BRCA1ゲノムDNAのさらなる5’配列を配列番号13に示す。1位のGは精巣における潜在的開始部位を表す。140位のAは体細胞組織における潜在的開始部位を表す。図8に示す5’配列の6つの別のスプライス形態がある。356位のGは公認された最初のスプライスドナー部位を表す。444位のGは2のクローンにおける最初のスプライスドナー部位を表す(精巣1および精巣2)。889位におけるGは胸腺3における最初のスプライスドナー部位を表す。第4のスプライスドナー部位は1230位におけるGである。1513位におけるTは前記スプライスドナーのすべてについてのスプライスアクセプター部位を表す。第5の別のスプライス形態は591位における最初のアクセプター部位と共に349位における最初のスプライスドナー部位ならぴに889位における第2のスプライスドナー部位および1513位における第2のアクセプター部位を有する。6つの別の形態がこの5’領域においてスプライスされない。1532位におけるAは公認された開始部位であり、これは配列番号1の120位に出現する。BRCA1について決定された部分的ゲノムDNA配列は図12−19および配列番号14−34に示す。下方のケース文字(図12−19)はイントロン配列を表し、他方、上方のケース文字はエキソン配列を表す。図12−19においてイントロン内の不明確なインターバルはvvvvvvvvで示す。イントロン/エキソン結合は表9および10に示す。エキソン8および14の5’末端で見い出されたCAGはいくつかのcDNAで見い出されたが、他のものでは見い出されなかった。公知の多形部位は、図12−19において肉太活字で示し、下線を施す。   A further 5 'sequence of BRCA1 genomic DNA is shown in SEQ ID NO: 13. G at position 1 represents a potential start site in the testis. A at position 140 represents a potential start site in somatic tissue. There are six alternative splice forms of the 5 'sequence shown in FIG. G at position 356 represents the first recognized splice donor site. G at position 444 represents the first splice donor site in 2 clones (testis 1 and testis 2). G at position 889 represents the first splice donor site in thymus 3. The fourth splice donor site is G at position 1230. T at position 1513 represents a splice acceptor site for all of the splice donors. The fifth alternative splice form has a first acceptor site at position 591 and a first splice donor site at position 349 as well as a second splice donor site at position 889 and a second acceptor site at position 1513. Six other forms are not spliced in this 5 'region. A at position 1532 is a recognized start site, which appears at position 120 of SEQ ID NO: 1. The partial genomic DNA sequence determined for BRCA1 is shown in FIGS. 12-19 and SEQ ID NOs: 14-34. The lower case letters (FIGS. 12-19) represent intron sequences, while the upper case letters represent exon sequences. In FIG. 12-19, the unclear interval in the intron is indicated by vvvvvvvv. Intron / exon binding is shown in Tables 9 and 10. CAGs found at the 5 'ends of exons 8 and 14 were found in some cDNAs but not others. Known polymorphic sites are shown in bold type in FIGS. 12-19 and are underlined.

Figure 2005124578
Figure 2005124578

Figure 2005124578
Figure 2005124578

発散した系統発生的バックグラウンドの生物からのゲノムDNAを亜鉛−フィンガー領域を欠くBRCA1配列でプローブする低ストリンジェンシィブロットにより、ヒト、サル、ヒツジおよびブタで強力にハイブリダイズする断片が明らかにされ、齧歯類では非常に弱いハイブリダイゼーションシグナルが明らかとされた。この結果は、亜鉛−フィンガードメトンは別として、BRCA1は進化を通じて中レベルにてのみ保存されていることを示す。   A low stringency blot that probes genomic DNA from a divergent phylogenetic background organism with a BRCA1 sequence lacking the zinc-finger region reveals fragments that hybridize strongly in humans, monkeys, sheep and pigs. A very weak hybridization signal was revealed in rodents. This result shows that, apart from zinc-fingered methones, BRCA1 is conserved only at moderate levels throughout evolution.

17q−連鎖家系における生殖細胞系BRCA1の突然変異
BRCA1候補遺伝子についての最も厳格なテストは、乳癌および卵巣癌に対する17q−連鎖感受性を分離する家系からのキャリア個人における潜在的に破壊的な突然変異について調べることである。かかる個人は野生型配列とは異なるBRCA1対立遺伝子を含有しなければならない。この分析で使用したDNA試料の組は8の異なるBRCA1家系を表す個人からのDNAよりなるものであった(表11)。
Germline BRCA1 mutations in 17q-linked families The most stringent test for BRCA1 candidate genes is for potentially destructive mutations in carrier individuals from families that isolate 17q-linked susceptibility to breast and ovarian cancer. It is to investigate. Such individuals must contain a BRCA1 allele that differs from the wild type sequence. The set of DNA samples used in this analysis consisted of DNA from individuals representing 8 different BRCA1 families (Table 11).

Figure 2005124578
Figure 2005124578

これらの家系における可能性(LOD)スコアの対数値は17q21におけるマーカーの組につき9.49ないし−0.44の範囲である。4の家族は連鎖につき納得のいくLODスコアを有し、4は低い正または負のLODスコアを有する。後者の家系は含めた。何故ならば、それらは少なくとも3人の罹患構成員につき染色体17q21にて共有するハプロタイプを示すからである。さらに、該組におけるすべての家系は乳癌開始の早期年齢を示し、家系の4つは卵巣癌の少なくとも1ケースを含み、両者はBRCA1家系の特徴である。1の家系2082はほとんど同等の乳癌および卵巣癌の度合いを有し、これは集団における卵巣癌が相対的に稀であることを仮定すれば異常な出現である。2つを除きすべての家系はユタ州で確認された。K2035は中西部からのものである。K2099は南米からのアフリカン−アメリカン−家系である。   The logarithm of the likelihood (LOD) score in these families ranges from 9.49 to -0.44 for the set of markers at 17q21. Family of 4 has a satisfactory LOD score per chain and 4 has a low positive or negative LOD score. The latter family was included. Because they exhibit a haplotype shared on chromosome 17q21 for at least 3 affected members. In addition, all families in the set show an early age of onset of breast cancer, and four of the families contain at least one case of ovarian cancer, both of which are characteristic of the BRCA1 family. One family 2082 has almost comparable degrees of breast and ovarian cancer, which is an unusual occurrence assuming that ovarian cancer in the population is relatively rare. All but two were confirmed in Utah. K2035 is from the Midwest. K2099 is an African-American-family from South America.

BRCA1における病気素因たる突然変異についての最初のスクリーニングにおいて、各家系における病気素因たるハプロタイプを担う1の個人からのDNAをテストした。23のコーディングエキソンおよび関連スプライス結合をゲノムDNA試料から、またはリンパ球mRNAから調製したcDNAから増幅した。増幅したDNA配列をDNA配列を野生型配列と比較すると、8の家系試料のうち4つが配列変異体を含有することが判明した(表12)。   In the initial screen for predisposing mutations in BRCA1, DNA from one individual bearing the predisposing haplotype in each family was tested. Twenty-three coding exons and associated splice junctions were amplified from genomic DNA samples or from cDNA prepared from lymphocyte mRNA. When the amplified DNA sequence was compared with the wild type sequence, it was found that 4 out of 8 family samples contained sequence variants (Table 12).

Figure 2005124578
Figure 2005124578

すべての4つの配列変異体はヘテロ接合であり、各々は家系のうち1つでのみ出現する。家系2082はエキソン11にナンセンス突然変異を含有する(図9)。家系1910はエキソン20に単一のヌクレオチド挿入を含有する(図10)。家系2099はエキソン21にミスセンス突然変異を含有し、その結果、Met→Arg置換となる。フレームシフトおよびナンセンス突然変異はBRCA1産物の機能にとって破壊的となるようである。家系1910におけるフレームシフト対立遺伝子によってコードされたペプチドは、野生型C−末端から108残基で始まる改変されたアミノ酸配列を含有する。家系1901におけるフレームシフト対立遺伝子によってコードされたペプチドは、野生型N−末端から24番目の残基で始まるアミノ酸配列を含有する。家系2082における突然変異対立遺伝子はC−末端から551残基失う蛋白質をコードする。家系2099で観察されたミスセンス置換は、それが小さな疎水性アミノ酸(Met)を大きな荷電残基(Arg)によって置き換えるので、潜在的に破壊的である。また、11の共通の多形も同定され、これは暗号配列に8つ、およびイントロンに3つである。   All four sequence variants are heterozygous, each appearing in only one of the families. Family 2082 contains a nonsense mutation in exon 11 (FIG. 9). Family 1910 contains a single nucleotide insertion in exon 20 (FIG. 10). Family 2099 contains a missense mutation in exon 21, resulting in a Met → Arg substitution. Frameshift and nonsense mutations appear to be disruptive to the function of the BRCA1 product. The peptide encoded by the frameshift allele in family 1910 contains a modified amino acid sequence starting at 108 residues from the wild-type C-terminus. The peptide encoded by the frameshift allele in family 1901 contains an amino acid sequence starting at the 24th residue from the wild type N-terminus. The mutant allele in family 2082 encodes a protein that loses 551 residues from the C-terminus. The missense substitution observed in family 2099 is potentially destructive because it replaces a small hydrophobic amino acid (Met) with a large charged residue (Arg). Eleven common polymorphisms have also been identified, eight in the coding sequence and three in the introns.

家系2035で研究した個人は明らかにBRCA1で調節突然変異を含有する。彼女のcDNAでは、多形部位(塩基3667においてA→G)はヘテロ接合を出現し、他方、彼女のゲノムDNAはこの部位においてヘテロ接合性を明らかとした(図11)。この観察についての可能な説明は、彼女の突然変異したBRCA1対立遺伝子からのmRNAは、その産生または安定性に影響する突然変異のため存在しないということである。この可能性をさらにBRCA1暗号領域における5つの多形部位を調べることによって調べ、これはBRCA1転写体における3.5kbもの多くによって分離されている。彼女のゲノムDNAが多形につきヘテロ接合性を表す場合において、cDNAはヘテロ接合性である。他の家系からのおよび家系2035における非ハプロタイプキャリアにえける個人において、これらの多形部位はcDNAにおけるヘテロ接合性として観察され、これは、cDNAからの増幅が1の対立遺伝子に有利に片寄らなかったことを示す。この分析は、家系2035におけるBRCA1突然変異は転写を妨げ、またはBRCA1転写体の不安定性または異常なスプライシングを引き起こすことを示す。   Individuals studied in pedigree 2035 clearly contain regulatory mutations in BRCA1. In her cDNA, the polymorphic site (A → G at base 3667) appeared heterozygous, whereas her genomic DNA revealed heterozygosity at this site (FIG. 11). A possible explanation for this observation is that the mRNA from her mutated BRCA1 allele is absent due to mutations that affect its production or stability. This possibility was further investigated by examining five polymorphic sites in the BRCA1 coding region, which are separated by as much as 3.5 kb in the BRCA1 transcript. The cDNA is heterozygous when her genomic DNA is heterozygous for the polymorphism. In individuals from other families and in non-haplotype carriers in family 2035, these polymorphic sites are observed as heterozygous in the cDNA, which indicates that amplification from the cDNA does not favor one allele. It shows that. This analysis shows that a BRCA1 mutation in family 2035 prevents transcription or causes instability or abnormal splicing of the BRCA1 transcript.

BRCA1ハプロタイプを持つBRCA1突然変異の共分離および集団頻度分析
蛋白質機能を潜在的に破壊する以外、2つの基準が候補病気素因突然変異としての資格を有する配列変異体で満たされなければならない。変異体は、1)病気素因BRCA1ハプロタイプを担う家系からの個人において存在し、家系の他の構成員では存在せず、2)一般的集団では稀であるということに合致しなければならない。
Cosegregation and population frequency analysis of BRCA1 mutations with a BRCA1 haplotype Except for potentially disrupting protein function, two criteria must be met with sequence variants that qualify as candidate disease predisposing mutations. Mutants must be consistent with 1) present in individuals from families with a predisposing BRCA1 haplotype, not present in other members of the family, and 2) rare in the general population.

各突然変異をBRCA1に関する共分離につきテストした。家系1910におけるフレームシフト突然変異については、2の他のハプロタイプキャリアおよび1の非−キャリアを配列決定した(図10)。キャリアのみがフレームシフト突然変異を呈した。家系2082におけるCからTへの変化は新しいAvrII制限部位を創製した。家系における他のキャリアおよび非−キャリアを制限部位の存在についてテストした(図9)。対立遺伝子特異的オリゴヌクレオチド(ASO)を、家系2099における配列変異体の存在を検出するために設計した。該家系からのいくつかの個人、病気素因対立遺伝子に関連するハプロタイプを担うことが知られているいくらか、および関連ハプロタイプを担わないことが知られている他のものを、該家系で従前に検出されている突然変異につき、ASOによってスクリーニングした。各家系において、対応する突然変異対立遺伝子がBRCA1−関連ハプロタイプを担う個人で検出され、非キャリアでは検出されなかった。家系2035からの個人で観察された潜在的調節突然変異の場合において、該家系におけるキャリアからのcDNAおよびゲノムDNAを、多形部位におけるヘテロ接合性につき比較した。いずれの場合においても、cDNA試料における区別された対立遺伝子は、BRCA1病気素因対立遺伝子を担う染色体上に存在することが示された(図11)。   Each mutation was tested for co-segregation for BRCA1. For the frameshift mutation in pedigree 1910, two other haplotype carriers and one non-carrier were sequenced (FIG. 10). Only the carrier exhibited a frameshift mutation. The change from C to T in pedigree 2082 created a new AvrII restriction site. Other carriers and non-carriers in the family were tested for the presence of restriction sites (Figure 9). Allele-specific oligonucleotides (ASO) were designed to detect the presence of sequence variants in family 2099. Several individuals from the family have previously been detected in the family, some known to carry haplotypes associated with disease predisposing alleles, and others known not to carry related haplotypes The mutations being screened were screened by ASO. In each family, the corresponding mutant allele was detected in individuals with BRCA1-related haplotypes and not in non-carriers. In the case of potential regulatory mutations observed in individuals from family 2035, cDNA and genomic DNA from carriers in the family were compared for heterozygosity at polymorphic sites. In either case, the distinguished allele in the cDNA sample was shown to be present on the chromosome bearing the BRCA1 disease predisposing allele (FIG. 11).

突然変異は集団における単に共通の多形であるという可能性を排除するために、各突然変異についてのASOを用いて、正常DNA試料の組をスクリーニングした。白人における遺伝子頻度見積もりはユタ州集団からのランダム試料に基づくものであった。アフリカン−アメリカンにおける遺伝子頻度見積もりは、彼女の連鎖研究で用いたアフリカン−アメリカンおよび20人の新しく生まれたユタ州のアフリカン−アメリカンに由来するM.Peracek−Vanceによって提供された39試料に基づくものであった。4の潜在的病気素因突然変異のいずれも適当な対照集団で見いだされず、これは、それらが一般的な集団で稀であることを示す。かくして、BRCA1感受性対立遺伝子についての2の重要な要件は候補病気素因突然変異によって満たされた:1)病気を持つ突然変異対立遺伝子の共分離、および2)対照における突然変異対立遺伝子の不存在(これは、一般的集団における低遺伝子頻度を示す)   In order to eliminate the possibility that the mutations were simply a common polymorphism in the population, ASO for each mutation was used to screen a set of normal DNA samples. Gene frequency estimates in Caucasians were based on random samples from the Utah population. Gene frequency estimates in African-American are from M. african-American and 20 newly born Utah African-Americans used in her linkage study. Based on 39 samples provided by Peracek-Vance. None of the four potential disease predisposing mutations were found in the appropriate control population, indicating that they are rare in the general population. Thus, two important requirements for the BRCA1 susceptibility allele were met by candidate disease predisposing mutations: 1) co-segregation of diseased mutant alleles, and 2) absence of mutant alleles in controls ( This indicates a low gene frequency in the general population)

BRCA1突然変異の表現型発現
BRCA1蛋白質に対する該突然変異の効果はBRCA1家系における観察された表現型発現における差異と相関した。ほとんどのBRCA1家系は、乳癌についてのものと比較して(Eastonら、1993)、中程度に増大した卵巣癌危険を有し、より小さなサブセットは卵巣癌の高い危険を有する。BRCA1突然変異が検出された4つの家系のうち3つが前者のカテゴリーに入り、他方、4番目(K2082)が高い卵巣癌危険群に入る。K2082で見い出されたBRCA1ナンセンス突然変異は検出された他の突然変異よりもアミノ末端に近く位置するので、それは異なる表現型を有すると予測される。事実、家系K2082突然変異は高い卵巣癌可能性を有し、他の家系よりも乳癌ケースのより遅い平均診断年齢を有する(Goldgarら、1994)。開始年齢におけるこの差異は、より小さく、より高度に浸透性の(penetrant)家族における確実性の偏りによりものであるか、またはそれはBRCA1突然変異の挙動における組織−特異的差異を反映しているものであろう。公知のBRCA1突然変異を分離する他の3つの家系は、平均して、乳癌毎10ケースにつき1の卵巣癌を有するが、その20代後半または30代前半において診断された乳癌ケースの高集団を有する。フレームシフト突然変異を有する家系1910は注目するに値する。何故ならば、4人の罹患固人のうち3人が両側乳癌を有し、各ケースにおいて、第2の腫瘍が最初の出現から1人以内に診断されたからである。潜在的調節BRCA1突然変異を分離する家系2035は劇的な表現型を有することが予測されよう。この家系における乳癌ケースの80%が50歳前に起こる。この数字は当該セットにおけるいずれとも同程度に高く、これは高い浸透性のBRCA1突然変異対立遺伝子を示唆する(表11)。
Phenotypic expression of BRCA1 mutation The effect of the mutation on the BRCA1 protein correlated with differences in observed phenotypic expression in the BRCA1 family. Most BRCA1 families have a moderately increased risk of ovarian cancer compared to that for breast cancer (Easton et al., 1993), with a smaller subset having a higher risk of ovarian cancer. Of the four families with BRCA1 mutations detected, three fall into the former category, while the fourth (K2082) falls into the high ovarian cancer risk group. Since the BRCA1 nonsense mutation found in K2082 is located closer to the amino terminus than the other mutations detected, it is predicted to have a different phenotype. In fact, the family K2082 mutation has a high likelihood of ovarian cancer and has a later mean age of diagnosis of breast cancer cases than other families (Goldgar et al., 1994). This difference in onset age is due to a bias in certainty in the smaller, more penetrant family, or it reflects tissue-specific differences in the behavior of the BRCA1 mutation Will. The other three families that isolate known BRCA1 mutations, on average, have one ovarian cancer per 10 cases of breast cancer, but have a high population of breast cancer cases diagnosed in their late 20s or early 30s Have. It is worth noting the family 1910 with the frameshift mutation. This is because 3 out of 4 affected individuals have bilateral breast cancer and in each case the second tumor was diagnosed within 1 person from the first appearance. A family 2035 that isolates a potential regulatory BRCA1 mutation would be expected to have a dramatic phenotype. 80% of breast cancer cases in this family occur before age 50. This number is as high as any in the set, suggesting a highly penetrating BRCA1 mutant allele (Table 11).

前記突然変異は明らかに有害で、非常に若い年齢の婦人において乳癌を引き起こすが、突然変異を持つ4の家系の各々は、悪性を発病することなく80歳まで生きた少なくとも1人の突然変異担持婦人を含む。BRCA1突然変異の効果を軽減し得る他の遺伝的または環境的因子を続いて突き止めるのは、該研究で最高に重要であろう。   Although the mutation is clearly harmful and causes breast cancer in very young women, each of the four families with the mutation carries at least one mutation that lived up to 80 years of age without developing malignancy Including women. It would be of utmost importance in the study to subsequently locate other genetic or environmental factors that could reduce the effects of BRCA1 mutations.

8の推定BRCA1−連鎖家系のうち4つにおいて、潜在的病気素因突然変異は見いだされなかった。これらの4つのうち3つは0.55未満のBRCA1−連鎖マーカーについてのLODスコアを有する。かくして、これらの家系は、実際は、BRCA1病気素因対立遺伝子を分離しないようである。あるいは、これらの4の家系における突然変異は、例えば、転写体のレベルに影響し、従って、検出を遠ざけるBRCA1の領域に存在するらしい。   In 4 of 8 putative BRCA1-linked families, no potential disease predisposing mutations were found. Three of these four have LOD scores for BRCA1-linked markers of less than 0.55. Thus, these families do not appear to segregate the BRCA1 disease predisposing allele in practice. Alternatively, mutations in these four families are likely to be present in the region of BRCA1, which affects, for example, the level of transcripts and thus keeps detection away.

癌におけるBRCA1の役割
現在同定されているほとんどの腫瘍サプレッサー遺伝子は、存在しない、非機能的または機能が低下した蛋白質産物を生じる。TP53突然変異の大部分はミスセンスであり;これらのうちいくつかは、野生型産物の機能に干渉する異常p53分子を生産することが示されている(Shaulianら、1992;Srivastavaら,1993)。同様の優性な陰性の作用メカニズムが、切形分子を生産するいくつかの腺腫ポリーブ症コリ(coli)(APC)対立遺伝子につき(Suら、1993)、および蛋白質のDNA結合を改変するWilmsの腫瘍遺伝子(WT1)における点突然変異につき(Littleら、1993)提案されている。BRCA1暗号配列で観察された突然変異の性質は優性陰性蛋白質または非機能的蛋白質の生産に一致する。家系2035で推定された調節突然変異は優性陰性ではありえない;むしろ、この突然変異は影響された対立遺伝子からのBRCA1発現の低下または完全な喪失を引き起こすようである。
The role of BRCA1 in cancer Most tumor suppressor genes currently identified give rise to non-functional or reduced function protein products. Most of the TP53 mutations are missense; some of these have been shown to produce abnormal p53 molecules that interfere with the function of the wild-type product (Shaulian et al., 1992; Srivastava et al., 1993). A similar dominant negative mechanism of action is found for several adenoma polyvosis coli (APC) alleles that produce truncated molecules (Su et al., 1993), and Wilms' tumors that alter protein DNA binding A point mutation in the gene (WT1) has been proposed (Little et al., 1993). The nature of the mutation observed in the BRCA1 coding sequence is consistent with the production of dominant negative or nonfunctional proteins. The regulatory mutation putative in family 2035 cannot be dominant negative; rather, this mutation appears to cause a reduction or complete loss of BRCA1 expression from the affected allele.

BRCA1蛋白質は、多数のDNA結合蛋白質で見い出された、核酸への亜鉛−依存性結合と深く結び付いたものと類似の、CHC亜鉛−フィンガードメインを含有する。BRCA1の最初の180アミノ酸は酸性残基よりも5個多い塩基性残基を含有する。対照的に、分子の残りは非常に酸性で、70個の酸性残基が正味に過剰である。過剰の負電荷はC−末端近くに特に集中している。かくして、1の可能性は、BRCA1がN−末端DNA結合ドメインおよびC−末端トランス活性化「酸性ブロブ(blob)」ドメインと共に転写因子をコードするということである。興味深いことには、もう1つの家族性腫瘍サプレッサー遺伝子、WT1、も亜鉛−フィンガーモチーフを含有する(Haberら、1990)。WT1における多くの癌病気素因突然変異は亜鉛−フィンガードメインを改変する(Littleら、1993;Haberら、1990;Littleら、1992)。WT1は、転写因子、およびWT1のDNA結合特性を改変する亜鉛−フィンガードメインの一部をコードするエキソンの別のスプライシングをコードする(Bickmoreら、1992)。WT1 mRNAの別にスプライスされたいくつかの形態は転写リプレッサーとして作用する分子を創製する(Drummondら、1994)。いくつかのBRCA1スプライシング変異体は亜鉛−フィンガーモチーフを改変し、WT1で起こるのに類似の調節メカニズムがBRCA1に適用できるという可能性を生じる。 The BRCA1 protein contains a C 3 HC 4 zinc-finger domain similar to that found in many DNA binding proteins, deeply associated with zinc-dependent binding to nucleic acids. The first 180 amino acids of BRCA1 contain 5 more basic residues than acidic residues. In contrast, the rest of the molecule is very acidic with a net excess of 70 acidic residues. Excess negative charge is particularly concentrated near the C-terminus. Thus, one possibility is that BRCA1 encodes a transcription factor with an N-terminal DNA binding domain and a C-terminal transactivated “acid blob” domain. Interestingly, another familial tumor suppressor gene, WT1, also contains a zinc-finger motif (Haber et al., 1990). Many cancer predisposing mutations in WT1 alter the zinc-finger domain (Little et al., 1993; Haber et al., 1990; Little et al., 1992). WT1 encodes an alternative splicing of transcription factors and exons that encode portions of the zinc-finger domain that modify the DNA binding properties of WT1 (Bickmore et al., 1992). Several alternatively spliced forms of WT1 mRNA create molecules that act as transcriptional repressors (Drummond et al., 1994). Some BRCA1 splicing variants modify the zinc-finger motif, giving rise to the possibility that a similar regulatory mechanism can be applied to BRCA1 as occurs in WT1.

実施例9
BRCA1突然変異についての腫瘍の分析
最もBRCA1突然変異を含有するらしい腫瘍についての分析に焦点を当てるため、初代乳癌および卵巣癌をBRCA1領域におけるLOHにつきタイプ分けした。3つの高度に多形の単純縦列反復マーカーを用いてLOH:D17S1323およびD17S855(これは、BRCA1の遺伝子内である)、およびD17S1327(これは、BRCA1に対してほぼ100kb末端側にある)をアクセスした。情報的ケース(すなわち、生殖細胞系がヘテロ接合性である)における合計したLOH頻度は乳癌につき32/72(44%)、卵巣癌につき12/21(57%)であり、当該領域におけるLOHの従前の測定に一致する(Futrealら、1992b;Jacobsら、1993;Satoら、1990;Ecclesら、1990;Croppら、1994)。かくして、分析により、混血人種の32の乳房腫瘍および12の卵巣腫瘍のパネルおよびBRCA突然変異につき調べるべき開始年齢が定義された。一本鎖コンフォメーション分析(SSCA)および直接配列決定の組合せによって、該遺伝子の完全な5,589bp暗号領域およびイントロン/エキソン境界配列をこの腫瘍セットでスクリーニングした。
Example 9
Tumor Analysis for BRCA1 Mutations To focus on analysis for tumors most likely to contain BRCA1 mutations, primary and ovarian cancers were typed for LOH in the BRCA1 region. Access LOH: D17S1323 and D17S855 (which are within the gene of BRCA1) and D17S1327 (which is approximately 100 kb terminal to BRCA1) using three highly polymorphic simple tandem repeat markers did. The total LOH frequency in the informational case (ie germline is heterozygous) is 32/72 (44%) for breast cancer and 12/21 (57%) for ovarian cancer, and the LOH frequency in the region Consistent with previous measurements (Futreal et al., 1992b; Jacobs et al., 1993; Sato et al., 1990; Eccles et al., 1990; Cropp et al., 1994). Thus, the analysis defined a panel of 32 breast and 12 ovarian tumors of mixed race and the starting age to be examined for BRCA mutations. The complete 5,589 bp coding region and intron / exon border sequences of the gene were screened in this tumor set by a combination of single strand conformation analysis (SSCA) and direct sequencing.

合計6の突然変異(そのうち2つが同一)が見い出され、1つが卵巣腫瘍におけるもの、4つが乳房腫瘍におけるもの、1つが男性の非罹患ハプロタイプキャリアにおけるものであった(表13)。1の突然変異Glu1541Terは、323個のアミノ酸を失った切形蛋白質を生じるであろう停止コドンをカルボキシル末端に導入した。加えて、2のミスセンス突然変異が同定された。これらはAla1708GluおよびMet1775Argであって、荷電残基による小さな疎水性残基の置換を含む。患者17764および19964は同一家族からのものである。患者OV24において、ヌクレオチド2575は失欠され、患者17764および19964においてヌクレオチド2993−2996は失欠されている。   A total of 6 mutations (of which 2 were identical) were found, 1 in ovarian tumors, 4 in breast tumors, and 1 in male unaffected haplotype carriers (Table 13). One mutation, Glu1541Ter, introduced a stop codon at the carboxyl terminus that would result in a truncated protein that had lost 323 amino acids. In addition, two missense mutations have been identified. These are Ala1708Glu and Met1775Arg, including substitution of small hydrophobic residues by charged residues. Patients 17764 and 19964 are from the same family. In patient OV24, nucleotide 2575 is missing and in patients 17764 and 19964 nucleotides 2993-2996 are missing.

Figure 2005124578
Figure 2005124578

いくつかの系の証拠は、すべての5の突然変異はBRCA1感受性対立遺伝子を表すことを示唆する。
(i)すべての突然変異は生殖細胞系に存在する;
(ii)すべては、適当な対照集団に不存在で、それらは共通の多形ではないことを示唆する;
(iii)BRCA1感受性対立遺伝子を分離する家系に属する患者からの腫瘍にも当てはまるが(Smithら、1992;Kelsellら、1993)(もし突然変異が中性多形を表すと、それらはケースの50%でのみ保持されるべきである)、各突然変異対立遺伝子は腫瘍で保有される;
(iv)突然変異を持つ4つの乳癌ケースにおける開始年齢は24歳と42歳の間で変化し、BRCA1を持つ個人における乳癌の早期開始年齢と合致する;同様に、卵巣癌ケースは44歳で診断され、これはすべての卵巣癌の最も若い13%に入る;および最後に、
(v)腫瘍の組はこの基準に関して選択されなかったにも拘わらず、5ケースのうち3つは、過去にさかのぼるとそれらの医学記録で見いだされる乳癌および卵巣癌の陽性家族歴史を有する。
Several lines of evidence suggest that all 5 mutations represent a BRCA1-sensitive allele.
(I) all mutations are present in the germline;
(Ii) All are absent from the appropriate control population, suggesting that they are not common polymorphs;
(Iii) This also applies to tumors from patients belonging to families that isolate BRCA1-sensitive alleles (Smith et al., 1992; Kelsel et al., 1993) (if the mutation represents a neutral polymorphism, they are Each mutant allele is retained in the tumor;
(Iv) The age of onset in the four breast cancer cases with mutations varies between 24 and 42 years, consistent with the early age of onset of breast cancer in individuals with BRCA1; Diagnosed, which falls into the youngest 13% of all ovarian cancers; and finally,
(V) Three of the five cases have a positive family history of breast and ovarian cancer found in their medical records dating back in the past, even though the tumor set was not selected for this criterion.

BT106は24歳で乳癌と診断された。彼女の母親は卵巣癌を有し、彼女の父親は黒色腫を有し、彼女の父方祖母もまた乳癌を有した。患者MC44(アフリカン−アメリカン)は42歳で両側乳癌を有した。この患者は34歳で乳癌で死亡した姉妹、リンパ腫で死亡したもう1人の姉妹、および肺癌で死亡した兄弟を有した。彼女の突然変異(Met1775Arg)は以前家系2099(BRCA1感受性対立遺伝子を分離し、アフリカン−アメリカンおよび白人対照では不存在であるアフリカン−アメリカン)で検出されている。我々の知識では、患者MC44は家系2099に関連しない。稀な突然変異対立遺伝子の検出(BRCA1家系で1回および明らかに無関係の早期開始乳癌ケースで1回)は、Met1775Arg変化はアフリカン−アメリカンで共通の病気素因であろうことを示唆する。総合すると、これらの観察は腫瘍におけるすべての4つのBRCA1突然変異は感受性対立遺伝子を表し;体細胞突然変異は分析した試料で検出されなかった。   BT106 was diagnosed with breast cancer at age 24. Her mother had ovarian cancer, her father had melanoma, and her paternal grandmother also had breast cancer. Patient MC44 (African-American) was 42 years old and had bilateral breast cancer. The patient had a sister who died of breast cancer at age 34, another sister who died of lymphoma, and a brother who died of lung cancer. Her mutation (Met1775Arg) has been previously detected in family 2099 (African-American that isolates the BRCA1-sensitive allele and is absent in the African-American and Caucasian controls). In our knowledge, patient MC44 is not related to family 2099. Detection of rare mutant alleles (once in the BRCA1 family and once in the unrelated early-onset breast cancer case) suggests that the Met1775Arg change may be a common disease predisposition in African-American. Taken together, these observations show that all four BRCA1 mutations in the tumor represent sensitive alleles; somatic mutations were not detected in the analyzed samples.

体細胞BRCA1突然変異の数の少なさは、17qについてのLOHの頻度および癌進行における腫瘍サプレッサーとしての感受性遺伝子の通常の役割を仮定すれば、予測されるものではなかった。この結果については3つの可能な説明がある:(i)我々のスクリーニング手法によると暗号配列においていくつかのBRCA1突然変異が失われていた;(ii)BRCA1体細胞突然変異は主としてコーディングエキソンの外側にある;および(iii)17qにおけるLOH事象はBRCA1体細胞突然変異を反映しない。   The low number of somatic BRCA1 mutations was not expected given the frequency of LOH for 17q and the normal role of susceptibility genes as tumor suppressors in cancer progression. There are three possible explanations for this result: (i) Several BRCA1 mutations were lost in the coding sequence according to our screening procedure; (ii) BRCA1 somatic mutations were primarily outside the coding exon. And (iii) the LOH event at 17q does not reflect a BRCA1 somatic mutation.

もし体細胞BRCA1突然変異が乳癌および卵巣癌で真に稀であれば、これはBRCA1の生物学について強力な密接関係を有するであろう。体細胞BRCA1突然変異の明らかな欠如は、一般的な集団における腫瘍と比較して、遺伝的に病気素因のBRCA1キャリアにおる腫瘍の発生においていくつかの基本的差異があるであろうことを含蓄する。例えば、BRCA1における突然変異は乳癌および卵巣発病における特定の早期段階において腫瘍形成に対してのみ効果を有し得る。この確率は閉経期前乳癌におけるBRCA1についての主要機能と一致する。乳癌および卵巣癌におけるBRCA1の役割についてのかかるモデルは、生殖ホルモンとBRCA1機能との間の相互作用を予測させる。しかしながら、家族性−散発性の乳癌および卵巣癌の臨床的もしくは病理学的差異(開始年齢以外)は記載されていない(Lynchら、1990)。他方、乳癌の家族履歴を持つ患者からの乳癌における増大したTP53突然変異および微小付随体の不安定性の最近の知見(Glebovら、1994)は病気素因個人で遺伝的に生気する腫瘍のいくつらかの差異を反映するであろう。今や、この現象におけるBRCA1の関与は直接的に扱える。あるいは、体細胞BRCA1突然変異の欠如は、BRCA1と同一の腫瘍抑制経路で機能するが、総合すると散発性腫瘍における突然変異についてのより都合よい標的を表す多数の遺伝子の存在に由来するであろう。遺伝経路における単一要素の突然変異は一般に該経路を破壊するのに十分であるので、BRCA1は他の要素の突然変異速度の合計よりもかなり低い速度で突然変異するであろう。   If somatic BRCA1 mutations are truly rare in breast and ovarian cancer, this will have a strong close relationship with the biology of BRCA1. The apparent lack of somatic BRCA1 mutations implies that there may be some fundamental differences in the development of tumors in genetically predisposed BRCA1 carriers compared to tumors in the general population To do. For example, mutations in BRCA1 may only have an effect on tumor formation at certain early stages in breast cancer and ovarian pathogenesis. This probability is consistent with the primary function for BRCA1 in premenopausal breast cancer. Such a model for the role of BRCA1 in breast and ovarian cancer predicts an interaction between reproductive hormones and BRCA1 function. However, clinical or pathological differences (other than the onset age) of familial-sporadic breast cancer and ovarian cancer have not been described (Lynch et al., 1990). On the other hand, recent findings of increased TP53 mutations and micro-incidental instability in breast cancer from patients with a family history of breast cancer (Glebov et al., 1994) have revealed some of the genetically viable tumors in predisposed individuals Will reflect the difference. Now, the involvement of BRCA1 in this phenomenon can be handled directly. Alternatively, the lack of somatic BRCA1 mutations may result from the presence of multiple genes that function in the same tumor suppressor pathway as BRCA1, but collectively represent a more convenient target for mutations in sporadic tumors. . Since single element mutations in the genetic pathway are generally sufficient to disrupt the pathway, BRCA1 will mutate at a much lower rate than the sum of the mutation rates of the other elements.

実施例10
BRCA1遺伝子の分析
BRCA1遺伝子の構造および機能は以下の方法によって測定される。
生物学的研究
BRCA1 cDNAを含有する哺乳動物発現ベクターを構築し、該遺伝子中に損傷を持つ適当な乳癌細胞にトランスフェクトする。野生型BRCA1 cDNAならびに改変したBRCA1 cDNAを用いる。該改変したBRCA1 cDNAは改変したBRCA1対立遺伝子から得ることができるか、あるいは後記するごとくに産生できる。培養における表現型復帰(例えば、細胞形態、倍加時間、足場依存性増殖)および動物における表現型復帰(例えば、腫瘍形成性)を調べる。研究では当該遺伝子の野生型および突然変異体形(セクションB)を共に使用する。
Example 10
Analysis of BRCA1 gene The structure and function of the BRCA1 gene are measured by the following method.
Biological Studies A mammalian expression vector containing the BRCA1 cDNA is constructed and transfected into appropriate breast cancer cells that have damage in the gene. Wild type BRCA1 cDNA as well as modified BRCA1 cDNA are used. The modified BRCA1 cDNA can be obtained from the modified BRCA1 allele or can be produced as described below. Phenotypic reversion in culture (eg, cell morphology, doubling time, anchorage dependent growth) and phenotypic reversion in animals (eg, tumorigenicity) are examined. The study uses both wild-type and mutant forms of the gene (Section B).

分子遺伝学研究
イン・ビトロ突然変異誘発を行って、(個人コドンにおける単一塩基対置換およびクラスター電荷→アラニン走査突然変異誘発によって)失欠突然変異体およびミスセンス突然変異体を構築する。該突然変異体を生物学的、生物化学的および生物物理学的研究で用いる。
Molecular Genetics Studies In vitro mutagenesis is performed to construct missing and missense mutants (by single base pair substitution and cluster charge → alanine scanning mutagenesis at individual codons). The mutant is used in biological, biochemical and biophysical studies.

メカニズム研究
BRCA1蛋白質が公知および未公知DNA配列に結合する能力を調べる。プロモーターをトランス活性化するその能力は、哺乳動物細胞における一時的レポーター発現系によって分析する。粒子−捕獲および酵母の2−ハイブリッド系のごとき通常の手法を用いていずれの機能的パートナーも見つけ同定する。該パートナーの性質および機能を特徴付ける。これらのパートナーは薬物発見用の標的である。
Mechanism studies The ability of BRCA1 protein to bind to known and unknown DNA sequences is examined. Its ability to transactivate the promoter is analyzed by a transient reporter expression system in mammalian cells. Any functional partner is found and identified using conventional techniques such as particle-capture and yeast two-hybrid systems. Characterize the nature and function of the partner. These partners are targets for drug discovery.

構造研究
組換え蛋白質をイー・コリ(E.coli)、酵母、昆虫および/または哺乳動物細胞で産生させ、結晶学およびNMR実験で使用する。蛋白質の分子作成も使用する。これらの研究は構造から導かれる薬物設計を容易とする。
Structural studies Recombinant proteins are produced in E. coli, yeast, insect and / or mammalian cells and used in crystallography and NMR experiments. Also used to make protein molecules. These studies facilitate drug design derived from the structure.

実施例11
試料中におけるBRCA1の存在を検出するための2工程アッセイ
Antonarakisら(1985)によって開示されている方法に従って患者試料を加工し、1%アガロースゲルを通して分離し、サザーンブロット分析用にナイロン膜に移す。GS Geneリンカー(Bio−Rad)を用い、膜を150mJでUV架橋させる。配列番号1のヌクレオチド3631−3930位に対応するBRCA1プローブをpTZ18Uにサブクローンする。M13KO7ヘルパーファージ(Bio−Rad,Richmond,CA)で感染させたイー・コリ(E.coli)MV1190にファゲミド(phagemide)を形質転換する。一本鎖DNAを標準的な手法(Sambrookら、1989参照)により単離する。
Example 11
Two-step assay to detect the presence of BRCA1 in a sample Patient samples are processed according to the method disclosed by Antonio Arakis et al. (1985), separated through a 1% agarose gel and transferred to a nylon membrane for Southern blot analysis. The membrane is UV cross-linked at 150 mJ using GS Gene linker (Bio-Rad). The BRCA1 probe corresponding to nucleotides 3631-3930 of SEQ ID NO: 1 is subcloned into pTZ18U. Phagemid is transformed into E. coli MV1190 infected with M13KO7 helper phage (Bio-Rad, Richmond, Calif.). Single stranded DNA is isolated by standard techniques (see Sambrook et al., 1989).

0.5M NaPO中の7%ドデシル硫酸ナトリウム(SDS)中、65℃にて、ブロットを14−30分間プレハイブリダイズさせる。該方法はNguyenら、1992に記載されているものに従う。該ブロットを、25−50mg/ml一本鎖プローブDNAを含む7%SDS、0.5M NaPO中、65℃で一晩ハイブリダイズさせる。ポスト−ハイブリダイゼーション洗液は65℃における5%SDS、40mM NaPO中の2回の30分間洗液であり、続いて65℃における2回の30分間の1%SDS、40mM NaPO洗液よりなる。 The blot is prehybridized in 7% sodium dodecyl sulfate (SDS) in 0.5 M NaPO 4 at 65 ° C. for 14-30 minutes. The method follows that described by Nguyen et al., 1992. The blot is hybridized overnight at 65 ° C. in 7% SDS, 0.5 M NaPO 4 containing 25-50 mg / ml single stranded probe DNA. The post-hybridization washes are two 30 min washes in 5% SDS, 40 mM NaPO 4 at 65 ° C., followed by two 30 min 1% SDS, 40 mM NaPO 4 washes at 65 ° C. Become.

次いで、該ブロットを室温にてリン酸緩衝生理食塩水(pH6.8)で5分間すすぎ、室温にてPBS中の0.2%カゼインと共に30−60分間インキュベートし、PBS中で5分間すすぐ。次いで、該ブロットを、6M尿素、0.3M   The blot is then rinsed with phosphate buffered saline (pH 6.8) for 5 minutes at room temperature, incubated with 0.2% casein in PBS at room temperature for 30-60 minutes, and rinsed in PBS for 5 minutes. The blot was then analyzed with 6M urea, 0.3M.

NaClおよび5×Denhardt’s溶液(Sambrookら、1989参照)よりなるハイブリダイゼーション緩衝液と共に、45℃にて、震盪する水浴中で5−10分間プレインキュベートする。緩衝液を除去し、50−75μl/cmの新鮮なハイブリダイゼーション緩衝液+共有結合架橋したオリゴヌクレオチド−アルカリ性フォスファターゼの、ユニバートルプライマー部位(UP−AP、Bio−Rad)と相補的なヌクレオチド配列とのコンジュゲートの2.5 nMで置き換える。該ブロットを45℃で20−30分間ハイブリダイズさせ、ポストハイブリダイゼーション洗液を、45℃にて、2回の6M尿素中10分間洗液、1×標準クエン加生理食塩水(SSC)、0.1%SDSおよび1×SSC、0.1%トリトンX−100中の1回洗液としてインキョベートする。該ブロットを室温で1×SSCと共に10分間すすぐ。 Preincubate for 5-10 minutes in a shaking water bath at 45 ° C. with hybridization buffer consisting of NaCl and 5 × Denhardt's solution (see Sambrook et al., 1989). Nucleotide sequence complementary to the universal primer site (UP-AP, Bio-Rad) of 50-75 μl / cm 2 fresh hybridization buffer + covalently crosslinked oligonucleotide-alkaline phosphatase, with buffer removed Replace with 2.5 nM of the conjugate. The blot was hybridized at 45 ° C. for 20-30 minutes and the post-hybridization wash was washed twice at 45 ° C. for 10 minutes in 6 M urea, 1 × standard citrated saline (SSC), 0 Incubate as a single wash in 0.1% SDS and 1 × SSC, 0.1% Triton X-100. Rinse the blot for 10 minutes with 1 × SSC at room temperature.

0.1Mジエタノールアミン、1mM MgCl、0.02%アジ化ナトリウム、pH10.0からなる基質緩衝液中で震盪しつつ、ブロットを室温で10分間インキョベートする。基質緩衝液および0.2mM AMPPD(3−(2’−スピロアダマンタン)−4−メトキシ−4−(3’−ホスホリルオキシ)フェニル−1,2−ジオキセタン、二ナトリウム塩、Bio−Rad)と共に個々のブロットをヒートシール可能なバッグに入れる。震盪しつつの室温での20分のインキュベーション後、過剰のAMPPD溶液を除去する。該ブロットをX−線に一晩暴露する。陽性バンドはBRCA1の存在を示す。 0.1M diethanolamine, 1 mM MgCl 2, 0.02% sodium azide, while shaking in the substrate buffer consisting of pH 10.0, to Inkyobeto 10 minutes at room temperature the blots. Individual with substrate buffer and 0.2 mM AMPPD (3- (2′-spiroadamantane) -4-methoxy-4- (3′-phosphoryloxy) phenyl-1,2-dioxetane, disodium salt, Bio-Rad) In a heat-sealable bag. After 20 minutes incubation at room temperature with shaking, excess AMPPD solution is removed. The blot is exposed to X-rays overnight. A positive band indicates the presence of BRCA1.

実施例12
BRCA1に対するポリクローナル抗体の作製
BRCA1暗号配列のセグメントをイー・コリ中の融合蛋白質として発現させた。過剰に生産された蛋白質をゲル溶出によって精製し、これを用いて、HarlowおよびLane、1988によって記載されているものと同様の手法を用い、ウサギおよびマウスを免疫化した。この手法は種々の他の蛋白質に対してAbsを生じることが示されている(例えば、Kraemerら、1993)。
Example 12
Production of polyclonal antibody against BRCA1 A segment of the BRCA1 coding sequence was expressed as a fusion protein in E. coli. Overproduced protein was purified by gel elution and used to immunize rabbits and mice using techniques similar to those described by Harlow and Lane, 1988. This approach has been shown to generate Abs against a variety of other proteins (eg, Kraemer et al., 1993).

略言すれば、BRCA1暗号配列のストレッチをプラスミドPET5A(Novagen,Inc.,Madison,WI)中の融合蛋白質としてクローン化した。BRCA1を組み込んだ配列は配列番号2の#1361−1554に対応するアミノ酸を含む。IPTGでの誘導の後、予測される分子量を持つ融合蛋白質の過剰生産を、SDS/PAGEによって確認した。融合蛋白質は電気溶出によってゲルから精製した。BRCA1融合産物としての蛋白質の同定は、N−末端における蛋白質配列決定によって確認した。次いで、該精製した蛋白質をウキザにおける免疫原として使用した。ウサギをフロイントの完全なアジュバント中の100μg蛋白質で免疫化し、3週間隔で2回(最初、フロイントの不完全アジュバント中の免疫原100μgで、続いてPBS中の免疫原100μg)追加免疫した。しかる後、血清を含有する抗体を2週間収集する。   Briefly, a stretch of the BRCA1 coding sequence was cloned as a fusion protein in plasmid PET5A (Novagen, Inc., Madison, WI). The sequence incorporating BRCA1 includes the amino acids corresponding to # 1361-1554 of SEQ ID NO: 2. After induction with IPTG, overproduction of the fusion protein with the expected molecular weight was confirmed by SDS / PAGE. The fusion protein was purified from the gel by electroelution. The identification of the protein as a BRCA1 fusion product was confirmed by protein sequencing at the N-terminus. The purified protein was then used as an immunogen in Ukiza. Rabbits were immunized with 100 μg protein in Freund's complete adjuvant and boosted twice at 3 week intervals (first with 100 μg of immunogen in Freund's incomplete adjuvant followed by 100 μg of immunogen in PBS). Thereafter, serum-containing antibodies are collected for 2 weeks.

この手法を反復して、BRCA1遺伝子の突然変異体形に対する抗体を得る。野生型BRCA1に対する抗体と組み合わせて、これらの抗体を用いて種々の組織および生物学的流体中の突然変異体形の存在および相対的レベルを検出する。   This procedure is repeated to obtain antibodies against mutant forms of the BRCA1 gene. In combination with antibodies against wild type BRCA1, these antibodies are used to detect the presence and relative levels of mutant forms in various tissues and biological fluids.

実施例13
BRCA1に特異的なモノクローナル抗体の作製
以下のプロトコルに従ってモノクローナル抗体を作製する。よく知られているごとく、グルタルアルデヒドまたはEDCを用い、キーホールリンペットヘモシアニンにコンジュゲートした無傷BRCA1またはBRCA1ペプチド(野生型または突然変異体)からなる免疫原でマウスを免疫化する。
Example 13
Production of monoclonal antibody specific for BRCA1 A monoclonal antibody is produced according to the following protocol. As is well known, mice are immunized with an immunogen consisting of intact BRCA1 or BRCA1 peptide (wild type or mutant) conjugated to keyhole limpet hemocyanin using glutaraldehyde or EDC.

該免疫原をアジュバントと混合する。各マウスに免疫原10ないし100μgの4回の注射を摂取させ、第4回目の注射の後、血液試料をマウスから採取して、該血清が免疫原に対する抗体を含有するか否かを判断する。血清力価をELISAまたはRIAによって測定する。免疫原に対する抗体の存在を示す血清を持つマウスをハイブリドーマ作製のために選択する。   The immunogen is mixed with an adjuvant. Each mouse receives 4 injections of 10-100 μg of immunogen, and after the fourth injection, a blood sample is taken from the mouse to determine whether the serum contains antibodies to the immunogen. . Serum titers are measured by ELISA or RIA. Mice with sera showing the presence of antibodies to the immunogen are selected for hybridoma production.

免疫マウスから脾臓を摘出し、単細胞懸濁液を調製する(HarlowおよびLane、1988参照)。細胞融合は実質的にKohlerおよびMilstein、1975によって記載されているごとくに行う。略言すれば、HarloweおよびLane、1988によって記載されているようにポリエチレングリコールを用い、P3.65.3骨髄腫細胞(American Type Culture Collection,Rockville,MD)を免疫脾臓細胞と融合させる。細胞を96ウェル組織培養プレート中、2×10細胞/ウェルの密度で平板培養する。個々のウェルを増殖につき調べ、増殖したウェルの上清を、野生型または突然変異体BRCA1標的蛋白質を用い、ELISAまたはRIAによって、BRCA1特異的抗体の存在につきテストする。陽性ウェル中の細胞を増殖させ、サブクローンしてモノクローナル抗体を確立し確認する。 Spleens are removed from immunized mice and single cell suspensions are prepared (see Harlow and Lane, 1988). Cell fusion is performed substantially as described by Kohler and Milstein, 1975. Briefly, P3.65.3 myeloma cells (American Type Culture Collection, Rockville, MD) are fused with immune spleen cells using polyethylene glycol as described by Harlowe and Lane, 1988. Cells are plated in 96-well tissue culture plates at a density of 2 × 10 5 cells / well. Individual wells are examined for growth and the supernatants of the grown wells are tested for the presence of BRCA1-specific antibodies by ELISA or RIA using wild type or mutant BRCA1 target proteins. Cells in positive wells are expanded and subcloned to establish and confirm monoclonal antibodies.

所望の特異性を持つクローンを増殖させ、マウスまたは中空繊維中で腹水として増殖させて、特徴付けおよびアッセイ開発のために十分量の抗体を得る。   Clones with the desired specificity are grown and grown as ascites in mice or hollow fibers to obtain a sufficient amount of antibody for characterization and assay development.

実施例14
BRCA1についてのサンドイッチアッセイ
モノクローナル抗体をプレート、チューブ、ビーズ、または粒子のごとき固体表面に結合させる。好ましくは、抗体を96−ウェルELISAプレートのウェル表面に結合させる。BRCA1ペプチド/蛋白質(野生型または突然変異体)を含有する100μl試料(例えば、血清、尿、組織サイトゾル)を固相抗体に結合させる。試料を室温で2時間インキュベートする。次いで、試料流体をデカントし、該固相を緩衝液で洗浄した、未結合物質を除去する。100μlの第2モノクローナル抗体(BRCA1ペプチド/蛋白質上の異なる抗原決定基に対するもの)を該固相に添加する。この抗体を検出器分子(例えば、125I、酵素、蛍光体、または発色団)で標識し、第2抗体と共に固相を室温で2時間インキュベートする。第2抗体をデカントし、固相を緩衝液で洗浄して未結合物質を除去する。
Example 14
Sandwich assay for BRCA1 Monoclonal antibodies are bound to a solid surface such as a plate, tube, bead, or particle. Preferably, the antibody is bound to the well surface of a 96-well ELISA plate. A 100 μl sample (eg, serum, urine, tissue cytosol) containing BRCA1 peptide / protein (wild type or mutant) is bound to the solid phase antibody. Samples are incubated at room temperature for 2 hours. The sample fluid is then decanted and the solid phase washed with buffer to remove unbound material. 100 μl of the second monoclonal antibody (to different antigenic determinants on the BRCA1 peptide / protein) is added to the solid phase. This antibody is labeled with a detector molecule (eg, 125 I, enzyme, fluorophore, or chromophore) and the solid phase is incubated with the second antibody at room temperature for 2 hours. The second antibody is decanted and the solid phase is washed with buffer to remove unbound material.

結合した標識の量(これは、試料に存在するBRCA1ペプチド/蛋白質の量に比例する)を定量する。野生型BRCA1につき特異的なモノクローナル抗体ならびにBRCA1で同定された突然変異体の各々に特異的なモノクローナル抗体を用い、別々のアッセイを行う。   The amount of bound label (which is proportional to the amount of BRCA1 peptide / protein present in the sample) is quantified. Separate assays are performed using a monoclonal antibody specific for wild-type BRCA1 as well as a monoclonal antibody specific for each of the mutants identified with BRCA1.

本発明の方法および組成物は種々の具体例の形態で具体化でき、そのうちの少しのみを本明細書で開示したことは認識されるであろう。本発明の精神を逸脱することなく他の具体例が存在することは当業者に明らかである。かくして、記載した具体化は例示的であって、制限的なものであると解釈されるべきではない。   It will be appreciated that the methods and compositions of the present invention may be embodied in the form of various embodiments, only a few of which are disclosed herein. It will be apparent to those skilled in the art that other embodiments exist without departing from the spirit of the invention. Thus, the described embodiments are illustrative and should not be construed as limiting.

文献のリスト
Altschul,S.F.ら(1990). J.Mol.Biol. 215:195−197
American Cancer Society,Cancer Facts & Figures−1992.(American Cancer Society,Atlanta,GA)
Anand,R.(1992). Techniques for the Analysis of Complex Gemones,(Academic Press)
Andersonら(1980). Proc.Natl.Acad.Sci.USA 77:5399−5403
Anderson,D.E.(1972), J.Natl.Cancer Inst. 48:1029−1034
Anderson,J.A.ら(1992). J.Otolaryngology 21:321
Antonarakis,S.E.ら(1985). New Eng.J.Med. 313:842−848
Ausubel,F.M.ら(1992). Current Protocols in Molecular Biology,J.Wiley and Sons,N.Y.)
Beaucage & Carruthers(1981). Tetra.Letts. 22:1859−1862
Berkner (1992). Curr.Top.Microbiol.Immunol. 158:39−61
Berknerら(1988) BioTechniques 6:616−629
Bickmore,W.A.ら(1992). Science 257:235−7
Bishop,D.T.ら(1988). Genet.Epidemiol. 5:151−169
Bishop,D.T.およびGardner,E.J.(1980) In:Banbury Report 4:Cancer Incidence in Defined Polulations (J.Cairns.,I.L.Lyon,M.Skolnick編),Cold Spring Harbor Laboratory,Cold Spring Harbor,N.Y.,309−408
Botsteinら(1980).Am.J.Hum.Genet. 32:314−331
Bowcock,A.M.ら(1993). Am.J.Hum.Gent. 52:718
BrandyopadhyayおよびTemin(1984). Mol. Cell.Biol. 4:749−754
BreakfieldおよびGeller(1987). Mol. Neurobiol. 1:337−371
Brinsterら(1981). Cell 27:223−231
BuckschacherおよびPanganiban(1992). J.Virol. 65:2731−2739
Bucklerら(1991). Proc. Natl.Acad.Sci.USA 88:4005−4009
Cannon−Albright,L.ら(1994). Cancer
Research 54:2378−2385
Capecchi,M.R.(1989). Science 244:1288
Cariello(1988). Human Genetics 42:726
Claus,E.ら(1991). Am.J.Hum.Genet. 48:232−242
Conner,B.J.ら(1983). Proc.Natl.Acad.Sci.USA 80:278−282
ConstantiniおよびLacy(1981). Nature 294:92−94
Cottenら(1990). Proc. Natl.Acad.Sci.USA 87:4033−4037
Cottonら(1988). Proc.Natl.Acad.Sci.USA 85:4397
Cropp,C.S.ら(1994). Cancer Res. 54:2548−2551
Culverら(1992). Science 256:1550−1552
Curielら(1991a). Proc.Natl.Acad.Sci.USA 88:8850−8854
Curielら(1991b). Hum.Gene Ther.3:147−154
Geutscher.M.(1990). Meth.Enzymology 182(Academic Press,San Diego,Cal.)
Donehower,L.A.ら(1992). Nature 356:215
Drummond,I.A.ら(1994). Mol.Cell Biol. 14:3800−9
Easton,D.ら(1993). Am.J.Hum.Genet.52:678−701
Eccles,D.M.ら(1990). Oncogene 5:1599−1601
Enhancers and Eurkaryotic Gene Expression, Cold Spring Harbor Press, Cold Spring Harbor, New York(1983)
Erickson,J.ら(1990). Science 249:527−533
Fain,P.R.(1992). Cytogen.Cell Genet. 60:178
Felgnerら(1987). Proc. Natl. Acad. Sci. USA 84:7413−7417
Fiersら(1978). Nature 273:113
Finkら(1992).Hum.Gene Ther,3:11−19
Finkelstein,J.ら(1990).Genomics
7:167−172
Preeseら(1990).Biochem.Pharmacol.40:2189−2199
Friedman,T.(1991).In Therapy for Genetic Diseases,T.Friedman編,Oxford University Press,105−121頁
Futreal(1993).Ph.D.Thesis,University of North Carolina,Chapel Hill.
Futreal,A.ら(1992a).Hum.Molec.Genet.1:66
Futreal,P.A.ら(1992b).Cancer Res.52:2624−2627
Glebov,O.K.ら(1994).Cancer Res. 54:3703−3709
Glover,D.(1985). DNA Cloning,IおよびII(Oxford Press)
Go,R.C.P.ら(1983). J.Natl.Cancer
Inst.71:455−461
Goding(1986).Monoclonal Antibodies:Principles and Practice,第二版.(Academic Press,N.Y.)
Godowskiら(1988). Science 241:812−816
Goldgar,D.E.ら(1994).J.Natl.Can.Inst.86:3:200−209
Gordonら(1980).Proc.Natl.Acad.Sci. USA 77:7380−7384
GorzigliaおよびKapikian(1992).J.Virol.66:4407−4412
Grahamおよびvan der Eb(1973).Virology 52:456−467
Grompe,M.(1993).Nature Genetics 5:111−117
Grompe,M.ら(1989).Proc.Natl.Acad.Sci.USA 86:5855−5892
Guthrie,G.& Fink.G,R,(1991). Guide to Yeast Genetics and Molecular
Biology(Academic Press)
Haber,D.A.ら(1990).Cell 61:1257−69
Hall,J.M.ら(1990) Science 250:1684−1689
Hall,J.M.ら(1992). Am.J.Hum.Genet.50:1235−1241
Harlow & Lane(1988). Antibodies:A Laboratory Manual(Cold Spring Harbor Laboratory,Cold Spring Harbor,N,Y.)
Hasty,P.K.ら(1991).Nature 350:243
Helsethら(1990).J.Virol.64:2416−2420 Hodgson,J.(1991). Bio/Technology 9:19−21
Huseら(1989). Science 246:1275−1281
Innisら(1990). PCR Protocols:A Guide to Methods and Applications(Academic Press,San Diego,Cal.)
Jablonski,E.(1986).Nuc.Acids Res.14:6115−6128
Jacobs,I.J.ら(1993).Cancer Res.53:1218−1221
Jacoby,W.B.およびPastan,I.H.(編)(1979).Cell Culture. Mothods in Enzymology,第58巻(Academic Press,Inc.,Harcourt Brace Jovanovich (New York))
Jeffreysら(1985). Nature 314:67−73
Johnsonら(1992). J.Virol.66:2952−2965
Kamb,A.ら(1994).Science 264:436−440
Kandpalら(1990).Nucl.Acids.Res.18:1789−1795
Kanedaら(1989). J.Biol.Chem.264:12126−12129
Kanehisa(1984).Nucl.Acids.Res. 12:203−213
Kelsell,D.P.ら(1993).Juman Mol.Genet. 2:1823−1828
Kinszler,K.W.ら(1991). Science 251:1366−1370
Knudson,A.G.(1993).Nature Genet.5:103
Kohler,G.およびMilstein,C.(1975). Nature 256:495−497
Kozak,M.(1987).Nucleic Acids Res.15:8125−8148
Kraemer,F.B.(1993).J.Lipid Res. 34:663−672
Kubo,T.ら(1988).FEBS Letts.241:119
Landegrenら(1988). Science 242:229
Limら(1992). Circulation 83:2007−2011
Lindsay,S.ら(1987).Nature 327:336−368
Littら(1989).Am.J.Hum.Genet. 44:397−401
Little,M.H.ら(1992). Proc.Natl.Acad.Sci.USA 89:4791
Little,M.H.ら(1993). Hum.Mol.Genet. 2:259
Lovettら(1991). Proc.Natl.Acad.Sci. USA 88:9628−9632
Lynch,H.T.ら(1990). Gynecol.Oncol.36:48−55
Madzakら(1992) J.Gen.Virol. 73:1533−1536
Malkin,D.ら(1990). Science 250:1233−1238
Maniatis.T.ら(1982). Molecular
Cloning:A Laboratoy Manual (Cold
Spring Harbor Laboratory,Cold Spring Harbor,N.Y.)
MannおよびBaltimore(1985).J.Virol. 54:401−407
Margaritteら(1992). Am.J.Hum.Genet. 50:1231−1234
Margolskee(1992).Curr.Top.Microbiol.Immunol. 158:67−90
Martin,R.ら(1990). BioTechniques 9:762−768
Matteucci,M.D.およびCaruthers,M.H. (1981).J.Am.Chem.Sci. 103:3185
Matthews & Kricka(1988)Anal.Biochem. 169:1
Merrifield(1963). J.Am.Chem.Soc. 85:2149−2156
Mttlin,C.ら(1990). American Journal of Epidemiology 131:973−983
Metzgerら(1988). Nature 334:31−36
Miller(1992). Curr.Top.Microbiol. Immunol. 158:1−24
Millerら(1985). Mol.Cell.Biol. 5:431−437
Millerら(1988). J.Virol. 62:4337−4345
Mittlin(1989). Clinical Chem. 35:1819
Modrich,P.(1991). Ann,Rev.Genet. 25:229−253
Mombaerts,P.ら(1992) Cell 68:869
Monacoら(1986). Nature 323:646
Moss(1992). Curr.Top.Microbiol. Immunol. 158:25−38
Muzyczka(1992). Curr.Top.Microbiol.Immunol. 158:97−123
Nabel(1992). Hum.Gene Ther. 3:399−410
Nabelら(1990). Science 249:1285−1288 Nakamuraら(1987). Science 235:1616−1622
Narod,S.A.ら(1991). The Lancet 338:82−83
Newman B.ら(1988). Proc.Natl.Acad. Sci.USA 85:3044−3048
Newton,C.R.Graham,A.Heptinstall,L.E.,Powell,S.J.Summers,C.,Kalsheker,N.,Smith,J.C.およびMarkham,A.F.(1989). Nucl.Acids Res. 17:2503−2516
Nguyen,Q.ら(1992). BioTechniques 13:116−123
Novackら(1986). Proc.Natl.Acad.Sci. USA 83:586
Oh,J.(1985). Analysis of Human Genetic Linkage,Johns Hopkins
University Press,Baltimore,Md,第1−216頁
Ohiら(1990). Gene 89:279−282
Oliphant,A.ら(1991). Nucleic Acid Res. 19:4794
Oliphant,A.(1991). Nucleic Acid Res. 19:4795
Oriaら(1989). Proc.Natl.Acad.Sci. USA 86:2776−2770
Pageら(1990). J.Virol. 64:5370−5276
Pellicerら(1980).Science 209:1414−1422
Petropoulusら(1992).J.Virol. 66:3391−3397
Philpott,K.L.ら(1992). Science
256:1448
Pierceら(1992) Proc.Natl.Acad.Sci. USA 89:2056−2060
Quantinら(1992) Proc.Natl.Acad.Sci. USA 89:2581−2584
Rano & Kidd(1989). Nucl.Acids Res. 17:8392
Rigby,P.W.J.ら(1977).J.Mol.Biol. 113:237−251
Rosenfeldら(1992). Cell 68:143−155
Sambrook,J.ら(1989). Molecular Cloning:A Laboratory Manual.第2版.(Cold Spring Harbor Laboratory,Cold Spring Habor,N.Y.)
Sato,T.ら(1990). Cancer Res. 50:7184−7189
Scharf(1986). Science 233:1076
Scopes,R.(1982). Protein Purification:Principles and Practice,(Springer−Verlag,N.Y.)
Shaulian,E.ら(1992) Mol.Cell Biol.12:5581−92
Sheffield,V.C.ら(1989).Proc.Natl.Acad.Sci.USA 86:232−236
Sheffield,V.C.ら(1991).Am.J.Hum.Genet. 49:699−706
Shenkら(1975). Proc.Natl.Acad.Sci. USA 72:989
Shimadaら(1991). J.Clin.Invest. 88:1043−1047
Shinkai,Y.ら(1992). Cell 68:855
Shizuya,H.ら(1992).Proc.Natl.Acad.Sci.USA 89:8794−8797
Simard,J.ら(1993). Human Mol.Genet. 2:1193−1199
Skolnick,M.H.およびWallace,B,R,(1988). Genomics 2:273−279
Skolnick,M.H.ら(1990). Science 250:1715−1720
Smith,S.A.ら(1992) Nature Genetics 2:128−131
Smith,T.F.およびWaterman,M.S.(1981). J.Mol.Biol. 147:195−197
Snouwaert,J.N.ら(1992). Science 257:1083
Sorgeら(1984).Mol.Cell. Biol.4:1730−1737
Srivastava,S.ら(1993). Cancer Res. 53:4452−5
Sternbergら(1990). Proc.Natl.Acad.Sci.USA 87:103−107
Sternbergら(1992). The New Biologist 2:151−162
Stewartら(1992).Hum.Gene Ther. 3:267−275
Stratford−Perricaudetら(1990). Hum.Gene Ther. 1:241−256
Swift,M.ら(1991).N.Engl.J.Med. 325:1831−1836
Swift,M.ら(1976).Cancer Res.36:209−215
Su,L.K.ら(1993).Cancer Res.53:2728−31
Thomas,A.およびSkolnic,M.H.(1994). IMA Journal of Mathematics Applied in Medicine and Biology (in press)
Tonolio,D.ら(1990).Cold Spring Harbor Conference
Valancius,V.& Smithies,O.(1991). Mol.Cell Biol. 11:1402
van Dillaら(1986). Biotechnology
4:537−552
Wagnerら(1990). Proc.Natl.Acad.Sci. USA 87:3410−3414
Wagnerら(1991). Proc.Natl.Acad. Sci. USA 88:4255−4259
WangおよびHuang(1989). Biochemistry 28:9508−9514
Wartell,R.M.ら(1990). Nucl.Acids Res. 18:2699−2705
Weber,J.L.(1990). Genomics 7:524−530
WeberおよびMay(1989). Am.J.Hum.Genet. 44:388−396
Weber,J.L.ら(1990) Nucleic Acids Res. 18:4640
Wells,J.A.(1991). Methods in Enzymology 202:390−411
Wetmur & Davidson(1968). J.Mol.Biol. 31:349−370
White,M.B.ら(1992). Genomics 12:301−306
WhiteおよびLalouel(1988). Ann.Rev.Genet. 22:259−279
Wilkinsonら(1992). Nucleic Acids Res. 20:2233−2239
WilliamsおよびAnderson(1984): Genet. Epidemiol. 1:7−20
Wolffら(1990). Science 247:1465−1468 Wolffら(1991). BioTechniques 11:474−485
Wooster,R.ら(1994). Science 265:2088 Wuら(1989a). Genomics 4:560−569
Wuら(1989b). J.Biol.Chem 264:16985−16987
Wuら(1991). J.Biol.Chem. 266:14338−14342
Zenkeら(19901). Proc.Natl.Acad.Sci. USA 87:3655−3659
List of documents Altschul, S .; F. (1990). J. et al. Mol. Biol. 215: 195-197
American Cancer Society, Cancer Facts & Figures-1992. (American Cancer Society, Atlanta, GA)
Anand, R.A. (1992). Technologies for the Analysis of Complex Genes, (Academic Press)
Anderson et al. (1980). Proc. Natl. Acad. Sci. USA 77: 5399-5403
Anderson, D.M. E. (1972), J.A. Natl. Cancer Inst. 48: 1029-1034
Anderson, J.M. A. (1992). J. et al. Otaryryology 21: 321
Antonarakis, S.A. E. Et al. (1985). New Eng. J. et al. Med. 313: 842-848
Ausubel, F.M. M.M. (1992). Current Protocols in Molecular Biology, J. MoI. Wiley and Sons, N.W. Y. )
Beaucage & Carruthers (1981). Tetra. Letts. 22: 1859-1862
Berkner (1992). Curr. Top. Microbiol. Immunol. 158: 39-61
Berkner et al. (1988) BioTechniques 6: 616-629.
Bickmore, W.M. A. (1992). Science 257: 235-7
Bishop, D.B. T.A. (1988). Genet. Epidemiol. 5: 151-169
Bishop, D.B. T.A. And Gardner, E .; J. et al. (1980) In: Banbury Report 4: Cancer Incident in Defined Pollutions (edited by J. Cairns., IL Lyon, M. Skolnick), Cold Spring Harbor Laboratory, Cold Spring, Cold Spring. Y. , 309-408
Botstein et al. (1980). Am. J. et al. Hum. Genet. 32: 314-331
Bowcock, A.M. M.M. (1993). Am. J. et al. Hum. Gent. 52: 718
Brandyopadhyay and Temin (1984). Mol. Cell. Biol. 4: 749-754
Breakfield and Geller (1987). Mol. Neurobiol. 1: 337-371
Brinster et al. (1981). Cell 27: 223-231
Buckschacher and Panganiban (1992). J. et al. Virol. 65: 2731-2739
Buckler et al. (1991). Proc. Natl. Acad. Sci. USA 88: 4005-4009
Cannon-Albright, L.M. (1994). Cancer
Research 54: 2378-2385
Capecchi, M.C. R. (1989). Science 244: 1288
Cariello (1988). Human Genetics 42: 726
Claus, E .; (1991). Am. J. et al. Hum. Genet. 48: 232-242
Conner, B.M. J. et al. Et al. (1983). Proc. Natl. Acad. Sci. USA 80: 278-282
Constantini and Lacy (1981). Nature 294: 92-94
Cotten et al. (1990). Proc. Natl. Acad. Sci. USA 87: 4033-4037
Cotton et al. (1988). Proc. Natl. Acad. Sci. USA 85: 4397
Cropp, C.I. S. (1994). Cancer Res. 54: 2548-2551
Culver et al. (1992). Science 256: 1550-1552
Curiel et al. (1991a). Proc. Natl. Acad. Sci. USA 88: 8850-8854
Curiel et al. (1991b). Hum. Gene Ther. 3: 147-154
Geutscher. M.M. (1990). Meth. Enzymology 182 (Academic Press, San Diego, Cal.)
Donehower, L.M. A. (1992). Nature 356: 215
Drummond, I.D. A. (1994). Mol. Cell Biol. 14: 3800-9
Easton, D.C. (1993). Am. J. et al. Hum. Genet. 52: 678-701
Eccles, D.M. M.M. (1990). Oncogene 5: 1599-1601
Enhancers and Eurkaryotic Gene Expression, Cold Spring Harbor Press, Cold Spring Harbor, New York (1983)
Erickson, J.M. (1990). Science 249: 527-533
Fain, P.M. R. (1992). Cytogen. Cell Genet. 60: 178
Felgner et al. (1987). Proc. Natl. Acad. Sci. USA 84: 7413-7417
Fiers et al. (1978). Nature 273: 113
Fink et al. (1992). Hum. Gene Ther, 3: 11-19
Finkelstein, J .; (1990). Genomics
7: 167-172
Preese et al. (1990). Biochem. Pharmacol. 40: 2189-2199
Friedman, T .; (1991). In Therapeutic for Genetic Diseases, T.A. Edited by Friedman, Oxford University Press, pages 105-121. Futural (1993). Ph. D. Thesis, University of North Carolina, Chapel Hill.
Futural, A.M. (1992a). Hum. Molec. Genet. 1:66
Futural, P.M. A. (1992b). Cancer Res. 52: 2624-2627
Glebov, O .; K. (1994). Cancer Res. 54: 3703-3709
Glover, D.C. (1985). DNA Cloning, I and II (Oxford Press)
Go, R.A. C. P. Et al. (1983). J. et al. Natl. Cancer
Inst. 71: 455-461
Goding (1986). Monoclonal Antibodies: Principles and Practice, Second Edition. (Academic Press, NY)
Godowski et al. (1988). Science 241: 812-816
Goldgar, D.C. E. (1994). J. et al. Natl. Can. Inst. 86: 3: 200-209
Gordon et al. (1980). Proc. Natl. Acad. Sci. USA 77: 7380-7384
Gorziglia and Kapikian (1992). J. et al. Virol. 66: 4407-4412
Graham and van der Eb (1973). Virology 52: 456-467
Grompe, M.M. (1993). Nature Genetics 5: 111-117
Grompe, M.M. (1989). Proc. Natl. Acad. Sci. USA 86: 5855-5892.
Guthrie, G. et al. & Fink. G, R, (1991). Guide to Yeast Genetics and Molecular
Biology (Academic Press)
Haver, D .; A. (1990). Cell 61: 1257-69
Hall, J. et al. M.M. (1990) Science 250: 1684-1689.
Hall, J. et al. M.M. (1992). Am. J. et al. Hum. Genet. 50: 1235-1241
Harlow & Lane (1988). Antibodies: A Laboratory Manual (Cold Spring Harbor Laboratory, Cold Spring Harbor, N, Y.)
Hasty, P.M. K. (1991). Nature 350: 243
Helseth et al. (1990). J. et al. Virol. 64: 2416-2420 Hodgson, J. et al. (1991). Bio / Technology 9: 19-21
Huse et al. (1989). Science 246: 1275-1281
Innis et al. (1990). PCR Protocols: A Guide to Methods and Applications (Academic Press, San Diego, Cal.)
Jablonski, E .; (1986). Nuc. Acids Res. 14: 6115-6128
Jacobs, I .; J. et al. (1993). Cancer Res. 53: 1218-1221
Jacobi, W .; B. And Pastan, I .; H. (Ed.) (1979). Cell Culture. Methods in Enzymology, Vol. 58 (Academic Press, Inc., Harcourt Brace Jovanovich (New York))
Jeffreys et al. (1985). Nature 314: 67-73
Johnson et al. (1992). J. et al. Virol. 66: 2952-2965
Kamb, A .; (1994). Science 264: 436-440
Kandpal et al. (1990). Nucl. Acids. Res. 18: 1789-1795
Kaneda et al. (1989). J. et al. Biol. Chem. H.264: 1226-12129
Kanehisa (1984). Nucl. Acids. Res. 12: 203-213
Kelsel, D.C. P. (1993). June Mol. Genet. 2: 1823-1828
Kinszler, K.M. W. (1991). Science 251: 1366-1370
Knudson, A .; G. (1993). Nature Genet. 5: 103
Kohler, G .; And Milstein, C.I. (1975). Nature 256: 495-497
Kozak, M .; (1987). Nucleic Acids Res. 15: 8125-8148
Kraemer, F.A. B. (1993). J. et al. Lipid Res. 34: 663-672
Kubo, T .; (1988). FEBS Letts. 241: 119
Landegren et al. (1988). Science 242: 229
Lim et al. (1992). Circulation 83: 2007-2011
Lindsay, S .; Et al. (1987). Nature 327: 336-368
Litt et al. (1989). Am. J. et al. Hum. Genet. 44: 397-401
Little, M.M. H. (1992). Proc. Natl. Acad. Sci. USA 89: 4791
Little, M.M. H. (1993). Hum. Mol. Genet. 2: 259
Lovett et al. (1991). Proc. Natl. Acad. Sci. USA 88: 9628-9632
Lynch, H.M. T.A. (1990). Gynecol. Oncol. 36: 48-55
Madzak et al. (1992) J. MoI. Gen. Virol. 73: 153-1536
Malkin, D.M. (1990). Science 250: 1233-1238
Maniatis. T.A. Et al. (1982). Molecular
Cloning: A Laboratory Manual (Cold
Spring Harbor Laboratory, Cold Spring Harbor, N.A. Y. )
Mann and Baltimore (1985). J. et al. Virol. 54: 401-407
Margarite et al. (1992). Am. J. et al. Hum. Genet. 50: 1231-1234
Margolsky (1992). Curr. Top. Microbiol. Immunol. 158: 67-90
Martin, R.M. (1990). BioTechniques 9: 762-768
Matteucci, M.M. D. And Caruthers, M .; H. (1981). J. et al. Am. Chem. Sci. 103: 3185
Matthews & Kricka (1988) Anal. Biochem. 169: 1
Merrifield (1963). J. et al. Am. Chem. Soc. 85: 2149-2156
Mttlin, C.I. (1990). American Journal of Epidemiology 131: 973-983
Metzger et al. (1988). Nature 334: 31-36
Miller (1992). Curr. Top. Microbiol. Immunol. 158: 1-24
Miller et al. (1985). Mol. Cell. Biol. 5: 431-437
Miller et al. (1988). J. et al. Virol. 62: 4337-4345
Mittlin (1989). Clinical Chem. 35: 1819
Modrich, P.M. (1991). Ann, Rev. Genet. 25: 229-253
Mombaerts, P.M. (1992) Cell 68: 869
Monaco et al. (1986). Nature 323: 646
Moss (1992). Curr. Top. Microbiol. Immunol. 158: 25-38
Muzyczka (1992). Curr. Top. Microbiol. Immunol. 158: 97-123
Nabel (1992). Hum. Gene Ther. 3: 399-410
Nabel et al. (1990). Science 249: 1285-1288 Nakamura et al. (1987). Science 235: 1616-1622
Narod, S .; A. (1991). The Lancet 338: 82-83
Newman B.I. (1988). Proc. Natl. Acad. Sci. USA 85: 3044-3048
Newton, C.I. R. Graham, A .; Heptinstal, L.M. E. Powell, S .; J. et al. Summers, C.I. Kalsheker, N .; Smith, J .; C. And Markham, A .; F. (1989). Nucl. Acids Res. 17: 2503-2516
Nguyen, Q.M. (1992). BioTechniques 13: 116-123
Novack et al. (1986). Proc. Natl. Acad. Sci. USA 83: 586
Oh, J .; (1985). Analysis of Human Genetic Linkage, Johns Hopkins
University Press, Baltimore, Md, pages 1-216 Ohi et al. (1990). Gene 89: 279-282
Oliphant, A.M. (1991). Nucleic Acid Res. 19: 4794
Oliphant, A.M. (1991). Nucleic Acid Res. 19: 4795
Oria et al. (1989). Proc. Natl. Acad. Sci. USA 86: 2776-2770
Page et al. (1990). J. et al. Virol. 64: 5370-5276
Pellicer et al. (1980). Science 209: 1414-1422
Petropoulus et al. (1992). J. et al. Virol. 66: 3391-3397
Philpott, K.M. L. (1992). Science
256: 1448
Pierce et al. (1992) Proc. Natl. Acad. Sci. USA 89: 2056-2060
Quantin et al. (1992) Proc. Natl. Acad. Sci. USA 89: 2581-2584
Rano & Kidd (1989). Nucl. Acids Res. 17: 8392
Rigby, P.M. W. J. et al. (1977). J. et al. Mol. Biol. 113: 237-251
Rosenfeld et al. (1992). Cell 68: 143-155
Sambrook, J. et al. (1989). Molecular Cloning: A Laboratory Manual. Second edition. (Cold Spring Harbor Laboratory, Cold Spring Harbor, NY)
Sato, T .; (1990). Cancer Res. 50: 7184-7189
Scharf (1986). Science 233: 1076
Scopes, R.M. (1982). Protein Purification: Principles and Practice, (Springer-Verlag, NY)
Shaulian, E .; (1992) Mol. Cell Biol. 12: 5581-92
Sheffield, V.M. C. (1989). Proc. Natl. Acad. Sci. USA 86: 232-236
Sheffield, V.M. C. (1991). Am. J. et al. Hum. Genet. 49: 699-706
Shenk et al. (1975). Proc. Natl. Acad. Sci. USA 72: 989
Shimada et al. (1991). J. et al. Clin. Invest. 88: 1043-1047
Shinkai, Y. et al. (1992). Cell 68: 855
Shizuya, H .; (1992). Proc. Natl. Acad. Sci. USA 89: 8794-8797
Simard, J .; (1993). Human Mol. Genet. 2: 1193-1199
Skolnick, M.M. H. And Wallace, B, R, (1988). Genomics 2: 273-279
Skolnick, M.M. H. (1990). Science 250: 1715-1720
Smith, S.M. A. (1992) Nature Genetics 2: 128-131.
Smith, T.M. F. And Waterman, M .; S. (1981). J. et al. Mol. Biol. 147: 195-197
Snowwaert, J .; N. (1992). Science 257: 1083
Serge et al. (1984). Mol. Cell. Biol. 4: 1730-1737
Srivastava, S.A. (1993). Cancer Res. 53: 4452-5
Sternberg et al. (1990). Proc. Natl. Acad. Sci. USA 87: 103-107
Sternberg et al. (1992). The New Biologist 2: 151-162
Stewart et al. (1992). Hum. Gene Ther. 3: 267-275
Stratford-Perricaudet et al. (1990). Hum. Gene Ther. 1: 241-256
Swift, M.M. (1991). N. Engl. J. et al. Med. 325: 1831-1836
Swift, M.M. (1976). Cancer Res. 36: 209-215
Su, L .; K. (1993). Cancer Res. 53: 2728-31
Thomas, A .; And Skolnic, M .; H. (1994). IMA Journal of Mathematicas Applied in Medicine and Biology (in press)
Tonolio, D.M. (1990). Cold Spring Harbor Conference
Valancius, V.M. & Smithies, O. (1991). Mol. Cell Biol. 11: 1402
van Dilla et al. (1986). Biotechnology
4: 537-552
Wagner et al. (1990). Proc. Natl. Acad. Sci. USA 87: 3410-3414
Wagner et al. (1991). Proc. Natl. Acad. Sci. USA 88: 4255-4259
Wang and Huang (1989). Biochemistry 28: 9508-9514
Waltell, R.A. M.M. (1990). Nucl. Acids Res. 18: 2699-2705
Weber, J. et al. L. (1990). Genomics 7: 524-530
Weber and May (1989). Am. J. et al. Hum. Genet. 44: 388-396
Weber, J. et al. L. (1990) Nucleic Acids Res. 18: 4640
Wells, J .; A. (1991). Methods in Enzymology 202: 390-411
Wetmur & Davidson (1968). J. et al. Mol. Biol. 31: 349-370
White, M.M. B. (1992). Genomics 12: 301-306
White and Lalouel (1988). Ann. Rev. Genet. 22: 259-279
Wilkinson et al. (1992). Nucleic Acids Res. 20: 2233-2239
Williams and Anderson (1984): Genet. Epidemiol. 1: 7-20
Wolff et al. (1990). Science 247: 1465-1468 Wolff et al. (1991). BioTechniques 11: 474-485
Wooster, R.A. (1994). Science 265: 2088 Wu et al. (1989a). Genomics 4: 560-569
Wu et al. (1989b). J. et al. Biol. Chem 264: 16985-16987
Wu et al. (1991). J. et al. Biol. Chem. 266: 14338-14342
Zenke et al. (19901). Proc. Natl. Acad. Sci. USA 87: 3655-3659

特許および特許出願のリスト
米国特許第3,817,837号
米国特許第3,850,752号
米国特許第3,939,350号
米国特許第3,996,345号
米国特許第4,275,149号
米国特許第4,277,437号
米国特許第4,366,241号
米国特許第4,376,110号
米国特許第4,486,530号
米国特許第4,683,195号
米国特許第4,683,202号
米国特許第4,816,567号
米国特許第4,868,105号
米国特許第5,252,479号
欧州公開第225,807号
欧州特許出願公開第0332435号
Geysen,H,PCT出願公開WO 84/03564、1984年9月13日公開
Hitzemanら、EP73,675A
PCT出願公開WO 93/07282
List of Patents and Patent Applications US Pat. No. 3,817,837 US Pat. No. 3,850,752 US Pat. No. 3,939,350 US Pat. No. 3,996,345 US Pat. No. 4,275,149 US Patent No. 4,277,437 US Patent No. 4,366,241 US Patent No. 4,376,110 US Patent No. 4,486,530 US Patent No. 4,683,195 US Patent No. 4 U.S. Pat. No. 4,816,567 U.S. Pat. No. 4,868,105 U.S. Pat. No. 5,252,479 EP-A 225,807 EP-A-0332435 Geysen, H. PCT Application Publication WO 84/03564, published September 13, 1984 Hitzeman et al., EP 73,675A
PCT Application Publication WO 93/07282

SEQUENCE LISTING
(1) GENERAL INFORMATION:

(i) APPLICANT: Skolnick, Mark H.
Goldagar, David E.
Miki, Yoshio
Swenson, Jeff
Kamb, Alexander
Harshman, Keith D.
Shattuck-Eidens, Donna M.
Tavtigian, Sean V.
Wiseman, Roger W.
Futreal, P. Andrew

(ii) TITLE OF INVENTION: 17q-Linked Breast and Ovarian Cancer
Susceptibility Gene

(iii) NUMBER OF SEQUENCES: 85

(iv) CORRESPONDENCE ADDRESS:
(A) ADDRESSEE: Venable, Baetjer, Howard & Civiletti, LLP
(B) STREET: 1201 New York Avenue, N.W., Suite 1000
(C) CITY: Washington
(D) STATE: DC
(E) COUNTRY: USA
(F) ZIP: 20005

(v) COMPUTER READABLE FORM:
(A) MEDIUM TYPE: Floppy disk
(B) COMPUTER: IBM PC compatible
(C) OPERATING SYSTEM: PC-DOS/MS-DOS
(D) SOFTWARE: PatentIn Release #1.0, Version #1.30

(vi) CURRENT APPLICATION DATA:
(A) APPLICATION NUMBER:
(B) FILING DATE:
(C) CLASSIFICATION:

(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US
(B) FILING DATE: 07-JUN-1995

(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08/409,305
(B) FILING DATE: 24-MAR-1995

(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08/348,824
(B) FILING DATE: 29-NOV-1994

(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08/308,104
(B) FILING DATE: 16-SEP-1994

(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08/300,266
(B) FILING DATE: 02-SEP-1994

(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08/289,221
(B) FILING DATE: 12-AUG-1994

(viii) ATTORNEY/AGENT INFORMATION:
(A) NAME: Ihnen, Jeffrey L.
(B) REGISTRATION NUMBER: 28,957
(C) REFERENCE/DOCKET NUMBER: 24884-109347

(ix) TELECOMMUNICATION INFORMATION:
(A) TELEPHONE: 202-962-4810
(B) TELEFAX: 202-962-8300

(2) INFORMATION FOR SEQ ID NO:1:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5914 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: cDNA

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(ix) FEATURE:
(A) NAME/KEY: CDS
(B) LOCATION: 120..5708

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:1:

agctcgctga gacttcctgg accccgcacc aggctgtggg gtttctcaga taactgggcc 60

CCTGCGCTCA GGAGGCCTTC ACCCTCTGCT CTGGGTAAAG TTCATTGGAA CAGAAAGAA 119

ATG GAT TTA TCT GCT CTT CGC GTT GAA GAA GTA CAA AAT GTC ATT AAT 167
Met Asp Leu Ser Ala Leu Arg Val Glu Glu Val Gln Asn Val Ile Asn
1 5 10 15

GCT ATG CAG AAA ATC TTA GAG TGT CCC ATC TGT CTG GAG TTG ATC AAG 215
Ala Met Gln Lys Ile Leu Glu Cys Pro Ile Cys Leu Glu Leu Ile Lys
20 25 30

GAA CCT GTC TCC ACA AAG TGT GAC CAC ATA TTT TGC AAA TTT TGC ATG 263
Glu Pro Val Ser Thr Lys Cys Asp His Ile Phe Cys Lys Phe Cys Met
35 40 45

CTG AAA CTT CTC AAC CAG AAG AAA GGG CCT TCA CAG TGT CCT TTA TGT 311
Leu Lys Leu Leu Asn Gln Lys Lys Gly Pro Ser Gln Cys Pro Leu Cys
50 55 60

AAG AAT GAT ATA ACC AAA AGG AGC CTA CAA GAA AGT ACG AGA TTT AGT 359
Lys Asn Asp Ile Thr Lys Arg Ser Leu Gln Glu Ser Thr Arg Phe Ser
65 70 75 80

CAA CTT GTT GAA GAG CTA TTG AAA ATC ATT TGT GCT TTT CAG CTT GAC 407
Gln Leu Val Glu Glu Leu Leu Lys Ile Ile Cys Ala Phe Gln Leu Asp
85 90 95

ACA GGT TTG GAG TAT GCA AAC AGC TAT AAT TTT GCA AAA AAG GAA AAT 455
Thr Gly Leu Glu Tyr Ala Asn Ser Tyr Asn Phe Ala Lys Lys Glu Asn
100 105 110

AAC TCT CCT GAA CAT CTA AAA GAT GAA GTT TCT ATC ATC CAA AGT ATG 503
Asn Ser Pro Glu His Leu Lys Asp Glu Val Ser Ile Ile Gln Ser Met
115 120 125

GGC TAC AGA AAC CGT GCC AAA AGA CTT CTA CAG AGT GAA CCC GAA AAT 551
Gly Tyr Arg Asn Arg Ala Lys Arg Leu Leu Gln Ser Glu Pro Glu Asn
130 135 140

CCT TCC TTG CAG GAA ACC AGT CTC AGT GTC CAA CTC TCT AAC CTT GGA 599
Pro Ser Leu Gln Glu Thr Ser Leu Ser Val Gln Leu Ser Asn Leu Gly
145 150 155 160

ACT GTG AGA ACT CTG AGG ACA AAG CAG CGG ATA CAA CCT CAA AAG ACG 647
Thr Val Arg Thr Leu Arg Thr Lys Gln Arg Ile Gln Pro Gln Lys Thr
165 170 175

TCT GTC TAC ATT GAA TTG GGA TCT GAT TCT TCT GAA GAT ACC GTT AAT 695
Ser Val Tyr Ile Glu Leu Gly Ser Asp Ser Ser Glu Asp Thr Val Asn
180 185 190

AAG GCA ACT TAT TGC AGT GTG GGA GAT CAA GAA TTG TTA CAA ATC ACC 743
Lys Ala Thr Tyr Cys Ser Val Gly Asp Gln Glu Leu Leu Gln Ile Thr
195 200 205

CCT CAA GGA ACC AGG GAT GAA ATC AGT TTG GAT TCT GCA AAA AAG GCT 791
Pro Gln Gly Thr Arg Asp Glu Ile Ser Leu Asp Ser Ala Lys Lys Ala
210 215 220

GCT TGT GAA TTT TCT GAG ACG GAT GTA ACA AAT ACT GAA CAT CAT CAA 839
Ala Cys Glu Phe Ser Glu Thr Asp Val Thr Asn Thr Glu His His Gln
225 230 235 240

CCC AGT AAT AAT GAT TTG AAC ACC ACT GAG AAG CGT GCA GCT GAG AGG 887
Pro Ser Asn Asn Asp Leu Asn Thr Thr Glu Lys Arg Ala Ala Glu Arg
245 250 255

CAT CCA GAA AAG TAT CAG GGT AGT TCT GTT TCA AAC TTG CAT GTG GAG 935
His Pro Glu Lys Tyr Gln Gly Ser Ser Val Ser Asn Leu His Val Glu
260 265 270

CCA TGT GGC ACA AAT ACT CAT GCC AGC TCA TTA CAG CAT GAG AAC AGC 983
Pro Cys Gly Thr Asn Thr His Ala Ser Ser Leu Gln His Glu Asn Ser
275 280 285

AGT TTA TTA CTC ACT AAA GAC AGA ATG AAT GTA GAA AAG GCT GAA TTC 1031
Ser Leu Leu Leu Thr Lys Asp Arg Met Asn Val Glu Lys Ala Glu Phe
290 295 300

TGT AAT AAA AGC AAA CAG CCT GGC TTA GCA AGG AGC CAA CAT AAC AGA 1079
Cys Asn Lys Ser Lys Gln Pro Gly Leu Ala Arg Ser Gln His Asn Arg
305 310 315 320

TGG GCT GGA AGT AAG GAA ACA TGT AAT GAT AGG CGG ACT CCC AGC ACA 1127
Trp Ala Gly Ser Lys Glu Thr Cys Asn Asp Arg Arg Thr Pro Ser Thr
325 330 335

GAA AAA AAG GTA GAT CTG AAT GCT GAT CCC CTG TGT GAG AGA AAA GAA 1175
Glu Lys Lys Val Asp Leu Asn Ala Asp Pro Leu Cys Glu Arg Lys Glu
340 345 350

TGG AAT AAG CAG AAA CTG CCA TGC TCA GAG AAT CCT AGA GAT ACT GAA 1223
Trp Asn Lys Gln Lys Leu Pro Cys Ser Glu Asn Pro Arg Asp Thr Glu
355 360 365

GAT GTT CCT TGG ATA ACA CTA AAT AGC AGC ATT CAG AAA GTT AAT GAG 1271
Asp Val Pro Trp Ile Thr Leu Asn Ser Ser Ile Gln Lys Val Asn Glu
370 375 380

TGG TTT TCC AGA AGT GAT GAA CTG TTA GGT TCT GAT GAC TCA CAT GAT 1319
Trp Phe Ser Arg Ser Asp Glu Leu Leu Gly Ser Asp Asp Ser His Asp
385 390 395 400

GGG GAG TCT GAA TCA AAT GCC AAA GTA GCT GAT GTA TTG GAC GTT CTA 1367
Gly Glu Ser Glu Ser Asn Ala Lys Val Ala Asp Val Leu Asp Val Leu
405 410 415

AAT GAG GTA GAT GAA TAT TCT GGT TCT TCA GAG AAA ATA GAC TTA CTG 1415
Asn Glu Val Asp Glu Tyr Ser Gly Ser Ser Glu Lys Ile Asp Leu Leu
420 425 430

GCC AGT GAT CCT CAT GAG GCT TTA ATA TGT AAA AGT GAA AGA GTT CAC 1463
Ala Ser Asp Pro His Glu Ala Leu Ile Cys Lys Ser Glu Arg Val His
435 440 445

TCC AAA TCA GTA GAG AGT AAT ATT GAA GAC AAA ATA TTT GGG AAA ACC 1511
Ser Lys Ser Val Glu Ser Asn Ile Glu Asp Lys Ile Phe Gly Lys Thr
450 455 460

TAT CGG AAG AAG GCA AGC CTC CCC AAC TTA AGC CAT GTA ACT GAA AAT 1559
Tyr Arg Lys Lys Ala Ser Leu Pro Asn Leu Ser His Val Thr Glu Asn
465 470 475 480

CTA ATT ATA GGA GCA TTT GTT ACT GAG CCA CAG ATA ATA CAA GAG CGT 1607
Leu Ile Ile Gly Ala Phe Val Thr Glu Pro Gln Ile Ile Gln Glu Arg
485 490 495

CCC CTC ACA AAT AAA TTA AAG CGT AAA AGG AGA CCT ACA TCA GGC CTT 1655
Pro Leu Thr Asn Lys Leu Lys Arg Lys Arg Arg Pro Thr Ser Gly Leu
500 505 510

CAT CCT GAG GAT TTT ATC AAG AAA GCA GAT TTG GCA GTT CAA AAG ACT 1703
His Pro Glu Asp Phe Ile Lys Lys Ala Asp Leu Ala Val Gln Lys Thr
515 520 525

CCT GAA ATG ATA AAT CAG GGA ACT AAC CAA ACG GAG CAG AAT GGT CAA 1751
Pro Glu Met Ile Asn Gln Gly Thr Asn Gln Thr Glu Gln Asn Gly Gln
530 535 540

GTG ATG AAT ATT ACT AAT AGT GGT CAT GAG AAT AAA ACA AAA GGT GAT 1799
Val Met Asn Ile Thr Asn Ser Gly His Glu Asn Lys Thr Lys Gly Asp
545 550 555 560

TCT ATT CAG AAT GAG AAA AAT CCT AAC CCA ATA GAA TCA CTC GAA AAA 1847
Ser Ile Gln Asn Glu Lys Asn Pro Asn Pro Ile Glu Ser Leu Glu Lys
565 570 575

GAA TCT GCT TTC AAA ACG AAA GCT GAA CCT ATA AGC AGC AGT ATA AGC 1895
Glu Ser Ala Phe Lys Thr Lys Ala Glu Pro Ile Ser Ser Ser Ile Ser
580 585 590

AAT ATG GAA CTC GAA TTA AAT ATC CAC AAT TCA AAA GCA CCT AAA AAG 1943
Asn Met Glu Leu Glu Leu Asn Ile His Asn Ser Lys Ala Pro Lys Lys
595 600 605

AAT AGG CTG AGG AGG AAG TCT TCT ACC AGG CAT ATT CAT GCG CTT GAA 1991
Asn Arg Leu Arg Arg Lys Ser Ser Thr Arg His Ile His Ala Leu Glu
610 615 620

CTA GTA GTC AGT AGA AAT CTA AGC CCA CCT AAT TGT ACT GAA TTG CAA 2039
Leu Val Val Ser Arg Asn Leu Ser Pro Pro Asn Cys Thr Glu Leu Gln
625 630 635 640

ATT GAT AGT TGT TCT AGC AGT GAA GAG ATA AAG AAA AAA AAG TAC AAC 2087
Ile Asp Ser Cys Ser Ser Ser Glu Glu Ile Lys Lys Lys Lys Tyr Asn
645 650 655

CAA ATG CCA GTC AGG CAC AGC AGA AAC CTA CAA CTC ATG GAA GGT AAA 2135
Gln Met Pro Val Arg His Ser Arg Asn Leu Gln Leu Met Glu Gly Lys
660 665 670

GAA CCT GCA ACT GGA GCC AAG AAG AGT AAC AAG CCA AAT GAA CAG ACA 2183
Glu Pro Ala Thr Gly Ala Lys Lys Ser Asn Lys Pro Asn Glu Gln Thr
675 680 685

AGT AAA AGA CAT GAC AGC GAT ACT TTC CCA GAG CTG AAG TTA ACA AAT 2231
Ser Lys Arg His Asp Ser Asp Thr Phe Pro Glu Leu Lys Leu Thr Asn
690 695 700

GCA CCT GGT TCT TTT ACT AAG TGT TCA AAT ACC AGT GAA CTT AAA GAA 2279
Ala Pro Gly Ser Phe Thr Lys Cys Ser Asn Thr Ser Glu Leu Lys Glu
705 710 715 720

TTT GTC AAT CCT AGC CTT CCA AGA GAA GAA AAA GAA GAG AAA CTA GAA 2327
Phe Val Asn Pro Ser Leu Pro Arg Glu Glu Lys Glu Glu Lys Leu Glu
725 730 735

ACA GTT AAA GTG TCT AAT AAT GCT GAA GAC CCC AAA GAT CTC ATG TTA 2375
Thr Val Lys Val Ser Asn Asn Ala Glu Asp Pro Lys Asp Leu Met Leu
740 745 750

AGT GGA GAA AGG GTT TTG CAA ACT GAA AGA TCT GTA GAG AGT AGC AGT 2423
Ser Gly Glu Arg Val Leu Gln Thr Glu Arg Ser Val Glu Ser Ser Ser
755 760 765

ATT TCA TTG GTA CCT GGT ACT GAT TAT GGC ACT CAG GAA AGT ATC TCG 2471
Ile Ser Leu Val Pro Gly Thr Asp Tyr Gly Thr Gln Glu Ser Ile Ser
770 775 780

TTA CTG GAA GTT AGC ACT CTA GGG AAG GCA AAA ACA GAA CCA AAT AAA 2519
Leu Leu Glu Val Ser Thr Leu Gly Lys Ala Lys Thr Glu Pro Asn Lys
785 790 795 800

TGT GTG AGT CAG TGT GCA GCA TTT GAA AAC CCC AAG GGA CTA ATT CAT 2567
Cys Val Ser Gln Cys Ala Ala Phe Glu Asn Pro Lys Gly Leu Ile His
805 810 815

GGT TGT TCC AAA GAT AAT AGA AAT GAC ACA GAA GGC TTT AAG TAT CCA 2615
Gly Cys Ser Lys Asp Asn Arg Asn Asp Thr Glu Gly Phe Lys Tyr Pro
820 825 830

TTG GGA CAT GAA GTT AAC CAC AGT CGG GAA ACA AGC ATA GAA ATG GAA 2663
Leu Gly His Glu Val Asn His Ser Arg Glu Thr Ser Ile Glu Met Glu
835 840 845

GAA AGT GAA CTT GAT GCT CAG TAT TTG CAG AAT ACA TTC AAG GTT TCA 2711
Glu Ser Glu Leu Asp Ala Gln Tyr Leu Gln Asn Thr Phe Lys Val Ser
850 855 860

AAG CGC CAG TCA TTT GCT CCG TTT TCA AAT CCA GGA AAT GCA GAA GAG 2759
Lys Arg Gln Ser Phe Ala Pro Phe Ser Asn Pro Gly Asn Ala Glu Glu
865 870 875 880

GAA TGT GCA ACA TTC TCT GCC CAC TCT GGG TCC TTA AAG AAA CAA AGT 2807
Glu Cys Ala Thr Phe Ser Ala His Ser Gly Ser Leu Lys Lys Gln Ser
885 890 895

CCA AAA GTC ACT TTT GAA TGT GAA CAA AAG GAA GAA AAT CAA GGA AAG 2855
Pro Lys Val Thr Phe Glu Cys Glu Gln Lys Glu Glu Asn Gln Gly Lys
900 905 910

AAT GAG TCT AAT ATC AAG CCT GTA CAG ACA GTT AAT ATC ACT GCA GGC 2903
Asn Glu Ser Asn Ile Lys Pro Val Gln Thr Val Asn Ile Thr Ala Gly
915 920 925

TTT CCT GTG GTT GGT CAG AAA GAT AAG CCA GTT GAT AAT GCC AAA TGT 2951
Phe Pro Val Val Gly Gln Lys Asp Lys Pro Val Asp Asn Ala Lys Cys
930 935 940

AGT ATC AAA GGA GGC TCT AGG TTT TGT CTA TCA TCT CAG TTC AGA GGC 2999
Ser Ile Lys Gly Gly Ser Arg Phe Cys Leu Ser Ser Gln Phe Arg Gly
945 950 955 960

AAC GAA ACT GGA CTC ATT ACT CCA AAT AAA CAT GGA CTT TTA CAA AAC 3047
Asn Glu Thr Gly Leu Ile Thr Pro Asn Lys His Gly Leu Leu Gln Asn
965 970 975

CCA TAT CGT ATA CCA CCA CTT TTT CCC ATC AAG TCA TTT GTT AAA ACT 3095
Pro Tyr Arg Ile Pro Pro Leu Phe Pro Ile Lys Ser Phe Val Lys Thr
980 985 990

AAA TGT AAG AAA AAT CTG CTA GAG GAA AAC TTT GAG GAA CAT TCA ATG 3143
Lys Cys Lys Lys Asn Leu Leu Glu Glu Asn Phe Glu Glu His Ser Met
995 1000 1005

TCA CCT GAA AGA GAA ATG GGA AAT GAG AAC ATT CCA AGT ACA GTG AGC 3191
Ser Pro Glu Arg Glu Met Gly Asn Glu Asn Ile Pro Ser Thr Val Ser
1010 1015 1020

ACA ATT AGC CGT AAT AAC ATT AGA GAA AAT GTT TTT AAA GAA GCC AGC 3239
Thr Ile Ser Arg Asn Asn Ile Arg Glu Asn Val Phe Lys Glu Ala Ser
1025 1030 1035 1040

TCA AGC AAT ATT AAT GAA GTA GGT TCC AGT ACT AAT GAA GTG GGC TCC 3287
Ser Ser Asn Ile Asn Glu Val Gly Ser Ser Thr Asn Glu Val Gly Ser
1045 1050 1055

AGT ATT AAT GAA ATA GGT TCC AGT GAT GAA AAC ATT CAA GCA GAA CTA 3335
Ser Ile Asn Glu Ile Gly Ser Ser Asp Glu Asn Ile Gln Ala Glu Leu
1060 1065 1070

GGT AGA AAC AGA GGG CCA AAA TTG AAT GCT ATG CTT AGA TTA GGG GTT 3383
Gly Arg Asn Arg Gly Pro Lys Leu Asn Ala Met Leu Arg Leu Gly Val
1075 1080 1085

TTG CAA CCT GAG GTC TAT AAA CAA AGT CTT CCT GGA AGT AAT TGT AAG 3431
Leu Gln Pro Glu Val Tyr Lys Gln Ser Leu Pro Gly Ser Asn Cys Lys
1090 1095 1100

CAT CCT GAA ATA AAA AAG CAA GAA TAT GAA GAA GTA GTT CAG ACT GTT 3479
His Pro Glu Ile Lys Lys Gln Glu Tyr Glu Glu Val Val Gln Thr Val
1105 1110 1115 1120

AAT ACA GAT TTC TCT CCA TAT CTG ATT TCA GAT AAC TTA GAA CAG CCT 3527
Asn Thr Asp Phe Ser Pro Tyr Leu Ile Ser Asp Asn Leu Glu Gln Pro
1125 1130 1135

ATG GGA AGT AGT CAT GCA TCT CAG GTT TGT TCT GAG ACA CCT GAT GAC 3575
Met Gly Ser Ser His Ala Ser Gln Val Cys Ser Glu Thr Pro Asp Asp
1140 1145 1150

CTG TTA GAT GAT GGT GAA ATA AAG GAA GAT ACT AGT TTT GCT GAA AAT 3623
Leu Leu Asp Asp Gly Glu Ile Lys Glu Asp Thr Ser Phe Ala Glu Asn
1155 1160 1165

GAC ATT AAG GAA AGT TCT GCT GTT TTT AGC AAA AGC GTC CAG AAA GGA 3671
Asp Ile Lys Glu Ser Ser Ala Val Phe Ser Lys Ser Val Gln Lys Gly
1170 1175 1180

GAG CTT AGC AGG AGT CCT AGC CCT TTC ACC CAT ACA CAT TTG GCT CAG 3719
Glu Leu Ser Arg Ser Pro Ser Pro Phe Thr His Thr His Leu Ala Gln
1185 1190 1195 1200

GGT TAC CGA AGA GGG GCC AAG AAA TTA GAG TCC TCA GAA GAG AAC TTA 3767
Gly Tyr Arg Arg Gly Ala Lys Lys Leu Glu Ser Ser Glu Glu Asn Leu
1205 1210 1215

TCT AGT GAG GAT GAA GAG CTT CCC TGC TTC CAA CAC TTG TTA TTT GGT 3815
Ser Ser Glu Asp Glu Glu Leu Pro Cys Phe Gln His Leu Leu Phe Gly
1220 1225 1230

AAA GTA AAC AAT ATA CCT TCT CAG TCT ACT AGG CAT AGC ACC GTT GCT 3863
Lys Val Asn Asn Ile Pro Ser Gln Ser Thr Arg His Ser Thr Val Ala
1235 1240 1245

ACC GAG TGT CTG TCT AAG AAC ACA GAG GAG AAT TTA TTA TCA TTG AAG 3911
Thr Glu Cys Leu Ser Lys Asn Thr Glu Glu Asn Leu Leu Ser Leu Lys
1250 1255 1260

AAT AGC TTA AAT GAC TGC AGT AAC CAG GTA ATA TTG GCA AAG GCA TCT 3959
Asn Ser Leu Asn Asp Cys Ser Asn Gln Val Ile Leu Ala Lys Ala Ser
1265 1270 1275 1280

CAG GAA CAT CAC CTT AGT GAG GAA ACA AAA TGT TCT GCT AGC TTG TTT 4007
Gln Glu His His Leu Ser Glu Glu Thr Lys Cys Ser Ala Ser Leu Phe
1285 1290 1295

TCT TCA CAG TGC AGT GAA TTG GAA GAC TTG ACT GCA AAT ACA AAC ACC 4055
Ser Ser Gln Cys Ser Glu Leu Glu Asp Leu Thr Ala Asn Thr Asn Thr
1300 1305 1310

CAG GAT CCT TTC TTG ATT GGT TCT TCC AAA CAA ATG AGG CAT CAG TCT 4103
Gln Asp Pro Phe Leu Ile Gly Ser Ser Lys Gln Met Arg His Gln Ser
1315 1320 1325

GAA AGC CAG GGA GTT GGT CTG AGT GAC AAG GAA TTG GTT TCA GAT GAT 4151
Glu Ser Gln Gly Val Gly Leu Ser Asp Lys Glu Leu Val Ser Asp Asp
1330 1335 1340

GAA GAA AGA GGA ACG GGC TTG GAA GAA AAT AAT CAA GAA GAG CAA AGC 4199
Glu Glu Arg Gly Thr Gly Leu Glu Glu Asn Asn Gln Glu Glu Gln Ser
1345 1350 1355 1360

ATG GAT TCA AAC TTA GGT GAA GCA GCA TCT GGG TGT GAG AGT GAA ACA 4247
Met Asp Ser Asn Leu Gly Glu Ala Ala Ser Gly Cys Glu Ser Glu Thr
1365 1370 1375

AGC GTC TCT GAA GAC TGC TCA GGG CTA TCC TCT CAG AGT GAC ATT TTA 4295
Ser Val Ser Glu Asp Cys Ser Gly Leu Ser Ser Gln Ser Asp Ile Leu
1380 1385 1390

ACC ACT CAG CAG AGG GAT ACC ATG CAA CAT AAC CTG ATA AAG CTC CAG 4343
Thr Thr Gln Gln Arg Asp Thr Met Gln His Asn Leu Ile Lys Leu Gln
1395 1400 1405

CAG GAA ATG GCT GAA CTA GAA GCT GTG TTA GAA CAG CAT GGG AGC CAG 4391
Gln Glu Met Ala Glu Leu Glu Ala Val Leu Glu Gln His Gly Ser Gln
1410 1415 1420

CCT TCT AAC AGC TAC CCT TCC ATC ATA AGT GAC TCT TCT GCC CTT GAG 4439
Pro Ser Asn Ser Tyr Pro Ser Ile Ile Ser Asp Ser Ser Ala Leu Glu
1425 1430 1435 1440

GAC CTG CGA AAT CCA GAA CAA AGC ACA TCA GAA AAA GCA GTA TTA ACT 4487
Asp Leu Arg Asn Pro Glu Gln Ser Thr Ser Glu Lys Ala Val Leu Thr
1445 1450 1455

TCA CAG AAA AGT AGT GAA TAC CCT ATA AGC CAG AAT CCA GAA GGC CTT 4535
Ser Gln Lys Ser Ser Glu Tyr Pro Ile Ser Gln Asn Pro Glu Gly Leu
1460 1465 1470

TCT GCT GAC AAG TTT GAG GTG TCT GCA GAT AGT TCT ACC AGT AAA AAT 4583
Ser Ala Asp Lys Phe Glu Val Ser Ala Asp Ser Ser Thr Ser Lys Asn
1475 1480 1485

AAA GAA CCA GGA GTG GAA AGG TCA TCC CCT TCT AAA TGC CCA TCA TTA 4631
Lys Glu Pro Gly Val Glu Arg Ser Ser Pro Ser Lys Cys Pro Ser Leu
1490 1495 1500

GAT GAT AGG TGG TAC ATG CAC AGT TGC TCT GGG AGT CTT CAG AAT AGA 4679
Asp Asp Arg Trp Tyr Met His Ser Cys Ser Gly Ser Leu Gln Asn Arg
1505 1510 1515 1520

AAC TAC CCA TCT CAA GAG GAG CTC ATT AAG GTT GTT GAT GTG GAG GAG 4727
Asn Tyr Pro Ser Gln Glu Glu Leu Ile Lys Val Val Asp Val Glu Glu
1525 1530 1535

CAA CAG CTG GAA GAG TCT GGG CCA CAC GAT TTG ACG GAA ACA TCT TAC 4775
Gln Gln Leu Glu Glu Ser Gly Pro His Asp Leu Thr Glu Thr Ser Tyr
1540 1545 1550

TTG CCA AGG CAA GAT CTA GAG GGA ACC CCT TAC CTG GAA TCT GGA ATC 4823
Leu Pro Arg Gln Asp Leu Glu Gly Thr Pro Tyr Leu Glu Ser Gly Ile
1555 1560 1565

AGC CTC TTC TCT GAT GAC CCT GAA TCT GAT CCT TCT GAA GAC AGA GCC 4871
Ser Leu Phe Ser Asp Asp Pro Glu Ser Asp Pro Ser Glu Asp Arg Ala
1570 1575 1580

CCA GAG TCA GCT CGT GTT GGC AAC ATA CCA TCT TCA ACC TCT GCA TTG 4919
Pro Glu Ser Ala Arg Val Gly Asn Ile Pro Ser Ser Thr Ser Ala Leu
1585 1590 1595 1600

AAA GTT CCC CAA TTG AAA GTT GCA GAA TCT GCC CAG AGT CCA GCT GCT 4967
Lys Val Pro Gln Leu Lys Val Ala Glu Ser Ala Gln Ser Pro Ala Ala
1605 1610 1615

GCT CAT ACT ACT GAT ACT GCT GGG TAT AAT GCA ATG GAA GAA AGT GTG 5015
Ala His Thr Thr Asp Thr Ala Gly Tyr Asn Ala Met Glu Glu Ser Val
1620 1625 1630

AGC AGG GAG AAG CCA GAA TTG ACA GCT TCA ACA GAA AGG GTC AAC AAA 5063
Ser Arg Glu Lys Pro Glu Leu Thr Ala Ser Thr Glu Arg Val Asn Lys
1635 1640 1645

AGA ATG TCC ATG GTG GTG TCT GGC CTG ACC CCA GAA GAA TTT ATG CTC 5111
Arg Met Ser Met Val Val Ser Gly Leu Thr Pro Glu Glu Phe Met Leu
1650 1655 1660

GTG TAC AAG TTT GCC AGA AAA CAC CAC ATC ACT TTA ACT AAT CTA ATT 5159
Val Tyr Lys Phe Ala Arg Lys His His Ile Thr Leu Thr Asn Leu Ile
1665 1670 1675 1680

ACT GAA GAG ACT ACT CAT GTT GTT ATG AAA ACA GAT GCT GAG TTT GTG 5207
Thr Glu Glu Thr Thr His Val Val Met Lys Thr Asp Ala Glu Phe Val
1685 1690 1695

TGT GAA CGG ACA CTG AAA TAT TTT CTA GGA ATT GCG GGA GGA AAA TGG 5255
Cys Glu Arg Thr Leu Lys Tyr Phe Leu Gly Ile Ala Gly Gly Lys Trp
1700 1705 1710

GTA GTT AGC TAT TTC TGG GTG ACC CAG TCT ATT AAA GAA AGA AAA ATG 5303
Val Val Ser Tyr Phe Trp Val Thr Gln Ser Ile Lys Glu Arg Lys Met
1715 1720 1725

CTG AAT GAG CAT GAT TTT GAA GTC AGA GGA GAT GTG GTC AAT GGA AGA 5351
Leu Asn Glu His Asp Phe Glu Val Arg Gly Asp Val Val Asn Gly Arg
1730 1735 1740

AAC CAC CAA GGT CCA AAG CGA GCA AGA GAA TCC CAG GAC AGA AAG ATC 5399
Asn His Gln Gly Pro Lys Arg Ala Arg Glu Ser Gln Asp Arg Lys Ile
1745 1750 1755 1760

TTC AGG GGG CTA GAA ATC TGT TGC TAT GGG CCC TTC ACC AAC ATG CCC 5447
Phe Arg Gly Leu Glu Ile Cys Cys Tyr Gly Pro Phe Thr Asn Met Pro
1765 1770 1775

ACA GAT CAA CTG GAA TGG ATG GTA CAG CTG TGT GGT GCT TCT GTG GTG 5495
Thr Asp Gln Leu Glu Trp Met Val Gln Leu Cys Gly Ala Ser Val Val
1780 1785 1790

AAG GAG CTT TCA TCA TTC ACC CTT GGC ACA GGT GTC CAC CCA ATT GTG 5543
Lys Glu Leu Ser Ser Phe Thr Leu Gly Thr Gly Val His Pro Ile Val
1795 1800 1805

GTT GTG CAG CCA GAT GCC TGG ACA GAG GAC AAT GGC TTC CAT GCA ATT 5591
Val Val Gln Pro Asp Ala Trp Thr Glu Asp Asn Gly Phe His Ala Ile
1810 1815 1820

GGG CAG ATG TGT GAG GCA CCT GTG GTG ACC CGA GAG TGG GTG TTG GAC 5639
Gly Gln Met Cys Glu Ala Pro Val Val Thr Arg Glu Trp Val Leu Asp
1825 1830 1835 1840

AGT GTA GCA CTC TAC CAG TGC CAG GAG CTG GAC ACC TAC CTG ATA CCC 5687
Ser Val Ala Leu Tyr Gln Cys Gln Glu Leu Asp Thr Tyr Leu Ile Pro
1845 1850 1855

CAG ATC CCC CAC AGC CAC TAC TGA CTGCAGCCAG CCACAGGTAC AGAGCCACAG 5741
Gln Ile Pro His Ser His Tyr *
1860

GACCCCAAGA ATGAGCTTAC AAAGTGGCCT TTCCAGGCCC TGGGAGCTCC TCTCACTCTT 5801

CAGTCCTTCT ACTGTCCTGG CTACTAAATA TTTTATGTAC ATCAGCCTGA AAAGGACTTC 5861

TGGCTATGCA AGGGTCCCTT AAAGATTTTC TGCTTGAAGT CTCCCTTGGA AAT 5914


(2) INFORMATION FOR SEQ ID NO:2:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1863 amino acids
(B) TYPE: amino acid
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:2:

Met Asp Leu Ser Ala Leu Arg Val Glu Glu Val Gln Asn Val Ile Asn
1 5 10 15

Ala Met Gln Lys Ile Leu Glu Cys Pro Ile Cys Leu Glu Leu Ile Lys
20 25 30

Glu Pro Val Ser Thr Lys Cys Asp His Ile Phe Cys Lys Phe Cys Met
35 40 45

Leu Lys Leu Leu Asn Gln Lys Lys Gly Pro Ser Gln Cys Pro Leu Cys
50 55 60

Lys Asn Asp Ile Thr Lys Arg Ser Leu Gln Glu Ser Thr Arg Phe Ser
65 70 75 80

Gln Leu Val Glu Glu Leu Leu Lys Ile Ile Cys Ala Phe Gln Leu Asp
85 90 95

Thr Gly Leu Glu Tyr Ala Asn Ser Tyr Asn Phe Ala Lys Lys Glu Asn
100 105 110

Asn Ser Pro Glu His Leu Lys Asp Glu Val Ser Ile Ile Gln Ser Met
115 120 125

Gly Tyr Arg Asn Arg Ala Lys Arg Leu Leu Gln Ser Glu Pro Glu Asn
130 135 140

Pro Ser Leu Gln Glu Thr Ser Leu Ser Val Gln Leu Ser Asn Leu Gly
145 150 155 160

Thr Val Arg Thr Leu Arg Thr Lys Gln Arg Ile Gln Pro Gln Lys Thr
165 170 175

Ser Val Tyr Ile Glu Leu Gly Ser Asp Ser Ser Glu Asp Thr Val Asn
180 185 190

Lys Ala Thr Tyr Cys Ser Val Gly Asp Gln Glu Leu Leu Gln Ile Thr
195 200 205

Pro Gln Gly Thr Arg Asp Glu Ile Ser Leu Asp Ser Ala Lys Lys Ala
210 215 220

Ala Cys Glu Phe Ser Glu Thr Asp Val Thr Asn Thr Glu His His Gln
225 230 235 240

Pro Ser Asn Asn Asp Leu Asn Thr Thr Glu Lys Arg Ala Ala Glu Arg
245 250 255

His Pro Glu Lys Tyr Gln Gly Ser Ser Val Ser Asn Leu His Val Glu
260 265 270

Pro Cys Gly Thr Asn Thr His Ala Ser Ser Leu Gln His Glu Asn Ser
275 280 285

Ser Leu Leu Leu Thr Lys Asp Arg Met Asn Val Glu Lys Ala Glu Phe
290 295 300

Cys Asn Lys Ser Lys Gln Pro Gly Leu Ala Arg Ser Gln His Asn Arg
305 310 315 320

Trp Ala Gly Ser Lys Glu Thr Cys Asn Asp Arg Arg Thr Pro Ser Thr
325 330 335

Glu Lys Lys Val Asp Leu Asn Ala Asp Pro Leu Cys Glu Arg Lys Glu
340 345 350

Trp Asn Lys Gln Lys Leu Pro Cys Ser Glu Asn Pro Arg Asp Thr Glu
355 360 365

Asp Val Pro Trp Ile Thr Leu Asn Ser Ser Ile Gln Lys Val Asn Glu
370 375 380

Trp Phe Ser Arg Ser Asp Glu Leu Leu Gly Ser Asp Asp Ser His Asp
385 390 395 400

Gly Glu Ser Glu Ser Asn Ala Lys Val Ala Asp Val Leu Asp Val Leu
405 410 415

Asn Glu Val Asp Glu Tyr Ser Gly Ser Ser Glu Lys Ile Asp Leu Leu
420 425 430

Ala Ser Asp Pro His Glu Ala Leu Ile Cys Lys Ser Glu Arg Val His
435 440 445

Ser Lys Ser Val Glu Ser Asn Ile Glu Asp Lys Ile Phe Gly Lys Thr
450 455 460

Tyr Arg Lys Lys Ala Ser Leu Pro Asn Leu Ser His Val Thr Glu Asn
465 470 475 480

Leu Ile Ile Gly Ala Phe Val Thr Glu Pro Gln Ile Ile Gln Glu Arg
485 490 495

Pro Leu Thr Asn Lys Leu Lys Arg Lys Arg Arg Pro Thr Ser Gly Leu
500 505 510

His Pro Glu Asp Phe Ile Lys Lys Ala Asp Leu Ala Val Gln Lys Thr
515 520 525

Pro Glu Met Ile Asn Gln Gly Thr Asn Gln Thr Glu Gln Asn Gly Gln
530 535 540

Val Met Asn Ile Thr Asn Ser Gly His Glu Asn Lys Thr Lys Gly Asp
545 550 555 560

Ser Ile Gln Asn Glu Lys Asn Pro Asn Pro Ile Glu Ser Leu Glu Lys
565 570 575

Glu Ser Ala Phe Lys Thr Lys Ala Glu Pro Ile Ser Ser Ser Ile Ser
580 585 590

Asn Met Glu Leu Glu Leu Asn Ile His Asn Ser Lys Ala Pro Lys Lys
595 600 605

Asn Arg Leu Arg Arg Lys Ser Ser Thr Arg His Ile His Ala Leu Glu
610 615 620

Leu Val Val Ser Arg Asn Leu Ser Pro Pro Asn Cys Thr Glu Leu Gln
625 630 635 640

Ile Asp Ser Cys Ser Ser Ser Glu Glu Ile Lys Lys Lys Lys Tyr Asn
645 650 655

Gln Met Pro Val Arg His Ser Arg Asn Leu Gln Leu Met Glu Gly Lys
660 665 670

Glu Pro Ala Thr Gly Ala Lys Lys Ser Asn Lys Pro Asn Glu Gln Thr
675 680 685

Ser Lys Arg His Asp Ser Asp Thr Phe Pro Glu Leu Lys Leu Thr Asn
690 695 700

Ala Pro Gly Ser Phe Thr Lys Cys Ser Asn Thr Ser Glu Leu Lys Glu
705 710 715 720

Phe Val Asn Pro Ser Leu Pro Arg Glu Glu Lys Glu Glu Lys Leu Glu
725 730 735

Thr Val Lys Val Ser Asn Asn Ala Glu Asp Pro Lys Asp Leu Met Leu
740 745 750

Ser Gly Glu Arg Val Leu Gln Thr Glu Arg Ser Val Glu Ser Ser Ser
755 760 765

Ile Ser Leu Val Pro Gly Thr Asp Tyr Gly Thr Gln Glu Ser Ile Ser
770 775 780

Leu Leu Glu Val Ser Thr Leu Gly Lys Ala Lys Thr Glu Pro Asn Lys
785 790 795 800

Cys Val Ser Gln Cys Ala Ala Phe Glu Asn Pro Lys Gly Leu Ile His
805 810 815

Gly Cys Ser Lys Asp Asn Arg Asn Asp Thr Glu Gly Phe Lys Tyr Pro
820 825 830

Leu Gly His Glu Val Asn His Ser Arg Glu Thr Ser Ile Glu Met Glu
835 840 845

Glu Ser Glu Leu Asp Ala Gln Tyr Leu Gln Asn Thr Phe Lys Val Ser
850 855 860

Lys Arg Gln Ser Phe Ala Pro Phe Ser Asn Pro Gly Asn Ala Glu Glu
865 870 875 880

Glu Cys Ala Thr Phe Ser Ala His Ser Gly Ser Leu Lys Lys Gln Ser
885 890 895

Pro Lys Val Thr Phe Glu Cys Glu Gln Lys Glu Glu Asn Gln Gly Lys
900 905 910

Asn Glu Ser Asn Ile Lys Pro Val Gln Thr Val Asn Ile Thr Ala Gly
915 920 925

Phe Pro Val Val Gly Gln Lys Asp Lys Pro Val Asp Asn Ala Lys Cys
930 935 940

Ser Ile Lys Gly Gly Ser Arg Phe Cys Leu Ser Ser Gln Phe Arg Gly
945 950 955 960

Asn Glu Thr Gly Leu Ile Thr Pro Asn Lys His Gly Leu Leu Gln Asn
965 970 975

Pro Tyr Arg Ile Pro Pro Leu Phe Pro Ile Lys Ser Phe Val Lys Thr
980 985 990

Lys Cys Lys Lys Asn Leu Leu Glu Glu Asn Phe Glu Glu His Ser Met
995 1000 1005

Ser Pro Glu Arg Glu Met Gly Asn Glu Asn Ile Pro Ser Thr Val Ser
1010 1015 1020

Thr Ile Ser Arg Asn Asn Ile Arg Glu Asn Val Phe Lys Glu Ala Ser
1025 1030 1035 1040

Ser Ser Asn Ile Asn Glu Val Gly Ser Ser Thr Asn Glu Val Gly Ser
1045 1050 1055

Ser Ile Asn Glu Ile Gly Ser Ser Asp Glu Asn Ile Gln Ala Glu Leu
1060 1065 1070

Gly Arg Asn Arg Gly Pro Lys Leu Asn Ala Met Leu Arg Leu Gly Val
1075 1080 1085

Leu Gln Pro Glu Val Tyr Lys Gln Ser Leu Pro Gly Ser Asn Cys Lys
1090 1095 1100

His Pro Glu Ile Lys Lys Gln Glu Tyr Glu Glu Val Val Gln Thr Val
1105 1110 1115 1120

Asn Thr Asp Phe Ser Pro Tyr Leu Ile Ser Asp Asn Leu Glu Gln Pro
1125 1130 1135

Met Gly Ser Ser His Ala Ser Gln Val Cys Ser Glu Thr Pro Asp Asp
1140 1145 1150

Leu Leu Asp Asp Gly Glu Ile Lys Glu Asp Thr Ser Phe Ala Glu Asn
1155 1160 1165

Asp Ile Lys Glu Ser Ser Ala Val Phe Ser Lys Ser Val Gln Lys Gly
1170 1175 1180

Glu Leu Ser Arg Ser Pro Ser Pro Phe Thr His Thr His Leu Ala Gln
1185 1190 1195 1200

Gly Tyr Arg Arg Gly Ala Lys Lys Leu Glu Ser Ser Glu Glu Asn Leu
1205 1210 1215

Ser Ser Glu Asp Glu Glu Leu Pro Cys Phe Gln His Leu Leu Phe Gly
1220 1225 1230

Lys Val Asn Asn Ile Pro Ser Gln Ser Thr Arg His Ser Thr Val Ala
1235 1240 1245

Thr Glu Cys Leu Ser Lys Asn Thr Glu Glu Asn Leu Leu Ser Leu Lys
1250 1255 1260

Asn Ser Leu Asn Asp Cys Ser Asn Gln Val Ile Leu Ala Lys Ala Ser
1265 1270 1275 1280

Gln Glu His His Leu Ser Glu Glu Thr Lys Cys Ser Ala Ser Leu Phe
1285 1290 1295

Ser Ser Gln Cys Ser Glu Leu Glu Asp Leu Thr Ala Asn Thr Asn Thr
1300 1305 1310

Gln Asp Pro Phe Leu Ile Gly Ser Ser Lys Gln Met Arg His Gln Ser
1315 1320 1325

Glu Ser Gln Gly Val Gly Leu Ser Asp Lys Glu Leu Val Ser Asp Asp
1330 1335 1340

Glu Glu Arg Gly Thr Gly Leu Glu Glu Asn Asn Gln Glu Glu Gln Ser
1345 1350 1355 1360

Met Asp Ser Asn Leu Gly Glu Ala Ala Ser Gly Cys Glu Ser Glu Thr
1365 1370 1375

Ser Val Ser Glu Asp Cys Ser Gly Leu Ser Ser Gln Ser Asp Ile Leu
1380 1385 1390

Thr Thr Gln Gln Arg Asp Thr Met Gln His Asn Leu Ile Lys Leu Gln
1395 1400 1405

Gln Glu Met Ala Glu Leu Glu Ala Val Leu Glu Gln His Gly Ser Gln
1410 1415 1420

Pro Ser Asn Ser Tyr Pro Ser Ile Ile Ser Asp Ser Ser Ala Leu Glu
1425 1430 1435 1440

Asp Leu Arg Asn Pro Glu Gln Ser Thr Ser Glu Lys Ala Val Leu Thr
1445 1450 1455

Ser Gln Lys Ser Ser Glu Tyr Pro Ile Ser Gln Asn Pro Glu Gly Leu
1460 1465 1470

Ser Ala Asp Lys Phe Glu Val Ser Ala Asp Ser Ser Thr Ser Lys Asn
1475 1480 1485

Lys Glu Pro Gly Val Glu Arg Ser Ser Pro Ser Lys Cys Pro Ser Leu
1490 1495 1500

Asp Asp Arg Trp Tyr Met His Ser Cys Ser Gly Ser Leu Gln Asn Arg
1505 1510 1515 1520

Asn Tyr Pro Ser Gln Glu Glu Leu Ile Lys Val Val Asp Val Glu Glu
1525 1530 1535

Gln Gln Leu Glu Glu Ser Gly Pro His Asp Leu Thr Glu Thr Ser Tyr
1540 1545 1550

Leu Pro Arg Gln Asp Leu Glu Gly Thr Pro Tyr Leu Glu Ser Gly Ile
1555 1560 1565

Ser Leu Phe Ser Asp Asp Pro Glu Ser Asp Pro Ser Glu Asp Arg Ala
1570 1575 1580

Pro Glu Ser Ala Arg Val Gly Asn Ile Pro Ser Ser Thr Ser Ala Leu
1585 1590 1595 1600

Lys Val Pro Gln Leu Lys Val Ala Glu Ser Ala Gln Ser Pro Ala Ala
1605 1610 1615

Ala His Thr Thr Asp Thr Ala Gly Tyr Asn Ala Met Glu Glu Ser Val
1620 1625 1630

Ser Arg Glu Lys Pro Glu Leu Thr Ala Ser Thr Glu Arg Val Asn Lys
1635 1640 1645

Arg Met Ser Met Val Val Ser Gly Leu Thr Pro Glu Glu Phe Met Leu
1650 1655 1660

Val Tyr Lys Phe Ala Arg Lys His His Ile Thr Leu Thr Asn Leu Ile
1665 1670 1675 1680

Thr Glu Glu Thr Thr His Val Val Met Lys Thr Asp Ala Glu Phe Val
1685 1690 1695

Cys Glu Arg Thr Leu Lys Tyr Phe Leu Gly Ile Ala Gly Gly Lys Trp
1700 1705 1710

Val Val Ser Tyr Phe Trp Val Thr Gln Ser Ile Lys Glu Arg Lys Met
1715 1720 1725

Leu Asn Glu His Asp Phe Glu Val Arg Gly Asp Val Val Asn Gly Arg
1730 1735 1740

Asn His Gln Gly Pro Lys Arg Ala Arg Glu Ser Gln Asp Arg Lys Ile
1745 1750 1755 1760

Phe Arg Gly Leu Glu Ile Cys Cys Tyr Gly Pro Phe Thr Asn Met Pro
1765 1770 1775

Thr Asp Gln Leu Glu Trp Met Val Gln Leu Cys Gly Ala Ser Val Val
1780 1785 1790

Lys Glu Leu Ser Ser Phe Thr Leu Gly Thr Gly Val His Pro Ile Val
1795 1800 1805

Val Val Gln Pro Asp Ala Trp Thr Glu Asp Asn Gly Phe His Ala Ile
1810 1815 1820

Gly Gln Met Cys Glu Ala Pro Val Val Thr Arg Glu Trp Val Leu Asp
1825 1830 1835 1840

Ser Val Ala Leu Tyr Gln Cys Gln Glu Leu Asp Thr Tyr Leu Ile Pro
1845 1850 1855

Gln Ile Pro His Ser His Tyr *
1860

(2) INFORMATION FOR SEQ ID NO:3:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: s754 A

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:3:

CTAGCCTGGG CAACAAACGA 20

(2) INFORMATION FOR SEQ ID NO:4:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: s754 B

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:4:

GCAGGAAGCA GGAATGGAAC 20

(2) INFORMATION FOR SEQ ID NO:5:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: s975 A

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:5:

TAGGAGATGG ATTATTGGTG 20

(2) INFORMATION FOR SEQ ID NO:6:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: s975 B

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:6:

AGGCAACTTT GCAATGAGTG 20

(2) INFORMATION FOR SEQ ID NO:7:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: tdj1474 A

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:7:

CAGAGTGAGA CCTTGTCTCA AA 22

(2) INFORMATION FOR SEQ ID NO:8:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: tdj1474 B

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:8:

TTCTGCAAAC ACCTTAAACT CAG 23

(2) INFORMATION FOR SEQ ID NO:9:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: tdj1239 A

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:9:

AACCTGGAAG GCAGAGGTTG 20

(2) INFORMATION FOR SEQ ID NO:10:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: tdj1239 B

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:10:

TCTGTACCTG CTAAGCAGTG G 21

(2) INFORMATION FOR SEQ ID NO:11:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 111 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: cDNA

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(ix) FEATURE:
(A) NAME/KEY: CDS
(B) LOCATION: 2..111

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:11:

G GKC TTA CTC TGT TGT CCC AGC TGG AGT ACA GWG TGC GAT CAT GAG 46
Xaa Leu Leu Cys Cys Pro Ser Trp Ser Thr Xaa Cys Asp His Glu
1865 1870 1875

GCT TAC TGT TGC TTG ACT CCT AGG CTC AAG CGA TCC TAT CAC CTC AGT 94
Ala Tyr Cys Cys Leu Thr Pro Arg Leu Lys Arg Ser Tyr His Leu Ser
1880 1885 1890 1895

CTC CAA GTA GCT GGA CT 111
Leu Gln Val Ala Gly
1900

(2) INFORMATION FOR SEQ ID NO:12:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 36 amino acids
(B) TYPE: amino acid
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:12:

Xaa Leu Leu Cys Cys Pro Ser Trp Ser Thr Xaa Cys Asp His Glu Ala
1 5 10 15

Tyr Cys Cys Leu Thr Pro Arg Leu Lys Arg Ser Tyr His Leu Ser Leu
20 25 30

Gln Val Ala Gly
35

(2) INFORMATION FOR SEQ ID NO:13:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1534 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:13:

GAGGCTAGAG GGCAGGCACT TTATGGCAAA CTCAGGTAGA ATTCTTCCTC TTCCGTCTCT 60

TTCCTTTTAC GTCATCGGGG AGACTGGGTG GCAATCGCAG CCCGAGAGAC GCATGGCTCT 120

TTCTGCCCTC CATCCTCTGA TGTACCTTGA TTTCGTATTC TGAGAGGCTG CTGCTTAGCG 180

GTAGCCCCTT GGTTTCCGTG GCAACGGAAA AGCGCGGGAA TTACAGATAA ATTAAAACTG 240

CGACTGCGCG GCGTGAGCTC GCTGAGACTT CCTGGACCCC GCACCAGGCT GTGGGGTTTC 300

TCAGATAACT GGGCCCCTGC GCTCAGGAGG CCTTCACCCT CTGCTCTGGG TAAAGGTAGT 360

AGAGTCCCGG GAAAGGGACA GGGGGCCCAA GTGATGCTCT GGGGTACTGG CGTGGGAGAG 420

TGGATTTCCG AAGCTGACAG ATGGGTATTC TTTGACGGGG GGTAGGGGCG GAACCTGAGA 480

GGCGTAAGGC GTTGTGAACC CTGGGGAGGG GGGCAGTTTG TAGGTCGCGA GGGAAGCGCT 540

GAGGATCAGG AAGGGGGCAC TGAGTGTCCG TGGGGGAATC CTCGTGATAG GAACTGGAAT 600

ATGCCTTGAG GGGGACACTA TGTCTTTAAA AACGTCGGCT GGTCATGAGG TCAGGAGTTC 660

CAGACCAGCC TGACCAACGT GGTGAAACTC CGTCTCTACT AAAAATACNA AAATTAGCCG 720

GGCGTGGTGC CGCTCCAGCT ACTCAGGAGG CTGAGGCAGG AGAATCGCTA GAACCCGGGA 780

GGCGGAGGTT GCAGTGAGCC GAGATCGCGC CATTGCACTC CAGCCTGGGC GACAGAGCGA 840

GACTGTCTCA AAACAAAACA AAACAAAACA AAACAAAAAA CACCGGCTGG TATGTATGAG 900

AGGATGGGAC CTTGTGGAAG AAGAGGTGCC AGGAATATGT CTGGGAAGGG GAGGAGACAG 960

GATTTTGTGG GAGGGAGAAC TTAAGAACTG GATCCATTTG CGCCATTGAG AAAGCGCAAG 1020

AGGGAAGTAG AGGAGCGTCA GTAGTAACAG ATGCTGCCGG CAGGGATGTG CTTGAGGAGG 1080

ATCCAGAGAT GAGAGCAGGT CACTGGGAAA GGTTAGGGGC GGGGAGGCCT TGATTGGTGT 1140

TGGTTTGGTC GTTGTTGATT TTGGTTTTAT GCAAGAAAAA GAAAACAACC AGAAACATTG 1200

GAGAAAGCTA AGGCTACCAC CACCTACCCG GTCAGTCACT CCTCTGTAGC TTTCTCTTTC 1260

TTGGAGAAAG GAAAAGACCC AAGGGGTTGG CAGCGATATG TGAAAAAATT CAGAATTTAT 1320

GTTGTCTAAT TACAAAAAGC AACTTCTAGA ATCTTTAAAA ATAAAGGACG TTGTCATTAG 1380

TTCTTCTGGT TTGTATTATT CTAAAACCTT CCAAATCTTC AAATTTACTT TATTTTAAAA 1440

TGATAAAATG AAGTTGTCAT TTTATAAACC TTTTAAAAAG ATATATATAT ATGTTTTTCT 1500

AATGTGTTAA AGTTCATTGG AACAGAAAGA AATG 1534

(2) INFORMATION FOR SEQ ID NO:14:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1924 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:14:

GAGGCTAGAG GGCAGGCACT TTATGGCAAA CTCAGGTAGA ATTCTTCCTC TTCCGTCTCT 60

TTCCTTTTAC GTCATCGGGG AGACTGGGTG GCAATCGCAG CCCGAGAGAC GCATGGCTCT 120

TTCTGCCCTC CATCCTCTGA TGTACCTTGA TTTCGTATTC TGAGAGGCTG CTGCTTAGCG 180

GTAGCCCCTT GGTTTCCGTG GCAACGGAAA AGCGCGGGAA TTACAGATAA ATTAAAACTG 240

CGACTGCGCG GCGTGAGCTC GCTGAGACTT CCTGGACCCC GCACCAGGCT GTGGGGTTTC 300

TCAGATAACT GGGCCCCTGC GCTCAGGAGG CCTTCACCCT CTGCTCTGGG TAAAGGTAGT 360

AGAGTCCCGG GAAAGGGACA GGGGGCCCAA GTGATGCTCT GGGGTACTGG CGTGGGAGAG 420

TGGATTTCCG AAGCTGACAG ATGGGTATTC TTTGACGGGG GGTAGGGGCG GAACCTGAGA 480

GGCGTAAGGC GTTGTGAACC CTGGGGAGGG GGGCAGTTTG TAGGTCGCGA GGGAAGCGCT 540

GAGGATCAGG AAGGGGGCAC TGAGTGTCCG TGGGGGAATC CTCGTGATAG GAACTGGAAT 600

ATGCCTTGAG GGGGACACTA TGTCTTTAAA AACGTCGGCT GGTCATGAGG TCAGGAGTTC 660

CAGACCAGCC TGACCAACGT GGTGAAACTC CGTCTCTACT AAAAATACNA AAATTAGCCG 720

GGCGTGGTGC CGCTCCAGCT ACTCAGGAGG CTGAGGCAGG AGAATCGCTA GAACCCGGGA 780

GGCGGAGGTT GCAGTGAGCC GAGATCGCGC CATTGCACTC CAGCCTGGGC GACAGAGCGA 840

GACTGTCTCA AAACAAAACA AAACAAAACA AAACAAAAAA CACCGGCTGG TATGTATGAG 900

AGGATGGGAC CTTGTGGAAG AAGAGGTGCC AGGAATATGT CTGGGAAGGG GAGGAGACAG 960

GATTTTGTGG GAGGGAGAAC TTAAGAACTG GATCCATTTG CGCCATTGAG AAAGCGCAAG 1020

AGGGAAGTAG AGGAGCGTCA GTAGTAACAG ATGCTGCCGG CAGGGATGTG CTTGAGGAGG 1080

ATCCAGAGAT GAGAGCAGGT CACTGGGAAA GGTTAGGGGC GGGGAGGCCT TGATTGGTGT 1140

TGGTTTGGTC GTTGTTGATT TTGGTTTTAT GCAAGAAAAA GAAAACAACC AGAAACATTG 1200

GAGAAAGCTA AGGCTACCAC CACCTACCCG GTCAGTCACT CCTCTGTAGC TTTCTCTTTC 1260

TTGGAGAAAG GAAAAGACCC AAGGGGTTGG CAGCGATATG TGAAAAAATT CAGAATTTAT 1320

GTTGTCTAAT TACAAAAAGC AACTTCTAGA ATCTTTAAAA ATAAAGGACG TTGTCATTAG 1380

TTCTTCTGGT TTGTATTATT CTAAAACCTT CCAAATCTTC AAATTTACTT TATTTTAAAA 1440

TGATAAAATG AAGTTGTCAT TTTATAAACC TTTTAAAAAG ATATATATAT ATGTTTTTCT 1500

AATGTGTTAA AGTTCATTGG AACAGAAAGA AATGGATTTA TCTGCTCTTC GCGTTGAAGA 1560

AGTACAAAAT GTCATTAATG CTATGCAGAA AATCTTAGAG TGTCCCATCT GGTAAGTCAG 1620

CACAAGAGTG TATTAATTTG GGATTCCTAT GATTATCTCC TATGCAAATG AACAGAATTG 1680

ACCTTACATA CTAGGGAAGA AAAGACATGT CTAGTAAGAT TAGGCTATTG TAATTGCTGA 1740

TTTTCTTAAC TGAAGAACTT TAAAAATATA GAAAATGATT CCTTGTTCTC CATCCACTCT 1800

GCCTCTCCCA CTCCTCTCCT TTTCAACACA ATCCTGTGGT CCGGGAAAGA CAGGGCTCTG 1860

TCTTGATTGG TTCTGCACTG GGCAGGATCT GTTAGATACT GCATTTGCTT TCTCCAGCTC 1920

TAAA 1924

(2) INFORMATION FOR SEQ ID NO:15:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 631 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:15:

AAATGCTGAT GATAGTATAG AGTATTGAAG GGATCAATAT AATTCTGTTT TGATATCTGA 60

AAGCTCACTG AAGGTAAGGA TCGTATTCTC TGCTGTATTC TCAGTTCCTG ACACAGCAGA 120

CATTTAATAA ATATTGAACG AACTTGAGGC CTTATGTTGA CTCAGTCATA ACAGCTCAAA 180

GTTGAACTTA TTCACTAAGA ATAGCTTTAT TTTTAAATAA ATTATTGAGC CTCATTTATT 240

TTCTTTTTCT CCCCCCCCTA CCCTGCTAGT CTGGAGTTGA TCAAGGAACC TGTCTCCACA 300

AAGTGTGACC ACATATTTTG CAAGTAAGTT TGAATGTGTT ATGTGGCTCC ATTATTAGCT 360

TTTGTTTTTG TCCTTCATAA CCCAGGAAAC ACCTAACTTT ATAGAAGCTT TACTTTCTTC 420

AATTAAGTGA GAACGAAAAT CCAACTCCAT TTCATTCTTT CTCAGAGAGT ATATAGTTAT 480

CAAAAGTTGG TTGTAATCAT AGTTCCTGGT AAAGTTTTGA CATATATTAT CTTTTTTTTT 540

TTTTGAGACA AGTCTCGCTC TGTCGCCCAG GCTGGAGTGC AGTGGCATGA GGCTTGCTCA 600

CTGCACCTCC GCCCCCGAGT TCAGCGACTC T 631

(2) INFORMATION FOR SEQ ID NO:16:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 481 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:16:

TGAGATCTAG ACCACATGGT CAAAGAGATA GAATGTGAGC AATAAATGAA CCTTAAATTT 60

TTCAACAGCT ACTTTTTTTT TTTTTTTTTG AGACAGGGKC TTACTCTGTT GTCCCAGCTG 120

GAGTACAGWG TGCGATCATG AGGCTTACTG TTGCTTGACT CCTAGGCTCA AGCGATCCTA 180

TCACCTCAGT CTCCAAGTAG CTGGACTGTA AGTGCACACC ACCATATCCA GCTAAATTTT 240

GTGTTTTCTG TAGAGACGGG GTTTCGCCAT GTTTCCCAGG CTGGTCTTGA ACTTTGGGCT 300

TAACCCGTCT GCCCACCTAG GCATCCCAAA GTGCTAGGAT TACAGGTGTG AGTCATCATG 360

CCTGGCCAGT ATTTTAGTTA GCTCTGTCTT TTCAAGTCAT ATACAAGTTC ATTTTCTTTT 420

AAGTTTAGTT AACAACCTTA TATCATGTAT TCTTTTCTAG CATAAAGAAA GATTCGAGGC 480

C 481

(2) INFORMATION FOR SEQ ID NO:17:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 522 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:17:

TGTGATCATA ACAGTAAGCC ATATGCATGT AAGTTCAGTT TTCATAGATC ATTGCTTATG 60

TAGTTTAGGT TTTTGCTTAT GCAGCATCCA AAAACAATTA GGAAACTATT GCTTGTAATT 120

CACCTGCCAT TACTTTTTAA ATGGCTCTTA AGGGCAGTTG TGAGATTATC TTTTCATGGC 180

TATTTGCCTT TTGAGTATTC TTTCTACAAA AGGAAGTAAA TTAAATTGTT CTTTCTTTCT 240

TTATAATTTA TAGATTTTGC ATGCTGAAAC TTCTCAACCA GAAGAAAGGG CCTTCACAGT 300

GTCCTTTATG TAAGAATGAT ATAACCAAAA GGTATATAAT TTGGTAATGA TGCTAGGTTG 360

GAAGCAACCA CAGTAGGAAA AAGTAGAAAT TATTTAATAA CATAGCGTTC CTATAAAACC 420

ATTCATCAGA AAAATTTATA AAAGAGTTTT TAGCACACAG TAAATTATTT CCAAAGTTAT 480

TTTCCTGAAA GTTTTATGGG CATCTGCCTT ATACAGGTAT TG 522

(2) INFORMATION FOR SEQ ID NO:18:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 465 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:18:

GGTAGGCTTA AATGAATGAC AAAAAGTTAC TAAATCACTG CCATCACACG GTTTATACAG 60

ATGTCAATGA TGTATTGATT ATAGAGGTTT TCTACTGTTG CTGCATCTTA TTTTTATTTG 120

TTTACATGTC TTTTCTTATT TTAGTGTCCT TAAAAGGTTG ATAATCACTT GCTGAGTGTG 180

TTTCTCAAAC AATTTAATTT CAGGAGCCTA CAAGAAAGTA CGAGATTTAG TCAACTTGTT 240

GAAGAGCTAT TGAAAATCAT TTGTGCTTTT CAGCTTGACA CAGGTTTGGA GTGTAAGTGT 300

TGAATATCCC AAGAATGACA CTCAAGTGCT GTCCATGAAA ACTCAGGAAG TTTGCACAAT 360

TACTTTCTAT GACGTGGTGA TAAGACCTTT TAGTCTAGGT TAATTTTAGT TCTGTATCTG 420

TAATCTATTT TAAAAAATTA CTCCCACTGG TCTCACACCT TATTT 465

(2) INFORMATION FOR SEQ ID NO:19:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 513 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:19:

AAAAAATCAC AGGTAACCTT AATGCATTGT CTTAACACAA CAAAGAGCAT ACATAGGGTT 60

TCTCTTGGTT TCTTTGATTA TAATTCATAC ATTTTTCTCT AACTGCAAAC ATAATGTTTT 120

CCCTTGTATT TTACAGATGC AAACAGCTAT AATTTTGCAA AAAAGGAAAA TAACTCTCCT 180

GAACATCTAA AAGATGAAGT TTCTATCATC CAAAGTATGG GCTACAGAAA CCGTGCCAAA 240

AGACTTCTAC AGAGTGAACC CGAAAATCCT TCCTTGGTAA AACCATTTGT TTTCTTCTTC 300

TTCTTCTTCT TCTTTTCTTT TTTTTTTCTT TTTTTTTTTG AGATGGAGTC TTGCTCTGTG 360

GCCCAGGCTA GAAGCAGTCC TCCTGCCTTA GCCNCCTTAG TAGCTGGGAT TACAGGCACG 420

CGCACCATGC CAGGCTAATT TTTGTATTTT TAGTAGAGAC GGGGTTTCAT CATGTTGGCC 480

AGGCTGGTCT CGAACTCCTA ACCTCAGGTG ATC 513

(2) INFORMATION FOR SEQ ID NO:20:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 6769 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:20:

ATGATGGAGA TCTTAAAAAG TAATCATTCT GGGGCTGGGC GTAGTAGCTT GCACCTGTAA 60

TCCCAGCACT TCGGGAGGCT GAGGCAGGCA GATAATTTGA GGTCAGGAGT TTGAGACCAG 120

CCTGGCCAAC ATGGTGAAAC CCATCTCTAC TAAAAATACA AAAATTAGCT GGGTGTGGTG 180

GCACGTACCT GTAATCCCAG CTACTCGGGA GGCGGAGGCA CAAGAATTGC TTGAACCTAG 240

GACGCGGAGG TTGCAGCGAG CCAAGATCGC GCCACTGCAC TCCAGCCTGG GCCGTAGAGT 300

GAGACTCTGT CTCAAAAAAG AAAAAAAAGT AATTGTTCTA GCTGGGCGCA GTGGCTCTTG 360

CCTGTAATCC CAGCACTTTG GGAGGCCAAG GCGGGTGGAT CTCGAGTCCT AGAGTTCAAG 420

ACCAGCCTAG GCAATGTGGT GAAACCCCAT CGCTACAAAA AATACAAAAA TTAGCCAGGC 480

ATGGTGGCGT GCGCATGTAG TCCCAGCTCC TTGGGAGGCT GAGGTGGGAG GATCACTTGA 540

ACCCAGGAGA CAGAGGTTGC AGTGAACCGA GATCACGCCA CCACGCTCCA GCCTGGGCAA 600

CAGAACAAGA CTCTGTCTAA AAAAATACAA ATAAAATAAA AGTAGTTCTC ACAGTACCAG 660

CATTCATTTT TCAAAAGATA TAGAGCTAAA AAGGAAGGAA AAAAAAAGTA ATGTTGGGCT 720

TTTAAATACT CGTTCCTATA CTAAATGTTC TTAGGAGTGC TGGGGTTTTA TTGTCATCAT 780

TTATCCTTTT TAAAAATGTT ATTGGCCAGG CACGGTGGCT CATGGCTGTA ATCCCAGCAC 840

TTTGGGAGGC CGAGGCAGGC AGATCACCTG AGGTCAGGAG TGTGAGACCA GCCTGGCCAA 900

CATGGCGAAA CCTGTCTCTA CTAAAAATAC AAAAATTAAC TAGGCGTGGT GGTGTACGCC 960

TGTAGTCCCA GCTACTCGGG AGGCTGAGGC AGGAGAATCA ACTGAACCAG GGAGGTGGAG 1020

GTTGCAGTGT GCCGAGATCA CGCCACTGCA CTCTAGCCTG GCAACAGAGC AAGATTCTGT 1080

CTCAAAAAAA AAAAACATAT ATACACATAT ATCCCAAAGT GCTGGGATTA CATATATATA 1140

TATATATATA TATTATATAT ATATATATAT ATATATGTGA TATATATGTG ATATATATAT 1200

AACATATATA TATGTAATAT ATATGTGATA TATATATAAT ATATATATGT AATATATATG 1260

TGATATATAT ATATACACAC ACACACACAT ATATATGTAT GTGTGTGTAC ACACACACAC 1320

ACAAATTAGC CAGGCATAGT TGCACACGCT TGGTAGACCC AGCTACTCAG GAGGCTGAGG 1380

GAGGAGAATC TCTTGAACTT AGGAGGCGGA GGTTGCAGTG AGCTGAGATT GCGCCACTGC 1440

ACTCCAGCCT GGGTGACAGA GCAGGACTCT GTACACCCCC CAAAACAAAA AAAAAAGTTA 1500

TCAGATGTGA TTGGAATGTA TATCAAGTAT CAGCTTCAAA ATATGCTATA TTAATACTTC 1560

AAAAATTACA CAAATAATAC ATAATCAGGT TTGAAAAATT TAAGACAACM SAARAAAAAA 1620

WYCMAATCAC AMATATCCCA CACATTTTAT TATTMCTMCT MCWATTATTT TGWAGAGMCT 1680

GGGTCTCACY CYKTTGCTWA TGCTGGTCTT TGAACYCCYK GCCYCAARCA RTCCTSCTCC 1740

ABCCTCCCAA RGTGCTGGGG ATWATAGGCA TGARCTAACC GCACCCAGCC CCAGACATTT 1800

TAGTGTGTAA ATTCCTGGGC ATTTTTTCAA GGCATCATAC ATGTTAGCTG ACTGATGATG 1860

GTCAATTTAT TTTGTCCATG GTGTCAAGTT TCTCTTCAGG AGGAAAAGCA CAGAACTGGC 1920

CAACAATTGC TTGACTGTTC TTTACCATAC TGTTTAGCAG GAAACCAGTC TCAGTGTCCA 1980

ACTCTCTAAC CTTGGAACTG TGAGAACTCT GAGGACAAAG CAGCGGATAC AACCTCAAAA 2040

GACGTCTGTC TACATTGAAT TGGGTAAGGG TCTCAGGTTT TTTAAGTATT TAATAATAAT 2100

TGCTGGATTC CTTATCTTAT AGTTTTGCCA AAAATCTTGG TCATAATTTG TATTTGTGGT 2160

AGGCAGCTTT GGGAAGTGAA TTTTATGAGC CCTATGGTGA GTTATAAAAA ATGTAAAAGA 2220

CGCAGTTCCC ACCTTGAAGA ATCTTACTTT AAAAAGGGAG CAAAAGAGGC CAGGCATGGT 2280

GGCTCACACC TGTAATCCCA GCACTTTGGG AGGCCAAAGT GGGTGGATCA CCTGAGGTCG 2340

GGAGTTCGAG ACCAGCCTAG CCAACATGGA GAAACTCTGT CTGTACCAAA AAATAAAAAA 2400

TTAGCCAGGT GTGGTGGCAC ATAACTGTAA TCCCAGCTAC TCGGGAGGCT GAGGCAGGAG 2460

AATCACTTGA ACCCGGGAGG TGGAGGTTGC GGTGAACCGA GATCGCACCA TTGCACTCCA 2520

GCCTGGGCAA AAATAGCGAA ACTCCATCTA AAAAAAAAAA AGAGAGCAAA AGAAAGAMTM 2580

TCTGGTTTTA AMTMTGTGTA AATATGTTTT TGGAAAGATG GAGAGTAGCA ATAAGAAAAA 2640

ACATGATGGA TTGCTACAGT ATTTAGTTCC AAGATAAATT GTACTAGATG AGGAAGCCTT 2700

TTAAGAAGAG CTGAATTGCC AGGCGCAGTG GCTCACGCCT GTAATCCCAG CACTTTGGGA 2760

GGCCGAGGTG GGCGGATCAC CTGAGGTCGG GAGTTCAAGA CCAGCCTGAC CAACATGGAG 2820

AAACCCCATC TCTACTAAAA AAAAAAAAAA AAAAATTAGC CGGGGTGGTG GCTTATGCCT 2880

GTAATCCCAG CTACTCAGGA GGCTGAGGCA GGAGAATCGC TTGAACCCAG GAAGCAGAGG 2940

TTGCAGTGAG CCAAGATCGC ACCATTGCAC TCCAGCCTAG GCAACAAGAG TGAAACTCCA 3000

TCTCAAAAAA AAAAAAAAAG AGCTGAATCT TGGCTGGGCA GGATGGCTCG TGCCTGTAAT 3060

CCTAACGCTT TGGAAGACCG AGGCAGAAGG ATTGGTTGAG TCCACGAGTT TAAGACCAGC 3120

CTGGCCAACA TAGGGGAACC CTGTCTCTAT TTTTAAAATA ATAATACATT TTTGGCCGGT 3180

GCGGTGGCTC ATGCCTGTAA TCCCAATACT TTGGGAGGCT GAGGCAGGTA GATCACCTGA 3240

GGTCAGAGTT CGAGACCAGC CTGGATAACC TGGTGAAACC CCTCTTTACT AAAAATACAA 3300

AAAAAAAAAA AAATTAGCTG GGTGTGGTAG CACATGCTTG TAATCCCAGC TACTTGGGAG 3360

GCTGAGGCAG GAGAATCGCT TGAACCAGGG AGGCGGAGGT TACAATGAGC CAACACTACA 3420

CCACTGCACT CCAGCCTGGG CAATAGAGTG AGACTGCATC TCAAAAAAAT AATAATTTTT 3480

AAAAATAATA AATTTTTTTA AGCTTATAAA AAGAAAAGTT GAGGCCAGCA TAGTAGCTCA 3540

CATCTGTAAT CTCAGCAGTG GCAGAGGATT GCTTGAAGCC AGGAGTTTGA GACCAGCCTG 3600

GGCAACATAG CAAGACCTCA TCTCTACAAA AAAATTTCTT TTTTAAATTA GCTGGGTGTG 3660

GTGGTGTGCA TCTGTAGTCC CAGCTACTCA GGAGGCAGAG GTGAGTGGAT ACATTGAACC 3720

CAGGAGTTTG AGGCTGTAGT GAGCTATGAT CATGCCACTG CACTCCAACC TGGGTGACAG 3780

AGCAAGACCT CCAAAAAAAA AAAAAAAAGA GCTGCTGAGC TCAGAATTCA AACTGGGCTC 3840

TCAAATTGGA TTTTCTTTTA GAATATATTT ATAATTAAAA AGGATAGCCA TCTTTTGAGC 3900

TCCCAGGCAC CACCATCTAT TTATCATAAC ACTTACTGTT TTCCCCCCTT ATGATCATAA 3960

ATTCCTAGAC AACAGGCATT GTAAAAATAG TTATAGTAGT TGATATTTAG GAGCACTTAA 4020

CTATATTCCA GGCACTATTG TGCTTTTCTT GTATAACTCA TTAGATGCTT GTCAGACCTC 4080

TGAGATTGTT CCTATTATAC TTATTTTACA GATGAGAAAA TTAAGGCACA GAGAAGTTAT 4140

GAAATTTTTC CAAGGTATTA AACCTAGTAA GTGGCTGAGC CATGATTCAA ACCTAGGAAG 4200

TTAGATGTCA GAGCCTGTGC TTTTTTTTTG TTTTTGTTTT TGTTTTCAGT AGAAACGGGG 4260

GTCTCACTTT GTTGGCCAGG CTGGTCTTGA ACTCCTAACC TCAAATAATC CACCCATCTC 4320

GGCCTCCTCA AGTGCTGGGA TTACAGGTGA GAGCCACTGT GCCTGGCGAA GCCCATGCCT 4380

TTAACCACTT CTCTGTATTA CATACTAGCT TAACTAGCAT TGTACCTGCC ACAGTAGATG 4440

CTCAGTAAAT ATTTCTAGTT GAATATCTGT TTTTCAACAA GTACATTTTT TTAACCCTTT 4500

TAATTAAGAA AACTTTTATT GATTTATTTT TTGGGGGGAA ATTTTTTAGG ATCTGATTCT 4560

TCTGAAGATA CCGTTAATAA GGCAACTTAT TGCAGGTGAG TCAAAGAGAA CCTTTGTCTA 4620

TGAAGCTGGT ATTTTCCTAT TTAGTTAATA TTAAGGATTG ATGTTTCTCT CTTTTTAAAA 4680

ATATTTTAAC TTTTATTTTA GGTTCAGGGA TGTATGTGCA GTTTGTTATA TAGGTAAACA 4740

CACGACTTGG GATTTGGTGT ATAGATTTTT TTCATCATCC GGGTACTAAG CATACCCCAC 4800

AGTTTTTTGT TTGCTTTCTT TCTGAATTTC TCCCTCTTCC CACCTTCCTC CCTCAAGTAG 4860

GCTGGTGTTT CTCCAGACTA GAATCATGGT ATTGGAAGAA ACCTTAGAGA TCATCTAGTT 4920

TAGTTCTCTC ATTTTATAGT GGAGGAAATA CCCTTTTTGT TTGTTGGATT TAGTTATTAG 4980

CACTGTCCAA AGGAATTTAG GATAACAGTA GAACTCTGCA CATGCTTGCT TCTAGCAGAT 5040

TGTTCTCTAA GTTCCTCATA TACAGTAATA TTGACACAGC AGTAATTGTG ACTGATGAAA 5100

ATGTTCAAGG ACTTCATTTT CAACTCTTTC TTTCCTCTGT TCCTTATTTC CACATATCTC 5160

TCAAGCTTTG TCTGTATGTT ATATAATAAA CTACAAGCAA CCCCAACTAT GTTACCTACC 5220

TTCCTTAGGA ATTATTGCTT GACCCAGGTT TTTTTTTTTT TTTTTTTGGA GACGGGGTCT 5280

TGCCCTGTTG CCAGGATGGA GTGTAGTGGC GCCATCTCGG CTCACTGCAA TCTCCAACTC 5340

CCTGGTTCAA GCGATTCTCC TGTCTCAATC TCACGAGTAG CTGGGACTAC AGGTATACAC 5400

CACCACGCCC GGTTAATTGA CCATTCCATT TCTTTCTTTC TCTCTTTTTT TTTTTTTTTT 5460

TTGAGACAGA GTCTTGCTCT GTTGCCCAGG CTGGAGTACA GAGGTGTGAT CTCACCTCTC 5520

CGCAACGTCT GCCTCCCAGG TTGAAGCCAT ACTCCTGCCT CAGCCTCTCT AGTAGCTGGG 5580

ACTACAGGCG CGCGCCACCA CACCCGGCTA ATTTTTGTAT TTTTAGTAGA GATGGGGTTT 5640

CACCATGTTG GCCAGGCTGG TCTTGAACTC ATGACCTCAA GTGGTCCACC CGCCTCAGCC 5700

TCCCAAAGTG CTGGAATTAC AGGCTTGAGC CACCGTGCCC AGCAACCATT TCATTTCAAC 5760

TAGAAGTTTC TAAAGGAGAG AGCAGCTTTC ACTAACTAAA TAAGATTGGT CAGCTTTCTG 5820

TAATCGAAAG AGCTAAAATG TTTGATCTTG GTCATTTGAC AGTTCTGCAT ACATGTAACT 5880

AGTGTTTCTT ATTAGGACTC TGTCTTTTCC CTATAGTGTG GGAGATCAAG AATTGTTACA 5940

AATCACCCCT CAAGGAACCA GGGATGAAAT CAGTTTGGAT TCTGCAAAAA AGGGTAATGG 6000

CAAAGTTTGC CAACTTAACA GGCACTGAAA AGAGAGTGGG TAGATACAGT ACTGTAATTA 6060

GATTATTCTG AAGACCATTT GGGACCTTTA CAACCCACAA AATCTCTTGG CAGAGTTAGA 6120

GTATCATTCT CTGTCAAATG TCGTGGTATG GTCTGATAGA TTTAAATGGT ACTAGACTAA 6180

TGTACCTATA ATAAGACCTT CTTGTAACTG ATTGTTGCCC TTTCGCTTTT TTTTTTGTTT 6240

GTTTGTTTGT TTTTTTTTGA GATGGGGTCT CACTCTGTTG CCCAGGCTGG AGTGCAGTGA 6300

TGCAATCTTG GCTCACTGCA ACCTCCACCT CCAAAGGCTC AAGCTATCCT CCCACTTCAG 6360

CCTCCTGAGT AGCTGGGACT ACAGGCGCAT GCCACCACAC CCGGTTAATT TTTTGTGGTT 6420

TTATAGAGAT GGGGTTTCAC CATGTTACCG AGGCTGGTCT CAAACTCCTG GACTCAAGCA 6480

GTCTGCCCAC TTCAGCCTCC CAAAGTGCTG CAGTTACAGG CTTGAGCCAC TGTGCCTGGC 6540

CTGCCCTTTA CTTTTAATTG GTGTATTTGT GTTTCATCTT TTACCTACTG GTTTTTAAAT 6600

ATAGGGAGTG GTAAGTCTGT AGATAGAACA GAGTATTAAG TAGACTTAAT GGCCAGTAAT 6660

CTTTAGAGTA CATCAGAACC AGTTTTCTGA TGGCCAATCT GCTTTTAATT CACTCTTAGA 6720

CGTTAGAGAA ATAGGTGTGG TTTCTGCATA GGGAAAATTC TGAAATTAA 6769

(2) INFORMATION FOR SEQ ID NO:21:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 4249 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:21:

GATCCTAAGT GGAAATAATC TAGGTAAATA GGAATTAAAT GAAAGAGTAT GAGCTACATC 60

TTCAGTATAC TTGGTAGTTT ATGAGGTTAG TTTCTCTAAT ATAGCCAGTT GGTTGATTTC 120

CACCTCCAAG GTGTATGAAG TATGTATTTT TTTAATGACA ATTCAGTTTT TGAGTACCTT 180

GTTATTTTTG TATATTTTCA GCTGCTTGTG AATTTTCTGA GACGGATGTA ACAAATACTG 240

AACATCATCA ACCCAGTAAT AATGATTTGA ACACCACTGA GAAGCGTGCA GCTGAGAGGC 300

ATCCAGAAAA GTATCAGGGT AGTTCTGTTT CAAACTTGCA TGTGGAGCCA TGTGGCACAA 360

ATACTCATGC CAGCTCATTA CAGCATGAGA ACAGCAGTTT ATTACTCACT AAAGACAGAA 420

TGAATGTAGA AAAGGCTGAA TTCTGTAATA AAAGCAAACA GCCTGGCTTA GCAAGGAGCC 480

AACATAACAG ATGGGCTGGA AGTAAGGAAA CATGTAATGA TAGGCGGACT CCCAGCACAG 540

AAAAAAAGGT AGATCTGAAT GCTGATCCCC TGTGTGAGAG AAAAGAATGG AATAAGCAGA 600

AACTGCCATG CTCAGAGAAT CCTAGAGATA CTGAAGATGT TCCTTGGATA ACACTAAATA 660

GCAGCATTCA GAAAGTTAAT GAGTGGTTTT CCAGAAGTGA TGAACTGTTA GGTTCTGATG 720

ACTCACATGA TGGGGAGTCT GAATCAAATG CCAAAGTAGC TGATGTATTG GACGTTCTAA 780

ATGAGGTAGA TGAATATTCT GGTTCTTCAG AGAAAATAGA CTTACTGGCC AGTGATCCTC 840

ATGAGGCTTT AATATGTAAA AGTGAAAGAG TTCACTCCAA ATCAGTAGAG AGTAATATTG 900

AAGGCCAAAT ATTTGGGAAA ACCTATCGGA AGAAGGCAAG CCTCCCCAAC TTAAGCCATG 960

TAACTGAAAA TCTAATTATA GGAGCATTTG TTACTGAGCC ACAGATAATA CAAGAGCGTC 1020

CCCTCACAAA TAAATTAAAG CGTAAAAGGA GACCTACATC AGGCCTTCAT CCTGAGGATT 1080

TTATCAAGAA AGCAGATTTG GCAGTTCAAA AGACTCCTGA AATGATAAAT CAGGGAACTA 1140

ACCAAACGGA GCAGAATGGT CAAGTGATGA ATATTACTAA TAGTGGTCAT GAGAATAAAA 1200

CAAAAGGTGA TTCTATTCAG AATGAGAAAA ATCCTAACCC AATAGAATCA CTCGAAAAAG 1260

AATCTGCTTT CAAAACGAAA GCTGAACCTA TAAGCAGCAG TATAAGCAAT ATGGAACTCG 1320

AATTAAATAT CCACAATTCA AAAGCACCTA AAAAGAATAG GCTGAGGAGG AAGTCTTCTA 1380

CCAGGCATAT TCATGCGCTT GAACTAGTAG TCAGTAGAAA TCTAAGCCCA CCTAATTGTA 1440

CTGAATTGCA AATTGATAGT TGTTCTAGCA GTGAAGAGAT AAAGAAAAAA AAGTACAACC 1500

AAATGCCAGT CAGGCACAGC AGAAACCTAC AACTCATGGA AGGTAAAGAA CCTGCAACTG 1560

GAGCCAAGAA GAGTAACAAG CCAAATGAAC AGACAAGTAA AAGACATGAC AGCGATACTT 1620

TCCCAGAGCT GAAGTTAACA AATGCACCTG GTTCTTTTAC TAAGTGTTCA AATACCAGTG 1680

AACTTAAAGA ATTTGTCAAT CCTAGCCTTC CAAGAGAAGA AAAAGAAGAG AACTAGAAAC 1740

AGTTAAAGTG TCTAATAATG CTGAAGACCC CAAAGATCTC ATGTTAAGTG GAGAAAGGGT 1800

TTTGCAAACT GAAAGATCTG TAGAGAGTAG CAGTATTTCA TTGGTACCTG GTACTGATTA 1860

TGGCACTCAG GAAAGTATCT CGTTACTGGA AGTTAGCACT CTAGGGAAGG CAAAAACAGA 1920

ACCAAATAAA TGTGTGAGTC AGTGTGCAGC ATTTGAAAAC CCCAAGGGAC TAATTCATGG 1980

TTGTTCCAAA GATAATAGAA ATGACACAGA AGGCTTTAAG TATCCATTGG GACATGAAGT 2040

TAACCACAGT CGGGAAACAA GCATAGAAAT GGAAGAAAGT GAACTTGATG CTCAGTATTT 2100

GCAGAATACA TTCAAGGTTT CAAAGCGCCA GTCATTTGCT CCGTTTTCAA ATCCAGGAAA 2160

TGCAGAAGAG GAATGTGCAA CATTCTCTGC CCACTCTGGG TCCTTAAAGA AACAAAGTCC 2220

AAAAGTCACT TTTGAATGTG AACAAAAGGA AGAAAATCAA GGAAAGAATG AGTCTAATAT 2280

CAAGCCTGTA CAGACAGTTA ATATCACTGC AGGCTTTCCT GTGGTTGGTC AGAAAGATAA 2340

GCCAGTTGAT AATGCCAAAT GTAGTATCAA AGGAGGCTCT AGGTTTTGTC TATCATCTCA 2400

GTTCAGAGGC AACGAAACTG GACTCATTAC TCCAAATAAA CATGGACTTT TACAAAACCC 2460

ATATCGTATA CCACCACTTT TTCCCATCAA GTCATTTGTT AAAACTAAAT GTAAGAAAAA 2520

TCTGCTAGAG GAAAACTTTG AGGAACATTC AATGTCACCT GAAAGAGAAA TGGGAAATGA 2580

GAACATTCCA AGTACAGTGA GCACAATTAG CCGTAATAAC ATTAGAGAAA ATGTTTTTAA 2640

AGAAGCCAGC TCAAGCAATA TTAATGAAGT AGGTTCCAGT ACTAATGAAG TGGGCTCCAG 2700

TATTAATGAA ATAGGTTCCA GTGATGAAAA CATTCAAGCA GAACTAGGTA GAAACAGAGG 2760

GCCAAAATTG AATGCTATGC TTAGATTAGG GGTTTTGCAA CCTGAGGTCT ATAAACAAAG 2820

TCTTCCTGGA AGTAATTGTA AGCATCCTGA AATAAAAAAG CAAGAATATG AAGAAGTAGT 2880

TCAGACTGTT AATACAGATT TCTCTCCATA TCTGATTTCA GATAACTTAG AACAGCCTAT 2940

GGGAAGTAGT CATGCATCTC AGGTTTGTTC TGAGACACCT GATGACCTGT TAGATGATGG 3000

TGAAATAAAG GAAGATACTA GTTTTGCTGA AAATGACATT AAGGAAAGTT CTGCTGTTTT 3060

TAGCAAAAGC GTCCAGAAAG GAGAGCTTAG CAGGAGTCCT AGCCCTTTCA CCCATACACA 3120

TTTGGCTCAG GGTTACCGAA GAGGGGCCAA GAAATTAGAG TCCTCAGAAG AGAACTTATC 3180

TAGTGAGGAT GAAGAGCTTC CCTGCTTCCA ACACTTGTTA TTTGGTAAAG TAAACAATAT 3240

ACCTTCTCAG TCTACTAGGC ATAGCACCGT TGCTACCGAG TGTCTGTCTA AGAACACAGA 3300

GGAGAATTTA TTATCATTGA AGAATAGCTT AAATGACTGC AGTAACCAGG TAATATTGGC 3360

AAAGGCATCT CAGGAACATC ACCTTAGTGA GGAAACAAAA TGTTCTGCTA GCTTGTTTTC 3420

TTCACAGTGC AGTGAATTGG AAGACTTGAC TGCAAATACA AACACCCAGG ATCCTTTCTT 3480

GATTGGTTCT TCCAAACAAA TGAGGCATCA GTCTGAAAGC CAGGGAGTTG GTCTGAGTGA 3540

CAAGGAATTG GTTTCAGATG ATGAAGAAAG AGGAACGGGC TTGGAAGAAA ATAATCAAGA 3600

AGAGCAAAGC ATGGATTCAA ACTTAGGTAT TGGAACCAGG TTTTTGTGTT TGCCCCAGTC 3660

TATTTATAGA AGTGAGCTAA ATGTTTATGC TTTTGGGGAG CACATTTTAC AAATTTCCAA 3720

GTATAGTTAA AGGAACTGCT TCTTAAACTT GAAACATGTT CCTCCTAAGG TGCTTTTCAT 3780

AGAAAAAAGT CCTTCACACA GCTAGGACGT CATCTTTGAC TGAATGAGCT TTAACATCCT 3840

AATTACTGGT GGACTTACTT CTGGTTTCAT TTTATAAAGC AAATCCCGGT GTCCCAAAGC 3900

AAGGAATTTA ATCATTTTGT GTGACATGAA AGTAAATCCA GTCCTGCCAA TGAGAAGAAA 3960

AAGACACAGC AAGTTGCAGC GTTTATAGTC TGCTTTTACA TCTGAACCTC TGTTTTTGTT 4020

ATTTAAGGTG AAGCAGCATC TGGGTGTGAG AGTGAAACAA GCGTCTCTGA AGACTGCTCA 4080

GGGCTATCCT CTCAGAGTGA CATTTTAACC ACTCAGGTAA AAAGCGTGTG TGTGTGTGCA 4140

CATGCGTGTG TGTGGTGTCC TTTGCATTCA GTAGTATGTA TCCCACATTC TTAGGTTTGC 4200

TGACATCATC TCTTTGAATT AATGGCACAA TTGTTTGTGG TTCATTGTC 4249

(2) INFORMATION FOR SEQ ID NO:22:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 710 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:22:

NGNGAATGTA ATCCTAATAT TTCNCNCCNA CTTAAAAGAA TACCACTCCA ANGGCATCNC 60

AATACATCAA TCAATTGGGG AATTGGGATT TTCCCTCNCT AACATCANTG GAATAATTTC 120

ATGGCATTAA TTGCATGAAT GTGGTTAGAT TAAAAGGTGT TCATGCTAGA ACTTGTAGTT 180

CCATACTAGG TGATTTCAAT TCCTGTGCTA AAATTAATTT GTATGATATA TTNTCATTTA 240

ATGGAAAGCT TCTCAAAGTA TTTCATTTTC TTGGTACCAT TTATCGTTTT TGAAGCAGAG 300

GGATACCATG CAACATAACC TGATAAAGCT CCAGCAGGAA ATGGCTGAAC TAGAAGCTGT 360

GTTAGAACAG CATGGGAGCC AGCCTTCTAA CAGCTACCCT TCCATCATAA GTGACTCTTC 420

TCCCTTGAG GACCTGCGAA ATCCAGAACA AAGCACATCA GAAAAAGGTG TGTATTGTTG 480

GCCAAACACT GATATCTTAA GCAAAATTCT TTCCTTCCCC TTTATCTCCT TCTGAAGAGT 540

AAGGACCTAG CTCCAACATT TTATGATCCT TGCTCAGCAC ATGGGTAATT ATGGAGCCTT 600

GGTTCTTGTC CCTGCTCACA ACTAATATAC CAGTCAGAGG GACCCAAGGC AGTCATTCAT 660

GTTGTCATCT GAGATACCTA CAACAAGTAG ATGCTATGGG GAGCCCATGG 710

(2) INFORMATION FOR SEQ ID NO:23:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 473 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:23:

CCATTGGTGC TAGCATCTGT CTGTTGCATT GCTTGTGTTT ATAAAATTCT GCCTGATATA 60

CTTGTTAAAA ACCAATTTGT GTATCATAGA TTGATGCTTT TGAAAAAAAT CAGTATTCTA 120

ACCTGAATTA TCACTATCAG AACAAAGCAG TAAAGTAGAT TTGTTTTCTC ATTCCATTTA 180

AAGCAGTATT AACTTCACAG AAAAGTAGTG AATACCCTAT AAGCCAGAAT CCAGAAGGCC 240

TTTCTGCTGA CAAGTTTGAG GTGTCTGCAG ATAGTTCTAC CAGTAAAAAT AAAGAACCAG 300

GAGTGGAAAG GTAAGAAACA TCAATGTAAA GATGCTGTGG TATCTGACAT CTTTATTTAT 360

ATTGAACTCT GATTGTTAAT TTTTTTCACC ATACTTTCTC CAGTTTTTTT GCATACAGGC 420

ATTTATACAC TTTTATTGCT CTAGGATACT TCTTTTGTTT AATCCTATAT AGG 473

(2) INFORMATION FOR SEQ ID NO:24:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 421 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:24:

GGATAAGNTC AAGAGATATT TTGATAGGTG ATGCAGTGAT NAATTGNGAA AATTTNCTGC 60

CTGCTTTTAA TCTTCCCCCG TTCTTTCTTC CTNCCTCCCT CCCTTCCTNC CTCCCGTCCT 120

TNCCTTTCCT TTCCCTCCCT TCCNCCTTCT TTCCNTCTNT CTTTCCTTTC TTTCCTGTCT 180

ACCTTTCTTT CCTTCCTCCC TTCCTTTTCT TTTCTTTCTT TCCTTTCCTT TTCTTTCCTT 240

TCTTTCCTTT CCTTTCTTTC TTGACAGAGT CTTGCTCTGT CACTCAGGCT GGAGTGCAGT 300

GGCGTGATCT CGNCTCACTG CAACCTCTGT CTCCCAGGTT CAAGCAATTT TCCTGCCTCA 360

GCCTCCCGAG TAGCTGAGAT TACAGGCGCC AGCCACCACA CCCAGCTACT GACCTGCTTT 420

T 421

(2) INFORMATION FOR SEQ ID NO:25:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 997 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:25:

AAACAGCTGG GAGATATGGT GCCTCAGACC AACCCCATGT TATATGTCAA CCCTGACATA 60

TTGGCAGGCA ACATGAATCC AGACTTCTAG GCTGTCATGC GGGCTCTTTT TTGCCAGTCA 120

TTTCTGATCT CTCTGACATG AGCTGTTTCA TTTATGCTTT GGCTGCCCAG CAAGTATGAT 180

TTGTCCTTTC ACAATTGGTG GCGATGGTTT TCTCCTTCCA TTTATCTTTC TAGGTCATCC 240

CCTTCTAAAT GCCCATCATT AGATGATAGG TGGTACATGC ACAGTTGCTC TGGGAGTCTT 300

CAGAATAGAA ACTACCCATC TCAAGAGGAG CTCATTAAGG TTGTTGATGT GGAGGAGCAA 360

CAGCTGGAAG AGTCTGGGCC ACACGATTTG ACGGAAACAT CTTACTTGCC AAGGCAAGAT 420

CTAGGTAATA TTTCATCTGC TGTATTGGAA CAAACACTYT GATTTTACTC TGAATCCTAC 480

ATAAAGATAT TCTGGTTAAC CAACTTTTAG ATGTACTAGT CTATCATGGA CACTTTTGTT 540

ATACTTAATT AAGCCCACTT TAGAAAAATA GCTCAAGTGT TAATCAAGGT TTACTTGAAA 600

ATTATTGAAA CTGTTAATCC ATCTATATTT TAATTAATGG TTTAACTAAT GATTTTGAGG 660

ATGWGGGAGT CKTGGTGTAC TCTAMATGTA TTATTTCAGG CCAGGCATAG TGGCTCACGC 720

CTGGTAATCC CAGTAYYCMR GAGCCCGAGG CAGGTGGAGC CAGCTGAGGT CAGGAGTTCA 780

AGACCTGTCT TGGCCAACAT GGGNGAAACC CTGTCTTCTT CTTAAAAAAN ACAAAAAAAA 840

TTAACTGGGT TGTGCTTAGG TGNATGCCCC GNATCCTAGT TNTTCTTGNG GGTTGAGGGA 900

GGAGATCACN TTGGACCCCG GAGGGGNGGG TGGGGGNGAG CAGGNCAAAA CACNGACCCA 960

GCTGGGGTGG AAGGGAAGCC CACTCNAAAA AANNTTN 997

(2) INFORMATION FOR SEQ ID NO:26:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 639 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:26:

TTTTTAGGAA ACAAGCTACT TTGGATTTCC ACCAACACCT GTATTCATGT ACCCATTTTT 60

CTCTTAACCT AACTTTATTG GTCTTTTTAA TTCTTAACAG AGACCAGAAC TTTGTAATTC 120

AACATTCATC GTTGTGTAAA TTAAACTTCT CCCATTCCTT TCAGAGGGAA CCCCTTACCT 180

GGAATCTGGA ATCAGCCTCT TCTCTGATGA CCCTGAATCT GATCCTTCTG AAGACAGAGC 240

CCCAGAGTCA GCTCGTGTTG GCAACATACC ATCTTCAACC TCTGCATTGA AAGTTCCCCA 300

ATTGAAAGTT GCAGAATCTG CCCAGAGTCC AGCTGCTGCT CATACTACTG ATACTGCTGG 360

GTATAATGCA ATGGAAGAAA GTGTGAGCAG GGAGAAGCCA GAATTGACAG CTTCAACAGA 420

AAGGGTCAAC AAAAGAATGT CCATGGTGGT GTCTGGCCTG ACCCCAGAAG AATTTGTGAG 480

TGTATCCATA TGTATCTCCC TAATGACTAA GACTTAACAA CATTCTGGAA AGAGTTTTAT 540

GTAGGTATTG TCAATTAATA ACCTAGAGGA AGAAATCTAG AAAACAATCA CAGTTCTGTG 600

TAATTTAATT TCGATTACTA ATTTCTGAAA ATTTAGAAY 639

(2) INFORMATION FOR SEQ ID NO:27:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 922 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:27:

NCCCNNCCCC CNAATCTGAA ATGGGGGTAA CCCCCCCCCA ACCGANACNT GGGTNGCNTA 60

GAGANTTTAA TGGCCCNTTC TGAGGNACAN AAGCTTAAGC CAGGNGACGT GGANCNATGN 120

GTTGTTTNTT GTTTGGTTAC CTCCAGCCTG GGTGACAGAG CAAGACTCTG TCTAAAAAAA 180

AAAAAAAAAA AAATCGACTT TAAATAGTTC CAGGACACGT GTAGAACGTG CAGGATTGCT 240

ACGTAGGTAA ACATATGCCA TGGTGGGATA ACTAGTATTC TGAGCTGTGT GCTAGAGGTA 300

ACTCATGATA ATGGAATATT TGATTTAATT TCAGATGCTC GTGTACAAGT TTGCCAGAAA 360

ACACCACATC ACTTTAACTA ATCTAATTAC TGAAGAGACT ACTCATGTTG TTATGAAAAC 420

AGGTATACCA AGAACCTTTA CAGAATACCT TGCATCTGCT GCATAAAACC ACATGAGGCG 480

AGGCACGGTG GCGCATGCCT GTAATCGCAG CACTTTGGGA GGCCGAGGCG GGCAGATCAC 540

GAGATTAGGA GATCGAGACC ATCCTGGCCA GCATGGTGAA ACCCCGTCTC TACTANNAAA 600

TGGNAAAATT ANCTGGGTGT GGTCGCGTGC NCCTGTAGTC CCAGCTACTC GTGAGGCTGA 660

GGCAGGAGAA TCACTTGAAC CGGGGAAATG GAGGTTTCAG TGAGCAGAGA TCATNCCCCT 720

NCATTCCAGC CTGGCGACAG AGCAAGGCTC CGTCNCCNAA AAAATAAAAA AAAACGTGAA 780

CAAATAAGAA TATTTGTTGA GCATAGCATG GATGATAGTC TTCTAATAGT CAATCAATTA 840

CTTTATGAAA GACAAATAAT AGTTTTGCTG CTTCCTTACC TCCTTTTGTT TTGGGTTAAG 900

ATTTGGAGTG TGGGCCAGGC AC 922

(2) INFORMATION FOR SEQ ID NO:28:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 867 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:28:

GATCTATAGC TAGCCTTGGC GTCTAGAAGA TGGGTGTTGA GAAGAGGGAG TGGAAAGATA 60

TTTCCTCTGG TCTTAACTTC ATATCAGCCT CCCCTAGACT TCCAAATATC CATACCTGCT 120

GGTTATAATT AGTGGTGTTT TCAGCCTCTG ATTCTGTCAC CAGGGGTTTT AGAATCATAA 180

ATCCAGATTG ATCTTGGGAG TGTAAAAAAC TGAGGCTCTT TAGCTTCTTA GGACAGCACT 240

TCCTGATTTT GTTTTCAACT TCTAATCCTT TGAGTGTTTT TCATTCTGCA GATGCTGAGT 300

TTGTGTGTGA ACGGACACTG AAATATTTTC TAGGAATTGC GGGAGGAAAA TGGGTAGTTA 360

GCTATTTCTG TAAGTATAAT ACTATTTCTC CCCTCCTCCC TTTAACACCT CAGAATTGCA 420

TTTTTACACC TAACATTTAA CACCTAAGGT TTTTGCTGAT GCTGAGTCTG AGTTACCAAA 480

AGGTCTTTAA ATTGTAATAC TAAACTACTT TTATCTTTAA TATCACTTTG TTCAAGATAA 540

GCTGGTGATG CTGGGAAAAT GGGTCTCTTT TATAACTAAT AGGACCTAAT CTGCTCCTAG 600

CAATGTTAGC ATATGAGCTA GGGATTTATT TAATAGTCGG CAGGAATCCA TGTGCARCAG 660

NCAAACTTAT AATGTTTAAA TTAAACATCA ACTCTGTCTC CAGAAGGAAA CTGCTGCTAC 720

AAGCCTTATT AAAGGGCTGT GGCTTTAGAG GGAAGGACCT CTCCTCTGTC ATTCTTCCTG 780

TGCTCTTTTG TGAATCGCTG ACCTCTCTAT CTCCGTGAAA AGAGCACGTT CTTCTGCTGT 840

ATGTAACCTG TCTTTTCTAT GATCTCT 867

(2) INFORMATION FOR SEQ ID NO:29:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 561 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:29:

NAAAAACGGG GNNGGGANTG GGCCTTAAAN CCAAAGGGCN AACTCCCCAA CCATTNAAAA 60

ANTGACNGGG GATTATTAAA ANCGGCGGGA AACATTTCAC NGCCCAACTA ATATTGTTAA 120

ATTAAAACCA CCACCNCTGC NCCAAGGAGG GAAACTGCTG CTACAAGCCT TATTAAAGGG 180

CTGTGGCTTT AGAGGGAAGG ACCTCTCCTC TGTCATTCTT CCTGTGCTCT TTTGTGAATC 240

GCTGACCTCT CTATGTCCGT GAAAAGAGCA CGTTCTTCGT CTGTATGTAA CCTGTCTTTT 300

CTATGATCTC TTTAGGGGTG ACCCAGTCTA TTAAAGAAAG AAAAATGCTG AATGAGGTAA 360

GTACTTGATG TTACAAACTA ACCAGAGATA TTCATTCAGT CATATAGTTA AAAATGTATT 420

TGCTTCCTTC CATCAATGCA CCACTTTCCT TAACAATGCA CAAATTTTCC ATGATAATGA 480

GGATCATCAA GAATTATGCA GGCCTGCACT GTGGCTCATA CCTATAATCC CAGCGCTTTG 540

GGAGGCTGAG GCGCTTGGAT C 561

(2) INFORMATION FOR SEQ ID NO:30:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 567 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:30:

AATTTTTTGT ATTTTTAGTA GAGATGAGGT TCACCATGTT GGTCTAGATC TGGTGTCGAA 60

CGTCCTGACC TCAAGTGATC TGCCAGCCTC AGTCTCCCAA AGTGCTAGGA TTACAGGGGT 120

GAGCCACTGC GCCTGGCCTG AATGCCTAAA ATATGACGTG TCTGCTCCAC TTCCATTGAA 180

GGAAGCTTCT CTTTCTCTTA TCCTGATGGG TTGTGTTTGG TTTCTTTCAG CATGATTTTG 240

AAGTCAGAGG AGATGTGGTC AATGGAAGAA ACCACCAAGG TCCAAAGCGA GCAAGAGAAT 300

CCCAGGACAG AAAGGTAAAG CTCCCTCCCT CAAGTTGACA AAAATCTCAC CCCACCACTC 360

TGTATTCCAC TCCCCTTTGC AGAGATGGGC CGCTTCATTT TGTAAGACTT ATTACATACA 420

TACACAGTGC TAGATACTTT CACACAGGTT CTTTTTTCAC TCTTCCATCC CAACCACATA 480

AATAAGTATT GTCTCTACTT TATGAATGAT AAAACTAAGA GATTTAGAGA GGCTGTGTAA 540

TTTGGATTCC CGTCTCGGGT TCAGATC 567

(2) INFORMATION FOR SEQ ID NO:31:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 633 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:31:

TTGGCCTGAT TGGTGACAAA AGTGAGATGC TCAGTCCTTG AATGACAAAG AATGCCTGTA 60

GAGTTGCAGG TCCAACTACA TATGCACTTC AAGAAGATCT TCTGAAATCT AGTAGTGTTC 120

TGGACATTGG ACTGCTTGTC CCTGGGAAGT AGCAGCAGAA ATGATCGGTG GTGAACAGAA 180

GAAAAAGAAA AGCTCTTCCT TTTTGAAAGT CTGTTTTTTG AATAAAAGCC AATATTCTTT 240

TATAACTAGA TTTTCCTTCT CTCCATTCCC CTGTCCCTCT CTCTTCCTCT CTTCTTCCAG 300

ATCTTCAGGG GGCTAGAAAT CTGTTGCTAT GGGCCCTTCA CCAACATGCC CACAGGTAAG 360

AGCCTGGGAG AACCCCAGAG TTCCAGCACC AGCCTTTGTC TTACATAGTG GAGTATTATA 420

AGCAAGGTCC CACGATGGGG GTTCCTCAGA TTGCTGAAAT GTTCTAGAGG CTATTCTATT 480

TCTCTACCAC TCTCCAAACA AAACAGCACC TAAATGTTAT CCTATGGCAA AAAAAAACTA 540

TACCTTGTCC CCCTTCTCAA GAGCATGAAG GTGGTTAATA GTTAGGATTC AGTATGTTAT 600

GTGTTCAGAT GGCGTTGAGC TGCTGTTAGT GCC 633

(2) INFORMATION FOR SEQ ID NO:32:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 470 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:32:

TTTGAGAGAC TATCAAACCT TATACCAAGT GGCCTTATGG AGACTGATAA CCAGAGTACA 60

TGGCATATCA GTGGCAAATT GACTTAAAAT CCATACCCCT ACTATTTTAA GACCATTGTC 120

CTTTGGAGCA GAGAGACAGA CTCTCCCATT GAGAGGTCTT GCTATAAGCC TTCATCCGGA 180

GAGTGTAGGG TAGAGGGCCT GGGTTAAGTA TGCAGATTAC TGCAGTGATT TTACATGTAA 240

ATGTCCATTT TAGATCAACT GGAATGGATG GTACAGCTGT GTGGTGCTTC TGTGGTGAAG 300

GAGCTTTCAT CATTCACCCT TGGCACAGTA AGTATTGGGT GCCCTGTCAG TGTGGGAGGA 360

CACAATATTC TCTCCTGTGA GCAAGACTGG CACCTGTCAG TCCCTATGGA TGCCCCTACT 420

GTAGCCTCAG AAGTCTTCTC TGCCCACATA CCTGTGCCAA AAGACTCCAT 470

(2) INFORMATION FOR SEQ ID NO:33:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 517 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:33:

GGTGGTACGT GTCTGTAGTT CCAGCTACTT GGGAGGCTGA GATGGAAGGA TTGCTTGAGC 60

CCAGGAGGCA GAGGTGGNAN NTTACGCTGA GATCACACCA CTGCACTCCA GCCTGGGTGA 120

CAGAGCAAGA CCCTGTCTCA AAAACAAACA AAAAAAATGA TGAAGTGACA GTTCCAGTAG 180

TCCTACTTTG ACACTTTGAA TGCTCTTTCC TTCCTGGGGA TCCAGGGTGT CCACCCAATT 240

GTGGTTGTGC AGCCAGATGC CTGGACAGAG GACAATGGCT TCCATGGTAA GGTGCCTCGC 300

ATGTACCTGT GCTATTAGTG GGGTCCTTGT GCATGGGTTT GGTTTATCAC TCATTACCTG 360

GTGCTTGAGT AGCACAGTTC TTGGCACATT TTTAAATATT TGTTGAATGA ATGGCTAAAA 420

TGTCTTTTTG ATGTTTTTAT TGTTATTTGT TTTATATTGT AAAAGTAATA CATGAACTGT 480

TTCCATGGGG TGGGAGTAAG ATATGAATGT TCATCAC 517

(2) INFORMATION FOR SEQ ID NO:34:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 434 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:34:

CAGTAATCCT NAGAACTCAT ACGACCGGGC CCCTGGAGTC GNTGNTTNGA GCCTAGTCCN 60

GGAGAATGAA TTGACACTAA TCTCTGCTTG TGTTCTCTGT CTCCAGCAAT TGGGCAGATG 120

TGTGAGGCAC CTGTGGTGAC CCGAGAGTGG GTGTTGGACA GTGTAGCACT CTACCAGTGC 180

CAGGAGCTGG ACACCTACCT GATACCCCAG ATCCCCCACA GCCACTACTG ACTGCAGCCA 240

GCCACAGGTA CAGAGCCACA GGACCCCAAG AATGAGCTTA CAAAGTGGCC TTTCCAGGCC 300

CTGGGAGCTC CTCTCACTCT TCAGTCCTTC TACTGTCCTG GCTACTAAAT ATTTTATGTA 360

CATCAGCCTG AAAAGGACTT CTGGCTATGC AAGGGTCCCT TAAAGATTTT CTGCTTGAAG 420

TCTCCCTTGG AAAT 434

(2) INFORMATION FOR SEQ ID NO:35:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:35:

GATAAATTAA AACTGCGACT GCGCGGCGTG 30

(2) INFORMATION FOR SEQ ID NO:36:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:36:

GTAGTAGAGT CCCGGGAAAG GGACAGGGGG 30

(2) INFORMATION FOR SEQ ID NO:37:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:37:

ATATATATAT GTTTTTCTAA TGTGTTAAAG 30

(2) INFORMATION FOR SEQ ID NO:38:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:38:

GTAAGTCAGC ACAAGAGTGT ATTAATTTGG 30

(2) INFORMATION FOR SEQ ID NO:39:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:39:

TTTCTTTTTC TCCCCCCCCT ACCCTGCTAG 30

(2) INFORMATION FOR SEQ ID NO:40:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:40:

GTAAGTTTGA ATGTGTTATG TGGCTCCATT 30

(2) INFORMATION FOR SEQ ID NO:41:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:41:

AGCTACTTTT TTTTTTTTTT TTTGAGACAG 30

(2) INFORMATION FOR SEQ ID NO:42:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:42:

GTAAGTGCAC ACCACCATAT CCAGCTAAAT 30

(2) INFORMATION FOR SEQ ID NO:43:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:43:

AATTGTTCTT TCTTTCTTTA TAATTTATAG 30

(2) INFORMATION FOR SEQ ID NO:44:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:44:

GTATATAATT TGGTAATGAT GCTAGGTTGG 30

(2) INFORMATION FOR SEQ ID NO:45:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:45:

GAGTGTGTTT CTCAAACAAT TTAATTTCAG 30

(2) INFORMATION FOR SEQ ID NO:46:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:46:

GTAAGTGTTG AATATCCCAA GAATGACACT 30

(2) INFORMATION FOR SEQ ID NO:47:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:47:

AAACATAATG TTTTCCCTTG TATTTTACAG 30

(2) INFORMATION FOR SEQ ID NO:48:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:48:

GTAAAACCAT TTGTTTTCTT CTTCTTCTTC 30

(2) INFORMATION FOR SEQ ID NO:49:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:49:

TGCTTGACTG TTCTTTACCA TACTGTTTAG 30

(2) INFORMATION FOR SEQ ID NO:50:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:50:

GTAAGGGTCT CAGGTTTTTT AAGTATTTAA 30

(2) INFORMATION FOR SEQ ID NO:51:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:51:

TGATTTATTT TTTGGGGGGA AATTTTTTAG 30

(2) INFORMATION FOR SEQ ID NO:52:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:52:

GTGAGTCAAA GAGAACCTTT GTCTATGAAG 30

(2) INFORMATION FOR SEQ ID NO:53:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:53:

TCTTATTAGG ACTCTGTCTT TTCCCTATAG 30

(2) INFORMATION FOR SEQ ID NO:54:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:54:

GTAATGGCAA AGTTTGCCAA CTTAACAGGC 30

(2) INFORMATION FOR SEQ ID NO:55:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:55:

GAGTACCTTG TTATTTTTGT ATATTTTCAG 30

(2) INFORMATION FOR SEQ ID NO:56:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:56:

GTATTGGAAC CAGGTTTTTG TGTTTGCCCC 30

(2) INFORMATION FOR SEQ ID NO:57:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:57:

ACATCTGAAC CTCTGTTTTT GTTATTTAAG 30

(2) INFORMATION FOR SEQ ID NO:58:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:58:

AGGTAAAAAG CGTGTGTGTG TGTGCACATG 30

(2) INFORMATION FOR SEQ ID NO:59:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:59:

CATTTTCTTG GTACCATTTA TCGTTTTTGA 30

(2) INFORMATION FOR SEQ ID NO:60:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:60:

GTGTGTATTG TTGGCCAAAC ACTGATATCT 30

(2) INFORMATION FOR SEQ ID NO:61:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:61:

AGTAGATTTG TTTTCTCATT CCATTTAAAG 30

(2) INFORMATION FOR SEQ ID NO:62:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:62:

GTAAGAAACA TCAATGTAAA GATGCTGTGG 30

(2) INFORMATION FOR SEQ ID NO:63:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:63:

ATGGTTTTCT CCTTCCATTT ATCTTTCTAG 30

(2) INFORMATION FOR SEQ ID NO:64:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:64:

GTAATATTTC ATCTGCTGTA TTGGAACAAA 30

(2) INFORMATION FOR SEQ ID NO:65:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:65:

TGTAAATTAA ACTTCTCCCA TTCCTTTCAG 30

(2) INFORMATION FOR SEQ ID NO:66:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:66:

GTGAGTGTAT CCATATGTAT CTCCCTAATG 30

(2) INFORMATION FOR SEQ ID NO:67:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:67:

ATGATAATGG AATATTTGAT TTAATTTCAG 30

(2) INFORMATION FOR SEQ ID NO:68:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens



(xi) SEQUENCE DESCRIPTION: SEQ ID NO:68:

GTATACCAAG AACCTTTACA GAATACCTTG 30

(2) INFORMATION FOR SEQ ID NO:69:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:69:

CTAATCCTTT GAGTGTTTTT CATTCTGCAG 30

(2) INFORMATION FOR SEQ ID NO:70:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:70:

GTAAGTATAA TACTATTTCT CCCCTCCTCC 30

(2) INFORMATION FOR SEQ ID NO:71:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:71:

TGTAACCTGT CTTTTCTATG ATCTCTTTAG 30

(2) INFORMATION FOR SEQ ID NO:72:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:72:

GTAAGTACTT GATGTTACAA ACTAACCAGA 30

(2) INFORMATION FOR SEQ ID NO:73:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:73:

TCCTGATGGG TTGTGTTTGG TTTCTTTCAG 30

(2) INFORMATION FOR SEQ ID NO:74:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:74:

GTAAAGCTCC CTCCCTCAAG TTGACAAAAA 30

(2) INFORMATION FOR SEQ ID NO:75:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:75:

CTGTCCCTCT CTCTTCCTCT CTTCTTCCAG 30

(2) INFORMATION FOR SEQ ID NO:76:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:76:

GTAAGAGCCT GGGAGAACCC CAGAGTTCCA 30

(2) INFORMATION FOR SEQ ID NO:77:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:77:

AGTGATTTTA CATGTAAATG TCCATTTTAG 30

(2) INFORMATION FOR SEQ ID NO:78:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:78:

GTAAGTATTG GGTGCCCTGT CAGTGTGGGA 30

(2) INFORMATION FOR SEQ ID NO:79:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:79:

TTGAATGCTC TTTCCTTCCT GGGGATCCAG 30

(2) INFORMATION FOR SEQ ID NO:80:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:80:

GTAAGGTGCC TCGCATGTAC CTGTGCTATT 30

(2) INFORMATION FOR SEQ ID NO:81:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:81:

CTAATCTCTG CTTGTGTTCT CTGTCTCCAG 30

(2) INFORMATION FOR SEQ ID NO:82:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 42 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:82:

Cys Pro Ile Cys Leu Glu Leu Ile Lys Glu Pro Val Ser Thr Lys Cys
1 5 10 15

Asp His Ile Phe Cys Lys Phe Cys Met Leu Lys Leu Leu Asn Gln Lys
20 25 30

Lys Gly Pro Ser Gln Cys Pro Leu Cys Lys
35 40

(2) INFORMATION FOR SEQ ID NO:83:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 45 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide

(iii) HYPOTHETICAL: NO

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:83:

Cys Pro Ile Cys Leu Glu Leu Leu Lys Glu Pro Val Ser Ala Asp Cys
1 5 10 15

Asn His Ser Phe Cys Arg Ala Cys Ile Thr Leu Asn Tyr Glu Ser Asn
20 25 30

Arg Asn Thr Asp Gly Lys Gly Asn Cys Pro Val Cys Arg
35 40 45

(2) INFORMATION FOR SEQ ID NO:84:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 41 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide

(iii) HYPOTHETICAL: NO

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:84:

Cys Pro Ile Cys Leu Asp Met Leu Lys Asn Thr Met Thr Thr Lys Glu
1 5 10 15

Cys Leu His Arg Phe Cys Ser Asp Cys Ile Val Thr Ala Leu Arg Ser
20 25 30

Gly Asn Lys Glu Cys Pro Thr Cys Arg
35 40

(2) INFORMATION FOR SEQ ID NO:85:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 42 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide

(iii) HYPOTHETICAL: NO

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:85:

Cys Pro Val Cys Leu Gln Tyr Phe Ala Glu Pro Met Met Leu Asp Cys
1 5 10 15

Gly His Asn Ile Cys Cys Ala Cys Leu Ala Arg Cys Trp Gly Thr Ala
20 25 30

Cys Thr Asn Val Ser Cys Pro Gln Cys Arg
35 40
SEQUENCE LISTING
(1) GENERAL INFORMATION:

(i) APPLICANT: Skolnick, Mark H.
Goldagar, David E.
Miki, Yoshio
Swenson, Jeff
Kamb, Alexander
Harshman, Keith D.
Shattuck-Eidens, Donna M.
Tavtigian, Sean V.
Wiseman, Roger W.
Futreal, P. Andrew

(ii) TITLE OF invention: 17q-Linked Breast and Ovarian Cancer
Susceptibility Gene

(iii) NUMBER OF SEQUENCES: 85

(iv) CORRESPONDENCE ADDRESS:
(A) ADDRESSEE: Venable, Baetjer, Howard & Civiletti, LLP
(B) STREET: 1201 New York Avenue, NW, Suite 1000
(C) CITY: Washington
(D) STATE: DC
(E) COUNTRY: USA
(F) ZIP: 20005

(v) COMPUTER READABLE FORM:
(A) MEDIUM TYPE: Floppy disk
(B) COMPUTER: IBM PC compatible
(C) OPERATING SYSTEM: PC-DOS / MS-DOS
(D) SOFTWARE: PatentIn Release # 1.0, Version # 1.30

(vi) CURRENT APPLICATION DATA:
(A) APPLICATION NUMBER:
(B) FILING DATE:
(C) CLASSIFICATION:

(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US
(B) FILING DATE: 07-JUN-1995

(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08 / 409,305
(B) FILING DATE: 24-MAR-1995

(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08 / 348,824
(B) FILING DATE: 29-NOV-1994

(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08 / 308,104
(B) FILING DATE: 16-SEP-1994

(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08 / 300,266
(B) FILING DATE: 02-SEP-1994

(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08 / 289,221
(B) FILING DATE: 12-AUG-1994

(viii) ATTORNEY / AGENT INFORMATION:
(A) NAME: Ihnen, Jeffrey L.
(B) REGISTRATION NUMBER: 28,957
(C) REFERENCE / DOCKET NUMBER: 24884-109347

(ix) TELECOMMUNICATION INFORMATION:
(A) TELEPHONE: 202-962-4810
(B) TELEFAX: 202-962-8300

(2) INFORMATION FOR SEQ ID NO: 1:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5914 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: cDNA

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(ix) FEATURE:
(A) NAME / KEY: CDS
(B) LOCATION: 120..5708

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 1:

agctcgctga gacttcctgg accccgcacc aggctgtggg gtttctcaga taactgggcc 60

CCTGCGCTCA GGAGGCCTTC ACCCTCTGCT CTGGGTAAAG TTCATTGGAA CAGAAAGAA 119

ATG GAT TTA TCT GCT CTT CGC GTT GAA GAA GTA CAA AAT GTC ATT AAT 167
Met Asp Leu Ser Ala Leu Arg Val Glu Glu Val Gln Asn Val Ile Asn
1 5 10 15

GCT ATG CAG AAA ATC TTA GAG TGT CCC ATC TGT CTG GAG TTG ATC AAG 215
Ala Met Gln Lys Ile Leu Glu Cys Pro Ile Cys Leu Glu Leu Ile Lys
20 25 30

GAA CCT GTC TCC ACA AAG TGT GAC CAC ATA TTT TGC AAA TTT TGC ATG 263
Glu Pro Val Ser Thr Lys Cys Asp His Ile Phe Cys Lys Phe Cys Met
35 40 45

CTG AAA CTT CTC AAC CAG AAG AAA GGG CCT TCA CAG TGT CCT TTA TGT 311
Leu Lys Leu Leu Asn Gln Lys Lys Gly Pro Ser Gln Cys Pro Leu Cys
50 55 60

AAG AAT GAT ATA ACC AAA AGG AGC CTA CAA GAA AGT ACG AGA TTT AGT 359
Lys Asn Asp Ile Thr Lys Arg Ser Leu Gln Glu Ser Thr Arg Phe Ser
65 70 75 80

CAA CTT GTT GAA GAG CTA TTG AAA ATC ATT TGT GCT TTT CAG CTT GAC 407
Gln Leu Val Glu Glu Leu Leu Lys Ile Ile Cys Ala Phe Gln Leu Asp
85 90 95

ACA GGT TTG GAG TAT GCA AAC AGC TAT AAT TTT GCA AAA AAG GAA AAT 455
Thr Gly Leu Glu Tyr Ala Asn Ser Tyr Asn Phe Ala Lys Lys Glu Asn
100 105 110

AAC TCT CCT GAA CAT CTA AAA GAT GAA GTT TCT ATC ATC CAA AGT ATG 503
Asn Ser Pro Glu His Leu Lys Asp Glu Val Ser Ile Ile Gln Ser Met
115 120 125

GGC TAC AGA AAC CGT GCC AAA AGA CTT CTA CAG AGT GAA CCC GAA AAT 551
Gly Tyr Arg Asn Arg Ala Lys Arg Leu Leu Gln Ser Glu Pro Glu Asn
130 135 140

CCT TCC TTG CAG GAA ACC AGT CTC AGT GTC CAA CTC TCT AAC CTT GGA 599
Pro Ser Leu Gln Glu Thr Ser Leu Ser Val Gln Leu Ser Asn Leu Gly
145 150 155 160

ACT GTG AGA ACT CTG AGG ACA AAG CAG CGG ATA CAA CCT CAA AAG ACG 647
Thr Val Arg Thr Leu Arg Thr Lys Gln Arg Ile Gln Pro Gln Lys Thr
165 170 175

TCT GTC TAC ATT GAA TTG GGA TCT GAT TCT TCT GAA GAT ACC GTT AAT 695
Ser Val Tyr Ile Glu Leu Gly Ser Asp Ser Ser Glu Asp Thr Val Asn
180 185 190

AAG GCA ACT TAT TGC AGT GTG GGA GAT CAA GAA TTG TTA CAA ATC ACC 743
Lys Ala Thr Tyr Cys Ser Val Gly Asp Gln Glu Leu Leu Gln Ile Thr
195 200 205

CCT CAA GGA ACC AGG GAT GAA ATC AGT TTG GAT TCT GCA AAA AAG GCT 791
Pro Gln Gly Thr Arg Asp Glu Ile Ser Leu Asp Ser Ala Lys Lys Ala
210 215 220

GCT TGT GAA TTT TCT GAG ACG GAT GTA ACA AAT ACT GAA CAT CAT CAA 839
Ala Cys Glu Phe Ser Glu Thr Asp Val Thr Asn Thr Glu His His Gln
225 230 235 240

CCC AGT AAT AAT GAT TTG AAC ACC ACT GAG AAG CGT GCA GCT GAG AGG 887
Pro Ser Asn Asn Asp Leu Asn Thr Thr Glu Lys Arg Ala Ala Glu Arg
245 250 255

CAT CCA GAA AAG TAT CAG GGT AGT TCT GTT TCA AAC TTG CAT GTG GAG 935
His Pro Glu Lys Tyr Gln Gly Ser Ser Val Ser Asn Leu His Val Glu
260 265 270

CCA TGT GGC ACA AAT ACT CAT GCC AGC TCA TTA CAG CAT GAG AAC AGC 983
Pro Cys Gly Thr Asn Thr His Ala Ser Ser Leu Gln His Glu Asn Ser
275 280 285

AGT TTA TTA CTC ACT AAA GAC AGA ATG AAT GTA GAA AAG GCT GAA TTC 1031
Ser Leu Leu Leu Thr Lys Asp Arg Met Asn Val Glu Lys Ala Glu Phe
290 295 300

TGT AAT AAA AGC AAA CAG CCT GGC TTA GCA AGG AGC CAA CAT AAC AGA 1079
Cys Asn Lys Ser Lys Gln Pro Gly Leu Ala Arg Ser Gln His Asn Arg
305 310 315 320

TGG GCT GGA AGT AAG GAA ACA TGT AAT GAT AGG CGG ACT CCC AGC ACA 1127
Trp Ala Gly Ser Lys Glu Thr Cys Asn Asp Arg Arg Thr Pro Ser Thr
325 330 335

GAA AAA AAG GTA GAT CTG AAT GCT GAT CCC CTG TGT GAG AGA AAA GAA 1175
Glu Lys Lys Val Asp Leu Asn Ala Asp Pro Leu Cys Glu Arg Lys Glu
340 345 350

TGG AAT AAG CAG AAA CTG CCA TGC TCA GAG AAT CCT AGA GAT ACT GAA 1223
Trp Asn Lys Gln Lys Leu Pro Cys Ser Glu Asn Pro Arg Asp Thr Glu
355 360 365

GAT GTT CCT TGG ATA ACA CTA AAT AGC AGC ATT CAG AAA GTT AAT GAG 1271
Asp Val Pro Trp Ile Thr Leu Asn Ser Ser Ile Gln Lys Val Asn Glu
370 375 380

TGG TTT TCC AGA AGT GAT GAA CTG TTA GGT TCT GAT GAC TCA CAT GAT 1319
Trp Phe Ser Arg Ser Asp Glu Leu Leu Gly Ser Asp Asp Ser His Asp
385 390 395 400

GGG GAG TCT GAA TCA AAT GCC AAA GTA GCT GAT GTA TTG GAC GTT CTA 1367
Gly Glu Ser Glu Ser Asn Ala Lys Val Ala Asp Val Leu Asp Val Leu
405 410 415

AAT GAG GTA GAT GAA TAT TCT GGT TCT TCA GAG AAA ATA GAC TTA CTG 1415
Asn Glu Val Asp Glu Tyr Ser Gly Ser Ser Glu Lys Ile Asp Leu Leu
420 425 430

GCC AGT GAT CCT CAT GAG GCT TTA ATA TGT AAA AGT GAA AGA GTT CAC 1463
Ala Ser Asp Pro His Glu Ala Leu Ile Cys Lys Ser Glu Arg Val His
435 440 445

TCC AAA TCA GTA GAG AGT AAT ATT GAA GAC AAA ATA TTT GGG AAA ACC 1511
Ser Lys Ser Val Glu Ser Asn Ile Glu Asp Lys Ile Phe Gly Lys Thr
450 455 460

TAT CGG AAG AAG GCA AGC CTC CCC AAC TTA AGC CAT GTA ACT GAA AAT 1559
Tyr Arg Lys Lys Ala Ser Leu Pro Asn Leu Ser His Val Thr Glu Asn
465 470 475 480

CTA ATT ATA GGA GCA TTT GTT ACT GAG CCA CAG ATA ATA CAA GAG CGT 1607
Leu Ile Ile Gly Ala Phe Val Thr Glu Pro Gln Ile Ile Gln Glu Arg
485 490 495

CCC CTC ACA AAT AAA TTA AAG CGT AAA AGG AGA CCT ACA TCA GGC CTT 1655
Pro Leu Thr Asn Lys Leu Lys Arg Lys Arg Arg Pro Thr Ser Gly Leu
500 505 510

CAT CCT GAG GAT TTT ATC AAG AAA GCA GAT TTG GCA GTT CAA AAG ACT 1703
His Pro Glu Asp Phe Ile Lys Lys Ala Asp Leu Ala Val Gln Lys Thr
515 520 525

CCT GAA ATG ATA AAT CAG GGA ACT AAC CAA ACG GAG CAG AAT GGT CAA 1751
Pro Glu Met Ile Asn Gln Gly Thr Asn Gln Thr Glu Gln Asn Gly Gln
530 535 540

GTG ATG AAT ATT ACT AAT AGT GGT CAT GAG AAT AAA ACA AAA GGT GAT 1799
Val Met Asn Ile Thr Asn Ser Gly His Glu Asn Lys Thr Lys Gly Asp
545 550 555 560

TCT ATT CAG AAT GAG AAA AAT CCT AAC CCA ATA GAA TCA CTC GAA AAA 1847
Ser Ile Gln Asn Glu Lys Asn Pro Asn Pro Ile Glu Ser Leu Glu Lys
565 570 575

GAA TCT GCT TTC AAA ACG AAA GCT GAA CCT ATA AGC AGC AGT ATA AGC 1895
Glu Ser Ala Phe Lys Thr Lys Ala Glu Pro Ile Ser Ser Ser Ile Ser
580 585 590

AAT ATG GAA CTC GAA TTA AAT ATC CAC AAT TCA AAA GCA CCT AAA AAG 1943
Asn Met Glu Leu Glu Leu Asn Ile His Asn Ser Lys Ala Pro Lys Lys
595 600 605

AAT AGG CTG AGG AGG AAG TCT TCT ACC AGG CAT ATT CAT GCG CTT GAA 1991
Asn Arg Leu Arg Arg Lys Ser Ser Thr Arg His Ile His Ala Leu Glu
610 615 620

CTA GTA GTC AGT AGA AAT CTA AGC CCA CCT AAT TGT ACT GAA TTG CAA 2039
Leu Val Val Ser Arg Asn Leu Ser Pro Pro Asn Cys Thr Glu Leu Gln
625 630 635 640

ATT GAT AGT TGT TCT AGC AGT GAA GAG ATA AAG AAA AAA AAG TAC AAC 2087
Ile Asp Ser Cys Ser Ser Ser Glu Glu Ile Lys Lys Lys Lys Tyr Asn
645 650 655

CAA ATG CCA GTC AGG CAC AGC AGA AAC CTA CAA CTC ATG GAA GGT AAA 2135
Gln Met Pro Val Arg His Ser Arg Asn Leu Gln Leu Met Glu Gly Lys
660 665 670

GAA CCT GCA ACT GGA GCC AAG AAG AGT AAC AAG CCA AAT GAA CAG ACA 2183
Glu Pro Ala Thr Gly Ala Lys Lys Ser Asn Lys Pro Asn Glu Gln Thr
675 680 685

AGT AAA AGA CAT GAC AGC GAT ACT TTC CCA GAG CTG AAG TTA ACA AAT 2231
Ser Lys Arg His Asp Ser Asp Thr Phe Pro Glu Leu Lys Leu Thr Asn
690 695 700

GCA CCT GGT TCT TTT ACT AAG TGT TCA AAT ACC AGT GAA CTT AAA GAA 2279
Ala Pro Gly Ser Phe Thr Lys Cys Ser Asn Thr Ser Glu Leu Lys Glu
705 710 715 720

TTT GTC AAT CCT AGC CTT CCA AGA GAA GAA AAA GAA GAG AAA CTA GAA 2327
Phe Val Asn Pro Ser Leu Pro Arg Glu Glu Lys Glu Glu Lys Leu Glu
725 730 735

ACA GTT AAA GTG TCT AAT AAT GCT GAA GAC CCC AAA GAT CTC ATG TTA 2375
Thr Val Lys Val Ser Asn Asn Ala Glu Asp Pro Lys Asp Leu Met Leu
740 745 750

AGT GGA GAA AGG GTT TTG CAA ACT GAA AGA TCT GTA GAG AGT AGC AGT 2423
Ser Gly Glu Arg Val Leu Gln Thr Glu Arg Ser Val Glu Ser Ser Ser
755 760 765

ATT TCA TTG GTA CCT GGT ACT GAT TAT GGC ACT CAG GAA AGT ATC TCG 2471
Ile Ser Leu Val Pro Gly Thr Asp Tyr Gly Thr Gln Glu Ser Ile Ser
770 775 780

TTA CTG GAA GTT AGC ACT CTA GGG AAG GCA AAA ACA GAA CCA AAT AAA 2519
Leu Leu Glu Val Ser Thr Leu Gly Lys Ala Lys Thr Glu Pro Asn Lys
785 790 795 800

TGT GTG AGT CAG TGT GCA GCA TTT GAA AAC CCC AAG GGA CTA ATT CAT 2567
Cys Val Ser Gln Cys Ala Ala Phe Glu Asn Pro Lys Gly Leu Ile His
805 810 815

GGT TGT TCC AAA GAT AAT AGA AAT GAC ACA GAA GGC TTT AAG TAT CCA 2615
Gly Cys Ser Lys Asp Asn Arg Asn Asp Thr Glu Gly Phe Lys Tyr Pro
820 825 830

TTG GGA CAT GAA GTT AAC CAC AGT CGG GAA ACA AGC ATA GAA ATG GAA 2663
Leu Gly His Glu Val Asn His Ser Arg Glu Thr Ser Ile Glu Met Glu
835 840 845

GAA AGT GAA CTT GAT GCT CAG TAT TTG CAG AAT ACA TTC AAG GTT TCA 2711
Glu Ser Glu Leu Asp Ala Gln Tyr Leu Gln Asn Thr Phe Lys Val Ser
850 855 860

AAG CGC CAG TCA TTT GCT CCG TTT TCA AAT CCA GGA AAT GCA GAA GAG 2759
Lys Arg Gln Ser Phe Ala Pro Phe Ser Asn Pro Gly Asn Ala Glu Glu
865 870 875 880

GAA TGT GCA ACA TTC TCT GCC CAC TCT GGG TCC TTA AAG AAA CAA AGT 2807
Glu Cys Ala Thr Phe Ser Ala His Ser Gly Ser Leu Lys Lys Gln Ser
885 890 895

CCA AAA GTC ACT TTT GAA TGT GAA CAA AAG GAA GAA AAT CAA GGA AAG 2855
Pro Lys Val Thr Phe Glu Cys Glu Gln Lys Glu Glu Asn Gln Gly Lys
900 905 910

AAT GAG TCT AAT ATC AAG CCT GTA CAG ACA GTT AAT ATC ACT GCA GGC 2903
Asn Glu Ser Asn Ile Lys Pro Val Gln Thr Val Asn Ile Thr Ala Gly
915 920 925

TTT CCT GTG GTT GGT CAG AAA GAT AAG CCA GTT GAT AAT GCC AAA TGT 2951
Phe Pro Val Val Gly Gln Lys Asp Lys Pro Val Asp Asn Ala Lys Cys
930 935 940

AGT ATC AAA GGA GGC TCT AGG TTT TGT CTA TCA TCT CAG TTC AGA GGC 2999
Ser Ile Lys Gly Gly Ser Arg Phe Cys Leu Ser Ser Gln Phe Arg Gly
945 950 955 960

AAC GAA ACT GGA CTC ATT ACT CCA AAT AAA CAT GGA CTT TTA CAA AAC 3047
Asn Glu Thr Gly Leu Ile Thr Pro Asn Lys His Gly Leu Leu Gln Asn
965 970 975

CCA TAT CGT ATA CCA CCA CTT TTT CCC ATC AAG TCA TTT GTT AAA ACT 3095
Pro Tyr Arg Ile Pro Pro Leu Phe Pro Ile Lys Ser Phe Val Lys Thr
980 985 990

AAA TGT AAG AAA AAT CTG CTA GAG GAA AAC TTT GAG GAA CAT TCA ATG 3143
Lys Cys Lys Lys Asn Leu Leu Glu Glu Asn Phe Glu Glu His Ser Met
995 1000 1005

TCA CCT GAA AGA GAA ATG GGA AAT GAG AAC ATT CCA AGT ACA GTG AGC 3191
Ser Pro Glu Arg Glu Met Gly Asn Glu Asn Ile Pro Ser Thr Val Ser
1010 1015 1020

ACA ATT AGC CGT AAT AAC ATT AGA GAA AAT GTT TTT AAA GAA GCC AGC 3239
Thr Ile Ser Arg Asn Asn Ile Arg Glu Asn Val Phe Lys Glu Ala Ser
1025 1030 1035 1040

TCA AGC AAT ATT AAT GAA GTA GGT TCC AGT ACT AAT GAA GTG GGC TCC 3287
Ser Ser Asn Ile Asn Glu Val Gly Ser Ser Thr Asn Glu Val Gly Ser
1045 1050 1055

AGT ATT AAT GAA ATA GGT TCC AGT GAT GAA AAC ATT CAA GCA GAA CTA 3335
Ser Ile Asn Glu Ile Gly Ser Ser Asp Glu Asn Ile Gln Ala Glu Leu
1060 1065 1070

GGT AGA AAC AGA GGG CCA AAA TTG AAT GCT ATG CTT AGA TTA GGG GTT 3383
Gly Arg Asn Arg Gly Pro Lys Leu Asn Ala Met Leu Arg Leu Gly Val
1075 1080 1085

TTG CAA CCT GAG GTC TAT AAA CAA AGT CTT CCT GGA AGT AAT TGT AAG 3431
Leu Gln Pro Glu Val Tyr Lys Gln Ser Leu Pro Gly Ser Asn Cys Lys
1090 1095 1100

CAT CCT GAA ATA AAA AAG CAA GAA TAT GAA GAA GTA GTT CAG ACT GTT 3479
His Pro Glu Ile Lys Lys Gln Glu Tyr Glu Glu Val Val Gln Thr Val
1105 1110 1115 1120

AAT ACA GAT TTC TCT CCA TAT CTG ATT TCA GAT AAC TTA GAA CAG CCT 3527
Asn Thr Asp Phe Ser Pro Tyr Leu Ile Ser Asp Asn Leu Glu Gln Pro
1125 1130 1135

ATG GGA AGT AGT CAT GCA TCT CAG GTT TGT TCT GAG ACA CCT GAT GAC 3575
Met Gly Ser Ser His Ala Ser Gln Val Cys Ser Glu Thr Pro Asp Asp
1140 1145 1150

CTG TTA GAT GAT GGT GAA ATA AAG GAA GAT ACT AGT TTT GCT GAA AAT 3623
Leu Leu Asp Asp Gly Glu Ile Lys Glu Asp Thr Ser Phe Ala Glu Asn
1155 1160 1165

GAC ATT AAG GAA AGT TCT GCT GTT TTT AGC AAA AGC GTC CAG AAA GGA 3671
Asp Ile Lys Glu Ser Ser Ala Val Phe Ser Lys Ser Val Gln Lys Gly
1170 1175 1180

GAG CTT AGC AGG AGT CCT AGC CCT TTC ACC CAT ACA CAT TTG GCT CAG 3719
Glu Leu Ser Arg Ser Pro Ser Pro Phe Thr His Thr His Leu Ala Gln
1185 1190 1195 1200

GGT TAC CGA AGA GGG GCC AAG AAA TTA GAG TCC TCA GAA GAG AAC TTA 3767
Gly Tyr Arg Arg Gly Ala Lys Lys Leu Glu Ser Ser Glu Glu Asn Leu
1205 1210 1215

TCT AGT GAG GAT GAA GAG CTT CCC TGC TTC CAA CAC TTG TTA TTT GGT 3815
Ser Ser Glu Asp Glu Glu Leu Pro Cys Phe Gln His Leu Leu Phe Gly
1220 1225 1230

AAA GTA AAC AAT ATA CCT TCT CAG TCT ACT AGG CAT AGC ACC GTT GCT 3863
Lys Val Asn Asn Ile Pro Ser Gln Ser Thr Arg His Ser Thr Val Ala
1235 1240 1245

ACC GAG TGT CTG TCT AAG AAC ACA GAG GAG AAT TTA TTA TCA TTG AAG 3911
Thr Glu Cys Leu Ser Lys Asn Thr Glu Glu Asn Leu Leu Ser Leu Lys
1250 1255 1260

AAT AGC TTA AAT GAC TGC AGT AAC CAG GTA ATA TTG GCA AAG GCA TCT 3959
Asn Ser Leu Asn Asp Cys Ser Asn Gln Val Ile Leu Ala Lys Ala Ser
1265 1270 1275 1280

CAG GAA CAT CAC CTT AGT GAG GAA ACA AAA TGT TCT GCT AGC TTG TTT 4007
Gln Glu His His Leu Ser Glu Glu Thr Lys Cys Ser Ala Ser Leu Phe
1285 1290 1295

TCT TCA CAG TGC AGT GAA TTG GAA GAC TTG ACT GCA AAT ACA AAC ACC 4055
Ser Ser Gln Cys Ser Glu Leu Glu Asp Leu Thr Ala Asn Thr Asn Thr
1300 1305 1310

CAG GAT CCT TTC TTG ATT GGT TCT TCC AAA CAA ATG AGG CAT CAG TCT 4103
Gln Asp Pro Phe Leu Ile Gly Ser Ser Lys Gln Met Arg His Gln Ser
1315 1320 1325

GAA AGC CAG GGA GTT GGT CTG AGT GAC AAG GAA TTG GTT TCA GAT GAT 4151
Glu Ser Gln Gly Val Gly Leu Ser Asp Lys Glu Leu Val Ser Asp Asp
1330 1335 1340

GAA GAA AGA GGA ACG GGC TTG GAA GAA AAT AAT CAA GAA GAG CAA AGC 4199
Glu Glu Arg Gly Thr Gly Leu Glu Glu Asn Asn Gln Glu Glu Gln Ser
1345 1350 1355 1360

ATG GAT TCA AAC TTA GGT GAA GCA GCA TCT GGG TGT GAG AGT GAA ACA 4247
Met Asp Ser Asn Leu Gly Glu Ala Ala Ser Gly Cys Glu Ser Glu Thr
1365 1370 1375

AGC GTC TCT GAA GAC TGC TCA GGG CTA TCC TCT CAG AGT GAC ATT TTA 4295
Ser Val Ser Glu Asp Cys Ser Gly Leu Ser Ser Gln Ser Asp Ile Leu
1380 1385 1390

ACC ACT CAG CAG AGG GAT ACC ATG CAA CAT AAC CTG ATA AAG CTC CAG 4343
Thr Thr Gln Gln Arg Asp Thr Met Gln His Asn Leu Ile Lys Leu Gln
1395 1400 1405

CAG GAA ATG GCT GAA CTA GAA GCT GTG TTA GAA CAG CAT GGG AGC CAG 4391
Gln Glu Met Ala Glu Leu Glu Ala Val Leu Glu Gln His Gly Ser Gln
1410 1415 1420

CCT TCT AAC AGC TAC CCT TCC ATC ATA AGT GAC TCT TCT GCC CTT GAG 4439
Pro Ser Asn Ser Tyr Pro Ser Ile Ile Ser Asp Ser Ser Ala Leu Glu
1425 1430 1435 1440

GAC CTG CGA AAT CCA GAA CAA AGC ACA TCA GAA AAA GCA GTA TTA ACT 4487
Asp Leu Arg Asn Pro Glu Gln Ser Thr Ser Glu Lys Ala Val Leu Thr
1445 1450 1455

TCA CAG AAA AGT AGT GAA TAC CCT ATA AGC CAG AAT CCA GAA GGC CTT 4535
Ser Gln Lys Ser Ser Glu Tyr Pro Ile Ser Gln Asn Pro Glu Gly Leu
1460 1465 1470

TCT GCT GAC AAG TTT GAG GTG TCT GCA GAT AGT TCT ACC AGT AAA AAT 4583
Ser Ala Asp Lys Phe Glu Val Ser Ala Asp Ser Ser Thr Ser Lys Asn
1475 1480 1485

AAA GAA CCA GGA GTG GAA AGG TCA TCC CCT TCT AAA TGC CCA TCA TTA 4631
Lys Glu Pro Gly Val Glu Arg Ser Ser Pro Ser Lys Cys Pro Ser Leu
1490 1495 1500

GAT GAT AGG TGG TAC ATG CAC AGT TGC TCT GGG AGT CTT CAG AAT AGA 4679
Asp Asp Arg Trp Tyr Met His Ser Cys Ser Gly Ser Leu Gln Asn Arg
1505 1510 1515 1520

AAC TAC CCA TCT CAA GAG GAG CTC ATT AAG GTT GTT GAT GTG GAG GAG 4727
Asn Tyr Pro Ser Gln Glu Glu Leu Ile Lys Val Val Asp Val Glu Glu
1525 1530 1535

CAA CAG CTG GAA GAG TCT GGG CCA CAC GAT TTG ACG GAA ACA TCT TAC 4775
Gln Gln Leu Glu Glu Ser Gly Pro His Asp Leu Thr Glu Thr Ser Tyr
1540 1545 1550

TTG CCA AGG CAA GAT CTA GAG GGA ACC CCT TAC CTG GAA TCT GGA ATC 4823
Leu Pro Arg Gln Asp Leu Glu Gly Thr Pro Tyr Leu Glu Ser Gly Ile
1555 1560 1565

AGC CTC TTC TCT GAT GAC CCT GAA TCT GAT CCT TCT GAA GAC AGA GCC 4871
Ser Leu Phe Ser Asp Asp Pro Glu Ser Asp Pro Ser Glu Asp Arg Ala
1570 1575 1580

CCA GAG TCA GCT CGT GTT GGC AAC ATA CCA TCT TCA ACC TCT GCA TTG 4919
Pro Glu Ser Ala Arg Val Gly Asn Ile Pro Ser Ser Thr Ser Ala Leu
1585 1590 1595 1600

AAA GTT CCC CAA TTG AAA GTT GCA GAA TCT GCC CAG AGT CCA GCT GCT 4967
Lys Val Pro Gln Leu Lys Val Ala Glu Ser Ala Gln Ser Pro Ala Ala
1605 1610 1615

GCT CAT ACT ACT GAT ACT GCT GGG TAT AAT GCA ATG GAA GAA AGT GTG 5015
Ala His Thr Thr Asp Thr Ala Gly Tyr Asn Ala Met Glu Glu Ser Val
1620 1625 1630

AGC AGG GAG AAG CCA GAA TTG ACA GCT TCA ACA GAA AGG GTC AAC AAA 5063
Ser Arg Glu Lys Pro Glu Leu Thr Ala Ser Thr Glu Arg Val Asn Lys
1635 1640 1645

AGA ATG TCC ATG GTG GTG TCT GGC CTG ACC CCA GAA GAA TTT ATG CTC 5111
Arg Met Ser Met Val Val Ser Gly Leu Thr Pro Glu Glu Phe Met Leu
1650 1655 1660

GTG TAC AAG TTT GCC AGA AAA CAC CAC ATC ACT TTA ACT AAT CTA ATT 5159
Val Tyr Lys Phe Ala Arg Lys His His Ile Thr Leu Thr Asn Leu Ile
1665 1670 1675 1680

ACT GAA GAG ACT ACT CAT GTT GTT ATG AAA ACA GAT GCT GAG TTT GTG 5207
Thr Glu Glu Thr Thr His Val Val Met Lys Thr Asp Ala Glu Phe Val
1685 1690 1695

TGT GAA CGG ACA CTG AAA TAT TTT CTA GGA ATT GCG GGA GGA AAA TGG 5255
Cys Glu Arg Thr Leu Lys Tyr Phe Leu Gly Ile Ala Gly Gly Lys Trp
1700 1705 1710

GTA GTT AGC TAT TTC TGG GTG ACC CAG TCT ATT AAA GAA AGA AAA ATG 5303
Val Val Ser Tyr Phe Trp Val Thr Gln Ser Ile Lys Glu Arg Lys Met
1715 1720 1725

CTG AAT GAG CAT GAT TTT GAA GTC AGA GGA GAT GTG GTC AAT GGA AGA 5351
Leu Asn Glu His Asp Phe Glu Val Arg Gly Asp Val Val Asn Gly Arg
1730 1735 1740

AAC CAC CAA GGT CCA AAG CGA GCA AGA GAA TCC CAG GAC AGA AAG ATC 5399
Asn His Gln Gly Pro Lys Arg Ala Arg Glu Ser Gln Asp Arg Lys Ile
1745 1750 1755 1760

TTC AGG GGG CTA GAA ATC TGT TGC TAT GGG CCC TTC ACC AAC ATG CCC 5447
Phe Arg Gly Leu Glu Ile Cys Cys Tyr Gly Pro Phe Thr Asn Met Pro
1765 1770 1775

ACA GAT CAA CTG GAA TGG ATG GTA CAG CTG TGT GGT GCT TCT GTG GTG 5495
Thr Asp Gln Leu Glu Trp Met Val Gln Leu Cys Gly Ala Ser Val Val
1780 1785 1790

AAG GAG CTT TCA TCA TTC ACC CTT GGC ACA GGT GTC CAC CCA ATT GTG 5543
Lys Glu Leu Ser Ser Phe Thr Leu Gly Thr Gly Val His Pro Ile Val
1795 1800 1805

GTT GTG CAG CCA GAT GCC TGG ACA GAG GAC AAT GGC TTC CAT GCA ATT 5591
Val Val Gln Pro Asp Ala Trp Thr Glu Asp Asn Gly Phe His Ala Ile
1810 1815 1820

GGG CAG ATG TGT GAG GCA CCT GTG GTG ACC CGA GAG TGG GTG TTG GAC 5639
Gly Gln Met Cys Glu Ala Pro Val Val Thr Arg Glu Trp Val Leu Asp
1825 1830 1835 1840

AGT GTA GCA CTC TAC CAG TGC CAG GAG CTG GAC ACC TAC CTG ATA CCC 5687
Ser Val Ala Leu Tyr Gln Cys Gln Glu Leu Asp Thr Tyr Leu Ile Pro
1845 1850 1855

CAG ATC CCC CAC AGC CAC TAC TGA CTGCAGCCAG CCACAGGTAC AGAGCCACAG 5741
Gln Ile Pro His Ser His Tyr *
1860

GACCCCAAGA ATGAGCTTAC AAAGTGGCCT TTCCAGGCCC TGGGAGCTCC TCTCACTCTT 5801

CAGTCCTTCT ACTGTCCTGG CTACTAAATA TTTTATGTAC ATCAGCCTGA AAAGGACTTC 5861

TGGCTATGCA AGGGTCCCTT AAAGATTTTC TGCTTGAAGT CTCCCTTGGA AAT 5914


(2) INFORMATION FOR SEQ ID NO: 2:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1863 amino acids
(B) TYPE: amino acid
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 2:

Met Asp Leu Ser Ala Leu Arg Val Glu Glu Val Gln Asn Val Ile Asn
1 5 10 15

Ala Met Gln Lys Ile Leu Glu Cys Pro Ile Cys Leu Glu Leu Ile Lys
20 25 30

Glu Pro Val Ser Thr Lys Cys Asp His Ile Phe Cys Lys Phe Cys Met
35 40 45

Leu Lys Leu Leu Asn Gln Lys Lys Gly Pro Ser Gln Cys Pro Leu Cys
50 55 60

Lys Asn Asp Ile Thr Lys Arg Ser Leu Gln Glu Ser Thr Arg Phe Ser
65 70 75 80

Gln Leu Val Glu Glu Leu Leu Lys Ile Ile Cys Ala Phe Gln Leu Asp
85 90 95

Thr Gly Leu Glu Tyr Ala Asn Ser Tyr Asn Phe Ala Lys Lys Glu Asn
100 105 110

Asn Ser Pro Glu His Leu Lys Asp Glu Val Ser Ile Ile Gln Ser Met
115 120 125

Gly Tyr Arg Asn Arg Ala Lys Arg Leu Leu Gln Ser Glu Pro Glu Asn
130 135 140

Pro Ser Leu Gln Glu Thr Ser Leu Ser Val Gln Leu Ser Asn Leu Gly
145 150 155 160

Thr Val Arg Thr Leu Arg Thr Lys Gln Arg Ile Gln Pro Gln Lys Thr
165 170 175

Ser Val Tyr Ile Glu Leu Gly Ser Asp Ser Ser Glu Asp Thr Val Asn
180 185 190

Lys Ala Thr Tyr Cys Ser Val Gly Asp Gln Glu Leu Leu Gln Ile Thr
195 200 205

Pro Gln Gly Thr Arg Asp Glu Ile Ser Leu Asp Ser Ala Lys Lys Ala
210 215 220

Ala Cys Glu Phe Ser Glu Thr Asp Val Thr Asn Thr Glu His His Gln
225 230 235 240

Pro Ser Asn Asn Asp Leu Asn Thr Thr Glu Lys Arg Ala Ala Glu Arg
245 250 255

His Pro Glu Lys Tyr Gln Gly Ser Ser Val Ser Asn Leu His Val Glu
260 265 270

Pro Cys Gly Thr Asn Thr His Ala Ser Ser Leu Gln His Glu Asn Ser
275 280 285

Ser Leu Leu Leu Thr Lys Asp Arg Met Asn Val Glu Lys Ala Glu Phe
290 295 300

Cys Asn Lys Ser Lys Gln Pro Gly Leu Ala Arg Ser Gln His Asn Arg
305 310 315 320

Trp Ala Gly Ser Lys Glu Thr Cys Asn Asp Arg Arg Thr Pro Ser Thr
325 330 335

Glu Lys Lys Val Asp Leu Asn Ala Asp Pro Leu Cys Glu Arg Lys Glu
340 345 350

Trp Asn Lys Gln Lys Leu Pro Cys Ser Glu Asn Pro Arg Asp Thr Glu
355 360 365

Asp Val Pro Trp Ile Thr Leu Asn Ser Ser Ile Gln Lys Val Asn Glu
370 375 380

Trp Phe Ser Arg Ser Asp Glu Leu Leu Gly Ser Asp Asp Ser His Asp
385 390 395 400

Gly Glu Ser Glu Ser Asn Ala Lys Val Ala Asp Val Leu Asp Val Leu
405 410 415

Asn Glu Val Asp Glu Tyr Ser Gly Ser Ser Glu Lys Ile Asp Leu Leu
420 425 430

Ala Ser Asp Pro His Glu Ala Leu Ile Cys Lys Ser Glu Arg Val His
435 440 445

Ser Lys Ser Val Glu Ser Asn Ile Glu Asp Lys Ile Phe Gly Lys Thr
450 455 460

Tyr Arg Lys Lys Ala Ser Leu Pro Asn Leu Ser His Val Thr Glu Asn
465 470 475 480

Leu Ile Ile Gly Ala Phe Val Thr Glu Pro Gln Ile Ile Gln Glu Arg
485 490 495

Pro Leu Thr Asn Lys Leu Lys Arg Lys Arg Arg Pro Thr Ser Gly Leu
500 505 510

His Pro Glu Asp Phe Ile Lys Lys Ala Asp Leu Ala Val Gln Lys Thr
515 520 525

Pro Glu Met Ile Asn Gln Gly Thr Asn Gln Thr Glu Gln Asn Gly Gln
530 535 540

Val Met Asn Ile Thr Asn Ser Gly His Glu Asn Lys Thr Lys Gly Asp
545 550 555 560

Ser Ile Gln Asn Glu Lys Asn Pro Asn Pro Ile Glu Ser Leu Glu Lys
565 570 575

Glu Ser Ala Phe Lys Thr Lys Ala Glu Pro Ile Ser Ser Ser Ile Ser
580 585 590

Asn Met Glu Leu Glu Leu Asn Ile His Asn Ser Lys Ala Pro Lys Lys
595 600 605

Asn Arg Leu Arg Arg Lys Ser Ser Thr Arg His Ile His Ala Leu Glu
610 615 620

Leu Val Val Ser Arg Asn Leu Ser Pro Pro Asn Cys Thr Glu Leu Gln
625 630 635 640

Ile Asp Ser Cys Ser Ser Ser Glu Glu Ile Lys Lys Lys Lys Tyr Asn
645 650 655

Gln Met Pro Val Arg His Ser Arg Asn Leu Gln Leu Met Glu Gly Lys
660 665 670

Glu Pro Ala Thr Gly Ala Lys Lys Ser Asn Lys Pro Asn Glu Gln Thr
675 680 685

Ser Lys Arg His Asp Ser Asp Thr Phe Pro Glu Leu Lys Leu Thr Asn
690 695 700

Ala Pro Gly Ser Phe Thr Lys Cys Ser Asn Thr Ser Glu Leu Lys Glu
705 710 715 720

Phe Val Asn Pro Ser Leu Pro Arg Glu Glu Lys Glu Glu Lys Leu Glu
725 730 735

Thr Val Lys Val Ser Asn Asn Ala Glu Asp Pro Lys Asp Leu Met Leu
740 745 750

Ser Gly Glu Arg Val Leu Gln Thr Glu Arg Ser Val Glu Ser Ser Ser
755 760 765

Ile Ser Leu Val Pro Gly Thr Asp Tyr Gly Thr Gln Glu Ser Ile Ser
770 775 780

Leu Leu Glu Val Ser Thr Leu Gly Lys Ala Lys Thr Glu Pro Asn Lys
785 790 795 800

Cys Val Ser Gln Cys Ala Ala Phe Glu Asn Pro Lys Gly Leu Ile His
805 810 815

Gly Cys Ser Lys Asp Asn Arg Asn Asp Thr Glu Gly Phe Lys Tyr Pro
820 825 830

Leu Gly His Glu Val Asn His Ser Arg Glu Thr Ser Ile Glu Met Glu
835 840 845

Glu Ser Glu Leu Asp Ala Gln Tyr Leu Gln Asn Thr Phe Lys Val Ser
850 855 860

Lys Arg Gln Ser Phe Ala Pro Phe Ser Asn Pro Gly Asn Ala Glu Glu
865 870 875 880

Glu Cys Ala Thr Phe Ser Ala His Ser Gly Ser Leu Lys Lys Gln Ser
885 890 895

Pro Lys Val Thr Phe Glu Cys Glu Gln Lys Glu Glu Asn Gln Gly Lys
900 905 910

Asn Glu Ser Asn Ile Lys Pro Val Gln Thr Val Asn Ile Thr Ala Gly
915 920 925

Phe Pro Val Val Gly Gln Lys Asp Lys Pro Val Asp Asn Ala Lys Cys
930 935 940

Ser Ile Lys Gly Gly Ser Arg Phe Cys Leu Ser Ser Gln Phe Arg Gly
945 950 955 960

Asn Glu Thr Gly Leu Ile Thr Pro Asn Lys His Gly Leu Leu Gln Asn
965 970 975

Pro Tyr Arg Ile Pro Pro Leu Phe Pro Ile Lys Ser Phe Val Lys Thr
980 985 990

Lys Cys Lys Lys Asn Leu Leu Glu Glu Asn Phe Glu Glu His Ser Met
995 1000 1005

Ser Pro Glu Arg Glu Met Gly Asn Glu Asn Ile Pro Ser Thr Val Ser
1010 1015 1020

Thr Ile Ser Arg Asn Asn Ile Arg Glu Asn Val Phe Lys Glu Ala Ser
1025 1030 1035 1040

Ser Ser Asn Ile Asn Glu Val Gly Ser Ser Thr Asn Glu Val Gly Ser
1045 1050 1055

Ser Ile Asn Glu Ile Gly Ser Ser Asp Glu Asn Ile Gln Ala Glu Leu
1060 1065 1070

Gly Arg Asn Arg Gly Pro Lys Leu Asn Ala Met Leu Arg Leu Gly Val
1075 1080 1085

Leu Gln Pro Glu Val Tyr Lys Gln Ser Leu Pro Gly Ser Asn Cys Lys
1090 1095 1100

His Pro Glu Ile Lys Lys Gln Glu Tyr Glu Glu Val Val Gln Thr Val
1105 1110 1115 1120

Asn Thr Asp Phe Ser Pro Tyr Leu Ile Ser Asp Asn Leu Glu Gln Pro
1125 1130 1135

Met Gly Ser Ser His Ala Ser Gln Val Cys Ser Glu Thr Pro Asp Asp
1140 1145 1150

Leu Leu Asp Asp Gly Glu Ile Lys Glu Asp Thr Ser Phe Ala Glu Asn
1155 1160 1165

Asp Ile Lys Glu Ser Ser Ala Val Phe Ser Lys Ser Val Gln Lys Gly
1170 1175 1180

Glu Leu Ser Arg Ser Pro Ser Pro Phe Thr His Thr His Leu Ala Gln
1185 1190 1195 1200

Gly Tyr Arg Arg Gly Ala Lys Lys Leu Glu Ser Ser Glu Glu Asn Leu
1205 1210 1215

Ser Ser Glu Asp Glu Glu Leu Pro Cys Phe Gln His Leu Leu Phe Gly
1220 1225 1230

Lys Val Asn Asn Ile Pro Ser Gln Ser Thr Arg His Ser Thr Val Ala
1235 1240 1245

Thr Glu Cys Leu Ser Lys Asn Thr Glu Glu Asn Leu Leu Ser Leu Lys
1250 1255 1260

Asn Ser Leu Asn Asp Cys Ser Asn Gln Val Ile Leu Ala Lys Ala Ser
1265 1270 1275 1280

Gln Glu His His Leu Ser Glu Glu Thr Lys Cys Ser Ala Ser Leu Phe
1285 1290 1295

Ser Ser Gln Cys Ser Glu Leu Glu Asp Leu Thr Ala Asn Thr Asn Thr
1300 1305 1310

Gln Asp Pro Phe Leu Ile Gly Ser Ser Lys Gln Met Arg His Gln Ser
1315 1320 1325

Glu Ser Gln Gly Val Gly Leu Ser Asp Lys Glu Leu Val Ser Asp Asp
1330 1335 1340

Glu Glu Arg Gly Thr Gly Leu Glu Glu Asn Asn Gln Glu Glu Gln Ser
1345 1350 1355 1360

Met Asp Ser Asn Leu Gly Glu Ala Ala Ser Gly Cys Glu Ser Glu Thr
1365 1370 1375

Ser Val Ser Glu Asp Cys Ser Gly Leu Ser Ser Gln Ser Asp Ile Leu
1380 1385 1390

Thr Thr Gln Gln Arg Asp Thr Met Gln His Asn Leu Ile Lys Leu Gln
1395 1400 1405

Gln Glu Met Ala Glu Leu Glu Ala Val Leu Glu Gln His Gly Ser Gln
1410 1415 1420

Pro Ser Asn Ser Tyr Pro Ser Ile Ile Ser Asp Ser Ser Ala Leu Glu
1425 1430 1435 1440

Asp Leu Arg Asn Pro Glu Gln Ser Thr Ser Glu Lys Ala Val Leu Thr
1445 1450 1455

Ser Gln Lys Ser Ser Glu Tyr Pro Ile Ser Gln Asn Pro Glu Gly Leu
1460 1465 1470

Ser Ala Asp Lys Phe Glu Val Ser Ala Asp Ser Ser Thr Ser Lys Asn
1475 1480 1485

Lys Glu Pro Gly Val Glu Arg Ser Ser Pro Ser Lys Cys Pro Ser Leu
1490 1495 1500

Asp Asp Arg Trp Tyr Met His Ser Cys Ser Gly Ser Leu Gln Asn Arg
1505 1510 1515 1520

Asn Tyr Pro Ser Gln Glu Glu Leu Ile Lys Val Val Asp Val Glu Glu
1525 1530 1535

Gln Gln Leu Glu Glu Ser Gly Pro His Asp Leu Thr Glu Thr Ser Tyr
1540 1545 1550

Leu Pro Arg Gln Asp Leu Glu Gly Thr Pro Tyr Leu Glu Ser Gly Ile
1555 1560 1565

Ser Leu Phe Ser Asp Asp Pro Glu Ser Asp Pro Ser Glu Asp Arg Ala
1570 1575 1580

Pro Glu Ser Ala Arg Val Gly Asn Ile Pro Ser Ser Thr Ser Ala Leu
1585 1590 1595 1600

Lys Val Pro Gln Leu Lys Val Ala Glu Ser Ala Gln Ser Pro Ala Ala
1605 1610 1615

Ala His Thr Thr Asp Thr Ala Gly Tyr Asn Ala Met Glu Glu Ser Val
1620 1625 1630

Ser Arg Glu Lys Pro Glu Leu Thr Ala Ser Thr Glu Arg Val Asn Lys
1635 1640 1645

Arg Met Ser Met Val Val Ser Gly Leu Thr Pro Glu Glu Phe Met Leu
1650 1655 1660

Val Tyr Lys Phe Ala Arg Lys His His Ile Thr Leu Thr Asn Leu Ile
1665 1670 1675 1680

Thr Glu Glu Thr Thr His Val Val Met Lys Thr Asp Ala Glu Phe Val
1685 1690 1695

Cys Glu Arg Thr Leu Lys Tyr Phe Leu Gly Ile Ala Gly Gly Lys Trp
1700 1705 1710

Val Val Ser Tyr Phe Trp Val Thr Gln Ser Ile Lys Glu Arg Lys Met
1715 1720 1725

Leu Asn Glu His Asp Phe Glu Val Arg Gly Asp Val Val Asn Gly Arg
1730 1735 1740

Asn His Gln Gly Pro Lys Arg Ala Arg Glu Ser Gln Asp Arg Lys Ile
1745 1750 1755 1760

Phe Arg Gly Leu Glu Ile Cys Cys Tyr Gly Pro Phe Thr Asn Met Pro
1765 1770 1775

Thr Asp Gln Leu Glu Trp Met Val Gln Leu Cys Gly Ala Ser Val Val
1780 1785 1790

Lys Glu Leu Ser Ser Phe Thr Leu Gly Thr Gly Val His Pro Ile Val
1795 1800 1805

Val Val Gln Pro Asp Ala Trp Thr Glu Asp Asn Gly Phe His Ala Ile
1810 1815 1820

Gly Gln Met Cys Glu Ala Pro Val Val Thr Arg Glu Trp Val Leu Asp
1825 1830 1835 1840

Ser Val Ala Leu Tyr Gln Cys Gln Glu Leu Asp Thr Tyr Leu Ile Pro
1845 1850 1855

Gln Ile Pro His Ser His Tyr *
1860

(2) INFORMATION FOR SEQ ID NO: 3:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: s754 A

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 3:

CTAGCCTGGG CAACAAACGA 20

(2) INFORMATION FOR SEQ ID NO: 4:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: s754 B

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 4:

GCAGGAAGCA GGAATGGAAC 20

(2) INFORMATION FOR SEQ ID NO: 5:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: s975 A

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 5:

TAGGAGATGG ATTATTGGTG 20

(2) INFORMATION FOR SEQ ID NO: 6:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: s975 B

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 6:

AGGCAACTTT GCAATGAGTG 20

(2) INFORMATION FOR SEQ ID NO: 7:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: tdj1474 A

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 7:

CAGAGTGAGA CCTTGTCTCA AA 22

(2) INFORMATION FOR SEQ ID NO: 8:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: tdj1474 B

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 8:

TTCTGCAAAC ACCTTAAACT CAG 23

(2) INFORMATION FOR SEQ ID NO: 9:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: tdj1239 A

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 9:

AACCTGGAAG GCAGAGGTTG 20

(2) INFORMATION FOR SEQ ID NO: 10:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: tdj1239 B

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 10:

TCTGTACCTG CTAAGCAGTG G 21

(2) INFORMATION FOR SEQ ID NO: 11:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 111 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: cDNA

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(ix) FEATURE:
(A) NAME / KEY: CDS
(B) LOCATION: 2..111

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 11:

G GKC TTA CTC TGT TGT CCC AGC TGG AGT ACA GWG TGC GAT CAT GAG 46
Xaa Leu Leu Cys Cys Pro Ser Trp Ser Thr Xaa Cys Asp His Glu
1865 1870 1875

GCT TAC TGT TGC TTG ACT CCT AGG CTC AAG CGA TCC TAT CAC CTC AGT 94
Ala Tyr Cys Cys Leu Thr Pro Arg Leu Lys Arg Ser Tyr His Leu Ser
1880 1885 1890 1895

CTC CAA GTA GCT GGA CT 111
Leu Gln Val Ala Gly
1900

(2) INFORMATION FOR SEQ ID NO: 12:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 36 amino acids
(B) TYPE: amino acid
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 12:

Xaa Leu Leu Cys Cys Pro Ser Trp Ser Thr Xaa Cys Asp His Glu Ala
1 5 10 15

Tyr Cys Cys Leu Thr Pro Arg Leu Lys Arg Ser Tyr His Leu Ser Leu
20 25 30

Gln Val Ala Gly
35

(2) INFORMATION FOR SEQ ID NO: 13:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1534 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 13:

GAGGCTAGAG GGCAGGCACT TTATGGCAAA CTCAGGTAGA ATTCTTCCTC TTCCGTCTCT 60

TTCCTTTTAC GTCATCGGGG AGACTGGGTG GCAATCGCAG CCCGAGAGAC GCATGGCTCT 120

TTCTGCCCTC CATCCTCTGA TGTACCTTGA TTTCGTATTC TGAGAGGCTG CTGCTTAGCG 180

GTAGCCCCTT GGTTTCCGTG GCAACGGAAA AGCGCGGGAA TTACAGATAA ATTAAAACTG 240

CGACTGCGCG GCGTGAGCTC GCTGAGACTT CCTGGACCCC GCACCAGGCT GTGGGGTTTC 300

TCAGATAACT GGGCCCCTGC GCTCAGGAGG CCTTCACCCT CTGCTCTGGG TAAAGGTAGT 360

AGAGTCCCGG GAAAGGGACA GGGGGCCCAA GTGATGCTCT GGGGTACTGG CGTGGGAGAG 420

TGGATTTCCG AAGCTGACAG ATGGGTATTC TTTGACGGGG GGTAGGGGCG GAACCTGAGA 480

GGCGTAAGGC GTTGTGAACC CTGGGGAGGG GGGCAGTTTG TAGGTCGCGA GGGAAGCGCT 540

GAGGATCAGG AAGGGGGCAC TGAGTGTCCG TGGGGGAATC CTCGTGATAG GAACTGGAAT 600

ATGCCTTGAG GGGGACACTA TGTCTTTAAA AACGTCGGCT GGTCATGAGG TCAGGAGTTC 660

CAGACCAGCC TGACCAACGT GGTGAAACTC CGTCTCTACT AAAAATACNA AAATTAGCCG 720

GGCGTGGTGC CGCTCCAGCT ACTCAGGAGG CTGAGGCAGG AGAATCGCTA GAACCCGGGA 780

GGCGGAGGTT GCAGTGAGCC GAGATCGCGC CATTGCACTC CAGCCTGGGC GACAGAGCGA 840

GACTGTCTCA AAACAAAACA AAACAAAACA AAACAAAAAA CACCGGCTGG TATGTATGAG 900

AGGATGGGAC CTTGTGGAAG AAGAGGTGCC AGGAATATGT CTGGGAAGGG GAGGAGACAG 960

GATTTTGTGG GAGGGAGAAC TTAAGAACTG GATCCATTTG CGCCATTGAG AAAGCGCAAG 1020

AGGGAAGTAG AGGAGCGTCA GTAGTAACAG ATGCTGCCGG CAGGGATGTG CTTGAGGAGG 1080

ATCCAGAGAT GAGAGCAGGT CACTGGGAAA GGTTAGGGGC GGGGAGGCCT TGATTGGTGT 1140

TGGTTTGGTC GTTGTTGATT TTGGTTTTAT GCAAGAAAAA GAAAACAACC AGAAACATTG 1200

GAGAAAGCTA AGGCTACCAC CACCTACCCG GTCAGTCACT CCTCTGTAGC TTTCTCTTTC 1260

TTGGAGAAAG GAAAAGACCC AAGGGGTTGG CAGCGATATG TGAAAAAATT CAGAATTTAT 1320

GTTGTCTAAT TACAAAAAGC AACTTCTAGA ATCTTTAAAA ATAAAGGACG TTGTCATTAG 1380

TTCTTCTGGT TTGTATTATT CTAAAACCTT CCAAATCTTC AAATTTACTT TATTTTAAAA 1440

TGATAAAATG AAGTTGTCAT TTTATAAACC TTTTAAAAAG ATATATATAT ATGTTTTTCT 1500

AATGTGTTAA AGTTCATTGG AACAGAAAGA AATG 1534

(2) INFORMATION FOR SEQ ID NO: 14:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1924 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 14:

GAGGCTAGAG GGCAGGCACT TTATGGCAAA CTCAGGTAGA ATTCTTCCTC TTCCGTCTCT 60

TTCCTTTTAC GTCATCGGGG AGACTGGGTG GCAATCGCAG CCCGAGAGAC GCATGGCTCT 120

TTCTGCCCTC CATCCTCTGA TGTACCTTGA TTTCGTATTC TGAGAGGCTG CTGCTTAGCG 180

GTAGCCCCTT GGTTTCCGTG GCAACGGAAA AGCGCGGGAA TTACAGATAA ATTAAAACTG 240

CGACTGCGCG GCGTGAGCTC GCTGAGACTT CCTGGACCCC GCACCAGGCT GTGGGGTTTC 300

TCAGATAACT GGGCCCCTGC GCTCAGGAGG CCTTCACCCT CTGCTCTGGG TAAAGGTAGT 360

AGAGTCCCGG GAAAGGGACA GGGGGCCCAA GTGATGCTCT GGGGTACTGG CGTGGGAGAG 420

TGGATTTCCG AAGCTGACAG ATGGGTATTC TTTGACGGGG GGTAGGGGCG GAACCTGAGA 480

GGCGTAAGGC GTTGTGAACC CTGGGGAGGG GGGCAGTTTG TAGGTCGCGA GGGAAGCGCT 540

GAGGATCAGG AAGGGGGCAC TGAGTGTCCG TGGGGGAATC CTCGTGATAG GAACTGGAAT 600

ATGCCTTGAG GGGGACACTA TGTCTTTAAA AACGTCGGCT GGTCATGAGG TCAGGAGTTC 660

CAGACCAGCC TGACCAACGT GGTGAAACTC CGTCTCTACT AAAAATACNA AAATTAGCCG 720

GGCGTGGTGC CGCTCCAGCT ACTCAGGAGG CTGAGGCAGG AGAATCGCTA GAACCCGGGA 780

GGCGGAGGTT GCAGTGAGCC GAGATCGCGC CATTGCACTC CAGCCTGGGC GACAGAGCGA 840

GACTGTCTCA AAACAAAACA AAACAAAACA AAACAAAAAA CACCGGCTGG TATGTATGAG 900

AGGATGGGAC CTTGTGGAAG AAGAGGTGCC AGGAATATGT CTGGGAAGGG GAGGAGACAG 960

GATTTTGTGG GAGGGAGAAC TTAAGAACTG GATCCATTTG CGCCATTGAG AAAGCGCAAG 1020

AGGGAAGTAG AGGAGCGTCA GTAGTAACAG ATGCTGCCGG CAGGGATGTG CTTGAGGAGG 1080

ATCCAGAGAT GAGAGCAGGT CACTGGGAAA GGTTAGGGGC GGGGAGGCCT TGATTGGTGT 1140

TGGTTTGGTC GTTGTTGATT TTGGTTTTAT GCAAGAAAAA GAAAACAACC AGAAACATTG 1200

GAGAAAGCTA AGGCTACCAC CACCTACCCG GTCAGTCACT CCTCTGTAGC TTTCTCTTTC 1260

TTGGAGAAAG GAAAAGACCC AAGGGGTTGG CAGCGATATG TGAAAAAATT CAGAATTTAT 1320

GTTGTCTAAT TACAAAAAGC AACTTCTAGA ATCTTTAAAA ATAAAGGACG TTGTCATTAG 1380

TTCTTCTGGT TTGTATTATT CTAAAACCTT CCAAATCTTC AAATTTACTT TATTTTAAAA 1440

TGATAAAATG AAGTTGTCAT TTTATAAACC TTTTAAAAAG ATATATATAT ATGTTTTTCT 1500

AATGTGTTAA AGTTCATTGG AACAGAAAGA AATGGATTTA TCTGCTCTTC GCGTTGAAGA 1560

AGTACAAAAT GTCATTAATG CTATGCAGAA AATCTTAGAG TGTCCCATCT GGTAAGTCAG 1620

CACAAGAGTG TATTAATTTG GGATTCCTAT GATTATCTCC TATGCAAATG AACAGAATTG 1680

ACCTTACATA CTAGGGAAGA AAAGACATGT CTAGTAAGAT TAGGCTATTG TAATTGCTGA 1740

TTTTCTTAAC TGAAGAACTT TAAAAATATA GAAAATGATT CCTTGTTCTC CATCCACTCT 1800

GCCTCTCCCA CTCCTCTCCT TTTCAACACA ATCCTGTGGT CCGGGAAAGA CAGGGCTCTG 1860

TCTTGATTGG TTCTGCACTG GGCAGGATCT GTTAGATACT GCATTTGCTT TCTCCAGCTC 1920

TAAA 1924

(2) INFORMATION FOR SEQ ID NO: 15:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 631 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 15:

AAATGCTGAT GATAGTATAG AGTATTGAAG GGATCAATAT AATTCTGTTT TGATATCTGA 60

AAGCTCACTG AAGGTAAGGA TCGTATTCTC TGCTGTATTC TCAGTTCCTG ACACAGCAGA 120

CATTTAATAA ATATTGAACG AACTTGAGGC CTTATGTTGA CTCAGTCATA ACAGCTCAAA 180

GTTGAACTTA TTCACTAAGA ATAGCTTTAT TTTTAAATAA ATTATTGAGC CTCATTTATT 240

TTCTTTTTCT CCCCCCCCTA CCCTGCTAGT CTGGAGTTGA TCAAGGAACC TGTCTCCACA 300

AAGTGTGACC ACATATTTTG CAAGTAAGTT TGAATGTGTT ATGTGGCTCC ATTATTAGCT 360

TTTGTTTTTG TCCTTCATAA CCCAGGAAAC ACCTAACTTT ATAGAAGCTT TACTTTCTTC 420

AATTAAGTGA GAACGAAAAT CCAACTCCAT TTCATTCTTT CTCAGAGAGT ATATAGTTAT 480

CAAAAGTTGG TTGTAATCAT AGTTCCTGGT AAAGTTTTGA CATATATTAT CTTTTTTTTT 540

TTTTGAGACA AGTCTCGCTC TGTCGCCCAG GCTGGAGTGC AGTGGCATGA GGCTTGCTCA 600

CTGCACCTCC GCCCCCGAGT TCAGCGACTC T 631

(2) INFORMATION FOR SEQ ID NO: 16:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 481 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 16:

TGAGATCTAG ACCACATGGT CAAAGAGATA GAATGTGAGC AATAAATGAA CCTTAAATTT 60

TTCAACAGCT ACTTTTTTTT TTTTTTTTTG AGACAGGGKC TTACTCTGTT GTCCCAGCTG 120

GAGTACAGWG TGCGATCATG AGGCTTACTG TTGCTTGACT CCTAGGCTCA AGCGATCCTA 180

TCACCTCAGT CTCCAAGTAG CTGGACTGTA AGTGCACACC ACCATATCCA GCTAAATTTT 240

GTGTTTTCTG TAGAGACGGG GTTTCGCCAT GTTTCCCAGG CTGGTCTTGA ACTTTGGGCT 300

TAACCCGTCT GCCCACCTAG GCATCCCAAA GTGCTAGGAT TACAGGTGTG AGTCATCATG 360

CCTGGCCAGT ATTTTAGTTA GCTCTGTCTT TTCAAGTCAT ATACAAGTTC ATTTTCTTTT 420

AAGTTTAGTT AACAACCTTA TATCATGTAT TCTTTTCTAG CATAAAGAAA GATTCGAGGC 480

C 481

(2) INFORMATION FOR SEQ ID NO: 17:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 522 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 17:

TGTGATCATA ACAGTAAGCC ATATGCATGT AAGTTCAGTT TTCATAGATC ATTGCTTATG 60

TAGTTTAGGT TTTTGCTTAT GCAGCATCCA AAAACAATTA GGAAACTATT GCTTGTAATT 120

CACCTGCCAT TACTTTTTAA ATGGCTCTTA AGGGCAGTTG TGAGATTATC TTTTCATGGC 180

TATTTGCCTT TTGAGTATTC TTTCTACAAA AGGAAGTAAA TTAAATTGTT CTTTCTTTCT 240

TTATAATTTA TAGATTTTGC ATGCTGAAAC TTCTCAACCA GAAGAAAGGG CCTTCACAGT 300

GTCCTTTATG TAAGAATGAT ATAACCAAAA GGTATATAAT TTGGTAATGA TGCTAGGTTG 360

GAAGCAACCA CAGTAGGAAA AAGTAGAAAT TATTTAATAA CATAGCGTTC CTATAAAACC 420

ATTCATCAGA AAAATTTATA AAAGAGTTTT TAGCACACAG TAAATTATTT CCAAAGTTAT 480

TTTCCTGAAA GTTTTATGGG CATCTGCCTT ATACAGGTAT TG 522

(2) INFORMATION FOR SEQ ID NO: 18:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 465 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 18:

GGTAGGCTTA AATGAATGAC AAAAAGTTAC TAAATCACTG CCATCACACG GTTTATACAG 60

ATGTCAATGA TGTATTGATT ATAGAGGTTT TCTACTGTTG CTGCATCTTA TTTTTATTTG 120

TTTACATGTC TTTTCTTATT TTAGTGTCCT TAAAAGGTTG ATAATCACTT GCTGAGTGTG 180

TTTCTCAAAC AATTTAATTT CAGGAGCCTA CAAGAAAGTA CGAGATTTAG TCAACTTGTT 240

GAAGAGCTAT TGAAAATCAT TTGTGCTTTT CAGCTTGACA CAGGTTTGGA GTGTAAGTGT 300

TGAATATCCC AAGAATGACA CTCAAGTGCT GTCCATGAAA ACTCAGGAAG TTTGCACAAT 360

TACTTTCTAT GACGTGGTGA TAAGACCTTT TAGTCTAGGT TAATTTTAGT TCTGTATCTG 420

TAATCTATTT TAAAAAATTA CTCCCACTGG TCTCACACCT TATTT 465

(2) INFORMATION FOR SEQ ID NO: 19:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 513 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 19:

AAAAAATCAC AGGTAACCTT AATGCATTGT CTTAACACAA CAAAGAGCAT ACATAGGGTT 60

TCTCTTGGTT TCTTTGATTA TAATTCATAC ATTTTTCTCT AACTGCAAAC ATAATGTTTT 120

CCCTTGTATT TTACAGATGC AAACAGCTAT AATTTTGCAA AAAAGGAAAA TAACTCTCCT 180

GAACATCTAA AAGATGAAGT TTCTATCATC CAAAGTATGG GCTACAGAAA CCGTGCCAAA 240

AGACTTCTAC AGAGTGAACC CGAAAATCCT TCCTTGGTAA AACCATTTGT TTTCTTCTTC 300

TTCTTCTTCT TCTTTTCTTT TTTTTTTCTT TTTTTTTTTG AGATGGAGTC TTGCTCTGTG 360

GCCCAGGCTA GAAGCAGTCC TCCTGCCTTA GCCNCCTTAG TAGCTGGGAT TACAGGCACG 420

CGCACCATGC CAGGCTAATT TTTGTATTTT TAGTAGAGAC GGGGTTTCAT CATGTTGGCC 480

AGGCTGGTCT CGAACTCCTA ACCTCAGGTG ATC 513

(2) INFORMATION FOR SEQ ID NO: 20:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 6769 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 20:

ATGATGGAGA TCTTAAAAAG TAATCATTCT GGGGCTGGGC GTAGTAGCTT GCACCTGTAA 60

TCCCAGCACT TCGGGAGGCT GAGGCAGGCA GATAATTTGA GGTCAGGAGT TTGAGACCAG 120

CCTGGCCAAC ATGGTGAAAC CCATCTCTAC TAAAAATACA AAAATTAGCT GGGTGTGGTG 180

GCACGTACCT GTAATCCCAG CTACTCGGGA GGCGGAGGCA CAAGAATTGC TTGAACCTAG 240

GACGCGGAGG TTGCAGCGAG CCAAGATCGC GCCACTGCAC TCCAGCCTGG GCCGTAGAGT 300

GAGACTCTGT CTCAAAAAAG AAAAAAAAGT AATTGTTCTA GCTGGGCGCA GTGGCTCTTG 360

CCTGTAATCC CAGCACTTTG GGAGGCCAAG GCGGGTGGAT CTCGAGTCCT AGAGTTCAAG 420

ACCAGCCTAG GCAATGTGGT GAAACCCCAT CGCTACAAAA AATACAAAAA TTAGCCAGGC 480

ATGGTGGCGT GCGCATGTAG TCCCAGCTCC TTGGGAGGCT GAGGTGGGAG GATCACTTGA 540

ACCCAGGAGA CAGAGGTTGC AGTGAACCGA GATCACGCCA CCACGCTCCA GCCTGGGCAA 600

CAGAACAAGA CTCTGTCTAA AAAAATACAA ATAAAATAAA AGTAGTTCTC ACAGTACCAG 660

CATTCATTTT TCAAAAGATA TAGAGCTAAA AAGGAAGGAA AAAAAAAGTA ATGTTGGGCT 720

TTTAAATACT CGTTCCTATA CTAAATGTTC TTAGGAGTGC TGGGGTTTTA TTGTCATCAT 780

TTATCCTTTT TAAAAATGTT ATTGGCCAGG CACGGTGGCT CATGGCTGTA ATCCCAGCAC 840

TTTGGGAGGC CGAGGCAGGC AGATCACCTG AGGTCAGGAG TGTGAGACCA GCCTGGCCAA 900

CATGGCGAAA CCTGTCTCTA CTAAAAATAC AAAAATTAAC TAGGCGTGGT GGTGTACGCC 960

TGTAGTCCCA GCTACTCGGG AGGCTGAGGC AGGAGAATCA ACTGAACCAG GGAGGTGGAG 1020

GTTGCAGTGT GCCGAGATCA CGCCACTGCA CTCTAGCCTG GCAACAGAGC AAGATTCTGT 1080

CTCAAAAAAA AAAAACATAT ATACACATAT ATCCCAAAGT GCTGGGATTA CATATATATA 1140

TATATATATA TATTATATAT ATATATATAT ATATATGTGA TATATATGTG ATATATATAT 1200

AACATATATA TATGTAATAT ATATGTGATA TATATATAAT ATATATATGT AATATATATG 1260

TGATATATAT ATATACACAC ACACACACAT ATATATGTAT GTGTGTGTGACACACACAC 1320

ACAAATTAGC CAGGCATAGT TGCACACGCT TGGTAGACCC AGCTACTCAG GAGGCTGAGG 1380

GAGGAGAATC TCTTGAACTT AGGAGGCGGA GGTTGCAGTG AGCTGAGATT GCGCCACTGC 1440

ACTCCAGCCT GGGTGACAGA GCAGGACTCT GTACACCCCC CAAAACAAAA AAAAAAGTTA 1500

TCAGATGTGA TTGGAATGTA TATCAAGTAT CAGCTTCAAA ATATGCTATA TTAATACTTC 1560

AAAAATTACA CAAATAATAC ATAATCAGGT TTGAAAAATT TAAGACAACM SAARAAAAAA 1620

WYCMAATCAC AMATATCCCA CACATTTTAT TATTMCTMCT MCWATTATTT TGWAGAGMCT 1680

GGGTCTCACY CYKTTGCTWA TGCTGGTCTT TGAACYCCYK GCCYCAARCA RTCCTSCTCC 1740

ABCCTCCCAA RGTGCTGGGG ATWATAGGCA TGARCTAACC GCACCCAGCC CCAGACATTT 1800

TAGTGTGTAA ATTCCTGGGC ATTTTTTCAA GGCATCATAC ATGTTAGCTG ACTGATGATG 1860

GTCAATTTAT TTTGTCCATG GTGTCAAGTT TCTCTTCAGG AGGAAAAGCA CAGAACTGGC 1920

CAACAATTGC TTGACTGTTC TTTACCATAC TGTTTAGCAG GAAACCAGTC TCAGTGTCCA 1980

ACTCTCTAAC CTTGGAACTG TGAGAACTCT GAGGACAAAG CAGCGGATAC AACCTCAAAA 2040

GACGTCTGTC TACATTGAAT TGGGTAAGGG TCTCAGGTTT TTTAAGTATT TAATAATAAT 2100

TGCTGGATTC CTTATCTTAT AGTTTTGCCA AAAATCTTGG TCATAATTTG TATTTGTGGT 2160

AGGCAGCTTT GGGAAGTGAA TTTTATGAGC CCTATGGTGA GTTATAAAAA ATGTAAAAGA 2220

CGCAGTTCCC ACCTTGAAGA ATCTTACTTT AAAAAGGGAG CAAAAGAGGC CAGGCATGGT 2280

GGCTCACACC TGTAATCCCA GCACTTTGGG AGGCCAAAGT GGGTGGATCA CCTGAGGTCG 2340

GGAGTTCGAG ACCAGCCTAG CCAACATGGA GAAACTCTGT CTGTACCAAA AAATAAAAAA 2400

TTAGCCAGGT GTGGTGGCAC ATAACTGTAA TCCCAGCTAC TCGGGAGGCT GAGGCAGGAG 2460

AATCACTTGA ACCCGGGAGG TGGAGGTTGC GGTGAACCGA GATCGCACCA TTGCACTCCA 2520

GCCTGGGCAA AAATAGCGAA ACTCCATCTA AAAAAAAAAA AGAGAGCAAA AGAAAGAMTM 2580

TCTGGTTTTA AMTMTGTGTA AATATGTTTT TGGAAAGATG GAGAGTAGCA ATAAGAAAAA 2640

ACATGATGGA TTGCTACAGT ATTTAGTTCC AAGATAAATT GTACTAGATG AGGAAGCCTT 2700

TTAAGAAGAG CTGAATTGCC AGGCGCAGTG GCTCACGCCT GTAATCCCAG CACTTTGGGA 2760

GGCCGAGGTG GGCGGATCAC CTGAGGTCGG GAGTTCAAGA CCAGCCTGAC CAACATGGAG 2820

AAACCCCATC TCTACTAAAA AAAAAAAAAA AAAAATTAGC CGGGGTGGTG GCTTATGCCT 2880

GTAATCCCAG CTACTCAGGA GGCTGAGGCA GGAGAATCGC TTGAACCCAG GAAGCAGAGG 2940

TTGCAGTGAG CCAAGATCGC ACCATTGCAC TCCAGCCTAG GCAACAAGAG TGAAACTCCA 3000

TCTCAAAAAA AAAAAAAAAG AGCTGAATCT TGGCTGGGCA GGATGGCTCG TGCCTGTAAT 3060

CCTAACGCTT TGGAAGACCG AGGCAGAAGG ATTGGTTGAG TCCACGAGTT TAAGACCAGC 3120

CTGGCCAACA TAGGGGAACC CTGTCTCTAT TTTTAAAATA ATAATACATT TTTGGCCGGT 3180

GCGGTGGCTC ATGCCTGTAA TCCCAATACT TTGGGAGGCT GAGGCAGGTA GATCACCTGA 3240

GGTCAGAGTT CGAGACCAGC CTGGATAACC TGGTGAAACC CCTCTTTACT AAAAATACAA 3300

AAAAAAAAAA AAATTAGCTG GGTGTGGTAG CACATGCTTG TAATCCCAGC TACTTGGGAG 3360

GCTGAGGCAG GAGAATCGCT TGAACCAGGG AGGCGGAGGT TACAATGAGC CAACACTACA 3420

CCACTGCACT CCAGCCTGGG CAATAGAGTG AGACTGCATC TCAAAAAAAT AATAATTTTT 3480

AAAAATAATA AATTTTTTTA AGCTTATAAA AAGAAAAGTT GAGGCCAGCA TAGTAGCTCA 3540

CATCTGTAAT CTCAGCAGTG GCAGAGGATT GCTTGAAGCC AGGAGTTTGA GACCAGCCTG 3600

GGCAACATAG CAAGACCTCA TCTCTACAAA AAAATTTCTT TTTTAAATTA GCTGGGTGTG 3660

GTGGTGTGCA TCTGTAGTCC CAGCTACTCA GGAGGCAGAG GTGAGTGGAT ACATTGAACC 3720

CAGGAGTTTG AGGCTGTAGT GAGCTATGAT CATGCCACTG CACTCCAACC TGGGTGACAG 3780

AGCAAGACCT CCAAAAAAAA AAAAAAAAGA GCTGCTGAGC TCAGAATTCA AACTGGGCTC 3840

TCAAATTGGA TTTTCTTTTA GAATATATTT ATAATTAAAA AGGATAGCCA TCTTTTGAGC 3900

TCCCAGGCAC CACCATCTAT TTATCATAAC ACTTACTGTT TTCCCCCCTT ATGATCATAA 3960

ATTCCTAGAC AACAGGCATT GTAAAAATAG TTATAGTAGT TGATATTTAG GAGCACTTAA 4020

CTATATTCCA GGCACTATTG TGCTTTTCTT GTATAACTCA TTAGATGCTT GTCAGACCTC 4080

TGAGATTGTT CCTATTATAC TTATTTTACA GATGAGAAAA TTAAGGCACA GAGAAGTTAT 4140

GAAATTTTTC CAAGGTATTA AACCTAGTAA GTGGCTGAGC CATGATTCAA ACCTAGGAAG 4200

TTAGATGTCA GAGCCTGTGC TTTTTTTTTG TTTTTGTTTT TGTTTTCAGT AGAAACGGGG 4260

GTCTCACTTT GTTGGCCAGG CTGGTCTTGA ACTCCTAACC TCAAATAATC CACCCATCTC 4320

GGCCTCCTCA AGTGCTGGGA TTACAGGTGA GAGCCACTGT GCCTGGCGAA GCCCATGCCT 4380

TTAACCACTT CTCTGTATTA CATACTAGCT TAACTAGCAT TGTACCTGCC ACAGTAGATG 4440

CTCAGTAAAT ATTTCTAGTT GAATATCTGT TTTTCAACAA GTACATTTTT TTAACCCTTT 4500

TAATTAAGAA AACTTTTATT GATTTATTTT TTGGGGGGAA ATTTTTTAGG ATCTGATTCT 4560

TCTGAAGATA CCGTTAATAA GGCAACTTAT TGCAGGTGAG TCAAAGAGAA CCTTTGTCTA 4620

TGAAGCTGGT ATTTTCCTAT TTAGTTAATA TTAAGGATTG ATGTTTCTCT CTTTTTAAAA 4680

ATATTTTAAC TTTTATTTTA GGTTCAGGGA TGTATGTGCA GTTTGTTATA TAGGTAAACA 4740

CACGACTTGG GATTTGGTGT ATAGATTTTT TTCATCATCC GGGTACTAAG CATACCCCAC 4800

AGTTTTTTGT TTGCTTTCTT TCTGAATTTC TCCCTCTTCC CACCTTCCTC CCTCAAGTAG 4860

GCTGGTGTTT CTCCAGACTA GAATCATGGT ATTGGAAGAA ACCTTAGAGA TCATCTAGTT 4920

TAGTTCTCTC ATTTTATAGT GGAGGAAATA CCCTTTTTGT TTGTTGGATT TAGTTATTAG 4980

CACTGTCCAA AGGAATTTAG GATAACAGTA GAACTCTGCA CATGCTTGCT TCTAGCAGAT 5040

TGTTCTCTAA GTTCCTCATA TACAGTAATA TTGACACAGC AGTAATTGTG ACTGATGAAA 5100

ATGTTCAAGG ACTTCATTTT CAACTCTTTC TTTCCTCTGT TCCTTATTTC CACATATCTC 5160

TCAAGCTTTG TCTGTATGTT ATATAATAAA CTACAAGCAA CCCCAACTAT GTTACCTACC 5220

TTCCTTAGGA ATTATTGCTT GACCCAGGTT TTTTTTTTTT TTTTTTTGGA GACGGGGTCT 5280

TGCCCTGTTG CCAGGATGGA GTGTAGTGGC GCCATCTCGG CTCACTGCAA TCTCCAACTC 5340

CCTGGTTCAA GCGATTCTCC TGTCTCAATC TCACGAGTAG CTGGGACTAC AGGTATACAC 5400

CACCACGCCC GGTTAATTGA CCATTCCATT TCTTTCTTTC TCTCTTTTTT TTTTTTTTTT 5460

TTGAGACAGA GTCTTGCTCT GTTGCCCAGG CTGGAGTACA GAGGTGTGAT CTCACCTCTC 5520

CGCAACGTCT GCCTCCCAGG TTGAAGCCAT ACTCCTGCCT CAGCCTCTCT AGTAGCTGGG 5580

ACTACAGGCG CGCGCCACCA CACCCGGCTA ATTTTTGTAT TTTTAGTAGA GATGGGGTTT 5640

CACCATGTTG GCCAGGCTGG TCTTGAACTC ATGACCTCAA GTGGTCCACC CGCCTCAGCC 5700

TCCCAAAGTG CTGGAATTAC AGGCTTGAGC CACCGTGCCC AGCAACCATT TCATTTCAAC 5760

TAGAAGTTTC TAAAGGAGAG AGCAGCTTTC ACTAACTAAA TAAGATTGGT CAGCTTTCTG 5820

TAATCGAAAG AGCTAAAATG TTTGATCTTG GTCATTTGAC AGTTCTGCAT ACATGTAACT 5880

AGTGTTTCTT ATTAGGACTC TGTCTTTTCC CTATAGTGTG GGAGATCAAG AATTGTTACA 5940

AATCACCCCT CAAGGAACCA GGGATGAAAT CAGTTTGGAT TCTGCAAAAA AGGGTAATGG 6000

CAAAGTTTGC CAACTTAACA GGCACTGAAA AGAGAGTGGG TAGATACAGT ACTGTAATTA 6060

GATTATTCTG AAGACCATTT GGGACCTTTA CAACCCACAA AATCTCTTGG CAGAGTTAGA 6120

GTATCATTCT CTGTCAAATG TCGTGGTATG GTCTGATAGA TTTAAATGGT ACTAGACTAA 6180

TGTACCTATA ATAAGACCTT CTTGTAACTG ATTGTTGCCC TTTCGCTTTT TTTTTTGTTT 6240

GTTTGTTTGT TTTTTTTTGA GATGGGGTCT CACTCTGTTG CCCAGGCTGG AGTGCAGTGA 6300

TGCAATCTTG GCTCACTGCA ACCTCCACCT CCAAAGGCTC AAGCTATCCT CCCACTTCAG 6360

CCTCCTGAGT AGCTGGGACT ACAGGCGCAT GCCACCACAC CCGGTTAATT TTTTGTGGTT 6420

TTATAGAGAT GGGGTTTCAC CATGTTACCG AGGCTGGTCT CAAACTCCTG GACTCAAGCA 6480

GTCTGCCCAC TTCAGCCTCC CAAAGTGCTG CAGTTACAGG CTTGAGCCAC TGTGCCTGGC 6540

CTGCCCTTTA CTTTTAATTG GTGTATTTGT GTTTCATCTT TTACCTACTG GTTTTTAAAT 6600

ATAGGGAGTG GTAAGTCTGT AGATAGAACA GAGTATTAAG TAGACTTAAT GGCCAGTAAT 6660

CTTTAGAGTA CATCAGAACC AGTTTTCTGA TGGCCAATCT GCTTTTAATT CACTCTTAGA 6720

CGTTAGAGAA ATAGGTGTGG TTTCTGCATA GGGAAAATTC TGAAATTAA 6769

(2) INFORMATION FOR SEQ ID NO: 21:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 4249 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 21:

GATCCTAAGT GGAAATAATC TAGGTAAATA GGAATTAAAT GAAAGAGTAT GAGCTACATC 60

TTCAGTATAC TTGGTAGTTT ATGAGGTTAG TTTCTCTAAT ATAGCCAGTT GGTTGATTTC 120

CACCTCCAAG GTGTATGAAG TATGTATTTT TTTAATGACA ATTCAGTTTT TGAGTACCTT 180

GTTATTTTTG TATATTTTCA GCTGCTTGTG AATTTTCTGA GACGGATGTA ACAAATACTG 240

AACATCATCA ACCCAGTAAT AATGATTTGA ACACCACTGA GAAGCGTGCA GCTGAGAGGC 300

ATCCAGAAAA GTATCAGGGT AGTTCTGTTT CAAACTTGCA TGTGGAGCCA TGTGGCACAA 360

ATACTCATGC CAGCTCATTA CAGCATGAGA ACAGCAGTTT ATTACTCACT AAAGACAGAA 420

TGAATGTAGA AAAGGCTGAA TTCTGTAATA AAAGCAAACA GCCTGGCTTA GCAAGGAGCC 480

AACATAACAG ATGGGCTGGA AGTAAGGAAA CATGTAATGA TAGGCGGACT CCCAGCACAG 540

AAAAAAAGGT AGATCTGAAT GCTGATCCCC TGTGTGAGAG AAAAGAATGG AATAAGCAGA 600

AACTGCCATG CTCAGAGAAT CCTAGAGATA CTGAAGATGT TCCTTGGATA ACACTAAATA 660

GCAGCATTCA GAAAGTTAAT GAGTGGTTTT CCAGAAGTGA TGAACTGTTA GGTTCTGATG 720

ACTCACATGA TGGGGAGTCT GAATCAAATG CCAAAGTAGC TGATGTATTG GACGTTCTAA 780

ATGAGGTAGA TGAATATTCT GGTTCTTCAG AGAAAATAGA CTTACTGGCC AGTGATCCTC 840

ATGAGGCTTT AATATGTAAA AGTGAAAGAG TTCACTCCAA ATCAGTAGAG AGTAATATTG 900

AAGGCCAAAT ATTTGGGAAA ACCTATCGGA AGAAGGCAAG CCTCCCCAAC TTAAGCCATG 960

TAACTGAAAA TCTAATTATA GGAGCATTTG TTACTGAGCC ACAGATAATA CAAGAGCGTC 1020

CCCTCACAAA TAAATTAAAG CGTAAAAGGA GACCTACATC AGGCCTTCAT CCTGAGGATT 1080

TTATCAAGAA AGCAGATTTG GCAGTTCAAA AGACTCCTGA AATGATAAAT CAGGGAACTA 1140

ACCAAACGGA GCAGAATGGT CAAGTGATGA ATATTACTAA TAGTGGTCAT GAGAATAAAA 1200

CAAAAGGTGA TTCTATTCAG AATGAGAAAA ATCCTAACCC AATAGAATCA CTCGAAAAAG 1260

AATCTGCTTT CAAAACGAAA GCTGAACCTA TAAGCAGCAG TATAAGCAAT ATGGAACTCG 1320

AATTAAATAT CCACAATTCA AAAGCACCTA AAAAGAATAG GCTGAGGAGG AAGTCTTCTA 1380

CCAGGCATAT TCATGCGCTT GAACTAGTAG TCAGTAGAAA TCTAAGCCCA CCTAATTGTA 1440

CTGAATTGCA AATTGATAGT TGTTCTAGCA GTGAAGAGAT AAAGAAAAAA AAGTACAACC 1500

AAATGCCAGT CAGGCACAGC AGAAACCTAC AACTCATGGA AGGTAAAGAA CCTGCAACTG 1560

GAGCCAAGAA GAGTAACAAG CCAAATGAAC AGACAAGTAA AAGACATGAC AGCGATACTT 1620

TCCCAGAGCT GAAGTTAACA AATGCACCTG GTTCTTTTAC TAAGTGTTCA AATACCAGTG 1680

AACTTAAAGA ATTTGTCAAT CCTAGCCTTC CAAGAGAAGA AAAAGAAGAG AACTAGAAAC 1740

AGTTAAAGTG TCTAATAATG CTGAAGACCC CAAAGATCTC ATGTTAAGTG GAGAAAGGGT 1800

TTTGCAAACT GAAAGATCTG TAGAGAGTAG CAGTATTTCA TTGGTACCTG GTACTGATTA 1860

TGGCACTCAG GAAAGTATCT CGTTACTGGA AGTTAGCACT CTAGGGAAGG CAAAAACAGA 1920

ACCAAATAAA TGTGTGAGTC AGTGTGCAGC ATTTGAAAAC CCCAAGGGAC TAATTCATGG 1980

TTGTTCCAAA GATAATAGAA ATGACACAGA AGGCTTTAAG TATCCATTGG GACATGAAGT 2040

TAACCACAGT CGGGAAACAA GCATAGAAAT GGAAGAAAGT GAACTTGATG CTCAGTATTT 2100

GCAGAATACA TTCAAGGTTT CAAAGCGCCA GTCATTTGCT CCGTTTTCAA ATCCAGGAAA 2160

TGCAGAAGAG GAATGTGCAA CATTCTCTGC CCACTCTGGG TCCTTAAAGA AACAAAGTCC 2220

AAAAGTCACT TTTGAATGTG AACAAAAGGA AGAAAATCAA GGAAAGAATG AGTCTAATAT 2280

CAAGCCTGTA CAGACAGTTA ATATCACTGC AGGCTTTCCT GTGGTTGGTC AGAAAGATAA 2340

GCCAGTTGAT AATGCCAAAT GTAGTATCAA AGGAGGCTCT AGGTTTTGTC TATCATCTCA 2400

GTTCAGAGGC AACGAAACTG GACTCATTAC TCCAAATAAA CATGGACTTT TACAAAACCC 2460

ATATCGTATA CCACCACTTT TTCCCATCAA GTCATTTGTT AAAACTAAAT GTAAGAAAAA 2520

TCTGCTAGAG GAAAACTTTG AGGAACATTC AATGTCACCT GAAAGAGAAA TGGGAAATGA 2580

GAACATTCCA AGTACAGTGA GCACAATTAG CCGTAATAAC ATTAGAGAAA ATGTTTTTAA 2640

AGAAGCCAGC TCAAGCAATA TTAATGAAGT AGGTTCCAGT ACTAATGAAG TGGGCTCCAG 2700

TATTAATGAA ATAGGTTCCA GTGATGAAAA CATTCAAGCA GAACTAGGTA GAAACAGAGG 2760

GCCAAAATTG AATGCTATGC TTAGATTAGG GGTTTTGCAA CCTGAGGTCT ATAAACAAAG 2820

TCTTCCTGGA AGTAATTGTA AGCATCCTGA AATAAAAAAG CAAGAATATG AAGAAGTAGT 2880

TCAGACTGTT AATACAGATT TCTCTCCATA TCTGATTTCA GATAACTTAG AACAGCCTAT 2940

GGGAAGTAGT CATGCATCTC AGGTTTGTTC TGAGACACCT GATGACCTGT TAGATGATGG 3000

TGAAATAAAG GAAGATACTA GTTTTGCTGA AAATGACATT AAGGAAAGTT CTGCTGTTTT 3060

TAGCAAAAGC GTCCAGAAAG GAGAGCTTAG CAGGAGTCCT AGCCCTTTCA CCCATACACA 3120

TTTGGCTCAG GGTTACCGAA GAGGGGCCAA GAAATTAGAG TCCTCAGAAG AGAACTTATC 3180

TAGTGAGGAT GAAGAGCTTC CCTGCTTCCA ACACTTGTTA TTTGGTAAAG TAAACAATAT 3240

ACCTTCTCAG TCTACTAGGC ATAGCACCGT TGCTACCGAG TGTCTGTCTA AGAACACAGA 3300

GGAGAATTTA TTATCATTGA AGAATAGCTT AAATGACTGC AGTAACCAGG TAATATTGGC 3360

AAAGGCATCT CAGGAACATC ACCTTAGTGA GGAAACAAAA TGTTCTGCTA GCTTGTTTTC 3420

TTCACAGTGC AGTGAATTGG AAGACTTGAC TGCAAATACA AACACCCAGG ATCCTTTCTT 3480

GATTGGTTCT TCCAAACAAA TGAGGCATCA GTCTGAAAGC CAGGGAGTTG GTCTGAGTGA 3540

CAAGGAATTG GTTTCAGATG ATGAAGAAAG AGGAACGGGC TTGGAAGAAA ATAATCAAGA 3600

AGAGCAAAGC ATGGATTCAA ACTTAGGTAT TGGAACCAGG TTTTTGTGTT TGCCCCAGTC 3660

TATTTATAGA AGTGAGCTAA ATGTTTATGC TTTTGGGGAG CACATTTTAC AAATTTCCAA 3720

GTATAGTTAA AGGAACTGCT TCTTAAACTT GAAACATGTT CCTCCTAAGG TGCTTTTCAT 3780

AGAAAAAAGT CCTTCACACA GCTAGGACGT CATCTTTGAC TGAATGAGCT TTAACATCCT 3840

AATTACTGGT GGACTTACTT CTGGTTTCAT TTTATAAAGC AAATCCCGGT GTCCCAAAGC 3900

AAGGAATTTA ATCATTTTGT GTGACATGAA AGTAAATCCA GTCCTGCCAA TGAGAAGAAA 3960

AAGACACAGC AAGTTGCAGC GTTTATAGTC TGCTTTTACA TCTGAACCTC TGTTTTTGTT 4020

ATTTAAGGTG AAGCAGCATC TGGGTGTGAG AGTGAAACAA GCGTCTCTGA AGACTGCTCA 4080

GGGCTATCCT CTCAGAGTGA CATTTTAACC ACTCAGGTAA AAAGCGTGTG TGTGTGTGCA 4140

CATGCGTGTG TGTGGTGTCC TTTGCATTCA GTAGTATGTA TCCCACATTC TTAGGTTTGC 4200

TGACATCATC TCTTTGAATT AATGGCACAA TTGTTTGTGG TTCATTGTC 4249

(2) INFORMATION FOR SEQ ID NO: 22:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 710 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 22:

NGNGAATGTA ATCCTAATAT TTCNCNCCNA CTTAAAAGAA TACCACTCCA ANGGCATCNC 60

AATACATCAA TCAATTGGGG AATTGGGATT TTCCCTCNCT AACATCANTG GAATAATTTC 120

ATGGCATTAA TTGCATGAAT GTGGTTAGAT TAAAAGGTGT TCATGCTAGA ACTTGTAGTT 180

CCATACTAGG TGATTTCAAT TCCTGTGCTA AAATTAATTT GTATGATATA TTNTCATTTA 240

ATGGAAAGCT TCTCAAAGTA TTTCATTTTC TTGGTACCAT TTATCGTTTT TGAAGCAGAG 300

GGATACCATG CAACATAACC TGATAAAGCT CCAGCAGGAA ATGGCTGAAC TAGAAGCTGT 360

GTTAGAACAG CATGGGAGCC AGCCTTCTAA CAGCTACCCT TCCATCATAA GTGACTCTTC 420

TCCCTTGAG GACCTGCGAA ATCCAGAACA AAGCACATCA GAAAAAGGTG TGTATTGTTG 480

GCCAAACACT GATATCTTAA GCAAAATTCT TTCCTTCCCC TTTATCTCCT TCTGAAGAGT 540

AAGGACCTAG CTCCAACATT TTATGATCCT TGCTCAGCAC ATGGGTAATT ATGGAGCCTT 600

GGTTCTTGTC CCTGCTCACA ACTAATATAC CAGTCAGAGG GACCCAAGGC AGTCATTCAT 660

GTTGTCATCT GAGATACCTA CAACAAGTAG ATGCTATGGG GAGCCCATGG 710

(2) INFORMATION FOR SEQ ID NO: 23:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 473 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 23:

CCATTGGTGC TAGCATCTGT CTGTTGCATT GCTTGTGTTT ATAAAATTCT GCCTGATATA 60

CTTGTTAAAA ACCAATTTGT GTATCATAGA TTGATGCTTT TGAAAAAAAT CAGTATTCTA 120

ACCTGAATTA TCACTATCAG AACAAAGCAG TAAAGTAGAT TTGTTTTCTC ATTCCATTTA 180

AAGCAGTATT AACTTCACAG AAAAGTAGTG AATACCCTAT AAGCCAGAAT CCAGAAGGCC 240

TTTCTGCTGA CAAGTTTGAG GTGTCTGCAG ATAGTTCTAC CAGTAAAAAT AAAGAACCAG 300

GAGTGGAAAG GTAAGAAACA TCAATGTAAA GATGCTGTGG TATCTGACAT CTTTATTTAT 360

ATTGAACTCT GATTGTTAAT TTTTTTCACC ATACTTTCTC CAGTTTTTTT GCATACAGGC 420

ATTTATACAC TTTTATTGCT CTAGGATACT TCTTTTGTTT AATCCTATAT AGG 473

(2) INFORMATION FOR SEQ ID NO: 24:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 421 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 24:

GGATAAGNTC AAGAGATATT TTGATAGGTG ATGCAGTGAT NAATTGNGAA AATTTNCTGC 60

CTGCTTTTAA TCTTCCCCCG TTCTTTCTTC CTNCCTCCCT CCCTTCCTNC CTCCCGTCCT 120

TNCCTTTCCT TTCCCTCCCT TCCNCCTTCT TTCCNTCTNT CTTTCCTTTC TTTCCTGTCT 180

ACCTTTCTTT CCTTCCTCCC TTCCTTTTCT TTTCTTTCTT TCCTTTCCTT TTCTTTCCTT 240

TCTTTCCTTT CCTTTCTTTC TTGACAGAGT CTTGCTCTGT CACTCAGGCT GGAGTGCAGT 300

GGCGTGATCT CGNCTCACTG CAACCTCTGT CTCCCAGGTT CAAGCAATTT TCCTGCCTCA 360

GCCTCCCGAG TAGCTGAGAT TACAGGCGCC AGCCACCACA CCCAGCTACT GACCTGCTTT 420

T 421

(2) INFORMATION FOR SEQ ID NO: 25:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 997 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 25:

AAACAGCTGG GAGATATGGT GCCTCAGACC AACCCCATGT TATATGTCAA CCCTGACATA 60

TTGGCAGGCA ACATGAATCC AGACTTCTAG GCTGTCATGC GGGCTCTTTT TTGCCAGTCA 120

TTTCTGATCT CTCTGACATG AGCTGTTTCA TTTATGCTTT GGCTGCCCAG CAAGTATGAT 180

TTGTCCTTTC ACAATTGGTG GCGATGGTTT TCTCCTTCCA TTTATCTTTC TAGGTCATCC 240

CCTTCTAAAT GCCCATCATT AGATGATAGG TGGTACATGC ACAGTTGCTC TGGGAGTCTT 300

CAGAATAGAA ACTACCCATC TCAAGAGGAG CTCATTAAGG TTGTTGATGT GGAGGAGCAA 360

CAGCTGGAAG AGTCTGGGCC ACACGATTTG ACGGAAACAT CTTACTTGCC AAGGCAAGAT 420

CTAGGTAATA TTTCATCTGC TGTATTGGAA CAAACACTYT GATTTTACTC TGAATCCTAC 480

ATAAAGATAT TCTGGTTAAC CAACTTTTAG ATGTACTAGT CTATCATGGA CACTTTTGTT 540

ATACTTAATT AAGCCCACTT TAGAAAAATA GCTCAAGTGT TAATCAAGGT TTACTTGAAA 600

ATTATTGAAA CTGTTAATCC ATCTATATTT TAATTAATGG TTTAACTAAT GATTTTGAGG 660

ATGWGGGAGT CKTGGTGTAC TCTAMATGTA TTATTTCAGG CCAGGCATAG TGGCTCACGC 720

CTGGTAATCC CAGTAYYCMR GAGCCCGAGG CAGGTGGAGC CAGCTGAGGT CAGGAGTTCA 780

AGACCTGTCT TGGCCAACAT GGGNGAAACC CTGTCTTCTT CTTAAAAAAN ACAAAAAAAA 840

TTAACTGGGT TGTGCTTAGG TGNATGCCCC GNATCCTAGT TNTTCTTGNG GGTTGAGGGA 900

GGAGATCACN TTGGACCCCG GAGGGGNGGG TGGGGGNGAG CAGGNCAAAA CACNGACCCA 960

GCTGGGGTGG AAGGGAAGCC CACTCNAAAA AANNTTN 997

(2) INFORMATION FOR SEQ ID NO: 26:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 639 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 26:

TTTTTAGGAA ACAAGCTACT TTGGATTTCC ACCAACACCT GTATTCATGT ACCCATTTTT 60

CTCTTAACCT AACTTTATTG GTCTTTTTAA TTCTTAACAG AGACCAGAAC TTTGTAATTC 120

AACATTCATC GTTGTGTAAA TTAAACTTCT CCCATTCCTT TCAGAGGGAA CCCCTTACCT 180

GGAATCTGGA ATCAGCCTCT TCTCTGATGA CCCTGAATCT GATCCTTCTG AAGACAGAGC 240

CCCAGAGTCA GCTCGTGTTG GCAACATACC ATCTTCAACC TCTGCATTGA AAGTTCCCCA 300

ATTGAAAGTT GCAGAATCTG CCCAGAGTCC AGCTGCTGCT CATACTACTG ATACTGCTGG 360

GTATAATGCA ATGGAAGAAA GTGTGAGCAG GGAGAAGCCA GAATTGACAG CTTCAACAGA 420

AAGGGTCAAC AAAAGAATGT CCATGGTGGT GTCTGGCCTG ACCCCAGAAG AATTTGTGAG 480

TGTATCCATA TGTATCTCCC TAATGACTAA GACTTAACAA CATTCTGGAA AGAGTTTTAT 540

GTAGGTATTG TCAATTAATA ACCTAGAGGA AGAAATCTAG AAAACAATCA CAGTTCTGTG 600

TAATTTAATT TCGATTACTA ATTTCTGAAA ATTTAGAAY 639

(2) INFORMATION FOR SEQ ID NO: 27:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 922 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 27:

NCCCNNCCCC CNAATCTGAA ATGGGGGTAA CCCCCCCCCA ACCGANACNT GGGTNGCNTA 60

GAGANTTTAA TGGCCCNTTC TGAGGNACAN AAGCTTAAGC CAGGNGACGT GGANCNATGN 120

GTTGTTTNTT GTTTGGTTAC CTCCAGCCTG GGTGACAGAG CAAGACTCTG TCTAAAAAAA 180

AAAAAAAAAA AAATCGACTT TAAATAGTTC CAGGACACGT GTAGAACGTG CAGGATTGCT 240

ACGTAGGTAA ACATATGCCA TGGTGGGATA ACTAGTATTC TGAGCTGTGT GCTAGAGGTA 300

ACTCATGATA ATGGAATATT TGATTTAATT TCAGATGCTC GTGTACAAGT TTGCCAGAAA 360

ACACCACATC ACTTTAACTA ATCTAATTAC TGAAGAGACT ACTCATGTTG TTATGAAAAC 420

AGGTATACCA AGAACCTTTA CAGAATACCT TGCATCTGCT GCATAAAACC ACATGAGGCG 480

AGGCACGGTG GCGCATGCCT GTAATCGCAG CACTTTGGGA GGCCGAGGCG GGCAGATCAC 540

GAGATTAGGA GATCGAGACC ATCCTGGCCA GCATGGTGAA ACCCCGTCTC TACTANNAAA 600

TGGNAAAATT ANCTGGGTGT GGTCGCGTGC NCCTGTAGTC CCAGCTACTC GTGAGGCTGA 660

GGCAGGAGAA TCACTTGAAC CGGGGAAATG GAGGTTTCAG TGAGCAGAGA TCATNCCCCT 720

NCATTCCAGC CTGGCGACAG AGCAAGGCTC CGTCNCCNAA AAAATAAAAA AAAACGTGAA 780

CAAATAAGAA TATTTGTTGA GCATAGCATG GATGATAGTC TTCTAATAGT CAATCAATTA 840

CTTTATGAAA GACAAATAAT AGTTTTGCTG CTTCCTTACC TCCTTTTGTT TTGGGTTAAG 900

ATTTGGAGTG TGGGCCAGGC AC 922

(2) INFORMATION FOR SEQ ID NO: 28:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 867 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 28:

GATCTATAGC TAGCCTTGGC GTCTAGAAGA TGGGTGTTGA GAAGAGGGAG TGGAAAGATA 60

TTTCCTCTGG TCTTAACTTC ATATCAGCCT CCCCTAGACT TCCAAATATC CATACCTGCT 120

GGTTATAATT AGTGGTGTTT TCAGCCTCTG ATTCTGTCAC CAGGGGTTTT AGAATCATAA 180

ATCCAGATTG ATCTTGGGAG TGTAAAAAAC TGAGGCTCTT TAGCTTCTTA GGACAGCACT 240

TCCTGATTTT GTTTTCAACT TCTAATCCTT TGAGTGTTTT TCATTCTGCA GATGCTGAGT 300

TTGTGTGTGA ACGGACACTG AAATATTTTC TAGGAATTGC GGGAGGAAAA TGGGTAGTTA 360

GCTATTTCTG TAAGTATAAT ACTATTTCTC CCCTCCTCCC TTTAACACCT CAGAATTGCA 420

TTTTTACACC TAACATTTAA CACCTAAGGT TTTTGCTGAT GCTGAGTCTG AGTTACCAAA 480

AGGTCTTTAA ATTGTAATAC TAAACTACTT TTATCTTTAA TATCACTTTG TTCAAGATAA 540

GCTGGTGATG CTGGGAAAAT GGGTCTCTTT TATAACTAAT AGGACCTAAT CTGCTCCTAG 600

CAATGTTAGC ATATGAGCTA GGGATTTATT TAATAGTCGG CAGGAATCCA TGTGCARCAG 660

NCAAACTTAT AATGTTTAAA TTAAACATCA ACTCTGTCTC CAGAAGGAAA CTGCTGCTAC 720

AAGCCTTATT AAAGGGCTGT GGCTTTAGAG GGAAGGACCT CTCCTCTGTC ATTCTTCCTG 780

TGCTCTTTTG TGAATCGCTG ACCTCTCTAT CTCCGTGAAA AGAGCACGTT CTTCTGCTGT 840

ATGTAACCTG TCTTTTCTAT GATCTCT 867

(2) INFORMATION FOR SEQ ID NO: 29:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 561 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 29:

NAAAAACGGG GNNGGGANTG GGCCTTAAAN CCAAAGGGCN AACTCCCCAA CCATTNAAAA 60

ANTGACNGGG GATTATTAAA ANCGGCGGGA AACATTTCAC NGCCCAACTA ATATTGTTAA 120

ATTAAAACCA CCACCNCTGC NCCAAGGAGG GAAACTGCTG CTACAAGCCT TATTAAAGGG 180

CTGTGGCTTT AGAGGGAAGG ACCTCTCCTC TGTCATTCTT CCTGTGCTCT TTTGTGAATC 240

GCTGACCTCT CTATGTCCGT GAAAAGAGCA CGTTCTTCGT CTGTATGTAA CCTGTCTTTT 300

CTATGATCTC TTTAGGGGTG ACCCAGTCTA TTAAAGAAAG AAAAATGCTG AATGAGGTAA 360

GTACTTGATG TTACAAACTA ACCAGAGATA TTCATTCAGT CATATAGTTA AAAATGTATT 420

TGCTTCCTTC CATCAATGCA CCACTTTCCT TAACAATGCA CAAATTTTCC ATGATAATGA 480

GGATCATCAA GAATTATGCA GGCCTGCACT GTGGCTCATA CCTATAATCC CAGCGCTTTG 540

GGAGGCTGAG GCGCTTGGAT C 561

(2) INFORMATION FOR SEQ ID NO: 30:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 567 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 30:

AATTTTTTGT ATTTTTAGTA GAGATGAGGT TCACCATGTT GGTCTAGATC TGGTGTCGAA 60

CGTCCTGACC TCAAGTGATC TGCCAGCCTC AGTCTCCCAA AGTGCTAGGA TTACAGGGGT 120

GAGCCACTGC GCCTGGCCTG AATGCCTAAA ATATGACGTG TCTGCTCCAC TTCCATTGAA 180

GGAAGCTTCT CTTTCTCTTA TCCTGATGGG TTGTGTTTGG TTTCTTTCAG CATGATTTTG 240

AAGTCAGAGG AGATGTGGTC AATGGAAGAA ACCACCAAGG TCCAAAGCGA GCAAGAGAAT 300

CCCAGGACAG AAAGGTAAAG CTCCCTCCCT CAAGTTGACA AAAATCTCAC CCCACCACTC 360

TGTATTCCAC TCCCCTTTGC AGAGATGGGC CGCTTCATTT TGTAAGACTT ATTACATACA 420

TACACAGTGC TAGATACTTT CACACAGGTT CTTTTTTCAC TCTTCCATCC CAACCACATA 480

AATAAGTATT GTCTCTACTT TATGAATGAT AAAACTAAGA GATTTAGAGA GGCTGTGTAA 540

TTTGGATTCC CGTCTCGGGT TCAGATC 567

(2) INFORMATION FOR SEQ ID NO: 31:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 633 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 31:

TTGGCCTGAT TGGTGACAAA AGTGAGATGC TCAGTCCTTG AATGACAAAG AATGCCTGTA 60

GAGTTGCAGG TCCAACTACA TATGCACTTC AAGAAGATCT TCTGAAATCT AGTAGTGTTC 120

TGGACATTGG ACTGCTTGTC CCTGGGAAGT AGCAGCAGAA ATGATCGGTG GTGAACAGAA 180

GAAAAAGAAA AGCTCTTCCT TTTTGAAAGT CTGTTTTTTG AATAAAAGCC AATATTCTTT 240

TATAACTAGA TTTTCCTTCT CTCCATTCCC CTGTCCCTCT CTCTTCCTCT CTTCTTCCAG 300

ATCTTCAGGG GGCTAGAAAT CTGTTGCTAT GGGCCCTTCA CCAACATGCC CACAGGTAAG 360

AGCCTGGGAG AACCCCAGAG TTCCAGCACC AGCCTTTGTC TTACATAGTG GAGTATTATA 420

AGCAAGGTCC CACGATGGGG GTTCCTCAGA TTGCTGAAAT GTTCTAGAGG CTATTCTATT 480

TCTCTACCAC TCTCCAAACA AAACAGCACC TAAATGTTAT CCTATGGCAA AAAAAAACTA 540

TACCTTGTCC CCCTTCTCAA GAGCATGAAG GTGGTTAATA GTTAGGATTC AGTATGTTAT 600

GTGTTCAGAT GGCGTTGAGC TGCTGTTAGT GCC 633

(2) INFORMATION FOR SEQ ID NO: 32:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 470 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 32:

TTTGAGAGAC TATCAAACCT TATACCAAGT GGCCTTATGG AGACTGATAA CCAGAGTACA 60

TGGCATATCA GTGGCAAATT GACTTAAAAT CCATACCCCT ACTATTTTAA GACCATTGTC 120

CTTTGGAGCA GAGAGACAGA CTCTCCCATT GAGAGGTCTT GCTATAAGCC TTCATCCGGA 180

GAGTGTAGGG TAGAGGGCCT GGGTTAAGTA TGCAGATTAC TGCAGTGATT TTACATGTAA 240

ATGTCCATTT TAGATCAACT GGAATGGATG GTACAGCTGT GTGGTGCTTC TGTGGTGAAG 300

GAGCTTTCAT CATTCACCCT TGGCACAGTA AGTATTGGGT GCCCTGTCAG TGTGGGAGGA 360

CACAATATTC TCTCCTGTGA GCAAGACTGG CACCTGTCAG TCCCTATGGA TGCCCCTACT 420

GTAGCCTCAG AAGTCTTCTC TGCCCACATA CCTGTGCCAA AAGACTCCAT 470

(2) INFORMATION FOR SEQ ID NO: 33:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 517 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 33:

GGTGGTACGT GTCTGTAGTT CCAGCTACTT GGGAGGCTGA GATGGAAGGA TTGCTTGAGC 60

CCAGGAGGCA GAGGTGGNAN NTTACGCTGA GATCACACCA CTGCACTCCA GCCTGGGTGA 120

CAGAGCAAGA CCCTGTCTCA AAAACAAACA AAAAAAATGA TGAAGTGACA GTTCCAGTAG 180

TCCTACTTTG ACACTTTGAA TGCTCTTTCC TTCCTGGGGA TCCAGGGTGT CCACCCAATT 240

GTGGTTGTGC AGCCAGATGC CTGGACAGAG GACAATGGCT TCCATGGTAA GGTGCCTCGC 300

ATGTACCTGT GCTATTAGTG GGGTCCTTGT GCATGGGTTT GGTTTATCAC TCATTACCTG 360

GTGCTTGAGT AGCACAGTTC TTGGCACATT TTTAAATATT TGTTGAATGA ATGGCTAAAA 420

TGTCTTTTTG ATGTTTTTAT TGTTATTTGT TTTATATTGT AAAAGTAATA CATGAACTGT 480

TTCCATGGGG TGGGAGTAAG ATATGAATGT TCATCAC 517

(2) INFORMATION FOR SEQ ID NO: 34:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 434 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 34:

CAGTAATCCT NAGAACTCAT ACGACCGGGC CCCTGGAGTC GNTGNTTNGA GCCTAGTCCN 60

GGAGAATGAA TTGACACTAA TCTCTGCTTG TGTTCTCTGT CTCCAGCAAT TGGGCAGATG 120

TGTGAGGCAC CTGTGGTGAC CCGAGAGTGG GTGTTGGACA GTGTAGCACT CTACCAGTGC 180

CAGGAGCTGG ACACCTACCT GATACCCCAG ATCCCCCACA GCCACTACTG ACTGCAGCCA 240

GCCACAGGTA CAGAGCCACA GGACCCCAAG AATGAGCTTA CAAAGTGGCC TTTCCAGGCC 300

CTGGGAGCTC CTCTCACTCT TCAGTCCTTC TACTGTCCTG GCTACTAAAT ATTTTATGTA 360

CATCAGCCTG AAAAGGACTT CTGGCTATGC AAGGGTCCCT TAAAGATTTT CTGCTTGAAG 420

TCTCCCTTGG AAAT 434

(2) INFORMATION FOR SEQ ID NO: 35:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 35:

GATAAATTAA AACTGCGACT GCGCGGCGTG 30

(2) INFORMATION FOR SEQ ID NO: 36:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 36:

GTAGTAGAGT CCCGGGAAAG GGACAGGGGG 30

(2) INFORMATION FOR SEQ ID NO: 37:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 37:

ATATATATAT GTTTTTCTAA TGTGTTAAAG 30

(2) INFORMATION FOR SEQ ID NO: 38:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 38:

GTAAGTCAGC ACAAGAGTGT ATTAATTTGG 30

(2) INFORMATION FOR SEQ ID NO: 39:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 39:

TTTCTTTTTC TCCCCCCCCT ACCCTGCTAG 30

(2) INFORMATION FOR SEQ ID NO: 40:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 40:

GTAAGTTTGA ATGTGTTATG TGGCTCCATT 30

(2) INFORMATION FOR SEQ ID NO: 41:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 41:

AGCTACTTTT TTTTTTTTTT TTTGAGACAG 30

(2) INFORMATION FOR SEQ ID NO: 42:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 42:

GTAAGTGCAC ACCACCATAT CCAGCTAAAT 30

(2) INFORMATION FOR SEQ ID NO: 43:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 43:

AATTGTTCTT TCTTTCTTTA TAATTTATAG 30

(2) INFORMATION FOR SEQ ID NO: 44:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 44:

GTATATAATT TGGTAATGAT GCTAGGTTGG 30

(2) INFORMATION FOR SEQ ID NO: 45:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 45:

GAGTGTGTTT CTCAAACAAT TTAATTTCAG 30

(2) INFORMATION FOR SEQ ID NO: 46:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 46:

GTAAGTGTTG AATATCCCAA GAATGACACT 30

(2) INFORMATION FOR SEQ ID NO: 47:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 47:

AAACATAATG TTTTCCCTTG TATTTTACAG 30

(2) INFORMATION FOR SEQ ID NO: 48:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 48:

GTAAAACCAT TTGTTTTCTT CTTCTTCTTC 30

(2) INFORMATION FOR SEQ ID NO: 49:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 49:

TGCTTGACTG TTCTTTACCA TACTGTTTAG 30

(2) INFORMATION FOR SEQ ID NO: 50:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 50:

GTAAGGGTCT CAGGTTTTTT AAGTATTTAA 30

(2) INFORMATION FOR SEQ ID NO: 51:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 51:

TGATTTATTT TTTGGGGGGA AATTTTTTAG 30

(2) INFORMATION FOR SEQ ID NO: 52:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 52:

GTGAGTCAAA GAGAACCTTT GTCTATGAAG 30

(2) INFORMATION FOR SEQ ID NO: 53:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 53:

TCTTATTAGG ACTCTGTCTT TTCCCTATAG 30

(2) INFORMATION FOR SEQ ID NO: 54:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 54:

GTAATGGCAA AGTTTGCCAA CTTAACAGGC 30

(2) INFORMATION FOR SEQ ID NO: 55:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 55:

GAGTACCTTG TTATTTTTGT ATATTTTCAG 30

(2) INFORMATION FOR SEQ ID NO: 56:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 56:

GTATTGGAAC CAGGTTTTTG TGTTTGCCCC 30

(2) INFORMATION FOR SEQ ID NO: 57:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 57:

ACATCTGAAC CTCTGTTTTT GTTATTTAAG 30

(2) INFORMATION FOR SEQ ID NO: 58:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 58:

AGGTAAAAAG CGTGTGTGTG TGTGCACATG 30

(2) INFORMATION FOR SEQ ID NO: 59:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 59:

CATTTTCTTG GTACCATTTA TCGTTTTTGA 30

(2) INFORMATION FOR SEQ ID NO: 60:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 60:

GTGTGTATTG TTGGCCAAAC ACTGATATCT 30

(2) INFORMATION FOR SEQ ID NO: 61:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 61:

AGTAGATTTG TTTTCTCATT CCATTTAAAG 30

(2) INFORMATION FOR SEQ ID NO: 62:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 62:

GTAAGAAACA TCAATGTAAA GATGCTGTGG 30

(2) INFORMATION FOR SEQ ID NO: 63:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 63:

ATGGTTTTCT CCTTCCATTT ATCTTTCTAG 30

(2) INFORMATION FOR SEQ ID NO: 64:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 64:

GTAATATTTC ATCTGCTGTA TTGGAACAAA 30

(2) INFORMATION FOR SEQ ID NO: 65:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 65:

TGTAAATTAA ACTTCTCCCA TTCCTTTCAG 30

(2) INFORMATION FOR SEQ ID NO: 66:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 66:

GTGAGTGTAT CCATATGTAT CTCCCTAATG 30

(2) INFORMATION FOR SEQ ID NO: 67:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 67:

ATGATAATGG AATATTTGAT TTAATTTCAG 30

(2) INFORMATION FOR SEQ ID NO: 68:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 68:

GTATACCAAG AACCTTTACA GAATACCTTG 30

(2) INFORMATION FOR SEQ ID NO: 69:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 69:

CTAATCCTTT GAGTGTTTTT CATTCTGCAG 30

(2) INFORMATION FOR SEQ ID NO: 70:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 70:

GTAAGTATAA TACTATTTCT CCCCTCCTCC 30

(2) INFORMATION FOR SEQ ID NO: 71:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 71:

TGTAACCTGT CTTTTCTATG ATCTCTTTAG 30

(2) INFORMATION FOR SEQ ID NO: 72:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 72:

GTAAGTACTT GATGTTACAA ACTAACCAGA 30

(2) INFORMATION FOR SEQ ID NO: 73:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 73:

TCCTGATGGG TTGTGTTTGG TTTCTTTCAG 30

(2) INFORMATION FOR SEQ ID NO: 74:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 74:

GTAAAGCTCC CTCCCTCAAG TTGACAAAAA 30

(2) INFORMATION FOR SEQ ID NO: 75:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 75:

CTGTCCCTCT CTCTTCCTCT CTTCTTCCAG 30

(2) INFORMATION FOR SEQ ID NO: 76:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 76:

GTAAGAGCCT GGGAGAACCC CAGAGTTCCA 30

(2) INFORMATION FOR SEQ ID NO: 77:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 77:

AGTGATTTTA CATGTAAATG TCCATTTTAG 30

(2) INFORMATION FOR SEQ ID NO: 78:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 78:

GTAAGTATTG GGTGCCCTGT CAGTGTGGGA 30

(2) INFORMATION FOR SEQ ID NO: 79:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 79:

TTGAATGCTC TTTCCTTCCT GGGGATCCAG 30

(2) INFORMATION FOR SEQ ID NO: 80:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 80:

GTAAGGTGCC TCGCATGTAC CTGTGCTATT 30

(2) INFORMATION FOR SEQ ID NO: 81:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 81:

CTAATCTCTG CTTGTGTTCT CTGTCTCCAG 30

(2) INFORMATION FOR SEQ ID NO: 82:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 42 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 82:

Cys Pro Ile Cys Leu Glu Leu Ile Lys Glu Pro Val Ser Thr Lys Cys
1 5 10 15

Asp His Ile Phe Cys Lys Phe Cys Met Leu Lys Leu Leu Asn Gln Lys
20 25 30

Lys Gly Pro Ser Gln Cys Pro Leu Cys Lys
35 40

(2) INFORMATION FOR SEQ ID NO: 83:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 45 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide

(iii) HYPOTHETICAL: NO

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 83:

Cys Pro Ile Cys Leu Glu Leu Leu Lys Glu Pro Val Ser Ala Asp Cys
1 5 10 15

Asn His Ser Phe Cys Arg Ala Cys Ile Thr Leu Asn Tyr Glu Ser Asn
20 25 30

Arg Asn Thr Asp Gly Lys Gly Asn Cys Pro Val Cys Arg
35 40 45

(2) INFORMATION FOR SEQ ID NO: 84:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 41 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide

(iii) HYPOTHETICAL: NO

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 84:

Cys Pro Ile Cys Leu Asp Met Leu Lys Asn Thr Met Thr Thr Lys Glu
1 5 10 15

Cys Leu His Arg Phe Cys Ser Asp Cys Ile Val Thr Ala Leu Arg Ser
20 25 30

Gly Asn Lys Glu Cys Pro Thr Cys Arg
35 40

(2) INFORMATION FOR SEQ ID NO: 85:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 42 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide

(iii) HYPOTHETICAL: NO

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 85:

Cys Pro Val Cys Leu Gln Tyr Phe Ala Glu Pro Met Met Leu Asp Cys
1 5 10 15

Gly His Asn Ile Cys Cys Ala Cys Leu Ala Arg Cys Trp Gly Thr Ala
20 25 30

Cys Thr Asn Val Ser Cys Pro Gln Cys Arg
35 40

「染色体17研究会」によって決定されたBRCA1近辺の遺伝子座の順序を示す図である。図1はFain,1992から再現した。It is a figure which shows the order of the gene locus near BRCA1 determined by "Chromosome 17 study group". Figure 1 is reproduced from Fain, 1992. Mfd15-Mfd188領域部分を画定するYACの模式的地図である。It is a schematic map of YAC demarcating Mfd15-Mfd188 area | region part. BRCA1領域中のSTS、P1およびBACの模式的地図である。It is a schematic map of STS, P1 and BAC in the BRCA1 region. ヒト染色体17の模式的地図である。BRCA1を含む直接関係する領域は、2つの以前に同定された遺伝子、CA125およびRNU2の相対的な位置を示すために拡大されており、BRCA1はマーカーD17S855にわたって広がっている。3 is a schematic map of human chromosome 17. The directly related region containing BRCA1 has been expanded to show the relative position of the two previously identified genes, CA125 and RNU2, and BRCA1 extends across the marker D17S855. Smith-Waterman配列に最もよく記録される3つの他の亜鉛-フィンガードメインを有するBRCA1亜鉛-フィンガードメインの配列を示している。RPT1は、マウスにおいてIL-2受容体の負の調節因子であるようである蛋白質をコードしている。RIN1は、亜鉛-フィンガーに関連する環(RING)-フィンガーモチーフを含むDNA-結合蛋白質をコードしている。RFP1は、RETオンコジーン産物のN-末端ドメインである予想転写因子をコードしている。下線部分は、亜鉛イオン結合ポケットを形成するシステインおよび1つのヒスチジンの位置を示すC3HC4共通亜鉛-フィンガー配列を含む。The sequence of the BRCA1 zinc-finger domain with the three other zinc-finger domains best recorded in the Smith-Waterman sequence is shown. RPT1 encodes a protein that appears to be a negative regulator of the IL-2 receptor in mice. RIN1 encodes a DNA-binding protein that contains a ring-finger motif associated with a zinc-finger. RFP1 encodes a predicted transcription factor that is the N-terminal domain of the RET oncogene product. The underlined portion contains a C3HC4 common zinc-finger sequence indicating the position of cysteine and one histidine that form the zinc ion binding pocket. 別のスプライシングによって生成したイントロンの位置、およびBRCA1 mRNAの変形を示すBRCA1 mRNAの図である。イントロン位置は「黒塗り三角」によって示し、エキソンはcDNAを表す線の下側に番号付けしている。最上段のcDNAは、BRCA1のペプチド配列を作製するのに用いる組成である。cDNAクローンまたはハイブリッド選抜クローンとして同定した別の形態を下側に示す。FIG. 5 is a BRCA1 mRNA diagram showing the location of introns generated by alternative splicing and the BRCA1 mRNA variant. Intron positions are indicated by “black triangles” and exons are numbered below the line representing the cDNA. The uppermost cDNA is a composition used for preparing the peptide sequence of BRCA1. Another form identified as a cDNA clone or hybrid selected clone is shown below. BRCA1の組織発現パターンを示している。ブロットはClontech社から得、それは示した組織からのRNAを含む。ハイブリダイゼーション条件は製造業者によって推奨されたもので、BRCA1のヌクレオチド位3631〜3930よりなるプローブを使用している。乳房および卵巣の両方がヘテロ接合体組織であり、関連する上皮細胞のパーセンテージが変動し得ることは注記しておく。分子量マーカーはkbである。The tissue expression pattern of BRCA1 is shown. The blot is obtained from Clontech, which contains RNA from the indicated tissues. Hybridization conditions were recommended by the manufacturer, and a probe consisting of nucleotide positions 3631 to 930 of BRCA1 was used. Note that both the breast and ovary are heterozygous tissues and the percentage of associated epithelial cells can vary. The molecular weight marker is kb. 別のスプライシングによって生成したイントロンの位置およびBRCA1 mRNAの変形を示すBRCA1の5'非翻訳領域+翻訳領域の開始点の図である。イントロンの位置を破線で示す。6つの別のスプライシング形態を示す。FIG. 4 is a diagram of the BRCA1 5 ′ untranslated region + translated region start point showing the location of the intron generated by alternative splicing and the deformation of BRCA1 mRNA. The position of the intron is indicated by a broken line. Six alternative splicing configurations are shown. Kindred2082におけるナンセンス突然変異を示している。Pとは、元来スクリーニングした個人を示し、bおよびcはハロタイプキャリアーで、a、d、e、fおよびgはBRCA1ハロタイプを運んでいない。CからTへの突然変異は終止コドンを生じ、制限酵素AvrIIの部位を生成する。PCR増幅産物はこの酵素で切断される。キャリアーは、該部位についてヘテロ接合体であり、それ故、3つのバンドを示す。非-キャリアーは切断されないまま残る。The nonsense mutation in Kindred2082 is shown. P indicates the originally screened individual, b and c are halotype carriers, and a, d, e, f and g do not carry the BRCA1 halotype. The C to T mutation results in a stop codon and creates a site for the restriction enzyme AvrII. The PCR amplification product is cleaved with this enzyme. The carrier is heterozygous for the site and therefore exhibits three bands. Non-carriers remain uncut. BRCA1家系における突然変異および共分離分析を示している。キャリアー個人は家系図中の「黒塗り丸」および「黒塗り四角」として示す。Kindred1910におけるフレームシフト突然変異。最初の3レーンは対照、非キャリアー試料である。1-3で標識したレーンはキャリアー個人からの配列を含む。レーン4には、BRCA1突然変異を運んでいない家系構成員からのDNAが含まれる。菱形を用いて家系の同定を防いでいる。さらなるCから生じたフレームシフトは1、2および3で標識したレーンで明らかである。Figure 2 shows mutation and cosegregation analysis in a BRCA1 family. Individual carriers are shown as “black circles” and “black squares” in the family tree. Frameshift mutation in Kindred1910. The first three lanes are control, non-carrier samples. Lanes labeled with 1-3 contain sequences from carrier individuals. Lane 4 contains DNA from a family member who does not carry the BRCA1 mutation. The rhombus is used to prevent the family from being identified. Further frame shifts resulting from C are evident in the lanes labeled 1, 2 and 3. BRCA1家系における突然変異および共分離分析を示している。キャリアー個人は、家系図中の「黒塗り丸」および「黒塗り四角」として示す。推論する調節突然変異がKindred2035にある。2の異なる多形(PM1およびPM7)のキャリアーおよび非キャリアーのASO分析を生殖細胞系におけるヘテロ接合性について検査し、リンパ球mRNAのヘテロ接合性と比較した。各パネルの最上段の2列はゲノムDNAから増幅したPCR産物を含み、下の2列はcDNAから増幅したPCR産物を含んでいる。「A」および「G」はASOによって検出した2つの対立遺伝子である。暗いスポットは、特定の対立遺伝子が試料中に存在することを示している。PM7の最初の3レーンは、一般集団の3種の遺伝子型を表している。Figure 2 shows mutation and cosegregation analysis in a BRCA1 family. Individual carriers are shown as “black circles” and “black squares” in the family tree. There are regulatory mutations inferred in Kindred 2035. Carrier and non-carrier ASO analyzes of two different polymorphs (PM1 and PM7) were examined for heterozygosity in the germline and compared to lymphocyte mRNA heterozygosity. The top two rows of each panel contain PCR products amplified from genomic DNA, and the bottom two rows contain PCR products amplified from cDNA. “A” and “G” are the two alleles detected by ASO. A dark spot indicates that a particular allele is present in the sample. The first three lanes of PM7 represent the three genotypes of the general population. BRCA1のゲノム配列を示している。より下のケースの文字はイントロン配列を示す一方、より上のケースの文字はエキソン配列を示す。イントロン内の不明瞭な間隔は、vvvvvvvvvvvvvvで示した。知られている多形部位は下線および肉付太字タイプとして示す。The genomic sequence of BRCA1 is shown. Lower case letters indicate intron sequences, while upper case letters indicate exon sequences. The unclear spacing within the intron is indicated by vvvvvvvvvvvvv. Known polymorphic sites are shown as underlined and meat bold type. BRCA1のゲノム配列を示している。より下のケースの文字はイントロン配列を示す一方、より上のケースの文字はエキソン配列を示す。イントロン内の不明瞭な間隔は、vvvvvvvvvvvvvvで示した。知られている多形部位は下線および肉付太字タイプとして示す。The genomic sequence of BRCA1 is shown. Lower case letters indicate intron sequences, while upper case letters indicate exon sequences. The unclear spacing within the intron is indicated by vvvvvvvvvvvvv. Known polymorphic sites are shown as underlined and meat bold type. BRCA1のゲノム配列を示している。より下のケースの文字はイントロン配列を示す一方、より上のケースの文字はエキソン配列を示す。イントロン内の不明瞭な間隔は、vvvvvvvvvvvvvvで示した。知られている多形部位は下線および肉付太字タイプとして示す。The genomic sequence of BRCA1 is shown. Lower case letters indicate intron sequences, while upper case letters indicate exon sequences. The unclear spacing within the intron is indicated by vvvvvvvvvvvvv. Known polymorphic sites are shown as underlined and meat bold type. BRCA1のゲノム配列を示している。より下のケースの文字はイントロン配列を示す一方、より上のケースの文字はエキソン配列を示す。イントロン内の不明瞭な間隔は、vvvvvvvvvvvvvvで示した。知られている多形部位は下線および肉付太字タイプとして示す。The genomic sequence of BRCA1 is shown. Lower case letters indicate intron sequences, while upper case letters indicate exon sequences. The unclear spacing within the intron is indicated by vvvvvvvvvvvvv. Known polymorphic sites are shown as underlined and meat bold type. BRCA1のゲノム配列を示している。より下のケースの文字はイントロン配列を示す一方、より上のケースの文字はエキソン配列を示す。イントロン内の不明瞭な間隔は、vvvvvvvvvvvvvvで示した。知られている多形部位は下線および肉付太字タイプとして示す。The genomic sequence of BRCA1 is shown. Lower case letters indicate intron sequences, while upper case letters indicate exon sequences. The unclear spacing within the intron is indicated by vvvvvvvvvvvvv. Known polymorphic sites are shown as underlined and meat bold type. BRCA1のゲノム配列を示している。より下のケースの文字はイントロン配列を示す一方、より上のケースの文字はエキソン配列を示す。イントロン内の不明瞭な間隔は、vvvvvvvvvvvvvvで示した。知られている多形部位は下線および肉付太字タイプとして示す。The genomic sequence of BRCA1 is shown. Lower case letters indicate intron sequences, while upper case letters indicate exon sequences. The unclear spacing within the intron is indicated by vvvvvvvvvvvvv. Known polymorphic sites are shown as underlined and meat bold type. BRCA1のゲノム配列を示している。より下のケースの文字はイントロン配列を示す一方、より上のケースの文字はエキソン配列を示す。イントロン内の不明瞭な間隔は、vvvvvvvvvvvvvvで示した。知られている多形部位は下線および肉付太字タイプとして示す。The genomic sequence of BRCA1 is shown. Lower case letters indicate intron sequences, while upper case letters indicate exon sequences. The unclear spacing within the intron is indicated by vvvvvvvvvvvvv. Known polymorphic sites are shown as underlined and meat bold type. BRCA1のゲノム配列を示している。より下のケースの文字はイントロン配列を示す一方、より上のケースの文字はエキソン配列を示す。イントロン内の不明瞭な間隔は、vvvvvvvvvvvvvvで示した。知られている多形部位は下線および肉付太字タイプとして示す。The genomic sequence of BRCA1 is shown. Lower case letters indicate intron sequences, while upper case letters indicate exon sequences. The unclear spacing within the intron is indicated by vvvvvvvvvvvvv. Known polymorphic sites are shown as underlined and meat bold type.

Claims (12)

45℃を超える温度および200mM未満の塩濃度のストリンジェントなハイブリダイゼーション条件下、ヒト染色体17q21上の遺伝子マーカーD17S855に広がり、N−末端アミノ酸がメチオニンであって、C−末端アミノ酸がチロシンである合計1863個のアミノ酸をコードする遺伝子と規定されるBRCA1遺伝子から由来するBRCA1のcDNAまたはmRNAにハイブリダイズする単離核酸。 A total that extends to the genetic marker D17S855 on human chromosome 17q21 under stringent hybridization conditions at temperatures above 45 ° C. and salt concentrations below 200 mM, the N-terminal amino acid is methionine and the C-terminal amino acid is tyrosine An isolated nucleic acid that hybridizes to a BRCA1 cDNA or mRNA derived from a BRCA1 gene defined as a gene encoding 1863 amino acids. 配列番号:1のヌクレオチド位置3631ないし3930の配列を含むプローブにハイブリダイズする請求項1記載の単離核酸。 The isolated nucleic acid of claim 1 that hybridizes to a probe comprising the sequence of nucleotide positions 3631 to 3930 of SEQ ID NO: 1. 45℃を超える温度および200mM未満の塩濃度のストリンジェントなハイブリダイゼーション条件下、配列番号:35、38、41、42、47、57、62、66、67、72および81よりなる群から選択されるヌクレオチド配列よりなるプローブにハイブリダイズする請求項1記載の単離核酸。 Selected from the group consisting of SEQ ID NOs: 35, 38, 41, 42, 47, 57, 62, 66, 67, 72 and 81 under stringent hybridization conditions at temperatures above 45 ° C. and salt concentrations below 200 mM The isolated nucleic acid according to claim 1, which hybridizes to a probe comprising a nucleotide sequence. 配列番号:35、38、41、42、47、57、62、66、67、72および81よりなる群から選択されるヌクレオチド配列を含む請求項1または3記載の単離核酸。 The isolated nucleic acid according to claim 1 or 3, comprising a nucleotide sequence selected from the group consisting of SEQ ID NOs: 35, 38, 41, 42, 47, 57, 62, 66, 67, 72 and 81. BRCA1、その対立遺伝子変異体または天然に発生するBRCA1をコードする請求項1、3または4記載の単離核酸。 5. The isolated nucleic acid of claim 1, 3 or 4 encoding BRCA1, an allelic variant thereof or a naturally occurring BRCA1. 該BRCA1変異体がカルボキシ末端にて切形されたBRCA1蛋白質である請求項5記載の単離核酸。 6. The isolated nucleic acid according to claim 5, wherein the BRCA1 variant is a BRCA1 protein truncated at the carboxy terminus. 組織試料中の請求項6に規定されたBRCA1突然変異体をコードする突然変異体BRCA1ヌクレオチド配列を同定するための方法であって、
(a)該組織試料中のBRCA1遺伝子のコード配列の少なくとも一部分を増幅し、次いで、
(b)BRCA1遺伝子が、フレームシフト突然変異または早期停止コドンにより引き起こされた短いアミノ酸配列をコードするかを決定することを含むことを特徴とする該方法。
A method for identifying a mutant BRCA1 nucleotide sequence encoding a BRCA1 mutant as defined in claim 6 in a tissue sample comprising:
(a) amplifying at least a portion of the coding sequence of the BRCA1 gene in the tissue sample;
(B) determining whether the BRCA1 gene encodes a short amino acid sequence caused by a frameshift mutation or an early stop codon.
ヒトから由来する組織試料中の乳癌および卵巣癌についての病気素因を決定する方法であって、該組織試料中の請求項1記載のBRCA1遺伝子における生殖細胞系の変化が存在するかを決定し、ここに、該変化は、変化した遺伝子にカルボキシ末端で切形された蛋白質をコードさせ、該変化の存在は、癌に対する該病気素因を示すことを含むことを特徴とする該方法。 A method for determining a predisposition for breast cancer and ovarian cancer in a tissue sample derived from a human, comprising determining whether there is a germline change in the BRCA1 gene of claim 1 in the tissue sample, Wherein the change comprises encoding a protein truncated at the carboxy terminus of the altered gene, and the presence of the change comprises indicating the predisposition to cancer. 該BRCA1遺伝子が、配列番号:1のヌクレオチド位置3631ないし3930の配列を含むプローブにハイブリダイズすることを特徴とする請求項8記載の方法。 9. The method of claim 8, wherein the BRCA1 gene hybridizes to a probe comprising a sequence at nucleotide positions 3631 to 3930 of SEQ ID NO: 1. 該変化が、フレームシフト突然変異または早期停止コドンよりなる群から選択されることを特徴とする請求項8記載の方法。 9. The method of claim 8, wherein the change is selected from the group consisting of a frameshift mutation or an early stop codon. 該変化が、蛋白質先端切断アッセイにより検出できることを特徴とする請求項8または10記載の方法。 11. The method according to claim 8 or 10, wherein the change can be detected by a protein tip cleavage assay. 該決定工程が、
(a)BRCA1遺伝子のコード配列の少なくとも一部分を増幅させ、
(b)増幅したDNAの配列を決定し、次いで、
(c)増幅したDNAによりコードされるアミノ酸残基の合計数または増幅したDNAによりコードされるポリペプチドのサイズを決定し、
ここに、該BRCA1遺伝子が切形した蛋白質をコードするという結果は、癌に対する該病気素因を示すことを特徴とする請求項8、10または11記載の方法。
The determining step is
(A) amplifying at least part of the coding sequence of the BRCA1 gene;
(B) determining the sequence of the amplified DNA;
(C) determining the total number of amino acid residues encoded by the amplified DNA or the size of the polypeptide encoded by the amplified DNA;
12. The method according to claim 8, 10 or 11, wherein the result that the BRCA1 gene encodes a truncated protein indicates the disease predisposition to cancer.
JP2004355724A 1994-08-12 2004-12-08 17q-LINKED BREAST AND OVARIAN CANCER SUSCEPTIBILITY GENE Pending JP2005124578A (en)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US28922194A 1994-08-12 1994-08-12
US30026694A 1994-09-02 1994-09-02
US30810494A 1994-09-16 1994-09-16
US34882494A 1994-11-29 1994-11-29
US40930595A 1995-03-24 1995-03-24
US08/487,002 US5710001A (en) 1994-08-12 1995-06-07 17q-linked breast and ovarian cancer susceptibility gene
US08/483,554 US5747282A (en) 1994-08-12 1995-06-07 17Q-linked breast and ovarian cancer susceptibility gene

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2004035158A Division JP2004135687A (en) 1994-08-12 2004-02-12 17q-LINKED BREAST AND OVARIAN CANCER SUSCEPTIBILITY GENE

Publications (1)

Publication Number Publication Date
JP2005124578A true JP2005124578A (en) 2005-05-19

Family

ID=27569597

Family Applications (4)

Application Number Title Priority Date Filing Date
JP50750896A Expired - Lifetime JP3241736B2 (en) 1994-08-12 1995-08-11 17q-linked breast and ovarian cancer susceptibility genes
JP2001119644A Withdrawn JP2001346593A (en) 1994-08-12 2001-04-18 17q-linked breast cancer and ovarian cancer susceptibility gene
JP2004035158A Pending JP2004135687A (en) 1994-08-12 2004-02-12 17q-LINKED BREAST AND OVARIAN CANCER SUSCEPTIBILITY GENE
JP2004355724A Pending JP2005124578A (en) 1994-08-12 2004-12-08 17q-LINKED BREAST AND OVARIAN CANCER SUSCEPTIBILITY GENE

Family Applications Before (3)

Application Number Title Priority Date Filing Date
JP50750896A Expired - Lifetime JP3241736B2 (en) 1994-08-12 1995-08-11 17q-linked breast and ovarian cancer susceptibility genes
JP2001119644A Withdrawn JP2001346593A (en) 1994-08-12 2001-04-18 17q-linked breast cancer and ovarian cancer susceptibility gene
JP2004035158A Pending JP2004135687A (en) 1994-08-12 2004-02-12 17q-LINKED BREAST AND OVARIAN CANCER SUSCEPTIBILITY GENE

Country Status (1)

Country Link
JP (4) JP3241736B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008136520A1 (en) * 2007-05-08 2008-11-13 B-Core Inc. Optical recognition code marking method and device, and related method and related device

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117487924B (en) * 2023-12-29 2024-04-26 湖南家辉生物技术有限公司 MEN1 gene mutant, mutant protein, reagent and application

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008136520A1 (en) * 2007-05-08 2008-11-13 B-Core Inc. Optical recognition code marking method and device, and related method and related device

Also Published As

Publication number Publication date
JP2004135687A (en) 2004-05-13
JP2001346593A (en) 2001-12-18
JPH10505742A (en) 1998-06-09
JP3241736B2 (en) 2001-12-25

Similar Documents

Publication Publication Date Title
US6162897A (en) 17q-linked breast and ovarian cancer susceptibility gene
EP0699754B1 (en) Method for diagnosing a predisposition for breast and ovarian cancer
EP0705903B1 (en) Mutations in the 17q-linked breast and ovarian cancer susceptibility gene
US5709999A (en) Linked breast and ovarian cancer susceptibility gene
US5710001A (en) 17q-linked breast and ovarian cancer susceptibility gene
US5693473A (en) Linked breast and ovarian cancer susceptibility gene
US5837492A (en) Chromosome 13-linked breast cancer susceptibility gene
EP0785216B1 (en) Chomosome 13-linked breast cancer susceptibility gene BRCA2
US5753441A (en) 170-linked breast and ovarian cancer susceptibility gene
US20040170994A1 (en) DNA sequences for human tumour suppressor genes
WO1997022689A9 (en) Chromosome 13-linked breast cancer susceptibility gene
US6465629B1 (en) BRG1 is a tumor suppressor that is mutated in prostate and other cancer types
JP2005124578A (en) 17q-LINKED BREAST AND OVARIAN CANCER SUSCEPTIBILITY GENE
NZ291330A (en) Detection and isolation of the gene brca1 a cancer predisposing gene
AU773601B2 (en) Chromosome 13-linked breast cancer susceptibility gene
WO2000012694A1 (en) Chromosome 1-linked prostate cancer susceptibility gene and multisite tumor suppressor
WO2000069879A9 (en) Ca7 cg04 gene

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050823

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20051117

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20051122

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060411

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20060707

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20060712

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061010

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20061010

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20061011

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20061011

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20061012

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070116

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20070201

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20070202