JP2004135687A

JP2004135687A - 17q-LINKED BREAST AND OVARIAN CANCER SUSCEPTIBILITY GENE

Info

Publication number: JP2004135687A
Application number: JP2004035158A
Authority: JP
Inventors: Mark H Skolnick; マーク・エイチ・スコルニック; David E Goldgar; デイビッド・イー・ゴールドガー; Yoshio Miki; 三木　義男; Jeff Swenson; ジェフ・スウェンソン; Alexander Kamb; アレキサンダー・カム; Keith D Harshman; キース・ディ・ハーシュマン; Donna M Shattuck-Eidens; ドナ・エム・シャタック−エイデンズ; Sean V Tavtigian; シィーン・ブイ・タブティジアン; Roger W Wiseman; ロジャー・ダブリュー・ワイズマン; P Andrew Futreal; アンドリュー・ピー・ファトリール
Original assignee: US Department of Health and Human Services; University of Utah Research Foundation UURF; Myriad Genetics Inc; US Government
Current assignee: US Department of Health and Human Services; University of Utah Research Foundation UURF; Myriad Genetics Inc; US Government
Priority date: 1994-08-12
Filing date: 2004-02-12
Publication date: 2004-05-13
Also published as: JP3241736B2; JP2001346593A; JPH10505742A; JP2005124578A

Abstract

<P>PROBLEM TO BE SOLVED: To provide a material and method used to test an allele of BRCA1, and an interpretation method for the normality or predisposition of the allele. <P>SOLUTION: The present invention relates to germline mutations in the BRCA1 gene and their use in the diagnosis of predisposition to breast and ovarian cancer, and to methods and materials used to isolate and detect a human breast and ovarian cancer predisposing gene (BRCA1). <P>COPYRIGHT: (C)2004,JPO

Description

　本発明は、一般的にヒト遺伝学の分野に関する。詳細には、本発明は、そのいくつかの突然変異対立遺伝子が、癌、特に乳癌および卵巣癌に感受性を引き起こすヒト乳癌および卵巣癌病気素因遺伝子(ＢＲＣＡ１)を単離し、検出するのに用いる方法および材料に関する。より詳細には、本発明は、ＢＲＣＡ１遺伝子における生殖細胞系突然変異、ならびに乳癌および卵巣癌に対する病気素因の診断におけるその使用に関する。本発明は、さらに、ヒト乳癌および卵巣癌におけるＢＲＣＡ１遺伝子における体細胞突然変異、ならびにヒト乳癌および卵巣癌の診断および予診におけるその使用に関する。加えて、本発明は、他のヒト癌におけるＢＲＣＡ１遺伝子の体細胞突然変異、ならびにヒト癌の診断および予診におけるその使用に関する。また、本発明は、遺伝子療法、蛋白質置換療法および蛋白質ミメティックスを包含する、ＢＲＣＡ１遺伝子中に突然変異を有するヒト癌の療法にも関する。本発明は、さらに、癌療法用薬剤のスクリーニングにも関する。最後に、本発明は、乳癌および卵巣癌の病気素因の診断に有用な、突然変異についてのＢＲＣＡ１遺伝子のスクリーニングに関する。
　本発明の背景、および特に、実施に関するさらなる詳細を提供する場合を明らかにするために本明細書中で用いる刊行物および他の材料は、出典明示して本明細書の一部とみなし、簡便のために、以下の明細書中の著者および日付けによって示し、添付する参照リスト中に各々グループ化する。 The present invention relates generally to the field of human genetics. In particular, the present invention relates to a method for isolating and detecting a human breast cancer and ovarian cancer predisposition gene (BRCA1), some of which mutant alleles cause susceptibility to cancer, especially breast and ovarian cancer. And materials. More particularly, the invention relates to germline mutations in the BRCA1 gene and their use in diagnosing a predisposition to breast and ovarian cancer. The invention further relates to somatic mutations in the BRCA1 gene in human breast and ovarian cancer, and their use in diagnosis and prognosis of human breast and ovarian cancer. In addition, the present invention relates to somatic mutations of the BRCA1 gene in other human cancers and their use in diagnosing and prognosing human cancers. The invention also relates to the therapy of human cancers having a mutation in the BRCA1 gene, including gene therapy, protein replacement therapy and protein mimetics. The invention further relates to screening for agents for cancer therapy. Finally, the present invention relates to the screening of the BRCA1 gene for mutations, which is useful in diagnosing a predisposition to breast and ovarian cancer.
Publications and other materials used herein to elucidate the background of the invention, and in particular, where it provides further details regarding the practice, are hereby incorporated by reference, are simply considered part of the specification, For the purposes of the present invention, they are indicated by author and date in the following specification and are each grouped in an attached reference list.

　トランスフォーム状態の優性で正の多くの調節遺伝子(オンコジーン)、ならびに劣性で負の多くの調節遺伝子(腫瘍サプレッサー遺伝子)を包含する癌の遺伝学は複雑である。百を超えるオンコジーンが特徴付けられている。１ダースに満たない腫瘍サプレッサー遺伝子しか同定されていないが、その数は５０を超えて増加すると予想される(Ｋnudson,1993)。遺伝 The genetics of cancer is complex, including many dominant and positive regulatory genes (oncogenes) in the transformed state, as well as many recessive and negative regulatory genes (tumor suppressor genes). More than a hundred oncogenes have been characterized. Less than a dozen tumor suppressor genes have been identified, but their number is expected to increase by more than 50 (Knudson, 1993).

　そのように多数の遺伝子の関与は、細胞で作動して正常組織の完全性を維持する増殖制御機構の複雑さを強調している。この複雑性は他の方法で明白である。現在まで、単一の遺伝子がすべての、または大部分のヒト癌の成長に関与していることが示されたことはない。最も普遍的なオンコジーン突然変異はＨ-ｒａｓ遺伝子に存在し、全ての充実性腫瘍の１０-１５％に見出されている(Ａndersonら，1992)。最も頻繁に突然変異する腫瘍サプレッサー遺伝子は、全腫瘍のほぼ５０％でホモ接合的に欠損したＴＰ５３遺伝子、および検査した腫瘍細胞系統の４６％でホモ接合的に欠損したＣＤＫＮ２である(Ｋambら，1994)。すべてのトランスフォーム細胞に共通する標的なしには、癌細胞を破壊または復帰させる一方で害されていない正常組織を残し得る「魔法の弾丸」の夢はありそうにない。特異的に標的化した抗癌剤の新たな創薬の望みは、細胞分裂の制御において一般的な役割を演じている腫瘍サプレッサー遺伝子またはオンコジーンを同定する能力に支えられ得る。 The involvement of such a large number of genes underscores the complexity of growth control mechanisms that operate in cells to maintain normal tissue integrity. This complexity is evident in other ways. To date, no single gene has been shown to be involved in the growth of all or most human cancers. The most ubiquitous oncogene mutation is present in the H-ras gene and is found in 10-15% of all solid tumors (Anderson et al., 1992). The most frequently mutated tumor suppressor genes are the TP53 gene, which is homozygously deleted in almost 50% of all tumors, and the CDKN2, which is homozygously deleted in 46% of the tumor cell lines examined (Kamb et al., 1994). Without a target common to all transformed cells, it is unlikely that a "magic bullet" dream could destroy or reinstate cancer cells while leaving harmless normal tissue. The desire for new drug discovery of specifically targeted anti-cancer drugs may be supported by the ability to identify tumor suppressor genes or oncogenes that play a general role in controlling cell division.

　クローン化され特徴付けられた腫瘍サプレッサー遺伝子は、１）網膜芽細胞腫(ＲＢ１)；２）Ｗilms腫瘍(ＷＴ１)；３）Ｌi-Ｆraumeni症候群(ＴＰ５３)；４）家族性腺腫性茸腫症(ＡＰＣ)；５）神経線維腫症１型(ＮＦ１)；６）神経線維腫症２型(ＮＦ２)；７）von Ｈippel-Ｌindau病(ＶＨＬ)；８）多発性内分泌腺腫症２Ａ型(ＭＥＮ２Ａ)；および９）メラノーマ(ＣＤＫＮ２)に対する感受性に影響する。 The cloned and characterized tumor suppressor genes include: 1) Retinoblastoma (RB1); 2) Wilms tumor (WT1); 3) Li-Fraumeni syndrome (TP53); 4) Familial adenomatous polyps. APC); 5) neurofibromatosis type 1 (NF1); 6) neurofibromatosis type 2 (NF2); 7) von Hippel-Lindau disease (VHL); 8) multiple endocrine neoplasia type 2A (MEN2A). And 9) affects sensitivity to melanoma (CDKN2).

　遺伝子的にマッピングされているが未だ単離されていない腫瘍サプレッサー遺伝子座には：多発性内分泌腺腫症１型(ＭＥＮ１)；リンチ癌家族性症候群２型(ＬＣＦＳ２)；神経芽細胞腫(ＮＢ)；基底細胞母斑症候群(ＢＣＮＳ)；Ｂeckwith-Ｗiedemann症候群(ＢＷＳ)；腎細胞腫(ＲＣＣ)；結節性硬化症１型(ＴＳＣ１)；および結節性硬化症２型(ＴＳＣ２)に関する遺伝子が包含される。今日までに特徴付けられている腫瘍サプレッサー遺伝子は、ＤＮＡ結合蛋白質(ＷＴ１)、補助転写因子(ＲＢ１)、ＧＴＰアーゼ活性化蛋白質またはＧＡＰ(ＮＦ１)、細胞骨格因子(ＮＦ２)、膜結合受容体キナーゼ(ＭＥＮ２Ａ)、細胞サイクル調節因子(ＣＤＫＮ２)および公知の蛋白質に明白な同一性をなんら有しない他のもの(ＡＰＣおよびＶＨＬ)を包含する、種々のタイプの蛋白質と同類の産物をコードする。 Tumor suppressor loci that have been genetically mapped but not yet isolated include: Multiple endocrine neoplasia type 1 (MEN1); Lynch cancer familial syndrome type 2 (LCFS2); Neuroblastoma (NB) Genes for basal cell nevus syndrome (BCNS); Beckwith-Wiedemann syndrome (BWS); renal cell tumors (RCC); tuberous sclerosis type 1 (TSC1); and tuberous sclerosis type 2 (TSC2). You. Tumor suppressor genes that have been characterized to date include DNA binding protein (WT1), auxiliary transcription factor (RB1), GTPase activating protein or GAP (NF1), cytoskeletal factor (NF2), membrane-bound receptor kinase It encodes products analogous to various types of proteins, including (MEN2A), cell cycle regulator (CDKN2) and others (APC and VHL) that have no apparent identity to known proteins.

　多くの場合、遺伝的研究を通して元来同定された腫瘍サプレッサー遺伝子は、ある種の散発性腫瘍においては欠失または突然変異していることが示されている。この結果は、染色体異常の領域が、癌への遺伝的病気素因および散発性癌の両方に関与する重要な腫瘍サプレッサー遺伝子の位置を知り得ることを示している。場合 In many cases, tumor suppressor genes originally identified through genetic studies have been shown to be deleted or mutated in certain sporadic tumors. The results indicate that regions of chromosomal abnormalities may be able to locate key tumor suppressor genes involved in both genetic predisposition to cancer and sporadic cancer.

　今日までに特徴付けられた数種の腫瘍サプレッサー遺伝子の顕著な特徴の１つは、特定の腫瘍型においてそれが高率で欠失しているということである。該欠失には、しばしば、単一対立遺伝子の欠失、いわゆるヘテロ接合体の欠失(ＬＯＨ)が含まれるが、また、両方の対立遺伝子のホモ接合体欠失も含まれ得る。ＬＯＨに関しては、予め存在する突然変異のためか、二次的散発性突然変異のためかのいずれかによって、残りの対立遺伝子が非機能性になると予想される。１ One of the salient features of several tumor suppressor genes characterized to date is that they are highly deleted in certain tumor types. Such deletions often include single allele deletions, so-called heterozygous deletions (LOH), but can also include homozygous deletions of both alleles. For LOH, it is expected that the remaining allele will be non-functional either due to pre-existing mutations or due to secondary sporadic mutations.

　乳癌は、女性に影響する最も重要な疾病の１つである。最近の比率では、米国女性は、９５歳までに乳癌を発症する１/８の危険度を有する(Ａmerican Ｃancer Ｓociety，1992)。後期ステージの乳癌の治療は、しばしば、無駄で、かつ醜く、疾病の医療管理において早期の検出を高い優先としている。乳癌よりもより頻繁ではないが、卵巣癌はしばしば迅速に死に至り、米国女性における癌致死率の第４番目の最も普遍的原因である。乳癌発症率の疾病-規定比率に寄与する遺伝的因子は全ケースの約５％と概算されるが、約２５％のケースが４０歳前に診断されている(Ｃlausら,1991)。乳癌は５０歳付近の年齢-特異的発症率曲線の変曲に基づき、２種のタイプ、すなわち、低齢発症および高齢発症に分けられる。１つの遺伝子、すなわちＢＲＣＡ１の突然変異が家族性乳癌の約４５％の原因と考えられるが、乳癌および卵巣癌の両方を有する家族の少なくとも８０％の原因と考えられる(Ｅastonら,1993)。 Breast cancer is one of the most important diseases affecting women. In a recent proportion, U.S. women have an eighth risk of developing breast cancer by the age of 95 (American Cancer Society, 1992). Treatment of late stage breast cancer is often wasteful and ugly, with early detection a high priority in medical care of the disease. Although less frequent than breast cancer, ovarian cancer often results in rapid death and is the fourth most common cause of cancer mortality in US women. The genetic factor contributing to the disease-defined ratio of breast cancer incidence is estimated to be about 5% of all cases, but about 25% of cases are diagnosed before age 40 (Claus et al., 1991). Breast cancer is divided into two types based on the inflection of the age-specific incidence curve around the age of 50, namely, young-onset and old-onset. Mutations in one gene, BRCA1, are thought to account for about 45% of familial breast cancers, but at least 80% of families with both breast and ovarian cancer (Easton et al., 1993).

　ＢＲＣＡ１遺伝子が１９９０年に最初にマッピングされてから、それを単離する激しい努力がなされてきている(Ｈallら,1990；Ｎarodら,1991)。第２の遺伝子座、ＢＲＣＡ２は最近、染色体１３ｑにマッピングされ(Ｗoosterら，1994)、ＢＲＣＡ１とほぼ同等な低齢-発症乳癌の比率と考えられるようであるが、卵巣癌の低い危険性に寄与している。低齢-発症乳癌に対する残りの感受性は、家族性癌の未だマッピングされていない遺伝子と、ＴＰ５３のごとき珍しい生殖細胞系突然変異との間に分けられる(Ｍalkinら，1990)。また、血管拡張性失調症遺伝子のヘテロ接合体キャリアーが、乳癌につき高危険性であることも示唆されている(Ｓwiftら，1976；Ｓwiftら，1991)。高齢-発症乳癌はしばしば家族性であるが、血縁における危険度は低齢-発症乳癌ほど高くない(Ｃannon-Ａlbrightら，1994；Ｍettlinら，1990)。しかしながら、遺伝的感受性によるかかるケースのパーセンテージは知られていない。 Since the BRCA1 gene was first mapped in 1990, strenuous efforts have been made to isolate it (Hall et al., 1990; Narod et al., 1991). A second locus, BRCA2, has recently been mapped to chromosome 13q (Wooster et al., 1994) and appears to be considered to have a similar proportion of young-onset breast cancer as BRCA1, but contributes to a lower risk of ovarian cancer are doing. The remaining susceptibility to young-onset breast cancer is divided between the unmapped gene of familial cancer and rare germline mutations such as TP53 (Malkin et al., 1990). It has also been suggested that heterozygous carriers of the ataxia telangiectasia gene are at high risk for breast cancer (Swift et al., 1976; Swift et al., 1991). Older-onset breast cancer is often familial, but the risk in blood relatedness is not as high as that of younger-onset breast cancer (Cannon-Albright et al., 1994; Mettlin et al., 1990). However, the percentage of such cases due to genetic susceptibility is not known.

　乳癌は、部分的に、家族性疾病であると長い間認識されている(Ａnderson,1972)。膨大な数の研究者が遺伝的受継の証拠を検査し、データは主要な感受性遺伝子座または遺伝子座群の優性遺伝とほとんど一致すると結論している(ＢishopおよびＧardner，1980；Ｇoら，1983；ＷilliamsおよびＡnderson，1984；Ｂishopら，1988；Ｎewmanら，1988；Ｃlausら，1991)。最近の結果は、少なくとも３つの遺伝子座が存在し、これらが乳癌ならびに他の癌に対する感受性を運んでいることを証明している。これらの遺伝子座は染色体１７ｐ上のＴＰ５３遺伝子座
(Ｍalkinら，1990)、ＢＲＣＡ１として知られている１７ｑ-連鎖感受性遺伝子座(Ｈallら，1990)、および未マッピングの残りのものに寄与する１または２以上の遺伝子座である。Ｈallら(1990)は、低齢発症を有する家系において遺伝した乳癌感受性が染色体１７ｑ２１に連鎖していることを示したが；より適当な遺伝的モデルを使用したこのグループによるつづく研究は、低齢発症乳癌への限定を部分的に論駁された(Ｍargaritteら，1992)。 Breast cancer has long been recognized in part as a familial disease (Anderson, 1972). A vast number of investigators have examined evidence of genetic succession and have concluded that the data are almost consistent with the dominant inheritance of major susceptibility loci or groups of loci (Bishop and Gardner, 1980; Go et al., 1983; Williams and Anderson, 1984; Bishop et al., 1988; Newman et al., 1988; Claus et al., 1991). Recent results demonstrate that there are at least three loci that carry susceptibility to breast cancer as well as other cancers. These loci are the TP53 locus on chromosome 17p.
(Malkin et al., 1990), the 17q-linked susceptibility locus known as BRCA1 (Hall et al., 1990), and one or more loci that contribute to the rest of the unmapped. Hall et al. (1990) showed that inherited breast cancer susceptibility was linked to chromosome 17q21 in families with a younger onset; further studies by this group using a more appropriate genetic model suggest that The limitation to onset breast cancer was partially refuted (Margaritte et al., 1992).

　１７ｑ-連鎖乳癌病気素因遺伝子(ＢＲＣＡ１)をクローン化する大部分の戦略は正確な遺伝的位置決定研究を要する。ＢＲＣＡ１の機能的な役割に関する最もシンプルなモデルは、癌となる病気素因であるＢＲＣＡ１の対立遺伝子が野生型対立遺伝子に対して劣性であり；すなわち、少なくとも１つの野生型ＢＲＣＡ１対立遺伝子を含む細胞は癌にかからないことを支持している。しかしながら、１つの野生型ＢＲＣＡ１対立遺伝子および１つの病気素因対立遺伝子を含有する細胞は、ランダム突然変異によってか、または細胞分裂の間の染色体欠失(非染色体分離)によるかのいずれかで野生型対立遺伝子の欠失にしばしば遭遇し得る。かかる突然変異細胞の子孫はすべて、ＢＲＣＡ１の野生型機能を欠いており、腫瘍に発展し得る。このモデルによれば、ＢＲＣＡ１の病気素因対立遺伝子は劣性で、癌に対する感受性を優性で受け継いでいても：１つの病気素因対立遺伝子(および１つの野生型対立遺伝子)を有する女性は癌を発症する危険性を有する。なぜならば、彼女の乳房上皮細胞が、自然発生的に野生型ＢＲＣＡ１対立遺伝子を欠失し得るからである。このモデルは、網膜芽細胞腫遺伝子および神経芽細胞腫遺伝子を包含するクラスの遺伝子、腫瘍サプレッサーまたは抗オンコジーンとして知られている癌感受性対立遺伝子の群に適用する。推論により、このモデルは、最近示されているごとく(Ｓmithら，1992)、ＢＲＣＡ１機能を説明することもできる。 Most strategies for cloning the 17q-linked breast cancer predisposition gene (BRCA1) require accurate genetic location studies. The simplest model for the functional role of BRCA1 is that the BRCA1 allele predisposing to cancer is recessive to the wild-type allele; that is, cells containing at least one wild-type BRCA1 allele are He supports not having cancer. However, cells containing one wild-type BRCA1 allele and one disease-predisposing allele were wild-type, either by random mutation or by chromosomal deletion during cell division (non-chromosomal segregation). Allelic deletions can often be encountered. All progeny of such mutant cells lack the wild-type function of BRCA1 and can develop into tumors. According to this model, the predisposition allele of BRCA1 is recessive, and women with one predisposition allele (and one wild-type allele) develop cancer, even if they dominantly inherit susceptibility to cancer. Has danger. Because her breast epithelial cells can spontaneously lack the wild-type BRCA1 allele. This model applies to a class of genes including retinoblastoma and neuroblastoma genes, a group of cancer susceptibility alleles known as tumor suppressors or anti-oncogenes. By inference, this model can also account for BRCA1 function, as recently shown (Smith et al., 1992).

　第２の可能性は、ＢＲＣＡ１病気素因対立遺伝子が実際に優性であり；すなわち、ＢＲＣＡ１の野生型対立遺伝子は病気素因対立遺伝子の腫瘍形成役割を克服し得ないということである。したがって、野生型と突然変異対立遺伝子との両方を運ぶ細胞は、悪性腫瘍細胞を生じる前にＢＲＣＡ１の野生型コピーを欠失しているとは限らない。その代わりに、病気素因個人における乳房細胞は、癌に通じるある種の他の確率的変化(群)が起きているであろう。 The second possibility is that the BRCA1 disease predisposing allele is indeed dominant; that is, the wild type allele of BRCA1 cannot overcome the tumorigenic role of the disease predisposing allele. Thus, cells carrying both wild-type and mutant alleles are not necessarily deficient in the wild-type copy of BRCA1 before giving rise to malignant cells. Instead, breast cells in predisposed individuals will have undergone some other stochastic change (s) leading to cancer.

　ＢＲＣＡ１病気素因対立遺伝子が劣性である場合、該ＢＲＣＡ１遺伝子は正常な乳房組織で発現するが、乳癌で機能的に発現しないと予想される。それとは反対に、ＢＲＣＡ１病気素因対立遺伝子が優性である場合、野生型ＢＲＣＡ１遺伝子は正常な乳房組織で発現し得るか、またはし得ない。しかしながら、該病気素因対立遺伝子は、乳癌細胞で発現するようである。 If the BRCA1 disease predisposing allele is recessive, the BRCA1 gene is expected to be expressed in normal breast tissue but not functionally in breast cancer. Conversely, if the BRCA1 disease predisposition allele is dominant, the wild-type BRCA1 gene may or may not be expressed in normal breast tissue. However, the disease predisposing allele appears to be expressed in breast cancer cells.

　ＢＲＣＡ１の１７ｑ連鎖は、乳癌と卵巣癌の両方を有する５人の家系のうちの３人で独立して確認された(Ｎarodら，1991)。これらの研究は、連鎖したマーカーｐＣＭＭ８６(D17S74)のいずれか側に対して１５センチモルガン(ｃＭ)、または約１５Ｍｂｐの非常に広範な領域の中に該遺伝子が位置決定されると主張している。しかしながら、ｐＣＭＭＳ６を取り囲むマーカーを用いた遺伝的研究によって該領域をさらに画定する試行は首尾よくいかないことが証明された。つづく研究は、該遺伝子がかなり接近していて(Ｅastonら，1993)、元来の分析が欠陥であったことを示している(Ｍargaritteら，1992)。Ｈallら(1992)は、最近、ＢＲＣＡ１遺伝子を、基部側のＭｆｄｌ５(D17S250)および末端側のヒトＧＩＰ遺伝子と境を接する約８ｃＭ(約８Ｍｂｐ)の間隔に位置決定した。公的に入手可能なデータに基づくＢＲＣＡ１対立遺伝子についてのわずかに狭い間隔は、１９９２年３月の「染色体１７研究会」(Ｆain，1992)で合意に達した。これらの領域のサイズおよびそれと関連する不確実性は、ＢＲＣＡ１遺伝子を単離する物理的マッピングおよび／またはクローニング戦略の設計および器具を過剰に困難としている。 The 17q linkage of BRCA1 was independently confirmed in three of five families with both breast and ovarian cancer (Narod et al., 1991). These studies claim that the gene is located within a very large region of 15 centiMorgans (cM), or about 15 Mbp, on either side of the linked marker pCMM86 (D17S74). . However, genetic studies using markers surrounding pCMMS6 have proven that attempts to further define the region have been unsuccessful. Subsequent studies indicate that the genes were quite close (Easton et al., 1993) and that the original analysis was defective (Margaritte et al., 1992). Hall et al. (1992) recently localized the BRCA1 gene at an interval of about 8 cM (about 8 Mbp) bordering the proximal Mfdl5 (D17S250) and the distal human GIP gene. A slightly narrower interval for the BRCA1 allele based on publicly available data was agreed in March 1992 at the "Chromosome 17 Study Group" (Fain, 1992). The size of these regions and the associated uncertainties make the design and instrumentation of physical mapping and / or cloning strategies to isolate the BRCA1 gene overly difficult.

　乳癌感受性対立遺伝子の同定により、感受性個人を早期に検出することができ、癌に通じる初期工程を理解する我々の能力を大きく増すであろう。感受性対立遺伝子は腫瘍が進展する間にしばしば変化するため、これらの遺伝子のクローニングも、より良好な診断および予診産物の開発、ならびにより良好な癌療法においても重要となり得る。 Identification of breast cancer susceptibility alleles will allow early detection of susceptible individuals and will greatly enhance our ability to understand the initial steps leading to cancer. Because susceptibility alleles often change during tumor progression, cloning of these genes may also be important in developing better diagnostic and diagnostic products, and in better cancer therapy.

　本発明は、一般的にヒト遺伝学の分野に関する。詳細には、本発明は、癌、特に乳癌および卵巣癌に対する感受性を生じるある種の対立遺伝子である、ヒト乳癌病気素因遺伝子(ＢＲＣＡ１)を単離し、かつ検出するのに用いる方法および材料に関する。より詳細には、本発明は、ＢＲＣＡ１遺伝子における生殖細胞系突然変異、ならびに乳癌および卵巣癌の病気素因の診断におけるその使用に関する。本発明は、さらに、ヒト乳癌におけるＢＲＣＡ１遺伝子の体細胞突然変異、ならびにヒト乳癌および卵巣癌の診断および予診におけるその使用に関する。加えて、本発明は、他のヒト癌におけるＢＲＣＡ１遺伝子の体細胞突然変異、ならびにヒト癌の診断および予診におけるその使用に関する。本発明は、また、遺伝子療法、蛋白質置換療法および蛋白質ミメティックスを包含する、ＢＲＣＡ１遺伝子に突然変異を有するヒト癌の療法に関する。本発明は、さらに、癌療法用の薬剤のスクリーニングに関する。最後に、本発明は、突然変異についてのＢＲＣＡ１遺伝子のスクリーニングに関し、それは乳癌および卵巣癌の病気素因を診断するのに有用である。 The present invention relates generally to the field of human genetics. In particular, the invention relates to methods and materials used to isolate and detect the human breast cancer predisposition gene (BRCA1), a certain allele that produces susceptibility to cancer, particularly breast and ovarian cancer. More particularly, the invention relates to germline mutations in the BRCA1 gene and their use in diagnosing a predisposition to breast and ovarian cancer. The invention further relates to somatic mutations of the BRCA1 gene in human breast cancer and its use in the diagnosis and prognosis of human breast and ovarian cancer. In addition, the present invention relates to somatic mutations of the BRCA1 gene in other human cancers and their use in diagnosing and prognosing human cancers. The present invention also relates to therapies for human cancers having a mutation in the BRCA1 gene, including gene therapy, protein replacement therapy and protein mimetics. The invention further relates to screening for agents for cancer therapy. Finally, the invention relates to the screening of the BRCA1 gene for mutations, which is useful for diagnosing a predisposition to breast and ovarian cancer.

　本発明は、個人のＢＲＣＡ１対立遺伝子をテストするのに用いる物質および方法ならびに該対立遺伝子の正常または病気素因性質の解釈を供する。正常の危険より高い個人はそのライフスタイルを適当に修飾するであろう。ＢＲＣＡ１の場合、最も有意な非−遺伝的危険因子は若年の全妊娠期間の保護効果である。従って、危険な婦人は早くに子供を作ることを考えるか、若年の全期間妊娠のホルモン効果を刺激するように設計した療法を考えることができよう。高い危険の婦人もまた早期検出に努力し、乳房の自己診断を学び実践する絶好の動機付けとなろう。かかる婦人は、一般の集団よりも早い年齢で始めて、規則的な乳房Ｘ線像を取るよう動機付けされるであろう。卵巣スクリーニングも、より高い頻度でなされるであろう。ＢＲＣＡ１遺伝子座の配列分析に基づく診断方法も腫瘍検出および分類に適用できるであろう。配列分析を用いて前駆体病巣を診断できるであろう。該方法の進歩およびＢＲＣＡ１および他の原因的遺伝子座についての情報の蓄積と共に、癌を良性および悪性に分けることが可能となろう。 The present invention provides materials and methods used to test an individual's BRCA1 allele and the interpretation of the normal or disease predisposing properties of the allele. Individuals who are above normal risk will modify their lifestyle appropriately. In the case of BRCA1, the most significant non-genetic risk factor is the protective effect over the entire gestation period of the young. Thus, at-risk women could consider having children early or could consider therapies designed to stimulate the hormonal effects of pregnancy throughout the young. High-risk women will also strive for early detection and will be a great incentive to learn and practice breast self-diagnosis. Such women would be motivated to take regular mammograms starting at an earlier age than the general population. Ovarian screening will also be done more frequently. Diagnostic methods based on sequence analysis of the BRCA1 locus could also be applied to tumor detection and classification. Precursor foci could be diagnosed using sequence analysis. With advances in the method and accumulation of information about BRCA1 and other causative loci, it will be possible to classify cancer into benign and malignant.

　乳癌を持つ婦人は、もしそれが病気素因でないというよりも、もしそれが病気素因であり、従ってさらに癌を有するであろうときは、異なる外科方法に従うであろう。ペプチドまたは小さい分子（合理的薬剤デザイン）いずれかを用いる他の療法が開発されるであろう。ペプチドはミッシング遺伝子産物それ自体またはミッシング遺伝子産物の一部であろう。別法として、治療剤は有害な遺伝子機能を模倣するもう１つの分子、受け継いだ遺伝子座の有害効果を妨げることが求められるペプチドまたは非ペプチド分子であろう。また、療法は正常なＢＲＣＡ１対立遺伝子を個人に導入して、有害対立遺伝子の効果を妨げるであろう蛋白質を作製することを通じる、遺伝子ベースであり得る。これらの遺伝子療法は多くの形態を取ることができ、腫瘍が形成されるのを妨げる、一旦生じた癌を治癒する、または癌が転移するのを停止させることに向けられるであろう。 Women with breast cancer will follow a different surgical procedure if it is predisposed to disease and therefore will have more cancer than if it is not predisposed to disease. Other therapies using either peptides or small molecules (rational drug design) will be developed. The peptide may be the missing gene product itself or a part of the missing gene product. Alternatively, the therapeutic agent will be another molecule that mimics the deleterious gene function, a peptide or non-peptide molecule that is sought to prevent the deleterious effects of the inherited locus. Also, the therapy may be gene-based, through introducing a normal BRCA1 allele into the individual and creating a protein that will counteract the effects of the deleterious allele. These gene therapies can take many forms and will be directed to preventing tumors from forming, curing cancer once it has occurred, or stopping cancer from metastasis.

　本発明は、一般的にヒト遺伝学の分野に関する。詳細には、本発明は、癌、特に乳癌および卵巣癌に対して感受性を生じるある種の対立遺伝子である、ヒト乳癌病気素因遺伝子(ＢＲＣＡ１)を単離し、かつ検出するのに用いる方法および材料に関する。より詳細には、本発明は、ＢＲＣＡ１遺伝子における生殖細胞系突然変異、ならびに乳癌および卵巣癌の病気素因の診断におけるその使用に関する。本発明は、さらに、ヒト乳癌におけるＢＲＣＡ１遺伝子における体細胞突然変異、ならびにヒト乳癌および卵巣癌の診断および予診におけるその使用に関する。加えて、本発明は、他のヒト癌におけるＢＲＣＡ１遺伝子中の体細胞突然変異、ならびにヒト癌の診断および予診におけるその使用に関する。また、本発明は、遺伝子療法、蛋白質置換療法および蛋白質ミメティックスを包含する、ＢＲＣＡ１遺伝子中に突然変異を有するヒト癌の療法に関する。本発明は、さらに、癌治療用の薬剤のスクリーニングに関する。最後に、本発明は、突然変異についてのＢＲＣＡ１遺伝子のスクリーニングに関し、それは乳癌および卵巣癌の病気素因を診断するのに有用である。 The present invention relates generally to the field of human genetics. In particular, the present invention relates to methods and materials used to isolate and detect the human breast cancer predisposition gene (BRCA1), a certain allele that confers susceptibility to cancer, particularly breast and ovarian cancer. About. More particularly, the invention relates to germline mutations in the BRCA1 gene and their use in diagnosing a predisposition to breast and ovarian cancer. The invention further relates to somatic mutations in the BRCA1 gene in human breast cancer and its use in the diagnosis and prognosis of human breast and ovarian cancer. In addition, the present invention relates to somatic mutations in the BRCA1 gene in other human cancers and their use in diagnosing and prognosing human cancers. The invention also relates to therapies for human cancers having a mutation in the BRCA1 gene, including gene therapy, protein replacement therapy and protein mimetics. The invention further relates to screening for agents for treating cancer. Finally, the invention relates to the screening of the BRCA1 gene for mutations, which is useful for diagnosing a predisposition to breast and ovarian cancer.

　本発明は、好ましくは少なくとも８塩基長〜約１００ｋｂ長の、ＢＲＣＡ１遺伝子座または突然変異ＢＲＣＡ１遺伝子座の全体または一部分よりなる単離ポリヌクレオチドを提供する。かかるポリヌクレオチドはアンチセンス・ポリヌクレオチドとし得る。本発明は、また、かかる単離ポリヌクレオチドよりなる組換え構築物、例えば、形質転換宿主細胞における発現に適した組換え構築物を提供する。 The present invention provides an isolated polynucleotide consisting of all or a part of the BRCA1 locus or a mutant BRCA1 locus, preferably at least 8 bases in length to about 100 kb in length. Such a polynucleotide can be an antisense polynucleotide. The present invention also provides a recombinant construct comprising such an isolated polynucleotide, for example, a recombinant construct suitable for expression in a transformed host cell.

　また、本発明により、分析物中のＢＲＣＡ１遺伝子座またはその発現産物の一部分を含むポリヌクレオチドを検出する方法を提供する。かかる方法は、さらに、ＢＲＣＡ１遺伝子座の一部分を増幅する工程を含んでよく、さらに、ＢＲＣＡ１遺伝子座の該一部分を増幅するためのプライマーである１セットのポリヌクレオチドを提供する工程を含んでよい。該方法は、癌に対する病気素因の診断、または癌の診断もしくは予診のいずれかに有用である。 The present invention also provides a method for detecting a polynucleotide containing a part of the BRCA1 locus or its expression product in an analyte. Such a method may further include amplifying a portion of the BRCA1 locus, and may further include providing a set of polynucleotides that are primers for amplifying the portion of the BRCA1 locus. The method is useful for either diagnosing a predisposition to cancer or diagnosing or prognosing cancer.

　本発明は、また、ＢＲＣＡ１遺伝子座によってコードされる少なくとも５個のアミノ酸残基よりなる単離ポリペプチドに特異的に結合する単離抗体、好ましくはモノクローナル抗体も提供する。 The invention also provides an isolated antibody, preferably a monoclonal antibody, that specifically binds to an isolated polypeptide consisting of at least 5 amino acid residues encoded by the BRCA1 locus.

　本発明は、また、ＢＲＣＡ１遺伝子座の一部分よりなるポリヌクレオチドを分析物中で検出するためのキットを提供し、該キットは適当な容器中に密閉したＢＲＣＡ１遺伝子座の一部分に相補的なポリヌクレオチドおよびそれを使用するための指示書を含む。 The invention also provides a kit for detecting a polynucleotide comprising a portion of the BRCA1 locus in an analyte, the kit comprising a polynucleotide complementary to a portion of the BRCA1 locus sealed in a suitable container. And instructions for using it.

　本発明は、さらに、重合性ヌクレオチドを含むポリヌクレオチドを調製し、ＢＲＣＡ１遺伝子座の少なくとも８つの隣接したヌクレオチドよりなる配列を得る方法；ならびに、重合性アミノ酸を含むポリペプチドを調製して、ＢＲＣＡ１遺伝子座内にコードされる少なくとも５個のアミノ酸を含む配列を得る方法を提供する。 The present invention further provides a method of preparing a polynucleotide comprising a polymerizable nucleotide and obtaining a sequence consisting of at least eight adjacent nucleotides of the BRCA1 locus; and preparing a polypeptide comprising a polymerizable amino acid to obtain a BRCA1 gene. A method is provided for obtaining a sequence comprising at least 5 amino acids encoded in a locus.

　本発明は、さらに、突然変異を同定するためにＢＲＣＡ１遺伝子をスクリーニングする方法を提供する。かかる方法は、さらに、ＢＲＣＡ１遺伝子座の一部分を増幅する工程をさらに含み得、かつ、ＢＲＣＡ１遺伝子座の該一部分を増幅するためのプライマーである１セットのポリヌクレオチドを提供する工程を含み得る。該方法は、癌に対する病気素因の診断または癌の診断もしくは予診のいずれかで使用する突然変異の同定に有用である。 The present invention further provides a method of screening the BRCA1 gene to identify a mutation. Such methods can further include amplifying a portion of the BRCA1 locus, and can include providing a set of polynucleotides that are primers for amplifying the portion of the BRCA1 locus. The method is useful for diagnosing a predisposition to cancer or identifying mutations for use in either diagnosing or prognosing cancer.

　本発明は、さらに、ＢＲＣＡ１遺伝子中の突然変異を同定するための予想ＢＲＣＡ１突然変異対立遺伝子をスクリーニングする方法を提供する。 The present invention further provides a method of screening for a predicted BRCA1 mutant allele to identify a mutation in the BRCA1 gene.

　加えて、本発明は、ＢＲＣＡ１遺伝子産物機能を回復するのに適当な薬剤を同定するために、癌療法用の薬剤をスクリーニングする方法を提供する。 Additionally, the present invention provides a method of screening a drug for cancer therapy to identify a drug suitable for restoring BRCA1 gene product function.

　最後に、本発明は、癌細胞に指向する遺伝子-ベースの療法の作成に必要な手段を提供する。これらの療法剤は、ＢＲＣＡ１蛋白質の機能が再構成されるように適当なベクターに設置するか、または、より直接的な方法で標的細胞にデリバリーするかのＢＲＣＡ１遺伝子座の全体または一部分を含むポリヌクレオチドの形態を採り得る。療法剤は、また、ＢＲＣＡ１の部分的または全体的な蛋白質配列のいずれかに基づいたポリペプチドの形態も採り得る。これらは、イン・ビボ(in vivo)でＢＲＣＡ１の活性を機能的に置換し得る。 Finally, the present invention provides the tools needed to create a gene-based therapy directed against cancer cells. These therapeutic agents may be placed in a suitable vector so that the function of the BRCA1 protein is reconstituted, or delivered to the target cell in a more direct manner, including the entire or partial BRCA1 locus. It can take the form of nucleotides. Therapeutic agents can also take the form of a polypeptide based on either the partial or complete protein sequence of BRCA1. They can functionally replace the activity of BRCA1 in vivo.

　個人が乳癌および卵巣癌に対する病気素因を作るＢＲＣＡ１遺伝子は、ＢＲＣＡ１蛋白質をコードする遺伝子であり、この蛋白質が、公知の蛋白質またはＤＮＡ配列となんら意味深い相同性を有しないことが判明したことは本発明の知見である。この遺伝子は、本明細書中でＢＲＣＡ１と命名する。生殖細胞系におけるＢＲＣＡ１遺伝子座中の突然変異が、乳癌および卵巣癌に対する病気素因の指標になるということは本発明の知見である。最後に、ＢＲＣＡ１遺伝子座における体細胞突然変異も、乳癌、卵巣癌および他の癌と関連しており、このことが、これらの癌の指標、またはこれらの癌の病気素因を表していることが本発明の知見である。ＢＲＣＡ１遺伝子座の突然変異事象には、コード配列および非-コード配列内における欠失、挿入および点突然変異が含まれ得る。 The BRCA1 gene, which causes an individual to have a predisposition to breast and ovarian cancer, is a gene that encodes a BRCA1 protein. It is a finding of the invention. This gene is designated herein as BRCA1. It is an observation of the present invention that mutations in the BRCA1 locus in the germline are indicative of a predisposition to breast and ovarian cancer. Finally, somatic mutations at the BRCA1 locus have also been associated with breast, ovarian and other cancers, which may be indicative of these cancers or predisposing them to disease. It is a finding of the present invention. Mutational events at the BRCA1 locus can include deletions, insertions, and point mutations in coding and non-coding sequences.

　ヒトゲノムのヒト染色体１７の長腕上の領域から開始する１７ｑは、約８Ｍｂｐと概算されるサイズ、遺伝子座を含む領域、ＢＲＣＡ１を有し、乳癌および卵巣癌を含む癌に対して感受性を引き起こすことが突き止められている。 Starting from the region on the long arm of human chromosome 17 of the human genome, 17q has a size estimated to be about 8 Mbp, the region containing the locus, BRCA1, and is susceptible to cancer, including breast and ovarian cancer. Is located.

　ＢＲＣＡ１遺伝子座を含む領域は、種々の遺伝的技術を用いて同定した。遺伝子マッピング技術は、遺伝子マーカーでの組換えによりＢＲＣＡ１領域を最初に画定した。多重ケースの乳癌(およびある家系では卵巣癌ケース)を有する大きく広がった家族(「家系」)の研究に基づいて、ＢＲＣＡ１遺伝子ならびにＢＲＣＡ１遺伝子座中の他の予想感受性対立遺伝子を含む染色体領域の正確な位置を示した。２つの分裂中止点が、遺伝子マーカーと該疾病との間の組換体として、およびＢＲＣＡ１遺伝子座の基部側の１つの組換体として発現されるＢＲＣＡ１遺伝子座の末端側に発見された。したがって、ＢＲＣＡ１遺伝子座を含む領域はこれらのマーカーと物理的に境を接する。 The region containing the BRCA1 locus was identified using various genetic techniques. Genetic mapping techniques first defined the BRCA1 region by recombination with genetic markers. Based on a study of a large spread family ("family") with multiple cases of breast cancer (and ovarian cancer cases in some families), the precise location of the chromosomal region including the BRCA1 gene and other possible susceptibility alleles at the BRCA1 locus. Position. Two mitotic breakpoints were found as recombination between the genetic marker and the disease and at the end of the BRCA1 locus, which is expressed as one recombination proximal to the BRCA1 locus. Thus, the region containing the BRCA1 locus physically borders these markers.

　本発明により提供される遺伝子マーカーの使用は、ヒト酵母人工染色体(ＹＡＣ)またはヒト細菌人工染色体(ＢＡＣ)ライブラリーからの領域をカバーするクローンの同定を許容する。また、この領域からのより簡便に操作したコスミド、Ｐ１およびＢＡＣクローンの同定および調製、ならびにサブセットのクローンからのコンチグ(contig)の構築も許容する。これらのコスミド、Ｐ１、ＹＡＣおよびＢＡＣは、ＢＲＣＡ１遺伝子座のクローニングの基礎を提供し、例えば、乳癌および／または卵巣癌の診断および治療に有効な試薬を開発する基礎を提供する。ＢＲＣＡ１遺伝子および他の可能性のある感受性遺伝子はこの領域から単離した。単離は、ｃＤＮＡライブラリーをスクリーニングする領域において、コスミド、Ｐ１およびＢＡＣからの全体または部分的ｃＤＮＡインサートと共に、ソフトウェア・トラッピング(連続的または非連続的ゲノムＤＮＡ配列から、コードエキソンを含んでいそうな配列を同定するコンピュータ的方法)、ハイブリッド選抜技術および直接的スクリーニングを用いて行った。これらの方法を用いて、乳房および他の組織中に発現される遺伝子座の配列を得た。これらの候補遺伝子座を分析して、癌感受性を供する配列を同定した。本発明者らは、ＢＲＣＡ１として知られている１７ｑ-連鎖癌感受性の原因となる家系において、ＢＲＣＡ１遺伝子座のコード配列中に突然変異が存在することを発見した。この遺伝子がこの領域中に存在することは知られていなかった。本発明は、特定の癌の早期検出を容易にして患者の生存に活力を与えるのみならず、感受性の個人が癌を発症する前に彼らを検出することもできる。使用 The use of the genetic markers provided by the present invention allows the identification of clones covering regions from human yeast artificial chromosome (YAC) or human bacterial artificial chromosome (BAC) libraries. It also allows the identification and preparation of more easily manipulated cosmid, P1 and BAC clones from this region, and the construction of contigs from subsets of clones. These cosmids, P1, YAC and BAC, provide the basis for the cloning of the BRCA1 locus, for example, to develop effective reagents for the diagnosis and treatment of breast and / or ovarian cancer. The BRCA1 gene and other potential susceptibility genes were isolated from this region. Isolation is performed by software trapping (from a continuous or non-contiguous genomic DNA sequence, likely to include coding exons, along with whole or partial cDNA inserts from cosmids, P1 and BACs in the region where the cDNA library is screened. Computer method to identify unique sequences), hybrid selection techniques and direct screening. Using these methods, the sequences of loci expressed in breast and other tissues were obtained. These candidate loci were analyzed to identify sequences that confer cancer susceptibility. The present inventors have found that there is a mutation in the coding sequence of the BRCA1 locus in a family responsible for 17q-linked cancer susceptibility known as BRCA1. This gene was not known to be present in this region. The present invention not only facilitates the early detection of certain cancers and energizes the survival of patients, but can also detect susceptible individuals before they develop cancer.

母集団-源
　広くよく記録されているユタ州の家系は、ヒト遺伝学研究の良好な入手源を提供する点において特に重要である。各大きな家系は、独立して、ＢＲＣＡ１感受性対立遺伝子がその家族中で分離しているか否かを決定する能力を提供する。ＢＲＣＡ１遺伝子座の位置決定および単離に関する組換え情報性は、感受性対立遺伝子の存在を確認するのに十分に大きな家系からのみ得ることができた。大きな兄弟姉妹は乳癌を研究する上で特に重要である。なぜならば、ＢＲＣＡ１感受性対立遺伝子の浸透度が年齢および性別の両方によって減じられ、情報的兄弟姉妹を発見することを困難としているためである。さらに、大きな兄弟姉妹はその接近した血縁のハロタイプからの影響によって、死亡した個人のハロタイプを構築するのに必須である。 Population-Sources Widely documented Utah families are particularly important in providing a good source of human genetics research. Each large pedigree independently provides the ability to determine whether the BRCA1 susceptibility allele is segregated in its family. Recombinational informa- tion for the location and isolation of the BRCAl locus could only be obtained from families large enough to confirm the presence of the susceptible allele. Large siblings are particularly important in studying breast cancer. This is because the penetrance of the BRCA1 sensitive allele is reduced by both age and gender, making it difficult to find informative siblings. In addition, large siblings are essential to constructing haplotypes for deceased individuals due to the effects of their close relative haplotypes.

　他の母集団も有益な情報を提供し得るが、かかる研究には一般的により大きな努力を要し、家族は通常遥かに小さく、それ故、あまり情報を得ることができない。ユタ州の年齢を調整した乳癌発症率は２０％で、平均米国の比率よりも低い。ユタ州における低い発症率は、恐らく、大部分は、最初の妊娠の低年齢によるもので、遺伝的病気素因を運ぶユタ州の家系にそのケースが見出される確率は上昇する。 Other populations can provide useful information, but such studies generally require more effort, and families are usually much smaller, and therefore have less information. Utah's age-adjusted breast cancer incidence rate is 20%, lower than the average US rate. The low incidence in Utah is probably due largely to the young age of the first pregnancy, increasing the likelihood of finding the case in Utah kindreds who carry a genetic predisposition.

遺伝子マッピング
　情報的な家族の組が与えられれば、疾病を染色体の領域に連鎖するために遺伝マーカーは必須である。かかるマーカーには、制限断片長多形(ＲＥＬＰ)(Ｂotsteinら,1980)、変動する数の縦列反復を有するマーカー(ＶＮＴＲ)(Ｊeffreysら，1985；Ｎakamuraら，1987)、および短縦列反復(ＳＴＲ)、特にＣｐＡの反復(ＷeberおよびＭay，1989；Ｌittら，1989)に基づく豊富なクラスのＤＮＡ多形が含まれる。遺伝子地図を作製するためには、潜在的な遺伝子マーカーを選抜し、研究する家系構成員から抽出したＤＮＡを用いてそれらを試験する。 Genetic Mapping Given an informative family set, genetic markers are essential for linking disease to chromosomal regions. Such markers include restriction fragment length polymorphism (RELP) (Botstein et al., 1980), markers with a variable number of tandem repeats (VNTR) (Jeffreys et al., 1985; Nakamura et al., 1987), and short tandem repeats (STR). ), Especially a rich class of DNA polymorphisms based on CpA repeats (Weber and May, 1989; Litt et al., 1989). To generate a genetic map, potential genetic markers are selected and tested using DNA extracted from the members of the family to be studied.

　疾病と関連する遺伝子座を探索するのに有用な遺伝子マーカーは、特異的染色体を稠密にカバーするか、染色体の特異的領域の詳細な分析による特にこの問題に基づいて選抜し得る。疾病と連鎖する遺伝マーカーを選抜する好ましい方法には、家系の情報性の程度を評価して所与の程度の多形の遺伝子マーカーの間の理想的な距離を決定し、ついで、最大の効率で理想的に離れた公知の遺伝子地図からマーカーを選抜することが含まれる。家系の情報性は、該マーカーが無関係な個人においてヘテロ接合体である確率によって測定する。また、ＰＣＲを用いた標的核酸配列の増幅によって検出したＳＴＲマーカーを用いることが最も効率的であり；かかるマーカーは非常に情報性が高く、アッセイし易く(ＷeberおよびＭay,1989)、複合戦略を用いて同時にアッセイし得(ＳkolnickおよびＷallace，1988)、要する実験数を顕著に低減し得る。遺伝子 Genetic markers useful for locating loci associated with disease can either cover specific chromosomes densely, or be selected based on this problem in particular by detailed analysis of specific regions of the chromosomes. A preferred method of selecting genetic markers linked to disease involves assessing the degree of informativeness of a family to determine the ideal distance between genetic markers of a given degree of polymorphism, and then maximizing efficiency. And selecting a marker from a known genetic map that is ideally distant. The informativeness of a family is measured by the probability that the marker is heterozygous in unrelated individuals. Also, it is most efficient to use STR markers detected by amplification of the target nucleic acid sequence using PCR; such markers are very informative, easy to assay (Weber and May, 1989), and allow for complex strategies. And can be assayed simultaneously (Skolnick and Wallace, 1988), which can significantly reduce the number of experiments required.

　連鎖性が確立されたら、疾病遺伝子座に隣接するマーカー、すなわち、該疾病遺伝子座に近い１または２以上のマーカー、および該疾病遺伝子座に対し基部側の１または２以上のマーカーを見付ける必要がある。可能ならば、公知の遺伝子地図から候補マーカーを選抜し得る。知られているものがない場合には、実施例で示すＳＴＲ技術によって新たなマーカーを同定し得る。 Once linkage has been established, it is necessary to find a marker adjacent to the disease locus, ie, one or more markers close to the disease locus and one or more markers proximal to the disease locus. is there. If possible, candidate markers can be selected from a known genetic map. If none is known, new markers can be identified by the STR technique shown in the examples.

　遺伝子マッピングは通常は反復的工程である。本発明においては、ＢＲＣＡ１遺伝子座の周りの隣接遺伝子マーカーを画定し、ついで、これらの隣接マーカーをＢＲＣＡ１遺伝子座に首尾よく近い他のマーカーに置き換えることによってそれを開始する。最初の工程、組換え事象では、広範な家系によって画定して、特異的な遺伝子マーカーから離れているか近いかとして、ＢＲＣＡ１遺伝子座を特異的に位置決定することを補助する(Ｇoldgarら，1994)。 Gene mapping is usually an iterative process. In the present invention, one begins by defining flanking genetic markers around the BRCA1 locus and then replacing those flanking markers with other markers that are successfully close to the BRCA1 locus. The first step, a recombination event, is defined by a broad pedigree and assists in specifically locating the BRCA1 locus as being away from or near a specific genetic marker (Goldgar et al., 1994). .

　本発明が開示されるまでは、ＢＲＣＡ１を囲む領域はよくマッピングされておらず、マーカーもほとんどなかった。したがって、物理的にマッピングされたＹＡＣからサブクローン化したコスミド上の短い反復配列を分析して、新たな遺伝子マーカーを開発した。このアプローチを用いて、本発明の１つのマーカー、４２Ｄ６が発見され、これは、ＢＲＣＡ１領域用の末端側隣接マーカーとしてｐＣＭＭ８６で置換した。４２Ｄ６はｐＣＭＭ８６からほぼ１４ｃＭに存在するため、それ故、ＢＲＣＡ１領域はほぼ１４センチモルガン分減少された(Ｅastonら，1993)。かくして、本発明は、ＢＲＣＡ１領域のより接近して連鎖した末端側隣接マーカーを見出すことによって開始した。ついで、ＢＲＣＡ１は、遺伝子マーカーＭfdl５に対して末端側に存在することを発見した。したがって、ＢＲＣＡ１は、Ｍfdl５および４２Ｄ６と境を接する６Ｍｂｐ〜１０Ｍｂｐの領域に存在することが示された。つづいて、マーカーＭfdl９lはＭfdl５から末端側であって、ＢＲＣＡ１から基部側にあることを発見した。かくして、Ｍdfl５を、最も基部側の遺伝子マーカーとしてＭfdl９lで置換した。同様にして、遺伝子マーカーＭfdl８８は、ＢＲＣＡ１遺伝子座を含む領域をほぼ１.５Ｍｂまで狭める、遺伝子マーカー４２Ｄ６を置換し得ることを発見した。ついで、当該分野で知られており、かつ本明細書に記載した技術を用いて、マーカーＭfdl9lを基部側マーカーとしてのtdj1474で置換し、Ｍfdl88を末端側マーカーとしてのＵ５Ｒで置き換えて、ＢＲＣＡ１遺伝子座を単離し、特徴付けを得るに十分に小さい領域までＢＲＣＡ１領域を狭めた(図３参照)。まで Until the present invention was disclosed, the region surrounding BRCA1 was poorly mapped and had few markers. Therefore, a new genetic marker was developed by analyzing short repetitive sequences on cosmids subcloned from physically mapped YACs. Using this approach, one marker of the invention, 42D6, was discovered, which was replaced with pCMM86 as the terminal flanking marker for the BRCA1 region. Since 42D6 is located approximately 14 cM from pCMM86, the BRCA1 region has therefore been reduced by approximately 14 cM (Easton et al., 1993). Thus, the present invention has begun by finding a more closely linked distal flanking marker of the BRCA1 region. Next, BRCA1 was found to be located on the terminal side with respect to the genetic marker Mfdl5. Therefore, it was shown that BRCA1 exists in a region of 6 Mbp to 10 Mbp bordering on Mfdl5 and 42D6. Subsequently, the marker Mfdl91 was found to be distal to Mfdl5 and proximal to BRCA1. Thus, Mdfl5 was replaced with Mfdl91 as the most proximal gene marker. Similarly, it has been discovered that the genetic marker Mfdl88 can replace the genetic marker 42D6, which narrows the region containing the BRCA1 locus to approximately 1.5 Mb. Then, using the techniques known in the art and described herein, the marker Mfdl91 was replaced with tdj1474 as a proximal marker and Mfdl88 was replaced with U5R as a terminal marker, resulting in a BRCA1 locus. Was isolated and the BRCA1 region narrowed to a region small enough to obtain characterization (see FIG. 3).

物理的マッピング
　３つの異なる方法を用いて該領域を物理的にマッピングした。第一のものは、ｔｄｊ１４７４およびＵ５Ｒによって隣接して挟まれた領域をクローン化するための酵母人工染色体(ＹＡＣ)の使用であった。第二のものは、ＢＲＣＡ１遺伝子座を含む領域をカバーするＰ１、ＢＡＣおよびコスミドクローンのセットの作製であった。 Physical Mapping The area was physically mapped using three different methods. The first was the use of a yeast artificial chromosome (YAC) to clone the region flanked by tdj1474 and U5R. The second was the generation of a set of P1, BAC and cosmid clones covering the region containing the BRCA1 locus.

　酵母人工染色体(ＹＡＣ)
　ＢＲＣＡ１遺伝子座を含む十分に小さな領域を同定したら、該領域をカバーする重複ＹＡＣのセットを同定することによって、該領域中のＤＮＡの物理的単離を続行した。有用なＹＡＣは、各々、広範に分布し、ほぼ５０,０００のＹＡＣを含むＳt.LouisおよびＣＥＰＨ　ＹＡＣライブラリーのごとき公知のライブラリーから単離し得る。ＹＡＣをこれらの公的にアクセス可能なライブラリーから単離し、Ｍichigan Ｇenome Ｃenterを含む多数の供給源から得ることができる。明らかに、これらのＹＡＣにアクセスしたものは、本発明を開示することなしに、本発明者らが選択した特異的ＹＡＣの価値を理解しなかったであろう。なぜならば、彼らは、ＢＲＣＡ１遺伝子座を含む最小の領域の中にどのＹＡＣが存在し、どのＹＡＣがその外側に存在するかということを理解しなかったであろうからである。 Yeast artificial chromosome (YAC)
Once a sufficiently small region containing the BRCA1 locus was identified, the physical isolation of DNA in the region was continued by identifying the set of overlapping YACs covering the region. Useful YACs can be isolated from known libraries, such as the St. Louis and CEPH YAC libraries, each of which is widely distributed and contains approximately 50,000 YACs. YACs can be isolated from these publicly accessible libraries and obtained from a number of sources, including the Michigan Genome Center. Obviously, those accessing these YACs would not have understood the value of the specific YACs we selected without disclosing the present invention. Because they would not have understood which YACs were in the smallest region containing the BRCA1 locus and which were outside.

　コスミド、Ｐ１およびＢＡＣクローン
　本発明においては、コスミド、Ｐ１およびＢＡＣクローンにより続行してこの領域をカバーすることが有利である。ＹＡＣインサートと比較してより小さなサイズのこれらのインサートは、特異的ハイブリダイゼーションプローブとしてそれをより有用としている。さらに、酵母細胞よりもむしろ細菌細胞中にクローン化ＤＮＡを有していれば、目的のＤＮＡを操作し得る簡便性が大きく上昇し、ハイブリダイゼーション・アッセイのノイズに対する信号の比が改善される。ＹＡＣのコスミドサブクローンについては、該ＤＮＡを制限酵素Ｓau３Ａで部分消化し、ｐＷＥ１５コスミドベクター(Ｓtratagene社，カタログ番号1251201)のＢamＨＩ部位にクローン化する。ヒト配列を含むコスミドは、実施例に詳記するごとく、ヒト反復ＤＮＡ(例えば、Ｇibco/ＢＲＬ社、ヒトＣ_０ｔ-１ＤＮＡ、カタログ番号5279Ａ)とのハイブリダイゼーションによってスクリーニングし、ついで、種々の技術によってフィンガープリンティングする。 Cosmid, P1 and BAC clones In the present invention, it is advantageous to continue with this region by cosmid, P1 and BAC clones. These inserts, which are smaller in size compared to the YAC insert, make it more useful as a specific hybridization probe. In addition, having the cloned DNA in bacterial cells rather than yeast cells greatly increases the ease with which the DNA of interest can be manipulated and improves the signal to noise ratio of the hybridization assay. For the cosmid subclone of YAC, the DNA is partially digested with the restriction enzyme Sau3A and cloned into the BamHI site of the pWE15 cosmid vector (Stratagene, catalog number 1251201). Cosmids containing human sequences, as will be detailed in Examples, human repetitive DNA (e.g., Gibco / BRL, Inc., human C _{0 t-1} DNA, Catalog No. 5279A) was screened by hybridization with, then various Fingerprinting by technology.

　Ｐ１およびＢＡＣクローンは、前記のごとく単離した、ＹＡＣ、コスミドまたはＰ１およびＢＡＣ由来の特異配列標識部位(ＳＴＳ)で全ヒトゲノムから構築したライブラリーをスクリーニングすることによって得る。 P1 and BAC clones are obtained by screening libraries constructed from the entire human genome with YACs, cosmids or specific sequence tag sites (STSs) derived from P1 and BAC, isolated as described above.

　これらのＰ１、ＢＡＣおよびコスミドクローンは、散在反復配列(ＩＲＳ)ＰＣＲおよび／または制限酵素消化につづくゲル電気泳動、および得られたＤＮＡフラグメントの比較(フィンガープリント)(Ｍaniatisら,1982)によって比較し得る。該クローンは、また、ＳＴＳの存在によっても特徴付け得る。該フィンガープリントを用いて、該領域をカバーするが冗長すぎないクローンの重複隣接セット(本明細書においては、「最小限タイル路(minimum tiling path)という」)を画定する。かかる最小限タイル路は、つづく実験の基礎を形成し、ＢＲＣＡ１遺伝子座由来となり得るｃＤＮＡを同定する。 These P1, BAC and cosmid clones were compared by interspersed repeat (IRS) PCR and / or gel electrophoresis following restriction enzyme digestion and comparison of the resulting DNA fragments (fingerprint) (Maniatis et al., 1982). obtain. The clone may also be characterized by the presence of STS. The fingerprint is used to define an overlapping contiguous set of clones that cover the region but are not too redundant (herein referred to as "minimum tiling path"). Such minimal tile tracts form the basis for subsequent experiments and identify cDNAs that could be derived from the BRCA1 locus.

　Ｐ１およびＢＡＣクローンでのギャップの適用範囲
　ゲノミッククローンを有する同定コスミド間のＢＲＣＡ１コンチグ(contig)中のいずれのギャップもカバーするために、Ｐ１用のコスミドよりもほぼ２倍大きく、ＢＡＣについてはなおより大きなゲノミックＤＮＡのインサートを含むＢＡＣベクターとＰ１中のクローン(Ｓternberg，1990；Ｓternbergら,1990；Ｐierceら，1992；Ｓhizuyaら，1992)とを用いた。Ｐ１クローンは、スクリーニング用に本発明らによって提供されるＰＣＲプライマーを用いてＧenome Ｓciences社によって単離した。ＢＡＣは、Ｄr.Ｍel Ｓimon's laboratoryにおけるハイブリダイゼーション技術によって得た。Ｐ１クローンを用いる戦略により、ＹＡＣ由来でないクローンの独立セットでゲノム領域をカバーすることも許容される。これは、検出されていないＹＡＣ中の他の欠失の可能性に対して保護する。Ｐ１クローン由来のこれらの新たな配列は、以下に記載するごとく、候補遺伝子をさらにスクリーニングするための材料を提供する。 Coverage of gaps in P1 and BAC clones To cover any gaps in the BRCA1 contig between identified cosmids with genomic clones, it is almost twice as large as the cosmid for P1, and even more so for BAC. A BAC vector containing a large genomic DNA insert and a clone in P1 (Sternberg, 1990; Sternberg et al., 1990; Pierce et al., 1992; Shizuya et al., 1992) were used. The P1 clone was isolated by Genome Sciences using the PCR primers provided by the present inventors for screening. BAC was obtained by a hybridization technique in Dr. Mel Simon's laboratory. The strategy using P1 clones also allows to cover the genomic region with an independent set of clones not derived from YAC. This protects against possible other deletions in the YAC that have not been detected. These new sequences from the P1 clone provide material for further screening for candidate genes, as described below.

遺伝子単離
　単離しようと試行する遺伝子座のコード配列の候補となりそうな配列の存在につきゲノミッククローンを試験する多くの技術が存在し、これには、限定するものではないが：
ａ．ズー・ブロット(zoo blot)
ｂ．ＨＴＦ・アイランド(island)の同定
ｃ．エキソントラッピング
ｄ．コスミドまたはＹＡＣへのｃＤＮＡのハイブリダイゼーション
ｅ．ｃＤＮＡライブラリーのスクリーニング
が含まれる。
　(ａ)ズー・ブロット　第一の技術はコスミドをサザンブロットにハイブリダイズさせて進化の過程で保存され、従って、ヒトに対し種々の程度の関係を有する種(サル、ウシ、ニワトリ、ブタ、マウスおよびラットのごとき)からのＤＮＡと陽性のハイブリダイゼーション信号を与えるＤＮＡ配列を同定する。種々の種からのかかるＤＮＡを含むサザンブロットは市販されている(Ｃlonetech社，カタログ番号7753-1)。
　(ｂ)ＨＴＦアイランドの同定　第二の技術には、ヌクレオチドＣおよびＧに富む領域を見出すことが含まれ、この領域はしばしばコード配列の付近またはその中に生じる。かかる配列は、これらの領域において頻繁に切断されるＣｐＧ二量体を含む部位に特異的な制限酵素として、ＨＴＦ(ＨpaＩ小フラグメント)またはＣｐＧアイランドと呼称される(Ｌindsayら，1987)。
　(ｃ)エキソントラッピング　第三の技術は、スプライス結合部を含有し、したがって遺伝子のコード配列を含んでいそうなゲノミックＤＮＡ中の配列を同定する方法、エキソントラッピングである。エキソン増幅(Ｂucklerら，1991)を用いて、前記したＤＮＡクローンからエキソンを選抜し、増幅する。エキソン増幅は、機能性５'および／または３'スプライス部位によって隣接して挟まれたＲＮＡ配列の選抜に基づいている。さらなる研究用の処理可能な数の候補遺伝子を同定するために、エキソン増幅の産物を用いて乳癌ｃＤＮＡライブラリーをスクリーニングする。エキソントラッピングは、コンピュータプログラムを用いた配列決定ＤＮＡの小セグメントで、またはソフトウェア捕捉によっても行い得る。
　(ｄ)コスミド、Ｐ１、ＢＡＣまたはＹＡＣに対してハイブリダイズする
ｃＤＮＡ　第四の技術は、コスミド、Ｐ１、ＢＡＣまたはＹＡＣに対するｃＤＮＡのハイブリダイゼーションを利用し、転写された配列がクローン化ゲノムＤＮＡ中に同定され、かつ、それから回収されるのを可能とする選択的富化技術の修飾法である(Ｋandpalら，1990)。本目的に修飾した選択的富化技術には、ＹＡＣ中に存在するＢＲＣＡ１の領域からのＤＮＡをカラムマトリックスに結合させ、ついで該結合ＤＮＡとハイブリダイズする適当なライブラリーからｃＤＮＡを選抜し、つづいて該結合ＤＮＡを増幅させて精製することが含まれ、クローン化ゲノムＤＮＡによって代表される領域中のｃＤＮＡが非常に増大される。
　(ｅ)ｃＤＮＡの同定　第五の技術は、ＢＲＣＡ１遺伝子座に対応するｃＤＮＡを同定することである。前記した技術のいずれかを用いて選抜した、予想コード配列を含むハイブリダイゼーション・プローブを用いて、乳房組織ｃＤＮＡライブラリー、卵巣ｃＤＮＡライブラリーおよびいずれかの他の必要なライブラリーを包含する種々のライブラリーをスクリーニングする。 Gene Isolation There are a number of techniques for testing genomic clones for the presence of sequences that are likely to be candidate coding sequences for the locus to be isolated, including but not limited to:
a. Zoo blot
b. Identification of HTF island
c. Exon trapping
d. Hybridization of cDNA to cosmid or YAC
e. Screening of a cDNA library is included.
(a) Zoo-blot The first technique is to hybridize a cosmid to a Southern blot and preserve it during evolution, and thus have a varying degree of relationship to humans (monkeys, cows, chickens, pigs, mice). And a DNA sequence that gives a positive hybridization signal to DNA from DNA (such as rat). Southern blots containing such DNA from various species are commercially available (Clonetech, Cat. No. 7753-1).
(b) HTF Island Identification A second technique involves finding a region rich in nucleotides C and G, which often occurs near or in the coding sequence. Such sequences are referred to as HTFs (HpaI small fragments) or CpG islands as restriction enzymes specific for sites containing CpG dimers that are frequently cleaved in these regions (Lindsay et al., 1987).
(c) Exon trapping The third technique is exon trapping, a method for identifying sequences in genomic DNA that contain splice junctions and therefore likely contain the coding sequence of a gene. Using exon amplification (Buckler et al., 1991), exons are selected from the above DNA clones and amplified. Exon amplification is based on the selection of RNA sequences flanked by functional 5 'and / or 3' splice sites. The product of the exon amplification is used to screen a breast cancer cDNA library to identify a processable number of candidate genes for further study. Exon trapping may be performed on small segments of sequencing DNA using a computer program or by software capture.
(d) cDNA hybridizing to cosmid, P1, BAC or YAC A fourth technique utilizes hybridization of cDNA to cosmid, P1, BAC or YAC, and the transcribed sequence is cloned into cloned genomic DNA. It is a modification of a selective enrichment technique that allows it to be identified and recovered from it (Kandpal et al., 1990). The selective enrichment technique modified for this purpose involves binding DNA from the BRCA1 region present in the YAC to a column matrix, then selecting cDNA from a suitable library that hybridizes with the bound DNA, followed by And amplifying and purifying the bound DNA, thereby greatly increasing the cDNA in the region represented by the cloned genomic DNA.
(e) Identification of cDNA The fifth technique is to identify the cDNA corresponding to the BRCA1 locus. Using hybridization probes containing the predicted coding sequence selected using any of the techniques described above, a variety of libraries, including breast tissue cDNA libraries, ovarian cDNA libraries, and any other necessary libraries, may be used. Screen the library.

　また、主題のｃＤＮＡの直接的選抜の他の変形を用いても、ＢＲＣＡ１の候補遺伝子を見い出した(Ｌovettら，1991；Ｆutreal，1993)。この方法は、コスミド、Ｐ１またはＢＡＣＤＮＡをプローブとして用いる。プローブＤＮＡは、ＨaeIIIのごとき平滑切断制限酵素で消化する。ついで、二本鎖アダプターを該ＤＮＡに連結し、これはビオチン化プライマーを用いる続くＰＣＲ増幅反応においてプライマーの結合部位として作用する。標的ｃＤＮＡは、第一鎖のランダム起点合成またはオリゴ(ｄＴ)起点合成のいずれかの合成につづく第二鎖合成によって、組織試料、例えば、乳房組織由来のｍＲＮＡから作製する。ｃＤＮＡ末端を平滑にし、二本鎖アダプターに連結する。これらのアダプターは、ＰＣＲ用の増幅部位として作用する。標的およびプローブ配列を変性させ、ヒトＣ_０ｔ-１ＤＮＡと混合して反復配列を遮断する。溶液ハイブリダイゼーションを高Ｃ_０ｔ-１/２値として、稀な標的ｃＤＮＡ分子のハイブリダイゼーションを保証する。ついで、アニーリングした材料をアビジンビーズ上に捕捉し、高ストリンジェンシーで洗浄し、保持されたｃＤＮＡを溶出し、ＰＣＲによって増幅する。選抜したｃＤＮＡは、分析用のプラスミドベクターにクローニングする前に増大のさらなるラウンドに付す。 Other variants of direct selection of the subject cDNA have also been used to find candidate genes for BRCA1 (Lovett et al., 1991; Futreal, 1993). This method uses cosmid, P1 or BAC DNA as a probe. The probe DNA is digested with a blunt restriction enzyme such as HaeIII. A double-stranded adapter is then ligated to the DNA, which acts as a primer binding site in a subsequent PCR amplification reaction using biotinylated primers. Target cDNA is generated from a tissue sample, eg, mRNA from breast tissue, by either first-strand random or oligo (dT) -origin synthesis followed by second-strand synthesis. The ends of the cDNA are made blunt and ligated to a double-stranded adapter. These adapters act as amplification sites for PCR. Denaturing the target and probe sequences, blocking the repetitive sequences was mixed with human C _{0 t-1} DNA. Solution hybridization is set to a high C ₀ t-1 / 2 value to ensure hybridization of rare target cDNA molecules. The annealed material is then captured on avidin beads, washed with high stringency, and the retained cDNA is eluted and amplified by PCR. The selected cDNA is subjected to a further round of expansion before cloning into a plasmid vector for analysis.

候補性についてのｃＤＮＡの試験
　ｃＤＮＡが、異常ＢＲＣＡ１遺伝子産物または異常なレベルのＢＲＣＡ１遺伝子産物を生成する羅患された家系構成員から抽出したＤＮＡ中に配列を見出すことによって得られるＢＲＣＡ１遺伝子座であることを立証する。かかるＢＲＣＡ１感受性対立遺伝子は、広範な家系中で該疾病に関し共-分離しているであろう。それは、また、乳癌および卵巣癌を有する非-家系個人、ついで一般集団中の個人において、より高頻度で存在するであろう。最後に、腫瘍は、他の例においては生殖細胞系で突然変異する遺伝子座でしばしば体細胞突然変異するため、本発明者らは、腫瘍組織から抽出したＤＮＡ中のＢＲＣＡ１感受性対立遺伝子と同一または同様である配列に突然変異誘発した正常な生殖細胞系ＢＲＣＡ１対立遺伝子を見出すことが期待される。腫瘍組織からのＢＲＣＡ１配列を同一個人の生殖細胞系からのＢＲＣＡ１対立遺伝子と比較するか、癌ケースからの生殖細胞系ＢＲＣＡ１対立遺伝子を非羅患個人からのものと比較するかのいずれにせよ、遺伝子産物の正常機能を明らかに破壊するに十分に重大である突然変異を見出すことが鍵となる。これらの突然変異は多種の形態を採り得る。最も重大な形態はフレームシフト突然変異または広範な欠失であり、これらは、遺伝子に、異常蛋白質をコードさせるか、または重大に変化した蛋白質を発現させるであろう。より重大でない破壊的突然変異には、小規模な枠内欠失および非保存性塩基対置換が含まれ、これらは、システイン残基へのまたはシステイン残基からの変化、塩基性アミノ酸から酸性アミノ酸への変化またはその反対、疎水性アミノ酸から親水性アミノ酸への変化またはその反対、あるいは、蛋白質の二次、三次または四次の構造に影響するであろう他の突然変異のごとき、産生蛋白質に重大な影響を及ぼすであろう。サイレント突然変異または保存性アミノ酸置換を生じるものは、一般的に蛋白質機能を破壊するとは予想されない。 Testing the cDNA for Candidateness The cDNA is the BRCA1 locus obtained by finding sequences in DNA extracted from affected family members that produce abnormal BRCA1 gene products or abnormal levels of BRCA1 gene products. Prove that. Such BRCA1 susceptibility alleles will be co-segregating for the disease in a wide variety of kindreds. It will also be more common in non-family individuals with breast and ovarian cancer, then in individuals in the general population. Finally, since tumors are often somatically mutated in other instances at germline mutated loci, we have identified the same or the same as the BRCA1 sensitive allele in DNA extracted from tumor tissue. It is expected to find normal germline BRCA1 alleles that have been mutagenized to similar sequences. Whether comparing BRCA1 sequences from tumor tissue to BRCA1 alleles from the germline of the same individual, or comparing germline BRCA1 alleles from cancer cases to those from non-affected individuals, The key is to find mutations that are severe enough to disrupt the normal function of the gene product. These mutations can take many forms. The most serious forms are frameshift mutations or widespread deletions, which will cause the gene to encode an abnormal protein or to express a significantly altered protein. Less severe disruptive mutations include small in-frame deletions and non-conservative base pair substitutions, which include changes to or from cysteine residues, from basic amino acids to acidic amino acids. To or from a hydrophobic amino acid to a hydrophilic amino acid, or vice versa, or other mutations that may affect the secondary, tertiary or quaternary structure of the protein. Will have a significant impact. Those that produce silent mutations or conservative amino acid substitutions are generally not expected to disrupt protein function.

　本発明の診断および予診によれば、野生型ＢＲＣＡ１遺伝子座の変化が検出される。加えて、該方法は、野生型ＢＲＣＡ１遺伝子座を検出し、ＢＲＣＡ１遺伝子座に癌の素因の欠失を確認することによって行い得る。「野生型遺伝子の変化」とは、コード領域および非コード領域における欠失、挿入および点突然変異を含むすべての形態の突然変異が包含される。欠失は、遺伝子全体のものであるか、または遺伝子の一部分のみのものであり得る。点突然変異は終止コドン、フレームシフト突然変異またはアミノ酸置換を生じ得る。体細胞突然変異は、特定の組織、例えば、腫瘍組織でのみ発生するものであり、生殖細胞系において遺伝されない。生殖細胞系突然変異は体のいずれの組織においても見出すことができ、遺伝される。単一の対立遺伝子のみが体細胞的に突然変異した場合、初期新生生物状態が示される。しかしながら、両方の対立遺伝子が体細胞的に突然変異した場合、後期の新生生物状態が示される。かくして、ＢＲＣＡ１突然変異の知見は、診断および予診の情報を両方提供する。欠失していないＢＲＣＡ１対立遺伝子(例えば、姉妹染色体からＢＲＣＡ１欠失を運ぶ染色体の姉妹染色体で見出された)は、挿入、小さな欠失および点突然変異のごとき他の突然変異につきスクリーニングし得る。腫瘍組織において見出された多くの突然変異はＢＲＣＡ１遺伝子産物の発現を低下に通じるものであろうと考えられる。しかしながら、非-機能的遺伝子産物に通じる突然変異も、癌にかかった状態に通じるであろう。点突然変異事象は、遺伝子のプロモーターでのごとき、調節領域中で起こり得、ｍＲＮＡの発現の欠失または減少に通じる。点突然変異も、また、適当なＲＮＡプロセシングを破壊し得、ＢＲＣＡ１遺伝子産物の発現の欠失、あるいは、ｍＲＮＡ安定性または翻訳効率の低下に通じる。 According to the diagnosis and the preliminary diagnosis of the present invention, a change in the wild-type BRCA1 locus is detected. In addition, the method can be performed by detecting the wild-type BRCA1 locus and confirming the lack of a predisposition to cancer at the BRCA1 locus. "Wild-type gene alterations" includes all forms of mutations, including deletions, insertions and point mutations in coding and non-coding regions. Deletions can be of the entire gene or only a portion of the gene. Point mutations can result in stop codons, frameshift mutations or amino acid substitutions. Somatic mutations occur only in certain tissues, such as tumor tissues, and are not inherited in the germline. Germline mutations can be found in any tissue of the body and are inherited. If only a single allele is somatically mutated, an early neoplastic state is indicated. However, if both alleles are somatically mutated, a late neoplastic state is indicated. Thus, the finding of a BRCA1 mutation provides both diagnostic and prognostic information. Undeleted BRCA1 alleles (eg, found on the sister chromosome of a chromosome carrying a BRCA1 deletion from a sister chromosome) can be screened for other mutations such as insertions, small deletions, and point mutations. . It is believed that many mutations found in tumor tissue will lead to reduced expression of the BRCA1 gene product. However, mutations that lead to non-functional gene products will also lead to cancerous conditions. Point mutation events can occur in regulatory regions, such as at the promoter of a gene, leading to a loss or decrease in mRNA expression. Point mutations can also disrupt proper RNA processing, leading to a loss of expression of the BRCA1 gene product or a decrease in mRNA stability or translation efficiency.

　有用な診断技術には、限定するものではないが、さらに以下で詳細に論じる蛍光イン・サイチュ(in situ)ハイブリダイゼーション(ＦＩＳＨ)、直接ＤＮＡ配列決定、ＰＦＧＥ分析、サザンブロット分析、一本鎖構造解析(ＳＳＣＡ)、ＲＮアーゼ保護アッセイ、対立遺伝子-特異的オリゴヌクレオチド(ＡＳＯ)、ドットブロット分析およびＰＣＲ-ＳＳＣＰが包含される。 Useful diagnostic techniques include, but are not limited to, fluorescence in situ hybridization (FISH), direct DNA sequencing, PFGE analysis, Southern blot analysis, single-stranded structure, discussed in more detail below. Analysis (SSCA), RNase protection assay, allele-specific oligonucleotide (ASO), dot blot analysis and PCR-SSCP are included.

　乳癌および卵巣癌および本明細書で同定した他の癌のごとき癌の素因は、ＢＲＣＡ１遺伝子の突然変異についてヒトのいずれかの組織を試験することによって確認し得る。例えば、生殖細胞系ＢＲＣＡ１突然変異を遺伝した個人は、癌を発症し易い傾向であろう。これは、該個人の体のいずれかの組織からのＤＮＡを試験することによって決定し得る。最も単純には、採血しその血液の細胞からＤＮＡを抽出する。加えて、ＢＲＣＡ１遺伝子の突然変異について、胎児細胞、胎盤細胞または羊膜細胞を試験することによっても出生前診断を行い得る。点突然変異または欠失のいずれによるにせよ、野生型ＢＲＣＡ１対立遺伝子の変化は、本明細書で論じるいずれかの手段によって検出し得る。癌 Cancer predisposition, such as breast and ovarian cancer and other cancers identified herein, can be confirmed by testing any human tissue for a mutation in the BRCA1 gene. For example, individuals who have inherited the germline BRCA1 mutation will be predisposed to developing cancer. This can be determined by testing DNA from any tissue of the individual's body. Most simply, blood is collected and DNA is extracted from cells of the blood. In addition, prenatal diagnosis may be made by testing fetal, placental or amniotic cells for BRCA1 gene mutations. Changes in the wild-type BRCA1 allele, whether due to point mutations or deletions, can be detected by any of the means discussed herein.

　ＤＮＡ配列変動を検出するのに用い得る幾つかの方法が存在する。手動配列決定または自動化蛍光配列決定のいずれかの直接ＤＮＡ配列決定は、配列変動を検出し得る。ＢＲＣＡ１ほど大きな遺伝子については、非常に激しい労働であるが、最適条件下では遺伝子のコード配列における突然変異をめったに見失わない。別のアプローチは、一本鎖構造多形性アッセイ(ＳＳＣＡ)(Ｏritaら，1989)である。この方法は、特にＤＮＡフラグメントが２００ｂｐよりも大きな場合、すべての配列変化を検出しないが、最適化して大部分のＤＮＡ配列変動を検出することができる。検出感度が低下することは不利であるが、ＳＳＣＡで可能な処理量の増加は、それを、研究ベースの突然変異検出用の直接配列決定の魅力的な、可能な別法としている。ＳＳＣＡゲル上でシフトした移動度を有するフラグメントをついで配列決定して、正確なＤＮＡ配列変動の性質を決定する。２つの相補的ＤＮＡ鎖の間の誤対合の検出に基づく他のアプローチには、締付変性電気泳動法(clamped denaturing denaturing gel elctrophoresis)(ＣＤＧＥ)(Ｓheffieldら，1991)、ヘテロ二重らせん分析(heteroduplex analysis)(ＨＡ)(Ｗhiteら，1992)および化学的誤対合切断(chemical mismatch cleavage)(ＣＭＣ)(Ｇrompeら，1989)が含まれる。前記した方法はいずれも大きな欠失、二本鎖形成または挿入を検出せず、あるいは、蛋白質の転写または翻訳に影響する調節的突然変異を検出しないであろう。蛋白質先端切断アッセイまたは非対称アッセイのごときこれらのクラスの突然変異を検出し得る他の方法は、特異的な型の突然変異のみを検出し、ミスセンス突然変異は検出しないであろう。ＤＮＡ配列変動を検出する最近利用し得る方法の概説は、Ｇrompe(1993)による最近の概説において見出すことができる。突然変異が判明したら、対立遺伝子特異的オリゴヌクレオチド(ＡＳＯ)ハイブリダイゼーションのごとき対立遺伝子特異的検出アプローチを利用して、同突然変異につき、膨大な数の他の試料を迅速にスクリーニングすることができる。 There are several methods that can be used to detect DNA sequence variation. Direct DNA sequencing, either manual sequencing or automated fluorescent sequencing, can detect sequence variations. For genes as large as BRCA1, it is very hard work, but under optimal conditions mutations in the coding sequence of the gene are rarely missed. Another approach is the single-stranded structural polymorphism assay (SSCA) (Orita et al., 1989). This method does not detect all sequence changes, especially when the DNA fragment is larger than 200 bp, but can be optimized to detect most DNA sequence variations. The disadvantage of reduced detection sensitivity is disadvantageous, but the increased throughput possible with SSCA makes it an attractive, possible alternative to direct sequencing for study-based mutation detection. Fragments with shifted mobility on SSCA gels are then sequenced to determine the nature of the exact DNA sequence variation. Other approaches based on the detection of mismatches between two complementary DNA strands include clamped denaturing denaturing gel elctrophoresis (CDGE) (Sheffield et al., 1991), heteroduplex analysis. (heteroduplex analysis) (HA) (White et al., 1992) and chemical mismatch cleavage (CMC) (Grompe et al., 1989). None of the methods described above will detect large deletions, duplex formations or insertions, or will not detect regulatory mutations that affect protein transcription or translation. Other methods that can detect these classes of mutations, such as protein truncation assays or asymmetric assays, will detect only specific types of mutations and will not detect missense mutations. A review of currently available methods for detecting DNA sequence variation can be found in a recent review by Grompe (1993). Once the mutation is identified, an allele-specific detection approach, such as allele-specific oligonucleotide (ASO) hybridization, can be used to rapidly screen a vast number of other samples for the mutation. .

　組織中の野生型ＢＲＣＡ１遺伝子の変化を検出するためには、周囲の正常組織から遊離した組織を単離することが有用である。腫瘍細胞の組織調製物を増やす方法は当該分野で知られている。例えば、該組織は、パラフィンまたはクライオスタット切片から単離し得る。癌細胞も、フローサイトメトリーによって正常細胞から分離し得る。これらの技術、ならびに、正常細胞から腫瘍細胞を分離する他の技術は当該分野でよく知られている。腫瘍組織が正常組織で非常に汚染されている場合、突然変異の検出はより困難である。 In order to detect changes in the wild-type BRCA1 gene in tissues, it is useful to isolate tissues released from surrounding normal tissues. Methods for expanding tissue preparations of tumor cells are known in the art. For example, the tissue can be isolated from paraffin or cryostat sections. Cancer cells can also be separated from normal cells by flow cytometry. These techniques, as well as other techniques for separating tumor cells from normal cells, are well known in the art. If the tumor tissue is heavily contaminated with normal tissue, detection of the mutation is more difficult.

　ＤＮＡ配列中の多形性を検出する迅速な予備分析は、１または２以上の制限酵素、好ましくは多数の制限酵素で切断したＤＮＡの一連のサザンブロット法で見ることによって行い得る。各ブロットは一連の正常個人および一連の癌ケース、腫瘍またはその両方を含む。(ＢＲＣＡ１遺伝子座付近か、またはそれを包含する配列で釣り上げた場合に対照とは長さが異なる)ハイブリダイズしたフラグメントを示すサザンブロットは、可能性のある突然変異を示す。非常に大きな制限断片を生成する制限酵素を用いる場合には、パルスフィールド電気泳動(ＰＦＧＥ)を用いる。 Rapid preliminary analysis to detect polymorphisms in DNA sequences can be performed by viewing a series of Southern blots of DNA cut with one or more restriction enzymes, preferably a number of restriction enzymes. Each blot contains a series of normal individuals and a series of cancer cases, tumors, or both. Southern blots showing hybridized fragments (different in length than the control when probed at or near the BRCA1 locus) show possible mutations. When using a restriction enzyme that generates a very large restriction fragment, pulse field electrophoresis (PFGE) is used.

　点突然変異の検出は、当該分野でよく知られている技術を用いて、ＢＲＣＡ１対立遺伝子(群)を分子クローン化し、該対立遺伝子(群)を配列決定することによってなし得る。別法として、該遺伝子配列は、公知技術を用いて、腫瘍組織からのゲノムＤＮＡ調製物から直接増幅し得る。ついで、増幅した配列のＤＮＡ配列を決定し得る。 Detection of point mutations can be accomplished by molecular cloning of the BRCA1 allele (s) and sequencing the allele (s) using techniques well known in the art. Alternatively, the gene sequence may be amplified directly from genomic DNA preparations from tumor tissue using known techniques. The DNA sequence of the amplified sequence can then be determined.

　感受性対立遺伝子の存在を確認するためのより完全で、いまだ間接的である試験のよく知られた６種の方法が存在する：１）一本鎖形成構造分析(ＳＳＣＡ)(Ｏritaら，1989)；２）変性勾配ゲル電気泳動(ＤＧＧＥ)(Ｗartellら,1990；Ｓheffieldら，1989)；３)ＲＡアーゼ保護アッセイ(Ｆinkelsteinら，1990；Ｋinszlerら，1991)；４）対立遺伝子-特異的オリゴヌクレオチド(ＡＯＳ)(Ｃonnerら，1983)；５）イー・コリ(Ｅ.coli)mutＳ蛋白質のごときヌクレオチド誤対合を認識する蛋白質の使用(Ｍodrich，1991)；ならびに６）対立遺伝子-特異的ＰＣＲ(ＲanoおよびＫidd，1989)。対立遺伝子-特異的ＰＣＲには、その３'末端で特定のＢＲＣＡ１突然変異にハイブリダイズするプライマーを使用する。特定のＢＲＣＡ１突然変異が存在しない場合、増幅産物は認められない。欧州特許公開第0332435号およびＮewtonら，1989に開示された増幅耐性突然変異系(Ａmplification Ｒefractory Ｍutation Ｓystem，ＡＲＭＳ)も用い得る。 There are six well-known methods of testing that are more complete and still indirect to confirm the presence of susceptibility alleles: 1) Single-strand formation structural analysis (SSCA) (Orita et al., 1989). 2) denaturing gradient gel electrophoresis (DGGE) (Wartell et al., 1990; Sheffield et al., 1989); 3) RAase protection assay (Finkelstein et al., 1990; Kinszler et al., 1991); 4) allele-specific oligonucleotides (AOS) (Conner et al., 1983); 5) Use of proteins that recognize nucleotide mismatches, such as the E. coli mutS protein (Modrich, 1991); and 6) Allele-specific PCR ( Rano and Kidd, 1989). Allele-specific PCR uses primers that hybridize to a particular BRCA1 mutation at its 3 'end. If no particular BRCA1 mutation is present, no amplification product is found. The Amplification Resistance Mutation System (ARMS) disclosed in EP 0 332 435 and Newton et al., 1989 may also be used.

　遺伝子の挿入および欠失は、クローニング、配列決定および増幅によっても検出し得る。加えて、遺伝子または周辺マーカー遺伝子の制限酵素断片長多形(ＲＦＬＰ)プローブを用いても、対立遺伝子の変化または多形フラグメント中の挿入を記録し得る。かかる方法は、影響された個人において見出されたＢＲＣＡ１突然変異の存在につき、該個人の親類をスクリーニングするのに特に有用である。当該分野で公知である挿入および欠失を検出する他の技術を用い得る。 Gene insertions and deletions can also be detected by cloning, sequencing and amplification. In addition, restriction fragment length polymorphism (RFLP) probes of the gene or surrounding marker gene may be used to record allelic changes or insertions in polymorphic fragments. Such methods are particularly useful for screening relatives of the affected individual for the presence of the BRCA1 mutation found in the individual. Other techniques for detecting insertions and deletions known in the art may be used.

　最初の３種の方法(ＳＳＣＡ、ＤＧＧＥおよびＲＡアーゼ保護アッセイ)においては、新たな電気泳動バンドが出現する。ＳＳＣＡは、異なって移動するバンドを検出する。なぜならば、配列の変化が一本鎖、すなわち分子内塩基対合において差を生じるからである。ＲＡアーゼ保護には、突然変異ポリヌクレオチドの２または３以上のより小さなフラグメントへの切断が含まれる。ＤＧＧＥは、変性勾配ゲルを用いて、野生型配列と比較した突然変異配列の移動速度における差を検出する。対立遺伝子-特異的オリゴヌクレオチドアッセイにおいては、特異的な配列を検出するようにオリゴヌクレオチドが設計されており、ハイブリダイゼーション信号の存在または不存在を検出することによって該アッセイを行う。
ｍｕｔＳアッセイにおいては、突然変異と野生型配列との間のヘテロ二重らせん中にヌクレオチド誤対合を含む配列にのみ該蛋白質が結合する。 In the first three methods (SSCA, DGGE and RAase protection assays), new electrophoretic bands appear. SSCA detects bands that move differently. This is because a change in sequence causes a difference in single-stranded, ie, intramolecular base pairing. RAase protection involves cleavage of the mutated polynucleotide into two or more smaller fragments. DGGE uses a denaturing gradient gel to detect differences in the migration rate of the mutated sequence compared to the wild-type sequence. In an allele-specific oligonucleotide assay, the oligonucleotide is designed to detect a specific sequence and is performed by detecting the presence or absence of a hybridization signal.
In the mutS assay, the protein binds only to sequences that contain nucleotide mismatches in the heteroduplex between the mutant and wild-type sequences.

　本発明による誤対合とは、２本の鎖が１００％相補性でない場合のハイブリダイズした核酸二重らせんである。全相補性の欠失は、欠失、挿入、逆位または置換に起因し得る。誤対合検出を用いて、遺伝子中またはそのｍＲＮＡ産物中の点突然変異を検出し得る。これらの技術は配列決定よりも感度が低いが、それらは、膨大な数の腫瘍試料で行うのにより単純である。誤対合切断技術の一例は、ＲＡアーゼ保護法である。本発明の実施においては、該方法は、ヒト野生型ＢＲＣＡ１遺伝子コード配列に相補的な標識リボプローブの使用が含まれる。該リボプローブと腫瘍組織から単離したｍＲＮＡまたはＤＮＡのいずれかとは共にアニーリング(ハイブリダイズ)し、つづいて、二重らせんＲＮＡ構造中のある種の誤対合を検出し得る酵素ＲＮアーゼＡで消化する。誤対合をＲＡアーゼＡによって検出する場合、それは誤対合の部位で切断する。かくして、アニーリングしたＲＮＡ調製物を電気泳動ゲルマトリックス上で分離する場合に、もし誤対合をＲＮアーゼＡによって検出し切断したら、リボプローブおよびｍＲＮＡまたはＤＮＡの完全長二重らせんＲＮＡよりも小さいＲＮＡ産物が示されるであろう。該リボプローブは、完全長のＢＲＣＡ１ｍＲＮＡまたは遺伝子である必要はないが、そのいずれかのセグメントとし得る。リボプローブがＢＲＣＡ１ｍＲＮＡまたは遺伝子のセグメントのみを含む場合、多数のこれらのプローブを用いて、誤対合につき全ｍＲＮＡ配列をスクリーニングすることが望ましいであろう。誤 Mismatch according to the invention is a hybridized nucleic acid double helix where the two strands are not 100% complementary. Deletions of total complementarity can result from deletions, insertions, inversions or substitutions. Mismatch detection can be used to detect point mutations in a gene or its mRNA product. Although these techniques are less sensitive than sequencing, they are simpler to perform on large numbers of tumor samples. One example of a mismatch cutting technique is the RAase protection law. In the practice of the present invention, the method involves the use of a labeled riboprobe that is complementary to the human wild-type BRCA1 gene coding sequence. The riboprobe is annealed (hybridized) together with either mRNA or DNA isolated from tumor tissue, followed by the enzyme RNase A, which can detect certain mismatches in the duplex RNA structure. Digest. If a mismatch is detected by RAase A, it cleaves at the site of the mismatch. Thus, if the annealed RNA preparations are separated on an electrophoretic gel matrix, if mismatches are detected and cleaved by RNase A, the riboprobes and the RNA are smaller than the full-length duplex RNA of mRNA or DNA. The product will be shown. The riboprobe need not be a full-length BRCA1 mRNA or gene, but can be any segment thereof. If the riboprobes contain only BRCA1 mRNA or a segment of the gene, it may be desirable to use a large number of these probes to screen the entire mRNA sequence for mismatches.

　同様にして、ＤＮＡプローブを用いて、酵素的または化学的切断を介して、誤対合を検出し得る(例えば、Ｃottonら，1988；Ｓhenkら，1975；Ｎovackら,1986参照)。別法として、対合二重らせんに対する誤対合二重らせんの電気泳動移動度のシフトによって、誤対合を検出し得る(例えば、Ｃariello，1988参照)。リボプローブまたはＤＮＡプローブのいずれを用いるにせよ、突然変異を含有し得る細胞性ｍＲＮＡまたはＤＮＡは、ハイブリダイゼーション前にＰＣＲ(後記参照)を用いて増幅し得る。ＢＲＣＡ１遺伝子のＤＮＡにおける変化は、特に、欠失および挿入のごとき、変化が全体の再配列の場合、サザン・ハイブリダイゼーションを用いても検出し得る。 Similarly, DNA probes can be used to detect mismatches through enzymatic or chemical cleavage (see, eg, Cotton et al., 1988; Shenk et al., 1975; Novack et al., 1986). Alternatively, mismatches can be detected by a shift in the electrophoretic mobility of the mismatched duplex to the matched duplex (see, eg, Cariello, 1988). Whether using riboprobes or DNA probes, cellular mRNA or DNA that may contain mutations can be amplified using PCR (see below) before hybridization. Changes in the DNA of the BRCA1 gene can also be detected using Southern hybridizations, especially if the change is an entire rearrangement, such as a deletion or insertion.

　ＰＣＲを使用することによって増幅したＢＲＣＡ１遺伝子のＤＮＡ配列は、対立遺伝子-特異的プローブを用いてもスクリーニングし得る。これらのプローブは核酸オリゴマーで、その各々は、公知の突然変異を隠し持つＢＲＣＡ１遺伝子配列の領域を含んでいる。例えば、１つのオリゴマーは、ＢＲＣＡ１遺伝子配列の一部分に対応する、約３０ヌクレオチド長とし得る。かかる一式の対立遺伝子-特異的プローブを用いることにより、ＰＣＲ増幅産物をスクリーニングして、ＢＲＣＡ１遺伝子中に予め同定した突然変異の存在を同定し得る。増幅したＢＲＣＡ１配列と対立遺伝子-特異的プローブとのハイブリダイゼーションは、例えば、ナイロンフィルター上で行い得る。ストリンジェントなハイブリダイゼーション条件下の特定のプローブに対するハイブリダイゼーションは、対立遺伝子-特異的プローブ中のごとく腫瘍組織中に同突然変異が存在することを示している。　候補遺伝子座中の突然変異についての最も明確な試験は、対照集団からのゲノムＢＲＣＡ１配列と癌患者からのものとを直接比較することである。別法として、例えばＰＣＲによって、増幅した後にｍＲＮＡを配列決定し、それによって候補遺伝子のエキソン構造を決定する必要を削除することもできる。ＤＮＡ The DNA sequence of the BRCA1 gene amplified by using PCR can also be screened using an allele-specific probe. These probes are nucleic acid oligomers, each of which contains a region of the BRCA1 gene sequence that harbors a known mutation. For example, one oligomer may be about 30 nucleotides in length, corresponding to a portion of the BRCA1 gene sequence. By using such a set of allele-specific probes, PCR amplification products can be screened to identify the presence of a previously identified mutation in the BRCA1 gene. Hybridization of the amplified BRCA1 sequence with an allele-specific probe can be performed, for example, on a nylon filter. Hybridization to a particular probe under stringent hybridization conditions indicates the presence of the mutation in tumor tissue as in an allele-specific probe.最も The clearest test for mutations in candidate loci is to directly compare genomic BRCA1 sequences from a control population with those from cancer patients. Alternatively, the mRNA can be sequenced after amplification, for example by PCR, thereby eliminating the need to determine the exon structure of the candidate gene.

　ＢＲＣＡ１のコード領域の外側に落ちる癌患者からの突然変異は、ＢＲＣＡ１遺伝子の付近またはその中のイントロンおよび調節配列のごとき、非コード領域を検査することによって検出し得る。非コード領域中の突然変異が重要であるという初期の示唆は、対照個人と比較しての癌患者における異常なサイズの、または豊富なｍＲＮＡ分子を明らかにするノザンブロット実験から出て来得る。突然変異 Mutations from cancer patients that fall outside of the BRCA1 coding region can be detected by examining non-coding regions, such as introns and regulatory sequences near or in the BRCA1 gene. Early suggestions that mutations in non-coding regions are important may come from Northern blot experiments that reveal abnormally sized or abundant mRNA molecules in cancer patients compared to control individuals.

　ＢＲＣＡ１ｍＲＮＡ発現の変化は、当該分野で公知のいずれかの技術によって検出し得る。これらには、ノザンブロット分析、ＰＣＲ増幅およびＲＡアーゼ保護が含まれる。ｍＲＮＡ発現の低下は、野生型ＢＲＣＡ１遺伝子の変化を示している。野生型ＢＲＣＡ１遺伝子の変化は、野生型ＢＲＣＡ１蛋白質の変化についてスクリーニングすることによっても検出し得る。例えば、ＢＲＣＡ１と免疫反応性であるモノクローナル抗体を用いて組織をスクリーニングし得る。同起源抗原を欠くことは、ＢＲＣＡ１突然変異を示しているであろう。突然変異対立遺伝子の産物に特異的な抗体を用いて突然変異ＢＲＣＡ１遺伝子産物を検出することもできる。かかる免疫学的アッセイは、当該分野で公知のいずれかの簡便な形式で行い得る。これらには、ウェスタンブロット、免疫組織化学的アッセイおよびＥＬＩＳＡアッセイが含まれる。変化したＢＲＣＡ１蛋白質を検出するいずれかの手段を用いて、野生型ＢＲＣＡ１遺伝子の変化を検出し得る。蛋白質結合性測定のごとき機能アッセイを用い得る。加えて、ＢＲＣＡ１生化学的機能を検出するアッセイを用いることができる。突然変異ＢＲＣＡ１遺伝子産物の発見は、野生型ＢＲＣＡ１遺伝子の変化を示している。変化 A change in BRCA1 mRNA expression may be detected by any technique known in the art. These include Northern blot analysis, PCR amplification and RAase protection. A decrease in mRNA expression indicates a change in the wild-type BRCA1 gene. Changes in the wild-type BRCA1 gene can also be detected by screening for changes in the wild-type BRCA1 protein. For example, tissues can be screened using a monoclonal antibody that is immunoreactive with BRCA1. Lack of cognate antigen would indicate a BRCA1 mutation. The mutant BRCA1 gene product can also be detected using an antibody specific for the product of the mutant allele. Such immunological assays can be performed in any convenient format known in the art. These include Western blots, immunohistochemical assays and ELISA assays. Any means of detecting an altered BRCA1 protein can be used to detect a change in the wild-type BRCA1 gene. Functional assays such as protein binding measurements can be used. In addition, assays that detect BRCA1 biochemical function can be used. The discovery of a mutated BRCA1 gene product indicates an alteration in the wild-type BRCA1 gene.

　突然変異ＢＲＣＡ１遺伝子または遺伝子産物は、血清、便、尿および唾液のごとき、他のヒト身体試料中にも検出し得る。組織中の突然変異ＢＲＣＡ１遺伝子または遺伝子産物を検出するための前記に論じた同技術は、他の身体試料にも適用し得る。癌細胞は腫瘍から脱皮し、かかる身体試料中に出現する。加えて、ＢＲＣＡ１遺伝子産物それ自体は、細胞外空間に分泌され得、癌細胞が不存在でもこれらの身体試料中に発見し得る。かかる身体試料をスクリーニングすることによって、単純で早期の診断を多くのタイプの癌について達成し得る。加えて、突然変異ＢＲＣＡ１遺伝子または遺伝子産物についてかかる身体試料を試験することによって、化学療法または放射線療法の進展をより容易にモニターし得る。 A mutant BRCA1 gene or gene product can also be detected in other human body samples, such as serum, stool, urine and saliva. The same techniques discussed above for detecting a mutant BRCA1 gene or gene product in a tissue may be applied to other body samples. Cancer cells molt from the tumor and appear in such body samples. In addition, the BRCA1 gene product itself can be secreted into the extracellular space and can be found in these body samples in the absence of cancer cells. By screening such body samples, a simple and early diagnosis can be achieved for many types of cancer. In addition, by testing such body samples for a mutated BRCA1 gene or gene product, the progress of chemotherapy or radiation therapy can be more easily monitored.

　本発明の診断方法は、ＢＲＣＡ１が腫瘍発生において役割を有するいずれの腫瘍にも適用し得る。本発明の診断方法は臨床医に有用で、彼は、治療の適当な過程で決定し得る。診断 The diagnostic method of the present invention can be applied to any tumor in which BRCA1 has a role in tumor development. The diagnostic methods of the present invention are useful to the clinician, who can make decisions during the appropriate course of treatment.

　本発明のプライマー対は、ＰＣＲを用いた特定のＢＲＣＡ１対立遺伝子のヌクレオチド配列の決定に有用である。一本鎖ＤＮＡプライマーの対は、染色体１７ｑ２１上のＢＲＣＡ１遺伝子の中か、または周辺の配列にアニーリングして、ＢＲＣＡ１遺伝子自体の増幅ＤＮＡ合成を開始し得る。完全セットのこれらのプライマーにより、ＢＲＣＡ１遺伝子コード配列の全ヌクレオチド、すなわち、エキソンの合成が許容される。プライマーセットは、好ましくは、イントロンおよびエキソン配列の両方の合成を許容する。対立遺伝子-特異的プライマーも用い得る。かかるプライマーは特定のＢＲＣＡ１突然変異対立遺伝子にのみアニーリングし、したがって、鋳型としての突然変異対立遺伝子存在下で産物を増幅するのみであろう。プライマー The primer pair of the present invention is useful for determining the nucleotide sequence of a specific BRCA1 allele using PCR. The pair of single-stranded DNA primers can anneal to sequences in or around the BRCA1 gene on chromosome 17q21 to initiate amplified DNA synthesis of the BRCA1 gene itself. The complete set of these primers permits the synthesis of all nucleotides of the BRCA1 gene coding sequence, ie, exons. The primer set preferably allows for the synthesis of both intron and exon sequences. Allele-specific primers may also be used. Such primers will only anneal to a particular BRCA1 mutant allele and will therefore only amplify the product in the presence of the mutant allele as a template.

　増幅した配列のつづくクローニングを促進するために、プライマーはその５'末端に付加した制限酵素部位配列を有し得る。かくして、プライマーの全ヌクレオチドは、制限酵素部位を形成するに必要な幾つかのヌクレオチド以外は、ＢＲＣＡ１配列またはＢＲＣＡ１付近の配列に由来する。該プライマーそれ自体は、当該分野でよく知られている技術を用いて合成し得る。一般的に、該プライマーは、市販されているオリゴヌクレオチド合成器を用いて作製し得る。ＢＲＣＡ１オープンリーディングフレームの配列を配列番号：１に示す。特定のプライマーの設計は、当業者の十分に範囲内である。プライマー To facilitate subsequent cloning of the amplified sequence, the primer may have a restriction enzyme site sequence added to its 5 'end. Thus, all nucleotides of the primer are derived from the BRCA1 sequence or a sequence near BRCA1, except for a few nucleotides required to form a restriction enzyme site. The primers themselves can be synthesized using techniques well known in the art. Generally, the primers can be made using commercially available oligonucleotide synthesizers. The sequence of the BRCA1 open reading frame is shown in SEQ ID NO: 1. The design of a particular primer is well within the skill of the art.

　本発明により提供される核酸プローブは、多くの目的に有用である。それは、ゲノムＤＮＡに対するサザンハイブリダイゼーション、およびすでに前記で論じた点突然変異を検出するＲＡアーゼ保護法に用い得る。該プローブを用いてＰＣＲ増幅産物を検出し得る。それを用いて、他の技術を用いたＢＲＣＡ１遺伝子またはｍＲＮＡとの誤対合を検出することもできる。核酸 The nucleic acid probe provided by the present invention is useful for many purposes. It can be used in Southern hybridization to genomic DNA, and in RAase protection methods to detect point mutations already discussed above. The probe can be used to detect PCR amplification products. It can also be used to detect mismatches with the BRCA1 gene or mRNA using other techniques.

　野生型ＢＲＣＡ１遺伝子を有する個人はＢＲＣＡ１対立遺伝子から生じた癌を有さないことが発見された。しかしながら、ＢＲＣＡ１蛋白質の機能を妨害する突然変異は癌の病理に関与している。したがって、機能を欠失したか、または変化した機能を有する蛋白質を産生する変化(または突然変異)したＢＲＣＡ１遺伝子の存在は、癌の危険性の増加に直接関係する。ＢＲＣＡ１遺伝子突然変異を検出するためには、生物試料を調製し、分析するＢＲＣＡ１対立遺伝子の配列と野生型ＢＲＣＡ１対立遺伝子の配列との間の相違を分析する。突然変異ＢＲＣＡ１対立遺伝子は、前記したいずれかの技術によって最初同定し得る。ついで、突然変異対立遺伝子を配列決定して、特定の突然変異対立遺伝子の特異的な突然変異を同定する。別法として、突然変異ＢＲＣＡ１対立遺伝子は、慣用的な技術を用いて、突然変異(変化)したＢＲＣＡ１蛋白質を同定することによって最初に同定し得る。ついで、該突然変異対立遺伝子を配列決定して、各対立遺伝子の特異的突然変異を同定する。突然変異、特にＢＲＣＡ１蛋白質の変化した機能に通じるものを、ついで、本発明の診断方法および予診方法に用いる。個人 Individuals with the wild-type BRCA1 gene were found to have no cancer arising from the BRCA1 allele. However, mutations that disrupt BRCA1 protein function have been implicated in cancer pathology. Thus, the presence of an altered (or mutated) BRCA1 gene that has lost function or produces a protein with altered function is directly related to an increased risk of cancer. To detect a BRCA1 gene mutation, a biological sample is prepared and the difference between the sequence of the BRCA1 allele to be analyzed and the sequence of the wild-type BRCA1 allele is analyzed. Mutant BRCA1 alleles can be initially identified by any of the techniques described above. The mutant allele is then sequenced to identify specific mutations of the particular mutant allele. Alternatively, a mutated BRCA1 allele may be identified initially by identifying the mutated (altered) BRCA1 protein using conventional techniques. The mutant alleles are then sequenced to identify specific mutations in each allele. Mutations, particularly those that lead to altered function of the BRCA1 protein, are then used in the diagnostic and prognostic methods of the invention.

定義
　本発明は、以下の定義を用いる：
　「ポリヌクレオチドの増幅」には、ポリメラーゼ連鎖反応(ＰＣＲ)、連結増幅(またはリガーゼ鎖反応(ligase chain reaction，ＬＣＲ))およびＱ-ベータレプリカーゼの使用に基づく増幅法のごとき方法を用いる。これらの方法は、よく知られており、当該分野で広く実施されている(例えば、米国特許第4,683,195号および第4,683,202号、ならびに(ＰＣＲについては)Ｉnnisら，1990；および(ＬＣＲについては)Ｗuら，1989a参照)。ＰＣＲを行う試薬およびハードウェアは市販されている。ＢＲＣＡ１領域からの配列を増幅するのに有用なプライマーは、好ましくは、ＢＲＣＡ１領域中の配列、またはその中の標的領域に隣接する領域中の配列に相補的であって、それに特異的にハイブリダイズする。増幅によって作製したＢＲＣＡ１配列は直接配列決定し得る。別法として、あまり望ましくはないが、増幅した配列(群)は配列分析に先んじてクローン化し得る。酵素的に増幅したゲノムセグメントの直接クローン化および配列分析は、Ｓcharf，1986によって記載されている。 Definitions The present invention uses the following definitions:
For "polynucleotide amplification", methods such as polymerase chain reaction (PCR), ligation amplification (or ligase chain reaction (LCR)) and amplification methods based on the use of Q-beta replicase are used. These methods are well known and widely practiced in the art (eg, US Pat. Nos. 4,683,195 and 4,683,202, and Innis et al., 1990 (for PCR); and Wu (for LCR). Et al., 1989a). Reagents and hardware for performing PCR are commercially available. Primers useful for amplifying sequences from the BRCA1 region are preferably complementary to and specifically hybridize to sequences in the BRCA1 region, or regions in the region adjacent to the target region therein. I do. BRCA1 sequences generated by amplification can be sequenced directly. Alternatively, but less preferably, the amplified sequence (s) can be cloned prior to sequence analysis. Direct cloning and sequence analysis of enzymatically amplified genomic segments has been described by Scharf, 1986.

　「分析ポリヌクレオチド」および「分析鎖」とは、標的配列を含むと予想され、生物試料を包含する種々のタイプの試料中に存在し得る一本鎖または二本鎖ポリヌクレオチドをいう。 "Analytical polynucleotide" and "analytical strand" refer to single- or double-stranded polynucleotides that are expected to contain a target sequence and may be present in various types of samples, including biological samples.

　「抗体」；本発明は、また、ポリクローナルおよび／またはモノクローナル抗体およびその断片、ならびにその免疫学的な結合同等物を提供し、これらは、ＢＲＣＡ１ポリペプチドおよびその断片、またはＢＲＣＡ１領域からの、特にＢＲＣＡ１遺伝子座またはその一部分からのポリヌクレオチド配列に特異的に結合し得る。「抗体」なる語は、均一な分子基、または複数の異なる分子基より構成される血清産物のごとき混合物をいうのに用法用いる。ポリペプチドは、ペプチド合成器中で合成的に調製し、(例えば、鍵穴吸着性ヘモシアニンのような)キャリアー分子にカップリングさせ、ウサギに数カ月にわたって注射し得る。ウサギ血清は、ＢＲＣＡ１ポリペプチドまたは断片に対する免疫反応性につき試験する。モノクローナル抗体は、蛋白質ポリペプチド、融合蛋白質またはそれらの断片でマウスを注射することにより作製し得る。モノクローナル抗体は、ＥＬＩＳＡによってスクリーンし、ＢＲＣＡ１ポリペプチドまたはその断片との特異的免疫反応性について試験するであろう(ＨarlowおよびＬane，1988参照)。これらの抗体は、アッセイならびに医薬に有用であろう。 "Antibodies"; the invention also provides polyclonal and / or monoclonal antibodies and fragments thereof, and immunological binding equivalents thereof, which include BRCA1 polypeptides and fragments thereof, or, particularly, from the BRCA1 region. It can specifically bind to a polynucleotide sequence from the BRCA1 locus or a portion thereof. The term "antibody" is used to refer to a homogeneous molecular group or a mixture, such as a serum product composed of a plurality of different molecular groups. Polypeptides can be prepared synthetically in a peptide synthesizer, coupled to a carrier molecule (such as keyhole-adsorbing hemocyanin), and injected into rabbits for several months. Rabbit sera is tested for immunoreactivity to the BRCA1 polypeptide or fragment. Monoclonal antibodies can be made by injecting mice with a protein polypeptide, a fusion protein, or a fragment thereof. Monoclonal antibodies will be screened by ELISA and tested for specific immunoreactivity with the BRCA1 polypeptide or fragment thereof (see Harlow and Lane, 1988). These antibodies will be useful in assays as well as in medicine.

　十分な量の所望のポリペプチドを得たら、種々の目的にそれを用いることができる。典型的な用途は、結合について特異的な抗体の産生である。これらの抗体は、ポリクローナルまたはモノクローナルのいずれかであって、当該分野でよく知られているイン・ビトロ(in vitro)またはイン・ビボ(in vivo)技術によって作製し得る。ポリクローナル抗体の作製には、適当な標的免疫系、典型的にはマウスまたはウサギを選択する。実質的に純粋な抗原は、動物に適した方法によってか、または免疫学者によく知られている他の指標によって決定した様式で免疫系に提示する。注射の典型的な部位は、筋肉内、腹膜内または皮膚内的なフットパッドである。勿論、他の種をマウスまたはウサギと代替し得る。ついで、当該分野で公知の技術を用いてポリクローナル抗体を精製し、所望の特異性に調整する。を得 Once a sufficient amount of the desired polypeptide has been obtained, it can be used for various purposes. A typical application is the production of antibodies specific for binding. These antibodies, either polyclonal or monoclonal, can be made by in vitro or in vivo techniques well known in the art. For the production of polyclonal antibodies, a suitable target immune system is selected, typically a mouse or rabbit. Substantially pure antigen is presented to the immune system in a manner determined by animals appropriate methods or by other indicators familiar to immunologists. Typical sites for injection are foot pads intramuscularly, intraperitoneally or intradermally. Of course, other species may be substituted for mice or rabbits. The polyclonal antibody is then purified using techniques known in the art and adjusted to the desired specificity.

　免疫学的応答性は、通常、免疫アッセイでアッセイする。通常、かかる免疫アッセイには、例えば、抗原と同細胞かつ同様式によって作製した抗原源のある種の精製が含まれる。種々の免疫アッセイ法が当該分野でよく知られている(例えば、ＨarlowおよびＬane，1988またはＧoding，1986参照)。
　１０^−８Ｍ^−１、もしくは好ましくは１０^−９〜１０^−１０Ｍ^−１またより強い親和性を有するモノクローナル抗体は、典型的に、例えば、ＨarlowおよびＬane，1988またはＧoding，1986に記載されている標準的な方法によって作製するであろう。簡単には、適当な動物を選抜し、所望の免疫化プロトコールに従う。適当な時間の後に、かかる動物の脾臓を切除し、適当な選抜条件下にて個々の脾臓細胞を不死化メラノーマ細胞に融合する。その後に、該細胞をクローン化的に分離し、各クローンの上清を、抗原の所望の領域に特異的な適当な抗体のそれらの産生について試験する。 Immunological responsiveness is usually assayed in an immunoassay. Usually, such immunoassays include, for example, certain purifications of the antigen source, produced in the same cell as the antigen and by a similar formula. Various immunoassays are well known in the art (see, for example, Harlow and Lane, 1988 or Goding, 1986).
Monoclonal antibodies having 10 ⁻⁸ M ⁻¹ , or preferably 10 ⁻⁹ to 10 ⁻¹⁰ M ⁻¹ or higher affinity, are typically described, for example, in Harlow and Lane, 1988 or Goding, 1986. Will be made by standard methods. Briefly, appropriate animals are selected and the desired immunization protocol is followed. After an appropriate time, the spleen of such animal is excised and individual spleen cells are fused to immortalized melanoma cells under appropriate selection conditions. Thereafter, the cells are clonally separated and the supernatant of each clone is tested for their production of appropriate antibodies specific for the desired region of the antigen.

　他の適当な技術には、抗原ポリペプチドへか、または別法としてファージまたは同様なベクター中の抗体の選抜したライブラリーへのリンパ球のイン・ビトロ(in vitro)暴露が含まれる(Ｈuseら，1989参照)。本発明のポリペプチドおよび抗体は、修飾しても、しないでも用い得る。しばしば、ポリペプチドおよび抗体は、共有的または非共有的のいずれかで、検出可能なシグナルを供する物質を結合することによって標識されるであろう。広範な標識およびコンジュゲート技術が知られており、科学文献および特許文献の両方において広範に報告されている。適当な標識には、放射性核種、酵素、基質、補因子、インヒビター、蛍光剤、化学発光剤、磁性粒子他が含まれる。かかる標識の使用を教示する特許には、米国特許第3,817,837号；第3,850,752号；第3,939,350号；第3,996,345号；第4,277,437号；4,275,149号および第4,366,241号が含まれる。また、組換え免疫グロブリンを作製することもできる(米国特許第4,816,567号参照)。 Other suitable techniques include in vitro exposure of lymphocytes to antigenic polypeptides or, alternatively, to a selected library of antibodies in phage or similar vectors (Huse et al.). 1989). The polypeptides and antibodies of the present invention may be used with or without modification. Frequently, polypeptides and antibodies will be labeled, either covalently or non-covalently, by attaching a substance that provides a detectable signal. A wide variety of labeling and conjugate technologies are known and have been widely reported in both the scientific and patent literature. Suitable labels include radionuclides, enzymes, substrates, cofactors, inhibitors, fluorescent agents, chemiluminescent agents, magnetic particles, and the like. Patents teaching the use of such labels include U.S. Patent Nos. 3,817,837; 3,850,752; 3,939,350; 3,996,345; 4,277,437; 4,275,149 and 4,366,241. Also, recombinant immunoglobulins can be produced (see US Pat. No. 4,816,567).

　「結合パートナー」とは、例えば、抗原および抗原-特異的抗体または酵素およびそのインヒビターのような、高い特異性でリガンド分子と結合する能力を有する分子をいう。一般的に、該特異的結合パートナーは、単離条件下にて、十分な親和性で結合して、分析物コピー／(ポリヌクレオチドハイブリダイゼーションの場合には)相補鎖二重らせんを固定化しなければならない。特異的結合パートナーは当該分野で公知であって、例えば、ビオチンおよびアビジンまたはストレプトアビジン、ＩｇＧおよびプロテインＡ、膨大な公知の受容体-リガンドカップリング物および相補的ポリヌクレオチド鎖が包含される。相補的ポリヌクレオチド結合パートナーの場合においては、該パートナーは、通常、少なくとも約１５塩基長、少なくとも４０塩基長とし得る。該ポリヌクレオチドは、ＤＮＡ、ＲＮＡまたは合成ヌクレオチドアナログから構成され得る。 "Binding partner" refers to a molecule that has the ability to bind a ligand molecule with high specificity, such as, for example, antigens and antigen-specific antibodies or enzymes and inhibitors thereof. Generally, the specific binding partner must bind with sufficient affinity under isolation conditions to immobilize the analyte copy / (in the case of polynucleotide hybridization) the complementary duplex. Must. Specific binding partners are known in the art and include, for example, biotin and avidin or streptavidin, IgG and protein A, a vast array of known receptor-ligand couplings and complementary polynucleotide chains. In the case of a complementary polynucleotide binding partner, the partner will typically be at least about 15 bases in length, at least 40 bases in length. The polynucleotide may be composed of DNA, RNA or synthetic nucleotide analogs.

　「生物試料」とは、個人からの分析物ポリヌクレオチドまたはポリペプチドを含むと予想される組織または流体の試料をいい、限定するものではないが、例えば、血漿、血清、髄液、リンパ液、皮膚の外部切片、呼吸器、腸および尿生殖器、涙、唾液、赤血球、腫瘍、器官、組織およびイン・ビトロ(in vitro)細胞培養構成物の試料が含まれる。 "Biological sample" refers to a sample of tissue or fluid that is expected to contain an analyte polynucleotide or polypeptide from an individual, including, but not limited to, plasma, serum, cerebrospinal fluid, lymph, skin , External respiratory, intestinal and genitourinary tracts, tears, saliva, erythrocytes, tumors, organs, tissues and samples of in vitro cell culture constructs.

　本明細書で用いるごとき、新生生物の文脈で用いる「診断」または「予診」なる語は、処理の前、間およびその後の１）新生生物として病巣の分類、２）新生生物の程度の測定、または３）疾病進展のモニターを示すのに用いる。 As used herein, the term "diagnosis" or "pre-diagnosis" in the context of neoplasms includes, before, during and after treatment, 1) classification of lesions as neoplasms, 2) measurement of neoplastic extent, Or 3) Used to indicate monitoring of disease progression.

　「コードする」；ポリペプチドを「コードする」というポリヌクレオチドは、その天然状態または当業者によく知られている方法によって操作されている場合、それは、ｍＲＮＡおよび/または該ポリペプチドもしくはその断片に転写および／または翻訳され得る。アンチセンス鎖は、かかる核酸、および、それから予想し得る配列コードの相補物である。 A polynucleotide that "encodes"; when a polynucleotide "encodes" a polypeptide is manipulated in its natural state or by methods well known to those of skill in the art, it is capable of encoding mRNA and / or the polypeptide or a fragment thereof. It can be transcribed and / or translated. The antisense strand is the complement of such a nucleic acid, and the sequence code predictable therefrom.

　「単離した」または「実質的に純粋な」；「単離した」または「実質的に純粋な」核酸(例えば、ＲＮＡ、ＤＮＡまたは混合ポリマー)とは、天然のヒト配列または蛋白質(例えば、リボソーム、ポリメラーゼ、多くの他のヒトゲノム配列および蛋白質)を自然に付随する他の細胞成分から実質的に単離されたものである。該語には、核酸配列および蛋白質の自然に発生する環境から除去したそれらを包含し、組換えまたはクローン化ＤＮＡ単離物、および化学合成したアナログまたは外来系によって生物学的に合成したアナログが含まれる。 "Isolated" or "substantially pure"; "isolated" or "substantially pure" nucleic acid (e.g., RNA, DNA or mixed polymer) is a native human sequence or protein (e.g., Ribosomes, polymerases, and many other human genomic sequences and proteins) are substantially isolated from other cellular components with which they naturally accompany. The term encompasses nucleic acid sequences and proteins removed from the naturally occurring environment and includes recombinant or cloned DNA isolates and chemically synthesized analogs or analogs biologically synthesized by foreign systems. included.

　「ＢＲＣＡ１対立遺伝子」とは、ＢＲＣＡ１遺伝子座の正常対立遺伝子、ならびに素因個人に、例えば、乳房、卵巣、結腸直腸および前立腺癌を含む、多くの部位の癌を発症させる変形を運んでいる対立遺伝子をいう。かかる素因対立遺伝子は、「ＢＲＣＡ１感受性対立遺伝子」とも呼称する。 "BRCA1 alleles" are normal alleles at the BRCA1 locus, as well as alleles carrying variants that cause a predisposed individual to develop cancer at many sites, including, for example, breast, ovarian, colorectal and prostate cancer. Say. Such predisposition alleles are also referred to as "BRCA1 susceptibility alleles."

　「ＢＲＣＡ１座」、「ＢＲＣＡ１遺伝子」、「ＢＲＣＡ１核酸」または「ＢＲＣＡ１ポリヌクレオチド」とは、各々、ポリヌクレオチドをいい、それら全部はＢＲＣＡ１領域中に存在し、それらは、個人に乳癌、卵巣癌、結腸直腸癌および前立腺癌を発症する素因の特定の対立遺伝子を正常組織に発現するようである。ＢＲＣＡ１における突然変異は、他のタイプの腫瘍の発生および／または進行に関与し得る。遺伝子座は、素因個人に癌を発症させる突然変異によって部分的に示される。これらの突然変異は下記するＢＲＣＡ１領域内に入る。ＢＲＣＡ１座は、コード配列、介在配列および転写および／または翻訳を制御する調節因子を含むよう意図される。ＢＲＣＡ１座は、該ＤＮＡ配列の全ての対立遺伝子変形を含むよう意図される。 "BRCA1 locus", "BRCA1 gene", "BRCA1 nucleic acid" or "BRCA1 polynucleotide" each refer to a polynucleotide, all of which are present in the BRCA1 region, which can be used to treat an individual with breast cancer, ovarian cancer, It appears that normal tissues express certain alleles predisposing to colorectal and prostate cancer. Mutations in BRCA1 may be involved in the development and / or progression of other types of tumors. The locus is indicated in part by a mutation that causes cancer in a predisposed individual. These mutations fall within the BRCA1 region described below. The BRCA1 locus is intended to contain coding sequences, intervening sequences and regulatory elements that control transcription and / or translation. The BRCA1 locus is intended to include all allelic variations of the DNA sequence.

　核酸に適用する場合、これらの語は、ＢＲＣＡ１ポリペプチド、断片、同等物または変形をコードする核酸をいい、例えば、蛋白質融合物または欠失物が包含される。本発明の核酸は、天然ＢＲＣＡ１-コード遺伝子、または天然ＢＲＣＡ１-コード遺伝子またはその一部分と実質的に相同性を有するものに由来するか、またはそれに実質的に同じものかのかのいずれかの配列を有するであろう。配列番号：２に示すアミノ酸配列を有するＢＲＣＡ１ポリペプチドのコード配列を配列番号：１に示す。 As applied to nucleic acids, these terms refer to nucleic acids that encode a BRCA1 polypeptide, fragment, equivalent, or variation, and include, for example, protein fusions or deletions. The nucleic acids of the invention can be derived from, or have substantially the same sequence as, a native BRCA1-encoding gene, or those that have substantial homology to a native BRCA1-encoding gene or a portion thereof. Will have. The coding sequence of a BRCA1 polypeptide having the amino acid sequence shown in SEQ ID NO: 2 is shown in SEQ ID NO: 1.

　本発明のポリヌクレオチド組成物には、当業者によって容易に理解されるであろう、センス鎖またはアンチセンス鎖の両方の、ＲＮＡ、ｃＤＮＡ、ゲノムＤＮＡ、合成形態、および混合ポリマーが含まれ、化学的または生化学的に修飾され得、あるいは非-天然または誘導化ヌクレオチド塩基を含み得る。かかる修飾物には、例えば、標識物、メチル化物、１または２以上の天然に発生するヌクレオチドのアナログでの置換物、(例えば、ホスホン酸メチル、ホスホトリエステル、ホスホアミデート、カルバメート他のような)非帯電リンケージのごときヌクレオチド間修飾物、(例えば、ホスホロチオエート、ホスホロジチオエート他のような)荷電リンケージ、(例えば、ポリペプチドのような)ペンダント型基、(アクリジン、プソラレン他のような)インターカレター、キレート剤、アルキル化剤および(例えば、アルファアノマー核酸他のような)修飾リンケージが含まれる。また、水素結合および他の化学的相互作用を介して指定した配列に結合する能力のポリヌクレオチドをミメティックスする合成分子も包含される。かかる分子は、当該分野で知られており、例えば、その中で分子骨格中のリン酸結合の代わりにペプチド結合を用いるものが含まれる。 The polynucleotide compositions of the present invention include RNA, cDNA, genomic DNA, synthetic forms, and mixed polymers, both sense or antisense, as will be readily understood by those of skill in the art. Can be modified chemically or biochemically, or can include non-natural or derivatized nucleotide bases. Such modifications include, for example, labels, methylates, substitutions of one or more naturally occurring nucleotide analogs (e.g., such as methyl phosphonate, phosphotriester, phosphoamidate, carbamate, and the like). Internucleotide modifiers such as uncharged linkages, charged linkages (e.g., phosphorothioates, phosphorodithioates, etc.), pendant groups (e.g., polypeptides), (e.g., acridine, psoralen, etc.) ) Intercalators, chelators, alkylating agents, and modified linkages (such as, for example, alpha anomeric nucleic acids, etc.). Also included are synthetic molecules that mimic the polynucleotides with the ability to bind to the specified sequence via hydrogen bonding and other chemical interactions. Such molecules are known in the art and include, for example, those that use peptide bonds instead of phosphate bonds in the molecular backbone.

　本発明は、ＢＲＣＡ１領域の全体または一部分を含む組換え核酸を提供する。該組換え構築物は、宿主細胞中で自律的に複製し得る。別法として、該組換え構築物は、宿主細胞の染色体ＤＮＡに一体化するようになり得る。かかる組換えポリヌクレオチドは、その起源または操作による、１）天然では結合するポリヌクレオチドの全体または一部分と結合せず；２）天然では結合するもの以外のポリペプチドに結合し；または３）天然には生じない、ゲノム、ｃＤＮＡ、半-合成または合成起源のポリヌクレオチドを含む。 The present invention provides a recombinant nucleic acid containing the whole or a part of the BRCA1 region. The recombinant construct can replicate autonomously in the host cell. Alternatively, the recombinant construct may become integrated into the chromosomal DNA of the host cell. Such a recombinant polynucleotide may, by its source or operation, 1) not bind to all or a portion of the polynucleotide to which it naturally binds; 2) bind to a polypeptide other than that to which it binds naturally; Does not occur, including polynucleotides of genomic, cDNA, semi-synthetic or synthetic origin.

　したがって、天然には生じない他の配列を含む組換え核酸が本発明によって提供される。野生型配列を用いることができるが、それは、しばしば、例えば、欠失、置換または挿入によって改変されているであろう。 Thus, there is provided by the present invention a recombinant nucleic acid comprising other sequences which do not occur in nature. The wild-type sequence can be used, but will often have been modified, for example, by deletion, substitution or insertion.

　種々のタイプのｃＤＮＡまたはゲノムライブラリーを、本発明の核酸の天然起源としてスクリーンし得、あるいはかかる核酸は、ゲノムＤＮＡまたは他の天然起源に存在する配列の増幅によって(例えば、ＰＣＲによって)提供し得る。ｃＤＮＡライブラリーの選択は、通常、所望の蛋白質のｍＲＮＡに富む組織起源に対応する。ファージライブラリーが通常好ましいが、他のタイプのライブラリーを用いることもできる。ライブラリーのクローンをプレートに拡げ、スクリーニング用基質に移し、変性し、所望の配列の存在につき釣上げる。 Various types of cDNA or genomic libraries may be screened as the natural source of the nucleic acids of the invention, or such nucleic acids may be provided by amplification of genomic DNA or other naturally occurring sequences (e.g., by PCR). obtain. The selection of a cDNA library usually corresponds to a tissue source rich in mRNA for the desired protein. Although phage libraries are usually preferred, other types of libraries can be used. Library clones are spread on plates, transferred to screening substrates, denatured, and picked for the presence of the desired sequence.

　本発明で用いるＤＮＡ配列は、通常、少なくとも約５コドン(１５ヌクレオチド)、より通常は少なくとも７-１５コドン、最も好ましくは、少なくとも約３５コドンを含む。また、１または２以上のイントロンが存在し得る。このヌクレオチド数は、通常、ＢＲＣＡ１-コード配列と特異的にハイブリダイズするであろう首尾よいプローブに要するおよそ最小限の長さである。ＤＮＡ The DNA sequence used in the present invention usually contains at least about 5 codons (15 nucleotides), more usually at least 7-15 codons, and most preferably at least about 35 codons. Also, one or more introns may be present. This number of nucleotides is usually about the minimum length required for a successful probe to hybridize specifically with the BRCA1-coding sequence.

　核酸操作用の技術は、一般的に、例えば、Ｓambrookら，1989またはＡusbelら，1992に記載されている。制限酵素他のごときかかる技術に適用する試薬は当該分野で広く知られており、Ｎew Ｅngland ＢioＬabs社、Ｂoehringer Ｍannheim社、Ａmersham社、Ｐromega Ｂiotec社、Ｕ.Ｓ.Ｂiochemicals社、Ｎew Ｅngland Ｎuclear社および他の多くの供給源のごとき業者から市販されている。本発明の融合蛋白質を作製するのに用いる組換え核酸配列は、天然または合成配列由来とし得る。適当なプローブを用いて、種々のｃＤＮＡまたはゲノムライブラリー(ＧenＢank，Ｎational Ｉnstitute of Ｈealth参照)から多くの天然遺伝子配列を得ることができる。技術 Techniques for manipulating nucleic acids are generally described, for example, in Sambrook et al., 1989 or Ausbel et al., 1992. Reagents that apply to such techniques, such as restriction enzymes, are widely known in the art and include New England BioLabs, Boehringer Mannheim, Amersham, Promega Biotec, US Biochemicals, New England Nuclear and others. Are commercially available from vendors, such as many sources. Recombinant nucleic acid sequences used to make the fusion proteins of the invention can be derived from natural or synthetic sequences. Using the appropriate probes, many natural gene sequences can be obtained from various cDNA or genomic libraries (see GenBank, National Institute of Health).

　「ＢＲＣＡ１領域」とは、マーカーｔｄｊ１４７４およびＵ５Ｒによって結合されるヒト染色体１７ｑ２１の部分をいう。この領域には、ＢＲＣＡ１遺伝子を含むＢＲＣＡ１座が含まれる。 "BRCA1 region" refers to the portion of human chromosome 17q21 bound by markers tdj1474 and U5R. This region includes the BRCA1 locus containing the BRCA1 gene.

　本明細書で用いるごとく、「ＢＲＣＡ１座」、「ＢＲＣＡ対立遺伝子」および「ＢＲＣＡ領域」は、すべて、遺伝子座、対立遺伝子または領域を含む二本鎖ＤＮＡ、ならびに遺伝子座、対立遺伝子または領域を含むいずれかの一本鎖ＤＮＡをいう。 As used herein, “BRCA1 locus”, “BRCA allele” and “BRCA region” all include a locus, a double-stranded DNA containing an allele or region, and a locus, allele or region. Refers to any single-stranded DNA.

　本明細書で用いるごとく、ＢＲＣＡ１座または領域もしくは対立遺伝子の「部分」とは、少なくとも約８ヌクレオチド、または好ましくは約１５ヌクレオチド、またはより好ましくは少なくとも約２５ヌクレオチドの最小限サイズを有すると規定され、および少なくとも約４０ヌクレオチドの最小限サイズを有し得る。 As used herein, a “portion” of a BRCA1 locus or region or allele is defined as having a minimum size of at least about 8 nucleotides, or preferably about 15 nucleotides, or more preferably at least about 25 nucleotides. , And a minimum size of at least about 40 nucleotides.

　「ＢＲＣＡ１蛋白質」または「ＢＲＣＡ１ポリペプチド」とは、ＢＲＣＡ１座によってコードされる蛋白質またはポリペプチド、その変形または断片をいう。　 "BRCA1 protein" or "BRCA1 polypeptide" refers to a protein or polypeptide encoded by the BRCA1 locus, a variant or fragment thereof.

　「ポリペプチド」なる語は、アミノ酸ポリマーまたはその相当物をいい、特異的な長さの生成物をいうのではなく；したがって、ペプチド、オリゴペプチドおよび蛋白質がポリペプチドの定義の中に含まれる。この語は、また、例えば、グルコシル化、アセチル化、リン酸化他のポリペプチドの修飾物をいうのではなく、または排除する。該定義の中に含まれるのは、天然および非天然に生じる(例えば、非天然アミノ酸他を包含する)１または２以上のアナログのアミノ酸を含むポリペプチド、置換結合を有するポリペプチド、ならびに当該分野で公知の他の修飾物が含まれる。通常、かかるポリペプチドは、天然のＢＲＣＡ１配列に少なくとも約５０％相同で、好ましくは約９０％を超えて、より好ましくは少なくとも約９５％相同性である。また、高または低ストリンジェンシー条件下にてＢＲＣＡ１-コード核酸にハイブリダイズし、ＢＲＣＡ１蛋白質(群)に対する抗血清によって回収される酷似したポリペプチドまたは蛋白質も包含される。 The term "polypeptide" refers to an amino acid polymer or its equivalent, and not to products of a specific length; thus, peptides, oligopeptides and proteins are included within the definition of polypeptide. The term also does not refer to or exclude, for example, glycosylation, acetylation, phosphorylation, or other modifications of the polypeptide. Included within the definition are polypeptides containing one or more analog amino acids, naturally occurring and non-naturally occurring (including, for example, unnatural amino acids, etc.), polypeptides having substitution bonds, and And other modifications known. Usually, such polypeptides are at least about 50% homologous, preferably greater than about 90%, and more preferably at least about 95% homologous to the native BRCA1 sequence. Also included are highly similar polypeptides or proteins that hybridize to BRCA1-encoding nucleic acids under high or low stringency conditions and are recovered by antisera to the BRCA1 protein (s).

　相同性につき比較するポリペプチド配列の長さは、一般的に、少なくとも約１６アミノ酸、通常、少なくとも約２０残基、より通常は少なくとも約２４残基で、典型的には、少なくとも約２８残基、好ましくは約３５残基を超えるであろう。 The length of the polypeptide sequences to be compared for homology is generally at least about 16 amino acids, usually at least about 20 residues, more usually at least about 24 residues, and typically at least about 28 residues. , Preferably more than about 35 residues.

　「作動可能に連結した」とは、かく記載した成分が、その意図した様式の機能を許容する関係にある並列(juxtaposition)をいう。例えば、プロモーターがコード配列の転写または発現に影響する場合には、該プロモーターは該配列に作動可能に連結されている。 "Operably linked" refers to a juxtaposition in which the components so described are in a relationship permitting their intended mode of function. For example, a promoter is operably linked to a coding sequence if the promoter affects the transcription or expression of the coding sequence.

　「プローブ」；適当なストリンジェントハイブリダイゼーションおよび洗浄条件下にて、標的配列のポリペプチドと安定なハイブリッドを形成するポリヌクレオチドプローブとのハイブリダイゼーションによって検出し得る、特定の癌の素因または大部分の癌に関連するＢＲＣＡ１対立遺伝子に関連するポリヌクレオチド多形性をいう。プローブが標的配列に対して完全に相補的であると予想される場合には、ストリンジェント条件を用いるであろう。例えば、変形が、プローブは完全に相補的でない結果を有すると予想される場合のような幾つかの誤対合が予想される場合、ハイブリダイゼーション・ストリンジェンシーを低下させ得る。非特異的／偶然の結合を排除する、すなわち、ノイズを最小限化する条件を選択する。かかる示唆は天然ＤＮＡ多形性ならびに突然変異を同定し、これらの示唆はさらに分析して、ＢＲＣＡ１感受性対立遺伝子の検出を立証する必要がある。 "Probe"; a predisposition to or predisposition to a particular cancer that can be detected by hybridization of a polynucleotide probe that forms a stable hybrid with the polypeptide of the target sequence under appropriate stringent hybridization and washing conditions. Refers to a polynucleotide polymorphism associated with the BRCA1 allele associated with cancer. If the probe is expected to be completely complementary to the target sequence, stringent conditions will be used. For example, hybridization stringency may be reduced if some mismatches are expected, such as when the variants are expected to have results that are not perfectly complementary. Choose conditions that eliminate non-specific / accidental binding, ie, minimize noise. Such suggestions identify natural DNA polymorphisms as well as mutations, and these suggestions need to be further analyzed to establish the detection of a BRCA1 sensitive allele.

　ＢＲＣＡ１対立遺伝子のプローブは、ＢＲＣＡ１領域またはそのｃＤＮＡの配列由来とし得る。該プローブは、ＢＲＣＡ１領域の全体または一部分に広がり、かつＢＲＣＡ１領域への特異的なハイブリダイゼーションを許容するいずれの適当な長さともし得る。標的配列が該プローブと同一の配列を含む場合、該プローブは、例えば、約８-３０塩基対の範囲に短くし得る。なぜならば、該ハイブリッドは、ストリンジェント条件下でさえ比較的安定であろうからである。プローブとある程度の誤対合が予想される場合、すなわち、該プローブが種々の領域にハイブリダイズすることが予想される場合、必要な特異性で標的配列にハイブリダイズするより長いプローブを用い得る。 The プローブ BRCA1 allele probe may be derived from the sequence of the BRCA1 region or its cDNA. The probe may span any or all of the BRCA1 region and may be of any suitable length to allow specific hybridization to the BRCA1 region. If the target sequence comprises the same sequence as the probe, the probe may be shortened, for example, to a range of about 8-30 base pairs. Since the hybrid will be relatively stable even under stringent conditions. If some degree of mismatch with the probe is expected, ie, the probe is expected to hybridize to various regions, a longer probe that hybridizes to the target sequence with the required specificity may be used.

　プローブには、標識またはレポーター分子に結合する単離ポリヌクレオチドが含まれ、それを用いて、標準的な方法によって配列類似を有する他のポリヌクレオチド配列を単離し得るであろう。プローブの調製および標識の技術としては、例えば、Ｓambrookら,1989またはＡusbelら，1992を参照せよ。他の同様なポリヌクレオチドは、相同ポリヌクレオチドを用いることによって選抜し得る。別法として、これらまたは同様のポリペプチドをコードするポリヌクレオチドは、遺伝子コード中の重複を用いることによって合成または選抜し得る。例えば、サイレント変化(それによって種々の制限部位を作製する)または特定の系を最適化することによって、種々のコドン置換を導入し得る。突然変異を導入して、ポリペプチドの特性(恐らくは、リガンド-結合親和性、鎖間親和性の変化またはポリペプチド分解または代謝回転速度の変化)を修飾することができる。 Probes include isolated polynucleotides that bind to a label or reporter molecule and may be used to isolate other polynucleotide sequences having sequence similarity by standard methods. See, eg, Sambrook et al., 1989 or Ausbel et al., 1992 for techniques for probe preparation and labeling. Other similar polynucleotides can be selected by using homologous polynucleotides. Alternatively, polynucleotides encoding these or similar polypeptides may be synthesized or selected by using duplication in the genetic code. For example, various codon substitutions may be introduced by silent changes (thus creating various restriction sites) or by optimizing the particular system. Mutations can be introduced to modify the properties of the polypeptide, possibly altering ligand-binding affinity, interchain affinity or altering polypeptide degradation or turnover rates.

　本発明の合成オリゴヌクレオチドまたは他のポリヌクレオチドを含むプローブは、天然に発生するか、または組換えの一本鎖または二本鎖ポリヌクレオチド、あるいは化学合成由来とし得る。プローブは、ニック・トランスレーション、クレノー酵素フィル-イン(fill-in)反応または当該分野で公知の他の方法によっても標識し得る。 Probes containing synthetic oligonucleotides or other polynucleotides of the present invention can be naturally occurring or recombinant, single- or double-stranded polynucleotides, or derived from chemical synthesis. Probes may also be labeled by nick translation, Klenow enzyme fill-in reaction, or other methods known in the art.

　ＢＲＣＡ１をコードするポリヌクレオチド配列からの、少なくとも約８ヌクレオチド、通常少なくとも約１５ヌクレオチドで、約６ｋｂより短い、通常約１.０ｋｂより短いヌクレオチドを有するポリヌクレオチド配列の一部分が、プローブとして好ましい。また、該プローブを用いて、ＢＲＣＡ１をコードするｍＲＮＡが細胞または組織中に存在するか否かを決定することもできる。 A portion of the polynucleotide sequence from the polynucleotide sequence encoding BRCA1 having at least about 8 nucleotides, usually at least about 15 nucleotides, and less than about 6 kb, usually less than about 1.0 kb, is preferred as a probe. In addition, the probe can be used to determine whether mRNA encoding BRCA1 is present in a cell or tissue.

　ＢＲＣＡ１ポリペプチドまたはその断片について本発明によって提供される
「蛋白質修飾物または断片」は、一次構造配列に実質的に相同性であるが、例えば、イン・ビボ(in vivo)またはイン・ビトロ(in vitro)の化学的および生化学的修飾または異常なアミノ酸を取り込んだものが含まれる。かかる修飾には、当業者によって容易に理解されるであろう、例えば、アセチル化、カルボキシ化、リン酸化、グリコシル化、ユビキチン化、(例えば、放射線核種での)標識、ならびに種々の酵素的修飾が含まれる。かかる目的に有用なポリペプチドを標識する種々の方法およびその置換または標識は、当該分野でよく知られており、^３２Ｐのごとき放射性同位体が含まれ、これは、標識リガンドの特異的結合対メンバーとして作用し得る標識抗リガンド(例えば、抗体)、蛍光団、化学発色剤、酵素および抗リガンドに結合する。標識の選択は、要する感度、プライマーとコンジュゲート容易性、安定性要件および入手可能な機器に依存する。ポリペプチドを標識する方法は当該分野でよく知られている(例えば、Ｓambrookら，1989またはＡusbelら，1992参照)。 A "protein modification or fragment" provided by the present invention for a BRCA1 polypeptide or fragment thereof is substantially homologous to the primary structural sequence, for example, in vivo or in vitro. (in vitro) chemical and biochemical modifications or those incorporating unusual amino acids. Such modifications will be readily appreciated by those skilled in the art, for example, acetylation, carboxylation, phosphorylation, glycosylation, ubiquitination, labeling (e.g., with radionuclides), and various enzymatic modifications Is included. Various methods of labeling polypeptides useful for such purpose and their substitution or labeling are well known in the art and include radioisotopes such as ³² P, which are specific binding partners for labeled ligands. Binds labeled anti-ligands (eg, antibodies), fluorophores, chemical chromogenic agents, enzymes and anti-ligands that can act as members. The choice of label depends on the sensitivity required, ease of primer and conjugation, stability requirements and available equipment. Methods for labeling polypeptides are well known in the art (see, for example, Sambrook et al., 1989 or Ausbel et al., 1992).

　実質的に完全長のポリペプチドに加えて、本発明は、偽ポリペプチドの生物学的に活性な断片を提供する。重要な生物学的活性には、ＢＲＣＡ１ポリペプチドのリガンド-結合性、免疫学的活性および他の生物学的活性特性が含まれる。免疫学的活性には、標的免疫系の免疫源機能、ならびに結合用の免疫学的エピトープを分け持っていること、ＢＲＣＡ１蛋白質のエピトープにつき競合または置換抗原のいずれかとして作用することの両方が含まれる。本明細書で用いる「エピトープ」とは、ポリペプチドの抗原決定基をいう。エピトープは、エピトープにユニークな空間立体配置に３個のアミノ酸を含み得る。一般的に、エピトープは、少なくとも５個のかかるアミノ酸、およびより通常は少なくとも８-１０個のかかるアミノ酸よりなる。かかるアミノ酸の空間立体配置を決定する方法は当該分野で知られている。に In addition to substantially full-length polypeptides, the present invention provides biologically active fragments of pseudopolypeptides. Important biological activities include BRCA1 polypeptide ligand-binding, immunological activity and other biologically active properties. Immunological activity includes both the immunogenic function of the target immune system, as well as sharing immunological epitopes for binding and acting as either a competition or replacement antigen for epitopes on the BRCA1 protein. It is. As used herein, “epitope” refers to an antigenic determinant of a polypeptide. An epitope may include three amino acids in a spatial configuration unique to the epitope. Generally, an epitope consists of at least 5 such amino acids, and more usually, at least 8-10 such amino acids. Methods for determining the spatial configuration of such amino acids are known in the art.

　免疫学的目的には、直列反復ポリペプチド・セグメントを免疫原として用い、それによって抗原蛋白質を高度に産生し得る。別法として、かかるポリペプチドは、特異的結合につき高効率の競合物としても作用するであろう。ＢＲＣＡ１ポリペプチドまたはその断片に特異的な抗体の作製を以下に記載する。 For immunological purposes, tandemly repeated polypeptide segments can be used as immunogens, thereby producing highly antigenic proteins. Alternatively, such polypeptides will also act as highly efficient competitors for specific binding. The generation of antibodies specific for a BRCA1 polypeptide or a fragment thereof is described below.

　また、本発明は、ＢＲＣＡ１ポリペプチドおよび断片を含む、融合ポリペプチドも提供する。ホモポリペプチドは、２または３以上のＢＲＣＡ１ポリペプチド配列の間の、またはＢＲＣＡ１の配列と関連蛋白質との間の融合とし得る。同様に、誘導蛋白質の特性または活性の組合せを示すであろうヘテロ融合物を構築し得る。例えば、リガンド-結合または他のドメインは、異なる新たな融合ポリペプチドまたは断片の間で「交換」し得る。かかるホモまたはヘテロ融合ポリペプチドは、例えば、変化した強さまたは特異性の結合を示し得る。融合パートナーには、免疫グロブリン、細菌β-ガラクトシダーゼ、ｔｒｐＥ、プロテインＡ、β-ラクタマーゼ、α-アミラーゼ、アルコール・デヒドロゲナーゼおよび酵母アルファ接合因子が含まれる(例えば、Ｇodowskiら，1988参照)。本 The present invention also provides fusion polypeptides, including BRCA1 polypeptides and fragments. A homopolypeptide may be a fusion between two or more BRCA1 polypeptide sequences, or between a BRCA1 sequence and a related protein. Similarly, heterofusions can be constructed that will exhibit a combination of properties or activities of the inducible protein. For example, ligand-binding or other domains may "swap" between different new fusion polypeptides or fragments. Such homo- or hetero-fusion polypeptides can exhibit, for example, altered strength or specificity binding. Fusion partners include immunoglobulins, bacterial β-galactosidase, trpE, protein A, β-lactamase, α-amylase, alcohol dehydrogenase and yeast alpha mating factor (see, eg, Godowski et al., 1988).

　融合蛋白質は、典型的には、以下に記載するごとき、いずれかの組換え核酸法によって作製し得、あるいは化学合成法とし得る。ポリペプチドを合成する技術は、例えば、Ｍerrifield，1963に記載されている。 Fusion proteins can typically be prepared by any of the recombinant nucleic acid methods described below, or can be chemically synthesized. Techniques for synthesizing polypeptides are described, for example, in Merrifield, 1963.

　「蛋白質精製」とは、ＢＲＣＡ１をコードする組換え核酸で形質転換した細胞からのごとき、他の生物材料からＢＲＣＡ１ポリペプチドを単離するための種々の方法、ならびに当該分野でよく知られている方法をいう。例えば、かかるポリペプチドは、例えば、本発明によって提供される抗体を用いる免疫アフィニティー・クロマトグラフィーによって精製し得る。蛋白質精製の種々の方法は当該分野でよく知られており、Ｄeutscher，1990およびＳcopes，1982に記載されたものが含まれる。 "Protein purification" refers to various methods for isolating a BRCA1 polypeptide from other biological materials, such as from cells transformed with a recombinant nucleic acid encoding BRCA1, and is well known in the art. Method. For example, such polypeptides can be purified, for example, by immunoaffinity chromatography using the antibodies provided by the invention. Various methods for protein purification are well known in the art and include those described in Deutscher, 1990 and Scopes, 1982.

　「単離した」、「実質的に純粋な」および「実質的に均一な」なる語は、天然状態では蛋白質またはポリペプチドを付随する成分からそれらを分離することを記載するために相互変換可能に用いる。少なくとも約６０〜７５％の試料が単一のポリペプチド配列を示す場合、単量体蛋白質は実質的に純粋である。実質的に純粋な蛋白質は、典型的には、約６０％〜９０％Ｗ／Ｗの蛋白質試料、より通常には約９５％、好ましくは約９９％純粋を超える蛋白質試料を含むであろう。蛋白質純度または均一性は、蛋白質試料のポリアクリルアミドゲル電気泳動につづく該ゲルの染色の際の単一ポリペプチドバンドの視覚化のごとき、当該分野でよく知られている多くの手段によって示し得る。特定の目的には、ＨＰＬＣまたは精製に利用する当該分野でよく知られた他の手段を用いることによって高解像度を供し得る。 The terms "isolated," "substantially pure," and "substantially homogeneous" are interchangeable to describe the separation of proteins or polypeptides from their associated components in nature. Used for A monomeric protein is substantially pure if at least about 60-75% of the sample exhibits a single polypeptide sequence. A substantially pure protein will typically include a protein sample of about 60% to 90% W / W, more usually about 95%, and preferably more than about 99% pure. Protein purity or homogeneity can be indicated by a number of means well known in the art, such as visualization of a single polypeptide band upon staining of the gel following polyacrylamide gel electrophoresis of a protein sample. For certain purposes, high resolution may be provided by using HPLC or other means well known in the art to utilize for purification.

　ＢＲＣＡ１蛋白質は、その天然状態でそれに付随する天然の汚染物からそれを分離した場合、天然で関連する成分を実質的に含まない。かくして、化学的に合成したか、またはそれが天然に起源する細胞とは異なる細胞系で合成したポリペプチドは、その天然に付随する成分を実質的に含まないであろう。蛋白質は、当該分野でよく知られた蛋白質精製技術を用いて単離することによって、天然に付随する成分を実質的に含まないものとすることもできる。 The BRCA1 protein is substantially free of naturally related components when it is separated from its natural contaminants in its natural state. Thus, a polypeptide that is chemically synthesized or synthesized in a cell line different from the cell from which it naturally originates will be substantially free of its naturally associated components. Proteins can be rendered substantially free of naturally associated components by isolation using protein purification techniques well known in the art.

　単離および操作した遺伝子配列の発現産物として生成するポリペプチドは、ホモ細胞型で発現される場合でさえ、本明細書で用いる「単離ポリペプチド」である。ヘテロ細胞によって発現される合成作製形態または分子は、本来、単離分子である。ポリ A polypeptide that is produced as an expression product of an isolated and engineered gene sequence is an “isolated polypeptide” as used herein, even when expressed in a homologous cell type. Synthetic production forms or molecules expressed by heterologous cells are naturally isolated molecules.

　「組換え核酸」とは、天然に生じるものではない、または、配列の２の他の分離したセグメントの人工的組合せによって作製した核酸である。この人工的な組合せは、しばしば、いずれかの化学合成手段によってか、または核酸の単離セグメントの人工操作によって、例えば、遺伝子工学技術によってなされる。かかるものは、通常、同一または保存アミノ酸をコードする余分なコドンでコドンを置換して行うが、典型的には、配列認識部位を導入するか、または除去する。別法として、それを行って、所望の機能の核酸セグメントを一緒に結合し、所望の組合せの機能を生成する。 "Recombinant nucleic acid" is a nucleic acid that is not naturally occurring or that has been created by the artificial combination of two other discrete segments of a sequence. This artificial combination is often made by any chemical synthetic means or by artificial manipulation of isolated segments of nucleic acids, for example, by genetic engineering techniques. Such is usually done by replacing the codon with an extra codon encoding the same or a conserved amino acid, but typically introducing or removing a sequence recognition site. Alternatively, it is performed to combine nucleic acid segments of a desired function together to produce a desired combination of functions.

　「調節配列」とは、通常、遺伝子座のコード領域の１００ｋｂ以内の配列をいうが、それはコード領域からさらに離れていることもあり、それは、(遺伝子の転写、およびｍＲＮＡの翻訳、スプライシング、安定性などを含む)遺伝子の発現に影響する。 “Regulatory sequence” usually refers to a sequence within 100 kb of the coding region of a locus, but it may be further away from the coding region, which may include (gene transcription and mRNA translation, splicing, stabilization, (Including gender).

　「実質的に相同または同様な」；他の核酸(またはその相補鎖)と(適当なヌクレオチド挿入または欠失を有して)最適に並べた場合に、ヌクレオチド塩基の少なくとも約６０％、通常少なくとも約７０％、より通常は少なくとも約８０％、好ましくは少なくとも約９０％、より好ましくは少なくとも約９５-９８％のヌクレオチド塩基のヌクレオチド配列同一性が存在する場合、核酸またはその断片はもう１つのものに「実質的に相同性である」(「または実質的に同様である」)。 "Substantially homologous or similar"; when optimally aligned (with appropriate nucleotide insertions or deletions) with another nucleic acid (or its complement), at least about 60% of the nucleotide bases, usually at least A nucleic acid or fragment thereof is another if there is nucleotide sequence identity of about 70%, more usually at least about 80%, preferably at least about 90%, more preferably at least about 95-98% nucleotide bases. "Substantially homologous" ("or substantially similar").

　別法として、鎖またはその相補鎖に対して選択的なハイブリダイゼーション条件下で、他の核酸(またはその相補鎖)に、核酸またはその断片がハイブリダイズする場合、実質的な相補性または(同一性)が存在する。特異性の全体的な欠乏よりも実質的により選択的なハイブリダイゼーションが起こる場合に、ハイブリダイゼーションの選択性が存在する。典型的には、選択的ハイブリダイゼーションは、少なくとも約１４ヌクレオチド、好ましくは少なくとも６５％、より好ましくは少なくとも約７５％、最も好ましくは少なくとも約９０％のストレッチにわたって少なくとも約５５％相同性が存在する場合に生じるであろう(Ｋanehisa，1984参照)。記載した相同性比較の長さは、より長いストレッチとすることもでき、特定の具体例においては、しばしば、少なくとも約９ヌクレオチド、通常は少なくとも約２０ヌクレオチド、より通常は少なくとも約２４ヌクレオチド、典型的には少なくとも約２８ヌクレオチド、より典型的には少なくとも約３２ヌクレオチド、好ましくは少なくとも約３６またはそれを超えるヌクレオチドのストレッチにわたるであろう。 Alternatively, if the nucleic acid or fragment thereof hybridizes to another nucleic acid (or its complement) under hybridization conditions selective for the strand or its complement, substantial complementarity or (identical) Sex) exists. Hybridization selectivity exists when hybridization occurs that is substantially more selective than the overall lack of specificity. Typically, selective hybridization is performed when at least about 55% homology exists over at least about 14 nucleotides, preferably at least about 65%, more preferably at least about 75%, and most preferably at least about 90% of the stretch. (See Kanehisa, 1984). The length of the described homology comparisons can also be longer stretches, and in certain embodiments, often will be at least about 9 nucleotides, usually at least about 20 nucleotides, more usually at least about 24 nucleotides, typically Will span a stretch of at least about 28 nucleotides, more typically at least about 32 nucleotides, preferably at least about 36 or more nucleotides.

　核酸ハイブリダイゼーションは、当業者によって容易に理解されるであろう、塩基組成、相補鎖の長さ、およびハイブリダイズする核酸の間のヌクレオチド塩基誤対合の数に加えて、塩濃度、温度、または有機溶媒のごとき条件によって影響されるでろう。ストリンジェントな温度条件には、一般的に、３０℃を超える、典型的には３７℃を超える、好ましくは４５℃を超える温度が含まれるであろう。ストインジェントな塩条件には、通常、１０００ｍＭ未満、典型的には５００ｍＭ未満、好ましくは２００ｍＭ未満であろう。しかしながら、指標の組合せはいずれの単一の指標の測定よりも遥かにより重要である(例えば、ＷetmurおよびＤavidson，1968参照)。プローブ配列は、また、特定の条件下にて二重らせんＤＮＡに特異的にハイブリダイズして、三重らせんまたは他のより高次のＤＮＡ複合体を形成し得る。かかるプローブの調製および適当なハイブリダイゼーション条件は当該分野でよく知られている。 Nucleic acid hybridization is well understood by those skilled in the art, as well as base composition, complementary strand length, and the number of nucleotide base mismatches between hybridizing nucleic acids, as well as salt concentration, temperature, Or it will be affected by conditions such as organic solvents. Stringent temperature conditions will generally include temperatures above 30 ° C, typically above 37 ° C, preferably above 45 ° C. Stringent salt conditions will usually be less than 1000 mM, typically less than 500 mM, preferably less than 200 mM. However, the combination of indicators is much more important than the measurement of any single indicator (see, eg, Wetmur and Davidson, 1968). The probe sequence may also specifically hybridize to the duplex DNA under certain conditions to form a triple helix or other higher order DNA complex. Preparation of such probes and appropriate hybridization conditions are well known in the art.

　「実質的相同性」または「実質的同一性」なる語は、ポリペプチドをいう場合、問題のポリペプチドまたは蛋白質が自然に発生する全体蛋白質またはその一部分と少なくとも約３０％同一性、通常少なくとも約７０％同一性、好ましくは少なくとも約９５％同一性を表すことを示す。 The terms "substantial homology" or "substantial identity" when referring to a polypeptide, are at least about 30% identical, usually at least about 30%, identical to the naturally occurring whole protein or a portion thereof, in which the polypeptide or protein in question is naturally occurring. Indicates 70% identity, preferably at least about 95% identity.

　「実質的に同一の機能」とは、野生型ＢＲＣＡ１核酸または野生型ＢＲＣＡ１ポリペプチドに関しての、修飾核酸または修飾蛋白質の機能をいう。修飾ポリペプチドは野生型ＢＲＣＡ１ポリペプチドに実質的に相同性であって、同一の機能を実質的に有するであろう。修飾ポリペプチドは、変化したアミノ酸配列を有し、および／または修飾アミノ酸を含み得る。機能の同一性に加えて、修飾ポリペプチドは、より長い半減期のごとき他の有用な特性を有し得る。修飾ポリペプチドの機能(活性)の同一性は、実質的に野生型ＢＲＣＡ１ポリペプチドの活性と同一とし得る。別法として、修飾ポリペプチドの機能(活性)の同一性は、野生型ＢＲＣＡ１ポリペプチドの活性よりも高いものとし得る。修飾ポリペプチドは、慣用的な技術を用いて合成し、あるいは、修飾した核酸によってコードされ、慣用的な技術を用いて作製される。修飾核酸は慣用的な技術によって調製する。野生型ＢＲＣＡ１遺伝子機能と実質的に同様の機能を有する核酸は、前記した修飾蛋白質を産生する。 "Substantially the same function" refers to a function of a modified nucleic acid or a modified protein with respect to a wild-type BRCA1 nucleic acid or a wild-type BRCA1 polypeptide. The modified polypeptide will be substantially homologous to the wild-type BRCA1 polypeptide and will have substantially the same function. Modified polypeptides have an altered amino acid sequence and / or can include modified amino acids. In addition to functional identity, modified polypeptides may have other useful properties, such as a longer half-life. The identity of the function (activity) of the modified polypeptide can be substantially the same as the activity of the wild-type BRCA1 polypeptide. Alternatively, the identity of the function (activity) of the modified polypeptide may be higher than the activity of the wild-type BRCA1 polypeptide. Modified polypeptides are synthesized using conventional techniques, or are encoded by modified nucleic acids and are produced using conventional techniques. Modified nucleic acids are prepared by conventional techniques. A nucleic acid having a function substantially similar to the wild-type BRCA1 gene function produces the modified protein described above.

　ポリペプチドの相同性は、典型的に、配列分析ソフトウェアを用いて測定する(例えば、Ｓequence Ａnalysis Ｓoftware Ｐackage of the Ｇenetics Ｃomputer Ｇroup，Ｕniversity of Ｗisconsin Ｂiotechnology Ｃenter，910 Ｕniversity Ａvenue，Ｍadison，Ｗisconsin 53705参照)。蛋白質分析ソフトウェアは、種々の置換、欠失および他の修飾を指定した相同性の測定を用いて、同様配列を対合する。保存性置換には、典型的に、以下の群の中の置換が含まれる：グリシン、アラニン；バリン、イソロイシン、ロイシン；アスパラギン酸、グルタミン酸；アスパラギン、グルタミン；セリン、スレオニン；リジン、アルギニン；およびフェニルアラニン、チロシン。 O Polypeptide homology is typically measured using sequence analysis software (see, for example, Sequence Analysis Software Package of the Genetics Computer Group, University of Wisconsin Biotechnology Center, 910 University Avenue, Madison, Wisconsin 53705). Protein analysis software pairs similar sequences using similarity measures, specifying various substitutions, deletions, and other modifications. Conservative substitutions typically include substitutions in the following group: glycine, alanine; valine, isoleucine, leucine; aspartic acid, glutamic acid; asparagine, glutamine; serine, threonine; lysine, arginine; and phenylalanine. , Tyrosine.

　ポリペプチド「断片」、「一部分」または「セグメント」とは、少なくとも約５〜７個の隣接したアミノ酸、しばしば、少なくとも約７〜９個の隣接したアミノ酸、典型的には少なくとも約９〜１３の隣接したアミノ酸、最も好ましくは少なくとも約２０〜３０またはそれを超えて隣接したアミノ酸のアミノ酸残基のストレッチである。 A polypeptide “fragment”, “portion” or “segment” is at least about 5 to 7 contiguous amino acids, often at least about 7 to 9 contiguous amino acids, typically at least about 9 to 13 contiguous amino acids. Stretches of amino acid residues of contiguous amino acids, most preferably at least about 20-30 or more contiguous amino acids.

　本発明のポリペプチドは、可溶性である場合、例えば、ニトロセルロース、ナイロン、カラム充填材(例えば、Ｓepharose beads)、磁性ビーズ、ガラスウール、プラスチック、金属、ポリマーゲル、細胞または他の基体のような固相支持体にカップリングし得る。かかる支持体は、例えば、ビーズ、ウェル、計深棒または膜のような形態を採り得る。 The polypeptides of the present invention, when soluble, such as, for example, nitrocellulose, nylon, column packing (eg, Sepharose beads), magnetic beads, glass wool, plastics, metals, polymer gels, cells or other substrates. It can be coupled to a solid support. Such a support may take the form of, for example, beads, wells, dipsticks or membranes.

　「標的領域」とは、増幅および／または検出する核酸の領域をいう。「標的配列」なる語は、所望の条件下にて、それとプローブまたはプライマーとが安定なハイブリッドを形成するであろう配列をいう。 "Target region" refers to a region of a nucleic acid to be amplified and / or detected. The term "target sequence" refers to a sequence that will form a stable hybrid with a probe or primer under desired conditions.

　本発明の実施は、特に指摘しない限り、化学、分子生物学、微生物学、組換えＤＮＡ、遺伝学および免疫学の慣用的な技術を用いる(例えば、Ｍaniatisら，1982；Ｓambrookら，1989；Ａusubelら，1992；Ｇlover，1985；Ａnand，1992；ＧuthrieおよびＦink，1991参照)。ヒト染色体１７ｑのマッピングを含むヒト遺伝子マッピングの技術および材料の一般的な議論は、例えば、ＷhiteおよびＬalouel，1988に記載されている。 The practice of the present invention will employ, unless otherwise indicated, conventional techniques of chemistry, molecular biology, microbiology, recombinant DNA, genetics and immunology (eg, Maniatis et al., 1982; Sambrook et al., 1989; Ausubel). Glover, 1985; Anand, 1992; Guthrie and Fink, 1991). A general discussion of techniques and materials for human gene mapping, including mapping of human chromosome 17q, is described in, for example, White and Lalouel, 1988.

組換えまたは化学的に合成した核酸；ベクター、形質転換、宿主細胞の調製
　本発明の大量のポリヌクレオチドは、適当な宿主細胞中の複製によって産生し得る。所望の断片をコードする天然または合成ポリヌクレオチド断片は、原核生物または真核生物細胞に導入し、複製する能力を有する、組換えポリヌクレオチド構築物、通常ＤＮＡ構築物に導入する。通常、ポリヌクレオチド構築物は、酵母または細菌のごとき単細胞宿主における複製に適しているであろうが、(ゲノム内に一体化されるか、またはされないで)培養した哺乳動物または植物あるいは他の真核生物細胞系統への導入を意図することもできる。本発明の方法によって作製した核酸の精製は、例えば、Ｓambrookら，1989またはＡusubelら，1992に記載されている。 Preparation of recombinant or chemically synthesized nucleic acids; vectors, transformations, host cells Large quantities of the polynucleotides of the invention may be produced by replication in a suitable host cell. Natural or synthetic polynucleotide fragments encoding the desired fragments are introduced into prokaryotic or eukaryotic cells and introduced into a recombinant polynucleotide construct, usually a DNA construct, capable of replicating. Usually, the polynucleotide construct will be suitable for replication in a unicellular host, such as a yeast or bacterium, but will be cultivated (integrated or not integrated into the genome) in a mammalian or plant or other eukaryotic state. It can also be intended for introduction into biological cell lines. Purification of nucleic acids produced by the method of the invention is described, for example, in Sambrook et al., 1989 or Ausubel et al., 1992.

　本発明のポリヌクレオチドは、例えば、ＢeaucageおよびＣarruthers，1981によって記載されているホスホルアミダイト法、またはＭatteucciおよびＣaruthers，1981によるトリエステル法による化学合成によって作製し得、市販の自動化オリゴヌクレオチド合成器で行うこともできる。二本鎖断片は、相補鎖を合成し、適当な条件下にてそれらの鎖を一緒にアニーリングさせることによって、あるいは、適当なプライマー配列と一緒にＤＮＡポリメラーゼを用いて相補鎖を付加することによって、化学合成の一本鎖から得ることができる。 The polynucleotides of the present invention can be made, for example, by chemical synthesis by the phosphoramidite method described by Beaucage and Carruthers, 1981, or by the triester method of Matteucci and Carruthers, 1981, and are commercially available on an automated oligonucleotide synthesizer. You can do it too. Double-stranded fragments are synthesized by synthesizing complementary strands and annealing the strands together under appropriate conditions, or by adding the complementary strands using a DNA polymerase with appropriate primer sequences. , Can be obtained from a single strand of chemical synthesis.

　原核生物または真核生物宿主へ導入するために調製するポリヌクレオチド構築物は、所望のポリヌクレオチドをコードする目的のポリヌクレオチド断片を包含する宿主によって認識される複製系を含み得、好ましくは該ポリヌクレオチドコードセグメントに作動可能に連結した転写および翻訳の開始の調節配列も含むであろう。発現ベクターには、例えば、複製開始点または自律複製配列(ＡＲＳ)、ならびに、リボソーム-結合部位、ＲＮＡスプライシング部位、ポリアデニル化部位、転写ターミネーター配列およびｍＲＮＡ安定化配列のごとき、発現制御配列、プロモーター、エンハンサーおよび必須のプロセシング情報部位が含まれ得る。分泌シグナルには、適当には、天然ＢＲＣＡ１蛋白質からか、または他の受容体、あるいは同一または関連する種の分泌ポリペプチドからかのいずれかからのもので、蛋白質を細胞膜貫通および／または緊提させるもので、従って、その機能トポロジーを達成する、あるいは細胞から分泌されるものが含まれ得る。かかるベクターは、当該分野でよく知られ、例えば、Ｓambrookら，1989またはＡusbelら，1992中で論じられている標準的な組換え技術によって調製し得る。 A polynucleotide construct prepared for introduction into a prokaryotic or eukaryotic host can include a replication system recognized by the host, including the polynucleotide fragment of interest encoding the desired polynucleotide, preferably the polynucleotide. It will also include transcriptional and translational initiation regulatory sequences operably linked to the coding segment. Expression vectors include, for example, an origin of replication or an autonomously replicating sequence (ARS), and expression control sequences, promoters, such as ribosome-binding sites, RNA splicing sites, polyadenylation sites, transcription terminator sequences and mRNA stabilizing sequences. Enhancers and essential processing information sites may be included. The secretion signal, suitably from either the native BRCA1 protein or from another receptor, or from a secreted polypeptide of the same or related species, transduces and / or binds the protein. And thus achieve those functional topologies or may be secreted from cells. Such vectors can be prepared by standard recombinant techniques well known in the art and discussed, for example, in Sambrook et al., 1989 or Ausbel et al., 1992.

　適当なプロモーターおよび他の必須のベクター配列は、宿主で機能するように選択され、適当には、ＢＲＣＡ１遺伝子と天然で関連するものが含まれ得る。細胞系統および発現ベクターの作動し得る組合せの例は、Ｓambrookら，1989またはＡusubelら，1992に記載されており；また、例えば、Ｍetzgerら，1988を参照せよ。多くの有用なベクターが当該分野で公知であり、Ｓtratagene社、Ｎew Ｅngland Ｂiolabs社、Ｐromega Ｂiotech社他のごとき業者から入手し得る。
ｔｒｐ、ｌａｃおよびファージプロモーター、ｔＲＮＡプロモーターおよび解糖酵素プロモーターのごときプロモーターを原核生物宿主に用い得る。有用な酵母プロモーターには、メタロチオネイン、３-ホスホグリセレート・キナーゼ、または、エノラーゼもしくはグリセルアルデヒド-３-ホスフェート・デヒドロゲナーゼのごとき他の解糖酵素、マルトースおよびガラクトース利用に寄与する酵素他のプロモーター領域が含まれる。酵母発現の使用に適したベクターおよびプロモーターは、さらに、Ｈitzemanら，EP 73,675A号に記載されている。適当な非天然哺乳動物プロモーターには、ＳＶ４０からの初期および後期プロモーター(Ｆiersら，1978)またはマウスモロニー白血病ウイルス、マウス腫瘍ウイルス、ニワトリ肉腫ウイルス、II型アデノウイルス、ウシ乳頭腫ウイルスまたはポリオーマ由来のプロモーターが含まれ得る。加えて、該構築物は、複数コピーの遺伝子を作製し得るように、増幅性遺伝子(例えば、ＤＨＦＲ)に連結し得る。適当なエンハンサーおよび他の発現制御配列に関しては、例えば、Ｅnhancers and Ｅukaryotic Ｇene Ｅxpression，Ｃold Ｓpring Ｈarbor Ｐress社，Ｃold Ｓpring Ｈarbor，Ｎew Ｙork(1983)を参照せよ。 Appropriate promoters and other essential vector sequences are selected to function in the host and may suitably include those naturally associated with the BRCA1 gene. Examples of operable combinations of cell lines and expression vectors are described in Sambrook et al., 1989 or Ausubel et al., 1992; see also, for example, Metzger et al., 1988. Many useful vectors are known in the art and can be obtained from commercial sources such as Stratagene, New England Biolabs, Promega Biotech, and others.
Promoters such as trp, lac and phage promoters, tRNA promoters and glycolytic enzyme promoters can be used for prokaryotic hosts. Useful yeast promoters include metallothionein, 3-phosphoglycerate kinase, or other glycolytic enzymes such as enolase or glyceraldehyde-3-phosphate dehydrogenase, enzymes that contribute to maltose and galactose utilization, and other promoter regions. Is included. Vectors and promoters suitable for use in yeast expression are further described in Hitzeman et al., EP 73,675A. Suitable non-natural mammalian promoters include the early and late promoters from SV40 (Fiers et al., 1978) or those derived from mouse Moloney leukemia virus, mouse tumor virus, chicken sarcoma virus, type II adenovirus, bovine papilloma virus or polyoma. A promoter may be included. In addition, the construct can be linked to an amplifiable gene (eg, DHFR) so that multiple copies of the gene can be made. For suitable enhancers and other expression control sequences, see, for example, Enhancers and Eukaryotic Gene Expression, Cold Spring Harbor Press, Cold Spring Harbor, New York (1983).

　かかる発現ベクターは自律的に複製し得るが、それらは、当該分野でよく知られている方法によって、宿主細胞のゲノムに挿入することによって複製することもできる。 Although such expression vectors can replicate autonomously, they can also replicate by inserting into the genome of a host cell, by methods well known in the art.

　発現およびクローニングベクターは、ベクターで形質転換した宿主細胞の生存または増殖に必須な蛋白質をコードする遺伝子である選択マーカーを含むようである。この遺伝子が存在することにより、該インサートを発現する宿主細胞のみの増殖が保証される。典型的な選択遺伝子は、ａ）抗生物質または他の毒性物質、例えば、アンピシリン、ネオマイシン、メトトレキセート他への抵抗性を付与する；ｂ）栄養要求性欠損を補う、またはｃ）複合培地から入手できない重要な栄養を供給する(例えば、悍菌(Ｂacilli)にはＤ-アラニン・ラセマーゼをコードする遺伝子)蛋白質をコードしている。適当な選択マーカーの選択は宿主細胞に依存し、種々の宿主に対する適当なマーカーは当該分野でよく知られている。 Expression and cloning vectors are likely to contain a selectable marker which is a gene encoding a protein essential for the survival or growth of the host cells transformed with the vector. The presence of this gene ensures that only host cells that express the insert will grow. Typical selection genes a) confer resistance to antibiotics or other toxic substances such as ampicillin, neomycin, methotrexate, etc .; b) compensate for auxotrophic deficiencies, or c) are not available from complex media It encodes a protein that supplies important nutrients (eg, the gene encoding D-alanine racemase in Bacilli). Selection of the appropriate selectable marker will depend on the host cell, and appropriate markers for different hosts are well known in the art.

　目的の核酸を含むベクターはイン・ビトロ(in vitro)で転写し得、よく知られた方法(例えば、インジェクション(Ｋuboら，1988))によって、得られたＲＮＡを宿主細胞に導入し得、あるいは、該ベクターは細胞宿主のタイプに依存して変動する当該分野でよく知られている方法(エレクトロポレーション；塩化カルシウム、塩化ルビジウム、リン酸カルシウム、ＤＥＡＥ-デキストランまたは他の物質を用いるトランスフェクション；マイクロプロジェクタイル衝撃；リポフェクション感染(ベクターがレトロウイルスゲノムのごとき感染性因子である)；ならびに他の方法)によって宿主細胞に直接導入し得る(一般的に、Ｓambrookら，1989およびＡusubelら，1992参照)。とりわけ前記したものを包含する当該分野で公知のいずれかの方法による宿主細胞へのポリヌクレオチドの導入は、本明細書中で「形質転換」という。前記の核酸を導入した細胞は、かかる細胞の子孫も含むことを意味する。 A vector containing the nucleic acid of interest can be transcribed in vitro, and the resulting RNA can be introduced into host cells by well-known methods (eg, injection (Kubo et al., 1988)), or The vector may vary depending on the type of cell host, well known in the art (electroporation; transfection with calcium chloride, rubidium chloride, calcium phosphate, DEAE-dextran or other substances; microprojectors Il bombardment; lipofection infection (the vector is an infectious agent such as the retroviral genome); and other methods) can be introduced directly into host cells (see generally, Sambrook et al., 1989 and Ausubel et al., 1992). Introduction of a polynucleotide into a host cell by any method known in the art, including, inter alia, those described above, is referred to herein as "transformation." Cells into which the nucleic acid has been introduced are meant to include the progeny of such cells.

　本発明の大量の核酸およびポリヌクレオチドは、ＢＲＣＡ１核酸またはその一部分を原核生物または真核生物宿主細胞に和合性のベクターまたは他の発現ビヒクルで発現させることによって調製し得る。最も通常用いる原核生物宿主はエシェリキア・コリ(Ｅscherichia coli)であるが、バチルス・ズブチリス(Ｂacillus subtilis)またはシュードモナス(Ｐseudomonas)のごとき他の原核生物も用い得る。 Large quantities of the nucleic acids and polynucleotides of the invention can be prepared by expressing the BRCA1 nucleic acid or a portion thereof in a prokaryotic or eukaryotic host cell with a vector or other expression vehicle that is compatible. The most commonly used prokaryotic host is Escherichia coli, but other prokaryotes such as Bacillus subtilis or Pseudomonas may be used.

　哺乳類宿主細胞、あるいは、酵母、糸状菌、植物、昆虫、または両生類もしくは鳥類のごとき他の真核生物宿主細胞も、また、本発明の蛋白質の産生に有用となり得る。培養における哺乳動物細胞の増殖は、それ自体よく知られている(ＪakobyおよびＰastan，1979参照)。通常用いられる哺乳動物宿主細胞系統の例はＶＥＲＯおよびＨeＬa細胞、チャイニーズハムスター卵巣(ＣＨＯ)細胞、ならびにＷＩ３８、ＢＨＫおよびＣＯＳ細胞系統であるが、他の細胞系統も、例えば、より高い発現、望ましいグリコシル化パターン、または他の特徴を供するに適当となり得ることは当業者によって理解されるであろう。 Mammalian host cells, or other eukaryotic host cells such as yeast, filamentous fungi, plants, insects, or amphibians or birds, may also be useful for producing the proteins of the invention. The growth of mammalian cells in culture is well known per se (see Jakoby and Pastan, 1979). Examples of commonly used mammalian host cell lines are VERO and HeLa cells, Chinese hamster ovary (CHO) cells, and WI38, BHK and COS cell lines, although other cell lines, such as higher expression, desirable glycosyl It will be appreciated by those skilled in the art that the pattern may be suitable for providing a pattern, or other features.

　ベクター構築物の様式に依存するマーカーを用いることによって、クローンを選抜し得る。マーカーは、同一または異なるＤＮＡ分子上とし得るが、好ましくは同一ＤＮＡ分子上である。原核生物宿主においては、例えば、アンピシリン、テトラサイクリンまたは他の抗生物質に対する抵抗性によって、形質転換体を選抜し得る。温度感受性に基づく特定の産物の産生も、適当なマーカーとして作用し得る。クローン Clones can be selected by using a marker that depends on the mode of the vector construct. The markers can be on the same or different DNA molecules, but are preferably on the same DNA molecule. In prokaryotic hosts, transformants can be selected by, for example, resistance to ampicillin, tetracycline, or other antibiotics. The production of a particular product based on temperature sensitivity may also serve as a suitable marker.

　本発明のポリヌクレオチドで形質転換した原核生物または真核生物細胞は、本発明の核酸およびポリペプチドの産生のみならず、例えば、ＢＲＣＡ１ポリペプチドの特性の研究においても有用であろう。
　アンチセンス・ポリヌクレオチド配列は、当業者によって理解されるであろうごとく、ＢＲＣＡ１座の発現を防ぐか、または減じるのに有用である。例えば、ＢＲＣＡ１座またはＢＲＣＡ１領域からの他の配列(特に、ＢＲＣＡ１座に隣接するもの)の全体もしくは一部分を含有するポリヌクレオシドベクターは、アンチセンス方向でプロモーターの制御下に置き、細胞に導入することができる。細胞内におけるかかるアンチセンス構築物の発現は、ＢＲＣＡ１転写および／または翻訳および／または複製を妨害するであろう。 Prokaryotic or eukaryotic cells transformed with a polynucleotide of the present invention will be useful not only in producing the nucleic acids and polypeptides of the present invention, but also in, for example, studying the properties of a BRCA1 polypeptide.
Antisense polynucleotide sequences are useful in preventing or reducing the expression of the BRCA1 locus, as will be appreciated by those skilled in the art. For example, a polynucleoside vector containing all or part of the BRCA1 locus or other sequences from the BRCA1 region (particularly those adjacent to the BRCA1 locus) can be placed under the control of the promoter in the antisense orientation and introduced into the cell. Can be. Expression of such an antisense construct in a cell will interfere with BRCA1 transcription and / or translation and / or replication.

　本明細書で開示したＢＲＣＡ１遺伝子配列に基づくプローブおよびプライマーを用いて、他の種における相同性ＢＲＣＡ１遺伝子配列および蛋白質を同定する。これらのＢＲＣＡ１遺伝子配列および蛋白質は、それを単離した種についての、本明細書に記載した診断／予測、治療および薬剤スクリーニング方法に用いる。プローブ Identify homologous BRCA1 gene sequences and proteins in other species using probes and primers based on the BRCA1 gene sequences disclosed herein. These BRCA1 gene sequences and proteins are used in the diagnostic / prognostic, therapeutic and drug screening methods described herein for the species from which they were isolated.

使用方法：核酸診断および診断キット
　個人が癌になる素因であるＢＲＣＡ１対立遺伝子の存在を検出するためには、血液のごとき生物試料を調製し、ＢＲＣＡ１の感受性対立遺伝子の存在または不存在について分析する。新生生物の存在を検出するためには、前駆体病斑の悪性腫瘍に向けての進展、または、予測指標として、病斑の生物試料を調製し、ＢＲＣＡ１の突然変異対立遺伝子の存在または不存在について分析する。これらの試験の結果および解釈情報は、試験した個人に対するコミュニケーションのためにヘルスケア・プロバイダーに戻す。かかる診断は、診断研究所によって行うか、別法として、診断キットを製造し、ヘルスケア・プロバイダーまたは自己-診断用にプライベートな個人に対して販売し得る。 Methods of Use: Nucleic Acid Diagnostics and Diagnostic Kits To detect the presence of the BRCA1 allele, which predisposes an individual to cancer, prepare a biological sample, such as blood, and analyze for the presence or absence of the susceptibility allele of BRCA1. . In order to detect the presence of a neoplasm, a biological sample of a lesion is prepared as a predictive indicator of the progression of a precursor lesion toward a malignant tumor, or the presence or absence of a mutant allele of BRCA1. Is analyzed. The results of these tests and interpretive information are returned to the healthcare provider for communication to the individuals tested. Such diagnosis may be performed by a diagnostic laboratory or, alternatively, a diagnostic kit may be manufactured and sold to a healthcare provider or private individual for self-diagnosis.

　最初に、スクリーニング法は適当なＢＲＣＡ１配列の増幅が含まれる。本発明のもう１つの好ましい具体例において、該スクリーニング方法は、非-ＰＣＲベースの戦略を含む。かかるスクリーニング法には、当該分野でよく知られている２-段階標識増幅方法論が含まれる。ＰＣＲおよび非-ＰＣＲの両方のベースのスクリーニング戦略は、高レベルの感度で標的配列を検出し得る。 Initially, the screening method involves amplification of the appropriate BRCA1 sequence. In another preferred embodiment of the invention, the screening method comprises a non-PCR based strategy. Such screening methods include two-step label amplification methodologies that are well known in the art. Both PCR and non-PCR based screening strategies can detect target sequences with a high level of sensitivity.

　今日用いられている最もポピュラーな方法は、標的増幅である。ここにおいては、標的核酸配列をポリメラーゼで増幅する。ポリメラーゼ作動増幅を用いる１つの特に好ましい方法は、ポリメラーゼ連鎖反応(ＰＣＲ)である。ポリメラーゼ連鎖反応および他のポリメラーゼ-作動増幅アッセイにより、ポリメラーゼ-作動増幅サイクルの使用を通して、コピー数にして百万倍を超える増加を達成し得る。増幅したら、得られた核酸は配列決定し得るか、またはＤＮＡプローブ用の基質として用い得る。最も The most popular method used today is target amplification. Here, the target nucleic acid sequence is amplified with a polymerase. One particularly preferred method using polymerase-operated amplification is the polymerase chain reaction (PCR). The polymerase chain reaction and other polymerase-operated amplification assays can achieve over one million-fold increase in copy number through the use of polymerase-operated amplification cycles. Once amplified, the resulting nucleic acid can be sequenced or used as a substrate for a DNA probe.

　プローブを用いて標的配列の存在を検出する(例えば、癌感受性についてのスクリーニングにおいて)場合、所望により、血液または血清のごとき分析すべき生物試料を処理して核酸を抽出し得る。試料核酸を種々の方法で調製して、標的配列の検出；例えば、変性、制限消化、電気泳動またはドット・ブロットを容易ならしめることができる。分析核酸の標的化領域は、通常、少なくとも部分的に一本鎖であって、プローブの標的配列とハイブリッドを形成しなければならない。配列が天然に一本鎖である場合、変性は必要ないであろう。しかしながら、配列が二本鎖である場合、該配列は恐らく変性させる必要がある。変性は、当該分野で公知の種々の技術によって行い得る。 If the probe is used to detect the presence of the target sequence (eg, in a screen for cancer susceptibility), the biological sample to be analyzed, such as blood or serum, can be processed to extract nucleic acids, if desired. The sample nucleic acid can be prepared in various ways to facilitate detection of the target sequence; for example, denaturation, restriction digestion, electrophoresis or dot blot. The targeting region of the assay nucleic acid usually must be at least partially single-stranded and hybridize with the target sequence of the probe. If the sequence is naturally single-stranded, no denaturation will be necessary. However, if the sequence is double-stranded, it will probably need to be denatured. Denaturation can be performed by various techniques known in the art.

　分析核酸およびプローブは、分析物中の予想標的化配列とプローブ中の標的配列との安定なハイブリッド形成を促進する条件下にてインキュベートする。分析物に結合させるのに用いるプローブの領域は、ヒト染色体１７ｑの標的化領域に完全に相補的とし得る。したがって、誤った陽性を防ぐためには、高ストリンジェンシー条件が望ましい。しかしながら、高ストリンジェンシー条件は、ゲノム中にユニークである染色体領域にプローブが相補的である場合にのみ使用する。ハイブリダイゼーションのストリンジェンシーは、ハイブリダイゼーションの間および洗浄工程の間の多数の因子によって決定され、これには、温度、イオン強度、塩基組成、プローブ長およびホルムアミド濃度が含まれる。これらの因子は、例えば、Ｍaniatisら，1982およびＳambrookら，1989に概説されている。特定の環境下においては、三重らせん、四重らせん他のごときより高次のハイブリッドを形成させて、標的配列を検出する手段を提供することが望ましいこともあり得る。 The assay nucleic acid and probe are incubated under conditions that promote stable hybridization of the expected targeting sequence in the analyte with the target sequence in the probe. The region of the probe used to bind the analyte may be completely complementary to the targeted region of human chromosome 17q. Therefore, high stringency conditions are desirable to prevent false positives. However, high stringency conditions are used only if the probe is complementary to a chromosomal region that is unique in the genome. The stringency of hybridization is determined by a number of factors during hybridization and during the washing step, including temperature, ionic strength, base composition, probe length and formamide concentration. These factors are reviewed, for example, in Maniatis et al., 1982 and Sambrook et al., 1989. Under certain circumstances, it may be desirable to allow higher order hybrids to form, such as triple helices, quadruplexes, etc., to provide a means to detect the target sequence.

　いずれにせよ、得られたハイブリッドの検出は、通常、標的プローブを用いることによってなされる。別法として、該プローブは非標識であってもよいが直接または間接的に標識したリガンドとの特異的な結合によって検出し得る。適当な標識、ならびにプローブおよびリガンドを標識する方法は当該分野で公知であって、これには、例えば、公知の方法(例えば、ニック・トランスレーション、ランダム・プライミングまたはキナージング(kinasing))、ビオチン、蛍光基、化学発光基(例えば、ジオキセタン、特に励起(triggered)ジオキセタン)、酵素、抗体他によって取り込み得る放射能標識が含まれる。この基本スキームの変形は当該分野で公知であって、外来物質から検出すべきハイブリッドの分離を容易ならしめる変形、および／または標識基からの信号を増幅する変形が含まれる。多くのこれらの変形は、例えば、ＭatthewsおよびＫricka，1988；Ｌandegrenら，1988；Ｍittlin，1989；米国特許第4,868,105号およびＥＰＯ公開第225,807号に概説されている。 In any case, detection of the obtained hybrid is usually performed by using a target probe. Alternatively, the probe may be unlabeled, but detected directly or indirectly by specific binding to a labeled ligand. Suitable labels and methods of labeling probes and ligands are known in the art, including, for example, known methods (e.g., nick translation, random priming or kinasing), biotin, Includes fluorescent groups, chemiluminescent groups (eg, dioxetanes, especially triggered dioxetanes), radioactive labels that can be taken up by enzymes, antibodies, and the like. Variations on this basic scheme are known in the art and include those that facilitate the separation of the hybrids to be detected from foreign substances and / or that amplify the signal from the labeling group. Many of these variations are reviewed, for example, in Matthews and Kricka, 1988; Landegren et al., 1988; Mittlin, 1989; U.S. Patent No. 4,868,105 and EPO Publication No. 225,807.

　前記したごとく、非-ＰＣＲ-ベースのスクリーニングアッセイも本発明で意図される。例示的な非-ＰＣＲに基づく方法を実施例１１に供する。この方法は、核酸プローブ(または、ホスホン酸メチル骨格を正常なホスホジエステルと置換えたごときアナログ)を低レベルのＤＮＡ標的にハイブリダイズする。このプローブは、共有結合がハイブリダイゼーションの特異性を妨害しないように、当該プローブに共有結合した酵素を有し得る。この酵素-プローブ-コンジュゲート-標的核酸複合体は、ついで、遊離プローブ酵素コンジュゲートから単離し得、酵素検出用に基質を添加する。酵素活性は、感度にして１０^３-１０^６の増加が得られる発色または発光出力における変化で観察認される。オリゴデオキシヌクレオチド-アルカリホスファターゼ・コンジュゲートの調製およびハイブリダイゼーション・プローブとしてのそれらの使用に関する一例としては、Ｊablonskiら，1986を参照せよ。 As noted above, non-PCR-based screening assays are also contemplated by the present invention. An exemplary non-PCR based method is provided in Example 11. This method hybridizes a nucleic acid probe (or an analog, such as replacing the methyl phosphonate backbone with a normal phosphodiester) to low levels of a DNA target. The probe may have an enzyme covalently attached to the probe such that the covalent bond does not interfere with the specificity of the hybridization. The enzyme-probe-conjugate-target nucleic acid complex can then be isolated from the free probe enzyme conjugate, and the substrate is added for enzyme detection. Enzyme activity is observed by a change in color development or luminescence output that results in an increase of 10 ³ -10 ⁶ in sensitivity. For an example of the preparation of oligodeoxynucleotide-alkaline phosphatase conjugates and their use as hybridization probes, see Jablonski et al., 1986.

　二段階標識増幅方法論は、当該分野で公知である。これらのアッセイは、(ジゴキシゲニン、ビオチン他のごとき)小リガンドが、ＢＲＣＡ１に特異的に結合し得る核酸プローブに結合するという原理で行う。例示的なプローブを本明細書の表９および１０に供し、これにはさらに、配列番号：１のヌクレオチド位３６３１〜３９３０に対応する核酸プローブが含まれる。対立遺伝子特異的プローブもまた、この例の範囲内にあることが意図されており、例示的な対立遺伝子特異的プローブには、本願明細書の表１２および１３中に要約した素因突然変異を包含するプローブが含まれる。 Two-step label amplification methodology is known in the art. These assays are performed on the principle that a small ligand (such as digoxigenin, biotin, etc.) binds to a nucleic acid probe capable of binding BRCA1 specifically. Exemplary probes are provided in Tables 9 and 10 herein, and further include nucleic acid probes corresponding to nucleotide positions 3631-930 of SEQ ID NO: 1. Allele-specific probes are also intended to be within the scope of this example, and exemplary allele-specific probes include the predisposition mutations summarized in Tables 12 and 13 herein. Probe to be included.

　一例において、核酸プローブに結合する小プローブは、抗体-酵素コンジュゲートによって特異的に認識される。この例の１つの具体例において、ジゴキシゲニンが核酸プローブに結合する。ハイブリダイゼーションは、化学発光基質になる抗体-アルカリホスファターゼ・コンジュゲートによって検出する。この具体例による核酸プローブを標識する方法については、Ｍartinら，1990を参照せよ。第二の実施例においては、第一リガンドに特異的にコンプレックスを形成し得る第二リガンド-酵素コンジュゲートによって小リガンドを認識する。この例のよく知られた具体例は、ビオチン-アビジン型の相互作用である。核酸プローブを標識する方法およびビオチン-アビジンに基づくアッセイにおけるそれらの使用については、Ｒigbyら，1977およびＮguyenら，1992を参照せよ。 In one example, the small probe that binds to the nucleic acid probe is specifically recognized by the antibody-enzyme conjugate. In one embodiment of this example, digoxigenin binds to the nucleic acid probe. Hybridization is detected by an antibody-alkaline phosphatase conjugate that becomes a chemiluminescent substrate. For a method of labeling a nucleic acid probe according to this embodiment, see Martin et al., 1990. In a second embodiment, the small ligand is recognized by a second ligand-enzyme conjugate capable of specifically forming a complex with the first ligand. A well-known example of this example is the biotin-avidin type interaction. For methods of labeling nucleic acid probes and their use in biotin-avidin based assays, see Rigby et al., 1977 and Nguyen et al., 1992.

　本発明の核酸プローブアッセイがＢＲＣＡ１を検出し得る核酸プローブのカクテルを用いるであろうことも、本発明の範囲内で意図されている。かくして、細胞試料中のＢＲＣＡ１の存在を検出する一例において、ＢＲＣＡ１に相補的な２以上のプローブを用い、特に、多くの異なるプローブを、別法として、２、３または５この異なる核酸プローブ配列を用いる。もう１つの例において、患者におけるＢＲＣＡ１遺伝子配列中の突然変異の存在を検出するためには、ＢＲＣＡ１に相補的な２以上のプローブを用い、ここに、カクテルは、ＢＲＣＡ１中に変化を有する患者の集団において同定された対立遺伝子-特異的突然変異に結合し得るプローブを含む。この具体例においては、いずれの数のプローブを用いることができるが、好ましくは、個人が乳癌になる素因として同定された主遺伝子突然変異に対応するプローブを含むであろう。本発明の範囲内に意図される幾つかの候補プローブには、表１２および１３に同定した対立遺伝子-特異的突然変異を含むプローブ、ならびに、配列番号：１の５'および３'の両方の突然変異サイトに対応するＢＲＣＡ１領域を有するプローブが含まれる。 It is also contemplated within the scope of the present invention that the nucleic acid probe assay of the present invention will use a cocktail of nucleic acid probes capable of detecting BRCA1. Thus, in one example of detecting the presence of BRCA1 in a cell sample, two or more probes complementary to BRCA1 are used, and in particular, many different probes can be used, alternatively 2, 3, or 5 different nucleic acid probe sequences. Used. In another example, to detect the presence of a mutation in the BRCA1 gene sequence in a patient, two or more probes that are complementary to BRCA1 are used, wherein the cocktail comprises a patient having a change in BRCA1. Includes probes that can bind to allele-specific mutations identified in the population. In this embodiment, any number of probes can be used, but will preferably include a probe corresponding to a major gene mutation identified as predisposing an individual to breast cancer. Some candidate probes contemplated within the scope of the present invention include probes containing allele-specific mutations identified in Tables 12 and 13, as well as both 5 'and 3' of SEQ ID NO: 1. Probes having a BRCA1 region corresponding to the mutation site are included.

使用方法：ペプチド診断および診断キット
　病斑の新生生物状態は、野生型ＢＣＡ１ポリペプチドの変化に基づいても検出し得る。かかる変化は、慣用的な技術による配列分析によって決定し得る。より好ましくは、抗体(ポリクローナルまたはモノクローナル抗体)を用いて、ＢＲＣＡ１ペプチド中の相違、または不存在を検出する。該抗体は、「抗体」なる標題下で前に論じ、実施例１２および１３にさらに示すごとく調製し得る。抗体を生起させて精製する他の技術は当該分野でよく知られており、いずれのかかる技術を用いても、本発明に請求する調製物をなし得る。本発明の好ましい具体例において、抗体は、溶液からＢＲＣＡ１蛋白質を免疫沈降し、かつ、ポリアクリルアミドゲルのウェスタンまたはイムノブロット上でＢＲＣＡ１蛋白質と反応するであろう。もう１つの好ましい具体例において、抗体は、免疫細胞化学的技術を用いて、パラフィンまたは凍結組織切片中のＢＲＣＡ１蛋白質を検出するであろう。 Methods of Use: Peptide Diagnosis and Diagnostic Kits The neoplastic state of a lesion can also be detected based on alterations in wild-type BCA1 polypeptide. Such changes can be determined by sequence analysis by conventional techniques. More preferably, antibodies (polyclonal or monoclonal antibodies) are used to detect differences or absence in the BRCA1 peptide. The antibodies can be prepared as discussed previously under the heading "Antibodies" and further shown in Examples 12 and 13. Other techniques for raising and purifying antibodies are well known in the art, and any such technique may be used to make the preparations claimed in the present invention. In a preferred embodiment of the invention, the antibody will immunoprecipitate the BRCA1 protein from solution and react with the BRCA1 protein on a Western or immunoblot of a polyacrylamide gel. In another preferred embodiment, the antibody will detect BRCA1 protein in paraffin or frozen tissue sections using immunocytochemical techniques.

　ＢＲＣＡ１またはその突然変異を検出する方法に関する好ましい具体例には、モノクローナル抗体および／またはポリクローナル抗体を用いたサンドウィッチアッセイを含む、酵素結合免疫ソルベントアッセイ(ＥＬＩＳＡ)、ラジオイムノアッセイ(ＲＩＡ)、イムノラジオ分析アッセイ(ＩＲＭＡ)およびイムノ酵素アッセイ(ＩＥＭＡ)が含まれる。例示的なサンドウィッチアッセイは、(出典明示して本明細書の一部とみなし、実施例１４で例示する)米国特許第4,376,110号および第4,486,530号においてＤavidらによって記載されている。 Preferred specific examples of the method for detecting BRCA1 or a mutation thereof include enzyme-linked immunosorbent assay (ELISA), radioimmunoassay (RIA), and immunoradiometric assay, including a sandwich assay using a monoclonal antibody and / or a polyclonal antibody. (IRMA) and immunoenzymatic assays (IEMA). Exemplary sandwich assays are described by David et al. In US Pat.

使用方法：薬剤スクリーニング
　本発明は、いずれかの種々の薬剤スクリーニング技術においてＢＲＣＡ１ポリペプチドまたはその結合フラグメントを使用することによって、化合物をスクリーニングするのに特に有用である。 Methods of Use: Drug Screening The present invention is particularly useful for screening compounds by using BRCA1 polypeptides or binding fragments thereof in any of a variety of drug screening techniques.

　かかる試験において使用するＢＲＣＡ１ポリペプチドまたはフラグメントは、溶液中で遊離させ得、固体支持体に固定化し得、あるいは細胞表面上に支持し得る。薬剤スクリーニングの１つの方法は、好ましくは競合結合アッセイにおいて、ポリペプチドまたはフラグメントを発現する組換えポリヌクレオチドで安定して形質転換した真核生物または原核宿主生物細胞を使用する。生存能力を有するか、または固定形態のいずれかのかかる細胞は、標準結合アッセイに用いることができる。例えば、ＢＲＣＡ１ポリペプチドまたはフラグメントと試験すべき剤との間の複合体の形成について測定し得、または、ＢＲＣＡ１ポリペプチドまたはフラグメントと既知リガンドとの間の複合体の形成が試験すべき剤によって妨害される程度を検査し得る。Ｂ The BRCA1 polypeptide or fragment used in such a test can be released in solution, immobilized on a solid support, or supported on a cell surface. One method of drug screening uses eukaryotic or prokaryotic host cells stably transformed with recombinant polynucleotides expressing the polypeptide or fragment, preferably in a competitive binding assay. Such cells, either viable or in fixed form, can be used in standard binding assays. For example, the formation of a complex between a BRCA1 polypeptide or fragment and an agent to be tested can be measured, or the formation of a complex between a BRCA1 polypeptide or fragment and a known ligand is blocked by the agent to be tested. You can inspect the extent to which it is done.

　かくして、本発明は、薬剤とＢＲＣＡ１ポリペプチドまたはフラグメントとを接触させ、当該分野でよく知られている方法によって、(ｉ)該剤とＢＲＣＡ１ポリペプチドまたはフラグメントとの間の複合体の存在につき、または(ｉｉ)ＢＲＣＡ１ポリペプチドまたはそのフラグメントとリガンドとの間の複合体の存在につきアッセイすることを特徴とする薬剤のスクリーニング方法を提供する。かかる競合結合アッセイにおいて、ＢＲＣＡ１ポリペプチドまたはフラグメントは、典型的に標識されている。遊離ＢＲＣＡ１ポリペプチドまたはフラグメントは、蛋白質：蛋白質複合体に存在するものから単離し、遊離(すなわち、非コンプレックス形成)標識の量は、各々、ＢＲＣＡ１に対して試験すべき剤の結合の測定値、またはＢＲＣＡ１：リガンド結合で妨害された値である。 Thus, the present invention provides for contacting an agent with a BRCA1 polypeptide or fragment, by methods well known in the art, for (i) the presence of a complex between the agent and the BRCA1 polypeptide or fragment, Or (ii) a method of screening for an agent comprising assaying for the presence of a complex between a BRCA1 polypeptide or a fragment thereof and a ligand. In such a competitive binding assay, the BRCA1 polypeptide or fragment is typically labeled. Free BRCA1 polypeptide or fragment is isolated from that present in the protein: protein complex, and the amount of free (ie, non-complex forming) label is determined by measuring the binding of the agent to be tested to BRCA1, respectively. Alternatively, BRCA1: a value hindered by ligand binding.

　薬剤スクリーニングのもう１つの技術は、ＢＲＣＡ１ポリペプチドに対して適当な結合アフィニティーを有する化合物の高処理量スクリーニングを提供し、これは、Ｇeysen，1984年9月13日に公開されたＰＣＴ国際公開ＷＯ84/03564号に詳記されている。簡単に説明すると、多数の異なる小ペプチド試験化合物を、プラスチックピンまたはある種の他の表面のごとき固体支持体上で合成する。ペプチド試験化合物をＢＲＣＡ１ポリペプチドと反応させ、洗浄する。結合したＢＲＣＡ１ポリペプチドを、ついで、当該分野でよく知られている方法によって検出する。 Another technique for drug screening provides high-throughput screening for compounds with appropriate binding affinity for BRCA1 polypeptides, which is described in Geysen, PCT International Publication WO84, published September 13, 1984. / 03564. Briefly, a number of different small peptide test compounds are synthesized on a solid support, such as a plastic pin or some other surface. The peptide test compound is reacted with the BRCA1 polypeptide and washed. Bound BRCA1 polypeptide is then detected by methods well known in the art.

　精製したＢＲＣＡ１は、前記した薬剤スクリーニング技術において使用するために、プレート上に直接コートし得る。しかしながら、該ポリペプチドに対する非-中和抗体を用いて抗体を捕捉し、該固相上にＢＲＣＡ１ポリペプチドを固定化し得る。 Purified BRCA1 can be coated directly on a plate for use in the drug screening techniques described above. However, non-neutralizing antibodies to the polypeptide can be used to capture the antibody and immobilize the BRCA1 polypeptide on the solid phase.

　また、本発明は、競合薬剤スクリーニングアッセイの使用も意図しており、その中では、ＢＲＣＡ１ポリペプチドに特異的に結合し得る中和抗体を、ＢＲＣＡポリペプチドまたはそのフラグメントに対する結合について、試験化合物と競合させる。このようにして、抗体を用いて、１または２以上のＢＲＣＡ１ポリペプチドの抗原決定基を有するいずれのペプチドの存在も検出し得る。 The present invention also contemplates the use of competitive drug screening assays, wherein a neutralizing antibody capable of specifically binding to a BRCA1 polypeptide is combined with a test compound for binding to a BRCA polypeptide or fragment thereof. Let them compete. In this manner, antibodies can be used to detect the presence of any peptide having an antigenic determinant of one or more BRCA1 polypeptides.

　薬剤スクリーニングのさらなる技術には、非機能性ＢＲＣＡ１遺伝子を有する(前記したごとき)宿主真核生物細胞系統または細胞の使用が含まれる。これらの宿主細胞系統または細胞は、ＢＲＣＡ１ポリペプチドレベルで欠失している。宿主細胞系統または細胞は、薬剤化合物存在下で増殖する。宿主細胞の増殖速度を測定して、該化合物がＢＲＣＡ１欠失細胞の増殖を調節し得るか否かを判断する。 Additional techniques for drug screening include the use of host eukaryotic cell lines or cells (as described above) that have a non-functional BRCA1 gene. These host cell lines or cells are deleted at the BRCA1 polypeptide level. The host cell line or cell grows in the presence of the drug compound. The growth rate of the host cell is measured to determine whether the compound can regulate the growth of BRCA1-deficient cells.

使用方法：合理的薬剤デザイン
　合理的薬剤デザインの目標は、例えば、より活性な、または安定な形態のポリペプチド、またはイン・ビボ(in vivo)でポリペプチドの機能を向上する、または妨害する薬剤を製造するために、目的の生物学的に活性なポリペプチド、または、当該薬剤が相互作用する小分子(例えば、アゴニスト、アンタゴニスト、インヒビター)の構造アナログを設計することである(例えば、Ｈodgson，1991参照)。１つのアプローチにおいて、最初に目的の蛋白質(例えば、ＢＲＣＡ１ポリペプチド)または、例えば、ＢＲＣＡ１-受容体もしくはリガンドコンプレックスの三次元構造を、X-線結晶学、コンピュータ・モデリング、または最も典型的には、組合せたアプローチによって決定する。あまり頻繁ではないが、相同蛋白質の構造に基づくモデリングによって、ポリペプチドの構造に関する有用な情報を得ることができる。合理的薬剤デザインの一例は、ＨＩＶプロテアーゼ・インヒビターの開発である(Ｅricksonら，1990)。加えて、ペプチド(例えば、ＢＲＣＡ１ポリペプチド)をアラニン・スキャンによって分析する(Ｗells，1991)。この技術においては、アミノ酸残基をＡlaに置換し、ペプチド活性に対するその影響を測定する。ペプチドの各アミノ酸残基をこのようにして分析して、ペプチドの重要な領域を決定する。 Uses: rational drug design The goal of rational drug design is, for example, a more active or stable form of the polypeptide, or an agent that enhances or interferes with the function of the polypeptide in vivo. To design a biologically active polypeptide of interest or a structural analog of a small molecule with which the agent interacts (eg, agonists, antagonists, inhibitors) (eg, Hodgson, 1991). In one approach, the three-dimensional structure of a protein of interest (eg, a BRCA1 polypeptide) or, for example, a BRCA1-receptor or ligand complex is first determined by X-ray crystallography, computer modeling, or most typically, , Determined by a combined approach. Less often, modeling based on the structure of homologous proteins can provide useful information about the structure of the polypeptide. One example of a rational drug design is the development of HIV protease inhibitors (Erickson et al., 1990). In addition, peptides (eg, BRCA1 polypeptides) are analyzed by alanine scanning (Wells, 1991). In this technique, an amino acid residue is replaced with Ala and its effect on peptide activity is measured. Each amino acid residue of the peptide is analyzed in this way to determine important regions of the peptide.

　また、機能アッセイによって選抜した標的-特異的抗体を単離し、ついで、その結晶構造を解明することもできる。原則として、このアプローチにより、続く薬剤デザインに基づき得るファーマコア(pharmacore)が得られる。機能的な薬理学的に活性な抗体に対する抗-イディオタイプ抗体(抗-ｉｄｓ)を生起することによって、蛋白質結晶学を全く回避することができる。鏡像の鏡像のごとく、抗-ｉｄｓの結合サイトは、元の受容体のアナログであると予想される。ついで、抗-ｉｄｓを用いて、ペプチドの化学的または生物学的に作成したバンクのバンクからペプチドを同定し、単離し得る。ついで、選抜したペプチドは、ファーマコアとして作用するであろう。標的 It is also possible to isolate the target-specific antibody selected by the functional assay and then elucidate its crystal structure. In principle, this approach results in a pharmacore that can be based on subsequent drug design. By generating anti-idiotypic antibodies (anti-ids) to functional pharmacologically active antibodies, protein crystallography can be avoided altogether. As a mirror image of the mirror image, the binding site of the anti-ids is expected to be an analog of the original receptor. The peptides can then be identified and isolated from a bank of chemically or biologically generated banks of peptides using anti-ids. The selected peptide will then act as a pharmacore.

　かくして、例えば、改善されたＢＲＣＡ１ポリペプチド活性または安定性を有するか、または、例えば、ＢＲＣＡ１ポリペプチド活性のインヒビター、アゴニスト、アンタゴニスト他として作用する薬剤をデザインすることができる。クローン化ＢＲＣＡ１配列の有効性によって、十分な量のＢＲＣＡ１ポリペプチドを利用して、ｘ線結晶学のごとき分析実験を行い得る。加えて、本明細書に供するＢＲＣＡ１蛋白質配列の知見は、ｘ-線結晶学の代わりに、またはそれに加えて、コンピュータモデリング技術を利用するものに導くであろう。 Thus, agents can be designed that have, for example, improved BRCA1 polypeptide activity or stability, or that act, for example, as inhibitors, agonists, antagonists, etc., of BRCA1 polypeptide activity. Depending on the effectiveness of the cloned BRCA1 sequence, an analytical experiment, such as x-ray crystallography, can be performed utilizing a sufficient amount of the BRCA1 polypeptide. In addition, the knowledge of the BRCA1 protein sequence provided herein will lead to the use of computer modeling techniques instead of or in addition to x-ray crystallography.

使用方法：遺伝子療法
　本発明により、野生型ＢＲＣＡ１機能を突然変異ＢＲＣＡ対立遺伝子を運ぶ細胞に供する方法が提供される。かかる機能の提供は、受容細胞の新生生物増殖を抑制するにちがいない。野生型ＢＲＣＡ１遺伝子またはその遺伝子の一部分は、遺伝子が染色体外に残るようベクターで細胞に導入し得る。かかる状態においては、遺伝子は、染色体外位置から細胞によって発現されるであろう。遺伝子フラグメントを突然変異ＢＲＣＡ１対立遺伝子を運ぶ細胞に導入し発現させた場合、該遺伝子フラグメントは、細胞の非-新生生物増殖に要するＢＲＣＡ１蛋白質の一部分をコードしているにちがいない。 Method of Use: Gene Therapy The present invention provides a method of providing wild-type BRCA1 function to cells carrying a mutant BRCA allele. Provision of such a function must inhibit neoplastic growth of the recipient cell. The wild-type BRCA1 gene or a portion of the gene can be introduced into cells with a vector such that the gene remains extrachromosomal. In such a situation, the gene will be expressed by the cell from an extrachromosomal location. When the gene fragment is introduced into a cell carrying a mutant BRCA1 allele and expressed, the gene fragment must encode a portion of the BRCA1 protein required for non-neoplastic growth of the cell.

　より好ましくは、野生型ＢＲＣＡ１遺伝子またはその一部分を、細胞に存在する内因性突然変異ＢＲＣＡ１遺伝子とそれが組換わるように、突然変異細胞に導入する状況である。かかる組換えには、二重組換え事象が必要であり、これはＢＲＣＡ１遺伝子突然変異の訂正を生じる。組換えおよび染色体外維持の両方の遺伝子を導入するベクターは当該分野で公知であり、いずれかの適当なベクターを用い得る。エレクトロポレーション、リン酸カルシウム共沈およびウイルス形質導入のごとき細胞にＤＮＡを導入する方法は当該分野で公知であり、方法の選択は日常従事者の能力の範囲内にある。野生型ＢＲＣＡ１遺伝子で形質転換した細胞をモデル系として使用し、癌の緩解およびかかる緩解を促進する薬剤処理を研究し得る。 More preferably, a situation in which a wild-type BRCA1 gene or a part thereof is introduced into a mutant cell such that it replaces the endogenous mutant BRCA1 gene present in the cell. Such recombination requires a double recombination event, which results in a correction of the BRCA1 gene mutation. Vectors that introduce both recombinant and extrachromosomal maintenance genes are known in the art, and any suitable vector may be used. Methods for introducing DNA into cells, such as electroporation, calcium phosphate co-precipitation, and viral transduction, are well known in the art, and the choice of method is within the abilities of routine workers. Cells transformed with the wild-type BRCA1 gene can be used as a model system to study cancer remission and drug treatments that promote such remission.

　一般的に前に論じたごとく、ＢＲＣＡ１遺伝子またはフラグメントは、適用し得る場合には、癌細胞中のかかる遺伝子の発現産物の量を増加させるために、遺伝子療法に用いることができる。かかる遺伝子療法は、癌性および前-癌性細胞の両方における使用に特に適しており、この療法においては、正常細胞に比して、ＢＲＣＡ１ポリペプチドのレベルがなくなるかまたは減じられる。また、「正常」レベルで突然変異遺伝子が発現しているが、該遺伝子産物は完全に機能的でない腫瘍細胞中でさえ、所与のＢＲＣＡ１遺伝子の発現レベルを増加させるにも有用となり得る。 As generally discussed above, the BRCA1 gene or fragment, when applicable, can be used in gene therapy to increase the amount of the expression product of such a gene in cancer cells. Such gene therapy is particularly suitable for use in both cancerous and pre-cancerous cells, in which the level of BRCA1 polypeptide is eliminated or reduced compared to normal cells. Also, although the mutant gene is expressed at "normal" levels, the gene product may be useful in increasing the expression level of a given BRCA1 gene, even in tumor cells that are not fully functional.

　遺伝子療法は、(例えば、Ｆriedman，1991によって記載されたごとき)一般的に許容された方法によって行われるであろう。患者の腫瘍からの細胞は、まず、前記した診断方法によって分析して、腫瘍細胞におけるＢＲＣＡ１ポリペプチドの産生を確認するであろう。発現制御因子につなげたＢＲＣＡ１遺伝子のコピーを含み、腫瘍細胞の内側で複製能力を有するウイルスまたはプラスミドベクター(以下のさらなる詳細参照)を調製する。米国特許第5,252,479号およびＰＣＴ国際公開ＷＯ93/07282号に開示のごとき、適当なベクターは公知である。ついで、腫瘍部位に局所的にか、または(他のサイトに転移し得るいずれかの腫瘍細胞に達するために)全身的にかのいずれかでベクターを患者に注射する。トランスフェクト遺伝子が各標的化腫瘍細胞のゲノムに恒久的に取り込まれた場合、該処理を定期的に反復し得る。 O Gene therapy will be performed by generally accepted methods (eg, as described by Friedman, 1991). Cells from the patient's tumor will first be analyzed by the diagnostic methods described above to confirm the production of BRCA1 polypeptide in the tumor cells. A virus or plasmid vector containing a copy of the BRCA1 gene linked to an expression control element and capable of replicating inside tumor cells (see further details below) is prepared. Suitable vectors are known, as disclosed in US Pat. No. 5,252,479 and PCT Publication WO 93/07282. The vector is then injected into the patient, either locally at the tumor site or systemically (to reach any tumor cells that can metastasize to other sites). The process can be repeated periodically if the transfected gene is permanently integrated into the genome of each targeted tumor cell.

　当該分野で公知である遺伝子移入系は、本発明の遺伝子療法の実施に有用となり得る。これらには、ウイルスおよび非ウイルス移入法が含まれる。ＳＶ４０(Ｍadzakら，1992)、アデノウイルス(Ｂerkner，1992；Ｂerknerら，1988；ＧorzigliaおよびＫapikian，1992；Ｑuantinら，1992；Ｒosenfeldら，1992；Ｗilkinsonら，1992；Ｓtratford-Ｐerricaudetら，1990)、ワクシニアウイルス(Ｍoss，1992)、アデノ関連ウイルス(Ｍuzyczka，1992；Ｏhiら，1992)を含むパポーバウイルス科、ＨＳＶおよびＥＢＶ(Ｍargolskee，1992；Ｊohnsonら，1992；Ｆinkら，1992；ＢreakfieldおよびＧeller，1987；Ｆreeseら，1990)を含むヘルペスウイルス科、ならびにニワトリ(ＢrandyopadhyayおよびＴemin，1984；Ｐetropoulosら，1992)、ネズミ(Ｍiller，1992；Ｍilerら，1985；Ｓorgeら，1984；ＭannおよびＢaltimore，1985；Ｍillerら，1988)およびヒト起源(Ｓhimadaら，1991；Ｈelsethら，1990；Ｐageら，1990；ＢuchschacherおよびＰanganiban，1992)のレトロウイルスを包含する、多数のウイルスが遺伝子移入ベクターとして用いられている。大部分のヒト遺伝子療法プロトコールは、不活化ネズミレトロウイルスに基づいている。遺伝子 Gene transfer systems known in the art can be useful for performing the gene therapy of the present invention. These include viral and non-viral transfer methods. SV40 (Madzak et al., 1992), adenovirus (Berkner, 1992; Berkner et al., 1988; Gorziglia and Kapikian, 1992; Quantin et al., 1992; Rosenfeld et al., 1992; Wilkinson et al., 1992; Stratford-Perricaudet et al., 1990), vaccinia Viruses (Moss, 1992), Papovaviridae including adeno-associated virus (Muzyczka, 1992; Ohi et al., 1992), HSV and EBV (Margolskee, 1992; Johnson et al., 1992; Fink et al., 1992; Breakfield and Geller, 1987; Freeese) Herpesviridae family, including chickens (Brandyopadhyay and Temin, 1984; Petropoulos et al., 1992), rats (Miller, 1992; Miler et al., 1985; Sorge et al., 1984; Mann and Baltimore, 1985; Miller et al., 1990). A number of viruses are inherited, including retroviruses of human origin (Shimada et al., 1991; Helseth et al., 1990; Page et al., 1990; Buchschacher and Panganiban, 1992). It has been used as a child transfer vector. Most human gene therapy protocols are based on inactivated murine retrovirus.

　当該分野で公知の非ウイルス遺伝子移入法には、リン酸カルシウム共沈(Ｇrahamおよびvan der Ｅb，1973；Ｐellicerら，1980)のごとき化学的技術；例えば、マイクロインジェクション(Ａndersonら，1980；Ｇodonら，1980；Ｂrinsterら，1981；ＣonstantiniおよびＬacy，1981)のごとき機械的方法；リポソームを介した膜融合-介在移入(Ｆelgnerら，1987；ＷangおよびＨaung，1989；Ｋanedaら，1989；Ｓtewartら，1992；Ｎabelら，1990；Ｌimら，1992);ならびに直接ＤＮＡ取り込みおよび受容体-媒介ＤＮＡ移入(Ｗolffら，1990；Ｗuら，1991；Ｚenkeら，1990；Ｗuら，1989b；Ｗolffら，1991；Ｗagnerら，1990；Ｗagnerら，1991；Ｃottenら，1990；Ｃurielら，1991a；Ｃurielら，1991b)が含まれる。ウイルス-媒介遺伝子移入は、リポソームデリバリーを用いる直接イン・ビボ(in vivo)遺伝子移入と組み合わせることにより、周囲の非分割細胞にではなく、腫瘍細胞にウイルスベクターを指向することができる。別法として、レトロウイルスベクター産生細胞系統を腫瘍に注射し得る(Ｃulverら，1992)。ついで、産生細胞の注射は、ベクター粒子の連続供給源を提供する。この技術は、手術不可能な脳腫瘍を有するヒトにおいて使用することが認可されている。 Non-viral gene transfer methods known in the art include chemical techniques such as calcium phosphate co-precipitation (Graham and van der Eb, 1973; Pellicer et al., 1980); for example, microinjection (Anderson et al., 1980; Godon et al., 1980). Mechanical methods such as Brinster et al., 1981; Constantini and Lacy, 1981); liposome-mediated membrane fusion-mediated transfer (Felgner et al., 1987; Wang and Haung, 1989; Kaneda et al., 1989; Stewart et al., 1992; Nabel). Lim et al., 1992); and direct DNA uptake and receptor-mediated DNA transfer (Wolff et al., 1990; Wu et al., 1991; Zenke et al., 1990; Wu et al., 1989b; Wolff et al., 1991; Wagner et al., 1990; Wagner et al., 1991; Cotten et al., 1990; Curiel et al., 1991a; Curiel et al., 1991b). Virus-mediated gene transfer can be combined with direct in vivo gene transfer using liposome delivery to direct the viral vector to tumor cells rather than to surrounding undivided cells. Alternatively, a retroviral vector producing cell line can be injected into the tumor (Culver et al., 1992). The injection of producer cells then provides a continuous source of vector particles. This technology has been approved for use in humans with inoperable brain tumors.

　生物および物理学的遺伝子移入法を組み合わせたアプローチにおいては、いずれかのサイズのプラスミドＤＮＡを、アデノウイルス・ヘキソン蛋白質に特異的なポリリジン-コンジュゲート抗体と組み合わせ、得られたコンプレックスをアデノウイルスベクターに結合する。ついで、三分子コンプレックスを用いて細胞を感染する。アデノウイルスベクターは、カップル化ＤＮＡが損傷される前に、エンドソームの効率的な結合、内在化および消化を許容する。 In an approach that combines biological and physical gene transfer methods, plasmid DNA of any size is combined with a polylysine-conjugated antibody specific for adenovirus hexon protein, and the resulting complex is transformed into an adenovirus vector. Join. The cells are then infected using the trimolecular complex. Adenovirus vectors allow efficient binding, internalization and digestion of endosomes before the coupled DNA is damaged.

　リポソーム／ＤＮＡコンプレックスは、直接イン・ビボ遺伝子移入を媒介し得ることが示された。標準的なリポソーム調製物において遺伝子移入プロセスは非特異的であるが、例えば、直接イン・サイチュ(in situ)投与後に、局在化イン・ビボ(in vivo)取り込みおよび発現が腫瘍沈着において報告されている(Ｎabel，1992)。ＤＮＡを、乳房組織および卵巣組織(例えば、乳房または卵巣の上皮細胞)にＤＮＡを直接標的化する遺伝子移入技術が好ましい。受容体-媒介遺伝子移入は、例えば、ポリリジンを介して、蛋白質リガンドにＤＮＡ(通常、共有的に閉環したスーパーコイル化プラスミドの形態)をコンジュゲートすることによってなす。リガンドは、標的細胞／組織型の細胞表面上の対応するリガンド受容体の存在に基づいて選択する。１つの適当な受容体／リガンド対には、エストロゲン受容体およびそのリガンド、エストロゲン(およびエストロゲン・アナログ)が含まれ得る。これらのリガンド-ＤＮＡコンジュゲートは、所望により、血液に直接注射することができ、受容体結合およびＤＮＡ-蛋白質コンプレックスの内在化が起こる標的組織に指向し得る。ＤＮＡの細胞内破壊の問題を克服するため、アデノウイルスとの同時感染を関与させて、エンドソーム機能を崩壊し得る。 It has been shown that liposome / DNA complexes can directly mediate in vivo gene transfer. Although the gene transfer process is non-specific in standard liposome preparations, for example, after direct in situ administration, localized in vivo uptake and expression has been reported in tumor deposition. (Nabel, 1992). Gene transfer techniques that target the DNA directly to breast and ovarian tissues (eg, breast or ovarian epithelial cells) are preferred. Receptor-mediated gene transfer is accomplished, for example, by conjugating DNA (usually in the form of a covalently closed supercoiled plasmid) to a protein ligand via polylysine. Ligands are selected based on the presence of the corresponding ligand receptor on the cell surface of the target cell / tissue type. One suitable receptor / ligand pair may include the estrogen receptor and its ligand, estrogen (and estrogen analogs). These ligand-DNA conjugates can, if desired, be injected directly into the blood and directed to target tissues where receptor binding and internalization of the DNA-protein complex occur. To overcome the problem of intracellular destruction of DNA, co-infection with adenovirus may be involved to disrupt endosomal function.

　該療法には、単独または結合して行い得る二工程が含まれる。第一工程においては、ＢＲＣＡ１感受性対立遺伝子を運ぶ思春期前女性を、彼女達の乳管上皮前駆細胞の幾つかまたは全部が機能正常ＢＲＣＡ１対立遺伝子の少なくとも１つのさらなるコピーを受けるように、遺伝子デリバリービヒクルで処理する。この工程においては、処理した個人は、正常な対立遺伝子が存在することによって感受性対立遺伝子の作用を押しとどめる程度まで低下した乳癌の危険性を有する。予防的な療法の第二工程においては、予め処理した若年女性、特に、提起した遺伝子療法治療を受けた女性をホルモン療法に付して、全期間妊娠の乳房に対する影響を最小限とする。療法 The therapy includes two steps that can be performed alone or in combination. In the first step, prepubertal women carrying the BRCA1 susceptibility allele are subjected to gene delivery such that some or all of their ductal epithelial progenitor cells receive at least one additional copy of the functional BRCA1 allele. Treat with vehicle. In this step, the treated individual has a reduced risk of breast cancer to the extent that the presence of the normal allele suppresses the effects of the susceptible allele. In the second step of prophylactic therapy, pre-treated young women, particularly those who have undergone the proposed gene therapy treatment, are subjected to hormonal therapy to minimize the effects of full-term pregnancy on the breast.

使用方法：ペプチド療法
　ＢＲＣＡ１活性を有するペプチドを、突然変異または欠失したＢＲＣＡ１対立遺伝子を運ぶ細胞に提供し得る。ＢＲＣＡ１蛋白質の配列を開示する(配列番号：２)。蛋白質は、例えば、公知の発現ベクターを用いて、細菌中でｃＤＮＡ配列を発現させることによって産生し得る。別法として、ＢＲＣＡ１ポリペプチドは、ＢＲＣＡ１産生-哺乳動物細胞から抽出することもできる。加えて、合成化学の技術を用いて、ＢＲＣＡ１蛋白質を合成することもできる。いずれのかかる技術も、ＢＲＣＡ１蛋白質を含む本発明の調製物を提供し得る。該調製物は、実質的に他のヒト蛋白質を含んでいない。このことは、微生物またはイン・ビトロ(in vitro)の合成によって最も容易になされる。 Method of Use: Peptide Therapy A peptide having BRCA1 activity can be provided to cells carrying a mutated or deleted BRCA1 allele. Discloses the sequence of the BRCA1 protein (SEQ ID NO: 2). The protein can be produced, for example, by expressing the cDNA sequence in bacteria using a known expression vector. Alternatively, BRCA1 polypeptides can be extracted from BRCA1 producing-mammalian cells. In addition, BRCA1 proteins can be synthesized using synthetic chemistry techniques. Any such technique can provide a preparation of the present invention that includes the BRCA1 protein. The preparation is substantially free of other human proteins. This is most easily accomplished by microbial or in vitro synthesis.

　活性ＢＲＣＡ１分子は、マイクロインジェクションによってか、または例えば、リポソームを使用することによって細胞に導入し得る。別法として、能動的または拡散によって、ある種の活性分子が細胞によって取り込まれ得る。ＢＲＣＡ１遺伝子産物の細胞外適用は、腫瘍増殖に十分に影響し得る。ＢＲＣＡ１活性を有する分子の適用は、新生生物状態の部分的逆転に通じるにちがいばい。ＢＲＣＡ１活性を有する他の分子(例えば、ペプチド、薬剤または有機化合物)を用いてもかかる逆転に影響し得る。実質的に同様の機能を有する修飾ペプチドも、ペプチド療法に用いられる。 Active BRCA1 molecules can be introduced into cells by microinjection or by using, for example, liposomes. Alternatively, certain active molecules may be taken up by cells, either actively or by diffusion. Extracellular application of the BRCA1 gene product can significantly affect tumor growth. Application of molecules with BRCA1 activity should lead to a partial reversal of the neoplastic state. The use of other molecules having BRCA1 activity (eg, peptides, drugs or organic compounds) can also affect such reversal. Modified peptides having substantially similar functions are also used in peptide therapy.

使用方法：形質転換宿主
　同様にして、突然変異ＢＲＣＡ１対立遺伝子を運ぶ細胞および動物をモデル系として用いて、治療剤としての潜在性を有する物質について実験および試験し得る。細胞は、典型的には、培養上皮細胞である。これらは、体細胞または生殖系列のいずれかのＢＲＣＡ１突然変異を有する個人から単離し得る。別法として、該細胞系統を設計して、前記したごとく、ＢＲＣＡ１対立遺伝子中に突然変異を運ばせ得る。試験物質を該細胞に適用した後、該細胞の新生生物的に形質転換した表現型を測定する。アンカレッジ・インディペンデント増殖、ヌードマウスにおける腫瘍形成性、細胞の非侵入性、および増殖因子依存性を包含する、新生生物的に形質転換した細胞のいずれの特色も評価し得る。これらの各特色のアッセイは、当該分野で知られている。 Methods of Use: Transformed Hosts Similarly, cells and animals carrying mutant BRCA1 alleles can be used as model systems to experiment and test for substances with therapeutic potential. The cells are typically cultured epithelial cells. These can be isolated from individuals with BRCA1 mutations, either somatic or germline. Alternatively, the cell line may be designed to carry a mutation in the BRCA1 allele, as described above. After applying a test substance to the cells, the neoplasticly transformed phenotype of the cells is determined. Any feature of neoplastic transformed cells can be assessed, including anchorage independent growth, tumorigenicity in nude mice, non-invasiveness of cells, and growth factor dependence. Assays for each of these features are known in the art.

　治療剤を試験する動物は、全体動物の突然変異誘発後または生殖系統細胞または接合体の処理後に選択し得る。かかる処理には、通常は、第二動物種からの突然変異ＢＲＣＡ１対立遺伝子の挿入、ならびに、破壊した相同遺伝子の挿入が含まれる。別法として、動物の内在性ＢＲＣＡ１遺伝子(群)は、挿入または欠失突然変異または従来技術を用いた他の遺伝的変化によって破壊し得る(Ｃapecchi，1989；ＶalanciusおよびＳmithies，1991；Ｈastyら，1991；Ｓhinkaiら，1992；Ｍombaertsら，1992；Ｐhilpottら，1992；Ｓnouwaertら，1992；Ｄonehowerら，1992)。試験物質を動物に投与した後に、腫瘍の増殖を評価しなければならない。試験物質が腫瘍の増殖を防ぐか、または抑制した場合には、該試験物質は、本明細書にて同定した癌の治療の候補治療剤である。これらの動物モデルは、潜在的な治療製品に極めて重要な試験ビヒクルを提供する。動物 Animals to test for therapeutic agents can be selected after mutagenesis of whole animals or after treatment of germline cells or zygotes. Such treatments usually include the insertion of a mutant BRCA1 allele from a second animal species, as well as the insertion of a disrupted homologous gene. Alternatively, the animal's endogenous BRCA1 gene (s) can be disrupted by insertion or deletion mutations or other genetic changes using conventional techniques (Capecchi, 1989; Valancius and Smithies, 1991; Hasty et al., 1991; Shinkai et al., 1992; Mombaerts et al., 1992; Philpott et al., 1992; Snouwaert et al., 1992; Donehower et al., 1992). After the test substance has been administered to the animals, the growth of the tumor must be assessed. If the test substance prevents or suppresses the growth of the tumor, the test substance is a candidate therapeutic for the treatment of cancer identified herein. These animal models provide a crucial test vehicle for potential therapeutic products.

　本発明を以下の実施例に参照することにより記載するが、これは説明目的で供するものであって、いかなる場合においても本発明を限定するものではない。当該分野でよく知られている標準技術、または以下に特別に記載する技術を利用した。 The invention will be described by reference to the following examples, which are provided for illustrative purposes and do not limit the invention in any way. Standard techniques well known in the art or techniques specifically described below were utilized.

　　　　　　　　　　　　　　　　実施例１
　１７ｑ−連鎖乳癌感受性遺伝子座を有するような確認家系および実験家系
　　広範な癌に罹り易い家系は、多くのケースの乳癌を持つ広範な家系および実験に利用できる血縁者の大きな一組を供する、はっきりとした集団から確認した。これらの大家系に存在する非常に多数の減数分裂は、ＢＲＣＡ１遺伝子座が分離しつつあるの否かを検出する能力を供し、調査すべき小領域内に起こる情報的組換え体についての機会を減少させた。これは、ＢＲＣＡ１領域への連鎖を確立する機会を大いに改良し、ＢＲＣＡ１領域の取り扱い易いサイズへの縮小を容易とし、ＢＲＣＡ１遺伝子座自体の同定を可能とする。 Example 1
Confirmed and experimental pedigrees with 17q-linked breast cancer susceptibility loci Widespread cancer-prone pedigrees provide a large set of widespread families with many cases of breast cancer and relatives available for experimentation. Was confirmed from the group. The large number of meiosis present in these large families provides the ability to detect whether the BRCA1 locus is segregating and provides an opportunity for informative recombinants occurring within the small region to be investigated. Reduced. This greatly improves the opportunity to establish linkage to the BRCA1 region, facilitates reduction of the BRCA1 region to a manageable size, and allows identification of the BRCA1 locus itself.

　各家系を、すべての利用可能な関連血縁者を通じて、各発端者または癌ケースのすべての情報的一親等血縁者まで拡大した。これらの家系については、さらなる乳癌ケース、および該家系で現れた注目する他の部位（例えば、卵巣）に癌を持つ個人を、腫瘍登録関連ファイルを通じて捜し当てた。ユタ州癌登録で確認されなかった家系で報告されているすべての乳癌を調査した。医学記録または死亡証明書を、すべての癌の確認のために入手した。ＤＮＡを抽出した血液試料を供することによって、各鍵となる個人およびすべての情報的個人を参加させた。また、我々は、故人ケースの遺伝子型がその血縁者の遺伝子型から推定できるように、故人ケースの配偶者および血縁者からサンプリングした。 Expanded families to all probands or all informative first-degree relatives in cancer cases through all available relatives. For these families, additional breast cancer cases and individuals with cancer at other sites of interest (eg, ovaries) that appeared in the family were located through tumor registry-related files. We investigated all breast cancers reported in families not identified in the Utah Cancer Registry. Medical records or death certificates were obtained for confirmation of all cancers. Each key individual and all informative individuals were involved by providing a blood sample from which DNA had been extracted. We also sampled spouses and relatives of the deceased case so that the genotype of the deceased case could be inferred from the genotype of the relative.

　推定できる遺伝子型を持つ３以上の癌ケースを有する１０の家系を、増殖性乳病および乳癌の研究用の関連データベータから元々は確認された２９家系の組からの１７ｑマーカーに対する連鎖実験のために選択した（Skolnickら、1990）。これらの家系の選択の基準は、乳癌を持つ２人の姉妹または母親および彼女の娘の存在であった。さらに、１９８０年以来我々の乳癌連鎖研究の一部として研究してきた２の家系（Ｋ１００１、Ｋ９０１８）、乳癌および／または卵巣癌のクラスターの存在についての関連データベースから確認した６の家系（Ｋ２０１９、Ｋ２０７３、Ｋ２０７９、Ｋ２０８０、Ｋ２０３９、Ｋ２０８２）および早期開始乳癌を持つ自己推定家系（Ｋ２０３５）を含めた。これらの家系を調査し、前記したように我々の臨床で拡大させた。表１は、引き続いての実施例の主題であるこれらの１９家系の特徴を示す。表１では、各家系につき、我々のデータベースにおける個人の合計数、タイプ分けした個人の数、および乳房／卵巣癌の診断時の最小、メジアンおよび最大年齢を報告する。乳癌の診断時のメジアン年齢が増加する順に家系を分類する。卵巣および乳癌双方と診断された４人の婦人は両方のカテゴリーに数える。 Ten families with three or more cancer cases with a deducible genotype were used for linkage experiments against the 17q marker from a set of 29 families originally identified from relevant data beta for the study of proliferative breast and breast cancer. (Skolnick et al., 1990). The criterion for selection of these families was the presence of two sisters or mothers with breast cancer and her daughter. In addition, two kindreds (K1001, K9018), which have been studied as part of our breast cancer linkage study since 1980, and six kindreds (K2019, K2073) identified from relevant databases for the presence of breast and / or ovarian cancer clusters. , K2079, K2080, K2039, K2082) and self-estimated families with early-onset breast cancer (K2035). These families were investigated and expanded in our clinic as described above. Table 1 shows the characteristics of these 19 families, which are the subject of subsequent examples. Table 1 reports the total number of individuals in our database, the number of individuals typed, and the minimum, median, and maximum age at diagnosis of breast / ovarian cancer for each kindred. The families are sorted in order of increasing median age at diagnosis of breast cancer. Four women diagnosed with both ovarian and breast cancer count in both categories.

　　　　　　　　　　　　　　　　実施例２
　染色体１７ｑに連鎖した家系の選択およびインターバルＭｆｄ１５−Ｍｆｄ１８８へのＢＲＣＡ１の位置決め
　これらの１９の家系で収集した各試料につき、標準的な実験プロトコルを用いて、血液（２のケースでは、パラフィン包埋組織ブロック）からＤＮＡを抽出した。この実験における遺伝子型決定は、短い縦列反復（ＳＴＲ）マーカーに制限した。というのは、一般に、これらは高ヘテロ接合性を有し、ＰＣＲ法は非常に少量のＤＮＡを使用しつつ、迅速な回転を供するからである。この努力を助力するために、ＣＡ陽性クローン用の染色体特異的コスミドライブラリーをスクリーニングすることによって、染色体１７上の４つのかかるＳＴＲマーカーを開発した。これらのマーカーのうち３つが長腕：（４６Ｅ６．Eastonら、1993)；（４２Ｄ６、Eastonら、1993)；２６Ｃ２（Ｄ１７Ｓ５１４、Oliphantら、1991）に位置決定され、他方、外のもの１２Ｇ６（Ｄ１７Ｓ５１３、Oliphantら、1991)は、ｐ５３腫瘍サプレッサー遺伝子座近くの短腕に位置決定された。これらのうち２つの４２Ｄ６および４６Ｅ６を、全世界の研究者による乳癌家族のタイプ分けのためにBreast Cancer Linkage Consortiumに提出した。我々の研究所で開発したのではないマーカーについてのオリゴヌクレオチド配列は、発表された報告から、あるいはBreast　Cancer　Linkage　Consortiumの一部として、あるいは他の研究者から入手した。 Example 2
Selection of kindreds linked to chromosome 17q and positioning of BRCA1 on the interval Mfd15-Mfd188 For each sample collected in these 19 kindreds, blood (paraffin embedded tissue in two cases) was used using standard experimental protocols. DNA was extracted from the block). Genotyping in this experiment was restricted to short tandem repeat (STR) markers. Because, in general, they are highly heterozygous and the PCR method provides very rapid rotation while using very small amounts of DNA. To assist in this effort, four such STR markers on chromosome 17 were developed by screening a chromosome-specific cosmid library for CA-positive clones. Three of these markers are located on the long arm: (46E6. Easton et al., 1993); (42D6, Easton et al., 1993); 26C2 (D17S514, Oliphant et al., 1991), while the outer 12G6 (D17S513). Oliphant et al., 1991) have been localized to the short arm near the p53 tumor suppressor locus. Two of these, 42D6 and 46E6, were submitted to the Breast Cancer Linkage Consortium for typing of breast cancer families by researchers worldwide. Oligonucleotide sequences for markers not developed at our laboratory were obtained from published reports, as part of the Breast Cancer Linkage Consortium, or from other researchers.

　すべての遺伝子型決定フィルムは、対立遺伝子の一貫したコード付けを維持するのに使用される標準的なレーンマーカーで、盲検によりスコアを取った。ここに示す４つの家系における鍵となる試料は、すべての関連マーカーにつき二連でタイプ分けした。すべての１９の家系は、２の多形ＣＡ反復マーカー：４２Ｄ６（Ｄ１７Ｓ５８８）、我々の研究所で単離されたＣＡ反復、およびＭｄｆ１５（Ｄ１７Ｓ２５０）、J. Weber (Weberら、1990)によって供されたＣＡ反復につき、タイプ分けをした。いくつかの入手源からのプローブを用いて、染色体１７上、特に染色体１７コスミド上に遺伝マーカーを創製し、Los Alamos National Laboratories (van Dillaら、1986)による分類された染色体からラムダファージライブラリーを作製した。 All genotyping films were blindly scored with standard lane markers used to maintain consistent coding of alleles. Key samples from the four families shown here were typed in duplicate for all relevant markers. All 19 kindreds were provided by two polymorphic CA repeat markers: 42D6 (D17S588), a CA repeat isolated in our laboratory, and Mdf15 (D17S250), J. Weber (Weber et al., 1990). Each CA repeat was typed. Genetic markers were created on chromosome 17, especially on chromosome 17 cosmids, using probes from several sources, and a lambda phage library was generated from chromosomes sorted by Los Alamos National Laboratories (van Dilla et al., 1986). Produced.

　これらの２つのマーカー（４２Ｄ６、Ｍｆｄ１５）およびこれらの２のマーカーの間に概略位置決定された第３のマーカーＭｆｄ１８８（Ｄ１７Ｓ５７９、Hallら、1992）を持つ各家系についてのＬＯＤスコアは、組換え分率の２つの値０.００１および０.１につき計算した。（ＬＯＤスコアの計算については、Oh,1985参照）。尤度は、Clausら，1991によって導かれたモデルで計算したが、これは、０.００３の見積もった遺伝子頻度、約０.８０の遺伝子キャリアにおける一生の危険、および非遺伝子キャリアにおける乳癌についての集団ベースの年齢特異的危険を推定するものである。ＬＯＤスコア計算で用いる３つのマーカーについての対立遺伝子頻度は、ＣＥＰＨパネル（WhiteおよびLalouel、1988)における非血縁個人の我々自身の研究所でのタイプ分けから計算した。表２は、３つのマーカー４２Ｄ６、Ｍｆｄ１８８、およびＭｆｄ１５を持つ各家系の対での連鎖分析の結果を示す。 The LOD score for each pedigree with these two markers (42D6, Mfd15) and a third marker, Mfd188 (D17S579, Hall et al., 1992), roughly located between these two markers, was Calculations were made for two values of the fractions, 0.001 and 0.1. (For calculation of the LOD score, see Oh, 1985). Likelihood was calculated with a model derived by Claus et al., 1991, which estimated gene frequency of 0.003, lifetime risk in approximately 0.80 gene carriers, and breast cancer in non-gene carriers. It estimates population-based age-specific risks. Allele frequencies for the three markers used in the LOD score calculation were calculated from the typing of unrelated individuals in our own laboratory in the CEPH panel (White and Lalouel, 1988). Table 2 shows the results of linkage analysis on pairs of each kindred with the three markers 42D6, Mfd188, and Mfd15.

　ＣＡＳＨモデル（Clausら、1991)下、少なくとも１つの遺伝子座につきＬＯＤスコア＞１.０の１７ｑの連鎖についての基準を用いると、１９の家系のうち４つが１７ｑに連鎖しているようであった（Ｋ１９０１、Ｋ１９２５、Ｋ２０３５、Ｋ２０８２）。多数のさらなる家系は、いくらかの連鎖の証拠を示したが、この時点では連鎖カテゴリーに明確に帰属させることはできなかった。これらは、家系Ｋ１９１１、Ｋ２０７３、Ｋ２０３９およびＫ２０８０を含むものであった。１７ｑ−連鎖家系のうち３つはこの領域で情報的組換え体を有し、これらを後記にて詳述する。 Using the criteria for 17q linkage with a LOD score> 1.0 for at least one locus under the CASH model (Claus et al., 1991), four out of 19 families appeared to be linked to 17q. (K1901, K1925, K2035, K2082). Many additional families showed some evidence of linkage, but could not be explicitly assigned to linkage categories at this time. These included the families K1911, K2073, K2039 and K2080. Three of the 17q-linked families have informative recombinants in this region, which are described in detail below.

　家系２０８２は、いくつかのグループによって現在報告されている最大の１７ｑ連鎖乳癌家族である。該家系は２０ケースの乳癌、および１０ケースの卵巣癌を持つ。２のケースは、卵巣癌および乳癌を持つ。この家族について１７ｑへの連鎖の証拠は圧倒的である：散在的であるような乳癌の３ケースの存在に拘わらず、連鎖したハプロタイプを持つＬＯＤスコアは６.０を超える。すなわち、これらのケースは、Ｍｆｄ１５および４２Ｄ６の間に連鎖したハプロタイプの一部を共には有しない。これらの３つの散在ケースは、年齢４６、４７および５４歳にて乳癌を持つと診断された。より小さい家系では、このタイプの散在的癌は、連鎖の分析および鍵となる組換え体の正しい同定を大いに混乱させる。２０８２家系における鍵となる組換え体は、その母親および伯母が各々５８歳および６６歳の年齢で卵巣癌となった４５歳で卵巣癌を発病した婦人である。彼女は、Ｍｆｄ１５における非連鎖対立遺伝子を受け継ぎつつ、Ｍｆｄ１８８および４２Ｄ６双方についてのハプロタイプの連鎖した一部を受け継いだ；この組換え事象により、はＢＲＣＡ１はＭｆｄ１５に対して末端側に位置決定された。 Kindred 2082 is the largest 17q-linked breast cancer family currently reported by several groups. The family has 20 cases of breast cancer and 10 cases of ovarian cancer. The second case has ovarian and breast cancer. The evidence of linkage to 17q for this family is overwhelming: Despite the presence of three cases of breast cancer that are sporadic, LOD scores with linked haplotypes exceed 6.0. That is, these cases do not share either part of the haplotype linked between Mfd15 and 42D6. These three scattered cases were diagnosed with breast cancer at ages 46, 47 and 54. In smaller families, this type of sporadic cancer greatly disrupts linkage analysis and the correct identification of key recombinants. A key recombinant in the 2082 kindred is a woman who developed ovarian cancer at the age of 45 whose mother and aunt developed ovarian cancer at the ages of 58 and 66, respectively. She inherited a linked portion of the haplotype for both Mfd188 and 42D6, while inheriting the unlinked allele at Mfd15; this recombination event caused BRCA1 to be located distal to Mfd15.

　Ｋ１９０１は、早期開始乳癌家系の典型的なものである。該家系は１０ケースの乳癌を持ち、４３.５齢のメジアン断時年齢を持つ；４ケースは４０歳前に診断された。マーカー４２Ｄ６でのこの家系についてのＬＯＤスコアは１.５であり、その結果、０.９６の１７ｑ−連鎖の事後確率である。この家系でハプロタイプを調査すると、真性な男性キャリアおよび４５歳で乳癌を持つと診断された彼の罹患娘において組換えハプロタイプが同定された。マーカーＭｆｄ１５についてのそれらの連鎖対立遺伝子は、（彼女の子供から完全には推定できなかった１のケースを除き）該家系におけるすべての他のケースで見いだされるものとは異なる。２つのハプロタイプはＭｆｄ１８８および４２Ｄ６につき同一である。従って、家系１９０１からのデータによってもＢＲＣＡ１遺伝子座はＭｆｄ１５に対して末端側に位置決定される。 K1901 is typical of an early-onset breast cancer kindred. The family had 10 cases of breast cancer and a median break age of 43.5 years; 4 cases were diagnosed before age 40 years. The LOD score for this family at marker 42D6 is 1.5, which is a posterior probability of 0.96 17q-linkage. Examination of the haplotypes in this kindred identified recombinant haplotypes in an authentic male carrier and his affected daughter diagnosed with breast cancer at the age of 45. Those linked alleles for the marker Mfd15 are different from those found in all other cases in the family (except in one case, which could not be completely inferred from her child). The two haplotypes are identical for Mfd188 and 42D6. Therefore, the BRCA1 locus is also located distal to Mfd15 by data from pedigree 1901.

　家系２０３５は、病気の表現型において、Ｋ１９０１と同様である。この家系における乳癌の８ケースについてのメジアン診断年齢は３７歳である。１のケースは６０歳で卵巣癌も有していた。この家族における乳癌ケースは、共に８０歳代におけるその死亡まで共に乳癌に罹らなかった２人の姉妹から受け継いだものにある。各分家は４ケースの乳癌を持ち、顕著な早期開始を有する各分家には少なくとも１のケースがあった。この家系はＭｆｄ１５につき２.３４のＬＯＤスコアを有する。２の分家において乳癌を分離しているハプロタイプはＭｆｄ１５において同一の対立遺伝子を共に有するが、末端側遺伝子座Ｍｆｄ１８８およびＮＭ２３（４２Ｄ６に対して丁度末端側に位置する集団（consortium）の一部としてタイプ分けされたマーカー）については異なる。２のハプロタイプはマーカー４２Ｄ６については一致するにも拘わらず、対立遺伝子は、血統によって同一（共通の先祖に由来する）というよりも、状態によって同一に共有されたものである（同一の対立遺伝子であるが、異なる先祖に由来する）。というのは、共有された対立遺伝子はこの遺伝子座で観察された第２の最も普通の対立遺伝子だからである。対照的に、Ｍｆｄ１５で共有された連鎖対立遺伝子は０.０４の頻度を有する。これは、我々のデータベースでは鍵となる組換え体である。というのは、それは、ＢＲＣＡ１がハプロタイプの基部側で分離する唯一の組換えであり、かくして、ＢＲＣＡ１領域と境界を接する末端を供するからである。この事象については、鍵となる組換えではないことには、家系の両分家において乳癌につき分離する稀なＭｆｄ１５対立遺伝子も共に有する家系に嫁いだ妻に第２の突然変異体ＢＲＣＡ１遺伝子が存在することを要する。この事象は１０００分の１未満の確率を有する。従って、この家系からの証拠により、Ｍｆｄ１８８に対してＢＲＣＡ１遺伝子座は基部側に位置決定された。 Family 2035 is similar in disease phenotype to K1901. The median age at diagnosis for eight cases of breast cancer in this family is 37 years. One case was 60 years old and also had ovarian cancer. The breast cancer cases in this family are inherited from two sisters who did not both have breast cancer until their death in their eighties. Each branch had four cases of breast cancer and each branch with significant early onset had at least one case. This kindred has a LOD score of 2.34 per Mfd15. The haplotypes separating breast cancer in the two branches have both identical alleles at Mfd15, but as part of a consortium located just distal to the terminal loci Mfd188 and NM23 (42D6). (Typed markers). Although the two haplotypes are identical for marker 42D6, the alleles are shared identically by state rather than identically (derived from a common ancestor) by pedigree (with the same allele). But from different ancestors). Because the shared allele is the second most common allele observed at this locus. In contrast, linked alleles shared by Mfd15 have a frequency of 0.04. This is a key recombinant in our database. Because BRCA1 is the only recombination that segregates proximal to the haplotype, thus providing an end that borders the BRCA1 region. For this event, not being a key recombination, the second mutant BRCA1 gene was present in a wife married to a family that also had a rare Mfd15 allele segregating for breast cancer in both families of the family. Need to be done. This event has a probability of less than one thousandth. Thus, evidence from this kindred located the BRCA1 locus proximal to Mfd188.

　　　　　　　　　　　　　　　　実施例３
　微細構造地図の作成およびさらなるＳＴＲ多形を用いるＭｆｄ１９１−Ｍｆｄ１８８に対するおよびＢＲＣＡ１領域の精密決定
　我々の組換え体の特徴付けを改良し、フランキングマーカーを明確とするためには、染色体１７ｑ上のこの比較的小さな領域の密な地図が必要であった。染色体１７の研究により、遺伝的および物理的マッピング実験（Fain,1992)の組合せに基づき、この領域のコンセンサス地図を作成した（図１）。この地図は、高度に多形のＳＴＲ多形、および多数の多形的発現遺伝子を共に含有する。この地図はこの順序についての証拠につき詳細を与えず、また隣接遺伝子座の順序における逆転についての局所的支持のいずれの測定も与えなかったので、我々は、それを、新しいマーカーの開発で使用すべき源およびＢＲＣＡ１を含有する小領域の我々の詳細な遺伝地図および物理的地図の作成を得るための粗いガイドとして総括した。我々のアプローチは、他の研究者によって提供された現行ＳＴＲマーカー、およびＣＥＰＨ関連家族からのＤＮＡを用いて同定された減数分裂の（遺伝的）分裂中止点のパネルおよびこの領域につき構築された体細胞細胞ハイブリッド（物理的分裂中止点）のパネル双方に関し我々の研究所から新しく開発されたすべてのマーカーを分析することであった。これらのマーカーは、Ｍｆｄ１５、Ｍｆｄ１９１（James Weberによって提供)、ＴＨＲＡ１（Futrealら、1992a)、およびDonald Black博士によって提供された３つの多形、ＮＭ２３（Hallら、1992）、ＳＣＧ４０（Ｄ１７Ｓ１８１）、および６Ｃ１（Ｄ１７Ｓ２９３）に対して基部側にマップされる、我々の研究所で開発された２６Ｃ２を含むものであった。 Example 3
Fine structure mapping and refinement of the BRCA1 region to Mfd191-Mfd188 using additional STR polymorphisms To improve the characterization of our recombinants and to define the flanking markers, A dense map of a relatively small area was needed. A study of chromosome 17 produced a consensus map of this region based on a combination of genetic and physical mapping experiments (Fain, 1992) (FIG. 1). This map contains both highly polymorphic STR polymorphisms and a number of polymorphically expressed genes. We use it in the development of new markers, as this map gives no details on the evidence for this order and does not give any measure of local support for reversals in the order of adjacent loci. It has been summarized as a rough guide to get our detailed genetic and physical mapping of the power source and the small region containing BRCA1. Our approach involves a panel of meiotic (genetic) mitotic breakpoints identified using current STR markers provided by other investigators and DNA from CEPH-related families and the body constructed for this region. The analysis was for all newly developed markers from our laboratory for both panels of cell-cell hybrids (physical breakpoints). These markers include Mfd15, Mfd191 (provided by James Weber), THRA1 (Futreal et al., 1992a), and three polymorphisms provided by Dr. Donald Black, NM23 (Hall et al., 1992), SCG40 (D17S181), and This included 26C2 developed in our lab, mapped proximally to 6C1 (D17S293).

　マーカーの遺伝子位置決定
　注目する領域内の新しいマーカーを遺伝子的に位置決定するために、我々は、ＣＥＰＨ文献パネルにおける、および我々の大きい乳癌家系（Ｋ２０８２）における、領域内の多数の鍵となる減数分裂分裂中止点を同定した。もしこの領域において小さな遺伝子距離があれば、それらは、この目的で使用できる比較的小さい組の組換え体であるに過ぎないらしく、また、それらは、組にグループ分けできるマーカーのようである。各組内におけるマーカーの順序は物理的マッピングによってのみ決定できる。しかしながら、新しいマーカーを位置決定するのに必要な遺伝子型決定の数は最小化される。これらの分裂中止点は表３および４に示す。このアプローチを用い、我々は、マーカーＴＨＲＡ１、６Ｃ１、ＳＣＧ４０およびＭｆｄ１９１を遺伝子的に順序付けることができた。表３および４から分かるように、ＴＨＲＡ１およびＭｆｄ１９１は共に、ＢＲＣＡ１遺伝子座を含有すると我々が従前に確認したＭｆｄ１５−Ｍｆｄ１８８領域の内側をマップする。表３および４において、Ｍ／Ｐは、母親または親の組換え体を示す。「１」は、遺伝された対立遺伝子は祖父起源であって、他方、「０」は祖母起源であり、「−」は該遺伝子座がタイプ分けされていないかまたは非情報的であることを示す。 Gene Localization of Markers To genetically localize new markers within the region of interest, we used a number of key reductions in the region in the CEPH literature panel and in our large breast cancer kindred (K2082). A mitotic breakpoint was identified. If there is a small genetic distance in this region, they appear to be only a relatively small set of recombinants that can be used for this purpose, and they appear to be markers that can be grouped into sets. The order of the markers within each set can only be determined by physical mapping. However, the number of genotyping required to locate a new marker is minimized. These breakpoints are shown in Tables 3 and 4. Using this approach, we were able to genetically order the markers THRA1, 6C1, SCG40 and Mfd191. As can be seen from Tables 3 and 4, both THRA1 and Mfd191 map inside the Mfd15-Mfd188 region we previously identified as containing the BRCA1 locus. In Tables 3 and 4, M / P indicates maternal or parental recombinant. "1" indicates that the inherited allele is of grandfather origin, while "0" is of grandmother origin and "-" indicates that the locus is untyped or non-informative. Show.

　我々の組換え体家族におけるマーカーＭｆｄ１５、Ｍｆｄ１８８、Ｍｆｄ１９１およびＴＨＲＡ１の分析
　Ｍｆｄ１５、Ｍｆｄ１８８、Ｍｆｄ１９１およびＴＨＲＡ１を我々の組換え体家族においてタイプ分けし、ＢＲＣＡ１遺伝子座を位置決定するためのさらなる情報につき調べた。家系１９０１において、Ｍｆｄ１５組換え体はＴＨＲＡ１についての組換え体であるが、Ｍｆｄ１９１については非情報的であり、かくして、ＢＲＣＡ１をＴＨＲＡ１に対して末端側に位置決定する。Ｋ２０８２において、Ｍｆｄ１５に関する組換え体はＭｆｄ１９１に関する組換え体でもあり、かくして、ＢＲＣＡ１遺伝子座をＭｆｄ１９１に対して末端側に位置決定する（Goldgarら、1994)。家系Ｋ２０３５におけるＴＨＲＡ１およびＭｆｄ１９１の調査からは、さらなる位置決定情報は得られなかった。というのは、２の分家は両マーカーにつき一致したからである。しかしながら、ＳＣＧ４０および６Ｃ１は共にＭｆｄ１８８と同一のパターンを呈し、かくして、この家族におけるＭｆｄ１８８組換え体によって提供された位置決定情報における我々の信頼性を増大させる。ＢＲＣＡ１遺伝子座、または少なくともその一部は、従って、基部側のＭｆｄ１９１および末端側のＭｆｄ１８８と境界を接するインターバル内にある。 Analysis of markers Mfd15, Mfd188, Mfd191 and THRA1 in our recombinant family Mfd15, Mfd188, Mfd191 and THRA1 were typed in our recombinant family and examined for further information to locate the BRCA1 locus . In kindred 1901, the Mfd15 recombinant is a recombinant for THRA1, but is non-informative for Mfd191, thus positioning BRCA1 distal to THRA1. In K2082, the recombinant for Mfd15 is also a recombinant for Mfd191, thus positioning the BRCA1 locus distal to Mfd191 (Goldgar et al., 1994). A survey of THRA1 and Mfd191 in kindred K2035 did not provide any further localization information. Because the two branches matched for both markers. However, both SCG40 and 6C1 exhibit the same pattern as Mfd188, thus increasing our confidence in the positioning information provided by Mfd188 recombinants in this family. The BRCA1 locus, or at least a portion thereof, is therefore within an interval bordering proximal Mfd191 and distal Mfd188.

　　　　　　　　　　　　　　　　実施例４
　注目する領域における遺伝子的および物理的源の開発
　Ｍｆｄ１９１−Ｍｆｄ１８８領域における高度に多形の遺伝子座の数を増加させるために、我々は、該領域に物理的にマップされるコスミドおよびＹＡＣから、我々の研究所で多数のＳＴＲマーカーを開発した。これらのマーカーにより我々は該領域をさらに精密決定できた。
　ＳＴＲ、はこれらの遺伝子座を含有し、次いでこれを用いて、コスミドＰ１またはＢＡＣにおいてサブクローンを同定するＹＡＣを同定するための所望の領域にあることが知られている遺伝子から同定した。次いで、これらのサブクローンを、（ＣＡ）_ｎオリゴヌクレオチド（Pharmacia)を用いてＣＡ縦列反復の存在につきスクリーニングした。強力なシグナルを持つクローンを優先的に選択した。というのは、それらは、非常に多数の反復および／または（ＣＡ）_ｎパターンに対するほとんど完全な正確さを有するＣＡ−反復を表すようだからである。これらの特徴は、共に、多形の確率を高めることが知られている（Weber, 1990）。これらのクローンをベクターから直接的に配列決定して、該反復の位置を決定した。我々は、（ＧＴ）_１０ＴのごときＣＡ−反復の末端に相補的な可能なプライマーの組のうち１つを用いることによって、ＣＡ−反復の一方側のユニークな配列を得た。このユニーク配列に基づき、プライマーを、他の方向において反復を逆に横切る配列を作成し、ＣＡ−反復に隣接する第２のプライマーの設計用のユニーク配列を得た。次いで、ＳＴＲを、無関係個人の小群についての多形につきスクリーニングし、ハイブリッドパネルに対してテストして、それの物理的位置を確認した。これらの基準を満たす新しいマーカーを、ユタ州およびＣＥＰＨ家族からの４０の無関係個人の組においてタイプ分けして、実験集団に適する対立遺伝子頻度を得た。本研究で報告する他のマーカーの多くを、ＣＥＰＨ無関係個人の小群でテストして、同様に適する対立遺伝子頻度を得た。 Example 4
Development of Genetic and Physical Sources in the Region of Interest To increase the number of highly polymorphic loci in the Mfd191-Mfd188 region, we have derived from cosmids and YACs that are physically mapped to that region. A number of STR markers have been developed at the Institute. These markers allowed us to further refine the region.
The STR, which contains these loci, was then used to identify cosmids P1 or genes that are known to be in the desired region to identify the YAC that identifies the subclone in the BAC. These subclones were then screened for the presence of CA tandem repeats using (CA) _n oligonucleotides (Pharmacia). Clones with strong signals were preferentially selected. Because they appear to represent a large number of repeats and / or CA-repeats with almost perfect accuracy for (CA) _n patterns. Both of these features are known to increase the probability of polymorphism (Weber, 1990). These clones were sequenced directly from the vector to locate the repeat. We, by using one of the set of complementary possible primer terminus of (GT) 10 _T such as CA- repeated to obtain a unique sequence on one side of CA- iteration. Based on this unique sequence, a primer was created that crossed the repeat in the other direction in reverse, resulting in a unique sequence for the design of a second primer adjacent to the CA-repeat. The STR was then screened for polymorphism for a small group of unrelated individuals and tested against the hybrid panel to confirm its physical location. New markers meeting these criteria were typed in a set of 40 unrelated individuals from the Utah and CEPH families to obtain a suitable allele frequency for the experimental population. Many of the other markers reported in this study were tested in a small group of CEPH unrelated individuals to obtain similarly suitable allele frequencies.

　前記手法を用い、合計８の多形ＳＴＲがこれらのＹＡＣＳから見い出された。このようにして同一の遺伝子座のうち、４つが、共に多形であってＢＲＣＡ１領域に対して位置決定された。４つのマーカーは染色体１７に位置決定されず、使用したＹＡＣのキメラ的性質を反映する。該領域にあった４つのマーカーをＡＡ１、ＥＤ２、４−７およびＹＭ２９と命名した。ＡＡ１およびＥＤ２はＲＮＵ２遺伝子につき陽性のＹＡＣから開発し、４−７はＥＰＢ３　ＹＡＣから、ＹＭ２９はハイブリッドパネルによって該領域に位置決定されたコスミドから開発した。乳癌家系で分析した対立遺伝子の数、ヘテロ接合性およびこれらの４つのおよびすべての他のＳＴＲ多形の源の記載を表５に後記する。用い Using the above procedure, a total of 8 polymorphic STRs were found in these YACS. In this way, four of the same loci were both polymorphic and localized to the BRCA1 region. The four markers are not located on chromosome 17 and reflect the chimeric nature of the YAC used. The four markers that were in the region were named AA1, ED2, 4-7 and YM29. AA1 and ED2 were developed from YACs positive for the RNU2 gene, 4-7 from EPB3ΔYAC, and YM29 from cosmids located in that region by the hybrid panel. A description of the number of alleles, heterozygosity and sources of these four and all other STR polymorphisms analyzed in breast cancer kindreds is provided below in Table 5.

　物理的に該領域にマップされた４つのＳＴＲ多形（４−７、ＥＤ２、ＡＡ１、ＹＭ２９）を減数分裂で分析し、分裂中止点パネルを表３および４に示した。表６および７は、これらの４つのマーカーの位置決定についての関連するＣＥＰＨデータおよび家系２０８２データを含む。表において、Ｍ／Ｐは母系または父系組換え体を示す。「１」は、引き継がれた対立遺伝子が祖父系起源のものであることを示し、他方、「０」は祖母系起源を示し、「−」は該遺伝子座がタイプ分けされていないか、または非情報的であることを示す。４Four STR polymorphisms (4-7, ED2, AA1, YM29) that were physically mapped to the region were analyzed by meiosis and the mitotic breakpoint panels are shown in Tables 3 and 4. Tables 6 and 7 contain relevant CEPH and pedigree 2082 data for the location of these four markers. In the table, M / P indicates maternal or paternal recombinants. A "1" indicates that the inherited allele is of paternal origin, while a "0" indicates grandmother origin and "-" indicates that the locus is not typed or Indicates non-informational.

　ＣＥＰＨ１３３３−０４から、我々は、ＡＡ１およびＹＭ２９がＭｆｄ１９１に対して末端側に位置するに違いないと見る。１３２９２より、ＡＡ１およびＥＤ２は共に４−７、ＹＭ２９およびＭｆｄ１８８に対して基部側であると推定できる。Ｋ２０８２で見い出された組換え体はいくつかのさらなる順序付けの情報を提供する。３つの独立した観察（個人番号２２、４０および６３）には、ＡＡ１、ＥＤ２、４−７、およびＹＭ２９、およびＭｆ１８８はＭｆｄ１９１に対して末端側に位置決定され、他方、ＩＤ１２５により、４−７、ＹＭ２９、およびＭｆｄ１８８はＳＧＣ４０に対して基部側に位置決定される。マーカーＡＡ１／ＥＤ２および４−７／ＹＭ２９／Ｍｆｄ１８８の２つのクラスター内における相対的順序付けについての遺伝的情報は遺伝子組み換え分析からは得られなかった。インタースティシャル・ヒトＤＮＡの小片が失われているらしい「ホール」を含有することが知られているハイブリッドに関する遺伝子座の順序付けは疑わしいが、ハイブリッドパターンは４−７がＹＭ２９およびＭｆｄ１８８の上方に存在することを示す。 From CEPH1333-04 we see that AA1 and YM29 must be located distal to Mfd191. From 13292, it can be estimated that AA1 and ED2 are both 4-7, and are on the base side relative to YM29 and Mfd188. The recombinant found in K2082 provides some additional ordering information. In three independent observations (personal numbers 22, 40 and 63), AA1, ED2, 4-7, and YM29, and Mf188 were located distal to Mfd191, while ID125 showed 4-7. , YM29 and Mfd188 are located proximal to the SGC 40. Genetic information on the relative ordering within the two clusters of the markers AA1 / ED2 and 4-7 / YM29 / Mfd188 was not obtained from genetic engineering analysis. Locus ordering for hybrids known to contain "holes" where interstitial human DNA fragments are likely to be missing is questionable, but the hybrid pattern shows 4-7 above YM29 and Mfd188 To do so.

　　　　　　　　　　　　　　　　実施例５
　マーカーＡＡ１、４−７、ＥＤ２およびＹＭ２９での乳癌家系の遺伝的分析
　前記にて議論した鍵となる組換え体を含有する３つの家系以外に、家系２０３９は、新しく開発されたＳＴＲマーカーの分析を通じて、当該領域に連鎖し、有用な組換え体を含有することが示された。 Example 5
Genetic analysis of breast cancer pedigrees with markers AA1, 4-7, ED2 and YM29 In addition to the three pedigrees containing key recombinants discussed above, pedigree 2039 is an analysis of newly developed STR markers. Through the above, it was shown to be linked to the region and to contain useful recombinants.

　表８は、各遺伝子座における特異的マーカー対立遺伝子およびその各頻度によって家系のハプロタイプ（コドン形で示す）を明らかにする。表８では、対立遺伝子は頻度が低下する順序でリストし；各遺伝子座についての対立遺伝子１−５の頻度を表５に示す。ＨをコードするハプロタイプはＢＲＣＡ１関連ハプロタイプであり、Ｐは部分的Ｈハプロタイプを示し、Ｒは観測可能な組換えハプロタイプを示す。表８で明らかなごとく、すべての家系がすべてのマーカーにつきタイプ分けされたのではなく、特に家系Ｋ２０８２において、家系のうちすべての個人が同一組のマーカーにつきタイプ分けされたのではない。１の例外があるが、罹患したまたは危険な家系構成員から受け継がれたハプロタイプのみを示し；該家系と結婚した配偶者からのハプロタイプは記載しない。かくして、与えられた兄弟姉妹では、ハプロタイプＸおよびＹの様子は、罹患した／危険な個人からの両ハプロタイプが観察され、いずれも乳癌関連ハプロタイプではなかった。 Table 8 defines the haplotypes of the pedigrees (shown in codon form) by specific marker alleles at each locus and their respective frequencies. In Table 8, the alleles are listed in decreasing order of frequency; the frequencies of alleles 1-5 for each locus are shown in Table 5. The haplotype encoding H is a BRCA1-associated haplotype, P indicates a partial H haplotype, and R indicates an observable recombinant haplotype. As is evident in Table 8, not all families were typed for all markers, and particularly for family K2082, not all individuals in the family were typed for the same set of markers. With one exception, only haplotypes inherited from affected or at-risk family members are shown; haplotypes from spouses married to the family are not listed. Thus, in a given sibling, the appearance of haplotypes X and Y was observed for both haplotypes from affected / at-risk individuals, none of which were breast cancer-associated haplotypes.

　家系Ｋ１９０１において、新しいマーカーは乳癌感受性を持つ観察可能な組換え体を示さず、これは、この家系における組換え事象がＴＨＲＡ１およびＥＤ２間で最も起こるらしいことを示す。かくして、この家系で４つの新しいマーカーを調べたことに基づいて、新しいＢＲＣＡ１位置決定情報は得られなかった。家系２０８２において、鍵となる組換え体個人はＥＤ２、４−７、ＡＡ１、およびＹＭ２９につき連鎖した対立遺伝子を引き継ぎ、これはｔｄｊ１４７４についての組換え体であり、これは、組換え事象がｔｄｊ１４７４およびＥＤ２／ＡＡ１の間でこの個人で起こったことを示す。において In kindred K1901, the new marker shows no observable recombinants with breast cancer susceptibility, indicating that recombination events in this kindred are most likely to occur between THRA1 and ED2. Thus, no new BRCA1 localization information was obtained based on examining four new markers in this kindred. In pedigree 2082, the key recombinant individuals took over the linked alleles for ED2, 4-7, AA1, and YM29, which are recombinants for tdj1474, which indicate that the recombination events were tdj1474 and tdj1474. Indicates what happened to this individual during ED2 / AA1.

　表８に示す家系Ｋ２０３５、Ｈ１、Ｈ２およびＲ２には注目する３つのハプロタイプがある。Ｈ１は４ケースおよび個人１７からの１の真性な男性キャリア承継者に存在し、他方、Ｈ２は２ケースおよび個人１０の承継者における２の真性な男性キャリアに存在する。Ｒ２はＭｆｄ１５およびＳＣＧ４０の間のおよびそれを含めた遺伝子座につきＨ２と同一であるが、ＳＣＧ４０と４２Ｄ６との間で組換え体を有する。我々は、ＢＲＣＡ１が４２Ｄ６に対して基部側にあることを確立したので、このＨ２／Ｒ２差異はさらなる位置決め情報を付加しない。Ｈ１およびＲ２はＭｆｄ１５、ＴＨＲＡ１、ＡＡ１およびＥＤ２において同一の対立遺伝子を共に有するが、ＥＤ２に対して末端側と推定される遺伝子座、すなわち４−７、Ｍｆｄ１８８、ＳＣＧ４０および６Ｃ１につき異なる。２のハプロタイプはマーカーＹＭ２９（４−７およびＭｆｄ１８８の間に物理的にマップされるマーカー）にて第５番目の対立遺伝子につき一致するにも拘わらず、該対立遺伝子は血統により同一に保有されているというよりも状態により同一に保有されているようである。というのは、この対立遺伝子はこの遺伝子座で最も普通の対立遺伝子であり、ＣＥＰＨ親における推定頻度は０.４２だからである。対照的に、Ｍｆｄ１５およびＥＤ２遺伝子座で共に保有された連鎖対立遺伝子は各々０.０４および０.０９の頻度を有する。また、それらは、Ｍｆｄ１９１において（頻度＝０.５２）、ＴＨＲＡ１、およびＡＡ１（頻度＝０.２８）においてより普通の対立遺伝子を保有する。これは該組における鍵となる組換え体である。というのは、それは乳癌がハプロタイプの基部の部分に関して分離している唯一の組換え体であり、かくして、末端側境界を決めるからである。従って、この家系からの証拠により、ＢＲＣＡ１遺伝子座は４−７の基部側に位置決定される。家 There are three haplotypes of interest in families K2035, H1, H2 and R2 shown in Table 8. H1 is present in four cases and one true male carrier successor from individual 17, while H2 is present in two cases and two true male carriers in individual 10 successors. R2 is identical to H2 for the locus between and including Mfd15 and SCG40, but has a recombinant between SCG40 and 42D6. Since we have established that BRCA1 is proximal to 42D6, this H2 / R2 difference does not add additional positioning information. H1 and R2 share the same allele in Mfd15, THRA1, AA1 and ED2, but differ for putative loci for ED2, ie, 4-7, Mfd188, SCG40 and 6C1. Although the haplotype of 2 matches for the fifth allele at marker YM29 (a marker physically mapped between 4-7 and Mfd188), the allele is retained identically by the pedigree. It seems that they are held the same depending on the situation rather than being there. This is because this allele is the most common allele at this locus and the estimated frequency in CEPH parents is 0.42. In contrast, linked alleles carried together at the Mfd15 and ED2 loci have frequencies of 0.04 and 0.09, respectively. Also, they carry more common alleles in Mfd191 (frequency = 0.52), THRA1, and AA1 (frequency = 0.28). This is the key recombinant in the set. Because breast cancer is the only recombinant that separates with respect to the base portion of the haplotype, and thus defines the terminal border. Thus, evidence from this kindred places the BRCA1 locus proximal to 4-7.

　ＢＲＣＡ１をｔｄｊ１４７４の末端側に位置決めする家系２０８２における組換え事象は、直接的に推定できる記載した４つの事象のうちの１つだけである；すなわち、罹患母親の遺伝子型は彼女の配偶者および子孫から推定でき、組換えハプロタイプは彼女の罹患娘で観察できる。この家族において、ＢＲＣＡ１感受性対立遺伝子を担う罹患個人に有利な可能性は極めて高い；データの唯一の可能な解釈は、ＢＲＣＡ１がＭｆｄ１９１の末端側にあるというものであり、あるいは表明された組換え体が４４歳の卵巣癌の散在ケースであるというものである。直接的に観察可能なまたは推定された組換え体というよりも、家系２０３３の解釈は、該家系の異なったかつ時々は遠い関連分家で分離する、区別される１７ｑ−ハプロタイプの観察に依存する。これらのハプロタイプの一部はいくつかのマーカーにつき共通する対立遺伝子を有し、他方、それらは、他のマーカーにおいて、共有された領域にＢＲＣＡ１遺伝子座を位置決めする。この位置決めの信頼性は、いくつかの因子；各ハプロタイプを担う個人間の関係、共有された対立遺伝子の頻度、ハプロタイプがＢＲＣＡ１遺伝子座に関して分離することが示された確実性、およびハプロタイプを決定する領域におけるマーカーの密度に依存する。家系２０３５の場合では、２つの分家が密接に関係しており、各分家は各ハプロタイプを担う多数の早期開始ケースを有する。共有された対立遺伝子のうち２つは共通である（Ｍｆｄ１９１、ＴＨＲＡ１）一方、Ｍｆｄ１５、ＡＡ１、およびＥＤ２における共有された対立遺伝子の推定頻度は各々０.０４、０.２８および０.０９である。従って、これらの対立遺伝子は、状態によって同一である（同一対立遺伝子であるが一般的集団に由来）というよりも、血統によって同一である（共通の先祖に由来）。 The recombination event in pedigree 2082 that positions BRCA1 distal to tdj1474 is only one of the four events described that can be directly estimated; that is, the genotype of the affected mother is her spouse and offspring. And the recombinant haplotype is observable in her affected daughter. In this family, it is very likely to benefit an affected individual carrying the BRCA1 susceptibility allele; the only possible interpretation of the data is that BRCA1 is distal to Mfd191, or the expressed recombinant Is a sporadic case of 44-year-old ovarian cancer. Rather than directly observable or putative recombinants, the interpretation of pedigree 2033 relies on the observation of distinct 17q-haplotypes, segregating in different and sometimes distantly related branches of the pedigree. . Some of these haplotypes have common alleles for some markers, while they position the BRCA1 locus in other markers on a shared region. The reliability of this localization determines several factors; the relationship between individuals carrying each haplotype, the frequency of shared alleles, the certainty that haplotypes have been shown to segregate for the BRCA1 locus, and the haplotype Depends on the density of the marker in the area. In the case of ancestry 2035, the two detached houses are closely related, with each separated house having a number of early onset cases responsible for each haplotype. Two of the shared alleles are common (Mfd191, THRA1), while the estimated frequencies of the shared alleles in Mfd15, AA1, and ED2 are 0.04, 0.28, and 0.09, respectively. . Thus, these alleles are identical by pedigree (derived from a common ancestor) rather than identical by state (identical alleles but derived from the general population).

　　　　　　　　　　　　　　　　実施例６
　精密な物理的マッピング研究は、ｔｄｊ１４７４およびＵ５Ｒが挟み隣接する領域にＢＲＣＡ１を位置付ける。
　１９９０年における染色体１７ｑへの最初の位置決定（Hallら、1990)以来、効果的な位置クローニング戦略の手段を可能として当該遺伝子を単離するのに十分な位小さな領域にＢＲＣＡ１遺伝子を位置決めするのに多大の努力がなされてきた。世界的に収集した２１４家族よりなる共同性Breast Cancer Linkage Consortiumデータベースにおいて、多点連鎖分析（multipoint linkage analysis）（Eastonら、1993)によって、まずＢＲＣＡ１遺伝子座がインターバルＭｆｄ１５（Ｄ１７Ｓ２５０）−４２Ｄ６（Ｄ１７Ｓ５８８）に位置決定された。引き続いての精密な位置決めは、特定の家族における個人の組換え事象に基づくものであった。領域ＴＨＲＡ１−Ｄ１７Ｓ１８３はBowcockら、1993によって明確化され；領域ＴＨＲＡ１−Ｄ１７Ｓ２８はSimardら、1993によって明確化された。 Example 6
Extensive physical mapping studies have located BRCA1 in the region flanked by tdj1474 and U5R.
Since the first localization to chromosome 17q in 1990 (Hall et al., 1990), the BRCA1 gene was located in a small enough region to allow for an effective position cloning strategy and to isolate the gene. A great deal of effort has been made. In a collective Breast Cancer Linkage Consortium database of 214 families collected worldwide, multipoint linkage analysis (Easton et al., 1993) first identified the BRCA1 locus at the interval Mfd15 (D17S250) -42D6 (D17S588). Was located. Subsequent fine positioning was based on individual recombination events in specific families. The region THRA1-D17S183 was defined by Bowcock et al., 1993; the region THRA1-D17S28 was defined by Simard et al., 1993.

　我々は、さらに、ＢＲＣＡ１遺伝子座はマーカーＭｆｄ１９１（Ｄ１７Ｓ７７６）に対して末端側に存在しなければならないことを示した（Goldgarら、1994)。このマーカーはＴＨＲＡ１およびＲＡＲＡに対して末端側に存在することが知られている。ＢＲＣＡ１遺伝子座についての最小の公表されている領域は、かくして、Ｄ１７Ｓ７７６とＤ１７Ｓ７８との間にある。この領域は、約１５０万塩基のＤＮＡを依然含有し、該領域におけるすべての遺伝子の単離およびテストを非常に困難な仕事としている。我々は、従って、該領域の物理的な地図を構築し、該領域に位置する多形ＳＴＲマーカーの組を単離し、情報的家族の組におけるこれらの新しいマーカーを分析する仕事を行って、取り扱えるインターバルへのＢＲＣＡ１遺伝子の位置決めの精度を上げた。 We have further shown that the BRCA1 locus must be distal to the marker Mfd191 (D17S776) (Goldgar et al., 1994). This marker is known to be distal to THRA1 and RARA. The smallest published region for the BRCA1 locus is thus between D17S776 and D17S78. This region still contains about 1.5 million bases of DNA, making the isolation and testing of all genes in the region a very difficult task. We can therefore perform and work on constructing a physical map of the region, isolating the set of polymorphic STR markers located in the region, and analyzing these new markers in the informative family set. The accuracy of positioning the BRCA1 gene in the interval was increased.

　４つの家族が、位置クローニング戦略の適用のための十分に小さな領域へのＢＲＣＡ１の位置決めについての重要な情報的遺伝的証拠を提供する。２つの家族（Ｋ２０８２、Ｋ１９０１）は、ＢＲＣＡ１についての基部側境界に関するデータを提供し、他の２つ（Ｋ２０３５、Ｋ１８１３）は末端側境界を定める。これらの家族を後記にて詳述する。ＰＣＲによってアッセイできる合計１５の短鎖縦列反復マーカーを用いて、研究した家族におけるこの位置決定の精度を上げた。これらのマーカーはＤＳ１７Ｓ７６５４、ＤＳ１７Ｓ９７５、ｔｇｊ１４７４およびｔｇｊ１２３９を含む。これらのマーカー用のプライマー配列は配列番号３に、ＤＳ１７Ｓ７５４については配列番号４に、ＤＳ１７Ｓ９７５については配列番号５および配列番号６に、ｔｇｊ１４７４については配列番号７および配列番号８に、ｔｇｊ１２３９については配列番号９および配列番号１０に供する。 Four families provide important informative genetic evidence for the positioning of BRCA1 in a region small enough for the application of a positional cloning strategy. Two families (K2082, K1901) provide data on the proximal border for BRCA1, and the other two (K2035, K1813) define a distal border. These families are described in detail below. A total of 15 short tandem repeat markers that could be assayed by PCR were used to refine this localization in the studied families. These markers include DS17S7654, DS17S975, tgj1474 and tgj1239. The primer sequences for these markers are SEQ ID NO: 3, SEQ ID NO: 4 for DS17S754, SEQ ID NO: 5 and SEQ ID NO: 6 for DS17S975, SEQ ID NO: 7 and SEQ ID NO: 8 for tgj1474, and SEQ ID NO: 8 for tgj1239. 9 and SEQ ID NO: 10.

　家系２０８２
　家系２０８２は現在までに研究された最大のＢＲＣＡ１−連鎖乳癌／卵巣癌家族である。それは、８.６のＬＯＤスコアを有し、１７ｑ連鎖についての明白な証拠を提供する。この家族は従前に記載されており、ＢＲＣＡ１をＭＦＤ１９１（Ｄ１７Ｓ７７６）の末端側に位置決めする臨界的組換え体を含有することが示されている。この組換え体は、その母親が６３歳で卵巣癌を有した４５歳で卵巣癌と診断された婦人で起こった。罹患した母親は他界し；しかしながら、彼女の子供から、彼女はＭｆｄ１５およびＭｆｄ１８８の間の領域において家族の３０の他のケースに存在する連鎖ハプロタイプを有すると推定できた。彼女の罹患した娘は遺伝子座ＥＤ２，４−７およびＭｆｄ１８８において連鎖対立遺伝子を受け継いだが、Ｍｆｄ１５およびＭｆｄ１９１における非−ＢＲＣＡ１染色体上の対立遺伝子を受け継いだ。この組換え分裂中止点をさらに位置付けするために、我々は物理的マッピング源に由来する以下のマーカーにつき、その家族の鍵となる構成員をテストした：ｔｄｊ１４７４、ｔｄｊ１２３９、ＣＦ４、Ｄ１７Ｓ８５５。マーカーｔｄｊ１４７４およびＣＦ４については、罹患娘は連鎖対立遺伝子を受け継がなかった。しかしながら、ＳＴＲ遺伝子座ｔｄｊ１２３９については、該母親は情報的であって、彼女の娘はＢＲＣＡ１関連対立遺伝子を受け継いだと推定できた。Ｄ１７Ｓ８５５はこの家族では情報的でなかった。この分析に基づき、順序は１７ｑ動原体−Ｍｆｄ１９１−１７ＨＳＤ−ＣＦ４−ｔｄｊ１４７４−ｔｄｊ１２３９−Ｄ１７Ｓ８５５−ＥＤ２−４−７−Ｍｆｄ１８８−１７ｑテロメアである。従って、前記した組換え体はＢＲＣＡ１をｔｄｊ１４７４に対して末端側に位置付け、分裂中止点はｔｄｊ１４７５とｔｄｊ１２３９との間のインターバルに位置付けた。ｔｄｊ１４７４に対して末端側に位置付けられるＢＲＣＡ１のもの以外のこの家族におけるデータについての唯一の別の説明は、組換え体個人に存在する卵巣癌はＢＲＣＡ１遺伝子とは独立した理由によって引き起こされるというものである。５０歳前に診断される卵巣癌が稀だとしたら、この別の解釈は全くありそうにもない。 Family 2082
Kindred 2082 is the largest BRCA1-linked breast / ovarian cancer family studied to date. It has a LOD score of 8.6 and provides clear evidence for 17q linkage. This family has been described previously and has been shown to contain critical recombinants that position BRCA1 distal to MFD191 (D17S776). This recombinant occurred in a woman diagnosed with ovarian cancer at the age of 45 whose mother had ovarian cancer at the age of 63. The affected mother died; however, from her child she could be inferred to have a linked haplotype present in 30 other cases of the family in the region between Mfd15 and Mfd188. Her affected daughter inherited linked alleles at loci ED2,4-7 and Mfd188, but inherited alleles on non-BRCA1 chromosomes at Mfd15 and Mfd191. To further map this recombination breakpoint, we tested key members of the family for the following markers from physical mapping sources: tdj1474, tdj1239, CF4, D17S855. For markers tdj1474 and CF4, affected daughters did not inherit the linked allele. However, for the STR locus tdj1239, it could be assumed that the mother was informative and her daughter inherited the BRCA1-related allele. D17S855 was not informative in this family. Based on this analysis, the order is 17q centromere-Mfd191-17HSD-CF4-tdj1474-tdj1239-D17S855-ED2-4-7-Mfd188-17q telomere. Thus, the recombinant described above positioned BRCA1 distal to tdj1474 and the breakpoint was positioned at the interval between tdj1475 and tdj1239. The only other explanation for data in this family other than that of BRCA1 located distal to tdj1474 is that ovarian cancer present in recombinant individuals is caused by reasons independent of the BRCA1 gene. is there. If ovarian cancer diagnosed before the age of 50 is rare, this alternative interpretation is unlikely.

　家系１９０１
　家系１９０１は、７ケースが５０歳前に乳癌と診断され、そのうち４ケースが４０歳前に診断された早期開始乳癌家族である。さらに、５０歳および７０歳の間に乳癌と診断された３ケースがあった。乳癌の１ケースは、６１歳における卵巣癌も有していた。この家族は、現在、Ｄ１７Ｓ８５５につき１.５のＬＯＤスコアを有する。この連鎖証拠および少なくとも１つの卵巣眼ケースの存在が与えられれば、この家族は０.９９を超えるＢＲＤＡ１による事後確率を有する。この家族では、組換えは、それから他のケースの大部分に遺伝した卵巣癌ケースの兄弟である個人が該家族における他のケースと共分離するハプロタイプの一部を共に有するという事実に由来する。しかしながら、彼はこの部分的ハプロタイプを彼の娘に渡し、彼女は４４歳で乳癌を発病した。もしこのケースがＢＲＤＡ１遺伝子によるものならば、この兄弟および彼の姉妹の間で共有されたハプロタイプの一部のみがＢＲＤＡ１遺伝子を含有できる。この種の情報の解釈の困難性は、共有されていないマーカー、従って、組換え体を確認することはできるが、一致するマーカーは、それらが非組換え体であるゆえに、あるいはそれらの親がホモ接合体であったゆえに共有されているであろうということである。親の遺伝子型データがなければ、これらの別解釈を区別できない。Ｋ１９０１におけるハプロタイプに鑑みると、彼はＭｆｄ１５（Ｄ１７Ｓ２５０）、ＴＨＲＡ１、ＣＦ４（Ｓ１７Ｓ１３２０）、およびｔｄｊ１４７４（１７Ｓ１３２１）において連鎖対立遺伝子を共に有していないことが示される。彼はＭｆｄ１９１（Ｄ１７Ｓ７７６）、ＥＤ２（Ｓ１７Ｓ１３２７）、ｔｄｊ１２３９（Ｄ１７Ｓ１３２８）およびＭｆｄ１８８（Ｄ１７Ｓ５７９）において連鎖対立遺伝子を共に有している。Ｍｆｄ１９１で共有された対立遺伝子は比較的稀（０.０７）であるにも拘わらず、我々は、該親は、それらがいずれか側の近くに位置付けされるマーカーにて組換え体であるのでホモ接合体であり、この領域における二重組換え事象は極端にありそうにもないと推定する。かくして、この家族における証拠はｔｄｊ１４７４に対してＢＲＣＡ１遺伝子座を末端側に位置決定する。しかしながら、この分裂中止点のより低い限界は親の遺伝子型情報なくしては決定するのが不可能である。この家族で鍵となる組換え分裂中止点は家系２０８２における結果を確認させることは当惑させるものである。前と同じように、この家族における位置決め情報は、もし乳癌がＢＲＣＡ１遺伝子によるものならば意味のあるものにすぎない。しかしながら、診断における彼女の比較的早期年齢（４４）はこれを非常にありそうなものとする。というのは、一般的集団では４５歳前の乳癌の危険は低いからである（ほぼ１％）。 Family tree 1901
Pedigree 1901 is an early-onset breast cancer family in which 7 cases were diagnosed before age 50, of which 4 were diagnosed before age 40. In addition, there were three cases diagnosed with breast cancer between the ages of 50 and 70. One case of breast cancer also had ovarian cancer at the age of 61. This family currently has a LOD score of 1.5 for D17S855. Given this linkage evidence and the presence of at least one ovarian eye case, the family has a posterior probability with a BRDA1 of greater than 0.99. In this family, recombination results from the fact that individuals who are siblings of ovarian cancer cases that were inherited in most of the other cases then share some of the haplotypes that co-segregate with other cases in the family. However, he handed this partial haplotype to his daughter, who developed breast cancer at the age of 44. If this case is due to the BRDA1 gene, only some of the haplotypes shared between this brother and his sister can contain the BRDA1 gene. Difficulties in interpreting this type of information can identify non-shared markers, and thus recombinants, but matching markers are likely because they are non-recombinant or when their parents That is, they would be shared because they were homozygous. Without parental genotype data, these alternative interpretations cannot be distinguished. The haplotype in K1901 indicates that he does not have any linked alleles at Mfd15 (D17S250), THRA1, CF4 (S17S1320), and tdj1474 (17S1321). He has both linked alleles at Mfd191 (D17S776), ED2 (S17S1327), tdj1239 (D17S1328) and Mfd188 (D17S579). Although the alleles shared by Mfd191 are relatively rare (0.07), we believe that because the parents are recombinant at a marker where they are located near either side It is homozygous, presuming that double recombination events in this region are extremely unlikely. Thus, evidence in this family positions the BRCA1 locus distal to tdj1474. However, this lower limit of the mitotic breakpoint cannot be determined without parental genotype information. The key recombination breakpoint in this family is disconcerting to confirm the results in pedigree 2082. As before, the positioning information in this family is only meaningful if the breast cancer is due to the BRCA1 gene. However, her relatively early age at diagnosis (44) makes this very likely. The risk of breast cancer before age 45 is low in the general population (almost 1%).

　家系２０３５
　この家族は、臨界的組換え事象についての情報が直接的には観察されないが、観察から、当該家族の２の分家における早期開始乳癌に関し共分離する２つのハプロタイプが１７ｑＢＲＣＡ１領域の基部側部分に位置決めされたマーカーにつき同一であるが、より末端側の遺伝子座では異なるようであると推定される点でＫ１９０１と同様である。これらの２のハプロタイプの各々は早期開始のまたは両側乳癌の少なくとも４ケースで起こる。この家族におけるＥＤ２での総じてのＬＯＤスコアは２.２であり、該家族に乳癌のケースがあり（これは、８０％のＢＲＣＡ１連鎖の事前確率を示す）、この家族がＢＲＣＡ１に連鎖しているという得られた事後確率は０.９９８である。ハプロタイプは、マーカーＭｆｄ１５、ＴＨＲＡ１、Ｍｆｄ１９１、ＥＤ２、ＡＡ１、Ｄ１７Ｓ８５８およびＤ１７Ｓ９０２につき同一である。Ｍｆｄ１５およびＥＤ２における共通の対立遺伝子は共にかなり稀であり、これは、このハプロタイプは子孫によって同一に共有されていることを示す。しかしながら、該ハプロタイプはＣＡ３７５、４−７、およびＭｆｄ１８８、ならびにいくつかのより末端側マーカーにつき一致しない。これは、ＢＲＣＡ１遺伝子座がマーカーＣＡ３７５上方に存在するにちがいないことを示す。このマーカーはＤ１７Ｓ７８よりも５０ｋｂ下方に位置し、従って、それはＳｉｍａｒｄら（１９９３）に報告されているように、一義的には、この従前の低い境界のさらなる確認として働く。 Family 2035
Although information about critical recombination events is not directly observed in this family, observations indicate that two haplotypes co-segregating for early-onset breast cancer in two separate families of the family are located proximal to the 17qBRCA1 region. Similar to K1901 in that it is the same for the located marker, but presumably different at the more distal loci. Each of these two haplotypes occurs in at least four cases of early onset or bilateral breast cancer. The overall LOD score at ED2 in this family is 2.2 and the family has a case of breast cancer (indicating an 80% prior probability of BRCA1 linkage), and this family is linked to BRCA1 The obtained posterior probability is 0.998. Haplotypes are identical for markers Mfd15, THRA1, Mfd191, ED2, AA1, D17S858 and D17S902. Both common alleles in Mfd15 and ED2 are fairly rare, indicating that this haplotype is shared identically by progeny. However, the haplotypes are inconsistent with CA375, 4-7, and Mfd188, and some more distal markers. This indicates that the BRCA1 locus must be above marker CA375. This marker is located 50 kb below D17S78, and thus serves primarily as a further confirmation of this previous lower boundary, as reported by Simard et al. (1993).

　家系１８１３
　家系１８１３は、その母親が４５歳で乳癌と診断され６１歳で卵巣癌診断された４０歳前に乳癌と診断された４ケースを持つ小さな家族である。この状況は、該４ケースは３人の異なる父親を有し、それのうち１人のみが遺伝子型が決定されているという事実によって幾分複雑化している。しかしながら、ＢＲＣＡ１領域における多数の異なるマーカーならびにゲノムにおける他の場所の高度に多形のマーカーをタイプ分けすることによって、該家族におけるすべての子供の父親が誰であるかは、かなりの確実性をもって決定された。この家族は、１７ｑマーカーに関し０.６０の最大多点ＬＯＤスコアを生じ、もし少なくとも１ケースの卵巣癌があれば、その結果、０.９３のＢＲＣＡ１連鎖家族であるという事後確率となる。この家族は、３４歳で乳癌を発病した個人１８において直接的に観察可能な組換え事象を含有する（Ｓｉｍａｒｄら，Ｈｕｍａｎ　Ｍｏｌ．Ｇｅｎｅｔ．２：１１９３−１１９９（１９９３）における図５参照）。関連１７ｑ遺伝子座における罹患母親の遺伝子型は、彼女の遺伝子型、彼女の罹患姉妹の遺伝子型、および３人の他の非罹患兄弟姉妹の遺伝子型から推定できる。個人１８は以下の遺伝子座：Ｍｆｄ１５、ＴＨＲＡ１、Ｄ１７Ｓ８００、Ｄ１７Ｓ８５５、ＡＡ１、およびＤ１７Ｓ９３１につきＢＲＣＡ１連鎖対立遺伝子を受け継ぐ。しかしながら、Ｄ１７Ｓ９３１の下方のマーカー、すなわち、Ｕ５Ｒ、ｖｒｓ３１、Ｄ１７Ｓ８５８およびＤ１７Ｓ５７９については、彼女は病気を担わない染色体上に位置する対立遺伝子を受け継いだ。この家族からの証拠は、従って、ＢＲＣＡ１遺伝子座をマーカーＵＳ５に対して基部側に位置付ける。彼女の診断の早期年齢（３４）のため、組換え個人の癌はこの家族における乳癌／卵巣癌の他のケースの原因となる遺伝子によるものではないということは極めてありそうにもなく：この家族における不確実性は、この家族における乳癌は第２の、まだマップされていない、乳癌感受性遺伝子座よりむしろＢＲＣＡ１によるものであるという我々の幾分少ない証拠に由来する。 Family 1813
Family 1813 is a small family with four cases whose mother was diagnosed with breast cancer at age 45 and diagnosed with ovarian cancer at age 61 at age 40 before the age of 40. This situation is somewhat complicated by the fact that the four cases have three different fathers, of which only one has been genotyped. However, by typing a number of different markers in the BRCA1 region as well as highly polymorphic markers elsewhere in the genome, it is determined with considerable certainty who is the father of every child in the family. Was done. This family produces a maximum multipoint LOD score of 0.60 for the 17q marker, and if there is at least one case of ovarian cancer, the posterior probability of being a BRCA1-linked family of 0.93. This family contains recombination events that are directly observable in individual 18, who developed breast cancer at the age of 34 (see FIG. 5 in Simard et al., Human Mol. Genet. 2: 1193-1199 (1993)). The genotype of the affected mother at the relevant 17q locus can be estimated from her genotype, her affected sister's genotype, and the genotypes of three other unaffected siblings. Individual 18 inherits the BRCA1 linked allele at the following loci: Mfd15, THRA1, D17S800, D17S855, AA1, and D17S931. However, for the markers below D17S931, namely U5R, vrs31, D17S858 and D17S579, she inherited alleles located on disease-free chromosomes. Evidence from this family therefore maps the BRCA1 locus proximal to marker US5. Because of the early age of her diagnosis (34), it is very unlikely that the recombinant individual's cancer is due to a gene responsible for other cases of breast / ovarian cancer in this family: this family Uncertainty comes from our somewhat less evidence that breast cancer in this family is due to BRCA1 rather than a second, unmapped, breast cancer susceptibility locus.

　ＢＲＣＡ１を含有する領域のサイズ
　前記で詳述した遺伝データに基くと、ＢＲＣＡ１遺伝子座は、共に我々の研究所で単離されたマーカーｔｄｊ４７４およびＵ５Ｒ間のインターバルに存在するにちがいない。図２および３に示す物理的地図に基づき、我々はこれらの２つの遺伝子座の間の物理的距離を見積もろうと試みることができる。それは、この領域にわたる約８０ｋｂの平均インサートサイズの約１４　Ｐ１クローンとするる。しかしながら、いくつかの未知の程度のこれらのすべてのＰ１重複のため、該物理的領域は８０ｋｂの１４倍よりも、どもうかなり小さいらしい。該領域をカバーするクローンの制限地図に基づき、我々はＢＲＣＡ１を含有する領域のサイズはほぼ６５０ｂｐであると見積もる。 Size of the Region Containing BRCA1 Based on the genetic data detailed above, the BRCA1 locus must be located in the interval between the markers tdj474 and U5R, both of which were isolated in our laboratory. Based on the physical maps shown in FIGS. 2 and 3, we can attempt to estimate the physical distance between these two loci. It gives an approximately 14 P1 clone with an average insert size of approximately 80 kb over this region. However, due to some unknown degree of all these P1 duplications, the physical area seems to be much smaller than 14 times 80 kb. Based on the restriction map of the clone covering the region, we estimate that the size of the region containing BRCA1 is approximately 650 bp.

　　　　　　　　　　　　　　　　実施例７
　Ｃｏｎｔｉｇ領域のゲノム分析によるＢＲＣＡ１遺伝子座についての候補ｃＤＮＡクローンの同定
　可能な領域の完全なスクリーニング
　候補ｃＤＮＡを同定する最初の方法は、かなり労力が必要だが、公知の技術を用いた。該方法は、該ｃｏｎｔｉｇにおけるコスミドならびにＰ１およびＢＡＣクローンをスクリーニングして推定暗号配列を同定することよりなるものであった。次いで、推定暗号配列を含有するクローンをｃＤＮＡライブラリーのフィルター上のプロープとして使用して将来の分析用の候補ｃＤＮＡクローンを同定した。該クローンを２つの方法のうちいずれかによって推定暗号配列につきスクリーニングした。 Example 7
Genomic analysis of the Contig region identifies candidate cDNA clones for the BRCA1 locus Complete Screening of Possible Regions The first method of identifying candidate cDNA required considerable effort but used known techniques. The method consisted of screening cosmids and P1 and BAC clones in the contig to identify putative coding sequences. The clone containing the putative coding sequence was then used as a probe on a filter of a cDNA library to identify candidate cDNA clones for future analysis. The clones were screened for putative coding sequences by one of two methods.

　ズー（ｚｏｏ）ブロット
　推定暗号配列を同定するための第１の方法は、いくつかの種にわたって進化を通じて保存された配列についてコスミドおよびＰ１クローンをスクリーニングすることによるものであった。この技術を「ズーブロット分析」といい、Ｍｏｎａｃｏ，１９８６によって記載されている。特に、ウシ、ニワトリ、ブタ、マウスおよびラットからのＤＮＡを制限酵素ＥｃｏＲＩおよびＨｉｎＤＩＩＩで消化した（酵素当たりＤＮＡ８μｇ）。消化したＤＮＡを２０ボルトにて１６時間０.７％ゲル上で一晩分離し（１４ｃｍゲル）、標準的なサザーンブロット技術を用いてＤＮＡをナイロン膜に移した。例えば、６５℃にて、０.１×ＳＳＣ、０.５％ＳＤＳおよび０.２Ｍ　トリス、ｐＨ８.０中で３０分間処理し、次いで、４２℃にて、５×ＳＳＣ、１０％ＰＥＧ８０００、２０ｍＭ　ＮａＰＯ_４、ｐＨ６.８、１００μｇ／ｍｌ　サケ精子ＤＮＡ、１×Ｄｅｎｈａｒｄｔ’ｓ、５０％ホルムアミド、０.１％ＳＤＳおよび２μｇ／ｍｌ　Ｃ_０ｔ−１ＤＮＡ中でブロックした。 Zoo Blots The first method to identify putative coding sequences was by screening cosmid and P1 clones for sequences conserved through evolution across several species. This technique is called "zooblot analysis" and is described by Monaco, 1986. In particular, DNA from cows, chickens, pigs, mice and rats was digested with restriction enzymes EcoRI and HinDIII (8 μg DNA per enzyme). The digested DNA was separated overnight (14 cm gel) on a 0.7% gel at 20 volts for 16 hours, and the DNA was transferred to a nylon membrane using standard Southern blot techniques. For example, treatment at 65 ° C. in 0.1 × SSC, 0.5% SDS and 0.2 M Tris, pH 8.0 for 30 minutes, then at 42 ° C., 5 × SSC, 10% PEG 8000, 20 mM NaPO _4, pH6.8,100μg / ml salmon sperm DNA, 1 × Denhardt's, 50 % formamide, and blocked with 0.1% SDS and 2 [mu] g / _ml C 0 in t-1 DNA.

　分析すべきコスミドおよびＰ１クローンを制限酵素で消化して、ヒトＤＮＡをベクターＤＮＡから遊離させた。該ＤＮＡを２０ボルトにて１６時間１４ｃｍの０.５％アガロースゲル泳動にて一晩分離した。ヒトＤＮＡバンドをゲルから切り出し、０.５×トリス酢酸緩衝液中、１００ボルトにて、ゲルウェッジから少なくとも２時間で電気溶出させた（Ｍａｎｉａｔｉｓら，１９８２）。次いで、溶出したＮｏｔ　Ｉ消化ＤＮＡ（〜１５ｋｂないし２５ｋｂ）をＥｃｏＲＩ制限酵素で消化して小さな断片（〜０.５ｋｂないし５.０ｋｂ）が得られ、次いで、これは放射性ヌクレオチドでのＤＮＡの標識の次工程にため容易に溶融した。該ＤＮＡ断片を、ヘキサマーランダムプライミング標識方法（Ｂｏｅｈｒｉｎｇｅｒ−Ｍａｎｎｈｅｉｎ，カタログ番号１００４７６０）によって標識した。標識したＤＮＡをスペルミン沈殿させて（１００μｌ　ＴＥ、５μｌ　０.１Ｍスペルミン、および５μｌ　１０ｍｇ／ｍｌサケ精子ＤＮＡ添加）、取り込まれなかった放射性ヌクレオチドを除去した。次いで、標識したＤＮＡを６５℃の１００μｌ　ＴＥ、０.５Ｍ　ＮａＣｌに５分間で再懸濁し、次いで、製造業者の指示のごとくに（Ｇｉｂｃｏ／ＢＲＬ、カタログ番号５２７９ＳＡ）、ヒトＣ_０ｔ−１ＤＮＡで２−４時間でブロックした。該Ｃ_０ｔ−１ブロックトプローブをブロッキング溶液中、４２℃で、ズーブロットフィルター上でインキュベートした。該フィルターを室温にて２×ＳＳＣ、０.１％ＳＤＳ中で３０分間洗浄し、次いで、５５℃にて同一緩衝液中で３０分間洗浄した。次いで、該フィルターを、−７０℃にて、増感剤を含むＫｏｄａｋ　ＸＡＲ−５フィルムに１ないし３日間暴露した。かくして、ズーブロットを当該インサートからのＥｃｏ−Ｒ１断片のプールと、または各断片と個々にハイブリダイズさせた。 The cosmid and P1 clone to be analyzed were digested with restriction enzymes to release human DNA from vector DNA. The DNA was separated on a 14 cm 0.5% agarose gel electrophoresis at 20 volts for 16 hours overnight. The human DNA band was excised from the gel and electroeluted from the gel wedge in 0.5 x Tris acetate buffer at 100 volts for at least 2 hours (Maniatis et al., 1982). The eluted Not I digested DNA (〜15 kb to 25 kb) was then digested with EcoRI restriction enzyme to give a small fragment (〜0.5 kb to 5.0 kb), which was then used to label the DNA with radionucleotides. It melted easily for the next step. The DNA fragment was labeled by the hexamer random priming labeling method (Boehringer-Mannhein, catalog number 100460). Labeled DNA was spermine precipitated (100 μl TE, 5 μl 0.1 M spermine, and 5 μl 10 mg / ml salmon sperm DNA added) to remove unincorporated radionucleotides. The labeled DNA was then resuspended in 100 μl TE, 0.5 M NaCl at 65 ° C. for 5 minutes, and then reconstituted with human C ₀ t-1 DNA according to the manufacturer's instructions (Gibco / BRL, catalog number 5279SA). Blocked for 2-4 hours. Blocking solution the C _{0 t-1} blocked probe, at 42 ° C., and incubated on Zoo blot filter. The filters were washed in 2 × SSC, 0.1% SDS at room temperature for 30 minutes, then at 55 ° C. in the same buffer for 30 minutes. The filters were then exposed to Kodak XAR-5 film with sensitizer at -70 ° C for 1-3 days. Thus, the Zooblot was hybridized individually with a pool of Eco-R1 fragments from the insert, or with each fragment.

　ＨＴＦアイランド（ｉｓｌａｎｄ）分析
　ｃＤＮＡライブラリーについてのプローブとして使用するためのコスミドを同定する第２の方法はＨＴＦアイランド分析であった。パルス場地図はＨＴＦアイランドを明らかとできるので、これらのＨＴＦアイランド領域にマップされるコスミドを優先的に分析した。ＨＴＦアイランドはＤＮＡのセグメントであって、これは非常に高頻度の非メチル化ＣｐＧジヌクレオチドを含有し（Ｔｏｎｏｌｉｏら、１９９０）、その認識配列がＣｐＧジヌクレオチドを含む酵素の制限部位のクラスターリングによって明らかにされる。ＨＴＦ−アイランド分析で有用であることが知られている酵素はＡｓｃＩ、ＮｏｔＩ、ＢｓｓＨＩＩ、ＥａｇＩ、ＳｃａＩＩ、ＮａｅＩ、ＮａｒＩ、ＳｍａＩおよびＭｌｕＩである（Ａｎａｎｄ，１９９２）。酵素ＮｏｔＩ、ＮｒｕＩ、ＥａｇＩ、ＳａｃＩＩおよびＳａｌＩを用いてパルス場地図を作成し、２つのＨＴＦアイランドが見い出された。これらのアイランドは当該領域の末端に位置し、１つはＧＰ２Ｂ遺伝子座の末端側であり、他のものは同遺伝子座よりも基部側であり、共にＢＲＣＡ１領域の外部にある。これらの２つの位置をカバーするＴＡＣに由来するコスミドを分析して、これらの制限部位、かくしてＨＴＦアイランドを含有するものを同定した。 HTF island analysis A second method of identifying cosmids for use as probes for cDNA libraries was HTF island analysis. Since pulse field maps can reveal HTF islands, cosmids mapped to these HTF island regions were analyzed preferentially. HTF islands are segments of DNA that contain a very high frequency of unmethylated CpG dinucleotides (Tonolio et al., 1990) whose recognition sequence is due to clustering of restriction sites of enzymes containing CpG dinucleotides. Will be revealed. Enzymes known to be useful in HTF-island analysis are AscI, NotI, BssHII, EagI, ScaII, NaeI, NarI, SmaI and MluI (Andand, 1992). A pulse field map was created using the enzymes NotI, NruI, EagI, SacII and SalI, and two HTF islands were found. These islands are located at the end of the region, one at the end of the GP2B locus and the other at the base of the locus, both outside the BRCA1 region. Cosmids derived from TAC covering these two positions were analyzed to identify those containing these restriction sites, and thus HTF islands.

　ｃＤＮＡスクリーニング
　ＨＴＦアイランドを含有するか、あるいはヒト以外の他の種のＤＮＡに対してハイブリダイゼーションを示すクローンは暗号配列を含有するようである。これらのクローンからのヒトＤＮＡを全インサートとしてまたはＥｃｏＲＩ断片として単離し、前記したごとくに標識した。標識したＤＮＡを用いて、ｃＤＮＡフィルターが６５℃で０.１×ＳＳＣ、０.１％ＳＤＳのよりストリンジェントな洗液を３０分間２回受けた以外は、ズーブロットと同一条件下で種々のｃＤＮＡライブラリーのフィルターをスクリーニングした。
　我々の実験で現在まで使用したｃＤＮＡライブラリーのほとんどは（正常乳房組織、妊娠８カ月で乳房悪性の婦人からの乳房組織からのライブラリー）Ｃｌｏｎｅｔｅｃｈ，Ｉｎｃ．から調製した。８カ月妊婦の乳房組織から作成したｃＤＮＡライブラリーはラムダｇｔ−１０ベクター中にてＣｌｏｎｅｔｅｃｈ（カタログ番号ＨＬ１０３７ａ）から入手でき、これを、Ｃ６００Ｈｆｌ細菌宿主細胞中で増殖させる。正常乳房組織および悪性乳房組織試料を３７歳の白人女性から単離し、１グラムの各組織をｍＲＮＡプロセッシングおよびｃＤＮＡライブラリー構築のためにＣｌｏｎｅｔｅｃｈに送った。後者の２のライブラリーは、ランダムおよびオリゴ−ｄＴプライミング双方を用いて作成し、最終産物のサイズを選択し、これを次いでラムダＺａｐＩＩベクターにクローン化し、製造業者によって記載されているごとくに細菌のＸＬ１−ブルー株で増殖させた。さらなる組織−特異的ｃＤＮＡライブラリーは、ヒト胎児脳（Ｓｔｒａｔａｇｅｎｅ，カタログ番号９３６２０６）、ヒト精巣（Ｃｌｏｎｅｔｅｃｈ，カタログＨＬ３０２４）、ヒト胸腺（Ｃｌｏｎｅｔｅｃｈ，カタログＨＬ１１２７ｎ）、ヒト脳（Ｃｌｏｎｅｔｅｃｈ，カタログＨＬ１１８１０）、ヒト胎盤（Ｃｌｏｎｅｔｅｃｈ，カタログ１０７５ｂ）、およびヒト骨格筋（Ｃｌｏｎｅｔｅｃｈ，カタログＨＬ１１２４ｂ）を含む。 cDNA Screening Clones that contain HTF islands or that hybridize to DNA of other species than human are likely to contain coding sequences. Human DNA from these clones was isolated as a total insert or as an EcoRI fragment and labeled as described above. Using the labeled DNA, various cDNAs were obtained under the same conditions as the Zooblot, except that the cDNA filter was subjected to two more 30 minute washes of 0.1 × SSC, 0.1% SDS at 65 ° C. for 30 minutes. The library filters were screened.
Most of the cDNA libraries used to date in our experiments (normal breast tissue, libraries from breast tissue from women with malignant malignancy at 8 months of gestation) are available from Clonetech, Inc. Prepared from A cDNA library generated from breast tissue of 8-month-old pregnant women is available from Clonetech (Cat. No. HL1037a) in the lambda gt-10 vector and is propagated in C600Hfl bacterial host cells. Normal and malignant breast tissue samples were isolated from a 37 year old Caucasian woman and 1 gram of each tissue was sent to Clonetech for mRNA processing and cDNA library construction. The latter two libraries were generated using both random and oligo-dT priming, to select the size of the final product, which was then cloned into a lambda ZapII vector, and the bacterial library was described as described by the manufacturer. The XL1-blue strain was grown. Additional tissue-specific cDNA libraries include human fetal brain (Stratagene, catalog number 936206), human testis (Clonetech, catalog HL3024), human thymus (Clonetech, catalog HL1127n), human brain (Clonetech, catalog HL11810), human placenta. (Clonetech, catalog 1075b), and human skeletal muscle (Clonetech, catalog HL1124b).

　該ｃＤＮＡライブラリーをＮＺＣＹＭプレート上でその宿主細胞と共に平板培養し、フィルターリフトをＭａｎｉａｔｉｓら（１９８２）におけるごとくに各プレートから二連にて作成する。候補ゲノムクローンからのインサート（ヒト）ＤＮＡを精製し、高比活性まで放射能標識した。次いで、放射能ＤＮＡを該ｃＤＮＡフィルターにハイブリダイズさせて、候補コスミドクローン内に位置する遺伝子に対応するｃＤＮＡを同定した。この方法によって同定されたｃＤＮＡを拾い、再度平板培養し、標識クローンインサートまたはそに由来するＥｃｏＲＩ断片ＤＮＡで再度スクリーニングして、それらの陽性状態を確認した。第２ラウンドのスクリーニング後に陽性であったクローンを次いで増殖させ、サザーンブロット分析および配列決定のためにそれらのＤＮＡを精製した。製造業者からのプロトコルに記載されてごとくに、ラムダファージベクターからのプラスミドのイン・ビボ切出を通じて、クローンをプラスミドとして精製するか、あるいはクローンを制限断片としてラムダファージから単離し、プラスミドベクターにサブクローン化した。平板 Plate the cDNA library with its host cells on NZCYM plates and make filter lifts from each plate in duplicate as in Maniatis et al. (1982). Insert (human) DNA from candidate genomic clones was purified and radiolabeled to high specific activity. Then, the radioactive DNA was hybridized to the cDNA filter to identify the cDNA corresponding to the gene located in the candidate cosmid clone. The cDNAs identified by this method were picked, re-plated, and screened again with the labeled clone insert or EcoRI fragment DNA derived therefrom to confirm their positive status. Clones that were positive after the second round of screening were then expanded and their DNA was purified for Southern blot analysis and sequencing. Either purify the clone as a plasmid through in vivo excision of the plasmid from the lambda phage vector, as described in the protocol from the manufacturer, or isolate the clone from lambda phage as a restriction fragment and subtype the plasmid vector. Cloned.

　サザーンブロット分析を二連で行い、１つは、元のゲノムインサートＤＮＡをプローブとして用いて、ｃＤＮＡインサーがハイブリダイズする配列を含有することを確認した。第２のブロットを最大ｃＤＮＡインサートからのｃＤＮＡインサートＤＮＡとハイブリダイズさせて、いずれのクローンが同一遺伝子を表すかを確認した。ゲノムクローンとハイブリダイズし、かつユニークであるすべてのｃＤＮＡを配列決定し、ＤＮＡ分析を行って、該配列が公知またはユニークな遺伝子を表すか否かを判断した。ユニークであるらしいすべてのｃＤＮＡクローンをさらに候補ＢＲＣＡ１遺伝子座として分析した。具体的には、該クローンをノーザーンブロットにハイブリダイズさせて、乳房特異的発現および正常−乳房腫瘍ＲＮＡにおける異なる発現を探す。また、それらをＢＲＣＡ１領域におけるクローンについてＰＣＲによって分析してそれらの位置を確認した。遺伝子座の広がりをマップするために、全長ｃＤＮＡを単離し、ＹＡＣならびに元の同一クローンの回りのおよびそれを含むクローンに対するＰＣＲプローブとしてそれらの配列を使用する。次いで、イントロン−エキソン境界をさらに配列分析により明確とした。 Southern blot analysis was performed in duplicate, and one confirmed that the cDNA insert contained a hybridizing sequence using the original genomic insert DNA as a probe. A second blot was hybridized with the cDNA insert DNA from the largest cDNA insert to determine which clone represented the same gene. All cDNAs that hybridized and were unique with the genomic clone were sequenced and DNA analysis was performed to determine if the sequence represented a known or unique gene. All cDNA clones that appeared to be unique were further analyzed as candidate BRCA1 loci. Specifically, the clones are hybridized to a Northern blot to look for breast specific expression and differential expression in normal-breast tumor RNA. They were also analyzed by PCR for clones in the BRCA1 region to confirm their location. To map the locus spread, full-length cDNAs are isolated and their sequences are used as PCR probes around the YAC and the clone containing and containing the same original clone. The intron-exon boundaries were then further defined by sequence analysis.

　我々は、当該領域におけるコスミドＢＡＣおよびＰ１クローンからのズーブロット陽性ＥｃｏＲＩ断片で、正常乳房、妊娠８ケ月の乳房および胎児脳ｃＤＮＡライブラリーをスクリーニングした。潜在的ＢＲＣＡ１　ｃＤＮＡクローンを３つのライブラリー間で同定した。クローンを拾い、再度平板培養し、元のプローブで再度スクリーニングして、それらが陽性であることを確認した。 We screened normal breast, 8 month gestational breast and fetal brain cDNA libraries with zooblot positive EcoRI fragments from cosmid BAC and P1 clones in this region. Potential BRCA1 cDNA clones were identified among the three libraries. Clones were picked, replated, and rescreened with the original probe to confirm that they were positive.

　ハイブリッド−選択ｃＤＮＡの分析
　直接選択から得られたｃＤＮＡ断片を、プローブＤＮＡに対するサザーンブロットハイブリダイゼーションによってチェックして、それらがｃｏｎｔｉｇに由来することを確認した。このテストをパスしたものをその全体について配列決定した。次いで、このようにした得られたＤＮＡ配列のセットを相互に対してチェックして、重複する独立したクローンを見いだした。例えば、クローン６９４−６５、１２４０−１および１２４０−３３が独立して得られ、引き続いて、ＥＳＴ：４８９：１と命名された同一の近接ｃＤＮＡ配列に由来することが示された。 Analysis of Hybrid-Selected cDNA cDNA fragments obtained from direct selection were checked by Southern blot hybridization to probe DNA to confirm that they were derived from contig. Those that passed this test were sequenced in their entirety. The set of DNA sequences thus obtained was then checked against each other and duplicate independent clones were found. For example, clones 694-65, 1240-1 and 1240-33 were obtained independently and were subsequently shown to be derived from the same contiguous cDNA sequence designated EST: 489: 1.

　候補クローンの分析
　前記からの候補遺伝子の１以上を配列決定し、当該情報を各発現された遺伝子の同定および分類に使用した。ＤＮＡ配列を、ヌクレオチド配列比較によって、およびすべてのフレームにおける翻訳、続いての公知のアミノ酸配列との比較によって、公知の遺伝子と比較した。これは、局所および遠隔配列データバンク（例えば、ＧｅｎＢａｎｋ）双方に対する配列比較のため、クライアント／サーバーソフトウェアパッケージ（例えば、ＢＬＡＳＴＮ　１.３.１３ＭＰ）のＧｅｎｅｔｉｃ　Ｄａｔａ　Ｅｎｖｉｒｏｎｍｅｎｔ　（ＧＤＥ）バージョン２.２ソフトウェアおよびＢａｓｉｃ　Ｌｏｃａｌ　Ａｌｉｇｎｍｅｎｔ　Ｓｅａｒｃｈ　Ｔｏｏｌ　（Ｂｌａｓｔ）シリーズを用い、Ｓｕｎ　ＳＰＡＲＣワークステーションで作動させて達成された。コスミドおよびＰ１で同定されたｃＤＮＡクローンのクレクションから再度構築した配列が得られた。新しい配列を表すすべて候補遺伝子をさらに分析して、推定ＢＲＣＡ１遺伝子座につきそれらの候補をテストした。 Analysis of Candidate Clones One or more of the candidate genes from above were sequenced and the information was used to identify and classify each expressed gene. DNA sequences were compared to known genes by nucleotide sequence comparison and by translation in all frames, followed by comparison to known amino acid sequences. This is the Genetic Data Environment (GDE) version 2.2 software and Basic software from a client / server software package (eg, BLASTN 1.3.13MP) for sequence comparisons against both local and remote sequence data banks (eg, GenBank). Achieved using the Local Alignment Search Tool (Blast) series, running on a Sun SPARC workstation. The reconstructed sequence was obtained from a collection of cDNA clones identified by cosmid and P1. All candidate genes representing the new sequence were further analyzed to test them for the putative BRCA1 locus.

　突然変異スクリーニング
　罹患血統における突然変異をスクリーニングするために、２の異なるアプローチを行った。まず、ＢＲＣＡ１の感受性対立遺伝子を担うことが知られている家族構成員から単離したゲノムＤＮＡをＰＣＲによる候補遺伝子配列の増幅用鋳型として使用した。もしＰＣＲプライマーがイントロン／エキソン境界に隣接しまたはそれと重複すると、増幅した断片はｃＤＮＡ配列から予測されるものよりも大きいか、あるいは増幅混合物には存在しないであろう。かかる増幅実験および設計したプライマーを用いたＰ１、ＢＡＣまたはコスミドクローンの配列決定を組み合わせることによって、イントロン／エキソン構造を確立し、最終的には該血統からのゲノムＤＮＡのＤＮＡ配列を得ることができる。 Mutation Screening To screen for mutations in affected pedigrees, two different approaches were taken. First, genomic DNA isolated from a family member known to carry the susceptibility allele of BRCA1 was used as a template for amplifying candidate gene sequences by PCR. If the PCR primers flank or overlap the intron / exon boundaries, the amplified fragment will be larger than expected from the cDNA sequence or will not be present in the amplification mixture. By combining such amplification experiments and sequencing of P1, BAC or cosmid clones with designed primers, an intron / exon structure can be established and ultimately the DNA sequence of genomic DNA from the pedigree can be obtained. .

　もし候補遺伝子のイントロン／エキソン構造が複雑であると、かなりより迅速である第２のアプーチは、血統リンパ球ｃＤＮＡから増幅した断片の配列決定を含む。血統血液から抽出したリンパ球ｍＲＮＡから合成したｃＤＮＡを、設計したプライマーのセットを用いるＰＣＲ増幅の基質として用いた。もし候補遺伝子がリンパ球で有意な程度発現されたならば、かかる実験は通常増幅された断片を生じ、これはイントロン／エキソン結合の知識なくして直接的に配列決定できる。と If the intron / exon structure of the candidate gene is complex, a much faster second approach involves sequencing fragments amplified from pedigree lymphocyte cDNA. CDNA synthesized from lymphocyte mRNA extracted from pedigree blood was used as a substrate for PCR amplification using the designed primer set. If the candidate gene is expressed to a significant extent in lymphocytes, such experiments usually result in amplified fragments, which can be sequenced directly without knowledge of intron / exon binding.

　かかる配列決定反応の産物をゲル電気泳動によって分析して、失欠または挿入のごとき突然変異、あるいはアミノ酸変化または他の有害効果を引き起こす塩基対置換いずれかを含有する配列における位置を決定した。産物 The products of such sequencing reactions were analyzed by gel electrophoresis to determine positions in the sequence containing mutations such as deletions or insertions, or base pair substitutions causing amino acid changes or other deleterious effects.

　乳房で発現されるＢＲＣＡ１領域内のいずれの配列もＢＲＣＡ１についての候補遺伝子であると考えられる。所与の候補遺伝子がＢＲＣＡ１に対応するという強力な証拠は、血統家族が候補の欠陥対立遺伝子を含有するという証拠に由来する。配列 Any sequence within the BRCA1 region expressed in the breast is considered a candidate gene for BRCA1. Strong evidence that a given candidate gene corresponds to BRCA1 comes from evidence that pedigree families contain the candidate defective allele.

　　　　　　　　　　　　　　　　実施例８
　ＢＲＣＡ１の同定
　ＢＲＣＡ１の同定
　いくつかの戦略を用い、Ｄ１７Ｓ１３２１およびＤ１７Ｓ１３２４間の１７ｑ２１の６００ｋｂ領域につき、転写体の詳細なマップを開発した。候補を発現する配列は：１）乳房、胎児脳、またはリンパ球ｃＤＮＡライブラリーの直接的スクリーニング、２）乳房、リンパ球または卵巣ｃＤＮＡのハイブリッド選択、または３）ゲノムＤＮＡのランダム配列決定およびＸＰＯＵＮＤ（ＴｈｏｍａｓおよびＳｋｏｌｎｉｃｋ，１９９４）によるコーディングエキソンの産生、から得られたＤＮＡ配列として定義された。多くの場合におけるこれらの発現された配列を、いくつかの独立して同定された配列からなるｃｏｎｔｉｇに組み立てた。候補遺伝子はこれらの候補発現配列のうちの１を超えるものからなってよい。この領域内の６５の候補発現配列を、ハイブリッド選択によって、ｃＤＮＡライブラリーの直接的スクリーニングによって、およびＰ１サブクローンのランダム配列決定によって同定した。転写体サイズ、ＤＮＡ配列、データベース比較、発現パターン、ゲノム構造、および最も重要には、１７ｑ−連鎖乳房および卵巣癌感受性を分離する家系からの個人におけるＤＮＡ配列分析によって発現配列を特徴付けた。 Example 8
Identification of BRCA1 Identification of BRCA1 A number of strategies were used to develop a detailed map of the transcript for the 600 kb region of 17q21 between D17S1321 and D17S1324. Sequences expressing candidates include: 1) direct screening of breast, fetal brain, or lymphocyte cDNA libraries, 2) hybrid selection of breast, lymphocyte or ovarian cDNA, or 3) random sequencing of genomic DNA and XPOUUND ( Production of coding exons by Thomas and Skolnick, 1994). These expressed sequences in many cases were assembled into a contig consisting of several independently identified sequences. Candidate genes may consist of more than one of these candidate expression sequences. 65 candidate expressed sequences within this region were identified by hybrid selection, by direct screening of a cDNA library, and by random sequencing of the P1 subclone. The expressed sequences were characterized by transcript size, DNA sequence, database comparison, expression pattern, genomic structure, and most importantly, DNA sequence analysis in individuals from kindreds segregating 17q-linked breast and ovarian cancer susceptibility.

　発現配列、１１４１：１（６４９ｂｐ）、６９４：５（２１３ｂｐ）および７５４：２（１０７９ｂｐ）の３つの独立ｃｏｎｔｉｇを単離し、結局、ＢＲＣＡ１の一部を表すことが示された。これらのｃｏｎｔｉｇについてのＥＳＴをノーザン分析用のハイブリダイゼーションプローブとして用いた場合、ほぼ７.８ｋｂの単一転写体が正常乳房ｍＲＮＡで観察され、これは、それらが単一遺伝子の異なる部分をコードすることを示唆する。乳房、胎児脳、胸腺、精巣、リンパ球および胎盤ｃＤＮＡのスクリーニングおよび乳房ｍＲＮＡでのＰＣＲ実験は、１１４１：１、６９４：５および７５４：２ｃｏｎｔｉｇを連鎖させた。胸腺、精巣および乳房ｍＲＮＡでの５’ＲＡＣＥ実験はｃｏｎｔｉｇを推定５’末端まで延長し、複合全長配列が得られた。ＰＣＲおよびＰ１の直接配列決定および当該領域におけるＢＡＣを用いて、イントロンの位置を突き止め、スプライスドナーおよびアクセプター部位の決定を可能とした。これらの３つの発現配列を単一の転写転移単位に併合し、これは最終分析でＢＴＣＡ１であることが判明した。この転写単位は６００ｋｂ領域の中心におけるＤ１７Ｓ８５５に隣接して位置決定された（図４）。 Three independent contigs of the expressed sequences, 1141: 1 (649 bp), 694: 5 (213 bp) and 754: 2 (1079 bp), were isolated and shown to eventually represent part of BRCA1. When ESTs for these contigs were used as hybridization probes for Northern analysis, a single transcript of approximately 7.8 kb was observed in normal breast mRNA, which encodes different parts of a single gene. Suggest that. Screening of breast, fetal brain, thymus, testis, lymphocyte and placental cDNA and PCR experiments with breast mRNA linked 1141: 1, 694: 5 and 754: 2 contig. 5 'RACE experiments with thymus, testis and breast mRNA extended contig to the putative 5' end, resulting in a composite full-length sequence. Direct sequencing of PCR and P1 and BACs in the region were used to locate introns and to determine splice donor and acceptor sites. These three expressed sequences were merged into a single transcriptional transfer unit, which was found to be BTCA1 by final analysis. This transcription unit was located adjacent to D17S855 at the center of the 600 kb region (FIG. 4).

　ｃＤＮＡクローンから得られた配列、ハイブリッド選択配列、および増幅されたＰＣＲ産物の組合せにより、複合全長ＢＴＣＡ１　ｃＤＮＡの構築が可能となった（配列番号：１）。ＢＲＣＡ１　ｃＤＮＡの配列（停止コドンまで）もまたＧｅｎＢａｎｋに寄託し、受託番号Ｕ−１４６８０が与えられた。この寄託配列を参照して一体化させる。３’方向に最も遠くに伸びるｃＤＮＡクローンは、ポリアデニル化シグナルに先行されるポリ（Ａ）トラクトを含有する。ｃＤＮＡの概念的翻訳により、Ｋｏｚａｋコンセンサス配列（Ｋｏｚａｋ，１９８７）に似た配列に囲まれ隣接された潜在的開始コドンと共に２０８キロダルトン（アミノ酸配列、配列番号２）の単一の長いオープンリーディングフレームが明らかとされた。Ｓｍｉｔｈ−Ｗａｔｅｒｍａｎ（ＳｍｉｔｈおよびＷａｔｅｒｍａｎ，１９８１）およびＢＬＡＳＴ（Ａｌｔｓｃｈｙｌら、１９９０）のサーチは、亜鉛−フィンガードメインに対してかなりの相同性を持つアミノ末端に近い配列を同定した（図５）。この配列は、コンセンサスＣ_３ＨＣ_４亜鉛−フィンガーモチーフに存在するシステインおよびヒスチジン残基を含有し、データベースにおける亜鉛−フィンガー蛋白質に関する多数の他の残基を共に有する。ＢＲＣＡ１遺伝子はゲノムＤＮＡの１００ｋｂを超えて配置された２３コーディングエキソンからなる（図６）。ＢＲＣＡ１　ｃＤＮＡの断片をプローブとして用いるノーザンブロットは、最も豊富には乳房、胸腺および精巣に存在し、また卵巣にも存在する約７.８ｋｂの単一転写体を同定した（図７）。４つの別にスプライスされた産物が独立したｃＤＮＡクローンで検出され；これらのうちの３つが乳房、２つが卵巣ｍＲＮＡで観察された（図６）。組織ｃＤＮＡからのＰＣＲ概観により、この遺伝子からの転写体の５’末端近くにかなりのヘテロ接合性があるという考えがさらに支持され；該ヘテロ結合性についての分子的ベースは、最初のスプライスドナー部位の異なる選択を含み、検出された変化はすべて同定された開始コドンよりも５’側の領域における転写体を改変する。我々は、この５’非翻訳領域で６つの潜在的別のスプライスドナーを検出し、最長の失欠は１，１５５ｂｐである。乳房および卵巣におけるＢＲＣＡ１蛋白質の支配的形態はエキソン４を欠く。ＢＲＣＡ１エキソン４のヌクレオチド配列を配列番号１１に示し、予測されるアミノ酸配列を配列番号１２に示す。 The combination of the sequence obtained from the cDNA clone, the hybrid selection sequence, and the amplified PCR product allowed the construction of a composite full-length BTCA1 cDNA (SEQ ID NO: 1). The sequence of the BRCA1 cDNA (up to the stop codon) has also been deposited with GenBank and given accession number U-14680. The deposited sequence is referred to and integrated. The cDNA clone that extends furthest in the 3 'direction contains a poly (A) tract preceded by a polyadenylation signal. The conceptual translation of the cDNA resulted in a single long open reading frame of 208 kilodaltons (amino acid sequence, SEQ ID NO: 2) with potential start codons flanked by sequences similar to the Kozak consensus sequence (Kozak, 1987). It was made clear. A search of Smith-Waterman (Smith and Waterman, 1981) and BLAST (Altschyl et al., 1990) identified a near amino-terminal sequence with considerable homology to the zinc-finger domain (FIG. 5). This sequence, a consensus C ₃ HC ₄ zinc - containing cysteine and histidine residues present in the finger motif, zinc in the database - having both a number of other residues regarding finger proteins. The BRCA1 gene consists of 23 coding exons located over 100 kb of genomic DNA (FIG. 6). Northern blots using a fragment of the BRCA1 cDNA as a probe identified a single transcript of approximately 7.8 kb, which was most abundantly present in the breast, thymus and testis, and also in the ovaries (FIG. 7). Four separately spliced products were detected in independent cDNA clones; three of these were found in breast and two in ovarian mRNA (FIG. 6). The PCR overview from the tissue cDNA further supports the notion that there is considerable heterozygosity near the 5 'end of the transcript from this gene; All the changes detected alter the transcript in the region 5 'to the identified start codon. We have detected six potential alternative splice donors in this 5 'untranslated region, with the longest deletion being 1,155 bp. The predominant form of BRCA1 protein in the breast and ovary lacks exon 4. The nucleotide sequence of BRCA1 exon 4 is shown in SEQ ID NO: 11, and the predicted amino acid sequence is shown in SEQ ID NO: 12.

　ＢＲＣＡ１ゲノムＤＮＡのさらなる５’配列を配列番号１３に示す。１位のＧは精巣における潜在的開始部位を表す。１４０位のＡは体細胞組織における潜在的開始部位を表す。図８に示す５’配列の６つの別のスプライス形態がある。３５６位のＧは公認された最初のスプライスドナー部位を表す。４４４位のＧは２のクローンにおける最初のスプライスドナー部位を表す（精巣１および精巣２）。８８９位におけるＧは胸腺３における最初のスプライスドナー部位を表す。第４のスプライスドナー部位は１２３０位におけるＧである。１５１３位におけるＴは前記スプライスドナーのすべてについてのスプライスアクセプター部位を表す。第５の別のスプライス形態は５９１位における最初のアクセプター部位と共に３４９位における最初のスプライスドナー部位ならぴに８８９位における第２のスプライスドナー部位および１５１３位における第２のアクセプター部位を有する。６つの別の形態がこの５’領域においてスプライスされない。１５３２位におけるＡは公認された開始部位であり、これは配列番号１の１２０位に出現する。ＢＲＣＡ１について決定された部分的ゲノムＤＮＡ配列は図１２−１９および配列番号１４−３４に示す。下方のケース文字（図１２−１９）はイントロン配列を表し、他方、上方のケース文字はエキソン配列を表す。図１２−１９においてイントロン内の不明確なインターバルはｖｖｖｖｖｖｖｖで示す。イントロン／エキソン結合は表９および１０に示す。エキソン８および１４の５’末端で見い出されたＣＡＧはいくつかのｃＤＮＡで見い出されたが、他のものでは見い出されなかった。公知の多形部位は、図１２−１９において肉太活字で示し、下線を施す。 An additional 5 'sequence of' BRCA1 genomic DNA is shown in SEQ ID NO: 13. G at position 1 represents a potential start site in the testis. A at position 140 represents a potential start site in somatic tissue. There are six alternative splice forms of the 5 'sequence shown in FIG. G at position 356 represents the first recognized splice donor site. G at position 444 represents the first splice donor site in two clones (testis 1 and testis 2). G at position 889 represents the first splice donor site in thymus 3. The fourth splice donor site is G at position 1230. T at position 1513 represents a splice acceptor site for all of the splice donors. A fifth alternative splice form has a first splice donor site at position 349 with a first splice donor site at position 591 and a second splice donor site at position 889 and a second acceptor site at position 1513. Six other forms are not spliced in this 5 'region. A at position 1532 is the recognized start site, which appears at position 120 in SEQ ID NO: 1. The partial genomic DNA sequence determined for BRCA1 is shown in FIGS. 12-19 and SEQ ID NOs: 14-34. The lower case letters (Figures 12-19) represent intron sequences, while the upper case letters represent exon sequences. In FIGS. 12-19, the undefined intervals in the intron are denoted by vvvvvvvv. Intron / exon binding is shown in Tables 9 and 10. CAG found at the 5 'end of exons 8 and 14 was found in some cDNAs, but not others. Known polymorphic sites are shown in boldface type in FIGS. 12-19 and are underlined.

　発散した系統発生的バックグラウンドの生物からのゲノムＤＮＡを亜鉛−フィンガー領域を欠くＢＲＣＡ１配列でプローブする低ストリンジェンシィブロットにより、ヒト、サル、ヒツジおよびブタで強力にハイブリダイズする断片が明らかにされ、齧歯類では非常に弱いハイブリダイゼーションシグナルが明らかとされた。この結果は、亜鉛−フィンガードメトンは別として、ＢＲＣＡ１は進化を通じて中レベルにてのみ保存されていることを示す。 Low stringency blots probing genomic DNA from divergent phylogenetic background organisms with a BRCA1 sequence lacking the zinc-finger region reveals strongly hybridizing fragments in humans, monkeys, sheep and pigs. Very weak hybridization signals were revealed in rodents. This result indicates that, apart from zinc-finger dometon, BRCA1 is only conserved at moderate levels throughout evolution.

　１７ｑ−連鎖家系における生殖細胞系ＢＲＣＡ１の突然変異
　ＢＲＣＡ１候補遺伝子についての最も厳格なテストは、乳癌および卵巣癌に対する１７ｑ−連鎖感受性を分離する家系からのキャリア個人における潜在的に破壊的な突然変異について調べることである。かかる個人は野生型配列とは異なるＢＲＣＡ１対立遺伝子を含有しなければならない。この分析で使用したＤＮＡ試料の組は８の異なるＢＲＣＡ１家系を表す個人からのＤＮＡよりなるものであった（表１１）。 Germline BRCA1 Mutations in 17q-Linked Pedigrees The most stringent test for BRCA1 candidate genes is for potentially disruptive mutations in carrier individuals from a pedigree that isolate 17q-linked susceptibility to breast and ovarian cancer. Is to find out. Such individuals must contain a different BRCA1 allele than the wild-type sequence. The set of DNA samples used in this analysis consisted of DNA from individuals representing eight different BRCA1 kindreds (Table 11).

　これらの家系における可能性（ＬＯＤ）スコアの対数値は１７ｑ２１におけるマーカーの組につき９.４９ないし−０.４４の範囲である。４の家族は連鎖につき納得のいくＬＯＤスコアを有し、４は低い正または負のＬＯＤスコアを有する。後者の家系は含めた。何故ならば、それらは少なくとも３人の罹患構成員につき染色体１７ｑ２１にて共有するハプロタイプを示すからである。さらに、該組におけるすべての家系は乳癌開始の早期年齢を示し、家系の４つは卵巣癌の少なくとも１ケースを含み、両者はＢＲＣＡ１家系の特徴である。１の家系２０８２はほとんど同等の乳癌および卵巣癌の度合いを有し、これは集団における卵巣癌が相対的に稀であることを仮定すれば異常な出現である。２つを除きすべての家系はユタ州で確認された。Ｋ２０３５は中西部からのものである。Ｋ２０９９は南米からのアフリカン−アメリカン−家系である。対 The logarithm of the likelihood (LOD) score in these families ranges from 9.49 to -0.44 for the set of markers at 17q21. Four families have a satisfactory LOD score per linkage, and four have a low positive or negative LOD score. The latter ancestry was included. Since they exhibit a haplotype shared on chromosome 17q21 for at least three affected members. Furthermore, all families in the set show early age of onset of breast cancer, four of the families include at least one case of ovarian cancer, and both are characteristic of the BRCA1 family. One kindred 2082 has almost the same degree of breast and ovarian cancer, which is an abnormal occurrence given that ovarian cancer is relatively rare in the population. All but two families have been identified in Utah. K2035 is from the Midwest. K2099 is an African-American-Family from South America.

　ＢＲＣＡ１における病気素因たる突然変異についての最初のスクリーニングにおいて、各家系における病気素因たるハプロタイプを担う１の個人からのＤＮＡをテストした。２３のコーディングエキソンおよび関連スプライス結合をゲノムＤＮＡ試料から、またはリンパ球ｍＲＮＡから調製したｃＤＮＡから増幅した。増幅したＤＮＡ配列をＤＮＡ配列を野生型配列と比較すると、８の家系試料のうち４つが配列変異体を含有することが判明した（表１２）。 In an initial screen for disease predisposing mutations in BRCA1, DNA from one individual carrying a predisposing haplotype in each kindred was tested. Twenty-three coding exons and related splice junctions were amplified from genomic DNA samples or from cDNA prepared from lymphocyte mRNA. Comparison of the amplified DNA sequence with the wild-type sequence revealed that four out of eight pedigree samples contained sequence variants (Table 12).

　すべての４つの配列変異体はヘテロ接合であり、各々は家系のうち１つでのみ出現する。家系２０８２はエキソン１１にナンセンス突然変異を含有する（図９）。家系１９１０はエキソン２０に単一のヌクレオチド挿入を含有する（図１０）。家系２０９９はエキソン２１にミスセンス突然変異を含有し、その結果、Ｍｅｔ→Ａｒｇ置換となる。フレームシフトおよびナンセンス突然変異はＢＲＣＡ１産物の機能にとって破壊的となるようである。家系１９１０におけるフレームシフト対立遺伝子によってコードされたペプチドは、野生型Ｃ−末端から１０８残基で始まる改変されたアミノ酸配列を含有する。家系１９０１におけるフレームシフト対立遺伝子によってコードされたペプチドは、野生型Ｎ−末端から２４番目の残基で始まるアミノ酸配列を含有する。家系２０８２における突然変異対立遺伝子はＣ−末端から５５１残基失う蛋白質をコードする。家系２０９９で観察されたミスセンス置換は、それが小さな疎水性アミノ酸（Ｍｅｔ）を大きな荷電残基（Ａｒｇ）によって置き換えるので、潜在的に破壊的である。また、１１の共通の多形も同定され、これは暗号配列に８つ、およびイントロンに３つである。 All four sequence variants are heterozygous, and each appears only in one of the families. Kindred 2082 contains a nonsense mutation in exon 11 (FIG. 9). Kindred 1910 contains a single nucleotide insertion at exon 20 (FIG. 10). Kindred 2099 contains a missense mutation in exon 21 resulting in a Met → Arg substitution. Frameshift and nonsense mutations appear to be disruptive to the function of the BRCA1 product. The peptide encoded by the frameshift allele in kindred 1910 contains a modified amino acid sequence beginning 108 residues from the wild-type C-terminus. The peptide encoded by the frameshift allele in kindred 1901 contains an amino acid sequence beginning with the 24th residue from the wild-type N-terminus. The mutant allele in kindred 2082 encodes a protein that loses 551 residues from the C-terminus. The missense substitution observed in pedigree 2099 is potentially destructive as it replaces small hydrophobic amino acids (Met) with large charged residues (Arg). Eleven common polymorphisms were also identified, eight in the coding sequence and three in the intron.

　家系２０３５で研究した個人は明らかにＢＲＣＡ１で調節突然変異を含有する。彼女のｃＤＮＡでは、多形部位（塩基３６６７においてＡ→Ｇ）はヘテロ接合を出現し、他方、彼女のゲノムＤＮＡはこの部位においてヘテロ接合性を明らかとした（図１１）。この観察についての可能な説明は、彼女の突然変異したＢＲＣＡ１対立遺伝子からのｍＲＮＡは、その産生または安定性に影響する突然変異のため存在しないということである。この可能性をさらにＢＲＣＡ１暗号領域における５つの多形部位を調べることによって調べ、これはＢＲＣＡ１転写体における３.５ｋｂもの多くによって分離されている。彼女のゲノムＤＮＡが多形につきヘテロ接合性を表す場合において、ｃＤＮＡはヘテロ接合性である。他の家系からのおよび家系２０３５における非ハプロタイプキャリアにえける個人において、これらの多形部位はｃＤＮＡにおけるヘテロ接合性として観察され、これは、ｃＤＮＡからの増幅が１の対立遺伝子に有利に片寄らなかったことを示す。この分析は、家系２０３５におけるＢＲＣＡ１突然変異は転写を妨げ、またはＢＲＣＡ１転写体の不安定性または異常なスプライシングを引き起こすことを示す。個人 Individuals studied in kindred 2035 clearly contain a regulatory mutation at BRCA1. In her cDNA, the polymorphic site (A → G at base 3667) appeared heterozygous, while her genomic DNA revealed heterozygosity at this site (FIG. 11). A possible explanation for this observation is that mRNA from her mutated BRCA1 allele is absent due to mutations that affect its production or stability. This possibility was further investigated by examining five polymorphic sites in the BRCA1 coding region, which were separated by as much as 3.5 kb in the BRCA1 transcript. In cases where her genomic DNA is heterozygous for the polymorphism, the cDNA is heterozygous. In individuals recruited to non-haplotype carriers from other kindreds and in kindred 2035, these polymorphic sites were observed as heterozygous in the cDNA, indicating that amplification from the cDNA did not favor one allele. Indicates that This analysis indicates that the BRCA1 mutation in kindred 2035 prevents transcription or causes instability or abnormal splicing of the BRCA1 transcript.

ＢＲＣＡ１ハプロタイプを持つＢＲＣＡ１突然変異の共分離および集団頻度分析
　蛋白質機能を潜在的に破壊する以外、２つの基準が候補病気素因突然変異としての資格を有する配列変異体で満たされなければならない。変異体は、１）病気素因ＢＲＣＡ１ハプロタイプを担う家系からの個人において存在し、家系の他の構成員では存在せず、２）一般的集団では稀であるということに合致しなければならない。 Co-segregation and population frequency analysis of BRCA1 mutations with BRCA1 haplotypes Besides potentially disrupting protein function, two criteria must be met with sequence variants that qualify as candidate disease predisposing mutations. Mutants must be consistent with being 1) present in individuals from a family carrying the predisposing BRCA1 haplotype, not present in other members of the family, and 2) rare in the general population.

　各突然変異をＢＲＣＡ１に関する共分離につきテストした。家系１９１０におけるフレームシフト突然変異については、２の他のハプロタイプキャリアおよび１の非−キャリアを配列決定した（図１０）。キャリアのみがフレームシフト突然変異を呈した。家系２０８２におけるＣからＴへの変化は新しいＡｖｒＩＩ制限部位を創製した。家系における他のキャリアおよび非−キャリアを制限部位の存在についてテストした（図９）。対立遺伝子特異的オリゴヌクレオチド（ＡＳＯ）を、家系２０９９における配列変異体の存在を検出するために設計した。該家系からのいくつかの個人、病気素因対立遺伝子に関連するハプロタイプを担うことが知られているいくらか、および関連ハプロタイプを担わないことが知られている他のものを、該家系で従前に検出されている突然変異につき、ＡＳＯによってスクリーニングした。各家系において、対応する突然変異対立遺伝子がＢＲＣＡ１−関連ハプロタイプを担う個人で検出され、非キャリアでは検出されなかった。家系２０３５からの個人で観察された潜在的調節突然変異の場合において、該家系におけるキャリアからのｃＤＮＡおよびゲノムＤＮＡを、多形部位におけるヘテロ接合性につき比較した。いずれの場合においても、ｃＤＮＡ試料における区別された対立遺伝子は、ＢＲＣＡ１病気素因対立遺伝子を担う染色体上に存在することが示された（図１１）。 Each mutation was tested for cosegregation for BRCA1. For the frameshift mutation in kindred 1910, two other haplotype carriers and one non-carrier were sequenced (FIG. 10). Only carriers exhibited frameshift mutations. The change from C to T in kindred 2082 created a new AvrII restriction site. Other carriers and non-carriers in the family were tested for the presence of restriction sites (FIG. 9). Allele-specific oligonucleotides (ASO) were designed to detect the presence of sequence variants in pedigree 2099. Some individuals from the pedigree have previously been detected in the pedigree, some known to carry the haplotype associated with the predisposition allele, and others known not to carry the associated haplotype. Mutations that have been screened by ASO. In each kindred, the corresponding mutant allele was detected in individuals carrying the BRCA1-associated haplotype, but not in non-carriers. In the case of potential regulatory mutations observed in individuals from kindred 2035, cDNA and genomic DNA from carriers in that kindred were compared for heterozygosity at polymorphic sites. In each case, the distinguished allele in the cDNA sample was shown to be on the chromosome carrying the BRCA1 disease predisposition allele (FIG. 11).

　突然変異は集団における単に共通の多形であるという可能性を排除するために、各突然変異についてのＡＳＯを用いて、正常ＤＮＡ試料の組をスクリーニングした。白人における遺伝子頻度見積もりはユタ州集団からのランダム試料に基づくものであった。アフリカン−アメリカンにおける遺伝子頻度見積もりは、彼女の連鎖研究で用いたアフリカン−アメリカンおよび２０人の新しく生まれたユタ州のアフリカン−アメリカンに由来するＭ．Ｐｅｒａｃｅｋ−Ｖａｎｃｅによって提供された３９試料に基づくものであった。４の潜在的病気素因突然変異のいずれも適当な対照集団で見いだされず、これは、それらが一般的な集団で稀であることを示す。かくして、ＢＲＣＡ１感受性対立遺伝子についての２の重要な要件は候補病気素因突然変異によって満たされた：１）病気を持つ突然変異対立遺伝子の共分離、および２）対照における突然変異対立遺伝子の不存在（これは、一般的集団における低遺伝子頻度を示す）組 A set of normal DNA samples was screened using the ASO for each mutation to exclude the possibility that the mutation was simply a common polymorphism in the population. Gene frequency estimates in Caucasians were based on random samples from the Utah population. Gene frequency estimates in African-American were derived from African Americans used in her linkage studies and M. A.M. from 20 newly born African Americans in Utah. Based on 39 samples provided by Peracek-Vance. None of the four potential disease predisposing mutations were found in the appropriate control population, indicating that they are rare in the general population. Thus, two important requirements for the BRCA1 susceptibility allele were met by the candidate disease predisposing mutation: 1) co-segregation of the mutant allele with the disease, and 2) absence of the mutant allele in the control ( This indicates a low gene frequency in the general population)

　ＢＲＣＡ１突然変異の表現型発現
　ＢＲＣＡ１蛋白質に対する該突然変異の効果はＢＲＣＡ１家系における観察された表現型発現における差異と相関した。ほとんどのＢＲＣＡ１家系は、乳癌についてのものと比較して（Ｅａｓｔｏｎら、１９９３）、中程度に増大した卵巣癌危険を有し、より小さなサブセットは卵巣癌の高い危険を有する。ＢＲＣＡ１突然変異が検出された４つの家系のうち３つが前者のカテゴリーに入り、他方、４番目（Ｋ２０８２）が高い卵巣癌危険群に入る。Ｋ２０８２で見い出されたＢＲＣＡ１ナンセンス突然変異は検出された他の突然変異よりもアミノ末端に近く位置するので、それは異なる表現型を有すると予測される。事実、家系Ｋ２０８２突然変異は高い卵巣癌可能性を有し、他の家系よりも乳癌ケースのより遅い平均診断年齢を有する（Ｇｏｌｄｇａｒら、１９９４）。開始年齢におけるこの差異は、より小さく、より高度に浸透性の（penetrant)家族における確実性の偏りによりものであるか、またはそれはＢＲＣＡ１突然変異の挙動における組織−特異的差異を反映しているものであろう。公知のＢＲＣＡ１突然変異を分離する他の３つの家系は、平均して、乳癌毎１０ケースにつき１の卵巣癌を有するが、その２０代後半または３０代前半において診断された乳癌ケースの高集団を有する。フレームシフト突然変異を有する家系１９１０は注目するに値する。何故ならば、４人の罹患固人のうち３人が両側乳癌を有し、各ケースにおいて、第２の腫瘍が最初の出現から１人以内に診断されたからである。潜在的調節ＢＲＣＡ１突然変異を分離する家系２０３５は劇的な表現型を有することが予測されよう。この家系における乳癌ケースの８０％が５０歳前に起こる。この数字は当該セットにおけるいずれとも同程度に高く、これは高い浸透性のＢＲＣＡ１突然変異対立遺伝子を示唆する（表１１）。 Phenotypic expression of the BRCA1 mutation The effect of the mutation on the BRCA1 protein correlated with the observed differences in phenotypic expression in BRCA1 kindreds. Most BRCA1 families have a moderately increased risk of ovarian cancer and a smaller subset have a higher risk of ovarian cancer compared to those for breast cancer (Easton et al., 1993). Three of the four families in which the BRCA1 mutation was detected fall into the former category, while the fourth (K2082) falls into the high ovarian cancer risk group. Since the BRCA1 nonsense mutation found in K2082 is located closer to the amino terminus than the other mutations detected, it is predicted to have a different phenotype. In fact, the family K2082 mutation has a higher likelihood of ovarian cancer and has a later average age of diagnosis of breast cancer cases than other families (Goldgar et al., 1994). This difference in onset age is due to certainty bias in smaller, more penetrant families, or that reflects tissue-specific differences in the behavior of the BRCA1 mutation Will. The other three kindreds segregating the known BRCA1 mutations have, on average, one ovarian cancer every 10 breast cancers, but have a high population of breast cancer cases diagnosed in their late 20s or early 30s. Have. Family 1910 with a frameshift mutation is notable. This is because three of the four affected individuals had bilateral breast cancer, and in each case a second tumor was diagnosed within one of the first appearance. Kindred 2035 segregating the potential regulatory BRCA1 mutation would be expected to have a dramatic phenotype. Eighty percent of breast cancer cases in this kindred occur before the age of 50. This figure is as high as any in the set, indicating a highly penetrating BRCA1 mutant allele (Table 11).

　前記突然変異は明らかに有害で、非常に若い年齢の婦人において乳癌を引き起こすが、突然変異を持つ４の家系の各々は、悪性を発病することなく８０歳まで生きた少なくとも１人の突然変異担持婦人を含む。ＢＲＣＡ１突然変異の効果を軽減し得る他の遺伝的または環境的因子を続いて突き止めるのは、該研究で最高に重要であろう。 Although the mutation is clearly harmful and causes breast cancer in very young women, each of the four families with the mutation has at least one mutation that has lived to age 80 without developing malignancy. Including women. Subsequent identification of other genetic or environmental factors that could reduce the effects of the BRCA1 mutation would be of paramount importance in the study.

　８の推定ＢＲＣＡ１−連鎖家系のうち４つにおいて、潜在的病気素因突然変異は見いだされなかった。これらの４つのうち３つは０.５５未満のＢＲＣＡ１−連鎖マーカーについてのＬＯＤスコアを有する。かくして、これらの家系は、実際は、ＢＲＣＡ１病気素因対立遺伝子を分離しないようである。あるいは、これらの４の家系における突然変異は、例えば、転写体のレベルに影響し、従って、検出を遠ざけるＢＲＣＡ１の領域に存在するらしい。 No potential disease-predisposing mutations were found in four of the $ 8 putative BRCA1-linked families. Three of these four have LOD scores for BRCA1-linked markers of less than 0.55. Thus, these families do not appear to actually segregate the BRCA1 disease predisposition allele. Alternatively, mutations in these four kindreds, for example, appear to be present in regions of BRCA1 that affect transcript levels and thus divert detection.

　癌におけるＢＲＣＡ１の役割
　現在同定されているほとんどの腫瘍サプレッサー遺伝子は、存在しない、非機能的または機能が低下した蛋白質産物を生じる。ＴＰ５３突然変異の大部分はミスセンスであり；これらのうちいくつかは、野生型産物の機能に干渉する異常ｐ５３分子を生産することが示されている（Shaulianら、1992;Srivastavaら,1993)。同様の優性な陰性の作用メカニズムが、切形分子を生産するいくつかの腺腫ポリーブ症コリ（ｃｏｌｉ）（ＡＰＣ）対立遺伝子につき（Ｓｕら、１９９３）、および蛋白質のＤＮＡ結合を改変するＷｉｌｍｓの腫瘍遺伝子（ＷＴ１）における点突然変異につき（Ｌｉｔｔｌｅら、１９９３）提案されている。ＢＲＣＡ１暗号配列で観察された突然変異の性質は優性陰性蛋白質または非機能的蛋白質の生産に一致する。家系２０３５で推定された調節突然変異は優性陰性ではありえない；むしろ、この突然変異は影響された対立遺伝子からのＢＲＣＡ１発現の低下または完全な喪失を引き起こすようである。 Role of BRCA1 in Cancer Most currently identified tumor suppressor genes result in non-existent, non-functional or impaired protein products. Most of the TP53 mutations are missense; some of them have been shown to produce abnormal p53 molecules that interfere with the function of the wild-type product (Shaulian et al., 1992; Srivastava et al., 1993). A similar dominant negative mechanism of action is for several adenoma polybosis coli (APC) alleles producing truncated molecules (Su et al., 1993), and Wilms' tumor that alters DNA binding of proteins A point mutation in the gene (WT1) has been proposed (Little et al., 1993). The nature of the mutation observed in the BRCA1 coding sequence is consistent with the production of a dominant negative or non-functional protein. The putative regulatory mutation in kindred 2035 cannot be dominant negative; rather, this mutation appears to cause a reduction or complete loss of BRCA1 expression from the affected allele.

　ＢＲＣＡ１蛋白質は、多数のＤＮＡ結合蛋白質で見い出された、核酸への亜鉛−依存性結合と深く結び付いたものと類似の、Ｃ_３ＨＣ_４亜鉛−フィンガードメインを含有する。ＢＲＣＡ１の最初の１８０アミノ酸は酸性残基よりも５個多い塩基性残基を含有する。対照的に、分子の残りは非常に酸性で、７０個の酸性残基が正味に過剰である。過剰の負電荷はＣ−末端近くに特に集中している。かくして、１の可能性は、ＢＲＣＡ１がＮ−末端ＤＮＡ結合ドメインおよびＣ−末端トランス活性化「酸性ブロブ（ｂｌｏｂ）」ドメインと共に転写因子をコードするということである。興味深いことには、もう１つの家族性腫瘍サプレッサー遺伝子、ＷＴ１、も亜鉛−フィンガーモチーフを含有する（Ｈａｂｅｒら、１９９０）。ＷＴ１における多くの癌病気素因突然変異は亜鉛−フィンガードメインを改変する（Ｌｉｔｔｌｅら、１９９３；Ｈａｂｅｒら、１９９０；Ｌｉｔｔｌｅら、１９９２）。ＷＴ１は、転写因子、およびＷＴ１のＤＮＡ結合特性を改変する亜鉛−フィンガードメインの一部をコードするエキソンの別のスプライシングをコードする（Ｂｉｃｋｍｏｒｅら、１９９２）。ＷＴ１　ｍＲＮＡの別にスプライスされたいくつかの形態は転写リプレッサーとして作用する分子を創製する（Ｄｒｕｍｍｏｎｄら、１９９４）。いくつかのＢＲＣＡ１スプライシング変異体は亜鉛−フィンガーモチーフを改変し、ＷＴ１で起こるのに類似の調節メカニズムがＢＲＣＡ１に適用できるという可能性を生じる。 BRCA1 protein was found in a number of DNA-binding proteins, zinc to nucleic acids - similar to that deeply as dependent binding, C ₃ HC ₄ zinc - containing finger domain. The first 180 amino acids of BRCA1 contain five more basic residues than acidic residues. In contrast, the rest of the molecule is very acidic, with a net excess of 70 acidic residues. The excess negative charge is particularly concentrated near the C-terminus. Thus, one possibility is that BRCA1 encodes a transcription factor with an N-terminal DNA binding domain and a C-terminal transactivating "acid blob" domain. Interestingly, another familial tumor suppressor gene, WT1, also contains a zinc-finger motif (Haber et al., 1990). Many cancer predisposition mutations in WT1 alter the zinc-finger domain (Little et al., 1993; Haber et al., 1990; Little et al., 1992). WT1 encodes an alternative splicing exon that encodes a transcription factor and part of the zinc-finger domain that alters the DNA binding properties of WT1 (Bickmore et al., 1992). Some alternatively spliced forms of WT1 mRNA create molecules that act as transcriptional repressors (Drummond et al., 1994). Some BRCA1 splice variants alter the zinc-finger motif, raising the possibility that a similar regulatory mechanism as occurs in WT1 could be applied to BRCA1.

　　　　　　　　　　　　　　　　実施例９
　ＢＲＣＡ１突然変異についての腫瘍の分析
　最もＢＲＣＡ１突然変異を含有するらしい腫瘍についての分析に焦点を当てるため、初代乳癌および卵巣癌をＢＲＣＡ１領域におけるＬＯＨにつきタイプ分けした。３つの高度に多形の単純縦列反復マーカーを用いてＬＯＨ：Ｄ１７Ｓ１３２３およびＤ１７Ｓ８５５（これは、ＢＲＣＡ１の遺伝子内である）、およびＤ１７Ｓ１３２７（これは、ＢＲＣＡ１に対してほぼ１００ｋｂ末端側にある）をアクセスした。情報的ケース（すなわち、生殖細胞系がヘテロ接合性である）における合計したＬＯＨ頻度は乳癌につき３２／７２（４４％）、卵巣癌につき１２／２１（５７％）であり、当該領域におけるＬＯＨの従前の測定に一致する（Ｆｕｔｒｅａｌら、１９９２ｂ；Ｊａｃｏｂｓら、１９９３；Ｓａｔｏら、１９９０；Ｅｃｃｌｅｓら、１９９０；Ｃｒｏｐｐら、１９９４）。かくして、分析により、混血人種の３２の乳房腫瘍および１２の卵巣腫瘍のパネルおよびＢＲＣＡ突然変異につき調べるべき開始年齢が定義された。一本鎖コンフォメーション分析（ＳＳＣＡ）および直接配列決定の組合せによって、該遺伝子の完全な５，５８９ｂｐ暗号領域およびイントロン／エキソン境界配列をこの腫瘍セットでスクリーニングした。 Example 9
Analysis of Tumors for BRCA1 Mutations To focus on the analysis for tumors that most likely contain the BRCA1 mutation, primary breast and ovarian cancers were typed for LOH in the BRCA1 region. Access LOH: D17S1323 and D17S855 (which is within the gene for BRCA1) and D17S1327 (which is approximately 100 kb distal to BRCA1) using three highly polymorphic simple tandem repeat markers. did. The total LOH frequency in the informative case (ie, the germline is heterozygous) was 32/72 (44%) for breast cancer and 12/21 (57%) for ovarian cancer, and the LOH Consistent with previous measurements (Futreal et al., 1992b; Jacobs et al., 1993; Sato et al., 1990; Eccles et al., 1990; Cropp et al., 1994). Thus, the analysis defined a panel of 32 breast and 12 ovarian tumors of mixed race and the starting age to be examined for BRCA mutations. The complete 5,589 bp coding region of the gene and intron / exon border sequences were screened in this tumor set by a combination of single-stranded conformational analysis (SSCA) and direct sequencing.

　合計６の突然変異（そのうち２つが同一）が見い出され、１つが卵巣腫瘍におけるもの、４つが乳房腫瘍におけるもの、１つが男性の非罹患ハプロタイプキャリアにおけるものであった（表１３）。１の突然変異Ｇｌｕ１５４１Ｔｅｒは、３２３個のアミノ酸を失った切形蛋白質を生じるであろう停止コドンをカルボキシル末端に導入した。加えて、２のミスセンス突然変異が同定された。これらはＡｌａ１７０８ＧｌｕおよびＭｅｔ１７７５Ａｒｇであって、荷電残基による小さな疎水性残基の置換を含む。患者１７７６４および１９９６４は同一家族からのものである。患者ＯＶ２４において、ヌクレオチド２５７５は失欠され、患者１７７６４および１９９６４においてヌクレオチド２９９３−２９９６は失欠されている。 A total of 6 mutations (two of which are identical) were found, one in ovarian tumors, four in breast tumors and one in male unaffected haplotype carriers (Table 13). One mutant Glu1541 Ter introduced a stop codon at the carboxyl terminus that would result in a truncated protein missing 323 amino acids. In addition, two missense mutations were identified. These are Ala1708Glu and Met1775Arg, which involve the replacement of small hydrophobic residues by charged residues. Patients 17764 and 19964 are from the same family. In patient OV24, nucleotide 2575 is missing and in patients 17764 and 19964 nucleotides 2993-2996 are missing.

　いくつかの系の証拠は、すべての５の突然変異はＢＲＣＡ１感受性対立遺伝子を表すことを示唆する。
　（ｉ）すべての突然変異は生殖細胞系に存在する；
　（ii）すべては、適当な対照集団に不存在で、それらは共通の多形ではないことを示唆する；
　（iii）ＢＲＣＡ１感受性対立遺伝子を分離する家系に属する患者からの腫瘍にも当てはまるが（Ｓｍｉｔｈら、１９９２；Ｋｅｌｓｅｌｌら、１９９３）（もし突然変異が中性多形を表すと、それらはケースの５０％でのみ保持されるべきである）、各突然変異対立遺伝子は腫瘍で保有される；
　（iv）突然変異を持つ４つの乳癌ケースにおける開始年齢は２４歳と４２歳の間で変化し、ＢＲＣＡ１を持つ個人における乳癌の早期開始年齢と合致する；同様に、卵巣癌ケースは４４歳で診断され、これはすべての卵巣癌の最も若い１３％に入る；および最後に、
　（ｖ）腫瘍の組はこの基準に関して選択されなかったにも拘わらず、５ケースのうち３つは、過去にさかのぼるとそれらの医学記録で見いだされる乳癌および卵巣癌の陽性家族歴史を有する。 Several lines of evidence suggest that all five mutations represent a BRCA1 sensitive allele.
(I) all mutations are in the germline;
(Ii) all are absent from the appropriate control population, suggesting that they are not common polymorphs;
(Iii) also applies to tumors from patients belonging to kindreds segregating the BRCA1 sensitive allele (Smith et al., 1992; Kelcell et al., 1993) (if the mutations represent a neutral polymorphism, they are 50% of cases). %), Each mutant allele is carried in tumors;
(Iv) The age of onset in the four breast cancer cases with mutations varies between 24 and 42 years, consistent with the early onset of breast cancer in individuals with BRCA1; Diagnosed, which falls into the youngest 13% of all ovarian cancers; and finally,
(V) Despite the tumor set not being selected for this criterion, three of the five cases have a positive family history of breast and ovarian cancer found in their medical records as far back as the past.

　ＢＴ１０６は２４歳で乳癌と診断された。彼女の母親は卵巣癌を有し、彼女の父親は黒色腫を有し、彼女の父方祖母もまた乳癌を有した。患者ＭＣ４４（アフリカン−アメリカン）は４２歳で両側乳癌を有した。この患者は３４歳で乳癌で死亡した姉妹、リンパ腫で死亡したもう１人の姉妹、および肺癌で死亡した兄弟を有した。彼女の突然変異（Ｍｅｔ１７７５Ａｒｇ）は以前家系２０９９（ＢＲＣＡ１感受性対立遺伝子を分離し、アフリカン−アメリカンおよび白人対照では不存在であるアフリカン−アメリカン）で検出されている。我々の知識では、患者ＭＣ４４は家系２０９９に関連しない。稀な突然変異対立遺伝子の検出（ＢＲＣＡ１家系で１回および明らかに無関係の早期開始乳癌ケースで１回）は、Ｍｅｔ１７７５Ａｒｇ変化はアフリカン−アメリカンで共通の病気素因であろうことを示唆する。総合すると、これらの観察は腫瘍におけるすべての４つのＢＲＣＡ１突然変異は感受性対立遺伝子を表し；体細胞突然変異は分析した試料で検出されなかった。 BT106 was diagnosed with breast cancer at the age of 24. Her mother had ovarian cancer, her father had melanoma, and her paternal grandmother also had breast cancer. Patient MC44 (African-American) was 42 years old and had bilateral breast cancer. This patient had a sister who died of breast cancer at the age of 34, another sister who died of lymphoma, and a brother who died of lung cancer. Her mutation (Met1775Arg) has previously been detected in kindred 2099 (African-American, which segregates the BRCA1 sensitive allele and is absent in African-American and Caucasian controls). To our knowledge, patient MC44 is not associated with family 2099. Detection of rare mutant alleles (once in BRCA1 kindreds and once in apparently unrelated early onset breast cancer cases) suggests that Met1775Arg alterations may be a common disease predisposition in African-American. Taken together, these observations indicated that all four BRCA1 mutations in the tumor represented susceptibility alleles; no somatic mutations were detected in the samples analyzed.

　体細胞ＢＲＣＡ１突然変異の数の少なさは、１７ｑについてのＬＯＨの頻度および癌進行における腫瘍サプレッサーとしての感受性遺伝子の通常の役割を仮定すれば、予測されるものではなかった。この結果については３つの可能な説明がある：（ｉ）我々のスクリーニング手法によると暗号配列においていくつかのＢＲＣＡ１突然変異が失われていた；（ii）ＢＲＣＡ１体細胞突然変異は主としてコーディングエキソンの外側にある；および（iii）１７ｑにおけるＬＯＨ事象はＢＲＣＡ１体細胞突然変異を反映しない。少 The low number of somatic BRCA1 mutations was not expected given the frequency of LOH for 17q and the normal role of susceptibility genes as tumor suppressors in cancer progression. There are three possible explanations for this result: (i) some BRCA1 mutations were missing in the coding sequence according to our screening approach; (ii) BRCA1 somatic mutations were mainly outside of the coding exons. And (iii) the LOH event at 17q does not reflect a BRCA1 somatic mutation.

　もし体細胞ＢＲＣＡ１突然変異が乳癌および卵巣癌で真に稀であれば、これはＢＲＣＡ１の生物学について強力な密接関係を有するであろう。体細胞ＢＲＣＡ１突然変異の明らかな欠如は、一般的な集団における腫瘍と比較して、遺伝的に病気素因のＢＲＣＡ１キャリアにおる腫瘍の発生においていくつかの基本的差異があるであろうことを含蓄する。例えば、ＢＲＣＡ１における突然変異は乳癌および卵巣発病における特定の早期段階において腫瘍形成に対してのみ効果を有し得る。この確率は閉経期前乳癌におけるＢＲＣＡ１についての主要機能と一致する。乳癌および卵巣癌におけるＢＲＣＡ１の役割についてのかかるモデルは、生殖ホルモンとＢＲＣＡ１機能との間の相互作用を予測させる。しかしながら、家族性−散発性の乳癌および卵巣癌の臨床的もしくは病理学的差異（開始年齢以外）は記載されていない（Lynchら、1990)。他方、乳癌の家族履歴を持つ患者からの乳癌における増大したＴＰ５３突然変異および微小付随体の不安定性の最近の知見（Ｇｌｅｂｏｖら、１９９４）は病気素因個人で遺伝的に生気する腫瘍のいくつらかの差異を反映するであろう。今や、この現象におけるＢＲＣＡ１の関与は直接的に扱える。あるいは、体細胞ＢＲＣＡ１突然変異の欠如は、ＢＲＣＡ１と同一の腫瘍抑制経路で機能するが、総合すると散発性腫瘍における突然変異についてのより都合よい標的を表す多数の遺伝子の存在に由来するであろう。遺伝経路における単一要素の突然変異は一般に該経路を破壊するのに十分であるので、ＢＲＣＡ１は他の要素の突然変異速度の合計よりもかなり低い速度で突然変異するであろう。であれば If somatic BRCA1 mutations are truly rare in breast and ovarian cancers, this will have a strong implication for BRCA1 biology. The apparent absence of somatic BRCA1 mutations implies that there may be some fundamental differences in the development of tumors in genetically predisposed BRCA1 carriers as compared to tumors in the general population. I do. For example, mutations in BRCA1 may only have an effect on tumor formation at certain early stages in breast and ovarian pathogenesis. This probability is consistent with a major function for BRCA1 in premenopausal breast cancer. Such a model for the role of BRCA1 in breast and ovarian cancer predicts the interaction between reproductive hormones and BRCA1 function. However, no clinical or pathological differences (other than age of onset) of familial-sporadic breast and ovarian cancers have been described (Lynch et al., 1990). On the other hand, recent findings of increased TP53 mutations and micro-accompanying instability in breast cancer from patients with a family history of breast cancer (Glevov et al., 1994) indicate that some of the tumors genetically live in disease predisposing individuals Will reflect the differences. Now, the involvement of BRCA1 in this phenomenon can be addressed directly. Alternatively, the lack of somatic BRCA1 mutations may result from the presence of multiple genes that function in the same tumor suppressor pathway as BRCA1 but collectively represent a more favorable target for mutations in sporadic tumors. . Since a single element mutation in the genetic pathway is generally sufficient to disrupt the pathway, BRCA1 will mutate at a rate much lower than the sum of the mutation rates of the other elements.

　　　　　　　　　　　　　　　実施例１０
　ＢＲＣＡ１遺伝子の分析
　ＢＲＣＡ１遺伝子の構造および機能は以下の方法によって測定される。
　生物学的研究
　ＢＲＣＡ１　ｃＤＮＡを含有する哺乳動物発現ベクターを構築し、該遺伝子中に損傷を持つ適当な乳癌細胞にトランスフェクトする。野生型ＢＲＣＡ１　ｃＤＮＡならびに改変したＢＲＣＡ１　ｃＤＮＡを用いる。該改変したＢＲＣＡ１　ｃＤＮＡは改変したＢＲＣＡ１対立遺伝子から得ることができるか、あるいは後記するごとくに産生できる。培養における表現型復帰（例えば、細胞形態、倍加時間、足場依存性増殖）および動物における表現型復帰（例えば、腫瘍形成性）を調べる。研究では当該遺伝子の野生型および突然変異体形（セクションＢ）を共に使用する。 Example 10
Analysis of BRCA1 gene The structure and function of the BRCA1 gene are measured by the following method.
Biological studies Mammalian expression vectors containing the BRCA1 cDNA are constructed and transfected into appropriate breast cancer cells that have a defect in the gene. The wild-type BRCA1 cDNA as well as the modified BRCA1 cDNA are used. The modified BRCA1 cDNA can be obtained from a modified BRCA1 allele or can be produced as described below. The phenotypic reversion in culture (eg, cell morphology, doubling time, anchorage-dependent growth) and the phenotype reversion in animals (eg, tumorigenicity) are examined. The study uses both wild-type and mutant forms of the gene (Section B).

　分子遺伝学研究
　イン・ビトロ突然変異誘発を行って、（個人コドンにおける単一塩基対置換およびクラスター電荷→アラニン走査突然変異誘発によって）失欠突然変異体およびミスセンス突然変異体を構築する。該突然変異体を生物学的、生物化学的および生物物理学的研究で用いる。 Molecular Genetics Studies In vitro mutagenesis is performed to construct absent and missense mutants (by single base pair substitution at individual codons and cluster charge → alanine scanning mutagenesis). The mutant is used in biological, biochemical and biophysical studies.

　メカニズム研究
　ＢＲＣＡ１蛋白質が公知および未公知ＤＮＡ配列に結合する能力を調べる。プロモーターをトランス活性化するその能力は、哺乳動物細胞における一時的レポーター発現系によって分析する。粒子−捕獲および酵母の２−ハイブリッド系のごとき通常の手法を用いていずれの機能的パートナーも見つけ同定する。該パートナーの性質および機能を特徴付ける。これらのパートナーは薬物発見用の標的である。 Mechanism studies The ability of the BRCA1 protein to bind to known and unknown DNA sequences is examined. Its ability to transactivate a promoter is analyzed by a transient reporter expression system in mammalian cells. Any functional partner is found and identified using conventional techniques, such as a particle-capture and yeast two-hybrid system. Characterize the nature and function of the partner. These partners are targets for drug discovery.

　構造研究
　組換え蛋白質をイー・コリ（Ｅ．ｃｏｌｉ）、酵母、昆虫および／または哺乳動物細胞で産生させ、結晶学およびＮＭＲ実験で使用する。蛋白質の分子作成も使用する。これらの研究は構造から導かれる薬物設計を容易とする。 Structural studies Recombinant proteins are produced in E. coli, yeast, insect and / or mammalian cells and used in crystallography and NMR experiments. It also uses protein molecule making. These studies facilitate structure-driven drug design.

　　　　　　　　　　　　　　　実施例１１
　試料中におけるＢＲＣＡ１の存在を検出するための２工程アッセイ
　Ａｎｔｏｎａｒａｋｉｓら（１９８５）によって開示されている方法に従って患者試料を加工し、１％アガロースゲルを通して分離し、サザーンブロット分析用にナイロン膜に移す。ＧＳ　Ｇｅｎｅリンカー（Ｂｉｏ−Ｒａｄ）を用い、膜を１５０ｍＪでＵＶ架橋させる。配列番号１のヌクレオチド３６３１−３９３０位に対応するＢＲＣＡ１プローブをｐＴＺ１８Ｕにサブクローンする。Ｍ１３ＫＯ７ヘルパーファージ（Ｂｉｏ−Ｒａｄ，Ｒｉｃｈｍｏｎｄ，ＣＡ）で感染させたイー・コリ（Ｅ．ｃｏｌｉ）ＭＶ１１９０にファゲミド（ｐｈａｇｅｍｉｄｅ）を形質転換する。一本鎖ＤＮＡを標準的な手法（Ｓａｍｂｒｏｏｋら、１９８９参照）により単離する。 Example 11
Two-Step Assay for Detecting the Presence of BRCA1 in a Sample Patient samples are processed according to the method disclosed by Antonarakis et al. (1985), separated through a 1% agarose gel, and transferred to a nylon membrane for Southern blot analysis. The membrane is UV cross-linked at 150 mJ using a GS Gene linker (Bio-Rad). The BRCA1 probe corresponding to nucleotide positions 3631-3930 of SEQ ID NO: 1 is subcloned into pTZ18U. E. coli MV1190 infected with M13KO7 helper phage (Bio-Rad, Richmond, CA) is transformed with phagemid. Single-stranded DNA is isolated by standard techniques (see Sambrook et al., 1989).

　０．５Ｍ　ＮａＰＯ_４中の７％ドデシル硫酸ナトリウム（ＳＤＳ）中、６５℃にて、ブロットを１４−３０分間プレハイブリダイズさせる。該方法はＮｇｕｙｅｎら、１９９２に記載されているものに従う。該ブロットを、２５−５０ｍｇ／ｍｌ一本鎖プローブＤＮＡを含む７％ＳＤＳ、０．５Ｍ　ＮａＰＯ_４中、６５℃で一晩ハイブリダイズさせる。ポスト−ハイブリダイゼーション洗液は６５℃における５％ＳＤＳ、４０ｍＭ　ＮａＰＯ_４中の２回の３０分間洗液であり、続いて６５℃における２回の３０分間の１％ＳＤＳ、４０ｍＭ　ＮａＰＯ_４洗液よりなる。 Blots are prehybridized in 7% sodium dodecyl sulfate (SDS) in 0.5 M NaPO ₄ at 65 ° C for 14-30 minutes. The method follows that described in Nguyen et al., 1992. The blot is hybridized overnight at 65 ° C. in 7% SDS, 0.5 M NaPO ₄ containing 25-50 mg / ml single-stranded probe DNA. The post-hybridization wash was two 30 minute washes in 5% SDS, 40 mM NaPO ₄ at 65 ° C., followed by two 30 minute 1% SDS, 40 mM NaPO ₄ washes at 65 ° C. Become.

　次いで、該ブロットを室温にてリン酸緩衝生理食塩水（ｐＨ６.８）で５分間すすぎ、室温にてＰＢＳ中の０.２％カゼインと共に３０−６０分間インキュベートし、ＰＢＳ中で５分間すすぐ。次いで、該ブロットを、６Ｍ尿素、０.３Ｍ　ブロット The blot is then rinsed with phosphate buffered saline (pH 6.8) for 5 minutes at room temperature, incubated with 0.2% casein in PBS for 30-60 minutes at room temperature, and rinsed for 5 minutes in PBS. The blot was then purified with 6M urea, 0.3M.

　ＮａＣｌおよび５×Ｄｅｎｈａｒｄｔ’ｓ溶液（Ｓａｍｂｒｏｏｋら、１９８９参照）よりなるハイブリダイゼーション緩衝液と共に、４５℃にて、震盪する水浴中で５−１０分間プレインキュベートする。緩衝液を除去し、５０−７５μｌ／ｃｍ^２の新鮮なハイブリダイゼーション緩衝液＋共有結合架橋したオリゴヌクレオチド−アルカリ性フォスファターゼの、ユニバートルプライマー部位（ＵＰ−ＡＰ、Ｂｉｏ−Ｒａｄ）と相補的なヌクレオチド配列とのコンジュゲートの２.５　ｎＭで置き換える。該ブロットを４５℃で２０−３０分間ハイブリダイズさせ、ポストハイブリダイゼーション洗液を、４５℃にて、２回の６Ｍ尿素中１０分間洗液、１×標準クエン加生理食塩水（ＳＳＣ）、０.１％ＳＤＳおよび１×ＳＳＣ、０.１％トリトンＸ−１００中の１回洗液としてインキョベートする。該ブロットを室温で１×ＳＳＣと共に１０分間すすぐ。 Preincubate with a hybridization buffer consisting of NaCl and 5 × Denhardt's solution (see Sambrook et al., 1989) at 45 ° C. in a shaking water bath for 5-10 minutes. The buffer was removed and the nucleotide sequence complementary to the universal primer site (UP-AP, Bio-Rad) of 50-75 μl / cm ² of fresh hybridization buffer + covalently cross-linked oligonucleotide-alkaline phosphatase With 2.5 nM of the conjugate. The blot was hybridized at 45 ° C. for 20-30 minutes, and the post-hybridization wash was washed twice at 45 ° C. for 10 minutes in 6 M urea, 1 × standard quenched saline (SSC), Incubate as a single wash in 1% SDS and 1 × SSC, 0.1% Triton X-100. The blot is rinsed for 10 minutes with 1 × SSC at room temperature.

　０.１Ｍジエタノールアミン、１ｍＭ　ＭｇＣｌ_２、０.０２％アジ化ナトリウム、ｐＨ１０.０からなる基質緩衝液中で震盪しつつ、ブロットを室温で１０分間インキョベートする。基質緩衝液および０.２ｍＭ　ＡＭＰＰＤ（３−（２’−スピロアダマンタン）−４−メトキシ−４−（３’−ホスホリルオキシ）フェニル−１，２−ジオキセタン、二ナトリウム塩、Ｂｉｏ−Ｒａｄ）と共に個々のブロットをヒートシール可能なバッグに入れる。震盪しつつの室温での２０分のインキュベーション後、過剰のＡＭＰＰＤ溶液を除去する。該ブロットをＸ−線に一晩暴露する。陽性バンドはＢＲＣＡ１の存在を示す。 The blot is incubated for 10 minutes at room temperature with shaking in a substrate buffer consisting of 0.1 M diethanolamine, 1 mM MgCl ₂ , 0.02% sodium azide, pH 10.0. Individually with substrate buffer and 0.2 mM AMPPD (3- (2'-spiroadamantane) -4-methoxy-4- (3'-phosphoryloxy) phenyl-1,2-dioxetane, disodium salt, Bio-Rad) Put the blots in a heat-sealable bag. After a 20 minute incubation at room temperature with shaking, the excess AMPPD solution is removed. The blot is exposed to X-rays overnight. A positive band indicates the presence of BRCA1.

　　　　　　　　　　　　　　　実施例１２
　ＢＲＣＡ１に対するポリクローナル抗体の作製
　ＢＲＣＡ１暗号配列のセグメントをイー・コリ中の融合蛋白質として発現させた。過剰に生産された蛋白質をゲル溶出によって精製し、これを用いて、ＨａｒｌｏｗおよびＬａｎｅ、１９８８によって記載されているものと同様の手法を用い、ウサギおよびマウスを免疫化した。この手法は種々の他の蛋白質に対してＡｂｓを生じることが示されている（例えば、Ｋｒａｅｍｅｒら、１９９３）。 Example 12
Preparation of Polyclonal Antibodies to BRCA1 A segment of the BRCA1 coding sequence was expressed as a fusion protein in E. coli. The overproduced protein was purified by gel elution and used to immunize rabbits and mice using a procedure similar to that described by Harlow and Lane, 1988. This approach has been shown to generate Abs for a variety of other proteins (eg, Kraemer et al., 1993).

　略言すれば、ＢＲＣＡ１暗号配列のストレッチをプラスミドＰＥＴ５Ａ（Ｎｏｖａｇｅｎ，Ｉｎｃ．，Ｍａｄｉｓｏｎ，ＷＩ）中の融合蛋白質としてクローン化した。ＢＲＣＡ１を組み込んだ配列は配列番号２の＃１３６１−１５５４に対応するアミノ酸を含む。ＩＰＴＧでの誘導の後、予測される分子量を持つ融合蛋白質の過剰生産を、ＳＤＳ／ＰＡＧＥによって確認した。融合蛋白質は電気溶出によってゲルから精製した。ＢＲＣＡ１融合産物としての蛋白質の同定は、Ｎ−末端における蛋白質配列決定によって確認した。次いで、該精製した蛋白質をウキザにおける免疫原として使用した。ウサギをフロイントの完全なアジュバント中の１００μｇ蛋白質で免疫化し、３週間隔で２回（最初、フロイントの不完全アジュバント中の免疫原１００μｇで、続いてＰＢＳ中の免疫原１００μｇ）追加免疫した。しかる後、血清を含有する抗体を２週間収集する。ストレッチ Briefly, a stretch of the BRCA1 coding sequence was cloned as a fusion protein in plasmid PET5A (Novagen, Inc., Madison, WI). The sequence incorporating BRCA1 contains the amino acid corresponding to # 1361-1554 of SEQ ID NO: 2. After induction with IPTG, overproduction of the fusion protein with the expected molecular weight was confirmed by SDS / PAGE. The fusion protein was purified from the gel by electroelution. Identification of the protein as a BRCA1 fusion product was confirmed by protein sequencing at the N-terminus. The purified protein was then used as an immunogen in Ukiza. Rabbits were immunized with 100 μg protein in Freund's complete adjuvant and boosted twice at three week intervals (first with 100 μg of immunogen in Freund's incomplete adjuvant, followed by 100 μg of immunogen in PBS). Thereafter, antibodies containing serum are collected for two weeks.

　この手法を反復して、ＢＲＣＡ１遺伝子の突然変異体形に対する抗体を得る。野生型ＢＲＣＡ１に対する抗体と組み合わせて、これらの抗体を用いて種々の組織および生物学的流体中の突然変異体形の存在および相対的レベルを検出する。 Repeat this procedure to obtain antibodies against mutant forms of the BRCA1 gene. In combination with antibodies to wild-type BRCA1, these antibodies are used to detect the presence and relative levels of mutant forms in various tissues and biological fluids.

　　　　　　　　　　　　　　　実施例１３
　ＢＲＣＡ１に特異的なモノクローナル抗体の作製
　以下のプロトコルに従ってモノクローナル抗体を作製する。よく知られているごとく、グルタルアルデヒドまたはＥＤＣを用い、キーホールリンペットヘモシアニンにコンジュゲートした無傷ＢＲＣＡ１またはＢＲＣＡ１ペプチド（野生型または突然変異体）からなる免疫原でマウスを免疫化する。 Example 13
Preparation of Monoclonal Antibody Specific to BRCA1 A monoclonal antibody is prepared according to the following protocol. As is well known, mice are immunized with glutaraldehyde or EDC with an immunogen consisting of intact BRCA1 or BRCA1 peptide (wild-type or mutant) conjugated to keyhole limpet hemocyanin.

　該免疫原をアジュバントと混合する。各マウスに免疫原１０ないし１００μｇの４回の注射を摂取させ、第４回目の注射の後、血液試料をマウスから採取して、該血清が免疫原に対する抗体を含有するか否かを判断する。血清力価をＥＬＩＳＡまたはＲＩＡによって測定する。免疫原に対する抗体の存在を示す血清を持つマウスをハイブリドーマ作製のために選択する。混合 Mix the immunogen with an adjuvant. Each mouse receives four injections of 10-100 μg of immunogen, and after the fourth injection, a blood sample is taken from the mouse to determine whether the serum contains antibodies to the immunogen. . Serum titers are measured by ELISA or RIA. Mice with sera indicating the presence of antibodies to the immunogen are selected for hybridoma generation.

　免疫マウスから脾臓を摘出し、単細胞懸濁液を調製する（ＨａｒｌｏｗおよびＬａｎｅ、１９８８参照）。細胞融合は実質的にＫｏｈｌｅｒおよびＭｉｌｓｔｅｉｎ、１９７５によって記載されているごとくに行う。略言すれば、ＨａｒｌｏｗｅおよびＬａｎｅ、１９８８によって記載されているようにポリエチレングリコールを用い、Ｐ３.６５.３骨髄腫細胞（Ａｍｅｒｉｃａｎ　Ｔｙｐｅ　Ｃｕｌｔｕｒｅ　Ｃｏｌｌｅｃｔｉｏｎ，Ｒｏｃｋｖｉｌｌｅ，ＭＤ）を免疫脾臓細胞と融合させる。細胞を９６ウェル組織培養プレート中、２×１０^５細胞／ウェルの密度で平板培養する。個々のウェルを増殖につき調べ、増殖したウェルの上清を、野生型または突然変異体ＢＲＣＡ１標的蛋白質を用い、ＥＬＩＳＡまたはＲＩＡによって、ＢＲＣＡ１特異的抗体の存在につきテストする。陽性ウェル中の細胞を増殖させ、サブクローンしてモノクローナル抗体を確立し確認する。 The spleen is excised from the immunized mouse and a single cell suspension is prepared (see Harlow and Lane, 1988). Cell fusion is performed substantially as described by Kohler and Milstein, 1975. Briefly, P3.65.3 myeloma cells (American Type Culture Collection, Rockville, Md.) Are fused with immune spleen cells using polyethylene glycol as described by Harlowe and Lane, 1988. Cells are plated at a density of 2 × 10 ⁵ cells / well in 96-well tissue culture plates. Individual wells are examined for growth and the supernatants of the grown wells are tested for the presence of BRCA1-specific antibodies by ELISA or RIA using wild-type or mutant BRCA1 target protein. Cells in positive wells are expanded and subcloned to establish and confirm monoclonal antibodies.

　所望の特異性を持つクローンを増殖させ、マウスまたは中空繊維中で腹水として増殖させて、特徴付けおよびアッセイ開発のために十分量の抗体を得る。クローン Grow clones with the desired specificity and grow as ascites in mice or hollow fibers to obtain sufficient antibodies for characterization and assay development.

　　　　　　　　　　　　　　　実施例１４
　ＢＲＣＡ１についてのサンドイッチアッセイ
　モノクローナル抗体をプレート、チューブ、ビーズ、または粒子のごとき固体表面に結合させる。好ましくは、抗体を９６−ウェルＥＬＩＳＡプレートのウェル表面に結合させる。ＢＲＣＡ１ペプチド／蛋白質（野生型または突然変異体）を含有する１００μｌ試料（例えば、血清、尿、組織サイトゾル）を固相抗体に結合させる。試料を室温で２時間インキュベートする。次いで、試料流体をデカントし、該固相を緩衝液で洗浄した、未結合物質を除去する。１００μｌの第２モノクローナル抗体（ＢＲＣＡ１ペプチド／蛋白質上の異なる抗原決定基に対するもの）を該固相に添加する。この抗体を検出器分子（例えば、^１２５Ｉ、酵素、蛍光体、または発色団）で標識し、第２抗体と共に固相を室温で２時間インキュベートする。第２抗体をデカントし、固相を緩衝液で洗浄して未結合物質を除去する。 Example 14
Sandwich assay for BRCA1 A monoclonal antibody is bound to a solid surface, such as a plate, tube, bead, or particle. Preferably, the antibodies are bound to the well surfaces of a 96-well ELISA plate. A 100 μl sample (eg, serum, urine, tissue cytosol) containing the BRCA1 peptide / protein (wild type or mutant) is bound to the solid phase antibody. Incubate the sample at room temperature for 2 hours. The sample fluid is then decanted and the solid phase washed with buffer to remove unbound material. 100 μl of a second monoclonal antibody (for a different antigenic determinant on the BRCA1 peptide / protein) is added to the solid phase. The antibody is labeled with a detector molecule (eg, ¹²⁵ I, enzyme, fluorophore, or chromophore) and the solid phase is incubated with the second antibody for 2 hours at room temperature. The second antibody is decanted and the solid phase is washed with buffer to remove unbound material.

　結合した標識の量（これは、試料に存在するＢＲＣＡ１ペプチド／蛋白質の量に比例する）を定量する。野生型ＢＲＣＡ１につき特異的なモノクローナル抗体ならびにＢＲＣＡ１で同定された突然変異体の各々に特異的なモノクローナル抗体を用い、別々のアッセイを行う。定量 Quantify the amount of bound label, which is proportional to the amount of BRCA1 peptide / protein present in the sample. Separate assays are performed using a monoclonal antibody specific for wild-type BRCA1 and a monoclonal antibody specific for each of the mutants identified with BRCA1.

　本発明の方法および組成物は種々の具体例の形態で具体化でき、そのうちの少しのみを本明細書で開示したことは認識されるであろう。本発明の精神を逸脱することなく他の具体例が存在することは当業者に明らかである。かくして、記載した具体化は例示的であって、制限的なものであると解釈されるべきではない。 It will be appreciated that the methods and compositions of the present invention can be embodied in various illustrative forms, only a few of which have been disclosed herein. It will be apparent to those skilled in the art that other embodiments exist without departing from the spirit of the invention. Thus, the described embodiments are illustrative and should not be construed as limiting.

　　　　　　　　　　　　　　文献のリスト
　Ａｌｔｓｃｈｕｌ，Ｓ．Ｆ．ら（１９９０）．　Ｊ．Ｍｏｌ．Ｂｉｏｌ．　２１５：１９５−１９７
　Ａｍｅｒｉｃａｎ　Ｃａｎｃｅｒ　Ｓｏｃｉｅｔｙ，Ｃａｎｃｅｒ　Ｆａｃｔｓ　&　Ｆｉｇｕｒｅｓ−１９９２．(Ａｍｅｒｉｃａｎ　Ｃａｎｃｅｒ　Ｓｏｃｉｅｔｙ，Ａｔｌａｎｔａ，ＧＡ）
　Ａｎａｎｄ，Ｒ．（１９９２）．　Ｔｅｃｈｎｉｑｕｅｓ　ｆｏｒ　ｔｈｅ　Ａｎａｌｙｓｉｓ　ｏｆ　Ｃｏｍｐｌｅｘ　Ｇｅｍｏｎｅｓ,(Ａｃａｄｅｍｉｃ　Ｐｒｅｓｓ）
　Ａｎｄｅｒｓｏｎら（１９８０）．　Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ.ＵＳＡ　７７：５３９９−５４０３
　Ａｎｄｅｒｓｏｎ，Ｄ．Ｅ．（１９７２），　Ｊ．Ｎａｔｌ．Ｃａｎｃｅｒ　Ｉｎｓｔ．　４８：１０２９−１０３４
　Ａｎｄｅｒｓｏｎ，Ｊ．Ａ．ら（１９９２）．　Ｊ．Ｏｔｏｌａｒｙｎｇｏｌｏｇｙ　２１：３２１
　Ａｎｔｏｎａｒａｋｉｓ，Ｓ．Ｅ．ら（１９８５）．　Ｎｅｗ　Ｅｎｇ．Ｊ．Ｍｅｄ．　３１３：８４２−８４８
　Ａｕｓｕｂｅｌ，Ｆ．Ｍ．ら（１９９２）．　Ｃｕｒｒｅｎｔ　Ｐｒｏｔｏｃｏｌｓ　ｉｎ　Ｍｏｌｅｃｕｌａｒ　Ｂｉｏｌｏｇｙ，Ｊ．Ｗｉｌｅｙ　ａｎｄ　Ｓｏｎｓ，Ｎ．Ｙ．）
　Ｂｅａｕｃａｇｅ　＆　Ｃａｒｒｕｔｈｅｒｓ（１９８１）．　Ｔｅｔｒａ．Ｌｅｔｔｓ．　２２：１８５９−１８６２
　Ｂｅｒｋｎｅｒ　（１９９２）．　Ｃｕｒｒ．Ｔｏｐ．Ｍｉｃｒｏｂｉｏｌ．Ｉｍｍｕｎｏｌ．　１５８：３９−６１
　Ｂｅｒｋｎｅｒら（１９８８）　ＢｉｏＴｅｃｈｎｉｑｕｅｓ　６：６１６−６２９
　Ｂｉｃｋｍｏｒｅ，Ｗ．Ａ．ら（１９９２）．　Ｓｃｉｅｎｃｅ　２５７：２３５−７
　Ｂｉｓｈｏｐ，Ｄ．Ｔ．ら（１９８８）．　Ｇｅｎｅｔ．Ｅｐｉｄｅｍｉｏｌ．　５：１５１−１６９
　Ｂｉｓｈｏｐ，Ｄ．Ｔ．およびＧａｒｄｎｅｒ，Ｅ．Ｊ．（１９８０）　Ｉｎ：Ｂａｎｂｕｒｙ　Ｒｅｐｏｒｔ　４：Ｃａｎｃｅｒ　Ｉｎｃｉｄｅｎｃｅ　ｉｎ　Ｄｅｆｉｎｅｄ　Ｐｏｌｕｌａｔｉｏｎｓ　（Ｊ．Ｃａｉｒｎｓ．，Ｉ．Ｌ．Ｌｙｏｎ，Ｍ．Ｓｋｏｌｎｉｃｋ編），Ｃｏｌｄ　Ｓｐｒｉｎｇ　Ｈａｒｂｏｒ　Ｌａｂｏｒａｔｏｒｙ，Ｃｏｌｄ　Ｓｐｒｉｎｇ　Ｈａｒｂｏｒ，Ｎ．Ｙ．，３０９−４０８
　Ｂｏｔｓｔｅｉｎら（１９８０）．Ａｍ．Ｊ．Ｈｕｍ．Ｇｅｎｅｔ．　３２：３１４−３３１
　Ｂｏｗｃｏｃｋ，Ａ．Ｍ．ら（１９９３）．　Ａｍ．Ｊ．Ｈｕｍ．Ｇｅｎｔ．　５２：７１８
　ＢｒａｎｄｙｏｐａｄｈｙａｙおよびＴｅｍｉｎ（１９８４）．　Ｍｏｌ．　Ｃｅｌｌ．Ｂｉｏｌ．　４：７４９−７５４
　ＢｒｅａｋｆｉｅｌｄおよびＧｅｌｌｅｒ（１９８７）．　Ｍｏｌ．　Ｎｅｕｒｏｂｉｏｌ．　１：３３７−３７１
　Ｂｒｉｎｓｔｅｒら（１９８１）．　Ｃｅｌｌ　２７：２２３−２３１
　ＢｕｃｋｓｃｈａｃｈｅｒおよびＰａｎｇａｎｉｂａｎ（１９９２）．　Ｊ．Ｖｉｒｏｌ．　６５：２７３１−２７３９
　Ｂｕｃｋｌｅｒら（１９９１）．　Ｐｒｏｃ．　Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ　８８：４００５−４００９
　Ｃａｎｎｏｎ−Ａｌｂｒｉｇｈｔ，Ｌ．ら（１９９４）．　Ｃａｎｃｅｒ
Ｒｅｓｅａｒｃｈ　５４：２３７８−２３８５
　Ｃａｐｅｃｃｈｉ，Ｍ．Ｒ．（１９８９）．　Ｓｃｉｅｎｃｅ　２４４：１２８８
　Ｃａｒｉｅｌｌｏ（１９８８）．　Ｈｕｍａｎ　Ｇｅｎｅｔｉｃｓ　４２：７２６
　Ｃｌａｕｓ，Ｅ．ら（１９９１）．　Ａｍ．Ｊ．Ｈｕｍ．Ｇｅｎｅｔ．　４８：２３２−２４２
　Ｃｏｎｎｅｒ，Ｂ．Ｊ．ら（１９８３）．　Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ　８０：２７８−２８２
　ＣｏｎｓｔａｎｔｉｎｉおよびＬａｃｙ（１９８１）．　Ｎａｔｕｒｅ　２９４：９２−９４
　Ｃｏｔｔｅｎら（１９９０）．　Ｐｒｏｃ．　Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ　８７：４０３３−４０３７
　Ｃｏｔｔｏｎら（１９８８）．　Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ　８５：４３９７
　Ｃｒｏｐｐ，Ｃ．Ｓ．ら（１９９４）．　Ｃａｎｃｅｒ　Ｒｅｓ．　５４：２５４８−２５５１
　Ｃｕｌｖｅｒら（１９９２）．　Ｓｃｉｅｎｃｅ　２５６：１５５０−１５５２
　Ｃｕｒｉｅｌら（１９９１ａ）．　Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ　８８：８８５０−８８５４
　Ｃｕｒｉｅｌら（１９９１ｂ）．　Ｈｕｍ．Ｇｅｎｅ　Ｔｈｅｒ．３：１４７−１５４
　Ｇｅｕｔｓｃｈｅｒ．Ｍ．（１９９０）．　Ｍｅｔｈ．Ｅｎｚｙｍｏｌｏｇｙ　１８２（Ａｃａｄｅｍｉｃ　Ｐｒｅｓｓ，Ｓａｎ　Ｄｉｅｇｏ，Ｃａｌ．）
　Ｄｏｎｅｈｏｗｅｒ，Ｌ．Ａ．ら（１９９２）．　Ｎａｔｕｒｅ　３５６：２１５
　Ｄｒｕｍｍｏｎｄ，Ｉ．Ａ．ら（１９９４）．　Ｍｏｌ．Ｃｅｌｌ　Ｂｉｏｌ．　１４：３８００−９
　Ｅａｓｔｏｎ，Ｄ．ら（１９９３）．　Ａｍ．Ｊ．Ｈｕｍ．Ｇｅｎｅｔ．５２：６７８−７０１
　Ｅｃｃｌｅｓ，Ｄ．Ｍ．ら（１９９０）．　Ｏｎｃｏｇｅｎｅ　５：１５９９−１６０１
　Ｅｎｈａｎｃｅｒｓ　ａｎｄ　Ｅｕｒｋａｒｙｏｔｉｃ　Ｇｅｎｅ　Ｅｘｐｒｅｓｓｉｏｎ，　Ｃｏｌｄ　Ｓｐｒｉｎｇ　Ｈａｒｂｏｒ　Ｐｒｅｓｓ，　Ｃｏｌｄ　Ｓｐｒｉｎｇ　Ｈａｒｂｏｒ，　Ｎｅｗ　Ｙｏｒｋ（１９８３）
　Ｅｒｉｃｋｓｏｎ，Ｊ．ら（１９９０）．　Ｓｃｉｅｎｃｅ　２４９：５２７−５３３
　Ｆａｉｎ，Ｐ．Ｒ．（１９９２）．　Ｃｙｔｏｇｅｎ．Ｃｅｌｌ　Ｇｅｎｅｔ．　６０：１７８
　Ｆｅｌｇｎｅｒら（１９８７）．　Ｐｒｏｃ．　Ｎａｔｌ．　Ａｃａｄ．　Ｓｃｉ．　ＵＳＡ　８４：７４１３−７４１７
　Ｆｉｅｒｓら（１９７８）．　Ｎａｔｕｒｅ　２７３：１１３
　Ｆｉｎｋら（１９９２）．Ｈｕｍ．Ｇｅｎｅ　Ｔｈｅｒ，３：１１−１９
　Ｆｉｎｋｅｌｓｔｅｉｎ，Ｊ．ら（１９９０）．Ｇｅｎｏｍｉｃｓ
７：１６７−１７２
　Ｐｒｅｅｓｅら（１９９０）．Ｂｉｏｃｈｅｍ．Ｐｈａｒｍａｃｏｌ．４０：２１８９−２１９９
　Ｆｒｉｅｄｍａｎ，Ｔ．（１９９１）．Ｉｎ　Ｔｈｅｒａｐｙ　ｆｏｒ　Ｇｅｎｅｔｉｃ　Ｄｉｓｅａｓｅｓ，Ｔ．Ｆｒｉｅｄｍａｎ編，Ｏｘｆｏｒｄ　Ｕｎｉｖｅｒｓｉｔｙ　Ｐｒｅｓｓ，１０５−１２１頁
　Ｆｕｔｒｅａｌ（１９９３）.Ｐｈ．Ｄ.Ｔｈｅｓｉｓ，Ｕｎｉｖｅｒｓｉｔｙ　ｏｆ　Ｎｏｒｔｈ　Ｃａｒｏｌｉｎａ，Ｃｈａｐｅｌ　Ｈｉｌｌ．
　Ｆｕｔｒｅａｌ，Ａ．ら（１９９２ａ）．Ｈｕｍ．Ｍｏｌｅｃ．Ｇｅｎｅｔ．１：６６
　Ｆｕｔｒｅａｌ，Ｐ．Ａ．ら（１９９２ｂ）．Ｃａｎｃｅｒ　Ｒｅｓ．５２：２６２４−２６２７
　Ｇｌｅｂｏｖ，Ｏ．Ｋ．ら（１９９４）．Ｃａｎｃｅｒ　Ｒｅｓ．　５４：３７０３−３７０９
　Ｇｌｏｖｅｒ，Ｄ．（１９８５）．　ＤＮＡ　Ｃｌｏｎｉｎｇ，ＩおよびＩＩ（Ｏｘｆｏｒｄ　Ｐｒｅｓｓ）
　Ｇｏ，Ｒ．Ｃ．Ｐ．ら（１９８３）．　Ｊ．Ｎａｔｌ．Ｃａｎｃｅｒ
Ｉｎｓｔ．７１：４５５−４６１
　Ｇｏｄｉｎｇ（１９８６）．Ｍｏｎｏｃｌｏｎａｌ　Ａｎｔｉｂｏｄｉｅｓ：Ｐｒｉｎｃｉｐｌｅｓ　ａｎｄＰｒａｃｔｉｃｅ，第二版.（Ａｃａｄｅｍｉｃ　Ｐｒｅｓｓ，Ｎ．Ｙ．）
　Ｇｏｄｏｗｓｋｉら（１９８８）．　Ｓｃｉｅｎｃｅ　２４１：８１２−８１６
　Ｇｏｌｄｇａｒ，Ｄ．Ｅ．ら（１９９４）．Ｊ．Ｎａｔｌ．Ｃａｎ．Ｉｎｓｔ．８６：３：２００−２０９
　Ｇｏｒｄｏｎら（１９８０）．Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．　ＵＳＡ　７７：７３８０−７３８４
　ＧｏｒｚｉｇｌｉａおよびＫａｐｉｋｉａｎ（１９９２）．Ｊ．Ｖｉｒｏｌ．６６：４４０７−４４１２
　Ｇｒａｈａｍおよびｖａｎ　ｄｅｒ　Ｅｂ（１９７３）．Ｖｉｒｏｌｏｇｙ　５２：４５６−４６７
　Ｇｒｏｍｐｅ，Ｍ．（１９９３）．Ｎａｔｕｒｅ　Ｇｅｎｅｔｉｃｓ　５：１１１−１１７
　Ｇｒｏｍｐｅ，Ｍ．ら（１９８９）．Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ　８６：５８５５−５８９２
　Ｇｕｔｈｒｉｅ，Ｇ．＆　Ｆｉｎｋ．Ｇ，Ｒ，（１９９１）．　Ｇｕｉｄｅ　ｔｏ　Ｙｅａｓｔ　Ｇｅｎｅｔｉｃｓ　ａｎｄ　Ｍｏｌｅｃｕｌａｒ
Ｂｉｏｌｏｇｙ（Ａｃａｄｅｍｉｃ　Ｐｒｅｓｓ）
　Ｈａｂｅｒ，Ｄ．Ａ．ら（１９９０）．Ｃｅｌｌ　６１：１２５７−６９
　Ｈａｌｌ，Ｊ．Ｍ．ら（１９９０）　Ｓｃｉｅｎｃｅ　２５０：１６８４−１６８９
　Ｈａｌｌ，Ｊ．Ｍ．ら（１９９２）．　Ａｍ．Ｊ．Ｈｕｍ．Ｇｅｎｅｔ．５０：１２３５−１２４１
　Ｈａｒｌｏｗ　＆　Ｌａｎｅ（１９８８）．　Ａｎｔｉｂｏｄｉｅｓ：Ａ　Ｌａｂｏｒａｔｏｒｙ　Ｍａｎｕａｌ（Ｃｏｌｄ　Ｓｐｒｉｎｇ　Ｈａｒｂｏｒ　Ｌａｂｏｒａｔｏｒｙ，Ｃｏｌｄ　Ｓｐｒｉｎｇ　Ｈａｒｂｏｒ，Ｎ，Ｙ．）
　Ｈａｓｔｙ，Ｐ．Ｋ．ら（１９９１）．Ｎａｔｕｒｅ　３５０：２４３
　Ｈｅｌｓｅｔｈら（１９９０）．Ｊ．Ｖｉｒｏｌ．６４：２４１６−２４２０　Ｈｏｄｇｓｏｎ，Ｊ．（１９９１）．　Ｂｉｏ／Ｔｅｃｈｎｏｌｏｇｙ　９：１９−２１
　Ｈｕｓｅら（１９８９）．　Ｓｃｉｅｎｃｅ　２４６：１２７５−１２８１
　Ｉｎｎｉｓら（１９９０）．　ＰＣＲ　Ｐｒｏｔｏｃｏｌｓ：Ａ　Ｇｕｉｄｅ　ｔｏ　Ｍｅｔｈｏｄｓ　ａｎｄ　Ａｐｐｌｉｃａｔｉｏｎｓ（Ａｃａｄｅｍｉｃ　Ｐｒｅｓｓ，Ｓａｎ　Ｄｉｅｇｏ，Ｃａｌ．）
　Ｊａｂｌｏｎｓｋｉ，Ｅ．（１９８６）．Ｎｕｃ．Ａｃｉｄｓ　Ｒｅｓ．１４：６１１５−６１２８
　Ｊａｃｏｂｓ，Ｉ．Ｊ．ら（１９９３）．Ｃａｎｃｅｒ　Ｒｅｓ．５３：１２１８−１２２１
　Ｊａｃｏｂｙ，Ｗ．Ｂ．およびＰａｓｔａｎ，Ｉ．Ｈ．（編）（１９７９）．Ｃｅｌｌ　Ｃｕｌｔｕｒｅ．　Ｍｏｔｈｏｄｓ　ｉｎ　Ｅｎｚｙｍｏｌｏｇｙ，第５８巻（Ａｃａｄｅｍｉｃ　Ｐｒｅｓｓ，Ｉｎｃ．，Ｈａｒｃｏｕｒｔ　Ｂｒａｃｅ　Ｊｏｖａｎｏｖｉｃｈ　（Ｎｅｗ　Ｙｏｒｋ））
　Ｊｅｆｆｒｅｙｓら（１９８５）．　Ｎａｔｕｒｅ　３１４：６７−７３
　Ｊｏｈｎｓｏｎら（１９９２）．　Ｊ．Ｖｉｒｏｌ．６６：２９５２−２９６５
　Ｋａｍｂ，Ａ．ら（１９９４）．Ｓｃｉｅｎｃｅ　２６４：４３６−４４０
　Ｋａｎｄｐａｌら（１９９０）．Ｎｕｃｌ．Ａｃｉｄｓ．Ｒｅｓ．１８：１７８９−１７９５
　Ｋａｎｅｄａら（１９８９）．　Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．２６４：１２１２６−１２１２９
　Ｋａｎｅｈｉｓａ（１９８４）．Ｎｕｃｌ．Ａｃｉｄｓ．Ｒｅｓ．　１２：２０３−２１３
　Ｋｅｌｓｅｌｌ，Ｄ．Ｐ．ら（１９９３）．Ｊｕｍａｎ　Ｍｏｌ．Ｇｅｎｅｔ．　２：１８２３−１８２８
　Ｋｉｎｓｚｌｅｒ，Ｋ．Ｗ．ら（１９９１）．　Ｓｃｉｅｎｃｅ　２５１：１３６６−１３７０
　Ｋｎｕｄｓｏｎ，Ａ．Ｇ．（１９９３）．Ｎａｔｕｒｅ　Ｇｅｎｅｔ．５：１０３
　Ｋｏｈｌｅｒ，Ｇ．およびＭｉｌｓｔｅｉｎ，Ｃ．（１９７５）．　Ｎａｔｕｒｅ　２５６：４９５−４９７
　Ｋｏｚａｋ，Ｍ．（１９８７）．Ｎｕｃｌｅｉｃ　Ａｃｉｄｓ　Ｒｅｓ．１５：８１２５−８１４８
　Ｋｒａｅｍｅｒ，Ｆ．Ｂ．（１９９３）．Ｊ．Ｌｉｐｉｄ　Ｒｅｓ．　３４：６６３−６７２
　Ｋｕｂｏ，Ｔ．ら（１９８８）．ＦＥＢＳ　Ｌｅｔｔｓ．２４１：１１９
　Ｌａｎｄｅｇｒｅｎら（１９８８）．　Ｓｃｉｅｎｃｅ　２４２：２２９
　Ｌｉｍら（１９９２）．　Ｃｉｒｃｕｌａｔｉｏｎ　８３：２００７−２０１１
　Ｌｉｎｄｓａｙ，Ｓ．ら（１９８７）．Ｎａｔｕｒｅ　３２７：３３６−３６８
　Ｌｉｔｔら（１９８９）．Ａｍ．Ｊ．Ｈｕｍ．Ｇｅｎｅｔ．　４４：３９７−４０１
　Ｌｉｔｔｌｅ，Ｍ．Ｈ．ら（１９９２）．　Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ　８９：４７９１
　Ｌｉｔｔｌｅ，Ｍ．Ｈ．ら（１９９３）．　Ｈｕｍ．Ｍｏｌ．Ｇｅｎｅｔ．　２：２５９
　Ｌｏｖｅｔｔら（１９９１）．　Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．　ＵＳＡ　８８：９６２８−９６３２
　Ｌｙｎｃｈ，Ｈ．Ｔ．ら（１９９０）．　Ｇｙｎｅｃｏｌ．Ｏｎｃｏｌ．３６：４８−５５
　Ｍａｄｚａｋら（１９９２）　Ｊ．Ｇｅｎ．Ｖｉｒｏｌ．　７３：１５３３−１５３６
　Ｍａｌｋｉｎ，Ｄ．ら（１９９０）．　Ｓｃｉｅｎｃｅ　２５０：１２３３−１２３８
　Ｍａｎｉａｔｉｓ．Ｔ．ら（１９８２）．　Ｍｏｌｅｃｕｌａｒ
Ｃｌｏｎｉｎｇ：Ａ　Ｌａｂｏｒａｔｏｙ　Ｍａｎｕａｌ　（Ｃｏｌｄ
Ｓｐｒｉｎｇ　Ｈａｒｂｏｒ　Ｌａｂｏｒａｔｏｒｙ，Ｃｏｌｄ　Ｓｐｒｉｎｇ　Ｈａｒｂｏｒ，Ｎ．Ｙ．）
　ＭａｎｎおよびＢａｌｔｉｍｏｒｅ（１９８５）．Ｊ．Ｖｉｒｏｌ．　５４：４０１−４０７
　Ｍａｒｇａｒｉｔｔｅら（１９９２）．　Ａｍ．Ｊ．Ｈｕｍ．Ｇｅｎｅｔ．　５０：１２３１−１２３４
　Ｍａｒｇｏｌｓｋｅｅ（１９９２）．Ｃｕｒｒ．Ｔｏｐ．Ｍｉｃｒｏｂｉｏｌ．Ｉｍｍｕｎｏｌ．　１５８：６７−９０
　Ｍａｒｔｉｎ，Ｒ．ら（１９９０）．　ＢｉｏＴｅｃｈｎｉｑｕｅｓ　９：７６２−７６８
　Ｍａｔｔｅｕｃｃｉ，Ｍ．Ｄ．およびＣａｒｕｔｈｅｒｓ，Ｍ．Ｈ．　（１９８１）．Ｊ．Ａｍ．Ｃｈｅｍ．Ｓｃｉ．　１０３：３１８５
　Ｍａｔｔｈｅｗｓ　＆　Ｋｒｉｃｋａ（１９８８）Ａｎａｌ．Ｂｉｏｃｈｅｍ．　１６９：１
　Ｍｅｒｒｉｆｉｅｌｄ（１９６３）．　Ｊ．Ａｍ．Ｃｈｅｍ．Ｓｏｃ．　８５：２１４９−２１５６
　Ｍｔｔｌｉｎ，Ｃ．ら（１９９０）．　Ａｍｅｒｉｃａｎ　Ｊｏｕｒｎａｌ　ｏｆ　Ｅｐｉｄｅｍｉｏｌｏｇｙ　１３１：９７３−９８３
　Ｍｅｔｚｇｅｒら（１９８８）．　Ｎａｔｕｒｅ　３３４：３１−３６
　Ｍｉｌｌｅｒ（１９９２）．　Ｃｕｒｒ．Ｔｏｐ．Ｍｉｃｒｏｂｉｏｌ．　Ｉｍｍｕｎｏｌ．　１５８：１−２４
　Ｍｉｌｌｅｒら（１９８５）．　Ｍｏｌ．Ｃｅｌｌ．Ｂｉｏｌ．　５：４３１−４３７
　Ｍｉｌｌｅｒら（１９８８）．　Ｊ．Ｖｉｒｏｌ．　６２：４３３７−４３４５
　Ｍｉｔｔｌｉｎ（１９８９）．　Ｃｌｉｎｉｃａｌ　Ｃｈｅｍ．　３５：１８１９
　Ｍｏｄｒｉｃｈ，Ｐ．（１９９１）．　Ａｎｎ，Ｒｅｖ．Ｇｅｎｅｔ．　２５：２２９−２５３
　Ｍｏｍｂａｅｒｔｓ，Ｐ．ら（１９９２）　Ｃｅｌｌ　６８：８６９
　Ｍｏｎａｃｏら（１９８６）．　Ｎａｔｕｒｅ　３２３：６４６
　Ｍｏｓｓ（１９９２）．　Ｃｕｒｒ．Ｔｏｐ．Ｍｉｃｒｏｂｉｏｌ．　Ｉｍｍｕｎｏｌ．　１５８：２５−３８
　Ｍｕｚｙｃｚｋａ（１９９２）．　Ｃｕｒｒ．Ｔｏｐ．Ｍｉｃｒｏｂｉｏｌ．Ｉｍｍｕｎｏｌ．　１５８：９７−１２３
　Ｎａｂｅｌ（１９９２）．　Ｈｕｍ．Ｇｅｎｅ　Ｔｈｅｒ．　３：３９９−４１０
　Ｎａｂｅｌら（１９９０）．　Ｓｃｉｅｎｃｅ　２４９：１２８５−１２８８　Ｎａｋａｍｕｒａら（１９８７）．　Ｓｃｉｅｎｃｅ　２３５：１６１６−１６２２
　Ｎａｒｏｄ，Ｓ．Ａ．ら（１９９１）．　Ｔｈｅ　Ｌａｎｃｅｔ　３３８：８２−８３
　Ｎｅｗｍａｎ　Ｂ．ら（１９８８）．　Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．　Ｓｃｉ．ＵＳＡ　８５：３０４４−３０４８
　Ｎｅｗｔｏｎ，Ｃ．Ｒ．Ｇｒａｈａｍ，Ａ．Ｈｅｐｔｉｎｓｔａｌｌ，Ｌ．Ｅ．，Ｐｏｗｅｌｌ，Ｓ．Ｊ．Ｓｕｍｍｅｒｓ，Ｃ．，Ｋａｌｓｈｅｋｅｒ，Ｎ．，Ｓｍｉｔｈ，Ｊ．Ｃ．およびＭａｒｋｈａｍ，Ａ．Ｆ．（１９８９）．　Ｎｕｃｌ．Ａｃｉｄｓ　Ｒｅｓ．　１７：２５０３−２５１６
　Ｎｇｕｙｅｎ，Ｑ．ら（１９９２）．　ＢｉｏＴｅｃｈｎｉｑｕｅｓ　１３：１１６−１２３
　Ｎｏｖａｃｋら（１９８６）．　Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．　ＵＳＡ　８３：５８６
　Ｏｈ，Ｊ．（１９８５）．　Ａｎａｌｙｓｉｓ　ｏｆ　Ｈｕｍａｎ　Ｇｅｎｅｔｉｃ　Ｌｉｎｋａｇｅ，Ｊｏｈｎｓ　Ｈｏｐｋｉｎｓ
Ｕｎｉｖｅｒｓｉｔｙ　Ｐｒｅｓｓ，Ｂａｌｔｉｍｏｒｅ，Ｍｄ，第１−２１６頁
　Ｏｈｉら（１９９０）．　Ｇｅｎｅ　８９：２７９−２８２
　Ｏｌｉｐｈａｎｔ，Ａ．ら（１９９１）．　Ｎｕｃｌｅｉｃ　Ａｃｉｄ　Ｒｅｓ．　１９：４７９４
　Ｏｌｉｐｈａｎｔ，Ａ．（１９９１）．　Ｎｕｃｌｅｉｃ　Ａｃｉｄ　Ｒｅｓ．　１９：４７９５
　Ｏｒｉａら（１９８９）．　Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．　ＵＳＡ　８６：２７７６−２７７０
　Ｐａｇｅら（１９９０）．　Ｊ．Ｖｉｒｏｌ．　６４：５３７０−５２７６
　Ｐｅｌｌｉｃｅｒら（１９８０）．Ｓｃｉｅｎｃｅ　２０９：１４１４−１４２２
　Ｐｅｔｒｏｐｏｕｌｕｓら（１９９２）．Ｊ．Ｖｉｒｏｌ．　６６：３３９１−３３９７
　Ｐｈｉｌｐｏｔｔ，Ｋ．Ｌ．ら（１９９２）．　Ｓｃｉｅｎｃｅ
２５６：１４４８
　Ｐｉｅｒｃｅら（１９９２）　Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．　ＵＳＡ　８９：２０５６−２０６０
　Ｑｕａｎｔｉｎら（１９９２）　Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．　ＵＳＡ　８９：２５８１−２５８４
　Ｒａｎｏ　＆　Ｋｉｄｄ（１９８９）．　Ｎｕｃｌ．Ａｃｉｄｓ　Ｒｅｓ．　１７：８３９２
　Ｒｉｇｂｙ，Ｐ．Ｗ．Ｊ．ら（１９７７）．Ｊ．Ｍｏｌ．Ｂｉｏｌ．　１１３：２３７−２５１
　Ｒｏｓｅｎｆｅｌｄら（１９９２）．　Ｃｅｌｌ　６８：１４３−１５５
　Ｓａｍｂｒｏｏｋ，Ｊ．ら（１９８９）．　Ｍｏｌｅｃｕｌａｒ　Ｃｌｏｎｉｎｇ：Ａ　Ｌａｂｏｒａｔｏｒｙ　Ｍａｎｕａｌ．第２版．（Ｃｏｌｄ　Ｓｐｒｉｎｇ　Ｈａｒｂｏｒ　Ｌａｂｏｒａｔｏｒｙ，Ｃｏｌｄ　Ｓｐｒｉｎｇ　Ｈａｂｏｒ，Ｎ．Ｙ．）
　Ｓａｔｏ，Ｔ．ら（１９９０）．　Ｃａｎｃｅｒ　Ｒｅｓ．　５０：７１８４−７１８９
　Ｓｃｈａｒｆ（１９８６）．　Ｓｃｉｅｎｃｅ　２３３：１０７６
　Ｓｃｏｐｅｓ，Ｒ．（１９８２）．　Ｐｒｏｔｅｉｎ　Ｐｕｒｉｆｉｃａｔｉｏｎ：Ｐｒｉｎｃｉｐｌｅｓ　ａｎｄ　Ｐｒａｃｔｉｃｅ，（Ｓｐｒｉｎｇｅｒ−Ｖｅｒｌａｇ，Ｎ．Ｙ．）
　Ｓｈａｕｌｉａｎ，Ｅ．ら（１９９２）　Ｍｏｌ．Ｃｅｌｌ　Ｂｉｏｌ．１２：５５８１−９２
　Ｓｈｅｆｆｉｅｌｄ，Ｖ．Ｃ．ら（１９８９）．Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ　８６：２３２−２３６
　Ｓｈｅｆｆｉｅｌｄ，Ｖ．Ｃ．ら（１９９１）．Ａｍ．Ｊ．Ｈｕｍ．Ｇｅｎｅｔ．　４９：６９９−７０６
　Ｓｈｅｎｋら（１９７５）．　Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．　ＵＳＡ　７２：９８９
　Ｓｈｉｍａｄａら（１９９１）．　Ｊ．Ｃｌｉｎ．Ｉｎｖｅｓｔ．　８８：１０４３−１０４７
　Ｓｈｉｎｋａｉ，Ｙ．ら（１９９２）．　Ｃｅｌｌ　６８：８５５
　Ｓｈｉｚｕｙａ，Ｈ．ら（１９９２）．Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ　８９：８７９４−８７９７
　Ｓｉｍａｒｄ，Ｊ．ら（１９９３）．　Ｈｕｍａｎ　Ｍｏｌ．Ｇｅｎｅｔ．　２：１１９３−１１９９
　Ｓｋｏｌｎｉｃｋ，Ｍ．Ｈ．およびＷａｌｌａｃｅ，Ｂ，Ｒ，（１９８８）．　Ｇｅｎｏｍｉｃｓ　２：２７３−２７９
　Ｓｋｏｌｎｉｃｋ，Ｍ．Ｈ．ら（１９９０）．　Ｓｃｉｅｎｃｅ　２５０：１７１５−１７２０
　Ｓｍｉｔｈ，Ｓ．Ａ．ら（１９９２）　Ｎａｔｕｒｅ　Ｇｅｎｅｔｉｃｓ　２：１２８−１３１
　Ｓｍｉｔｈ，Ｔ．Ｆ．およびＷａｔｅｒｍａｎ，Ｍ．Ｓ．（１９８１）．　Ｊ．Ｍｏｌ．Ｂｉｏｌ．　１４７：１９５−１９７
　Ｓｎｏｕｗａｅｒｔ，Ｊ．Ｎ．ら（１９９２）．　Ｓｃｉｅｎｃｅ　２５７：１０８３
　Ｓｏｒｇｅら（１９８４）．Ｍｏｌ．Ｃｅｌｌ．　Ｂｉｏｌ．４：１７３０−１７３７
　Ｓｒｉｖａｓｔａｖａ，Ｓ．ら（１９９３）．　Ｃａｎｃｅｒ　Ｒｅｓ．　５３：４４５２−５
　Ｓｔｅｒｎｂｅｒｇら（１９９０）．　Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ　８７：１０３−１０７
　Ｓｔｅｒｎｂｅｒｇら（１９９２）．　Ｔｈｅ　Ｎｅｗ　Ｂｉｏｌｏｇｉｓｔ　２：１５１−１６２
　Ｓｔｅｗａｒｔら（１９９２）．Ｈｕｍ．Ｇｅｎｅ　Ｔｈｅｒ．　３：２６７−２７５
　Ｓｔｒａｔｆｏｒｄ−Ｐｅｒｒｉｃａｕｄｅｔら（１９９０）．　Ｈｕｍ．Ｇｅｎｅ　Ｔｈｅｒ．　１：２４１−２５６
　Ｓｗｉｆｔ，Ｍ．ら（１９９１）．Ｎ．Ｅｎｇｌ．Ｊ．Ｍｅｄ．　３２５：１８３１−１８３６
　Ｓｗｉｆｔ，Ｍ．ら（１９７６）．Ｃａｎｃｅｒ　Ｒｅｓ．３６：２０９−２１５
　Ｓｕ，Ｌ．Ｋ．ら（１９９３）．Ｃａｎｃｅｒ　Ｒｅｓ．５３：２７２８−３１
　Ｔｈｏｍａｓ，Ａ．およびＳｋｏｌｎｉｃ，Ｍ．Ｈ．（１９９４）．　ＩＭＡ　Ｊｏｕｒｎａｌ　ｏｆ　Ｍａｔｈｅｍａｔｉｃｓ　Ａｐｐｌｉｅｄ　ｉｎ　Ｍｅｄｉｃｉｎｅ　ａｎｄ　Ｂｉｏｌｏｇｙ　（ｉｎ　ｐｒｅｓｓ）
　Ｔｏｎｏｌｉｏ，Ｄ．ら（１９９０）．Ｃｏｌｄ　Ｓｐｒｉｎｇ　Ｈａｒｂｏｒ　Ｃｏｎｆｅｒｅｎｃｅ
　Ｖａｌａｎｃｉｕｓ，Ｖ．＆　Ｓｍｉｔｈｉｅｓ，Ｏ．（１９９１）．　Ｍｏｌ．Ｃｅｌｌ　Ｂｉｏｌ．　１１：１４０２
　ｖａｎ　Ｄｉｌｌａら（１９８６）．　Ｂｉｏｔｅｃｈｎｏｌｏｇｙ
４：５３７−５５２
　Ｗａｇｎｅｒら（１９９０）．　Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．　ＵＳＡ　８７：３４１０−３４１４
　Ｗａｇｎｅｒら（１９９１）．　Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．　Ｓｃｉ．　ＵＳＡ　８８：４２５５−４２５９
　ＷａｎｇおよびＨｕａｎｇ（１９８９）．　Ｂｉｏｃｈｅｍｉｓｔｒｙ　２８：９５０８−９５１４
　Ｗａｒｔｅｌｌ，Ｒ．Ｍ．ら（１９９０）．　Ｎｕｃｌ．Ａｃｉｄｓ　Ｒｅｓ．　１８：２６９９−２７０５
　Ｗｅｂｅｒ，Ｊ．Ｌ．（１９９０）．　Ｇｅｎｏｍｉｃｓ　７：５２４−５３０
　ＷｅｂｅｒおよびＭａｙ（１９８９）．　Ａｍ．Ｊ．Ｈｕｍ．Ｇｅｎｅｔ．　４４：３８８−３９６
　Ｗｅｂｅｒ，Ｊ．Ｌ．ら（１９９０）　Ｎｕｃｌｅｉｃ　Ａｃｉｄｓ　Ｒｅｓ．　１８：４６４０
　Ｗｅｌｌｓ，Ｊ．Ａ．（１９９１）．　Ｍｅｔｈｏｄｓ　ｉｎ　Ｅｎｚｙｍｏｌｏｇｙ　２０２：３９０−４１１
　Ｗｅｔｍｕｒ　＆　Ｄａｖｉｄｓｏｎ（１９６８）．　Ｊ．Ｍｏｌ．Ｂｉｏｌ．　３１：３４９−３７０
　Ｗｈｉｔｅ，Ｍ．Ｂ．羅（１９９２）．　Ｇｅｎｏｍｉｃｓ　１２：３０１−３０６
　ＷｈｉｔｅおよびＬａｌｏｕｅｌ（１９８８）．　Ａｎｎ．Ｒｅｖ．Ｇｅｎｅｔ．　２２：２５９−２７９
　Ｗｉｌｋｉｎｓｏｎら（１９９２）．　Ｎｕｃｌｅｉｃ　Ａｃｉｄｓ　Ｒｅｓ．　２０：２２３３−２２３９
　ＷｉｌｌｉａｍｓおよびＡｎｄｅｒｓｏｎ（１９８４）：　Ｇｅｎｅｔ．　Ｅｐｉｄｅｍｉｏｌ．　１：７−２０
　Ｗｏｌｆｆら（１９９０）．　Ｓｃｉｅｎｃｅ　２４７：１４６５−１４６８　Ｗｏｌｆｆら（１９９１）．　ＢｉｏＴｅｃｈｎｉｑｕｅｓ　１１：４７４−４８５
　Ｗｏｏｓｔｅｒ，Ｒ．ら（１９９４）．　Ｓｃｉｅｎｃｅ　２６５：２０８８　Ｗｕら（１９８９ａ）．　Ｇｅｎｏｍｉｃｓ　４：５６０−５６９
　Ｗｕら（１９８９ｂ）．　Ｊ．Ｂｉｏｌ．Ｃｈｅｍ　２６４：１６９８５−１６９８７
　Ｗｕら（１９９１）．　Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．　２６６：１４３３８−１４３４２
　Ｚｅｎｋｅら（１９９０１）．　Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．　ＵＳＡ　８７：３６５５−３６５９ List of references Altschul, S .; F. (1990). J. Mol. Biol. 215: 195-197
American Cancer Society, Cancer Facts & Figures-1992. (American Cancer Society, Atlanta, GA)
Andand, R .; (1992). Technologies for the Analysis of Complex Gemones, (Academic Press)
Anderson et al. (1980). Proc. Natl. Acad. Sci. USA 77: 5399-5403.
Anderson, D.M. E. FIG. (1972), J.M. Natl. Cancer Inst. 48: 1029-1034
Anderson, J. et al. A. (1992). J. Otolaryngology 21: 321
Antonarakis, S .; E. FIG. (1985). New Eng. J. Med. 313: 842-848
Ausubel, F .; M. (1992). Current Protocols in Molecular Biology, J. Mol. Wiley and Sons, N.W. Y. )
Beaucage & Carruthers (1981). Tetra. Letts. 22: 1859-1862
Berkner (1992). Curr. Top. Microbiol. Immunol. 158: 39-61
Berkner et al. (1988) BioTechniques 6: 616-629.
Bickmore, W.C. A. (1992). Science 257: 235-7
Bishop, D .; T. (1988). Genet. Epidemiol. 5: 151-169
Bishop, D .; T. And Gardner, E .; J. (1980) In: Banbury Report 4: Cancer Incidence in Defined Regulations (edited by J. Cairns., IL. Lyon, M. Skonickick), Cold Spring Harbor Laboratory, Cold Spring Harbor, N.D. Y. , 309-408
Botstein et al. (1980). Am. J. Hum. Genet. 32: 314-331
Bowcock, A .; M. (1993). Am. J. Hum. Gent. 52: 718
Brandyopadhyay and Temin (1984). Mol. Cell. Biol. 4: 749-754
Breakfield and Geller (1987). Mol. Neurobiol. 1: 337-371
Brinster et al. (1981). Cell 27: 223-231
Buckscher and Panganiban (1992). J. Virol. 65: 2731-2739
Buckler et al. (1991). Proc. Natl. Acad. Sci. USA 88: 4005-4009.
Cannon-Albright, L.A. (1994). Cancer
Research 54: 2378-2385
Capecchi, M .; R. (1989). Science 244: 1288
Cariello (1988). Human Genetics 42: 726
Claus, E .; (1991). Am. J. Hum. Genet. 48: 232-242
Conner, B .; J. (1983). Proc. Natl. Acad. Sci. USA 80: 278-282.
Constantin and Lacy (1981). Nature 294: 92-94
Cotten et al. (1990). Proc. Natl. Acad. Sci. USA 87: 4033-4037
Cotton et al. (1988). Proc. Natl. Acad. Sci. USA 85: 4397
Cropp, C.I. S. (1994). Cancer Res. 54: 2548-2551
Culver et al. (1992). Science 256: 1550-1552
Curiel et al. (1991a). Proc. Natl. Acad. Sci. USA 88: 8850-8854
Curiel et al. (1991b). Hum. Gene Ther. 3: 147-154
Geutscher. M. (1990). Meth. Enzymology 182 (Academic Press, San Diego, Cal.)
Donehower, L .; A. (1992). Nature 356: 215
Drummond, I .; A. (1994). Mol. Cell Biol. 14: 3800-9
Easton, D .; (1993). Am. J. Hum. Genet. 52: 678-701
Eccles, D.C. M. (1990). Oncogene 5: 1599-1601.
Enhancers and Eurkariotic Gene Expression, Cold Spring Harbor Press, Cold Spring Harbor, New York (1983)
Erickson, J. et al. (1990). Science 249: 527-533.
Fain, P .; R. (1992). Cytogen. Cell Genet. 60: 178
Felgner et al. (1987). Proc. Natl. Acad. Sci. USA 84: 7413-7417
Fiers et al. (1978). Nature 273: 113
Fink et al. (1992). Hum. Gene Ther, 3: 11-19
Finkelstein, J.M. (1990). Genomics
7: 167-172
Preese et al. (1990). Biochem. Pharmacol. 40: 2189-2199
Friedman, T .; (1991). In Therapy for Genetic Diseases, T.W. Friedman ed., Oxford University Press, 105-121 Fureal (1993). Ph. D. Thesis, University of North Carolina, Chapel Hill.
Fureal, A. et al. (1992a). Hum. Molec. Genet. 1:66
Futreal, P .; A. (1992b). Cancer Res. 52: 2624-2627
Glevov, O .; K. (1994). Cancer Res. 54: 3703-3709
Glover, D.A. (1985). DNA Cloning, I and II (Oxford Press)
Go, R .; C. P. (1983). J. Natl. Cancer
Inst. 71: 455-461
Goding (1986). Monoclonal Antibodies: Principles and Practice, Second Edition. (Academic Press, NY).
Godowski et al. (1988). Science 241: 812-816
Goldgar, D .; E. FIG. (1994). J. Natl. Can. Inst. 86: 3: 200-209
Gordon et al. (1980). Proc. Natl. Acad. Sci. USA 77: 7380-7384
Gorziglia and Kapkian (1992). J. Virol. 66: 4407-4412
Graham and van der Eb (1973). Virology 52: 456-467.
Grompe, M .; (1993). Nature Genetics 5: 111-117
Grompe, M .; (1989). Proc. Natl. Acad. Sci. USA 86: 5855-5892.
Guthrie, G .; & Fink. G, R, (1991). Guide to Year Genetics and Molecular
Biology (Academic Press)
Haber, D .; A. (1990). Cell 61: 1257-69
Hall, J.M. M. (1990) Science 250: 1684-1689.
Hall, J.M. M. (1992). Am. J. Hum. Genet. 50: 1235-1241
Harlow & Lane (1988). Antibodies: A Laboratory Manual (Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y.)
Hasty, P .; K. (1991). Nature 350: 243
Helseth et al. (1990). J. Virol. 64: 2416-2420 Hodgson, J .; (1991). Bio / Technology 9: 19-21
Huse et al. (1989). Science 246: 1275-1281
Innis et al. (1990). PCR Protocols: A Guide to Methods and Applications (Academic Press, San Diego, Cal.)
Jablonski, E .; (1986). Nuc. Acids Res. 14: 6115-6128
Jacobs, I .; J. (1993). Cancer Res. 53: 1218-1221
Jacby, W.C. B. And Pastan, I .; H. (Eds.) (1979). Cell Culture. Methods in Enzymology, Vol. 58 (Academic Press, Inc., Harcourt Brace Jovanovich (New York)).
Jeffreys et al. (1985). Nature 314: 67-73
Johnson et al. (1992). J. Virol. 66: 2952-2965
Kamb, A .; (1994). Science 264: 436-440
Kandpal et al. (1990). Nucl. Acids. Res. 18: 1789-1795
Kaneda et al. (1989). J. Biol. Chem. 264: 12126-12129
Kanehisa (1984). Nucl. Acids. Res. 12: 203-213
Kelsell, D .; P. (1993). See Journal Mol. Genet. 2: 1823-1828
Kinszler, K .; W. (1991). Science 251: 1366-1370
Knudson, A .; G. FIG. (1993). Nature Genet. 5: 103
Kohler, G .; And Milstein, C.I. (1975). Nature 256: 495-497
Kozak, M .; (1987). Nucleic Acids Res. 15: 8125-8148
Kraemer, F .; B. (1993). J. Lipid Res. 34: 663-672
Kubo, T .; (1988). FEBS Letts. 241: 119
Landegren et al. (1988). Science 242: 229
Lim et al. (1992). Circulation 83: 2007-2011
Lindsay, S.M. (1987). Nature 327: 336-368
Litt et al. (1989). Am. J. Hum. Genet. 44: 397-401
Little, M .; H. (1992). Proc. Natl. Acad. Sci. USA 89: 4791
Little, M .; H. (1993). Hum. Mol. Genet. 2: 259
Lovett et al. (1991). Proc. Natl. Acad. Sci. USA 88: 9628-9632
Lynch, H .; T. (1990). Gynecol. Oncol. 36: 48-55
Madzak et al. (1992) Gen. Virol. 73: 1533-1536
Malkin, D .; (1990). Science 250: 1233-1238
Maniatis. T. (1982). Molecular
Cloning: A Laboratory Manual (Cold
Spring Harbor Laboratory, Cold Spring Harbor, NJ. Y. )
Mann and Baltimore (1985). J. Virol. 54: 401-407
Margarite et al. (1992). Am. J. Hum. Genet. 50: 1231-1234
Margolskie (1992). Curr. Top. Microbiol. Immunol. 158: 67-90
Martin, R.M. (1990). BioTechniques 9: 762-768.
Matteucci, M .; D. And Caruthers, M .; H. (1981). J. Am. Chem. Sci. 103: 3185
Matthews & Kricka (1988) Anal. Biochem. 169: 1
Merrifield (1963). J. Am. Chem. Soc. 85: 2149-2156
Mttlin, C.I. (1990). American Journal of Epidemiology 131: 973-983
Metzger et al. (1988). Nature 334: 31-36
Miller (1992). Curr. Top. Microbiol. Immunol. 158: 1-24
Miller et al. (1985). Mol. Cell. Biol. 5: 431-437
Miller et al. (1988). J. Virol. 62: 4337-4345
Mittlin (1989). Clinical Chem. 35: 1819
Modrich, P .; (1991). Ann, Rev .; Genet. 25: 229-253
Mombaerts, P .; (1992) Cell 68: 869.
Monaco et al. (1986). Nature 323: 646
Moss (1992). Curr. Top. Microbiol. Immunol. 158: 25-38
Muzyczka (1992). Curr. Top. Microbiol. Immunol. 158: 97-123
Nabel (1992). Hum. Gene Ther. 3: 399-410
Nabel et al. (1990). Science 249: 1285-1288 Nakamura et al. (1987). Science 235: 1616-1622
Narod, S.M. A. (1991). The Lancet 338: 82-83.
Newman B. (1988). Proc. Natl. Acad. Sci. USA 85: 3044-3048
Newton, C.I. R. Graham, A .; Heptinstall, L .; E. FIG. , Powell, S .; J. Summers, C.I. , Kalsheker, N .; , Smith, J. et al. C. And Markham, A .; F. (1989). Nucl. Acids Res. 17: 2503-2516
Nguyen, Q. et al. (1992). BioTechniques 13: 116-123
Novack et al. (1986). Proc. Natl. Acad. Sci. USA 83: 586
Oh, J .; (1985). Analysis of Human Genetic Linkage, Johns Hopkins
University Press, Baltimore, Md, pp. 1-216 Ohi et al. (1990). Gene 89: 279-282
Olifant, A .; (1991). Nucleic Acid Res. 19: 4794
Olifant, A .; (1991). Nucleic Acid Res. 19: 4795
Oria et al. (1989). Proc. Natl. Acad. Sci. USA 86: 2776-2770.
Page et al. (1990). J. Virol. 64: 5370-5276
Pellicer et al. (1980). Science 209: 1414-1422
Petropoulus et al. (1992). J. Virol. 66: 3391-3397
Philpott, K .; L. (1992). Science
256: 1448
Pierce et al. (1992) Proc. Natl. Acad. Sci. USA 89: 2056-2060
Quantin et al. (1992) Proc. Natl. Acad. Sci. USA 89: 2581-2584.
Rano & Kidd (1989). Nucl. Acids Res. 17: 8392
Rigby, P.M. W. J. (1977). J. Mol. Biol. 113: 237-251
Rosenfeld et al. (1992). Cell 68: 143-155
Sambrook, J .; (1989). Molecular Cloning: A Laboratory Manual. Second edition. (Cold Spring Harbor Laboratory, Cold Spring Harbor, NY)
Sato, T .; (1990). Cancer Res. 50: 7184-7189
Scharf (1986). Science 233: 1076
Scopes, R.A. (1982). Protein Purification: Principles and Practice, (Springer-Verlag, NY)
Shaulian, E .; (1992) Mol. Cell Biol. 12: 5581-92
Sheffield, V .; C. (1989). Proc. Natl. Acad. Sci. USA 86: 232-236
Sheffield, V .; C. (1991). Am. J. Hum. Genet. 49: 699-706
Shenk et al. (1975). Proc. Natl. Acad. Sci. USA 72: 989
Shimada et al. (1991). J. Clin. Invest. 88: 1043-1047
Shinkai, Y .; (1992). Cell 68: 855
Shizuya, H .; (1992). Proc. Natl. Acad. Sci. USA 89: 8794-8797.
Simard, J.M. (1993). Human Mol. Genet. 2: 1193-1199
Skonick, M .; H. And Wallace, B, R, (1988). Genomics 2: 273-279
Skonick, M .; H. (1990). Science 250: 1715-1720
Smith, S.M. A. (1992) Nature Genetics 2: 128-131.
Smith, T .; F. And Waterman, M .; S. (1981). J. Mol. Biol. 147: 195-197
Snouerert, J .; N. (1992). Science 257: 1083
Sorge et al. (1984). Mol. Cell. Biol. 4: 1730-1737
Srivastava, S .; (1993). Cancer Res. 53: 4452-5
Sternberg et al. (1990). Proc. Natl. Acad. Sci. USA 87: 103-107
Sternberg et al. (1992). The New Biologist 2: 151-162
Stewart et al. (1992). Hum. Gene Ther. 3: 267-275
Stratford-Perricaudet et al. (1990). Hum. Gene Ther. 1: 241-256
Swift, M .; (1991). N. Engl. J. Med. 325: 1831-1836
Swift, M .; (1976). Cancer Res. 36: 209-215
Su, L .; K. (1993). Cancer Res. 53: 2728-31
Thomas, A .; And Skolnic, M .; H. (1994). IMA Journal of Mathematicals Applied in Medicine and Biology (in press)
Tonolio, D .; (1990). Cold Spring Harbor Conference
Valanius, V .; & Smithies, O.M. (1991). Mol. Cell Biol. 11: 1402
van Dilla et al. (1986). Biotechnology
4: 537-552
Wagner et al. (1990). Proc. Natl. Acad. Sci. USA 87: 3410-3414
Wagner et al. (1991). Proc. Natl. Acad. Sci. USA 88: 4255-4259.
Wang and Huang (1989). Biochemistry 28: 9508-9514
Wartell, R .; M. (1990). Nucl. Acids Res. 18: 2699-2705
Weber, J. et al. L. (1990). Genomics 7: 524-530
Weber and May (1989). Am. J. Hum. Genet. 44: 388-396
Weber, J. et al. L. (1990) Nucleic Acids Res. 18: 4640
Wells, J.M. A. (1991). Methods in Enzymology 202: 390-411
Wetmur & Davidson (1968). J. Mol. Biol. 31: 349-370
White, M .; B. Luo (1992). Genomics 12: 301-306
White and Lalouel (1988). Ann. Rev .. Genet. 22: 259-279
Wilkinson et al. (1992). Nucleic Acids Res. 20: 2233-239
Williams and Anderson (1984): Genet. Epidemiol. 1: 7-20
Wolff et al. (1990). Science 247: 1465-1468 Wolff et al. (1991). BioTechniques 11: 474-485.
Wooster, R .; (1994). Science 265: 2088 Wu et al. (1989a). Genomics 4: 560-569
Wu et al. (1989b). J. Biol. Chem 264: 16985-16987
Wu et al. (1991). J. Biol. Chem. 266: 14338-14342
Zenke et al. (19901). Proc. Natl. Acad. Sci. USA 87: 3655-3659

　特許および特許出願のリスト
　米国特許第３，８１７，８３７号
　米国特許第３，８５０，７５２号
　米国特許第３，９３９，３５０号
　米国特許第３，９９６，３４５号
　米国特許第４，２７５，１４９号
　米国特許第４，２７７，４３７号
　米国特許第４，３６６，２４１号
　米国特許第４，３７６，１１０号
　米国特許第４，４８６，５３０号
　米国特許第４，６８３，１９５号
　米国特許第４，６８３，２０２号
　米国特許第４，８１６，５６７号
　米国特許第４，８６８，１０５号
　米国特許第５，２５２，４７９号
　欧州公開第２２５，８０７号
　欧州特許出願公開第０３３２４３５号
　Ｇｅｙｓｅｎ，Ｈ，ＰＣＴ出願公開ＷＯ　８４／０３５６４、１９８４年９月１３日公開
　Ｈｉｔｚｅｍａｎら、ＥＰ７３，６７５Ａ
　ＰＣＴ出願公開ＷＯ　９３／０７２８２ List of Patents and Patent Applications US Patent No. 3,817,837 US Patent No. 3,850,752 US Patent No. 3,939,350 US Patent No. 3,996,345 US Patent No. 4,275,149 U.S. Pat. No. 4,277,437 U.S. Pat. No. 4,366,241 U.S. Pat. No. 4,376,110 U.S. Pat. No. 4,486,530 U.S. Pat. No. 4,683,195 U.S. Pat. U.S. Pat. No. 4,816,567 U.S. Pat. No. 4,868,105 U.S. Pat. No. 5,252,479 EP 225,807 EP U.S. Pat. PCT Application Publication WO 84/03564, published September 13, 1984 Hitzeman et al., EP 73,675A.
PCT Application Publication WO 93/07282

SEQUENCE LISTING
(1) GENERAL INFORMATION:

(i) APPLICANT: Skolnick, Mark H.
Goldgar, David E.
Miki, Yoshio
Swenson, Jeff
Kamb, Alexander
Harshman, Keith D.
Shattuck-Eidens, Donna M.
Tavtigian, Sean V.
Wiseman, Roger W.
Futreal, P. Andrew

(ii) TITLE OF INVENTION: 17q-Linked Breast and Ovarian Cancer
Susceptibility Gene

(iii) NUMBER OF SEQUENCES: 85

(iv) CORRESPONDENCE ADDRESS:
(A) ADDRESSEE: Venable, Baetjer, Howard & Civiletti, LLP
(B) STREET: 1201 New York Avenue, N.W., Suite 1000
(C) CITY: Washington
(D) STATE: DC
(E) COUNTRY: USA
(F) ZIP: 20005

(v) COMPUTER READABLE FORM:
(A) MEDIUM TYPE: Floppy disk
(B) COMPUTER: IBM PC compatible
(C) OPERATING SYSTEM: PC-DOS/MS-DOS
(D) SOFTWARE: PatentIn Release #1.0, Version #1.30

(vi) CURRENT APPLICATION DATA:
(A) APPLICATION NUMBER:
(B) FILING DATE:
(C) CLASSIFICATION:

(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US
(B) FILING DATE: 07-JUN-1995

(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08/409,305
(B) FILING DATE: 24-MAR-1995

(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08/348,824
(B) FILING DATE: 29-NOV-1994

(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08/308,104
(B) FILING DATE: 16-SEP-1994

(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08/300,266
(B) FILING DATE: 02-SEP-1994

(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08/289,221
(B) FILING DATE: 12-AUG-1994

(viii) ATTORNEY/AGENT INFORMATION:
(A) NAME: Ihnen, Jeffrey L.
(B) REGISTRATION NUMBER: 28,957
(C) REFERENCE/DOCKET NUMBER: 24884-109347

(ix) TELECOMMUNICATION INFORMATION:
(A) TELEPHONE: 202-962-4810
(B) TELEFAX: 202-962-8300

(2) INFORMATION FOR SEQ ID NO:1:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5914 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: cDNA

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(ix) FEATURE:
(A) NAME/KEY: CDS
(B) LOCATION: 120..5708

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:1:

agctcgctga gacttcctgg accccgcacc aggctgtggg gtttctcaga taactgggcc 60

CCTGCGCTCA GGAGGCCTTC ACCCTCTGCT CTGGGTAAAG TTCATTGGAA CAGAAAGAA 119

ATG GAT TTA TCT GCT CTT CGC GTT GAA GAA GTA CAA AAT GTC ATT AAT 167
Met Asp Leu Ser Ala Leu Arg Val Glu Glu Val Gln Asn Val Ile Asn
1 5 10 15

GCT ATG CAG AAA ATC TTA GAG TGT CCC ATC TGT CTG GAG TTG ATC AAG 215
Ala Met Gln Lys Ile Leu Glu Cys Pro Ile Cys Leu Glu Leu Ile Lys
20 25 30

GAA CCT GTC TCC ACA AAG TGT GAC CAC ATA TTT TGC AAA TTT TGC ATG 263
Glu Pro Val Ser Thr Lys Cys Asp His Ile Phe Cys Lys Phe Cys Met
35 40 45

CTG AAA CTT CTC AAC CAG AAG AAA GGG CCT TCA CAG TGT CCT TTA TGT 311
Leu Lys Leu Leu Asn Gln Lys Lys Gly Pro Ser Gln Cys Pro Leu Cys
50 55 60

AAG AAT GAT ATA ACC AAA AGG AGC CTA CAA GAA AGT ACG AGA TTT AGT 359
Lys Asn Asp Ile Thr Lys Arg Ser Leu Gln Glu Ser Thr Arg Phe Ser
65 70 75 80

CAA CTT GTT GAA GAG CTA TTG AAA ATC ATT TGT GCT TTT CAG CTT GAC 407
Gln Leu Val Glu Glu Leu Leu Lys Ile Ile Cys Ala Phe Gln Leu Asp
85 90 95

ACA GGT TTG GAG TAT GCA AAC AGC TAT AAT TTT GCA AAA AAG GAA AAT 455
Thr Gly Leu Glu Tyr Ala Asn Ser Tyr Asn Phe Ala Lys Lys Glu Asn
100 105 110

AAC TCT CCT GAA CAT CTA AAA GAT GAA GTT TCT ATC ATC CAA AGT ATG 503
Asn Ser Pro Glu His Leu Lys Asp Glu Val Ser Ile Ile Gln Ser Met
115 120 125

GGC TAC AGA AAC CGT GCC AAA AGA CTT CTA CAG AGT GAA CCC GAA AAT 551
Gly Tyr Arg Asn Arg Ala Lys Arg Leu Leu Gln Ser Glu Pro Glu Asn
130 135 140

CCT TCC TTG CAG GAA ACC AGT CTC AGT GTC CAA CTC TCT AAC CTT GGA 599
Pro Ser Leu Gln Glu Thr Ser Leu Ser Val Gln Leu Ser Asn Leu Gly
145 150 155 160

ACT GTG AGA ACT CTG AGG ACA AAG CAG CGG ATA CAA CCT CAA AAG ACG 647
Thr Val Arg Thr Leu Arg Thr Lys Gln Arg Ile Gln Pro Gln Lys Thr
165 170 175

TCT GTC TAC ATT GAA TTG GGA TCT GAT TCT TCT GAA GAT ACC GTT AAT 695
Ser Val Tyr Ile Glu Leu Gly Ser Asp Ser Ser Glu Asp Thr Val Asn
180 185 190

AAG GCA ACT TAT TGC AGT GTG GGA GAT CAA GAA TTG TTA CAA ATC ACC 743
Lys Ala Thr Tyr Cys Ser Val Gly Asp Gln Glu Leu Leu Gln Ile Thr
195 200 205

CCT CAA GGA ACC AGG GAT GAA ATC AGT TTG GAT TCT GCA AAA AAG GCT 791
Pro Gln Gly Thr Arg Asp Glu Ile Ser Leu Asp Ser Ala Lys Lys Ala
210 215 220

GCT TGT GAA TTT TCT GAG ACG GAT GTA ACA AAT ACT GAA CAT CAT CAA 839
Ala Cys Glu Phe Ser Glu Thr Asp Val Thr Asn Thr Glu His His Gln
225 230 235 240

CCC AGT AAT AAT GAT TTG AAC ACC ACT GAG AAG CGT GCA GCT GAG AGG 887
Pro Ser Asn Asn Asp Leu Asn Thr Thr Glu Lys Arg Ala Ala Glu Arg
245 250 255

CAT CCA GAA AAG TAT CAG GGT AGT TCT GTT TCA AAC TTG CAT GTG GAG 935
His Pro Glu Lys Tyr Gln Gly Ser Ser Val Ser Asn Leu His Val Glu
260 265 270

CCA TGT GGC ACA AAT ACT CAT GCC AGC TCA TTA CAG CAT GAG AAC AGC 983
Pro Cys Gly Thr Asn Thr His Ala Ser Ser Leu Gln His Glu Asn Ser
275 280 285

AGT TTA TTA CTC ACT AAA GAC AGA ATG AAT GTA GAA AAG GCT GAA TTC 1031
Ser Leu Leu Leu Thr Lys Asp Arg Met Asn Val Glu Lys Ala Glu Phe
290 295 300

TGT AAT AAA AGC AAA CAG CCT GGC TTA GCA AGG AGC CAA CAT AAC AGA 1079
Cys Asn Lys Ser Lys Gln Pro Gly Leu Ala Arg Ser Gln His Asn Arg
305 310 315 320

TGG GCT GGA AGT AAG GAA ACA TGT AAT GAT AGG CGG ACT CCC AGC ACA 1127
Trp Ala Gly Ser Lys Glu Thr Cys Asn Asp Arg Arg Thr Pro Ser Thr
325 330 335

GAA AAA AAG GTA GAT CTG AAT GCT GAT CCC CTG TGT GAG AGA AAA GAA 1175
Glu Lys Lys Val Asp Leu Asn Ala Asp Pro Leu Cys Glu Arg Lys Glu
340 345 350

TGG AAT AAG CAG AAA CTG CCA TGC TCA GAG AAT CCT AGA GAT ACT GAA 1223
Trp Asn Lys Gln Lys Leu Pro Cys Ser Glu Asn Pro Arg Asp Thr Glu
355 360 365

GAT GTT CCT TGG ATA ACA CTA AAT AGC AGC ATT CAG AAA GTT AAT GAG 1271
Asp Val Pro Trp Ile Thr Leu Asn Ser Ser Ile Gln Lys Val Asn Glu
370 375 380

TGG TTT TCC AGA AGT GAT GAA CTG TTA GGT TCT GAT GAC TCA CAT GAT 1319
Trp Phe Ser Arg Ser Asp Glu Leu Leu Gly Ser Asp Asp Ser His Asp
385 390 395 400

GGG GAG TCT GAA TCA AAT GCC AAA GTA GCT GAT GTA TTG GAC GTT CTA 1367
Gly Glu Ser Glu Ser Asn Ala Lys Val Ala Asp Val Leu Asp Val Leu
405 410 415

AAT GAG GTA GAT GAA TAT TCT GGT TCT TCA GAG AAA ATA GAC TTA CTG 1415
Asn Glu Val Asp Glu Tyr Ser Gly Ser Ser Glu Lys Ile Asp Leu Leu
420 425 430

GCC AGT GAT CCT CAT GAG GCT TTA ATA TGT AAA AGT GAA AGA GTT CAC 1463
Ala Ser Asp Pro His Glu Ala Leu Ile Cys Lys Ser Glu Arg Val His
435 440 445

TCC AAA TCA GTA GAG AGT AAT ATT GAA GAC AAA ATA TTT GGG AAA ACC 1511
Ser Lys Ser Val Glu Ser Asn Ile Glu Asp Lys Ile Phe Gly Lys Thr
450 455 460

TAT CGG AAG AAG GCA AGC CTC CCC AAC TTA AGC CAT GTA ACT GAA AAT 1559
Tyr Arg Lys Lys Ala Ser Leu Pro Asn Leu Ser His Val Thr Glu Asn
465 470 475 480

CTA ATT ATA GGA GCA TTT GTT ACT GAG CCA CAG ATA ATA CAA GAG CGT 1607
Leu Ile Ile Gly Ala Phe Val Thr Glu Pro Gln Ile Ile Gln Glu Arg
485 490 495

CCC CTC ACA AAT AAA TTA AAG CGT AAA AGG AGA CCT ACA TCA GGC CTT 1655
Pro Leu Thr Asn Lys Leu Lys Arg Lys Arg Arg Pro Thr Ser Gly Leu
500 505 510

CAT CCT GAG GAT TTT ATC AAG AAA GCA GAT TTG GCA GTT CAA AAG ACT 1703
His Pro Glu Asp Phe Ile Lys Lys Ala Asp Leu Ala Val Gln Lys Thr
515 520 525

CCT GAA ATG ATA AAT CAG GGA ACT AAC CAA ACG GAG CAG AAT GGT CAA 1751
Pro Glu Met Ile Asn Gln Gly Thr Asn Gln Thr Glu Gln Asn Gly Gln
530 535 540

GTG ATG AAT ATT ACT AAT AGT GGT CAT GAG AAT AAA ACA AAA GGT GAT 1799
Val Met Asn Ile Thr Asn Ser Gly His Glu Asn Lys Thr Lys Gly Asp
545 550 555 560

TCT ATT CAG AAT GAG AAA AAT CCT AAC CCA ATA GAA TCA CTC GAA AAA 1847
Ser Ile Gln Asn Glu Lys Asn Pro Asn Pro Ile Glu Ser Leu Glu Lys
565 570 575

GAA TCT GCT TTC AAA ACG AAA GCT GAA CCT ATA AGC AGC AGT ATA AGC 1895
Glu Ser Ala Phe Lys Thr Lys Ala Glu Pro Ile Ser Ser Ser Ile Ser
580 585 590

AAT ATG GAA CTC GAA TTA AAT ATC CAC AAT TCA AAA GCA CCT AAA AAG 1943
Asn Met Glu Leu Glu Leu Asn Ile His Asn Ser Lys Ala Pro Lys Lys
595 600 605

AAT AGG CTG AGG AGG AAG TCT TCT ACC AGG CAT ATT CAT GCG CTT GAA 1991
Asn Arg Leu Arg Arg Lys Ser Ser Thr Arg His Ile His Ala Leu Glu
610 615 620

CTA GTA GTC AGT AGA AAT CTA AGC CCA CCT AAT TGT ACT GAA TTG CAA 2039
Leu Val Val Ser Arg Asn Leu Ser Pro Pro Asn Cys Thr Glu Leu Gln
625 630 635 640

ATT GAT AGT TGT TCT AGC AGT GAA GAG ATA AAG AAA AAA AAG TAC AAC 2087
Ile Asp Ser Cys Ser Ser Ser Glu Glu Ile Lys Lys Lys Lys Tyr Asn
645 650 655

CAA ATG CCA GTC AGG CAC AGC AGA AAC CTA CAA CTC ATG GAA GGT AAA 2135
Gln Met Pro Val Arg His Ser Arg Asn Leu Gln Leu Met Glu Gly Lys
660 665 670

GAA CCT GCA ACT GGA GCC AAG AAG AGT AAC AAG CCA AAT GAA CAG ACA 2183
Glu Pro Ala Thr Gly Ala Lys Lys Ser Asn Lys Pro Asn Glu Gln Thr
675 680 685

AGT AAA AGA CAT GAC AGC GAT ACT TTC CCA GAG CTG AAG TTA ACA AAT 2231
Ser Lys Arg His Asp Ser Asp Thr Phe Pro Glu Leu Lys Leu Thr Asn
690 695 700

GCA CCT GGT TCT TTT ACT AAG TGT TCA AAT ACC AGT GAA CTT AAA GAA 2279
Ala Pro Gly Ser Phe Thr Lys Cys Ser Asn Thr Ser Glu Leu Lys Glu
705 710 715 720

TTT GTC AAT CCT AGC CTT CCA AGA GAA GAA AAA GAA GAG AAA CTA GAA 2327
Phe Val Asn Pro Ser Leu Pro Arg Glu Glu Lys Glu Glu Lys Leu Glu
725 730 735

ACA GTT AAA GTG TCT AAT AAT GCT GAA GAC CCC AAA GAT CTC ATG TTA 2375
Thr Val Lys Val Ser Asn Asn Ala Glu Asp Pro Lys Asp Leu Met Leu
740 745 750

AGT GGA GAA AGG GTT TTG CAA ACT GAA AGA TCT GTA GAG AGT AGC AGT 2423
Ser Gly Glu Arg Val Leu Gln Thr Glu Arg Ser Val Glu Ser Ser Ser
755 760 765

ATT TCA TTG GTA CCT GGT ACT GAT TAT GGC ACT CAG GAA AGT ATC TCG 2471
Ile Ser Leu Val Pro Gly Thr Asp Tyr Gly Thr Gln Glu Ser Ile Ser
770 775 780

TTA CTG GAA GTT AGC ACT CTA GGG AAG GCA AAA ACA GAA CCA AAT AAA 2519
Leu Leu Glu Val Ser Thr Leu Gly Lys Ala Lys Thr Glu Pro Asn Lys
785 790 795 800

TGT GTG AGT CAG TGT GCA GCA TTT GAA AAC CCC AAG GGA CTA ATT CAT 2567
Cys Val Ser Gln Cys Ala Ala Phe Glu Asn Pro Lys Gly Leu Ile His
805 810 815

GGT TGT TCC AAA GAT AAT AGA AAT GAC ACA GAA GGC TTT AAG TAT CCA 2615
Gly Cys Ser Lys Asp Asn Arg Asn Asp Thr Glu Gly Phe Lys Tyr Pro
820 825 830

TTG GGA CAT GAA GTT AAC CAC AGT CGG GAA ACA AGC ATA GAA ATG GAA 2663
Leu Gly His Glu Val Asn His Ser Arg Glu Thr Ser Ile Glu Met Glu
835 840 845

GAA AGT GAA CTT GAT GCT CAG TAT TTG CAG AAT ACA TTC AAG GTT TCA 2711
Glu Ser Glu Leu Asp Ala Gln Tyr Leu Gln Asn Thr Phe Lys Val Ser
850 855 860

AAG CGC CAG TCA TTT GCT CCG TTT TCA AAT CCA GGA AAT GCA GAA GAG 2759
Lys Arg Gln Ser Phe Ala Pro Phe Ser Asn Pro Gly Asn Ala Glu Glu
865 870 875 880

GAA TGT GCA ACA TTC TCT GCC CAC TCT GGG TCC TTA AAG AAA CAA AGT 2807
Glu Cys Ala Thr Phe Ser Ala His Ser Gly Ser Leu Lys Lys Gln Ser
885 890 895

CCA AAA GTC ACT TTT GAA TGT GAA CAA AAG GAA GAA AAT CAA GGA AAG 2855
Pro Lys Val Thr Phe Glu Cys Glu Gln Lys Glu Glu Asn Gln Gly Lys
900 905 910

AAT GAG TCT AAT ATC AAG CCT GTA CAG ACA GTT AAT ATC ACT GCA GGC 2903
Asn Glu Ser Asn Ile Lys Pro Val Gln Thr Val Asn Ile Thr Ala Gly
915 920 925

TTT CCT GTG GTT GGT CAG AAA GAT AAG CCA GTT GAT AAT GCC AAA TGT 2951
Phe Pro Val Val Gly Gln Lys Asp Lys Pro Val Asp Asn Ala Lys Cys
930 935 940

AGT ATC AAA GGA GGC TCT AGG TTT TGT CTA TCA TCT CAG TTC AGA GGC 2999
Ser Ile Lys Gly Gly Ser Arg Phe Cys Leu Ser Ser Gln Phe Arg Gly
945 950 955 960

AAC GAA ACT GGA CTC ATT ACT CCA AAT AAA CAT GGA CTT TTA CAA AAC 3047
Asn Glu Thr Gly Leu Ile Thr Pro Asn Lys His Gly Leu Leu Gln Asn
965 970 975

CCA TAT CGT ATA CCA CCA CTT TTT CCC ATC AAG TCA TTT GTT AAA ACT 3095
Pro Tyr Arg Ile Pro Pro Leu Phe Pro Ile Lys Ser Phe Val Lys Thr
980 985 990

AAA TGT AAG AAA AAT CTG CTA GAG GAA AAC TTT GAG GAA CAT TCA ATG 3143
Lys Cys Lys Lys Asn Leu Leu Glu Glu Asn Phe Glu Glu His Ser Met
995 1000 1005

TCA CCT GAA AGA GAA ATG GGA AAT GAG AAC ATT CCA AGT ACA GTG AGC 3191
Ser Pro Glu Arg Glu Met Gly Asn Glu Asn Ile Pro Ser Thr Val Ser
1010 1015 1020

ACA ATT AGC CGT AAT AAC ATT AGA GAA AAT GTT TTT AAA GAA GCC AGC 3239
Thr Ile Ser Arg Asn Asn Ile Arg Glu Asn Val Phe Lys Glu Ala Ser
1025 1030 1035 1040

TCA AGC AAT ATT AAT GAA GTA GGT TCC AGT ACT AAT GAA GTG GGC TCC 3287
Ser Ser Asn Ile Asn Glu Val Gly Ser Ser Thr Asn Glu Val Gly Ser
1045 1050 1055

AGT ATT AAT GAA ATA GGT TCC AGT GAT GAA AAC ATT CAA GCA GAA CTA 3335
Ser Ile Asn Glu Ile Gly Ser Ser Asp Glu Asn Ile Gln Ala Glu Leu
1060 1065 1070

GGT AGA AAC AGA GGG CCA AAA TTG AAT GCT ATG CTT AGA TTA GGG GTT 3383
Gly Arg Asn Arg Gly Pro Lys Leu Asn Ala Met Leu Arg Leu Gly Val
1075 1080 1085

TTG CAA CCT GAG GTC TAT AAA CAA AGT CTT CCT GGA AGT AAT TGT AAG 3431
Leu Gln Pro Glu Val Tyr Lys Gln Ser Leu Pro Gly Ser Asn Cys Lys
1090 1095 1100

CAT CCT GAA ATA AAA AAG CAA GAA TAT GAA GAA GTA GTT CAG ACT GTT 3479
His Pro Glu Ile Lys Lys Gln Glu Tyr Glu Glu Val Val Gln Thr Val
1105 1110 1115 1120

AAT ACA GAT TTC TCT CCA TAT CTG ATT TCA GAT AAC TTA GAA CAG CCT 3527
Asn Thr Asp Phe Ser Pro Tyr Leu Ile Ser Asp Asn Leu Glu Gln Pro
1125 1130 1135

ATG GGA AGT AGT CAT GCA TCT CAG GTT TGT TCT GAG ACA CCT GAT GAC 3575
Met Gly Ser Ser His Ala Ser Gln Val Cys Ser Glu Thr Pro Asp Asp
1140 1145 1150

CTG TTA GAT GAT GGT GAA ATA AAG GAA GAT ACT AGT TTT GCT GAA AAT 3623
Leu Leu Asp Asp Gly Glu Ile Lys Glu Asp Thr Ser Phe Ala Glu Asn
1155 1160 1165

GAC ATT AAG GAA AGT TCT GCT GTT TTT AGC AAA AGC GTC CAG AAA GGA 3671
Asp Ile Lys Glu Ser Ser Ala Val Phe Ser Lys Ser Val Gln Lys Gly
1170 1175 1180

GAG CTT AGC AGG AGT CCT AGC CCT TTC ACC CAT ACA CAT TTG GCT CAG 3719
Glu Leu Ser Arg Ser Pro Ser Pro Phe Thr His Thr His Leu Ala Gln
1185 1190 1195 1200

GGT TAC CGA AGA GGG GCC AAG AAA TTA GAG TCC TCA GAA GAG AAC TTA 3767
Gly Tyr Arg Arg Gly Ala Lys Lys Leu Glu Ser Ser Glu Glu Asn Leu
1205 1210 1215

TCT AGT GAG GAT GAA GAG CTT CCC TGC TTC CAA CAC TTG TTA TTT GGT 3815
Ser Ser Glu Asp Glu Glu Leu Pro Cys Phe Gln His Leu Leu Phe Gly
1220 1225 1230

AAA GTA AAC AAT ATA CCT TCT CAG TCT ACT AGG CAT AGC ACC GTT GCT 3863
Lys Val Asn Asn Ile Pro Ser Gln Ser Thr Arg His Ser Thr Val Ala
1235 1240 1245

ACC GAG TGT CTG TCT AAG AAC ACA GAG GAG AAT TTA TTA TCA TTG AAG 3911
Thr Glu Cys Leu Ser Lys Asn Thr Glu Glu Asn Leu Leu Ser Leu Lys
1250 1255 1260

AAT AGC TTA AAT GAC TGC AGT AAC CAG GTA ATA TTG GCA AAG GCA TCT 3959
Asn Ser Leu Asn Asp Cys Ser Asn Gln Val Ile Leu Ala Lys Ala Ser
1265 1270 1275 1280

CAG GAA CAT CAC CTT AGT GAG GAA ACA AAA TGT TCT GCT AGC TTG TTT 4007
Gln Glu His His Leu Ser Glu Glu Thr Lys Cys Ser Ala Ser Leu Phe
1285 1290 1295

TCT TCA CAG TGC AGT GAA TTG GAA GAC TTG ACT GCA AAT ACA AAC ACC 4055
Ser Ser Gln Cys Ser Glu Leu Glu Asp Leu Thr Ala Asn Thr Asn Thr
1300 1305 1310

CAG GAT CCT TTC TTG ATT GGT TCT TCC AAA CAA ATG AGG CAT CAG TCT 4103
Gln Asp Pro Phe Leu Ile Gly Ser Ser Lys Gln Met Arg His Gln Ser
1315 1320 1325

GAA AGC CAG GGA GTT GGT CTG AGT GAC AAG GAA TTG GTT TCA GAT GAT 4151
Glu Ser Gln Gly Val Gly Leu Ser Asp Lys Glu Leu Val Ser Asp Asp
1330 1335 1340

GAA GAA AGA GGA ACG GGC TTG GAA GAA AAT AAT CAA GAA GAG CAA AGC 4199
Glu Glu Arg Gly Thr Gly Leu Glu Glu Asn Asn Gln Glu Glu Gln Ser
1345 1350 1355 1360

ATG GAT TCA AAC TTA GGT GAA GCA GCA TCT GGG TGT GAG AGT GAA ACA 4247
Met Asp Ser Asn Leu Gly Glu Ala Ala Ser Gly Cys Glu Ser Glu Thr
1365 1370 1375

AGC GTC TCT GAA GAC TGC TCA GGG CTA TCC TCT CAG AGT GAC ATT TTA 4295
Ser Val Ser Glu Asp Cys Ser Gly Leu Ser Ser Gln Ser Asp Ile Leu
1380 1385 1390

ACC ACT CAG CAG AGG GAT ACC ATG CAA CAT AAC CTG ATA AAG CTC CAG 4343
Thr Thr Gln Gln Arg Asp Thr Met Gln His Asn Leu Ile Lys Leu Gln
1395 1400 1405

CAG GAA ATG GCT GAA CTA GAA GCT GTG TTA GAA CAG CAT GGG AGC CAG 4391
Gln Glu Met Ala Glu Leu Glu Ala Val Leu Glu Gln His Gly Ser Gln
1410 1415 1420

CCT TCT AAC AGC TAC CCT TCC ATC ATA AGT GAC TCT TCT GCC CTT GAG 4439
Pro Ser Asn Ser Tyr Pro Ser Ile Ile Ser Asp Ser Ser Ala Leu Glu
1425 1430 1435 1440

GAC CTG CGA AAT CCA GAA CAA AGC ACA TCA GAA AAA GCA GTA TTA ACT 4487
Asp Leu Arg Asn Pro Glu Gln Ser Thr Ser Glu Lys Ala Val Leu Thr
1445 1450 1455

TCA CAG AAA AGT AGT GAA TAC CCT ATA AGC CAG AAT CCA GAA GGC CTT 4535
Ser Gln Lys Ser Ser Glu Tyr Pro Ile Ser Gln Asn Pro Glu Gly Leu
1460 1465 1470

TCT GCT GAC AAG TTT GAG GTG TCT GCA GAT AGT TCT ACC AGT AAA AAT 4583
Ser Ala Asp Lys Phe Glu Val Ser Ala Asp Ser Ser Thr Ser Lys Asn
1475 1480 1485

AAA GAA CCA GGA GTG GAA AGG TCA TCC CCT TCT AAA TGC CCA TCA TTA 4631
Lys Glu Pro Gly Val Glu Arg Ser Ser Pro Ser Lys Cys Pro Ser Leu
1490 1495 1500

GAT GAT AGG TGG TAC ATG CAC AGT TGC TCT GGG AGT CTT CAG AAT AGA 4679
Asp Asp Arg Trp Tyr Met His Ser Cys Ser Gly Ser Leu Gln Asn Arg
1505 1510 1515 1520

AAC TAC CCA TCT CAA GAG GAG CTC ATT AAG GTT GTT GAT GTG GAG GAG 4727
Asn Tyr Pro Ser Gln Glu Glu Leu Ile Lys Val Val Asp Val Glu Glu
1525 1530 1535

CAA CAG CTG GAA GAG TCT GGG CCA CAC GAT TTG ACG GAA ACA TCT TAC 4775
Gln Gln Leu Glu Glu Ser Gly Pro His Asp Leu Thr Glu Thr Ser Tyr
1540 1545 1550

TTG CCA AGG CAA GAT CTA GAG GGA ACC CCT TAC CTG GAA TCT GGA ATC 4823
Leu Pro Arg Gln Asp Leu Glu Gly Thr Pro Tyr Leu Glu Ser Gly Ile
1555 1560 1565

AGC CTC TTC TCT GAT GAC CCT GAA TCT GAT CCT TCT GAA GAC AGA GCC 4871
Ser Leu Phe Ser Asp Asp Pro Glu Ser Asp Pro Ser Glu Asp Arg Ala
1570 1575 1580

CCA GAG TCA GCT CGT GTT GGC AAC ATA CCA TCT TCA ACC TCT GCA TTG 4919
Pro Glu Ser Ala Arg Val Gly Asn Ile Pro Ser Ser Thr Ser Ala Leu
1585 1590 1595 1600

AAA GTT CCC CAA TTG AAA GTT GCA GAA TCT GCC CAG AGT CCA GCT GCT 4967
Lys Val Pro Gln Leu Lys Val Ala Glu Ser Ala Gln Ser Pro Ala Ala
1605 1610 1615

GCT CAT ACT ACT GAT ACT GCT GGG TAT AAT GCA ATG GAA GAA AGT GTG 5015
Ala His Thr Thr Asp Thr Ala Gly Tyr Asn Ala Met Glu Glu Ser Val
1620 1625 1630

AGC AGG GAG AAG CCA GAA TTG ACA GCT TCA ACA GAA AGG GTC AAC AAA 5063
Ser Arg Glu Lys Pro Glu Leu Thr Ala Ser Thr Glu Arg Val Asn Lys
1635 1640 1645

AGA ATG TCC ATG GTG GTG TCT GGC CTG ACC CCA GAA GAA TTT ATG CTC 5111
Arg Met Ser Met Val Val Ser Gly Leu Thr Pro Glu Glu Phe Met Leu
1650 1655 1660

GTG TAC AAG TTT GCC AGA AAA CAC CAC ATC ACT TTA ACT AAT CTA ATT 5159
Val Tyr Lys Phe Ala Arg Lys His His Ile Thr Leu Thr Asn Leu Ile
1665 1670 1675 1680

ACT GAA GAG ACT ACT CAT GTT GTT ATG AAA ACA GAT GCT GAG TTT GTG 5207
Thr Glu Glu Thr Thr His Val Val Met Lys Thr Asp Ala Glu Phe Val
1685 1690 1695

TGT GAA CGG ACA CTG AAA TAT TTT CTA GGA ATT GCG GGA GGA AAA TGG 5255
Cys Glu Arg Thr Leu Lys Tyr Phe Leu Gly Ile Ala Gly Gly Lys Trp
1700 1705 1710

GTA GTT AGC TAT TTC TGG GTG ACC CAG TCT ATT AAA GAA AGA AAA ATG 5303
Val Val Ser Tyr Phe Trp Val Thr Gln Ser Ile Lys Glu Arg Lys Met
1715 1720 1725

CTG AAT GAG CAT GAT TTT GAA GTC AGA GGA GAT GTG GTC AAT GGA AGA 5351
Leu Asn Glu His Asp Phe Glu Val Arg Gly Asp Val Val Asn Gly Arg
1730 1735 1740

AAC CAC CAA GGT CCA AAG CGA GCA AGA GAA TCC CAG GAC AGA AAG ATC 5399
Asn His Gln Gly Pro Lys Arg Ala Arg Glu Ser Gln Asp Arg Lys Ile
1745 1750 1755 1760

TTC AGG GGG CTA GAA ATC TGT TGC TAT GGG CCC TTC ACC AAC ATG CCC 5447
Phe Arg Gly Leu Glu Ile Cys Cys Tyr Gly Pro Phe Thr Asn Met Pro
1765 1770 1775

ACA GAT CAA CTG GAA TGG ATG GTA CAG CTG TGT GGT GCT TCT GTG GTG 5495
Thr Asp Gln Leu Glu Trp Met Val Gln Leu Cys Gly Ala Ser Val Val
1780 1785 1790

AAG GAG CTT TCA TCA TTC ACC CTT GGC ACA GGT GTC CAC CCA ATT GTG 5543
Lys Glu Leu Ser Ser Phe Thr Leu Gly Thr Gly Val His Pro Ile Val
1795 1800 1805

GTT GTG CAG CCA GAT GCC TGG ACA GAG GAC AAT GGC TTC CAT GCA ATT 5591
Val Val Gln Pro Asp Ala Trp Thr Glu Asp Asn Gly Phe His Ala Ile
1810 1815 1820

GGG CAG ATG TGT GAG GCA CCT GTG GTG ACC CGA GAG TGG GTG TTG GAC 5639
Gly Gln Met Cys Glu Ala Pro Val Val Thr Arg Glu Trp Val Leu Asp
1825 1830 1835 1840

AGT GTA GCA CTC TAC CAG TGC CAG GAG CTG GAC ACC TAC CTG ATA CCC 5687
Ser Val Ala Leu Tyr Gln Cys Gln Glu Leu Asp Thr Tyr Leu Ile Pro
1845 1850 1855

CAG ATC CCC CAC AGC CAC TAC TGA CTGCAGCCAG CCACAGGTAC AGAGCCACAG 5741
Gln Ile Pro His Ser His Tyr *
1860

GACCCCAAGA ATGAGCTTAC AAAGTGGCCT TTCCAGGCCC TGGGAGCTCC TCTCACTCTT 5801

CAGTCCTTCT ACTGTCCTGG CTACTAAATA TTTTATGTAC ATCAGCCTGA AAAGGACTTC 5861

TGGCTATGCA AGGGTCCCTT AAAGATTTTC TGCTTGAAGT CTCCCTTGGA AAT 5914

(2) INFORMATION FOR SEQ ID NO:2:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1863 amino acids
(B) TYPE: amino acid
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:2:

Met Asp Leu Ser Ala Leu Arg Val Glu Glu Val Gln Asn Val Ile Asn
1 5 10 15

Ala Met Gln Lys Ile Leu Glu Cys Pro Ile Cys Leu Glu Leu Ile Lys
20 25 30

Glu Pro Val Ser Thr Lys Cys Asp His Ile Phe Cys Lys Phe Cys Met
35 40 45

Leu Lys Leu Leu Asn Gln Lys Lys Gly Pro Ser Gln Cys Pro Leu Cys
50 55 60

Lys Asn Asp Ile Thr Lys Arg Ser Leu Gln Glu Ser Thr Arg Phe Ser
65 70 75 80

Gln Leu Val Glu Glu Leu Leu Lys Ile Ile Cys Ala Phe Gln Leu Asp
85 90 95

Thr Gly Leu Glu Tyr Ala Asn Ser Tyr Asn Phe Ala Lys Lys Glu Asn
100 105 110

Asn Ser Pro Glu His Leu Lys Asp Glu Val Ser Ile Ile Gln Ser Met
115 120 125

Gly Tyr Arg Asn Arg Ala Lys Arg Leu Leu Gln Ser Glu Pro Glu Asn
130 135 140

Pro Ser Leu Gln Glu Thr Ser Leu Ser Val Gln Leu Ser Asn Leu Gly
145 150 155 160

Thr Val Arg Thr Leu Arg Thr Lys Gln Arg Ile Gln Pro Gln Lys Thr
165 170 175

Ser Val Tyr Ile Glu Leu Gly Ser Asp Ser Ser Glu Asp Thr Val Asn
180 185 190

Lys Ala Thr Tyr Cys Ser Val Gly Asp Gln Glu Leu Leu Gln Ile Thr
195 200 205

Pro Gln Gly Thr Arg Asp Glu Ile Ser Leu Asp Ser Ala Lys Lys Ala
210 215 220

Ala Cys Glu Phe Ser Glu Thr Asp Val Thr Asn Thr Glu His His Gln
225 230 235 240

Pro Ser Asn Asn Asp Leu Asn Thr Thr Glu Lys Arg Ala Ala Glu Arg
245 250 255

His Pro Glu Lys Tyr Gln Gly Ser Ser Val Ser Asn Leu His Val Glu
260 265 270

Pro Cys Gly Thr Asn Thr His Ala Ser Ser Leu Gln His Glu Asn Ser
275 280 285

Ser Leu Leu Leu Thr Lys Asp Arg Met Asn Val Glu Lys Ala Glu Phe
290 295 300

Cys Asn Lys Ser Lys Gln Pro Gly Leu Ala Arg Ser Gln His Asn Arg
305 310 315 320

Trp Ala Gly Ser Lys Glu Thr Cys Asn Asp Arg Arg Thr Pro Ser Thr
325 330 335

Glu Lys Lys Val Asp Leu Asn Ala Asp Pro Leu Cys Glu Arg Lys Glu
340 345 350

Trp Asn Lys Gln Lys Leu Pro Cys Ser Glu Asn Pro Arg Asp Thr Glu
355 360 365

Asp Val Pro Trp Ile Thr Leu Asn Ser Ser Ile Gln Lys Val Asn Glu
370 375 380

Trp Phe Ser Arg Ser Asp Glu Leu Leu Gly Ser Asp Asp Ser His Asp
385 390 395 400

Gly Glu Ser Glu Ser Asn Ala Lys Val Ala Asp Val Leu Asp Val Leu
405 410 415

Asn Glu Val Asp Glu Tyr Ser Gly Ser Ser Glu Lys Ile Asp Leu Leu
420 425 430

Ala Ser Asp Pro His Glu Ala Leu Ile Cys Lys Ser Glu Arg Val His
435 440 445

Ser Lys Ser Val Glu Ser Asn Ile Glu Asp Lys Ile Phe Gly Lys Thr
450 455 460

Tyr Arg Lys Lys Ala Ser Leu Pro Asn Leu Ser His Val Thr Glu Asn
465 470 475 480

Leu Ile Ile Gly Ala Phe Val Thr Glu Pro Gln Ile Ile Gln Glu Arg
485 490 495

Pro Leu Thr Asn Lys Leu Lys Arg Lys Arg Arg Pro Thr Ser Gly Leu
500 505 510

His Pro Glu Asp Phe Ile Lys Lys Ala Asp Leu Ala Val Gln Lys Thr
515 520 525

Pro Glu Met Ile Asn Gln Gly Thr Asn Gln Thr Glu Gln Asn Gly Gln
530 535 540

Val Met Asn Ile Thr Asn Ser Gly His Glu Asn Lys Thr Lys Gly Asp
545 550 555 560

Ser Ile Gln Asn Glu Lys Asn Pro Asn Pro Ile Glu Ser Leu Glu Lys
565 570 575

Glu Ser Ala Phe Lys Thr Lys Ala Glu Pro Ile Ser Ser Ser Ile Ser
580 585 590

Asn Met Glu Leu Glu Leu Asn Ile His Asn Ser Lys Ala Pro Lys Lys
595 600 605

Asn Arg Leu Arg Arg Lys Ser Ser Thr Arg His Ile His Ala Leu Glu
610 615 620

Leu Val Val Ser Arg Asn Leu Ser Pro Pro Asn Cys Thr Glu Leu Gln
625 630 635 640

Ile Asp Ser Cys Ser Ser Ser Glu Glu Ile Lys Lys Lys Lys Tyr Asn
645 650 655

Gln Met Pro Val Arg His Ser Arg Asn Leu Gln Leu Met Glu Gly Lys
660 665 670

Glu Pro Ala Thr Gly Ala Lys Lys Ser Asn Lys Pro Asn Glu Gln Thr
675 680 685

Ser Lys Arg His Asp Ser Asp Thr Phe Pro Glu Leu Lys Leu Thr Asn
690 695 700

Ala Pro Gly Ser Phe Thr Lys Cys Ser Asn Thr Ser Glu Leu Lys Glu
705 710 715 720

Phe Val Asn Pro Ser Leu Pro Arg Glu Glu Lys Glu Glu Lys Leu Glu
725 730 735

Thr Val Lys Val Ser Asn Asn Ala Glu Asp Pro Lys Asp Leu Met Leu
740 745 750

Ser Gly Glu Arg Val Leu Gln Thr Glu Arg Ser Val Glu Ser Ser Ser
755 760 765

Ile Ser Leu Val Pro Gly Thr Asp Tyr Gly Thr Gln Glu Ser Ile Ser
770 775 780

Leu Leu Glu Val Ser Thr Leu Gly Lys Ala Lys Thr Glu Pro Asn Lys
785 790 795 800

Cys Val Ser Gln Cys Ala Ala Phe Glu Asn Pro Lys Gly Leu Ile His
805 810 815

Gly Cys Ser Lys Asp Asn Arg Asn Asp Thr Glu Gly Phe Lys Tyr Pro
820 825 830

Leu Gly His Glu Val Asn His Ser Arg Glu Thr Ser Ile Glu Met Glu
835 840 845

Glu Ser Glu Leu Asp Ala Gln Tyr Leu Gln Asn Thr Phe Lys Val Ser
850 855 860

Lys Arg Gln Ser Phe Ala Pro Phe Ser Asn Pro Gly Asn Ala Glu Glu
865 870 875 880

Glu Cys Ala Thr Phe Ser Ala His Ser Gly Ser Leu Lys Lys Gln Ser
885 890 895

Pro Lys Val Thr Phe Glu Cys Glu Gln Lys Glu Glu Asn Gln Gly Lys
900 905 910

Asn Glu Ser Asn Ile Lys Pro Val Gln Thr Val Asn Ile Thr Ala Gly
915 920 925

Phe Pro Val Val Gly Gln Lys Asp Lys Pro Val Asp Asn Ala Lys Cys
930 935 940

Ser Ile Lys Gly Gly Ser Arg Phe Cys Leu Ser Ser Gln Phe Arg Gly
945 950 955 960

Asn Glu Thr Gly Leu Ile Thr Pro Asn Lys His Gly Leu Leu Gln Asn
965 970 975

Pro Tyr Arg Ile Pro Pro Leu Phe Pro Ile Lys Ser Phe Val Lys Thr
980 985 990

Lys Cys Lys Lys Asn Leu Leu Glu Glu Asn Phe Glu Glu His Ser Met
995 1000 1005

Ser Pro Glu Arg Glu Met Gly Asn Glu Asn Ile Pro Ser Thr Val Ser
1010 1015 1020

Thr Ile Ser Arg Asn Asn Ile Arg Glu Asn Val Phe Lys Glu Ala Ser
1025 1030 1035 1040

Ser Ser Asn Ile Asn Glu Val Gly Ser Ser Thr Asn Glu Val Gly Ser
1045 1050 1055

Ser Ile Asn Glu Ile Gly Ser Ser Asp Glu Asn Ile Gln Ala Glu Leu
1060 1065 1070

Gly Arg Asn Arg Gly Pro Lys Leu Asn Ala Met Leu Arg Leu Gly Val
1075 1080 1085

Leu Gln Pro Glu Val Tyr Lys Gln Ser Leu Pro Gly Ser Asn Cys Lys
1090 1095 1100

His Pro Glu Ile Lys Lys Gln Glu Tyr Glu Glu Val Val Gln Thr Val
1105 1110 1115 1120

Asn Thr Asp Phe Ser Pro Tyr Leu Ile Ser Asp Asn Leu Glu Gln Pro
1125 1130 1135

Met Gly Ser Ser His Ala Ser Gln Val Cys Ser Glu Thr Pro Asp Asp
1140 1145 1150

Leu Leu Asp Asp Gly Glu Ile Lys Glu Asp Thr Ser Phe Ala Glu Asn
1155 1160 1165

Asp Ile Lys Glu Ser Ser Ala Val Phe Ser Lys Ser Val Gln Lys Gly
1170 1175 1180

Glu Leu Ser Arg Ser Pro Ser Pro Phe Thr His Thr His Leu Ala Gln
1185 1190 1195 1200

Gly Tyr Arg Arg Gly Ala Lys Lys Leu Glu Ser Ser Glu Glu Asn Leu
1205 1210 1215

Ser Ser Glu Asp Glu Glu Leu Pro Cys Phe Gln His Leu Leu Phe Gly
1220 1225 1230

Lys Val Asn Asn Ile Pro Ser Gln Ser Thr Arg His Ser Thr Val Ala
1235 1240 1245

Thr Glu Cys Leu Ser Lys Asn Thr Glu Glu Asn Leu Leu Ser Leu Lys
1250 1255 1260

Asn Ser Leu Asn Asp Cys Ser Asn Gln Val Ile Leu Ala Lys Ala Ser
1265 1270 1275 1280

Gln Glu His His Leu Ser Glu Glu Thr Lys Cys Ser Ala Ser Leu Phe
1285 1290 1295

Ser Ser Gln Cys Ser Glu Leu Glu Asp Leu Thr Ala Asn Thr Asn Thr
1300 1305 1310

Gln Asp Pro Phe Leu Ile Gly Ser Ser Lys Gln Met Arg His Gln Ser
1315 1320 1325

Glu Ser Gln Gly Val Gly Leu Ser Asp Lys Glu Leu Val Ser Asp Asp
1330 1335 1340

Glu Glu Arg Gly Thr Gly Leu Glu Glu Asn Asn Gln Glu Glu Gln Ser
1345 1350 1355 1360

Met Asp Ser Asn Leu Gly Glu Ala Ala Ser Gly Cys Glu Ser Glu Thr
1365 1370 1375

Ser Val Ser Glu Asp Cys Ser Gly Leu Ser Ser Gln Ser Asp Ile Leu
1380 1385 1390

Thr Thr Gln Gln Arg Asp Thr Met Gln His Asn Leu Ile Lys Leu Gln
1395 1400 1405

Gln Glu Met Ala Glu Leu Glu Ala Val Leu Glu Gln His Gly Ser Gln
1410 1415 1420

Pro Ser Asn Ser Tyr Pro Ser Ile Ile Ser Asp Ser Ser Ala Leu Glu
1425 1430 1435 1440

Asp Leu Arg Asn Pro Glu Gln Ser Thr Ser Glu Lys Ala Val Leu Thr
1445 1450 1455

Ser Gln Lys Ser Ser Glu Tyr Pro Ile Ser Gln Asn Pro Glu Gly Leu
1460 1465 1470

Ser Ala Asp Lys Phe Glu Val Ser Ala Asp Ser Ser Thr Ser Lys Asn
1475 1480 1485

Lys Glu Pro Gly Val Glu Arg Ser Ser Pro Ser Lys Cys Pro Ser Leu
1490 1495 1500

Asp Asp Arg Trp Tyr Met His Ser Cys Ser Gly Ser Leu Gln Asn Arg
1505 1510 1515 1520

Asn Tyr Pro Ser Gln Glu Glu Leu Ile Lys Val Val Asp Val Glu Glu
1525 1530 1535

Gln Gln Leu Glu Glu Ser Gly Pro His Asp Leu Thr Glu Thr Ser Tyr
1540 1545 1550

Leu Pro Arg Gln Asp Leu Glu Gly Thr Pro Tyr Leu Glu Ser Gly Ile
1555 1560 1565

Ser Leu Phe Ser Asp Asp Pro Glu Ser Asp Pro Ser Glu Asp Arg Ala
1570 1575 1580

Pro Glu Ser Ala Arg Val Gly Asn Ile Pro Ser Ser Thr Ser Ala Leu
1585 1590 1595 1600

Lys Val Pro Gln Leu Lys Val Ala Glu Ser Ala Gln Ser Pro Ala Ala
1605 1610 1615

Ala His Thr Thr Asp Thr Ala Gly Tyr Asn Ala Met Glu Glu Ser Val
1620 1625 1630

Ser Arg Glu Lys Pro Glu Leu Thr Ala Ser Thr Glu Arg Val Asn Lys
1635 1640 1645

Arg Met Ser Met Val Val Ser Gly Leu Thr Pro Glu Glu Phe Met Leu
1650 1655 1660

Val Tyr Lys Phe Ala Arg Lys His His Ile Thr Leu Thr Asn Leu Ile
1665 1670 1675 1680

Thr Glu Glu Thr Thr His Val Val Met Lys Thr Asp Ala Glu Phe Val
1685 1690 1695

Cys Glu Arg Thr Leu Lys Tyr Phe Leu Gly Ile Ala Gly Gly Lys Trp
1700 1705 1710

Val Val Ser Tyr Phe Trp Val Thr Gln Ser Ile Lys Glu Arg Lys Met
1715 1720 1725

Leu Asn Glu His Asp Phe Glu Val Arg Gly Asp Val Val Asn Gly Arg
1730 1735 1740

Asn His Gln Gly Pro Lys Arg Ala Arg Glu Ser Gln Asp Arg Lys Ile
1745 1750 1755 1760

Phe Arg Gly Leu Glu Ile Cys Cys Tyr Gly Pro Phe Thr Asn Met Pro
1765 1770 1775

Thr Asp Gln Leu Glu Trp Met Val Gln Leu Cys Gly Ala Ser Val Val
1780 1785 1790

Lys Glu Leu Ser Ser Phe Thr Leu Gly Thr Gly Val His Pro Ile Val
1795 1800 1805

Val Val Gln Pro Asp Ala Trp Thr Glu Asp Asn Gly Phe His Ala Ile
1810 1815 1820

Gly Gln Met Cys Glu Ala Pro Val Val Thr Arg Glu Trp Val Leu Asp
1825 1830 1835 1840

Ser Val Ala Leu Tyr Gln Cys Gln Glu Leu Asp Thr Tyr Leu Ile Pro
1845 1850 1855

Gln Ile Pro His Ser His Tyr *
1860

(2) INFORMATION FOR SEQ ID NO:3:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: s754 A

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:3:

CTAGCCTGGG CAACAAACGA 20

(2) INFORMATION FOR SEQ ID NO:4:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: s754 B

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:4:

GCAGGAAGCA GGAATGGAAC 20

(2) INFORMATION FOR SEQ ID NO:5:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: s975 A

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:5:

TAGGAGATGG ATTATTGGTG 20

(2) INFORMATION FOR SEQ ID NO:6:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: s975 B

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:6:

AGGCAACTTT GCAATGAGTG 20

(2) INFORMATION FOR SEQ ID NO:7:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: tdj1474 A

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:7:

CAGAGTGAGA CCTTGTCTCA AA 22

(2) INFORMATION FOR SEQ ID NO:8:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: tdj1474 B

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:8:

TTCTGCAAAC ACCTTAAACT CAG 23

(2) INFORMATION FOR SEQ ID NO:9:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: tdj1239 A

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:9:

AACCTGGAAG GCAGAGGTTG 20

(2) INFORMATION FOR SEQ ID NO:10:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: tdj1239 B

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:10:

TCTGTACCTG CTAAGCAGTG G 21

(2) INFORMATION FOR SEQ ID NO:11:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 111 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: cDNA

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(ix) FEATURE:
(A) NAME/KEY: CDS
(B) LOCATION: 2..111

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:11:

G GKC TTA CTC TGT TGT CCC AGC TGG AGT ACA GWG TGC GAT CAT GAG 46
Xaa Leu Leu Cys Cys Pro Ser Trp Ser Thr Xaa Cys Asp His Glu
1865 1870 1875

GCT TAC TGT TGC TTG ACT CCT AGG CTC AAG CGA TCC TAT CAC CTC AGT 94
Ala Tyr Cys Cys Leu Thr Pro Arg Leu Lys Arg Ser Tyr His Leu Ser
1880 1885 1890 1895

CTC CAA GTA GCT GGA CT 111
Leu Gln Val Ala Gly
1900

(2) INFORMATION FOR SEQ ID NO:12:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 36 amino acids
(B) TYPE: amino acid
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:12:

Xaa Leu Leu Cys Cys Pro Ser Trp Ser Thr Xaa Cys Asp His Glu Ala
1 5 10 15

Tyr Cys Cys Leu Thr Pro Arg Leu Lys Arg Ser Tyr His Leu Ser Leu
20 25 30

Gln Val Ala Gly
35

(2) INFORMATION FOR SEQ ID NO:13:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1534 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:13:

GAGGCTAGAG GGCAGGCACT TTATGGCAAA CTCAGGTAGA ATTCTTCCTC TTCCGTCTCT 60

TTCCTTTTAC GTCATCGGGG AGACTGGGTG GCAATCGCAG CCCGAGAGAC GCATGGCTCT 120

TTCTGCCCTC CATCCTCTGA TGTACCTTGA TTTCGTATTC TGAGAGGCTG CTGCTTAGCG 180

GTAGCCCCTT GGTTTCCGTG GCAACGGAAA AGCGCGGGAA TTACAGATAA ATTAAAACTG 240

CGACTGCGCG GCGTGAGCTC GCTGAGACTT CCTGGACCCC GCACCAGGCT GTGGGGTTTC 300

TCAGATAACT GGGCCCCTGC GCTCAGGAGG CCTTCACCCT CTGCTCTGGG TAAAGGTAGT 360

AGAGTCCCGG GAAAGGGACA GGGGGCCCAA GTGATGCTCT GGGGTACTGG CGTGGGAGAG 420

TGGATTTCCG AAGCTGACAG ATGGGTATTC TTTGACGGGG GGTAGGGGCG GAACCTGAGA 480

GGCGTAAGGC GTTGTGAACC CTGGGGAGGG GGGCAGTTTG TAGGTCGCGA GGGAAGCGCT 540

GAGGATCAGG AAGGGGGCAC TGAGTGTCCG TGGGGGAATC CTCGTGATAG GAACTGGAAT 600

ATGCCTTGAG GGGGACACTA TGTCTTTAAA AACGTCGGCT GGTCATGAGG TCAGGAGTTC 660

CAGACCAGCC TGACCAACGT GGTGAAACTC CGTCTCTACT AAAAATACNA AAATTAGCCG 720

GGCGTGGTGC CGCTCCAGCT ACTCAGGAGG CTGAGGCAGG AGAATCGCTA GAACCCGGGA 780

GGCGGAGGTT GCAGTGAGCC GAGATCGCGC CATTGCACTC CAGCCTGGGC GACAGAGCGA 840

GACTGTCTCA AAACAAAACA AAACAAAACA AAACAAAAAA CACCGGCTGG TATGTATGAG 900

AGGATGGGAC CTTGTGGAAG AAGAGGTGCC AGGAATATGT CTGGGAAGGG GAGGAGACAG 960

GATTTTGTGG GAGGGAGAAC TTAAGAACTG GATCCATTTG CGCCATTGAG AAAGCGCAAG 1020

AGGGAAGTAG AGGAGCGTCA GTAGTAACAG ATGCTGCCGG CAGGGATGTG CTTGAGGAGG 1080

ATCCAGAGAT GAGAGCAGGT CACTGGGAAA GGTTAGGGGC GGGGAGGCCT TGATTGGTGT 1140

TGGTTTGGTC GTTGTTGATT TTGGTTTTAT GCAAGAAAAA GAAAACAACC AGAAACATTG 1200

GAGAAAGCTA AGGCTACCAC CACCTACCCG GTCAGTCACT CCTCTGTAGC TTTCTCTTTC 1260

TTGGAGAAAG GAAAAGACCC AAGGGGTTGG CAGCGATATG TGAAAAAATT CAGAATTTAT 1320

GTTGTCTAAT TACAAAAAGC AACTTCTAGA ATCTTTAAAA ATAAAGGACG TTGTCATTAG 1380

TTCTTCTGGT TTGTATTATT CTAAAACCTT CCAAATCTTC AAATTTACTT TATTTTAAAA 1440

TGATAAAATG AAGTTGTCAT TTTATAAACC TTTTAAAAAG ATATATATAT ATGTTTTTCT 1500

AATGTGTTAA AGTTCATTGG AACAGAAAGA AATG 1534

(2) INFORMATION FOR SEQ ID NO:14:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1924 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:14:

GAGGCTAGAG GGCAGGCACT TTATGGCAAA CTCAGGTAGA ATTCTTCCTC TTCCGTCTCT 60

TTCCTTTTAC GTCATCGGGG AGACTGGGTG GCAATCGCAG CCCGAGAGAC GCATGGCTCT 120

TTCTGCCCTC CATCCTCTGA TGTACCTTGA TTTCGTATTC TGAGAGGCTG CTGCTTAGCG 180

GTAGCCCCTT GGTTTCCGTG GCAACGGAAA AGCGCGGGAA TTACAGATAA ATTAAAACTG 240

CGACTGCGCG GCGTGAGCTC GCTGAGACTT CCTGGACCCC GCACCAGGCT GTGGGGTTTC 300

TCAGATAACT GGGCCCCTGC GCTCAGGAGG CCTTCACCCT CTGCTCTGGG TAAAGGTAGT 360

AGAGTCCCGG GAAAGGGACA GGGGGCCCAA GTGATGCTCT GGGGTACTGG CGTGGGAGAG 420

TGGATTTCCG AAGCTGACAG ATGGGTATTC TTTGACGGGG GGTAGGGGCG GAACCTGAGA 480

GGCGTAAGGC GTTGTGAACC CTGGGGAGGG GGGCAGTTTG TAGGTCGCGA GGGAAGCGCT 540

GAGGATCAGG AAGGGGGCAC TGAGTGTCCG TGGGGGAATC CTCGTGATAG GAACTGGAAT 600

ATGCCTTGAG GGGGACACTA TGTCTTTAAA AACGTCGGCT GGTCATGAGG TCAGGAGTTC 660

CAGACCAGCC TGACCAACGT GGTGAAACTC CGTCTCTACT AAAAATACNA AAATTAGCCG 720

GGCGTGGTGC CGCTCCAGCT ACTCAGGAGG CTGAGGCAGG AGAATCGCTA GAACCCGGGA 780

GGCGGAGGTT GCAGTGAGCC GAGATCGCGC CATTGCACTC CAGCCTGGGC GACAGAGCGA 840

GACTGTCTCA AAACAAAACA AAACAAAACA AAACAAAAAA CACCGGCTGG TATGTATGAG 900

AGGATGGGAC CTTGTGGAAG AAGAGGTGCC AGGAATATGT CTGGGAAGGG GAGGAGACAG 960

GATTTTGTGG GAGGGAGAAC TTAAGAACTG GATCCATTTG CGCCATTGAG AAAGCGCAAG 1020

AGGGAAGTAG AGGAGCGTCA GTAGTAACAG ATGCTGCCGG CAGGGATGTG CTTGAGGAGG 1080

ATCCAGAGAT GAGAGCAGGT CACTGGGAAA GGTTAGGGGC GGGGAGGCCT TGATTGGTGT 1140

TGGTTTGGTC GTTGTTGATT TTGGTTTTAT GCAAGAAAAA GAAAACAACC AGAAACATTG 1200

GAGAAAGCTA AGGCTACCAC CACCTACCCG GTCAGTCACT CCTCTGTAGC TTTCTCTTTC 1260

TTGGAGAAAG GAAAAGACCC AAGGGGTTGG CAGCGATATG TGAAAAAATT CAGAATTTAT 1320

GTTGTCTAAT TACAAAAAGC AACTTCTAGA ATCTTTAAAA ATAAAGGACG TTGTCATTAG 1380

TTCTTCTGGT TTGTATTATT CTAAAACCTT CCAAATCTTC AAATTTACTT TATTTTAAAA 1440

TGATAAAATG AAGTTGTCAT TTTATAAACC TTTTAAAAAG ATATATATAT ATGTTTTTCT 1500

AATGTGTTAA AGTTCATTGG AACAGAAAGA AATGGATTTA TCTGCTCTTC GCGTTGAAGA 1560

AGTACAAAAT GTCATTAATG CTATGCAGAA AATCTTAGAG TGTCCCATCT GGTAAGTCAG 1620

CACAAGAGTG TATTAATTTG GGATTCCTAT GATTATCTCC TATGCAAATG AACAGAATTG 1680

ACCTTACATA CTAGGGAAGA AAAGACATGT CTAGTAAGAT TAGGCTATTG TAATTGCTGA 1740

TTTTCTTAAC TGAAGAACTT TAAAAATATA GAAAATGATT CCTTGTTCTC CATCCACTCT 1800

GCCTCTCCCA CTCCTCTCCT TTTCAACACA ATCCTGTGGT CCGGGAAAGA CAGGGCTCTG 1860

TCTTGATTGG TTCTGCACTG GGCAGGATCT GTTAGATACT GCATTTGCTT TCTCCAGCTC 1920

TAAA 1924

(2) INFORMATION FOR SEQ ID NO:15:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 631 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:15:

AAATGCTGAT GATAGTATAG AGTATTGAAG GGATCAATAT AATTCTGTTT TGATATCTGA 60

AAGCTCACTG AAGGTAAGGA TCGTATTCTC TGCTGTATTC TCAGTTCCTG ACACAGCAGA 120

CATTTAATAA ATATTGAACG AACTTGAGGC CTTATGTTGA CTCAGTCATA ACAGCTCAAA 180

GTTGAACTTA TTCACTAAGA ATAGCTTTAT TTTTAAATAA ATTATTGAGC CTCATTTATT 240

TTCTTTTTCT CCCCCCCCTA CCCTGCTAGT CTGGAGTTGA TCAAGGAACC TGTCTCCACA 300

AAGTGTGACC ACATATTTTG CAAGTAAGTT TGAATGTGTT ATGTGGCTCC ATTATTAGCT 360

TTTGTTTTTG TCCTTCATAA CCCAGGAAAC ACCTAACTTT ATAGAAGCTT TACTTTCTTC 420

AATTAAGTGA GAACGAAAAT CCAACTCCAT TTCATTCTTT CTCAGAGAGT ATATAGTTAT 480

CAAAAGTTGG TTGTAATCAT AGTTCCTGGT AAAGTTTTGA CATATATTAT CTTTTTTTTT 540

TTTTGAGACA AGTCTCGCTC TGTCGCCCAG GCTGGAGTGC AGTGGCATGA GGCTTGCTCA 600

CTGCACCTCC GCCCCCGAGT TCAGCGACTC T 631

(2) INFORMATION FOR SEQ ID NO:16:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 481 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:16:

TGAGATCTAG ACCACATGGT CAAAGAGATA GAATGTGAGC AATAAATGAA CCTTAAATTT 60

TTCAACAGCT ACTTTTTTTT TTTTTTTTTG AGACAGGGKC TTACTCTGTT GTCCCAGCTG 120

GAGTACAGWG TGCGATCATG AGGCTTACTG TTGCTTGACT CCTAGGCTCA AGCGATCCTA 180

TCACCTCAGT CTCCAAGTAG CTGGACTGTA AGTGCACACC ACCATATCCA GCTAAATTTT 240

GTGTTTTCTG TAGAGACGGG GTTTCGCCAT GTTTCCCAGG CTGGTCTTGA ACTTTGGGCT 300

TAACCCGTCT GCCCACCTAG GCATCCCAAA GTGCTAGGAT TACAGGTGTG AGTCATCATG 360

CCTGGCCAGT ATTTTAGTTA GCTCTGTCTT TTCAAGTCAT ATACAAGTTC ATTTTCTTTT 420

AAGTTTAGTT AACAACCTTA TATCATGTAT TCTTTTCTAG CATAAAGAAA GATTCGAGGC 480

C 481

(2) INFORMATION FOR SEQ ID NO:17:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 522 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:17:

TGTGATCATA ACAGTAAGCC ATATGCATGT AAGTTCAGTT TTCATAGATC ATTGCTTATG 60

TAGTTTAGGT TTTTGCTTAT GCAGCATCCA AAAACAATTA GGAAACTATT GCTTGTAATT 120

CACCTGCCAT TACTTTTTAA ATGGCTCTTA AGGGCAGTTG TGAGATTATC TTTTCATGGC 180

TATTTGCCTT TTGAGTATTC TTTCTACAAA AGGAAGTAAA TTAAATTGTT CTTTCTTTCT 240

TTATAATTTA TAGATTTTGC ATGCTGAAAC TTCTCAACCA GAAGAAAGGG CCTTCACAGT 300

GTCCTTTATG TAAGAATGAT ATAACCAAAA GGTATATAAT TTGGTAATGA TGCTAGGTTG 360

GAAGCAACCA CAGTAGGAAA AAGTAGAAAT TATTTAATAA CATAGCGTTC CTATAAAACC 420

ATTCATCAGA AAAATTTATA AAAGAGTTTT TAGCACACAG TAAATTATTT CCAAAGTTAT 480

TTTCCTGAAA GTTTTATGGG CATCTGCCTT ATACAGGTAT TG 522

(2) INFORMATION FOR SEQ ID NO:18:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 465 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:18:

GGTAGGCTTA AATGAATGAC AAAAAGTTAC TAAATCACTG CCATCACACG GTTTATACAG 60

ATGTCAATGA TGTATTGATT ATAGAGGTTT TCTACTGTTG CTGCATCTTA TTTTTATTTG 120

TTTACATGTC TTTTCTTATT TTAGTGTCCT TAAAAGGTTG ATAATCACTT GCTGAGTGTG 180

TTTCTCAAAC AATTTAATTT CAGGAGCCTA CAAGAAAGTA CGAGATTTAG TCAACTTGTT 240

GAAGAGCTAT TGAAAATCAT TTGTGCTTTT CAGCTTGACA CAGGTTTGGA GTGTAAGTGT 300

TGAATATCCC AAGAATGACA CTCAAGTGCT GTCCATGAAA ACTCAGGAAG TTTGCACAAT 360

TACTTTCTAT GACGTGGTGA TAAGACCTTT TAGTCTAGGT TAATTTTAGT TCTGTATCTG 420

TAATCTATTT TAAAAAATTA CTCCCACTGG TCTCACACCT TATTT 465

(2) INFORMATION FOR SEQ ID NO:19:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 513 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:19:

AAAAAATCAC AGGTAACCTT AATGCATTGT CTTAACACAA CAAAGAGCAT ACATAGGGTT 60

TCTCTTGGTT TCTTTGATTA TAATTCATAC ATTTTTCTCT AACTGCAAAC ATAATGTTTT 120

CCCTTGTATT TTACAGATGC AAACAGCTAT AATTTTGCAA AAAAGGAAAA TAACTCTCCT 180

GAACATCTAA AAGATGAAGT TTCTATCATC CAAAGTATGG GCTACAGAAA CCGTGCCAAA 240

AGACTTCTAC AGAGTGAACC CGAAAATCCT TCCTTGGTAA AACCATTTGT TTTCTTCTTC 300

TTCTTCTTCT TCTTTTCTTT TTTTTTTCTT TTTTTTTTTG AGATGGAGTC TTGCTCTGTG 360

GCCCAGGCTA GAAGCAGTCC TCCTGCCTTA GCCNCCTTAG TAGCTGGGAT TACAGGCACG 420

CGCACCATGC CAGGCTAATT TTTGTATTTT TAGTAGAGAC GGGGTTTCAT CATGTTGGCC 480

AGGCTGGTCT CGAACTCCTA ACCTCAGGTG ATC 513

(2) INFORMATION FOR SEQ ID NO:20:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 6769 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:20:

ATGATGGAGA TCTTAAAAAG TAATCATTCT GGGGCTGGGC GTAGTAGCTT GCACCTGTAA 60

TCCCAGCACT TCGGGAGGCT GAGGCAGGCA GATAATTTGA GGTCAGGAGT TTGAGACCAG 120

CCTGGCCAAC ATGGTGAAAC CCATCTCTAC TAAAAATACA AAAATTAGCT GGGTGTGGTG 180

GCACGTACCT GTAATCCCAG CTACTCGGGA GGCGGAGGCA CAAGAATTGC TTGAACCTAG 240

GACGCGGAGG TTGCAGCGAG CCAAGATCGC GCCACTGCAC TCCAGCCTGG GCCGTAGAGT 300

GAGACTCTGT CTCAAAAAAG AAAAAAAAGT AATTGTTCTA GCTGGGCGCA GTGGCTCTTG 360

CCTGTAATCC CAGCACTTTG GGAGGCCAAG GCGGGTGGAT CTCGAGTCCT AGAGTTCAAG 420

ACCAGCCTAG GCAATGTGGT GAAACCCCAT CGCTACAAAA AATACAAAAA TTAGCCAGGC 480

ATGGTGGCGT GCGCATGTAG TCCCAGCTCC TTGGGAGGCT GAGGTGGGAG GATCACTTGA 540

ACCCAGGAGA CAGAGGTTGC AGTGAACCGA GATCACGCCA CCACGCTCCA GCCTGGGCAA 600

CAGAACAAGA CTCTGTCTAA AAAAATACAA ATAAAATAAA AGTAGTTCTC ACAGTACCAG 660

CATTCATTTT TCAAAAGATA TAGAGCTAAA AAGGAAGGAA AAAAAAAGTA ATGTTGGGCT 720

TTTAAATACT CGTTCCTATA CTAAATGTTC TTAGGAGTGC TGGGGTTTTA TTGTCATCAT 780

TTATCCTTTT TAAAAATGTT ATTGGCCAGG CACGGTGGCT CATGGCTGTA ATCCCAGCAC 840

TTTGGGAGGC CGAGGCAGGC AGATCACCTG AGGTCAGGAG TGTGAGACCA GCCTGGCCAA 900

CATGGCGAAA CCTGTCTCTA CTAAAAATAC AAAAATTAAC TAGGCGTGGT GGTGTACGCC 960

TGTAGTCCCA GCTACTCGGG AGGCTGAGGC AGGAGAATCA ACTGAACCAG GGAGGTGGAG 1020

GTTGCAGTGT GCCGAGATCA CGCCACTGCA CTCTAGCCTG GCAACAGAGC AAGATTCTGT 1080

CTCAAAAAAA AAAAACATAT ATACACATAT ATCCCAAAGT GCTGGGATTA CATATATATA 1140

TATATATATA TATTATATAT ATATATATAT ATATATGTGA TATATATGTG ATATATATAT 1200

AACATATATA TATGTAATAT ATATGTGATA TATATATAAT ATATATATGT AATATATATG 1260

TGATATATAT ATATACACAC ACACACACAT ATATATGTAT GTGTGTGTAC ACACACACAC 1320

ACAAATTAGC CAGGCATAGT TGCACACGCT TGGTAGACCC AGCTACTCAG GAGGCTGAGG 1380

GAGGAGAATC TCTTGAACTT AGGAGGCGGA GGTTGCAGTG AGCTGAGATT GCGCCACTGC 1440

ACTCCAGCCT GGGTGACAGA GCAGGACTCT GTACACCCCC CAAAACAAAA AAAAAAGTTA 1500

TCAGATGTGA TTGGAATGTA TATCAAGTAT CAGCTTCAAA ATATGCTATA TTAATACTTC 1560

AAAAATTACA CAAATAATAC ATAATCAGGT TTGAAAAATT TAAGACAACM SAARAAAAAA 1620

WYCMAATCAC AMATATCCCA CACATTTTAT TATTMCTMCT MCWATTATTT TGWAGAGMCT 1680

GGGTCTCACY CYKTTGCTWA TGCTGGTCTT TGAACYCCYK GCCYCAARCA RTCCTSCTCC 1740

ABCCTCCCAA RGTGCTGGGG ATWATAGGCA TGARCTAACC GCACCCAGCC CCAGACATTT 1800

TAGTGTGTAA ATTCCTGGGC ATTTTTTCAA GGCATCATAC ATGTTAGCTG ACTGATGATG 1860

GTCAATTTAT TTTGTCCATG GTGTCAAGTT TCTCTTCAGG AGGAAAAGCA CAGAACTGGC 1920

CAACAATTGC TTGACTGTTC TTTACCATAC TGTTTAGCAG GAAACCAGTC TCAGTGTCCA 1980

ACTCTCTAAC CTTGGAACTG TGAGAACTCT GAGGACAAAG CAGCGGATAC AACCTCAAAA 2040

GACGTCTGTC TACATTGAAT TGGGTAAGGG TCTCAGGTTT TTTAAGTATT TAATAATAAT 2100

TGCTGGATTC CTTATCTTAT AGTTTTGCCA AAAATCTTGG TCATAATTTG TATTTGTGGT 2160

AGGCAGCTTT GGGAAGTGAA TTTTATGAGC CCTATGGTGA GTTATAAAAA ATGTAAAAGA 2220

CGCAGTTCCC ACCTTGAAGA ATCTTACTTT AAAAAGGGAG CAAAAGAGGC CAGGCATGGT 2280

GGCTCACACC TGTAATCCCA GCACTTTGGG AGGCCAAAGT GGGTGGATCA CCTGAGGTCG 2340

GGAGTTCGAG ACCAGCCTAG CCAACATGGA GAAACTCTGT CTGTACCAAA AAATAAAAAA 2400

TTAGCCAGGT GTGGTGGCAC ATAACTGTAA TCCCAGCTAC TCGGGAGGCT GAGGCAGGAG 2460

AATCACTTGA ACCCGGGAGG TGGAGGTTGC GGTGAACCGA GATCGCACCA TTGCACTCCA 2520

GCCTGGGCAA AAATAGCGAA ACTCCATCTA AAAAAAAAAA AGAGAGCAAA AGAAAGAMTM 2580

TCTGGTTTTA AMTMTGTGTA AATATGTTTT TGGAAAGATG GAGAGTAGCA ATAAGAAAAA 2640

ACATGATGGA TTGCTACAGT ATTTAGTTCC AAGATAAATT GTACTAGATG AGGAAGCCTT 2700

TTAAGAAGAG CTGAATTGCC AGGCGCAGTG GCTCACGCCT GTAATCCCAG CACTTTGGGA 2760

GGCCGAGGTG GGCGGATCAC CTGAGGTCGG GAGTTCAAGA CCAGCCTGAC CAACATGGAG 2820

AAACCCCATC TCTACTAAAA AAAAAAAAAA AAAAATTAGC CGGGGTGGTG GCTTATGCCT 2880

GTAATCCCAG CTACTCAGGA GGCTGAGGCA GGAGAATCGC TTGAACCCAG GAAGCAGAGG 2940

TTGCAGTGAG CCAAGATCGC ACCATTGCAC TCCAGCCTAG GCAACAAGAG TGAAACTCCA 3000

TCTCAAAAAA AAAAAAAAAG AGCTGAATCT TGGCTGGGCA GGATGGCTCG TGCCTGTAAT 3060

CCTAACGCTT TGGAAGACCG AGGCAGAAGG ATTGGTTGAG TCCACGAGTT TAAGACCAGC 3120

CTGGCCAACA TAGGGGAACC CTGTCTCTAT TTTTAAAATA ATAATACATT TTTGGCCGGT 3180

GCGGTGGCTC ATGCCTGTAA TCCCAATACT TTGGGAGGCT GAGGCAGGTA GATCACCTGA 3240

GGTCAGAGTT CGAGACCAGC CTGGATAACC TGGTGAAACC CCTCTTTACT AAAAATACAA 3300

AAAAAAAAAA AAATTAGCTG GGTGTGGTAG CACATGCTTG TAATCCCAGC TACTTGGGAG 3360

GCTGAGGCAG GAGAATCGCT TGAACCAGGG AGGCGGAGGT TACAATGAGC CAACACTACA 3420

CCACTGCACT CCAGCCTGGG CAATAGAGTG AGACTGCATC TCAAAAAAAT AATAATTTTT 3480

AAAAATAATA AATTTTTTTA AGCTTATAAA AAGAAAAGTT GAGGCCAGCA TAGTAGCTCA 3540

CATCTGTAAT CTCAGCAGTG GCAGAGGATT GCTTGAAGCC AGGAGTTTGA GACCAGCCTG 3600

GGCAACATAG CAAGACCTCA TCTCTACAAA AAAATTTCTT TTTTAAATTA GCTGGGTGTG 3660

GTGGTGTGCA TCTGTAGTCC CAGCTACTCA GGAGGCAGAG GTGAGTGGAT ACATTGAACC 3720

CAGGAGTTTG AGGCTGTAGT GAGCTATGAT CATGCCACTG CACTCCAACC TGGGTGACAG 3780

AGCAAGACCT CCAAAAAAAA AAAAAAAAGA GCTGCTGAGC TCAGAATTCA AACTGGGCTC 3840

TCAAATTGGA TTTTCTTTTA GAATATATTT ATAATTAAAA AGGATAGCCA TCTTTTGAGC 3900

TCCCAGGCAC CACCATCTAT TTATCATAAC ACTTACTGTT TTCCCCCCTT ATGATCATAA 3960

ATTCCTAGAC AACAGGCATT GTAAAAATAG TTATAGTAGT TGATATTTAG GAGCACTTAA 4020

CTATATTCCA GGCACTATTG TGCTTTTCTT GTATAACTCA TTAGATGCTT GTCAGACCTC 4080

TGAGATTGTT CCTATTATAC TTATTTTACA GATGAGAAAA TTAAGGCACA GAGAAGTTAT 4140

GAAATTTTTC CAAGGTATTA AACCTAGTAA GTGGCTGAGC CATGATTCAA ACCTAGGAAG 4200

TTAGATGTCA GAGCCTGTGC TTTTTTTTTG TTTTTGTTTT TGTTTTCAGT AGAAACGGGG 4260

GTCTCACTTT GTTGGCCAGG CTGGTCTTGA ACTCCTAACC TCAAATAATC CACCCATCTC 4320

GGCCTCCTCA AGTGCTGGGA TTACAGGTGA GAGCCACTGT GCCTGGCGAA GCCCATGCCT 4380

TTAACCACTT CTCTGTATTA CATACTAGCT TAACTAGCAT TGTACCTGCC ACAGTAGATG 4440

CTCAGTAAAT ATTTCTAGTT GAATATCTGT TTTTCAACAA GTACATTTTT TTAACCCTTT 4500

TAATTAAGAA AACTTTTATT GATTTATTTT TTGGGGGGAA ATTTTTTAGG ATCTGATTCT 4560

TCTGAAGATA CCGTTAATAA GGCAACTTAT TGCAGGTGAG TCAAAGAGAA CCTTTGTCTA 4620

TGAAGCTGGT ATTTTCCTAT TTAGTTAATA TTAAGGATTG ATGTTTCTCT CTTTTTAAAA 4680

ATATTTTAAC TTTTATTTTA GGTTCAGGGA TGTATGTGCA GTTTGTTATA TAGGTAAACA 4740

CACGACTTGG GATTTGGTGT ATAGATTTTT TTCATCATCC GGGTACTAAG CATACCCCAC 4800

AGTTTTTTGT TTGCTTTCTT TCTGAATTTC TCCCTCTTCC CACCTTCCTC CCTCAAGTAG 4860

GCTGGTGTTT CTCCAGACTA GAATCATGGT ATTGGAAGAA ACCTTAGAGA TCATCTAGTT 4920

TAGTTCTCTC ATTTTATAGT GGAGGAAATA CCCTTTTTGT TTGTTGGATT TAGTTATTAG 4980

CACTGTCCAA AGGAATTTAG GATAACAGTA GAACTCTGCA CATGCTTGCT TCTAGCAGAT 5040

TGTTCTCTAA GTTCCTCATA TACAGTAATA TTGACACAGC AGTAATTGTG ACTGATGAAA 5100

ATGTTCAAGG ACTTCATTTT CAACTCTTTC TTTCCTCTGT TCCTTATTTC CACATATCTC 5160

TCAAGCTTTG TCTGTATGTT ATATAATAAA CTACAAGCAA CCCCAACTAT GTTACCTACC 5220

TTCCTTAGGA ATTATTGCTT GACCCAGGTT TTTTTTTTTT TTTTTTTGGA GACGGGGTCT 5280

TGCCCTGTTG CCAGGATGGA GTGTAGTGGC GCCATCTCGG CTCACTGCAA TCTCCAACTC 5340

CCTGGTTCAA GCGATTCTCC TGTCTCAATC TCACGAGTAG CTGGGACTAC AGGTATACAC 5400

CACCACGCCC GGTTAATTGA CCATTCCATT TCTTTCTTTC TCTCTTTTTT TTTTTTTTTT 5460

TTGAGACAGA GTCTTGCTCT GTTGCCCAGG CTGGAGTACA GAGGTGTGAT CTCACCTCTC 5520

CGCAACGTCT GCCTCCCAGG TTGAAGCCAT ACTCCTGCCT CAGCCTCTCT AGTAGCTGGG 5580

ACTACAGGCG CGCGCCACCA CACCCGGCTA ATTTTTGTAT TTTTAGTAGA GATGGGGTTT 5640

CACCATGTTG GCCAGGCTGG TCTTGAACTC ATGACCTCAA GTGGTCCACC CGCCTCAGCC 5700

TCCCAAAGTG CTGGAATTAC AGGCTTGAGC CACCGTGCCC AGCAACCATT TCATTTCAAC 5760

TAGAAGTTTC TAAAGGAGAG AGCAGCTTTC ACTAACTAAA TAAGATTGGT CAGCTTTCTG 5820

TAATCGAAAG AGCTAAAATG TTTGATCTTG GTCATTTGAC AGTTCTGCAT ACATGTAACT 5880

AGTGTTTCTT ATTAGGACTC TGTCTTTTCC CTATAGTGTG GGAGATCAAG AATTGTTACA 5940

AATCACCCCT CAAGGAACCA GGGATGAAAT CAGTTTGGAT TCTGCAAAAA AGGGTAATGG 6000

CAAAGTTTGC CAACTTAACA GGCACTGAAA AGAGAGTGGG TAGATACAGT ACTGTAATTA 6060

GATTATTCTG AAGACCATTT GGGACCTTTA CAACCCACAA AATCTCTTGG CAGAGTTAGA 6120

GTATCATTCT CTGTCAAATG TCGTGGTATG GTCTGATAGA TTTAAATGGT ACTAGACTAA 6180

TGTACCTATA ATAAGACCTT CTTGTAACTG ATTGTTGCCC TTTCGCTTTT TTTTTTGTTT 6240

GTTTGTTTGT TTTTTTTTGA GATGGGGTCT CACTCTGTTG CCCAGGCTGG AGTGCAGTGA 6300

TGCAATCTTG GCTCACTGCA ACCTCCACCT CCAAAGGCTC AAGCTATCCT CCCACTTCAG 6360

CCTCCTGAGT AGCTGGGACT ACAGGCGCAT GCCACCACAC CCGGTTAATT TTTTGTGGTT 6420

TTATAGAGAT GGGGTTTCAC CATGTTACCG AGGCTGGTCT CAAACTCCTG GACTCAAGCA 6480

GTCTGCCCAC TTCAGCCTCC CAAAGTGCTG CAGTTACAGG CTTGAGCCAC TGTGCCTGGC 6540

CTGCCCTTTA CTTTTAATTG GTGTATTTGT GTTTCATCTT TTACCTACTG GTTTTTAAAT 6600

ATAGGGAGTG GTAAGTCTGT AGATAGAACA GAGTATTAAG TAGACTTAAT GGCCAGTAAT 6660

CTTTAGAGTA CATCAGAACC AGTTTTCTGA TGGCCAATCT GCTTTTAATT CACTCTTAGA 6720

CGTTAGAGAA ATAGGTGTGG TTTCTGCATA GGGAAAATTC TGAAATTAA 6769

(2) INFORMATION FOR SEQ ID NO:21:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 4249 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:21:

GATCCTAAGT GGAAATAATC TAGGTAAATA GGAATTAAAT GAAAGAGTAT GAGCTACATC 60

TTCAGTATAC TTGGTAGTTT ATGAGGTTAG TTTCTCTAAT ATAGCCAGTT GGTTGATTTC 120

CACCTCCAAG GTGTATGAAG TATGTATTTT TTTAATGACA ATTCAGTTTT TGAGTACCTT 180

GTTATTTTTG TATATTTTCA GCTGCTTGTG AATTTTCTGA GACGGATGTA ACAAATACTG 240

AACATCATCA ACCCAGTAAT AATGATTTGA ACACCACTGA GAAGCGTGCA GCTGAGAGGC 300

ATCCAGAAAA GTATCAGGGT AGTTCTGTTT CAAACTTGCA TGTGGAGCCA TGTGGCACAA 360

ATACTCATGC CAGCTCATTA CAGCATGAGA ACAGCAGTTT ATTACTCACT AAAGACAGAA 420

TGAATGTAGA AAAGGCTGAA TTCTGTAATA AAAGCAAACA GCCTGGCTTA GCAAGGAGCC 480

AACATAACAG ATGGGCTGGA AGTAAGGAAA CATGTAATGA TAGGCGGACT CCCAGCACAG 540

AAAAAAAGGT AGATCTGAAT GCTGATCCCC TGTGTGAGAG AAAAGAATGG AATAAGCAGA 600

AACTGCCATG CTCAGAGAAT CCTAGAGATA CTGAAGATGT TCCTTGGATA ACACTAAATA 660

GCAGCATTCA GAAAGTTAAT GAGTGGTTTT CCAGAAGTGA TGAACTGTTA GGTTCTGATG 720

ACTCACATGA TGGGGAGTCT GAATCAAATG CCAAAGTAGC TGATGTATTG GACGTTCTAA 780

ATGAGGTAGA TGAATATTCT GGTTCTTCAG AGAAAATAGA CTTACTGGCC AGTGATCCTC 840

ATGAGGCTTT AATATGTAAA AGTGAAAGAG TTCACTCCAA ATCAGTAGAG AGTAATATTG 900

AAGGCCAAAT ATTTGGGAAA ACCTATCGGA AGAAGGCAAG CCTCCCCAAC TTAAGCCATG 960

TAACTGAAAA TCTAATTATA GGAGCATTTG TTACTGAGCC ACAGATAATA CAAGAGCGTC 1020

CCCTCACAAA TAAATTAAAG CGTAAAAGGA GACCTACATC AGGCCTTCAT CCTGAGGATT 1080

TTATCAAGAA AGCAGATTTG GCAGTTCAAA AGACTCCTGA AATGATAAAT CAGGGAACTA 1140

ACCAAACGGA GCAGAATGGT CAAGTGATGA ATATTACTAA TAGTGGTCAT GAGAATAAAA 1200

CAAAAGGTGA TTCTATTCAG AATGAGAAAA ATCCTAACCC AATAGAATCA CTCGAAAAAG 1260

AATCTGCTTT CAAAACGAAA GCTGAACCTA TAAGCAGCAG TATAAGCAAT ATGGAACTCG 1320

AATTAAATAT CCACAATTCA AAAGCACCTA AAAAGAATAG GCTGAGGAGG AAGTCTTCTA 1380

CCAGGCATAT TCATGCGCTT GAACTAGTAG TCAGTAGAAA TCTAAGCCCA CCTAATTGTA 1440

CTGAATTGCA AATTGATAGT TGTTCTAGCA GTGAAGAGAT AAAGAAAAAA AAGTACAACC 1500

AAATGCCAGT CAGGCACAGC AGAAACCTAC AACTCATGGA AGGTAAAGAA CCTGCAACTG 1560

GAGCCAAGAA GAGTAACAAG CCAAATGAAC AGACAAGTAA AAGACATGAC AGCGATACTT 1620

TCCCAGAGCT GAAGTTAACA AATGCACCTG GTTCTTTTAC TAAGTGTTCA AATACCAGTG 1680

AACTTAAAGA ATTTGTCAAT CCTAGCCTTC CAAGAGAAGA AAAAGAAGAG AACTAGAAAC 1740

AGTTAAAGTG TCTAATAATG CTGAAGACCC CAAAGATCTC ATGTTAAGTG GAGAAAGGGT 1800

TTTGCAAACT GAAAGATCTG TAGAGAGTAG CAGTATTTCA TTGGTACCTG GTACTGATTA 1860

TGGCACTCAG GAAAGTATCT CGTTACTGGA AGTTAGCACT CTAGGGAAGG CAAAAACAGA 1920

ACCAAATAAA TGTGTGAGTC AGTGTGCAGC ATTTGAAAAC CCCAAGGGAC TAATTCATGG 1980

TTGTTCCAAA GATAATAGAA ATGACACAGA AGGCTTTAAG TATCCATTGG GACATGAAGT 2040

TAACCACAGT CGGGAAACAA GCATAGAAAT GGAAGAAAGT GAACTTGATG CTCAGTATTT 2100

GCAGAATACA TTCAAGGTTT CAAAGCGCCA GTCATTTGCT CCGTTTTCAA ATCCAGGAAA 2160

TGCAGAAGAG GAATGTGCAA CATTCTCTGC CCACTCTGGG TCCTTAAAGA AACAAAGTCC 2220

AAAAGTCACT TTTGAATGTG AACAAAAGGA AGAAAATCAA GGAAAGAATG AGTCTAATAT 2280

CAAGCCTGTA CAGACAGTTA ATATCACTGC AGGCTTTCCT GTGGTTGGTC AGAAAGATAA 2340

GCCAGTTGAT AATGCCAAAT GTAGTATCAA AGGAGGCTCT AGGTTTTGTC TATCATCTCA 2400

GTTCAGAGGC AACGAAACTG GACTCATTAC TCCAAATAAA CATGGACTTT TACAAAACCC 2460

ATATCGTATA CCACCACTTT TTCCCATCAA GTCATTTGTT AAAACTAAAT GTAAGAAAAA 2520

TCTGCTAGAG GAAAACTTTG AGGAACATTC AATGTCACCT GAAAGAGAAA TGGGAAATGA 2580

GAACATTCCA AGTACAGTGA GCACAATTAG CCGTAATAAC ATTAGAGAAA ATGTTTTTAA 2640

AGAAGCCAGC TCAAGCAATA TTAATGAAGT AGGTTCCAGT ACTAATGAAG TGGGCTCCAG 2700

TATTAATGAA ATAGGTTCCA GTGATGAAAA CATTCAAGCA GAACTAGGTA GAAACAGAGG 2760

GCCAAAATTG AATGCTATGC TTAGATTAGG GGTTTTGCAA CCTGAGGTCT ATAAACAAAG 2820

TCTTCCTGGA AGTAATTGTA AGCATCCTGA AATAAAAAAG CAAGAATATG AAGAAGTAGT 2880

TCAGACTGTT AATACAGATT TCTCTCCATA TCTGATTTCA GATAACTTAG AACAGCCTAT 2940

GGGAAGTAGT CATGCATCTC AGGTTTGTTC TGAGACACCT GATGACCTGT TAGATGATGG 3000

TGAAATAAAG GAAGATACTA GTTTTGCTGA AAATGACATT AAGGAAAGTT CTGCTGTTTT 3060

TAGCAAAAGC GTCCAGAAAG GAGAGCTTAG CAGGAGTCCT AGCCCTTTCA CCCATACACA 3120

TTTGGCTCAG GGTTACCGAA GAGGGGCCAA GAAATTAGAG TCCTCAGAAG AGAACTTATC 3180

TAGTGAGGAT GAAGAGCTTC CCTGCTTCCA ACACTTGTTA TTTGGTAAAG TAAACAATAT 3240

ACCTTCTCAG TCTACTAGGC ATAGCACCGT TGCTACCGAG TGTCTGTCTA AGAACACAGA 3300

GGAGAATTTA TTATCATTGA AGAATAGCTT AAATGACTGC AGTAACCAGG TAATATTGGC 3360

AAAGGCATCT CAGGAACATC ACCTTAGTGA GGAAACAAAA TGTTCTGCTA GCTTGTTTTC 3420

TTCACAGTGC AGTGAATTGG AAGACTTGAC TGCAAATACA AACACCCAGG ATCCTTTCTT 3480

GATTGGTTCT TCCAAACAAA TGAGGCATCA GTCTGAAAGC CAGGGAGTTG GTCTGAGTGA 3540

CAAGGAATTG GTTTCAGATG ATGAAGAAAG AGGAACGGGC TTGGAAGAAA ATAATCAAGA 3600

AGAGCAAAGC ATGGATTCAA ACTTAGGTAT TGGAACCAGG TTTTTGTGTT TGCCCCAGTC 3660

TATTTATAGA AGTGAGCTAA ATGTTTATGC TTTTGGGGAG CACATTTTAC AAATTTCCAA 3720

GTATAGTTAA AGGAACTGCT TCTTAAACTT GAAACATGTT CCTCCTAAGG TGCTTTTCAT 3780

AGAAAAAAGT CCTTCACACA GCTAGGACGT CATCTTTGAC TGAATGAGCT TTAACATCCT 3840

AATTACTGGT GGACTTACTT CTGGTTTCAT TTTATAAAGC AAATCCCGGT GTCCCAAAGC 3900

AAGGAATTTA ATCATTTTGT GTGACATGAA AGTAAATCCA GTCCTGCCAA TGAGAAGAAA 3960

AAGACACAGC AAGTTGCAGC GTTTATAGTC TGCTTTTACA TCTGAACCTC TGTTTTTGTT 4020

ATTTAAGGTG AAGCAGCATC TGGGTGTGAG AGTGAAACAA GCGTCTCTGA AGACTGCTCA 4080

GGGCTATCCT CTCAGAGTGA CATTTTAACC ACTCAGGTAA AAAGCGTGTG TGTGTGTGCA 4140

CATGCGTGTG TGTGGTGTCC TTTGCATTCA GTAGTATGTA TCCCACATTC TTAGGTTTGC 4200

TGACATCATC TCTTTGAATT AATGGCACAA TTGTTTGTGG TTCATTGTC 4249

(2) INFORMATION FOR SEQ ID NO:22:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 710 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:22:

NGNGAATGTA ATCCTAATAT TTCNCNCCNA CTTAAAAGAA TACCACTCCA ANGGCATCNC 60

AATACATCAA TCAATTGGGG AATTGGGATT TTCCCTCNCT AACATCANTG GAATAATTTC 120

ATGGCATTAA TTGCATGAAT GTGGTTAGAT TAAAAGGTGT TCATGCTAGA ACTTGTAGTT 180

CCATACTAGG TGATTTCAAT TCCTGTGCTA AAATTAATTT GTATGATATA TTNTCATTTA 240

ATGGAAAGCT TCTCAAAGTA TTTCATTTTC TTGGTACCAT TTATCGTTTT TGAAGCAGAG 300

GGATACCATG CAACATAACC TGATAAAGCT CCAGCAGGAA ATGGCTGAAC TAGAAGCTGT 360

GTTAGAACAG CATGGGAGCC AGCCTTCTAA CAGCTACCCT TCCATCATAA GTGACTCTTC 420

TCCCTTGAG GACCTGCGAA ATCCAGAACA AAGCACATCA GAAAAAGGTG TGTATTGTTG 480

GCCAAACACT GATATCTTAA GCAAAATTCT TTCCTTCCCC TTTATCTCCT TCTGAAGAGT 540

AAGGACCTAG CTCCAACATT TTATGATCCT TGCTCAGCAC ATGGGTAATT ATGGAGCCTT 600

GGTTCTTGTC CCTGCTCACA ACTAATATAC CAGTCAGAGG GACCCAAGGC AGTCATTCAT 660

GTTGTCATCT GAGATACCTA CAACAAGTAG ATGCTATGGG GAGCCCATGG 710

(2) INFORMATION FOR SEQ ID NO:23:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 473 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:23:

CCATTGGTGC TAGCATCTGT CTGTTGCATT GCTTGTGTTT ATAAAATTCT GCCTGATATA 60

CTTGTTAAAA ACCAATTTGT GTATCATAGA TTGATGCTTT TGAAAAAAAT CAGTATTCTA 120

ACCTGAATTA TCACTATCAG AACAAAGCAG TAAAGTAGAT TTGTTTTCTC ATTCCATTTA 180

AAGCAGTATT AACTTCACAG AAAAGTAGTG AATACCCTAT AAGCCAGAAT CCAGAAGGCC 240

TTTCTGCTGA CAAGTTTGAG GTGTCTGCAG ATAGTTCTAC CAGTAAAAAT AAAGAACCAG 300

GAGTGGAAAG GTAAGAAACA TCAATGTAAA GATGCTGTGG TATCTGACAT CTTTATTTAT 360

ATTGAACTCT GATTGTTAAT TTTTTTCACC ATACTTTCTC CAGTTTTTTT GCATACAGGC 420

ATTTATACAC TTTTATTGCT CTAGGATACT TCTTTTGTTT AATCCTATAT AGG 473

(2) INFORMATION FOR SEQ ID NO:24:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 421 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:24:

GGATAAGNTC AAGAGATATT TTGATAGGTG ATGCAGTGAT NAATTGNGAA AATTTNCTGC 60

CTGCTTTTAA TCTTCCCCCG TTCTTTCTTC CTNCCTCCCT CCCTTCCTNC CTCCCGTCCT 120

TNCCTTTCCT TTCCCTCCCT TCCNCCTTCT TTCCNTCTNT CTTTCCTTTC TTTCCTGTCT 180

ACCTTTCTTT CCTTCCTCCC TTCCTTTTCT TTTCTTTCTT TCCTTTCCTT TTCTTTCCTT 240

TCTTTCCTTT CCTTTCTTTC TTGACAGAGT CTTGCTCTGT CACTCAGGCT GGAGTGCAGT 300

GGCGTGATCT CGNCTCACTG CAACCTCTGT CTCCCAGGTT CAAGCAATTT TCCTGCCTCA 360

GCCTCCCGAG TAGCTGAGAT TACAGGCGCC AGCCACCACA CCCAGCTACT GACCTGCTTT 420

T 421

(2) INFORMATION FOR SEQ ID NO:25:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 997 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:25:

AAACAGCTGG GAGATATGGT GCCTCAGACC AACCCCATGT TATATGTCAA CCCTGACATA 60

TTGGCAGGCA ACATGAATCC AGACTTCTAG GCTGTCATGC GGGCTCTTTT TTGCCAGTCA 120

TTTCTGATCT CTCTGACATG AGCTGTTTCA TTTATGCTTT GGCTGCCCAG CAAGTATGAT 180

TTGTCCTTTC ACAATTGGTG GCGATGGTTT TCTCCTTCCA TTTATCTTTC TAGGTCATCC 240

CCTTCTAAAT GCCCATCATT AGATGATAGG TGGTACATGC ACAGTTGCTC TGGGAGTCTT 300

CAGAATAGAA ACTACCCATC TCAAGAGGAG CTCATTAAGG TTGTTGATGT GGAGGAGCAA 360

CAGCTGGAAG AGTCTGGGCC ACACGATTTG ACGGAAACAT CTTACTTGCC AAGGCAAGAT 420

CTAGGTAATA TTTCATCTGC TGTATTGGAA CAAACACTYT GATTTTACTC TGAATCCTAC 480

ATAAAGATAT TCTGGTTAAC CAACTTTTAG ATGTACTAGT CTATCATGGA CACTTTTGTT 540

ATACTTAATT AAGCCCACTT TAGAAAAATA GCTCAAGTGT TAATCAAGGT TTACTTGAAA 600

ATTATTGAAA CTGTTAATCC ATCTATATTT TAATTAATGG TTTAACTAAT GATTTTGAGG 660

ATGWGGGAGT CKTGGTGTAC TCTAMATGTA TTATTTCAGG CCAGGCATAG TGGCTCACGC 720

CTGGTAATCC CAGTAYYCMR GAGCCCGAGG CAGGTGGAGC CAGCTGAGGT CAGGAGTTCA 780

AGACCTGTCT TGGCCAACAT GGGNGAAACC CTGTCTTCTT CTTAAAAAAN ACAAAAAAAA 840

TTAACTGGGT TGTGCTTAGG TGNATGCCCC GNATCCTAGT TNTTCTTGNG GGTTGAGGGA 900

GGAGATCACN TTGGACCCCG GAGGGGNGGG TGGGGGNGAG CAGGNCAAAA CACNGACCCA 960

GCTGGGGTGG AAGGGAAGCC CACTCNAAAA AANNTTN 997

(2) INFORMATION FOR SEQ ID NO:26:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 639 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:26:

TTTTTAGGAA ACAAGCTACT TTGGATTTCC ACCAACACCT GTATTCATGT ACCCATTTTT 60

CTCTTAACCT AACTTTATTG GTCTTTTTAA TTCTTAACAG AGACCAGAAC TTTGTAATTC 120

AACATTCATC GTTGTGTAAA TTAAACTTCT CCCATTCCTT TCAGAGGGAA CCCCTTACCT 180

GGAATCTGGA ATCAGCCTCT TCTCTGATGA CCCTGAATCT GATCCTTCTG AAGACAGAGC 240

CCCAGAGTCA GCTCGTGTTG GCAACATACC ATCTTCAACC TCTGCATTGA AAGTTCCCCA 300

ATTGAAAGTT GCAGAATCTG CCCAGAGTCC AGCTGCTGCT CATACTACTG ATACTGCTGG 360

GTATAATGCA ATGGAAGAAA GTGTGAGCAG GGAGAAGCCA GAATTGACAG CTTCAACAGA 420

AAGGGTCAAC AAAAGAATGT CCATGGTGGT GTCTGGCCTG ACCCCAGAAG AATTTGTGAG 480

TGTATCCATA TGTATCTCCC TAATGACTAA GACTTAACAA CATTCTGGAA AGAGTTTTAT 540

GTAGGTATTG TCAATTAATA ACCTAGAGGA AGAAATCTAG AAAACAATCA CAGTTCTGTG 600

TAATTTAATT TCGATTACTA ATTTCTGAAA ATTTAGAAY 639

(2) INFORMATION FOR SEQ ID NO:27:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 922 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:27:

NCCCNNCCCC CNAATCTGAA ATGGGGGTAA CCCCCCCCCA ACCGANACNT GGGTNGCNTA 60

GAGANTTTAA TGGCCCNTTC TGAGGNACAN AAGCTTAAGC CAGGNGACGT GGANCNATGN 120

GTTGTTTNTT GTTTGGTTAC CTCCAGCCTG GGTGACAGAG CAAGACTCTG TCTAAAAAAA 180

AAAAAAAAAA AAATCGACTT TAAATAGTTC CAGGACACGT GTAGAACGTG CAGGATTGCT 240

ACGTAGGTAA ACATATGCCA TGGTGGGATA ACTAGTATTC TGAGCTGTGT GCTAGAGGTA 300

ACTCATGATA ATGGAATATT TGATTTAATT TCAGATGCTC GTGTACAAGT TTGCCAGAAA 360

ACACCACATC ACTTTAACTA ATCTAATTAC TGAAGAGACT ACTCATGTTG TTATGAAAAC 420

AGGTATACCA AGAACCTTTA CAGAATACCT TGCATCTGCT GCATAAAACC ACATGAGGCG 480

AGGCACGGTG GCGCATGCCT GTAATCGCAG CACTTTGGGA GGCCGAGGCG GGCAGATCAC 540

GAGATTAGGA GATCGAGACC ATCCTGGCCA GCATGGTGAA ACCCCGTCTC TACTANNAAA 600

TGGNAAAATT ANCTGGGTGT GGTCGCGTGC NCCTGTAGTC CCAGCTACTC GTGAGGCTGA 660

GGCAGGAGAA TCACTTGAAC CGGGGAAATG GAGGTTTCAG TGAGCAGAGA TCATNCCCCT 720

NCATTCCAGC CTGGCGACAG AGCAAGGCTC CGTCNCCNAA AAAATAAAAA AAAACGTGAA 780

CAAATAAGAA TATTTGTTGA GCATAGCATG GATGATAGTC TTCTAATAGT CAATCAATTA 840

CTTTATGAAA GACAAATAAT AGTTTTGCTG CTTCCTTACC TCCTTTTGTT TTGGGTTAAG 900

ATTTGGAGTG TGGGCCAGGC AC 922

(2) INFORMATION FOR SEQ ID NO:28:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 867 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:28:

GATCTATAGC TAGCCTTGGC GTCTAGAAGA TGGGTGTTGA GAAGAGGGAG TGGAAAGATA 60

TTTCCTCTGG TCTTAACTTC ATATCAGCCT CCCCTAGACT TCCAAATATC CATACCTGCT 120

GGTTATAATT AGTGGTGTTT TCAGCCTCTG ATTCTGTCAC CAGGGGTTTT AGAATCATAA 180

ATCCAGATTG ATCTTGGGAG TGTAAAAAAC TGAGGCTCTT TAGCTTCTTA GGACAGCACT 240

TCCTGATTTT GTTTTCAACT TCTAATCCTT TGAGTGTTTT TCATTCTGCA GATGCTGAGT 300

TTGTGTGTGA ACGGACACTG AAATATTTTC TAGGAATTGC GGGAGGAAAA TGGGTAGTTA 360

GCTATTTCTG TAAGTATAAT ACTATTTCTC CCCTCCTCCC TTTAACACCT CAGAATTGCA 420

TTTTTACACC TAACATTTAA CACCTAAGGT TTTTGCTGAT GCTGAGTCTG AGTTACCAAA 480

AGGTCTTTAA ATTGTAATAC TAAACTACTT TTATCTTTAA TATCACTTTG TTCAAGATAA 540

GCTGGTGATG CTGGGAAAAT GGGTCTCTTT TATAACTAAT AGGACCTAAT CTGCTCCTAG 600

CAATGTTAGC ATATGAGCTA GGGATTTATT TAATAGTCGG CAGGAATCCA TGTGCARCAG 660

NCAAACTTAT AATGTTTAAA TTAAACATCA ACTCTGTCTC CAGAAGGAAA CTGCTGCTAC 720

AAGCCTTATT AAAGGGCTGT GGCTTTAGAG GGAAGGACCT CTCCTCTGTC ATTCTTCCTG 780

TGCTCTTTTG TGAATCGCTG ACCTCTCTAT CTCCGTGAAA AGAGCACGTT CTTCTGCTGT 840

ATGTAACCTG TCTTTTCTAT GATCTCT 867

(2) INFORMATION FOR SEQ ID NO:29:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 561 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:29:

NAAAAACGGG GNNGGGANTG GGCCTTAAAN CCAAAGGGCN AACTCCCCAA CCATTNAAAA 60

ANTGACNGGG GATTATTAAA ANCGGCGGGA AACATTTCAC NGCCCAACTA ATATTGTTAA 120

ATTAAAACCA CCACCNCTGC NCCAAGGAGG GAAACTGCTG CTACAAGCCT TATTAAAGGG 180

CTGTGGCTTT AGAGGGAAGG ACCTCTCCTC TGTCATTCTT CCTGTGCTCT TTTGTGAATC 240

GCTGACCTCT CTATGTCCGT GAAAAGAGCA CGTTCTTCGT CTGTATGTAA CCTGTCTTTT 300

CTATGATCTC TTTAGGGGTG ACCCAGTCTA TTAAAGAAAG AAAAATGCTG AATGAGGTAA 360

GTACTTGATG TTACAAACTA ACCAGAGATA TTCATTCAGT CATATAGTTA AAAATGTATT 420

TGCTTCCTTC CATCAATGCA CCACTTTCCT TAACAATGCA CAAATTTTCC ATGATAATGA 480

GGATCATCAA GAATTATGCA GGCCTGCACT GTGGCTCATA CCTATAATCC CAGCGCTTTG 540

GGAGGCTGAG GCGCTTGGAT C 561

(2) INFORMATION FOR SEQ ID NO:30:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 567 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:30:

AATTTTTTGT ATTTTTAGTA GAGATGAGGT TCACCATGTT GGTCTAGATC TGGTGTCGAA 60

CGTCCTGACC TCAAGTGATC TGCCAGCCTC AGTCTCCCAA AGTGCTAGGA TTACAGGGGT 120

GAGCCACTGC GCCTGGCCTG AATGCCTAAA ATATGACGTG TCTGCTCCAC TTCCATTGAA 180

GGAAGCTTCT CTTTCTCTTA TCCTGATGGG TTGTGTTTGG TTTCTTTCAG CATGATTTTG 240

AAGTCAGAGG AGATGTGGTC AATGGAAGAA ACCACCAAGG TCCAAAGCGA GCAAGAGAAT 300

CCCAGGACAG AAAGGTAAAG CTCCCTCCCT CAAGTTGACA AAAATCTCAC CCCACCACTC 360

TGTATTCCAC TCCCCTTTGC AGAGATGGGC CGCTTCATTT TGTAAGACTT ATTACATACA 420

TACACAGTGC TAGATACTTT CACACAGGTT CTTTTTTCAC TCTTCCATCC CAACCACATA 480

AATAAGTATT GTCTCTACTT TATGAATGAT AAAACTAAGA GATTTAGAGA GGCTGTGTAA 540

TTTGGATTCC CGTCTCGGGT TCAGATC 567

(2) INFORMATION FOR SEQ ID NO:31:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 633 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:31:

TTGGCCTGAT TGGTGACAAA AGTGAGATGC TCAGTCCTTG AATGACAAAG AATGCCTGTA 60

GAGTTGCAGG TCCAACTACA TATGCACTTC AAGAAGATCT TCTGAAATCT AGTAGTGTTC 120

TGGACATTGG ACTGCTTGTC CCTGGGAAGT AGCAGCAGAA ATGATCGGTG GTGAACAGAA 180

GAAAAAGAAA AGCTCTTCCT TTTTGAAAGT CTGTTTTTTG AATAAAAGCC AATATTCTTT 240

TATAACTAGA TTTTCCTTCT CTCCATTCCC CTGTCCCTCT CTCTTCCTCT CTTCTTCCAG 300

ATCTTCAGGG GGCTAGAAAT CTGTTGCTAT GGGCCCTTCA CCAACATGCC CACAGGTAAG 360

AGCCTGGGAG AACCCCAGAG TTCCAGCACC AGCCTTTGTC TTACATAGTG GAGTATTATA 420

AGCAAGGTCC CACGATGGGG GTTCCTCAGA TTGCTGAAAT GTTCTAGAGG CTATTCTATT 480

TCTCTACCAC TCTCCAAACA AAACAGCACC TAAATGTTAT CCTATGGCAA AAAAAAACTA 540

TACCTTGTCC CCCTTCTCAA GAGCATGAAG GTGGTTAATA GTTAGGATTC AGTATGTTAT 600

GTGTTCAGAT GGCGTTGAGC TGCTGTTAGT GCC 633

(2) INFORMATION FOR SEQ ID NO:32:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 470 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:32:

TTTGAGAGAC TATCAAACCT TATACCAAGT GGCCTTATGG AGACTGATAA CCAGAGTACA 60

TGGCATATCA GTGGCAAATT GACTTAAAAT CCATACCCCT ACTATTTTAA GACCATTGTC 120

CTTTGGAGCA GAGAGACAGA CTCTCCCATT GAGAGGTCTT GCTATAAGCC TTCATCCGGA 180

GAGTGTAGGG TAGAGGGCCT GGGTTAAGTA TGCAGATTAC TGCAGTGATT TTACATGTAA 240

ATGTCCATTT TAGATCAACT GGAATGGATG GTACAGCTGT GTGGTGCTTC TGTGGTGAAG 300

GAGCTTTCAT CATTCACCCT TGGCACAGTA AGTATTGGGT GCCCTGTCAG TGTGGGAGGA 360

CACAATATTC TCTCCTGTGA GCAAGACTGG CACCTGTCAG TCCCTATGGA TGCCCCTACT 420

GTAGCCTCAG AAGTCTTCTC TGCCCACATA CCTGTGCCAA AAGACTCCAT 470

(2) INFORMATION FOR SEQ ID NO:33:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 517 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:33:

GGTGGTACGT GTCTGTAGTT CCAGCTACTT GGGAGGCTGA GATGGAAGGA TTGCTTGAGC 60

CCAGGAGGCA GAGGTGGNAN NTTACGCTGA GATCACACCA CTGCACTCCA GCCTGGGTGA 120

CAGAGCAAGA CCCTGTCTCA AAAACAAACA AAAAAAATGA TGAAGTGACA GTTCCAGTAG 180

TCCTACTTTG ACACTTTGAA TGCTCTTTCC TTCCTGGGGA TCCAGGGTGT CCACCCAATT 240

GTGGTTGTGC AGCCAGATGC CTGGACAGAG GACAATGGCT TCCATGGTAA GGTGCCTCGC 300

ATGTACCTGT GCTATTAGTG GGGTCCTTGT GCATGGGTTT GGTTTATCAC TCATTACCTG 360

GTGCTTGAGT AGCACAGTTC TTGGCACATT TTTAAATATT TGTTGAATGA ATGGCTAAAA 420

TGTCTTTTTG ATGTTTTTAT TGTTATTTGT TTTATATTGT AAAAGTAATA CATGAACTGT 480

TTCCATGGGG TGGGAGTAAG ATATGAATGT TCATCAC 517

(2) INFORMATION FOR SEQ ID NO:34:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 434 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:34:

CAGTAATCCT NAGAACTCAT ACGACCGGGC CCCTGGAGTC GNTGNTTNGA GCCTAGTCCN 60

GGAGAATGAA TTGACACTAA TCTCTGCTTG TGTTCTCTGT CTCCAGCAAT TGGGCAGATG 120

TGTGAGGCAC CTGTGGTGAC CCGAGAGTGG GTGTTGGACA GTGTAGCACT CTACCAGTGC 180

CAGGAGCTGG ACACCTACCT GATACCCCAG ATCCCCCACA GCCACTACTG ACTGCAGCCA 240

GCCACAGGTA CAGAGCCACA GGACCCCAAG AATGAGCTTA CAAAGTGGCC TTTCCAGGCC 300

CTGGGAGCTC CTCTCACTCT TCAGTCCTTC TACTGTCCTG GCTACTAAAT ATTTTATGTA 360

CATCAGCCTG AAAAGGACTT CTGGCTATGC AAGGGTCCCT TAAAGATTTT CTGCTTGAAG 420

TCTCCCTTGG AAAT 434

(2) INFORMATION FOR SEQ ID NO:35:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:35:

GATAAATTAA AACTGCGACT GCGCGGCGTG 30

(2) INFORMATION FOR SEQ ID NO:36:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:36:

GTAGTAGAGT CCCGGGAAAG GGACAGGGGG 30

(2) INFORMATION FOR SEQ ID NO:37:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:37:

ATATATATAT GTTTTTCTAA TGTGTTAAAG 30

(2) INFORMATION FOR SEQ ID NO:38:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:38:

GTAAGTCAGC ACAAGAGTGT ATTAATTTGG 30

(2) INFORMATION FOR SEQ ID NO:39:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:39:

TTTCTTTTTC TCCCCCCCCT ACCCTGCTAG 30

(2) INFORMATION FOR SEQ ID NO:40:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:40:

GTAAGTTTGA ATGTGTTATG TGGCTCCATT 30

(2) INFORMATION FOR SEQ ID NO:41:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:41:

AGCTACTTTT TTTTTTTTTT TTTGAGACAG 30

(2) INFORMATION FOR SEQ ID NO:42:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:42:

GTAAGTGCAC ACCACCATAT CCAGCTAAAT 30

(2) INFORMATION FOR SEQ ID NO:43:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:43:

AATTGTTCTT TCTTTCTTTA TAATTTATAG 30

(2) INFORMATION FOR SEQ ID NO:44:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:44:

GTATATAATT TGGTAATGAT GCTAGGTTGG 30

(2) INFORMATION FOR SEQ ID NO:45:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:45:

GAGTGTGTTT CTCAAACAAT TTAATTTCAG 30

(2) INFORMATION FOR SEQ ID NO:46:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:46:

GTAAGTGTTG AATATCCCAA GAATGACACT 30

(2) INFORMATION FOR SEQ ID NO:47:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:47:

AAACATAATG TTTTCCCTTG TATTTTACAG 30

(2) INFORMATION FOR SEQ ID NO:48:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:48:

GTAAAACCAT TTGTTTTCTT CTTCTTCTTC 30

(2) INFORMATION FOR SEQ ID NO:49:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:49:

TGCTTGACTG TTCTTTACCA TACTGTTTAG 30

(2) INFORMATION FOR SEQ ID NO:50:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:50:

GTAAGGGTCT CAGGTTTTTT AAGTATTTAA 30

(2) INFORMATION FOR SEQ ID NO:51:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:51:

TGATTTATTT TTTGGGGGGA AATTTTTTAG 30

(2) INFORMATION FOR SEQ ID NO:52:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:52:

GTGAGTCAAA GAGAACCTTT GTCTATGAAG 30

(2) INFORMATION FOR SEQ ID NO:53:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:53:

TCTTATTAGG ACTCTGTCTT TTCCCTATAG 30

(2) INFORMATION FOR SEQ ID NO:54:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:54:

GTAATGGCAA AGTTTGCCAA CTTAACAGGC 30

(2) INFORMATION FOR SEQ ID NO:55:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:55:

GAGTACCTTG TTATTTTTGT ATATTTTCAG 30

(2) INFORMATION FOR SEQ ID NO:56:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:56:

GTATTGGAAC CAGGTTTTTG TGTTTGCCCC 30

(2) INFORMATION FOR SEQ ID NO:57:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:57:

ACATCTGAAC CTCTGTTTTT GTTATTTAAG 30

(2) INFORMATION FOR SEQ ID NO:58:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:58:

AGGTAAAAAG CGTGTGTGTG TGTGCACATG 30

(2) INFORMATION FOR SEQ ID NO:59:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:59:

CATTTTCTTG GTACCATTTA TCGTTTTTGA 30

(2) INFORMATION FOR SEQ ID NO:60:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:60:

GTGTGTATTG TTGGCCAAAC ACTGATATCT 30

(2) INFORMATION FOR SEQ ID NO:61:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:61:

AGTAGATTTG TTTTCTCATT CCATTTAAAG 30

(2) INFORMATION FOR SEQ ID NO:62:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:62:

GTAAGAAACA TCAATGTAAA GATGCTGTGG 30

(2) INFORMATION FOR SEQ ID NO:63:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:63:

ATGGTTTTCT CCTTCCATTT ATCTTTCTAG 30

(2) INFORMATION FOR SEQ ID NO:64:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:64:

GTAATATTTC ATCTGCTGTA TTGGAACAAA 30

(2) INFORMATION FOR SEQ ID NO:65:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:65:

TGTAAATTAA ACTTCTCCCA TTCCTTTCAG 30

(2) INFORMATION FOR SEQ ID NO:66:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:66:

GTGAGTGTAT CCATATGTAT CTCCCTAATG 30

(2) INFORMATION FOR SEQ ID NO:67:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:67:

ATGATAATGG AATATTTGAT TTAATTTCAG 30

(2) INFORMATION FOR SEQ ID NO:68:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:68:

GTATACCAAG AACCTTTACA GAATACCTTG 30

(2) INFORMATION FOR SEQ ID NO:69:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:69:

CTAATCCTTT GAGTGTTTTT CATTCTGCAG 30

(2) INFORMATION FOR SEQ ID NO:70:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:70:

GTAAGTATAA TACTATTTCT CCCCTCCTCC 30

(2) INFORMATION FOR SEQ ID NO:71:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:71:

TGTAACCTGT CTTTTCTATG ATCTCTTTAG 30

(2) INFORMATION FOR SEQ ID NO:72:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:72:

GTAAGTACTT GATGTTACAA ACTAACCAGA 30

(2) INFORMATION FOR SEQ ID NO:73:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:73:

TCCTGATGGG TTGTGTTTGG TTTCTTTCAG 30

(2) INFORMATION FOR SEQ ID NO:74:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:74:

GTAAAGCTCC CTCCCTCAAG TTGACAAAAA 30

(2) INFORMATION FOR SEQ ID NO:75:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:75:

CTGTCCCTCT CTCTTCCTCT CTTCTTCCAG 30

(2) INFORMATION FOR SEQ ID NO:76:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:76:

GTAAGAGCCT GGGAGAACCC CAGAGTTCCA 30

(2) INFORMATION FOR SEQ ID NO:77:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:77:

AGTGATTTTA CATGTAAATG TCCATTTTAG 30

(2) INFORMATION FOR SEQ ID NO:78:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:78:

GTAAGTATTG GGTGCCCTGT CAGTGTGGGA 30

(2) INFORMATION FOR SEQ ID NO:79:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:79:

TTGAATGCTC TTTCCTTCCT GGGGATCCAG 30

(2) INFORMATION FOR SEQ ID NO:80:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:80:

GTAAGGTGCC TCGCATGTAC CTGTGCTATT 30

(2) INFORMATION FOR SEQ ID NO:81:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:81:

CTAATCTCTG CTTGTGTTCT CTGTCTCCAG 30

(2) INFORMATION FOR SEQ ID NO:82:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 42 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:82:

Cys Pro Ile Cys Leu Glu Leu Ile Lys Glu Pro Val Ser Thr Lys Cys
1 5 10 15

Asp His Ile Phe Cys Lys Phe Cys Met Leu Lys Leu Leu Asn Gln Lys
20 25 30

Lys Gly Pro Ser Gln Cys Pro Leu Cys Lys
35 40

(2) INFORMATION FOR SEQ ID NO:83:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 45 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide

(iii) HYPOTHETICAL: NO

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:83:

Cys Pro Ile Cys Leu Glu Leu Leu Lys Glu Pro Val Ser Ala Asp Cys
1 5 10 15

Asn His Ser Phe Cys Arg Ala Cys Ile Thr Leu Asn Tyr Glu Ser Asn
20 25 30

Arg Asn Thr Asp Gly Lys Gly Asn Cys Pro Val Cys Arg
35 40 45

(2) INFORMATION FOR SEQ ID NO:84:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 41 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide

(iii) HYPOTHETICAL: NO

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:84:

Cys Pro Ile Cys Leu Asp Met Leu Lys Asn Thr Met Thr Thr Lys Glu
1 5 10 15

Cys Leu His Arg Phe Cys Ser Asp Cys Ile Val Thr Ala Leu Arg Ser
20 25 30

Gly Asn Lys Glu Cys Pro Thr Cys Arg
35 40

(2) INFORMATION FOR SEQ ID NO:85:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 42 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide

(iii) HYPOTHETICAL: NO

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:85:

Cys Pro Val Cys Leu Gln Tyr Phe Ala Glu Pro Met Met Leu Asp Cys
1 5 10 15

Gly His Asn Ile Cys Cys Ala Cys Leu Ala Arg Cys Trp Gly Thr Ala
20 25 30

Cys Thr Asn Val Ser Cys Pro Gln Cys Arg
35 40 SEQUENCE LISTING
(1) GENERAL INFORMATION:

(i) APPLICANT: Skolnick, Mark H.
Goldgar, David E.
Miki, Yoshio
Swenson, Jeff
Kamb, Alexander
Harshman, Keith D.
Shattuck-Eidens, Donna M.
Tavtigian, Sean V.
Wiseman, Roger W.
Futreal, P. Andrew

(ii) TITLE OF INVENTION: 17q-Linked Breast and Ovarian Cancer
Susceptibility Gene

(iii) NUMBER OF SEQUENCES: 85

(iv) CORRESPONDENCE ADDRESS:
(A) ADDRESSEE: Venable, Baetjer, Howard & Civiletti, LLP
(B) STREET: 1201 New York Avenue, NW, Suite 1000
(C) CITY: Washington
(D) STATE: DC
(E) COUNTRY: USA
(F) ZIP: 20005

(v) COMPUTER READABLE FORM:
(A) MEDIUM TYPE: Floppy disk
(B) COMPUTER: IBM PC compatible
(C) OPERATING SYSTEM: PC-DOS / MS-DOS
(D) SOFTWARE: PatentIn Release # 1.0, Version # 1.30

(vi) CURRENT APPLICATION DATA:
(A) APPLICATION NUMBER:
(B) FILING DATE:
(C) CLASSIFICATION:

(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US
(B) FILING DATE: 07-JUN-1995

(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08 / 409,305
(B) FILING DATE: 24-MAR-1995

(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08 / 348,824
(B) FILING DATE: 29-NOV-1994

(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08 / 308,104
(B) FILING DATE: 16-SEP-1994

(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08 / 300,266
(B) FILING DATE: 02-SEP-1994

(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 08 / 289,221
(B) FILING DATE: 12-AUG-1994

(viii) ATTORNEY / AGENT INFORMATION:
(A) NAME: Ihnen, Jeffrey L.
(B) REGISTRATION NUMBER: 28,957
(C) REFERENCE / DOCKET NUMBER: 24884-109347

(ix) TELECOMMUNICATION INFORMATION:
(A) TELEPHONE: 202-962-4810
(B) TELEFAX: 202-962-8300

(2) INFORMATION FOR SEQ ID NO: 1:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 5914 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: cDNA

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(ix) FEATURE:
(A) NAME / KEY: CDS
(B) LOCATION: 120..5708

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 1:

agctcgctga gacttcctgg accccgcacc aggctgtggg gtttctcaga taactgggcc 60

CCTGCGCTCA GGAGGCCTTC ACCCTCTGCT CTGGGTAAAG TTCATTGGAA CAGAAAGAA 119

ATG GAT TTA TCT GCT CTT CGC GTT GAA GAA GTA CAA AAT GTC ATT AAT 167
Met Asp Leu Ser Ala Leu Arg Val Glu Glu Val Gln Asn Val Ile Asn
1 5 10 15

GCT ATG CAG AAA ATC TTA GAG TGT CCC ATC TGT CTG GAG TTG ATC AAG 215
Ala Met Gln Lys Ile Leu Glu Cys Pro Ile Cys Leu Glu Leu Ile Lys
20 25 30

GAA CCT GTC TCC ACA AAG TGT GAC CAC ATA TTT TGC AAA TTT TGC ATG 263
Glu Pro Val Ser Thr Lys Cys Asp His Ile Phe Cys Lys Phe Cys Met
35 40 45

CTG AAA CTT CTC AAC CAG AAG AAA GGG CCT TCA CAG TGT CCT TTA TGT 311
Leu Lys Leu Leu Asn Gln Lys Lys Gly Pro Ser Gln Cys Pro Leu Cys
50 55 60

AAG AAT GAT ATA ACC AAA AGG AGC CTA CAA GAA AGT ACG AGA TTT AGT 359
Lys Asn Asp Ile Thr Lys Arg Ser Leu Gln Glu Ser Thr Arg Phe Ser
65 70 75 80

CAA CTT GTT GAA GAG CTA TTG AAA ATC ATT TGT GCT TTT CAG CTT GAC 407
Gln Leu Val Glu Glu Leu Leu Lys Ile Ile Cys Ala Phe Gln Leu Asp
85 90 95

ACA GGT TTG GAG TAT GCA AAC AGC TAT AAT TTT GCA AAA AAG GAA AAT 455
Thr Gly Leu Glu Tyr Ala Asn Ser Tyr Asn Phe Ala Lys Lys Glu Asn
100 105 110

AAC TCT CCT GAA CAT CTA AAA GAT GAA GTT TCT ATC ATC CAA AGT ATG 503
Asn Ser Pro Glu His Leu Lys Asp Glu Val Ser Ile Ile Gln Ser Met
115 120 125

GGC TAC AGA AAC CGT GCC AAA AGA CTT CTA CAG AGT GAA CCC GAA AAT 551
Gly Tyr Arg Asn Arg Ala Lys Arg Leu Leu Gln Ser Glu Pro Glu Asn
130 135 140

CCT TCC TTG CAG GAA ACC AGT CTC AGT GTC CAA CTC TCT AAC CTT GGA 599
Pro Ser Leu Gln Glu Thr Ser Leu Ser Val Gln Leu Ser Asn Leu Gly
145 150 155 160

ACT GTG AGA ACT CTG AGG ACA AAG CAG CGG ATA CAA CCT CAA AAG ACG 647
Thr Val Arg Thr Leu Arg Thr Lys Gln Arg Ile Gln Pro Gln Lys Thr
165 170 175

TCT GTC TAC ATT GAA TTG GGA TCT GAT TCT TCT GAA GAT ACC GTT AAT 695
Ser Val Tyr Ile Glu Leu Gly Ser Asp Ser Ser Glu Asp Thr Val Asn
180 185 190

AAG GCA ACT TAT TGC AGT GTG GGA GAT CAA GAA TTG TTA CAA ATC ACC 743
Lys Ala Thr Tyr Cys Ser Val Gly Asp Gln Glu Leu Leu Gln Ile Thr
195 200 205

CCT CAA GGA ACC AGG GAT GAA ATC AGT TTG GAT TCT GCA AAA AAG GCT 791
Pro Gln Gly Thr Arg Asp Glu Ile Ser Leu Asp Ser Ala Lys Lys Ala
210 215 220

GCT TGT GAA TTT TCT GAG ACG GAT GTA ACA AAT ACT GAA CAT CAT CAA 839
Ala Cys Glu Phe Ser Glu Thr Asp Val Thr Asn Thr Glu His His Gln
225 230 235 240

CCC AGT AAT AAT GAT TTG AAC ACC ACT GAG AAG CGT GCA GCT GAG AGG 887
Pro Ser Asn Asn Asp Leu Asn Thr Thr Glu Lys Arg Ala Ala Glu Arg
245 250 255

CAT CCA GAA AAG TAT CAG GGT AGT TCT GTT TCA AAC TTG CAT GTG GAG 935
His Pro Glu Lys Tyr Gln Gly Ser Ser Val Ser Asn Leu His Val Glu
260 265 270

CCA TGT GGC ACA AAT ACT CAT GCC AGC TCA TTA CAG CAT GAG AAC AGC 983
Pro Cys Gly Thr Asn Thr His Ala Ser Ser Leu Gln His Glu Asn Ser
275 280 285

AGT TTA TTA CTC ACT AAA GAC AGA ATG AAT GTA GAA AAG GCT GAA TTC 1031
Ser Leu Leu Leu Thr Lys Asp Arg Met Asn Val Glu Lys Ala Glu Phe
290 295 300

TGT AAT AAA AGC AAA CAG CCT GGC TTA GCA AGG AGC CAA CAT AAC AGA 1079
Cys Asn Lys Ser Lys Gln Pro Gly Leu Ala Arg Ser Gln His Asn Arg
305 310 315 320

TGG GCT GGA AGT AAG GAA ACA TGT AAT GAT AGG CGG ACT CCC AGC ACA 1127
Trp Ala Gly Ser Lys Glu Thr Cys Asn Asp Arg Arg Thr Pro Ser Thr
325 330 335

GAA AAA AAG GTA GAT CTG AAT GCT GAT CCC CTG TGT GAG AGA AAA GAA 1175
Glu Lys Lys Val Asp Leu Asn Ala Asp Pro Leu Cys Glu Arg Lys Glu
340 345 350

TGG AAT AAG CAG AAA CTG CCA TGC TCA GAG AAT CCT AGA GAT ACT GAA 1223
Trp Asn Lys Gln Lys Leu Pro Cys Ser Glu Asn Pro Arg Asp Thr Glu
355 360 365

GAT GTT CCT TGG ATA ACA CTA AAT AGC AGC ATT CAG AAA GTT AAT GAG 1271
Asp Val Pro Trp Ile Thr Leu Asn Ser Ser Ile Gln Lys Val Asn Glu
370 375 380

TGG TTT TCC AGA AGT GAT GAA CTG TTA GGT TCT GAT GAC TCA CAT GAT 1319
Trp Phe Ser Arg Ser Asp Glu Leu Leu Gly Ser Asp Asp Ser His Asp
385 390 395 400

GGG GAG TCT GAA TCA AAT GCC AAA GTA GCT GAT GTA TTG GAC GTT CTA 1367
Gly Glu Ser Glu Ser Asn Ala Lys Val Ala Asp Val Leu Asp Val Leu
405 410 415

AAT GAG GTA GAT GAA TAT TCT GGT TCT TCA GAG AAA ATA GAC TTA CTG 1415
Asn Glu Val Asp Glu Tyr Ser Gly Ser Ser Glu Lys Ile Asp Leu Leu
420 425 430

GCC AGT GAT CCT CAT GAG GCT TTA ATA TGT AAA AGT GAA AGA GTT CAC 1463
Ala Ser Asp Pro His Glu Ala Leu Ile Cys Lys Ser Glu Arg Val His
435 440 445

TCC AAA TCA GTA GAG AGT AAT ATT GAA GAC AAA ATA TTT GGG AAA ACC 1511
Ser Lys Ser Val Glu Ser Asn Ile Glu Asp Lys Ile Phe Gly Lys Thr
450 455 460

TAT CGG AAG AAG GCA AGC CTC CCC AAC TTA AGC CAT GTA ACT GAA AAT 1559
Tyr Arg Lys Lys Ala Ser Leu Pro Asn Leu Ser His Val Thr Glu Asn
465 470 475 480

CTA ATT ATA GGA GCA TTT GTT ACT GAG CCA CAG ATA ATA CAA GAG CGT 1607
Leu Ile Ile Gly Ala Phe Val Thr Glu Pro Gln Ile Ile Gln Glu Arg
485 490 495

CCC CTC ACA AAT AAA TTA AAG CGT AAA AGG AGA CCT ACA TCA GGC CTT 1655
Pro Leu Thr Asn Lys Leu Lys Arg Lys Arg Arg Pro Thr Ser Gly Leu
500 505 510

CAT CCT GAG GAT TTT ATC AAG AAA GCA GAT TTG GCA GTT CAA AAG ACT 1703
His Pro Glu Asp Phe Ile Lys Lys Ala Asp Leu Ala Val Gln Lys Thr
515 520 525

CCT GAA ATG ATA AAT CAG GGA ACT AAC CAA ACG GAG CAG AAT GGT CAA 1751
Pro Glu Met Ile Asn Gln Gly Thr Asn Gln Thr Glu Gln Asn Gly Gln
530 535 540

GTG ATG AAT ATT ACT AAT AGT GGT CAT GAG AAT AAA ACA AAA GGT GAT 1799
Val Met Asn Ile Thr Asn Ser Gly His Glu Asn Lys Thr Lys Gly Asp
545 550 555 560

TCT ATT CAG AAT GAG AAA AAT CCT AAC CCA ATA GAA TCA CTC GAA AAA 1847
Ser Ile Gln Asn Glu Lys Asn Pro Asn Pro Ile Glu Ser Leu Glu Lys
565 570 575

GAA TCT GCT TTC AAA ACG AAA GCT GAA CCT ATA AGC AGC AGT ATA AGC 1895
Glu Ser Ala Phe Lys Thr Lys Ala Glu Pro Ile Ser Ser Ser Ile Ser
580 585 590

AAT ATG GAA CTC GAA TTA AAT ATC CAC AAT TCA AAA GCA CCT AAA AAG 1943
Asn Met Glu Leu Glu Leu Asn Ile His Asn Ser Lys Ala Pro Lys Lys
595 600 605

AAT AGG CTG AGG AGG AAG TCT TCT ACC AGG CAT ATT CAT GCG CTT GAA 1991
Asn Arg Leu Arg Arg Lys Ser Ser Thr Arg His Ile His Ala Leu Glu
610 615 620

CTA GTA GTC AGT AGA AAT CTA AGC CCA CCT AAT TGT ACT GAA TTG CAA 2039
Leu Val Val Ser Arg Asn Leu Ser Pro Pro Asn Cys Thr Glu Leu Gln
625 630 635 640

ATT GAT AGT TGT TCT AGC AGT GAA GAG ATA AAG AAA AAA AAG TAC AAC 2087
Ile Asp Ser Cys Ser Ser Ser Glu Glu Ile Lys Lys Lys Lys Tyr Asn
645 650 655

CAA ATG CCA GTC AGG CAC AGC AGA AAC CTA CAA CTC ATG GAA GGT AAA 2135
Gln Met Pro Val Arg His Ser Arg Asn Leu Gln Leu Met Glu Gly Lys
660 665 670

GAA CCT GCA ACT GGA GCC AAG AAG AGT AAC AAG CCA AAT GAA CAG ACA 2183
Glu Pro Ala Thr Gly Ala Lys Lys Ser Asn Lys Pro Asn Glu Gln Thr
675 680 685

AGT AAA AGA CAT GAC AGC GAT ACT TTC CCA GAG CTG AAG TTA ACA AAT 2231
Ser Lys Arg His Asp Ser Asp Thr Phe Pro Glu Leu Lys Leu Thr Asn
690 695 700

GCA CCT GGT TCT TTT ACT AAG TGT TCA AAT ACC AGT GAA CTT AAA GAA 2279
Ala Pro Gly Ser Phe Thr Lys Cys Ser Asn Thr Ser Glu Leu Lys Glu
705 710 715 720

TTT GTC AAT CCT AGC CTT CCA AGA GAA GAA AAA GAA GAG AAA CTA GAA 2327
Phe Val Asn Pro Ser Leu Pro Arg Glu Glu Lys Glu Glu Lys Leu Glu
725 730 735

ACA GTT AAA GTG TCT AAT AAT GCT GAA GAC CCC AAA GAT CTC ATG TTA 2375
Thr Val Lys Val Ser Asn Asn Ala Glu Asp Pro Lys Asp Leu Met Leu
740 745 750

AGT GGA GAA AGG GTT TTG CAA ACT GAA AGA TCT GTA GAG AGT AGC AGT 2423
Ser Gly Glu Arg Val Leu Gln Thr Glu Arg Ser Val Glu Ser Ser Ser
755 760 765

ATT TCA TTG GTA CCT GGT ACT GAT TAT GGC ACT CAG GAA AGT ATC TCG 2471
Ile Ser Leu Val Pro Gly Thr Asp Tyr Gly Thr Gln Glu Ser Ile Ser
770 775 780

TTA CTG GAA GTT AGC ACT CTA GGG AAG GCA AAA ACA GAA CCA AAT AAA 2519
Leu Leu Glu Val Ser Thr Leu Gly Lys Ala Lys Thr Glu Pro Asn Lys
785 790 795 800

TGT GTG AGT CAG TGT GCA GCA TTT GAA AAC CCC AAG GGA CTA ATT CAT 2567
Cys Val Ser Gln Cys Ala Ala Phe Glu Asn Pro Lys Gly Leu Ile His
805 810 815

GGT TGT TCC AAA GAT AAT AGA AAT GAC ACA GAA GGC TTT AAG TAT CCA 2615
Gly Cys Ser Lys Asp Asn Arg Asn Asp Thr Glu Gly Phe Lys Tyr Pro
820 825 830

TTG GGA CAT GAA GTT AAC CAC AGT CGG GAA ACA AGC ATA GAA ATG GAA 2663
Leu Gly His Glu Val Asn His Ser Arg Glu Thr Ser Ile Glu Met Glu
835 840 845

GAA AGT GAA CTT GAT GCT CAG TAT TTG CAG AAT ACA TTC AAG GTT TCA 2711
Glu Ser Glu Leu Asp Ala Gln Tyr Leu Gln Asn Thr Phe Lys Val Ser
850 855 860

AAG CGC CAG TCA TTT GCT CCG TTT TCA AAT CCA GGA AAT GCA GAA GAG 2759
Lys Arg Gln Ser Phe Ala Pro Phe Ser Asn Pro Gly Asn Ala Glu Glu
865 870 875 880

GAA TGT GCA ACA TTC TCT GCC CAC TCT GGG TCC TTA AAG AAA CAA AGT 2807
Glu Cys Ala Thr Phe Ser Ala His Ser Gly Ser Leu Lys Lys Gln Ser
885 890 895

CCA AAA GTC ACT TTT GAA TGT GAA CAA AAG GAA GAA AAT CAA GGA AAG 2855
Pro Lys Val Thr Phe Glu Cys Glu Gln Lys Glu Glu Asn Gln Gly Lys
900 905 910

AAT GAG TCT AAT ATC AAG CCT GTA CAG ACA GTT AAT ATC ACT GCA GGC 2903
Asn Glu Ser Asn Ile Lys Pro Val Gln Thr Val Asn Ile Thr Ala Gly
915 920 925

TTT CCT GTG GTT GGT CAG AAA GAT AAG CCA GTT GAT AAT GCC AAA TGT 2951
Phe Pro Val Val Gly Gln Lys Asp Lys Pro Val Asp Asn Ala Lys Cys
930 935 940

AGT ATC AAA GGA GGC TCT AGG TTT TGT CTA TCA TCT CAG TTC AGA GGC 2999
Ser Ile Lys Gly Gly Ser Arg Phe Cys Leu Ser Ser Gln Phe Arg Gly
945 950 955 960

AAC GAA ACT GGA CTC ATT ACT CCA AAT AAA CAT GGA CTT TTA CAA AAC 3047
Asn Glu Thr Gly Leu Ile Thr Pro Asn Lys His Gly Leu Leu Gln Asn
965 970 975

CCA TAT CGT ATA CCA CCA CTT TTT CCC ATC AAG TCA TTT GTT AAA ACT 3095
Pro Tyr Arg Ile Pro Pro Leu Phe Pro Ile Lys Ser Phe Val Lys Thr
980 985 990

AAA TGT AAG AAA AAT CTG CTA GAG GAA AAC TTT GAG GAA CAT TCA ATG 3143
Lys Cys Lys Lys Asn Leu Leu Glu Glu Asn Phe Glu Glu His Ser Met
995 1000 1005

TCA CCT GAA AGA GAA ATG GGA AAT GAG AAC ATT CCA AGT ACA GTG AGC 3191
Ser Pro Glu Arg Glu Met Gly Asn Glu Asn Ile Pro Ser Thr Val Ser
1010 1015 1020

ACA ATT AGC CGT AAT AAC ATT AGA GAA AAT GTT TTT AAA GAA GCC AGC 3239
Thr Ile Ser Arg Asn Asn Ile Arg Glu Asn Val Phe Lys Glu Ala Ser
1025 1030 1035 1040

TCA AGC AAT ATT AAT GAA GTA GGT TCC AGT ACT AAT GAA GTG GGC TCC 3287
Ser Ser Asn Ile Asn Glu Val Gly Ser Ser Thr Asn Glu Val Gly Ser
1045 1050 1055

AGT ATT AAT GAA ATA GGT TCC AGT GAT GAA AAC ATT CAA GCA GAA CTA 3335
Ser Ile Asn Glu Ile Gly Ser Ser Asp Glu Asn Ile Gln Ala Glu Leu
1060 1065 1070

GGT AGA AAC AGA GGG CCA AAA TTG AAT GCT ATG CTT AGA TTA GGG GTT 3383
Gly Arg Asn Arg Gly Pro Lys Leu Asn Ala Met Leu Arg Leu Gly Val
1075 1080 1085

TTG CAA CCT GAG GTC TAT AAA CAA AGT CTT CCT GGA AGT AAT TGT AAG 3431
Leu Gln Pro Glu Val Tyr Lys Gln Ser Leu Pro Gly Ser Asn Cys Lys
1090 1095 1100

CAT CCT GAA ATA AAA AAG CAA GAA TAT GAA GAA GTA GTT CAG ACT GTT 3479
His Pro Glu Ile Lys Lys Gln Glu Tyr Glu Glu Val Val Gln Thr Val
1105 1110 1115 1120

AAT ACA GAT TTC TCT CCA TAT CTG ATT TCA GAT AAC TTA GAA CAG CCT 3527
Asn Thr Asp Phe Ser Pro Tyr Leu Ile Ser Asp Asn Leu Glu Gln Pro
1125 1130 1135

ATG GGA AGT AGT CAT GCA TCT CAG GTT TGT TCT GAG ACA CCT GAT GAC 3575
Met Gly Ser Ser His Ala Ser Gln Val Cys Ser Glu Thr Pro Asp Asp
1140 1145 1150

CTG TTA GAT GAT GGT GAA ATA AAG GAA GAT ACT AGT TTT GCT GAA AAT 3623
Leu Leu Asp Asp Gly Glu Ile Lys Glu Asp Thr Ser Phe Ala Glu Asn
1155 1160 1165

GAC ATT AAG GAA AGT TCT GCT GTT TTT AGC AAA AGC GTC CAG AAA GGA 3671
Asp Ile Lys Glu Ser Ser Ala Val Phe Ser Lys Ser Val Gln Lys Gly
1170 1175 1180

GAG CTT AGC AGG AGT CCT AGC CCT TTC ACC CAT ACA CAT TTG GCT CAG 3719
Glu Leu Ser Arg Ser Pro Ser Pro Phe Thr His Thr His Leu Ala Gln
1185 1190 1195 1200

GGT TAC CGA AGA GGG GCC AAG AAA TTA GAG TCC TCA GAA GAG AAC TTA 3767
Gly Tyr Arg Arg Gly Ala Lys Lys Leu Glu Ser Ser Glu Glu Asn Leu
1205 1210 1215

TCT AGT GAG GAT GAA GAG CTT CCC TGC TTC CAA CAC TTG TTA TTT GGT 3815
Ser Ser Glu Asp Glu Glu Leu Pro Cys Phe Gln His Leu Leu Phe Gly
1220 1225 1230

AAA GTA AAC AAT ATA CCT TCT CAG TCT ACT AGG CAT AGC ACC GTT GCT 3863
Lys Val Asn Asn Ile Pro Ser Gln Ser Thr Arg His Ser Thr Val Ala
1235 1240 1245

ACC GAG TGT CTG TCT AAG AAC ACA GAG GAG AAT TTA TTA TCA TTG AAG 3911
Thr Glu Cys Leu Ser Lys Asn Thr Glu Glu Asn Leu Leu Ser Leu Lys
1250 1255 1260

AAT AGC TTA AAT GAC TGC AGT AAC CAG GTA ATA TTG GCA AAG GCA TCT 3959
Asn Ser Leu Asn Asp Cys Ser Asn Gln Val Ile Leu Ala Lys Ala Ser
1265 1270 1275 1280

CAG GAA CAT CAC CTT AGT GAG GAA ACA AAA TGT TCT GCT AGC TTG TTT 4007
Gln Glu His His Leu Ser Glu Glu Thr Lys Cys Ser Ala Ser Leu Phe
1285 1290 1295

TCT TCA CAG TGC AGT GAA TTG GAA GAC TTG ACT GCA AAT ACA AAC ACC 4055
Ser Ser Gln Cys Ser Glu Leu Glu Asp Leu Thr Ala Asn Thr Asn Thr
1300 1305 1310

CAG GAT CCT TTC TTG ATT GGT TCT TCC AAA CAA ATG AGG CAT CAG TCT 4103
Gln Asp Pro Phe Leu Ile Gly Ser Ser Lys Gln Met Arg His Gln Ser
1315 1320 1325

GAA AGC CAG GGA GTT GGT CTG AGT GAC AAG GAA TTG GTT TCA GAT GAT 4151
Glu Ser Gln Gly Val Gly Leu Ser Asp Lys Glu Leu Val Ser Asp Asp
1330 1335 1340

GAA GAA AGA GGA ACG GGC TTG GAA GAA AAT AAT CAA GAA GAG CAA AGC 4199
Glu Glu Arg Gly Thr Gly Leu Glu Glu Asn Asn Gln Glu Glu Gln Ser
1345 1350 1355 1360

ATG GAT TCA AAC TTA GGT GAA GCA GCA TCT GGG TGT GAG AGT GAA ACA 4247
Met Asp Ser Asn Leu Gly Glu Ala Ala Ser Gly Cys Glu Ser Glu Thr
1365 1370 1375

AGC GTC TCT GAA GAC TGC TCA GGG CTA TCC TCT CAG AGT GAC ATT TTA 4295
Ser Val Ser Glu Asp Cys Ser Gly Leu Ser Ser Gln Ser Asp Ile Leu
1380 1385 1390

ACC ACT CAG CAG AGG GAT ACC ATG CAA CAT AAC CTG ATA AAG CTC CAG 4343
Thr Thr Gln Gln Arg Asp Thr Met Gln His Asn Leu Ile Lys Leu Gln
1395 1400 1405

CAG GAA ATG GCT GAA CTA GAA GCT GTG TTA GAA CAG CAT GGG AGC CAG 4391
Gln Glu Met Ala Glu Leu Glu Ala Val Leu Glu Gln His Gly Ser Gln
1410 1415 1420

CCT TCT AAC AGC TAC CCT TCC ATC ATA AGT GAC TCT TCT GCC CTT GAG 4439
Pro Ser Asn Ser Tyr Pro Ser Ile Ile Ser Asp Ser Ser Ala Leu Glu
1425 1430 1435 1440

GAC CTG CGA AAT CCA GAA CAA AGC ACA TCA GAA AAA GCA GTA TTA ACT 4487
Asp Leu Arg Asn Pro Glu Gln Ser Thr Ser Glu Lys Ala Val Leu Thr
1445 1450 1455

TCA CAG AAA AGT AGT GAA TAC CCT ATA AGC CAG AAT CCA GAA GGC CTT 4535
Ser Gln Lys Ser Ser Glu Tyr Pro Ile Ser Gln Asn Pro Glu Gly Leu
1460 1465 1470

TCT GCT GAC AAG TTT GAG GTG TCT GCA GAT AGT TCT ACC AGT AAA AAT 4583
Ser Ala Asp Lys Phe Glu Val Ser Ala Asp Ser Ser Thr Ser Lys Asn
1475 1480 1485

AAA GAA CCA GGA GTG GAA AGG TCA TCC CCT TCT AAA TGC CCA TCA TTA 4631
Lys Glu Pro Gly Val Glu Arg Ser Ser Pro Ser Lys Cys Pro Ser Leu
1490 1495 1500

GAT GAT AGG TGG TAC ATG CAC AGT TGC TCT GGG AGT CTT CAG AAT AGA 4679
Asp Asp Arg Trp Tyr Met His Ser Cys Ser Gly Ser Leu Gln Asn Arg
1505 1510 1515 1520

AAC TAC CCA TCT CAA GAG GAG CTC ATT AAG GTT GTT GAT GTG GAG GAG 4727
Asn Tyr Pro Ser Gln Glu Glu Leu Ile Lys Val Val Asp Val Glu Glu
1525 1530 1535

CAA CAG CTG GAA GAG TCT GGG CCA CAC GAT TTG ACG GAA ACA TCT TAC 4775
Gln Gln Leu Glu Glu Ser Gly Pro His Asp Leu Thr Glu Thr Ser Tyr
1540 1545 1550

TTG CCA AGG CAA GAT CTA GAG GGA ACC CCT TAC CTG GAA TCT GGA ATC 4823
Leu Pro Arg Gln Asp Leu Glu Gly Thr Pro Tyr Leu Glu Ser Gly Ile
1555 1560 1565

AGC CTC TTC TCT GAT GAC CCT GAA TCT GAT CCT TCT GAA GAC AGA GCC 4871
Ser Leu Phe Ser Asp Asp Pro Glu Ser Asp Pro Ser Glu Asp Arg Ala
1570 1575 1580

CCA GAG TCA GCT CGT GTT GGC AAC ATA CCA TCT TCA ACC TCT GCA TTG 4919
Pro Glu Ser Ala Arg Val Gly Asn Ile Pro Ser Ser Thr Ser Ala Leu
1585 1590 1595 1600

AAA GTT CCC CAA TTG AAA GTT GCA GAA TCT GCC CAG AGT CCA GCT GCT 4967
Lys Val Pro Gln Leu Lys Val Ala Glu Ser Ala Gln Ser Pro Ala Ala
1605 1610 1615

GCT CAT ACT ACT GAT ACT GCT GGG TAT AAT GCA ATG GAA GAA AGT GTG 5015
Ala His Thr Thr Asp Thr Ala Gly Tyr Asn Ala Met Glu Glu Ser Val
1620 1625 1630

AGC AGG GAG AAG CCA GAA TTG ACA GCT TCA ACA GAA AGG GTC AAC AAA 5063
Ser Arg Glu Lys Pro Glu Leu Thr Ala Ser Thr Glu Arg Val Asn Lys
1635 1640 1645

AGA ATG TCC ATG GTG GTG TCT GGC CTG ACC CCA GAA GAA TTT ATG CTC 5111
Arg Met Ser Met Val Val Ser Gly Leu Thr Pro Glu Glu Phe Met Leu
1650 1655 1660

GTG TAC AAG TTT GCC AGA AAA CAC CAC ATC ACT TTA ACT AAT CTA ATT 5159
Val Tyr Lys Phe Ala Arg Lys His His Ile Thr Leu Thr Asn Leu Ile
1665 1670 1675 1680

ACT GAA GAG ACT ACT CAT GTT GTT ATG AAA ACA GAT GCT GAG TTT GTG 5207
Thr Glu Glu Thr Thr His Val Val Met Lys Thr Asp Ala Glu Phe Val
1685 1690 1695

TGT GAA CGG ACA CTG AAA TAT TTT CTA GGA ATT GCG GGA GGA AAA TGG 5255
Cys Glu Arg Thr Leu Lys Tyr Phe Leu Gly Ile Ala Gly Gly Lys Trp
1700 1705 1710

GTA GTT AGC TAT TTC TGG GTG ACC CAG TCT ATT AAA GAA AGA AAA ATG 5303
Val Val Ser Tyr Phe Trp Val Thr Gln Ser Ile Lys Glu Arg Lys Met
1715 1720 1725

CTG AAT GAG CAT GAT TTT GAA GTC AGA GGA GAT GTG GTC AAT GGA AGA 5351
Leu Asn Glu His Asp Phe Glu Val Arg Gly Asp Val Val Asn Gly Arg
1730 1735 1740

AAC CAC CAA GGT CCA AAG CGA GCA AGA GAA TCC CAG GAC AGA AAG ATC 5399
Asn His Gln Gly Pro Lys Arg Ala Arg Glu Ser Gln Asp Arg Lys Ile
1745 1750 1755 1760

TTC AGG GGG CTA GAA ATC TGT TGC TAT GGG CCC TTC ACC AAC ATG CCC 5447
Phe Arg Gly Leu Glu Ile Cys Cys Tyr Gly Pro Phe Thr Asn Met Pro
1765 1770 1775

ACA GAT CAA CTG GAA TGG ATG GTA CAG CTG TGT GGT GCT TCT GTG GTG 5495
Thr Asp Gln Leu Glu Trp Met Val Gln Leu Cys Gly Ala Ser Val Val
1780 1785 1790

AAG GAG CTT TCA TCA TTC ACC CTT GGC ACA GGT GTC CAC CCA ATT GTG 5543
Lys Glu Leu Ser Ser Phe Thr Leu Gly Thr Gly Val His Pro Ile Val
1795 1800 1805

GTT GTG CAG CCA GAT GCC TGG ACA GAG GAC AAT GGC TTC CAT GCA ATT 5591
Val Val Gln Pro Asp Ala Trp Thr Glu Asp Asn Gly Phe His Ala Ile
1810 1815 1820

GGG CAG ATG TGT GAG GCA CCT GTG GTG ACC CGA GAG TGG GTG TTG GAC 5639
Gly Gln Met Cys Glu Ala Pro Val Val Thr Arg Glu Trp Val Leu Asp
1825 1830 1835 1840

AGT GTA GCA CTC TAC CAG TGC CAG GAG CTG GAC ACC TAC CTG ATA CCC 5687
Ser Val Ala Leu Tyr Gln Cys Gln Glu Leu Asp Thr Tyr Leu Ile Pro
1845 1850 1855

CAG ATC CCC CAC AGC CAC TAC TGA CTGCAGCCAG CCACAGGTAC AGAGCCACAG 5741
Gln Ile Pro His Ser His Tyr *
1860

GACCCCAAGA ATGAGCTTAC AAAGTGGCCT TTCCAGGCCC TGGGAGCTCC TCTCACTCTT 5801

CAGTCCTTCT ACTGTCCTGG CTACTAAATA TTTTATGTAC ATCAGCCTGA AAAGGACTTC 5861

TGGCTATGCA AGGGTCCCTT AAAGATTTTC TGCTTGAAGT CTCCCTTGGA AAT 5914

(2) INFORMATION FOR SEQ ID NO: 2:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1863 amino acids
(B) TYPE: amino acid
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 2:

Met Asp Leu Ser Ala Leu Arg Val Glu Glu Val Gln Asn Val Ile Asn
1 5 10 15

Ala Met Gln Lys Ile Leu Glu Cys Pro Ile Cys Leu Glu Leu Ile Lys
20 25 30

Glu Pro Val Ser Thr Lys Cys Asp His Ile Phe Cys Lys Phe Cys Met
35 40 45

Leu Lys Leu Leu Asn Gln Lys Lys Gly Pro Ser Gln Cys Pro Leu Cys
50 55 60

Lys Asn Asp Ile Thr Lys Arg Ser Leu Gln Glu Ser Thr Arg Phe Ser
65 70 75 80

Gln Leu Val Glu Glu Leu Leu Lys Ile Ile Cys Ala Phe Gln Leu Asp
85 90 95

Thr Gly Leu Glu Tyr Ala Asn Ser Tyr Asn Phe Ala Lys Lys Glu Asn
100 105 110

Asn Ser Pro Glu His Leu Lys Asp Glu Val Ser Ile Ile Gln Ser Met
115 120 125

Gly Tyr Arg Asn Arg Ala Lys Arg Leu Leu Gln Ser Glu Pro Glu Asn
130 135 140

Pro Ser Leu Gln Glu Thr Ser Leu Ser Val Gln Leu Ser Asn Leu Gly
145 150 155 160

Thr Val Arg Thr Leu Arg Thr Lys Gln Arg Ile Gln Pro Gln Lys Thr
165 170 175

Ser Val Tyr Ile Glu Leu Gly Ser Asp Ser Ser Glu Asp Thr Val Asn
180 185 190

Lys Ala Thr Tyr Cys Ser Val Gly Asp Gln Glu Leu Leu Gln Ile Thr
195 200 205

Pro Gln Gly Thr Arg Asp Glu Ile Ser Leu Asp Ser Ala Lys Lys Ala
210 215 220

Ala Cys Glu Phe Ser Glu Thr Asp Val Thr Asn Thr Glu His His Gln
225 230 235 240

Pro Ser Asn Asn Asp Leu Asn Thr Thr Glu Lys Arg Ala Ala Glu Arg
245 250 255

His Pro Glu Lys Tyr Gln Gly Ser Ser Val Ser Asn Leu His Val Glu
260 265 270

Pro Cys Gly Thr Asn Thr His Ala Ser Ser Leu Gln His Glu Asn Ser
275 280 285

Ser Leu Leu Leu Thr Lys Asp Arg Met Asn Val Glu Lys Ala Glu Phe
290 295 300

Cys Asn Lys Ser Lys Gln Pro Gly Leu Ala Arg Ser Gln His Asn Arg
305 310 315 320

Trp Ala Gly Ser Lys Glu Thr Cys Asn Asp Arg Arg Thr Pro Ser Thr
325 330 335

Glu Lys Lys Val Asp Leu Asn Ala Asp Pro Leu Cys Glu Arg Lys Glu
340 345 350

Trp Asn Lys Gln Lys Leu Pro Cys Ser Glu Asn Pro Arg Asp Thr Glu
355 360 365

Asp Val Pro Trp Ile Thr Leu Asn Ser Ser Ile Gln Lys Val Asn Glu
370 375 380

Trp Phe Ser Arg Ser Asp Glu Leu Leu Gly Ser Asp Asp Ser His Asp
385 390 395 400

Gly Glu Ser Glu Ser Asn Ala Lys Val Ala Asp Val Leu Asp Val Leu
405 410 415

Asn Glu Val Asp Glu Tyr Ser Gly Ser Ser Glu Lys Ile Asp Leu Leu
420 425 430

Ala Ser Asp Pro His Glu Ala Leu Ile Cys Lys Ser Glu Arg Val His
435 440 445

Ser Lys Ser Val Glu Ser Asn Ile Glu Asp Lys Ile Phe Gly Lys Thr
450 455 460

Tyr Arg Lys Lys Ala Ser Leu Pro Asn Leu Ser His Val Thr Glu Asn
465 470 475 480

Leu Ile Ile Gly Ala Phe Val Thr Glu Pro Gln Ile Ile Gln Glu Arg
485 490 495

Pro Leu Thr Asn Lys Leu Lys Arg Lys Arg Arg Pro Thr Ser Gly Leu
500 505 510

His Pro Glu Asp Phe Ile Lys Lys Ala Asp Leu Ala Val Gln Lys Thr
515 520 525

Pro Glu Met Ile Asn Gln Gly Thr Asn Gln Thr Glu Gln Asn Gly Gln
530 535 540

Val Met Asn Ile Thr Asn Ser Gly His Glu Asn Lys Thr Lys Gly Asp
545 550 555 560

Ser Ile Gln Asn Glu Lys Asn Pro Asn Pro Ile Glu Ser Leu Glu Lys
565 570 575

Glu Ser Ala Phe Lys Thr Lys Ala Glu Pro Ile Ser Ser Ser Ile Ser
580 585 590

Asn Met Glu Leu Glu Leu Asn Ile His Asn Ser Lys Ala Pro Lys Lys
595 600 605

Asn Arg Leu Arg Arg Lys Ser Ser Thr Arg His Ile His Ala Leu Glu
610 615 620

Leu Val Val Ser Arg Asn Leu Ser Pro Pro Asn Cys Thr Glu Leu Gln
625 630 635 640

Ile Asp Ser Cys Ser Ser Ser Glu Glu Ile Lys Lys Lys Lys Tyr Asn
645 650 655

Gln Met Pro Val Arg His Ser Arg Asn Leu Gln Leu Met Glu Gly Lys
660 665 670

Glu Pro Ala Thr Gly Ala Lys Lys Ser Asn Lys Pro Asn Glu Gln Thr
675 680 685

Ser Lys Arg His Asp Ser Asp Thr Phe Pro Glu Leu Lys Leu Thr Asn
690 695 700

Ala Pro Gly Ser Phe Thr Lys Cys Ser Asn Thr Ser Glu Leu Lys Glu
705 710 715 720

Phe Val Asn Pro Ser Leu Pro Arg Glu Glu Lys Glu Glu Lys Leu Glu
725 730 735

Thr Val Lys Val Ser Asn Asn Ala Glu Asp Pro Lys Asp Leu Met Leu
740 745 750

Ser Gly Glu Arg Val Leu Gln Thr Glu Arg Ser Val Glu Ser Ser Ser
755 760 765

Ile Ser Leu Val Pro Gly Thr Asp Tyr Gly Thr Gln Glu Ser Ile Ser
770 775 780

Leu Leu Glu Val Ser Thr Leu Gly Lys Ala Lys Thr Glu Pro Asn Lys
785 790 795 800

Cys Val Ser Gln Cys Ala Ala Phe Glu Asn Pro Lys Gly Leu Ile His
805 810 815

Gly Cys Ser Lys Asp Asn Arg Asn Asp Thr Glu Gly Phe Lys Tyr Pro
820 825 830

Leu Gly His Glu Val Asn His Ser Arg Glu Thr Ser Ile Glu Met Glu
835 840 845

Glu Ser Glu Leu Asp Ala Gln Tyr Leu Gln Asn Thr Phe Lys Val Ser
850 855 860

Lys Arg Gln Ser Phe Ala Pro Phe Ser Asn Pro Gly Asn Ala Glu Glu
865 870 875 880

Glu Cys Ala Thr Phe Ser Ala His Ser Gly Ser Leu Lys Lys Gln Ser
885 890 895

Pro Lys Val Thr Phe Glu Cys Glu Gln Lys Glu Glu Asn Gln Gly Lys
900 905 910

Asn Glu Ser Asn Ile Lys Pro Val Gln Thr Val Asn Ile Thr Ala Gly
915 920 925

Phe Pro Val Val Gly Gln Lys Asp Lys Pro Val Asp Asn Ala Lys Cys
930 935 940

Ser Ile Lys Gly Gly Ser Arg Phe Cys Leu Ser Ser Gln Phe Arg Gly
945 950 955 960

Asn Glu Thr Gly Leu Ile Thr Pro Asn Lys His Gly Leu Leu Gln Asn
965 970 975

Pro Tyr Arg Ile Pro Pro Leu Phe Pro Ile Lys Ser Phe Val Lys Thr
980 985 990

Lys Cys Lys Lys Asn Leu Leu Glu Glu Asn Phe Glu Glu His Ser Met
995 1000 1005

Ser Pro Glu Arg Glu Met Gly Asn Glu Asn Ile Pro Ser Thr Val Ser
1010 1015 1020

Thr Ile Ser Arg Asn Asn Ile Arg Glu Asn Val Phe Lys Glu Ala Ser
1025 1030 1035 1040

Ser Ser Asn Ile Asn Glu Val Gly Ser Ser Thr Asn Glu Val Gly Ser
1045 1050 1055

Ser Ile Asn Glu Ile Gly Ser Ser Asp Glu Asn Ile Gln Ala Glu Leu
1060 1065 1070

Gly Arg Asn Arg Gly Pro Lys Leu Asn Ala Met Leu Arg Leu Gly Val
1075 1080 1085

Leu Gln Pro Glu Val Tyr Lys Gln Ser Leu Pro Gly Ser Asn Cys Lys
1090 1095 1100

His Pro Glu Ile Lys Lys Gln Glu Tyr Glu Glu Val Val Gln Thr Val
1105 1110 1115 1120

Asn Thr Asp Phe Ser Pro Tyr Leu Ile Ser Asp Asn Leu Glu Gln Pro
1125 1130 1135

Met Gly Ser Ser His Ala Ser Gln Val Cys Ser Glu Thr Pro Asp Asp
1140 1145 1150

Leu Leu Asp Asp Gly Glu Ile Lys Glu Asp Thr Ser Phe Ala Glu Asn
1155 1160 1165

Asp Ile Lys Glu Ser Ser Ala Val Phe Ser Lys Ser Val Gln Lys Gly
1170 1175 1180

Glu Leu Ser Arg Ser Pro Ser Pro Phe Thr His Thr His Leu Ala Gln
1185 1190 1195 1200

Gly Tyr Arg Arg Gly Ala Lys Lys Leu Glu Ser Ser Glu Glu Asn Leu
1205 1210 1215

Ser Ser Glu Asp Glu Glu Leu Pro Cys Phe Gln His Leu Leu Phe Gly
1220 1225 1230

Lys Val Asn Asn Ile Pro Ser Gln Ser Thr Arg His Ser Thr Val Ala
1235 1240 1245

Thr Glu Cys Leu Ser Lys Asn Thr Glu Glu Asn Leu Leu Ser Leu Lys
1250 1255 1260

Asn Ser Leu Asn Asp Cys Ser Asn Gln Val Ile Leu Ala Lys Ala Ser
1265 1270 1275 1280

Gln Glu His His Leu Ser Glu Glu Thr Lys Cys Ser Ala Ser Leu Phe
1285 1290 1295

Ser Ser Gln Cys Ser Glu Leu Glu Asp Leu Thr Ala Asn Thr Asn Thr
1300 1305 1310

Gln Asp Pro Phe Leu Ile Gly Ser Ser Lys Gln Met Arg His Gln Ser
1315 1320 1325

Glu Ser Gln Gly Val Gly Leu Ser Asp Lys Glu Leu Val Ser Asp Asp
1330 1335 1340

Glu Glu Arg Gly Thr Gly Leu Glu Glu Asn Asn Gln Glu Glu Gln Ser
1345 1350 1355 1360

Met Asp Ser Asn Leu Gly Glu Ala Ala Ser Gly Cys Glu Ser Glu Thr
1365 1370 1375

Ser Val Ser Glu Asp Cys Ser Gly Leu Ser Ser Gln Ser Asp Ile Leu
1380 1385 1390

Thr Thr Gln Gln Arg Asp Thr Met Gln His Asn Leu Ile Lys Leu Gln
1395 1400 1405

Gln Glu Met Ala Glu Leu Glu Ala Val Leu Glu Gln His Gly Ser Gln
1410 1415 1420

Pro Ser Asn Ser Tyr Pro Ser Ile Ile Ser Asp Ser Ser Ala Leu Glu
1425 1430 1435 1440

Asp Leu Arg Asn Pro Glu Gln Ser Thr Ser Glu Lys Ala Val Leu Thr
1445 1450 1455

Ser Gln Lys Ser Ser Glu Tyr Pro Ile Ser Gln Asn Pro Glu Gly Leu
1460 1465 1470

Ser Ala Asp Lys Phe Glu Val Ser Ala Asp Ser Ser Thr Ser Lys Asn
1475 1480 1485

Lys Glu Pro Gly Val Glu Arg Ser Ser Pro Ser Lys Cys Pro Ser Leu
1490 1495 1500

Asp Asp Arg Trp Tyr Met His Ser Cys Ser Gly Ser Leu Gln Asn Arg
1505 1510 1515 1520

Asn Tyr Pro Ser Gln Glu Glu Leu Ile Lys Val Val Asp Val Glu Glu
1525 1530 1535

Gln Gln Leu Glu Glu Ser Gly Pro His Asp Leu Thr Glu Thr Ser Tyr
1540 1545 1550

Leu Pro Arg Gln Asp Leu Glu Gly Thr Pro Tyr Leu Glu Ser Gly Ile
1555 1560 1565

Ser Leu Phe Ser Asp Asp Pro Glu Ser Asp Pro Ser Glu Asp Arg Ala
1570 1575 1580

Pro Glu Ser Ala Arg Val Gly Asn Ile Pro Ser Ser Thr Ser Ala Leu
1585 1590 1595 1600

Lys Val Pro Gln Leu Lys Val Ala Glu Ser Ala Gln Ser Pro Ala Ala
1605 1610 1615

Ala His Thr Thr Asp Thr Ala Gly Tyr Asn Ala Met Glu Glu Ser Val
1620 1625 1630

Ser Arg Glu Lys Pro Glu Leu Thr Ala Ser Thr Glu Arg Val Asn Lys
1635 1640 1645

Arg Met Ser Met Val Val Ser Gly Leu Thr Pro Glu Glu Phe Met Leu
1650 1655 1660

Val Tyr Lys Phe Ala Arg Lys His His Ile Thr Leu Thr Asn Leu Ile
1665 1670 1675 1680

Thr Glu Glu Thr Thr His Val Val Met Lys Thr Asp Ala Glu Phe Val
1685 1690 1695

Cys Glu Arg Thr Leu Lys Tyr Phe Leu Gly Ile Ala Gly Gly Lys Trp
1700 1705 1710

Val Val Ser Tyr Phe Trp Val Thr Gln Ser Ile Lys Glu Arg Lys Met
1715 1720 1725

Leu Asn Glu His Asp Phe Glu Val Arg Gly Asp Val Val Asn Gly Arg
1730 1735 1740

Asn His Gln Gly Pro Lys Arg Ala Arg Glu Ser Gln Asp Arg Lys Ile
1745 1750 1755 1760

Phe Arg Gly Leu Glu Ile Cys Cys Tyr Gly Pro Phe Thr Asn Met Pro
1765 1770 1775

Thr Asp Gln Leu Glu Trp Met Val Gln Leu Cys Gly Ala Ser Val Val
1780 1785 1790

Lys Glu Leu Ser Ser Phe Thr Leu Gly Thr Gly Val His Pro Ile Val
1795 1800 1805

Val Val Gln Pro Asp Ala Trp Thr Glu Asp Asn Gly Phe His Ala Ile
1810 1815 1820

Gly Gln Met Cys Glu Ala Pro Val Val Thr Arg Glu Trp Val Leu Asp
1825 1830 1835 1840

Ser Val Ala Leu Tyr Gln Cys Gln Glu Leu Asp Thr Tyr Leu Ile Pro
1845 1850 1855

Gln Ile Pro His Ser His Tyr *
1860

(2) INFORMATION FOR SEQ ID NO: 3:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: s754 A

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 3:

CTAGCCTGGG CAACAAACGA 20

(2) INFORMATION FOR SEQ ID NO: 4:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: s754 B

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 4:

GCAGGAAGCA GGAATGGAAC 20

(2) INFORMATION FOR SEQ ID NO: 5:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: s975 A

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 5:

TAGGAGATGG ATTATTGGTG 20

(2) INFORMATION FOR SEQ ID NO: 6:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: s975 B

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 6:

AGGCAACTTT GCAATGAGTG 20

(2) INFORMATION FOR SEQ ID NO: 7:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 22 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: tdj1474 A

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 7:

CAGAGTGAGA CCTTGTCTCA AA 22

(2) INFORMATION FOR SEQ ID NO: 8:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: tdj1474 B

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 8:

TTCTGCAAAC ACCTTAAACT CAG 23

(2) INFORMATION FOR SEQ ID NO: 9:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: tdj1239 A

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 9:

AACCTGGAAG GCAGAGGTTG 20

(2) INFORMATION FOR SEQ ID NO: 10:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 21 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(vii) IMMEDIATE SOURCE:
(B) CLONE: tdj1239 B

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 10:

TCTGTACCTG CTAAGCAGTG G 21

(2) INFORMATION FOR SEQ ID NO: 11:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 111 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: cDNA

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(ix) FEATURE:
(A) NAME / KEY: CDS
(B) LOCATION: 2..111

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 11:

G GKC TTA CTC TGT TGT CCC AGC TGG AGT ACA GWG TGC GAT CAT GAG 46
Xaa Leu Leu Cys Cys Pro Ser Trp Ser Thr Xaa Cys Asp His Glu
1865 1870 1875

GCT TAC TGT TGC TTG ACT CCT AGG CTC AAG CGA TCC TAT CAC CTC AGT 94
Ala Tyr Cys Cys Leu Thr Pro Arg Leu Lys Arg Ser Tyr His Leu Ser
1880 1885 1890 1895

CTC CAA GTA GCT GGA CT 111
Leu Gln Val Ala Gly
1900

(2) INFORMATION FOR SEQ ID NO: 12:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 36 amino acids
(B) TYPE: amino acid
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 12:

Xaa Leu Leu Cys Cys Pro Ser Trp Ser Thr Xaa Cys Asp His Glu Ala
1 5 10 15

Tyr Cys Cys Leu Thr Pro Arg Leu Lys Arg Ser Tyr His Leu Ser Leu
20 25 30

Gln Val Ala Gly
35

(2) INFORMATION FOR SEQ ID NO: 13:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1534 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 13:

GAGGCTAGAG GGCAGGCACT TTATGGCAAA CTCAGGTAGA ATTCTTCCTC TTCCGTCTCT 60

TTCCTTTTAC GTCATCGGGG AGACTGGGTG GCAATCGCAG CCCGAGAGAC GCATGGCTCT 120

TTCTGCCCTC CATCCTCTGA TGTACCTTGA TTTCGTATTC TGAGAGGCTG CTGCTTAGCG 180

GTAGCCCCTT GGTTTCCGTG GCAACGGAAA AGCGCGGGAA TTACAGATAA ATTAAAACTG 240

CGACTGCGCG GCGTGAGCTC GCTGAGACTT CCTGGACCCC GCACCAGGCT GTGGGGTTTC 300

TCAGATAACT GGGCCCCTGC GCTCAGGAGG CCTTCACCCT CTGCTCTGGG TAAAGGTAGT 360

AGAGTCCCGG GAAAGGGACA GGGGGCCCAA GTGATGCTCT GGGGTACTGG CGTGGGAGAG 420

TGGATTTCCG AAGCTGACAG ATGGGTATTC TTTGACGGGG GGTAGGGGCG GAACCTGAGA 480

GGCGTAAGGC GTTGTGAACC CTGGGGAGGG GGGCAGTTTG TAGGTCGCGA GGGAAGCGCT 540

GAGGATCAGG AAGGGGGCAC TGAGTGTCCG TGGGGGAATC CTCGTGATAG GAACTGGAAT 600

ATGCCTTGAG GGGGACACTA TGTCTTTAAA AACGTCGGCT GGTCATGAGG TCAGGAGTTC 660

CAGACCAGCC TGACCAACGT GGTGAAACTC CGTCTCTACT AAAAATACNA AAATTAGCCG 720

GGCGTGGTGC CGCTCCAGCT ACTCAGGAGG CTGAGGCAGG AGAATCGCTA GAACCCGGGA 780

GGCGGAGGTT GCAGTGAGCC GAGATCGCGC CATTGCACTC CAGCCTGGGC GACAGAGCGA 840

GACTGTCTCA AAACAAAACA AAACAAAACA AAACAAAAAA CACCGGCTGG TATGTATGAG 900

AGGATGGGAC CTTGTGGAAG AAGAGGTGCC AGGAATATGT CTGGGAAGGG GAGGAGACAG 960

GATTTTGTGG GAGGGAGAAC TTAAGAACTG GATCCATTTG CGCCATTGAG AAAGCGCAAG 1020

AGGGAAGTAG AGGAGCGTCA GTAGTAACAG ATGCTGCCGG CAGGGATGTG CTTGAGGAGG 1080

ATCCAGAGAT GAGAGCAGGT CACTGGGAAA GGTTAGGGGC GGGGAGGCCT TGATTGGTGT 1140

TGGTTTGGTC GTTGTTGATT TTGGTTTTAT GCAAGAAAAA GAAAACAACC AGAAACATTG 1200

GAGAAAGCTA AGGCTACCAC CACCTACCCG GTCAGTCACT CCTCTGTAGC TTTCTCTTTC 1260

TTGGAGAAAG GAAAAGACCC AAGGGGTTGG CAGCGATATG TGAAAAAATT CAGAATTTAT 1320

GTTGTCTAAT TACAAAAAGC AACTTCTAGA ATCTTTAAAA ATAAAGGACG TTGTCATTAG 1380

TTCTTCTGGT TTGTATTATT CTAAAACCTT CCAAATCTTC AAATTTACTT TATTTTAAAA 1440

TGATAAAATG AAGTTGTCAT TTTATAAACC TTTTAAAAAG ATATATATAT ATGTTTTTCT 1500

AATGTGTTAA AGTTCATTGG AACAGAAAGA AATG 1534

(2) INFORMATION FOR SEQ ID NO: 14:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 1924 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 14:

GAGGCTAGAG GGCAGGCACT TTATGGCAAA CTCAGGTAGA ATTCTTCCTC TTCCGTCTCT 60

TTCCTTTTAC GTCATCGGGG AGACTGGGTG GCAATCGCAG CCCGAGAGAC GCATGGCTCT 120

TTCTGCCCTC CATCCTCTGA TGTACCTTGA TTTCGTATTC TGAGAGGCTG CTGCTTAGCG 180

GTAGCCCCTT GGTTTCCGTG GCAACGGAAA AGCGCGGGAA TTACAGATAA ATTAAAACTG 240

CGACTGCGCG GCGTGAGCTC GCTGAGACTT CCTGGACCCC GCACCAGGCT GTGGGGTTTC 300

TCAGATAACT GGGCCCCTGC GCTCAGGAGG CCTTCACCCT CTGCTCTGGG TAAAGGTAGT 360

AGAGTCCCGG GAAAGGGACA GGGGGCCCAA GTGATGCTCT GGGGTACTGG CGTGGGAGAG 420

TGGATTTCCG AAGCTGACAG ATGGGTATTC TTTGACGGGG GGTAGGGGCG GAACCTGAGA 480

GGCGTAAGGC GTTGTGAACC CTGGGGAGGG GGGCAGTTTG TAGGTCGCGA GGGAAGCGCT 540

GAGGATCAGG AAGGGGGCAC TGAGTGTCCG TGGGGGAATC CTCGTGATAG GAACTGGAAT 600

ATGCCTTGAG GGGGACACTA TGTCTTTAAA AACGTCGGCT GGTCATGAGG TCAGGAGTTC 660

CAGACCAGCC TGACCAACGT GGTGAAACTC CGTCTCTACT AAAAATACNA AAATTAGCCG 720

GGCGTGGTGC CGCTCCAGCT ACTCAGGAGG CTGAGGCAGG AGAATCGCTA GAACCCGGGA 780

GGCGGAGGTT GCAGTGAGCC GAGATCGCGC CATTGCACTC CAGCCTGGGC GACAGAGCGA 840

GACTGTCTCA AAACAAAACA AAACAAAACA AAACAAAAAA CACCGGCTGG TATGTATGAG 900

AGGATGGGAC CTTGTGGAAG AAGAGGTGCC AGGAATATGT CTGGGAAGGG GAGGAGACAG 960

GATTTTGTGG GAGGGAGAAC TTAAGAACTG GATCCATTTG CGCCATTGAG AAAGCGCAAG 1020

AGGGAAGTAG AGGAGCGTCA GTAGTAACAG ATGCTGCCGG CAGGGATGTG CTTGAGGAGG 1080

ATCCAGAGAT GAGAGCAGGT CACTGGGAAA GGTTAGGGGC GGGGAGGCCT TGATTGGTGT 1140

TGGTTTGGTC GTTGTTGATT TTGGTTTTAT GCAAGAAAAA GAAAACAACC AGAAACATTG 1200

GAGAAAGCTA AGGCTACCAC CACCTACCCG GTCAGTCACT CCTCTGTAGC TTTCTCTTTC 1260

TTGGAGAAAG GAAAAGACCC AAGGGGTTGG CAGCGATATG TGAAAAAATT CAGAATTTAT 1320

GTTGTCTAAT TACAAAAAGC AACTTCTAGA ATCTTTAAAA ATAAAGGACG TTGTCATTAG 1380

TTCTTCTGGT TTGTATTATT CTAAAACCTT CCAAATCTTC AAATTTACTT TATTTTAAAA 1440

TGATAAAATG AAGTTGTCAT TTTATAAACC TTTTAAAAAG ATATATATAT ATGTTTTTCT 1500

AATGTGTTAA AGTTCATTGG AACAGAAAGA AATGGATTTA TCTGCTCTTC GCGTTGAAGA 1560

AGTACAAAAT GTCATTAATG CTATGCAGAA AATCTTAGAG TGTCCCATCT GGTAAGTCAG 1620

CACAAGAGTG TATTAATTTG GGATTCCTAT GATTATCTCC TATGCAAATG AACAGAATTG 1680

ACCTTACATA CTAGGGAAGA AAAGACATGT CTAGTAAGAT TAGGCTATTG TAATTGCTGA 1740

TTTTCTTAAC TGAAGAACTT TAAAAATATA GAAAATGATT CCTTGTTCTC CATCCACTCT 1800

GCCTCTCCCA CTCCTCTCCT TTTCAACACA ATCCTGTGGT CCGGGAAAGA CAGGGCTCTG 1860

TCTTGATTGG TTCTGCACTG GGCAGGATCT GTTAGATACT GCATTTGCTT TCTCCAGCTC 1920

TAAA 1924

(2) INFORMATION FOR SEQ ID NO: 15:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 631 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 15:

AAATGCTGAT GATAGTATAG AGTATTGAAG GGATCAATAT AATTCTGTTT TGATATCTGA 60

AAGCTCACTG AAGGTAAGGA TCGTATTCTC TGCTGTATTC TCAGTTCCTG ACACAGCAGA 120

CATTTAATAA ATATTGAACG AACTTGAGGC CTTATGTTGA CTCAGTCATA ACAGCTCAAA 180

GTTGAACTTA TTCACTAAGA ATAGCTTTAT TTTTAAATAA ATTATTGAGC CTCATTTATT 240

TTCTTTTTCT CCCCCCCCTA CCCTGCTAGT CTGGAGTTGA TCAAGGAACC TGTCTCCACA 300

AAGTGTGACC ACATATTTTG CAAGTAAGTT TGAATGTGTT ATGTGGCTCC ATTATTAGCT 360

TTTGTTTTTG TCCTTCATAA CCCAGGAAAC ACCTAACTTT ATAGAAGCTT TACTTTCTTC 420

AATTAAGTGA GAACGAAAAT CCAACTCCAT TTCATTCTTT CTCAGAGAGT ATATAGTTAT 480

CAAAAGTTGG TTGTAATCAT AGTTCCTGGT AAAGTTTTGA CATATATTAT CTTTTTTTTT 540

TTTTGAGACA AGTCTCGCTC TGTCGCCCAG GCTGGAGTGC AGTGGCATGA GGCTTGCTCA 600

CTGCACCTCC GCCCCCGAGT TCAGCGACTC T 631

(2) INFORMATION FOR SEQ ID NO: 16:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 481 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 16:

TGAGATCTAG ACCACATGGT CAAAGAGATA GAATGTGAGC AATAAATGAA CCTTAAATTT 60

TTCAACAGCT ACTTTTTTTT TTTTTTTTTG AGACAGGGKC TTACTCTGTT GTCCCAGCTG 120

GAGTACAGWG TGCGATCATG AGGCTTACTG TTGCTTGACT CCTAGGCTCA AGCGATCCTA 180

TCACCTCAGT CTCCAAGTAG CTGGACTGTA AGTGCACACC ACCATATCCA GCTAAATTTT 240

GTGTTTTCTG TAGAGACGGG GTTTCGCCAT GTTTCCCAGG CTGGTCTTGA ACTTTGGGCT 300

TAACCCGTCT GCCCACCTAG GCATCCCAAA GTGCTAGGAT TACAGGTGTG AGTCATCATG 360

CCTGGCCAGT ATTTTAGTTA GCTCTGTCTT TTCAAGTCAT ATACAAGTTC ATTTTCTTTT 420

AAGTTTAGTT AACAACCTTA TATCATGTAT TCTTTTCTAG CATAAAGAAA GATTCGAGGC 480

C 481

(2) INFORMATION FOR SEQ ID NO: 17:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 522 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 17:

TGTGATCATA ACAGTAAGCC ATATGCATGT AAGTTCAGTT TTCATAGATC ATTGCTTATG 60

TAGTTTAGGT TTTTGCTTAT GCAGCATCCA AAAACAATTA GGAAACTATT GCTTGTAATT 120

CACCTGCCAT TACTTTTTAA ATGGCTCTTA AGGGCAGTTG TGAGATTATC TTTTCATGGC 180

TATTTGCCTT TTGAGTATTC TTTCTACAAA AGGAAGTAAA TTAAATTGTT CTTTCTTTCT 240

TTATAATTTA TAGATTTTGC ATGCTGAAAC TTCTCAACCA GAAGAAAGGG CCTTCACAGT 300

GTCCTTTATG TAAGAATGAT ATAACCAAAA GGTATATAAT TTGGTAATGA TGCTAGGTTG 360

GAAGCAACCA CAGTAGGAAA AAGTAGAAAT TATTTAATAA CATAGCGTTC CTATAAAACC 420

ATTCATCAGA AAAATTTATA AAAGAGTTTT TAGCACACAG TAAATTATTT CCAAAGTTAT 480

TTTCCTGAAA GTTTTATGGG CATCTGCCTT ATACAGGTAT TG 522

(2) INFORMATION FOR SEQ ID NO: 18:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 465 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 18:

GGTAGGCTTA AATGAATGAC AAAAAGTTAC TAAATCACTG CCATCACACG GTTTATACAG 60

ATGTCAATGA TGTATTGATT ATAGAGGTTT TCTACTGTTG CTGCATCTTA TTTTTATTTG 120

TTTACATGTC TTTTCTTATT TTAGTGTCCT TAAAAGGTTG ATAATCACTT GCTGAGTGTG 180

TTTCTCAAAC AATTTAATTT CAGGAGCCTA CAAGAAAGTA CGAGATTTAG TCAACTTGTT 240

GAAGAGCTAT TGAAAATCAT TTGTGCTTTT CAGCTTGACA CAGGTTTGGA GTGTAAGTGT 300

TGAATATCCC AAGAATGACA CTCAAGTGCT GTCCATGAAA ACTCAGGAAG TTTGCACAAT 360

TACTTTCTAT GACGTGGTGA TAAGACCTTT TAGTCTAGGT TAATTTTAGT TCTGTATCTG 420

TAATCTATTT TAAAAAATTA CTCCCACTGG TCTCACACCT TATTT 465

(2) INFORMATION FOR SEQ ID NO: 19:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 513 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 19:

AAAAAATCAC AGGTAACCTT AATGCATTGT CTTAACACAA CAAAGAGCAT ACATAGGGTT 60

TCTCTTGGTT TCTTTGATTA TAATTCATAC ATTTTTCTCT AACTGCAAAC ATAATGTTTT 120

CCCTTGTATT TTACAGATGC AAACAGCTAT AATTTTGCAA AAAAGGAAAA TAACTCTCCT 180

GAACATCTAA AAGATGAAGT TTCTATCATC CAAAGTATGG GCTACAGAAA CCGTGCCAAA 240

AGACTTCTAC AGAGTGAACC CGAAAATCCT TCCTTGGTAA AACCATTTGT TTTCTTCTTC 300

TTCTTCTTCT TCTTTTCTTT TTTTTTTCTT TTTTTTTTTG AGATGGAGTC TTGCTCTGTG 360

GCCCAGGCTA GAAGCAGTCC TCCTGCCTTA GCCNCCTTAG TAGCTGGGAT TACAGGCACG 420

CGCACCATGC CAGGCTAATT TTTGTATTTT TAGTAGAGAC GGGGTTTCAT CATGTTGGCC 480

AGGCTGGTCT CGAACTCCTA ACCTCAGGTG ATC 513

(2) INFORMATION FOR SEQ ID NO: 20:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 6769 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 20:

ATGATGGAGA TCTTAAAAAG TAATCATTCT GGGGCTGGGC GTAGTAGCTT GCACCTGTAA 60

TCCCAGCACT TCGGGAGGCT GAGGCAGGCA GATAATTTGA GGTCAGGAGT TTGAGACCAG 120

CCTGGCCAAC ATGGTGAAAC CCATCTCTAC TAAAAATACA AAAATTAGCT GGGTGTGGTG 180

GCACGTACCT GTAATCCCAG CTACTCGGGA GGCGGAGGCA CAAGAATTGC TTGAACCTAG 240

GACGCGGAGG TTGCAGCGAG CCAAGATCGC GCCACTGCAC TCCAGCCTGG GCCGTAGAGT 300

GAGACTCTGT CTCAAAAAAG AAAAAAAAGT AATTGTTCTA GCTGGGCGCA GTGGCTCTTG 360

CCTGTAATCC CAGCACTTTG GGAGGCCAAG GCGGGTGGAT CTCGAGTCCT AGAGTTCAAG 420

ACCAGCCTAG GCAATGTGGT GAAACCCCAT CGCTACAAAA AATACAAAAA TTAGCCAGGC 480

ATGGTGGCGT GCGCATGTAG TCCCAGCTCC TTGGGAGGCT GAGGTGGGAG GATCACTTGA 540

ACCCAGGAGA CAGAGGTTGC AGTGAACCGA GATCACGCCA CCACGCTCCA GCCTGGGCAA 600

CAGAACAAGA CTCTGTCTAA AAAAATACAA ATAAAATAAA AGTAGTTCTC ACAGTACCAG 660

CATTCATTTT TCAAAAGATA TAGAGCTAAA AAGGAAGGAA AAAAAAAGTA ATGTTGGGCT 720

TTTAAATACT CGTTCCTATA CTAAATGTTC TTAGGAGTGC TGGGGTTTTA TTGTCATCAT 780

TTATCCTTTT TAAAAATGTT ATTGGCCAGG CACGGTGGCT CATGGCTGTA ATCCCAGCAC 840

TTTGGGAGGC CGAGGCAGGC AGATCACCTG AGGTCAGGAG TGTGAGACCA GCCTGGCCAA 900

CATGGCGAAA CCTGTCTCTA CTAAAAATAC AAAAATTAAC TAGGCGTGGT GGTGTACGCC 960

TGTAGTCCCA GCTACTCGGG AGGCTGAGGC AGGAGAATCA ACTGAACCAG GGAGGTGGAG 1020

GTTGCAGTGT GCCGAGATCA CGCCACTGCA CTCTAGCCTG GCAACAGAGC AAGATTCTGT 1080

CTCAAAAAAA AAAAACATAT ATACACATAT ATCCCAAAGT GCTGGGATTA CATATATATA 1140

TATATATATA TATTATATAT ATATATATAT ATATATGTGA TATATATGTG ATATATATAT 1200

AACATATATA TATGTAATAT ATATGTGATA TATATATAAT ATATATATGT AATATATATG 1260

TGATATATAT ATATACACAC ACACACACAT ATATATGTAT GTGTGTGTAC ACACACACAC 1320

ACAAATTAGC CAGGCATAGT TGCACACGCT TGGTAGACCC AGCTACTCAG GAGGCTGAGG 1380

GAGGAGAATC TCTTGAACTT AGGAGGCGGA GGTTGCAGTG AGCTGAGATT GCGCCACTGC 1440

ACTCCAGCCT GGGTGACAGA GCAGGACTCT GTACACCCCC CAAAACAAAA AAAAAAGTTA 1500

TCAGATGTGA TTGGAATGTA TATCAAGTAT CAGCTTCAAA ATATGCTATA TTAATACTTC 1560

AAAAATTACA CAAATAATAC ATAATCAGGT TTGAAAAATT TAAGACAACM SAARAAAAAA 1620

WYCMAATCAC AMATATCCCA CACATTTTAT TATTMCTMCT MCWATTATTT TGWAGAGMCT 1680

GGGTCTCACY CYKTTGCTWA TGCTGGTCTT TGAACYCCYK GCCYCAARCA RTCCTSCTCC 1740

ABCCTCCCAA RGTGCTGGGG ATWATAGGCA TGARCTAACC GCACCCAGCC CCAGACATTT 1800

TAGTGTGTAA ATTCCTGGGC ATTTTTTCAA GGCATCATAC ATGTTAGCTG ACTGATGATG 1860

GTCAATTTAT TTTGTCCATG GTGTCAAGTT TCTCTTCAGG AGGAAAAGCA CAGAACTGGC 1920

CAACAATTGC TTGACTGTTC TTTACCATAC TGTTTAGCAG GAAACCAGTC TCAGTGTCCA 1980

ACTCTCTAAC CTTGGAACTG TGAGAACTCT GAGGACAAAG CAGCGGATAC AACCTCAAAA 2040

GACGTCTGTC TACATTGAAT TGGGTAAGGG TCTCAGGTTT TTTAAGTATT TAATAATAAT 2100

TGCTGGATTC CTTATCTTAT AGTTTTGCCA AAAATCTTGG TCATAATTTG TATTTGTGGT 2160

AGGCAGCTTT GGGAAGTGAA TTTTATGAGC CCTATGGTGA GTTATAAAAA ATGTAAAAGA 2220

CGCAGTTCCC ACCTTGAAGA ATCTTACTTT AAAAAGGGAG CAAAAGAGGC CAGGCATGGT 2280

GGCTCACACC TGTAATCCCA GCACTTTGGG AGGCCAAAGT GGGTGGATCA CCTGAGGTCG 2340

GGAGTTCGAG ACCAGCCTAG CCAACATGGA GAAACTCTGT CTGTACCAAA AAATAAAAAA 2400

TTAGCCAGGT GTGGTGGCAC ATAACTGTAA TCCCAGCTAC TCGGGAGGCT GAGGCAGGAG 2460

AATCACTTGA ACCCGGGAGG TGGAGGTTGC GGTGAACCGA GATCGCACCA TTGCACTCCA 2520

GCCTGGGCAA AAATAGCGAA ACTCCATCTA AAAAAAAAAA AGAGAGCAAA AGAAAGAMTM 2580

TCTGGTTTTA AMTMTGTGTA AATATGTTTT TGGAAAGATG GAGAGTAGCA ATAAGAAAAA 2640

ACATGATGGA TTGCTACAGT ATTTAGTTCC AAGATAAATT GTACTAGATG AGGAAGCCTT 2700

TTAAGAAGAG CTGAATTGCC AGGCGCAGTG GCTCACGCCT GTAATCCCAG CACTTTGGGA 2760

GGCCGAGGTG GGCGGATCAC CTGAGGTCGG GAGTTCAAGA CCAGCCTGAC CAACATGGAG 2820

AAACCCCATC TCTACTAAAA AAAAAAAAAA AAAAATTAGC CGGGGTGGTG GCTTATGCCT 2880

GTAATCCCAG CTACTCAGGA GGCTGAGGCA GGAGAATCGC TTGAACCCAG GAAGCAGAGG 2940

TTGCAGTGAG CCAAGATCGC ACCATTGCAC TCCAGCCTAG GCAACAAGAG TGAAACTCCA 3000

TCTCAAAAAA AAAAAAAAAG AGCTGAATCT TGGCTGGGCA GGATGGCTCG TGCCTGTAAT 3060

CCTAACGCTT TGGAAGACCG AGGCAGAAGG ATTGGTTGAG TCCACGAGTT TAAGACCAGC 3120

CTGGCCAACA TAGGGGAACC CTGTCTCTAT TTTTAAAATA ATAATACATT TTTGGCCGGT 3180

GCGGTGGCTC ATGCCTGTAA TCCCAATACT TTGGGAGGCT GAGGCAGGTA GATCACCTGA 3240

GGTCAGAGTT CGAGACCAGC CTGGATAACC TGGTGAAACC CCTCTTTACT AAAAATACAA 3300

AAAAAAAAAA AAATTAGCTG GGTGTGGTAG CACATGCTTG TAATCCCAGC TACTTGGGAG 3360

GCTGAGGCAG GAGAATCGCT TGAACCAGGG AGGCGGAGGT TACAATGAGC CAACACTACA 3420

CCACTGCACT CCAGCCTGGG CAATAGAGTG AGACTGCATC TCAAAAAAAT AATAATTTTT 3480

AAAAATAATA AATTTTTTTA AGCTTATAAA AAGAAAAGTT GAGGCCAGCA TAGTAGCTCA 3540

CATCTGTAAT CTCAGCAGTG GCAGAGGATT GCTTGAAGCC AGGAGTTTGA GACCAGCCTG 3600

GGCAACATAG CAAGACCTCA TCTCTACAAA AAAATTTCTT TTTTAAATTA GCTGGGTGTG 3660

GTGGTGTGCA TCTGTAGTCC CAGCTACTCA GGAGGCAGAG GTGAGTGGAT ACATTGAACC 3720

CAGGAGTTTG AGGCTGTAGT GAGCTATGAT CATGCCACTG CACTCCAACC TGGGTGACAG 3780

AGCAAGACCT CCAAAAAAAA AAAAAAAAGA GCTGCTGAGC TCAGAATTCA AACTGGGCTC 3840

TCAAATTGGA TTTTCTTTTA GAATATATTT ATAATTAAAA AGGATAGCCA TCTTTTGAGC 3900

TCCCAGGCAC CACCATCTAT TTATCATAAC ACTTACTGTT TTCCCCCCTT ATGATCATAA 3960

ATTCCTAGAC AACAGGCATT GTAAAAATAG TTATAGTAGT TGATATTTAG GAGCACTTAA 4020

CTATATTCCA GGCACTATTG TGCTTTTCTT GTATAACTCA TTAGATGCTT GTCAGACCTC 4080

TGAGATTGTT CCTATTATAC TTATTTTACA GATGAGAAAA TTAAGGCACA GAGAAGTTAT 4140

GAAATTTTTC CAAGGTATTA AACCTAGTAA GTGGCTGAGC CATGATTCAA ACCTAGGAAG 4200

TTAGATGTCA GAGCCTGTGC TTTTTTTTTG TTTTTGTTTT TGTTTTCAGT AGAAACGGGG 4260

GTCTCACTTT GTTGGCCAGG CTGGTCTTGA ACTCCTAACC TCAAATAATC CACCCATCTC 4320

GGCCTCCTCA AGTGCTGGGA TTACAGGTGA GAGCCACTGT GCCTGGCGAA GCCCATGCCT 4380

TTAACCACTT CTCTGTATTA CATACTAGCT TAACTAGCAT TGTACCTGCC ACAGTAGATG 4440

CTCAGTAAAT ATTTCTAGTT GAATATCTGT TTTTCAACAA GTACATTTTT TTAACCCTTT 4500

TAATTAAGAA AACTTTTATT GATTTATTTT TTGGGGGGAA ATTTTTTAGG ATCTGATTCT 4560

TCTGAAGATA CCGTTAATAA GGCAACTTAT TGCAGGTGAG TCAAAGAGAA CCTTTGTCTA 4620

TGAAGCTGGT ATTTTCCTAT TTAGTTAATA TTAAGGATTG ATGTTTCTCT CTTTTTAAAA 4680

ATATTTTAAC TTTTATTTTA GGTTCAGGGA TGTATGTGCA GTTTGTTATA TAGGTAAACA 4740

CACGACTTGG GATTTGGTGT ATAGATTTTT TTCATCATCC GGGTACTAAG CATACCCCAC 4800

AGTTTTTTGT TTGCTTTCTT TCTGAATTTC TCCCTCTTCC CACCTTCCTC CCTCAAGTAG 4860

GCTGGTGTTT CTCCAGACTA GAATCATGGT ATTGGAAGAA ACCTTAGAGA TCATCTAGTT 4920

TAGTTCTCTC ATTTTATAGT GGAGGAAATA CCCTTTTTGT TTGTTGGATT TAGTTATTAG 4980

CACTGTCCAA AGGAATTTAG GATAACAGTA GAACTCTGCA CATGCTTGCT TCTAGCAGAT 5040

TGTTCTCTAA GTTCCTCATA TACAGTAATA TTGACACAGC AGTAATTGTG ACTGATGAAA 5100

ATGTTCAAGG ACTTCATTTT CAACTCTTTC TTTCCTCTGT TCCTTATTTC CACATATCTC 5160

TCAAGCTTTG TCTGTATGTT ATATAATAAA CTACAAGCAA CCCCAACTAT GTTACCTACC 5220

TTCCTTAGGA ATTATTGCTT GACCCAGGTT TTTTTTTTTT TTTTTTTGGA GACGGGGTCT 5280

TGCCCTGTTG CCAGGATGGA GTGTAGTGGC GCCATCTCGG CTCACTGCAA TCTCCAACTC 5340

CCTGGTTCAA GCGATTCTCC TGTCTCAATC TCACGAGTAG CTGGGACTAC AGGTATACAC 5400

CACCACGCCC GGTTAATTGA CCATTCCATT TCTTTCTTTC TCTCTTTTTT TTTTTTTTTT 5460

TTGAGACAGA GTCTTGCTCT GTTGCCCAGG CTGGAGTACA GAGGTGTGAT CTCACCTCTC 5520

CGCAACGTCT GCCTCCCAGG TTGAAGCCAT ACTCCTGCCT CAGCCTCTCT AGTAGCTGGG 5580

ACTACAGGCG CGCGCCACCA CACCCGGCTA ATTTTTGTAT TTTTAGTAGA GATGGGGTTT 5640

CACCATGTTG GCCAGGCTGG TCTTGAACTC ATGACCTCAA GTGGTCCACC CGCCTCAGCC 5700

TCCCAAAGTG CTGGAATTAC AGGCTTGAGC CACCGTGCCC AGCAACCATT TCATTTCAAC 5760

TAGAAGTTTC TAAAGGAGAG AGCAGCTTTC ACTAACTAAA TAAGATTGGT CAGCTTTCTG 5820

TAATCGAAAG AGCTAAAATG TTTGATCTTG GTCATTTGAC AGTTCTGCAT ACATGTAACT 5880

AGTGTTTCTT ATTAGGACTC TGTCTTTTCC CTATAGTGTG GGAGATCAAG AATTGTTACA 5940

AATCACCCCT CAAGGAACCA GGGATGAAAT CAGTTTGGAT TCTGCAAAAA AGGGTAATGG 6000

CAAAGTTTGC CAACTTAACA GGCACTGAAA AGAGAGTGGG TAGATACAGT ACTGTAATTA 6060

GATTATTCTG AAGACCATTT GGGACCTTTA CAACCCACAA AATCTCTTGG CAGAGTTAGA 6120

GTATCATTCT CTGTCAAATG TCGTGGTATG GTCTGATAGA TTTAAATGGT ACTAGACTAA 6180

TGTACCTATA ATAAGACCTT CTTGTAACTG ATTGTTGCCC TTTCGCTTTT TTTTTTGTTT 6240

GTTTGTTTGT TTTTTTTTGA GATGGGGTCT CACTCTGTTG CCCAGGCTGG AGTGCAGTGA 6300

TGCAATCTTG GCTCACTGCA ACCTCCACCT CCAAAGGCTC AAGCTATCCT CCCACTTCAG 6360

CCTCCTGAGT AGCTGGGACT ACAGGCGCAT GCCACCACAC CCGGTTAATT TTTTGTGGTT 6420

TTATAGAGAT GGGGTTTCAC CATGTTACCG AGGCTGGTCT CAAACTCCTG GACTCAAGCA 6480

GTCTGCCCAC TTCAGCCTCC CAAAGTGCTG CAGTTACAGG CTTGAGCCAC TGTGCCTGGC 6540

CTGCCCTTTA CTTTTAATTG GTGTATTTGT GTTTCATCTT TTACCTACTG GTTTTTAAAT 6600

ATAGGGAGTG GTAAGTCTGT AGATAGAACA GAGTATTAAG TAGACTTAAT GGCCAGTAAT 6660

CTTTAGAGTA CATCAGAACC AGTTTTCTGA TGGCCAATCT GCTTTTAATT CACTCTTAGA 6720

CGTTAGAGAA ATAGGTGTGG TTTCTGCATA GGGAAAATTC TGAAATTAA 6769

(2) INFORMATION FOR SEQ ID NO: 21:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 4249 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 21:

GATCCTAAGT GGAAATAATC TAGGTAAATA GGAATTAAAT GAAAGAGTAT GAGCTACATC 60

TTCAGTATAC TTGGTAGTTT ATGAGGTTAG TTTCTCTAAT ATAGCCAGTT GGTTGATTTC 120

CACCTCCAAG GTGTATGAAG TATGTATTTT TTTAATGACA ATTCAGTTTT TGAGTACCTT 180

GTTATTTTTG TATATTTTCA GCTGCTTGTG AATTTTCTGA GACGGATGTA ACAAATACTG 240

AACATCATCA ACCCAGTAAT AATGATTTGA ACACCACTGA GAAGCGTGCA GCTGAGAGGC 300

ATCCAGAAAA GTATCAGGGT AGTTCTGTTT CAAACTTGCA TGTGGAGCCA TGTGGCACAA 360

ATACTCATGC CAGCTCATTA CAGCATGAGA ACAGCAGTTT ATTACTCACT AAAGACAGAA 420

TGAATGTAGA AAAGGCTGAA TTCTGTAATA AAAGCAAACA GCCTGGCTTA GCAAGGAGCC 480

AACATAACAG ATGGGCTGGA AGTAAGGAAA CATGTAATGA TAGGCGGACT CCCAGCACAG 540

AAAAAAAGGT AGATCTGAAT GCTGATCCCC TGTGTGAGAG AAAAGAATGG AATAAGCAGA 600

AACTGCCATG CTCAGAGAAT CCTAGAGATA CTGAAGATGT TCCTTGGATA ACACTAAATA 660

GCAGCATTCA GAAAGTTAAT GAGTGGTTTT CCAGAAGTGA TGAACTGTTA GGTTCTGATG 720

ACTCACATGA TGGGGAGTCT GAATCAAATG CCAAAGTAGC TGATGTATTG GACGTTCTAA 780

ATGAGGTAGA TGAATATTCT GGTTCTTCAG AGAAAATAGA CTTACTGGCC AGTGATCCTC 840

ATGAGGCTTT AATATGTAAA AGTGAAAGAG TTCACTCCAA ATCAGTAGAG AGTAATATTG 900

AAGGCCAAAT ATTTGGGAAA ACCTATCGGA AGAAGGCAAG CCTCCCCAAC TTAAGCCATG 960

TAACTGAAAA TCTAATTATA GGAGCATTTG TTACTGAGCC ACAGATAATA CAAGAGCGTC 1020

CCCTCACAAA TAAATTAAAG CGTAAAAGGA GACCTACATC AGGCCTTCAT CCTGAGGATT 1080

TTATCAAGAA AGCAGATTTG GCAGTTCAAA AGACTCCTGA AATGATAAAT CAGGGAACTA 1140

ACCAAACGGA GCAGAATGGT CAAGTGATGA ATATTACTAA TAGTGGTCAT GAGAATAAAA 1200

CAAAAGGTGA TTCTATTCAG AATGAGAAAA ATCCTAACCC AATAGAATCA CTCGAAAAAG 1260

AATCTGCTTT CAAAACGAAA GCTGAACCTA TAAGCAGCAG TATAAGCAAT ATGGAACTCG 1320

AATTAAATAT CCACAATTCA AAAGCACCTA AAAAGAATAG GCTGAGGAGG AAGTCTTCTA 1380

CCAGGCATAT TCATGCGCTT GAACTAGTAG TCAGTAGAAA TCTAAGCCCA CCTAATTGTA 1440

CTGAATTGCA AATTGATAGT TGTTCTAGCA GTGAAGAGAT AAAGAAAAAA AAGTACAACC 1500

AAATGCCAGT CAGGCACAGC AGAAACCTAC AACTCATGGA AGGTAAAGAA CCTGCAACTG 1560

GAGCCAAGAA GAGTAACAAG CCAAATGAAC AGACAAGTAA AAGACATGAC AGCGATACTT 1620

TCCCAGAGCT GAAGTTAACA AATGCACCTG GTTCTTTTAC TAAGTGTTCA AATACCAGTG 1680

AACTTAAAGA ATTTGTCAAT CCTAGCCTTC CAAGAGAAGA AAAAGAAGAG AACTAGAAAC 1740

AGTTAAAGTG TCTAATAATG CTGAAGACCC CAAAGATCTC ATGTTAAGTG GAGAAAGGGT 1800

TTTGCAAACT GAAAGATCTG TAGAGAGTAG CAGTATTTCA TTGGTACCTG GTACTGATTA 1860

TGGCACTCAG GAAAGTATCT CGTTACTGGA AGTTAGCACT CTAGGGAAGG CAAAAACAGA 1920

ACCAAATAAA TGTGTGAGTC AGTGTGCAGC ATTTGAAAAC CCCAAGGGAC TAATTCATGG 1980

TTGTTCCAAA GATAATAGAA ATGACACAGA AGGCTTTAAG TATCCATTGG GACATGAAGT 2040

TAACCACAGT CGGGAAACAA GCATAGAAAT GGAAGAAAGT GAACTTGATG CTCAGTATTT 2100

GCAGAATACA TTCAAGGTTT CAAAGCGCCA GTCATTTGCT CCGTTTTCAA ATCCAGGAAA 2160

TGCAGAAGAG GAATGTGCAA CATTCTCTGC CCACTCTGGG TCCTTAAAGA AACAAAGTCC 2220

AAAAGTCACT TTTGAATGTG AACAAAAGGA AGAAAATCAA GGAAAGAATG AGTCTAATAT 2280

CAAGCCTGTA CAGACAGTTA ATATCACTGC AGGCTTTCCT GTGGTTGGTC AGAAAGATAA 2340

GCCAGTTGAT AATGCCAAAT GTAGTATCAA AGGAGGCTCT AGGTTTTGTC TATCATCTCA 2400

GTTCAGAGGC AACGAAACTG GACTCATTAC TCCAAATAAA CATGGACTTT TACAAAACCC 2460

ATATCGTATA CCACCACTTT TTCCCATCAA GTCATTTGTT AAAACTAAAT GTAAGAAAAA 2520

TCTGCTAGAG GAAAACTTTG AGGAACATTC AATGTCACCT GAAAGAGAAA TGGGAAATGA 2580

GAACATTCCA AGTACAGTGA GCACAATTAG CCGTAATAAC ATTAGAGAAA ATGTTTTTAA 2640

AGAAGCCAGC TCAAGCAATA TTAATGAAGT AGGTTCCAGT ACTAATGAAG TGGGCTCCAG 2700

TATTAATGAA ATAGGTTCCA GTGATGAAAA CATTCAAGCA GAACTAGGTA GAAACAGAGG 2760

GCCAAAATTG AATGCTATGC TTAGATTAGG GGTTTTGCAA CCTGAGGTCT ATAAACAAAG 2820

TCTTCCTGGA AGTAATTGTA AGCATCCTGA AATAAAAAAG CAAGAATATG AAGAAGTAGT 2880

TCAGACTGTT AATACAGATT TCTCTCCATA TCTGATTTCA GATAACTTAG AACAGCCTAT 2940

GGGAAGTAGT CATGCATCTC AGGTTTGTTC TGAGACACCT GATGACCTGT TAGATGATGG 3000

TGAAATAAAG GAAGATACTA GTTTTGCTGA AAATGACATT AAGGAAAGTT CTGCTGTTTT 3060

TAGCAAAAGC GTCCAGAAAG GAGAGCTTAG CAGGAGTCCT AGCCCTTTCA CCCATACACA 3120

TTTGGCTCAG GGTTACCGAA GAGGGGCCAA GAAATTAGAG TCCTCAGAAG AGAACTTATC 3180

TAGTGAGGAT GAAGAGCTTC CCTGCTTCCA ACACTTGTTA TTTGGTAAAG TAAACAATAT 3240

ACCTTCTCAG TCTACTAGGC ATAGCACCGT TGCTACCGAG TGTCTGTCTA AGAACACAGA 3300

GGAGAATTTA TTATCATTGA AGAATAGCTT AAATGACTGC AGTAACCAGG TAATATTGGC 3360

AAAGGCATCT CAGGAACATC ACCTTAGTGA GGAAACAAAA TGTTCTGCTA GCTTGTTTTC 3420

TTCACAGTGC AGTGAATTGG AAGACTTGAC TGCAAATACA AACACCCAGG ATCCTTTCTT 3480

GATTGGTTCT TCCAAACAAA TGAGGCATCA GTCTGAAAGC CAGGGAGTTG GTCTGAGTGA 3540

CAAGGAATTG GTTTCAGATG ATGAAGAAAG AGGAACGGGC TTGGAAGAAA ATAATCAAGA 3600

AGAGCAAAGC ATGGATTCAA ACTTAGGTAT TGGAACCAGG TTTTTGTGTT TGCCCCAGTC 3660

TATTTATAGA AGTGAGCTAA ATGTTTATGC TTTTGGGGAG CACATTTTAC AAATTTCCAA 3720

GTATAGTTAA AGGAACTGCT TCTTAAACTT GAAACATGTT CCTCCTAAGG TGCTTTTCAT 3780

AGAAAAAAGT CCTTCACACA GCTAGGACGT CATCTTTGAC TGAATGAGCT TTAACATCCT 3840

AATTACTGGT GGACTTACTT CTGGTTTCAT TTTATAAAGC AAATCCCGGT GTCCCAAAGC 3900

AAGGAATTTA ATCATTTTGT GTGACATGAA AGTAAATCCA GTCCTGCCAA TGAGAAGAAA 3960

AAGACACAGC AAGTTGCAGC GTTTATAGTC TGCTTTTACA TCTGAACCTC TGTTTTTGTT 4020

ATTTAAGGTG AAGCAGCATC TGGGTGTGAG AGTGAAACAA GCGTCTCTGA AGACTGCTCA 4080

GGGCTATCCT CTCAGAGTGA CATTTTAACC ACTCAGGTAA AAAGCGTGTG TGTGTGTGCA 4140

CATGCGTGTG TGTGGTGTCC TTTGCATTCA GTAGTATGTA TCCCACATTC TTAGGTTTGC 4200

TGACATCATC TCTTTGAATT AATGGCACAA TTGTTTGTGG TTCATTGTC 4249

(2) INFORMATION FOR SEQ ID NO: 22:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 710 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 22:

NGNGAATGTA ATCCTAATAT TTCNCNCCNA CTTAAAAGAA TACCACTCCA ANGGCATCNC 60

AATACATCAA TCAATTGGGG AATTGGGATT TTCCCTCNCT AACATCANTG GAATAATTTC 120

ATGGCATTAA TTGCATGAAT GTGGTTAGAT TAAAAGGTGT TCATGCTAGA ACTTGTAGTT 180

CCATACTAGG TGATTTCAAT TCCTGTGCTA AAATTAATTT GTATGATATA TTNTCATTTA 240

ATGGAAAGCT TCTCAAAGTA TTTCATTTTC TTGGTACCAT TTATCGTTTT TGAAGCAGAG 300

GGATACCATG CAACATAACC TGATAAAGCT CCAGCAGGAA ATGGCTGAAC TAGAAGCTGT 360

GTTAGAACAG CATGGGAGCC AGCCTTCTAA CAGCTACCCT TCCATCATAA GTGACTCTTC 420

TCCCTTGAG GACCTGCGAA ATCCAGAACA AAGCACATCA GAAAAAGGTG TGTATTGTTG 480

GCCAAACACT GATATCTTAA GCAAAATTCT TTCCTTCCCC TTTATCTCCT TCTGAAGAGT 540

AAGGACCTAG CTCCAACATT TTATGATCCT TGCTCAGCAC ATGGGTAATT ATGGAGCCTT 600

GGTTCTTGTC CCTGCTCACA ACTAATATAC CAGTCAGAGG GACCCAAGGC AGTCATTCAT 660

GTTGTCATCT GAGATACCTA CAACAAGTAG ATGCTATGGG GAGCCCATGG 710

(2) INFORMATION FOR SEQ ID NO: 23:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 473 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 23:

CCATTGGTGC TAGCATCTGT CTGTTGCATT GCTTGTGTTT ATAAAATTCT GCCTGATATA 60

CTTGTTAAAA ACCAATTTGT GTATCATAGA TTGATGCTTT TGAAAAAAAT CAGTATTCTA 120

ACCTGAATTA TCACTATCAG AACAAAGCAG TAAAGTAGAT TTGTTTTCTC ATTCCATTTA 180

AAGCAGTATT AACTTCACAG AAAAGTAGTG AATACCCTAT AAGCCAGAAT CCAGAAGGCC 240

TTTCTGCTGA CAAGTTTGAG GTGTCTGCAG ATAGTTCTAC CAGTAAAAAT AAAGAACCAG 300

GAGTGGAAAG GTAAGAAACA TCAATGTAAA GATGCTGTGG TATCTGACAT CTTTATTTAT 360

ATTGAACTCT GATTGTTAAT TTTTTTCACC ATACTTTCTC CAGTTTTTTT GCATACAGGC 420

ATTTATACAC TTTTATTGCT CTAGGATACT TCTTTTGTTT AATCCTATAT AGG 473

(2) INFORMATION FOR SEQ ID NO: 24:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 421 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 24:

GGATAAGNTC AAGAGATATT TTGATAGGTG ATGCAGTGAT NAATTGNGAA AATTTNCTGC 60

CTGCTTTTAA TCTTCCCCCG TTCTTTCTTC CTNCCTCCCT CCCTTCCTNC CTCCCGTCCT 120

TNCCTTTCCT TTCCCTCCCT TCCNCCTTCT TTCCNTCTNT CTTTCCTTTC TTTCCTGTCT 180

ACCTTTCTTT CCTTCCTCCC TTCCTTTTCT TTTCTTTCTT TCCTTTCCTT TTCTTTCCTT 240

TCTTTCCTTT CCTTTCTTTC TTGACAGAGT CTTGCTCTGT CACTCAGGCT GGAGTGCAGT 300

GGCGTGATCT CGNCTCACTG CAACCTCTGT CTCCCAGGTT CAAGCAATTT TCCTGCCTCA 360

GCCTCCCGAG TAGCTGAGAT TACAGGCGCC AGCCACCACA CCCAGCTACT GACCTGCTTT 420

T 421

(2) INFORMATION FOR SEQ ID NO: 25:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 997 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 25:

AAACAGCTGG GAGATATGGT GCCTCAGACC AACCCCATGT TATATGTCAA CCCTGACATA 60

TTGGCAGGCA ACATGAATCC AGACTTCTAG GCTGTCATGC GGGCTCTTTT TTGCCAGTCA 120

TTTCTGATCT CTCTGACATG AGCTGTTTCA TTTATGCTTT GGCTGCCCAG CAAGTATGAT 180

TTGTCCTTTC ACAATTGGTG GCGATGGTTT TCTCCTTCCA TTTATCTTTC TAGGTCATCC 240

CCTTCTAAAT GCCCATCATT AGATGATAGG TGGTACATGC ACAGTTGCTC TGGGAGTCTT 300

CAGAATAGAA ACTACCCATC TCAAGAGGAG CTCATTAAGG TTGTTGATGT GGAGGAGCAA 360

CAGCTGGAAG AGTCTGGGCC ACACGATTTG ACGGAAACAT CTTACTTGCC AAGGCAAGAT 420

CTAGGTAATA TTTCATCTGC TGTATTGGAA CAAACACTYT GATTTTACTC TGAATCCTAC 480

ATAAAGATAT TCTGGTTAAC CAACTTTTAG ATGTACTAGT CTATCATGGA CACTTTTGTT 540

ATACTTAATT AAGCCCACTT TAGAAAAATA GCTCAAGTGT TAATCAAGGT TTACTTGAAA 600

ATTATTGAAA CTGTTAATCC ATCTATATTT TAATTAATGG TTTAACTAAT GATTTTGAGG 660

ATGWGGGAGT CKTGGTGTAC TCTAMATGTA TTATTTCAGG CCAGGCATAG TGGCTCACGC 720

CTGGTAATCC CAGTAYYCMR GAGCCCGAGG CAGGTGGAGC CAGCTGAGGT CAGGAGTTCA 780

AGACCTGTCT TGGCCAACAT GGGNGAAACC CTGTCTTCTT CTTAAAAAAN ACAAAAAAAA 840

TTAACTGGGT TGTGCTTAGG TGNATGCCCC GNATCCTAGT TNTTCTTGNG GGTTGAGGGA 900

GGAGATCACN TTGGACCCCG GAGGGGNGGG TGGGGGNGAG CAGGNCAAAA CACNGACCCA 960

GCTGGGGTGG AAGGGAAGCC CACTCNAAAA AANNTTN 997

(2) INFORMATION FOR SEQ ID NO: 26:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 639 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 26:

TTTTTAGGAA ACAAGCTACT TTGGATTTCC ACCAACACCT GTATTCATGT ACCCATTTTT 60

CTCTTAACCT AACTTTATTG GTCTTTTTAA TTCTTAACAG AGACCAGAAC TTTGTAATTC 120

AACATTCATC GTTGTGTAAA TTAAACTTCT CCCATTCCTT TCAGAGGGAA CCCCTTACCT 180

GGAATCTGGA ATCAGCCTCT TCTCTGATGA CCCTGAATCT GATCCTTCTG AAGACAGAGC 240

CCCAGAGTCA GCTCGTGTTG GCAACATACC ATCTTCAACC TCTGCATTGA AAGTTCCCCA 300

ATTGAAAGTT GCAGAATCTG CCCAGAGTCC AGCTGCTGCT CATACTACTG ATACTGCTGG 360

GTATAATGCA ATGGAAGAAA GTGTGAGCAG GGAGAAGCCA GAATTGACAG CTTCAACAGA 420

AAGGGTCAAC AAAAGAATGT CCATGGTGGT GTCTGGCCTG ACCCCAGAAG AATTTGTGAG 480

TGTATCCATA TGTATCTCCC TAATGACTAA GACTTAACAA CATTCTGGAA AGAGTTTTAT 540

GTAGGTATTG TCAATTAATA ACCTAGAGGA AGAAATCTAG AAAACAATCA CAGTTCTGTG 600

TAATTTAATT TCGATTACTA ATTTCTGAAA ATTTAGAAY 639

(2) INFORMATION FOR SEQ ID NO: 27:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 922 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 27:

NCCCNNCCCC CNAATCTGAA ATGGGGGTAA CCCCCCCCCA ACCGANACNT GGGTNGCNTA 60

GAGANTTTAA TGGCCCNTTC TGAGGNACAN AAGCTTAAGC CAGGNGACGT GGANCNATGN 120

GTTGTTTNTT GTTTGGTTAC CTCCAGCCTG GGTGACAGAG CAAGACTCTG TCTAAAAAAA 180

AAAAAAAAAA AAATCGACTT TAAATAGTTC CAGGACACGT GTAGAACGTG CAGGATTGCT 240

ACGTAGGTAA ACATATGCCA TGGTGGGATA ACTAGTATTC TGAGCTGTGT GCTAGAGGTA 300

ACTCATGATA ATGGAATATT TGATTTAATT TCAGATGCTC GTGTACAAGT TTGCCAGAAA 360

ACACCACATC ACTTTAACTA ATCTAATTAC TGAAGAGACT ACTCATGTTG TTATGAAAAC 420

AGGTATACCA AGAACCTTTA CAGAATACCT TGCATCTGCT GCATAAAACC ACATGAGGCG 480

AGGCACGGTG GCGCATGCCT GTAATCGCAG CACTTTGGGA GGCCGAGGCG GGCAGATCAC 540

GAGATTAGGA GATCGAGACC ATCCTGGCCA GCATGGTGAA ACCCCGTCTC TACTANNAAA 600

TGGNAAAATT ANCTGGGTGT GGTCGCGTGC NCCTGTAGTC CCAGCTACTC GTGAGGCTGA 660

GGCAGGAGAA TCACTTGAAC CGGGGAAATG GAGGTTTCAG TGAGCAGAGA TCATNCCCCT 720

NCATTCCAGC CTGGCGACAG AGCAAGGCTC CGTCNCCNAA AAAATAAAAA AAAACGTGAA 780

CAAATAAGAA TATTTGTTGA GCATAGCATG GATGATAGTC TTCTAATAGT CAATCAATTA 840

CTTTATGAAA GACAAATAAT AGTTTTGCTG CTTCCTTACC TCCTTTTGTT TTGGGTTAAG 900

ATTTGGAGTG TGGGCCAGGC AC 922

(2) INFORMATION FOR SEQ ID NO: 28:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 867 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 28:

GATCTATAGC TAGCCTTGGC GTCTAGAAGA TGGGTGTTGA GAAGAGGGAG TGGAAAGATA 60

TTTCCTCTGG TCTTAACTTC ATATCAGCCT CCCCTAGACT TCCAAATATC CATACCTGCT 120

GGTTATAATT AGTGGTGTTT TCAGCCTCTG ATTCTGTCAC CAGGGGTTTT AGAATCATAA 180

ATCCAGATTG ATCTTGGGAG TGTAAAAAAC TGAGGCTCTT TAGCTTCTTA GGACAGCACT 240

TCCTGATTTT GTTTTCAACT TCTAATCCTT TGAGTGTTTT TCATTCTGCA GATGCTGAGT 300

TTGTGTGTGA ACGGACACTG AAATATTTTC TAGGAATTGC GGGAGGAAAA TGGGTAGTTA 360

GCTATTTCTG TAAGTATAAT ACTATTTCTC CCCTCCTCCC TTTAACACCT CAGAATTGCA 420

TTTTTACACC TAACATTTAA CACCTAAGGT TTTTGCTGAT GCTGAGTCTG AGTTACCAAA 480

AGGTCTTTAA ATTGTAATAC TAAACTACTT TTATCTTTAA TATCACTTTG TTCAAGATAA 540

GCTGGTGATG CTGGGAAAAT GGGTCTCTTT TATAACTAAT AGGACCTAAT CTGCTCCTAG 600

CAATGTTAGC ATATGAGCTA GGGATTTATT TAATAGTCGG CAGGAATCCA TGTGCARCAG 660

NCAAACTTAT AATGTTTAAA TTAAACATCA ACTCTGTCTC CAGAAGGAAA CTGCTGCTAC 720

AAGCCTTATT AAAGGGCTGT GGCTTTAGAG GGAAGGACCT CTCCTCTGTC ATTCTTCCTG 780

TGCTCTTTTG TGAATCGCTG ACCTCTCTAT CTCCGTGAAA AGAGCACGTT CTTCTGCTGT 840

ATGTAACCTG TCTTTTCTAT GATCTCT 867

(2) INFORMATION FOR SEQ ID NO: 29:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 561 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 29:

NAAAAACGGG GNNGGGANTG GGCCTTAAAN CCAAAGGGCN AACTCCCCAA CCATTNAAAA 60

ANTGACNGGG GATTATTAAA ANCGGCGGGA AACATTTCAC NGCCCAACTA ATATTGTTAA 120

ATTAAAACCA CCACCNCTGC NCCAAGGAGG GAAACTGCTG CTACAAGCCT TATTAAAGGG 180

CTGTGGCTTT AGAGGGAAGG ACCTCTCCTC TGTCATTCTT CCTGTGCTCT TTTGTGAATC 240

GCTGACCTCT CTATGTCCGT GAAAAGAGCA CGTTCTTCGT CTGTATGTAA CCTGTCTTTT 300

CTATGATCTC TTTAGGGGTG ACCCAGTCTA TTAAAGAAAG AAAAATGCTG AATGAGGTAA 360

GTACTTGATG TTACAAACTA ACCAGAGATA TTCATTCAGT CATATAGTTA AAAATGTATT 420

TGCTTCCTTC CATCAATGCA CCACTTTCCT TAACAATGCA CAAATTTTCC ATGATAATGA 480

GGATCATCAA GAATTATGCA GGCCTGCACT GTGGCTCATA CCTATAATCC CAGCGCTTTG 540

GGAGGCTGAG GCGCTTGGAT C 561

(2) INFORMATION FOR SEQ ID NO: 30:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 567 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 30:

AATTTTTTGT ATTTTTAGTA GAGATGAGGT TCACCATGTT GGTCTAGATC TGGTGTCGAA 60

CGTCCTGACC TCAAGTGATC TGCCAGCCTC AGTCTCCCAA AGTGCTAGGA TTACAGGGGT 120

GAGCCACTGC GCCTGGCCTG AATGCCTAAA ATATGACGTG TCTGCTCCAC TTCCATTGAA 180

GGAAGCTTCT CTTTCTCTTA TCCTGATGGG TTGTGTTTGG TTTCTTTCAG CATGATTTTG 240

AAGTCAGAGG AGATGTGGTC AATGGAAGAA ACCACCAAGG TCCAAAGCGA GCAAGAGAAT 300

CCCAGGACAG AAAGGTAAAG CTCCCTCCCT CAAGTTGACA AAAATCTCAC CCCACCACTC 360

TGTATTCCAC TCCCCTTTGC AGAGATGGGC CGCTTCATTT TGTAAGACTT ATTACATACA 420

TACACAGTGC TAGATACTTT CACACAGGTT CTTTTTTCAC TCTTCCATCC CAACCACATA 480

AATAAGTATT GTCTCTACTT TATGAATGAT AAAACTAAGA GATTTAGAGA GGCTGTGTAA 540

TTTGGATTCC CGTCTCGGGT TCAGATC 567

(2) INFORMATION FOR SEQ ID NO: 31:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 633 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 31:

TTGGCCTGAT TGGTGACAAA AGTGAGATGC TCAGTCCTTG AATGACAAAG AATGCCTGTA 60

GAGTTGCAGG TCCAACTACA TATGCACTTC AAGAAGATCT TCTGAAATCT AGTAGTGTTC 120

TGGACATTGG ACTGCTTGTC CCTGGGAAGT AGCAGCAGAA ATGATCGGTG GTGAACAGAA 180

GAAAAAGAAA AGCTCTTCCT TTTTGAAAGT CTGTTTTTTG AATAAAAGCC AATATTCTTT 240

TATAACTAGA TTTTCCTTCT CTCCATTCCC CTGTCCCTCT CTCTTCCTCT CTTCTTCCAG 300

ATCTTCAGGG GGCTAGAAAT CTGTTGCTAT GGGCCCTTCA CCAACATGCC CACAGGTAAG 360

AGCCTGGGAG AACCCCAGAG TTCCAGCACC AGCCTTTGTC TTACATAGTG GAGTATTATA 420

AGCAAGGTCC CACGATGGGG GTTCCTCAGA TTGCTGAAAT GTTCTAGAGG CTATTCTATT 480

TCTCTACCAC TCTCCAAACA AAACAGCACC TAAATGTTAT CCTATGGCAA AAAAAAACTA 540

TACCTTGTCC CCCTTCTCAA GAGCATGAAG GTGGTTAATA GTTAGGATTC AGTATGTTAT 600

GTGTTCAGAT GGCGTTGAGC TGCTGTTAGT GCC 633

(2) INFORMATION FOR SEQ ID NO: 32:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 470 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 32:

TTTGAGAGAC TATCAAACCT TATACCAAGT GGCCTTATGG AGACTGATAA CCAGAGTACA 60

TGGCATATCA GTGGCAAATT GACTTAAAAT CCATACCCCT ACTATTTTAA GACCATTGTC 120

CTTTGGAGCA GAGAGACAGA CTCTCCCATT GAGAGGTCTT GCTATAAGCC TTCATCCGGA 180

GAGTGTAGGG TAGAGGGCCT GGGTTAAGTA TGCAGATTAC TGCAGTGATT TTACATGTAA 240

ATGTCCATTT TAGATCAACT GGAATGGATG GTACAGCTGT GTGGTGCTTC TGTGGTGAAG 300

GAGCTTTCAT CATTCACCCT TGGCACAGTA AGTATTGGGT GCCCTGTCAG TGTGGGAGGA 360

CACAATATTC TCTCCTGTGA GCAAGACTGG CACCTGTCAG TCCCTATGGA TGCCCCTACT 420

GTAGCCTCAG AAGTCTTCTC TGCCCACATA CCTGTGCCAA AAGACTCCAT 470

(2) INFORMATION FOR SEQ ID NO: 33:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 517 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 33:

GGTGGTACGT GTCTGTAGTT CCAGCTACTT GGGAGGCTGA GATGGAAGGA TTGCTTGAGC 60

CCAGGAGGCA GAGGTGGNAN NTTACGCTGA GATCACACCA CTGCACTCCA GCCTGGGTGA 120

CAGAGCAAGA CCCTGTCTCA AAAACAAACA AAAAAAATGA TGAAGTGACA GTTCCAGTAG 180

TCCTACTTTG ACACTTTGAA TGCTCTTTCC TTCCTGGGGA TCCAGGGTGT CCACCCAATT 240

GTGGTTGTGC AGCCAGATGC CTGGACAGAG GACAATGGCT TCCATGGTAA GGTGCCTCGC 300

ATGTACCTGT GCTATTAGTG GGGTCCTTGT GCATGGGTTT GGTTTATCAC TCATTACCTG 360

GTGCTTGAGT AGCACAGTTC TTGGCACATT TTTAAATATT TGTTGAATGA ATGGCTAAAA 420

TGTCTTTTTG ATGTTTTTAT TGTTATTTGT TTTATATTGT AAAAGTAATA CATGAACTGT 480

TTCCATGGGG TGGGAGTAAG ATATGAATGT TCATCAC 517

(2) INFORMATION FOR SEQ ID NO: 34:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 434 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: double
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(iv) ANTI-SENSE: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 34:

CAGTAATCCT NAGAACTCAT ACGACCGGGC CCCTGGAGTC GNTGNTTNGA GCCTAGTCCN 60

GGAGAATGAA TTGACACTAA TCTCTGCTTG TGTTCTCTGT CTCCAGCAAT TGGGCAGATG 120

TGTGAGGCAC CTGTGGTGAC CCGAGAGTGG GTGTTGGACA GTGTAGCACT CTACCAGTGC 180

CAGGAGCTGG ACACCTACCT GATACCCCAG ATCCCCCACA GCCACTACTG ACTGCAGCCA 240

GCCACAGGTA CAGAGCCACA GGACCCCAAG AATGAGCTTA CAAAGTGGCC TTTCCAGGCC 300

CTGGGAGCTC CTCTCACTCT TCAGTCCTTC TACTGTCCTG GCTACTAAAT ATTTTATGTA 360

CATCAGCCTG AAAAGGACTT CTGGCTATGC AAGGGTCCCT TAAAGATTTT CTGCTTGAAG 420

TCTCCCTTGG AAAT 434

(2) INFORMATION FOR SEQ ID NO: 35:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 35:

GATAAATTAA AACTGCGACT GCGCGGCGTG 30

(2) INFORMATION FOR SEQ ID NO: 36:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 36:

GTAGTAGAGT CCCGGGAAAG GGACAGGGGG 30

(2) INFORMATION FOR SEQ ID NO: 37:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 37:

ATATATATAT GTTTTTCTAA TGTGTTAAAG 30

(2) INFORMATION FOR SEQ ID NO: 38:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 38:

GTAAGTCAGC ACAAGAGTGT ATTAATTTGG 30

(2) INFORMATION FOR SEQ ID NO: 39:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 39:

TTTCTTTTTC TCCCCCCCCT ACCCTGCTAG 30

(2) INFORMATION FOR SEQ ID NO: 40:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 40:

GTAAGTTTGA ATGTGTTATG TGGCTCCATT 30

(2) INFORMATION FOR SEQ ID NO: 41:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 41:

AGCTACTTTT TTTTTTTTTT TTTGAGACAG 30

(2) INFORMATION FOR SEQ ID NO: 42:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 42:

GTAAGTGCAC ACCACCATAT CCAGCTAAAT 30

(2) INFORMATION FOR SEQ ID NO: 43:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 43:

AATTGTTCTT TCTTTCTTTA TAATTTATAG 30

(2) INFORMATION FOR SEQ ID NO: 44:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 44:

GTATATAATT TGGTAATGAT GCTAGGTTGG 30

(2) INFORMATION FOR SEQ ID NO: 45:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 45:

GAGTGTGTTT CTCAAACAAT TTAATTTCAG 30

(2) INFORMATION FOR SEQ ID NO: 46:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 46:

GTAAGTGTTG AATATCCCAA GAATGACACT 30

(2) INFORMATION FOR SEQ ID NO: 47:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 47:

AAACATAATG TTTTCCCTTG TATTTTACAG 30

(2) INFORMATION FOR SEQ ID NO: 48:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 48:

GTAAAACCAT TTGTTTTCTT CTTCTTCTTC 30

(2) INFORMATION FOR SEQ ID NO: 49:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 49:

TGCTTGACTG TTCTTTACCA TACTGTTTAG 30

(2) INFORMATION FOR SEQ ID NO: 50:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 50:

GTAAGGGTCT CAGGTTTTTT AAGTATTTAA 30

(2) INFORMATION FOR SEQ ID NO: 51:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 51:

TGATTTATTT TTTGGGGGGA AATTTTTTAG 30

(2) INFORMATION FOR SEQ ID NO: 52:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 52:

GTGAGTCAAA GAGAACCTTT GTCTATGAAG 30

(2) INFORMATION FOR SEQ ID NO: 53:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 53:

TCTTATTAGG ACTCTGTCTT TTCCCTATAG 30

(2) INFORMATION FOR SEQ ID NO: 54:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 54:

GTAATGGCAA AGTTTGCCAA CTTAACAGGC 30

(2) INFORMATION FOR SEQ ID NO: 55:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 55:

GAGTACCTTG TTATTTTTGT ATATTTTCAG 30

(2) INFORMATION FOR SEQ ID NO: 56:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 56:

GTATTGGAAC CAGGTTTTTG TGTTTGCCCC 30

(2) INFORMATION FOR SEQ ID NO: 57:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 57:

ACATCTGAAC CTCTGTTTTT GTTATTTAAG 30

(2) INFORMATION FOR SEQ ID NO: 58:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 58:

AGGTAAAAAG CGTGTGTGTG TGTGCACATG 30

(2) INFORMATION FOR SEQ ID NO: 59:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 59:

CATTTTCTTG GTACCATTTA TCGTTTTTGA 30

(2) INFORMATION FOR SEQ ID NO: 60:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 60:

GTGTGTATTG TTGGCCAAAC ACTGATATCT 30

(2) INFORMATION FOR SEQ ID NO: 61:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 61:

AGTAGATTTG TTTTCTCATT CCATTTAAAG 30

(2) INFORMATION FOR SEQ ID NO: 62:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 62:

GTAAGAAACA TCAATGTAAA GATGCTGTGG 30

(2) INFORMATION FOR SEQ ID NO: 63:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 63:

ATGGTTTTCT CCTTCCATTT ATCTTTCTAG 30

(2) INFORMATION FOR SEQ ID NO: 64:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 64:

GTAATATTTC ATCTGCTGTA TTGGAACAAA 30

(2) INFORMATION FOR SEQ ID NO: 65:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 65:

TGTAAATTAA ACTTCTCCCA TTCCTTTCAG 30

(2) INFORMATION FOR SEQ ID NO: 66:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 66:

GTGAGTGTAT CCATATGTAT CTCCCTAATG 30

(2) INFORMATION FOR SEQ ID NO: 67:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 67:

ATGATAATGG AATATTTGAT TTAATTTCAG 30

(2) INFORMATION FOR SEQ ID NO: 68:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 68:

GTATACCAAG AACCTTTACA GAATACCTTG 30

(2) INFORMATION FOR SEQ ID NO: 69:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 69:

CTAATCCTTT GAGTGTTTTT CATTCTGCAG 30

(2) INFORMATION FOR SEQ ID NO: 70:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 70:

GTAAGTATAA TACTATTTCT CCCCTCCTCC 30

(2) INFORMATION FOR SEQ ID NO: 71:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 71:

TGTAACCTGT CTTTTCTATG ATCTCTTTAG 30

(2) INFORMATION FOR SEQ ID NO: 72:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 72:

GTAAGTACTT GATGTTACAA ACTAACCAGA 30

(2) INFORMATION FOR SEQ ID NO: 73:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 73:

TCCTGATGGG TTGTGTTTGG TTTCTTTCAG 30

(2) INFORMATION FOR SEQ ID NO: 74:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 74:

GTAAAGCTCC CTCCCTCAAG TTGACAAAAA 30

(2) INFORMATION FOR SEQ ID NO: 75:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 75:

CTGTCCCTCT CTCTTCCTCT CTTCTTCCAG 30

(2) INFORMATION FOR SEQ ID NO: 76:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 76:

GTAAGAGCCT GGGAGAACCC CAGAGTTCCA 30

(2) INFORMATION FOR SEQ ID NO: 77:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 77:

AGTGATTTTA CATGTAAATG TCCATTTTAG 30

(2) INFORMATION FOR SEQ ID NO: 78:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 78:

GTAAGTATTG GGTGCCCTGT CAGTGTGGGA 30

(2) INFORMATION FOR SEQ ID NO: 79:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 79:

TTGAATGCTC TTTCCTTCCT GGGGATCCAG 30

(2) INFORMATION FOR SEQ ID NO: 80:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 80:

GTAAGGTGCC TCGCATGTAC CTGTGCTATT 30

(2) INFORMATION FOR SEQ ID NO: 81:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 30 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 81:

CTAATCTCTG CTTGTGTTCT CTGTCTCCAG 30

(2) INFORMATION FOR SEQ ID NO: 82:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 42 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide

(iii) HYPOTHETICAL: NO

(vi) ORIGINAL SOURCE:
(A) ORGANISM: Homo sapiens

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 82:

Cys Pro Ile Cys Leu Glu Leu Ile Lys Glu Pro Val Ser Thr Lys Cys
1 5 10 15

Asp His Ile Phe Cys Lys Phe Cys Met Leu Lys Leu Leu Asn Gln Lys
20 25 30

Lys Gly Pro Ser Gln Cys Pro Leu Cys Lys
35 40

(2) INFORMATION FOR SEQ ID NO: 83:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 45 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide

(iii) HYPOTHETICAL: NO

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 83:

Cys Pro Ile Cys Leu Glu Leu Leu Lys Glu Pro Val Ser Ala Asp Cys
1 5 10 15

Asn His Ser Phe Cys Arg Ala Cys Ile Thr Leu Asn Tyr Glu Ser Asn
20 25 30

Arg Asn Thr Asp Gly Lys Gly Asn Cys Pro Val Cys Arg
35 40 45

(2) INFORMATION FOR SEQ ID NO: 84:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 41 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide

(iii) HYPOTHETICAL: NO

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 84:

Cys Pro Ile Cys Leu Asp Met Leu Lys Asn Thr Met Thr Thr Lys Glu
1 5 10 15

Cys Leu His Arg Phe Cys Ser Asp Cys Ile Val Thr Ala Leu Arg Ser
20 25 30

Gly Asn Lys Glu Cys Pro Thr Cys Arg
35 40

(2) INFORMATION FOR SEQ ID NO: 85:

(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 42 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS:
(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide

(iii) HYPOTHETICAL: NO

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 85:

Cys Pro Val Cys Leu Gln Tyr Phe Ala Glu Pro Met Met Leu Asp Cys
1 5 10 15

Gly His Asn Ile Cys Cys Ala Cys Leu Ala Arg Cys Trp Gly Thr Ala
20 25 30

Cys Thr Asn Val Ser Cys Pro Gln Cys Arg
35 40

「染色体１７研究会」によって決定されたＢＲＣＡ１近辺の遺伝子座の順序を示す図である。図１はＦain，1992から再現した。It is a figure which shows the order of the locus near BRCA1 determined by "chromosome 17 workshop". FIG. 1 was reproduced from Fain, 1992. Ｍfd15-Ｍfd188領域部分を画定するＹＡＣの模式的地図である。It is a schematic map of YAC which defines the Mfd15-Mfd188 region part. ＢＲＣＡ１領域中のＳＴＳ、Ｐ１およびＢＡＣの模式的地図である。1 is a schematic map of STS, P1 and BAC in the BRCA1 region. ヒト染色体１７の模式的地図である。ＢＲＣＡ１を含む直接関係する領域は、２つの以前に同定された遺伝子、ＣＡ１２５およびＲＮＵ２の相対的な位置を示すために拡大されており、ＢＲＣＡ１はマーカーD17S855にわたって広がっている。It is a schematic map of human chromosome 17. The directly related region containing BRCA1 has been expanded to show the relative location of the two previously identified genes, CA125 and RNU2, and BRCA1 extends over marker D17S855. Ｓmith-Ｗaterman配列に最もよく記録される３つの他の亜鉛-フィンガードメインを有するＢＲＣＡ１亜鉛-フィンガードメインの配列を示している。ＲＰＴ１は、マウスにおいてＩＬ-２受容体の負の調節因子であるようである蛋白質をコードしている。ＲＩＮ１は、亜鉛-フィンガーに関連する環(RING)-フィンガーモチーフを含むＤＮＡ-結合蛋白質をコードしている。ＲＦＰ１は、ＲＥＴオンコジーン産物のＮ-末端ドメインである予想転写因子をコードしている。下線部分は、亜鉛イオン結合ポケットを形成するシステインおよび１つのヒスチジンの位置を示すＣ３ＨＣ４共通亜鉛-フィンガー配列を含む。Figure 6 shows the sequence of the BRCA1 zinc-finger domain with three other zinc-finger domains best recorded in the Smith-Waterman sequence. RPT1 encodes a protein that appears to be a negative regulator of the IL-2 receptor in mice. RIN1 encodes a DNA-binding protein that contains a zinc-finger related RING-finger motif. RFP1 encodes a putative transcription factor that is the N-terminal domain of the RET oncogene product. The underlined portion contains the C3HC4 consensus zinc-finger sequence indicating the location of cysteine and one histidine to form a zinc ion binding pocket. 別のスプライシングによって生成したイントロンの位置、およびＢＲＣＡ１ｍＲＮＡの変形を示すＢＲＣＡ１ｍＲＮＡの図である。イントロン位置は「黒塗り三角」によって示し、エキソンはｃＤＮＡを表す線の下側に番号付けしている。最上段のｃＤＮＡは、ＢＲＣＡ１のペプチド配列を作製するのに用いる組成である。ｃＤＮＡクローンまたはハイブリッド選抜クローンとして同定した別の形態を下側に示す。FIG. 4 is a diagram of BRCA1 mRNA showing the location of introns generated by alternative splicing, and a variation of BRCA1 mRNA. Intron positions are indicated by "solid triangles" and exons are numbered below the cDNA line. The cDNA at the top is a composition used to prepare the peptide sequence of BRCA1. Other forms identified as cDNA clones or hybrid selection clones are shown below. ＢＲＣＡ１の組織発現パターンを示している。ブロットはＣlontech社から得、それは示した組織からのＲＮＡを含む。ハイブリダイゼーション条件は製造業者によって推奨されたもので、ＢＲＣＡ１のヌクレオチド位３６３１〜３９３０よりなるプローブを使用している。乳房および卵巣の両方がヘテロ接合体組織であり、関連する上皮細胞のパーセンテージが変動し得ることは注記しておく。分子量マーカーはｋｂである。3 shows the tissue expression pattern of BRCA1. Blots were obtained from Clontech, which contains RNA from the indicated tissues. Hybridization conditions were recommended by the manufacturer and a probe consisting of nucleotide positions 3631-930 of BRCA1 was used. It is noted that both breast and ovary are heterozygous tissues and the percentage of epithelial cells involved can vary. The molecular weight marker is kb. 別のスプライシングによって生成したイントロンの位置およびＢＲＣＡ１ｍＲＮＡの変形を示すＢＲＣＡ１の５'非翻訳領域＋翻訳領域の開始点の図である。イントロンの位置を破線で示す。６つの別のスプライシング形態を示す。FIG. 4 is a diagram of the position of the intron generated by alternative splicing and the starting point of the 5 ′ untranslated region of BRCA1 + translated region showing the modification of BRCA1 mRNA. The position of the intron is indicated by a dashed line. 6 shows six alternative splicing configurations. Ｋindred2082におけるナンセンス突然変異を示している。Ｐとは、元来スクリーニングした個人を示し、ｂおよびｃはハロタイプキャリアーで、ａ、ｄ、ｅ、ｆおよびｇはＢＲＣＡ１ハロタイプを運んでいない。ＣからＴへの突然変異は終止コドンを生じ、制限酵素ＡｖｒIIの部位を生成する。ＰＣＲ増幅産物はこの酵素で切断される。キャリアーは、該部位についてヘテロ接合体であり、それ故、３つのバンドを示す。非-キャリアーは切断されないまま残る。The nonsense mutation in Kindred 2082 is shown. P indicates the originally screened individual, b and c are halotype carriers, and a, d, e, f and g do not carry the BRCA1 haplotype. The C to T mutation creates a stop codon, creating a site for the restriction enzyme AvrII. The PCR amplification product is cut with this enzyme. The carrier is heterozygous for the site and therefore shows three bands. Non-carriers remain uncut. ＢＲＣＡ１家系における突然変異および共分離分析を示している。キャリアー個人は家系図中の「黒塗り丸」および「黒塗り四角」として示す。Ｋindred1910におけるフレームシフト突然変異。最初の３レーンは対照、非キャリアー試料である。１-３で標識したレーンはキャリアー個人からの配列を含む。レーン４には、ＢＲＣＡ１突然変異を運んでいない家系構成員からのＤＮＡが含まれる。菱形を用いて家系の同定を防いでいる。さらなるＣから生じたフレームシフトは１、２および３で標識したレーンで明らかである。Figure 2 shows mutation and co-segregation analysis in BRCA1 kindreds. Carrier individuals are shown as "solid circles" and "solid squares" in the family tree. Frameshift mutation in Kindred 1910. The first three lanes are control, non-carrier samples. Lanes labeled 1-3 contain sequences from individual carriers. Lane 4 contains DNA from family members who do not carry the BRCA1 mutation. Diamonds are used to prevent family identification. Additional frameshifts resulting from C are evident in lanes labeled 1, 2, and 3. ＢＲＣＡ１家系における突然変異および共分離分析を示している。キャリアー個人は、家系図中の「黒塗り丸」および「黒塗り四角」として示す。推論する調節突然変異がＫindred2035にある。２の異なる多形(ＰＭ１およびＰＭ７)のキャリアーおよび非キャリアーのＡＳＯ分析を生殖細胞系におけるヘテロ接合性について検査し、リンパ球ｍＲＮＡのヘテロ接合性と比較した。各パネルの最上段の２列はゲノムＤＮＡから増幅したＰＣＲ産物を含み、下の２列はｃＤＮＡから増幅したＰＣＲ産物を含んでいる。「Ａ」および「Ｇ」はＡＳＯによって検出した２つの対立遺伝子である。暗いスポットは、特定の対立遺伝子が試料中に存在することを示している。ＰＭ７の最初の３レーンは、一般集団の３種の遺伝子型を表している。Figure 2 shows mutation and co-segregation analysis in BRCA1 kindreds. Carrier individuals are shown as "solid circles" and "solid squares" in the family tree. The inferred regulatory mutation is in Kindred 2035. ASO analysis of carriers and non-carriers of two different polymorphisms (PM1 and PM7) was examined for germline heterozygosity and compared to that of lymphocyte mRNA. The top two rows of each panel contain PCR products amplified from genomic DNA, and the bottom two rows contain PCR products amplified from cDNA. "A" and "G" are the two alleles detected by ASO. Dark spots indicate that a particular allele is present in the sample. The first three lanes of PM7 represent the three genotypes of the general population. ＢＲＣＡ１のゲノム配列を示している。より下のケースの文字はイントロン配列を示す一方、より上のケースの文字はエキソン配列を示す。イントロン内の不明瞭な間隔は、ｖｖｖｖｖｖｖｖｖｖｖｖｖｖで示した。知られている多形部位は下線および肉付太字タイプとして示す。1 shows the genomic sequence of BRCA1. Lower case letters indicate intron sequences, while upper case letters indicate exon sequences. Ambiguous intervals within introns are denoted by vvvvvvvvvvvvvvv. Known polymorphic sites are shown as underlined and bold type. ＢＲＣＡ１のゲノム配列を示している。より下のケースの文字はイントロン配列を示す一方、より上のケースの文字はエキソン配列を示す。イントロン内の不明瞭な間隔は、ｖｖｖｖｖｖｖｖｖｖｖｖｖｖで示した。知られている多形部位は下線および肉付太字タイプとして示す。1 shows the genomic sequence of BRCA1. Lower case letters indicate intron sequences, while upper case letters indicate exon sequences. Ambiguous intervals within introns are denoted by vvvvvvvvvvvvvvv. Known polymorphic sites are shown as underlined and bold type. ＢＲＣＡ１のゲノム配列を示している。より下のケースの文字はイントロン配列を示す一方、より上のケースの文字はエキソン配列を示す。イントロン内の不明瞭な間隔は、ｖｖｖｖｖｖｖｖｖｖｖｖｖｖで示した。知られている多形部位は下線および肉付太字タイプとして示す。1 shows the genomic sequence of BRCA1. Lower case letters indicate intron sequences, while upper case letters indicate exon sequences. Ambiguous intervals within introns are denoted by vvvvvvvvvvvvvvv. Known polymorphic sites are shown as underlined and bold type. ＢＲＣＡ１のゲノム配列を示している。より下のケースの文字はイントロン配列を示す一方、より上のケースの文字はエキソン配列を示す。イントロン内の不明瞭な間隔は、ｖｖｖｖｖｖｖｖｖｖｖｖｖｖで示した。知られている多形部位は下線および肉付太字タイプとして示す。1 shows the genomic sequence of BRCA1. Lower case letters indicate intron sequences, while upper case letters indicate exon sequences. Ambiguous intervals within introns are denoted by vvvvvvvvvvvvvvv. Known polymorphic sites are shown as underlined and bold type. ＢＲＣＡ１のゲノム配列を示している。より下のケースの文字はイントロン配列を示す一方、より上のケースの文字はエキソン配列を示す。イントロン内の不明瞭な間隔は、ｖｖｖｖｖｖｖｖｖｖｖｖｖｖで示した。知られている多形部位は下線および肉付太字タイプとして示す。1 shows the genomic sequence of BRCA1. Lower case letters indicate intron sequences, while upper case letters indicate exon sequences. Ambiguous intervals within introns are denoted by vvvvvvvvvvvvvvv. Known polymorphic sites are shown as underlined and bold type. ＢＲＣＡ１のゲノム配列を示している。より下のケースの文字はイントロン配列を示す一方、より上のケースの文字はエキソン配列を示す。イントロン内の不明瞭な間隔は、ｖｖｖｖｖｖｖｖｖｖｖｖｖｖで示した。知られている多形部位は下線および肉付太字タイプとして示す。1 shows the genomic sequence of BRCA1. Lower case letters indicate intron sequences, while upper case letters indicate exon sequences. Ambiguous intervals within introns are denoted by vvvvvvvvvvvvvvv. Known polymorphic sites are shown as underlined and bold type. ＢＲＣＡ１のゲノム配列を示している。より下のケースの文字はイントロン配列を示す一方、より上のケースの文字はエキソン配列を示す。イントロン内の不明瞭な間隔は、ｖｖｖｖｖｖｖｖｖｖｖｖｖｖで示した。知られている多形部位は下線および肉付太字タイプとして示す。1 shows the genomic sequence of BRCA1. Lower case letters indicate intron sequences, while upper case letters indicate exon sequences. Ambiguous intervals within introns are denoted by vvvvvvvvvvvvvvv. Known polymorphic sites are shown as underlined and bold type. ＢＲＣＡ１のゲノム配列を示している。より下のケースの文字はイントロン配列を示す一方、より上のケースの文字はエキソン配列を示す。イントロン内の不明瞭な間隔は、ｖｖｖｖｖｖｖｖｖｖｖｖｖｖで示した。知られている多形部位は下線および肉付太字タイプとして示す。1 shows the genomic sequence of BRCA1. Lower case letters indicate intron sequences, while upper case letters indicate exon sequences. Ambiguous intervals within introns are denoted by vvvvvvvvvvvvvvv. Known polymorphic sites are shown as underlined and bold type.

Claims

(I) the nucleotide sequence according to SEQ ID NO: 1 from nucleotide 120 to nucleotide 5708, its complement or the corresponding RNA, or (ii) an allelic variant of the nucleotide sequence according to SEQ ID NO: 1 from nucleotide 120 to nucleotide 5708, (A) a nucleic acid encoding a BRCA1 polypeptide comprising its complement or corresponding RNA and comprising the amino acid sequence set forth in SEQ ID NO: 2; and (b) a stringent strain at a temperature exceeding 45 ° C. and a salt concentration of less than 200 mM. A nucleic acid that hybridizes under hybridization conditions to a BRCA1 nucleic acid comprising the nucleotide sequence set forth in SEQ ID NO: 1 from nucleotide 120 to nucleotide 5708, encoding BRCA1, an allelic variant thereof, or a naturally occurring mutant thereof. From the nucleic acid An isolated nucleic acid selected from that group.

2. The isolated nucleic acid of claim 1, operably linked to a BRCA1 gene regulatory sequence.

(I) a nucleic acid comprising a nucleotide sequence selected from the nucleotide sequence of SEQ ID NO: 1 from nucleotide 120 to nucleotide 5708 of claim 1 or an allelic variant thereof or a naturally occurring mutant form thereof, or (ii) A) a hybridization probe for determining the presence of RNA corresponding to said nucleic acid in a sample, comprising an isolated DNA comprising a portion of the nucleotide sequence of the nucleic acid according to claim 1, wherein the sequence of said probe is Under stringent hybridization conditions at a temperature greater than 45 ° C. and a salt concentration of less than 200 mM, the nucleic acid or RNA can specifically hybridize to a target sequence that is a portion of the BRCA1 polypeptide coding sequence, wherein the portion comprises at least 15 The hybridization probe comprising a nucleotide.

4. A nucleic acid probe suitable for the hybridization probe according to claim 3, wherein the nucleotide sequence of the nucleic acid probe comprises the DNA sequence of SEQ ID NO: 1 at nucleotide positions 3631 to 3930.

A vector comprising the isolated nucleic acid according to claim 1.

(A) (i) the isolated nucleic acid of claim 1 or the probe of claim 3, and (ii) a replication cloning vector comprising a replicon operable in a host cell of the vector; and (b) the BRCA1 poly. The peptide or a mutated form thereof is selected from the group consisting of an expression vector comprising the isolated nucleic acid of claim 1 operably linked to a promoter sequence capable of directing the expression of the coding sequence in a host cell of the vector. vector.

A host cell transformed or transfected with the vector according to claim 5 or 6.

The method for identifying a mutant BRCA1 nucleotide sequence according to claim 2, wherein the nucleotide sequence of the predicted mutant BRCA1 allele is the coding sequence according to SEQ ID NO: 1 from nucleotide 120 to nucleotide 5708 and / or an allelic variation thereof. The method comprising comparing to the nucleotide sequence of BRCA1 containing the body.

DNA fragments prepared by amplification using the primer pairs listed in Table 9.