JP2003518920A - New human genes and gene expression products - Google Patents

New human genes and gene expression products

Info

Publication number
JP2003518920A
JP2003518920A JP2001508340A JP2001508340A JP2003518920A JP 2003518920 A JP2003518920 A JP 2003518920A JP 2001508340 A JP2001508340 A JP 2001508340A JP 2001508340 A JP2001508340 A JP 2001508340A JP 2003518920 A JP2003518920 A JP 2003518920A
Authority
JP
Japan
Prior art keywords
sequence
seq
polynucleotide
gene
sequences
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001508340A
Other languages
Japanese (ja)
Inventor
ルイス ティー. ウィリアムズ,
ジェイム エスコベド,
マイケル エイ. イニス,
パブロ ドミンゲズ ガルシア,
ジュリー クリンガー,
アルタフ カッサム,
クリストフ レインハード,
フィリッポ ランダッゾ,
グイリア シー. ケネディー,
デイビッド ポット,
ジョージ ランソン,
ラドジェ ダーマナック,
ラドマー カーケンヤコフ,
スネザナ ダーマナック,
マーク ディクソン,
イヴァン ラバット,
ディナ レシュコウィティズ,
デイビッド キタ,
ベロニカ ガルシア,
リー ウィリアム ジョーンズ,
バージット ストラチェ−クレイン,
Original Assignee
カイロン コーポレイション
ハイセク インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by カイロン コーポレイション, ハイセク インコーポレイテッド filed Critical カイロン コーポレイション
Publication of JP2003518920A publication Critical patent/JP2003518920A/en
Withdrawn legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1205Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4705Regulators; Modulating activity stimulating, promoting or activating activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/64Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
    • C12N9/6421Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
    • C12N9/6424Serine endopeptidases (3.4.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides

Abstract

(57)【要約】 本発明は、新規なポリヌクレオチドを提供する。本発明は、タンパク質ファミリーの新規なメンバー、および正常細胞と比較して癌細胞において示差的に発現されるポリヌクレオチド、および正常細胞または非転移性癌細胞と比較して転移性癌細胞において示差的に発現されるポリヌクレオチドをさらに提供する。本発明はまた、哺乳動物細胞の癌状態と相関する示差的に発現された遺伝子を検出する方法を提供し、この方法は、癌であると疑われている細胞由来の試験サンプルにおいて、少なくとも1つの示差的に発現した遺伝子産物を検出する工程を包含する。   (57) [Summary] The present invention provides a novel polynucleotide. The present invention relates to novel members of the protein family and polynucleotides that are differentially expressed in cancer cells as compared to normal cells, and differentially expressed in metastatic cancer cells as compared to normal or non-metastatic cancer cells. There is further provided a polynucleotide expressed in The present invention also provides a method of detecting a differentially expressed gene that correlates with a cancerous state of a mammalian cell, the method comprising at least one test sample from a cell suspected of being cancerous. Detecting the two differentially expressed gene products.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】 (発明の分野) 本発明は、ヒト起源の新規なポリヌクレオチドおよびそのコードされる遺伝子
産物に関する。
FIELD OF THE INVENTION The present invention relates to novel polynucleotides of human origin and their encoded gene products.

【0002】 (発明の背景) 新規なポリヌクレオチド、特に発現される遺伝子産物をコードするポリヌクレ
オチドの同定は、薬物発見、診断技術、ならびに癌のような複雑な疾患の進行お
よび性質の理解の進歩において重要である。疾患の状態または病期、発生の段階
、種々の環境因子への曝露、起源の組織、組織が単離される種などが異なる供給
源から単離された異なる細胞型において発現される遺伝子の同定は、これらの種
々の差異と関連する表現型を担う遺伝的因子を同定する鍵である。
BACKGROUND OF THE INVENTION The identification of novel polynucleotides, particularly those that encode expressed gene products, is an advance in drug discovery, diagnostic techniques, and understanding of the progression and nature of complex diseases such as cancer. Is important in. Identification of genes expressed in different cell types isolated from different sources such as disease state or stage, stage of development, exposure to various environmental factors, tissue of origin, species from which the tissue is isolated, etc. , Is the key to identifying the genetic factors responsible for the phenotype associated with these various differences.

【0003】 本発明は、新規なヒトポリヌクレオチド、これらのポリヌクレオチドによって
コードされるポリペプチド、ならびにこれらの新規なポリヌクレオチドに対応す
る遺伝子およびタンパク質を提供する。
The present invention provides novel human polynucleotides, polypeptides encoded by these polynucleotides, and genes and proteins corresponding to these novel polynucleotides.

【0004】 (発明の要旨) 本発明は、新規なヒトポリヌクレオチドおよびそれらの改変体、それらのコー
ドするポリペプチドおよびそれらの改変体に、これらのポリヌクレオチドに対応
する遺伝子に、ならびにこれらの遺伝子によって発現されるタンパク質に関する
。本発明はまた、このような新規なヒトポリヌクレオチド、それらの対応する遺
伝子、または遺伝子産物を含有する診断薬および治療薬(プローブ、アンチセン
スヌクレオチド、および抗体を含む)に関する。本発明のポリヌクレオチドは、
配列番号1〜3351のうちの少なくとも1つの配列情報を含むポリヌクレオチ
ドに対応する。
SUMMARY OF THE INVENTION The present invention relates to novel human polynucleotides and their variants, polypeptides encoding them and their variants, genes corresponding to these polynucleotides, and these genes. Related to proteins expressed by. The present invention also relates to diagnostic and therapeutic agents (including probes, antisense nucleotides, and antibodies) containing such novel human polynucleotides, their corresponding genes, or gene products. The polynucleotide of the present invention is
It corresponds to a polynucleotide containing sequence information of at least one of SEQ ID NOs: 1-3351.

【0005】 本発明の種々の局面および実施形態は、本明細書中に提供される記載を読む際
に当業者に容易に明らかである。
Various aspects and embodiments of the invention will be readily apparent to those of skill in the art upon reading the description provided herein.

【0006】 (発明の詳細な説明) 本発明は、開示されたヌクレオチド配列を含有するポリヌクレオチドに、全長
cDNA配列、mRNAゲノム配列、ならびにこれらの配列に対応する遺伝子お
よびそれらの縮重改変体に、ならびに本発明のポリヌクレオチドによってコード
されるポリペプチドおよびポリペプチド改変体に関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention provides polynucleotides containing the disclosed nucleotide sequences, full-length cDNA sequences, mRNA genomic sequences, and genes corresponding to these sequences and degenerate variants thereof. , And polypeptides and polypeptide variants encoded by the polynucleotides of the invention.

【0007】 ポリペプチド改変体は、野生型タンパク質の生物学的活性を増強するか、付加
するか、または減少するかのいずれかである1つ以上のアミノ酸置換を有する点
で野生型とは異なる。
Polypeptide variants differ from wild-type in that they have one or more amino acid substitutions that either enhance, add, or decrease the biological activity of the wild-type protein. .

【0008】 本明細書中に開示されたポリペプチドのうちの6つは、MKKキナーゼファミ
リーの新規のメンバーをコードする;このコード領域は、括弧中のヌクレオチド
領域内に見出される:配列番号29(ヌクレオチド295−421);配列番号
31(298−397);配列番号196(37−322);配列番号3175
(ヌクレオチド14−164);配列番号3190(229−390);および
配列番号3281(15−182)。ポリペプチドのうちの24個は、塩基性領
域およびロイシンジッパーを有する転写因子タンパク質のファミリーの新規のメ
ンバーをコードする:配列番号410(42−191);配列番号552(11
6−288);配列番号768(116−288);配列番号822(108−
262);配列番号836(158−353);配列番号1288(73−23
4);配列番号1365(69−257);配列番号1540(289−471
);配列番号1549(200−391);配列番号1556(163−354
);配列番号1557(207−398);配列番号1563(107−298
);配列番号1622(180−365);配列番号1630(100−291
);配列番号1704(184−372);配列番号1808(36−161)
;配列番号1454(49−209);配列番号2363(48−211);配
列番号2424(43−194);配列番号3147(190−369);配列
番号3152(129−320);配列番号3158(167−334);およ
び配列番号3208(34−256)。
Six of the polypeptides disclosed herein encode novel members of the MKK kinase family; this coding region is found within the nucleotide region in brackets: SEQ ID NO: 29 ( Nucleotides 295-421); SEQ ID NO: 31 (298-397); SEQ ID NO: 196 (37-322); SEQ ID NO: 3175
(Nucleotides 14-164); SEQ ID NO: 3190 (229-390); and SEQ ID NO: 3281 (15-182). Twenty-four of the polypeptides encode novel members of the family of transcription factor proteins with basic regions and leucine zippers: SEQ ID NO: 410 (42-191); SEQ ID NO: 552 (11).
6-288); SEQ ID NO: 768 (116-288); SEQ ID NO: 822 (108-
262); SEQ ID NO: 836 (158-353); SEQ ID NO: 1288 (73-23)
4); SEQ ID NO: 1365 (69-257); SEQ ID NO: 1540 (289-471)
); SEQ ID NO: 1549 (200-391); SEQ ID NO: 1556 (163-354)
); SEQ ID NO: 1557 (207-398); SEQ ID NO: 1563 (107-298)
); SEQ ID NO: 1622 (180-365); SEQ ID NO: 1630 (100-291)
); SEQ ID NO: 1704 (184-372); SEQ ID NO: 1808 (36-161)
SEQ ID NO: 1454 (49-209); SEQ ID NO: 2363 (48-211); SEQ ID NO: 2424 (43-194); SEQ ID NO: 3147 (190-369); SEQ ID NO: 3152 (129-320); SEQ ID NO: 3158 ( 167-334); and SEQ ID NO: 3208 (34-256).

【0009】 配列番号186(175−395);2591(60−165);3307(
43−321);および3339(94−342)は、SH2ドメインを有する
ポリペプチドをコードし、そして配列番号234(23−121)、1832(
18−173)、および1835(57−206)は、SH3ドメインを有する
ポリペプチドをコードする。9つのポリペプチドは、Ank反復領域を有するタ
ンパク質のファミリーの新規のメンバーをコードする:配列番号187(358
−432);配列番号1268(238−315);配列番号1804(301
−378);配列番号1819(278−355);配列番号1839(224
−307);配列番号1830(184−267);配列番号2562(18−
101);配列番号3015(131−214);および配列番号3267(9
7−180)。
SEQ ID NO: 186 (175-395); 2591 (60-165); 3307 (
43-321); and 3339 (94-342) encode a polypeptide having an SH2 domain, and SEQ ID NOs: 234 (23-121), 1832 ().
18-173), and 1835 (57-206) encode polypeptides having the SH3 domain. Nine polypeptides encode a novel member of a family of proteins with an Ank repeat region: SEQ ID NO: 187 (358).
-432); SEQ ID NO: 1268 (238-315); SEQ ID NO: 1804 (301
-378); SEQ ID NO: 1819 (278-355); SEQ ID NO: 1839 (224)
-307); SEQ ID NO: 1830 (184-267); SEQ ID NO: 2562 (18-
101); SEQ ID NO: 3015 (131-214); and SEQ ID NO: 3267 (9
7-180).

【0010】 以下の11個のポリヌクレオチドは、C2H2型ジンクフィンガーを有するポ
リペプチドをコードする:配列番号308(110−172);807(339
−392);1324(294−356);1503(154−216);15
27(156−212);1674(196−258);1779(64−12
6);1801(295−351);3081(190−252);3193(
293−355);および3306(161−223)。8個のポリヌクレオチ
ドは、ATPaseのファミリーのポリペプチドをコードする:配列番号431
(71−428);639(157−561);2135(2−401);26
84(9−461);2859(100−320);3178(45−386)
;3197(281−343)および3266(8−139)。III型フィブ
ロネクチンドメインを有するポリペプチドは、配列番号746(209−427
)および1192(186−416)によってコードされる。EFハンドドメイ
ンを有するポリペプチドは、配列番号820(341−406);1755(2
81−367)および3285(16−102)によってコードされる。プロテ
インキナーゼファミリーの6つのポリペプチドは、配列番号1157(41−4
44);1478(54−437)、1496(241−520);2286(
12−182);2969(5−387);および3190(118−390)
によってコードされる。
The following eleven polynucleotides encode a polypeptide having C2H2-type zinc fingers: SEQ ID NOs: 308 (110-172); 807 (339).
-392); 1324 (294-356); 1503 (154-216); 15
27 (156-212); 1674 (196-258); 1779 (64-12).
6); 1801 (295-351); 3081 (190-252); 3193 (
293-355); and 3306 (161-223). Eight polynucleotides encode a polypeptide of the ATPase family: SEQ ID NO: 431
(71-428); 639 (157-561); 2135 (2-401); 26.
84 (9-461); 2859 (100-320); 3178 (45-386).
3197 (281-343) and 3266 (8-139). A polypeptide having a type III fibronectin domain has the sequence of SEQ ID NO: 746 (209-427).
) And 1192 (186-416). The polypeptide having the EF hand domain is SEQ ID NO: 820 (341-406); 1755 (2
81-367) and 3285 (16-102). The six polypeptides of the protein kinase family are SEQ ID NO: 1157 (41-4
44); 1478 (54-437), 1496 (241-520); 2286 (
12-182); 2969 (5-387); and 3190 (118-390).
Coded by

【0011】 LIMドメイン含有ポリペプチドは、配列番号1269(79−240);1
309(248−404);1360(222−377);および1386(2
43−398)によってコードされる。C2ドメイン(プロテインキナーゼC様
)を有するファミリーの2つのポリペプチドは、配列番号1325(1−234
)および2282(183−353)によってコードされる。WDドメイン、G
−β反復モチーフを有するポリペプチドは、配列番号1336(66−164)
;1380(42−140);1711(263−361);1762(236
−334);1909(160−258);2218(127−225);30
47(191−292);3108(275−367)および3292(208
−300)によってコードされる。
The LIM domain-containing polypeptide is SEQ ID NO: 1269 (79-240); 1
309 (248-404); 1360 (222-377); and 1386 (2.
43-398). Two polypeptides of the family with the C2 domain (protein kinase C-like) are SEQ ID NO: 1325 (1-234
) And 2282 (183-353). WD domain, G
The polypeptide having the -β repeat motif is SEQ ID NO: 1336 (66-164).
1380 (42-140); 1711 (263-361); 1762 (236.
-334); 1909 (160-258); 2218 (127-225); 30.
47 (191-292); 3108 (275-367) and 3292 (208).
-300).

【0012】 配列番号1410(222−350)は、トリプシンファミリーのメンバーを
コードする。配列番号1417(8−354);2281(20−387)およ
び2310(20−371)は、プロテインチロシンホスファターゼファミリー
のメンバーをコードする。配列番号1464(4−180)および1514(2
−252)は、RNA認識モチーフ(RRM、RBD、またはRNPドメインと
しても公知である)を有するファミリーのメンバーをコードする。配列番号14
96(241−520)および3297(7−153)は、保存されたC末端ド
メインを有するヘリカーゼをコードする。配列番号1538(9−635)は、
発達シグナル伝達タンパク質のwntファミリーのメンバーをコードする。
SEQ ID NO: 1410 (222-350) encodes a member of the trypsin family. SEQ ID NOs: 1417 (8-354); 2281 (20-387) and 2310 (20-371) encode members of the protein tyrosine phosphatase family. SEQ ID NOs: 1464 (4-180) and 1514 (2
-252) encodes a member of a family with an RNA recognition motif (also known as RRM, RBD, or RNP domain). SEQ ID NO: 14
96 (241-520) and 3297 (7-153) encode helicases with a conserved C-terminal domain. SEQ ID NO: 1538 (9-635) is
Encodes a member of the wnt family of developmental signaling proteins.

【0013】 3つのポリヌクレオチドは、ホメオボックスドメインを有するポリペプチドを
コードする:配列番号1676(9−86);1820(123−299);お
よび1821(127−303)。新規なチオレドキシンは、配列番号1677
(316−369)によってコードされる。rasファミリーの2つの新規なメ
ンバーは、配列番号1688(109−410)および3258(138−39
4)によってコードされる。ホスファチジルイノシトール特異的ホスホリパーゼ
C Yドメインを有する新規なポリペプチドは、配列番号1707(92−43
9)によってコードされる。新規なセリンカルボキシペプチダーゼは、配列番号
1744(238−433)によってコードされる。EtsドメインにおいてN
末端相同性を有する新規なポリペプチドは、配列番号1811(184−315
)によってコードされる。ブロモドメインを有する新規なポリペプチドは、配列
番号1814(127−294)によってコードされる。二本鎖RNA結合モチ
ーフを有する新規なポリペプチドは、配列番号1818(9−146)によって
コードされる。Gタンパク質αサブユニットを有する新規なポリペプチドは、配
列番号1846(12−398)によってコードされる。
The three polynucleotides encode a polypeptide having a homeobox domain: SEQ ID NOs: 1676 (9-86); 1820 (123-299); and 1821 (127-303). The novel thioredoxin is SEQ ID NO: 1677.
(316-369). Two novel members of the ras family are SEQ ID NOs: 1688 (109-410) and 3258 (138-39).
4) coded by. A novel polypeptide having a phosphatidylinositol-specific phospholipase CY domain is SEQ ID NO: 1707 (92-43).
9) coded by. The novel serine carboxypeptidase is encoded by SEQ ID NO: 1744 (238-433). N in Ets domain
A novel polypeptide having terminal homology is SEQ ID NO: 1811 (184-315).
) Coded by. A novel polypeptide having a bromo domain is encoded by SEQ ID NO: 1814 (127-294). A novel polypeptide having a double-stranded RNA binding motif is encoded by SEQ ID NO: 1818 (9-146). A novel polypeptide having the G protein α subunit is encoded by SEQ ID NO: 1846 (12-398).

【0014】 配列番号1911(35−151)および1980(60−197)は、C3
HC4型ジンクフィンガードメイン(RINGフィンガー)を有するポリペプチ
ドをコードする。配列番号2065(253−306)は、CCHCジンクフィ
ンガードメインを有するポリペプチドをコードする。配列番号2216(90−
179)は、WW/rsp5/WWPドメインを有するポリペプチドをコードす
る。配列番号2428(25−350)は、触媒ドメインを有する二重特異性ホ
スファターゼファミリーのポリペプチドメンバーをコードする。
SEQ ID NOs: 1911 (35-151) and 1980 (60-197) are C3
It encodes a polypeptide having an HC4 type zinc finger domain (RING finger). SEQ ID NO: 2065 (253-306) encodes a polypeptide having a CCHC zinc finger domain. SEQ ID NO: 2216 (90-
179) encodes a polypeptide having a WW / rsp5 / WWP domain. SEQ ID NO: 2428 (25-350) encodes a polypeptide member of the bispecific phosphatase family having a catalytic domain.

【0015】 配列番号2577(0−311);3183(14−215);および319
5(0−215)は、4回膜貫通セグメント内在性膜タンパク質ファミリーのメ
ンバーをコードする。配列番号2826(116−400)および2871(1
98−392)は、DEADおよびDEAHボックスヘリカーゼファミリーのポ
リペプチドをコードする。配列番号2944(18−281)は、カルパインラ
ージサブユニット(ドメインIII)を有するポリペプチドをコードする。
SEQ ID NOs: 2577 (0-311); 3183 (14-215); and 319.
5 (0-215) encodes a member of the four-transmembrane segment integral membrane protein family. SEQ ID NOs: 2826 (116-400) and 2871 (1
98-392) encode polypeptides of the DEAD and DEAH box helicase families. SEQ ID NO: 2944 (18-281) encodes a polypeptide having a calpain large subunit (domain III).

【0016】 配列番号3274(11−187)は、フォークヘッドドメインを有する真核
生物転写因子をコードする。配列番号3345(65−271)は、PDZドメ
インを有するポリペプチドをコードし、そして配列番号3351(124−27
0)は、ホルボールエステル/グリセロール結合タンパク質のファミリーにおけ
るポリペプチドをコードする。
SEQ ID NO: 3274 (11-187) encodes a eukaryotic transcription factor having a forkhead domain. SEQ ID NO: 3345 (65-271) encodes a polypeptide having a PDZ domain, and SEQ ID NO: 3351 (124-27).
0) encodes a polypeptide in the family of phorbol ester / glycerol binding proteins.

【0017】 本発明によって包含されるポリヌクレオチド組成物、全長の遺伝子産物をコー
ドするcDNAまたはゲノムDNAを得るための方法、これらのポリヌクレオチ
ドおよび遺伝子の発現、ポリヌクレオチドおよび遺伝子の構造モチーフの同定、
本発明のポリヌクレオチドに対応する遺伝子によってコードされる遺伝子産物の
機能の同定、プローブとしてならびにマッピングにおいておよび組織プロファイ
リング(profiling)における提供されるポリヌクレオチドの使用、抗
体を惹起するための対応するポリペプチドおよび他の遺伝子産物の使用、ならび
に治療目的および診断目的のためのポリヌクレオチドおよびそれらのコードする
遺伝子産物の使用が以下に記載される。
Polynucleotide compositions encompassed by the present invention, methods for obtaining cDNA or genomic DNA encoding full-length gene products, expression of these polynucleotides and genes, identification of structural motifs of polynucleotides and genes,
Identification of the function of the gene product encoded by the gene corresponding to the polynucleotide of the invention, use of the provided polynucleotide as a probe and in mapping and in tissue profiling, the corresponding polypeptide for raising antibodies And the use of other gene products, and the use of polynucleotides and their encoded gene products for therapeutic and diagnostic purposes are described below.

【0018】 (ポリヌクレオチド組成物) ポリヌクレオチド組成物に関する本発明の範囲としては、配列番号1〜335
1のうちのいずれか1つにおいて示される配列を有するポリヌクレオチド;スト
リンジェントな条件(特に高ストリンジェンシーの条件)下でのハイブリダイゼ
ーションによって本明細書中に記載される生物学的材料または他の生物学的供給
源(特にヒト供給源)から得られるポリヌクレオチド;提供されるポリヌクレオ
チドに対応する遺伝子;提供されるポリヌクレオチドおよびそれらの対応する遺
伝子の改変体、特にコードされる遺伝子産物の生物学的活性(例えば、タンパク
質ファミリーへの遺伝子産物の割当ておよび/または遺伝子産物に存在する機能
的ドメインの同定の結果として、提供されるポリヌクレオチドに対応する遺伝子
産物に帰する生物学的活性)を保持する改変体が挙げられるが、これらに必ずし
も制限されない。本発明の範囲によっておよびその範囲内で意図される他の核酸
組成物は、本明細書中での開示が提供される場合、当業者に容易に明らかである
。組成物の核酸に関して本明細書中で使用される場合、「ポリヌクレオチド」お
よび「核酸」は、特に示されない限り、核酸の長さまたは構造に関して制限され
ることが意図されない。
(Polynucleotide Composition) The scope of the present invention relating to a polynucleotide composition includes SEQ ID NOs: 1 to 335.
A polynucleotide having the sequence set forth in any one of 1; the biological material or other biological material described herein by hybridization under stringent conditions, particularly conditions of high stringency Polynucleotides obtained from biological sources (especially human sources); Genes corresponding to the provided polynucleotides; Provided polynucleotides and variants of their corresponding genes, especially organisms of the encoded gene products Biological activity (eg, biological activity attributable to a gene product corresponding to a provided polynucleotide as a result of assignment of the gene product to a protein family and / or identification of functional domains present in the gene product). Examples of the variants to be retained include, but are not necessarily limited to. Other nucleic acid compositions contemplated by and within the scope of the present invention will be readily apparent to those of ordinary skill in the art given the disclosure herein. As used herein with respect to the nucleic acids of the composition, “polynucleotide” and “nucleic acid” are not intended to be limited with respect to the length or structure of the nucleic acids, unless otherwise indicated.

【0019】 本発明は、ヒト組織、具体的にはヒト結腸、乳房、および/または肺の組織に
おいて発現されるポリヌクレオチドを特徴とする。本発明の新規な核酸組成物は
、配列番号1〜3351のいずれか1つにおいて示される配列またはその同定化
配列を含む。「同定化配列」は、ポリヌクレオチド配列を独自に同定する少なく
とも約10nt長〜約20nt長、通常少なくとも約50nt〜約100nt長
の残基の連続する配列であり、例えば、約20ntを超える任意の連続性ヌクレ
オチド配列に対して、90%未満の、通常約80%〜約85%未満の配列同一性
を示す。従って、本発明の新規な核酸組成物は、配列番号1〜3351のいずれ
か1つからの連続性ヌクレオチドの同定化配列を含む全長のcDNAまたはmR
NAを含む。
The invention features polynucleotides that are expressed in human tissue, specifically human colon, breast, and / or lung tissue. The novel nucleic acid composition of the present invention comprises the sequence shown in any one of SEQ ID NOs: 1 to 3531 or its identified sequence. An "identifying sequence" is a contiguous sequence of residues of at least about 10 nt to about 20 nt long, usually at least about 50 nt to about 100 nt long that uniquely identifies a polynucleotide sequence, eg, any sequence above about 20 nt. It exhibits less than 90% sequence identity, usually about 80% to less than about 85%, to contiguous nucleotide sequences. Accordingly, the novel nucleic acid compositions of the present invention include a full-length cDNA or mR containing an identifying sequence of contiguous nucleotides from any one of SEQ ID NOs: 1-3351.
Including NA.

【0020】 本発明のポリヌクレオチドはまた、配列類似性または配列同一性を有するポリ
ヌクレオチドを含む。配列類似性を有する核酸は、低いストリンジェンシー条件
下、例えば、50℃および10×SSC(0.9M 生理食塩水/0.09M
クエン酸ナトリウム)でのハイブリダイゼーションによって検出され、そして1
×SSC中55℃での洗浄に供される場合、結合を保持する。配列同一性は、ス
トリンジェントな条件下、例えば、50℃以上および0.1×SSC(9mM
生理食塩水/0.9mM クエン酸ナトリウム)でのハイブリダイゼーションに
よって決定され得る。ハイブリダイゼーション方法および条件は、当該分野にお
いて周知であり、例えば、米国特許第5,707,829号を参照のこと。提供
されるポリヌクレオチド配列に実質的に同一である核酸、例えば、対立遺伝子改
変体、遺伝子の遺伝的に変化したバージョンなどは、ストリンジェントなハイブ
リダイゼーション条件下で、提供されるポリヌクレオチド配列(配列番号1〜3
351)に結合する。プローブ、特にDNA配列の標識化プローブを使用するこ
とによって、相同な遺伝子または関連の遺伝子を単離し得る。相同な遺伝子の供
給源は、任意の種、例えば、霊長類、特にヒト:げっ歯類(例えば、ラットおよ
びマウス);イヌ、ネコ、ウシ、ヒツジ、ウマ、酵母、線虫などであり得る。
The polynucleotide of the present invention also includes polynucleotides having sequence similarity or sequence identity. Nucleic acids with sequence similarity are labeled under conditions of low stringency, eg, 50 ° C. and 10 × SSC (0.9 M saline / 0.09 M).
Sodium citrate) and 1
Retains binding when subjected to washing at 55 ° C in SSC. Sequence identity may be determined under stringent conditions, such as above 50 ° C. and 0.1 × SSC (9 mM
It can be determined by hybridization with saline / 0.9 mM sodium citrate). Hybridization methods and conditions are well known in the art, see, eg, US Pat. No. 5,707,829. A nucleic acid that is substantially identical to a provided polynucleotide sequence, such as an allelic variant, a genetically altered version of a gene, etc., under stringent hybridization conditions, is provided with the provided polynucleotide sequence (sequence Numbers 1-3
351). By using probes, in particular labeled probes of DNA sequences, homologous or related genes can be isolated. The source of homologous genes can be any species, eg primates, especially humans: rodents (eg rats and mice); dogs, cats, cows, sheep, horses, yeasts, nematodes and the like.

【0021】 好ましくは、ハイブリダイゼーションは、配列番号1〜3351のうちの少な
くとも1つの少なくとも15の連続なヌクレオチド(nt)を使用して行われる
。すなわち、開示される配列番号のうちの1つの少なくとも15の連続なntが
プローブとして使用される場合、プローブは相補的な配列を含有する核酸と優先
的にハイブリダイズし、選択されたプローブに独自にハイブリダイズする核酸の
同定および回収を可能にする。1より多くの配列番号からのプローブは、それら
が由来するcDNAが1つのmRNAに対応する場合、同じ核酸とハイブリダイ
ズし得る。15ntを超えるプローブ、例えば、約18nt〜約100ntのプ
ローブが使用され得るが、15ntは独自の同定について十分な配列であること
を示す。
Preferably, hybridization is performed using at least 15 contiguous nucleotides (nt) of at least one of SEQ ID NOs: 1-3351. That is, if at least 15 consecutive nts of one of the disclosed SEQ ID NOs are used as probes, the probes will preferentially hybridize to nucleic acids containing complementary sequences and will be unique to the selected probe. Enables identification and recovery of nucleic acids that hybridize to Probes from more than one SEQ ID NO: can hybridize to the same nucleic acid if the cDNA from which they correspond corresponds to one mRNA. Probes over 15 nt may be used, for example from about 18 nt to about 100 nt, indicating that 15 nt is sufficient sequence for unique identification.

【0022】 本発明のポリヌクレオチドはまた、ヌクレオチド配列の天然に存在する改変体
(例えば、縮重改変体、対立遺伝子改変体など)を含む。本発明のポリヌクレオ
チドの改変体は、本明細書中に開示されるヌクレオチド配列と推定の改変体との
ハイブリダイゼーションによって、好ましくはストリンジェントな条件下でのハ
イブリダイゼーションによって同定される。例えば、適切な洗浄条件を使用する
ことによって、本発明のポリヌクレオチドの改変体は、対立遺伝子改変体が、選
択されるポリヌクレオチドプローブに対して多くとも約25〜30%の塩基対(
bp)不適正を示す場合に同定され得る。一般に、対立遺伝子改変体は、15〜
25%bp不適正を含み、そしてわずか5〜15%、または2〜5%、または1
〜2%bpの不適正、ならびに単一bpの不適正を含み得る。
The polynucleotides of the present invention also include naturally occurring variants of nucleotide sequences (eg, degenerate variants, allelic variants, etc.). Variants of the polynucleotides of the invention are identified by hybridization of the nucleotide sequences disclosed herein with putative variants, preferably under stringent conditions. For example, by using appropriate wash conditions, a variant of a polynucleotide of the invention will have an allelic variant of at most about 25-30% base pair (based on the selected polynucleotide probe).
bp) can be identified if it shows inadequacy. Generally, allelic variants are 15-
Including 25% bp mismatch and only 5-15%, or 2-5%, or 1
~ 2% bp mismatch, as well as single bp mismatch.

【0023】 本発明はまた、配列番号1〜3351のポリヌクレオチドに対応するホモログ
を包含し、ここで相同な遺伝子の供給源は、任意の哺乳動物種、例えば、霊長類
、特にヒト;げっ歯類(例えば、ラット);イヌ、ネコ、ウシ、ヒツジ、ウマ、
酵母、線虫などであり得る。哺乳動物種間(例えばヒトとマウス)で、ホモログ
は一般に、実質的な配列類似性、例えば、ヌクレオチド配列間に少なくとも75
%、通常少なくとも90%、より通常少なくとも95%の配列同一性を有する。
配列類似性は、参照配列に基づいて算定され、参照配列は保存されるモチーフ、
コード領域、隣接領域などのような、より長い配列のサブセットであり得る。参
照配列は通常、少なくとも約18の連続するnt長、より通常には少なくとも約
30nt長であり、そして比較されている完全な配列に伸長され得る。配列分析
についてのアルゴリズムは、当該分野において公知である(例えば、Altsc
hulら、J.Mol.Biol.(1990)215:403−10において
記載されるBLAST)。
The present invention also includes homologs corresponding to the polynucleotides of SEQ ID NOs: 1-3351, wherein the source of homologous genes is any mammalian species, eg primates, especially humans; rodents. (Eg, rat); dog, cat, cow, sheep, horse,
It can be yeast, nematodes and the like. Between mammalian species (eg human and mouse), homologs generally have substantial sequence similarity, eg, at least 75 nucleotide sequences between nucleotide sequences.
%, Usually at least 90%, more usually at least 95% sequence identity.
Sequence similarity is calculated based on the reference sequence, which is a conserved motif,
It may be a subset of longer sequences, such as coding regions, flanking regions and the like. A reference sequence will usually be at least about 18 contiguous nt long, more usually at least about 30 nt long, and can be extended to the complete sequence being compared. Algorithms for sequence analysis are known in the art (eg Altsc.
hul et al. Mol. Biol. (1990) 215: 403-10 BLAST).

【0024】 一般に、本発明の改変体は、少なくとも約65%、好ましくは少なくとも約7
5%、より好ましくは少なくとも約85%を超える配列同一性を有し、そして少
なくとも約90%、91%、92%、93%、94%、95%、または96%、
最も好ましくは97%、98%または99%を超え得る。本発明の目的のために
、パーセント同一性を算定する好ましい方法は、以下を使用するSmith−W
atermanアルゴリズムである。全体的なDNA配列同一性は、以下の検索
パラメーター:ギャップオープンペナルティー(gap open penal
ty)、12;およびギャップ伸長ペナルティー(gap extension
penalty)、1を用いるアフィンギャップ(affine gap)検
索を使用して、MPSRCHプログラム(Oxford Molecular)
において実行されるようなSmith−Waterman相同性検索アルゴリズ
ムによって決定される場合、65%を超えなければならない。
Generally, variants of the invention will be at least about 65%, preferably at least about 7%.
5%, more preferably at least about 85% sequence identity, and at least about 90%, 91%, 92%, 93%, 94%, 95%, or 96%,
Most preferably it can exceed 97%, 98% or 99%. For purposes of this invention, the preferred method of calculating percent identity is Smith-W using
The aterman algorithm. The overall DNA sequence identity was determined by the following search parameters: gap open penalty.
ty), 12; and gap extension penalties.
MPSRCH program (Oxford Molecular) using affine gap search with 1).
Must be greater than 65% as determined by the Smith-Waterman homology search algorithm as performed in.

【0025】 本発明の核酸は、cDNAまたはゲノムDNA、ならびにそれらのフラグメン
ト、特に生物学的に活性な遺伝子産物をコードするフラグメントおよび/または
本明細書中で開示される方法において有用(例えば、診断において、目的の示差
的に発現される遺伝子の独自の識別子(identifier)としてなど)で
あるフラグメントであり得る。本明細書中で使用される場合、用語「cDNA」
は、ネイティブな成熟mRNA種において見出される配列エレメントの配置を共
有する全ての核酸を含むことが意図され、ここでは配列エレメントは、エキソン
、ならびに3’非コード領域および5’非コード領域である。通常mRNA種は
、連続するエキソンを有し、イントロンの介在を伴い、存在する場合、核RNA
スプライシングによって除去され、本発明のポリぺプチドをコードする連続オー
プンリーディングフレームを生成する。
The nucleic acids of the invention are useful in cDNA or genomic DNA, and fragments thereof, particularly those encoding biologically active gene products and / or in the methods disclosed herein (eg, diagnostics). , As a unique identifier of the differentially expressed gene of interest, etc.). As used herein, the term "cDNA"
Is intended to include all nucleic acids that share the arrangement of sequence elements found in the native mature mRNA species, where the sequence elements are exons and 3'non-coding and 5'non-coding regions. Usually mRNA species have contiguous exons, with intron intervention and, if present, nuclear RNA.
It is removed by splicing to produce a continuous open reading frame encoding the polypeptide of the invention.

【0026】 目的のゲノム配列は、列挙される配列において規定されるように、開始コドン
と終止コドンとの間に存在する核酸を含み、ネイティブな染色体に通常存在する
全てのイントロンを含む。これはさらに、成熟mRNAにおいて見出される3’
非翻訳領域および5’非翻訳領域を含み得る。これはさらに、特異的な転写調節
配列および翻訳調節配列(例えば、プロモーター、エンハンサーなど)を含み得
、転写領域の5’および3’末端のいずれかでの約1kbの、しかしおそらくよ
り長い隣接ゲノムDNAを含む。ゲノムDNAは、100kbp以下のフラグメ
ントとして単離され得;そして隣接する染色体配列が実質的にない。3’および
5’のいずれかでコード領域に隣接するゲノムDNA、またはイントロンにおい
て時折見出されるような内部調節配列は、適切な組織、段階特異的な発現、また
は疾患状態特異的な発現のために必要とされる配列を含む。
The genomic sequence of interest includes the nucleic acids present between the start and stop codons and includes all introns normally present in the native chromosome, as defined in the listed sequences. It is further 3 ′ found in mature mRNA
It may include untranslated regions and 5'untranslated regions. It may further include specific transcriptional and translational regulatory sequences (eg, promoters, enhancers, etc.), of approximately 1 kb, but possibly a longer flanking genome at either the 5'and 3'ends of the transcribed region. Contains DNA. Genomic DNA can be isolated as fragments of 100 kbp or less; and is substantially free of flanking chromosomal sequences. Genomic DNA flanking the coding region in either 3'and 5'or internal regulatory sequences, such as are sometimes found in introns, are present for proper tissue, stage-specific, or disease state-specific expression. Contains the required sequences.

【0027】 本発明の核酸組成物は、本発明のポリぺプチドの全てまたは一部をコードし得
る。2本鎖または1本鎖フラグメントは、制限酵素消化によって、PCR増幅な
どによって、従来の方法に従ってオリゴヌクレオチドを化学的に合成することに
よってDNA配列から得られ得る。本発明の単離されたポリヌクレオチドおよび
ポリヌクレオチドフラグメントは、配列番号1〜3351において示されるよう
なポリヌクレオチド配列から選択される、少なくとも約10、約15、約20、
約35、約50、約100、約150〜約200、約250〜約300、または
約350の連続するntを含む。これらのフラグメントはまた、具体的に述べら
れた長さの中間の長さ(例えば、35、36、37、38、39など;150、
151、152、153、154など)のフラグメントを含む。大部分について
、フラグメントは、少なくとも約15nt、通常少なくとも18ntまたは25
nt、および少なくとも約50までの連続するnt長以上である。好ましい実施
形態において、ポリヌクレオチド分子は、配列番号1〜3351において示され
るポリヌクレオチドからなる群より選択される少なくとも12ntの連続する配
列を含む。
The nucleic acid composition of the present invention may encode all or a part of the polypeptide of the present invention. Double-stranded or single-stranded fragments can be obtained from DNA sequences by chemical synthesis of oligonucleotides according to conventional methods, such as by restriction enzyme digestion, PCR amplification and the like. The isolated polynucleotides and polynucleotide fragments of the invention are at least about 10, about 15, about 20, selected from the polynucleotide sequences as set forth in SEQ ID NOs: 1-3351.
It comprises about 35, about 50, about 100, about 150 to about 200, about 250 to about 300, or about 350 consecutive nts. These fragments also have a length intermediate to those specifically mentioned (eg 35, 36, 37, 38, 39, etc .; 150,
151, 152, 153, 154, etc.). For the most part, fragments will be at least about 15 nt, usually at least 18 nt or 25 nt.
nt and up to at least about 50 consecutive nt lengths. In a preferred embodiment, the polynucleotide molecule comprises at least 12 nt of contiguous sequence selected from the group consisting of the polynucleotides set forth in SEQ ID NOs: 1-3351.

【0028】 本発明のポリヌクレオチドに特異的なプローブは、配列番号1〜3351にお
いて開示されるポリヌクレオチド配列を使用して作製され得る。プローブは、好
ましくは、配列番号1〜3351のうちの対応する連続する配列の少なくとも約
12、15、16、18、20、22、24、または25ntフラグメントであ
り、そして2、1、0.5、0.1、または0.05kb長未満であり得る。プ
ローブは化学的に合成され得るか、または制限酵素を使用してより長いポリヌク
レオチドから作製され得る。プローブは、例えば、放射性タグ、ビオチン化タグ
、または蛍光タグで標識され得る。好ましくは、プローブは、配列番号1〜33
51のうちの1つのポリヌクレオチドの同定化配列に基づいて設計される。より
好ましくは、プローブは、配列への低い複雑性をマスクするためのマスキングプ
ログラム(例えば、XBLAST)の適用後にマスクされないままである本発明
のポリヌクレオチドのうちの1つの連続する配列に基づいて設計される(すなわ
ち、マスキングプログラムによって生成されるマスクした配列のポリ−nストレ
ッチの外側のポリヌクレオチドによって示されるような、マスクされない領域が
選択される)。
Probes specific for the polynucleotides of the present invention can be made using the polynucleotide sequences disclosed in SEQ ID NOs: 1-3351. The probe is preferably at least about 12,15,16,18,20,22,24, or 25 nt fragment of the corresponding contiguous sequence of SEQ ID NOs: 1-3351, and 2,1,0.5. , 0.1, or 0.05 kb in length. Probes can be chemically synthesized or can be made from longer polynucleotides using restriction enzymes. The probe can be labeled with, for example, a radioactive tag, a biotinylated tag, or a fluorescent tag. Preferably, the probes are SEQ ID NOs: 1-33
Designed based on the identified sequence of one of the 51 polynucleotides. More preferably, the probe is designed based on a contiguous sequence of one of the polynucleotides of the invention that remains unmasked after application of a masking program (eg, XBLAST) to mask low complexity to the sequence. (Ie, unmasked regions are selected, as indicated by the polynucleotides outside the poly-n stretch of masked sequence generated by the masking program).

【0029】 本発明のポリヌクレオチドは、一般的にインタクトな染色体以外として、十分
な純度において単離され、そして得られる。通常、ポリヌクレオチドは、DNA
またはRNAのいずれかとして、他の天然に存在する核酸配列を実質的に含まず
に得られ、一般に少なくとも約50%、通常少なくとも約90%の純度であり、
そして代表的に「組換え」であり、例えば、天然に存在する染色体では通常伴わ
ない1つ以上のヌクレオチドによって隣接される。
The polynucleotides of the present invention are isolated and obtained in sufficient purity, generally other than intact chromosomes. Usually, the polynucleotide is DNA
Or RNA, obtained substantially free of other naturally occurring nucleic acid sequences, and generally of at least about 50%, usually at least about 90% pure,
And is typically "recombinant," for example flanked by one or more nucleotides normally not associated with the naturally occurring chromosome.

【0030】 本発明のポリヌクレオチドは、直鎖状分子として、または環状分子内に提供さ
れ得、そして自律的に複製する分子(ベクター)内に、または複製配列を伴わな
い分子内に提供され得る。ポリヌクレオチドの発現は、それら自身によって、ま
たは当該分野において公知の他の調節配列によって調節され得る。本発明のポリ
ヌクレオチドは、当該分野において利用可能な種々の技術(例えば、トランスフ
ェリンポリカチオン媒介性DNA移入、裸の核酸またはカプセル化された核酸で
のトランスフェクション、リポソーム媒介性のDNA移入、DNAコーティング
ラテックスビーズの細胞内輸送、プロトプラスト融合、ウイルス感染、エレクト
ロポレーション、遺伝子銃、リン酸カルシウム媒介性のトランスフェクションな
ど)を使用して適切な宿主細胞に導入され得る。
The polynucleotide of the present invention can be provided as a linear molecule or in a circular molecule, and can be provided in an autonomously replicating molecule (vector) or in a molecule without a replication sequence. . Expression of polynucleotides may be regulated by themselves or by other regulatory sequences known in the art. The polynucleotides of the invention can be incorporated into various techniques available in the art (eg, transferrin polycation-mediated DNA transfer, transfection with naked or encapsulated nucleic acid, liposome-mediated DNA transfer, DNA coating). Intracellular delivery of latex beads, protoplast fusion, viral infection, electroporation, gene gun, calcium phosphate mediated transfection, etc.) can be used to introduce into appropriate host cells.

【0031】 本発明の核酸組成物は、例えば、ポリペプチドを生成するために、生物学的サ
ンプル(例えば、ヒト細胞の抽出物)中の本発明のmRNAの検出のためのプロ
ーブとして、ポリヌクレオチドのさらなるコピーを作製するために、リボザイム
またはアンチセンスオリゴヌクレオチドを作製するために、および1本鎖DNA
プローブとしてかまたは3本鎖を形成するオリゴヌクレオチドとして、使用され
得る。本明細書中に記載されるプローブは、例えば、サンプル中の配列番号1〜
3351において示されるようなポリヌクレオチド配列またはそれらの改変体の
存在または非存在を決定するために使用され得る。これらの使用および他の使用
は、以下により詳細に記載される。
The nucleic acid composition of the invention may be used as a probe for the detection of mRNA of the invention in a biological sample (eg an extract of human cells), eg to produce a polypeptide, a polynucleotide. To make additional copies of the ribozyme or to make antisense oligonucleotides, and single-stranded DNA
It can be used as a probe or as a triplex forming oligonucleotide. The probes described herein include, for example, SEQ ID NOs: 1 to 1 in a sample.
It can be used to determine the presence or absence of a polynucleotide sequence as shown in 3351 or variants thereof. These and other uses are described in more detail below.

【0032】 (全長のcDNA、遺伝子、およびプロモーター領域を得るためのポリヌクレ
オチドの使用) 開示されるポリヌクレオチドを含有する全長cDNA分子は、以下のように得
られる。配列番号1〜3351のうちの1つの配列、または少なくとも12、1
5、18、または20ntを含有するそれらの部分を有するポリヌクレオチドは
、米国特許第5,654,173号において記載されるようなプローブ設計法、
クローニング法、およびクローン選択技術を使用して、cDNAライブラリーの
ハイブリダイズするメンバーを検出するために、ハイブリダイゼーションプロー
ブとして使用される。cDNAのライブラリーは、正常組織もしくは腫瘍組織の
ような選択された組織から、または例えば、薬剤で処置された哺乳動物の組織か
ら作製される。好ましくは、組織は、本発明のポリヌクレオチドが単離された組
織と同じ組織である。なぜなら、本明細書中に記載されるポリヌクレオチドおよ
びcDNAの両方が発現される遺伝子を示すからである。最も好ましくは、cD
NAライブラリーは、実施例において本明細書中に記載される生物学的材料から
作製される。ライブラリー構築のための細胞型の選択は、本発明のポリヌクレオ
チドに対応する遺伝子によってコードされるタンパク質の生体が知られた後にな
され得る。このことは、どの組織および細胞型が関連する遺伝子を発現するよう
であるかを示し、従って、cDNAを作製するためのmRNAについての適切な
供給源を示す。実施例に記載されるように、本発明のcDNAは、特定の細胞型
または組織型から単離され、そしてこのような細胞および組織は、関連する核酸
を得るために好ましい。
(Use of Polynucleotide to Obtain Full-Length cDNA, Gene, and Promoter Region) A full-length cDNA molecule containing the disclosed polynucleotide can be obtained as follows. One of SEQ ID NOs: 1-3351, or at least 12, 1
Polynucleotides having those moieties containing 5, 18, or 20 nt may be probed as described in US Pat. No. 5,654,173,
Used as a hybridization probe to detect hybridizing members of a cDNA library using cloning methods and clone selection techniques. Libraries of cDNA are made from selected tissues, such as normal or tumor tissues, or from, eg, drug-treated mammalian tissues. Preferably, the tissue is the same tissue from which the polynucleotide of the invention was isolated. This is because both the polynucleotides and cDNAs described herein represent expressed genes. Most preferably cD
NA libraries are made from the biological materials described herein in the Examples. The selection of cell types for library construction can be done after the organism of the protein encoded by the gene corresponding to the polynucleotide of the invention is known. This indicates which tissues and cell types are likely to express the relevant gene, and thus represents a suitable source for mRNA to make cDNA. As described in the examples, the cDNA of the present invention is isolated from a particular cell or tissue type, and such cells and tissues are preferred for obtaining the relevant nucleic acid.

【0033】 核酸配列ライブラリーを生成およびプローブするための技術が、例えば、Sa
mbrookら、Molecular Cloning:A Laborato
ry Manual、第2版、(1989)Cold Spring Harb
or Press、Cold Spring Harbor、NYにおいて記載
される。cDNAは、配列番号1〜3351からの配列に基づくプライマーを使
用することによって調製され得る。1つの実施形態において、cDNAライブラ
リーは、ポリアデニル化mRNAのみから作製され得る。従って、ポリ−Tプラ
イマーが、mRNAからcDNAを調製するために使用され得る。
Techniques for generating and probing nucleic acid sequence libraries are described in, for example, Sa
Mbrook et al., Molecular Cloning: A Laborato.
ry Manual, 2nd Edition, (1989) Cold Spring Harb
or Press, Cold Spring Harbor, NY. cDNA can be prepared by using primers based on the sequences from SEQ ID NOs: 1-3351. In one embodiment, a cDNA library can be made exclusively of polyadenylated mRNA. Therefore, poly-T primers can be used to prepare cDNA from mRNA.

【0034】 提供されるポリヌクレオチドよりも長く、かつ好ましくはネイティブなメッセ
ージの完全なコード配列を含むライブラリーのメンバーが得られる。cDNA全
体が得られたことを確認するために、RNAプロテクション実験が以下のように
行われる。mRNAへの全長cDNAのハイブリダイゼーションは、RNase
分解からRNAを保護する。cDNAが全長でない場合、ハイブリダイズしない
mRNAの部分はRNase分解に供される。これは、当該分野において公知で
あるように、ポリアクリルアミドゲルにおける電気泳動移動度の変化によってか
、または放出されるモノリボヌクレオチドの検出によってアッセイされる。Sa
mbrookら、Molecular Cloning:A Laborato
ry Manual、第2版、(1989)Cold Spring Harb
or Press、Cold Spring Harbor、NY。部分的なc
DNAの末端に対して5’側のさらなる配列を得るために、5’RACE(PC
R Protocols:A Guide to Methods and A
pplications、(1990)Academic Press、Inc
.)が行われ得る。
Members of the library are obtained which are longer than the polynucleotide provided and which preferably contain the complete coding sequence of the native message. To confirm that the entire cDNA has been obtained, RNA protection experiments are performed as follows. Hybridization of full-length cDNA to mRNA was performed using RNase
Protects RNA from degradation. If the cDNA is not full length, the part of the mRNA that does not hybridize is subjected to RNase degradation. This is assayed by changes in electrophoretic mobility in polyacrylamide gels or by detection of released monoribonucleotides, as is known in the art. Sa
Mbrook et al., Molecular Cloning: A Laborato.
ry Manual, 2nd Edition, (1989) Cold Spring Harb
or Press, Cold Spring Harbor, NY. Partial c
To obtain additional sequences 5'to the ends of the DNA, 5'RACE (PC
R Protocols: A Guide to Methods and A
applications, (1990) Academic Press, Inc.
. ) Can be done.

【0035】 ゲノムDNAは、全長cDNAの単離と類似の様式において、提供されるポリ
ヌクレオチドを使用して単離される。簡潔には、提供されるポリヌクレオチド、
またはその部分は、ゲノムDNAのライブラリーに対するプローブとして使用さ
れる。好ましくは、ライブラリーは、本発明のポリヌクレオチドを作製するため
に使用された細胞型から得られるが、必ずしもそうである必要はない。最も好ま
しくは、ゲノムDNAは、実施例において本明細書中に記載される生物学的材料
から得られる。このようなライブラリーは、Sambrookら、9.4〜9.
30において詳細に記載されるように、P1またはYACのような、ゲノムの大
きなセグメントを保有するために適切なベクター中にあり得る。さらに、ゲノム
配列は、ヒトBACライブラリーから単離され得、これは例えば、Resear
ch Genetics、Inc.Huntsville、Alabama、U
SAから市販されている。さらなる5’配列または3’配列を得るために、Sa
mbrookらにおいて記載されるように染色体ウォーキングが行われ、これに
よってゲノムDNAの近接かつ重複するフラグメントが単離される。これらは、
制限消化酵素およびDNAリガーゼを使用して、当該分野において公知であるよ
うに、マッピングされ、そしてともに継ぎ合わされる。
Genomic DNA is isolated using the provided polynucleotides in a manner similar to the isolation of full length cDNA. Briefly, the provided polynucleotide,
Alternatively, that portion is used as a probe for a library of genomic DNA. Preferably, the library is, but need not be, derived from the cell type used to make the polynucleotide of the invention. Most preferably, the genomic DNA is obtained from the biological material described herein in the examples. Such libraries are described in Sambrook et al., 9.4-9.
As described in detail at 30, it may be in a vector suitable to carry a large segment of the genome, such as P1 or YAC. In addition, genomic sequences can be isolated from human BAC libraries, which can be isolated, for example, from Research.
ch Genetics, Inc. Huntsville, Alabama, U
Commercially available from SA. To obtain additional 5'or 3'sequence, Sa
Chromosome walking is performed as described in mbrook et al., which isolates contiguous and overlapping fragments of genomic DNA. They are,
Restriction digestion enzymes and DNA ligase are used to map and splice together as is known in the art.

【0036】 本発明のポリヌクレオチド配列を使用して、対応する全長遺伝子が、cDNA
ライブラリーを構築およびプローブするための古典的な方法およびPCR法の両
方を使用して単離され得る。いずれかの方法を使用して、好ましくはノーザンブ
ロットが、どの細胞株が最も高いレベルで目的の遺伝子を発現するかを決定する
ために、多くの細胞型に対して行われる。cDNAライブラリーを構築する古典
的な方法は、Sambrookら(前出)において教示される。これらの方法を
使用して、cDNAがmRNAから生成され得、そしてウイルスベクターまたは
発現ベクター中に挿入される。代表的に、ポリ(A)テイルを含有するmRNA
ライブラリーは、ポリ(T)プライマーを用いて生成され得る。同様に、cDN
Aライブラリーは、本発明の配列をプライマーとして使用して生成され得る。
Using the polynucleotide sequences of the present invention, the corresponding full-length gene is a cDNA
It can be isolated using both classical and PCR methods for constructing and probing libraries. Using either method, Northern blots are preferably performed on a number of cell types to determine which cell line expresses the gene of interest at the highest level. Classical methods of constructing cDNA libraries are taught in Sambrook et al. (supra). Using these methods, cDNA can be generated from mRNA and inserted into a viral or expression vector. Typically, an mRNA containing a poly (A) tail
The library can be generated using poly (T) primers. Similarly, cDN
A libraries can be generated using the sequences of the invention as primers.

【0037】 PCR法が、所望の挿入物を含有するcDNAライブラリーのメンバーを増幅
するために使用される。この場合において、所望の挿入物は、本発明のポリヌク
レオチドに対応する全長のcDNA由来の配列を含む。このようなPCR法とし
ては、Gruberら、WO 95/04745およびGruberら、米国特
許第5,500,356号において記載されるような、遺伝子トラップ法および
RACE法が挙げられる。キットは、例えば、Life Technologi
es,Gaithersburg、Maryland、USAから遺伝子トラッ
プ実験を行うように市販されている。RACEの好ましい実施形態において、共
通のプライマーが、cDNA末端に連結される恣意的なアダプター配列にアニー
ルするように設計される(ApteおよびSiebert、Biotechni
ques(1993)15:890−893:Edwardsら、Nuc.Ac
ids Res.(1991)19:5227−5232)。単一の遺伝子特異
的RACEプライマーが共通のプライマーと対合される場合、この単一の遺伝子
特異的プライマーとこの共通のプライマーとの間の配列の優先的な増幅が生じる
。RACEにおいて使用するために改変された市販のcDNAプールが利用可能
である。
The PCR method is used to amplify a member of the cDNA library containing the desired insert. In this case, the desired insert comprises the full-length cDNA-derived sequence corresponding to the polynucleotide of the invention. Such PCR methods include gene trap and RACE methods, such as those described in Gruber et al., WO 95/04745 and Gruber et al., US Pat. No. 5,500,356. The kit is, for example, Life Technology
es, Gaithersburg, Maryland, USA are commercially available for performing gene trap experiments. In a preferred embodiment of RACE, the common primer is designed to anneal to an optional adapter sequence linked to the ends of the cDNA (Apte and Siebert, Biotechni).
ques (1993) 15: 890-893: Edwards et al., Nuc. Ac
ids Res. (1991) 19: 5227-5232). When a single gene-specific RACE primer is paired with a common primer, preferential amplification of the sequence between this single gene-specific primer and this common primer occurs. Commercially available cDNA pools modified for use in RACE are available.

【0038】 遺伝子のプロモーター領域は、一般にRNAポリメラーゼIIについての開始
部位に対して5’側に位置される。数百のプロモーター領域は、変異に感受性で
ある、「TATA」ボックス(例えば、TATTAまたはTATAAの配列)を
含む。プロモーター領域は、遺伝子のコード領域からのプライマーを使用して5
’RACEを行うことによって得られ得る。あるいは、cDNAは、ゲノム配列
についてのプローブとして使用され得、そしてコード領域に対して5’側の領域
は、「ウォーキングアップ」によって同定される。遺伝子が高度に発現されるか
、または示差的に発現される場合、この遺伝子由来のプロモーターは、異種遺伝
子についての調節構築物において有用であり得る。
The promoter region of the gene is generally located 5'to the start site for RNA polymerase II. Several hundred promoter regions contain "TATA" boxes (eg, TATTA or TATAA sequences) that are susceptible to mutation. The promoter region uses a primer from the coding region of the gene
'Can be obtained by performing RACE. Alternatively, the cDNA can be used as a probe for genomic sequences, and the region 5'to the coding region is identified by "walking up." If the gene is highly or differentially expressed, promoters from this gene may be useful in regulatory constructs for heterologous genes.

【0039】 一旦、全長のcDNAまたは遺伝子が得られると、改変体をコードするDNA
は、部位特異的変異誘発によって調製され得る(Sambrookら、15.3
〜15.63において詳細に記載される)。置換されるコドンまたはヌクレオチ
ドの選択は、変化したタンパク質構造および/または機能を達成するためのアミ
ノ酸における任意の変化に関する本明細書中の開示に基づき得る。
Once the full-length cDNA or gene is obtained, the DNA encoding the variant
Can be prepared by site-directed mutagenesis (Sambrook et al., 15.3).
~ 15.63). The choice of codons or nucleotides to be replaced can be based on the disclosure herein regarding any changes in amino acids to achieve altered protein structure and / or function.

【0040】 生物学的材料からDNAまたはRNAを得る代替の方法として、本発明の1つ
以上のポリヌクレオチドの配列を有するヌクレオチドを含有する核酸が合成され
得る。従って、本発明は、核酸分子の15nt(配列番号1〜3351のうちの
1つの少なくとも15個連続するntに対応する)から1つ以上の生物学的操作
(複製および発現を含む)に適切な最大の長さにまでにわたる長さの核酸分子を
含む。本発明は、(a)完全な遺伝子のサイズを有し、かつ配列番号1〜335
1のうちの少なくとも1つを含む核酸;(b)融合タンパク質の発現を許容する
ように作動可能に連結される、少なくとも1つのさらなるポリヌクレオチドまた
は遺伝子もまた含む(a)の核酸;(c)(a)または(b)を含有する核酸ベ
クター;(d)(a)または(b)を含有するプラスミド;ならびに(e)(a
)または(b)を含有する組換えウイルス粒子を含むが、これらに限定されない
。一旦、本明細書中に開示されるポリヌクレオチドが提供されると、(a)〜(
e)の構築および調製は、十分に当該分野の技術の範囲内である。
As an alternative method of obtaining DNA or RNA from biological material, nucleic acids containing nucleotides having the sequence of one or more polynucleotides of the present invention can be synthesized. Accordingly, the present invention is suitable for 15 nt (corresponding to at least 15 consecutive nt of one of SEQ ID NOS: 1-3351) to one or more biological manipulations (including replication and expression) of nucleic acid molecules. It includes nucleic acid molecules of lengths up to the maximum length. The present invention provides (a) the complete gene size and SEQ ID NOs: 1-335.
A nucleic acid comprising at least one of 1; (b) a nucleic acid of (a) also comprising at least one additional polynucleotide or gene operably linked to allow expression of the fusion protein; (c) A nucleic acid vector containing (a) or (b); (d) a plasmid containing (a) or (b); and (e) (a
) Or (b) is included in the recombinant virus particle, but is not limited thereto. Once the polynucleotide disclosed herein is provided, (a)-(
The construction and preparation of e) is well within the skill of the art.

【0041】 配列番号1〜3351のうちの少なくともいずれか1つの少なくとも15個連
続するntを含有する核酸の配列、好ましくは配列番号1〜3351のうちの少
なくともいずれか1つの配列全体は、制限されず、そしてA、T、G、および/
もしくはC(DNAについて)、ならびにA、U、G、および/もしくはC(R
NAについて)、またはそれらの改変された塩基(イノシンおよびプソイドウラ
シルを含む)の任意の配列であり得る。配列の選択は、所望の機能に依存し、そ
して所望のコード領域、所望のイントロン様領域、および所望の調節領域によっ
て指示され得る。配列番号1〜3351のうちのいずれか1つの配列全体が核酸
内にある場合、得られる核酸は、本明細書中で、配列番号1〜3351のうちの
いずれか1つの配列を含むポリヌクレオチドといわれる。
The sequence of a nucleic acid containing at least 15 consecutive nts of at least one of SEQ ID NOs: 1-3351, preferably the entire sequence of at least any one of SEQ ID NOs: 1-3351 is restricted. , And A, T, G, and / or
Or C (for DNA), and A, U, G, and / or C (R
NA) or any of their modified bases, including inosine and pseudouracil. The choice of sequence depends on the desired function and can be dictated by the desired coding region, the desired intron-like region, and the desired regulatory region. If the entire sequence of any one of SEQ ID NOs: 1-3351 is within the nucleic acid, the resulting nucleic acid is referred to herein as a polynucleotide comprising the sequence of any one of SEQ ID NOs: 1-3351. Be seen.

【0042】 (全長cDNAまたは全長遺伝子によりコードされるポリペプチドの発現) 提供されるポリヌクレオチド(例えば、配列番号1〜3351のうちの1つの
配列を有するポリヌクレオチド)、対応するcDNA、または全長の遺伝子は、
部分的なまたは完全な遺伝子産物を発現するために使用される。配列番号1〜3
351の配列を有するポリヌクレオチドの構築物を、合成的に生成し得る。ある
いは、オリゴデオキシリボヌクレオチドの多数のメンバーに由来する遺伝子およ
びプラスミド全体の単工程アセンブリは、例えば、Stemmerら、Gene
(Amsterdam)(1995)164(1):49−53によって記載さ
れる。本方法において、アセンブリPCR(オリゴデオキシリボヌクレオチド(
オリゴ)の多数のメンバーに由来する長いDNA配列の合成)が記載される。こ
の方法は、DNAシャッフリング(Stemmer,Nature(1994)
370:389−391)に由来し、そしてDNAリガーゼに頼らないが、代わ
りにアッセンブリプロセスの間に、さらにより長いDNAフラグメントを構築す
るためのDNAポリメラーゼに頼る。
(Expression of Full-length cDNA or Polypeptide Encoded by Full-length Gene) A provided polynucleotide (eg, a polynucleotide having a sequence of one of SEQ ID NOs: 1-3351), a corresponding cDNA, or a full-length cDNA The gene is
Used to express a partial or complete gene product. Sequence number 1-3
A construct of a polynucleotide having the sequence of 351 can be produced synthetically. Alternatively, single-step assembly of genes and entire plasmids from multiple members of oligodeoxyribonucleotides is described, for example, in Stemmer et al., Gene.
(Amsterdam) (1995) 164 (1): 49-53. In this method, assembly PCR (oligodeoxyribonucleotide (
(Synthesis of long DNA sequences derived from multiple members of oligo). This method is based on DNA shuffling (Stemmer, Nature (1994).
370: 389-391) and do not rely on DNA ligase, but instead during the assembly process, rely on DNA polymerase to assemble even longer DNA fragments.

【0043】 適切なポリヌクレオチド構築物は、例えばSambrookら、Molecu
lar Cloning:A Laboratory Manual,第2版、
(1989)Cold Spring Harbor Press,Cold
Spring Harbor,NYに記載される標準的組換えDNA技術を使用
して、そしてUnited States Dept.of HHS,Nati
onal Institute of Health(NIH)Guideli
nes for Recombinant DNA Researchに記載さ
れるような現行の規則の下で、精製される。本発明のポリヌクレオチドによりコ
ードされる遺伝子産物は、任意の発現系(例えば、細菌、酵母、昆虫、両生類お
よび哺乳動物系を含む)において発現される。ベクター、宿主細胞、およびこれ
らにおける発現を得るための方法は、当該分野で周知である。適切なベクターお
よび宿主細胞は、米国特許第5,654,173号に記載される。
Suitable polynucleotide constructs are described, for example, in Sambrook et al., Molcu.
lar Cloning: A Laboratory Manual, 2nd Edition,
(1989) Cold Spring Harbor Press, Cold
Using standard recombinant DNA techniques described in Spring Harbor, NY, and in the United States Dept. of HHS, Nati
onal Institute of Health (NIH) Guideli
Purified under current rules as described in nes for Recombinant DNA Research. The gene product encoded by the polynucleotide of the present invention is expressed in any expression system, including, for example, bacterial, yeast, insect, amphibian and mammalian systems. Vectors, host cells, and methods for obtaining expression in these are well known in the art. Suitable vectors and host cells are described in US Pat. No. 5,654,173.

【0044】 本明細書に提供されるポリヌクレオチド配列を含むポリヌクレオチド分子は、
一般に、ベクター中にこの分子を配置することによって増殖される。ウイルスお
よび非ウイルスベクター(プラスミドを含む)が使用される。プラスミドの選択
は、増殖が所望される細胞の型および増殖の目的に依存する。特定のベクターが
、大量の所望のDNA配列を増幅および作製するために有用である。他のベクタ
ーは、培養中の細胞における発現に適切である。さらなる他のベクターは、動物
全体またはヒトにおける細胞中での転移および発現のために適切である。適切な
ベクターの選択は、十分に当該分野の技術の範囲内である。多くのこのようなベ
クターは、市販されている。所望の配列を含むベクターを調製するための方法は
、当該分野で周知である。
A polynucleotide molecule comprising a polynucleotide sequence provided herein,
Generally, it is propagated by placing the molecule in a vector. Viral and non-viral vectors (including plasmids) are used. The choice of plasmid depends on the type of cell in which it is desired to grow and the purpose of growth. Certain vectors are useful for amplifying and producing large amounts of the desired DNA sequence. Other vectors are suitable for expression in cells in culture. Still other vectors are suitable for transfer and expression in cells in whole animals or humans. Selection of the appropriate vector is well within the skill of the art. Many such vectors are commercially available. Methods for preparing vectors containing the desired sequence are well known in the art.

【0045】 配列番号1〜3351に記載のポリヌクレオチドまたはそれらの対応する全長
ポリヌクレオチドは、所望の発現特性を得るのに適切なように、調節配列に連結
される。これらは、プロモーター(センス鎖の5’末端またはアンチセンス鎖の
3’末端のいずれかで付着される)、エンハンサー、ターミネーター、オペレー
ター、リプレッサー、およびインデューサーを含み得る。プロモーターは、調節
され得るか、または構成性であり得る。いくつかの状況では、条件的活性プロモ
ーター(例えば、組織特異的または発生ステージ特異的なプロモーター)を使用
することが望まれ得る。これらは、ベクターへの連結について上述した技術を使
用して、所望のヌクレオチド配列に連結される。当該分野で公知の任意の技術が
用いられ得る。
The polynucleotides set forth in SEQ ID NOs: 1-3351, or their corresponding full-length polynucleotides, are linked to regulatory sequences as appropriate to obtain the desired expression characteristics. These can include promoters (attached at either the 5'end of the sense strand or the 3'end of the antisense strand), enhancers, terminators, operators, repressors, and inducers. The promoter can be regulated or constitutive. In some situations, it may be desirable to use conditionally active promoters, such as tissue-specific or developmental stage-specific promoters. These are ligated to the desired nucleotide sequence using the techniques described above for ligation into vectors. Any technique known in the art can be used.

【0046】 任意の適切な宿主細胞または生物が、本発明のポリヌクレオチドまたは核酸を
複製し、そして/または発現させるために用いられる場合、得られた複製された
核酸、RNA、発現されたタンパク質またはポリペプチドは、その宿主細胞また
は生物の産物として、本発明の範囲内にある。この産物は、当該分野で公知の任
意の適切な手段によって回収される。
When any suitable host cell or organism is used to replicate and / or express a polynucleotide or nucleic acid of the invention, the resulting replicated nucleic acid, RNA, expressed protein or Polypeptides are within the scope of this invention as the product of their host cells or organisms. The product is recovered by any suitable means known in the art.

【0047】 選択されたポリヌクレオチドに対応する遺伝子がいったん同定されると、その
発現は、その遺伝子がネイティブである細胞において調節され得る。例えば、細
胞の内因性遺伝子は、米国特許第5,641,670号に開示されるように外因
性調節配列によって調節され得る。
Once the gene corresponding to the selected polynucleotide is identified, its expression can be regulated in cells in which the gene is native. For example, a cell's endogenous genes can be regulated by exogenous regulatory sequences as disclosed in US Pat. No. 5,641,670.

【0048】 (新規遺伝子の機能的および構造的なモチーフの同定) 提供されたポリヌクレオチド、cDNA、または完全遺伝子のヌクレオチド配
列の翻訳が、個々の公知配列と整列され得る。個別配列との類似性が、本発明の
ポリヌクレオチドによってコードされるポリペプチドの活性を決定するために使
用され得る。また、1つより多い個別配列との類似性を呈示する配列は、個別配
列のいずれか、または両方に特徴的な活性を呈示し得る。
Identification of Functional and Structural Motif of Novel Genes Translation of the nucleotide sequence of a provided polynucleotide, cDNA, or complete gene can be aligned with individual known sequences. Similarity to individual sequences can be used to determine the activity of the polypeptide encoded by the polynucleotide of the invention. Also, a sequence exhibiting similarity to more than one individual sequence may exhibit activity characteristic of either or both of the individual sequences.

【0049】 最も近縁のもののポリヌクレオチド配列の全長配列およびフラグメントは、提
供されたポリヌクレオチドに対応する全長配列を同定し、そして単離するための
プローブおよびプライマーとして使用され得る。最も近縁のものは、提供された
ポリヌクレオチドに対応する全長配列についてのライブラリーを構築するために
使用するための組織または細胞型を示し得る。
The full-length sequences and fragments of the closest polynucleotide sequences can be used as probes and primers to identify and isolate full-length sequences corresponding to the provided polynucleotides. The closest one may indicate the tissue or cell type to use to construct the library for the full length sequence corresponding to the provided polynucleotide.

【0050】 代表的には、選択されたポリヌクレオチドは、個別配列との最良の整列を決定
するために、6つ全てのフレームで翻訳される。配列表において本明細書中に開
示される配列は、5’から3’への方向であり、そして3つのフレームでの翻訳
は十分であり得る。これらのアミノ酸配列を、一般に、問い合わせ配列と称し、
これは、個別配列と整列される。個別配列を有するデータベースは、「Comp
uter Methods for Macromolecular Sequ
ence Analysis」 Methods in Enzymology
(1996)266、Doolittle、Academic Press,I
nc.a division of Harcourt Brace & Co
.,San Diego、California、USAに記載される。データ
ベースとしては、Genbank、EMBL、およびDNA Database
of Japan(DDBJ)が挙げられる。
[0050] Typically, the selected polynucleotides are translated in all 6 frames to determine the best alignment with the individual sequences. The sequences disclosed herein in the sequence listing are in the 5'to 3'direction and translation in 3 frames may be sufficient. These amino acid sequences are commonly referred to as query sequences,
This is aligned with the individual sequence. The database with individual sequences is "Comp
uter Methods for Macromolecular Seque
ence Analysis ”Methods in Enzymology
(1996) 266, Doolittle, Academic Press, I.
nc. a division of Harcourt Brace & Co
. , San Diego, California, USA. Databases include Genbank, EMBL, and DNA Database.
of Japan (DDBJ).

【0051】 問い合わせ配列および個別配列は、上記の方法およびコンピュータープログラ
ムを用いて整列され得、そしてBLAST(http://www.ncbi. nlm.nhi.gov/BLAST のワールドワイドウェブで利用可能)を含
む。別の整列アルゴリズムは、Fasta(Genetics Computi
ng Group(GCG)パッケージで利用可能、Madison、Wisc
onsin、USA、Oxford Molecular Group、Inc
.の完全所有子会社)である。整列のための他の技術は、Doolittle、
前出、に記載される。好ましくは、配列中のギャップを可能にする整列プログラ
ムが、配列を整列させるために利用される。Smith−Watermanは、
配列整列中のギャップを可能にするアルゴリズムの1つのタイプである。Met
h.Mol.Biol.(1997)70:173−187を参照のこと。また
、NeedlemanおよびWunsch整列法を用いるGAPプログラムが、
配列を整列させるために利用され得る。代替の検索ストラテジーは、MASPA
Rコンピューターで実行するMPSRCHソフトウェアを使用する。MPSRC
Hは、大規模並行コンピューターにおいて配列をスコア付けするためにSmit
h−Watermanアルゴリズムを使用する。このアプローチは、かすかに関
連付けする適合である配列を同定する能力を改善し、そして小さなギャップおよ
びヌクレオチド配列誤差に特に寛容である。提供されたポリヌクレオチドによっ
てコードされるアミノ酸配列は、タンパク質データベースおよびDNAデータベ
ースの両方を検索するために使用され得る。
The query sequence and individual sequences can be aligned using the above methods and computer programs, and BLAST: a (http //www.ncbi available in nlm.nhi.gov/BLAST of the World Wide Web.) Including. Another alignment algorithm is Fasta (Genetics Computi).
Available in ng Group (GCG) package, Madison, Wisc
onsin, USA, Oxford Molecular Group, Inc.
. Is a wholly owned subsidiary). Other techniques for alignment are Doolittle,
As described above. Preferably, alignment programs that allow gaps in the sequences are utilized to align the sequences. Smith-Waterman is
It is one type of algorithm that allows for gaps in sequence alignments. Met
h. Mol. Biol. (1997) 70: 173-187. Also, a GAP program using the Needleman and Wunsch alignment method
It can be used to align sequences. An alternative search strategy is MASPA
MPSRCH software running on an R computer is used. MPSRC
Hmit Smit to score sequences on a massively parallel computer.
Use the h-Waterman algorithm. This approach improves the ability to identify sequences that are faintly related matches and is particularly tolerant of small gaps and nucleotide sequence errors. The amino acid sequence encoded by the provided polynucleotide can be used to search both protein and DNA databases.

【0052】 (高類似性)一般に、高類似性であるとみなされる整列の結果では、整列領域
長のパーセントは、問い合わせ配列の全長の、代表的には、少なくとも約55%
;より代表的には、少なくとも約58%;さらにより代表的には、問い合わせ配
列の全残基長の少なくとも約60%である。通常、整列領域の長さのパーセント
は、約62%程度の多さ;より通常には、約64%程度の多さ;さらにより通常
には、約66%程度の多さであり得る。さらに、高類似性について、整列領域は
、代表的には、少なくとも約75%の配列同一性;より代表的には、少なくとも
約78%;よりさらに代表的には、少なくとも約80%の配列同一性を示す。通
常、配列同一性パーセントは、約82%程度の多さ;より通常には、約84%程
度の多さ;ずっとより通常には、約86%程度の多さであり得る。
High Similarity Generally, as a result of alignments considered to be high similarities, the percentage of alignment region length is typically at least about 55% of the total length of the query sequence.
More typically at least about 58%; even more typically at least about 60% of the total residue length of the query sequence. Typically, the percent of alignment region length can be as high as about 62%; more usually as high as about 64%; and even more usually as high as about 66%. Further, for high similarities, the alignment regions typically have at least about 75% sequence identity; more typically at least about 78%; even more typically at least about 80% sequence identity. Shows sex. Usually, percent sequence identity can be as high as about 82%; more usually as high as about 84%; much more usually as high as about 86%.

【0053】 p値は、これらの方法と併用して使用される。高い類似性が見出された場合、
p値が約10-2以下であり;より通常には、約10-3以下であり;さらにより通
常には、約10-4以下である場合、問い合わせ配列は、プロフィール配列と高い
類似性を有するとみなされる。より代表的には、問い合わせ配列が類似性が高い
とみなされるには、p値は、約10-5を超えず;より代表的には、約10-10
下であり;さらにより代表的には、約10-15以下である。
The p-value is used in conjunction with these methods. If a high degree of similarity is found,
If the p-value is less than about 10 -2 ; more usually less than about 10 -3 ; even more usually less than about 10 -4 , the query sequence has a high degree of similarity to the profile sequence. Is considered to have. More typically, the p-values are not more than about 10 −5 ; more typically about 10 −10 or less; even more typically Is about 10 −15 or less.

【0054】 (配列同一性のみにより決定された類似性)配列同一性は、単独で、個別配列
に対する問い合わせ配列の類似性を決定するために使用され得、そして配列の活
性を示し得る。このような整列は、好ましくは、配列を整列するためにギャップ
を許容する。代表的には、問い合わせ配列は、問い合わせ配列全体にわたる配列
同一性が、少なくとも約15%;より代表的には、少なくとも約20%;さらに
より代表的には、少なくとも約25%;さらにより代表的には、少なくとも約5
0%である場合、プロフィール配列に関連する。配列同一性は、単独で、問い合
わせ配列が、通常、少なくとも80残基長;より通常には90残基;よりさらに
通常には、少なくとも95アミノ酸残基長であるとき、類似性の尺度として、最
も有用である。より代表的には、問い合わせ配列が、好ましくは100残基長;
より好ましくは120残基長;よりさらに好ましくは、150アミノ酸残基長で
あるとき、配列同一性のみに基づいて、類似性が決定され得る。
Similarity Determined by Sequence Identity Only Sequence identity can be used alone to determine the similarity of a query sequence to an individual sequence and can be indicative of sequence activity. Such alignments preferably allow gaps to align the sequences. Typically, the query sequence has at least about 15% sequence identity over the query sequence; more typically at least about 20%; even more typically at least about 25%; Has at least about 5
0% is associated with the profile sequence. Sequence identity, alone, is a measure of similarity when the query sequence is usually at least 80 residues long; more usually 90 residues; even more usually at least 95 amino acid residues long. Most useful. More typically, the query sequence is preferably 100 residues long;
Similarity can be determined based solely on sequence identity when more preferably 120 residues long; even more preferably 150 amino acid residues long.

【0055】 (プロフィールおよび多重整列配列との整列)提供されたポリヌクレオチドの
翻訳は、タンパク質ファミリーまたは共通モチーフのいずれかを規定するアミノ
酸プロフィールと整列され得る。また、提供されたポリヌクレオチドの翻訳は、
タンパク質ファミリーまたはモチーフのメンバーのポリペプチド配列を含む多重
配列整列(MSA)に対して整列され得る。プロフィール配列またはMSAとの
類似性または同一性は、提供されたポリヌクレオチドまたは対応するcDNAも
しくは遺伝子によりコードされた遺伝子産物(例えば、ポリペプチド)の活性を
決定するために使用され得る。例えば、ケモカインプロフィールまたはMSAと
の同一性または類似性を示す配列は、ケモカイン活性を示し得る。
Profiles and Alignment with Multiple Aligned Sequences Translations of the provided polynucleotides can be aligned with amino acid profiles that define either protein families or common motifs. In addition, the translation of the provided polynucleotide,
It can be aligned to a multiple sequence alignment (MSA) that includes polypeptide sequences of protein family or motif members. Similarity or identity to the profile sequence or MSA can be used to determine the activity of the gene product (eg, polypeptide) encoded by the provided polynucleotide or the corresponding cDNA or gene. For example, a sequence showing identity or similarity to a chemokine profile or MSA may exhibit chemokine activity.

【0056】 プロフィールは、(1)MSA(ファミリーに属するメンバーのアミノ酸配列
の整列である)を作製し、そして(2)整列の統計的表示を作成することによっ
て、手動で設計され得る。このような方法は、例えば、Birneyら、Nuc
l.Acid Res.(1996)24(14):2730−2739におい
て記載される。いくつかのタンパク質ファミリーおよびモチーフのMSAは、公
的に入手可能である。MSAは、Sonnhammerら、Proteins(
1997)28:405−420にも記載される。これらのMSAの簡単な説明
は、Pascarellaら、Prot.Eng.(1996)9(3):24
9−251に報告されている。MSAからのプロフィール構築のための技術は、
Sonnhammerら(前出);Birneyら(前出);および「Comp
uter Methods for Macromolecular Sequ
ence Analysis」,Methods in Enzymology
(1996)266、Doolittle、Academic Press,I
nc.,San Diego、California、USAに記載されている
Profiles can be manually designed by creating (1) MSA, which is an alignment of amino acid sequences of members of the family, and (2) creating a statistical representation of the alignment. Such methods are described, for example, in Birney et al., Nuc.
l. Acid Res. (1996) 24 (14): 2730-2739. MSAs for several protein families and motifs are publicly available. MSA is reviewed by Sonnhammer et al., Proteins (
1997) 28: 405-420. A brief description of these MSAs can be found in Pascarella et al., Prot. Eng. (1996) 9 (3): 24
9-251. The technology for profile construction from MSA is
Sonnhammer et al. (Supra); Birney et al. (Supra); and Comp.
uter Methods for Macromolecular Seque
ence Analysis ", Methods in Enzymology
(1996) 266, Doolittle, Academic Press, I.
nc. , San Diego, California, USA.

【0057】 問い合わせ配列とタンパク質ファミリーまたはモチーフとの間の類似性は、(
a)プロフィールに対して問い合わせ配列を比較することおよび/または(b)
問い合わせ配列をファミリーもしくはモチーフのメンバーと整列することによっ
て決定され得る。代表的には、Searchwiseのようなプログラムは、問
い合わせ配列を、複数整列(プロフィールとしてもまた公知である(Birne
yら(前出)を参照のこと))の統計的表現と比較するために使用される。配列
とプロフィールとを比較するための他の技術は、Sonnhammerら(前出
)およびDoolittle(前出)において記載される。
Similarities between query sequences and protein families or motifs are (
a) comparing the query sequence to the profile and / or (b)
It can be determined by aligning the query sequence with family or motif members. Typically, programs such as Searchwise allow query sequences to be aligned in multiples (also known as profiles (Birne.
y et al. (supra)))). Other techniques for comparing sequences and profiles are described in Sonnhammer et al. (Supra) and Doolittle (supra).

【0058】 次に、Fengら、J.Mol.Evol.(1987)25:351および
Higginsら、CABIOS(1989)5:151により記載された方法
が、問い合わせ配列をファミリーもしくはモチーフのメンバー(MSAとしても
また公知である)と整列させるために使用され得る。配列整列は、種々のソフト
ウェアツールのいずれを使用しても生成され得る。例としては、PileUpが
挙げられ、これは、複数配列整列を作製し、そしてFengら、J.Mol.E
vol.(1987)25:351に記載される。別の方法(GAP)は、Ne
edlemanら、J.Mol.Biol.(1970)48:443の整列方
法を使用する。GAPは、配列の全体的な整列に最も適している。3番目の方法
(BastFit)は、Smithら、Adv.Appl.Math(1981
)2:482の局所的相同性アルゴリズムを使用して、適合の数を最大化するよ
うにギャップを挿入することによって、機能する。一般に、以下の要因が、問い
合わせ配列とプロフィールまたはMSAと間に類似性が存在するか否かを決定す
るために使用される:(1)問い合わせ配列中に見出された保存された残基の数
、(2)問い合わせ配列中に見出された保存された残基のパーセント、(3)フ
レームシフトの数、および(4)保存された残基間の間隔。
Next, Feng et al. Mol. Evol. (1987) 25: 351 and Higgins et al., CABIOS (1989) 5: 151 can be used to align a query sequence with a family or motif member (also known as MSA). Sequence alignments can be generated using any of a variety of software tools. Examples include PileUp, which creates multiple sequence alignments and is described by Feng et al. Mol. E
vol. (1987) 25: 351. Another method (GAP) is Ne
edleman et al. Mol. Biol. (1970) 48: 443. GAP is best suited for global alignment of sequences. The third method (BastFit) is described by Smith et al., Adv. Appl. Math (1981
) It works by using the 2: 482 local homology algorithm and inserting gaps to maximize the number of matches. Generally, the following factors are used to determine whether there are similarities between the query sequence and the profile or MSA: (1) Conserved residues found in the query sequence. Number, (2) percent of conserved residues found in the query sequence, (3) number of frameshifts, and (4) spacing between conserved residues.

【0059】 配列を翻訳しそして整列することの両方を行ういくつかの整列プログラムは、
最良の整列を作製するために、ヌクレオチド配列を翻訳する場合、かなり多数の
フレームシフトを作製し得る。整列を作製するために必要とされるフレームシフ
トが少ないほど、問い合わせとプロフィールまたはMSAとの間の類似性または
同一性はより強くなる。例えば、フレームシフトなしから得られる弱い類似性は
、2つのフレームシフトから得られる強い類似性よりも良い、問い合わせ配列の
活性または構造の指標であり得る。好ましくは、3以下のフレームシフトが整列
において見出され;より好ましくは、2以下のフレームシフトが;さらにより好
ましくは、1つ以下のフレームシフトが;なお好ましくは、フレームシフトのな
いことが、問い合わせとプロフィールまたはMSAとの整列において見出される
Some alignment programs that both translate and align sequences are:
When translating the nucleotide sequences to produce the best alignment, a large number of frameshifts may be produced. The fewer frameshifts needed to create an alignment, the stronger the similarity or identity between the query and the profile or MSA. For example, the weak similarity obtained without frameshifting may be a better indicator of the activity or structure of the query sequence than the strong similarity obtained with two frameshifts. Preferably, no more than 3 frameshifts are found in the alignment; more preferably no more than 2 frameshifts; even more preferably no more than 1 frameshift; even more preferably no frameshifts, Found in the alignment of the query with the profile or MSA.

【0060】 保存された残基は、ファミリーまたはモチーフメンバーの全てまたはいくつか
において、特定の位置で見出されるアミノ酸である。あるいは、特定のクラスの
アミノ酸だけが、ファミリーのメンバーの全てまたはいくつかにおいて、特定の
位置で見出される場合、位置は、保存されたと考えられる。例えば、N末端の位
置は、リジン、アルギニン、またはヒスチジンのような正に荷電したアミノ酸を
含み得る。
Conserved residues are amino acids found at specific positions in all or some of the family or motif members. Alternatively, a position is considered conserved if only a particular class of amino acids is found at that particular position in all or some of the members of the family. For example, the N-terminal position can include a positively charged amino acid such as lysine, arginine, or histidine.

【0061】 代表的には、ポリペプチドの残基は、アミノ酸のあるクラスまたは単一のアミ
ノ酸が、特定の位置において、全てのクラスのメンバーの少なくとも約40%;
より代表的には、少なくとも約50%;なおより代表的には、メンバーの少なく
とも約60%で見出される場合、保存されている。通常、あるクラスまたは単一
のアミノ酸が、ファミリーまたはモチーフのメンバーの少なくとも約70%;よ
り通常には、少なくとも約80%;なおより通常には、少なくとも約90%;さ
らにより通常には、少なくとも約95%で見出される場合、残基は、保存されて
いる。
Typically, the residues of a polypeptide are such that a class of amino acids or a single amino acid is at least about 40% of all class members at a particular position;
More typically, at least about 50%; and even more typically, conserved if found in at least about 60% of the members. Usually, a class or single amino acid is at least about 70% of members of a family or motif; more usually at least about 80%; even more usually at least about 90%; even more usually at least Residues are conserved if found in about 95%.

【0062】 3つの関連していないアミノ酸;より通常には、2つの関連していないアミノ
酸が、メンバーのいくつかまたは全てにおける、特定の位置で見出される場合、
残基は保存されていると考えられる。関連していないアミノ酸が、あるクラスの
全てのメンバーの少なくとも約40%;より代表的には、少なくとも約50%;
なおより代表的には、メンバーの少なくとも約60%で、特定の位置で見出され
る場合、これらの残基は、保存されている。通常、あるクラスまたは単一のアミ
ノ酸が、あるファミリーまたはモチーフのメンバーの少なくとも約70%;より
通常には、少なくとも約80%;なおより通常には、少なくとも約90%;なお
より通常には、少なくとも約95%で見出される場合、残基は、保存されている
Three unrelated amino acids; more usually, two unrelated amino acids are found at a particular position in some or all of the members:
The residues are considered to be conserved. Unrelated amino acids are at least about 40% of all members of a class; more typically at least about 50%;
Even more typically, these residues are conserved if found in a particular position in at least about 60% of the members. Usually, a class or single amino acid is at least about 70% of members of a family or motif; more usually at least about 80%; even more usually at least about 90%; even more usually Residues are conserved if found in at least about 95%.

【0063】 問い合わせ配列が、プロフィールまたはMSAの保存された残基の少なくとも
約25%;より通常には、少なくとも約30%;なおより通常には、少なくとも
約40%を含む場合、問い合わせ配列は、プロフィールまたはMSAとの類似性
を有する。代表的には、問い合わせ配列が、プロフィールまたはMSAの保存さ
れた残基の少なくとも約45%;より代表的には、少なくとも約50%;なおよ
り代表的には、少なくとも約55%を含む場合、問い合わせ配列は、プロフィー
ル配列またはMSAとのより強い類似性を有する。
If the query sequence comprises at least about 25% of conserved residues of the profile or MSA; more usually at least about 30%; even more usually at least about 40%, then the query sequence is: It has similarities to the profile or MSA. Typically, the query sequence comprises at least about 45% of the conserved residues of the profile or MSA; more typically at least about 50%; even more typically at least about 55%, The query sequence has a stronger similarity to the profile sequence or MSA.

【0064】 (分泌ポリペプチドおよび膜結合ポリペプチドの同定) 本発明の分泌ポリペプチドおよび膜結合ポリペプチドの両方は、特に興味深い
ものである。例えば、分泌ポリペプチドのレベルは、都合よい体液(例えば、血
液、血漿、血清、および尿、前立腺液および精液のような他の体液)中でアッセ
イされ得る。膜結合ポリペプチドは、ワクチン抗原を構築するために、または免
疫応答を誘導するために有用である。このような抗原は、膜結合ポリペプチドの
細胞外領域のすべてまたは一部を含む。分泌ポリペプチドおよび膜結合ポリペプ
チドの両方が、連続した疎水性アミノ酸のフラグメントを含むので、疎水性予測
アルゴリズムが、このようなポリペプチドを同定するために使用され得る。
Identification of Secreted and Membrane Bound Polypeptides Both the secreted and membrane bound polypeptides of the invention are of particular interest. For example, levels of secreted polypeptides can be assayed in convenient body fluids, such as blood, plasma, serum, and other body fluids such as urine, prostatic fluid and semen. Membrane-bound polypeptides are useful for constructing vaccine antigens or for inducing an immune response. Such antigens include all or part of the extracellular region of the membrane bound polypeptide. Since both secreted and membrane-bound polypeptides contain contiguous fragments of hydrophobic amino acids, hydrophobicity prediction algorithms can be used to identify such polypeptides.

【0065】 シグナル配列は、通常、分泌ポリペプチド遺伝子および膜結合ポリペプチド遺
伝子の両方によってコードされ、細胞の表面にポリペプチドを指向させる。シグ
ナル配列は、通常、疎水性残基のストレッチを含む。このようなシグナル配列は
、ヘリックス構造に折り畳まれ得る。膜結合ポリペプチドは、代表的には、膜を
横断し得る疎水性アミノ酸のストレッチを有する、少なくとも1つの膜貫通領域
を含む。いくつかの膜貫通領域もまた、ヘリックス構造を示す。ポリペプチド内
部の疎水性フラグメントは、コンピューターアルゴリズムを使用することによっ
て同定され得る。このようなアルゴリズムは、HoppおよびWoods、Pr
oc.Natl.Acad.Sci.USA(1981)78:3824−38
28;KyteおよびDoolittle、J.Mol.Biol.(1982
)157:105〜132;ならびにRAOARアルゴリズム、Degli E
spostiら、Eur.J.Biochem.(1990)190:207−
219を含む。
Signal sequences are usually encoded by both secreted and membrane-bound polypeptide genes and direct the polypeptide to the surface of the cell. Signal sequences usually include stretches of hydrophobic residues. Such a signal sequence can be folded into a helix structure. Membrane-bound polypeptides typically include at least one transmembrane region with a stretch of hydrophobic amino acids that can cross the membrane. Some transmembrane regions also show helix structures. Hydrophobic fragments within a polypeptide can be identified by using computer algorithms. Such algorithms are described in Hopp and Woods, Pr.
oc. Natl. Acad. Sci. USA (1981) 78: 3824-38.
28; Kyte and Doolittle, J. et al. Mol. Biol. (1982
) 157: 105-132; and RAOAR algorithm, Degli E.
sposti et al., Eur. J. Biochem. (1990) 190: 207-
219 is included.

【0066】 分泌ポリペプチドおよび膜結合ポリペプチドを同定する別の方法は、本発明の
ポリヌクレオチドを、6つ全てのフレームで翻訳すること、および少なくとも8
連続した疎水性アミノ酸が存在するかどうかを決定することである。少なくとも
8;より代表的には10;さらにより代表的には12連続した疎水性アミノ酸を
有する翻訳されたポリペプチドは、推定の分泌ポリペプチドまたは膜結合ポリペ
プチドのいずれかであるとみなされる。疎水性アミノ酸としては、アラニン、グ
リシン、ヒスチジン、イソロイシン、ロイシン、リジン、メチオニン、フェニル
アラニン、プロリン、スレオニン、トリプトファン、チロシン、およびバリンが
挙げられる。
Another method of identifying secreted and membrane bound polypeptides is to translate the polynucleotides of the invention in all 6 frames, and at least 8
To determine if there are consecutive hydrophobic amino acids. A translated polypeptide having at least 8; more typically 10; and even more typically 12 contiguous hydrophobic amino acids is considered to be either a putative secreted polypeptide or a membrane-bound polypeptide. Hydrophobic amino acids include alanine, glycine, histidine, isoleucine, leucine, lysine, methionine, phenylalanine, proline, threonine, tryptophan, tyrosine, and valine.

【0067】 (全長遺伝子の発現産物の機能の同定) リボザイム、アンチセンス構築物、およびドミナントネガティブ変異体は、本
明細書中で提供されるポリヌクレオチドに対応する遺伝子の発現産物の機能を決
定するために使用され得る。オリゴヌクレオチド合成のホスホルアミダイト法は
、アンチセンス分子およびリボザイムを構築するために使用され得る。Beau
cageら、Tet.Lett.(1981)22:1859および米国特許第
4,668,777号を参照のこと。自動合成デバイスは、この化学を使用して
オリゴヌクレオチドを作製するために利用可能である。このようなデバイスの例
としては、Applied Biosystems、a division o
f Perkin−Elmer Corp.、Foster City、Cal
ifornia、USAのBiosearch 8600、392型および39
4型;ならびにPerceptive Biosystems、Framing
ham、Massachusetts、USAのExpediteが挙げられる
。合成RNA、リン酸アナログオリゴヌクレオチド、および化学的に誘導体化し
たオリゴヌクレオチドもまた産生され得、そして他の分子に共有結合され得る。
RNAオリゴヌクレオチドは、例えば、RNAホスホルアミダイトを使用して合
成され得る。この方法は、自動合成機(例えば、Applied Biosys
tems、392型および394型、Foster City、Califor
nia、USA)で行われ得る。
Identification of Function of Expression Product of Full Length Gene Ribozymes, antisense constructs, and dominant negative mutants are used to determine the function of expression products of genes corresponding to the polynucleotides provided herein. Can be used for. The phosphoramidite method of oligonucleotide synthesis can be used to construct antisense molecules and ribozymes. Beau
Cage et al., Tet. Lett. (1981) 22: 1859 and U.S. Pat. No. 4,668,777. Automated synthesis devices are available to make oligonucleotides using this chemistry. Examples of such devices include Applied Biosystems, a division o.
f Perkin-Elmer Corp. , Foster City, Cal
Biosearch 8600, Type 392 and 39 from Ifornia, USA
Type 4; and Perceptive Biosystems, Framing
ham, Massachusetts, and Expedite of USA. Synthetic RNA, phosphate analog oligonucleotides, and chemically derivatized oligonucleotides can also be produced and covalently linked to other molecules.
RNA oligonucleotides can be synthesized, for example, using RNA phosphoramidites. This method is based on an automated synthesizer (eg, Applied Biosys).
tems, types 392 and 394, Foster City, California
nia, USA).

【0068】 200ヌクレオチドまでの、より代表的に100ヌクレオチド、より代表的に
50ヌクレオチドまでの;さらにより代表的に30〜40ヌクレオチドのオリゴ
ヌクレオチドが合成され得る。これらの合成フラグメントは、より大きなフラグ
メントを構築するためにアニールされ得、そして一緒に連結され得る。例えば、
Sambrookら、前出を参照のこと。トランス切断化触媒RNA(リボザイ
ム)は、エンドリボヌクレアーゼ活性を保有するRNA分子である。リボザイム
は、特定の標的に対して特異的に設計され、そして標的メッセージは特異的なヌ
クレオチド配列を含まなければならない。これらは、細胞性RNAの背景におい
て、任意のRNA種を部位特異的に切断するように操作される。切断事象は、m
RNAを不安定にし、そしてタンパク質発現を妨げる。重要なことに、リボザイ
ムは、インビトロまたはインビボの状況における機能未知の遺伝子の機能を表現
型効果を検出することによって決定する目的のため、機能未知の遺伝子の発現を
阻害するために使用され得る。
Oligonucleotides of up to 200 nucleotides, more typically 100 nucleotides, more typically up to 50 nucleotides; even more typically 30-40 nucleotides can be synthesized. These synthetic fragments can be annealed and ligated together to build larger fragments. For example,
See Sambrook et al., Supra. Trans-cleaving catalytic RNA (ribozyme) is an RNA molecule that possesses endoribonuclease activity. Ribozymes are designed specifically for a particular target, and the target message must contain a specific nucleotide sequence. They are engineered to cleave any RNA species site-specifically in the background of cellular RNA. The disconnection event is m
It destabilizes RNA and prevents protein expression. Importantly, ribozymes can be used to inhibit the expression of genes of unknown function for the purpose of determining the function of genes of unknown function in in vitro or in vivo situations by detecting phenotypic effects.

【0069】 アンチセンス核酸はRNAに特異的に結合するように設計され、これによって
DNA複製、逆転写、またはメッセンジャーRNA翻訳の阻止を伴う、RNA−
DNAハイブリッドまたはRNA−RNAハイブリッドの形成を生じる。選択さ
れたポリヌクレオチド配列に基づくアンチセンスポリヌクレオチドは、対応する
遺伝子の発現を妨害し得る。アンチセンスポリヌクレオチドは、代表的には、転
写された鎖としてのアンチセンス鎖を含むアンチセンス構築物からの発現によっ
て、細胞内で生成される。開示されたポリヌクレオチドに基づくアンチセンスポ
リヌクレオチドは、アンチセンスポリヌクレオチドに相補的な配列を含むmRN
Aに結合し、そして/またはそのmRNAの翻訳を妨害する。コントロール細胞
の発現産物とアンチセンス構築物で処理した細胞の発現産物とは、アンチセンス
構築物が基づくところのポリヌクレオチドに対応する遺伝子のタンパク質産物を
検出するために比較される。このタンパク質は、慣用的な生化学的方法を用いて
、単離および同定される。
Antisense nucleic acids are designed to bind specifically to RNA, thereby involving RNA-, which involves the inhibition of DNA replication, reverse transcription, or messenger RNA translation.
This results in the formation of DNA hybrids or RNA-RNA hybrids. Antisense polynucleotides based on the selected polynucleotide sequence may interfere with expression of the corresponding gene. Antisense polynucleotides are typically produced intracellularly by expression from an antisense construct containing the antisense strand as the transcribed strand. Antisense polynucleotides based on the disclosed polynucleotides include an mRN containing a sequence complementary to the antisense polynucleotide.
Binds to A and / or interferes with translation of its mRNA. The expression product of control cells and the expression product of cells treated with the antisense construct are compared to detect the protein product of the gene corresponding to the polynucleotide on which the antisense construct is based. The protein is isolated and identified using conventional biochemical methods.

【0070】 アンチセンス治療における広範な背景の文献および臨床的な経験を考えると、
当業者は、さらなる潜在的な治療剤として本発明の選択されたポリヌクレオチド
を使用し得る。ポリヌクレオチドの選択は、癌性の細胞のゲノムの「ホットスポ
ット」領域に結合することについてそれらを最初に試験することによって狭めら
れ得る。ポリヌクレオチドが「ホットスポット」に結合すると同定される場合、
対応する癌細胞中のアンチセンス化合物としてのポリヌクレオチドを試験するこ
とは、正当化される。
Given the extensive background literature and clinical experience in antisense therapy,
One of ordinary skill in the art can use the selected polynucleotides of the invention as additional potential therapeutic agents. The choice of polynucleotides can be narrowed by first testing them for binding to "hot spot" regions of the cancerous cell's genome. If the polynucleotide is identified as binding to a "hot spot",
Testing the polynucleotides as antisense compounds in corresponding cancer cells is justified.

【0071】 ホモマルチマーとして活性な対応するタンパク質についてのドミナントネガテ
ィブ変異もまた容易に生成される。変異体ポリペプチドは、野生型ポリペプチド
(他の対立遺伝子から作られる)と相互作用し、そして非機能的マルチマーを形
成する。従って、変異は、基質結合ドメイン、触媒ドメイン、または細胞局在化
ドメイン中にある。好ましくは、変異体ポリペプチドは、過剰産生される。この
ような効果を有する点変異が作られる。さらに、タンパク質の末端への種々の長
さの異なるポリペプチドの融合が、ドミナントネガティブ変異体を産生し得る。
一般的なストラテジーが、ドミナントネガティブ変異体を作製するために利用可
能である(例えば、Herskowitz、Nature(1987)329:
219を参照のこと)。このような技術は、機能の喪失(loss of fu
nction)の変異を作製するために使用され得、この変異はタンパク質機能
を決定するために有用である。
Dominant negative mutations for the corresponding proteins active as homomultimers are also readily generated. Variant polypeptides interact with wild-type polypeptides (made from other alleles) and form non-functional multimers. Thus, the mutation is in the substrate binding domain, catalytic domain, or cell localization domain. Preferably, the variant polypeptide is overproduced. A point mutation having such an effect is created. Furthermore, fusion of different length polypeptides to the ends of the protein can produce dominant negative mutants.
General strategies are available for making dominant negative mutants (eg Herskowitz, Nature (1987) 329:
219). Such techniques are loss of fu.
nucleation) mutations, which are useful for determining protein function.

【0072】 (ポリぺプチドおよびそれらの改変体) 本発明のポリぺプチドは、開示されるポリヌクレオチド、および開示されるポ
リヌクレオチドに対して、遺伝子コードの縮重のために、配列において同一でな
い核酸によってコードされるポリぺプチドを含む。従って、本発明は、配列番号
1〜3351のいずれか1つの配列を有するポリヌクレオチドまたはその改変体
によってコードされるポリぺプチドを本発明の範囲内に含む。
Polypeptides and Variants thereof The polypeptides of the invention are not identical in sequence to the disclosed polynucleotides and to the disclosed polynucleotides due to the degeneracy of the genetic code. It includes a polypeptide encoded by a nucleic acid. Therefore, the present invention includes, within the scope of the present invention, a polypeptide encoded by the polynucleotide having any one of the sequences of SEQ ID NOs: 1-3351 or a variant thereof.

【0073】 一般に、本明細書中で使用される場合、用語「ポリぺプチド」は、示されるポ
リヌクレオチドによってコードされる全長のポリぺプチド、示されるポリヌクレ
オチドによって示される遺伝子によってコードされるポリぺプチドの両方、およ
びそれらの部分またはフラグメントをいう。「ポリぺプチド」はまた、天然に存
在するタンパク質の改変体を含み、ここで、このような改変体は、天然に存在す
るタンパク質に相同であるかまたは実質的に類似し、そして天然に存在するタン
パク質と同じまたは異なる種(例えば、ヒト、マウス、または示されるポリぺプ
チドを天然で発現するいくつかの他の種、通常、哺乳動物種)の起源であり得る
。一般に、改変体ポリぺプチドは、上記のパラメーターを使用してBLASTに
よって測定されるように、本発明の示差的に発現されるポリぺプチドと、少なく
とも約80%、通常少なくとも約90%、およびより通常少なくとも約98%の
配列同一性を有する配列を有する。改変体ポリぺプチドは、天然でグリコシル化
され得るか、または天然ではグリコシル化され得ない(すなわち、ポリぺプチド
は、対応する天然に存在するタンパク質において見出されるグリコシル化パター
ンとは異なるグリコシル化パターンを有する)。
In general, as used herein, the term “polypeptide” refers to the full-length polypeptide encoded by the indicated polynucleotide, the polypeptide encoded by the gene indicated by the indicated polynucleotide. Refers to both peptides, and parts or fragments thereof. "Polypeptide" also includes variants of naturally-occurring proteins, wherein such variants are homologous or substantially similar to naturally-occurring proteins and are naturally-occurring. Can be of the same or different species as the protein (eg, human, mouse, or some other species that naturally expresses the indicated polypeptide, usually a mammalian species). In general, a variant polypeptide comprises at least about 80%, usually at least about 90%, and usually a differentially expressed polypeptide of the invention, as measured by BLAST using the parameters above. More usually have sequences that have at least about 98% sequence identity. Variant polypeptides may be naturally glycosylated or non-naturally glycosylated (ie, a polypeptide is a glycosylation pattern different from that found in the corresponding naturally occurring protein). Have).

【0074】 本発明はまた、開示されたポリぺプチドのホモログ(またはそれらのフラグメ
ント)を含み、ここでこのホモログは、他の種(すなわち、他の動物または植物
種)から単離され、このようなホモログは通常、哺乳動物種(例えば、マウス、
ラットのようなげっ歯類:家畜(例えば、ウマ、ウシ、イヌ、ネコ);およびヒ
ト)である。「ホモログ」によって、上述で同定されるように特定の示差的に発
現されるタンパク質に対して少なくとも約35%、通常少なくとも約40%、お
よびより通常少なくとも約60%のアミノ酸配列同一性を有するポリぺプチドが
意図され、ここで、配列同一性は、上記のパラメーターを用いるBLASTアル
ゴリズムを使用して決定される。
The present invention also includes homologs (or fragments thereof) of the disclosed polypeptides, wherein the homologs are isolated from other species (ie, other animal or plant species), Such homologues are usually of mammalian species (eg, mouse,
Rodents such as rats: domestic animals (eg horses, cows, dogs, cats); and humans. By "homologue" is meant a polymorph having an amino acid sequence identity of at least about 35%, usually at least about 40%, and more usually at least about 60% to a particular differentially expressed protein as identified above. Peptides are contemplated, where sequence identity is determined using the BLAST algorithm with the above parameters.

【0075】 一般に、本発明のポリぺプチドは、天然に存在しない環境において提供され、
例えば、それらの天然に存在する環境から分離されている。ある実施形態におい
て、本発明のタンパク質は、コントロールに比較してそのタンパク質について富
化された組成物中に存在する。それ自体、精製されたポリぺプチドが提供され、
ここで、精製されたとは、タンパク質が非示差的に発現されたポリぺプチドが実
質的にない組成物中に存在することが意味され、ここで実質的にないとは、その
組成物の90%未満、通常60%未満、およびより通常50%未満が、非示差的
に発現されるポリぺプチドから構成されることを意味する。
Generally, the polypeptides of the invention are provided in non-naturally occurring environments,
For example, it is separated from their naturally occurring environment. In certain embodiments, a protein of the invention is present in a composition enriched for that protein relative to a control. As such, it provides a purified polypeptide,
Purified, as used herein, means that the protein is present in a composition that is substantially free of non-differentially expressed polypeptide, where substantially no protein is 90% of the composition. It is meant that less than%, usually less than 60%, and more usually less than 50% is composed of non-differentially expressed polypeptides.

【0076】 また本発明の範囲内にあるのは、改変体であり;ポリぺプチドの改変体は、変
異体、フラグメント、および融合物を含む。変異体は、アミノ酸の置換、付加、
または欠失を含み得る。アミノ酸の置換は、保存的なアミノ酸の置換、または非
必須アミノ酸を排除するための(例えば、グリコシル化部位、リン酸化部位、も
しくはアセチル化部位を変化するため)、または機能について必須ではない1つ
以上のシステイン残基の置換または欠失による誤った折畳みを最小にするための
置換であり得る。保存的なアミノ酸の置換は、全体的な電荷、疎水性/親水性、
および/または置換されるアミノ酸の立体的なバルクを保存する置換である。改
変体は、タンパク質の特定の領域(例えば、機能的ドメインおよび/または、ポ
リぺプチドがタンパク質ファミリーのメンバーである場合、コンセンサス配列と
関連する領域)の生物学的活性を、保持するように設計され得る。改変体の生成
についてのアミノ酸変化の選択は、アミノ酸の接近可能性(内部対外部)(例え
ば、Goら、Int.J.Peptide Protein Res.(198
0)15:211を参照のこと)、改変体ポリぺプチドの熱安定性(例えば、Q
uerolら、Prot.Eng.(1996)9:265を参照のこと)、所
望のグリコシル化部位(例えば、OlsenおよびThomsen、J.Gen
.Microbiol.(1991)137:579を参照のこと)、所望のジ
スルフィド架橋(例えば、Clarkeら、Biochemistry(199
3)32:4322;およびWakarchukら、Protein Eng.
(1994)7:1379を参照のこと)、所望の金属結合部位(例えば、To
maら、Biochemistry(1991)30:97、およびHaeze
rbrouckら、Protein Eng.(1993)6:643)、なら
びにプロリンループ内での所望の置換(例えば、Masulら、Appl.En
v.Microbiol.(1994)60:3579)に基づき得る。システ
イン涸渇されたムテインは、米国特許第4,959,314号において記載され
るように生成され得る。
Also within the scope of the invention are variants; variants of polypeptides include variants, fragments and fusions. Variants include amino acid substitutions, additions,
Or it may include a deletion. Amino acid substitutions may be conservative amino acid substitutions, or to eliminate non-essential amino acids (eg, to change glycosylation, phosphorylation, or acetylation sites), or one that is not essential for function. It may be a substitution to minimize misfolding due to the substitution or deletion of the above cysteine residues. Conservative amino acid substitutions result in overall charge, hydrophobicity / hydrophilicity,
And / or is a substitution that preserves the steric bulk of the amino acid being replaced. Variants are designed to retain the biological activity of a particular region of the protein (eg, the functional domain and / or the region associated with the consensus sequence if the polypeptide is a member of the protein family). Can be done. The choice of amino acid changes for the generation of variants is based on the accessibility of amino acids (internal vs. external) (eg Go et al., Int. J. Peptide Protein Res. (198).
0) 15: 211), the thermal stability of the modified polypeptides (eg Q
uerol et al., Prot. Eng. (1996) 9: 265), the desired glycosylation site (eg, Olsen and Thomsen, J. Gen.
. Microbiol. (1991) 137: 579), the desired disulfide bridge (eg, Clarke et al., Biochemistry (199).
3) 32: 4322; and Wakarchuk et al., Protein Eng.
(1994) 7: 1379), the desired metal binding site (eg, To
ma et al., Biochemistry (1991) 30:97, and Haeze.
rbrouck et al., Protein Eng. (1993) 6: 643), as well as desired substitutions within the proline loop (eg, Masul et al., Appl. En.
v. Microbiol. (1994) 60: 3579). Cysteine-depleted muteins can be produced as described in US Pat. No. 4,959,314.

【0077】 改変体はまた、本明細書中に開示されるポリぺプチドのフラグメント、特に生
物学的に活性なフラグメントおよび/または機能的ドメインに対応するフラグメ
ントを含む。目的のフラグメントは代表的に、少なくとも約10アミノ酸長から
少なくとも約15アミノ酸長、通常少なくとも約50アミノ酸長であり、そして
300アミノ酸長またはそれよりも長くあり得るが、通常約1000アミノ酸長
を超えず、ここで、フラグメントは、任意の配列番号1〜3351の配列を有す
るポリヌクレオチドまたはそれらのホモログによってコードされるポリぺプチド
に同一であるアミノ酸のストレッチを有する。本明細書中に記載されるタンパク
質改変体は、本発明の範囲内であるポリヌクレオチドによってコードされる。遺
伝子コードは、対応する改変体を構築するために適切なコドンを選択するために
使用され得る。
Variants also include fragments of the polypeptides disclosed herein, particularly biologically active fragments and / or fragments corresponding to functional domains. Fragments of interest are typically at least about 10 amino acids in length to at least about 15 amino acids in length, usually at least about 50 amino acids in length, and can be 300 amino acids in length or longer, but usually not more than about 1000 amino acids in length. , Wherein the fragment has a stretch of amino acids that is identical to a polypeptide encoded by a polynucleotide having the sequence of any of SEQ ID NOs: 1-3351, or homologs thereof. The protein variants described herein are encoded by polynucleotides that are within the scope of the invention. The genetic code can be used to select the appropriate codons to construct the corresponding variant.

【0078】 (コンピュータに関連する実施形態) 一般に、ポリヌクレオチドのライブラリーは、配列情報の収集物であり、その
情報は、生化学的形態において(例えば、ポリヌクレオチド分子の収集物として
)、または電子形態において(例えば、コンピュータ読み取り可能な形態におい
て保存されているポリぺプチドヌクレオチド配列の収集物として、コンピュータ
システムの中のものとして、および/またはコンピュータプログラムの部分とし
て)のいずれかで提供される。ポリヌクレオチドの配列情報は、例えば、遺伝子
発見のためのリソースとして、選択された細胞型において発現される配列の表示
として(例えば、細胞型のマーカー)、および/または所与の疾患もしくは疾患
状態のマーカーとして、多様な方法において使用され得る。一般に、疾患マーカ
ーは、正常な細胞(例えば、疾患によって実質的に影響されない同じまたは類似
の型の細胞)に比べて上昇されたまたは減少されたレベルのいずれかで、疾患に
よって影響される全ての細胞に存在する、遺伝子産物の表示である。例えば、ラ
イブラリーにおけるポリヌクレオチド配列は、ポリヌクレオチドによってコード
されるmRNA、ポリぺプチド、または他の遺伝子産物を示すポリヌクレオチド
であり得、正常な(すなわち、実質的に疾患のない)乳房細胞に比べて、癌によ
って影響される乳管細胞において過剰発現されるかまたは抑制発現されるかのい
ずれかである。
Computer-Related Embodiments Generally, a library of polynucleotides is a collection of sequence information, which information is in biochemical form (eg, as a collection of polynucleotide molecules), or Provided either in electronic form (eg, as a collection of polypeptide nucleotide sequences stored in computer readable form, as in a computer system, and / or as part of a computer program). . Polynucleotide sequence information can be used, for example, as a resource for gene discovery, as an indication of the sequences expressed in the selected cell type (eg, a marker of the cell type), and / or for a given disease or disease state. As a marker, it can be used in a variety of ways. In general, a disease marker is all levels affected by a disease, either at elevated or decreased levels relative to normal cells (eg, cells of the same or similar type that are not substantially affected by the disease). A representation of the gene product present in the cell. For example, the polynucleotide sequence in the library can be a polynucleotide that represents the mRNA, polypeptide, or other gene product encoded by the polynucleotide, and is associated with normal (ie, substantially disease-free) breast cells. In comparison, they are either overexpressed or downregulated in ductal cells affected by the cancer.

【0079】 ライブラリーのヌクレオチド配列情報は、任意の適切な形態(例えば、電子形
態または生化学的形態)において具現化され得る。例えば、電子形態において具
現化される配列情報のライブラリーは、例えば、i)癌細胞と正常な細胞との間
で;ii)癌細胞と形成異常細胞との間で;iii)癌細胞と癌以外の疾患また
は状態によって影響される細胞との間で;iv)転移性の癌細胞と正常な細胞お
よび/もしくは非転移性の癌細胞との間で;v)悪性癌細胞と非悪性の癌細胞(
もしくは正常な細胞)との間で、ならびに/またはvi)正常な細胞に比較した
形成異常細胞で、示差的に発現される(例えば、過剰発現されるまたは抑制発現
される)遺伝子の代表的なヌクレオチド配列を含む、アクセス可能なコンピュー
タデータファイル(または生化学的形態において、核酸分子の収集物)を含む。
種々の疾患または疾患の段階によって影響される細胞の他の組み合わせおよび比
較は、当業者に容易に明らかである。ライブラリーの生化学的実施形態は、ライ
ブラリー中に遺伝子の配列を有する核酸の収集物を含み、ここで、この核酸は、
以下により詳細に記載されるように、ライブラリー中の遺伝子全体またはそのフ
ラグメントに対応し得る。
The nucleotide sequence information for the library may be embodied in any suitable form, such as electronic or biochemical form. For example, libraries of sequence information embodied in electronic form include, for example, i) between cancer cells and normal cells; ii) between cancer cells and dysplastic cells; iii) cancer cells and cancer. Between cells affected by a disease or condition other than; iv) between metastatic cancer cells and normal and / or non-metastatic cancer cells; v) malignant cancer cells and non-malignant cancer cells cell(
Or normal cells), and / or vi) dysplastic cells relative to normal cells, are representative of genes that are differentially expressed (eg, overexpressed or repressively expressed). Includes accessible computer data files (or collections of nucleic acid molecules in biochemical form) containing nucleotide sequences.
Other combinations and comparisons of cells affected by various diseases or stages of disease will be readily apparent to those of skill in the art. A biochemical embodiment of the library comprises a collection of nucleic acids having the sequences of the genes in the library, wherein the nucleic acids are
As described in more detail below, it may correspond to the entire gene in the library or a fragment thereof.

【0080】 本発明のポリヌクレオチドライブラリーは、一般に、複数のポリヌクレオチド
配列の配列情報を含み、ここで、少なくとも1つのポリヌクレオチドは、配列番
号1〜3351の任意の配列を有する。複数とは、少なくとも2つ、通常少なく
とも3つが意味され、そして配列番号1〜3351の全てまでを含み得る。ライ
ブラリー中のポリヌクレオチドの長さおよび数は、例えば、ライブラリーがオリ
ゴヌクレオチドアレイ、cDNAアレイ、配列情報のコンピュータデータベース
などである場合、ライブラリーの性質とともに変化する。
Polynucleotide libraries of the invention generally include sequence information for multiple polynucleotide sequences, wherein at least one polynucleotide has any of SEQ ID NOs: 1-3351. By plural is meant at least 2, usually at least 3, and may include all of SEQ ID NOs: 1-3351. The length and number of polynucleotides in the library will vary with the nature of the library, eg, if the library is an oligonucleotide array, a cDNA array, a computer database of sequence information, and the like.

【0081】 ライブラリーが電子ライブラリーである場合、核酸配列情報は、多様な媒体中
に存在し得る。「媒体」は、本発明の配列情報を含む、単離された核酸分子以外
の製造物をいう。このような製造物は、核酸中に存在のようには配列に直接適用
可能でない手段によって試験され得る形態においてゲノム配列またはそのサブセ
ットを提供する。例えば、本発明のヌクレオチド配列、例えば、配列番号1〜3
351のポリヌクレオチドのいずれかの核酸配列は、コンピュータ読み取り可能
な媒体、例えば、コンピュータによって直接的に読み取られ、かつアクセスされ
得る任意の媒体に記録され得る。このような媒体としては:磁気保存媒体(例え
ば、フロッピー(登録商標)ディスク、ハードディスク保存媒体、および磁気テ
ープ);光学保存媒体(例えば、CD−ROM);電子保存媒体(例えば、RA
MおよびROM);ならびにこれらのカテゴリーのハイブリッド(例えば、磁気
/光学保存媒体)が挙げられるが、これらに制限されない。当業者は、現在公知
の任意のコンピュータ読み取り可能な、どのような媒体が本発明の配列情報の記
録を含む製造物を作製するために使用され得るかを容易に理解し得る。「記録さ
れる」とは、当該分野において公知であるような任意の方法を使用して、コンピ
ュータ読み取り可能な媒体に情報を保存するためのプロセスをいう。任意の便利
なデータ保存構造が、保存されている情報をアクセスするために使用される手段
に基づいて選択され得る。多様なデータプロセッサープログラムおよびフォーマ
ットが、保存のために使用され得る(例えば、ワードプロセッシングテキストフ
ァイル、データベースフォーマットなど)。配列情報に加えて、本発明のライブ
ラリーの電子バージョンは、他のコンピュータ読み取り可能な情報および/また
は他の型のコンピュータ読み取り可能なファイル(例えば、検索可能なファイル
、実行可能なファイルなど、例えば、検索プログラムソフトウェアなどを含むが
これに制限されない)と組合わせてまたはそれとともに提供され得る。
If the library is an electronic library, nucleic acid sequence information can be present in a variety of media. "Media" refers to an article of manufacture other than an isolated nucleic acid molecule that contains the sequence information of the present invention. Such an article of manufacture provides a genomic sequence or a subset thereof in a form that can be tested by means that are not directly applicable to the sequence as it is present in a nucleic acid. For example, a nucleotide sequence of the invention, eg, SEQ ID NOs: 1-3
The nucleic acid sequence of any of the 351 polynucleotides can be recorded on a computer-readable medium, such as any medium that can be directly read and accessed by a computer. Such media include: magnetic storage media (eg floppy disks, hard disk storage media, and magnetic tape); optical storage media (eg CD-ROM); electronic storage media (eg RA).
M and ROM); and hybrids of these categories (eg, magnetic / optical storage media), but are not limited thereto. One of ordinary skill in the art can readily understand what any computer-readable medium now known can be used to make an article of manufacture containing the sequence information records of the invention. "Recorded" refers to the process of storing information on a computer-readable medium, using any method known in the art. Any convenient data storage structure may be selected based on the means used to access the stored information. A wide variety of data processor programs and formats can be used for storage (eg, word processing text files, database formats, etc.). In addition to sequence information, electronic versions of the libraries of the invention may contain other computer readable information and / or other types of computer readable files (eg, searchable files, executable files, etc., such as , Including, but not limited to, search program software, etc.).

【0082】 コンピュータ読み取り可能な形態においてヌクレオチド配列を提供することに
よって、情報は多様な目的のためにアクセスされ得る。配列情報をアクセスする
ためのコンピュータソフトウェアは、公的に利用可能である。例えば、BLAS
T(Altschulら、前出)、およびSybaseシステムにおけるBLA
ZE(Brutlagら、Comp.Chem.(1993)17:203)検
索アルゴリズムが、他の生物体由来のオープンリーディングフレーム(ORF)
に対するホモログを含むゲノム内のORFを同定するために使用され得る。
By providing the nucleotide sequences in computer readable form, the information can be accessed for a variety of purposes. Computer software for accessing sequence information is publicly available. For example, BLAS
T (Altschul et al., Supra), and BLA in the Sybase system
The ZE (Brutlag et al., Comp. Chem. (1993) 17: 203) search algorithm uses open reading frames (ORFs) from other organisms.
Can be used to identify ORFs within the genome that contain homologs for.

【0083】 本明細書中で使用される場合、「コンピュータベースのシステム」は本発明の
ヌクレオチド配列情報を分析するために使用されるハードウェア手段、ソフトウ
ェア手段、およびデータ保存手段をいう。本発明のコンピュータベースのシステ
ムの最小のハードウェアは、中央処理装置(CPU)、入力手段、出力手段、お
よびデータ保存手段を含む。当業者は、現在利用可能なコンピュータベースのシ
ステムのいずれか1つが、本発明における使用のために適切であることを容易に
理解し得る。データ保存手段は、上記のような本発明の配列情報の記録を含む任
意の製造物、またはこのような製造物をアクセスし得るメモリアクセス手段を含
み得る。
As used herein, “computer-based system” refers to the hardware, software, and data storage means used to analyze the nucleotide sequence information of the present invention. The minimum hardware of the computer-based system of the present invention includes a central processing unit (CPU), input means, output means, and data storage means. One of ordinary skill in the art can readily appreciate that any one of the currently available computer-based systems is suitable for use in the present invention. The data storage means may include any product containing a record of the sequence information of the invention as described above, or memory access means capable of accessing such product.

【0084】 「検索手段」とは、標的配列もしくは標的構造モチーフ、またはサンプル中の
ポリヌクレオチドの発現レベルを、保存されている配列情報と比較するための、
コンピュータベースのシステムにおいて実行される1つ以上のプログラムをいう
。検索手段は、特定の標的配列または標的モチーフに適合するゲノムのフラグメ
ントまたは領域を同定するために使用され得る。多様な公知のアルゴリズムが、
公に公知であり、そして市販されている(例えば、MacPattern(EM
BL)、BLASTN、およびBLASTX(NCBI))。「標的配列」は、
6個以上の連続するヌクレオチドもしくは2つ以上のアミノ酸配列の、任意のポ
リヌクレオチド配列もしくはアミノ酸配列、好ましくは約10〜100アミノ酸
もしくは約30〜300ヌクレオチドの、任意のポリヌクレオチド配列もしくは
アミノ酸配列であり得る。多様な比較手段が、データー保存手段との、サンプル
からの配列情報の比較を達成するために(例えば、標的配列、標的モチーフ、ま
たは相対的な発現レベルを分析するために)使用され得る。当業者は、公に利用
可能な相同性検索プログラムのうちのいずれか1つが、標的配列および標的モチ
ーフの比較を達成するために、本発明のコンピュータベースのシステムについて
の検索手段として使用され得ることを容易に認識し得る。サンプル中およびコン
トロール中の発現レベルを分析するためのコンピュータプログラムはまた、当該
分野において公知である。
A “search tool” is a means for comparing the expression level of a target sequence or target structural motif, or a polynucleotide in a sample, with stored sequence information,
Refers to one or more programs executed in a computer-based system. Search means can be used to identify genomic fragments or regions that match a particular target sequence or target motif. A variety of known algorithms
Publicly known and commercially available (eg, MacPattern (EM
BL), BLASTN, and BLASTX (NCBI)). "Target sequence" is
Any polynucleotide or amino acid sequence of 6 or more contiguous nucleotides or two or more amino acid sequences, preferably about 10 to 100 amino acids or about 30 to 300 nucleotides. obtain. A variety of comparison means can be used to achieve comparison of sequence information from a sample with a data storage means (eg, to analyze target sequences, target motifs, or relative expression levels). Those skilled in the art will appreciate that any one of the publicly available homology search programs can be used as a search tool for the computer-based system of the present invention to achieve a comparison of target sequences and target motifs. Can be easily recognized. Computer programs for analyzing expression levels in samples and controls are also known in the art.

【0085】 「標的構造モチーフ」または「標的モチーフ」は、任意の合理的に選択された
配列または配列の組合せをいい、ここで配列は、標的モチーフの折り畳みの際に
形成される三次元高次構造に基づいて、または調節部位もしくは活性部位のコン
センサス配列に基づいて選択される。当該分野で公知の多様な標的モチーフが存
在する。タンパク質標的モチーフは、酵素活性部位およびシグナル配列を含むが
、これらに制限されない。核酸標的モチーフは、ヘアピン構造、プロモーター配
列、および転写因子についての結合部位のような他の発現エレメントを含むが、
これらに限定されない。
“Target structure motif” or “target motif” refers to any reasonably selected sequence or combination of sequences, where a sequence is a three-dimensional higher order formed upon folding of the target motif. Selection is based on structure or on the consensus sequence of regulatory or active sites. There are a variety of target motifs known in the art. Protein target motifs include, but are not limited to, enzyme active sites and signal sequences. Nucleic acid target motifs include hairpin structures, promoter sequences, and other expression elements such as binding sites for transcription factors,
It is not limited to these.

【0086】 入力手段および出力手段についての種々の構造フォーマットが、本発明のコン
ピュータベースのシステムにおいて情報を入力および出力するために使用され得
る。出力手段についての1つのフォーマットは、異なるポリヌクレオチドの相対
的な発現レベルをランク付けする。このような提示は、当業者に遺伝子発現プロ
フィールを決定するための相対的な発現レベルの格付を提供する。
Various structural formats for the input and output means may be used to input and output information in the computer-based system of the present invention. One format for the output means ranks the relative expression levels of different polynucleotides. Such a presentation provides one of skill in the art with a relative expression level rating for determining gene expression profiles.

【0087】 上述で考察されるように、本発明の「ライブラリー」はまた、配列番号1〜3
351のポリヌクレオチドの生化学的ライブラリー(例えば、提供されるポリヌ
クレオチドを表す核酸の収集物)を包含する。生化学的ライブラリーは、種々の
形態(例えば、cDNAの溶液、固体支持体の表面と安定に会合されるプローブ
核酸のパターン(すなわち、アレイ)など)を採り得る。特に興味深いのは、配
列番号1〜3351の1つ以上がアレイ上に提示される、核酸アレイである。ア
レイによって、その表面の1つに少なくとも2つの異なる核酸標的を有する少な
くとも1つの基板を保有する製品が意味され、ここでは異なる核酸の数がかなり
高くあり得、代表的に少なくとも10ヌクレオチド、通常少なくとも20ヌクレ
オチド、およびしばしば少なくとも25ヌクレオチドであり得る。種々の異なる
アレイフォーマットが開発され、そして、これは当業者に公知である。本発明の
アレイは、種々の適用(上述で列挙される例示的な特許文献において開示される
ような、遺伝子発現分析、薬物スクリーニング、変異分析などを含む)における
使用を見出す。
As discussed above, “libraries” of the invention also include SEQ ID NOs: 1-3.
A biochemical library of 351 polynucleotides (eg, a collection of nucleic acids representing the provided polynucleotides). Biochemical libraries can take a variety of forms, such as solutions of cDNA, patterns of probe nucleic acids that are stably associated with the surface of a solid support (ie, arrays), and the like. Of particular interest are nucleic acid arrays in which one or more of SEQ ID NOS: 1-3351 is displayed on the array. By array is meant an article carrying at least one substrate with at least two different nucleic acid targets on one of its surfaces, where the number of different nucleic acids can be quite high, typically at least 10 nucleotides, usually at least It can be 20 nucleotides, and often at least 25 nucleotides. A variety of different array formats have been developed and are known to those of skill in the art. The arrays of the invention find use in a variety of applications, including gene expression analysis, drug screening, mutation analysis, etc., as disclosed in the exemplary patent documents listed above.

【0088】 上述の核酸ライブラリーに加えて、ポリぺプチドの類似のライブラリーがまた
提供され、ここではライブラリーのポリぺプチドは、配列番号1〜3351によ
ってコードされるポリぺプチドの少なくとも一部を表す。
In addition to the nucleic acid libraries described above, a library of similar polypeptides is also provided, wherein the polypeptides of the library are at least one of the polypeptides encoded by SEQ ID NOs: 1-3351. Represents a part.

【0089】 (マッピングおよび組織プロファイリングにおける、ポリヌクレオチドプロー
ブの使用) ポリヌクレオチドプローブは、一般に、配列表において示されるようなポリヌ
クレオチドの少なくとも12個連続するヌクレオチドを含み、多様な目的(例え
ば、ポリヌクレオチドの染色体マッピング、および転写レベルの検出)のために
使用される。開示されるポリヌクレオチド配列の好ましい領域についてのさらな
る開示は、実施例において見出される。本明細書中に開示されるポリヌクレオチ
ドに特異的にハイブリダイズするプローブは、他の非関連の配列を用いて提供さ
れるバックグラウンドハイブリダイゼーションよりも少なくとも5、10、また
は20倍高い検出シグナルを提供するべきである。
Use of Polynucleotide Probes in Mapping and Tissue Profiling Polynucleotide probes generally comprise at least 12 contiguous nucleotides of a polynucleotide as set forth in the Sequence Listing for a variety of purposes (eg, polynucleotides). Chromosomal mapping and detection of transcription levels). Further disclosure of preferred regions of the disclosed polynucleotide sequences can be found in the examples. Probes that specifically hybridize to the polynucleotides disclosed herein will have a detection signal that is at least 5, 10, or 20 times higher than background hybridization provided with other unrelated sequences. Should be provided.

【0090】 発現レベルの検出。ヌクレオチドプローブが、提供されるポリヌクレオチドに
対応する遺伝子の発現を検出するために使用される。ノーザンブロットにおいて
、mRNAは、電気泳動的に分離され、そしてプローブと接触される。プローブ
は特定の大きさのmRNA種にハイブリダイズするものとして検出される。ハイ
ブリダイゼーションの量は、例えば、特定の条件下での発現の相対的な量を決定
するために定量される。プローブは、発現を検出するために、細胞へのインサイ
チュハイブリダイゼーションに使用される。プローブはまた、ハイブリダイズす
る配列の診断的検出のために、インビボで使用され得る。プローブは代表的に、
放射性同位体で標識される。他の型の検出可能な標識が使用され得る(例えば、
発色団、蛍光体、および酵素)。ヌクレオチドハイブリダイゼーションアッセイ
の他の例は、WO92/02526および米国特許第5,124,246号にお
いて記載される。
Detection of expression levels. Nucleotide probes are used to detect expression of the gene corresponding to the provided polynucleotides. In Northern blots, mRNA is electrophoretically separated and contacted with the probe. The probe is detected as hybridizing to a particular size mRNA species. The amount of hybridization is quantified, for example, to determine the relative amount of expression under particular conditions. The probe is used for in situ hybridization to cells to detect expression. The probe can also be used in vivo for diagnostic detection of hybridizing sequences. The probe is typically
It is labeled with a radioactive isotope. Other types of detectable labels can be used (eg,
Chromophores, fluorophores, and enzymes). Other examples of nucleotide hybridization assays are described in WO92 / 02526 and US Pat. No. 5,124,246.

【0091】 あるいは、ポリメラーゼ連鎖反応(PCR)は、少量の標的核酸を検出するた
めの別の手段である(例えば、Mullisら、Meth.Enzymol.(
1987)155:335;米国特許第4,683,195号;および米国特許
第4,683,202号を参照のこと)。標的核酸とハイブリダイズする2つの
プライマーポリヌクレオチドが、反応をプライムするために使用される。プライ
マーは、配列表のポリヌクレオチド内の、またはそれに対して3’側および5’
側の配列から構成され得る。あるいは、プライマーが、これらのポリヌクレオチ
ドに対して3’側および5’側である場合、これらは、ポリヌクレオチドまたは
相補体にハイブリダイズする必要はない。熱安定性ポリメラーゼでの標的の増幅
後、増幅された標的核酸は、当該分野において公知の方法(例えば、サザンブロ
ット)によって検出され得る。mRNAまたはcDNAはまた、Sambroo
kら、「Molecular Cloning:A Laboratory M
anual」(New York Cold Spring Harbor L
aboratory、1989)において記載される伝統的なブロッティング技
術(例えば、サザンブロット、ノーザンブロットなど)(例えば、PCR増幅を
伴わない)によって検出され得る。一般に、mRNA、またはポリメラーゼ酵素
を使用してmRNAから作製されるcDNAは、ゲル電気泳動を使用して精製お
よび分離され得、そしてニトロセルロースのような固体支持体に移される。固体
支持体は、標識化プローブに曝露され、洗浄して任意のハイブリダイズしていな
いプローブを除去し、そして標識化プローブを含む二重鎖が検出される。
Alternatively, the polymerase chain reaction (PCR) is another means for detecting small amounts of target nucleic acid (eg, Mullis et al., Meth. Enzymol.
1987) 155: 335; U.S. Pat. No. 4,683,195; and U.S. Pat. No. 4,683,202). Two primer polynucleotides that hybridize to the target nucleic acid are used to prime the reaction. The primer may be in the polynucleotide of the sequence listing or at the 3'side and 5'to it.
It may consist of a side array. Alternatively, if the primers are 3'and 5'to these polynucleotides, then they need not hybridize to the polynucleotides or complements. After amplification of the target with a thermostable polymerase, the amplified target nucleic acid can be detected by methods known in the art (eg, Southern blot). mRNA or cDNA can also be obtained from Sambrook
K. et al., “Molecular Cloning: A Laboratory M”.
"" (New York Cold Spring Harbor L)
laboratory, 1989) and can be detected by traditional blotting techniques (eg, Southern blots, Northern blots, etc.) (eg, without PCR amplification). In general, mRNA, or cDNA made from mRNA using polymerase enzyme, can be purified and separated using gel electrophoresis and transferred to a solid support such as nitrocellulose. The solid support is exposed to a labeled probe, washed to remove any unhybridized probe, and the duplex containing the labeled probe is detected.

【0092】 マッピング。本発明のポリヌクレオチドは、対応する遺伝子が存在する染色体
を同定するために使用され得る。このようなマッピングは、既知の機能を有する
他の遺伝子に対するその近位性により、そのポリヌクレオチドに関連する遺伝子
の機能を同定する際に有用であり得る。機能はまた、特定の症候群または疾患が
同じ染色体上にマップされる場合、そのポリヌクレオチドに関連する遺伝子に割
り当てられ得る。例えば、核酸配列異常の同定および定量におけるポリヌクレオ
チドプローブの使用は、米国特許第5,783,387号において記載される。
例示的なマッピング法は、蛍光インサイチュハイブリダイゼーション(FISH
)であり、これは、DNA配列の相対的なコピー数における変化の全体的なゲノ
ム評価を可能にして、比較ゲノムハイブリダイゼーションを容易にする(例えば
、Valdesら、Methods in Molecular Biolog
y(1997)68:1を参照のこと)。ポリヌクレオチドはまた、例えば、放
射ハイブリッドまたは染色体特異的ハイブリッドパネルを使用して、特定の染色
体にマッピングされ得る。Leachら、Advances in Genet
ics(1995)33:63−99;Walterら、Nature Gen
etics(1994)7:22;WalterおよびGoodfellow、
Trends in Genetics(1992)9:352を参照のこと。
放射ハイブリッドマッピングについてのパネルは、Research Gene
tics、Inc.、Huntsville、Alabama、USAから入手
可能である。統計学的プログラムRHMAPは、ある順序に対する別の順序の相
対的な尤度の測定とともに、放射ハイブリダイゼーションからのデータに基づい
てマップを構築するために使用され得る。RHMAPは、http://www
.sph.umich.edu/group/statgen/softwar
eにてワールドワイドウェブを介して入手可能である。さらに、癌のような疾患
と一般に関連する染色体の領域を同定するための市販のプログラムが利用可能で
ある。
Mapping. The polynucleotides of the present invention can be used to identify the chromosome in which the corresponding gene resides. Such mapping may be useful in identifying the function of the gene associated with the polynucleotide due to its proximity to other genes with known function. Function can also be assigned to the gene associated with the polynucleotide if the particular syndrome or disease maps on the same chromosome. For example, the use of polynucleotide probes in the identification and quantification of nucleic acid sequence abnormalities is described in US Pat. No. 5,783,387.
An exemplary mapping method is fluorescence in situ hybridization (FISH).
), Which allows global genomic assessment of changes in relative copy number of DNA sequences, facilitating comparative genomic hybridization (eg, Valdes et al., Methods in Molecular Biolog).
y (1997) 68: 1). Polynucleotides can also be mapped to specific chromosomes using, for example, radial hybrids or chromosome-specific hybrid panels. Leach et al., Advances in Genet
ics (1995) 33: 63-99; Walter et al., Nature Gen.
etics (1994) 7:22; Walter and Goodfellow,
See Trends in Genetics (1992) 9: 352.
A panel on Radiative Hybrid Mapping is available at Research Gene.
tics, Inc. , Huntsville, Alabama, USA. The statistical program RHMAP can be used to build a map based on data from radiohybridization, along with a measure of the relative likelihood of one order relative to another. RHMAP is http: // www
. sph. umich. edu / group / statgen / softwar
It is available via the World Wide Web at e. In addition, commercially available programs are available for identifying regions of the chromosome that are commonly associated with diseases such as cancer.

【0093】 組織型決定または組織プロファイリング。提供されたポリヌクレオチドに対応
する特異的なmRNAの発現は、異なる細胞型において変化し得、そして組織特
異的であり得る。異なる細胞型におけるmRNAレベルのこの変化は、組織型を
決定するための核酸プローブアッセイを用いて活用され得る。例えば、配列表に
列挙されるポリヌクレオチドに実質的に同一のまたは相補的な核酸プローブを利
用する、PCR、分岐化DNAプローブアッセイ、またはブロッティング技術は
、対応するcDNAまたはmRNAの存在または不在を決定し得る。
Tissue typing or tissue profiling. Expression of the specific mRNA corresponding to the provided polynucleotide may be altered in different cell types and may be tissue specific. This change in mRNA levels in different cell types can be exploited using nucleic acid probe assays to determine tissue type. For example, PCR, branched DNA probe assays, or blotting techniques that utilize nucleic acid probes that are substantially identical or complementary to the polynucleotides listed in the Sequence Listing determine the presence or absence of the corresponding cDNA or mRNA. You can

【0094】 組織型決定は、転移性病変の発生的な器官または組織源を、その器官または組
織の特定のマーカーの発現を同定することによって、同定するために使用され得
る。ポリヌクレオチドが特定の組織型においてのみ発現され、そして転移性病変
がそのポリヌクレオチドを発現することが見出される場合、病変の発生源が同定
される。特定のポリヌクレオチドの発現は、対応するmRNAまたはタンパク質
産物のいずれかの検出によってアッセイされ得る。
Tissue typing can be used to identify a developing organ or tissue source of metastatic lesions by identifying the expression of specific markers for that organ or tissue. The origin of the lesion is identified if the polynucleotide is only expressed in a particular tissue type and a metastatic lesion is found to express the polynucleotide. Expression of a particular polynucleotide can be assayed by detection of either the corresponding mRNA or protein product.

【0095】 多型の使用。本発明のポリヌクレオチドは、法医学的分析、遺伝子分析、マッ
ピング、および診断的適用において使用され得、ここでは遺伝子のその対応する
領域は、ヒト集団において多型である。遺伝子における多型を検出するための任
意の手段が使用され得、これには、タンパク質多型改変体の電気泳動、制限酵素
切断に対する示差的な感受性、および対立遺伝子特異的プローブへのハイブリダ
イゼーションが挙げられるが、これらに制限されない。
Use of polymorphisms. The polynucleotides of the invention can be used in forensic analysis, genetic analysis, mapping, and diagnostic applications, where the corresponding region of the gene is polymorphic in the human population. Any means for detecting polymorphisms in a gene can be used, including electrophoresis of protein polymorphism variants, differential sensitivity to restriction enzyme cleavage, and hybridization to allele-specific probes. Examples include, but are not limited to:

【0096】 (抗体産生) 本発明のポリヌクレオチド、および対応するmRNA、cDNA、または完全
な遺伝子の発現産物が、実験目的、診断目的および治療目的のための抗体を惹起
するために調製および使用され得る。対応する遺伝子が割り当てられていないポ
リヌクレオチドについては、これは、その対応する遺伝子を同定するためのさら
なる方法を提供する。このポリヌクレオチドまたは関連するcDNAは、上記の
ように発現され、そして抗体が調製される。これらの抗体は、そのポリヌクレオ
チドによってコードされるポリぺプチド上のエピトープに特異的であり、そして
細胞もしくは組織調製物において、またはインビトロ発現系の無細胞抽出物にお
いて、対応するネイティブなタンパク質を沈澱させ得るか、またはそのタンパク
質に結合し得る。
Antibody Production The polynucleotides of the invention, and the corresponding mRNA, cDNA, or complete gene expression products, are prepared and used to raise antibodies for experimental, diagnostic and therapeutic purposes. obtain. For polynucleotides to which the corresponding gene has not been assigned, this provides an additional way to identify that corresponding gene. The polynucleotide or related cDNA is expressed and antibodies are prepared as described above. These antibodies are specific for the epitope on the polypeptide encoded by the polynucleotide and precipitate the corresponding native protein in cell or tissue preparations or in cell-free extracts of in vitro expression systems. Or can bind to the protein.

【0097】 選択された抗原を特異的に結合するポリクローナル抗体およびモノクローナル
抗体を産生するための方法は、当該分野で周知である。これらの抗体は、配列表
において開示されるポリヌクレオチドによってコードされるポリぺプチドに存在
するエピトープに特異的に結合する。代表的に、少なくとも6個、8個、10個
または12個連続するアミノ酸が、エピトープを形成するために必要とされる。
連続しないアミノ酸を含むエピトープは、より長いポリぺプチド(例えば、少な
くとも15、25または50アミノ酸)を必要とし得る。これらの提供されるポ
リヌクレオチドによってコードされるヒトポリぺプチドに特異的に結合する抗体
は、ウエスタンブロットまたは他の免疫化学的アッセイにおいて使用される場合
、他のタンパク質を用いて提供される検出シグナルよりも少なくとも5倍、10
倍または20倍高い検出シグナルを提供する。好ましくは、本発明のポリぺプチ
ドに特異的な抗体は、免疫化学アッセイにおいて検出可能なレベルで他のタンパ
ク質に結合せず、そしてその特定のポリぺプチドを溶液から免疫沈降させ得る。
Methods for producing polyclonal and monoclonal antibodies that specifically bind a selected antigen are well known in the art. These antibodies specifically bind to epitopes present on the polypeptides encoded by the polynucleotides disclosed in the Sequence Listing. Typically, at least 6, 8, 10, or 12 consecutive amino acids are required to form the epitope.
Epitopes containing non-contiguous amino acids may require longer polypeptides (eg at least 15, 25 or 50 amino acids). Antibodies that specifically bind to the human polypeptides encoded by these provided polynucleotides, when used in Western blots or other immunochemical assays, will yield more than the detection signals provided with other proteins. At least 5 times, 10
It provides a 2-fold or 20-fold higher detection signal. Preferably, an antibody specific for the polypeptide of the invention does not bind to other proteins at detectable levels in immunochemical assays and is capable of immunoprecipitating that particular polypeptide from solution.

【0098】 本発明はまた、本発明のポリぺプチドに特異的な天然に存在する抗体を意図す
る。例えば、ヒト集団中の本発明のポリぺプチドに対する血清抗体は、当該分野
において周知の方法によって(例えば、その対応する選択されたポリぺプチドま
たは融合タンパク質が結合されるカラムに抗血清を通すことによって)精製され
得る。次いで、この結合された抗体は、例えば、高塩濃度を有する緩衝液を使用
してカラムから溶出され得る。
The present invention also contemplates naturally occurring antibodies specific for the polypeptides of the present invention. For example, serum antibodies to the polypeptides of the invention in the human population can be prepared by methods well known in the art (eg, passing the antiserum through a column to which the corresponding selected polypeptide or fusion protein is bound). Can be purified). The bound antibody can then be eluted from the column using, for example, a buffer having a high salt concentration.

【0099】 上記で考察される抗体に加えて、本発明はまた、当該分野において周知の方法
に従う、遺伝子操作された抗体、抗体誘導体(例えば、単鎖抗体、抗体フラグメ
ント(例えば、Fabなど))を意図する。
In addition to the antibodies discussed above, the present invention also includes genetically engineered antibodies, antibody derivatives (eg, single chain antibodies, antibody fragments (eg, Fab, etc.)) according to methods well known in the art. Intended.

【0100】 本発明の他の実施形態は、本発明のポリペプチドに結合し得るヒト化モノクロ
ーナル抗体を包含する。句「ヒト化抗体」とは、非ヒト抗体(代表的には、マウ
スモノクローナル抗体)に由来する抗体をいう。あるいは、ヒト化抗体は、親(
非ヒト)抗体の抗原結合特性を維持するかまたは実質的に維持するが、ヒトに投
与された場合にその親抗体と比較して減少した免疫原性を示す、キメラ抗体に由
来し得る。本明細書中で使用される場合、句「キメラ抗体」とは、2つの異なる
抗体に由来する配列を含む抗体をいい(例えば、米国特許第4,816,567
号を参照のこと)、その2つの抗体は、代表的に、異なる種から生成する。より
代表的には、キメラ抗体は、ヒト抗体フラグメントおよびマウス抗体フラグメン
ト(一般には、ヒト定常領域およびマウス可変領域)を含む。
Other embodiments of the invention include humanized monoclonal antibodies capable of binding the polypeptides of the invention. The phrase "humanized antibody" refers to an antibody derived from a non-human antibody (typically a mouse monoclonal antibody). Alternatively, the humanized antibody is a parental (
It may be derived from a chimeric antibody that retains or substantially retains the antigen binding properties of the (non-human) antibody, but exhibits reduced immunogenicity when administered to a human as compared to its parent antibody. As used herein, the phrase “chimeric antibody” refers to an antibody that comprises sequences derived from two different antibodies (eg, US Pat. No. 4,816,567).
No.), the two antibodies are typically produced from different species. More typically, chimeric antibodies include human antibody fragments and mouse antibody fragments, generally human constant regions and mouse variable regions.

【0101】 ヒト化抗体は、親マウスモノクローナル抗体よりも、ヒトにおいてはるかに免
疫原性が低いので、これらは、アナフィラキシーの危険性をほとんど伴わずにヒ
トの処置に使用され得る。従って、これらの抗体は、ヒトへのインビボ投与を含
む治療適用(例えば、新形成疾患の処置のための照射感作物質としての使用、ま
たは(例えば、癌治療の)副作用を減少するための方法における使用)において
好ましくあり得る。
Since humanized antibodies are much less immunogenic in humans than the parental mouse monoclonal antibodies, they can be used in the treatment of humans with little risk of anaphylaxis. Accordingly, these antibodies may be used in therapeutic applications, including in vivo administration to humans (eg, use as radiation sensitizers for the treatment of neoplastic diseases, or methods for reducing side effects (eg, in cancer therapy). Use in).

【0102】 ヒト化抗体は、種々の方法によって完成され得、これらの方法としては、例え
ば、以下が挙げられる:(1)ヒトフレームワークおよび定常領域への非ヒト相
補性決定領域(CDR)のグラフティング(当該分野で「ヒト化」と称されるプ
ロセス)、あるいは(2)非ヒト可変ドメイン全体の置換(しかし、この非ヒト
可変ドメイン全体を、表面残基の置換によってヒト様表面で「覆う(Cloak
ing)」)(当該分野で「ベニヤリング(veneering)」と呼ばれる
プロセス)。本発明において、ヒト化抗体は、「ヒト化」抗体または「ベニヤ化
(veneerd)」抗体の両方を含む。これらの方法は、例えば、Jones
ら、Nature 321:522−525(1986);Morrisonら
、Proc.Natl.Acad.Sci.,U.S.A.,81:6851−
6855(1984);MorrisonおよびOi,Adv.Immunol
.,44:65−92(1988);Verhoeyerら、Science
239:1534−1536(1988);Padlan,Molec.Imm
un.28:489−498(1991);Padlan,Molec.Imm
unol.31(3):169−217(1994);ならびにKettleb
orough,C.A.ら、Protein Eng.4(7):773−83
(1991)(これらの各々は、参考として本明細書中に援用される)に開示さ
れる。
Humanized antibodies can be completed by a variety of methods, including, for example: (1) human framework and constant region non-human complementarity determining regions (CDRs). Grafting (a process referred to in the art as "humanization"), or (2) replacement of an entire non-human variable domain (but this entire non-human variable domain is replaced on the human-like surface by substitution of surface residues). Cover (Cloak
ing))) (a process referred to in the art as "veneering"). In the present invention, humanized antibodies include both "humanized" or "veneered" antibodies. These methods are described, for example, in Jones
Et al., Nature 321: 522-525 (1986); Morrison et al., Proc. Natl. Acad. Sci. , U. S. A. , 81: 6851-
6855 (1984); Morrison and Oi, Adv. Immunol
. , 44: 65-92 (1988); Verhoeyer et al., Science.
239: 1534-1536 (1988); Padlan, Molec. Imm
un. 28: 489-498 (1991); Padlan, Molec. Imm
unol. 31 (3): 169-217 (1994); and Kettleb.
orough, C.I. A. Et al., Protein Eng. 4 (7): 773-83.
(1991), each of which is incorporated herein by reference.

【0103】 句「相補性決定領域」とは、ネイティブな免疫グロブリン結合部位の天然のF
v領域の結合親和性および特異性を共に規定するアミノ酸配列をいう。例えば、
Chothiaら、J.Mol.Biol.196:901−917(1987
);Kabatら、U.S.Dept.of Health and Huma
n Services NIH Publication No.91−324
2(1991)を参照のこと。句「定常領域」とは、エフェクター機能を付与す
る抗体分子の部分をいう。本発明において、マウス定常領域は、ヒト定常領域に
よって置換される。その対象のヒト化抗体の定常領域は、ヒト免疫グロブリンに
由来する。重鎖定常領域は、5つのアイソタイプ:α、δ、ε、γまたはμのい
ずれかから選択され得る。
The phrase “complementarity determining region” refers to the native F of a native immunoglobulin binding site.
It refers to an amino acid sequence that defines both the binding affinity and specificity of the v region. For example,
Chothia et al. Mol. Biol. 196: 901-917 (1987)
); Kabat et al., U.S.P. S. Dept. of Health and Huma
n Services NIH Publication No. 91-324
2 (1991). The phrase "constant region" refers to the portion of the antibody molecule that confers effector functions. In the present invention, mouse constant regions are replaced by human constant regions. The constant region of the humanized antibody of interest is derived from human immunoglobulin. The heavy chain constant region can be selected from any of the five isotypes: α, δ, ε, γ or μ.

【0104】 抗体をヒト化する1つの方法は、非ヒト重鎖および軽鎖配列をヒト重鎖および
軽鎖配列に対して整列させる工程、非ヒトフレームワークを選択し、そしてこの
ような整列化に基づいてその非ヒトフレームワークをヒトフレームワークで置換
する工程、そのヒト化配列のコンフォーメーションを予測するために分子モデリ
ングを行い、そして親抗体のコンフォーメーションと比較する工程を包含する。
このプロセスに続き、そのヒト化配列モデルの予測されるコンフォメーションが
、親の非ヒト抗体の非ヒトCDRのコンフォメーションと密接に近似するまで、
CDRの構造を妨害するCDR領域中の残基の変異を繰り返す。このようなヒト
化抗体はさらに、例えば、Ashwellレセプターを介する取り込みおよびク
リアランスを容易にするために誘導体化され得る。例えば、米国特許第5,53
0,101号および同第5,585,089号(これらの特許は、参考として本
明細書中で援用される)を参照のこと。
One method of humanizing an antibody is to align non-human heavy and light chain sequences with human heavy and light chain sequences, select a non-human framework, and perform such an alignment. Substituting the non-human framework with a human framework based on the following, performing molecular modeling to predict the conformation of the humanized sequence, and comparing with the conformation of the parent antibody.
Following this process, until the predicted conformation of the humanized sequence model closely approximates that of the non-human CDRs of the parent non-human antibody,
Repeat mutations of residues in the CDR regions that interfere with the structure of the CDRs. Such humanized antibodies can be further derivatized, eg, to facilitate uptake and clearance via the Ashwell receptor. For example, US Pat. No. 5,53
See 0,101 and 5,585,089, which patents are incorporated herein by reference.

【0105】 ヒト化抗体はまた、ヒト免疫グロブリン遺伝子座を含むように操作されている
、トランスジェニック動物を使用して産生され得る。例えば、WO98/248
93は、ヒトIg遺伝子座を有するトランスジェニック動物を開示し、ここで、
これらの動物は、内因性重鎖および軽鎖の遺伝子座の不活化に起因して、機能的
な内因性免疫グロブリンを産生しない。WO91/10741はまた、免疫原に
対する免疫応答をマウントし得る、トランスジェニック非霊長類哺乳動物宿主を
開示し、ここで、これらの抗体は、霊長類の定常領域および/または可変領域を
有し、かつ内因性の免疫グロブリンコード遺伝子座は、置換または不活化されて
いる。WO96/30498は、哺乳動物中の免疫グロブリン遺伝子座を改変す
るため(例えば、定常領域または可変領域の全てまたは一部を置換して改変され
た抗体分子を形成するため)のCre/Lox系の使用を開示する。WO94/
02602は、不活化された内因性Ig遺伝子座および機能的なヒトIg遺伝子
座を有する、非ヒト哺乳動物宿主を開示する。米国特許第5,939,598号
は、内因性重鎖を欠失し、1以上の異種定常領域を含む外因性免疫グロブリン遺
伝子座を発現する、トランスジェニックマウスを作製する方法を開示する。
Humanized antibodies can also be produced using transgenic animals that have been engineered to contain human immunoglobulin loci. For example, WO98 / 248
93 discloses a transgenic animal having a human Ig locus, wherein
These animals do not produce functional endogenous immunoglobulins due to inactivation of the endogenous heavy and light chain loci. WO 91/10741 also discloses transgenic non-primate mammalian hosts capable of mounting an immune response against an immunogen, wherein these antibodies have primate constant and / or variable regions, And the endogenous immunoglobulin-encoding loci have been replaced or inactivated. WO96 / 30498 describes a Cre / Lox system for modifying immunoglobulin loci in mammals (eg, substituting all or part of a constant or variable region to form a modified antibody molecule). Disclose the use. WO94 /
02602 discloses a non-human mammalian host having an inactivated endogenous Ig locus and a functional human Ig locus. US Pat. No. 5,939,598 discloses methods for producing transgenic mice that lack endogenous heavy chains and express exogenous immunoglobulin loci containing one or more heterologous constant regions.

【0106】 上記に記載されるトランスジェニック動物を使用して、選択された抗原性分子
に対する免疫応答が生成され、そして抗体産生細胞がその動物より取り出され、
ヒトモノクローナル抗体を分泌するハイブリドーマを生成するために使用され得
る。免疫プロトコル、アジュバントなどは、当該分野で公知であり、例えば、W
O96/33735に記載されるようなトランスジェニックマウスの免疫に使用
される。この刊行物は、種々の抗原性分子(IL−6、IL−8、TNF、ヒト
CD4、L−セレクチン、gp39および破傷風毒素を含む)に対するモノクロ
ーナル抗体を開示する。これらのモノクローナル抗体は、その対応するタンパク
質の生物学的活性または生理学的効果を阻害または中和する能力について試験さ
れ得る。WO96/33735は、IL−8に対するモノクローナル抗体(IL
−8で免疫したトランスジェニックマウスの免疫細胞に由来する)が、好中球の
IL−8誘導性機能をブロックしたことを開示する。トランスジェニック動物を
免疫するために使用されたこの抗原に対する特異性を有するヒトモノクローナル
抗体もまた、WO96/34096に開示される。
Using the transgenic animals described above, an immune response to the selected antigenic molecule is generated and antibody producing cells are removed from the animal,
It can be used to generate hybridomas that secrete human monoclonal antibodies. Immunization protocols, adjuvants, etc. are known in the art, eg W
It is used to immunize transgenic mice as described in O96 / 33735. This publication discloses monoclonal antibodies against various antigenic molecules including IL-6, IL-8, TNF, human CD4, L-selectin, gp39 and tetanus toxin. These monoclonal antibodies can be tested for their ability to inhibit or neutralize the biological activity or physiological effects of the corresponding protein. WO96 / 33735 is a monoclonal antibody against IL-8 (IL
(Derived from immune cells of transgenic mice immunized with −8) blocked the IL-8-induced function of neutrophils. Human monoclonal antibodies with specificity for this antigen used to immunize transgenic animals are also disclosed in WO 96/34096.

【0107】 (診断のためのポリヌクレオチドまたはアレイ) ポリヌクレオチドアレイは、プローブが結合された二次元マトリクスまたはア
レイにおいて、基材(例えば、ガラス、ニトロセルロースなど)上にポリヌクレ
オチドプローブをスポットすることによって作製され得る。プローブは、共有結
合によって、または非特異的な相互作用(例えば、疎水性相互作用)によっての
いずれかで基材に結合され得る。ポリヌクレオチドのサンプルは、(例えば、放
射性標識または蛍光標識を使用して)検出可能に標識され得、次いでプローブに
ハイブリダイズされ得る。プローブポリヌクレオチドに結合した標識されたサン
プルポリヌクレオチドを含む2本鎖ポリヌクレオチドは、一旦、サンプルの未結
合の部分が洗浄して除かれると検出され得る。アレイを構築するための技術、お
よびこれらのアレイを使用する方法は、EP799,897;WO97/292
12;WO97/27317;EP785,280;WO97/02357:米
国特許第5,593,839号;米国特許第5,578,832号;EP728
,520;米国特許第5,599,695号;EP721 016;米国特許第
5,556,752号;WO95/22058;および米国特許第5,631,
734号において記載される。アレイは、例えば、遺伝子の示差的発現を試験す
るために使用され得、そして遺伝子機能を決定するために使用され得る。例えば
、アレイは、試験細胞とコントロール細胞との(例えば、癌細胞と正常な細胞と
の)間のポリヌクレオチドの示差的発現を検出するために使用され得る。例えば
、対応する正常な細胞において観察されない、癌細胞における特定のメッセージ
の高い発現は、癌特異的遺伝子産物を示し得る。アレイの例示的な使用はさらに
、例えば、Pappalaradoら、Sem.Radiation Onco
l.(1998)8:217;およびRamsay,Nature Biote
chnol.(1998)16:40において記載される。
Polynucleotides or Arrays for Diagnostic Polynucleotide arrays consist of spotting a polynucleotide probe on a substrate (eg glass, nitrocellulose, etc.) in a two-dimensional matrix or array to which the probe is attached. Can be made by. The probe can be attached to the substrate either by covalent bonding or by non-specific interactions (eg, hydrophobic interactions). A sample of polynucleotides can be detectably labeled (eg, using a radioactive or fluorescent label) and then hybridized to a probe. Double-stranded polynucleotides, including the labeled sample polynucleotide bound to the probe polynucleotide, can be detected once the unbound portion of the sample is washed away. Techniques for constructing arrays, and methods of using these arrays are described in EP 799,897; WO 97/292.
12; WO97 / 27317; EP785,280; WO97 / 02357: US Pat. No. 5,593,839; US Pat. No. 5,578,832; EP728.
, 520; US Pat. No. 5,599,695; EP 721 016; US Pat. No. 5,556,752; WO 95/22058; and US Pat.
No. 734. Arrays can be used, for example, to test the differential expression of genes and to determine gene function. For example, the array can be used to detect the differential expression of polynucleotides between test cells and control cells (eg, between cancer cells and normal cells). For example, high expression of a particular message in cancer cells, which is not observed in the corresponding normal cells, may indicate a cancer-specific gene product. Exemplary uses of arrays are further described, for example, in Papalarado et al., Sem. Radiation Onco
l. (1998) 8: 217; and Ramsay, Nature Biote.
chnol. (1998) 16:40.

【0108】 (診断における示差的な発現) 本発明のポリヌクレオチドはまた、例えば、ヒトにおける異常なまたは罹患し
た組織を同定するための方法として、2つの細胞間の発現レベルにおける差異を
検出するために使用され得る。タンパク質ファミリーのプロフィールに対応する
ポリヌクレオチドについて、組織の選択は、推定の生化学的機能に従って選択さ
れ得る。一般に、特異的なポリヌクレオチドに対応する遺伝子の発現は、ヒトの
、罹患したことが疑われる第1の組織と、第2の正常な組織との間で比較される
。異常であることまたは罹患したことが疑われる組織は、ヒトの異なる組織型に
由来し得るが、好ましくはこれは、同じ組織型に由来し;例えば、腸ポリープま
たは他の異常な増殖は、正常な腸組織と比較されるべきである。正常な組織は、
試験サンプルの組織と同じ組織、または患者の任意の正常な組織、特に目的のポ
リヌクレオチド関連遺伝子を発現する組織(例えば、脳、胸腺、精巣、心臓、前
立腺、胎盤、脾臓、小腸、骨格筋、膵臓、および結腸の粘膜内層)であり得る。
例えば、分子量、アミノ酸配列もしくはヌクレオチド配列、または相対量におい
て比較される2つの組織におけるポリヌクレオチド関連遺伝子、mRNA、また
はタンパク質の間の差異は、罹患したことが疑われるヒトの組織における、この
遺伝子、またはこの遺伝子を調節する遺伝子の変化を示す。示差的発現の検出ま
たは癌の診断におけるその使用の例は、米国特許第5,688,641号および
同第5,677,125号において記載される。
Differential Expression in Diagnostic Polynucleotides of the invention can also be used to detect differences in expression levels between two cells, for example as a method to identify abnormal or diseased tissue in humans. Can be used for. For polynucleotides that correspond to protein family profiles, tissue selection can be selected according to putative biochemical functions. Generally, the expression of the gene corresponding to a specific polynucleotide is compared between a human, first suspected diseased tissue, and a second normal tissue. Tissues suspected of being abnormal or diseased can be from different human tissue types, but preferably it is from the same tissue type; for example, intestinal polyps or other abnormal growths are normal. Should be compared to different intestinal tissues. Normal tissue is
The same tissue as the test sample, or any normal tissue of the patient, particularly tissue expressing a polynucleotide-related gene of interest (e.g., brain, thymus, testis, heart, prostate, placenta, spleen, small intestine, skeletal muscle, Mucosal lining of the pancreas and colon).
For example, a difference between a polynucleotide-related gene, mRNA, or protein in two tissues that is compared in molecular weight, amino acid sequence or nucleotide sequence, or relative amount is that the gene in human tissue suspected of being affected, Alternatively, it indicates a change in the gene that regulates this gene. Examples of the detection of differential expression or its use in diagnosing cancer are described in US Pat. Nos. 5,688,641 and 5,677,125.

【0109】 ヒトにおける疾患に対する遺伝的素因はまた、胎児組織における本発明のポリ
ヌクレオチドに対応するmRNAまたはタンパク質の発現レベルと、正常な胎児
組織における関連するレベルとを比較することによって検出され得る。この目的
のために使用される胎児組織としては、羊水、絨毛膜絨毛、血液、およびインビ
トロで受精された胚の割球が挙げられるが、これらに制限されない。匹敵する正
常なポリヌクレオチド関連遺伝子は、任意の組織から得られる。mRNAまたは
タンパク質は、ポリヌクレオチド関連遺伝子が発現されるヒトの正常な組織から
得られる。胎児ポリヌクレオチド関連遺伝子もしくはmRNAの同じ産物のヌク
レオチド配列またはその大きさにおける変化、または分子量、アミノ酸配列、も
しくは胎児タンパク質の相対量における変化のような差異は、胎児のポリヌクレ
オチド関連遺伝子における生殖系列の変異を示し得、これは、疾患に対する遺伝
的素因を示す。一般に、示差的発現に基づく本発明の診断、予後、および他の方
法は、疾患(例えば、乳癌、肺癌、結腸癌、および/またはその転移形態)を有
することが疑われる、または疾患に罹患しやすい患者から得られる試験サンプル
中の、遺伝子産物(特に示差的に発現される遺伝子産物)のレベルまたは量の検
出、ならびに正常な細胞(例えば、癌に実質的に罹患していない細胞)および/
または他のコントロール細胞において見出されるレベルと検出されたレベルとの
比較(例えば、異形成に罹患した細胞から癌細胞を区別するために)を包含する
。さらに、疾患の重篤度は、示差的に発現される遺伝子産物の検出されるレベル
と、種々の程度の重篤度の疾患と関連する示差的な遺伝子産物のレベルを示すサ
ンプル中で検出されるレベルとを比較することによって評価され得る。本明細書
中での用語「診断」の使用は、「予後の」あるいは「予後」を排除することを必
ずしも意味せず、むしろ便宜のために使用されることに留意すべきである。
Genetic predisposition to disease in humans can also be detected by comparing expression levels of mRNA or protein corresponding to the polynucleotides of the invention in fetal tissue to relevant levels in normal fetal tissue. Fetal tissues used for this purpose include, but are not limited to, amniotic fluid, chorionic villi, blood, and blastomere of in vitro fertilized embryos. Comparable normal polynucleotide-related genes can be obtained from any tissue. mRNA or protein is obtained from normal human tissue in which the polynucleotide-related gene is expressed. Differences, such as changes in the nucleotide sequence of the same product of a fetal polynucleotide-related gene or mRNA or in its size, or changes in the molecular weight, amino acid sequence, or relative amount of fetal proteins, can be due to Mutations may be exhibited that indicate a genetic predisposition to the disease. Generally, the diagnostic, prognostic, and other methods of the invention based on differential expression are suspected of having, or suffering from, a disease (eg, breast cancer, lung cancer, colon cancer, and / or metastatic forms thereof). Detecting the level or amount of gene products (particularly differentially expressed gene products) in test samples obtained from susceptible patients, as well as normal cells (eg, cells substantially free of cancer) and / or
Or comparing the levels found in other control cells with the levels detected (eg, to distinguish cancer cells from cells afflicted with dysplasia). In addition, the severity of the disease is detected in samples exhibiting detected levels of differentially expressed gene products and levels of differential gene products associated with diseases of varying degrees of severity. Can be evaluated by comparing It should be noted that the use of the term "diagnosis" herein is not necessarily meant to exclude "prognostic" or "prognosis", but rather for convenience.

【0110】 用語「示差的に発現される遺伝子」は一般に、例えば、遺伝子産物(例えば、
ポリぺプチド)をコードするオープンリーディングフレーム、ならびに/または
このような遺伝子のイントロン、ならびに発現の調節に関与する隣接の5’およ
び3’非コードヌクレオチド配列(コード領域を超えて約20kbまでであるが
いずれかの方向においておそらくそれ以上)を含み得るポリヌクレオチドを包含
することが、意図される。遺伝子は、染色体外での維持のために、または宿主ゲ
ノムへの組み込みのために、適切なベクターに導入され得る。一般に、少なくと
も約25%、通常少なくとも約50%〜75%、より通常は少なくとも約90%
以上の発現レベルにおける減少と関連する発現レベルにおける差異は、示差的に
発現される目的の遺伝子(すなわち、コントロールサンプルと比較して試験サン
プル中で過少発現されるかまたはダウンレギュレートされる遺伝子)を示す。さ
らに、コントロールサンプルと比較して、少なくとも約25%、通常少なくとも
約50%〜75%、より通常少なくとも約90%の、発現の増加と関連する発現
レベルの差異は、少なくとも約1と1/2倍、通常少なくとも2倍〜約10倍で
あり得、そして約100倍〜約1,000倍の増加であり得、このことは、示差
的に発現される目的の遺伝子(すなわち、過剰発現されるかまたはアップレギュ
レートされる遺伝子)の指標である。
The term “differentially expressed gene” generally refers to, for example, a gene product (eg,
An open reading frame encoding a polypeptide and / or introns of such genes and adjacent 5'and 3'non-coding nucleotide sequences (up to about 20 kb beyond the coding region) involved in the regulation of expression. Is likely to include more than one in either direction). The gene may be introduced into a suitable vector for extrachromosomal maintenance or for integration into the host genome. Generally, at least about 25%, usually at least about 50% to 75%, more usually at least about 90%.
Differences in expression levels associated with these reductions in expression levels are differentially expressed genes of interest (ie, genes that are under-expressed or down-regulated in test samples compared to control samples). Indicates. Further, the difference in expression levels associated with increased expression by at least about 25%, usually at least about 50% to 75%, more usually at least about 90% compared to control samples is at least about 1 and 1/2. Fold, usually at least 2 fold to about 10 fold, and can be about 100 fold to about 1,000 fold increase, which is differentially expressed gene of interest (ie, overexpressed). Or upregulated genes).

【0111】 本明細書中で使用される場合、「示差的に発現されるポリヌクレオチド」は、
示差的に発現される遺伝子を示す配列を含む核酸分子(RNAまたはDNA)を
意味し、例えば、示差的に発現されるポリヌクレオチドは、サンプル中の示差的
に発現されるポリヌクレオチドの検出が、サンプル中の示差的に発現される遺伝
子の存在と相関されるように、示差的に発現される遺伝子を独特に同定する配列
(例えば、遺伝子産物をコードするオープンリーディングフレーム)を含む。「
示差的に発現されるポリヌクレオチド」はまた、開示されるポリヌクレオチドの
フラグメント(例えば、生物学的活性を保持するフラグメント)、ならびに開示
されるポリヌクレオチドに相同な、実質的に類似の、または実質的に同一の(例
えば、約90%の配列同一性を有する)核酸ホモログを包含することが意味され
る。
As used herein, a “differentially expressed polynucleotide” is
By a nucleic acid molecule (RNA or DNA) comprising a sequence representing a differentially expressed gene, for example, a differentially expressed polynucleotide is the detection of a differentially expressed polynucleotide in a sample by It includes a sequence that uniquely identifies the differentially expressed gene (eg, an open reading frame encoding a gene product), as correlated with the presence of the differentially expressed gene in the sample. "
"Differentially expressed polynucleotides" also include fragments of the disclosed polynucleotides (eg, fragments that retain biological activity), as well as homologous, substantially similar or substantially homologous to the disclosed polynucleotides. To be homologous (eg, having about 90% sequence identity).

【0112】 本明細書中で使用される場合、「診断」は、一般に、疾患または障害に対する
患者の罹患しやすさの決定、被験体が疾患または障害に現在罹患しているか否か
に関する決定、ならびに疾患または障害に罹患した被験体の予後に関する決定(
例えば、転移前のもしくは転移性の癌の状態、癌の病期、または治療に対する癌
の応答性の同定)を含む。本発明は特に、乳癌(例えば、上皮内癌(例えば、上
皮内管癌(ductal carcinoma in situ))、エストロ
ゲンレセプター(ER)ポジティブ乳癌、ERネガティブ乳癌、または乳癌の他
の形態および/または病期)、肺癌(例えば、小細胞癌、非小細胞癌、中皮腫、
および肺癌の他の形態および/または病期)、ならびに結腸癌(例えば、腺腫性
ポリープ、結腸直腸癌、および結腸癌の他の形態および/または病期)の状況に
おける被験体の診断を含む。
As used herein, “diagnosis” generally refers to the determination of a patient's susceptibility to a disease or disorder, a determination as to whether the subject is currently suffering from the disease or disorder, And a decision regarding the prognosis of a subject suffering from a disease or disorder (
For example, identification of the pre-metastatic or metastatic cancer state, the stage of the cancer, or the responsiveness of the cancer to treatment). The invention is particularly directed to breast cancer (eg, carcinoma in situ (eg, ductal carcinoma in situ)), estrogen receptor (ER) positive breast cancer, ER negative breast cancer, or other forms and / or stages of breast cancer. ), Lung cancer (eg, small cell carcinoma, non-small cell carcinoma, mesothelioma,
And other forms and / or stages of lung cancer), as well as the diagnosis of subjects in the context of colon cancer (eg, adenomatous polyps, colorectal cancer, and other forms and / or stages of colon cancer).

【0113】 本明細書を通して使用される「サンプル」または「生物学的サンプル」は一般
的に、生物学的流体または組織のサンプル(特に、組織から得たサンプル、特に
診断適用が設計される疾患(例えば、腺管癌)に関連した種類の細胞由来のサンプ
ルなど)をいうことを意味する。「サンプル」はまた、このようなサンプルの誘
導体および画分(例えば、細胞溶解産物)を包含することを意味する。サンプルが
固形組織である場合、この組織の細胞は、解離され得るかまたは組織切片が分析
され得る。
As used throughout this specification, “sample” or “biological sample” generally refers to a sample of biological fluid or tissue (especially a sample obtained from tissue, particularly a disease for which a diagnostic application is designed. (For example, a sample derived from a cell of a type related to ductal carcinoma). “Sample” is also meant to include the derivatives and fractions (eg, cell lysates) of such a sample. If the sample is solid tissue, cells of this tissue can be dissociated or tissue sections can be analyzed.

【0114】 診断または予後において有用な本発明の方法は代表的に、目的のサンプル中の
選択される示差的に発現される遺伝子産物の量と、コントロールのその量とを比
較して、遺伝子産物の発現における任意の相対的な差異を決定する工程を包含し
、ここでこの差異は、定性的におよび/または定量的に測定され得る。定量は、
例えば、サンプルにおいて検出される発現産物のレベルと、検量線に存在する産
物の量とを比較することによって達成され得る。比較は、視覚的に;コンピュー
ター化した補助を伴うかまたは伴わないデンシトメトリーのような技術を使用す
ることによって;試験サンプルから単離されたmRNAのcDNAクローンの代
表的なライブラリーを調製し、そのライブラリー中のクローンを配列決定して同
じ遺伝子産物に対応するcDNAクローンの数を決定し、そしてコントロールサ
ンプル中の同じ遺伝子産物のクローンの数に対して、同じ遺伝子産物に対応する
クローンの数を分析することによって;またはアレイを使用して、選択された配
列もしくは配列のセットへのハイブリダイゼーションの相対的なレベルを検出し
、そしてこのハイブリダイゼーションパターンをコントロールのハイブリダイゼ
ーションパターンと比較することによって、なされ得る。次いで、発現における
差異は、異常な発現パターンの存在または不在と相関付けられる。サンプル中の
核酸の量を決定するための種々の異なる方法は、当業者に公知である(例えば、
WO97/27317を参照のこと)。一般に、本発明の診断アッセイは、配列
番号1〜3351の配列に対応するポリヌクレオチド配列(例えば、mRNAま
たはポリぺプチド)の遺伝子産物の検出を包含する。サンプルが得られる患者は
、明らかに健常であり得るか、(例えば、家族病歴または特定の環境因子への曝
露によって決定した場合)疾患に罹患しやすくあり得るか、または本発明の遺伝
子産物の変化した発現が関連する状態を有するとして既に同定されてい得る。
The methods of the invention useful in diagnosis or prognosis are typically performed by comparing the amount of a differentially expressed gene product of choice in a sample of interest to that of a control to obtain the gene product. Comprising the step of determining any relative difference in the expression of, which difference may be qualitatively and / or quantitatively measured. The quantification is
For example, it can be achieved by comparing the level of expression product detected in the sample with the amount of product present in the calibration curve. Comparisons are made visually; by using techniques such as densitometry with or without computerized assistance; preparing a representative library of cDNA clones of mRNA isolated from test samples. , Sequence the clones in the library to determine the number of cDNA clones corresponding to the same gene product, and compare the number of clones of the same gene product to the number of clones of the same gene product in the control sample. By analyzing the numbers; or using the array to detect the relative level of hybridization to a selected sequence or set of sequences and comparing this hybridization pattern to that of a control. Can be done by Differences in expression are then correlated with the presence or absence of aberrant expression patterns. A variety of different methods for determining the amount of nucleic acid in a sample are known to those of skill in the art (eg,
See WO 97/27317). In general, the diagnostic assays of the invention involve detection of the gene product of a polynucleotide sequence (eg, mRNA or polypeptide) corresponding to the sequences of SEQ ID NOs: 1-3351. The patient from whom the sample is obtained may be clearly healthy, may be predisposed to disease (as determined, for example, by family history or exposure to certain environmental factors), or changes in the gene product of the invention. Expression may have been previously identified as having a related condition.

【0115】 診断は、配列番号1〜3351において記載される配列を有する、少なくとも
1つの、好ましくは少なくとも2つ以上の、少なくとも3つ以上の、または少な
くとも4つ以上のポリヌクレオチドによってコードされる遺伝子産物の遺伝子産
物の検出された発現レベルに基づいて決定され得、そして配列番号1〜3351
の全て、ならびに/またはさらなる診断マーカーおよび/もしくは参照配列とし
て機能し得るさらなる配列に対応する遺伝子の発現の検出を包含し得る。診断方
法が、癌の存在または患者の癌への罹患しやすさを検出するために設計される場
合、アッセイは好ましくは、癌において示差的に発現されるポリヌクレオチドに
対応する遺伝子によってコードされる遺伝子産物の検出を包含する。このような
示差的に発現されるポリヌクレオチドの例は、以下の実施例において記載される
。提供されるポリヌクレオチドおよび本明細書中に提供されるそれらの相対的な
発現レベルに関する情報を考慮すれば、診断および予後において、このようなポ
リヌクレオチドおよびそれらの発現レベルの検出を使用するアッセイは、当業者
に容易に明らかである。
Diagnosis is a gene encoded by at least one, preferably at least two or more, at least three or more, or at least four or more polynucleotides having the sequences set forth in SEQ ID NOS: 1-3351. Can be determined based on the detected expression level of the gene product of the product, and SEQ ID NOs: 1-3351
And / or the detection of the expression of a gene corresponding to an additional diagnostic marker and / or an additional sequence that may function as a reference sequence. When the diagnostic method is designed to detect the presence of cancer or the susceptibility of a patient to cancer, the assay is preferably encoded by the gene corresponding to the polynucleotide differentially expressed in the cancer. Includes detection of gene products. Examples of such differentially expressed polynucleotides are described in the Examples below. Given the information provided on the polynucleotides provided and their relative expression levels provided herein, assays using the detection of such polynucleotides and their expression levels in diagnosis and prognosis would be , Will be readily apparent to one of ordinary skill in the art.

【0116】 任意の種々の検出可能な標識は、本発明の診断方法の種々の実施形態と関連し
て使用され得る。適切な検出可能な標識としては、蛍光色素(例えば、フルオレ
セインイソチオシアネート(FITC)、ローダミン、テキサスレッド、フィコ
エリトリン、アロフィコシアニン、6−カルボキシフルオレセイン(6−FAM
)、2’,7’−ジメトキシ−4’,5’−ジクロロ−6−カルボキシフルオレ
セイン、6−カルボキシ−X−ローダミン(ROX)、6−カルボキシ−2’,
4’,7’,4,7−ヘキサクロロフルオレセイン(HEX)、5−カルボキシ
フルオレセイン(5−FAM)、またはN,N,N’,N’,−テトラメチル−
6−カルボキシローダミン(TAMRA))、放射性標識(例えば、32P、35
3Hなど)などが挙げられる。検出可能な標識は、2段階系(例えば、ビオチ
ン−アビジン、ハプテン−抗ハプテン抗体など)を含み得る。
Any of a variety of detectable labels can be used in connection with various embodiments of the diagnostic methods of the present invention. Suitable detectable labels include fluorescent dyes (eg fluorescein isothiocyanate (FITC), rhodamine, Texas red, phycoerythrin, allophycocyanin, 6-carboxyfluorescein (6-FAM).
) 2 ', 7'-dimethoxy-4', 5'-dichloro-6-carboxyfluorescein, 6-carboxy-X-rhodamine (ROX), 6-carboxy-2 ',
4 ', 7', 4,7-hexachlorofluorescein (HEX), 5-carboxyfluorescein (5-FAM), or N, N, N ', N',-tetramethyl-
6-carboxyrhodamine (TAMRA), radioactive label (eg 32 P, 35 S
, 3 H) and the like. The detectable label can include a two-step system (eg, biotin-avidin, hapten-anti-hapten antibody, etc.).

【0117】 本発明のポリヌクレオチドおよびポリペプチドに特異的な試薬(例えば、抗体
およびヌクレオチドプローブ)は、生物学的サンプル中の発現産物の存在を検出
するためのキットにおいて供給され得る。キットはまた、緩衝剤または標識化成
分、ならびに生物学的サンプル中の発現産物を検出および定量するための試薬を
使用するための説明書を含み得る。本発明の診断方法の例示的な実施形態は、以
下により詳細に記載される。
Reagents specific to the polynucleotides and polypeptides of the invention (eg, antibodies and nucleotide probes) can be supplied in kits for detecting the presence of expression products in a biological sample. The kit can also include a buffer or labeling component, and instructions for using the reagents to detect and quantify the expression product in the biological sample. Exemplary embodiments of the diagnostic method of the present invention are described in more detail below.

【0118】 (診断におけるポリぺプチド検出) 1つの実施形態において、試験サンプル
は、示差的に発現されるポリぺプチドのレベルについてアッセイされる。診断は
、試験サンプル中の示差的に発現されるポリぺプチドの不在もしくは存在、また
は変化した量を決定するための多くの方法のいずれかを使用して達成され得る。
例えば、検出は、従来の方法に従って行われる、標識抗体での細胞または組織学
的切片の染色を利用し得る。細胞は、細胞質分子を染色するために透過化され得
る。一般に、本発明の示差的に発現されるポリぺプチドを特異的に結合する抗体
がサンプルに添加され、そしてエピトープへの結合を可能にするのに十分な期間
、通常少なくとも約10分間、インキュベートされる。抗体は、直接的な検出の
ために検出可能に標識され得るか(例えば、放射性同位体、酵素、蛍光体、化学
発光体などを使用して)、または結合を検出するための第2段階の抗体または試
薬と共に使用され得る(例えば、ビオチンと西洋ワサビペルオキシダーゼ結合体
化アビジン、蛍光化合物(例えば、フルオレセイン、ローダミン、テキサスレッ
ドなど)に結合体化した二次抗体)。抗体結合の不在または存在は、種々の方法
によって決定され得、この方法としては、解離された細胞のフローサイトメトリ
ー、顕微鏡法、X線撮影、シンチレーションカウンティングなどが挙げられる。
示差発現されるポリぺプチドのレベルまたは量の定性的または定量的な検出の任
意の適切な代替の方法(例えば、ELISA、ウェスタンブロット、免疫沈降、
ラジオイムノアッセイなど)が、使用され得る。
Polypeptide Detection in Diagnostic In one embodiment, test samples are assayed for the level of differentially expressed polypeptide. Diagnosis can be accomplished using any of a number of methods for determining the absence or presence, or altered amount, of a differentially expressed polypeptide in a test sample.
For example, detection can utilize staining of cells or histological sections with labeled antibodies, which is performed according to conventional methods. Cells can be permeabilized to stain cytoplasmic molecules. In general, an antibody that specifically binds the differentially expressed polypeptide of the invention is added to the sample and incubated for a period sufficient to allow binding to the epitope, usually at least about 10 minutes. It The antibody may be detectably labeled for direct detection (eg, using a radioisotope, an enzyme, a fluorophore, a chemiluminescer, etc.) or a second step for detecting binding. It can be used with antibodies or reagents (eg biotin and horseradish peroxidase conjugated avidin, secondary antibodies conjugated to fluorescent compounds (eg fluorescein, rhodamine, Texas red, etc.)). The absence or presence of antibody binding can be determined by various methods including flow cytometry of dissociated cells, microscopy, radiography, scintillation counting and the like.
Any suitable alternative method of qualitative or quantitative detection of the level or amount of differentially expressed polypeptide (eg, ELISA, Western blot, immunoprecipitation,
Radioimmunoassays, etc.) can be used.

【0119】 (mRNA検出) 本発明の診断方法はまた、もしくはあるいは、本発明の示
差的に発現されるポリヌクレオチドに対応する遺伝子によってコードされるmR
NAの検出を包含し得る。特異的なmRNAを検出するための当該分野において
公知の任意の適切な定性的または定量的な方法が、使用され得る。mRNAは、
例えば、組織切片におけるインサイチュハイブリダイゼーションによって、逆転
写酵素PCRによって、またはポリA+mRNAを含むノーザンブロットにおい
て、検出され得る。当業者は容易に、2つのサンプル間のmRNA転写物の大き
さまたは量における差異を検出するために、これらの方法を使用し得る。サンプ
ル中のmRNA発現レベルは、サンプルからの発現配列タグ(EST)のライブ
ラリーの作製によって決定され得、ここではESTライブラリーは、サンプル中
に存在する配列の代表である(Adamsら(1991)Science 25
2:1651)。ライブラリー内のESTの相対的な表示の列挙は、出発サンプ
ル内の遺伝子転写物の相対的な表示を近似するために使用され得る。次いで、試
験サンプルのEST分析の結果は、参照サンプルのEST分析と比較されて、選
択されるポリヌクレオチド、特に本明細書中に記載される1つ以上の示差的に発
現される遺伝子に対応するポリヌクレオチドの相対的な発現レベルを決定し得る
。あるいは、試験サンプル中の遺伝子発現は、遺伝子発現の連続分析(SAGE
)方法論(例えば、Velculescuら、Science(1995)27
0:484)またはディファレンシャルディスプレイ(DD)方法論(例えば、
米国特許第5,776,683号;および米国特許第5,807,680号を参
照のこと)を使用して行われ得る。
(Detection of mRNA) The diagnostic method of the present invention may also, or alternatively, be an mRNA encoded by a gene corresponding to the differentially expressed polynucleotide of the present invention.
The detection of NA may be included. Any suitable qualitative or quantitative method known in the art for detecting specific mRNA can be used. mRNA is
For example, it can be detected by in situ hybridization in tissue sections, by reverse transcriptase PCR, or in Northern blots containing poly A + mRNA. One of skill in the art can readily use these methods to detect differences in the size or amount of mRNA transcripts between two samples. The mRNA expression level in a sample can be determined by making a library of expressed sequence tags (ESTs) from the sample, where the EST library is representative of the sequences present in the sample (Adams et al. (1991). Science 25
2: 1651). A listing of the relative representations of ESTs in the library can be used to approximate the relative representations of gene transcripts in the starting sample. The results of the EST analysis of the test sample are then compared to the EST analysis of the reference sample to correspond to the selected polynucleotide, particularly one or more differentially expressed genes described herein. The relative expression level of the polynucleotide can be determined. Alternatively, gene expression in the test sample can be determined by serial analysis of gene expression (SAGE
) Methodology (eg, Velculescu et al., Science (1995) 27.
0: 484) or differential display (DD) methodology (eg,
See US Pat. No. 5,776,683; and US Pat. No. 5,807,680).

【0120】 あるいは、遺伝子発現は、ハイブリダイゼーション分析を使用して分析され得
る。オリゴヌクレオチドまたはcDNAは、特異的な配列組成のDNAまたはR
NA、および定性的または定量的に決定された公知の捕獲配列にハイブリダイズ
するRNAまたはcDNAの量を選択的に同定または捕獲するために、サンプル
中の細胞性メッセージのプール内の特定のメッセージの相対的な表示についての
情報を提供するために、使用され得る。ハイブリダイゼーション分析は、例えば
、高密度形式を有するアレイベースの技術(フィルター、顕微鏡スライド、もし
くはマイクロチップを含む)、または分光学的分析(例えば、質量分析)を用い
る溶液ベースの技術を使用することによって、数百〜数千の遺伝子の相対的な発
現の同時のスクリーニングを可能にするように設計され得る。本発明の診断方法
におけるアレイの1つの例示的な使用は、以下に、より詳細に記載される。
Alternatively, gene expression can be analyzed using hybridization analysis. Oligonucleotides or cDNAs are DNA or R of specific sequence composition.
In order to selectively identify or capture NA, and the amount of RNA or cDNA that hybridizes to a known qualitatively or quantitatively determined capture sequence, a specific message within a pool of cellular messages in a sample It can be used to provide information about relative displays. Hybridization analysis uses, for example, array-based techniques with high density formats (including filters, microscope slides, or microchips) or solution-based techniques with spectroscopic analysis (eg, mass spectrometry). Can be designed to allow simultaneous screening of relative expression of hundreds to thousands of genes. One exemplary use of arrays in the diagnostic methods of the invention is described in more detail below.

【0121】 (診断適用における単一遺伝子の使用) 本発明の診断方法は、単一の示差的
に発現される遺伝子の発現に集中し得る。例えば、診断方法は、疾患と関連した
、示差的に発現された遺伝子、またはこのような遺伝子の多型(例えば、コード
領域または制御領域における多型)を検出する工程を包含し得る。疾患関連性の
多型は、遺伝子の欠失または短縮、コードされるタンパク質の発現レベルを変化
させるおよび/またはコードされるタンパク質の活性に影響を与えるなどの変異
を含み得る。
Use of Single Genes in Diagnostic Applications The diagnostic methods of the invention can focus on the expression of a single differentially expressed gene. For example, a diagnostic method can include detecting a differentially expressed gene associated with a disease, or a polymorphism in such a gene (eg, a polymorphism in the coding or control regions). Disease-related polymorphisms may include mutations such as gene deletions or truncations, altered expression levels of the encoded protein and / or affecting the activity of the encoded protein.

【0122】 多くの方法が、特定の配列(例えば、疾患関連性の多型)の存在について核酸
を分析するために利用可能である。大量のDNAが利用可能である場合、ゲノム
DNAが直接的に使用される。あるいは、目的の領域は、適切なベクターにクロ
ーン化され、そして分析のために十分な量で増殖される。示差的に発現される遺
伝子を発現する細胞は、mRNAの供給源として使用され得、これは直接的にア
ッセイされ得るか、分析のためにcDNAへと逆転写され得る。核酸は、分析の
ために十分な量を提供するために、ポリメラーゼ連鎖反応(PCR)のような従
来の技術によって増幅され得、そして検出可能な標識が、検出を容易にするため
に増幅反応において含められ得る(例えば、検出可能に標識されるプライマーま
たは検出可能に標識されるオリゴヌクレオチドを使用する)。あるいは、多型を
検出する手段としてオリゴヌクレオチド連結を利用する種々の方法がまた、当該
分野において公知である。例えば、Rileyら、Nucl.Acids Re
s.(1990)18:2887;およびDelahuntyら、Am.J.H
um.Genet.(1996)58:1239を参照のこと。
Many methods are available for analyzing nucleic acids for the presence of particular sequences (eg, disease-associated polymorphisms). When large amounts of DNA are available, genomic DNA is used directly. Alternatively, the region of interest is cloned into an appropriate vector and grown in sufficient quantity for analysis. Cells expressing the differentially expressed gene can be used as a source of mRNA, which can be directly assayed or reverse transcribed into cDNA for analysis. The nucleic acid can be amplified by conventional techniques such as the polymerase chain reaction (PCR) to provide a sufficient amount for analysis, and a detectable label is added in the amplification reaction to facilitate detection. Can be included (eg, using detectably labeled primers or detectably labeled oligonucleotides). Alternatively, various methods that utilize oligonucleotide ligation as a means of detecting polymorphisms are also known in the art. See, for example, Riley et al., Nucl. Acids Re
s. (1990) 18: 2887; and Delahunty et al., Am. J. H
um. Genet. (1996) 58: 1239.

【0123】 増幅されたかまたはクローン化されたサンプル核酸は、当該分野において公知
の多くの方法のうちの1つによって分析され得る。核酸は、ジデオキシ法または
他の方法によって配列決定され得、そして塩基の配列は、選択された配列(例え
ば、野生型配列)と比較され得る。多型配列または改変体配列とのハイブリダイ
ゼーションはまた、サンプル中のその存在を決定するために(例えば、サザンブ
ロット、ドットブロットなどにより)使用され得る。米国特許第5,445,9
34号またはWO95/35505において記載されるように、固体支持体上に
固定されたオリゴヌクレオチドプローブのアレイに対する、多型配列または改変
体配列、およびコントロール配列のハイブリダイゼーションパターンはまた、疾
患と関連する多型配列または改変体配列を同定する手段として使用され得る。ゲ
ルマトリクスにおける一本鎖高次構造多型(SSCP)分析、変性勾配ゲル電気
泳動(DGGE)、およびヘテロ二重鎖分析は、電気泳動移動度の変化としてD
NA配列バリエーションによって作成される高次構造変化を検出するために使用
される。あるいは、多型が制限エンドヌクレアーゼについての認識部位を作製ま
たは破壊する場合、サンプルは、そのエンドヌクレアーゼで消化され、そして産
物は、フラグメントが消化されたか否かを決定するためにサイズ分画される。分
画は、ゲル電気泳動またはキャピラリー電気泳動(特にアクリルアミドゲルまた
はアガロースゲル)によって行われる。
Amplified or cloned sample nucleic acid can be analyzed by one of many methods known in the art. Nucleic acids can be sequenced by the dideoxy method or other methods, and the sequence of bases can be compared to a selected sequence (eg, wild type sequence). Hybridization with a polymorphic or variant sequence can also be used to determine its presence in a sample (eg, by Southern blot, dot blot, etc.). US Patent No. 5,445,9
No. 34 or WO 95/35505, hybridization patterns of polymorphic or variant sequences and control sequences to an array of oligonucleotide probes immobilized on a solid support are also associated with disease. It can be used as a means to identify polymorphic or variant sequences. Single-stranded conformational polymorphism (SSCP) analysis in gel matrix, denaturing gradient gel electrophoresis (DGGE), and heteroduplex analysis showed D as a change in electrophoretic mobility.
Used to detect conformational changes created by NA sequence variations. Alternatively, if the polymorphism creates or destroys a recognition site for a restriction endonuclease, the sample is digested with that endonuclease and the product is size fractionated to determine if the fragment was digested. . Fractionation is performed by gel electrophoresis or capillary electrophoresis (especially acrylamide gel or agarose gel).

【0124】 遺伝子における変異についてのスクリーニングは、タンパク質の機能特性なま
たは抗原特性に基づき得る。タンパク質短縮アッセイは、タンパク質の生物学的
活性に影響し得る欠失を検出する際に有用である。タンパク質における多型を検
出するために設計される多様な免疫アッセイが、スクリーニングにおいて使用さ
れ得る。多くの種々の遺伝子変異が、特定の疾患表現型を導く場合、機能性タン
パク質アッセイが、有効なスクリーニングのツールであることが証明された。コ
ードされるタンパク質の活性は、野生型タンパク質との比較によって決定され得
る。
Screening for mutations in a gene may be based on the functional or antigenic properties of the protein. Protein shortening assays are useful in detecting deletions that can affect the biological activity of proteins. A variety of immunoassays designed to detect polymorphisms in proteins can be used in the screen. Functional protein assays have proven to be effective screening tools when many different genetic mutations lead to specific disease phenotypes. The activity of the encoded protein can be determined by comparison with the wild type protein.

【0125】 (アレイを使用する診断におけるパターン適合化)別の実施形態において、本
発明の診断および/または予後の方法は、試験発現パターン(TEP)を生成す
るために、試験サンプル中の遺伝子の選択されたセットの発現の検出を含む。T
EPは、参照サンプル(例えば、ポジティブコントロールサンプルまたはネガテ
ィブコントロールサンプル)中の遺伝子の選択されたセットの発現の検出によっ
て生成される参照発現パターン(REP)と比較される。遺伝子の選択されたセ
ットは、本発明の遺伝子のうちの少なくとも1つを含み、これらの遺伝子は、配
列番号1〜3351のポリヌクレオチド配列に対応する。特に重要なのは、試験
サンプルがスクリーニングされる疾患において示差的に発現される遺伝子を含む
遺伝子の選択されたセットである。
Pattern Matching in Diagnostic Using Arrays In another embodiment, the diagnostic and / or prognostic method of the present invention involves the generation of a test expression pattern (TEP) of genes in a test sample. Includes detection of expression for a selected set. T
The EP is compared to a reference expression pattern (REP) generated by detecting the expression of a selected set of genes in a reference sample (eg, positive control sample or negative control sample). The selected set of genes comprises at least one of the genes of the invention, these genes corresponding to the polynucleotide sequences of SEQ ID NOs: 1-3351. Of particular importance is a selected set of genes, including genes that are differentially expressed in the disease for which the test sample is being screened.

【0126】 示差的遺伝子発現分析および診断/予後に関して本明細書中で使用される場合
に、「参照配列」または「参照ポリヌクレオチド」は、ポリヌクレオチドの選択
されたセットをいい、この選択されたセットは、本明細書中に記載される示差的
に発現されるポリヌクレオチドのうちの少なくとも1つ以上を含む。複数の参照
配列(好ましくはポジティブコントロール配列およびネガティブコントロール配
列を含む)が、参照配列として含まれ得る。さらに適切な参照配列は、GenB
ank、Unigene、および他のヌクレオチド配列データベースにおいて見
出される(例えば、発現配列タグ(EST)、部分配列および全長配列を含む)
As used herein with respect to differential gene expression analysis and diagnosis / prognosis, a “reference sequence” or “reference polynucleotide” refers to a selected set of polynucleotides, which has been selected. The set comprises at least one or more of the differentially expressed polynucleotides described herein. Multiple reference sequences may be included as reference sequences, preferably including positive and negative control sequences. A more suitable reference sequence is GenB
found in ank, Unigene, and other nucleotide sequence databases (including, for example, expressed sequence tags (ESTs), partial and full length sequences)
.

【0127】 「参照アレイ」は、サンプルとのハイブリダイゼーションにおける使用のため
の参照配列を有するアレイを意味し、ここでは参照配列は、本明細書中に記載さ
れる示差的に発現されたポリヌクレオチドのうちの全て、それらのうちの少なく
とも1つ、またはそれらのうちの任意のサブセットを含む。通常このようなアレ
イは、少なくとも3つの異なる参照配列を含み、そして提供された示差的に発現
される配列のいずれか1つまたは全てを含み得る。目的のアレイはさらに、他の
遺伝子配列(特に疾患または障害(例えば、癌、異形成、あるいは他の関連があ
るかまたは関連のない疾患、障害もしくは状態)についてスクリーニングするた
めの目的の他の配列)の配列(多型を含む)を含み得る。このアレイにおけるオ
リゴヌクレオチド配列は通常、少なくとも約12nt長であり、そしておよそ提
供される配列の長さであり得るし、または100nt〜200nt長以上のフラ
グメントを生成するように隣接領域へ伸長され得る。参照アレイは、当該分野に
おいて公知の任意の適切な方法に従って作製し得る。例えば、オリゴヌクレオチ
ドの大きなアレイを作製する方法は、光指向性合成技術を使用する米国特許第5
,134,854号および米国特許第5,445,934号において記載される
。コンピューター制御系を使用して、モノマーの不均一アレイが、多くの反応部
位での同時のカップリングを介してポリマーの不均一アレイへ変換される。ある
いは、マイクロアレイが、例えば、PCT公開出願WO95/35505におい
て記載されるように、固体基材上への予め合成されたオリゴヌクレオチドの堆積
によって作製される。
“Reference array” means an array having a reference sequence for use in hybridization with a sample, wherein the reference sequence is the differentially expressed polynucleotide described herein. Of all, at least one of them, or any subset of them. Generally, such arrays contain at least three different reference sequences and may contain any one or all of the differentially expressed sequences provided. The array of interest further includes other sequences of interest, particularly for screening for other gene sequences, such as diseases or disorders (eg, cancer, dysplasia, or other related or unrelated diseases, disorders or conditions). ) Sequences (including polymorphisms). The oligonucleotide sequences in this array are typically at least about 12 nt in length, and can be approximately the length of the sequence provided, or can be extended into flanking regions to produce fragments 100 nt to 200 nt or longer. The reference array may be made according to any suitable method known in the art. For example, a method of making large arrays of oligonucleotides is described in US Pat.
, 134,854 and US Pat. No. 5,445,934. Using a computer control system, a heterogeneous array of monomers is converted into a heterogeneous array of polymers via simultaneous coupling at many reaction sites. Alternatively, microarrays are made by deposition of pre-synthesized oligonucleotides on a solid substrate, as described, for example, in PCT published application WO 95/35505.

【0128】 本明細書中で使用される場合「参照発現パターン」あるいは「REP」は、遺
伝子(特に、選択された細胞型(例えば、正常細胞、癌細胞、環境刺激に曝露さ
れた細胞など)と相関する、示差的に発現される遺伝子)の選択されたセットの
相対的な発現レベルをいう。「試験発現パターン」または「TEP」は、試験サ
ンプル(例えば、mRNAが単離される、未知の疾患状態の細胞または疾患状態
が疑われる細胞)中の、遺伝子(特に、示差的に発現される遺伝子)の選択され
たセットの相対的な発現レベルをいう。
As used herein, a “reference expression pattern” or “REP” refers to a gene (especially a selected cell type (eg, normal cells, cancer cells, cells exposed to environmental stimuli, etc.)). Relative expression level of a selected set of differentially expressed genes, which correlate with. A "test expression pattern" or "TEP" is a gene (especially a differentially expressed gene) in a test sample (eg, a cell in an unknown disease state or a suspected disease state in which mRNA is isolated). ) Refers to the relative expression level of the selected set.

【0129】 REPは、当該分野において周知の方法に従って、種々の方法において作製さ
れ得る。例えば、REPは、ポリヌクレオチドの選択されたセット(特に、示差
的に発現されるポリヌクレオチドの選択されたセット)を有するアレイに、コン
トロールサンプルをハイブリダイズし、アレイからのハイブリダイゼーションデ
ータを獲得し、そしてREPとTEPとの容易な比較を可能にするフォーマット
でデータを保存することによって作製され得る。あるいは、コントロールサンプ
ル中の発現される全ての配列は、例えば、コントロールサンプルからmRNAを
単離し、mRNAをcDNAに変換し、そしてcDNAを配列決定することによ
って、単離および配列決定され得る。得られる配列情報は、サンプル中の発現さ
れる配列の正体および相対的な数をおよそまたは正確に反映する。次いで、配列
情報は、REPとTEPとの容易な比較を可能にするフォーマット(例えば、コ
ンピューター読み出し可能なフォーマット)で保存され得る。REPは、データ
保存の前または後に正規化され得、そして/またはあまり重要ではないかまたは
分析を複雑にし得る発現された遺伝子の配列を選択的に除去するように処理され
得る(例えば、ハウスキーピング遺伝子と関連する配列のいくつかまたは全ては
、REPデータから排除され得る)。
REPs can be made in various ways, according to methods well known in the art. For example, REP hybridizes a control sample to an array having a selected set of polynucleotides, particularly a selected set of differentially expressed polynucleotides, and acquires hybridization data from the array. , And can be made by storing the data in a format that allows easy comparison of REP and TEP. Alternatively, all expressed sequences in a control sample can be isolated and sequenced, for example, by isolating mRNA from the control sample, converting the mRNA to cDNA, and sequencing the cDNA. The sequence information obtained approximately or accurately reflects the identity and relative number of expressed sequences in the sample. The sequence information can then be stored in a format that allows easy comparison of REP and TEP, such as a computer readable format. REPs can be normalized before or after data storage and / or can be treated to selectively remove sequences of expressed genes that may be less important or complicate analysis (eg, housekeeping). Some or all of the sequences associated with the gene can be excluded from the REP data).

【0130】 TEPは、例えば、ポリヌクレオチドの選択されたセット(特に示差的に発現
されるポリヌクレオチドの選択されたセット)を有するアレイに試験サンプルを
ハイブリダイズさせ、このアレイからハイブリダイゼーションデータを獲得し、
そしてTEPとREPとの容易な比較を可能にするフォーマットでデータを保存
することによって、RFPと同様な様式で作製され得る。比較において使用され
るREPおよびTEPは、同時に作製され得るか、またはTEPが、事前に作製
されかつ保存されたREPと比較され得る。
TEP, for example, hybridizes a test sample to an array having a selected set of polynucleotides, particularly a selected set of differentially expressed polynucleotides, and obtains hybridization data from the array. Then
It can then be made in a manner similar to RFP by storing the data in a format that allows easy comparison of TEP and REP. The REP and TEP used in the comparison can be made at the same time, or the TEP can be compared to a previously made and stored REP.

【0131】 本発明の1つの実施形態において、TEPとREPとの比較は、試験サンプル
と参照アレイとをハイブリダイズする工程を包含し、ここでは参照アレイは、サ
ンプルとのハイブリダイゼーションにおける使用のために1つ以上の参照配列を
有する。参照配列は、本明細書中に記載の示差的に発現されるポリヌクレオチド
のうちの全て、それらのうちの少なくとも1つ、またはそれらのうちの任意のサ
ブセットを含む。試験サンプルについてのハイブリダイゼーションデータが獲得
され、そのデータは正規化され、そして作製されたTEPは、示差的に発現され
るポリヌクレオチドの同じまたは類似の選択されたセットを有するアレイを使用
して、作製されたREPと比較される。2つのサンプル間で示差的に発現される
配列に対応するプローブは、サンプルのうちの一方について、他方にくらべて減
少したかまたは増加したハイブリダイゼーション効率を示す。
In one embodiment of the invention, comparing TEP and REP comprises hybridizing a test sample with a reference array, where the reference array is for use in hybridization with the sample. With one or more reference sequences. A reference sequence comprises all of the differentially expressed polynucleotides described herein, at least one of them, or any subset thereof. Hybridization data for the test samples were acquired, the data were normalized, and the TEPs generated were generated using an array with the same or similar selected set of differentially expressed polynucleotides. It is compared to the REP made. Probes corresponding to sequences that are differentially expressed between the two samples show reduced or increased hybridization efficiency for one of the samples compared to the other.

【0132】 サンプルと参照アレイとのハイブリダイゼーションからのデータの収集のため
の方法は、当該分野において周知である。例えば、参照サンプルおよび試験サン
プルのポリヌクレオチドは、検出可能な蛍光標識を使用して生成され得、そして
サンプルにおけるポリヌクレオチドのハイブリダイゼーションは、例えば、顕微
鏡または基質に光を当てるための光源とを使用して、検出可能な標識の存在につ
いてマイクロアレイをスキャンすることによって検出され得る。光子カウンター
は、基質からの蛍光を検出し、一方、x−y平行移動(translation
)ステージは基質の位置を変化させる。本発明の方法において使用され得る共焦
点検出デバイスは、米国特許第5,631,734号において記載される。走査
型レーザー顕微鏡は、Shalonら、Genome Res.(1996)6
:639において記載される。適切な励起線を使用するスキャンが、使用される
各蛍光団について行われる。次いで、スキャンから作製されるデジタル画像が、
その後の分析のために組合わされる。任意の特定のアレイエレメントについて、
1つのサンプル(例えば、試験サンプル)からの蛍光シグナルの比率は、別のサ
ンプル(例えば、参照サンプル)からの蛍光シグナルと比較され、そして相対的
なシグナル強度が決定される。
Methods for collecting data from hybridization of a sample with a reference array are well known in the art. For example, the reference sample and the test sample polynucleotides can be generated using a detectable fluorescent label, and hybridization of the polynucleotides in the sample can be performed using, for example, a microscope or a light source to illuminate a substrate. And can be detected by scanning the microarray for the presence of detectable label. The photon counter detects the fluorescence from the substrate, while the xy translation.
The stage changes the position of the substrate. Confocal detection devices that can be used in the method of the present invention are described in US Pat. No. 5,631,734. Scanning laser microscopes are described by Shalon et al., Genome Res. (1996) 6
: 639. A scan using the appropriate excitation line is performed for each fluorophore used. Then the digital image created from the scan
Combined for subsequent analysis. For any particular array element,
The ratio of the fluorescent signal from one sample (eg the test sample) is compared to the fluorescent signal from another sample (eg the reference sample) and the relative signal intensities are determined.

【0133】 アレイへのハイブリダイゼーションから収集されるデータを分析するための方
法は、当該分野において周知である。例えば、ハイブリダイゼーションの検出が
蛍光標識を含む場合、データ分析は、収集されたデータからの基質の位置の関数
として蛍光強度を決定する工程、アウトライアー(すなわち、予め決定された統
計学的分布から逸脱するデータ)を除く工程、および残りのデータから標的の相
対的な結合親和性を算定する工程を包含し得る。得られるデータは、標的とプロ
ーブとの間の結合親和性に従って変化する各領域における強度とともに、画像と
して提示され得る。
Methods for analyzing the data collected from hybridization to arrays are well known in the art. For example, if detection of hybridization involves a fluorescent label, data analysis may include determining fluorescence intensity as a function of substrate position from the collected data, outliers (ie, from a predetermined statistical distribution). Deviating data) and calculating the relative binding affinity of the target from the remaining data. The data obtained can be presented as an image, with intensities in each region varying according to the binding affinity between target and probe.

【0134】 一般に、試験サンプルは、試験サンプルから作製されるTEPを、参照サンプ
ルから(例えば、癌、癌の特定の段階、異形成と関連するサンプル、癌以外の疾
患に罹患したサンプル、正常サンプルなどから)作製される1つ以上のREPと
比較することによって、疾患状態または非疾患状態と関連する遺伝子発現プロフ
ィールに対応する遺伝子発現プロフィールを有すると分類される。TEPとRE
Pとの間の適合、または実質的な適合についての基準は、参照遺伝子の同じまた
は実質的に同じセットの発現、および実質的に同じレベル(例えば、サンプルの
正規化後に選択された参照配列と関連するシグナルについて、サンプル間で有意
差がないか、または所定の参照配列についてのシグナル強度における、少なくと
も約25%〜約40%を超えない差異)でのこれらの参照遺伝子の発現を含む。
一般に、TEPとREPとの間のパターン適合は、本発明の示差的に発現される
遺伝子のうちの少なくとも1つ、それらのうちの全て、またはそれらのうちの任
意のサブセットの、発現における適合(好ましくは定性的または定量的な発現レ
ベルにおける適合)を含む。
Generally, a test sample is a TEP made from a test sample that is derived from a reference sample (eg, cancer, a particular stage of cancer, a sample associated with dysplasia, a sample affected by a disease other than cancer, a normal sample). Are classified as having a gene expression profile that corresponds to a gene expression profile associated with a diseased or non-diseased condition by comparison with one or more REPs that are produced. TEP and RE
The criteria for a match, or a substantial match, with P are expression of the same or substantially the same set of reference genes, and substantially the same level (eg, with the reference sequence selected after normalization of the sample). Expression of these reference genes is not significantly different between samples for relevant signals, or a difference in signal intensity for a given reference sequence of at least about 25% to not more than about 40%.
In general, a pattern match between TEP and REP is a match in expression of at least one, all of them, or any subset thereof of the differentially expressed genes of the invention ( Preferably at a qualitative or quantitative expression level).

【0135】 パターン適合化は、手動で行われ得るか、またはコンピュータープログラムを
使用して行われ得る。基質マトリクス(例えば、アレイ)の調製のための方法、
このようなマトリクスとともに使用するオリゴヌクレオチドの設計のための方法
、プローブの標識化のための方法、ハイブリダイゼーション条件のための方法、
ハイブリダイズされたマトリクスのスキャニングのための方法、および生成され
るパターンの分析(比較分析を含む)のための方法は、例えば米国特許第5,8
00,992号において記載される。
Pattern matching can be done manually or using computer programs. A method for the preparation of a substrate matrix (eg an array),
Methods for designing oligonucleotides for use with such matrices, methods for labeling probes, methods for hybridization conditions,
Methods for scanning hybridized matrices, and for analysis of the patterns produced (including comparative analysis) are described, for example, in US Pat.
00,992.

【0136】 (癌の診断、予後、および管理) 本発明のポリヌクレオチドおよびそれらの遺伝子産物は、発癌経路に沿って最
も初期の変化を検出する遺伝子マーカーまたは生化学的マーカー(例えば、血液
もしくは組織中で)として、ならびに/または種々の治療および予防的介入の効
力をモニターするために、特に重要である。例えば、あるポリヌクレオチドの発
現のレベルは、より不十分な予後の指標であり得、それゆえ、患者に対してより
攻撃的な化学療法または放射線療法を保証し、逆もまた同じである。患者におけ
る処置に対する応答および結果と、新規な代用の腫瘍特異的特徴との相関は、そ
の腫瘍の分子プロフィールに基づいて調整される治療の設計を可能にする予後の
指標を規定し得る。これらの治療は、抗体標的化および遺伝子治療を包含する。
あるポリヌクレオチドの発現を決定すること、ならびに患者のプロフィールを正
常な組織および疾患の改変体における既知の発現と比較することは、処置の特異
性に関して、および患者の苦痛のないレベルに関しての両方で、患者についての
最も良好な可能な処置の決定を可能にする。ポリヌクレオチド発現のような代用
の腫瘍マーカーはまた、より良好な分類のために、従って、癌の異なる形態およ
び疾患状態を診断および処置するために、使用され得る。本発明のポリヌクレオ
チドの発現レベルの同定から得られ得る、腫瘍学において広範に使用される2つ
の分類は、癌障害の病期分類、および癌組織の性質の悪性度分類である。
Cancer Diagnosis, Prognosis, and Management Polynucleotides and their gene products of the present invention include genetic or biochemical markers (eg, blood or tissue) that detect the earliest changes along the carcinogenic pathway. In) and / or to monitor the efficacy of various therapeutic and prophylactic interventions. For example, the level of expression of a given polynucleotide may be indicative of a poorer prognosis, and thus warrants more aggressive chemotherapy or radiation therapy to the patient and vice versa. Correlation of response and outcome to treatment in patients with novel surrogate tumor-specific characteristics may define prognostic indicators that allow for the design of a therapy tailored based on the tumor's molecular profile. These therapies include antibody targeting and gene therapy.
Determining the expression of a polynucleotide, and comparing the patient's profile to known expression in normal tissue and disease variants, both in terms of treatment specificity and in terms of patient's pain-free level. , Enables the determination of the best possible treatment for a patient. Surrogate tumor markers such as polynucleotide expression can also be used for better classification, and thus for diagnosing and treating different forms of cancer and disease states. Two widely used classes in oncology that may result from the identification of expression levels of the polynucleotides of the invention are staging of cancer disorders and grading of the nature of cancerous tissue.

【0137】 本発明のポリヌクレオチドは、潜在的に悪性の事象を、それらが肉眼形態学的
レベルで検出可能となる前に分子レベルで検出するために、癌を有するかまたは
癌に感受性の患者をモニターするために有用であり得る。さらに、1つの型の癌
にとって重要であると同定される本発明のポリヌクレオチドはまた、他の型の癌
の発症または発症の危険性についての関連性を有し得、例えば、ここではポリヌ
クレオチドは種々の癌の型にわたって差次的に発現される。従って、例えば、転
移性の結腸癌について臨床学的関連性を有するポリヌクレオチドの発現はまた、
胃癌または子宮内膜癌について臨床学的関連性を有し得る。
The polynucleotides of the present invention allow patients with or susceptible to cancer to detect potentially malignant events at the molecular level before they are detectable at the gross morphological level. Can be useful for monitoring. In addition, the polynucleotides of the present invention identified as being important for one type of cancer may also have relevance for the development or risk of developing another type of cancer, eg, where the polynucleotide Is differentially expressed across various cancer types. Thus, for example, expression of a polynucleotide of clinical relevance for metastatic colon cancer may also be
It may have clinical relevance for gastric cancer or endometrial cancer.

【0138】 病期分類。病期分類は、患者において癌の状態がどのくらい進行したかを記載
するために、医師によって使用されるプロセスである。一般に、癌がどのリンパ
節にも広がることなく原発性病変の領域においてのみ検出可能である場合、この
癌は病期Iと呼ばれる。癌が最も近いリンパ節にのみ広がった場合、これは病期
IIと呼ばれる。病期IIIにおいて、癌は一般に、原発性病変の部位に近位の
リンパ節に広がっている。身体の遠位の部分(例えば、肝臓、骨、脳、または他
の部位)に広がった癌は、病期IVであり、最も進行した病期である。
Staging. Staging is a process used by physicians to describe how advanced a cancerous condition is in a patient. Generally, if the cancer does not spread to any lymph nodes and can be detected only in the area of the primary lesion, it is referred to as stage I. If the cancer has spread only to the closest lymph nodes, it is called stage II. In stage III, the cancer has generally spread to lymph nodes proximal to the site of the primary lesion. Cancer that has spread to distant parts of the body (eg, liver, bones, brain, or other sites) is stage IV and is the most advanced stage.

【0139】 本発明のポリヌクレオチドは、癌の攻撃性(例えば、転移能)、および身体の
異なる領域における存在についてのマーカーを同定することによって、病期分類
プロセスの微調整を容易にし得る。従って、高い転移能の癌を示すポリヌクレオ
チドを有する病期IIの癌は、境界の病期II腫瘍を病期III腫瘍へと変える
ために使用され得、より攻撃性の治療を正当化する。逆に、より低い転移能を示
すポリヌクレオチドの存在は、より保存的な腫瘍の病期分類を許容する。
The polynucleotides of the invention may facilitate fine tuning of the staging process by identifying markers for cancer aggressiveness (eg, metastatic potential) and presence in different areas of the body. Thus, stage II cancers with polynucleotides exhibiting high metastatic potential cancers can be used to convert borderline stage II tumors into stage III tumors, justifying more aggressive treatments. Conversely, the presence of polynucleotides with a lower metastatic potential allows for a more conservative tumor staging.

【0140】 癌の悪性度分類。悪性度は、腫瘍がその同じ型の正常な組織にどのくらい近く
似ているかを記載するために使用される用語である。腫瘍の顕微鏡での外観は、
細胞形態、細胞構成、および分化の他のマーカーのようなパラメーターに基づい
て、腫瘍の悪性度を同定するために使用される。一般的な法則として、腫瘍の悪
性度は、その増殖の速度または攻撃性に対応し、未分化の腫瘍または高い悪性度
の腫瘍は、十分に分化した腫瘍または低い悪性度の腫瘍よりも攻撃性である。以
下の指針は一般に、腫瘍を悪性度分類するために使用される:1)GX悪性度は
、評価され得ない;2)G1 十分に分化している;G2 中程度に十分に分化
している;3)G3 不十分にしか分化していない;4)G4 未分化。本発明
のポリヌクレオチドは、これが腫瘍の細胞の分化の状態を決定することを補助し
得るのみでなく、これらはまた腫瘍の攻撃性(例えば、転移能)を決定する際に
価値がある、分化以外の因子を同定し得るので、腫瘍の悪性度を決定するにおい
て特に価値があり得る。
Cancer grading. Grade is a term used to describe how closely a tumor resembles the same type of normal tissue. The appearance of the tumor under a microscope is
It is used to identify tumor grade based on parameters such as cell morphology, cell composition, and other markers of differentiation. As a general rule, a tumor's grade corresponds to its rate of growth or aggressiveness, with undifferentiated or high-grade tumors being more aggressive than well-differentiated or low-grade tumors. Is. The following guidelines are generally used to grade tumors: 1) GX grade cannot be assessed; 2) G1 well differentiated; G2 moderately well differentiated 3) G3 poorly differentiated; 4) G4 undifferentiated. Not only can the polynucleotides of the present invention help this to determine the state of differentiation of tumor cells, but they are also valuable in determining tumor aggression (eg, metastatic potential). It may be of particular value in determining the grade of a tumor, since factors other than can be identified.

【0141】 肺癌の検出。本発明のポリヌクレオチドは、被験体において肺癌を検出するた
めに使用され得る。1ダースよりも多くの異なる種類の肺癌が存在するが、肺癌
の2つの主な型は、小細胞癌および非小細胞癌であり、これらは全ての肺癌症例
のうちの約90%を包含する。小細胞癌(燕麦細胞癌とも呼ばれる)は通常、大
きい方の気管支の1つにおいて開始し、非常に迅速に増殖し、そして診断の時ま
でには大きくなる傾向がある。非小細胞肺癌(NSCLC)は、肺癌の3つの一
般的なサブタイプから構成される。類表皮癌(扁平上皮細胞癌とも呼ばれる)は
通常、大きい方の気管支の1つにおいて開始し、そして比較的ゆっくりと増殖す
る。これらの腫瘍のサイズは、非常に小さいサイズから非常に大きいサイズまで
の範囲であり得る。腺癌は、肺の外側の表面近くで増殖を開始し、そして大きさ
および増殖速度の両方において変化し得る。いくつかのゆっくりと増殖する腺癌
は、肺胞細胞癌として記載される。大細胞癌は、肺の表面近くで開始し、迅速に
増殖し、そして診断されるときには、増殖は通常、非常に大きい。肺癌の他のあ
まり一般的でない形態は、カルチノイド、円柱腫、粘液性類表皮癌、および悪性
中皮腫である。
Detection of lung cancer. The polynucleotides of the present invention can be used to detect lung cancer in a subject. Although there are more than a dozen different types of lung cancer, the two major types of lung cancer are small cell carcinoma and non-small cell carcinoma, which cover approximately 90% of all lung cancer cases. . Small cell carcinoma (also called oat cell carcinoma) usually begins in one of the larger bronchi, grows very quickly, and tends to grow by the time of diagnosis. Non-small cell lung cancer (NSCLC) is composed of three common subtypes of lung cancer. Epidermoid carcinoma (also called squamous cell carcinoma) usually starts in one of the larger bronchi and grows relatively slowly. The size of these tumors can range from very small to very large. Adenocarcinoma begins to grow near the outer surface of the lung and can vary in both size and growth rate. Some slowly growing adenocarcinomas are described as alveolar cell carcinomas. Large cell carcinoma begins near the surface of the lung, grows rapidly, and when diagnosed, the growth is usually very large. Other less common forms of lung cancer are carcinoids, cylinders, mucoepidermoid carcinomas, and malignant mesothelioma.

【0142】 本発明のポリヌクレオチド(例えば、正常な細胞対癌性肺細胞(例えば、高い
転移能の腫瘍細胞または低い転移能の腫瘍細胞)において差次的に発現されるポ
リヌクレオチド、もしくは癌性肺細胞の型の間(例えば、高い転移性対低い転移
性)で差次的に発現されるポリヌクレオチド)は、肺癌の型を区別するために、
ならびにある患者の癌に特異的な特性を同定するために、および適切な治療を選
択するために、使用され得る。例えば、患者の生検が、低い転移能と関連するポ
リヌクレオチドを発現する場合、これは病変を除去するための外科手術において
患者の肺の比較的大きな部分を残すことを正当化し得る。あるいは、高い転移能
と関連するポリヌクレオチドの発現を伴う比較的小さな病変は、転移が病理学的
試験を介して同定され得ない場合であってさえも、肺組織および/またはその周
囲のリンパ節のより根治的な除去を正当化し得る。
Polynucleotides of the invention (eg, normal cells versus polynucleotides that are differentially expressed in cancerous lung cells (eg, high or low metastatic tumor cells), or cancerous. Polynucleotides that are differentially expressed between lung cell types (eg, highly metastatic vs. low metastatic), to distinguish lung cancer types,
And can be used to identify cancer-specific characteristics of a patient and to select an appropriate treatment. For example, if a patient's biopsy expresses a polynucleotide associated with low metastatic potential, this may justify leaving a relatively large portion of the patient's lungs in surgery to remove the lesion. Alternatively, relatively small lesions with expression of polynucleotides associated with high metastatic potential are present in lung tissue and / or surrounding lymph nodes even if metastases cannot be identified through pathological examination. May justify a more radical removal of.

【0143】 乳癌の検出。乳癌の大多数は、腺癌のサブタイプであり、これは以下のように
まとめられ得る:1)上皮内腺管癌(DCIS)(面皰癌を含む);2)浸潤性
(または侵襲性)腺管癌(IDC);3)上皮内小葉癌(LCIS);4)浸潤
性(または侵襲性)小葉癌(ILC);5)炎症性乳癌;6)髄様癌;7)粘液
性癌腫;8)乳頭のパゲット病;9)葉状腫瘍、および10)管状腺癌。
Detection of breast cancer. The majority of breast cancers are subtypes of adenocarcinoma, which can be summarized as follows: 1) ductal carcinoma in situ (DCIS) (including comedone cancer); 2) invasive (or invasive). Ductal carcinoma (IDC); 3) Lobular carcinoma in situ (LCIS); 4) Lobular (or invasive) lobular carcinoma (ILC); 5) Inflammatory breast cancer; 6) Medullary carcinoma; 7) Mucinous carcinoma; 8) Paget's disease of the nipple; 9) lobular tumor, and 10) tubular adenocarcinoma.

【0144】 本発明のポリヌクレオチドの発現は、乳癌の診断および管理において、ならび
に乳癌の型の間を区別するために、使用され得る。乳癌の検出は、本発明の任意
の適切なポリヌクレオチドの発現レベルを、単独でかまたは組合わせてかのいず
れかで使用して、決定され得る。乳癌の攻撃性の性質および/または転移能の決
定はまた、本発明の1つ以上のポリヌクレオチドのレベルを比較し、そして癌性
組織において変化することが知られる別の配列のレベル(例えば、ER発現)を
比較することによって、決定され得る。さらに、乳癌の発症は、ステロイドホル
モン(例えば、テストステロンもしくはエストロゲン)のレベルに対する差次的
に発現されるポリヌクレオチドの発現の比率、または他のホルモン(例えば、成
長ホルモン、インスリン)に対する差次的に発現されるポリヌクレオチドの発現
の比率を試験することによって、検出され得る。従って、特定のマーカーポリヌ
クレオチドの発現は、正常な乳房組織と癌性の乳房組織との間を区別するため、
起源の異なる細胞を有する乳癌の間を区別するため、異なる潜在的な転移速度を
有する乳癌の間を区別するなどのために、使用され得る。
Expression of the polynucleotides of the invention can be used in the diagnosis and management of breast cancer and to distinguish between breast cancer types. Breast cancer detection can be determined using expression levels of any suitable polynucleotide of the invention, either alone or in combination. Determining the aggressive nature and / or metastatic potential of breast cancer also compares the levels of one or more polynucleotides of the invention and the levels of other sequences known to be altered in cancerous tissues (eg, ER expression) can be determined by comparison. In addition, the development of breast cancer is differentially expressed by the ratio of expression of differentially expressed polynucleotides to the level of steroid hormones (eg, testosterone or estrogen), or differentially to other hormones (eg, growth hormone, insulin). It can be detected by examining the rate of expression of the expressed polynucleotide. Therefore, expression of a particular marker polynucleotide distinguishes between normal and cancerous breast tissue,
It can be used to distinguish between breast cancers with cells of different origin, such as between breast cancers with different potential metastatic rates.

【0145】 結腸癌の検出。適切な発現パターンを示す本発明のポリヌクレオチドは、被験
体において結腸癌を検出するために使用され得る。結腸直腸癌は、ヒトにおける
最も一般的な新生物の1つであり、そしておそらく遺伝性の新生物の最も頻繁な
形態である。予防および初期の検出は、結腸直腸癌を制御および治癒することに
おける重要な因子である。結腸直腸癌は、結腸の内層において形成する、細胞の
小さな、良性の増殖物であるポリープとして開始する。数年間の期間にわたって
、これらのポリープのいくつかはさらなる変異を蓄積し、そして癌性になる。複
数の家族性結腸直腸癌障害が同定されており、これは以下のようにまとめられる
:1)家族性腺腫様ポリポーシス(FAP);2)ガードナー症候群;3)遺伝
性非ポリポシース結腸癌(HNPCC);および4)アシュケナージユダヤ人に
おける家族性結腸直腸癌。本発明の適切なポリヌクレオチドの発現は、結腸直腸
癌の診断、予後、および管理において使用され得る。結腸癌の検出は、任意のこ
れらの配列の発現レベルを、単独でかまたは発現のレベルと組合わせて使用して
、決定され得る。結腸癌の攻撃性の性質および/または転移能の決定は、本発明
の1つ以上のポリヌクレオチドのレベルを比較し、そして癌組織において変化す
ることが知られる別の配列の総レベル(例えば、p53、DCC ras、lo
r FAPの発現)を比較することによって、決定され得る(例えば、Fear
on ERら、Cell(1990)61(5):759;Hamilton
SRら、Cancer(1993)72:957;Bodmer Wら、Nat
Genet.(1994)4(3):217;Fearon ER、Ann
NY Acad Sci.(1995)768:101を参照のこと)。例えば
、結腸癌の発症は、癌遺伝子(例えば、ras)または腫瘍抑圧遺伝子(例えば
、FAPまたはp53)のレベルに対する本発明のポリヌクレオチドのいずれか
の比率を試験することによって、検出され得る。従って、特定のマーカーポリヌ
クレオチドの発現が、正常な結腸組織と癌性の結腸組織との間を区別するため、
起源の異なる細胞を有する結腸癌の間を区別するため、異なる潜在的な転移速度
を有する結腸癌の間を区別するなどのために、使用され得る。
Detection of colon cancer. Polynucleotides of the invention that exhibit the appropriate expression pattern can be used to detect colon cancer in a subject. Colorectal cancer is one of the most common neoplasms in humans, and is probably the most frequent form of hereditary neoplasm. Prevention and early detection are important factors in controlling and curing colorectal cancer. Colorectal cancer begins as polyps, which are small, benign outgrowths of cells that form in the lining of the colon. Over a period of several years, some of these polyps accumulate additional mutations and become cancerous. Multiple familial colorectal cancer disorders have been identified and are summarized as follows: 1) familial adenomatous polyposis (FAP); 2) Gardner's syndrome; 3) hereditary non-polyposis colon cancer (HNPCC). And 4) Familial colorectal cancer in Ashkenazi Jews. Expression of the appropriate polynucleotides of the invention can be used in the diagnosis, prognosis, and management of colorectal cancer. Detection of colon cancer can be determined using the expression level of any of these sequences, either alone or in combination with the level of expression. Determining the aggressive nature and / or metastatic potential of colon cancer involves comparing the levels of one or more polynucleotides of the invention and the total level of another sequence known to be altered in cancer tissue (eg, p53, DCC ras, lo
r FAP expression) can be determined by comparison (eg, Fear).
on ER et al., Cell (1990) 61 (5): 759; Hamilton.
SR et al., Cancer (1993) 72: 957; Bodmer W et al., Nat.
Genet. (1994) 4 (3): 217; Fearon ER, Ann.
NY Acad Sci. (1995) 768: 101). For example, the development of colon cancer can be detected by testing the ratio of either the polynucleotide of the invention to the level of an oncogene (eg, ras) or tumor suppressor gene (eg, FAP or p53). Therefore, the expression of a particular marker polynucleotide distinguishes between normal and cancerous colon tissue,
It can be used to distinguish between colon cancers with different origins of cells, such as between colon cancers with different potential metastatic rates.

【0146】 (ペプチドアナログおよびアンタゴニストについてスクリーニングするための
ポリヌクレオチドの使用) 本発明のポリヌクレオチドおよび対応する全長遺伝子によってコードされるポ
リぺプチドは、コードされるポリぺプチドの中からレセプターのような結合パー
トナーを同定するために、ペプチドライブラリーをスクリーニングするために使
用され得る。ペプチドライブラリーは、当該分野において公知の方法に従って合
成され得る(例えば、米国特許第5,010,175号およびWO91/178
23を参照のこと)。本発明のポリぺプチドのアゴニストまたはアンタゴニスト
は、シグナル伝達、抗体結合、レセプター結合、マイトジェンアッセイ、走化性
アッセイなどのような当該分野において公知の任意の利用可能な方法を使用して
、スクリーニングされ得る。アッセイ条件は理想的には、ネイティブな活性がイ
ンビボで示される条件、すなわち、生理学的pH、温度、およびイオン強度下の
条件に類似するべきである。適切なアゴニストまたはアンタゴニストは、被験体
において毒性の副作用を引き起こさない濃度で、ネイティブな活性の強力な阻害
または増強を示す。ネイティブなポリぺプチドへの結合について競合するアゴニ
ストまたはアンタゴニストは、ネイティブな濃度に等しいかまたはこれよりも大
きい濃度を必要とし得るが、そのポリぺプチドに不可逆的に結合し得るインヒビ
ターは、ほぼネイティブな濃度程度の濃度で添加され得る。
Use of Polynucleotides to Screen for Peptide Analogs and Antagonists Polypeptides encoded by the polynucleotides of the present invention and the corresponding full-length genes may be labeled as receptors among the encoded polypeptides. It can be used to screen peptide libraries to identify binding partners. Peptide libraries can be synthesized according to methods known in the art (eg, US Pat. No. 5,010,175 and WO 91/178).
23). Agonists or antagonists of the polypeptides of the invention can be screened using any available method known in the art such as signal transduction, antibody binding, receptor binding, mitogen assay, chemotaxis assay and the like. obtain. Assay conditions should ideally be similar to those in which native activity is shown in vivo, ie under physiological pH, temperature, and ionic strength. Suitable agonists or antagonists exhibit potent inhibition or enhancement of native activity at concentrations that do not cause toxic side effects in the subject. Agonists or antagonists that compete for binding to the native polypeptide may require concentrations equal to or greater than the native concentration, while inhibitors capable of irreversibly binding the polypeptide are nearly native. It can be added at a concentration as high as about 100%.

【0147】 このようなスクリーニングおよび実験は、本発明のポリヌクレオチドに対応す
る遺伝子またはcDNAによってコードされる、レセプターのような、新規なポ
リぺプチド結合パートナー、および新規な結合パートナーの少なくとも1つのペ
プチドアゴニストまたはアンタゴニストの同定を導き得る。このようなアゴニス
トおよびアンタゴニストは、レセプターがネイティブである細胞において、また
は遺伝子操作の結果としてレセプターを保持する細胞において、レセプター機能
を調節、増強、または阻害するために使用され得る。さらに、新規なレセプター
が公知のレセプターと生物学的に重要な特徴を共有する場合、アゴニスト/アン
タゴニスト結合についての情報は、公知のレセプターの改善されたアゴニスト/
アンタゴニストの開発を容易にし得る。
Such screens and experiments can be performed with novel polypeptide binding partners, such as receptors, encoded by a gene or cDNA corresponding to a polynucleotide of the invention, and at least one peptide of the novel binding partner. It may lead to the identification of agonists or antagonists. Such agonists and antagonists can be used to modulate, enhance, or inhibit receptor function in cells where the receptor is native or in cells which retain the receptor as a result of genetic engineering. Furthermore, where the novel receptor shares biologically significant characteristics with known receptors, information on agonist / antagonist binding can be obtained by improving the agonist / antagonist properties of known receptors.
It may facilitate the development of antagonists.

【0148】 (薬学的組成物および治療的使用) 本発明の薬学的組成物は、治療的に有効な量において、本発明のポリぺプチド
、抗体、またはポリヌクレオチド(アンチセンスヌクレオチドおよびリボザイム
を含む)を含み得る。本明細書中で使用される場合、用語「治療的に有効な量」
は、所望の疾患もしくは状態を処置、軽減、または予防するための、または検出
可能な治療的または予防的効果を示すための、治療剤の量をいう。効果は、例え
ば、化学マーカーまたは抗原レベルによって検出され得る。治療的効果はまた、
体温の低下のような身体的症状における減少を含む。被験体についての正確な有
効量は、被験体の大きさおよび健常度、状態の性質および程度、ならびに投与の
ために選択される治療薬または治療薬の組合せに依存する。従って、正確な有効
量を予め特定することは有用でない。しかし、所定の状態についての有効量は、
日常的な実験によって決定され、そして臨床医の判断の範囲内である。本発明の
目的のために、有効用量は、一般に、これが投与される個体において、約0.0
1mg/kg〜50mg/kg、または0.05mg/kg〜約10mg/kg
のDNA構築物である。
Pharmaceutical Compositions and Therapeutic Uses Pharmaceutical compositions of the invention include a polypeptide, antibody, or polynucleotide of the invention (antisense nucleotides and ribozymes in a therapeutically effective amount. ) May be included. As used herein, the term "therapeutically effective amount"
Refers to the amount of therapeutic agent to treat, reduce, or prevent the desired disease or condition, or to exhibit a detectable therapeutic or prophylactic effect. Effects can be detected by, for example, chemical markers or antigen levels. The therapeutic effect is also
Includes reductions in physical symptoms such as decreased body temperature. The precise effective amount for a subject will depend on the subject's size and health, the nature and extent of the condition, and the therapeutic agent or combination of therapeutic agents selected for administration. Therefore, it is not useful to pre-determine the exact effective amount. However, the effective dose for a given situation is
It will be determined by routine experimentation and is within the judgment of the clinician. For purposes of this invention, an effective dose will generally be about 0.0 in the individual to whom it is administered.
1 mg / kg to 50 mg / kg, or 0.05 mg / kg to about 10 mg / kg
DNA construct of.

【0149】 薬学的組成物はまた、薬学的に受容可能なキャリアを含み得る。用語「薬学的
に受容可能なキャリア」は、抗体またはポリぺプチドのような治療剤、遺伝子、
および他の治療剤の投与のためのキャリアをいう。この用語は、組成物を受容す
る個体に有害な抗体の産生をそれ自身は誘導せず、そして過度の毒性を伴わずに
投与され得る任意の薬学的キャリアをいう。適切なキャリアは、タンパク質、多
糖、ポリ乳酸、ポリグリコール酸、ポリマーアミノ酸、アミノ酸コポリマー、お
よび不活性なウイルス粒子のような大きな、ゆっくりと代謝される高分子であり
得る。このようなキャリアは当業者に周知である。治療的組成物における薬学的
に受容可能なキャリアは、水、生理食塩水、グリセロール、およびエタノールの
ような液体を含み得る。湿潤化剤または乳化剤、pH緩衝化物質などのような補
助物質もまた、このようなビヒクルに存在し得る。典型的に、治療的組成物は、
注射可能な、液体溶液または懸濁液のいずれかとして調製され;注射の前に液体
ビヒクル中で溶液または懸濁液とするのに適切な固体形態もまた、調製され得る
。リポソームは、薬学的に受容可能なキャリアの規定内に含まれる。薬学的に受
容可能な塩もまた、薬学的組成物中に存在し得る(例えば、塩化水素塩、臭化水
素塩、リン酸塩、硫酸塩などのような鉱酸塩;および酢酸塩、プロピオン酸塩、
マロン酸塩、安息香酸塩などのような有機酸の塩)。薬学的に受容される腑形剤
の徹底的な考察は、Remington’s Pharmaceutical
Sciences(Mack Pub. Co.、New Joursey 1
991)において利用可能である。
The pharmaceutical composition may also include a pharmaceutically acceptable carrier. The term "pharmaceutically acceptable carrier" refers to therapeutic agents such as antibodies or polypeptides, genes,
And other carriers for the administration of other therapeutic agents. The term refers to any pharmaceutical carrier that does not itself induce the production of antibodies harmful to the individual receiving the composition and can be administered without undue toxicity. Suitable carriers can be large, slowly metabolized macromolecules such as proteins, polysaccharides, polylactic acids, polyglycolic acids, polymeric amino acids, amino acid copolymers, and inactive virus particles. Such carriers are well known to those of ordinary skill in the art. Pharmaceutically acceptable carriers in therapeutic compositions may include liquids such as water, saline, glycerol and ethanol. Auxiliary substances such as wetting or emulsifying agents, pH buffering substances and the like, may also be present in such vehicles. Typically, the therapeutic composition is
Injectables, either prepared as liquid solutions or suspensions; solid forms suitable for solution or suspension in liquid vehicles prior to injection can also be prepared. Liposomes are included within the definition of pharmaceutically acceptable carriers. Pharmaceutically acceptable salts may also be present in pharmaceutical compositions (eg mineral salts such as hydrogen chloride, hydrobromide, phosphate, sulphate, etc .; and acetate, propione). Acid salt,
Salts of organic acids such as malonates, benzoates, etc.). A thorough discussion of pharmaceutically acceptable excipients can be found in Remington's Pharmaceuticals.
Sciences (Mack Pub. Co., New Joursey 1
991).

【0150】 (送達方法) 一旦処方されると、本発明の組成物は、(1)被験体に直接的
に投与され得る(例えば、ポリヌクレオチドまたはポリぺプチドとして)か;ま
たは(2)被験体に由来する細胞にエクスビボで送達され得る(例えば、エクス
ビボ遺伝子治療におけるように)。組成物の直接的な送達は一般に、非経口注射
(例えば、皮下、腹腔内、静脈内もしくは筋肉内、腫瘍内、または組織の間質腔
への注射)によって達成される。投与の他の態様としては、経口投与および肺投
与、坐薬、および経皮適用、針、および遺伝子銃またはハイポスプレイ(hyp
ospray)が挙げられる。投薬処置は、単回用量スケジュールまたは複数用
量スケジュールであり得る。
Methods of Delivery Once formulated, the compositions of the invention can (1) be administered directly to the subject (eg, as a polynucleotide or polypeptide); or (2) the subject. It can be delivered ex vivo to cells from the body (eg, as in ex vivo gene therapy). Direct delivery of the compositions is generally accomplished by parenteral injection (eg, subcutaneous, intraperitoneal, intravenous or intramuscular, intratumoral, or intrathecal tissue injection). Other modes of administration include oral and pulmonary administration, suppositories, and transdermal applications, needles, and gene guns or hypospray.
Osspray). Dosage treatment may be a single dose schedule or a multiple dose schedule.

【0151】 エクスビボ送達および被験体への形質転換された細胞の再移植のための方法は
、当該分野において公知であり、そして例えば、国際公開第WO93/1477
8号において記載される。イクスビボ適用において有用な細胞の例としては、例
えば、幹細胞、特に造血幹細胞、リンパ細胞、マクロファージ、樹状細胞、また
は腫瘍細胞が挙げられる。一般に、エクスビボおよびインビトロ適用のための核
酸の送達は、例えば、デキストラン媒介性のトランスフェクション、リン酸カル
シウム沈澱、ポリブレン媒介性のトランスフェクション、プロトプラスト融合、
電気泳動、リポソーム中のポリヌクレオチドのカプセル化、および核へのDNA
の直接的なマイクロインジェクションによって達成され得、全て当該分野におい
て周知である。
Methods for ex vivo delivery and reimplantation of transformed cells into a subject are known in the art and are described, for example, in International Publication No. WO93 / 1477.
No. 8 is described. Examples of cells useful in ex vivo applications include, for example, stem cells, particularly hematopoietic stem cells, lymphoid cells, macrophages, dendritic cells, or tumor cells. In general, delivery of nucleic acids for ex vivo and in vitro applications includes, for example, dextran-mediated transfection, calcium phosphate precipitation, polybrene-mediated transfection, protoplast fusion,
Electrophoresis, encapsulation of polynucleotides in liposomes, and DNA into the nucleus
Can be achieved by direct microinjection, all well known in the art.

【0152】 一旦本発明のポリヌクレオチドに対応する遺伝子が、新生物、形成異常、およ
び過形成のような、増殖性障害と相関することが見出されると、この障害は、提
供されるポリヌクレオチド、対応するポリぺプチド、または他の対応する分子(
例えば、アンチセンス、リボザイムなど)に基づく治療剤の投与による処置に反
応し易い。
Once the gene corresponding to a polynucleotide of the invention is found to correlate with proliferative disorders such as neoplasia, dysplasia, and hyperplasia, the disorder is provided by the provided polynucleotide, The corresponding polypeptide, or other corresponding molecule (
For example, it is more responsive to treatment by administration of therapeutic agents based on antisense, ribozymes, etc.).

【0153】 本発明の薬学的組成物の投与の用量および手段は、治療的組成物の特異的な質
、患者の状態、年齢、および体重、疾患の進行、ならびに他の関連の因子に基づ
いて決定される。例えば、本発明のポリヌクレオチド治療的組成物薬剤の投与は
、局所投与または全身投与を含み、注射、経口投与、パーティクルガン(par
ticle gun)、またはカテーテル法による投与、および局所的な投与が
挙げられる。好ましくは、治療的ポリヌクレオチド組成物は、本明細書中に開示
されるポリヌクレオチドの少なくとも12、22、25、30、または35の連
続したntのポリヌクレオチドに作動可能に連結されるプロモーターを含有する
発現構築物を含む。種々の方法が、治療的組成物を身体の特定の部位に直接的に
投与するために使用され得る。例えば、小さな転移性病変が位置づけられ、そし
て治療的組成物は、腫瘍の体内のいくつかの異なる位置において数回注射される
。あるいは、腫瘍を供給する動脈が同定され、そして治療的組成物は、組成物を
腫瘍に直接的に送達するために、このような動脈に注射される。壊死中心を有す
る腫瘍は吸引され、そして組成物は、腫瘍の今や空になった中心に直接的に注射
される。アンチセンス組成物は、例えば、組成物の局所的な適用によって腫瘍の
表面に直接的に投与される。X線画像化は、いくつかの上述の送達法を補助する
ために使用される。
The dosage and means of administration of the pharmaceutical compositions of the present invention are based on the specific quality of the therapeutic composition, the condition, age and weight of the patient, disease progression, and other relevant factors. It is determined. For example, administration of the polynucleotide therapeutic composition agents of the present invention includes local or systemic administration, including injection, oral administration, particle gun (par).
single gun), or administration by catheterization, and local administration. Preferably, the therapeutic polynucleotide composition contains a promoter operably linked to at least 12, 22, 25, 30, or 35 contiguous nt polynucleotides of the polynucleotides disclosed herein. Expression constructs. Various methods can be used to administer the therapeutic composition directly to a specific site in the body. For example, a small metastatic lesion is located and the therapeutic composition is injected several times at several different locations within the body of the tumor. Alternatively, the artery supplying the tumor is identified and the therapeutic composition is injected into such artery to deliver the composition directly to the tumor. Tumors with necrotic centers are aspirated, and the composition is injected directly into the now empty center of the tumor. The antisense composition is administered directly to the surface of the tumor, for example by topical application of the composition. X-ray imaging is used to aid in some of the above delivery methods.

【0154】 アンチセンスポリヌクレオチド、サブゲノムポリヌクレオチド、または特定の
組織に対する抗体を含有する治療的組成物のレセプター媒介性の標的化送達もま
た、使用され得る。レセプター媒介性のDNA送達技術は、例えば、Finde
isら、Trends Biotechnol.(1993)11:202;C
hiouら、Gene Therapeutics:Methods And
Applications Of Direct Gene Transfer
(J.A.Wolff編)(1994);Wuら、J. Biol. Chem
.(1988)263:621;Wuら、J. Biol. Chem.(19
94)269:542;Zenkeら、Proc. Natl. Acad.
Sci.(USA)(1990)87:3655;Wuら、J. Biol.
Chem.(1991)266:338において記載される。ポリヌクレオチド
を含有する治療的組成物は、遺伝子治療プロトコルにおける局所投与のために、
約100ng〜約200mgのDNAの範囲で投与される。約500ngから約
50mg、約1mg〜約2mg、約5mg〜約500g、および約20mg〜約
100mgのDNAの濃度範囲がまた、遺伝子治療プロトコルの間に使用され得
る。作用の(例えば、コードされる遺伝子産物のレベルを増強するまたは阻害す
るための)方法、形質転換および発現の効力のような因子は、アンチセンスサブ
ゲノムポリヌクレオチドの最終的な効力のために必要とされる投薬量に影響する
考慮すべき事柄である。組織のより大きな領域にわたってより優れた発現が所望
される場合、アンチセンスサブゲノムポリヌクレオチドのより多くの量、もしく
は投与の継続的なプロトコルにおいて再投与される同じ量、または例えば、腫瘍
部位の異なる近接のまたは近い組織部分への数回の投与が、ポジティブな治療的
結果を達成するために必要とされ得る。全ての場合において、臨床試験における
日常的な実験は、至適な治療的効果についての特定の範囲を決定する。抗炎症活
性を有するポリぺプチドまたはタンパク質をコードするポリヌクレオチド関連性
の遺伝子についての、適切な使用、用量、および投与は、米国特許第5,654
,173号において記載される。
Receptor-mediated targeted delivery of therapeutic compositions containing antisense polynucleotides, subgenomic polynucleotides, or antibodies to specific tissues can also be used. Receptor-mediated DNA delivery techniques are described, for example, in Finde.
is et al., Trends Biotechnol. (1993) 11: 202; C
hiou et al., Gene Therapeutics: Methods Ands.
Applications Of Direct Gene Transfer
(JA Wolff Ed.) (1994); Wu et al. Biol. Chem
. (1988) 263: 621; Wu et al., J. Am. Biol. Chem. (19
94) 269: 542; Zenke et al., Proc. Natl. Acad.
Sci. (USA) (1990) 87: 3655; Wu et al. Biol.
Chem. (1991) 266: 338. Therapeutic compositions containing a polynucleotide are provided for topical administration in gene therapy protocols,
Doses range from about 100 ng to about 200 mg DNA. DNA concentration ranges of about 500 ng to about 50 mg, about 1 mg to about 2 mg, about 5 mg to about 500 g, and about 20 mg to about 100 mg can also be used during gene therapy protocols. Factors such as methods of action (eg, to enhance or inhibit the level of the encoded gene product), transformation and expression potency are necessary for the ultimate potency of the antisense subgenomic polynucleotide. It is a matter of concern that affects the doses taken. If better expression is desired over a larger area of tissue, a higher amount of antisense subgenomic polynucleotide, or the same amount re-administered in a continuous protocol of administration, or, for example, at different tumor sites Multiple doses to adjacent or near tissue parts may be required to achieve positive therapeutic results. In all cases, routine experimentation in clinical trials will determine the specific range for optimal therapeutic effect. Suitable uses, doses and administrations for polynucleotide-related genes encoding polypeptides or proteins having anti-inflammatory activity are described in US Pat. No. 5,654.
, 173.

【0155】 本発明の治療的ポリヌクレオチドおよびポリぺプチドは、遺伝子送達ビヒクル
を使用して送達され得る。遺伝子送達ビヒクルは、ウイルス起源または非ウイル
ス起源であり得る(概して、Jolly、Cancer Gene Thera
py(1994)1:51;Kimura、Human Gene Thera
py(1994)5:845;Connelly、Human Gene Th
erapy(1995)1:815;およびKaplitt、Nature G
enetics(1994)6:148を参照のこと)。このようなコード配列
の発現は、内因性の哺乳動物または異種プロモーターを使用して誘導され得る。
コード配列の発現は、構成的または調節性のいずれかであり得る。
The therapeutic polynucleotides and polypeptides of the present invention can be delivered using gene delivery vehicles. Gene delivery vehicles can be of viral or non-viral origin (generally Jolly, Cancer Gene Thera.
py (1994) 1:51; Kimura, Human Gene Thera.
py (1994) 5: 845; Connelly, Human Gene Th.
erase (1995) 1: 815; and Kaplitt, Nature G.
Enetics (1994) 6: 148). Expression of such coding sequences can be induced using endogenous mammalian or heterologous promoters.
Expression of the coding sequence can be either constitutive or regulated.

【0156】 所望のポリヌクレオチドの送達および所望の細胞における発現のためのウイル
スベースのベクターは、当該分野において周知である。例示的なウイルスベース
のビヒクルとしては、組換えレトロウイルス(例えば、WO90/07936;
WO94/03622;WO93/25698;WO93/25234;米国特
許第5,219,740号;WO93/11230;WO93/10218;米
国特許第4,777,127号;英国特許第2,200,651号;EP 0
345 242;およびWO91/02805を参照のこと)、αウイルスベー
スのベクター(例えば、シンドビスウイルスベクター、セムリキ森林ウイルス(
ATCC VR−67;ATCC VR−1247)、ロスリバーウイルス(A
TCC VR−373;ATCC VR−1246)、およびベネズエラウマ脳
炎ウイルス(ATCC VR−923;ATCC VR−1250;ATCC
VR 1249;ATCC VR−532)、およびアデノ随伴ウイルス(AA
V)ベクター(例えば、WO94/12649、WO93/03769;WO9
3/19191;WO94/28938;WO95/11984、およびWO9
5/00655を参照のこと)が挙げられるが、これらに制限されない。Cur
iel. Hum. Gene Ther.(1992)3:147において記
載されるような殺傷されたアデノウイルスに連結されるDNAの投与もまた、用
いられ得る。
Viral-based vectors for delivery of desired polynucleotides and expression in desired cells are well known in the art. Exemplary virus-based vehicles include recombinant retroviruses (eg, WO90 / 07936;
WO94 / 03622; WO93 / 25698; WO93 / 25234; US Patent No. 5,219,740; WO93 / 11230; WO93 / 10218; US Patent No. 4,777,127; British Patent No. 2,200,651; EP 0
345 242; and WO 91/02805), alphavirus-based vectors (eg, Sindbis virus vector, Semliki Forest virus (see
ATCC VR-67; ATCC VR-1247), Ross River virus (A
TCC VR-373; ATCC VR-1246), and Venezuelan Equine Encephalitis Virus (ATCC VR-923; ATCC VR-1250; ATCC).
VR 1249; ATCC VR-532), and adeno-associated virus (AA).
V) vectors (eg WO94 / 12649, WO93 / 03769; WO9
3/19191; WO94 / 28938; WO95 / 11984, and WO9.
5/00655), but is not limited thereto. Cur
iel. Hum. Gene Ther. (1992) 3: 147, administration of DNA linked to a killed adenovirus can also be used.

【0157】 非ウイルス性送達ビヒクルおよび方法がまた用いられ得る。この方法としては
、以下が挙げられるがこれらに限定されない:殺傷されたアデノウイルスのみに
連結されたかまたは連結されていないポリカチオン性凝縮DNA(例えば、Cu
riel,Hum.Gene Ther.(1992)3:147を参照のこと
);リガンド連結DNA(例えば、Wu,J.Biol.Chem.264:1
6985(1989)を参照のこと);真核細胞送達ビヒクル細胞(例えば、米
国特許第5,814,482号;WO 95/07994;WO 96/170
72;WO 95/30763;およびWO 97/42338を参照のこと)
、ならびに細胞膜を用いた核電荷中和または融合。裸のDNAがまた使用され得
る。例示的な裸のDNA導入方法は、WO 90/11092および米国特許第
5,580,859号に記載されている。遺伝子送達ビヒクルとして役立ち得る
リポソームは、米国特許第5,422,120号;WO 95/13796;W
O 94/23697;WO 91/14445;および欧州特許052496
8に記載されている。さらなるアプローチが、Philip,Mol.Cell
Biol.14:2411(1994)、およびWoffendin,Pro
c.Natl.Acad.Sci.(1994)91:1581に記載されてい
る。
Non-viral delivery vehicles and methods can also be used. This method includes, but is not limited to, polycationic condensed DNA (eg Cu, linked only to killed adenovirus or unlinked).
riel, Hum. Gene Ther. (1992) 3: 147); ligand-ligated DNA (eg, Wu, J. Biol. Chem. 264: 1).
6985 (1989)); eukaryotic delivery vehicle cells (eg, US Pat. No. 5,814,482; WO 95/07994; WO 96/170).
72; WO 95/30763; and WO 97/42338).
, And nuclear charge neutralization or fusion with cell membranes. Naked DNA can also be used. Exemplary naked DNA transfer methods are described in WO 90/11092 and US Pat. No. 5,580,859. Liposomes that can serve as gene delivery vehicles are described in US Pat. No. 5,422,120; WO 95/13796; W.
O 94/23697; WO 91/14445; and European patent 052496.
8 are described. A further approach is described in Philip, Mol. Cell
Biol. 14: 2411 (1994), and Woffendin, Pro.
c. Natl. Acad. Sci. (1994) 91: 1581.

【0158】 使用に適切なさらなる非ウイルス性送達としては、Woffendinら、P
roc.Natl.Acad.Sci.USA 91(24):11581(1
994)に記載のアプローチのような、機械的送達系が挙げられる。さらに、コ
ード配列およびこのような発現の産物は、光重合化ヒドロゲル物質の沈着、また
はイオン化放射線の使用を通じて送達され得る(米国特許第5,206,152
号およびWO 92/11033を参照のこと)。コード配列の送達のために用
いられ得る遺伝子送達のための他の従来の方法としては、例えば、携帯式遺伝子
移入粒子銃(hand−hold gene transfer partic
le gun)の使用(例えば、米国特許第5,149,655号を参照のこと
);移入した遺伝子を活性化するためのイオン化放射線の使用(例えば、米国特
許第5,206,152号およびWO 92/11033を参照のこと)が挙げ
られる。
Additional non-viral delivery suitable for use includes Woffendin et al., P.
roc. Natl. Acad. Sci. USA 91 (24): 11581 (1
Mechanical delivery systems, such as the approach described in 994). In addition, the coding sequences and products of such expression can be delivered through the deposition of photopolymerized hydrogel materials, or the use of ionizing radiation (US Pat. No. 5,206,152).
Issue and WO 92/11033). Other conventional methods for gene delivery that may be used for delivery of coding sequences include, for example, the hand-hold gene transfer particle gun.
Legun) (see, eg, US Pat. No. 5,149,655); use of ionizing radiation to activate transferred genes (eg, US Pat. No. 5,206,152 and WO 92/11033).

【0159】 本発明は、特に有利な実施形態を記載した、以下の実施例を参照して、ここで
例示される。しかし、これらの実施形態は、例示のためであり、いかなる方法で
も、本発明を限定するとは解釈されないことに注意のこと。
The invention will now be illustrated with reference to the following examples, which describe particularly advantageous embodiments. However, it should be noted that these embodiments are illustrative and are not to be construed as limiting the invention in any way.

【0160】 (実施例) (実施例1) (生物学的物質によって発現された新規なポリヌクレオチドの生物学的物質の
供給源およびこのポリヌクレオチドの概要) 細胞株ならびにヒトの正常組織および腫瘍組織を用いて、細胞および組織から
単離されたmRNAより、cDNAライブラリーを構築した。ほとんどの配列は
、約275〜300ヌクレオチド長であった。この細胞株としては、Km12L
4−A細胞株、高転移性結腸ガン細胞株(Morika,W.A.K.ら、Ca
ncer Research(1988)48:6863)が挙げられる。KM
12L4−A細胞株は、KM12C細胞株から送達される。KM12C細胞株(
転移性が欠しい(低転移性))は、Dukes’段階B2外科標品由来の培養物
中で樹立された(Morikawaら、Cancer Res.(1988)4
8:6863)。KML4−Aは、KM12C由来の高転移性亜株である(Ye
atmanら、Nucl.Acids.Res.(1995)23:4007;
Bao−Lingら、Proc.Annu.Meet.Am.Assoc.Ca
ncer.Res.(1995)21:3269)。KM12CおよびKM12
C由来細胞株(例えば、KM12L4、KM12L4−Aなど)は、当該分野に
おいて、結腸ガンの研究のためのモデル細胞株として十分認識されている(例え
ば、Moriakawaら、前出;Radinskyら、Clin.Cance
r Res.(1995)1:19;Yeatmanら(1995)前出;Ye
atmanら、Clin.Exp.Metastasis(1996)14:2
46を参照のこと)。これらおよび他の細胞株および組織は、表6に記載されて
いる。
Example 1 Example 1 Source of Novel Polynucleotide Biological Material Expressed by Biological Material and Overview of This Polynucleotide Cell line and human normal and tumor tissues Was used to construct a cDNA library from mRNA isolated from cells and tissues. Most sequences were approximately 275-300 nucleotides in length. This cell line is Km12L
4-A cell line, highly metastatic colon cancer cell line (Morika, WAK, et al., Ca
ncer Research (1988) 48: 6863). KM
The 12L4-A cell line is delivered from the KM12C cell line. KM12C cell line (
Lack of metastasis (low metastasis) was established in cultures from Dukes' stage B2 surgical preparations (Morikawa et al. Cancer Res. (1988) 4
8: 6863). KML4-A is a highly metastatic substrain derived from KM12C (Ye.
atman et al., Nucl. Acids. Res. (1995) 23: 4007;
Bao-Ling et al., Proc. Annu. Meet. Am. Assoc. Ca
ncer. Res. (1995) 21: 3269). KM12C and KM12
C-derived cell lines (eg, KM12L4, KM12L4-A, etc.) are well recognized in the art as model cell lines for the study of colon cancer (eg, Morikawa et al., Supra; Radinsky et al., Clin. Cancel
r Res. (1995) 1:19; Yeatman et al. (1995) supra; Ye.
atman et al., Clin. Exp. Metastasis (1996) 14: 2.
46). These and other cell lines and tissues are listed in Table 6.

【0161】 単離されたポリヌクレオチドの配列を、XBLASTマスキングプログラムを
用いて、最初にマスクし、低複雑性配列を排除する(Claverie「Eff
ective Large−Scale Sequence Similari
ty Searches」:Computer Methods for Ma
cromolecular Sequence Analysis、Dooli
ttle編、Meth.Enzymol.266:212−227 Acade
mic Press、NY、NY(1996);特にClaverie、「Au
tomated DNA Sequencing and Analysis
Techniques」Adamsら編、Chap.36、p.267 Aca
demic Press、San Diego、1994およびClaveri
eら、Comput.Chem.(1993)17:191)。一般的に、マス
クは、それらの低複雑性のために、関連する小さな目的の配列排除、複数の配列
(例えば、Aluリピート)に共通な反復領域への類似性に基づく複数の「hi
t」の除去を除いて、最終の検索結果には影響しない。次いで、マスキング後に
残る配列を、BLASTN vs.Genbank検索に用いた。この検索では
、70%を超える重複、99%の同一性および1×10-40未満のp値を示した
配列は、破棄した。この検索からの配列はまた、包括的なパラメータが適合する
が、その配列が、リボソームまたはベクター由来であった場合、破棄した。
The sequence of the isolated polynucleotide is first masked using the XBLAST masking program to eliminate low complexity sequences (Claverie “Eff.
active Large-Scale Sequence Similari
ty Searches ": Computer Methods for Ma
cromolecular Sequence Analysis, Dooli
Title edited by Meth. Enzymol. 266: 212-227 Acade
mic Press, NY, NY (1996); especially Claverie, “Au
tomato DNA Sequencing and Analysis
Techniques "Adams et al., Ed., Chap. 36, p. 267 Aca
demic Press, San Diego, 1994 and Claveri
e et al., Comput. Chem. (1993) 17: 191). In general, masks, due to their low complexity, have multiple “hi” s based on related small target sequence exclusions, similarity to repeat regions common to multiple sequences (eg, Alu repeats).
It does not affect the final search results, except for the removal of "t". The sequences remaining after masking are then labeled with BLASTN vs. Used for Genbank search. Sequences that showed greater than 70% duplication, 99% identity, and p-value less than 1 × 10 −40 were discarded in this search. The sequences from this search also matched the global parameters, but were discarded if the sequences were from ribosomes or vectors.

【0162】 前述の検索により得られた配列を、3つのグループ(以下に示す、1、2およ
び3)に分類し、そしてBLASTX vs.NRP(非重複タンパク質)デー
タベース検索によって検索した:(1)不明(Genbank検索による該当無
し)、(2)弱い類似性(同一性は、45%より大きく、そしてp値は、1×1
-5未満である)、および(3)高い類似性(60%より大きい重複、80%よ
り大きい同一性、および1×10-5未満のp値)。70%より大きい重複、99
%より大きい同一性、および1×10-40未満のp値を有する配列を破棄した。
The sequences obtained by the above search were classified into three groups (shown below, 1, 2 and 3), and BLASTX vs. Searched by NRP (non-redundant protein) database search: (1) unknown (not applicable by Genbank search), (2) weak similarity (identity greater than 45% and p-value 1 × 1).
0 less than -5 is), and (3) high similarity (greater overlap 60%, greater than 80% identity, and 1 × 10 p value of less than -5). Over 70% overlap, 99
Sequences with greater than% identity and p-value less than 1 × 10 −40 were discarded.

【0163】 残った配列を、不明(該当無し)、弱い類似性、および高い類似性(上述のパ
ラメータ)に分類した。2つの検索をこれらの配列において実行した。初めに、
BLAST vs.ESTデータベース検索を実施し、そして99%より大きい
重複、99%より大きい類似性、および1×10-40未満のp値を有する配列を
破棄した。ヒト起源のデータベース配列と比較した場合、1×10-65未満のp
値を有する配列もまた除去した。第2にBLASTN vs.Patent G
eneSeqデータベースを実施して、そして99%より大きい同一性、1×1
-40未満のp値、および99%より大きい重複を有する配列を破棄した。
The remaining sequences were classified as unknown (not applicable), weak similarity and high similarity (parameters above). Two searches were performed on these sequences. at first,
BLAST vs. An EST database search was performed and sequences with greater than 99% overlap, greater than 99% similarity, and p-value less than 1 × 10 −40 were discarded. P less than 1 × 10 −65 when compared to database sequences of human origin
Sequences with values were also removed. Second, BLASTN vs. Patent G
Implementing the eneSeq database and greater than 99% identity, 1x1
Sequences with p-values less than 0-40 and greater than 99% duplication were discarded.

【0164】 残っている配列を、他の規則およびデータセットにおける重複性を用いてスク
リーニングに共した。ヒト起源のデータベース配列との関係における1×10-1 11 未満のp値を有する配列を、特に排除した。最終的に、添付した配列表に挙げ
た3351個の配列を得た。同定されたそれぞれのポリヌクレオチドは、少なく
とも一部のmRNA転写産物からの配列を示す。新規であると決定されたポリヌ
クレオチドは、配列番号を割当てた。
The remaining sequences were screened using other rules and redundancy in the dataset. A sequence having a p-value less than 1 × 10 -1 11 in relation to database sequences of human origin, in particular eliminated. Finally, 3351 sequences listed in the attached sequence listing were obtained. Each identified polynucleotide represents a sequence from at least some mRNA transcripts. The polynucleotides determined to be new have been assigned the SEQ ID NOs.

【0165】 新しいポリヌクレオチドは、配列番号1〜3351が割当てられた。新しいポ
リヌクレオチドに対応している最初の1847のDNA配列を、表1の配列表に
表す。配列番号1848〜3351の新規のポリヌクレオチドに対応するDNA
配列は、表2の配列表に示される。表2のDNA配列(配列番号1〜1504と
番号付けた)は、配列表中の配列番号1848〜3351に対応する。例えば、
表2配列番号2は、配列番号1848であり、表2配列番号2は、配列番号18
49である、など。表4の各DNA配列は、配列表中のその配列番号より184
7小さい数によって特異的に同定される。表1および2は、以下を示す:1)本
明細書における使用のために各配列に割当てられた配列番号、または対応する数
;2)この配列の内部識別子(internal identifier)とし
て用いられた配列名;3)クローン(これから配列が単離された)に割当てられ
た名前;および4)クラスター(これに配列が割当てられた)の数(クラスター
ID;クラスターIDが0の場合、この配列は、いずれのクラスターにも割当て
られない)。
The new polynucleotides have been assigned SEQ ID NOS: 1-3351. The first 1847 DNA sequences corresponding to the new polynucleotides are shown in the sequence listing in Table 1. DNAs corresponding to the novel polynucleotides of SEQ ID NOs: 1848-3351
The sequences are shown in the sequence listing in Table 2. The DNA sequences in Table 2 (numbered SEQ ID NOS: 1-1504) correspond to SEQ ID NOS: 1848-3351 in the Sequence Listing. For example,
Table 2 SEQ ID NO: 2 is SEQ ID NO: 1848, Table 2 SEQ ID NO: 2 is SEQ ID NO: 18
49, and so on. Each DNA sequence in Table 4 is 184 based on its sequence number in the sequence listing.
7 Uniquely identified by a small number. Tables 1 and 2 show: 1) the SEQ ID NO assigned to each sequence, or the corresponding number for use herein; 2) the sequence used as the internal identifier of this sequence. Name; 3) the name assigned to the clone (from which the sequence was isolated); and 4) the number of clusters (to which the sequence was assigned) (cluster ID; if cluster ID is 0, this sequence is Not assigned to any cluster).

【0166】 提供されたポリヌクレオチドは、部分的mRNA転写物を示すので、本発明の
2つ以上のポリヌクレオチドは、同じmRNA転写物および同じ遺伝子の異なる
領域を示し得る。従って、2つ以上の配列番号が同じクローンに属すると同定さ
れるならば、いずれかの配列を用いて、全長mRNAまたは全長遺伝子を入手し
得る。
Since the provided polynucleotides represent partial mRNA transcripts, two or more polynucleotides of the invention may represent the same mRNA transcript and different regions of the same gene. Thus, if two or more SEQ ID NOs are identified as belonging to the same clone, either sequence can be used to obtain the full length mRNA or gene.

【0167】 (実施例2:遺伝子産物の機能を同定するための公共データベース検索の結果
) 配列番号1〜3351を、個々の配列でベストの整列を決定するために3つ全
てのリーディングフレームにおいて、翻訳した。これらのアミノ酸配列およびヌ
クレオチド配列は、一般的に個々の配列に対して配置された照会配列として参照
される。照会および個々の配列は、http://www.ncbi.nlm.
nih.gov/BLAST/でワールドワイドウェブにわたって利用可能であ
るBLASTプログラムを用いて整列した。再度この配列を、上記の実施例1に
記載した、低複雑性をマスクするためのXBLASTプログラムを用いて、反復
性配列またはポリA配列の検索を妨げる種々の範囲に対してマスクした。
Example 2: Results of a public database search to identify the function of the gene product SEQ ID NOS: 1-3351 were used in all three reading frames to determine the best alignment of the individual sequences. translated. These amino acid and nucleotide sequences are commonly referred to as query sequences, which are arranged against the individual sequences. Queries and individual sequences can be found at http: // www. ncbi. nlm.
nih. Aligned using the BLAST program available over the World Wide Web at gov / BLAST /. Again, this sequence was masked against the various regions that interfered with the search for repetitive or polyA sequences using the XBLAST program for masking low complexity described in Example 1 above.

【0168】 表3および4(特許請求の範囲の前に挿入)は、整列の結果を示す。表3は、
配列番号1〜1847の整列情報を含み、そして表4は、配列番号1848〜3
351の整列情報を含む。表4のDNA配列(配列番号1〜1504と番号付け
された)は、配列番号1848〜3351に対応する。表4における各DNA配
列は、その配列番号よりも1847少ない数で特異的に同定される。表3および
4は、その配列番号または対応する数による各配列、Genbankおよび非重
複性タンパク質(Non−Reddundant Protein)検索から最
も近縁のものおよび説明、ならびにp値の検索結果を示す。
Tables 3 and 4 (inserted before the claims) show the alignment results. Table 3 shows
Includes alignment information for SEQ ID NOs: 1-1847, and Table 4 lists SEQ ID NOs: 1848-3.
351 alignment information. The DNA sequences in Table 4 (numbered SEQ ID NOS: 1-1504) correspond to SEQ ID NOS: 1848-3351. Each DNA sequence in Table 4 is uniquely identified with a number 1847 less than its SEQ ID NO. Tables 3 and 4 show each sequence by its SEQ ID NO or the corresponding number, the closest and explanation from the Genbank and Non-Redundant Protein searches, and the p-value search results.

【0169】 配列番号1〜1847のそれぞれについて、タンパク質またはDNA配列に対
する最適の整列が、表3に含まれ、そして配列番号1848〜3351のそれぞ
れについての最適の整列が、表4に含まれる。配列番号1〜3351によりコー
ドされるポリペプチドの活性は、表3または4に報告される最も近縁のものと同
じかまたは類似である。最も近縁のもののアクセッション番号が報告されており
、この最も近縁のものにより示される活性に対する参照を提供する。この整列の
ために用いた検索プログラムおよびデータベースはまた、同様に、p値の計算に
ついても示す。
The optimal alignment for the protein or DNA sequences for each of SEQ ID NOs: 1-1847 is included in Table 3, and the optimal alignment for each of SEQ ID NOs: 1848-3351 is included in Table 4. The activity of the polypeptides encoded by SEQ ID NOs: 1-3351 is the same as or similar to the most closely related ones reported in Table 3 or 4. The closest relative's accession number has been reported and provides a reference to the activity exhibited by this closest relative. The search programs and databases used for this alignment also show the calculation of p-values.

【0170】 最も近縁のもののポリヌクレオチド配列の全長配列またはフラグメントは、配
列番号1〜3351の全長の配列を同定しかつ単離するために、プローブおよび
プライマーとして使用され得る。最も近縁のものは、配列番号1〜3351の全
長の配列についてのライブラリーを構築するために使用されるべき組織型または
細胞型を示し得る。
The full-length sequences or fragments of the closest polynucleotide sequences can be used as probes and primers to identify and isolate full-length sequences of SEQ ID NOs: 1-3351. The closest one may indicate the tissue or cell type to be used to construct the library for the full length sequence of SEQ ID NOs: 1-3351.

【0171】 (実施例3) (タンパク質ファミリーのメンバー) 配列(配列番号1〜3351)を、上述の本明細書中で記載されるように、プ
ロフィール検索を行うために使用した。本発明のポリヌクレオチドのいくつかは
、公知のタンパク質ファミリーに属するポリぺプチドの特徴を有し(従って、こ
れらのタンパク質ファミリーの新規なメンバーを示す)、および/または公知の
機能的なドメインを含む、ポリぺプチドをコードすることが見出された(表5)
。表3の「開始」および「停止」は、示された配列番号を有する問合せ配列に対
して配列する個々の配列内での位置を示す。方向は、個々の配列に関して、問い
合わせ配列の配向を示し、ここで正方向(正)は、整列が配列表において提供さ
れる配列と同じ方向(左から右)であることを示し、そして逆方向(逆)は、整
列が配列表において提供される配列に相補的な配列を有することを示す。
Example 3 Protein Family Members The sequences (SEQ ID NOs: 1-3351) were used to perform profile searches as described herein above. Some of the polynucleotides of the invention have the characteristics of polypeptides belonging to known protein families (thus indicating novel members of these protein families) and / or contain known functional domains. , Was found to encode a polypeptide (Table 5).
. "Start" and "Stop" in Table 3 indicate the position within the individual sequences that align with the query sequence having the indicated SEQ ID NO. Orientation refers to the orientation of the query sequence with respect to the individual sequences, where positive direction (positive) indicates that the alignment is in the same direction as the sequences provided in the sequence listing (left to right), and reverse direction. (Inverse) indicates that the alignment has a sequence complementary to the sequence provided in the sequence listing.

【0172】 いくつかのポリヌクレオチドは、複数のプロフィールヒットを示した。なぜな
ら、例えば、特定の配列が重複するプロフィール領域を含み、および/またはこ
の配列が2つの異なる機能的ドメインを含むからである。これらのプロフィール
ヒットを、以下により詳細に記載する。
Some polynucleotides showed multiple profile hits. This is because, for example, a particular sequence contains overlapping profile regions and / or this sequence contains two different functional domains. These profile hits are described in more detail below.

【0173】 (Ankリピート(ANK))配列番号187、1268、1804、181
9、1830、1839、2652、3015および3267は、Ankリピー
ト含有タンパク質をコードするポリヌクレオチドを示す。アンキリンモチーフは
、24タンデム33アミノ酸モチーフを有するタンパク質アンキリンにちなんで
名付けられた33個のアミノ酸配列である。Ankリピートは、元は、細胞周期
制御タンパク質cdc10において同定された(Breedenら、Natur
e(1987)329:651)。アンキリンリピートを含むタンパク質として
は、アンキリン、ミオトロピン、I−κBタンパク質、細胞サイクルタンパク質
cdc10、Notchレセプター(Matsunoら、Developmen
t(1997)124(21):4265);主要組織適合性複合体のクラスI
II領域のG9a(またはBAT8)(Biochem J.290:811−
818、1993)、FABP、GABP、53BP2、Lin12、glp−
1、SW14、およびSW16が挙げられる。アンキリンリピートの機能は、タ
ンパク質相互作用における役割と適合する(Bork,Proteins(19
93)17(4):363;LambertおよびBennet,Eur.J.
Biochem.(1993)211:1;Kerrら,Current Op
.Cell Biol.(1992)4:496;Bennetら,J.Bio
l.Chem.(1980)255:6424)。
(Ank Repeat (ANK)) SEQ ID NOs: 187, 1268, 1804, 181
9, 1830, 1839, 2652, 3015 and 3267 represent polynucleotides encoding an Ank repeat containing protein. The ankyrin motif is a 33 amino acid sequence named after the protein ankyrin, which has a 24 tandem 33 amino acid motif. Ank repeats were originally identified in the cell cycle regulatory protein cdc10 (Breden et al., Nature.
e (1987) 329: 651). Examples of proteins containing ankyrin repeats include ankyrin, myotropin, I-κB protein, cell cycle protein cdc10, Notch receptor (Matsuno et al., Developmen.
t (1997) 124 (21): 4265); major histocompatibility complex class I.
II region G9a (or BAT8) (Biochem J. 290: 811-).
818, 1993), FABP, GABP, 53BP2, Lin12, glp-.
1, SW14, and SW16. The function of ankyrin repeats is compatible with its role in protein interactions (Bork, Proteins (19
93) 17 (4): 363; Lambert and Bennet, Eur. J.
Biochem. (1993) 211: 1; Kerr et al., Current Op.
. Cell Biol. (1992) 4: 496; Bennet et al., J. Am. Bio
l. Chem. (1980) 255: 6424).

【0174】 (種々の細胞活性と関連するATPアーゼ(ATPアーゼ))配列番号431
、639、2135、2684、2859、3197および3266における配
列は、「多様な細胞活性と関連するATPアーゼ」(AAA)タンパク質ファン
ミリーの新規のメンバーをコードする配列に対応する。このAAAタンパク質フ
ァミリーは、ATP結合部位を含む約220個のアミノ酸の保存された領域を共
有する多数のATPアーゼから構成される(Froehlichら,J Cel
l Biol.(1991)114:443;Erdmannら,Cell(1
991)64:499;Petersら,EMBO J.(1990)9:17
57;Kunauら,Biochimie(1993)75:209−224;
Confalonieriら,BioEssays(1995)17:639;
http://yeamob.pci.chemie.uni−tuebing
en.de/AAA/Description.html)。このファミリーの
いずれかに属するタンパク質は、1または2個のAAAドメインを含む。一般に
、これらのタンパク質におけるAAAドメインは、ATP依存タンパク質クラン
プ(clamp)として作用する(Confalonieriら(1995)B
ioEssays 17:639)。このドメインのN末端側の半分に位置する
ATP結合「A」および「B」モチーフに加えて、高度に保存された領域がドメ
インの中心部分に位置し、これはシグネチャー(signature)パターン
の開発に使用された。このコンセンサスパターンは、[LIVMT]−x−[L
IVMT] [LIVMF]−x [GATMC]−[ST]−[NS]−x(
4)−[LIVM]−D−x−A−[LIFA]−x−Rである。
(ATPases Associated with Various Cellular Activities (ATPases)) SEQ ID NO: 431
, 639, 2135, 2684, 2859, 3197, and 3266 correspond to sequences encoding a novel member of the "ATPase associated with diverse cellular activities" (AAA) protein fanmilly. This AAA protein family is composed of multiple ATPases that share a conserved region of approximately 220 amino acids containing the ATP binding site (Froehlich et al., J Cel.
l Biol. (1991) 114: 443; Erdmann et al., Cell (1
991) 64: 499; Peters et al., EMBO J .; (1990) 9:17
57; Kunau et al., Biochimie (1993) 75: 209-224;
Confalonieri et al., BioEssays (1995) 17: 639;
http: // yeamob. pci. chemie. uni-tuebing
en. de / AAA / Description. html). Proteins belonging to either of these families contain one or two AAA domains. In general, the AAA domain in these proteins acts as an ATP-dependent protein clamp (Confalonieri et al. (1995) B.
ioEssays 17: 639). In addition to the ATP-binding "A" and "B" motifs located in the N-terminal half of this domain, a highly conserved region is located in the central part of the domain, which is important for the development of signature patterns. Was used. This consensus pattern is [LIVMT] -x- [L
IVMT] [LIVMF] -x [GATMC]-[ST]-[NS] -x (
4)-[LIVM] -D-x-A- [LIFA] -x-R.

【0175】 (ブロモドメイン(bromodomain))配列番号1814は、ブロモ
ドメイン領域を有するポリペプチドをコードするポリヌクレオチドを表し(Ha
ynesら,1992,Nucleic Acids Res.20:2693
−2603,Tamkunら,1992,Cell 68:561−572,お
よびTamkun,1995,Curr.Opin.Genet.Dev.5:
473−477)、これは、約70個のアミノ酸の保存された領域である。ブロ
モドメインは、タンパク質−タンパク質相互作用に関連すると考えられ、そして
転写活性に関連する多成分複合体の集合または活性にとって重要であり得る。ブ
ロモドメインの主要部にわたるコンセンサスパターンは、[STANVF]−x
(2)−F−x(4)−[DNS]−x(5,7)−[DENQTF]−Y−[
HFY]−x (2)−[LIVMFY]−x(3)− [LIVM]−x(4
)−[LIVM]−x(6,8)−Y−x(12,13)−[LIVM]−x(
2)−N−[SACF]−x(2)−[FY]である。
(Bromodomain) SEQ ID NO: 1814 represents a polynucleotide encoding a polypeptide having a bromodomain region (Ha
ynes et al., 1992, Nucleic Acids Res. 20: 2693
-2603, Tamkun et al., 1992, Cell 68: 561-572, and Tamkun, 1995, Curr. Opin. Genet. Dev. 5:
473-477), which is a conserved region of about 70 amino acids. Bromodomains are thought to be involved in protein-protein interactions and may be important for the assembly or activity of multicomponent complexes associated with transcriptional activity. The consensus pattern over the main part of the bromodomain is [STANVF] -x
(2) -F-x (4)-[DNS] -x (5,7)-[DENQTF] -Y- [
HFY] -x (2)-[LIVMFY] -x (3)-[LIVM] -x (4
)-[LIVM] -x (6,8) -Yx (12,13)-[LIVM] -x (
2) -N- [SACF] -x (2)-[FY].

【0176】 (塩基性領域およびロイシンジッパー転写因子(BZIP))配列番号410
、552、768、822、836、1288、1365、1454、1540
、1549、1556、1557、1563、1622、1630、1704、
1808、2363、2424、3147、3152、3158および3208
は、塩基性領域およびロイシンジッパー転写因子のファミリーの新規なメンバー
をコードするポリヌクレオチドを表す。真核生物DNA結合転写因子のbZIP
スーパーファミリー(Hurst,Protein Prof.(1995)2
:105;およびEllenberger,Curr.Opin.Struct
.Biol.(1994)4:12)は、二量体化に必要とされるロイシンジッ
パーに続く塩基性領域媒介配列特異的DNA結合を含むタンパク質を含む。この
タンパク質ファミリーについでのコンセンサスパターンは、[KR]−x(1,
3)−[RKSAQ]−N−x(2)−[SAQ](2)−x−[RKTAEN
Q]−x−R−x−[RK]である。
(Basic region and leucine zipper transcription factor (BZIP)) SEQ ID NO: 410
, 552, 768, 822, 836, 1288, 1365, 1454, 1540
, 1549, 1556, 1557, 1563, 1622, 1630, 1704,
1808, 2363, 2424, 3147, 3152, 3158 and 3208
Represents a polynucleotide encoding a basic region and a novel member of the family of leucine zipper transcription factors. Eukaryotic DNA binding transcription factor bZIP
Super Family (Hurst, Protein Prof. (1995) 2
: 105; and Ellenberger, Curr. Opin. Struct
. Biol. (1994) 4:12) contain proteins containing basic region-mediated sequence-specific DNA binding followed by leucine zippers required for dimerization. The consensus pattern for this protein family is [KR] -x (1,
3)-[RKSAQ] -N-x (2)-[SAQ] (2) -x- [RKTAEN
Q] -x-R-x- [RK].

【0177】 (EFハンド(EFhand))配列番号820、1755および3285は
、EFハンドタンパク質のファミリーにおける新規のタンパク質をコードするポ
リヌクレオチドに対応する。多くのカルシウム結合タンパク質は、同じ進化的フ
ァミリーに属し、そしてEFハンドとして公知のカルシウム結合ドメインの1つ
の型を共有する(Kawasakiら,Protein.Prof(1995)
2:305−490)。この型のドメインは、12個の残基のαらせんドメイン
が両側に隣接した12個の残基ループからなる。EFハンドループにおいて、カ
ルシウムイオは、五方両錐(pentagonal bipyramidal)
立体配置で配位される。結合に関わるこの6個の残基は、位置1、3、5、7、
9および12にあり;これらの残基は、X、Y、Z、−Y、−Xおよび−Zによ
り示される。位置12における不変GluまたはAspは、Ca(二座配位子)
に配位するために2つの酸素を提供する。コンセンサスパターンは、完全なEF
ハンドループ、およびループに続き、かつ常に疎水性であろう第1の残基:D−
x−[DNS]−{ILVFYW}−[DENSTG]−[DNQGHRK]−
{GP}−[LIVMC]−[DENQSTAGC]−x(2)−[DE]−[
LIVMFYW]を含む。
(EFhand) SEQ ID NOs: 820, 1755 and 3285 correspond to polynucleotides encoding novel proteins in the family of EFhand proteins. Many calcium-binding proteins belong to the same evolutionary family and share one type of calcium-binding domain known as the EF hand (Kawasaki et al., Protein. Prof (1995).
2: 305-490). This type of domain consists of a 12 residue loop flanked by 12 residue α-helical domains. In the EF hand loop, calcium-iodine is a pentagonal bipyramidal.
It is coordinated in a three-dimensional configuration. The six residues involved in binding are at positions 1, 3, 5, 7,
9 and 12; these residues are designated by X, Y, Z, -Y, -X and -Z. Invariant Glu or Asp at position 12 is Ca (bidentate ligand)
Provide two oxygens to coordinate with. Consensus pattern is complete EF
Hand loop, and the first residue that follows the loop and is always hydrophobic: D-
x- [DNS]-{ILVFYW}-[DENSTG]-[DNQGHRK]-
{GP}-[LIVMC]-[DENQSTAGC] -x (2)-[DE]-[
LIVMFYW].

【0178】 (Ets Domain(Ets Nterm))配列番号1811は、ET
SドメインにおいてN末端の相同性を有するポリヌクレオチドをコードするポリ
ヌクレオチドを示す。このファミリーのタンパク質は、DNA結合に関わる保存
されたドメイン「ETSドメイン」を含む。このドメインは、プリンリッチ配列
を認識するようであり;それは、長さが約85〜90個のアミノ酸であり、そし
て芳香族残基および正に荷電した残基が豊富である(Wasylykら,Eur
.J.Biochem.(1993)211:718)。このets遺伝子ファ
ミリーは、DNA結合タンパク質の新規のクラスをコードし、この各々は、特異
的なDNA配列を結合し、そして共通のコアトリヌクレオチド配列GGAを含む
配列と特異的に相互作用するetsドメインを含む。etsドメインに加えて、
ネイティブなetsタンパク質は、タンパク質の生物学的な特異性を調節し得る
他の配列を含む。Ets遺伝子およびタンパク質は、細胞増殖、分化および発生
を含む種々の必須の生物学的プロセスに関連し、そして3つのメンバーが、腫瘍
プロセスに関係する。
(Ets Domain (Ets Nterm)) SEQ ID NO: 1811 is ET
1 shows a polynucleotide encoding a polynucleotide having N-terminal homology in the S domain. This family of proteins contains the conserved domain "ETS domain" involved in DNA binding. This domain appears to recognize a purine-rich sequence; it is approximately 85-90 amino acids in length and is rich in aromatic and positively charged residues (Wasylyk et al., Eur).
. J. Biochem. (1993) 211: 718). This ets gene family encodes a novel class of DNA binding proteins, each of which binds a specific DNA sequence and interacts specifically with sequences containing the common core trinucleotide sequence GGA. including. In addition to the ets domain,
The native ets protein contains other sequences that can regulate the biological specificity of the protein. Ets genes and proteins are involved in various essential biological processes including cell proliferation, differentiation and development, and three members are involved in tumor processes.

【0179】 (G−タンパク質αサブユニット(G−α))配列番号1846は、G−タン
パク質αサブユニットファミリーの新規ポリペプチドをコードするポリヌクレオ
チドを表す。グアニンヌクレオチド結合タンパク質(G−タンパク質)は、細胞
内エフェクター(例えば、セカンドメッセンジャー分子の濃度を変化させるイオ
ンチャネルおよび酵素)に、細胞外で活性化された内在性膜レセプターを共役す
る膜会合性のタンパク質のファミリーである。G−タンパク質は、静止状態にお
いて、原形質膜の内表面で三量体として会合する3つのサブユニット(α、β、
およびγ)から構成される。αサブユニットはGTPを結合し、そしてGTPア
ーゼ活性を示す。G−タンパク質αサブユニットは長さが350−400アミノ
酸であり、そして40〜45kDaの範囲における分子量を有する。17個の異
なる型のαサブユニットが哺乳動物において同定されており、そして配列類似性
および機能の両方に基づいて、4つの主な群:α−s、α−q、α−i、および
α−12に分類される(Simonら、Science(1993)252:8
02)。これらはしばしば、通常、ミリスチル酸および/またはパルミトイル酸
(palmitoylate)によりN末端でアシル化され、そして、これらの
脂肪酸改変は、膜会合および他のタンパク質との高親和性の相互作用のために重
要であり得る。
(G-protein α subunit (G-α)) SEQ ID NO: 1846 represents a polynucleotide encoding a novel polypeptide of the G-protein α subunit family. Guanine nucleotide-binding proteins (G-proteins) are membrane-associated proteins that couple extracellularly activated integral membrane receptors to intracellular effectors (eg, ion channels and enzymes that alter the concentration of second messenger molecules). It is a family of proteins. G-proteins are three subunits (α, β,
And γ). The α subunit binds GTP and exhibits GTPase activity. The G-protein α subunit is 350-400 amino acids in length and has a molecular weight in the range 40-45 kDa. Seventeen different types of α subunits have been identified in mammals, and based on both sequence similarity and function, there are four major groups: α-s, α-q, α-i, and α. -12 (Simon et al., Science (1993) 252: 8.
02). They are often N-terminally acylated, usually by myristic and / or palmitoylate, and these fatty acid modifications are important for membrane association and high affinity interactions with other proteins. Can be.

【0180】 (C末端ドメインが保存されたヘリカーゼ(ヘリカーゼ C))配列番号14
96、2826および2871は、DEAD/Hヘリカーゼファミリーの新規な
メンバーをコードするポリヌクレオチドを示す。多くの真核生物および原核生物
タンパク質が、それらの構造的類似性を基礎に特徴付けられている(Schmi
d S.Rら、Mol. Microbiol.(1992)6:283;Li
nder Pら、Nature(1989)337:121;Wassarma
n D.Aら、Nature(1991)349:463)。全ては、ATP依
存性の核酸巻戻し(unwinding)に関与する。上記タンパク質の全ての
DEADボックスファミリーメンバーは、多くの保存された配列モチーフを共有
し、このうちのいくつかはDEADファミリーに特異的であり、他は、他のAT
P結合タンパク質によってか、またはヘリカーゼ「スーパーファミリー」に属す
るタンパク質によって共有される(Hodgman T.C.、Nature(
1988)333:22およびNature(1988)333:578(Er
rata)。これらのモチーフのうちの1つは、「D−E−A−D−ボックス」
と呼ばれ、ATP−結合タンパク質のBモチーフの特別なバージョンを示す。第
2のAspの代わりにHisを有するサブファミリーに属すいくつかの他のタン
パク質は、それ故「D−E−A−H−ボックス」タンパク質である(Wassa
rman D.Aら、Nature(1991)349:463;Harosh
Iら、Nucleic Acids Res.(1991)19:6331;
Koonin E.Vら、J. Gen. Virol.(1992)73:9
89。以下の特徴的なパターンは、両方のサブファミリーについてのメンバーを
同定するために使用される:1)[LIVMF](2)−D−E−A−D−[R
KEN]−x−[LIVMFYGSTN];および2)[GSAH]−x−[L
IVMF](3)−D−E−[ALIV]−H−[NECR]。
(Helicase with Conserved C-Terminal Domain (Helicase C)) SEQ ID NO: 14
96, 2826 and 2871 represent polynucleotides encoding novel members of the DEAD / H helicase family. Many eukaryotic and prokaryotic proteins have been characterized on the basis of their structural similarities (Schmi
d S. R et al., Mol. Microbiol. (1992) 6: 283; Li
nder P et al., Nature (1989) 337: 121; Wassarma.
n D. A, et al., Nature (1991) 349: 463). All are involved in ATP-dependent nucleic acid unwinding. All DEAD box family members of the above proteins share a number of conserved sequence motifs, some of which are specific to the DEAD family and others of which are AT
Shared by P-binding proteins or by proteins belonging to the helicase "superfamily" (Hodgman TC, Nature (
1988) 333: 22 and Nature (1988) 333: 578 (Er.
rata). One of these motifs is the "DEAD Box".
, Which represents a special version of the B motif of the ATP-binding protein. Some other proteins that belong to a subfamily with His instead of the second Asp are therefore "DE-AH-box" proteins (Wassa).
rman D.L. A et al., Nature (1991) 349: 463; Harosh.
I et al., Nucleic Acids Res. (1991) 19: 6331;
Koonin E. V. et al. Gen. Virol. (1992) 73: 9.
89. The following characteristic patterns are used to identify members for both subfamilies: 1) [LIVMF] (2) -DEAD- [R
KEN] -x- [LIVMFYGSTN]; and 2) [GSAH] -x- [L
IVMF] (3) -DE- [ALIV] -H- [NECR].

【0181】 (ホメオボックスドメイン(ホメオボックス))配列番号1676、1820
および1821は、ホメオボックスドメインを有するタンパク質をコードするポ
リヌクレオチドを示す。このホメオボックスは、60のアミノ酸のタンパク質ド
メインであり(Gehring In:Guidebook to the H
oemobox Genes、Duboule D編集、1−10頁、Oxfo
rd University Press、Oxford、(1994);Bu
erglin In:Guidebook to the Homeobox
Genes、25−72頁、Oxford University Press
、Oxford、(1994);Gehring、Trends Bioche
m.Sci.(1992) 17:277−280;Gehringら、Ann
u.Rev.Genet.(1986)20:147−173;Schofie
ld、Trends Neurosci.(1987)10:3−6)、多くの
Drosophilaホメオティックおよびセグメンテーションタンパク質中で
最初に同定された。それは、脊椎動物を含む多くのその他の動物で非常に良く保
存されている。このドメインは、ヘリックス−ターン−ヘリックス型の構造によ
りDNAを結合する。ホメオボックスドメインを含むいくつかのタンパク質は、
発生において重要な役割を演じる。これらタンパク質の大部分は、配列特異的D
NA結合転写因子である。このホメオボックスドメインはまた、酵母接合型タン
パク質の領域に非常に類似している。これらは、細胞型特異的様式で遺伝子発現
を制御することによって、酵母分化におけるマスタースイッチとして作用する、
配列特異的DNA結合タンパク質である。
(Homeobox Domain (Homeobox)) SEQ ID NOS: 1676, 1820
And 1821 represent polynucleotides encoding proteins with homeobox domains. This homeobox is a protein domain of 60 amino acids (Gehring In: Guidebook to the H
oemobox Genes, DOUBLE D edit, pp. 1-10, Oxford
rd University Press, Oxford, (1994); Bu.
erglin In: Guidebook to the Homebox
Genes, pages 25-72, Oxford University Press
, Oxford, (1994); Gehring, Trends Bioche.
m. Sci. (1992) 17: 277-280; Gehring et al., Ann.
u. Rev. Genet. (1986) 20: 147-173; Schofie.
ld, Trends Neurosci. (1987) 10: 3-6), first identified in many Drosophila homeotic and segmentation proteins. It is very well preserved in many other animals, including vertebrates. This domain binds DNA with a helix-turn-helix type structure. Some proteins, including homeobox domains,
Play an important role in development. Most of these proteins are sequence-specific D
It is an NA-binding transcription factor. This homeobox domain is also very similar to the region of yeast mating type proteins. These act as master switches in yeast differentiation by controlling gene expression in a cell-type specific manner,
It is a sequence-specific DNA binding protein.

【0182】 このホメオボックスドメインの概略表示を以下に示す。ヘリックス−ターン−
ヘリックス領域はシンボル「H」(ヘリックス)、および「t」(ターン)によ
り示される。
A schematic representation of this homeobox domain is shown below. Helix-Turn-
The helix region is indicated by the symbols "H" (helix), and "t" (turn).

【0183】[0183]

【化1】 このパターンは、ホメオボックス配列24残基長を検出し、そしてホメオボッ
クスドメインの位置34〜57に広がる。コンセンサスパターンは以下の通りで
ある:[LIVMFYG]−[ASLVR]−x(2)−[LIVMSTACN
]−x−[LIVM]−x(4)−[LIV]−[RKNQESTAIY]−[
LIVFSTNKH]−W−[FYVC]−x−[NDQTAH]−x(5)−
[RKNAIMW]。
[Chemical 1] This pattern detects homeobox sequence 24 residues long and spans positions 34-57 of the homeobox domain. The consensus pattern is as follows: [LIVMFYG]-[ASLVR] -x (2)-[LIVMSTACN].
] -X- [LIVM] -x (4)-[LIV]-[RKNQESTAY]-[
LIVFSTNKH] -W- [FYVC] -x- [NDQTAH] -x (5)-
[RKNAIMW].

【0184】 (MAPキナーゼキナーゼ(mkk))配列番号29、31、196、317
5、3190および3281は、新規のMAPキナーゼキナーゼファミリーのメ
ンバーを示す。MAPキナーゼ(MAPK)は、シグナル伝達に関与し、そして
細胞周期および細胞増殖の制御において重要である。MAPキナーゼキナーゼ(
MAPKK)は、MAPキナーゼをリン酸化し、そして活性化する、二重特異性
プロテインキナーゼである。MAPKKホモログは、酵母、無脊椎動物、両生類
、および哺乳動物において見出されている。さらに、MAPKK/MAPKリン
酸化スイッチは、酵母におけるおよび脊椎動物における異なる経路において活性
化される基本的なモジュールを構成する。MAPKKは、核に達する前にシグナ
ルが通過しなければならない必要不可欠なトランスデューサーである。概説につ
いて、例えば、Biologique Biol. Cell(1993)79
:193−207;Nishidaら、Trends Biochem Sci
(1993)18:128−31;Ruderman Curr Opin C
ell Biol(1993)5:207−13:Dhanasekaranら
、Oncogene(1998)17:1447−55;Kieferら、Bi
ochem Soc Trans(1997)25:491−8;およびHil
l.Cell Signal(1996)8:533−44を参照のこと。
(MAP Kinase Kinase (mkk)) SEQ ID NOs: 29, 31, 196, 317
5, 3190 and 3281 represent members of the novel MAP kinase kinase family. MAP kinase (MAPK) is involved in signal transduction and is important in controlling cell cycle and cell proliferation. MAP kinase kinase (
MAPKK) is a bispecific protein kinase that phosphorylates and activates MAP kinase. MAPKK homologs have been found in yeast, invertebrates, amphibians, and mammals. Furthermore, the MAPKK / MAPK phosphorylation switch constitutes a basic module that is activated in different pathways in yeast and in vertebrates. MAPKKs are essential transducers that signals must pass through before they reach the nucleus. For an overview, see, for example, Biologique Biol. Cell (1993) 79
: 193-207; Nishida et al., Trends Biochem Sci.
(1993) 18: 128-31; Ruderman Curr Opin C.
Lell Biol (1993) 5: 207-13: Dhanasekaran et al., Oncogene (1998) 17: 1447-55; Kiefer et al., Bi.
Ochem Soc Trans (1997) 25: 491-8; and Hil.
l. See Cell Signal (1996) 8: 533-44.

【0185】 (プロテインキナーゼ(protkinase))配列番号1157、147
8、1496、2286、2969および3190は、プロテインキナーゼをコ
ードするポリヌクレオチドを示す。プロテインキナーゼは、種々の経路でタンパ
ク質のリン酸化を触媒し、そして癌に関与する。真核生物のプロテインキナーゼ
(Hanks S.Kら、FASEB J.(1995)9:576;Hunt
er T,Meth. Enzymol.(1991)200:3:Hanks
S.Kら、Meth.Enzymol.(1991)200:38;Hanks
、 S.K、Curr. Opin. Struct. Biol.(1991
)1:369;Hanks S.Kら、Science(1988)241:4
2)は、セリン/スレオニンおよびチロシンプロテインキナーゼの両方に共通の
保存された触媒コアを共有するタンパク質の非常に広範囲なファミリーに属する
酵素である。プロテインキナーゼの触媒ドメインにおいて多くの保存された領域
がある。第1の領域は、触媒ドメインのN末端の端に位置し、リジン残基の近傍
における残基のグリシンリッチストレッチであり、これはATP結合に関与する
。第2の領域は、触媒ドメインの中心部分に位置し、酵素の触媒活性に重要であ
る保存されたアスパラギン酸残基を含む(Knighton D.Rら、Sci
ence(1991)253:407)。プロテインキナーゼプロフィールは、
この第2の領域について2つの特徴的なパターンを含む:一方は、セリン/スレ
オニンキナーゼに特異的であり、そして他方はチロシンキナーゼに特異的である
。第3のプロフィールは、整列(Hanks S.Kら、FASEB J.(1
995)9:576)に基づき、そして全触媒ドメインを覆う。
(Protein Kinase (Protkinase)) SEQ ID NOS: 1157, 147
8, 1496, 2286, 2969 and 3190 represent polynucleotides encoding protein kinases. Protein kinases catalyze the phosphorylation of proteins by various pathways and are involved in cancer. Eukaryotic protein kinases (Hanks SK, et al., FASEB J. (1995) 9: 576; Hunt.
er T, Meth. Enzymol. (1991) 200: 3: Hanks.
S. K et al., Meth. Enzymol. (1991) 200: 38; Hanks.
, S. K, Curr. Opin. Struct. Biol. (1991
) 1: 369; Hanks S .; K et al., Science (1988) 241: 4.
2) are enzymes belonging to a very broad family of proteins that share a conserved catalytic core common to both serine / threonine and tyrosine protein kinases. There are many conserved regions in the catalytic domain of protein kinases. The first region, located at the N-terminal end of the catalytic domain, is a glycine-rich stretch of residues near the lysine residue, which is involved in ATP binding. The second region is located in the central part of the catalytic domain and contains a conserved aspartic acid residue that is important for the catalytic activity of the enzyme (Knightton DR et al., Sci.
ence (1991) 253: 407). The protein kinase profile is
It contains two characteristic patterns for this second region: one specific for serine / threonine kinases and the other specific for tyrosine kinases. The third profile is aligned (Hanks SK et al., FASEB J. (1
995) 9: 576) and covers the entire catalytic domain.

【0186】 コンセンサスパターンは以下のようである:1)[LIV]−G−{P}−G
−{P}−[FYWMGSTNH]−[SGA]−{PW}−[LIVCAT]
−{PD}−x−[GSTACLIVMFY]−x(5,18)−[LIVMF
YWCSTAR]−[AIVP]−[LIVMFAGCKR]−Kであり、ここ
でKは、ATPを結合する;2)[LIVMFYC]−x−[HY]−x−D−
[LIVMFY]−K−x(2)−N−[LIVMFYCT](3)、ここでD
は、活性部位残基であり、;および3)[LIVMFYC]−x−[HY]−x
−D−[LIVMFY]−[RSTAC]−x(2)−N−[LIVMFYC]
、ここでDは、活性部位残基である。
The consensus pattern is as follows: 1) [LIV] -G- {P} -G
-{P}-[FYWMGSTNH]-[SGA]-{PW}-[LIVCAT]
-{PD} -x- [GSTACLIVMFY] -x (5,18)-[LIVMF
YWCSTAR]-[AIVP]-[LIVMFAGCKR] -K, where K binds ATP; 2) [LIVMFYC] -x- [HY] -x-D-
[LIVMFY] -Kx (2) -N- [LIVMFYCT] (3), where D
Is an active site residue; and 3) [LIVMFYC] -x- [HY] -x.
-D- [LIVMFY]-[RSTAC] -x (2) -N- [LIVMFYC]
, Where D is an active site residue.

【0187】 分析されたタンパク質が、上記のタンパク質キナーゼ特徴の2つ0含む場合、
それがプロテインキナーゼである確率は100%に近い。
If the protein analyzed contains two 0 of the above protein kinase features:
The probability that it is a protein kinase is close to 100%.

【0188】 (Rasファミリータンパク質(ras))配列番号1688および3258
は、小さなGTP/GDP結合タンパク質であるrasファミリーの新規メンバ
ーをコードするポリヌクレオチドを示す(Valenciaら、1991、Bi
ochemistry 30:4637−4648)。Rasファミリーメンバ
ーは、一般に、全体のGTPアーゼ活性の刺激因子として、特異的グアニンヌク
レオチド交換因子(GEF)および特異的GTPアーゼ活性化タンパク質(GA
P)を必要とする。ras関連タンパク質のうち、最も高い程度の配列保存性は
、グアニンヌクレオチド結合に直接関与する4つの領域で見出される。最初の2
つは、リン酸およびMg2+結合部位(PM部位)の大部分を構成し、G−ドメ
インの前半分中に位置する。その他の2つの領域は、グアノシン結合に関与し、
そしてこの分子のC末端側の後半部分に位置する。ras関連タンパク質のモチ
ーフおよび保存された構造的特徴は、Valenciaら、1991、Bioc
hemistry 30:4637−4648に記載されている。rasタンパ
ク質の主要なコンセンサスパターンは:D−T−A−G−Q−E−K−[LF]
−G−G−L−R−[DE]−G−Y−Yである。
(Ras Family Protein (ras)) SEQ ID NOs: 1688 and 3258
Shows a polynucleotide encoding a novel member of the ras family, a small GTP / GDP binding protein (Valencia et al., 1991, Bi.
Chemistry 30: 4637-4648). Ras family members are generally specific guanine nucleotide exchange factor (GEF) and specific GTPase activating protein (GA) as stimulators of overall GTPase activity.
P) is required. The highest degree of sequence conservation of ras-related proteins is found in the four regions directly involved in guanine nucleotide binding. First two
One constitutes the majority of the phosphate and Mg2 + binding sites (PM sites) and is located in the first half of the G-domain. The other two regions are involved in guanosine binding,
It is located in the latter half of the C-terminal side of this molecule. The motifs and conserved structural features of ras-related proteins are reviewed in Valencia et al., 1991, Bioc.
Chemistry 30: 4637-4648. The major consensus patterns of ras proteins are: D-T-A-G-G-Q-E-K- [LF].
-G-G-LR- [DE] -G-Y-Y.

【0189】 (チオレドキシンファミリー活性部位(Thioredox))配列番号16
77は、チオレドキシンファミリー活性部位を有するタンパク質をコードするポ
リヌクレオチドを示す。チオレドキシンは、活性中心のジスルフィド結合の可逆
性の酸化を介して種々のレドックス反応に関与する約100アミノ酸残基の小タ
ンパク質である(Holmgren A.Annu.Rev.Biochem.
(1985)54:237;Gleason F.K.ら、FEMS Micr
obiol. Rev.(1988)54:271;Holmgren A.J
.Biol.Chem.(1989)264:13963;Eklund Hら
、Proteins(1991)11:13)。チオレドキシンは、2つのシス
テイン残基が分子内ジスルフィド結合において連結される還元形態または酸化形
態のいずれかで存在する。チオレドキシンは、原核生物および真核生物中に存在
し、そしてレドックス活性ジスルフィド結合の周囲の配列は、良好に保存されて
いる。すべてのPDIは、チオレドキシンドメインの2または3(ERp72)
コピーを含む。コンセンサスパターンは:[LIVMF]−[LIVMSTA]
−x−[LIVMFYC]−[FYWSTHE]−x(2)−[FYWGTN]
−C−[GATPLVE]−[PHYWSTA]−C−x(6)−[LIVMF
YWT](ここでは2つのCは、レドックス活性結合を形成する)。
(Thioredoxin Family Active Site (Thioredox)) SEQ ID NO: 16
77 indicates a polynucleotide encoding a protein having a thioredoxin family active site. Thioredoxin is a small protein of about 100 amino acid residues that participates in various redox reactions through the reversible oxidation of active center disulfide bonds (Holmgren A. Annu. Rev. Biochem.
(1985) 54: 237; Gleason F .; K. Et al., FEMS Micr
obiol. Rev. (1988) 54: 271; Holmgren A .; J
. Biol. Chem. (1989) 264: 13963; Eklund H et al., Proteins (1991) 11:13). Thioredoxin exists in either a reduced or oxidized form in which two cysteine residues are linked in an intramolecular disulfide bond. Thioredoxin is present in prokaryotes and eukaryotes, and the sequences surrounding redox-active disulfide bonds are well conserved. All PDIs are 2 or 3 of the thioredoxin domain (ERp72)
Including copy. The consensus pattern is: [LIVMF]-[LIVMSTA]
-X- [LIVMFYC]-[FYWSTHE] -x (2)-[FYWGTN]
-C- [GATPLVE]-[PHYWSTA] -C-x (6)-[LIVMF
YWT] (where the two Cs form a redox active bond).

【0190】 (トリプシン(トリプシン))配列番号1410は、トリプシンファミリーの
新規なセリンプロテアーゼに対応する。トリプシンファミリーからのセリンプロ
テアーゼの触媒活性は、ヒスチジン(これ自身はセリンに水素結合する)に水素
結合するアスパラギン酸残基に関与する電荷リレー系によって提供される。活性
部位セリン残基およびヒスチジン残基の近傍における配列は、このプロテアーゼ
のファミリー中で良好に保存されている(Brenner S、Nature(
1988)334:528)。トリプシンタンパク質ファミリーについてのコン
センサスパターンは:1)[LIVM]−[ST]−A−[STAG]−H−C
、ここでHは活性部位残基である;および2)[DNSTAGC]−[GSTA
PIMVQH]−x(2)−G−[DE]−S−G−[GS]−[SAPHV]
−[LIVMFYWH]−[LIVMFYSTANQH]、ここではSは、活性
部位残基である。このファミリーに属することが知られる全ての配列は、第1の
保存されたグリシンが喪失した18個の異なるプロテアーゼを除いて、上記のコ
ンセンサス配列によって検出される。タンパク質がセリン活性部位特徴およびヒ
スチジン活性部位特徴の両方を含む場合、これが、トリプシンファミリーセリン
プロテアーゼである確率は、100%である。
(Trypsin) SEQ ID NO: 1410 corresponds to a novel serine protease of the trypsin family. The catalytic activity of serine proteases from the trypsin family is provided by a charge relay system involving an aspartic acid residue that hydrogen bonds to histidine, which itself hydrogen bonds to serine. The sequences near the active site serine and histidine residues are well conserved in this family of proteases (Brenner S, Nature (
1988) 334: 528). The consensus pattern for the trypsin protein family is: 1) [LIVM]-[ST] -A- [STAG] -HC
, Where H is an active site residue; and 2) [DNSTAGC]-[GSTA
PIMVQH] -x (2) -G- [DE] -SG- [GS]-[SAPHV]
-[LIVMFYWH]-[LIVMFYSTANQH], where S is an active site residue. All sequences known to belong to this family are detected by the consensus sequence above, except for the 18 different proteases that the first conserved glycine has lost. If the protein contains both serine and histidine active site features, the probability that it is a trypsin family serine protease is 100%.

【0191】 (WDドメイン、G−β反復(WDドメイン))配列番号1336、1380
、1711、1762、1909、2218、3047、3108、および32
92は、WDドメイン/G−β反復ファミリーの新規のメンバーを表す。β−ト
ランスデューシン(G−β)は、膜貫通レセプターによって生成されるシグナル
の伝達における中間体として作用するグアニンヌクレオチド結合タンパク質(G
タンパク質)の3つのサブユニット(α、β、およびγ)のうちの1つである(
Gilman、Annu.Rev.Biochem.(1987)56:615
)。αサブユニットは、GTPに結合し、これを加水分解し;βおよびγサブユ
ニットの機能は、それほど明確ではないが、GTPによるGDPの置換に、なら
びに膜固着化およびレセプター認識に必要とされるようである。高等真核生物に
おいて、G−βは、約340アミノ酸残基の高度に保存されたタンパク質の小さ
な多重遺伝子ファミリーとして存在する。構造学的に、G−βは、約40残基の
8つのタンデムな反復からなり、それぞれ中心的なTrp−Aspモチーフを含
む(この型の反復は、時折WD−40反復と呼ばれる)。WDドメイン/G−β
反復ファミリーのコンセンサスパターンは:[LIVMSTAC]−[LIVM
FYWSTAGC]−[LIMSTAG]−[LIVMSTAGC]−x(2)
−[DN]−x(2)−[LIVMWSTAC]−x−[LIVMFSTAG]
−W−[DEN]−[LIVMFSTAGCN]である。
(WD domain, G-β repeat (WD domain)) SEQ ID NOs: 1336, 1380
, 1711, 1762, 1909, 2218, 3047, 3108, and 32.
92 represents a novel member of the WD domain / G-β repeat family. β-transducin (G-β) is a guanine nucleotide binding protein (G-G) that acts as an intermediate in the transduction of signals generated by transmembrane receptors.
Is one of the three subunits (α, β, and γ) of (protein) (
Gilman, Annu. Rev. Biochem. (1987) 56: 615.
). The α subunit binds and hydrolyzes GTP; the functions of the β and γ subunits are less well defined, but are required for GDP displacement by GTP and for membrane anchoring and receptor recognition. It seems In higher eukaryotes, G-β exists as a small multigene family of highly conserved proteins of approximately 340 amino acid residues. Structurally, G-β consists of eight tandem repeats of approximately 40 residues, each containing a central Trp-Asp motif (this type of repeat is sometimes referred to as the WD-40 repeat). WD domain / G-β
The consensus pattern for the repeat family is: [LIVMSTAC]-[LIVM
FYWSTAGC]-[LIMSTAG]-[LIVMSTAGC] -x (2)
-[DN] -x (2)-[LIVMWSTAC] -x- [LIVMFSTAG]
-W- [DEN]-[LIVMFSTAGCN].

【0192】 (発生シグナル伝達タンパク質のwntファミリー(Wnt dev sig
n))配列番号1538は、発生シグナル伝達タンパク質のwntファミリーの
新規なメンバーに対応する。Wnt−1(以前はint−1として公知であった
)は、このファミリーの発生のメンバーであり(Nusse R、Trends
Genet(1988)4:291)、細胞内連絡において役割を果たすと考
えられ、そして中枢神経系(CNS)の発達において重要なシグナル伝達分子で
あるようである。全てのwntファミリータンパク質は、分泌タンパク質に特徴
的な以下の特徴を共有する:シグナルペプチド、いくつかの潜在的なNグリコシ
ル化部位、およびジスルフィド結合におそらく関与する22個の保存されたシス
テイン。wntタンパク質は、分泌細胞の形質膜に接着し、それゆえわずかな細
胞直径のみにわたってシグナル伝達するようである。コンセンサスパターン(3
つのシステインを含む高度に保存された領域に基づく)は、以下のようである:
C−K−C−H−G−[LIVMT]−S−G−x−C。
(Wnt family of developmental signaling proteins (Wnt dev sig
n)) SEQ ID NO: 1538 corresponds to a novel member of the wnt family of developmental signaling proteins. Wnt-1 (formerly known as int-1) is a developmental member of this family (Nusse R, Trends
Genet (1988) 4: 291), thought to play a role in intracellular communication, and appear to be an important signaling molecule in the development of the central nervous system (CNS). All wnt family proteins share the following features characteristic of secreted proteins: a signal peptide, several potential N-glycosylation sites, and 22 conserved cysteines likely involved in disulfide bonds. The wnt protein appears to adhere to the plasma membrane of secretory cells and therefore signal over only a small cell diameter. Consensus pattern (3
Based on a highly conserved region containing one cysteine) is as follows:
C-K-C-H-G- [LIVMT] -S-G-x-C.

【0193】 (タンパク質チロシンホスファターゼ(Yホスファターゼ))配列番号141
7は、タンパク質チロシンキナーゼをコードするポリヌクレオチドを表す。チロ
シン特異的タンパク質ホスファターゼ(EC 3.1.3.48)(PTPas
e)(Fischerら,Science(1991)253:401;Cha
rbonneauら,Annu.Rev.Cell Biol.(1992)8
:463;Trowbridge,J.Biol.Chem.(1991)26
6:23517;Tonksら,Trends Biochem.Sci.(1
989)14:497;およびHunter,Cell(1989)58:10
13)は、チロシン残基に付着したリン酸基の除去を触媒する。これらの酵素は
、細胞成長、増殖、分化および形質転換の制御に非常に重要である。複数の形態
のPTPaseが特徴付けられ、そして2つの分類に分類され得る:可溶性PT
PaseおよびPTPaseドメインを含む膜貫通レセプタータンパク質。構造
学的に、すべての既知のレセプターPTPaseは、可変長の細胞外ドメインか
らなり、膜貫通領域およびC末端触媒細胞質ドメインが続く。PTPaseドメ
インは、約300アミノ酸からなる。2つの保存されたシステインの検索によっ
て、これらが、活性に絶対的に必要であることが示された。さらに、そのすぐ近
傍の多くの保存された残基もまた、重要であることが示された。PTPaseの
コンセンサスパターンは、[LIVMF]−H−C−x(2)−G−x(3)−
[STC]−[STAGP]−x−[LIVMFY]であり;Cは活性部位残基
である。
(Protein Tyrosine Phosphatase (Y Phosphatase)) SEQ ID NO: 141
7 represents a polynucleotide encoding a protein tyrosine kinase. Tyrosine-specific protein phosphatase (EC 3.1.348) (PTPas
e) (Fischer et al., Science (1991) 253: 401; Cha.
rbonneau et al., Annu. Rev. Cell Biol. (1992) 8
: 463; Troubridge, J .; Biol. Chem. (1991) 26
6: 23517; Tonks et al., Trends Biochem. Sci. (1
989) 14: 497; and Hunter, Cell (1989) 58:10.
13) catalyzes the removal of phosphate groups attached to tyrosine residues. These enzymes are very important in controlling cell growth, proliferation, differentiation and transformation. Multiple forms of PTPase have been characterized and can be divided into two categories: soluble PT.
A transmembrane receptor protein containing Pase and PTPase domains. Structurally, all known receptors PTPase consist of an extracellular domain of variable length, followed by a transmembrane region and a C-terminal catalytic cytoplasmic domain. The PTPase domain consists of about 300 amino acids. A search for two conserved cysteines showed that they are absolutely necessary for activity. Moreover, many conserved residues in their immediate vicinity were also shown to be important. The consensus pattern for PTPase is [LIVMF] -HC-x (2) -G-x (3)-.
[STC]-[STAGP] -x- [LIVMFY]; C is the active site residue.

【0194】 (ジンクフィンガー、C2H2型(Zincfing C2H2))配列番号
308、807、1324、1503、1527、3081、3193および3
306は、C2H2型ジンクフィンガータンパク質ファミリーの新規のメンバー
をコードするポリヌクレオチドに対応する。ジンクフィンガードメインー(Kl
ugら、Trends Biochem.Sci.(1987)12:464;
Evansら、Cell(1988)52:1;Payreら、FEBS Le
tt.(1988)234:245;Millerら、EMBO J.(198
5)4:1609;およびBerg、Proc.Natl.Acad.Sci.
USA(1988)85:99)は、核酸結合タンパク質構造である。保存され
た亜鉛リガンド残基に加えて、多くの他の位置もまた、C2H2ジンクフィンガ
ーの構造完全性に重要であることが示された(Rosenfeldら、J.Bi
omol.Struct.Dyn.(1993)11:557)。最も良好に保
存される位置は、第2のシステインの後ろの4つの残基に見出され:この位置は
、一般に芳香族残基または脂肪族残基である。C2H2ジンクフィンガーについ
てのコンセンサスパターンは:C−x(2,4)−C−x(3)−[LIVMF
YWC]−x(8)−H−x(3,5)−Hである。2つのCおよび2つのHは
、亜鉛リガンドである。
(Zinc finger, C2H2 type (Zincfing C2H2)) SEQ ID NOs: 308, 807, 1324, 1503, 1527, 3081, 3193 and 3
306 corresponds to a polynucleotide encoding a novel member of the C2H2-type zinc finger protein family. Zinc finger domain (Kl
ug et al., Trends Biochem. Sci. (1987) 12: 464;
Evans et al., Cell (1988) 52: 1; Payre et al., FEBS Le.
tt. (1988) 234: 245; Miller et al., EMBO J. et al. (198
5) 4: 1609; and Berg, Proc. Natl. Acad. Sci.
USA (1988) 85:99) is a nucleic acid binding protein structure. In addition to the conserved zinc ligand residue, many other positions have also been shown to be important for the structural integrity of the C2H2 zinc finger (Rosenfeld et al., J. Bi.
omol. Struct. Dyn. (1993) 11: 557). The best conserved position is found in the four residues after the second cysteine: this position is generally an aromatic or aliphatic residue. The consensus pattern for C2H2 zinc fingers is: Cx (2,4) -Cx (3)-[LIVMF
YWC] -x (8) -H-x (3,5) -H. Two Cs and two Hs are zinc ligands.

【0195】 (Src相同性2)配列番号186、2591、3307、および3339は
、Src相同性2(SH2)タンパク質のファミリーの新規のメンバーをコード
するポリヌクレオチドを表す。Src相同性2(SH2)ドメインは、腫瘍性タ
ンパク質SrcとFpsとの間の保存された配列領域として第1に同定された約
100アミノ酸残基のタンパク質ドメインである(Sadowski I.ら,
Mol.Cell.Biol.6:4396−4408(1986))。類似の
配列は、多くの他の細胞内シグナル伝達タンパク質に見出される(Russel
R.B.ら,FEBS Lett.304:15−20(1992))。SH
2ドメインは、配列特異的様式およびリン酸化依存性様式で、ホスホチロシン含
有標的ペプチドと高い親和性で相互作用することによって細胞内シグナル伝達カ
スケードの調製モジュールとして機能する(Marangere L.E.M.
,Pawson T.,J.Cell Sci.Suppl.18:97−10
4(1994);Pawson T.,Schlessinger J.,Cu
rr.Biol.3:434−442(1993);Mayer B.J.,B
altimore D.,Trends Cell.Biol.3:8−13(
1993);Pawson T.,Nature 373:573−580(1
995))。
(Src Homology 2) SEQ ID NOs: 186, 2591, 3307, and 3339 represent polynucleotides encoding novel members of the family of Src Homology 2 (SH2) proteins. The Src homology 2 (SH2) domain is a protein domain of approximately 100 amino acid residues that was first identified as a conserved sequence region between the oncoproteins Src and Fps (Sadowski I., et al.
Mol. Cell. Biol. 6: 4396-4408 (1986)). Similar sequences are found in many other intracellular signaling proteins (Russel
R. B. Et al., FEBS Lett. 304: 15-20 (1992)). SH
The 2 domain functions as a preparative module of the intracellular signaling cascade by interacting with high affinity with phosphotyrosine-containing target peptides in a sequence-specific and phosphorylation-dependent manner (Marangere LEM.
, Pawson T .; J. Cell Sci. Suppl. 18: 97-10
4 (1994); Pawson T .; , Schlessinger J .; , Cu
rr. Biol. 3: 434-442 (1993); Mayer B .; J. , B
Altimore D. , Trends Cell. Biol. 3: 8-13 (
1993); Pawson T .; , Nature 373: 573-580 (1
995)).

【0196】 SH2ドメインは、2つのαへリックスおよび6〜7のβ鎖からなる保存され
た3D構造を有する。このドメインのコアは、2つの連結されたβシートからな
る連続するβ湾曲によって形成される(Kuriyan J.,Cowburn
D.,Curr.Opin.Struct.Biol.3:828−837(
1993))。SH2ドメインを検出するためのプロフィールは、総計すると9
2のマッチ位置である、8のギャップのないブロックおよび7のリンカー領域か
らなる構造学的アライメントに基づく。
The SH2 domain has a conserved 3D structure consisting of two α-helices and 6-7 β-strands. The core of this domain is formed by a contiguous β-curve consisting of two linked β-sheets (Kuriyan J., Cowburn.
D. Curr. Opin. Struct. Biol. 3: 828-837 (
1993)). The total profile for detecting SH2 domains is 9
Based on a structural alignment consisting of 8 gapless blocks and 7 linker regions, 2 match positions.

【0197】 (Src相同性3)配列番号234、1832および1835は、Src相同
性3(SH3)タンパク質のファミリーの新規のメンバーをコードするポリヌク
レオチドを表す。Src相同性3(SH3)ドメインは、いくつかの細胞質タン
パク質チロシンキナーゼの非触媒性部分における保存された配列(例えば、Sr
c、Abl、Lck)として第1に同定された約60アミノ酸残基の小さなタン
パク質ドメインである(Mayer B.J.ら,Nature 332:27
2−275(1988))。それ以来、広範な細胞内タンパク質または膜結合タ
ンパク質が、見出されている(Musacchio A.ら,FEBS Let
t.307:55−61(1992);Pawson T.,Schlessi
nger J.,Curr.Biol.3:434−442(1993);Ma
yer B.J.,Baltimore D.,Trends Cell Bi
ol.3:8−13(1993);Pawson T.,Nature 373
:573−580(1995))。
(Src Homology 3) SEQ ID NOs: 234, 1832 and 1835 represent polynucleotides encoding novel members of the family of Src homology 3 (SH3) proteins. The Src homology 3 (SH3) domain is a conserved sequence in the noncatalytic portion of some cytoplasmic protein tyrosine kinases (eg, Sr
c, Abl, Lck) is a small protein domain first identified as approximately 60 amino acid residues (Mayer BJ, et al., Nature 332: 27).
2-275 (1988)). Since then, a wide variety of intracellular or membrane-bound proteins have been found (Musaccio A. et al., FEBS Let).
t. 307: 55-61 (1992); Pawson T. et al. , Schlessi
nger J. Curr. Biol. 3: 434-442 (1993); Ma.
yer B. J. , Baltimore D .; , Trends Cell Bi
ol. 3: 8-13 (1993); Pawson T. et al. , Nature 373
: 573-580 (1995)).

【0198】 SH3ドメインは、2つの密に充填された逆平行βシートとして配置された5
または6のβ鎖からなる特徴的な折り畳みを有する。リンカー領域は、短いヘリ
ックスを含み得る(Kuriyan J.,Cowburn D.,Curr.
Opin.Struct.Biol.3:828−837(1993))。
The SH3 domain is arranged as two closely packed anti-parallel β-sheets 5
Or it has a characteristic fold consisting of 6 β-strands. The linker region may include short helices (Kuriyan J., Cowburn D., Curr.
Opin. Struct. Biol. 3: 828-837 (1993)).

【0199】 SH3ドメインの機能は、特定のタンパク質複合体のアセンブリを、プロリン
リッチなペプチドへの結合を介して媒介することであり得る(Morton C
.J.,Campbell I.D.,Curr.Biol.4:615−61
7(1994))。
The function of the SH3 domain may be to mediate the assembly of specific protein complexes via binding to proline-rich peptides (Morton C
. J. , Campbell I .; D. Curr. Biol. 4: 615-61
7 (1994)).

【0200】 一般的に、SH3ドメインは、所定のタンパク質におけるシグナルコピーとし
て見出されるが、2つのSH3ドメインを有する有意な数のタンパク質および3
または4のコピーを有するいくつかが存在する。
Generally, the SH3 domain is found as the signal copy in a given protein, although a significant number of proteins with two SH3 domains and 3
Or there are some with 4 copies.

【0201】 III型フィブロネクチン。配列番号746および1192は、III型フィ
ブロネクチンタンパク質のファミリーの新規なメンバーをコードするポリヌクレ
オチドを表す。リンホカイン、造血性増殖因子、および成長ホルモン関連分子に
ついての多数のレセプターが、共通の結合ドメインを共有することが見出されて
いる(Bazan J.F.,Biochem.Biophys.Res.Co
mmun.164:788−795(1989);Bazan J.F.,Pr
oc.Natl.Acad.Sci.U.S.A.87:6934−6938(
1990);Cosman D.ら、Trends Biochem.Sci.
15:265−270(1990);d’Andrea A.D.,Fasma
n G.D.,Lodish H.F.,Cell 58 :1023−102
4(1989);d’Andrea A.D.,Fasman G.D.,Lo
dish H.F.,Curr.Opin.Cell Biol.2:648−
651(1990))。
Type III fibronectin. SEQ ID NOs: 746 and 1192 represent polynucleotides encoding novel members of the family of type III fibronectin proteins. Multiple receptors for lymphokines, hematopoietic growth factors, and growth hormone-related molecules have been found to share a common binding domain (Bazan JF, Biochem. Biophys. Res. Co.
mmun. 164: 788-795 (1989); Bazan J. et al. F. , Pr
oc. Natl. Acad. Sci. U. S. A. 87: 6934-6938 (
1990); Cosman D .; Et al., Trends Biochem. Sci.
15: 265-270 (1990); d'Andrea A. et al. D. , Fasma
n G. D. Lodish H. et al. F. , Cell 58: 1023-102.
4 (1989); d'Andrea A. et al. D. , Fasman G .; D. , Lo
dish H. F. Curr. Opin. Cell Biol. 2: 648-
651 (1990)).

【0202】 保存性領域は、細胞外リガンド結合領域のすべてまたは一部を構成し、そして
約200アミノ酸残基長である。成長ホルモンレセプター中で、このドメインの
N末端においてジスルフィド結合に関与する既知の2対のシステインが存在する
The conserved region constitutes all or part of the extracellular ligand binding region and is approximately 200 amino acid residues in length. In the growth hormone receptor, there are two known pairs of cysteines involved in disulfide bonds at the N-terminus of this domain.

【0203】[0203]

【化2】 2つのパターンがこのレセプターファミリーを検出する。第1のパターンは、
最初のN末端ジスルフィドループ由来であり、第2のパターンは、細胞外領域の
端のC末端に位置するトリプトファンリッチパターンである。
[Chemical 2] Two patterns detect this receptor family. The first pattern is
The second pattern is from the first N-terminal disulfide loop and the second pattern is a tryptophan-rich pattern located at the C-terminus at the end of the extracellular region.

【0204】 このタンパク質ファミリーについてのコンセンサスは:C−[LVFYR]−
x(7,8)−[STIVDN]−C−x−W(2つのCはジスルフィド結合に
よって連結されている)である。このタンパク質ファミリーについての第2のコ
ンセンサスは:[STGL]−x−W−[SG]−x−W−Sである。
A consensus for this protein family is: C- [LVFYR]-
x (7,8)-[STIVDN] -Cxw (where the two Cs are linked by a disulfide bond). The second consensus for this protein family is: [STGL] -x-W- [SG] -x-WS.

【0205】 LIMドメイン含有タンパク質。配列番号1269、1309、1360、お
よび1386は、LIMドメイン含有タンパク質のファミリーの新規なメンバー
をコードするポリヌクレオチドを表す。多数のタンパク質が、約60アミノ酸残
基の保存性システインリッチドメインを含む(Freyd G.ら、Natur
e 344:876−879(1990);Baltz R.ら、Plant
Cell 4:1465−1466(1992);Sanchez−Garci
a I.,Rabbitts T.H.,Trends Genet.10:3
15−320(1994))。
LIM domain containing proteins. SEQ ID NOs: 1269, 1309, 1360, and 1386 represent polynucleotides encoding novel members of the family of LIM domain-containing proteins. Many proteins contain a conserved cysteine-rich domain of about 60 amino acid residues (Freyd G. et al., Nature.
e 344: 876-879 (1990); Baltz R. et al. Et al, Plant
Cell 4: 1465-1466 (1992); Sanchez-Garci.
a I. , Rabbitts T .; H. , Trends Genet. 10: 3
15-320 (1994)).

【0206】 LIMドメインにおいて、7つの保存性システイン残基および1つのヒスチジ
ンが存在する。これらの保存性残基が従う配列は、C−x(2)−C−x(16
,23)H−x(2)−[CH]−x(2)−C−x(2)−C−x(16,2
1)−C−x(2,3)−[CHD]である。LIMドメインは、2つの亜鉛イ
オンを結合する(Michelsen J.W.ら、Proc.Natl.Ac
ad Sci.U.S.A.90:4404−4408(1993))。LIM
はDNAを結合せず、むしろタンパク質−タンパク質相互作用のための界面とし
て作用するようである。このタンパク質ファミリーについてのコンセンサスは:
C−x(2)−C−x(15,21)−[FYWH]−H−x(2)−[CH]
−x(2)−C−x(2)−C−x(3)−[LIVMF]である。5つのCお
よび1つのHは亜鉛を結合する。
There are seven conserved cysteine residues and one histidine in the LIM domain. The sequence followed by these conserved residues is Cx (2) -Cx (16
, 23) H-x (2)-[CH] -x (2) -Cx (2) -Cx (16,2)
1) -C-x (2,3)-[CHD]. The LIM domain binds two zinc ions (Michelsen JW, et al., Proc. Natl. Ac.
ad Sci. U. S. A. 90: 4404-4408 (1993)). LIM
Does not bind DNA, but rather acts as an interface for protein-protein interactions. The consensus for this protein family is:
C-x (2) -C-x (15,21)-[FYWH] -H-x (2)-[CH]
It is -x (2) -Cx (2) -Cx (3)-[LIVMF]. Five Cs and one H binds zinc.

【0207】 C2ドメイン(プロテインキナーゼC様。配列番号1325および2282は
、C2ドメイン含有タンパク質のファミリーの新規なメンバーをコードするポリ
ヌクレオチドを表す。プロテインキナーゼC(PKC)のいくつかのアイソザイ
ムは、約116アミノ酸残基のC2として公知のドメインを含み、このドメイン
は、C1ドメイン(これはホルボールエステルおよびジアシルグリセロールを結
合する)の2つのコピーおよびプロテインキナーゼ触媒ドメインの間に位置する
(Azzi A.ら、Eur.J.Biochem.208:547−557(
1992);Stabel S.,Semin.Cancer Biol.5:
277−284(1994))。
The C2 domain (protein kinase C-like. SEQ ID NOs: 1325 and 2282 represent polynucleotides that encode novel members of the family of C2 domain-containing proteins. Some isozymes of protein kinase C (PKC) have about: It contains a domain known as C2 of 116 amino acid residues, which is located between two copies of the C1 domain, which binds phorbol ester and diacylglycerol, and the protein kinase catalytic domain (Azzi A. et al. Et al., Eur. J. Biochem. 208: 547-557 (
1992); Stabel S .; , Semin. Cancer Biol. 5:
277-284 (1994)).

【0208】 C2ドメインは、カルシウム依存性リン脂質結合に関与する(Davleto
v B.A.,Suedhof T.C.,J.Biol.Chem.268:
26386−26390(1993))。C2ドメインに関連するドメインはま
た、カルシウムを結合しないタンパク質においても見出されているので、C2ド
メインについての他の推定の機能には、イノシトール−1,3,5−四リン酸へ
の結合が挙げられる(Fukuda M.,ら、J.Biol.Chem.26
9:29206−29211(1994))。
The C2 domain is involved in calcium-dependent phospholipid binding (Davleto).
v B. A. , Suedhof T .; C. J. Biol. Chem. 268:
26386-26390 (1993)). Other putative functions for the C2 domain include binding to inositol-1,3,5-tetraphosphate, as domains related to the C2 domain have also been found in proteins that do not bind calcium. (Fukuda M., et al., J. Biol. Chem. 26.
9: 29206-29211 (1994)).

【0209】 C2ドメインについてのコンセンサスパターンは、このドメインの保存性部分
に位置し、連結ループはβ鎖2および3の間に位置する。C2ドメインにについ
てのプロフィールは、全体のドメインを網羅する。このタンパク質ファミリーに
ついてのコンセンサスは:[ACG]−x(2)−L−x(2,3)−D−x(
1,2)−[NGSTLIF]−[GTMR]−x−[STAP]−D−[PA
]−[FY]である。
The consensus pattern for the C2 domain is located in the conserved part of this domain and the connecting loop is located between β-strands 2 and 3. The profile for the C2 domain covers the entire domain. The consensus for this protein family is: [ACG] -x (2) -Lx (2,3) -Dx (
1, 2)-[NGSTLIF]-[GTMR] -x- [STAP] -D- [PA
]-[FY].

【0210】 セリンプロテアーゼ、トリプシンファミリー、活性部位。配列番号1410は
、セリンプロテアーゼのファミリー(トリプシンタンパク質)の新規なメンバー
をコードするポリヌクレオチドを表す。トリプシンファミリー由来のセリンプロ
テアーゼの触媒活性は、ヒスチジン(これ自体がセリンに水素結合している)に
水素結合したアスパラギン酸残基を含む電荷リレー系によって提供される。活性
部位のセリン残基およびヒスチジン残基の近傍の配列は、プロテアーゼのこのフ
ァミリーにおいて十分に保存されている(Brenner S.,Nature 334:528−530(1988))。
Serine proteases, trypsin family, active site. SEQ ID NO: 1410 represents a polynucleotide that encodes a novel member of the family of serine proteases (trypsin proteins). The catalytic activity of serine proteases from the trypsin family is provided by a charge relay system containing an aspartic acid residue hydrogen bonded to histidine, which is itself hydrogen bonded to serine. The sequences near the active site serine and histidine residues are well conserved in this family of proteases (Brenner S., Nature 334: 528-530 (1988)).

【0211】 このタンパク質ファミリーについてのコンセンサスは:[LIVM]−[ST
]−A−[STAG]−H−C[Hは活性部位の残基である]である。このタン
パク質ファミリーについての第2のコンセンサスは:[DNSTAGC]−[G
STAPIMVQH]−x(2)−G−[DE]−S−G−[GS]−[SAP
HV]−[LIVMFYWH]−[LIVMFYSTANQH][Sは活性部位
の残基である]である。
A consensus for this protein family is: [LIVM]-[ST
] -A- [STAG] -HC [H is the residue of the active site]. The second consensus for this protein family is: [DNSTAGC]-[G
STAPIMVQH] -x (2) -G- [DE] -SG- [GS]-[SAP
HV]-[LIVMFYWH]-[LIVMFYSTANQH] [S is the active site residue].

【0212】 RNA認識モチーフドメイン(RRM、RBD、またはRNP)。配列番号1
464および1514は、RNA認識モチーフドメインタンパク質のファミリー
の新規なメンバーをコードするポリヌクレオチドを表す(Bandziulis R.J.ら、Genes Dev.3:431−437(1989);Dre
yfuss G.ら、Trends Biochem.Sci.13:86−9
1(1988))。
RNA recognition motif domain (RRM, RBD, or RNP). Sequence number 1
464 and 1514 represent polynucleotides encoding novel members of the family of RNA recognition motif domain proteins (Bandziulis JJ et al., Genes Dev. 3: 431-437 (1989); Dre.
yfuss G. Et al., Trends Biochem. Sci. 13: 86-9
1 (1988)).

【0213】 推定のRNA結合ドメインの内部において、高度に保存されている2つの領域
が存在する。第1の領域は、6残基の疎水性セグメント(RNP−2モチーフと
呼ばれる)であり;第2の領域はオクタペプチドモチーフ(RNP−1またはR
NP−CSと呼ばれる)である。このドメインにおける両方のモチーフの位置を
、以下の模式図に示す。
Within the putative RNA-binding domain, there are two regions that are highly conserved. The first region is a 6-residue hydrophobic segment (termed the RNP-2 motif); the second region is the octapeptide motif (RNP-1 or RNP).
NP-CS). The positions of both motifs in this domain are shown in the schematic diagram below.

【0214】[0214]

【化3】 この型のドメインについてのコンセンサスパターンとして、RNP−1モチー
フを使用した。このタンパク質ファミリーについてのコンセンサスは:[RK]
−G−{EDRKHPCG}−[AGSCI]−[FY]−[LIVA]−x−
[FYLM]である。
[Chemical 3] The RNP-1 motif was used as a consensus pattern for this type of domain. The consensus for this protein family is: [RK]
-G- {EDRKHPCG}-[AGSCI]-[FY]-[LIVA] -x-
[FYLM].

【0215】 ホスファチジルイノシトール特異的ホスホリパーゼC、Yドメイン。配列番号
1707は、ホスファチジルイノシトール特異的ホスホリパーゼC、Yドメイン
のファミリーのタンパク質の新規なメンバーをコードするポリヌクレオチドを表
す。ホスファチジルイノシトール特異的ホスホリパーゼC(EC3.1.4.1
1)は、真核生物の細胞内酵素であり、シグナル伝達プロセスにおいて重要な役
割を演じている(Meldrum E.ら、Biochim.Biophys.
Acta 1092:49−71(1991))。この酵素は、セカンドメッセ
ンジャー分子であるジアシルグリセロールおよびイノシトール−1,4,5−三
リン酸への、1−ホスファチジル−D−ミオ−イノシトール−3,4,5−三リ
ン酸の加水分解を触媒する。この触媒的プロセスは、調節タンパク質の可逆的リ
ン酸化および結合によって強固に調節されている(Rhee S.G.,Cho
i K.D.,Adv.Second Messenger Phosphop
rotein Res.26:35−61(1992);Rhee S.G.,
Choi K.D.,J Biol.Chem.267:12393−1239
6(1992);Sternweis P.C.,Smrcka A.V.,T
rends Biochem.Sci.17:502−506(1992))。
Phosphatidylinositol-specific phospholipase C, Y domain. SEQ ID NO: 1707 represents a polynucleotide encoding a novel member of a phosphatidylinositol-specific phospholipase C, Y domain family of proteins. Phosphatidylinositol-specific phospholipase C (EC 3.1.4.1)
1) is a eukaryotic intracellular enzyme that plays an important role in the signal transduction process (Meldrum E. et al., Biochim. Biophys.
Acta 1092: 49-71 (1991)). This enzyme catalyzes the hydrolysis of 1-phosphatidyl-D-myo-inositol-3,4,5-triphosphate to the second messenger molecules diacylglycerol and inositol-1,4,5-triphosphate. To do. This catalytic process is tightly regulated by reversible phosphorylation and binding of regulatory proteins (Rhee SG, Cho.
i K. D. , Adv. Second Messenger Phosphop
rotation Res. 26: 35-61 (1992); Rhee S .; G. ,
Choi K. D. , J Biol. Chem. 267: 12393-1239
6 (1992); Sternweis P .; C. , Smrcka A .; V. , T
rends Biochem. Sci. 17: 502-506 (1992)).

【0216】 すべての真核生物PI−PLCは、2つの相同性領域を含み、これらは「X−
ボックス」および「Y−ボックス」と呼ばれる。これらの2つの領域の順番は同
じ(NH2−X−Y−COOH)であるが、その間隔が異なる。大部分のアイソ
フォームにおいて、これらの2つの領域間の距離は、わずか50〜100残基で
あるが、γアイソフォームにおいては、1つのPHドメイン、2つのSH2ドメ
イン、および1つのSH3ドメインが2つのPLC特異的ドメイン間に挿入され
ている。これらの2つの保存性領域は、触媒活性のために重要であることが示さ
れてきた。Y−ボックスのC末端において、Ca依存性膜結合におそらく関与す
るC2ドメインが存在する。
All eukaryotic PI-PLCs contain two regions of homology, these are "X-
Called "box" and "Y-box". The order of these two regions is the same (NH2-XY-COOH), but their intervals are different. In most isoforms, the distance between these two regions is only 50-100 residues, whereas in the gamma isoform, one PH domain, two SH2 domains, and one SH3 domain are two. It is inserted between two PLC-specific domains. These two conserved regions have been shown to be important for catalytic activity. At the C-terminus of the Y-box, there is a C2 domain probably involved in Ca-dependent membrane binding.

【0217】 セリンカルボキシペプチダーゼ。配列番号1744は、セリンカルボキシペプ
チダーゼファミリーのタンパク質の新規なメンバーをコードするポリヌクレオチ
ドを表す。カルボキシペプチダーゼは、メタロカルボキシペプチダーゼまたはセ
リンカルボキシペプチダーゼ(EC3.4.16.5およびEC3.4.16.
6)のいずれかであり得る。セリンカルボキシペプチダーゼの触媒活性は、トリ
プシンファミリーのセリンプロテアーゼの触媒活性と同様に、ヒスチジン(これ
自体がセリンに水素結合している)に水素結合したアスパラギン酸残基を含む電
荷リレー系によって提供される(Liao D.I.,Remington S
.J.,J.Biol.Chem.265:6528−6531(1990))
Serine carboxypeptidase. SEQ ID NO: 1744 represents a polynucleotide encoding a novel member of the serine carboxypeptidase family of proteins. Carboxypeptidases are metallocarboxypeptidases or serine carboxypeptidases (EC3.4.16.5 and EC3.4.16.
It can be any of 6). The catalytic activity of serine carboxypeptidases is provided by a charge relay system containing an aspartic acid residue hydrogen-bonded to histidine, which itself is hydrogen-bonded to serine, similar to the catalytic activity of serine proteases of the trypsin family. (Liao DI, Remington S.
. J. J. Biol. Chem. 265: 6528-6531 (1990)).
.

【0218】 活性部位のセリン残基およびヒスチジン残基の周辺の配列は、これらすべての
セリンカルボキシペプチダーゼにおいて高度に保存されている。このタンパク質
ファミリーについてのコンセンサスは:[LIVM]−x−[GTA]−E−S
−Y−[AG]−[GS][Sは活性部位の残基である]である。このタンパク
質ファミリーについての第2のコンセンサスは:[LIVF]−x(2)−[L
IVSTA]−x−[IVPST]−x−[GSDNQL][SAGV]−[S
G]−H−x−[IVAQ]−P−x(3)−[PSA]である[Hは活性部位
の残基である]。
The sequences surrounding the active site serine and histidine residues are highly conserved in all these serine carboxypeptidases. The consensus for this protein family is: [LIVM] -x- [GTA] -ES
-Y- [AG]-[GS] [S is the residue of the active site]. The second consensus for this protein family is: [LIVF] -x (2)-[L
IVSTA] -x- [IVPST] -x- [GSDNQL] [SAGV]-[S
G] -Hx- [IVAQ] -Px (3)-[PSA], where H is the active site residue.

【0219】 dsrm二本鎖RNA結合モチーフ。配列番号1818は、dsrm二本鎖R
NA結合モチーフタンパク質の新規なメンバーをコードするポリヌクレオチドを
表す。真核生物細胞において、多数のRNA結合タンパク質が、遺伝子発現の転
写後調節における鍵となる役割を果たす。これらのタンパク質の特徴付けは、い
くつかのRNA結合モチーフの同定をもたらす。いくつかのヒトおよび他の脊椎
動物の遺伝的障害が、RNA結合タンパク質の異常な発現によって引き起こされ
る(C.G.BurdおよびG.Dreyfuss,Science 265:
615−621(1994))。
Dsrm double-stranded RNA binding motif. SEQ ID NO: 1818 is a dsrm double-stranded R
1 depicts a polynucleotide encoding a novel member of NA binding motif protein. In eukaryotic cells, numerous RNA binding proteins play key roles in the post-transcriptional regulation of gene expression. Characterization of these proteins has led to the identification of several RNA binding motifs. Several human and other vertebrate genetic disorders are caused by aberrant expression of RNA binding proteins (CG Burd and G. Dreyfuss, Science 265:
615-621 (1994)).

【0220】 二本鎖RNA結合モチーフを含むタンパク質は、特異的RNA標的に結合する
。二本鎖RNA結合モチーフは、ヒトにおいて、インターフェロンによって誘導
されたプロテインキナーゼ(これは、dsRNAに対する細胞応答の一部である
)によって例証される。
Proteins containing the double-stranded RNA binding motif bind to specific RNA targets. The double-stranded RNA binding motif is illustrated in humans by a protein kinase induced by interferon, which is part of the cellular response to dsRNA.

【0221】 配列番号2577、3183、および3195は、4回膜貫通内在性膜タンパ
ク質ファミリーのメンバーをコードする。このファミリーは、III型タンパク
質からなり、これらは、生合成の間に切断されないN末端膜アンカードメインを
含む内在性膜タンパク質であり、そして移行シグナルおよび膜アンカーとして機
能する。これらのタンパク質はまた、3つのさらなる膜貫通領域を有する。その
コンセンサスパターンは、G−x(3)−[LIVMF]−x(2)−[GSA
]−[LIVMF](2)−G−C−x−[GA]−[STA]−x(20−[
eG]−x(20−[CwN]−[LIVM](2)である。
SEQ ID NOs: 2577, 3183, and 3195 encode members of the four-transmembrane integral membrane protein family. This family consists of type III proteins, which are integral membrane proteins that contain an N-terminal membrane anchor domain that is not cleaved during biosynthesis, and function as translocation signals and membrane anchors. These proteins also have three additional transmembrane regions. The consensus pattern is G-x (3)-[LIVMF] -x (2)-[GSA.
]-[LIVMF] (2) -GC-x- [GA]-[STA] -x (20- [
eG] -x (20- [CwN]-[LIVM] (2).

【0222】 配列番号2944は、カルパインラージサブユニット、ドメインIIIを有す
るポリペプチドをコードする。カルパインとは、種々の生物学的役割を果たす、
細胞内プロテアーゼのファミリーである。カルパイン3(p94としてもまた公
知)は、骨格筋において優先的に発現され、そして2A型肢帯筋ジストロフィー
において、役割を果たす(Sorimachi,H.ら、Biochem.J.
328:721−732,1997)。
SEQ ID NO: 2944 encodes a polypeptide having calpain large subunit, domain III. Calpain plays various biological roles,
It is a family of intracellular proteases. Calpain 3 (also known as p94) is predominantly expressed in skeletal muscle and plays a role in limb girdle muscular dystrophy type 2A (Sorimachi, H. et al., Biochem. J. et al.
328: 721-732, 1997).

【0223】 配列番号1911および1980は、C3HC4型ジンクフィンガードメイン
(RINGフィンガー)を有するポリペプチドをコードする。このドメインは、
2原子の亜鉛を結合する40〜60残基のシステインリッチドメインであり、そ
してタンパク質−タンパク質相互作用の媒介に関与すると考えられている。この
ファミリーの哺乳動物タンパク質としては、以下が挙げられる:V(D)J組換
え活性化タンパク質(これは、免疫グロブリンおよびT細胞レセプター遺伝子の
再構成を活性化する);乳癌1型感受性タンパク質(BRCA1);bmi−1
癌原遺伝子;cbl癌原遺伝子;およびmel−18タンパク質(これは、種々
の腫瘍細胞において発現され、そして特定のDNA配列を認識および結合する転
写抑制因子である)。このコンセンサスパターンは、C−x−H−x−[LIV
MFY]−C−x(2)−C−[LIVMYA]である。
SEQ ID NOs: 1911 and 1980 encode polypeptides having a C3HC4 type zinc finger domain (RING finger). This domain is
It is a 40-60 residue cysteine-rich domain that binds diatomic zinc and is believed to be involved in mediating protein-protein interactions. Mammalian proteins of this family include: V (D) J recombination activating protein, which activates rearrangement of immunoglobulin and T cell receptor genes; breast cancer type 1 susceptibility protein ( BRCA1); bmi-1
Protooncogene; cbl protooncogene; and mel-18 protein, which is a transcriptional repressor that is expressed in various tumor cells and recognizes and binds specific DNA sequences. This consensus pattern is Cx-H-x- [LIV
MFY] -Cx (2) -C- [LIVMYA].

【0224】 配列番号3274は、約100アミノ酸残基の、フォークヘッド型ドメインを
有する真核生物転写因子をコードする。この群のタンパク質は、以下が挙げられ
る転写因子である:哺乳動物転写因子HNF−3−α、−β、および−γ;イン
ターロイキンエンハンサー結合因子;ならびにHTLF(これは、ヒトT細胞白
血病ウイルスの長い末端反復の領域に結合する)。このコンセンサスパターンは
、[KR]−P−[PTQ]−[FYLVQH]−S−[FY]x(2)−[L
IVM]−X(3,4)−[AC]−[LIM]である。
SEQ ID NO: 3274 encodes a eukaryotic transcription factor with a forkhead domain of about 100 amino acid residues. Proteins in this group are transcription factors that include: mammalian transcription factors HNF-3-α, -β, and -γ; interleukin enhancer binding factor; and HTLF, which is a human T-cell leukemia virus. Binds to regions of long terminal repeats). This consensus pattern is [KR] -P- [PTQ]-[FYLVQH] -S- [FY] x (2)-[L
IVM] -X (3,4)-[AC]-[LIM].

【0225】 配列番号3345は、PDZドメインを有するポリペプチドをコードする。数
ダースのシグナル伝達タンパク質は、PDZドメインとして公知である80〜1
00の残基反復を有する、タンパク質のこの群に属する。これらのタンパク質の
うちのいくつかは、イオンチャンネルおよび/またはレセプターのC末端テトラ
ペプチドモチーフX−Ser/Thr/X−Val−COO−と相互作用する(
Ponting,C.P.,Protein Sci.6;464−468,1
997)。
SEQ ID NO: 3345 encodes a polypeptide having a PDZ domain. Several dozen signaling proteins are known as PDZ domains, 80-1
Belonging to this group of proteins, which have 00 residue repeats. Some of these proteins interact with the C-terminal tetrapeptide motif X-Ser / Thr / X-Val-COO- of ion channels and / or receptors (
Ponting, C.I. P. , Protein Sci. 6; 464-468, 1
997).

【0226】 配列番号3351は、ホルボールエステル/グリセロール結合タンパク質のフ
ァミリーのポリペプチドをコードする。ホルボールエステル(PE)は、ジアシ
ルグリセロール(DAG)のアナログであり、そして強力な腫瘍プロモーターで
ある。DAGは、プロテインキナーゼCとして公知であるセリン−スレオニンプ
ロテインキナーゼのファミリーを活性化する。プロテインキナーゼCのN末端領
域は、PEおよびDAGを結合し、そして約50アミノ酸残基のシステインリッ
チドメインの1つまたは2つのコピーを含む。このドメインを有する他のタンパ
ク質としては、ジアシルグリセロールキナーゼ;vav癌遺伝子;およびN−キ
メリン(chimaerin)(脳特異的タンパク質)が挙げられる。DAG/
PE結合ドメインは、このドメインにおいて保存される6つのシステインおよび
2つのヒスチジンを介して、2つの亜鉛イオンを結合する。このコンセンサスパ
ターンは、H−x−[LIVMFYW]−x(8,1l)−C−x(2)−C−
x−(3)−[LIVMFC]−x(5,10)−C−x(2)−C−x(4)
−[HD]−x(2)−C−x(5,9)−Cである。
SEQ ID NO: 3351 encodes a polypeptide of the family of phorbol ester / glycerol binding proteins. Phorbol ester (PE) is an analog of diacylglycerol (DAG) and is a strong tumor promoter. DAG activates a family of serine-threonine protein kinases known as protein kinase C. The N-terminal region of protein kinase C binds PE and DAG and contains one or two copies of a cysteine-rich domain of approximately 50 amino acid residues. Other proteins with this domain include diacylglycerol kinase; the vav oncogene; and N-chimerin, a brain-specific protein. DAG /
The PE binding domain binds two zinc ions via the 6 cysteines and 2 histidines that are conserved in this domain. This consensus pattern is H-x- [LIVMFYW] -x (8,1l) -Cx (2) -C-.
x- (3)-[LIVMFC] -x (5,10) -Cx (2) -Cx (4)
-[HD] -x (2) -C-x (5,9) -C.

【0227】 配列番号2216は、WW/rsp5/WWPドメインを有するポリペプチド
をコードする。このタンパク質は、保存された芳香族位置(一般に、トリプトフ
ァン)および保存されたプロリンの存在に因んで命名される。このドメインを有
するタンパク質としては、ジストロフィン、脊椎動物YAPタンパク質、および
IQGAP(ラットに作用する、ヒトGTPase活性化タンパク質)が挙げら
れる。このコンセンサスパターンは、W−x(9,11)−[VFY]−[FY
W]−x(6,7)−[GSTNE]−[GSTQCR]−[FYW]−x(2
)−Pである。
SEQ ID NO: 2216 encodes a polypeptide having a WW / rsp5 / WWP domain. The protein is named for the presence of a conserved aromatic position (generally tryptophan) and a conserved proline. Proteins having this domain include dystrophin, vertebrate YAP protein, and IQGAP (human GTPase activating protein acting on rat). This consensus pattern is Wx (9,11)-[VFY]-[FY
W] -x (6,7)-[GSTNE]-[GSTQCR]-[FYW] -x (2
) -P.

【0228】 配列番号2428は、触媒性ドメインを有する二重特異性ホスファターゼファ
ミリーのメンバーをコードし、そして配列番号2281および2310は、プロ
テインチロシンホスファターゼファミリーのメンバーをコードする。これらのフ
ァミリーは、関連があり、そしてチロシン特異的プロテインホスファターゼとし
て分類される。これらの酵素は、チロシン残基からのリン酸基の除去を触媒し、
そして細胞の成長、増殖、分化、および変換の制御において、重要である。この
コンセンサスパターンは、[LIVMF]−H−C−x(2)−G−x−(3)
−[STC]−[STAGP]−x−[LIVMFY]である。
SEQ ID NO: 2428 encodes a member of the bispecific phosphatase family with a catalytic domain, and SEQ ID NOS: 2281 and 2310 encode members of the protein tyrosine phosphatase family. These families are related and classified as tyrosine-specific protein phosphatases. These enzymes catalyze the removal of phosphate groups from tyrosine residues,
And it is important in controlling cell growth, proliferation, differentiation, and conversion. This consensus pattern is [LIVMF] -H-C-x (2) -G-x- (3).
-[STC]-[STAGP] -x- [LIVMFY].

【0229】[0229]

【表1】 [Table 1]

【0230】[0230]

【表2】 [Table 2]

【0231】[0231]

【表3】 [Table 3]

【0232】[0232]

【表4】 [Table 4]

【配列表】 [Sequence list]

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) C12N 1/19 C12N 1/21 4H045 1/21 C12Q 1/68 A 5/10 G01N 33/53 D C12Q 1/68 M G01N 33/53 33/566 33/574 Z 33/566 A61K 31/7088 33/574 C12N 15/00 ZNAA // A61K 31/7088 5/00 A 38/00 A61K 37/02 (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,MZ,SD,SL,SZ,TZ,UG ,ZW),EA(AM,AZ,BY,KG,KZ,MD, RU,TJ,TM),AE,AG,AL,AM,AT, AU,AZ,BA,BB,BG,BR,BY,BZ,C A,CH,CN,CR,CU,CZ,DE,DK,DM ,DZ,EE,ES,FI,GB,GD,GE,GH, GM,HR,HU,ID,IL,IN,IS,JP,K E,KG,KP,KR,KZ,LC,LK,LR,LS ,LT,LU,LV,MA,MD,MG,MK,MN, MW,MX,MZ,NO,NZ,PL,PT,RO,R U,SD,SE,SG,SI,SK,SL,TJ,TM ,TR,TT,TZ,UA,UG,UZ,VN,YU, ZA,ZW (72)発明者 ウィリアムズ, ルイス ティー. アメリカ合衆国 カリフォルニア 94662 −8097, エミリービル, ピー.オー. ボックス 8097, カイロン コーポレ イション (72)発明者 エスコベド, ジェイム アメリカ合衆国 カリフォルニア 94662 −8097, エミリービル, ピー.オー. ボックス 8097, カイロン コーポレ イション (72)発明者 イニス, マイケル エイ. アメリカ合衆国 カリフォルニア 94662 −8097, エミリービル, ピー.オー. ボックス 8097, カイロン コーポレ イション (72)発明者 ガルシア, パブロ ドミンゲズ アメリカ合衆国 カリフォルニア 94662 −8097, エミリービル, ピー.オー. ボックス 8097, カイロン コーポレ イション (72)発明者 クリンガー, ジュリー アメリカ合衆国 カリフォルニア 94662 −8097, エミリービル, ピー.オー. ボックス 8097, カイロン コーポレ イション (72)発明者 カッサム, アルタフ アメリカ合衆国 カリフォルニア 94662 −8097, エミリービル, ピー.オー. ボックス 8097, カイロン コーポレ イション (72)発明者 レインハード, クリストフ アメリカ合衆国 カリフォルニア 94662 −8097, エミリービル, ピー.オー. ボックス 8097, カイロン コーポレ イション (72)発明者 ランダッゾ, フィリッポ アメリカ合衆国 カリフォルニア 94662 −8097, エミリービル, ピー.オー. ボックス 8097, カイロン コーポレ イション (72)発明者 ケネディー, グイリア シー. アメリカ合衆国 カリフォルニア 94662 −8097, エミリービル, ピー.オー. ボックス 8097, カイロン コーポレ イション (72)発明者 ポット, デイビッド アメリカ合衆国 カリフォルニア 94662 −8097, エミリービル, ピー.オー. ボックス 8097, カイロン コーポレ イション (72)発明者 ランソン, ジョージ アメリカ合衆国 カリフォルニア 94662 −8097, エミリービル, ピー.オー. ボックス 8097, カイロン コーポレ イション (72)発明者 ダーマナック, ラドジェ アメリカ合衆国 カリフォルニア 94086, サニーベイル, アルマノー アベニュ ー 675 (72)発明者 カーケンヤコフ, ラドマー アメリカ合衆国 カリフォルニア 94086, サニーベイル, アルマノー アベニュ ー 675 (72)発明者 ダーマナック, スネザナ アメリカ合衆国 カリフォルニア 94086, サニーベイル, アルマノー アベニュ ー 675 (72)発明者 ディクソン, マーク アメリカ合衆国 カリフォルニア 94086, サニーベイル, アルマノー アベニュ ー 675 (72)発明者 ラバット, イヴァン アメリカ合衆国 カリフォルニア 94086, サニーベイル, アルマノー アベニュ ー 675 (72)発明者 レシュコウィティズ, ディナ アメリカ合衆国 カリフォルニア 94086, サニーベイル, アルマノー アベニュ ー 675 (72)発明者 キタ, デイビッド アメリカ合衆国 カリフォルニア 94086, サニーベイル, アルマノー アベニュ ー 675 (72)発明者 ガルシア, ベロニカ アメリカ合衆国 カリフォルニア 94086, サニーベイル, アルマノー アベニュ ー 675 (72)発明者 ジョーンズ, リー ウィリアム アメリカ合衆国 カリフォルニア 94086, サニーベイル, アルマノー アベニュ ー 675 (72)発明者 ストラチェ−クレイン, バージット アメリカ合衆国 カリフォルニア 94086, サニーベイル, アルマノー アベニュ ー 675 Fターム(参考) 4B024 AA12 BA80 CA04 CA09 CA20 DA01 DA02 DA05 DA11 DA12 GA11 HA11 HA13 HA14 4B063 QA01 QA19 QQ53 QR08 QR32 QR35 QR40 QR56 QR62 QS16 QS25 QS34 QS36 QX02 4B065 AA01X AA58X AA72X AA87X AA93Y AB01 AC14 BA02 CA24 CA44 CA46 4C084 AA01 AA13 CA27 CA53 ZB26 4C086 AA02 EA16 MA01 NA14 ZB26 4H045 AA10 AA11 AA20 BA10 CA40 DA75 EA20 EA50 FA71 FA74─────────────────────────────────────────────────── ─── Continuation of front page (51) Int.Cl. 7 Identification code FI theme code (reference) C12N 1/19 C12N 1/21 4H045 1/21 C12Q 1/68 A 5/10 G01N 33/53 D C12Q 1 / 68 MG01N 33/53 33/566 33/574 Z 33/566 A61K 31/7088 33/574 C12N 15/00 ZNAA // A61K 31/7088 5/00 A 38/00 A61K 37/02 (81) designation Country EP (AT, BE, CH, CY, DE, DK, ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT, SE), OA (BF, BJ, CF, CG) , CI, CM, GA, GN, GW, ML, MR, NE, SN, TD, TG), AP (GH, GM, KE, LS, MW, MZ, SD, SL, SZ, TZ, UG, ZW) ), E (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM), AE, AG, AL, AM, AT, AU, AZ, BA, BB, BG, BR, BY, BZ, CA, CH , CN, CR, CU, CZ, DE, DK, DM, DZ, EE, ES, FI, GB, GD, GE, GH, GM, HR, HU, ID, IL, IN, IS, JP, KE, KG, KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV, MA, MD, MG, MK, MN, MW, MX, MZ, NO, NZ, PL, PT, RO, RU , SD, SE, SG, SI, SK, SL, TJ, TM, TR, TT, TZ, UA, UG, UZ, VN, YU, ZA, ZW (72) Inventor Williams, Lewis T. United States California 94662-8097, Emilyville, P. Oh. Box 8097, Chiron Corporation (72) Inventor Escobed, James United States California 94662-8097, Emilyville, P. Oh. Box 8097, Chiron Corporation (72) Inventor Innis, Michael A .. United States California 94662-8097, Emilyville, P. Oh. Box 8097, Chiron Corporation (72) Inventor Garcia, Pablo Dominguez United States California 94662-8097, Emilyville, P. Oh. Box 8097, Chiron Corporation (72) Inventor Klinger, Julie United States California 94662-8097, Emily Bill, P. Oh. Box 8097, Chiron Corporation (72) Inventor Kassam, Altough United States California 94662-8097, Emilyville, P. Oh. Box 8097, Chiron Corporation (72) Inventor Rainhard, Christoph United States California 94662-8097, Emilyville, P. Oh. Box 8097, Chiron Corporation (72) Inventor Randazo, Filippo United States California 94662-8097, Emilyville, P. Oh. Box 8097, Chiron Corporation (72) Inventor Kennedy, Guilliacy. United States California 94662-8097, Emilyville, P. Oh. Box 8097, Chiron Corporation (72) Inventor Pot, David United States California 94662-8097, Emily Bill, P. Oh. Box 8097, Chiron Corporation (72) Inventor Lanson, George United States California 94662-8097, Emily Bill, P. Oh. Box 8097, Chiron Corporation (72) Inventor Darmanac, Ladge United States California 94086, Sunnyvale, Armano Avenue 675 (72) Inventor Kirken Yakov, Radmer United States California 94086, Sunnyvale, Armano Avenue 675 (72) Inventor Darmanac, Snezana United States California 94086, Sunnyvale, Almanau Avenue 675 (72) Inventor Dixon, Mark United States California 94086, Sunnyvale, Armano Avenue 675 (72) Inventor Labat, Ivan United States California 94086, Sunnyvale, Armano Avenue 675 (72) Invention Reshko Withits, Dina United States California 94086, Sunnyvale, Armano Avenue 675 (72) Inventor Kita, David United States California 94086, Sunnyvale, Armano Avenue 675 (72) Inventor Garcia, Veronica United States California 94086, Sunnyvale, Almaneau Avenue 675 (72) Inventor Jones, Lee William USA California 94086, Sunnyvale, Armano Avenue 675 (72) Inventor Strache Crane, Bargit United States California 94086, Sunnyvale, Armano Avenue 675 F Term (reference) 4B024 AA12 BA80 CA04 CA09 CA20 DA01 DA02 DA05 DA11 DA12 GA11 HA11 HA13 HA14 4B063 QA QA19 QQ53 QR08 QR32 QR35 QR40 QR56 QR62 QS16 QS25 QS34 QS36 QX02 4B065 AA01X AA58X AA72X AA87X AA93Y AB01 AC14 BA02 CA24 CA44 CA46 4C084 AA01 AA13 CA27 CA53 ZB26 4C086 AA15 AA02 A16 MAA02 A16 AA02 A16 MA14 0 CA40 DA75 EA20 EA50 FA71 FA74

Claims (15)

【特許請求の範囲】[Claims] 【請求項1】 ポリヌクレオチドのライブラリーであって、該ライブラリー
が配列番号1〜3351のうちの少なくとも1つの配列情報を含む、ライブラリ
ー。
1. A library of polynucleotides, wherein the library comprises sequence information for at least one of SEQ ID NOs: 1-3351.
【請求項2】 前記ライブラリーが核酸アレイ上で提供される、請求項1に
記載のライブラリー。
2. The library of claim 1, wherein the library is provided on a nucleic acid array.
【請求項3】 前記ライブラリーがコンピューターで読み取り可能な形式で
提供される、請求項1に記載のライブラリー。
3. The library of claim 1, wherein the library is provided in a computer readable format.
【請求項4】 請求項1に記載のライブラリーであって、該ライブラリーが
、コントロール細胞と比較して高い転移能の癌細胞中に示差的に発現される遺伝
子に対応するポリヌクレオチドを含み、該コントロール細胞は、正常な細胞また
は低い転移能の細胞であり、該発現は、転移性組織においてより大きく、そして
配列が、配列番号14、137、151、152、171、200、254、2
62、271、348、412、472、507、520、530、588、6
23、637、660、678、680、700、714、774、812、8
34、901、937、976、1168、1333、1352、1520、1
524、1546、1550、1574、1580、1590、1599、16
07、1622、1706、1752、1768、1769、1780、178
1、1799、1803、1811、1851、1856、1867、1872
、1875、1884、1919、1923、1939、1975、2024、
2045、2060、2071、2118、2119、2128、2135、2
177、2181、2184、2185、2190、2193、2232、22
39、2283、2311、2314、2338、2378、2393、239
4、2395、2398、2460、2490、2505、2514、2540
、2542、2597、2607、2640、2657、2669、2670、
2674、2679、2684、2707、2724、2757、2776、2
804、2818、2906、2959、2964、2968、2976、29
80、2987、3010、3043、3047、3050、3071、307
2、3092、3095、3097、3140、3157、3173、3187
、3203、3210、3212、3220、3236、3249、3264、
3284、3288、3305、3309、3318、3330、3331、お
よび3335からなる群より選択される、ライブラリー。
4. The library according to claim 1, wherein the library comprises a polynucleotide corresponding to a gene differentially expressed in a cancer cell having a high metastatic potential as compared with a control cell. , The control cells are normal cells or cells with low metastatic potential, the expression is greater in metastatic tissue and the sequences are SEQ ID NOs: 14, 137, 151, 152, 171, 200, 254, 2
62, 271, 348, 412, 472, 507, 520, 530, 588, 6
23, 637, 660, 678, 680, 700, 714, 774, 812, 8
34, 901, 937, 976, 1168, 1333, 1352, 1520, 1
524, 1546, 1550, 1574, 1580, 1590, 1599, 16
07, 1622, 1706, 1752, 1768, 1769, 1780, 178
1, 1799, 1803, 1811, 1851, 1856, 1867, 1872
, 1875, 1884, 1919, 1923, 1939, 1975, 2024,
2045, 2060, 2071, 2118, 2119, 2128, 2135, 2
177, 2181, 2184, 2185, 2190, 2193, 2232, 22
39, 2283, 2311, 2314, 2338, 2378, 2393, 239.
4, 2395, 2398, 2460, 2490, 2505, 2514, 2540
, 2542, 2597, 2607, 2640, 2657, 2669, 2670,
2674, 2679, 2684, 2707, 2724, 2757, 2776, 2
804, 2818, 2906, 2959, 2964, 2968, 2976, 29
80, 2987, 3010, 3043, 3047, 3050, 3071, 307
2, 3092, 3095, 3097, 3140, 3157, 3173, 3187
3203, 3210, 3212, 3220, 3236, 3249, 3264,
A library selected from the group consisting of 3284, 3288, 3305, 3309, 3318, 3330, 3331, and 3335.
【請求項5】 請求項1に記載のライブラリーであって、該ライブラリーが
、結腸癌組織と比較して正常結腸組織において示差的に発現される遺伝子に対応
するポリヌクレオチドを含み、該発現は、癌組織においてより大きく、そして配
列が、配列番号7、164、734、836、928、965、987、102
6、1044、1119、1226、1227、1251、1316、1429
、1442、1540、1553、1560、1577、1588、1610、
1620、1626、1673、2416、2749、2976、3129およ
び3132からなる群より選択される、ライブラリー。
5. The library of claim 1, wherein the library comprises a polynucleotide corresponding to a gene that is differentially expressed in normal colon tissue as compared to colon cancer tissue, said expression. Is larger in cancerous tissue and the sequence is SEQ ID NO: 7, 164, 734, 836, 928, 965, 987, 102.
6, 1044, 1119, 1226, 1227, 1251, 1316, 1429
, 1442, 1540, 1553, 1560, 1577, 1588, 1610,
A library selected from the group consisting of 1620, 1626, 1673, 2416, 2749, 2976, 3129 and 3132.
【請求項6】 請求項1に記載のライブラリーであって、該ライブラリーは
、結腸癌組織と比較して正常結腸組織において示差的に発現される遺伝子に対応
するポリヌクレオチドを含み、該発現は、癌組織より正常組織においてより大き
く、そして配列が、配列番号105、198、465、489、745、859
、976、1011、1045、1138、1226、1251、1253、1
392、1474、1559、1571、1589、1591、1607、16
08、1643、1753、1764、1766、1782、1811、274
9、2784、2790、2805、2976、3128、3129、3146
、3150、および3151からなる群より選択される、ライブラリー。
6. The library of claim 1, wherein the library comprises a polynucleotide corresponding to a gene that is differentially expressed in normal colon tissue compared to colon cancer tissue, the expression being Is larger in normal tissue than in cancer tissue and the sequence is SEQ ID NO: 105, 198, 465, 489, 745, 859.
, 976, 1011, 1045, 1138, 1226, 1251, 1253, 1
392, 1474, 1559, 1571, 1589, 1591, 1607, 16
08, 1643, 1753, 1764, 1766, 1782, 1811, 274
9, 2784, 2790, 2805, 2976, 3128, 3129, 3146
A library selected from the group consisting of: 3150, and 3151.
【請求項7】 請求項1に記載のライブラリーであって、該ライブラリーは
、ヒト前立腺癌細胞と比較して正常ヒト前立腺細胞において示差的に発現される
遺伝子に対応するポリヌクレオチドを含み、該発現は、癌細胞より正常細胞にお
いてより大きく、そして配列が、配列番号53、446、1410、1754、
1801、1845、2060、2143、2632、2899、および333
8からなる群より選択される、ライブラリー。
7. The library of claim 1, wherein the library comprises a polynucleotide corresponding to a gene that is differentially expressed in normal human prostate cells as compared to human prostate cancer cells, The expression is greater in normal cells than in cancer cells and the sequences are SEQ ID NOs: 53, 446, 1410, 1754,
1801, 1845, 2060, 2143, 2632, 2899, and 333
A library selected from the group consisting of 8.
【請求項8】 請求項1に記載のライブラリーであって、該ライブラリーは
、ヒト前立腺癌細胞と比較して正常ヒト前立腺細胞において示差的に発現される
遺伝子に対応するポリヌクレオチドを含み、該発現は、正常細胞より癌細胞にお
いてより大きく、そして配列が、配列番号86、93、687、1269、15
81、1647、1649、1710、1717、1772、1960、298
7、3128、3132、3150、3222、および3268からなる群より
選択される、ライブラリー。
8. The library of claim 1, wherein the library comprises polynucleotides corresponding to genes that are differentially expressed in normal human prostate cells as compared to human prostate cancer cells, The expression is greater in cancer cells than in normal cells and the sequences are SEQ ID NOs: 86, 93, 687, 1269, 15
81, 1647, 1649, 1710, 1717, 1772, 1960, 298.
A library selected from the group consisting of 7, 3128, 3132, 3150, 3222, and 3268.
【請求項9】 配列番号1〜3351の同定化配列あるいはそれらの縮重改
変体またはフラグメントに少なくとも90%の配列同一性を有するヌクレオチド
配列を含む、単離されたポリヌクレオチド。
9. An isolated polynucleotide comprising a nucleotide sequence having at least 90% sequence identity to the identified sequences of SEQ ID NOs: 1-3351, or degenerate variants or fragments thereof.
【請求項10】 請求項9に記載のポリヌクレオチドを含む、組換え宿主細
胞。
10. A recombinant host cell comprising the polynucleotide of claim 9.
【請求項11】 請求項9に記載のポリヌクレオチドによりコードされる、
単離されたポリペプチド。
11. A polynucleotide encoded by the polynucleotide of claim 9,
Isolated polypeptide.
【請求項12】 請求項11に記載のポリペプチドを特異的に結合する、抗
体。
12. An antibody that specifically binds the polypeptide of claim 11.
【請求項13】 請求項9に記載のポリヌクレオチドを含む、ベクター。13. A vector comprising the polynucleotide of claim 9. 【請求項14】 哺乳動物細胞の癌状態と相関する示差的に発現された遺伝
子を検出する方法であって、該方法が、以下: 癌であると疑われている細胞由来の試験サンプルにおいて、少なくとも1つの
示差的に発現した遺伝子産物を検出する工程であって、該遺伝子産物が、配列番
号14、137、151、152、171、200、254、262、271、
348、412、472、507、520、530、588、623、637、
660、678、680、700、714、774、812、834、901、
937、976、1168、1333、1352、1520、1524、154
6、1550、1574、1580、1590、1599、1607、1622
、1706、1752、1768、1769、1780、1781、1799、
1803、1811、1851、1856、1867、1872、1875、1
884、1919、1923、1939、1975、2024、2045、20
60、2071、2118、2119、2128、2135、2177、218
1、2184、2185、2190、2193、2232、2239、2283
、2311、2314、2338、2378、2393、2394、2395、
2398、2460、2490、2505、2514、2540、2542、2
597、2607、2640、2657、2669、2670、2674、26
79、2684、2707、2724、2757、2776、2804、281
8、2906、2959、2964、2968、2976、2980、2987
、3010、3043、3047、3050、3071、3072、3092、
3095、3097、3140、3157、3173、3187、3203、3
210、3212、3220、3236、3249、3264、3284、32
88、3305、3309、3318、3330、3331、および3335の
うちの少なくとも1つの配列に対応する遺伝子によりコードされる、工程を包含
し、該示差的に発現した遺伝子産物の検出が、該試験サンプルが由来した細胞の
癌状態と相関する、方法。
14. A method for detecting a differentially expressed gene that correlates with the cancerous state of a mammalian cell, the method comprising: in a test sample derived from a cell suspected of having cancer, Detecting at least one differentially expressed gene product, said gene product comprising SEQ ID NOs: 14, 137, 151, 152, 171, 200, 254, 262, 271,
348, 412, 472, 507, 520, 530, 588, 623, 637,
660, 678, 680, 700, 714, 774, 812, 834, 901,
937, 976, 1168, 1333, 1352, 1520, 1524, 154
6, 1550, 1574, 1580, 1590, 1599, 1607, 1622
, 1706, 1752, 1768, 1769, 1780, 1781, 1799,
1803, 1811, 1851, 1856, 1867, 1872, 1875, 1
884, 1919, 1923, 1939, 1975, 2024, 2045, 20
60, 2071, 2118, 2119, 2128, 2135, 2177, 218
1, 2184, 2185, 2190, 2193, 2232, 2239, 2283
, 2311, 2314, 2338, 2378, 2393, 2394, 2395,
2398, 2460, 2490, 2505, 2514, 2540, 2542, 2
597, 2607, 2640, 2657, 2669, 2670, 2674, 26
79, 2684, 2707, 2724, 2757, 2776, 2804, 281
8, 2906, 2959, 2964, 2968, 2976, 2980, 2987
, 3010, 3043, 3047, 3050, 3071, 3072, 3092,
3095, 3097, 3140, 3157, 3173, 3187, 3203, 3
210, 3212, 3220, 3236, 3249, 3264, 3284, 32
88, 3305, 3309, 3318, 3330, 3331, and 3335, wherein the detection of the differentially expressed gene product is encoded by a gene corresponding to the sequence of at least one of the test samples. A method of correlating with a cancerous state of a cell from which the.
【請求項15】 哺乳動物細胞の癌状態と相関する示差的に発現された遺伝
子を検出する方法であって、該方法が、以下: 癌であると疑われている細胞由来の試験サンプルにおいて、少なくとも1つの
示差的に発現した遺伝子産物を検出する工程であって、該遺伝子産物が、配列番
号7、164、734、836、928、965、987、1026、1044
、1119、1226、1227、1251、1316、1429、1442、
1540、1553、1560、1577、1588、1610、1620、1
626、1673、1960、2416、2749、2976、2987、31
28、3129、3132、3150、3222、および3268の少なくとも
1つの配列に対応する遺伝子によりコードされる、工程を包含し、該示差的に発
現した遺伝子産物の検出が、該試験サンプルが由来した細胞の癌状態と相関する
、方法。
15. A method for detecting a differentially expressed gene that correlates with the cancerous state of a mammalian cell, the method comprising: in a test sample derived from a cell suspected of having cancer, Detecting at least one differentially expressed gene product, wherein the gene product is SEQ ID NO: 7, 164, 734, 836, 928, 965, 987, 1026, 1044.
, 1119, 1226, 1227, 1251, 1316, 1429, 1442,
1540, 1553, 1560, 1577, 1588, 1610, 1620, 1
626, 1673, 1960, 2416, 2749, 2976, 2987, 31
28, 3129, 3132, 3150, 3222, and 3268, wherein the detection of the differentially expressed gene product is encoded by a gene corresponding to the sequence of at least one of the cells from which the test sample was derived. Methods that correlate with the cancer status of.
JP2001508340A 1999-07-02 2000-06-30 New human genes and gene expression products Withdrawn JP2003518920A (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US14231099P 1999-07-02 1999-07-02
US14231199P 1999-07-02 1999-07-02
US60/142,311 1999-07-02
US60/142,310 1999-07-02
PCT/US2000/018374 WO2001002568A2 (en) 1999-07-02 2000-06-30 Human genes and gene expression products

Publications (1)

Publication Number Publication Date
JP2003518920A true JP2003518920A (en) 2003-06-17

Family

ID=26839967

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001508340A Withdrawn JP2003518920A (en) 1999-07-02 2000-06-30 New human genes and gene expression products

Country Status (4)

Country Link
EP (1) EP1194549A2 (en)
JP (1) JP2003518920A (en)
AU (1) AU6069300A (en)
WO (1) WO2001002568A2 (en)

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030170864A1 (en) 2000-05-30 2003-09-11 Genentech, Inc. Secreted and transmembrane polypeptides and nucleic acids encoding the same
US8101349B2 (en) 1997-12-23 2012-01-24 Novartis Vaccines And Diagnostics, Inc. Gene products differentially expressed in cancerous cells and their methods of use II
US6462187B1 (en) 2000-06-15 2002-10-08 Millennium Pharmaceuticals, Inc. 22109, a novel human thioredoxin family member and uses thereof
EP1734051A3 (en) * 1998-12-01 2007-09-12 Genetech, Inc. Composition and methods for the diagnosis of tumours
PT1277833E (en) * 1999-02-12 2006-07-31 Genentech Inc GENE THAT IS AMPLIFIED IN TUMORS AND MATERIALS AND RELATED METHODS
US6759508B2 (en) 2000-09-01 2004-07-06 Corixa Corporation Compositions and methods for the therapy and diagnosis of lung cancer
US6951738B2 (en) 1999-07-16 2005-10-04 Human Genome Sciences, Inc. Human tumor necrosis factor receptors TR13 and TR14
KR100543857B1 (en) * 1999-09-01 2006-01-23 제넨테크, 인크. Promotion or Inhibition of Angiogenesis and Cardiovascularization
AU4018201A (en) * 1999-09-23 2001-04-24 Incyte Genomics, Inc. Molecules for diagnostics and therapeutics
US7029895B2 (en) 1999-09-27 2006-04-18 Millennium Pharmaceuticals, Inc. 27411, a novel human PGP synthase
FR2800388A1 (en) * 1999-10-29 2001-05-04 Pf Medicament CLONING, EXPRESSION AND CHARACTERIZATION OF A GENE EXPRESSED IN TUMOR CELLS AND INVOLVED IN REGULATION OF THE IMMUNE RESPONSE
EP2228446A1 (en) * 1999-12-01 2010-09-15 Genentech, Inc. Secreted and transmembrane polypeptieds and nucleic acids encoding the same
US20020156238A1 (en) * 1999-12-09 2002-10-24 Peyman John A. Novel polypeptides and polynucleotides encoding same
AU2262501A (en) * 1999-12-16 2001-06-25 Amgen, Inc. Tnfr/opg-like molecules and uses thereof
WO2001062921A2 (en) * 2000-02-22 2001-08-30 Lexicon Genetics Incorporated Novel human regulatory protein and polynucleotides encoding the same
US20030017585A1 (en) * 2000-02-25 2003-01-23 Andro Hsu Novel sodium/solute symporter-like protein and nucleic acids encoding same
US6413757B1 (en) * 2000-02-28 2002-07-02 Millennium Pharmaceuticals, Inc. 25312, a novel human agmatinase-like homolog
AU2001249078A1 (en) 2000-02-28 2001-09-12 Millenium Pharmaceuticals, Inc. 27411, a novel human pgp synthase
EP1276875A2 (en) 2000-03-07 2003-01-22 Millennium Pharmaceuticals, Inc. 16835, a human phospholipase c and uses thereof
AU2001245619A1 (en) * 2000-03-09 2001-09-17 Chiron Corporation Human genes and gene expression products
US6627423B2 (en) 2000-03-24 2003-09-30 Millennium Pharmaceuticals, Inc. 21481, a novel dehydrogenase molecule and uses therefor
US6511834B1 (en) 2000-03-24 2003-01-28 Millennium Pharmaceuticals, Inc. 32142,21481,25964,21686, novel human dehydrogenase molecules and uses therefor
US6500657B1 (en) * 2000-03-31 2002-12-31 Millennium Pharmaceuticals, Inc. 33167, a novel human hydrolase and uses therefor
EP1272641A2 (en) * 2000-04-10 2003-01-08 MERCK PATENT GmbH Serine-threonine kinase
AU6531101A (en) * 2000-06-02 2001-12-17 Genentech Inc Secreted and transmembrane polypeptides and nucleic acids encoding the same
ES2281437T3 (en) 2000-08-22 2007-10-01 Agensys, Inc. NUCLEIC ACID AND CORRESPONDING PROTEIN DENOMINATED 158P1D7 USEFUL FOR THE TREATMENT AND DETECTION OF BLADDER CANCER AND OTHER CANCERES.
US7358353B2 (en) 2000-08-22 2008-04-15 Agensys, Inc. Nucleic acid and corresponding protein named 158P1D7 useful in the treatment and detection of bladder and other cancers
US20040072185A1 (en) * 2000-09-15 2004-04-15 Patrizia Paterlini-Brechot Cellular genes involved in oncogenesis, products of said genes and their diagnostic and therapeutic uses
FR2814176A1 (en) * 2000-09-15 2002-03-22 Inst Nat Sante Rech Med New nucleic acid implicated in oncogenesis, useful for diagnosis and treatment of cancer, also related polypeptides and antibodies
ES2335478T3 (en) * 2000-10-05 2010-03-29 Millennium Pharmaceuticals, Inc. 32144, A HUMAN HYDROLASE OF AMIDAS OF FATTY ACIDS AND ITS USES.
JP2004535785A (en) 2000-11-22 2004-12-02 ディアデクサス インコーポレーテッド Compositions and methods for breast-specific genes and proteins
WO2002044209A2 (en) 2000-11-28 2002-06-06 Zymogenetics, Inc. Cytonkine receptor zcytor19
JPWO2002050269A1 (en) * 2000-12-21 2004-04-22 株式会社ジェノックス創薬研究所 Testing methods for allergic diseases
US20060063230A1 (en) 2000-12-27 2006-03-23 Roman Naworth Sulfatases and methods of use thereof
US7601825B2 (en) 2001-03-05 2009-10-13 Agensys, Inc. Nucleic acid and corresponding protein entitled 121P1F1 useful in treatment and detection of cancer
US6924358B2 (en) 2001-03-05 2005-08-02 Agensys, Inc. 121P1F1: a tissue specific protein highly expressed in various cancers
US7271240B2 (en) 2001-03-14 2007-09-18 Agensys, Inc. 125P5C8: a tissue specific protein highly expressed in various cancers
WO2002083921A2 (en) 2001-04-10 2002-10-24 Agensys, Inc. Nuleic acids and corresponding proteins useful in the detection and treatment of various cancers
US20030120040A1 (en) 2001-06-29 2003-06-26 Genentech, Inc. Secreted and Transmembrane polypeptides and nucleic acids encoding the same
WO2003025214A1 (en) 2001-09-14 2003-03-27 Medimolecular Pty. Ltd. Nucleic acid markers for use in determining predisposition to neoplasm and/or adenoma
US6787327B2 (en) 2001-10-05 2004-09-07 Kelk Graduate Of Applied Life Sciences Methods for determining tyrosine-DNA phosphodiesterase activity
US7033787B2 (en) * 2001-12-21 2006-04-25 Ludwig Institute For Cancer Research Isolated cytokine receptor LICR-2
WO2003089603A2 (en) 2002-04-19 2003-10-30 Zymogenetics, Inc. Cytokine receptor
WO2004009837A2 (en) * 2002-07-19 2004-01-29 Arizona Board Of Regents A high resolution typing system for pathogenic mycobacterium tuberculosum
US7723477B2 (en) 2005-10-31 2010-05-25 Oncomed Pharmaceuticals, Inc. Compositions and methods for inhibiting Wnt-dependent solid tumor cell growth
AU2009296246B2 (en) 2008-09-26 2015-07-30 Oncomed Pharmaceuticals, Inc. Frizzled-binding agents and uses thereof
TWI535445B (en) 2010-01-12 2016-06-01 安可美德藥物股份有限公司 Wnt antagonists and methods of treatment and screening
CN102971337B (en) 2010-04-01 2016-09-21 昂考梅德药品有限公司 FZ combines medicament and application thereof
PT2621526T (en) 2010-09-29 2018-08-02 Seattle Genetics Inc Antibody drug conjugates (adc) that bind to 191p4d12 proteins
SG10201701424QA (en) 2012-08-23 2017-04-27 Agensys Inc Antibody drug conjugates (adc) that bind to 158p1d7 proteins
CN105073195A (en) 2013-02-04 2015-11-18 昂科梅德制药有限公司 Methods and monitoring of treatment with a Wnt pathway inhibitor
US9168300B2 (en) 2013-03-14 2015-10-27 Oncomed Pharmaceuticals, Inc. MET-binding agents and uses thereof
TW201610168A (en) * 2013-12-02 2016-03-16 安可美德藥物股份有限公司 Identification of predictive biomarkers associated with Wnt pathway inhibitors

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997040151A2 (en) * 1996-04-19 1997-10-30 Genetics Institute, Inc. Secreted proteins and polynucleotides encoding them

Also Published As

Publication number Publication date
EP1194549A2 (en) 2002-04-10
WO2001002568A2 (en) 2001-01-11
WO2001002568A3 (en) 2001-08-30
AU6069300A (en) 2001-01-22

Similar Documents

Publication Publication Date Title
JP2003518920A (en) New human genes and gene expression products
US7122373B1 (en) Human genes and gene expression products V
JP2002500010A (en) Human genes and gene expression products I
US20070243176A1 (en) Human genes and gene expression products
JP2004502406A (en) Human genes and human gene expression products
JP2002519000A (en) Human genes and gene expression products II
US20020076735A1 (en) Diagnostic and therapeutic methods using molecules differentially expressed in cancer cells
JP2011254830A (en) Polynucleotide related to colon cancer
JP2002517244A (en) Genes and gene expression products that are differentially regulated in prostate cancer
US20030215803A1 (en) Human genes and gene expression products isolated from human prostate
US20030065156A1 (en) Novel human genes and gene expression products I
JP2004533206A (en) Cancer-related genes as targets for chemotherapy
JP2003530816A (en) Human genes and gene expression products
JP2003528630A (en) Human genes and expression products
CA2430794A1 (en) Human genes and gene expression products isolated from human prostate
US7355025B2 (en) Marker molecules associated with lung tumors
US20060122132A1 (en) Use of murine genomic regions identified to be involved in tumor developement for the development of anti-cancer drugs and diagnosis of cancer

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070904