JP2003530816A - Human genes and gene expression products - Google Patents

Human genes and gene expression products

Info

Publication number
JP2003530816A
JP2003530816A JP2000572363A JP2000572363A JP2003530816A JP 2003530816 A JP2003530816 A JP 2003530816A JP 2000572363 A JP2000572363 A JP 2000572363A JP 2000572363 A JP2000572363 A JP 2000572363A JP 2003530816 A JP2003530816 A JP 2003530816A
Authority
JP
Japan
Prior art keywords
sequence
sequences
polynucleotide
gene
polynucleotides
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000572363A
Other languages
Japanese (ja)
Inventor
ルイス ティー. ウィリアム,
ジェイム エスコベド,
マイケル エー. イニス,
パブロ ドミンガ ガルシア,
ジュリー サドス−クリンガー,
クリストフ ライナハート
クラウス ギエス,
フィリッポ ランダッゾ,
ギウリア シー. ケネディ,
デビッド ポット,
アルタフ カッサム,
ジョージ ラムソン,
ラドジェ ドルマナック,
ラドミール クルクベンジャコブ,
マーク ディックソン,
スネザナ ドルマナック,
イバン ラバト,
デナ レシュコウィッツ,
デビッド キタ,
ベロニカ ガルシア,
リー ウィリアム ジョーンズ,
バージット スタチェ−クレイン,
Original Assignee
カイロン コーポレイション
ハイセク インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by カイロン コーポレイション, ハイセク インコーポレイテッド filed Critical カイロン コーポレイション
Publication of JP2003530816A publication Critical patent/JP2003530816A/en
Withdrawn legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Abstract

(57)【要約】 本発明は、新規のヒトポリヌクレオチドおよびその改変体、それらのコードするポリペプチドおよびその改変体に関し、これらのポリヌクレオチドに対応する遺伝子に関し、ならびにその遺伝子によって発現されるタンパク質に関する。本発明はまた、このような新規なヒトポリヌクレオチド、それらの対応する遺伝子または遺伝子産物(例えば、これらの遺伝子およびタンパク質)を使用する診断薬および治療薬に関し、これにはプローブ、アンチセンス構築物、および抗体が含まれる。   (57) [Summary] The present invention relates to novel human polynucleotides and variants thereof, polypeptides encoding them and variants thereof, the genes corresponding to these polynucleotides, and the proteins expressed by the genes. The invention also relates to diagnostic and therapeutic agents using such novel human polynucleotides, their corresponding genes or gene products (eg, these genes and proteins), including probes, antisense constructs, And antibodies.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】 (発明の分野) 本発明は、ヒト起源のポリヌクレオチドおよびコードされる遺伝子産物に関す
る。
FIELD OF THE INVENTION The present invention relates to polynucleotides of human origin and encoded gene products.

【0002】 (発明の背景) 新規なポリヌクレオチド、特に発現される遺伝子産物をコードするポリヌクレ
オチドの同定は、薬物発見、診断技術、ならびに癌のような複雑な疾患の進行お
よび性質の理解の進歩において重要である。疾患の状態または段階、発生の段階
、種々の環境因子への曝露、起源の組織、その組織が単離された種などで異なる
供給源から単離された異なる細胞型において発現される遺伝子の同定は、これら
の種々の差異と相関する表現型を担う遺伝的因子を同定する鍵となる。
BACKGROUND OF THE INVENTION The identification of novel polynucleotides, particularly those that encode expressed gene products, is an advance in drug discovery, diagnostic techniques, and understanding of the progression and nature of complex diseases such as cancer. Is important in. Identification of genes expressed in different cell types isolated from different sources, such as disease state or stage, stage of development, exposure to various environmental factors, tissue of origin, species from which the tissue was isolated, etc. Are key to identifying the genetic factors responsible for the phenotype that correlate with these various differences.

【0003】 本発明は、新規なヒトポリヌクレオチド、これらのポリヌクレオチドによって
コードされるポリペプチド、ならびにこれらの新規なポリヌクレオチドに対応す
る遺伝子およびタンパク質を提供する。
The present invention provides novel human polynucleotides, polypeptides encoded by these polynucleotides, and genes and proteins corresponding to these novel polynucleotides.

【0004】 (発明の要旨) 本発明は、新規なヒトポリヌクレオチドおよびそれらの改変体、それらのコー
ドするポリペプチドおよびそれらの改変体に関し、これらのポリヌクレオチドに
対応する遺伝子に関し、そしてその遺伝子によって発現されるタンパク質に関す
る。本発明はまた、このような新規なヒトポリヌクレオチド、それらの対応する
遺伝子、または遺伝子産物を含有する診断薬および治療薬(プローブ、アンチセ
ンスヌクレオチド、および抗体を含む)に関する。本発明のポリヌクレオチドは
、配列番号1〜1079のうちの少なくとも1つの配列情報を含むポリヌクレオ
チドに対応する。
SUMMARY OF THE INVENTION The present invention relates to novel human polynucleotides and their variants, their encoded polypeptides and their variants, to the genes corresponding to these polynucleotides, and by their genes. Regarding expressed proteins. The present invention also relates to diagnostic and therapeutic agents (including probes, antisense nucleotides, and antibodies) containing such novel human polynucleotides, their corresponding genes, or gene products. The polynucleotide of the present invention corresponds to a polynucleotide containing sequence information of at least one of SEQ ID NOs: 1 to 1079.

【0005】 本発明の種々の局面および実施態様は、本明細書中に提供される記載を読んで
当業者に容易に明らかである。
Various aspects and embodiments of the invention will be readily apparent to those of skill in the art upon reading the description provided herein.

【0006】 (発明の詳細な説明) 本発明は、開示されたヌクレオチド配列を含有するポリヌクレオチドに関し、
全長cDNA、mRNAゲノム配列、およびこれらの配列に対応する遺伝子なら
びにそれらの縮重改変体に関し、そして本発明のポリヌクレオチドによってコー
ドされるポリペプチドおよびポリペプチド改変体に関する。以下の詳細な記載は
、本発明によって包含されるポリヌクレオチド組成物、全長の遺伝子産物をコー
ドするcDNAまたはゲノムDNAを得るための方法、これらのポリヌクレオチ
ドおよび遺伝子の発現、ポリヌクレオチドおよび遺伝子の構造モチーフの同定、
本発明のポリヌクレオチドに対応する遺伝子によってコードされる遺伝子産物の
機能の同定、プローブとしてならびにマッピングおよび組織プロファイリング(
profiling)の際に提供されるポリヌクレオチドの使用、抗体を惹起す
るための対応するポリペプチドおよび他の遺伝子産物の使用、そして治療目的お
よび診断目的のためのポリヌクレオチドおよびそれらのコードする遺伝子産物の
使用を記載する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to polynucleotides containing the disclosed nucleotide sequences,
It relates to full-length cDNA, mRNA genomic sequences, and genes corresponding to these sequences and degenerate variants thereof, and to polypeptides and polypeptide variants encoded by the polynucleotides of the invention. The following detailed description includes polynucleotide compositions encompassed by the present invention, methods for obtaining cDNA or genomic DNA encoding full-length gene products, expression of these polynucleotides and genes, polynucleotide and gene structures. Identification of motifs,
Identification of the function of the gene product encoded by the gene corresponding to the polynucleotide of the invention, as a probe as well as mapping and tissue profiling (
use of the provided polynucleotides during profiling, use of the corresponding polypeptides and other gene products for raising antibodies, and of polynucleotides and their encoded gene products for therapeutic and diagnostic purposes. Describe the use.

【0007】 (ポリヌクレオチド組成物) ポリヌクレオチド組成物に関する本発明の範囲としては、配列番号1〜107
9のうちのいずれか1つにおいて示される配列を有するポリヌクレオチド;本明
細書中に記載される生物学的材料またはストリンジェントな条件(特に高ストリ
ンジェンシーの条件)下でのハイブリダイゼーションによって他の生物学的供給
源(特にヒト起源)から得られるポリヌクレオチド;提供されるポリヌクレオチ
ドに対応する遺伝子;提供されるポリヌクレオチドおよびそれらの対応する遺伝
子の改変体、特にコードされる遺伝子産物の生物学的活性(例えば、タンパク質
ファミリーへの遺伝産物の割当ておよび/または遺伝子産物に存在する機能的ド
メインの同定の結果として、提供されるポリヌクレオチドに対応する遺伝子産物
に帰する生物学的活性)を保持するそれらの改変体を含むが、これらに必ずしも
制限されない。本発明の範囲以内で意図される他の核酸組成物は、本明細書中で
の開示が提供される場合、当業者に容易に明らかである。組成物の核酸に関して
本明細書中で使用される場合、「ポリヌクレオチド」および「核酸」は、特に示
されない限り、核酸の長さまたは構造に関して制限されることを意図されない。
(Polynucleotide Composition) The scope of the present invention relating to a polynucleotide composition includes SEQ ID NOs: 1 to 107.
A polynucleotide having the sequence set forth in any one of 9; other biological materials described herein or otherwise hybridized under stringent conditions, particularly conditions of high stringency. Polynucleotides obtained from biological sources (especially human origin); Genes corresponding to the provided polynucleotides; Provided polynucleotides and variants of their corresponding genes, especially the biology of the encoded gene products Biological activity (eg, biological activity attributable to a gene product corresponding to a provided polynucleotide as a result of assignment of the gene product to a protein family and / or identification of functional domains present in the gene product) However, it is not necessarily limited to these. Other nucleic acid compositions contemplated within the scope of the present invention will be readily apparent to those of skill in the art given the disclosure herein. As used herein with respect to the nucleic acids of the composition, “polynucleotide” and “nucleic acid” are not intended to be limited with respect to the length or structure of the nucleic acids, unless otherwise indicated.

【0008】 本発明は、ヒト組織、詳細にはヒト結腸、乳房、および/または肺の組織にお
いて発現されるポリヌクレオチドを特徴とする。特定の目的の本発明の新規な核
酸組成物は、配列番号1〜1079のいずれか1つにおいて示される配列および
その同定配列を含む。「同定配列(identifying sequence
)」は、ポリヌクレオチド配列を固有に同定する少なくとも約10nt長〜約2
0nt長、通常少なくとも約50nt長〜約100nt長の残基の連続配列であ
り、例えば、約20ntを超える任意の連続ヌクレオチド配列に対して、90%
未満の、通常約80%〜約85%未満の配列同一性を示す。従って、本発明の新
規な核酸組成物は、配列番号1〜1079のいずれか1つの連続ヌクレオチドの
同定配列を含む全長のcDNAまたはmRNAを含む。
The invention features polynucleotides that are expressed in human tissue, particularly human colon, breast, and / or lung tissue. A novel nucleic acid composition of the invention for a particular purpose comprises the sequences set forth in any one of SEQ ID NOs: 1-1079 and their identified sequences. "Identifying sequence (identifying sequence)
) "Is at least about 10 nt long and about 2 to uniquely identify the polynucleotide sequence.
A contiguous sequence of residues 0 nt long, usually at least about 50 nt to about 100 nt long, eg 90% for any contiguous nucleotide sequence greater than about 20 nt.
Less than about 80% and usually less than about 85% sequence identity. Therefore, the novel nucleic acid composition of the present invention comprises a full-length cDNA or mRNA containing an identifying sequence of contiguous nucleotides of any one of SEQ ID NOs: 1-1079.

【0009】 本発明のポリヌクレオチドはまた、配列類似性および配列同一性を有するポリ
ヌクレオチドを含む。配列類似性を有する核酸は、低いストリンジェンシー条件
下、例えば、50℃および10×SSC(0.9M生理食塩水/0.09Mクエ
ン酸ナトリウム)でのハイブリダイゼーションによって検出され、そして1×S
SC中55℃での洗浄に供される場合、結合を保持する。配列同一性は、ストリ
ンジェントな条件下、例えば、50℃以上および0.1×SSC(9mM生理食
塩水/0.9mMクエン酸ナトリウム)でのハイブリダイゼーションによって決
定され得る。ハイブリダイゼーション方法および条件は、当該分野において周知
であり、例えば、USPN 5,707,829号を参照のこと。提供されるポ
リヌクレオチド配列に実質的に同一である核酸、例えば、対立遺伝子改変体、遺
伝子の遺伝的に変化したバージョンなどは、ストリンジェントなハイブリダイゼ
ーション条件下で、提供されるポリヌクレオチド配列(配列番号1〜1079)
に結合する。プローブ、特にDNA配列の標識化プローブを使用することによっ
て、相同な遺伝子または関連の遺伝子を単離し得る。相同な遺伝子の供給源は、
任意の種、例えば、霊長類種、特にヒト:げっ歯類(例えば、ラットおよびマウ
ス);イヌ、ネコ、ウシ、ヒツジ、ウマ、酵母、線虫などであり得る。
Polynucleotides of the invention also include polynucleotides that have sequence similarity and sequence identity. Nucleic acids with sequence similarity are detected by hybridization under low stringency conditions, eg, 50 ° C. and 10 × SSC (0.9M saline / 0.09M sodium citrate), and 1 × S.
Retains binding when subjected to washing at 55 ° C in SC. Sequence identity can be determined by stringent conditions, eg, hybridization at 50 ° C. or above and 0.1 × SSC (9 mM saline / 0.9 mM sodium citrate). Hybridization methods and conditions are well known in the art, see, eg, USPN 5,707,829. A nucleic acid that is substantially identical to a provided polynucleotide sequence, such as an allelic variant, a genetically altered version of a gene, etc., under stringent hybridization conditions, is provided with the provided polynucleotide sequence (sequence (Numbers 1-1079)
Bind to. By using probes, in particular labeled probes of DNA sequences, homologous or related genes can be isolated. Sources of homologous genes are
It can be any species, eg primate species, especially humans: rodents (eg rat and mouse); dogs, cats, cows, sheep, horses, yeasts, nematodes, etc.

【0010】 好ましくは、ハイブリダイゼーションは、配列番号1〜1079のうちの少な
くとも1つの少なくとも15個の連続したヌクレオチド(nt)を使用して行わ
れる。すなわち、開示される配列番号のうちの1つの少なくとも15個の連続し
たntがプローブとして使用される場合、そのプローブは相補的な配列を含有す
る核酸と優先的にハイブリダイズし、選択されたプローブに固有にハイブリダイ
ズする核酸の同定および回収を可能にする。1つより多い配列番号からのプロー
ブは、それらが由来するcDNAが1つのmRNAに対応する場合、同じ核酸と
ハイブリダイズし得る。15ntより多いプローブ、例えば、約18nt〜約1
00ntのプローブが使用され得るが、15ntは固有の同定のために十分な配
列を示す。
Preferably, hybridization is performed using at least 15 contiguous nucleotides (nt) of at least one of SEQ ID NOs: 1-1079. That is, when at least 15 consecutive nts of one of the disclosed SEQ ID NOs are used as probes, the probe will preferentially hybridize with a nucleic acid containing a complementary sequence and the selected probe It allows the identification and recovery of nucleic acids that hybridize uniquely to. Probes from more than one SEQ ID NO: may hybridize to the same nucleic acid if the cDNA from which they correspond corresponds to one mRNA. Probes greater than 15 nt, eg, about 18 nt to about 1
A 00 nt probe can be used, but 15 nt represents sufficient sequence for unique identification.

【0011】 本発明のポリヌクレオチドはまた、ヌクレオチド配列の天然に存在する改変体
(例えば、縮重改変体、対立遺伝子改変体など)を含む。本発明のポリヌクレオ
チドの改変体は、本明細書中に開示されるヌクレオチド配列と推定の改変体との
ハイブリダイゼーションによって、好ましくはストリンジェントな条件下でのハ
イブリダイゼーションによって同定される。例えば、適切な洗浄条件を使用する
ことによって、本発明のポリヌクレオチドの改変体は、対立遺伝子改変体が、選
択されるポリヌクレオチドプローブに対して多くとも約25〜30%の塩基対(
bp)非適合を示す場合に同定され得る。一般に、対立遺伝子改変体は、15〜
25%bp非適合を含み、そして5〜15%、または2〜5%、または1〜2%
bp程度の非適合、ならびに単一bpの非適合を含み得る。
Polynucleotides of the invention also include naturally occurring variants of the nucleotide sequence (eg, degenerate variants, allelic variants, etc.). Variants of the polynucleotides of the invention are identified by hybridization of the nucleotide sequences disclosed herein with putative variants, preferably under stringent conditions. For example, by using appropriate wash conditions, a variant of a polynucleotide of the invention will have an allelic variant of at most about 25-30% base pair (based on the selected polynucleotide probe).
bp) Can be identified if they show a non-match. Generally, allelic variants are 15-
Including 25% bp non-conformance, and 5-15%, or 2-5%, or 1-2%
It can include as little as bp non-matching, as well as single bp non-matching.

【0012】 本発明はまた、配列番号1〜1079のポリヌクレオチドに対応するホモログ
を包含し、ここでは相同な遺伝子の供給源は、任意の哺乳動物種、例えば、霊長
類種、特にヒト;げっ歯類(例えば、ラット);イヌ、ネコ、ウシ、ヒツジ、ウ
マ、酵母、線虫などであり得る。哺乳動物種間(例えばヒトとマウス)で、ホモ
ログは一般に、実質的な配列類似性、例えば、ヌクレオチド配列間に少なくとも
75%、通常少なくとも90%、より通常少なくとも95%の配列同一性を有す
る。配列類似性は、参照配列に基づいて算定され、参照配列は保存されるモチー
フ、コード領域、隣接領域などのような、より長い配列のサブセットであり得る
。参照配列は通常、少なくとも約18個の連続するntの長さ、より通常には少
なくとも約30ntの長さであり、そして比較されている完全な配列に伸長され
得る。配列分析についてのアルゴリズムは、当該分野において公知である(例え
ば、ギャップ化BLAST(Altschulら、Nucleic Acids
Res.(1997)25:3389−3402において記載される))。
The present invention also includes homologs corresponding to the polynucleotides of SEQ ID NOs: 1-1079, wherein the source of homologous genes is any mammalian species, eg, primate species, especially humans; It can be a tooth (eg rat); dog, cat, cow, sheep, horse, yeast, nematode, etc. Among mammalian species, such as human and mouse, homologs generally have substantial sequence similarity, eg, at least 75%, usually at least 90%, more usually at least 95% sequence identity between nucleotide sequences. Sequence similarity is calculated based on the reference sequence, which may be a subset of longer sequences, such as conserved motifs, coding regions, flanking regions, etc. A reference sequence is usually at least about 18 contiguous nts in length, more usually at least about 30 nts in length, and can be extended to the complete sequence being compared. Algorithms for sequence analysis are known in the art (eg gapped BLAST (Altschul et al., Nucleic Acids.
Res. (1997) 25: 3389-3402)).

【0013】 一般に、本発明の改変体は、少なくとも約65%、好ましくは少なくとも約7
5%、より好ましくは少なくとも約85%を超える配列同一性を有し、そしてM
PSRCHプログラム(Oxford Molecular)において実行され
るようなSmith−Waterman相同性検索アルゴリズムによって決定さ
れる場合に、少なくとも約90%以上であり得る。本発明の目的のために、パー
セント同一性を算定する好ましい方法は、以下を使用するSmith−Wate
rmanアルゴリズムである。全体的なDNA配列同一性は、以下の検索パラメ
ーター:ギャップオープンペナルティー(gap open penalty)
、12;およびギャップ伸長ペナルティー(gap extension pe
nalty)、1を用いるアフィンギャップ(affine gap)検索を使
用して、MPSRCHプログラム(Oxford Molecular)におい
て実行されるようなSmith−Waterman相同性検索アルゴリズムによ
って決定される場合に、65%を超えなければならない。
Generally, variants of the invention will be at least about 65%, preferably at least about 7%.
Have a sequence identity of greater than 5%, more preferably at least about 85%, and M
It can be at least about 90% or more as determined by the Smith-Waterman homology search algorithm as performed in the PSRCH program (Oxford Molecular). For purposes of the present invention, the preferred method of calculating percent identity is the Smith-Wate using:
The rman algorithm. The overall DNA sequence identity was determined by the following search parameters: gap open penalty.
, 12; and gap extension penalties.
nity, using an affine gap search with 1, must not exceed 65% as determined by the Smith-Waterman homology search algorithm as performed in the MPSRCH program (Oxford Molecular). I won't.

【0014】 本発明の核酸は、cDNAまたはゲノムDNA、ならびにそれらのフラグメン
ト、特に生物学的に活性な遺伝子産物をコードするおよび/または本明細書中で
開示される方法において有用(例えば、診断において、目的の示差発現される遺
伝子の固有の識別子(identifier)としてなど)であるフラグメント
であり得る。本明細書中で使用される場合、用語「cDNA」は、ネイティブな
成熟mRNA種において見出される配列エレメントの配置を共有する全ての核酸
を含むことが意図され、ここでは配列エレメントは、エキソン、ならびに3’非
コード領域および5’非コード領域である。通常mRNA種は、連続するエキソ
ンを有し、イントロンの介在を伴い、存在する場合には、核RNAスプライシン
グによって除去され、本発明のポリぺプチドをコードする連続するオープンリー
ディングフレームを生成する。
The nucleic acids of the invention encode cDNA or genomic DNA, and fragments thereof, particularly biologically active gene products, and / or are useful in the methods disclosed herein (eg, in diagnostics). , As a unique identifier of the differentially expressed gene of interest, etc.). As used herein, the term "cDNA" is intended to include all nucleic acids that share the arrangement of sequence elements found in the native mature mRNA species, where the sequence elements are exons, as well as 3'non-coding region and 5'non-coding region. Usually mRNA species have contiguous exons, with intron intervention, and, if present, removed by nuclear RNA splicing, producing a contiguous open reading frame encoding the polypeptide of the invention.

【0015】 目的のゲノム配列は、列挙される配列において規定されるように、開始コドン
と停止コドンとの間に存在する核酸を含み、ネイティブな染色体に通常存在する
全てのイントロンを含む。これはさらに、成熟mRNAにおいて見出される3’ 非翻訳領域および5’非翻訳領域を含み得る。これはさらに、特異的な転写調
節配列および翻訳調節配列(例えば、プロモーター、エンハンサーなど)を含み
得、転写領域の5’および3’末端のいずれかに約1kbの、しかし可能性とし
てはより長い隣接ゲノムDNAを含む。ゲノムDNAは、100kbp以下のフ
ラグメントとして単離され得;そして隣接する染色体配列が実質的にない。3’
および5’のいずれかでコード領域に隣接するゲノムDNA、またはイントロン
において時折見出されるような内部調節配列は、適切な組織、段階特異的な発現
、または疾患状態特異的な発現のために必要とされる配列を含む。
The genomic sequence of interest includes nucleic acids located between the start and stop codons and includes all introns normally found on the native chromosome, as defined in the listed sequences. It may further include the 3'untranslated region and 5'untranslated region found in the mature mRNA. It may further include specific transcriptional and translational regulatory sequences (eg, promoters, enhancers, etc.) of about 1 kb at either the 5'and 3'ends of the transcribed region, but possibly longer. Contains flanking genomic DNA. Genomic DNA can be isolated as fragments of 100 kbp or less; and is substantially free of flanking chromosomal sequences. 3 '
And internal regulatory sequences, such as are occasionally found in introns, flanking the coding region at either 5'and 5'are required for proper tissue, stage-specific, or disease state-specific expression. Contains an array that is

【0016】 本発明の核酸組成物は、本発明のポリぺプチドの全てまたは一部をコードし得
る。2本鎖または1本鎖フラグメントは、従来の方法に従ってオリゴヌクレオチ
ドを化学的に合成すること、制限酵素消化、PCR増幅などによって、DNA配
列から獲得され得る。本発明の単離されたポリヌクレオチドおよびヌクレオチド
フラグメントは、配列番号1〜1079において示されるようなポリヌクレオチ
ド配列から選択される、少なくとも約10、約15、約20、約35、約50、
約100、約150〜約200、約250〜約300、または約350の連続す
るntを含む。大部分について、フラグメントは、少なくとも約15nt、通常
少なくとも18ntまたは25nt、および少なくとも約50までの連続するn
t長またはそれより長いフラグメントである。好ましい実施態様において、ポリ
ヌクレオチド分子は、配列番号1〜1079において示されるポリヌクレオチド
からなる群より選択される少なくとも12ntの連続する配列を含む。
The nucleic acid composition of the present invention may encode all or a part of the polypeptide of the present invention. Double-stranded or single-stranded fragments can be obtained from DNA sequences by chemically synthesizing oligonucleotides according to conventional methods, restriction enzyme digestion, PCR amplification and the like. The isolated polynucleotides and nucleotide fragments of the invention are at least about 10, about 15, about 20, about 35, about 50, selected from the polynucleotide sequences as set forth in SEQ ID NOS: 1-1079.
It comprises about 100, about 150 to about 200, about 250 to about 300, or about 350 consecutive nts. For the most part, fragments are at least about 15 nt, usually at least 18 nt or 25 nt, and up to at least about 50 consecutive n.
It is a fragment of t length or longer. In a preferred embodiment, the polynucleotide molecule comprises at least 12 nt of contiguous sequence selected from the group consisting of the polynucleotides set forth in SEQ ID NOS: 1-1079.

【0017】 本発明のポリヌクレオチドに特異的なプローブは、配列番号1〜1079にお
いて開示されるポリヌクレオチド配列を使用して作製され得る。プローブは、好
ましくは、配列番号1〜1079の対応する連続配列のなかの少なくとも約12
、15、16、18、20、22、24、または25ntのフラグメントであり
、そして2、1、0.5、0.1、または0.05kb長未満であり得る。プロ
ーブは化学的に合成され得るか、または制限酵素を使用してより長いポリヌクレ
オチドから作製され得る。プローブは、例えば、放射性タグ、ビオチン化タグ、
または蛍光タグで標識され得る。好ましくは、プローブは、配列番号1〜107
9のうちの1つのポリヌクレオチドの同定配列に基づいて設計される。より好ま
しくは、プローブは、配列への低い複雑性をマスクするためのマスキングプログ
ラム(例えば、XBLAST)の適用後にマスクされないままである本発明のポ
リヌクレオチドのうちの1つの連続配列に基づいて設計される(すなわち、マス
キングプログラムによって生成されるマスクした配列のポリ−nストレッチの外
側のポリヌクレオチドによって示されるような、マスクされない領域が選択され
る)。
Probes specific for the polynucleotides of the present invention can be made using the polynucleotide sequences disclosed in SEQ ID NOs: 1-1079. The probe is preferably at least about 12 of the corresponding contiguous sequences of SEQ ID NOS: 1-1079.
, 15, 16, 18, 20, 22, 24, or 25 nt fragments and can be less than 2, 1, 0.5, 0.1, or 0.05 kb in length. Probes can be chemically synthesized or can be made from longer polynucleotides using restriction enzymes. The probe is, for example, a radioactive tag, a biotinylated tag,
Or it can be labeled with a fluorescent tag. Preferably, the probe is SEQ ID NO: 1-107.
Designed based on the identified sequence of one of the nine polynucleotides. More preferably, the probe is designed based on a continuous sequence of one of the polynucleotides of the invention that remains unmasked after application of a masking program (eg, XBLAST) to mask low complexity to the sequence. (Ie, the unmasked regions are selected, as indicated by the polynucleotide outside the poly-n stretch of masked sequence generated by the masking program).

【0018】 本発明のポリヌクレオチドは、一般的にインタクトな染色体以外として、実質
的な純度で単離および獲得される。通常、ポリヌクレオチドは、DNAまたはR
NAのいずれかとして、他の天然に存在する核酸配列を実質的に含まないように
獲得され、一般に少なくとも約50%、通常少なくとも約90%の純度であり、
そして代表的に「組換え」であり、例えば、天然に存在する染色体において通常
結合されない1つ以上のヌクレオチドによって隣接される。
The polynucleotides of the present invention are generally isolated and obtained with substantial purity, except for intact chromosomes. Usually, the polynucleotide is DNA or R
Obtained as being substantially free of other naturally-occurring nucleic acid sequences, as any of the NAs, and generally being at least about 50%, usually at least about 90% pure,
And is typically "recombinant," for example flanked by one or more nucleotides that are not normally associated in the naturally occurring chromosome.

【0019】 本発明のポリヌクレオチドは、直線状の分子として、または環状分子内に提供
され得、そして自律的に複製する分子(ベクター)内に、または複製配列を伴わ
ない分子内に提供され得る。ポリヌクレオチドの発現は、それら自身によって、
または当該分野において公知の他の調節配列によって調節され得る。本発明のポ
リヌクレオチドは、当該分野において利用可能な種々の技術(例えば、トランス
フェリンポリカチオン媒介性DNA移入、裸の核酸またはカプセル化された核酸
でのトランスフェクション、リポソーム媒介性のDNA移入、DNAコート化ラ
テックスビーズの細胞内輸送、プロトプラスト融合、ウイルス感染、エレクトロ
ポレーション、遺伝子銃、リン酸カルシウム媒介性のトランスフェクションなど
)を使用して適切な宿主細胞に導入され得る。
The polynucleotide of the present invention may be provided as a linear molecule or in a circular molecule, and may be provided in an autonomously replicating molecule (vector) or in a molecule without a replication sequence. . Expression of polynucleotides is by themselves
Alternatively, it may be regulated by other regulatory sequences known in the art. Polynucleotides of the invention can be prepared by a variety of techniques available in the art (eg, transferrin polycation-mediated DNA transfer, transfection with naked or encapsulated nucleic acid, liposome-mediated DNA transfer, DNA coating). Trafficking of modified latex beads, protoplast fusion, viral infection, electroporation, gene gun, calcium phosphate mediated transfection, etc.) and can be introduced into appropriate host cells.

【0020】 本発明の核酸組成物は、例えば、ポリペプチドを生成するために、生物学的サ
ンプル(例えば、ヒト細胞の抽出物)中の本発明のmRNAの検出のためのプロ
ーブとして、ポリヌクレオチドのさらなるコピーを作製するために、リボザイム
またはアンチセンスオリゴヌクレオチドを作製するために、および1本鎖DNA
プローブとしてかまたは3本鎖を形成するオリゴヌクレオチドとして、使用され
得る。本明細書中に記載されるプローブは、例えば、サンプル中の配列番号1〜
1079において示されるようなポリヌクレオチド配列またはそれらの改変体の
存在または非存在を決定するために使用され得る。これらの用途および他の用途
は、以下により詳細に記載される。
The nucleic acid composition of the invention may be used as a probe for the detection of mRNA of the invention in a biological sample (eg an extract of human cells), eg to produce a polypeptide, a polynucleotide To make additional copies of the ribozyme or to make antisense oligonucleotides, and single-stranded DNA
It can be used as a probe or as a triplex forming oligonucleotide. The probes described herein include, for example, SEQ ID NOs: 1 to 1 in a sample.
It can be used to determine the presence or absence of a polynucleotide sequence as shown in 1079 or variants thereof. These and other uses are described in more detail below.

【0021】 (全長のcDNA、遺伝子、およびプロモーター領域を得るためのポリヌクレ
オチドの使用) 開示されるポリヌクレオチドを含有する全長cDNA分子は、以下のように得
られる。配列番号1〜1079のうちの1つの配列、または少なくとも12、1
5、18、または20ntを含有するそれらの部分を有するポリヌクレオチドは
、USPN 5,654,173号において記載されるようなプローブ設計法、
クローニング法、およびクローン選択技術を使用して、cDNAライブラリーの
ハイブリダイズするメンバーを検出するためのハイブリダイゼーションプローブ
として使用される。cDNAのライブラリーは、正常組織もしくは腫瘍組織のよ
うな選択された組織から、または例えば、薬学的な薬剤で処置された哺乳動物の
組織から作製される。好ましくは、組織は、本発明のポリヌクレオチドが単離さ
れた組織と同一である。なぜなら、本明細書中に記載されるポリヌクレオチドお
よびcDNAの両方が発現される遺伝子を示すからである。最も好ましくは、c
DNAライブラリーは、実施例において本明細書中に記載される生物学的材料か
ら作製される。ライブラリー構築のための細胞型の選択は、本発明のポリヌクレ
オチドに対応する遺伝子によってコードされるタンパク質の同定が知られた後で
なされ得る。このことは、どの組織および細胞型が関連する遺伝子を発現するよ
うであるかを示し、従って、cDNAを作製するためのmRNAについての適切
な供給源を示す。提供されるポリヌクレオチドがcDNAライブラリーから単離
される場合、ライブラリーはヒト結腸細胞、より好ましくはヒト結腸癌細胞のm
RNA、さらにより好ましくは非常に転移性の結腸細胞Km 12L4−Aから
調製される。
(Use of Polynucleotide to Obtain Full-Length cDNA, Gene, and Promoter Region) A full-length cDNA molecule containing the disclosed polynucleotide can be obtained as follows. One of SEQ ID NOs: 1-1079, or at least 12, 1
Polynucleotides having those moieties containing 5, 18, or 20 nt may be probed as described in USPN 5,654,173,
Used as a hybridization probe to detect hybridizing members of a cDNA library using cloning methods and clone selection techniques. A library of cDNA is made from selected tissues, such as normal or tumor tissues, or from mammalian tissues, eg, treated with a pharmaceutical agent. Preferably, the tissue is the same as the tissue from which the polynucleotide of the invention was isolated. This is because both the polynucleotides and cDNAs described herein represent expressed genes. Most preferably c
DNA libraries are made from the biological materials described herein in the examples. The selection of cell types for library construction can be done after the identification of the protein encoded by the gene corresponding to the polynucleotide of the invention is known. This indicates which tissues and cell types are likely to express the relevant gene, and thus represents a suitable source for mRNA to make cDNA. When the provided polynucleotides are isolated from a cDNA library, the library is a human colon cell, more preferably a human colon cancer cell m.
RNA, even more preferably from highly metastatic colon cells Km 12L4-A.

【0022】 核酸配列ライブラリーを生成およびプローブするための技術が、例えば、Sa
mbrookら、Molecular Cloning:A Laborato
ry Manual、第2版、(1989)Cold Spring Harb
or Press、Cold Spring Harbor、NYにおいて記載
される。cDNAは、配列番号1〜1079からの配列に基づくプライマーを使
用することによって調製され得る。1つの実施態様において、cDNAライブラ
リーは、ポリアデニル化mRNAのみから作製され得る。従って、ポリ−Tプラ
イマーが、mRNAからcDNAを調製するために使用され得る。
Techniques for generating and probing nucleic acid sequence libraries are described in, for example, Sa
Mbrook et al., Molecular Cloning: A Laborato.
ry Manual, 2nd Edition, (1989) Cold Spring Harb
or Press, Cold Spring Harbor, NY. cDNA can be prepared by using primers based on the sequences from SEQ ID NOS: 1-1079. In one embodiment, the cDNA library can be made exclusively of polyadenylated mRNA. Therefore, poly-T primers can be used to prepare cDNA from mRNA.

【0023】 提供されるポリヌクレオチドよりも大きく、かつ好ましくはネイティブなメッ
セージの完全なコード配列を含むライブラリーのメンバーが得られる。cDNA
全体が得られたことを確認するために、RNAプロテクション実験が以下のよう
に行われる。mRNAへの全長cDNAのハイブリダイゼーションは、RNアー
ゼ分解からRNAを保護する。cDNAが全長でない場合、ハイブリダイズしな
いmRNAの部分はRNアーゼ分解に供される。これは、当該分野において公知
であるように、ポリアクリルアミドゲルにおける電気泳動移動度の変化によって
か、または放出されるモノリボヌクレオチドの検出によってアッセイされる。S
ambrookら、Molecular Cloning:A Laborat
ory Manual、第2版、(1989)Cold Spring Har
bor Press、Cold Spring Harbor、NY。部分的c
DNAの末端に対して5’のさらなる配列を得るために、5’RACE(PCR Protocols:A Guide to Methods and Ap
plications、(1990)Academic Press、Inc.
)が行われ得る。
Members of the library are obtained which are larger than the polynucleotide provided and which preferably contain the complete coding sequence of the native message. cDNA
To confirm that all were obtained, RNA protection experiments are performed as follows. Hybridization of full-length cDNA to mRNA protects RNA from RNase degradation. If the cDNA is not full length, the portion of the mRNA that does not hybridize is subject to RNase degradation. This is assayed by changes in electrophoretic mobility in polyacrylamide gels or by detection of released monoribonucleotides, as is known in the art. S
ambrook et al., Molecular Cloning: A Laborat
ory Manual, 2nd edition, (1989) Cold Spring Har
bor Press, Cold Spring Harbor, NY. Partial c
To obtain additional sequences 5'to the ends of the DNA, 5'RACE (PCR Protocols: A Guide to Methods and Ap) was obtained.
applications, (1990) Academic Press, Inc.
) Can be done.

【0024】 全長cDNAの単離に類似の様式で提供されるポリヌクレオチドを用いて、ゲ
ノムDNAを単離する。手短には、提供されるポリヌクレオチド、またはその一
部分は、ゲノムDNAのライブラリーに対するプローブとして使用される。好ま
しくは、このライブラリーは、本発明のポリヌクレオチドを生成するために使用
された細胞型から得られる。しかし、これは必須ではない。最も好ましくは、こ
のゲノムDNAは、本明細書中の実施例に記載される生物学的材料から得られる
。このようなライブラリーは、ゲノムの大きなセグメントを運ぶのに適するベク
ター(例えば、Sambrookら、9.4−9.30に詳細に記載されるよう
なP1またはYAC)に存在し得る。さらに、ゲノム配列は、ヒトBACライブ
ラリーから単離され得る。これは、例えば、Research Genetic
s,Inc.,Huntville,Alabama,USAより市販されてい
る。さらなる5’または3’配列を得るために、Sambrookらに記載され
るように、染色体ウォーキングが実行され、その結果、ゲノムDNAの隣接およ
び重複フラグメントが単離される。これらは、当該分野で公知のように、制限消
化酵素およびDNAリガーゼを使用して、マッピングおよびつなぎ合わされる。
Genomic DNA is isolated using a polynucleotide provided in a manner similar to the isolation of full length cDNA. Briefly, the provided polynucleotide, or a portion thereof, is used as a probe for a library of genomic DNA. Preferably, this library is obtained from the cell types used to produce the polynucleotides of the invention. However, this is not mandatory. Most preferably, this genomic DNA is obtained from the biological material described in the examples herein. Such libraries may be present in vectors suitable for carrying large segments of the genome (eg P1 or YAC as described in detail in Sambrook et al., 9.4-9.30). In addition, genomic sequences can be isolated from human BAC libraries. This is, for example, Research Genetic
s, Inc. , Huntville, Alabama, USA. To obtain additional 5'or 3'sequences, chromosomal walking is performed as described in Sambrook et al., Resulting in the isolation of flanking and overlapping fragments of genomic DNA. These are mapped and stitched together using restriction digests and DNA ligases as are known in the art.

【0025】 本発明のポリヌクレオチド配列を使用して、対応する全長遺伝子が、cDNA
ライブラリーを構築およびプローブするための古典的な方法およびPCR法の両
方を使用して単離され得る。いずれかの方法、好ましくはノーザンブロットを使
用して、どの細胞株が最も高いレベルで目的の遺伝子を発現するのかを決定する
ために、多くの細胞型において実行される。cDNAライブラリーを構築する古
典的な方法は、Sambrookら(前出)に教示される。これらの方法を用い
て、cDNAは、mRNAから生成され得、そしてウイルスベクターまたは発現
ベクターに挿入され得る。代表的には、ポリ(A)テールを含むmRNAのライ
ブラリーは、ポリ(T)プライマーを用いて生成され得る。同様に、cDNAラ
イブラリーは、プライマーとして本発明の配列を使用して、生成され得る。
Using the polynucleotide sequences of the present invention, the corresponding full-length gene is a cDNA
It can be isolated using both classical and PCR methods for constructing and probing libraries. Performed on many cell types to determine which cell line expresses the gene of interest at the highest level using either method, preferably Northern blot. Classical methods of constructing cDNA libraries are taught in Sambrook et al. (supra). Using these methods, cDNA can be generated from mRNA and inserted into viral or expression vectors. Typically, a library of mRNAs containing poly (A) tails can be generated using poly (T) primers. Similarly, a cDNA library can be generated using the sequences of the invention as primers.

【0026】 PCR法は、所望の挿入物を含むcDNAライブラリーのメンバーを増幅する
ために使用される。この場合において、所望される挿入物は、本発明のポリヌク
レオチドに対応する全長cDNA由来の配列を含む。このようなPCR法は、遺
伝子トラッピングおよびRACE法を含む。遺伝子トラッピングは、cDNAラ
イブラリーのメンバーをベクターに挿入することを必要とする。次いで、このベ
クターを変性させ、一本鎖分子を生成する。次に、基質結合プローブ(例えば、
ビオチン化オリゴ)は、目的のcDNA挿入物をトラップするために使用される
。ビオチン化プローブは、アビジン結合固体基質に連結され得る。PCR法は、
このトラップしたcDNAを増幅するために使用され得る。全長の遺伝子に対応
する配列をトラップするために、標識化プローブ配列は、本発明のポリヌクレオ
チド配列に基づく。ライブラリーベクターに対して特異的なランダムプライマー
は、このトラップしたcDNAを増幅するために使用され得る。このような遺伝
子トラッピング技術は、Gruberら、WO 95/04745およびGru
berら、米国特許第5,500,356号に記載される。遺伝子トラッピング
実験を実施するためのキットは、市販されている(例えば、Life Tech
nologies,Gaithersburg,Maryland,USAより
)。
The PCR method is used to amplify a member of the cDNA library containing the desired insert. In this case, the desired insert comprises the sequence from the full length cDNA corresponding to the polynucleotide of the invention. Such PCR methods include gene trapping and RACE methods. Gene trapping involves inserting a member of a cDNA library into a vector. The vector is then denatured to produce a single chain molecule. Next, a substrate-bound probe (eg,
Biotinylated oligos) are used to trap the cDNA insert of interest. The biotinylated probe can be linked to an avidin-conjugated solid substrate. The PCR method is
It can be used to amplify this trapped cDNA. Labeled probe sequences are based on the polynucleotide sequences of the invention to trap sequences corresponding to the full-length gene. Random primers specific for the library vector can be used to amplify this trapped cDNA. Such gene trapping techniques are described in Gruber et al., WO 95/04745 and Gru.
Ber et al., US Pat. No. 5,500,356. Kits for performing gene trapping experiments are commercially available (eg, Life Tech).
Nologies, Gaithersburg, Maryland, USA).

【0027】 「cDNA末端の迅速な増幅」、またはRACEは、多数の異なるRNAから
cDNAを増幅するPCR法である。このcDNAを、オリゴヌクレオチドリン
カーに結合させ、そして2つのプライマーを用いてPCRによって増幅する。1
つのプライマーは、本発明のポリヌクレオチド由来の配列に基づき、これは全長
配列が所望される。そして2つめのプライマーは、cDNAを増幅するためのオ
リゴヌクレオチドリンカーとハイブリダイズする配列を含む。この方法の説明は
、WO 97/19110に示される。RACEの好ましい実施態様において、
一般のプライマーは、cDNA末端に連結される任意のアダプター配列とアニー
ルするために設計される(ApteおよびSiebert,Biotechni
ques(1993)15:890−893;Edwardsら、Nuc.Ac
ids Res.(1991):5227−5232)。単一の遺伝子特異的R
ACEプライマーが、一般のプライマーと対になる場合、単一の遺伝子特異的プ
ライマーと一般のプライマーとの間で配列の優先的な増幅が起こる。RACEに
おける使用のために改変された市販のcDNAプールは利用可能である。
“Rapid amplification of cDNA ends,” or RACE, is a PCR method that amplifies cDNA from a number of different RNAs. The cDNA is attached to an oligonucleotide linker and amplified by PCR with two primers. 1
One primer is based on a sequence derived from the polynucleotide of the invention, which is desired for the full length sequence. And the second primer contains a sequence that hybridizes with an oligonucleotide linker for amplifying the cDNA. A description of this method is given in WO 97/19110. In a preferred embodiment of RACE,
Common primers are designed to anneal with any adapter sequence that is ligated to the ends of the cDNA (Apte and Siebert, Biotechni.
ques (1993) 15: 890-893; Edwards et al., Nuc. Ac
ids Res. (1991): 5227-5232). Single gene-specific R
When the ACE primer pairs with the generic primer, preferential amplification of the sequence occurs between the single gene-specific primer and the generic primer. Commercially available cDNA pools modified for use in RACE are available.

【0028】 別のPCRに基づく方法は、cDNA配列の特定の情報を必要とせず、固定化
末端を有する全長のcDNAライブラリーを産生する。この方法は、ロック−ド
ッキングプライマー(I−VI)(1つのプライマーであるポリTV(I−II
I)は、第1鎖の合成を生じる真核生物のmRNAのポリAテールにわたって固
定し、そして第2のプライマーであるポリGH(IV−VI)は、末端デオキシ
ヌクレオチジルトランスフェラーゼ(TdT)により付加されるポリCテール上
に固定する)を使用する(例えば、WO96/40998を参照のこと)。
Another PCR-based method does not require specific information of the cDNA sequence and produces a full-length cDNA library with immobilized ends. This method uses a lock-docking primer (I-VI) (one primer, polyTV (I-II).
I) anchors over the poly A tail of the eukaryotic mRNA resulting in first-strand synthesis, and the second primer, polyGH (IV-VI), is added by terminal deoxynucleotidyl transferase (TdT). Immobilized on a poly C tail) (see, for example, WO 96/40998).

【0029】 遺伝子のプロモーター領域は、一般に、RNAポリメラーゼIIのための開始
部位に対して5’に位置する。何百ものプロモーター領域は、「TATAボック
ス」(例えば、TATTAまたはTATAAのような配列)を含み、これは、変
異に対して感受性である。プロモーター領域は、遺伝子のコード領域由来のプラ
イマーを使用する5’RACEの実施により得られ得る。あるいは、cDNAは
、ゲノム配列についてのプローブとして使用され得、そしてコード領域に対する
領域5’は「ウォーキングアップ」により同定される。遺伝子が高度に発現され
るか、または示差発現される場合、この遺伝子由来のプロモーターは、異種遺伝
子に対する調節構築物において有用であり得る。
The promoter region of the gene is generally located 5'to the start site for RNA polymerase II. Hundreds of promoter regions contain a "TATA box" (eg, sequences such as TATTA or TATAA), which are susceptible to mutations. The promoter region can be obtained by performing 5'RACE using primers derived from the coding region of the gene. Alternatively, the cDNA can be used as a probe for genomic sequences, and the region 5'to the coding region is identified by "walking up". If the gene is highly or differentially expressed, promoters from this gene may be useful in regulatory constructs for heterologous genes.

【0030】 一旦全長のcDNAまたは遺伝子が得られたならば、改変体をコードするDN
Aは、部位特異的変異誘発により調製され得る(Sambrookら、15.3
−15.63に詳細に記載される)。置換されるコドンまたはヌクレオチドの選
択は、タンパク質の構造および/または機能の変化を達成するために、アミノ酸
における必要に応じた変化についての本明細書中の開示に基づき得る。
Once the full length cDNA or gene has been obtained, the DN encoding the variant
A can be prepared by site-directed mutagenesis (Sambrook et al., 15.3).
-15.63). The choice of codons or nucleotides to be replaced can be based on the disclosure herein of optional changes in amino acids to achieve changes in protein structure and / or function.

【0031】 生物学的材料由来のDNAまたはRNAを得るための代替方法として、本発明
の1つ以上のポリヌクレオチドの配列を有するヌクレオチドを含む核酸が、合成
され得る。従って、本発明は、1つ以上の生物学的操作(核酸分子の複製および
発現を含む)に適する15ヌクレオチド長(配列番号1〜1079のうちの1つ
の、少なくとも15の連続するヌクレオチドに対応する)から最大長までの範囲
である核酸分子を含む。本発明は、(a)完全な遺伝子のサイズを有し、かつ配
列番号1〜1079の少なくとも1つを含む核酸;(b)少なくとも1つのさら
なる遺伝子をまた含み、融合タンパク質の発現を可能にするために作動可能に連
結される(a)の核酸;(c)(a)または(b)を含む発現ベクター;(d)
(a)または(b)を含むプラスミド;および(e)(a)または(b)を含む
組換え型ウイルス粒子、を含むが、これらに限定されない。一旦本明細書中に開
示されるポリヌクレオチドが提供されれば、(a)〜(e)の構築および調製は
、当業者に周知である。
As an alternative method for obtaining DNA or RNA from biological material, nucleic acids containing nucleotides having the sequence of one or more polynucleotides of the present invention can be synthesized. Thus, the present invention corresponds to at least 15 contiguous nucleotides of 15 nucleotide length (one of SEQ ID NOs: 1-1079) suitable for one or more biological manipulations, including replication and expression of nucleic acid molecules. ) To the maximum length. The present invention comprises (a) a nucleic acid having the size of the complete gene and comprising at least one of SEQ ID NOs: 1-1079; (b) also comprising at least one additional gene, allowing expression of the fusion protein. A nucleic acid of (a) operably linked for: (c) an expression vector comprising (a) or (b); (d)
A plasmid containing (a) or (b); and (e) a recombinant virus particle containing (a) or (b), but not limited thereto. Once provided with the polynucleotides disclosed herein, the construction and preparation of (a)-(e) is well known to those of skill in the art.

【0032】 配列番号1〜1079の少なくともいずれか1つの、少なくとも15の連続す
るヌクレオチドを含む核酸配列、好ましくは配列番号1〜1079の少なくとも
いずれか1つの全体配列を含む核酸配列は、これに限定されないが、A、T、G
、および/またはC(DNAに関して)ならびにA、U、G、および/またはC
(RNAに関して)のいずれかの配列、あるいはそれらの改変された塩基(イノ
シンおよびプソイドウリジンを含む)であり得る。配列の選択は、所望される機
能に基づき、そして所望されるコード領域、所望されるイントロン様領域、およ
び所望される調節領域によって指示され得る。配列番号1〜1079のいずれか
1つの全体配列が核酸内に存在する場合、得られる核酸は、本明細書中において
配列番号1〜1079のいずれか1つの配列を含むポリヌクレオチドと呼ばれる
Nucleic acid sequences comprising at least 15 contiguous nucleotides of at least one of SEQ ID NOS: 1-1079, preferably nucleic acid sequences comprising the entire sequence of at least one of SEQ ID NOS: 1-1079 are not limited thereto. Not A, T, G
, And / or C (with respect to DNA) and A, U, G, and / or C
It can be any sequence (for RNA) or their modified bases, including inosine and pseudouridine. The choice of sequence will be based on the desired function and may be dictated by the desired coding region, desired intron-like region, and desired regulatory region. When the entire sequence of any one of SEQ ID NOs: 1-1079 is present within a nucleic acid, the resulting nucleic acid is referred to herein as a polynucleotide comprising the sequence of any one of SEQ ID NOs: 1-1079.

【0033】 (全長cDNAまたは全長遺伝子によりコードされるポリペプチドの発現) 提供されるポリヌクレオチド(例えば、配列番号1〜1079の1つの配列を
有するポリヌクレオチド)、対応するcDNA、または全長の遺伝子は、部分的
なまたは完全な遺伝子産物を発現するために使用される。配列番号1〜1079
の配列を有するポリヌクレオチドの構築物はまた、合成されて生じ得る。あるい
は、オリゴデオキシリボヌクレオチドの多数のメンバー由来の遺伝子およびプラ
スミド全体の単段階アセンブリは、例えば、Stemmerら、Gene(Am
sterdam)(1995)164(1):49−53によって記載される。
本方法において、アセンブリPCR(オリゴデオキシリボヌクレオチド(オリゴ
)の多数のメンバー由来の長いDNA配列の合成)が記載される。この方法は、
DNAシャッフリング(Stemmer,Nature(1994)370:3
89−391)に由来し、そしてDNAリガーゼに頼らないが、代わりにアセン
ブリプロセスの間により長いDNAフラグメントをますます構築するためのDN
Aポリメラーゼに頼る。
(Expression of Polypeptide Encoded by Full-length cDNA or Full-length Gene) A provided polynucleotide (for example, a polynucleotide having one sequence of SEQ ID NOs: 1 to 1079), a corresponding cDNA, or a full-length gene is , Used to express partial or complete gene products. Sequence number 1-1079
A polynucleotide construct having the sequence of may also be synthetically produced. Alternatively, single-step assembly of genes and entire plasmids from multiple members of oligodeoxyribonucleotides is described, for example, in Stemmer et al., Gene (Am.
sterdam) (1995) 164 (1): 49-53.
In this method, assembly PCR (synthesis of long DNA sequences from multiple members of an oligodeoxyribonucleotide (oligo)) is described. This method
DNA shuffling (Stemmer, Nature (1994) 370: 3
89-391) and does not rely on DNA ligase, but instead to construct increasingly longer DNA fragments during the assembly process.
Rely on A polymerase.

【0034】 適切なポリヌクレオチド構築物は、例えばSambrookら、Molecu
lar Cloning:A Laboratory Manual,第2版、
(1989)Cold Spring Harbor Press,Cold
Spring Harbor,NYに記載される標準的組換えDNA技術を用い
て、および United States Dept.of HHS, Nat
ional Institute of Health(NIH)Guidel
ines for Recombinant DNA Researchに記載
されるような現行の規則の下で、精製される。本発明のポリヌクレオチドにより
コードされる遺伝子産物は、いずれかの発現系(例えば、細菌、酵母、昆虫、両
生類および哺乳動物系を含む)において発現される。ベクター、宿主細胞、およ
びそれらにおいて発現を得るための方法は、当該分野で周知である。適切なベク
ターおよび宿主細胞は、米国特許第5,654,173号に記載される。
Suitable polynucleotide constructs are described, for example, in Sambrook et al., Molcu.
lar Cloning: A Laboratory Manual, 2nd Edition,
(1989) Cold Spring Harbor Press, Cold
Using standard recombinant DNA techniques described in Spring Harbor, NY, and in United States Dept. of HHS, Nat
ional Institute of Health (NIH) Guidel
Purified under current rules as described in the ins for Recombinant DNA Research. The gene product encoded by the polynucleotide of the present invention is expressed in any expression system including, for example, bacterial, yeast, insect, amphibian and mammalian systems. Vectors, host cells, and methods for obtaining expression in them are well known in the art. Suitable vectors and host cells are described in US Pat. No. 5,654,173.

【0035】 本明細書に提供されるポリヌクレオチド配列を含むポリヌクレオチド分子は、
一般に、ベクター中にこの分子を配置することによって増殖される。ウイルスお
よび非ウイルスベクター(プラスミドを含む)が使用される。プラスミドの選択
は、増殖が所望される細胞のタイプおよび増殖の目的に依存する。特定のベクタ
ーが、大量の所望のDNA配列を増幅および作製するために有用である。他のベ
クターは、培養中の細胞における発現に適切である。さらなる他のベクターは、
動物全体またはヒトにおける細胞における転移および発現のために適切である。
適切なベクターの選択は、十分に当該分野の技術の範囲内である。多くのこのよ
うなベクターは、市販されている。所望の配列を含むベクターの調製のための方
法は、当該分野で周知である。
A polynucleotide molecule comprising a polynucleotide sequence provided herein,
Generally, it is propagated by placing the molecule in a vector. Viral and non-viral vectors (including plasmids) are used. The choice of plasmid depends on the type of cell in which it is desired to grow and the purpose of growth. Certain vectors are useful for amplifying and producing large amounts of the desired DNA sequence. Other vectors are suitable for expression in cells in culture. Still other vectors are
Suitable for metastasis and expression in cells in whole animals or humans.
Selection of the appropriate vector is well within the skill of the art. Many such vectors are commercially available. Methods for the preparation of vectors containing the desired sequence are well known in the art.

【0036】 配列番号1〜1079に記載のポリヌクレオチドまたはそれらの対応する全長
ポリヌクレオチドは、所望の発現特性を得るために適切なように、調節配列に連
結される。これらは、プロモーター(センス鎖の5’末端またはアンチセンス鎖
の3’末端のいずれかで付着される)、エンハンサー、ターミネーター、オペレ
ーター、リプレッサー、およびインデューサーを含み得る。プロモーターは、調
節され得るか、または構成性であり得る。いくつかの状況では、条件的活性プロ
モーター(例えば、組織特異的または発生期特異的プロモーター)を使用するこ
とが望ましいとされ得る。これらは、ベクターへの連結のために上述した技術を
使用して、所望のヌクレオチド配列に連結される。当該分野で公知の任意の技術
が用いられ得る。
The polynucleotides set forth in SEQ ID NOS: 1-1079 or their corresponding full-length polynucleotides are linked to regulatory sequences as appropriate to obtain the desired expression characteristics. These can include promoters (attached at either the 5'end of the sense strand or the 3'end of the antisense strand), enhancers, terminators, operators, repressors, and inducers. The promoter can be regulated or constitutive. In some situations, it may be desirable to use conditionally active promoters, such as tissue-specific or nascent-specific promoters. These are ligated to the desired nucleotide sequence using the techniques described above for ligation into vectors. Any technique known in the art can be used.

【0037】 上記の宿主細胞のいずれか、または他の適切な宿主細胞または生物が、本発明
のポリヌクレオチドまたは核酸を複製し、かつ/または発現させるために用いら
れる場合、得られた複製された核酸、RNA、発現されたタンパク質またはポリ
ペプチドは、宿主細胞または生物の産物として、本発明の範囲内にある。この産
物は、当該分野で公知の任意の適切な手段によって回収される。
When any of the above host cells, or other suitable host cells or organisms, are used to replicate and / or express the polynucleotides or nucleic acids of the invention, the resulting replicated Nucleic acids, RNA, expressed proteins or polypeptides are within the scope of the invention as a product of the host cell or organism. The product is recovered by any suitable means known in the art.

【0038】 選択されたポリヌクレオチドに対応する遺伝子がいったん同定されると、その
発現は、その遺伝子がネイティブである細胞において調節され得る。例えば、細
胞の内因性遺伝子は、米国特許第5,641,670号に開示されるように外因
性調節配列によって調節され得る。
Once the gene corresponding to the selected polynucleotide is identified, its expression can be regulated in cells in which the gene is native. For example, a cell's endogenous genes can be regulated by exogenous regulatory sequences as disclosed in US Pat. No. 5,641,670.

【0039】 (公的に入手可能なデータベースに対してスクリーニングされる、新規遺伝子
の機能的および構造的モチーフの同定) 提供されたポリヌクレオチド、cDNA、または完全遺伝子のヌクレオチド配
列の翻訳物を、個々の既知配列と整列し得る。個々の配列との類似性が、本発明
のポリヌクレオチドによってコードされるポリペプチドの活性を決定するために
使用され得る。また、1つより多い個々の配列との類似性を呈示する配列は、個
々の配列のいずれか、または両方に特徴的な活性を呈示し得る。
Identification of Functional and Structural Motif of Novel Genes Screened Against Publicly Available Databases Provided polynucleotides, cDNAs, or translations of the nucleotide sequence of the complete gene are individually labeled. Can be aligned with known sequences of. The similarity to individual sequences can be used to determine the activity of the polypeptide encoded by the polynucleotide of the invention. Also, sequences exhibiting similarities to more than one individual sequence may exhibit activity characteristic of either or both of the individual sequences.

【0040】 最も近い隣接物のポリヌクレオチド配列の全長配列およびフラグメントは、提
供されたポリヌクレオチドに対応する全長配列を同定し、そして単離するための
プローブおよびプライマーとして使用され得る。最も近い隣接物は、提供された
ポリヌクレオチドに対応する全長配列のためのライブラリーを構築するために使
用され得る組織または細胞タイプを示し得る。
The full-length sequences and fragments of the closest flanking polynucleotide sequences can be used as probes and primers to identify and isolate full-length sequences corresponding to the provided polynucleotides. The closest neighbors may indicate a tissue or cell type that can be used to construct a library for the full length sequence corresponding to the provided polynucleotide.

【0041】 代表的には、選択されたポリヌクレオチドは、個々の配列との最良の整列を決
定するために、6つ全てのフレームで翻訳される。配列表において本明細書中に
開示された配列は、5’から3’への方向であり、そして3つのフレームでの翻
訳で十分であり得る(実施例に記載のような少数の特定の例外はあるが)。これ
らのアミノ酸配列を、一般に、「問い合わせ(query)配列」と称し、これ
は、個々の配列と整列される。個々の配列を有するデータベースは、「Comp
uter Methods for Macromolecular Sequ
ence Analysis」 Methods in Enzymology
(1996)266、Doolittle、Academic Press,I
nc.a division of Harcourt Brace & Co
.,San Diego、California、USAに記載されている。デ
ータベースは、Genbank、EMBL、およびDNA Database
of Japan(DDBJ)を包含する。
Typically, the selected polynucleotides are translated in all 6 frames to determine the best alignment with the individual sequences. The sequences disclosed herein in the sequence listing are in the 5'to 3'direction and translation in three frames may be sufficient (with a few specific exceptions as described in the Examples). But there is). These amino acid sequences are commonly referred to as "query sequences," which are aligned with the individual sequences. The database with individual sequences is "Comp
uter Methods for Macromolecular Seque
ence Analysis ”Methods in Enzymology
(1996) 266, Doolittle, Academic Press, I.
nc. a division of Harcourt Brace & Co
. , San Diego, California, USA. The databases are Genbank, EMBL, and DNA Database.
of Japan (DDBJ).

【0042】 問い合わせ配列および個々の配列は、上記の方法およびコンピュータープログ
ラムを用いて整列され得、そしてBLAST2.0(http://www.n
cbi.nlm.nih.gov/BLAST/でワールドワイドウェブで利用
可能)を含む。Altschulら、Nucleic Acids Res.(
1997)25:3389−3402もまた参照のこと。別の整列アルゴリズム
は、Fasta(Genetics Computing Group(GCG
)パッケージで利用可能、Madison、Wisconsin、USA、Ox
ford Molecular Group、Inc.の完全所有子会社)であ
る。整列のための他の技術は、Doolittle、前出に記載される。好まし
くは、配列中のギャップを可能にする整列プログラムが、配列を整列させるため
に利用される。Smith−Watermanは、配列整列中のギャップを可能
にするアルゴリズムの1つのタイプである。Meth.Mol.Biol.(1
997)70:173−187を参照のこと。また、Needlemanおよび
Wunsch整列法を用いるGAPプログラムが、配列を整列させるために利用
され得る。代替的検索ストラテジーは、MPSRCHソフトウェアを使用する。
これは、MASPARコンピューターで実行する。MPSRCHは、大規模並行
コンピューターにおいて配列をスコア付けするためにSmith−Waterm
anアルゴリズムを使用する。このアプローチは、遠いと関連付けられた適合で
ある配列を同定する能力を改善し、そして小さなギャップおよびヌクレオチド配
列誤差に特に寛容である。提供されたポリヌクレオチドによってコードされるア
ミノ酸配列は、タンパク質データベースおよびDNAデータベースの両方を検索
するために使用され得る。DNA配列データベースまたはタンパク質配列データ
ベース(特許データベース(例えば、GeneSeq)を含む)のいずれかによ
り、本出願の出願日当時に公になった全ての配列は、本明細書中に参考として援
用される。本出願の出願日当時にこれらのデータベースに寄託されたが、本出願
の出願日以降ずっと公にならなかった配列もまた、本明細書中に参考として援用
される。
The query sequence and individual sequences can be aligned using the methods and computer programs described above, and BLAST 2.0 (http: //www.n.
cbi. nlm. nih. Gov / BLAST / available on the World Wide Web). Altschul et al., Nucleic Acids Res. (
1997) 25: 3389-3402. Another alignment algorithm is Fasta (Genetics Computing Group (GCG
) Available in packages, Madison, Wisconsin, USA, Ox
ford Molecular Group, Inc. Is a wholly owned subsidiary). Other techniques for alignment are described in Doolittle, supra. Preferably, alignment programs that allow gaps in the sequences are utilized to align the sequences. Smith-Waterman is one type of algorithm that allows for gaps in sequence alignments. Meth. Mol. Biol. (1
997) 70: 173-187. Also, the GAP program using the Needleman and Wunsch alignment methods can be utilized to align sequences. An alternative search strategy uses MPSRCH software.
This is done on a MASPAR computer. MPSRCH is used by Smith-Waterm to score sequences on a massively parallel computer.
Use the an algorithm. This approach improves the ability to identify sequences that are distantly associated matches and is particularly tolerant of small gaps and nucleotide sequence errors. The amino acid sequence encoded by the provided polynucleotide can be used to search both protein and DNA databases. All sequences published at the filing date of this application, either by DNA sequence databases or protein sequence databases, including patent databases (eg, GeneSeq), are incorporated herein by reference. Sequences deposited in these databases at the filing date of the present application, but which have not been made public since the filing date of the present application, are also incorporated herein by reference.

【0043】 個々の配列および問い合わせ配列の整列の結果は、高類似性、弱類似性、およ
び類似性なしの3つのカテゴリーに分けられ得る。高類似性から弱類似性までの
範囲の個々の整列結果は、ポリペプチド活性および/または構造を決定するため
の基礎を提供する。個々の結果をカテゴライズするためのパラメーターは、以下
を含む:最も強い整列が見出される整列領域長の百分率、配列同一性パーセント
、およびp値。整列領域長の百分率は、最も強い整列の領域(例えば、整列した
問い合わせ配列の対応する領域の残基と同一である残基の最も多くの数を含む個
々の配列の連続的な領域)において見出された個々の配列の残基数を計数するこ
とによって算定される。この数を、問い合わせ配列の全残基長で割って、百分率
を算定する。例えば、20アミノ酸残基の問い合わせ配列を、個々の配列の20
アミノ酸領域と整列し得る。個々の配列は、問い合わせ配列のアミノ酸残基5、
9〜15、および17〜19に同一であったとする。従って、最も強い整列の領
域は、残基9〜19に伸長する領域である11アミノ酸ストレッチである。整列
領域長の百分率は、以下の通りである:11(最も強い整列の領域の長さ)を2
0(問い合わせ配列の長さ)で割ったもの、すなわち55%。
The results of the alignment of individual and query sequences can be divided into three categories: high similarity, weak similarity, and no similarity. Individual alignment results, ranging from high similarity to weak similarity, provide the basis for determining polypeptide activity and / or structure. Parameters for categorizing individual results include: percentage of aligned region length where the strongest alignment is found, percent sequence identity, and p-value. The percentage of alignment region length is found in the region of the strongest alignment (eg, the contiguous region of an individual sequence that contains the largest number of residues that are identical to the residues in the corresponding region of the aligned query sequence). It is calculated by counting the number of residues in each individual sequence issued. This number is divided by the total residue length of the query sequence to calculate the percentage. For example, a query sequence of 20 amino acid residues may be
Can align with amino acid regions. The individual sequences are amino acid residue 5 of the query sequence,
9-15 and 17-19. Thus, the region of strongest alignment is the 11 amino acid stretch, which is the region extending to residues 9-19. The percentage of alignment region length is as follows: 11 (length of region of strongest alignment) 2
Divided by 0 (query array length), or 55%.

【0044】 配列同一性パーセントは、問い合わせ配列と個々の配列との間のアミノ酸適合
の数を計数し、そして適合の総数を最も強い整列の領域において見出された個々
の配列の残基数で割ることによって算定される。従って、上記の例における同一
性パーセントは、10適合を11アミノ酸で割ったもの、すなわち約90.9%
である。
Percent sequence identity counts the number of amino acid matches between the query and individual sequences, and the total number of matches is the number of individual sequence residues found in the region of the strongest alignment. Calculated by dividing. Therefore, the percent identity in the above example is 10 matches divided by 11 amino acids, or about 90.9%.
Is.

【0045】 p値は、整列が偶然に生じた確率である。単整列については、p値は、Kar
linら、Proc.Natl.Acad.Sci.(1990)87:226
4およびKarlinら、Proc.Natl.Acad.Sci.(1993
)90に従って算定され得る。同じ問い合わせ配列を用いる多重整列のp値は、
Altschulら、Nat.Genet.(1994)6:119に記載の発
見的アプローチを用いて算定され得る。BLASTプログラムのような整列プロ
グラムがp値を算定し得る(Altschulら、Nucleic Acids Res.(1997)25:3389−3402もまた参照のこと)。
The p-value is the probability that the alignment happened by chance. For simple alignment, the p-value is Kar
Lin et al., Proc. Natl. Acad. Sci. (1990) 87: 226.
4 and Karlin et al., Proc. Natl. Acad. Sci. (1993
) 90. The p-value for multiple alignments using the same query sequence is
Altschul et al., Nat. Genet. (1994) 6: 119 and can be calculated using the heuristic approach. Alignment programs such as the BLAST program can calculate p-values (see also Altschul et al., Nucleic Acids Res. (1997) 25: 3389-3402).

【0046】 同一性または類似性を決定することについて考慮する別の要因は、類似性また
は同一性の位置選定である。強い局地的な整列は、たとえ整列の長さが短かった
としても、類似であることを示し得る。問い合わせ配列の長さ全体にわたって分
散された配列の同一性もまた、問い合わせ配列とプロフィール配列との間で類似
であることを示し得る。配列が整列する領域の境界は、Doolittle、前
出;BLAST2.0(例えば、Altschulら、Nucleic Aci
ds Res.(1997)25:3389−3402を参照のこと)もしくは
FASTプログラムに従って;または配列同一性が最も高い領域を決定すること
によって、決定され得る。
Another factor to consider in determining identity or similarity is localization of similarity or identity. A strong local alignment may indicate similarity, even if the alignment length is short. Sequence identity distributed over the length of the query sequence may also indicate similarity between the query and profile sequences. The boundaries of the regions where the sequences align are described in Doolittle, supra; BLAST 2.0 (eg, Altschul et al., Nucleic Aci.
ds Res. (1997) 25: 3389-3402) or according to the FAST program; or by determining the region of highest sequence identity.

【0047】 (高類似性) 一般に、高類似性であるとみなされる整列結果では、整列領域
長のパーセントは、問い合わせ配列の全長の、代表的には、少なくとも約55%
;より代表的には、少なくとも約58%;ずっとより代表的には、問い合わせ配
列の全残基長の少なくとも約60%である。通常、整列領域の長さのパーセント
は、約62%程度の多さ;より通常には、約64%程度の多さ;ずっとより通常
には、約66%程度の多さであり得る。さらに、高類似性について、整列の領域
は、代表的には、少なくとも約75%の配列同一性;より代表的には、少なくと
も約78%;よりずっと代表的には、少なくとも約80%の配列同一性を示す。
通常、配列同一性パーセントは、約82%程度の多さ;より通常には、約84%
程度の多さ;ずっとより通常には、約86%程度の多さであり得る。
High Similarities In alignment results that are generally considered to be high similarities, the percentage of alignment region length is typically at least about 55% of the total length of the query sequence.
More typically at least about 58%; much more typically at least about 60% of the total residue length of the query sequence. Generally, the percent of length of the alignment region can be as high as about 62%; more usually as high as about 64%; much more usually as high as about 66%. Further, for high similarity, regions of alignment will typically have at least about 75% sequence identity; more typically, at least about 78%; and even more typically, at least about 80% sequence. Shows identity.
Usually, percent sequence identity is as high as about 82%; more usually about 84%.
Much higher; much more usually can be as high as about 86%.

【0048】 p値は、これらの方法と併用して使用される。高類似性が見出された場合、p
値が約10-2以下であり;より通常には、約10-3以下であり;ずっとより通常
には、約10-4以下である場合、問い合わせ配列は、プロフィール配列と高い類
似性を有するとみなされる。より代表的には、問い合わせ配列が類似性が高いと
みなされるには、p値は、約10-5を超えず;より代表的には、約10-10以下
であり;ずっとより代表的には、約10-15以下である。
The p-value is used in conjunction with these methods. If high similarity is found, p
If the value is about 10 -2 or less; more usually about 10 -3 or less; much more usually about 10 -4 or less, the query sequence has a high degree of similarity to the profile sequence. Then be considered. More typically, the p-value will not exceed about 10 -5 ; more typically it will be about 10 -10 or less; much more typically, for the query sequences to be considered highly similar. Is about 10 −15 or less.

【0049】 (弱い類似性)一般に、整列結果が弱い類似性であると考慮される場合、整列
領域の長さの最小のパーセントも整列の最小の長さも存在しない。弱い配列類似
性をより充分に示すことは、整列の領域が代表的に、少なくとも約15アミノ酸
残基長;より代表的に、少なくとも約20;さらにより代表的に;少なくとも約
25アミノ酸長である場合に考慮される。通常、整列領域の長さは、約30アミ
ノ酸残基;より通常、約40程度;さらにより通常、約60程度のアミノ酸残基
であり得る。さらに、弱い類似性について、整列の領域は、代表的に、少なくと
も約35%の配列同一性;より代表的に、少なくとも約40%;さらにより代表
的に;少なくとも約45%の配列同一性を示す。通常、配列同一性のパーセント
は、約50%程度;より通常、約55%程度;さらにより通常、約60%程度で
あり得る。
Weak Similarities In general, when the alignment result is considered to be a weak similarity, there is no minimum percentage of the length of the alignment region or the minimum length of the alignment. A more sufficient indication of weak sequence similarity is that the region of alignment is typically at least about 15 amino acid residues in length; more typically at least about 20; even more typically; at least about 25 amino acids in length. To be considered in case. Generally, the length of the alignment regions will be about 30 amino acid residues; more usually about 40; even more usually about 60 amino acid residues. Moreover, for weak similarity, regions of the alignment typically exhibit at least about 35% sequence identity; more typically at least about 40%; even more typically; at least about 45% sequence identity. Show. Generally, percent sequence identity can be as high as about 50%; more usually as high as about 55%; even more usually as high as about 60%.

【0050】 低い類似性が見出される場合、問合せ配列は、p値が通常、約10-2未満であ
るかまたはこれに等しい場合;より通常には;約10-3未満であるかまたはこれ
に等しい場合;さらにより通常には;約10-4未満であるかまたはこれに等しい
場合に、プロフィール配列と弱い配列類似性を有すると考慮される。より代表的
には、弱い類似性であることが考慮される問合せ配列について、p値は、約10-5 を超えず:より通常には;約10-10を超えないかまたはこれに等しく;さら
により通常には;約10-15を超えないかまたはこれに等しい。
If low similarity is found, the query sequence is usually less than or equal to about 10 −3 if the p-value is typically less than or equal to about 10 −2 ; If equal; even more usually; less than or equal to about 10 −4, it is considered to have weak sequence similarity with the profile sequence. More typically, for query sequences that are considered to be weakly similar, the p-value does not exceed about 10 −5 : more usually; does not exceed about 10 −10 or is equal to this; Even more usually; not more than or equal to about 10 -15 .

【0051】 (配列同一性単独によって決定される類似性)配列同一性のみが、個々の配列
に対する問合せ配列の類似性を決定するために使用され得、そしてその配列の活
性を示し得る。このような整列は、好ましくは配列を整列するためにギャップを
許容する。代表的に、問合せ配列は、問合せ配列全体にわたる配列同一性が、少
なくとも約15%;より代表的に、少なくとも約20%;さらにより代表的に、
少なくとも約25%;さらにより代表的に、少なくとも約50%である場合、プ
ロフィール配列に関連する。類似性の尺度として、配列同一性単独は、問合せ配
列が通常、少なくとも80残基長;より通常、90残基;さらにより通常、少な
くとも95アミノ酸残基長である場合に最も有用である。より代表的に、類似性
は、問合せ配列が好ましくは100残基長;より好ましくは、120残基長;さ
らにより好ましくは、150アミノ酸残基長である場合に、配列同一性単独に基
づいて結論され得る。
Similarity (Determined by Sequence Identity Alone) Sequence identity alone can be used to determine the similarity of query sequences to individual sequences and can indicate the activity of that sequence. Such an alignment preferably allows gaps to align the sequences. Typically, the query sequence has at least about 15% sequence identity over the query sequence; more typically, at least about 20%; and even more typically,
At least about 25%; and even more typically at least about 50%, is associated with the profile sequence. As a measure of similarity, sequence identity alone is most useful when the query sequence is usually at least 80 residues long; more usually 90 residues; even more usually at least 95 amino acid residues long. More typically, similarity is based on sequence identity alone when the query sequence is preferably 100 residues long; more preferably 120 residues long; even more preferably 150 amino acid residues long. It can be concluded.

【0052】 (プロフィール配列および複数の整列された配列との整列)提供されるポリヌ
クレオチドの翻訳物は、タンパク質ファミリーまたは共通のモチーフのいずれか
を規定するアミノ酸プロフィールを用いて整列され得る。また、提供されるポリ
ヌクレオチドの翻訳物は、タンパク質ファミリーまたはモチーフのメンバーのポ
リぺプチド配列を含有する複数の配列整列(MSA)に対して整列され得る。プ
ロフィール配列またはMSAとの類似性または同一性は、提供されるポリヌクレ
オチドまたは対応するcDNAもしくは遺伝子によってコードされる遺伝子産物
(例えば、ポリぺプチド)の活性を決定するために使用され得る。例えば、ケモ
カインプロフィールまたはMSAと同一性および類似性を示す配列は、ケモカイ
ン活性を示し得る。
(Alignment with Profile Sequences and Multiple Aligned Sequences) Provided polynucleotide translations can be aligned with amino acid profiles that define either a protein family or a common motif. Also, translations of the provided polynucleotides can be aligned to multiple sequence alignments (MSA) containing the polypeptide sequences of protein family or motif members. The similarity or identity to the profile sequence or MSA can be used to determine the activity of the gene product (eg, polypeptide) encoded by the provided polynucleotide or the corresponding cDNA or gene. For example, sequences that show identity and similarity to chemokine profiles or MSA may exhibit chemokine activity.

【0053】 プロフィールは、(1)ファミリーに属するメンバーのアミノ酸配列の整列で
あるMSAを作製し、そして(2)整列の統計学的表示を構築することによって
、手動で設計され得る。このような方法は、例えば、Birneyら、Nucl
.Acid Res.(1996)24(14):2730−2739において
記載される。いくつかのタンパク質ファミリーおよびモチーフのMSAは、公的
に利用可能である。例えば、http://genome.wustl.edu
/Pfam/は、547個の異なるファミリーおよびモチーフのMSAを含む。
これらのMSAはまた、Sonnhammerら、Proteins(1997
)28:405−420において記載される。ワールドワイドウェブにおける他
の供給源としては、http://www.embl−heidelberg.
de/argos/ali/ali.htmlが挙げられる;あるいは、情報と
してALI@EMBL−HEIDELBERG.DEにメッセージが送信され得
る。これらのMSAの簡潔な記載は、Pascarellaら、Prot.En
g.(1996)9(3):249−251において報告される。MSAからの
プロフィールを構築するための技術は、Sonnhammerら、前出;Bir
neyら、前出:および「高分子配列分析のためのコンピュータ法」、Meth
od in Enzymology(1996)266、Doolittle,
Academic Press、Inc.San Diego、Califor
nia、USAにおいて記載される。
Profiles can be manually designed by (1) creating MSA, which is an alignment of amino acid sequences of members belonging to the family, and (2) constructing a statistical representation of the alignment. Such methods are described, for example, in Birney et al., Nucl.
. Acid Res. (1996) 24 (14): 2730-2739. MSAs for several protein families and motifs are publicly available. For example, http: // genome. wastel. edu
/ Pfam / contains MSAs of 547 different families and motifs.
These MSAs are also described by Sonnhammer et al., Proteins (1997).
) 28: 405-420. Other sources on the World Wide Web include http: // www. embl-heidelberg.
de / argos / ali / ali. html; or ALI @ EMBL-HEIDELBERG. A message may be sent to the DE. A brief description of these MSAs can be found in Pascarella et al., Prot. En
g. (1996) 9 (3): 249-251. Techniques for constructing profiles from MSA are described by Sonnhammer et al., Supra; Bir.
ney et al., supra: and "Computer Methods for Polymer Sequence Analysis," Meth.
od in Enzymology (1996) 266, Doolittle,
Academic Press, Inc. San Diego, California
nia, USA.

【0054】 問合せ配列とタンパク質ファミリーもしくはモチーフとの間の類似性は、(a
)プロフィールに対して問合せ配列を比較することによって、および/または(
b)ファミリーもしくはモチーフのメンバーと問合せ配列とを整列することによ
って、決定され得る。代表的に、Searchwiseのようなプログラムが、
プロフィールとしてもまた知られる複数の整列の統計学的表示に対して問合せ配
列を比較するために使用される(Birneyら、前出を参照のこと)。配列お
よびプロフィールを比較するための他の技術は、Sonnhammerら、前出
およびDoolittle、前出において記載される。
The similarity between the query sequence and the protein family or motif is (a
) By comparing the query sequence against the profile, and / or (
b) Can be determined by aligning the query sequence with family or motif members. Typically, a program like Searchwise
Used to compare query sequences against a statistical representation of multiple alignments, also known as profiles (see Birney et al., Supra). Other techniques for comparing sequences and profiles are described in Sonnhammer et al., Supra and Doolittle, supra.

【0055】 次に、Fengら、J.Mol.Evol.(1987)25:351および
Higginsら、CABIOS(1989)5:151によって記載される方
法が、問合せ配列と、MSAとしてもまた知られるファミリーまたはモチーフの
メンバーとを整列するために使用され得る。配列整列は、任意の多様なソフトウ
ェアツールを使用して作製され得る。例としては、PileUPが挙げられ、こ
れは、複数の配列整列を作製し、そしてFengら、J.Mol.Evol.(
1987)25:351において記載される。別の方法のGAPは、Needl
emanら、J.Mol.Biol.(1970)48:443の整列法を使用
する。GAPは、配列の全体の整列に最も良好に適合される。第3の方法のBe
stFitは、Smithら、Adv.Appl.Math.(1981)2:
482の局所的な相同性アルゴリズムを使用して適合の数を最大にするようにギ
ャップを挿入することによって機能する。一般に、問合せ配列とプロフィールま
たはMSAとの間に類似性が存在するか否かを決定するために以下の因子が使用
される:(1)問合せ配列において見出される保存された残基の数、(2)問合
せ配列において見出される保存された残基のパーセント、(3)フレームシフト
の数、および(4)保存された残基間のスペーシング。
Next, Feng et al. Mol. Evol. (1987) 25: 351 and Higgins et al., CABIOS (1989) 5: 151 can be used to align the query sequence with members of a family or motif also known as MSA. Sequence alignments can be created using any of a variety of software tools. Examples include PileUP, which creates multiple sequence alignments and is described by Feng et al. Mol. Evol. (
1987) 25: 351. Another way GAP is Needl
eman et al. Mol. Biol. (1970) 48: 443. GAP is best suited for the overall alignment of sequences. Be of the third method
stFit is described in Smith et al., Adv. Appl. Math. (1981) 2:
It works by inserting gaps to maximize the number of matches using the 482 local homology algorithm. Generally, the following factors are used to determine whether there is a similarity between the query sequence and the profile or MSA: (1) the number of conserved residues found in the query sequence, ( 2) Percentage of conserved residues found in the query sequence, (3) number of frameshifts, and (4) spacing between conserved residues.

【0056】 配列の翻訳および整列の両方を行ういくつかの整列プログラムが、最も良好な
整列を生成するようにヌクレオチド配列を翻訳する場合、任意の数のフレームシ
フトを作製し得る。整列を作製するために必要とされるフレームシフトが少ない
ほど、問合せ配列とプロフィールまたはMSAとの間の類似性または同一性は強
い。例えば、フレームシフトなしから生じる弱い類似性は、2つのフレームシフ
トから生じる強力な類似性よりも、問合せ配列の活性または構造の良好な指示で
あり得る。好ましくは、3つ以下のフレームシフトが、整列において見出され;
より好ましくは2つ以下のフレームシフト;さらにより好ましくは、1つ以下の
フレームシフト;さらにより好ましくはフレームシフトなしが、問合せ配列とプ
ロフィールまたはMSAとの整列において見出される。
If some alignment programs that both translate and align the sequences translate the nucleotide sequences to produce the best alignment, any number of frameshifts can be made. The fewer frameshifts required to make an alignment, the stronger the similarity or identity between the query sequence and the profile or MSA. For example, the weak similarity that results from no frameshifting may be a better indication of the activity or structure of the query sequence than the strong similarity that results from two frameshifting. Preferably, no more than 3 frameshifts are found in the alignment;
More preferably no more than 2 frameshifts; even more preferably no more than 1 frameshift; even more preferably no frameshifts are found in the alignment of the query sequence with the profile or MSA.

【0057】 保存された残基は、ファミリーまたはモチーフのメンバーの全てまたはいくつ
かにおいて特定の位置で見出されるアミノ酸配列である。あるいは、位置は、ア
ミノ酸のあるクラスのみがファミリーメンバーの全てまたはいくつかにおいて特
定の位置で見出される場合、保存されていると考えられる。例えば、N末端の位
置は、リジン、アルギニン、またはヒスチジンのような正に荷電されたアミノ酸
を含み得る。
A conserved residue is an amino acid sequence found at a particular position in all or some of the members of a family or motif. Alternatively, a position is considered conserved if only one class of amino acids is found at that particular position in all or some of the family members. For example, the N-terminal position can include a positively charged amino acid such as lysine, arginine, or histidine.

【0058】 代表的に、ポリぺプチドの残基は、アミノ酸または単一のアミノ酸のクラスが
、全てのクラスメンバーのうちの少なくとも約40%;より代表的に、少なくと
も約50%;さらにより代表的にメンバーのうちの少なくとも約60%において
、特定の位置で見出される場合、保存されている。通常、残基は、クラスまたは
単一のアミノ酸がファミリーまたはモチーフのメンバーのうちの少なくとも約7
0%;より通常、少なくとも約80%;さらにより通常、少なくとも約90%;
さらにより通常、少なくとも約95%において見出される場合、保存されている
Typically, the residue of a polypeptide is an amino acid or single amino acid class that is at least about 40% of all class members; more typically at least about 50%; Is conserved if found at a particular location in at least about 60% of the members. Usually, residues are at least about 7 members of a class or single amino acid family or motif member.
0%; more usually at least about 80%; even more usually at least about 90%;
Even more usually, it is conserved if found in at least about 95%.

【0059】 残基は、3つの非関連のアミノ酸;より通常、2つの非関連のアミノ酸が、メ
ンバーのうちのいくつかまたは全てにおいて特定の位置で見出される場合、保存
されていると考えられる。これらの残基は、非関連のアミノ酸が、全てのクラス
のメンバーのうちの少なくとも約40%;より代表的に、少なくとも約50%;
さらにより代表的に、メンバーのうちの少なくとも約60%において、特定の位
置で見出される場合、保存されている。通常、残基は、クラスまたは単一のアミ
ノ酸が、ファミリーまたはモチーフのメンバーのうちの少なくとも約70%;よ
り通常、少なくとも約80%;さらにより通常、少なくとも約90%;さらによ
り通常、少なくと約95%において見出される場合、保存されている。
Residues are considered to be conserved if three unrelated amino acids; more usually two unrelated amino acids are found at particular positions in some or all of the members. These residues are unrelated amino acids at least about 40% of members of all classes; more typically at least about 50%;
Even more typically, it is conserved if found at a particular location in at least about 60% of the members. Usually, the residue is at least about 70% of the members of the family or motif in the class or single amino acid; more usually at least about 80%; even more usually at least about 90%; even more usually at least Conserved if found in about 95%.

【0060】 問合せ配列が、プロフィールまたはMSAの保存された残基のうちの少なくと
も約25%;より通常、少なくとも約30%;さらにより通常;少なくとも40
%を含む場合、問合せ配列はプロフィールまたはMSAに対して類似性を有する
。代表的に、問合せ配列が、プロフィールまたはMSAの保存された残基のうち
の少なくとも約45%;より代表的に、少なくとも約50%;さらにより代表的
に;少なくとも約55%を含む場合、問合せ配列はプロフィール配列またはMS
Aにより強い類似性を有する。
The query sequence is at least about 25% of the conserved residues of the profile or MSA; more usually at least about 30%; even more usually; at least 40.
If included, the query sequence has similarity to the profile or MSA. Typically, the query sequence comprises at least about 45% of the conserved residues of the profile or MSA; more typically, at least about 50%; even more typically; at least about 55%. Sequence is profile sequence or MS
It has a stronger similarity to A.

【0061】 (分泌性ポリぺプチドおよび膜結合性ポリぺプチドの同定) 本発明の分泌性ポリぺプチドおよび膜結合性ポリぺプチドの両方は、特に重要
である。例えば、分泌性ポリぺプチドのレベルは、都合のよい体液(例えば、血
液、血漿、血清、ならびに尿、前立腺液および精液のような他の体液)において
アッセイされ得る。膜結合性ポリぺプチドは、ワクチン抗原を構築するためにま
たは免疫応答を誘発するために有用である。このような抗原は、膜結合性ポリぺ
プチドの細胞外領域の全てまたは部分を含む。分泌性ポリぺプチドおよび膜結合
性ポリぺプチドの両方は、連続する疎水性アミノ酸のフラグメントを含むので、
疎水性を予測するアルゴリズムが、このようなポリぺプチドを同定するために使
用され得る。
(Identification of Secretory Polypeptide and Membrane-bound Polypeptide) Both the secretory polypeptide and the membrane-bound polypeptide of the present invention are particularly important. For example, secretory polypeptide levels can be assayed in convenient body fluids, such as blood, plasma, serum, and other body fluids such as urine, prostatic fluid and semen. Membrane-bound polypeptides are useful for constructing vaccine antigens or for eliciting an immune response. Such antigens include all or part of the extracellular region of the membrane-bound polypeptide. Since both secretory and membrane-bound polypeptides contain fragments of contiguous hydrophobic amino acids,
Algorithms that predict hydrophobicity can be used to identify such polypeptides.

【0062】 シグナル配列は通常、細胞の表面にポリぺプチドを指向するために、分泌性ポ
リぺプチドおよび膜結合性ポリぺプチドの両方によってコードされる。シグナル
配列は通常、疎水性残基のストレッチを含む。このようなシグナル配列は、らせ
ん構造に折畳まれ得る。膜結合性のポリぺプチドは代表的に、膜を横切り得る疎
水性アミノ酸のストレッチを保有する少なくとも1つの膜貫通領域を含む。いく
つかの膜貫通領域はまた、らせん構造を示す。ポリぺプチド内の疎水性フラグメ
ントは、コンピュータアルゴリズムを使用することによって同定され得る。この
ようなアルゴリズムとしては、HoppおよびWoods、Proc.Natl
.Acad.Sci.USA(1981)8:3824−3828;Kyteお
よびDoolittle、J.Mol.Biol.(1982)157:105
−132;およびRAOARアルゴリズム、Degli Espostiら、E
ur.J.Biochem.(1990)190:207−219が挙げられる
Signal sequences are usually encoded by both secretory and membrane-bound polypeptides in order to direct the polypeptide to the surface of cells. Signal sequences usually include stretches of hydrophobic residues. Such signal sequences can be folded into a helical structure. Membrane-bound polypeptides typically include at least one transmembrane region that carries a stretch of hydrophobic amino acids that can cross the membrane. Some transmembrane regions also show helical structures. Hydrophobic fragments within the polypeptide can be identified by using computer algorithms. Examples of such algorithms include Hopp and Woods, Proc. Natl
. Acad. Sci. USA (1981) 8: 3824-3828; Kyte and Doolittle, J. et al. Mol. Biol. (1982) 157: 105.
-132; and RAOAR algorithm, Degli Esposti et al., E.
ur. J. Biochem. (1990) 190: 207-219.

【0063】 分泌性ポリぺプチドおよび膜結合性ポリぺプチドを同定する別の方法は、全部
の6フレームにおいて本発明のポリヌクレオチドを翻訳し、そして少なくとも8
個の連続する疎水性アミノ酸が存在するか否かを決定することである。少なくと
も8個の;より代表的には、10個の;さらにより代表的には、12個の連続す
る疎水性アミノ酸を有するこれらの翻訳されたポリぺプチドは、推定の分泌性ポ
リぺプチドまたは膜結合性ポリぺプチドのいずれかであることが考慮される。疎
水性アミノ酸としては、アラニン、グリシン、ヒスチジン、イソロイシン、ロイ
シン、リジン、メチオニン、フェニルアラニン、プロリン、トレオニン、トリプ
トファン、チロシン、およびバリンが挙げられる。
Another method of identifying secretory and membrane-bound polypeptides is to translate the polynucleotide of the invention in all 6 frames and at least 8
To determine if there are consecutive hydrophobic amino acids. These translated polypeptides having at least 8; more typically 10; and even more typically 12 contiguous hydrophobic amino acids are putative secretory polypeptides or It is considered to be any of the membrane-bound polypeptides. Hydrophobic amino acids include alanine, glycine, histidine, isoleucine, leucine, lysine, methionine, phenylalanine, proline, threonine, tryptophan, tyrosine, and valine.

【0064】 (全長遺伝子発現産物の機能の同定) リボザイム、アンチセンス構築物、およびドミナントネガティブ変異体が、本
明細書中で提供されるポリヌクレオチドに対応する遺伝子の発現産物の機能を決
定するために使用され得る。これらの方法および組成物は特に、提供される新規
なポリヌクレオチドが公知の機能の遺伝子をコードする配列に有意なおよび実質
的な相同性を示さない場合、有用である。アンチセンス分子およびリボザイムは
、合成ポリヌクレオチドから構築され得る。代表的に、オリゴヌクレオチド合成
のホスホルアミダイト法が使用される。Beaucageら、Tet.Lett
.(1981)22:1859および米国特許第4,668,777号を参照の
こと。合成のための自動化装置が、この化学薬品を使用してオリゴヌクレオチド
を合成するために利用可能である。このような装置の例としては、Applie
d Biosystems a division of Perkin El
mer Corp.、Foster City、California,USA
によるBiosearch 8600.392および394型;ならびにPer
ceptive Biosystems、Framingham、Massac
husetts、USAによるExpediteが挙げられる。合成RNA、リ
ン酸アナログオリゴヌクレオチド、および化学的に誘導体化されたオリゴヌクレ
オチドがまた生成され得、そして他の分子に共有結合的に付着され得る。RNA
オリゴヌクレオチドが、例えば、RNAホスホルアミダイトを使用して合成され
得る。この方法は、Applied Biosystems、392および39
4型、Foster City、California USAのような自動化
合成器において行われ得る。
Identification of Function of Full-Length Gene Expression Product Ribozymes, antisense constructs, and dominant negative mutants were used to determine the function of expression products of genes corresponding to the polynucleotides provided herein. Can be used. These methods and compositions are particularly useful when the novel polynucleotides provided do not show significant and substantial homology to sequences encoding genes of known function. Antisense molecules and ribozymes can be constructed from synthetic polynucleotides. Typically, the phosphoramidite method of oligonucleotide synthesis is used. Beaucage et al., Tet. Lett
. (1981) 22: 1859 and U.S. Pat. No. 4,668,777. Automated equipment for synthesis is available to synthesize oligonucleotides using this chemical. An example of such a device is the Applie
d Biosystems a division of Perkin El
mer Corp. , Foster City, California, USA
Biosearch 8600.392 and 394; and Per.
cceptive Biosystems, Framingham, Massac
Husetts, Expedite by USA. Synthetic RNA, phosphate analog oligonucleotides, and chemically derivatized oligonucleotides can also be produced and covalently attached to other molecules. RNA
Oligonucleotides can be synthesized using, for example, RNA phosphoramidites. This method is described in Applied Biosystems, 392 and 39.
It can be performed in an automated synthesizer such as a Type 4, Foster City, California USA.

【0065】 ホスホロチオエートオリゴヌクレオチドもまた、アンチセンス構築のために合
成され得る。硫黄化試薬(例えば、アセトニトリル中のテトラエチルチウラム(
thiraum)ジスルフィド(TETD)が、室温で15分間以内でヌクレオ
チド間のシアノエチル亜リン酸エステルをホスホロチオエートトリエステルに変
換するために使用され得る。TETDは、インドール試薬を置換えるが、標準的
なホスホルアミダイト化学に使用される他の試薬は同じままである。このような
合成法は、例えば、Applied Biosystems、Model 39
2およびModel 394を使用して自動化され得る。
Phosphorothioate oligonucleotides can also be synthesized for antisense construction. Sulfuration reagents (eg, tetraethylthiuram in acetonitrile (
thiraum) disulfide (TETD) can be used to convert internucleotide cyanoethyl phosphites to phosphorothioate triesters within 15 minutes at room temperature. TETD replaces the indole reagent, but the other reagents used in standard phosphoramidite chemistry remain the same. Such a synthesis method is described, for example, in Applied Biosystems, Model 39.
2 and Model 394 can be used to automate.

【0066】 200ヌクレオチドまでの、より代表的に、100ヌクレオチド、より代表的
に50ヌクレオチド;さらにより代表的に30〜40ヌクレオチドのオリゴヌク
レオチドが合成され得る。これらの合成フラグメントは、より大きなフラグメン
トを構築するためにアニールされ得、そして一緒に連結され得る。例えば、Sa
mbrookら、前出を参照のこと。トランス切断化触媒RNA(リボザイム)
は、エンドヌクレアーゼ活性を保有するRNA分子である。リボザイムは、特定
の標的に対して特異的に設計され、そして標的メッセージは特異的なヌクレオチ
ド配列を含まなければならない。これらは、細胞性RNAの背景において、任意
のRNA種を部位特異的に切断するように操作される。切断事象は、mRNAを
不安定にし、そしてタンパク質発現を妨げる。重要なことに、リボザイムは、イ
ンビトロまたはインビボの状況における未知の機能を、表現型効果を検出するこ
とによって決定する目的のため、未知の機能の遺伝子の発現を阻害するために使
用され得る。1つの一般に使用されるリボザイムモチーフはハンマーヘッドであ
り、これについての基質配列要件は極わずかである。ハンマーヘッドリボザイム
の設計、ならびにリボザイムの治療学的使用は、Usmanら、Current
Opin.Struct.Biol.(1996)6:527において開示さ
れる。リボザイム(ヘパリン構造のリボザイムフラグメントを含む)の生成のた
めの方法、リボザイム特異性を増加する方法などは、当該分野において公知であ
る。
Oligonucleotides of up to 200 nucleotides, more typically 100 nucleotides, more typically 50 nucleotides; even more typically 30-40 nucleotides can be synthesized. These synthetic fragments can be annealed and ligated together to build larger fragments. For example, Sa
See mbrook et al., supra. Trans-cleaving catalytic RNA (ribozyme)
Is an RNA molecule that possesses endonuclease activity. Ribozymes are designed specifically for a particular target, and the target message must contain a specific nucleotide sequence. They are engineered to cleave any RNA species site-specifically in the background of cellular RNA. Cleavage events destabilize mRNA and prevent protein expression. Importantly, ribozymes can be used to inhibit the expression of genes of unknown function for the purpose of determining the unknown function in in vitro or in vivo situations by detecting phenotypic effects. One commonly used ribozyme motif is the hammerhead, for which the substrate sequence requirements are minimal. The design of hammerhead ribozymes, as well as therapeutic uses for ribozymes, is described by Usman et al., Current.
Opin. Struct. Biol. (1996) 6: 527. Methods for the production of ribozymes (including heparin-structured ribozyme fragments), methods of increasing ribozyme specificity, etc. are known in the art.

【0067】 リボザイムのハイブリダイズ領域は、HornおよびUrdea、Nucle
ic Acids Res.(1989)17:6959において記載されるよ
うに改変され得るか、または分岐化構造として調製され得る。リボザイムの基本
的な構造はまた、当業者によく知られる方法において化学的に変化され得、そし
て化学的に合成されたリボザイムは、モノマー単位によって改変される合成オリ
ゴヌクレオチド誘導体として投与され得る。治療学的状況において、リボザイム
のリポソーム媒介性の送達は、Birikhら、Eur.J.Biochem(
1997)245:1において記載されるように、細胞取込みを改善する。
The hybridizing region of ribozyme includes Horn and Urdea, Nucle.
ic Acids Res. (1989) 17: 6959, or prepared as a branched structure. The basic structure of ribozymes can also be chemically altered in methods well known to those skilled in the art, and chemically synthesized ribozymes can be administered as synthetic oligonucleotide derivatives modified by monomeric units. In the therapeutic setting, liposome-mediated delivery of ribozymes is described by Birikh et al., Eur. J. Biochem (
1997) 245: 1 to improve cell uptake.

【0068】 アンチセンス核酸は、RNAに特異的に結合するように設計され、RNA−D
NAまたはRNA−RNAハイブリッドの形成を生じ、DNAの複製、逆転写、
またはメッセンジャーRNAの翻訳の停止を伴う。選択されたポリヌクレオチド
配列に基づくアンチセンスポリヌクレオチドは、対応する遺伝子の発現を妨げ得
る。アンチセンスポリヌクレオチドは代表的に、転写された鎖としてアンチセン
ス鎖を含むアンチセンス構築物からの発現によって細胞内に作製される。開示さ
れるポリヌクレオチドに基づくアンチセンスポリヌクレオチドは、アンチセンス
ポリヌクレオチドに相補的な配列を含むmRNAを結合し、および/またはその
翻訳を妨げる。コントロール細胞およびアンチセンス構築物で処理された細胞の
発現産物は、そのアンチセンス構築物が基づくポリヌクレオチドに対応する遺伝
子のタンパク質産物を検出するために比較される。このタンパク質は、慣用的な
生化学的方法を使用して単離され、そして同定される。
Antisense nucleic acids are designed to specifically bind RNA, and RNA-D
Resulting in the formation of NA or RNA-RNA hybrids, DNA replication, reverse transcription,
Alternatively, the translation of messenger RNA is stopped. Antisense polynucleotides based on the selected polynucleotide sequence may interfere with expression of the corresponding gene. Antisense polynucleotides are typically made intracellularly by expression from an antisense construct containing the antisense strand as the transcribed strand. Antisense polynucleotides based on the disclosed polynucleotides bind and / or prevent the translation of mRNA containing sequences complementary to the antisense polynucleotide. The expression products of control cells and cells treated with the antisense construct are compared to detect the protein product of the gene corresponding to the polynucleotide on which the antisense construct is based. The protein is isolated and identified using conventional biochemical methods.

【0069】 広範な背景文献およびアンチセンス治療における臨床学的経験を考慮して、当
業者は、さらなる潜在的な治療薬として本発明の選択されたポリヌクレオチドを
使用し得る。ポリヌクレオチドの選択は、癌性細胞のゲノムの「ホットスポット
」領域への結合について、先ずそれらを試験することによって狭められ得る。ポ
リヌクレオチドが「ホットスポット」に結合するとして同定される場合、対応す
る癌細胞においてポリヌクレオチドをアンチセンス化合物として試験することが
望まれる。
Given the broad background literature and clinical experience in antisense therapy, one of skill in the art can use selected polynucleotides of the present invention as additional potential therapeutic agents. The choice of polynucleotides can be narrowed by first testing them for binding to "hot spot" regions of the cancerous cell's genome. If the polynucleotide is identified as binding to a "hot spot", it is desirable to test the polynucleotide as an antisense compound in the corresponding cancer cells.

【0070】 本明細書中に開示されるポリヌクレオチドに対応する遺伝子の機能を同定する
ための代替の方法として、ドミナントネガティブな変異が、ホモマルチマーとし
て活性である対応するタンパク質について容易に作製され得る。変異体ポリぺプ
チドは、野生型ポリぺプチド(他方の対立遺伝子から作製される)と相互作用し
、そして非機能的なマルチマーを形成する。従って、変異は、基質結合ドメイン
、触媒ドメイン、または細胞性局在化ドメインにおいてである。好ましくは、変
異体ポリぺプチドは過剰産生され得る。このような効果を有する点変異が作製さ
れる。さらに、タンパク質の末端に対して種々の長さの異なるポリぺプチドの機
能は、ドミナントネガティブな変異体を生じ得る。一般的なストラテジーが、ド
ミナントネガティブな変異体を作製するために利用可能である(例えば、Her
skowitz、Nature(1987)329:219を参照のこと)。こ
のような技術は、タンパク質の機能を決定するために有用である機能喪失の変異
を作製するために使用され得る。
As an alternative method for identifying the function of the genes corresponding to the polynucleotides disclosed herein, dominant negative mutations can be readily made for the corresponding proteins that are active as homomultimers. . The mutant polypeptide interacts with the wild-type polypeptide (made from the other allele) and forms a non-functional multimer. Thus, the mutation is in the substrate binding domain, catalytic domain, or cellular localization domain. Preferably, the mutant polypeptide may be overproduced. A point mutation having such an effect is produced. Moreover, the function of different peptides of varying lengths to the ends of the protein can give rise to dominant negative mutants. Common strategies are available to generate dominant negative mutants (eg Her.
Skowitz, Nature (1987) 329: 219). Such techniques can be used to create loss-of-function mutations that are useful for determining protein function.

【0071】 (ポリぺプチドおよびそれらの改変体) 本発明のポリぺプチドは、開示されるポリヌクレオチド、および開示されるポ
リヌクレオチドに対して、遺伝子コードの縮重のために、配列において同一でな
い核酸によってコードされるポリぺプチドを含む。従って、本発明は、配列番号
1〜1079のいずれかの配列を有するポリヌクレオチドまたはその改変体によ
ってコードされるポリぺプチドを本発明の範囲内に含む。
Polypeptides and Variants thereof The polypeptides of the invention are not identical in sequence to the disclosed polynucleotides and to the disclosed polynucleotides due to the degeneracy of the genetic code. It includes a polypeptide encoded by a nucleic acid. Therefore, the present invention includes, within the scope of the present invention, a polypeptide encoded by the polynucleotide having any one of SEQ ID NOs: 1 to 1079 or a variant thereof.

【0072】 一般に、本明細書中で使用されるように、用語「ポリぺプチド」は、示される
ポリヌクレオチドによってコードされる全長のポリぺプチド、示されるポリヌク
レオチドによって示される遺伝子によってコードされるポリぺプチドの両方、お
よびそれらの部分またはフラグメントをいう。「ポリぺプチド」はまた、天然に
存在するタンパク質の改変体を含み、ここではこのような改変体は、天然に存在
するタンパク質に相同であるかまたは実質的に類似し、そして天然に存在するタ
ンパク質と同じまたは異なる種(例えば、ヒト、マウス、または示されるポリぺ
プチドを天然に発現するいくつかの他の種、通常、哺乳動物種)の起源であり得
る。一般に、改変体ポリぺプチドは、上記のパラメーターを使用してBLAST 2.0によって測定されるように、本発明の異なって発現されるポリぺプチド
と、少なくとも約80%、通常少なくとも約90%、およびより通常少なくとも
約98%の配列同一性を有する配列を有する。改変体ポリぺプチドは、天然にグ
リコシル化されるか、または天然ではグリコシル化されない(すなわち、ポリぺ
プチドは、対応する天然に存在するタンパク質において見出されるグリコシル化
パターンとは異なるグリコシル化パターンを有する)。
In general, as used herein, the term "polypeptide" is encoded by the full-length polypeptide encoded by the indicated polynucleotide, the gene indicated by the indicated polynucleotide. Refers to both polypeptides, and parts or fragments thereof. "Polypeptide" also includes variants of naturally occurring proteins, where such variants are homologous or substantially similar to naturally occurring proteins and are naturally occurring. It can be of the same or different species as the protein (eg, human, mouse, or some other species that naturally expresses the indicated polypeptide, usually a mammalian species). In general, a variant polypeptide is at least about 80%, usually at least about 90% with the differentially expressed polypeptide of the invention as measured by BLAST 2.0 using the parameters described above. , And more usually, sequences having at least about 98% sequence identity. Variant polypeptides are naturally glycosylated or are not naturally glycosylated (ie, the polypeptides have a glycosylation pattern that differs from that found in the corresponding naturally occurring protein). ).

【0073】 本発明はまた、開示されたポリぺプチドのホモログ(またはそれらのフラグメ
ント)を含み、ここでこのホモログは、他の種(すなわち、他の動物または植物
種)から単離され、このようなホモログは通常、哺乳動物種(例えば、マウス、
ラットのようなげっ歯類:家畜(例えば、ウマ、ウシ、イヌ、ネコ);およびヒ
トである。「ホモログ」によって、上述で同定されるように特定の特異的に発現
されるタンパク質に対して少なくとも約35%、通常少なくとも約40%、およ
びより通常少なくとも約60%のアミノ酸配列同一性を有するポリぺプチドが意
味され、ここでは配列同一性は、前出に記載されるパラメーターを用いるBLA
ST 2.0アルゴリズムを使用して決定される。
The present invention also includes homologues (or fragments thereof) of the disclosed polypeptides, wherein the homologues are isolated from other species (ie, other animal or plant species), Such homologues are usually of mammalian species (eg, mouse,
Rodents such as rats: livestock (eg horses, cows, dogs, cats); and humans. By "homolog" is meant a polymorph having at least about 35%, usually at least about 40%, and more usually at least about 60% amino acid sequence identity to a particular specifically expressed protein as identified above. Peptide is meant where sequence identity is BLA using the parameters described above.
Determined using the ST 2.0 algorithm.

【0074】 一般に、本発明のポリぺプチドは、天然に存在しない環境において提供され、
例えば、それらの天然に存在する環境から分離されている。ある実施態様におい
て、本発明のタンパク質は、コントロールと比較して、そのタンパク質について
富化された組成物中に存在する。それ自体、精製されたポリぺプチドが提供され
、ここでは精製されたとは、タンパク質が非示差発現されたポリぺプチドが実質
的にない組成物中に存在することが意味され、ここで「実質的にない」とは、そ
の組成物の90%未満、通常60%未満、およびより通常50%未満が、非示差
発現されるポリぺプチドから構成されることを意味する。
Generally, the polypeptides of the invention are provided in non-naturally occurring environments,
For example, it is separated from their naturally occurring environment. In certain embodiments, the protein of the invention is present in a composition enriched for that protein as compared to a control. As such, a purified polypeptide is provided, wherein purified means that the protein is present in a composition that is substantially free of differentially expressed polypeptide, where "substantially" By "absent" is meant that less than 90%, usually less than 60%, and more usually less than 50% of the composition is composed of non-differentially expressed polypeptides.

【0075】 また本発明の範囲内にあるのは、改変体であり;ポリぺプチドの改変体は、変
異体、フラグメント、および融合物を含む。変異体は、アミノ酸の置換、付加、
または欠失を含む。アミノ酸の置換は、保存的なアミノ酸の置換、または非必須
アミノ酸を排除するための(例えば、グリコシル化部位、リン酸化部位、もしく
はアセチル化部位を変化するため)、または機能について必須ではない1つ以上
のシステイン残基の置換または欠失によって誤った折畳みを最小にするための置
換であり得る。保存的なアミノ酸の置換は、全体的な電荷、疎水性/親水性、お
よび/または置換されるアミノ酸の立体的なバルクを保存する置換である。改変
体は、タンパク質の特定の領域(例えば、機能的ドメインおよび/または、ポリ
ぺプチドがタンパク質ファミリーのメンバーである場合、コンセンサス配列と関
連する領域)の増強された生物学的活性を、保持するかまたは有するように設計
され得る。改変体の生成についてのアミノ酸変化の選択は、アミノ酸の接近可能
性(内部対外部)(例えば、Goら、Int.J.Peptide Prote
in Res.(1980)15:211を参照のこと)、改変体ポリぺプチド
の熱安定性(例えば、Querolら、Prot.Eng.(1996)9:2
65を参照のこと)、所望のグリコシル化部位(例えば、OlsenおよびTh
omsen、J.Gen.Microbiol.(1991)137:579を
参照のこと)、所望のジスルフィド架橋(例えば、Clarkeら、Bioch
emistry(1993)32:4322;およびWakarchukら、P
rotein Eng.(1994)7:1379を参照のこと)、所望の金属
結合部位(例えば、Tomaら、Biochemistry(1991)30:
97、およびHaezerbrouckら、Protein Eng.(199
3)6:643)、ならびにプロリンループ内での所望の置換(例えば、Mas
ulら、Appl.Env.Microbiol.(1994)60:3579
)に基づき得る。システイン涸渇されたムテインは、米国特許第4,959,3
14号において記載されるように生成され得る。
Also within the scope of the invention are variants; variants of polypeptides include variants, fragments and fusions. Variants include amino acid substitutions, additions,
Or includes a deletion. Amino acid substitutions may be conservative amino acid substitutions, or to eliminate non-essential amino acids (eg, to change glycosylation, phosphorylation, or acetylation sites), or one that is not essential for function. The substitution or deletion of the above cysteine residues may be a substitution for minimizing misfolding. Conservative amino acid substitutions are those that preserve the overall charge, hydrophobicity / hydrophilicity, and / or steric bulk of the amino acid being replaced. Variants retain the enhanced biological activity of specific regions of the protein (eg, functional domains and / or regions associated with the consensus sequence if the polypeptide is a member of the protein family). Or can be designed to have. The choice of amino acid changes for the generation of variants is based on the accessibility of the amino acids (internal vs. external) (eg Go et al. Int. J. Peptide Prote.
in Res. (1980) 15: 211), the thermal stability of variant polypeptides (eg, Querol et al., Prot. Eng. (1996) 9: 2).
65), the desired glycosylation site (eg Olsen and Th).
omsen, J .; Gen. Microbiol. (1991) 137: 579), the desired disulfide bridge (eg, Clarke et al., Bioch.
emissry (1993) 32: 4322; and Waarchuchuk et al., P.
protein Eng. (1994) 7: 1379), the desired metal binding site (eg, Toma et al., Biochemistry (1991) 30:
97, and Haezerbrook et al., Protein Eng. (199
3) 6: 643), as well as desired substitutions within the proline loop (eg Mas
ul et al., Appl. Env. Microbiol. (1994) 60: 3579.
) Can be based on. Cysteine-depleted muteins are described in US Pat. No. 4,959,3
It may be produced as described in No. 14.

【0076】 改変体はまた、本明細書中に開示されるポリぺプチドのフラグメント、特に生
物学的に活性なフラグメントおよび/または機能的ドメインに対応するフラグメ
ントを含む。目的のフラグメントは、代表的に、少なくとも約10アミノ酸長か
ら少なくとも約15アミノ酸長、通常少なくとも約50アミノ酸長であり、およ
び300アミノ酸長またはそれよりも長くあり得るが、通常約1000アミノ酸
長を超えず、ここではフラグメントは、任意の配列番号1〜1079の配列を有
するポリヌクレオチドまたはそれらのホモログによってコードされるポリぺプチ
ドに同一であるアミノ酸のストレッチを有する。本明細書中に記載されるタンパ
ク質改変体は、本発明の範囲内であるポリヌクレオチドによってコードされる。
遺伝子コードは、対応する改変体を構築するために適切なコドンを選択するため
に使用され得る。
Variants also include fragments of the polypeptides disclosed herein, particularly biologically active fragments and / or fragments corresponding to functional domains. Fragments of interest are typically at least about 10 amino acids in length to at least about 15 amino acids in length, usually at least about 50 amino acids in length, and can be 300 amino acids in length or longer, but usually more than about 1000 amino acids in length. No, here the fragment has a stretch of amino acids which is identical to the polypeptide encoded by a polynucleotide having the sequence of SEQ ID NO: 1-1079 or homologues thereof. The protein variants described herein are encoded by polynucleotides that are within the scope of the invention.
The genetic code can be used to select the appropriate codons to construct the corresponding variant.

【0077】 (コンピュータに関連する実施態様) 一般に、ポリヌクレオチドのライブラリーは、配列情報のコレクションであり
、その情報は、生化学的形態において(例えば、ポリヌクレオチド分子のコレク
ションとして)、または電気的形態において(例えば、コンピュータ読み出し可
能な形態で記憶されているポリぺプチドヌクレオチド配列のコレクションとして
、コンピュータシステムとして、および/またはコンピュータプログラムの部分
として)のいずれかで提供される。ポリヌクレオチドの配列情報は、例えば、遺
伝子発見のための資源として、選択された細胞型において発現される配列の表示
として(例えば、細胞型のマーカー)、および/または所与の疾患もしくは疾患
状態のマーカーとして、多様な方法において使用され得る。一般に、疾患マーカ
ーは、正常細胞(例えば、疾患によって実質的に影響されない同じまたは類似の
型の細胞)に比べて上昇されたまたは減少されたレベルのいずれかで、疾患によ
って影響される全ての細胞に存在する遺伝子産物の表示である。例えば、ライブ
ラリーにおけるポリヌクレオチド配列は、ポリヌクレオチドによってコードされ
るmRNA、ポリぺプチド、または他の遺伝子産物を示すポリヌクレオチドであ
り得、正常な(すなわち、実質的に疾患のない)乳房細胞に比べて、癌によって
影響される乳腺細胞(breast ductal cell)において過剰発
現されるかまたは抑制発現されるかのいずれかである。
Computer-Related Embodiments In general, a library of polynucleotides is a collection of sequence information, which information is in biochemical form (eg, as a collection of polynucleotide molecules), or electronically. Provided in any form (eg, as a collection of polypeptide nucleotide sequences stored in a computer-readable form, as a computer system, and / or as part of a computer program). Polynucleotide sequence information can be used, for example, as a resource for gene discovery, as an indication of the sequences expressed in the selected cell type (eg, a marker of the cell type), and / or for a given disease or disease state. As a marker, it can be used in a variety of ways. Generally, the disease marker is all cells affected by the disease, either at elevated or decreased levels relative to normal cells (eg, cells of the same or similar type that are not substantially affected by the disease). Is a representation of the gene product present in. For example, the polynucleotide sequence in the library can be a polynucleotide that represents the mRNA, polypeptide, or other gene product encoded by the polynucleotide, and is associated with normal (ie, substantially disease-free) breast cells. In comparison, it is either over-expressed or repressed in breast ductal cells affected by cancer.

【0078】 ライブラリーのヌクレオチド配列情報は、任意の適切な形態(例えば、電気的
形態または生化学的形態)において具現化され得る。例えば、電気的形態におい
て具現化される配列情報のライブラリーは、例えば、i)癌細胞と正常細胞との
間で;ii)癌細胞と形成異常細胞との間で;iii)癌細胞と癌以外の疾患ま
たは状態によって影響される細胞との間で;iv)転移性の癌細胞と正常細胞お
よび/もしくは非転移性の癌細胞との間で;v)悪性癌細胞と非悪性の癌細胞(
もしくは正常細胞)との間で、ならびに/またはvi)正常細胞に比較した形成
異常細胞で、示差発現される(例えば、過剰発現されるまたは抑制発現される)
遺伝子の代表的なヌクレオチド配列を含む、利用可能なコンピュータデータファ
イルを含む(または生化学的形態において、核酸分子のコレクション)。種々の
疾患または疾患の段階によって影響される細胞の他の組み合わせおよび比較は、
当業者に容易に明らかである。ライブラリーの生化学的実施態様は、ライブラリ
ー中に遺伝子の配列を有する核酸のコレクションを含み、ここでは核酸は、以下
により詳細に記載されるように、ライブラリー中の遺伝子全体またはそのフラグ
メントに対応し得る。
The nucleotide sequence information for the library may be embodied in any suitable form, such as electrical or biochemical form. For example, a library of sequence information embodied in electrical form is, for example, i) between cancer cells and normal cells; ii) between cancer cells and dysplastic cells; iii) cancer cells and cancer. Between cells affected by a disease or condition other than; iv) between metastatic cancer cells and normal and / or non-metastatic cancer cells; v) malignant and non-malignant cancer cells (
Or normal cells) and / or vi) dysplastic cells compared to normal cells are differentially expressed (eg, overexpressed or repressed).
Contains available computer data files (or collections of nucleic acid molecules in biochemical form) containing representative nucleotide sequences of genes. Other combinations and comparisons of cells affected by various diseases or stages of disease are
It will be readily apparent to one skilled in the art. The biochemical embodiment of the library comprises a collection of nucleic acids having the sequences of the genes in the library, wherein the nucleic acids are the entire genes in the library or fragments thereof, as described in more detail below. Can respond.

【0079】 本発明のポリヌクレオチドライブラリーは、一般に、複数のポリヌクレオチド
配列の配列情報を含み、ここでは少なくとも1つのポリヌクレオチドは、配列番
号1〜1079の任意の配列を有する。複数とは、少なくとも2つ、通常少なく
とも3つが意味され、そして配列番号1〜1079の全てまでを含み得る。ライ
ブラリー中のポリヌクレオチドの長さおよび数は、例えば、ライブラリーがオリ
ゴヌクレオチドアレイ、cDNAアレイ、配列情報のコンピュータデータベース
などであるかどうかで、ライブラリーの性質とともに変化する。
Polynucleotide libraries of the invention generally include sequence information for multiple polynucleotide sequences, wherein at least one polynucleotide has any of the sequences SEQ ID NOs: 1-1079. By plural is meant at least 2, usually at least 3, and can include all of SEQ ID NOS: 1-1079. The length and number of polynucleotides in a library will vary with the nature of the library, eg, whether the library is an oligonucleotide array, a cDNA array, a computer database of sequence information, etc.

【0080】 ライブラリーが電子ライブラリーである場合、核酸配列情報は、多様な媒体中
に存在し得る。「媒体」は、本発明の配列情報を含む、単離された核酸分子以外
の製造物をいう。このような製造物は、核酸中に存在するようには配列に直接適
用可能でない手段によって試験され得る形態において、ゲノム配列またはそのサ
ブセットを提供する。例えば、本発明のヌクレオチド配列、例えば、配列番号1
〜1079のポリヌクレオチドのいずれかの核酸配列は、コンピューター読み出
し可能な媒体、例えば、コンピュータによって直接的に読み取られおよびアクセ
スされ得る任意の媒体に記録され得る。このような媒体としては:磁気記憶媒体
(例えば、フロッピー(登録商標)ディスク、ハードディスク記憶媒体、および
磁気テープ):光記憶媒体(例えば、CD−ROM);電子記憶媒体(例えば、
RAMおよびROM);ならびにこれらのカテゴリーのハイブリッド(例えば、
磁気/光記憶媒体)が挙げられるが、これらに制限されない。当業者は、現在公
知の任意のコンピューター読み出し可能などのような媒体が、本発明の配列情報
の記録を含む製造物を作製するために使用され得るかを容易に理解し得る。「記
録される」とは、当該分野において公知であるような任意の方法を使用して、コ
ンピューター読み出し可能な媒体に情報を記憶するためのプロセスをいう。任意
の便利なデータ記憶構造が、記憶されている情報をアクセスするために使用され
る手段に基づいて選択され得る。多様なデータプロセッサープログラムおよびフ
ォーマットが、記憶のために使用され得る(例えば、ワードプロセッシングテキ
ストファイル、データベースフォーマットなど)。配列情報に加えて、本発明の
ライブラリーの電子バージョンは、他のコンピューター読み出し可能な情報およ
び/または他の型のコンピューター読み出し可能なファイル(例えば、検索可能
なファイル、実行可能なファイルなど、例えば、検索プログラムソフトウェアな
どを含むがこれに制限されない)と組合わせてまたはそれとともに提供され得る
When the library is an electronic library, nucleic acid sequence information can be present in a variety of media. "Media" refers to an article of manufacture other than an isolated nucleic acid molecule that contains the sequence information of the present invention. Such an article of manufacture provides a genomic sequence or a subset thereof in a form that can be tested by means that are not directly applicable to the sequence as it is present in a nucleic acid. For example, a nucleotide sequence of the invention, eg, SEQ ID NO: 1
The nucleic acid sequence of any of the 1079 polynucleotides can be recorded on a computer-readable medium, such as any medium that can be directly read and accessed by a computer. Such media include: magnetic storage media (eg, floppy disks, hard disk storage media, and magnetic tape): optical storage media (eg, CD-ROM); electronic storage media (eg,
RAM and ROM); and hybrids of these categories (eg,
Magnetic / optical storage media), but is not limited thereto. One of ordinary skill in the art can readily understand what any computer readable medium now known can be used to make the product containing the sequence information records of the invention. “Recorded” refers to the process of storing information on a computer-readable medium, using any method known in the art. Any convenient data storage structure may be selected based on the means used to access the stored information. A variety of data processor programs and formats can be used for storage (eg, word processing text files, database formats, etc.). In addition to sequence information, electronic versions of the libraries of the invention may contain other computer-readable information and / or other types of computer-readable files (eg, searchable files, executable files, etc., such as , Including, but not limited to, search program software, etc.).

【0081】 コンピューター読み出し可能な形態においてヌクレオチド配列を提供すること
によって、情報は多様な目的のためにアクセスされ得る。配列情報をアクセスす
るためのコンピュータソフトウェアは、公的に利用可能である。例えば、Syb
aseシステムにおけるギャップ化BLAST(Altschulら、Nucl
eic Acids Res.(1997)25:3389−3402)および
BLAZE(Brutlagら、Comp.Chem.(1993)17:20
3)検索アルゴリズムが、他の生物体からのオープンリーディングフレーム(O
RF)に対する相同性を含むゲノム内にORFを同定するために使用され得る。
By providing the nucleotide sequences in computer readable form, the information can be accessed for a variety of purposes. Computer software for accessing sequence information is publicly available. For example, Syb
gapped BLAST in the asase system (Altschul et al., Nucl
eic Acids Res. (1997) 25: 3389-3402) and BLAZE (Brutlag et al., Comp. Chem. (1993) 17:20.
3) The search algorithm uses open reading frames (O
Can be used to identify ORFs within the genome that contain homology to (RF).

【0082】 本明細書中で使用される場合、「コンピュータベースのシステム」は本発明の
ヌクレオチド配列情報を分析するために使用されるハードウェア手段、ソフトウ
ェア手段、およびデータ記憶手段をいう。本発明のコンピュータベースのシステ
ムの最小のハードウェアは、中央処理装置(CPU)、入力手段、出力手段、お
よびデータ記憶手段を備える。当業者は、現在利用可能なコンピュータベースの
システムのいずれか1つが、本発明における使用のために適切であることを容易
に理解し得る。データ記憶手段は、上記のような本発明の配列情報の記録を含む
任意の製造物、またはこのような製造物をアクセスし得るメモリアクセス手段を
含み得る。
As used herein, "computer-based system" refers to the hardware means, software means, and data storage means used to analyze the nucleotide sequence information of the present invention. The minimum hardware of the computer-based system of the present invention comprises a central processing unit (CPU), input means, output means, and data storage means. One of ordinary skill in the art can readily appreciate that any one of the currently available computer-based systems is suitable for use in the present invention. The data storage means may include any product containing a record of the sequence information of the invention as described above, or memory access means capable of accessing such a product.

【0083】 「検索手段」とは、標的配列もしくは標的構造モチーフ、またはサンプル中の
ポリヌクレオチドの発現レベルを、記憶されている配列情報と比較するための、
コンピュータベースのシステムにおいて実行される1つ以上のプログラムをいう
。検索手段は、特定の標的配列または標的モチーフを一致するゲノムのフラグメ
ントまたは領域を同定するために使用され得る。多様な公知のアルゴリズムが、
公的に公知であり、および市販されている(例えば、MacPattern(E
MBL)、BLASTN、およびBLASTX(NCBI))。「標的配列」は
、任意のポリヌクレオチド、または6個以上の連続するヌクレオチドのアミノ酸
配列、または2つ以上のアミノ酸、好ましくは約10〜100個のアミノ酸、も
しくは約30〜300ヌクレオチドであり得る。多様な比較手段を使用して、デ
ーター記憶手段を用いる、サンプルからの配列情報の比較を達成し得る(例えば
、標的配列、標的モチーフ、または相対的な発現レベルを分析し得る)。当業者
は、公的に利用可能な相同性検索プログラムのいずれか一つが、標的配列および
モチーフの比較を達成するために、本発明のコンピュータベースのシステムにつ
いての検索手段として使用され得ることを容易に認識し得る。サンプル中および
コントロール中の発現レベルを分析するためのコンピュータプログラムもまた、
当該分野において公知である。
A “search tool” is a means for comparing the expression level of a target sequence or target structural motif, or a polynucleotide in a sample, with stored sequence information.
Refers to one or more programs executed in a computer-based system. Search means can be used to identify fragments or regions of the genome that match a particular target sequence or target motif. A variety of known algorithms
Publicly known and commercially available (eg MacPattern (E
MBL), BLASTN, and BLASTX (NCBI)). A "target sequence" can be any polynucleotide, or amino acid sequence of 6 or more contiguous nucleotides, or 2 or more amino acids, preferably about 10-100 amino acids, or about 30-300 nucleotides. A variety of comparison means can be used to achieve comparison of sequence information from a sample using data storage means (eg, analyzing target sequences, target motifs, or relative expression levels). One of skill in the art will readily appreciate that any one of the publicly available homology search programs can be used as a search tool for the computer-based systems of the present invention to achieve target sequence and motif comparisons. Can be recognized. Computer programs for analyzing expression levels in samples and controls also
Are known in the art.

【0084】 「標的構造モチーフ」または「標的モチーフ」は、合理的に選択される配列い
ずれかまたは配列の組合せのいずれかをいい、ここで配列は、標的モチーフの折
畳みの際に形成される三次元高次構造に基づいて、もしくは調節部位もしくは活
性部位のコンセンサス配列に基づいて選択される。多様な標的モチーフが当該分
野で公知である。タンパク質標的モチーフは、酵素活性部位およびシグナル配列
を含むが、これらに制限されない。核酸標的モチーフは、ヘパリン構造、プロモ
ーター配列、および転写因子についての結合部位のような他の発現エレメントを
含むが、これらに制限されない。
“Target structural motif” or “target motif” refers to any rationally selected sequence or combination of sequences, where a sequence is a tertiary form formed upon folding of the target motif. Selection is based on original conformation or on the consensus sequence of regulatory or active sites. A wide variety of target motifs are known in the art. Protein target motifs include, but are not limited to, enzyme active sites and signal sequences. Nucleic acid target motifs include, but are not limited to, heparin structures, promoter sequences, and other expression elements such as binding sites for transcription factors.

【0085】 入力および出力手段についての多様な構造フォーマットが、本発明のコンピュ
ータベースのシステムにおいて情報を入力および出力するために使用され得る。
出力手段についての1つのフォーマットは、異なるポリヌクレオチドの相対的な
発現レベルを評価する。このような提示は、当業者に遺伝子発現プロフィールを
決定するための相対的な発現レベルの格付を提供する。
A variety of structural formats for input and output means can be used to input and output information in the computer-based system of the present invention.
One format for the output means assesses the relative expression levels of different polynucleotides. Such a presentation provides one of skill in the art with a relative expression level rating for determining gene expression profiles.

【0086】 上述で考察されるように、本発明の「ライブラリー」はまた、配列番号1〜1
079のポリヌクレオチドの生化学的ライブラリー(例えば、提供されるポリヌ
クレオチドを表す核酸のコレクション)を含む。生化学的ライブラリーは、種々
の形態(例えば、cDNAの溶液、固体支持体の表面と安定に会合されるプロー
ブ核酸のパターン(すなわち、アレイ)など)を採り得る。特に重要なのは、配
列番号1〜1079の1つ以上がアレイにおいて表される核酸アレイである。ア
レイによって、基板の表面の1つに少なくとも2つの異なる核酸標的を有する、
少なくとも1つの基板を有する製造物の物品が意味され、ここでは異なる核酸の
数が、かなり高くあり得、代表的に少なくとも10ヌクレオチド、通常少なくと
も20ヌクレオチド、およびしばしば少なくとも25ヌクレオチドであり得る。
多様な異なるアレイフォーマットが開発され、および当業者に公知である。本発
明のアレイは、多様な適用(上記に列挙される例示的な特許文書において開示さ
れるような、遺伝子発現分析、薬物スクリーニング、変異分析などを含む)にお
ける使用を見出す。
As discussed above, “libraries” of the invention also include SEQ ID NOs: 1-1.
A biochemical library of 079 polynucleotides (eg, a collection of nucleic acids representing the provided polynucleotides). Biochemical libraries can take a variety of forms, such as solutions of cDNA, patterns of probe nucleic acids that are stably associated with the surface of a solid support (ie, arrays), and the like. Of particular interest are nucleic acid arrays in which one or more of SEQ ID NOS: 1-1079 is represented in an array. The array has at least two different nucleic acid targets on one of the surfaces of the substrate,
By article of manufacture having at least one substrate is meant here the number of different nucleic acids can be quite high, typically at least 10 nucleotides, usually at least 20 nucleotides and often at least 25 nucleotides.
A wide variety of different array formats have been developed and are known to those of skill in the art. The arrays of the invention find use in a variety of applications, including gene expression analysis, drug screening, mutation analysis, etc., as disclosed in the exemplary patent documents listed above.

【0087】 上述の核酸ライブラリーに加えて、ポリぺプチドのアナログライブラリーがま
た提供され、ここではライブラリーのポリぺプチドは、配列番号1〜1079に
よってコードされるポリぺプチドの少なくとも一部を表す。
In addition to the nucleic acid libraries described above, analog libraries of polypeptides are also provided, wherein the polypeptides of the library are at least a portion of the polypeptides encoded by SEQ ID NOs: 1-1079. Represents

【0088】 (有用性) (マッピングおよび組織プロフィール作成におけるポリヌクレオチドプローブ
の使用) ポリヌクレオチドプローブは、一般に、配列表において示されるようなポリヌ
クレオチドの少なくとも12の連続するヌクレオチドを含み、多様な目的(例え
ば、ポリヌクレオチドの染色体マッピング、および転写レベルの検出)ために使
用される。開示されるポリヌクレオチド配列の好ましい領域についてのさらなる
開示は、実施例において見出される。本明細書中に開示されるポリヌクレオチド
に特異的にハイブリダイズするプローブは、他の非関連の配列を用いて提供され
るバックグラウンドハイブリダイゼーションよりも少なくとも5、10、または
20倍高い検出シグナル伝達を提供するべきである。
Utility Uses of Polynucleotide Probes in Mapping and Tissue Profiling Polynucleotide probes generally comprise at least 12 contiguous nucleotides of a polynucleotide as shown in the Sequence Listing, for a variety of purposes ( For example, chromosomal mapping of polynucleotides and detection of transcription levels). Further disclosure of preferred regions of the disclosed polynucleotide sequences can be found in the examples. Probes that specifically hybridize to the polynucleotides disclosed herein have at least 5, 10, or 20-fold higher detection signaling than background hybridization provided with other unrelated sequences. Should be provided.

【0089】 (発現レベルの検出) ヌクレオチドプローブが、提供されるポリヌクレオチ
ドに対応する遺伝子の発現を検出するために使用される。ノーザンブロットにお
いて、mRNAは、電気泳動的に分離され、そしてプローブと接触される。プロ
ーブは特定の大きさのmRNA種にハイブリダイズすることで検出される。ハイ
ブリダイゼーションの量は、例えば、特定の条件下での発現の相対的な量を検出
するために定量される。プローブは、発現を検出するために、細胞へのインサイ
チュハイブリダイゼーションに使用される。プローブはまた、ハイブリダイズす
る配列の診断的検出のために、インビボで使用され得る。プローブは代表的に、
放射性同位体で標識される。検出可能な標識の他の型が使用され得る(例えば、
発色団、蛍光体、および酵素)。ヌクレオチドハイブリダイゼーションアッセイ
の他の例は、WO92/02526および米国特許第5,124,246号にお
いて記載される。
Detection of Expression Level Nucleotide probes are used to detect expression of the gene corresponding to the provided polynucleotides. In Northern blots, mRNA is electrophoretically separated and contacted with the probe. The probe is detected by hybridizing to a particular size mRNA species. The amount of hybridization is quantified, for example, to detect the relative amount of expression under particular conditions. The probe is used for in situ hybridization to cells to detect expression. The probe can also be used in vivo for diagnostic detection of hybridizing sequences. The probe is typically
It is labeled with a radioactive isotope. Other types of detectable labels can be used (eg,
Chromophores, fluorophores, and enzymes). Other examples of nucleotide hybridization assays are described in WO92 / 02526 and US Pat. No. 5,124,246.

【0090】 あるいは、ポリメラーゼ連鎖反応(PCR)は、小量の標的核酸を検出するた
めの別の手段である(例えば、Mullisら、Meth.Enzymol.(
1987)155:335;米国特許第4,683,195号;および米国特許
第4,683,202号を参照のこと)。標的核酸とハイブリダイズする2つの
プライマーポリヌクレオチドヌクレオチドが、反応を開始するために使用される
。このプライマーは、配列表のポリヌクレオチド内の、またはそれに対して3’
および5’の配列から構成され得る。あるいは、プライマーが、これらのポリヌ
クレオチドに対する3’および5’である場合、これらは、ポリヌクレオチドま
たは相補体にハイブリダイズする必要はない。熱安定性ポリメラーゼでの標的の
増幅後、増幅された標的核酸は、当該分野において公知の方法(例えば、サザン
ブロット)によって検出され得る。mRNAまたはcDNAはまた、Sambr
ookら、「Molecular Cloning:A Laboratory
Manual」(New York,Cold Spring Harbor
Laboratory、1989)において記載される伝統的なブロッティン
グ技術(例えば、サザンブロット、ノーザンブロットなど)(例えば、PCR増
幅を伴わない)によって検出され得る。一般に、mRNA、またはポリメラーゼ
酵素を使用してmRNAから作製されるcDNAは、ゲル電気泳動を使用して精
製および分離され得、そしてニトロセルロースのような固体支持体に移される。
固体支持体は、標識化プローブに曝露され、洗浄して任意の未ハイブリダイズの
プローブを除去され、そして標識化プローブを含む2重鎖が検出される。
Alternatively, the polymerase chain reaction (PCR) is another means for detecting small amounts of target nucleic acid (eg, Mullis et al., Meth. Enzymol.
1987) 155: 335; U.S. Pat. No. 4,683,195; and U.S. Pat. No. 4,683,202). Two primer polynucleotides that hybridize to the target nucleic acid are used to initiate the reaction. This primer is 3'to or within the polynucleotide of the sequence listing.
And the 5'sequence. Alternatively, if the primers are 3'and 5'to these polynucleotides, then they need not hybridize to the polynucleotides or complements. After amplification of the target with a thermostable polymerase, the amplified target nucleic acid can be detected by methods known in the art (eg, Southern blot). mRNA or cDNA is also Sambr
Look et al., “Molecular Cloning: A Laboratory”.
Manual "(New York, Cold Spring Harbor)
It can be detected by traditional blotting techniques (eg, Southern blot, Northern blot, etc.) described in Laboratory, 1989) (eg, without PCR amplification). In general, mRNA, or cDNA made from mRNA using polymerase enzyme, can be purified and separated using gel electrophoresis and transferred to a solid support such as nitrocellulose.
The solid support is exposed to a labeled probe, washed to remove any unhybridized probe, and the duplex containing the labeled probe is detected.

【0091】 (マッピング) 本発明のポリヌクレオチドは、対応する遺伝子が存在する染
色体を同定するために使用され得る。このようなマッピングは、公知の機能を有
する他の遺伝子へのその近位性により、ポリヌクレオチド関連性遺伝子の機能を
同定するのに有用であり得る。機能はまた、特定の症候群または疾患が同じ染色
体上にマップされる場合、そのポリヌクレオチド関連性遺伝子に割り当てられ得
る。例えば、核酸配列異常の同定および定量におけるポリヌクレオチドプローブ
の使用は、米国特許第5,783,387号において記載される。例示的なマッ
ピング法は、蛍光インサイチュハイブリダイゼーション(FISH)であり、こ
れは相対的なコピー数のDNAにおける変化の全体的なゲノム評価を可能にする
ための、比較のゲノムハイブリダイゼーションを容易にする(例えば、Vald
esら、Methods in Molecular Biology(199
7)68:1を参照のこと)。ポリヌクレオチドはまた、例えば、放射ハイブリ
ッドまたは染色体特異的ハイブリッドパネルを使用して、特定の染色体にマッピ
ングされ得る。Leachら、Advances in Genetics,(
1995)33:63−99;Walterら、Nature Genetic
s(1994)7:22;WalterおよびGoodfellow、Tren
ds in Genetics(1992)9:352を参照のこと。放射ハイ
ブリッドマッピングについてのパネルは、Research Genetics
、Inc.、Huntsville、Alabama、USAから入手可能であ
る。種々のパネルを使用するマーカーのデータベースは、http:/F/sh
gc−www.stanford.edu;およびhttp://www−ge
nome.wi.mit.edu/cgi−bin/contig/rhmap
per.plにてインターネットを介して利用可能である。統計学的プログラム
RHMAPは、ある順序に対する別の順序の相対的な尤度の測定とともに、放射
ハイブリダイゼーションからのデータに基づいてマップを構築するために使用さ
れ得る。RHMAPは、http//www.sph.umich.edu/g
roup/statgen/softwareにてインターネットを介して入手
可能である。さらに、癌のような疾患と一般に関連する染色体の領域を同定する
ための市販のプログラムが利用可能である。
Mapping The polynucleotides of the invention can be used to identify the chromosome where the corresponding gene resides. Such a mapping may be useful in identifying the function of a polynucleotide-related gene by virtue of its proximity to other genes of known function. Function can also be assigned to the polynucleotide-related gene if the particular syndrome or disease maps on the same chromosome. For example, the use of polynucleotide probes in the identification and quantification of nucleic acid sequence abnormalities is described in US Pat. No. 5,783,387. An exemplary mapping method is Fluorescence In Situ Hybridization (FISH), which facilitates comparative genomic hybridization to allow global genomic evaluation of changes in relative copy number DNA. (For example, Vald
es et al., Methods in Molecular Biology (199).
7) 68: 1)). Polynucleotides can also be mapped to specific chromosomes using, for example, radial hybrids or chromosome-specific hybrid panels. Leach et al., Advances in Genetics, (
1995) 33: 63-99; Walter et al., Nature Genetic.
s (1994) 7:22; Walter and Goodfellow, Tren.
See ds in Genetics (1992) 9: 352. Panel on Radiative Hybrid Mapping, Research Genetics
, Inc. , Huntsville, Alabama, USA. A database of markers using various panels is available at http: // F / sh
gc-www. stanford. edu; and http: // www-ge
nome. wi. mit. edu / cgi-bin / contig / rhmap
per. Pl is available via the internet. The statistical program RHMAP can be used to build a map based on data from radiohybridization, along with a measure of the relative likelihood of one order relative to another. RHMAP can be found at http: // www. sph. umich. edu / g
It is available via the internet at group / statgen / software. In addition, commercially available programs are available for identifying regions of the chromosome that are commonly associated with diseases such as cancer.

【0092】 (組織タイピングまたはプロフィーリング) 提供されたポリヌクレオチドに
対応する特異的なmRNAの発現は、異なる細胞型において変化し得、そして組
織特異的であり得る。異なる細胞型におけるmRNAレベルのこの変化は、組織
型を決定するための核酸プローブアッセイを用いて活用され得る。例えば、配列
表において列挙されるポリヌクレオチドに実質的に同一のまたは相補的な核酸プ
ローブを利用する、PCR、分枝型(branched)DNAプローブアッセ
イ、またはブロッティング技術は、対応するcDNAまたはmRNAの存在また
は不在を決定し得る。
Tissue Typing or Profiling The expression of specific mRNA corresponding to a provided polynucleotide can be altered in different cell types and can be tissue specific. This change in mRNA levels in different cell types can be exploited using nucleic acid probe assays to determine tissue type. For example, PCR, a branched DNA probe assay, or a blotting technique that utilizes nucleic acid probes that are substantially identical or complementary to the polynucleotides listed in the Sequence Listing is used to determine the presence of the corresponding cDNA or mRNA. Or the absence may be determined.

【0093】 組織タイピングは、転移性病変の発生的な器官または組織供給源を、その器官
または組織の特定のマーカーの発現を同定することによって、同定するために使
用される。ポリヌクレオチドが、特異的な組織型においてのみ発現される場合、
および転移性病変がそのポリヌクレオチドを発現することが見出される場合、病
変の発生的な供給源が同定された。特定のポリヌクレオチドの発現は、対応する
mRNAまたはタンパク質産物のいずれかの検出によってアッセイされ得る。任
意の法医学者に容易に明らかであるように、本明細書中に開示される配列は、非
ヒト組織からヒト組織を区別するにおいて有用である。特に、これらの配列は、
例えば、鳥類、爬虫類、および両生類の組織からヒト組織を区別するために有用
である。
Tissue typing is used to identify the developing organ or tissue source of metastatic lesions by identifying the expression of specific markers of that organ or tissue. When the polynucleotide is expressed only in a specific tissue type,
And when a metastatic lesion was found to express the polynucleotide, a developmental source of the lesion was identified. Expression of a particular polynucleotide can be assayed by detection of either the corresponding mRNA or protein product. As will be readily apparent to any forensic practitioner, the sequences disclosed herein are useful in distinguishing human from non-human tissue. In particular, these sequences
For example, it is useful for distinguishing human tissue from avian, reptile, and amphibian tissues.

【0094】 (多型の使用) 本発明のポリヌクレオチドは、法医学的分析、遺伝子分析、
マッピング、および診断的適用において使用され得、ここでは遺伝子の対応する
領域は、ヒト集団における多型である。遺伝子における多型を検出するための任
意の手段が使用され得、タンパク質多型改変体の電気泳動、制限酵素切断に対す
る示差的な感受性、および対立遺伝子特異的プローブへのハイブリダイゼーショ
ンが挙げられるが、これらに制限されない。
(Use of Polymorphism) The polynucleotide of the present invention can be used for forensic analysis, genetic analysis,
It can be used in mapping and diagnostic applications, where the corresponding region of the gene is a polymorphism in the human population. Any means for detecting polymorphisms in a gene can be used, including electrophoresis of protein polymorphism variants, differential sensitivity to restriction enzyme cleavage, and hybridization to allele-specific probes, It is not limited to these.

【0095】 (抗体産生) 本発明のポリヌクレオチド、および対応するmRNA、cDNA、または完全
な遺伝子の発現産物が調製され、そして実験的な、診断的な、および治療学的な
目的のために抗体を惹起するために使用され得る。対応する遺伝子が割り当てら
れていないポリヌクレオチドについて、これは対応する遺伝子を同定するための
さらなる方法を提供する。ポリヌクレオチドまたは関連のcDNAは上記のよう
に発現され、そして抗体が調製される。これらの抗体は、ポリヌクレオチドによ
ってコードされるポリぺプチド上のエピトープに特異的であり、そして細胞もし
くは組織調製物において、またはインビトロ発現系の無細胞抽出物において、対
応するネイティブなタンパク質を沈澱し得るか、またはこれに結合し得る。
Antibody Production The expression products of the polynucleotides of the invention and the corresponding mRNAs, cDNAs, or complete genes have been prepared and used for experimental, diagnostic, and therapeutic purposes. Can be used to trigger For polynucleotides to which the corresponding gene has not been assigned, this provides an additional method for identifying the corresponding gene. The polynucleotide or related cDNA is expressed and antibodies are prepared as described above. These antibodies are specific for an epitope on the polypeptide encoded by the polynucleotide and precipitate the corresponding native protein in cell or tissue preparations or in cell-free extracts of in vitro expression systems. Can be obtained or bound to it.

【0096】 選択された抗原に特異的に結合する抗体の産生のための方法は、当該分野にお
いて周知である。抗体を惹起するための免疫原は、本発明のポリヌクレオチドに
よってコードされるポリぺプチドをアジュバントともに混合することによって、
および/またはより大きな免疫原性タンパク質との融合タンパク質を作製するこ
とによって調製され得る。ポリぺプチドはまた、他のより大きな免疫原性タンパ
ク質(例えば、キーホールリンペットヘモシアニン)に共有結合的に連結され得
る。免疫原は典型的に、抗体を生成するために、皮内、皮下、または筋肉内で、
実験動物(例えば、ウサギ、ヒツジ、およびマウス)に投与される。モノクロー
ナル抗体は、脾細胞を単離し、骨髄腫細胞を融合してハイブリドーマを形成する
ことによって作製され得る。あるいは、選択されたポリヌクレオチドが、例えば
、筋肉内注射によって直接的に投与され、そしてインビボで発現される。発現さ
れるタンパク質は、種々のタンパク質特異的免疫応答(抗体の産生を含む)を生
成し、これは、タンパク質の投与に匹敵する。
Methods for the production of antibodies that specifically bind a selected antigen are well known in the art. An immunogen for raising antibodies is prepared by mixing the polypeptide encoded by the polynucleotide of the present invention with an adjuvant.
And / or can be prepared by making a fusion protein with a larger immunogenic protein. Polypeptides can also be covalently linked to other larger immunogenic proteins such as keyhole limpet hemocyanin. Immunogens are typically intradermal, subcutaneous, or intramuscular to produce antibodies,
It is administered to laboratory animals such as rabbits, sheep, and mice. Monoclonal antibodies can be made by isolating splenocytes and fusing myeloma cells to form hybridomas. Alternatively, the selected polynucleotide is directly administered and expressed in vivo, for example, by intramuscular injection. The expressed protein produces a variety of protein-specific immune responses, including the production of antibodies, which is comparable to administration of the protein.

【0097】 選択されたポリヌクレオチドによってコードされるポリぺプチドに特異的なポ
リクローナル抗体およびモノクローナル抗体の調製は、当該分野において公知の
標準的な方法を使用して作製される。抗体は、配列表において開示されるポリヌ
クレオチドによってコードされるポリぺプチドに存在するエピトープに特異的に
結合する。典型的に、少なくとも6、8、10、または12の連続するアミノ酸
がエピトープを形成するために必要とされる。連続しないアミノ酸を含むエピト
ープは、より長いポリぺプチド(例えば、少なくとも15、25、または50ア
ミノ酸)を必要とし得る。提供されるポリぺプチドによってコードされるヒトポ
リぺプチドに特異的に結合する抗体は、ウェスタンブロットまたは他の免疫化学
的アッセイにおいて使用される場合、他のタンパク質を用いて提供される検出シ
グナルよりも少なくとも5、10、または20倍高い検出シグナルを提供するべ
きである。好ましくは、本発明のポリぺプチドに特異的な抗体は、免疫化学アッ
セイにおいて、検出可能なレベルで他のタンパク質に結合せず、そして特定のポ
リぺプチドを溶液から免疫沈降し得る。
Preparation of polyclonal and monoclonal antibodies specific for the polypeptides encoded by the selected polynucleotides is made using standard methods known in the art. The antibody specifically binds to an epitope present on the polypeptide encoded by the polynucleotide disclosed in the Sequence Listing. Typically, at least 6, 8, 10, or 12 contiguous amino acids are required to form the epitope. Epitopes containing non-contiguous amino acids may require longer polypeptides (eg, at least 15, 25, or 50 amino acids). Antibodies that specifically bind to human polypeptides encoded by provided polypeptides, when used in Western blots or other immunochemical assays, are more likely than detection signals provided with other proteins. It should provide at least 5, 10, or 20 times higher detection signal. Preferably, antibodies specific for the polypeptides of the invention do not bind detectable levels to other proteins in immunochemical assays and are capable of immunoprecipitating certain polypeptides from solution.

【0098】 本発明はまた、本発明のポリぺプチドに特異的な天然に存在する抗体を意図す
る。例えば、ヒト集団中の本発明のポリぺプチドに対する血清抗体は、当該分野
において周知の方法によって、例えば、対応する選択されるポリぺプチドまたは
融合タンパク質が結合されるカラムに抗血清を通すことによって、精製され得る
。次いで結合された抗体は、例えば、高塩濃度を有する緩衝液を使用して、カラ
ムから溶出され得る。
The present invention also contemplates naturally occurring antibodies specific for the polypeptides of the present invention. For example, serum antibodies to polypeptides of the invention in the human population can be obtained by methods well known in the art, for example by passing the antiserum through a column to which the corresponding selected polypeptide or fusion protein is bound. , Can be purified. The bound antibody can then be eluted from the column using, for example, a buffer having a high salt concentration.

【0099】 上述で考察される抗体に加えて、本発明はまた、当該分野において周知の方法
に従う、遺伝子操作された抗体、抗体誘導体(例えば、単鎖抗体、抗体フラグメ
ント(例えば、Fabなど))を意図する。
In addition to the antibodies discussed above, the present invention also includes genetically engineered antibodies, antibody derivatives (eg, single chain antibodies, antibody fragments (eg, Fab, etc.)) according to methods well known in the art. Intended.

【0100】 (診断のためのポリヌクレオチドまたはアレイ) ポリヌクレオチドアレイは、サンプル中の非常に多くのポリヌクレオチド配列
をアッセイし得る高処理量の技術を提供する。この技術は、診断として、および
示差的発現を試験するための道具として、例えば、コードされるタンパク質の機
能を決定するために使用され得る。アレイは、結合されるプローブを有する二次
元マトリクスまたはアレイにおいて、基材(例えば、ガラス、ニトロセルロース
など)上にポリヌクレオチドプローブをスポットすることによって作製され得る
。プローブは、共有結合によって、または非特異的な相互作用(例えば、疎水性
相互作用)によってのいずれかによって基材に結合され得る。ポリヌクレオチド
のサンプルは、検出可能に標識され得(例えば、放射性標識または蛍光標識を使
用して)、次いでプローブにハイブリダイズされ得る。二本鎖ポリヌクレオチド
は、プローブポリヌクレオチドに結合される標識されたサンプルポリヌクレオチ
ドを含み、一旦、サンプルの未結合の部分が洗浄して除かれると検出され得る。
アレイを構築するための技術、およびこれらのアレイを使用する方法は、EP7
99,897;WO97/29212;WO97/27317;EP785,2
80;WO97/02357:米国特許第5,593,839号;米国特許第5
,578,832号;EP728,520;米国特許第5,599,695号;
EP721 016;米国特許第5,556,752号;WO95/22058
;および米国特許第5,631,734号において記載される。アレイは、例え
ば、遺伝子の示差的発現を試験するために使用され得、そして遺伝子機能を決定
するために使用され得る。例えば、アレイは、試験細胞とコントロール細胞との
(例えば、癌細胞と正常細胞との)間のポリヌクレオチドの示差的発現を検出す
るために使用され得る。例えば、癌細胞における特定のメッセージの高い発現は
、対応する正常細胞において観察されず、癌特異的遺伝子産物を示し得る。アレ
イの例示的な使用はさらに、例えば、Pappalaradoら、Sem.Ra
diation Oncol.(1998)8:217;およびRamsay
Nature Biotechnol.(1998)16:40において記載さ
れる。
Polynucleotides or Arrays for Diagnostic Polynucleotide arrays provide a high throughput technique by which a large number of polynucleotide sequences in a sample can be assayed. This technique can be used as a diagnostic and as a tool for testing differential expression, eg, to determine the function of the encoded protein. Arrays can be made by spotting polynucleotide probes on a substrate (eg, glass, nitrocellulose, etc.) in a two-dimensional matrix or array with the probes attached. The probe can be bound to the substrate either by covalent bonding or by non-specific interactions (eg, hydrophobic interactions). A sample of polynucleotides can be detectably labeled (eg, using a radioactive or fluorescent label) and then hybridized to the probe. The double-stranded polynucleotide comprises a labeled sample polynucleotide bound to a probe polynucleotide and can be detected once the unbound portion of the sample has been washed away.
Techniques for constructing arrays, and methods of using these arrays are described in EP7.
99,897; WO97 / 29212; WO97 / 27317; EP785,2.
80; WO97 / 02357: US Patent No. 5,593,839; US Patent No. 5
, 578,832; EP 728,520; U.S. Pat. No. 5,599,695;
EP 721 016; US Pat. No. 5,556,752; WO95 / 22058.
And US Pat. No. 5,631,734. Arrays can be used, for example, to test the differential expression of genes and to determine gene function. For example, the array can be used to detect differential expression of polynucleotides between test cells and control cells (eg, cancer cells and normal cells). For example, high expression of a particular message in cancer cells may not be observed in the corresponding normal cells, indicating a cancer-specific gene product. Exemplary uses of arrays are further described, for example, in Papalarado et al., Sem. Ra
direction Oncol. (1998) 8: 217; and Ramsay.
Nature Biotechnol. (1998) 16:40.

【0101】 (診断における示差的な発現) 本発明のポリヌクレオチドはまた、例えば、ヒトにおける異常なまたは罹患し
た組織を同定するための方法として、2つの細胞間の発現レベルにおける差異を
検出するために使用され得る。タンパク質ファミリーのプロフィールに対応する
ポリヌクレオチドについて、組織の選択は、推定の生化学的機能に従って選択さ
れ得る。一般に、特異的なポリヌクレオチドに対応する遺伝子の発現は、ヒトの
、罹患したことが疑われる第1の組織と、第2の正常な組織との間で比較される
。異常であることまたは罹患したことが疑われる組織は、ヒトの異なる組織型に
由来し得るが、好ましくはこれは、同じ組織型に由来し;例えば、腸ポリープま
たは他の異常な増殖は、正常な腸組織と比較されるべきである。正常な組織は、
試験サンプルの組織と同じ組織、または患者の任意の正常な組織、特に目的のポ
リヌクレオチド関連遺伝子を発現する組織(例えば、脳、胸腺、精巣、心臓、前
立腺、胎盤、脾臓、小腸、骨格筋、膵臓、および結腸の粘膜内層)であり得る。
例えば、分子量、アミノ酸配列もしくはヌクレオチド配列、または相対的量にお
いて比較される2つの組織におけるポリヌクレオチド関連遺伝子、mRNA、ま
たはタンパク質の間の差異は、罹患したことが疑われるヒトの組織における、遺
伝子、または遺伝子を調節する遺伝子の変化を示す。示差的発現の検出および癌
の診断におけるその使用の例は、米国特許第5,688,641号および同第5
,677,125号において記載される。
Differential Expression in Diagnostic Polynucleotides of the invention can also be used to detect differences in expression levels between two cells, for example as a method for identifying abnormal or diseased tissues in humans. Can be used for. For polynucleotides that correspond to protein family profiles, tissue selection can be selected according to putative biochemical functions. Generally, the expression of the gene corresponding to a specific polynucleotide is compared between a human, first suspected diseased tissue, and a second normal tissue. Tissues suspected of being abnormal or diseased can be from different human tissue types, but preferably it is from the same tissue type; for example, intestinal polyps or other abnormal growths are normal. Should be compared to different intestinal tissues. Normal tissue is
The same tissue as the test sample, or any normal tissue of the patient, particularly tissue expressing a polynucleotide-related gene of interest (e.g., brain, thymus, testis, heart, prostate, placenta, spleen, small intestine, skeletal muscle, Mucosal lining of the pancreas and colon).
For example, a difference between a polynucleotide-related gene, mRNA, or protein in two tissues compared in molecular weight, amino acid sequence or nucleotide sequence, or relative amount is a gene in human tissue suspected of being affected, Alternatively, it indicates a change in a gene that regulates the gene. Examples of the detection of differential expression and its use in diagnosing cancer are described in US Pat. Nos. 5,688,641 and 5;
, 677,125.

【0102】 ヒトにおける疾患に対する遺伝的素因はまた、胎児組織における本発明のポリ
ヌクレオチドに対応するmRNAまたはタンパク質の発現レベルと、正常な胎児
組織における関連するレベルとを比較することによって検出され得る。この目的
のために使用される胎児組織としては、羊水、絨毛、血液、およびインビトロで
受精された胚の割球が挙げられるが、これらに制限されない。匹敵する正常なポ
リヌクレオチド関連遺伝子は、任意の組織から得られる。mRNAまたはタンパ
ク質は、ポリヌクレオチド関連遺伝子が発現されるヒトの正常な組織から得られ
る。胎児ポリヌクレオチド関連遺伝子もしくはmRNAの同じ産物のヌクレオチ
ド配列または大きさにおける変化、または分子量、アミノ酸配列、もしくは胎児
タンパク質の相対的な量における変化のような差異は、胎児のポリヌクレオチド
関連遺伝子における生殖系列の変異を示し得、これは、疾患に対する遺伝的素因
を示す。一般に、示差的発現に基づく本発明の診断、予後、および他の方法は、
疾患(例えば、乳癌、肺癌、結腸癌、および/またはその転移形態)を有するこ
とが疑われる、または疾患に罹患しやすい患者から得られる試験サンプル中の、
遺伝子産物、特に示差発現される遺伝子産物のレベルまたは量の検出、ならびに
正常細胞(例えば、癌に実質的に罹患していない細胞)および/または他のコン
トロール細胞において見出されるそれらのレベルと検出されたレベルとの比較(
例えば、異形成に罹患した細胞から癌細胞を区別するために)を包含する。さら
に、疾患の重篤度は、示差発現される遺伝子産物の検出されるレベルと、疾患の
種々の程度の重篤度と相関する示差的な遺伝子産物のレベルを示すサンプル中で
検出されるレベルとを比較することによって評価され得る。本明細書中での用語
「診断」の使用は、「予後の」あるいは「予後」を排除することを必ずしも意味
せず、むしろ便宜のために使用されることに留意すべきである。
Genetic predisposition to disease in humans can also be detected by comparing the expression level of mRNA or protein corresponding to a polynucleotide of the invention in fetal tissue to the relevant level in normal fetal tissue. Fetal tissues used for this purpose include, but are not limited to, amniotic fluid, villi, blood, and blastomere of in vitro fertilized embryos. Comparable normal polynucleotide-related genes can be obtained from any tissue. mRNA or protein is obtained from normal human tissue in which the polynucleotide-related gene is expressed. Differences, such as changes in the nucleotide sequence or size of the same product of a fetal polynucleotide-related gene or mRNA, or changes in the relative amounts of molecular weight, amino acid sequence, or fetal protein, can be due to germline in the fetal polynucleotide-related gene. , Which indicates a genetic predisposition to the disease. In general, the diagnostic, prognostic, and other methods of the invention based on differential expression are
In a test sample obtained from a patient suspected of having a disease (eg, breast cancer, lung cancer, colon cancer, and / or metastatic form thereof) or susceptible to the disease,
Detection of levels or amounts of gene products, particularly differentially expressed gene products, and their levels found in normal cells (eg, cells substantially free of cancer) and / or other control cells. Comparison with the level (
For example, to distinguish cancer cells from cells suffering from dysplasia). In addition, the severity of the disease is determined by the level of differentially expressed gene product detected in the sample and the level of differential gene product correlated with varying degrees of severity of the disease. Can be evaluated by comparing with. It should be noted that the use of the term "diagnosis" herein is not necessarily meant to exclude "prognostic" or "prognosis", but rather for convenience.

【0103】 用語「示差発現される遺伝子」は一般に、例えば、遺伝子産物(例えば、ポリ
ぺプチド)をコードするオープンリーディングフレーム、ならびに/またはこの
ような遺伝子のイントロン、および発現の調節に関与する隣接の5’および3’
非コードヌクレオチド配列(コード領域を超えて約20kbまでであるがいずれ
かの方向においておそらくそれ以上)を含み得るポリヌクレオチドを包含するこ
とが、意図される。遺伝子は、染色体外での維持のために、または宿主ゲノムへ
の組み込みのために、適切なベクターに導入され得る。一般に、少なくとも約2
5%、通常少なくとも約50%〜70%、より通常には少なくとも約90%以上
の発現レベルにおける減少と相関する発現レベルにおける差異は、示差発現され
る目的の遺伝子(すなわち、コントロールサンプルと比較して試験サンプル中で
不十分に発現されるかまたはダウンレギュレートされる遺伝子)を示す。さらに
、コントロールサンプルと比較して、少なくとも約25%、通常少なくとも約5
0%〜75%、より通常には少なくとも約90%の、発現の増加と相関する発現
レベルの差異は、少なくとも約1と1/2倍、通常少なくとも約2倍〜約10倍
であり得、そして約100倍〜約1000倍の増加であり得、このことは、示差
発現される目的の遺伝子(すなわち、過剰発現されるまたはアップレギュレート
される遺伝子)の指標である。
The term “differentially expressed gene” generally refers to, for example, an open reading frame encoding a gene product (eg, a polypeptide), and / or introns of such genes, and flanking those involved in the regulation of expression. 5'and 3 '
It is intended to include polynucleotides that may include non-coding nucleotide sequences (up to about 20 kb beyond the coding region, but probably more in either direction). The gene may be introduced into a suitable vector for extrachromosomal maintenance or for integration into the host genome. Generally, at least about 2
Differences in expression levels that correlate with a decrease in expression levels of 5%, usually at least about 50% to 70%, and more usually at least about 90% or more, result in a differentially expressed gene of interest (ie, compared to a control sample). Genes that are under-expressed or down-regulated in test samples). Furthermore, at least about 25%, usually at least about 5%, as compared to the control sample.
A difference in expression levels that correlates with an increase in expression of 0% to 75%, more usually at least about 90%, can be at least about 1 and 1/2 fold, usually at least about 2 fold to about 10 fold, And, there can be an increase of about 100-fold to about 1000-fold, which is an indicator of the gene of interest that is differentially expressed (ie, overexpressed or upregulated gene).

【0104】 本明細書中で使用されるように「示差発現されるポリヌクレオチド」は、示差
発現される遺伝子を示す配列を含む核酸分子(RNAまたはDNA)を意味し、
例えば、示差発現されるポリヌクレオチドは、サンプル中の示差発現されるポリ
ヌクレオチドの検出が、サンプル中の示差発現される遺伝子の存在と相関される
ように、示差発現される遺伝子を独特に同定する配列(例えば、遺伝子産物をコ
ードするオープンリーディングフレーム)を含む。「示差発現されるポリヌクレ
オチド」はまた、開示されるポリヌクレオチドのフラグメント(例えば、生物学
的活性を保持するフラグメント)、および開示されるポリヌクレオチドに相同な
、実質的に類似の、または実質的に同一の(例えば、約90%の配列同一性を有
する)核酸を包含することが意味される。
“Differentially expressed polynucleotide” as used herein means a nucleic acid molecule (RNA or DNA) that comprises a sequence that represents a differentially expressed gene,
For example, the differentially expressed polynucleotide uniquely identifies the differentially expressed gene such that detection of the differentially expressed polynucleotide in the sample is correlated with the presence of the differentially expressed gene in the sample. It includes a sequence (eg, an open reading frame encoding a gene product). "Differentially expressed polynucleotide" also includes fragments of the disclosed polynucleotides (eg, fragments that retain biological activity), and homologous, substantially similar, or substantially homologous to the disclosed polynucleotides. Are meant to include nucleic acids identical to (eg, having about 90% sequence identity).

【0105】 本明細書中で使用されるように「診断」は、一般に、疾患または障害に対する
患者の罹患しやすさの決定、被験体が疾患または障害に現在罹患しているか否か
に関する決定、および疾患または障害に罹患した被験体の予後に関する決定(例
えば、転移前のもしくは転移性の癌の状態、癌の段階、または治療に対する癌の
応答性の同定)を含む。本発明は特に、乳癌(例えば、インサイチュ癌腫(例え
ば、インサイチュ乳管癌腫)、エストロゲンレセプター(ER)−ポジティブ乳
癌、ER−ネガティブ乳癌、または乳癌の他の形態および/または段階)、肺癌
(小細胞癌腫、非小細胞癌腫、中皮腫、および肺癌の他の形態および/または段
階)、ならびに結腸癌(例えば、腺腫性ポリープ、結腸直腸癌腫、および結腸癌
の他の形態および/または段階)の状況における被験体の診断を含む。
As used herein, “diagnosis” generally refers to a determination of a patient's susceptibility to a disease or disorder, a determination as to whether a subject is currently suffering from the disease or disorder, And determining prognosis of a subject suffering from a disease or disorder (eg, identifying the pre-metastatic or metastatic cancer state, the stage of the cancer, or the responsiveness of the cancer to treatment). The invention is particularly directed to breast cancer (eg, in situ carcinoma (eg, in situ ductal carcinoma), estrogen receptor (ER) -positive breast cancer, ER-negative breast cancer, or other forms and / or stages of breast cancer), lung cancer (small cell). Carcinoma, non-small cell carcinoma, mesothelioma, and other forms and / or stages of lung cancer) and colon cancer (eg, adenomatous polyps, colorectal carcinoma, and other forms and / or stages of colon cancer) Including a diagnosis of the subject in the context.

【0106】 本明細書を通じて使用されるように「サンプル」または「生化学的サンプル」
は一般に、生物学的液体または組織のサンプル、特に組織から、特に診断適用が
設計される疾患(例えば、腺管性腺癌(ductal adenocarcin
oma))と相関する細胞の型から得られるサンプルなどをいうことを意味する
。「サンプル」はまた、このようなサンプルの誘導体および画分(例えば、細胞
溶解物)を含むことが意味される。サンプルが固形組織である場合、組織の細胞
が解離され得るか、または組織切片が分析され得る。
“Sample” or “biochemical sample” as used throughout this specification
Is generally from a sample of biological fluid or tissue, in particular tissue, in particular diseases for which diagnostic applications are designed (eg, ductal adenocarcinoma).
It is meant to refer to a sample or the like obtained from a cell type that correlates with oma)). “Sample” is also meant to include derivatives and fractions (eg, cell lysates) of such sample. If the sample is solid tissue, cells of the tissue can be dissociated or tissue sections can be analyzed.

【0107】 診断または予後において有用な本発明の方法は典型的に、遺伝子産物の発現に
おける任意の相対的な差異を決定するための、目的のサンプル中の選択される示
差発現される遺伝子産物の量と、コントロールのその量との比較を包含し、ここ
ではその差異は、定性的におよび/または定量的に測定され得る。定量は、例え
ば、サンプル中に検出される発現産物のレベルと、標準曲線に存在する産物の量
とを比較することによって達成され得る。比較は;コンピューター処理の補助を
伴うかまたは伴わないデンシトメトリーのような技術を使用することによって;
試験サンプルから単離されたmRNAのcDNAクローンの代表的なライブラリ
ーを調製し、ライブラリー中のクローンを配列決定して同じ遺伝子産物に対応す
るcDNAクローンの数を決定し、そしてコントロールサンプル中の同じ遺伝子
産物のクローンの数に対して、同じ遺伝子産物に対応するクローンの数を分析す
ることによって;またはアレイを使用して、選択された配列もしくは配列のセッ
トへのハイブリダイゼーションの相対的なレベルを検出し、そしてハイブリダイ
ゼーションパターンをコントロールのハイブリダイゼーションパターンと比較す
ることによって、視覚的になされ得る。次いで、発現における差異は、異常な発
現パターンの存在または非存在と相関される。サンプル中の核酸の量を決定する
ための種々の異なる方法は、当業者に公知である(例えば、WO97/2731
7を参照のこと)。
The methods of the invention useful in diagnosis or prognosis typically involve the selection of selected differentially expressed gene products in a sample of interest to determine any relative differences in gene product expression. Including a comparison of the amount with that of the control, where the difference can be measured qualitatively and / or quantitatively. Quantitation can be accomplished, for example, by comparing the level of expression product detected in the sample to the amount of product present in the standard curve. Comparisons; by using techniques such as densitometry with or without the aid of computer processing;
A representative library of cDNA clones of mRNA isolated from test samples was prepared, the clones in the library were sequenced to determine the number of cDNA clones corresponding to the same gene product, and in control samples. By analyzing the number of clones corresponding to the same gene product, relative to the number of clones of the same gene product; or using the array, the relative level of hybridization to a selected sequence or set of sequences Can be done visually and by comparing the hybridization pattern to the control hybridization pattern. Differences in expression are then correlated with the presence or absence of aberrant expression patterns. A variety of different methods for determining the amount of nucleic acid in a sample are known to those of skill in the art (eg WO 97/2731).
7).

【0108】 一般に、本発明の診断アッセイは、配列番号1〜1079の配列に対応するポ
リヌクレオチド配列の遺伝子産物(例えば、mRNA、またはポリぺプチド)の
検出を包含する。サンプルが得られる患者は、明らかに健常であり得るか、疾患
(例えば、家族病歴または特定の環境因子への曝露によって決定される)に罹患
しやすくあり得るか、または本発明の遺伝子産物の変化された発現と相関する状
態を有するとして既に同定され得る。
In general, the diagnostic assays of the present invention involve the detection of the gene product (eg, mRNA, or polypeptide) of polynucleotide sequences corresponding to the sequences of SEQ ID NOs: 1-1079. The patient from whom the sample is obtained may be clearly healthy, may be predisposed to a disease, as determined by, for example, family history or exposure to certain environmental factors, or an alteration in the gene product of the invention. It can already be identified as having a condition that correlates with the expressed expression.

【0109】 診断は、配列番号1〜1079において示される配列を有する、少なくとも1
つの、好ましくは少なくとも2つ以上の、少なくとも3つ以上の、または少なく
とも4つ以上のポリヌクレオチドによってコードされる遺伝子産物の検出される
遺伝子産物の発現レベルに基づいて決定され得、そして配列番号1〜1079の
全て、ならびに/またはさらなる診断マーカーおよび/もしくは参照配列として
作用し得るさらなる配列に対応する遺伝子の発現の検出を包含し得る。診断方法
が、癌の存在または癌に対する患者の罹患しやすさを検出するために設計される
場合、アッセイは好ましくは、癌において示差発現されるポリヌクレオチドに対
応する遺伝子によってコードされる遺伝子産物の検出を包含する。このような示
差発現されるポリヌクレオチドの例は、以下の実施例において記載される。提供
されるポリヌクレオチドおよび本明細書中に提供されるそれらの相対的な発現レ
ベルに関する情報を考慮すれば、診断および予後において、このようなポリヌク
レオチドおよびそれらの発現レベルの検出を使用するアッセイは、当業者に容易
に明らかである。
The diagnostic is at least 1 with the sequences set forth in SEQ ID NOS: 1-1079.
Of the gene product encoded by one, preferably at least two or more, at least three or more, or at least four or more polynucleotides, and can be determined based on the expression level of the detected gene product, and SEQ ID NO: 1 Detecting the expression of genes corresponding to all of the -1079 and / or additional sequences that may act as additional diagnostic markers and / or reference sequences. When the diagnostic method is designed to detect the presence of or the susceptibility of a patient to cancer, the assay preferably comprises the gene product encoded by the gene corresponding to the polynucleotide differentially expressed in the cancer. Includes detection. Examples of such differentially expressed polynucleotides are described in the Examples below. Given the information provided on the polynucleotides provided and their relative expression levels provided herein, assays using the detection of such polynucleotides and their expression levels in diagnosis and prognosis would be , Will be readily apparent to one of ordinary skill in the art.

【0110】 任意の種々の検出可能なレベルは、本発明の診断方法の種々の実施態様と関連
して使用され得る。適切な選択可能な標識としては、蛍光色素(例えば、フルオ
レセインイソチオシアネート(FITC)、ローダミン、テキサスレッド、フィ
コエリトリン、アロフィコシアニン、6−カルボキシフルオロセイン(6−FA
M)、2’,7’−ジメトキシ−4’,5’−ジクロロ−6−カルボキシフルオ
ロセイン、6−カルボキシ−X−ローダミン(ROX)、6−カルボキシ−2’
,4’,7’,4,7−ヘキサクロロフルオロセイン(HEX)、5−カルボキ
シフルオロセイン(5−FAM)、またはN,N,N’,N’,−テトラメチル
−6−カルボキシローダミン(TAMRA))、放射性標識(例えば、32P、35 S、3Hなど)などが挙げられる。検出可能な標識は、2段階系(例えば、ビオ
チン−アビジン、ハプテン−抗ハプテン抗体など)を含み得る。
Any of the various detectable levels can be used in connection with various embodiments of the diagnostic methods of the present invention. Suitable selectable labels include fluorescent dyes such as fluorescein isothiocyanate (FITC), rhodamine, Texas red, phycoerythrin, allophycocyanin, 6-carboxyfluoroscein (6-FA.
M) 2 ', 7'-dimethoxy-4', 5'-dichloro-6-carboxyfluorocein, 6-carboxy-X-rhodamine (ROX), 6-carboxy-2 '.
, 4 ', 7', 4,7-hexachlorofluorocein (HEX), 5-carboxyfluorocein (5-FAM), or N, N, N ', N',-tetramethyl-6-carboxyrhodamine (TAMRA) )), Radioactive labels (eg, 32 P, 35 S, 3 H, etc.) and the like. The detectable label can include a two-step system (eg, biotin-avidin, hapten-anti-hapten antibody, etc.).

【0111】 本発明のポリヌクレオチドおよびポリペプチドに特異的な試薬(例えば、抗体
およびヌクレオチドプローブ)は、生物学的サンプル中の発現産物の存在を検出
するためのキットにおいて供給され得る。キットはまた、緩衝液または標識化成
分、および生物学的サンプル中の発現産物を検出および定量するための試薬を使
用するための説明書を含み得る。本発明の診断方法の例示的な実施態様は、以下
により詳細に記載される。
Reagents specific to the polynucleotides and polypeptides of the invention (eg, antibodies and nucleotide probes) can be supplied in kits for detecting the presence of expression products in a biological sample. The kit can also include buffers or labeled components and instructions for using the reagents to detect and quantify the expression product in the biological sample. Exemplary embodiments of the diagnostic method of the present invention are described in more detail below.

【0112】 (診断におけるポリぺプチド検出) 1つの実施態様において、試験サンプル
は、示差発現されるポリぺプチドのレベルについてアッセイされる。診断は、試
験サンプル中の示差発現されるポリぺプチドの非存在もしくは存在、または変化
した量を測定するための任意の多くの方法を使用して達成され得る。例えば、検
出は、標識化抗体での細胞または組織学的切片の染色を利用し得、従来の方法に
従って行われ得る。細胞は、細胞質分子を染色するために透過性にされ得る。一
般に、本発明の示差発現されるポリぺプチドを特異的に結合する抗体がサンプル
に添加され、そしてエピトープへの結合を可能にするのに十分な時間の間、通常
少なくとも約10分間、インキュベートされる。抗体は、直接的な検出のために
検出可能に標識され得るか(例えば、放射性同位体、酵素、蛍光体、化学発光体
などを使用して)、または結合を検出するための第2段階の抗体または試薬と共
同して使用され得る(例えば、ビオチンと西洋ワサビペルオキシダーゼ結合アビ
ジン、蛍光化合物(例えば、フルオレセイン、ローダミン、テキサスレッドなど
)に結合体化した二次抗体)。抗体結合の非存在または存在は、種々の方法によ
って決定され得、解離された細胞のフローサイトメトリー、検鏡、ラジオグラフ
ィー、シンチレーションカウンティングなどが挙げられる。示差発現されるポリ
ぺプチドのレベルまたは量の定性的または定量的な検出の任意の適切な代替の方
法が、使用され得る(例えば、ELISA、ウェスタンブロット、免疫沈降、ラ
ジオイムノアッセイなど)。
Polypeptide Detection in Diagnosis In one embodiment, test samples are assayed for the level of differentially expressed polypeptide. Diagnosis can be accomplished using any of numerous methods for measuring the absence or presence, or altered amount, of differentially expressed polypeptides in a test sample. For example, detection can utilize staining of cells or histological sections with labeled antibodies and can be performed according to conventional methods. Cells can be permeabilized to stain cytoplasmic molecules. In general, an antibody that specifically binds the differentially expressed polypeptide of the invention is added to the sample and incubated for a time sufficient to allow binding to the epitope, usually at least about 10 minutes. It The antibody may be detectably labeled for direct detection (eg, using a radioisotope, an enzyme, a fluorophore, a chemiluminescer, etc.) or a second step for detecting binding. It can be used in conjunction with antibodies or reagents (eg biotin and horseradish peroxidase conjugated avidin, secondary antibodies conjugated to fluorescent compounds (eg fluorescein, rhodamine, Texas red, etc.)). The absence or presence of antibody binding can be determined by a variety of methods, including flow cytometry of dissociated cells, microscopy, radiography, scintillation counting, and the like. Any suitable alternative method of qualitative or quantitative detection of the level or amount of differentially expressed polypeptide can be used (eg, ELISA, Western blot, immunoprecipitation, radioimmunoassay, etc.).

【0113】 (mRNA検出) 本発明の診断方法はまた、もしくはあるいは、本発明の示
差発現されるポリヌクレオチドに対応する遺伝子によってコードされるmRNA
の検出を包含する。特定のmRNAを検出するための当該分野において公知の任
意の適切な定性的または定量的な方法が、使用され得る。mRNAは、例えば、
組織切片におけるインサイチュハイブリダイゼーションによって、逆転写酵素P
CRによって、またはポリA+mRNAを含むノーザンブロットにおいて、検出
され得る。当業者は容易に、2つのサンプル間のmRNA転写物の大きさまたは
量における差異を検出するために、これらの方法を使用し得る。サンプル中のm
RNA発現レベルはまた、サンプルからの発現される配列タグ(EST)のライ
ブラリーの作製によって決定され得、ここではESTライブラリーは、サンプル
中に存在する配列の代表である(Adamsら(1991)Science 2
52:1651)。ライブラリー内のESTの相対的な表示の列挙は、開始サン
プル内の遺伝子転写物の相対的な表示を近似するために使用され得る。次いで、
試験サンプルのEST分析の結果は、参照サンプルのEST分析と比較されて、
選択されるポリヌクレオチド、特に本明細書中に記載される1つ以上の示差発現
される遺伝子に対応するポリヌクレオチドの相対的な発現レベルを決定し得る。
あるいは、試験サンプル中の遺伝子発現は、遺伝子発現の連続分析(SAGE)
方法論(例えば、Velculescuら、Science(1995)270
:484)またはディファレンシャルディスプレイ(DD)方法論(例えば、米
国特許第5,776,683号;および米国特許第5,807,680号を参照
のこと)を使用して行われ得る。
(Detection of mRNA) The diagnostic method of the present invention may also, or alternatively, mRNA encoded by a gene corresponding to the differentially expressed polynucleotide of the present invention.
Detection of. Any suitable qualitative or quantitative method known in the art for detecting a particular mRNA can be used. mRNA is, for example,
Reverse transcriptase P by in situ hybridization in tissue sections
It can be detected by CR or in Northern blots containing poly A + mRNA. One of skill in the art can readily use these methods to detect differences in the size or amount of mRNA transcripts between two samples. M in the sample
RNA expression levels can also be determined by making a library of expressed sequence tags (ESTs) from a sample, where the EST library is representative of the sequences present in the sample (Adams et al. (1991). Science 2
52: 1651). An enumeration of the relative representations of ESTs in the library can be used to approximate the relative representations of gene transcripts in the starting sample. Then
The results of the EST analysis of the test sample are compared with the EST analysis of the reference sample,
The relative expression level of the selected polynucleotide, particularly the polynucleotide corresponding to one or more of the differentially expressed genes described herein, can be determined.
Alternatively, the gene expression in the test sample is determined by serial analysis of gene expression (SAGE).
Methodology (eg, Velculescu et al., Science (1995) 270.
: 484) or a differential display (DD) methodology (see, eg, US Pat. No. 5,776,683; and US Pat. No. 5,807,680).

【0114】 あるいは、遺伝子発現は、ハイブリダイゼーション分析を使用して分析され得
る。オリゴヌクレオチドまたはcDNAは、特異的な配列組成のDNAまたはR
NA、および定性的または定量的に決定された公知の捕獲配列にハイブリダイズ
するRNAまたはcDNAの量を選択的に同定または捕獲するために、サンプル
中の細胞性メッセージのプール内の特定のメッセージの相対的な表示についての
情報を提供するために、使用され得る。ハイブリダイゼーション分析は、例えば
、高密度形式を有するアレイベースの技術(濾過、顕微鏡スライド、もしくはマ
イクロチップを含む)、または分光学的分析(例えば、質量分析)を用いる溶液
ベースの技術を使用することによって、数百〜数千の遺伝子の相対的な発現の同
時のスクリーニングを可能にするように設計され得る。本発明の診断方法におけ
るアレイの1つの例示的な使用は、以下により詳細に記載される。
Alternatively, gene expression can be analyzed using hybridization analysis. Oligonucleotides or cDNAs are DNA or R of specific sequence composition.
In order to selectively identify or capture NA, and the amount of RNA or cDNA that hybridizes to a known qualitatively or quantitatively determined capture sequence, a specific message within a pool of cellular messages in a sample It can be used to provide information about relative displays. Hybridization analysis uses, for example, array-based techniques with high density formats (including filtration, microscope slides, or microchips) or solution-based techniques with spectroscopic analysis (eg, mass spectrometry). Can be designed to allow simultaneous screening of relative expression of hundreds to thousands of genes. One exemplary use of arrays in the diagnostic methods of the invention is described in more detail below.

【0115】 (診断適用における単一遺伝子の使用) 本発明の診断方法は、単一の示差発
現される遺伝子の発現に集中し得る。例えば、診断方法は、示差発現される遺伝
子、または疾患と関連したこのような遺伝子の多型(例えば、コード領域または
制御領域における多型)を検出する工程を包含し得る。疾患関連性の多型は、遺
伝子の欠失または短縮、発現レベルを変化するおよび/またはコードされるタン
パク質の活性に影響する変異などを含み得る。
Use of a Single Gene in Diagnostic Applications The diagnostic methods of the invention can focus on the expression of a single differentially expressed gene. For example, diagnostic methods can include detecting differentially expressed genes or polymorphisms of such genes associated with disease (eg, polymorphisms in the coding or regulatory regions). Disease-related polymorphisms may include gene deletions or truncations, mutations that alter expression levels and / or affect the activity of the encoded protein, and the like.

【0116】 多くの方法が、特異的な配列(例えば、疾患関連性の多型)の存在について核
酸を分析するために利用可能である。大量のDNAが利用可能である場合、ゲノ
ムDNAが直接的に使用される。あるいは、目的の領域は、適切なベクターにク
ローン化され、そして分析のために十分な量で増殖される。示差発現される遺伝
子を発現する細胞は、mRNAの供給源として使用され得、これは直接的にアッ
セイされ得るか、分析のためにcDNAに逆転写され得る。核酸は、分析のため
に十分な量を提供するために、ポリメラーゼ連鎖反応(PCR)のような従来の
技術によって増幅され得、そして検出可能な標識が、検出を容易にするために増
幅反応(例えば、検出可能に標識されるプライマーまたは検出可能に標識される
オリゴヌクレオチドを使用する)に含まれ得る。あるいは、多型を検出する手段
としてオリゴヌクレオチドライゲーションを利用する種々の方法がまた、当該分
野において公知である。例えば、Rileyら、Nucl. Acids Re
s.(1990)18:2887;およびDelahuntyら、Am.J.H
um.Genet.(1996)58:1239を参照のこと。
Many methods are available for analyzing nucleic acids for the presence of specific sequences (eg, disease-associated polymorphisms). When large amounts of DNA are available, genomic DNA is used directly. Alternatively, the region of interest is cloned into an appropriate vector and grown in sufficient quantity for analysis. Cells expressing the differentially expressed gene can be used as a source of mRNA, which can be directly assayed or reverse transcribed into cDNA for analysis. The nucleic acid can be amplified by conventional techniques such as the polymerase chain reaction (PCR) to provide a sufficient quantity for analysis, and a detectable label is added to the amplification reaction ( For example, using detectably labeled primers or detectably labeled oligonucleotides). Alternatively, various methods that utilize oligonucleotide ligation as a means of detecting polymorphisms are also known in the art. See, for example, Riley et al., Nucl. Acids Re
s. (1990) 18: 2887; and Delahunty et al., Am. J. H
um. Genet. (1996) 58: 1239.

【0117】 増幅されたまたはクローン化されたサンプル核酸は、当該分野において公知の
多くの方法のうちの1つによって分析され得る。核酸は、ジデオキシ法または他
の方法によって配列決定され得、塩基の配列は、選択される配列と、例えば、野
生型配列と比較され得る。多型配列または改変体配列でのハイブリダイゼーショ
ンはまた、サンプル中のその存在を決定するために使用され得る(例えば、サザ
ンブロット、ドットブロットなどによる)。米国特許第5,445,934号に
おいて、またはWO95/35505において記載されるように、固体支持体に
固定化されるオリゴヌクレオチドプローブのアレイに対する、多型配列または改
変体配列、およびコントロール配列のハイブリダイゼーションパターンはまた、
疾患と相関する多型配列または改変体配列を同定する手段として使用され得る。
ゲルマトリクスにおける1本鎖高次構造多型(single strand c
onformational polymorphism)(SSCP)分析、
変性勾配ゲル電気泳動(DGGE)、およびヘテロ2本鎖分析は、電気泳動移動
度における変化としてDNA配列の改変によって作製される高次構造変化を検出
するために使用される。あるいは、多型が制限エンドヌクレアーゼについての認
識部位を作製または破壊する場合、サンプルは、エンドヌクレアーゼで消化され
、そして産物の大きさが、フラグメントが消化されたか否かを決定するために分
画される。分画は、ゲル電気泳動またはキャピラリー電気泳動、特にアクリルア
ミドゲルまたはアガロースゲルによって、行われる。
Amplified or cloned sample nucleic acid can be analyzed by one of many methods known in the art. Nucleic acids can be sequenced by the dideoxy method or other methods, and the sequence of bases can be compared to the sequence of choice, eg, the wild-type sequence. Hybridization with a polymorphic sequence or variant sequence can also be used to determine its presence in a sample (eg, by Southern blot, dot blot, etc.). High polymorphic or variant sequences and control sequences for arrays of oligonucleotide probes immobilized on a solid support, as described in US Pat. No. 5,445,934 or in WO95 / 35505. The hybridization pattern is also
It can be used as a means to identify polymorphic or variant sequences that correlate with disease.
Single-strand conformation polymorphism in gel matrix
informational polymorphism (SSCP) analysis,
Denaturing gradient gel electrophoresis (DGGE), and heteroduplex analysis are used to detect conformational changes created by alteration of DNA sequences as alterations in electrophoretic mobility. Alternatively, if the polymorphism creates or destroys a recognition site for a restriction endonuclease, the sample is digested with endonuclease and the product size is fractionated to determine whether the fragment was digested. It Fractionation is performed by gel or capillary electrophoresis, especially acrylamide gels or agarose gels.

【0118】 遺伝子における変異についてのスクリーニングは、タンパク質の機能的なまた
は抗原性特性に基づき得る。タンパク質短縮アッセイは、タンパク質の生物学的
活性に影響し得る欠失を検出するにおいて有用である。タンパク質における多型
を検出するために設計される種々の免疫アッセイが、スクリーニングにおいて使
用され得る。多くの種々の遺伝子変異が、特定の疾患表現型を導いた場合、機能
的なタンパク質アッセイが、有効なスクリーニングツールであることを証明した
。コードされるタンパク質の活性は、野生型タンパク質との比較によって決定さ
れ得る。
Screening for mutations in a gene may be based on the functional or antigenic properties of the protein. Protein truncation assays are useful in detecting deletions that can affect the biological activity of proteins. A variety of immunoassays designed to detect polymorphisms in proteins can be used in the screen. Functional protein assays have proven to be effective screening tools when many different genetic mutations have led to specific disease phenotypes. The activity of the encoded protein can be determined by comparison with the wild type protein.

【0119】 (アレイを使用する診断におけるパターン適合化) 別の実施態様において、
本発明の診断および/または予後の方法は、試験発現パターン(TEP)を生成
するための試験サンプル中の遺伝子の選択されるセットの発現の検出を包含する
。TEPは、参照発現パターン(REP)と比較され、参照発現パターンは、参
照サンプル(例えば、ポジティブコントロールサンプルまたはネガティブコント
ロールサンプル)中の遺伝子の選択されるセットの発現の検出によって生成され
る。遺伝子の選択されるセットは、本発明の遺伝子のうちの少なくとも1つを含
み、これらの遺伝子は、配列番号1〜1079のポリヌクレオチド配列に対応す
る。特に目的のものは、試験サンプルがスクリーニングされる疾患において示差
発現される遺伝子を含む遺伝子の選択されるセットである。
Pattern Matching in Diagnostic Using Arrays In another embodiment,
The diagnostic and / or prognostic methods of the present invention include detecting expression of a selected set of genes in a test sample to generate a test expression pattern (TEP). The TEP is compared to a reference expression pattern (REP), which is generated by detection of expression of a selected set of genes in a reference sample (eg, positive control sample or negative control sample). The selected set of genes comprises at least one of the genes of the invention, these genes corresponding to the polynucleotide sequences of SEQ ID NOs: 1-1079. Of particular interest is a selected set of genes, including genes that are differentially expressed in the disease for which the test sample is screened.

【0120】 示差的遺伝子発現分析および診断/予後の状況において本明細書中で使用され
るように、「参照配列」または「参照ポリヌクレオチド」は、ポリヌクレオチド
の選択されるセットをいい、選択されるセットは、本明細書中に記載される示差
発現されるポリヌクレオチドのうちの少なくとも1つ以上を含む。複数の参照配
列(好ましくはポジティブコントロール配列およびネガティブコントロール配列
を含む)は、参照配列として含まれ得る。さらに適切な参照配列は、GenBa
nk、Unigene、および他のヌクレオチド配列データベースにおいて見出
される(例えば、発現される配列タグ(EST)、部分的な、および全長の配列
を含む)。
As used herein in differential gene expression analysis and diagnostic / prognostic context, a “reference sequence” or “reference polynucleotide” refers to and is a selected set of polynucleotides. The set comprises at least one or more of the differentially expressed polynucleotides described herein. Multiple reference sequences, preferably including positive and negative control sequences, can be included as reference sequences. A further suitable reference sequence is GenBa
Found in nk, Unigene, and other nucleotide sequence databases (including, for example, expressed sequence tags (ESTs), partial and full length sequences).

【0121】 「参照アレイ」は、サンプルとのハイブリダイゼーションにおける使用のため
の参照配列を有するアレイを意味し、ここでは参照配列は、本明細書中に記載さ
れる示差発現されるポリヌクレオチドの全て、それらのうちの少なくとも1つ、
またはそれらのうちの任意のサブセットを含む。通常このようなアレイは、少な
くとも3つの異なる参照配列を含み、そして提供される示差発現される配列のい
ずれか1つまたは全てを含み得る。目的のアレイはさらに、他の遺伝子配列、特
に疾患または障害(例えば、癌、異形成、または他の関連のもしくは未関連の疾
患、障害、または状態)をスクリーニングするための目的の他の配列の配列(多
型を含む)を含み得る。アレイにおけるオリゴヌクレオチド配列は通常、少なく
とも12ヌクレオチド長であり、および提供される配列の長さ付近であり得るか
、100ヌクレオチド〜200ヌクレオチド長以上のフラグメントを作製するた
めに隣接領域に伸長され得る。参照アレイは、当該分野において公知の任意の適
切な方法に従って生成され得る。例えば、オリゴヌクレオチドの大きなアレイを
生成する方法は、光指向性合成技術を使用する米国特許第5,134,854号
および米国特許第5,445,934号において記載される。コンピューター制
御系を使用して、モノマーの異種アレイが、多くの反応部位での同時のカップリ
ングを介してポリマーの異種アレイへと変換される。あるいは、マイクロアレイ
は、例えば、PCT公開出願第WO95/35505号において記載されるよう
に、固体基材上への予め合成されたオリゴヌクレオチドの沈着によって作製され
る。
By “reference array” is meant an array having a reference sequence for use in hybridization with a sample, wherein the reference sequence is all of the differentially expressed polynucleotides described herein. , At least one of them,
Or include any subset thereof. Usually such arrays contain at least three different reference sequences, and may contain any one or all of the differentially expressed sequences provided. The array of interest further comprises other gene sequences, particularly other sequences of interest for screening for a disease or disorder (eg, cancer, dysplasia, or other related or unrelated disease, disorder, or condition). Sequences (including polymorphisms) can be included. The oligonucleotide sequences in the array are usually at least 12 nucleotides in length, and can be near the length of the sequences provided, or can be extended into flanking regions to create fragments 100 nucleotides to 200 nucleotides or more in length. The reference array can be generated according to any suitable method known in the art. For example, methods of producing large arrays of oligonucleotides are described in US Pat. No. 5,134,854 and US Pat. No. 5,445,934 using light directed synthesis techniques. A computer controlled system is used to convert a heterogeneous array of monomers into a heterogeneous array of polymers via simultaneous coupling at many reaction sites. Alternatively, microarrays are made by deposition of pre-synthesized oligonucleotides on a solid substrate, for example, as described in PCT Published Application No. WO 95/35505.

【0122】 本明細書中で使用されるように「参照発現パターン」あるいは「REP」は、
遺伝子の、特に、選択される細胞型(例えば、正常細胞、癌細胞、環境刺激に曝
露された細胞など)と相関する、示差発現される遺伝子の選択されるセットの相
対的な発現レベルをいう。「試験発現パターン」あるいは「TEP」は、試験サ
ンプル(例えば、mRNAが単離される、未知のまたは疾患状態が疑われる細胞
)中の、遺伝子、特に、示差発現される遺伝子の選択されるセットの相対的な発
現レベルをいう。
As used herein, “reference expression pattern” or “REP” refers to
Refers to the relative expression level of a selected set of differentially expressed genes that correlates with a gene, particularly the selected cell type (eg, normal cells, cancer cells, cells exposed to environmental stimuli, etc.) . "Test expression pattern" or "TEP" refers to the selected set of genes, particularly differentially expressed genes, in a test sample (eg, cells from which mRNA is isolated, unknown or suspected of being in a disease state). Refers to the relative expression level.

【0123】 REPは、当該分野において周知の方法に従う種々の方法において作製され得
る。例えば、REPは、ポリヌクレオチドの選択されるセット(特に、示差発現
されるポリヌクレオチドの選択されるセット)を有するアレイに、コントロール
サンプルをハイブリダイズさせ、アレイからのハイブリダイゼーションデータを
獲得し、そしてREPとTEPとの容易な比較を可能にするフォーマットでデー
タを保存することによって作製され得る。あるいは、コントロールサンプル中の
全ての発現される配列は、例えば、コントロールサンプルからmRNAを単離し
、mRNAをcDNAに変換し、そしてcDNAを配列決定することによって、
単離および配列決定され得る。得られる配列情報は、サンプル中の発現される配
列の同一性および相対的な数をおよそまたは正確に反映する。次いで、配列情報
は、REPとTEPとの容易な比較を可能にするフォーマット(例えば、コンピ
ューター読み出し可能フォーマット)で保存され得る。REPは、データ保存の
前または後に正規化され得、および/またはほとんど目的でなく、かつ分析を複
雑にし得る発現される遺伝子の配列を選択的に除去するために処理され得る(例
えば、ハウスキーピング遺伝子と関連する配列のいくつかまたは全ては、REP
データから排除され得る)。
REPs can be made in a variety of ways according to methods well known in the art. For example, REP hybridizes a control sample to an array having a selected set of polynucleotides, particularly a selected set of differentially expressed polynucleotides, acquires hybridization data from the array, and It can be created by storing the data in a format that allows easy comparison of REP and TEP. Alternatively, all expressed sequences in a control sample can be obtained by, for example, isolating mRNA from the control sample, converting the mRNA to cDNA, and sequencing the cDNA.
It can be isolated and sequenced. The resulting sequence information approximately or accurately reflects the identity and relative number of expressed sequences in the sample. The sequence information can then be stored in a format that allows easy comparison of REP and TEP, such as a computer readable format. REPs can be normalized before or after data storage and / or processed to selectively remove sequences of expressed genes that are of little interest and can complicate analysis (eg, housekeeping). Some or all of the sequences associated with the gene are REP
Can be excluded from the data).

【0124】 TEPは、例えば、ポリヌクレオチドの選択されるセット、特に示差発現され
るポリヌクレオチドの選択されるセットを有するアレイに、試験サンプルをハイ
ブリダイズさせ、アレイからのハイブリダイゼーションデータを獲得し、そして
TEPとREPとの容易な比較を可能にするフォーマットにデータを保存するこ
とによってRFPと同様に作製され得る。比較において使用されるREPおよび
TEPは、同時に作製され得るか、またはTEPは、以前に作製され、そして保
存されたREPと比較され得る。
TEP, for example, hybridizes a test sample to an array having a selected set of polynucleotides, particularly a selected set of differentially expressed polynucleotides, and obtains hybridization data from the array, It can then be made similar to RFP by storing the data in a format that allows easy comparison of TEP and REP. The REP and TEP used in the comparison can be made simultaneously or the TEP can be compared to a previously made and stored REP.

【0125】 本発明の1つの実施態様において、TEPとREPとの比較は、試験サンプル
と参照アレイとをハイブリダイズさせる工程を包含し、ここでは参照アレイは、
サンプルとのハイブリダイゼーションにおける使用のために1つ以上の参照配列
を有する。参照配列は、本明細書中に記載の示差発現されるポリヌクレオチドの
全て、それらのうちの少なくとも1つ、またはそれらのうちの任意のサブセット
を含む。試験サンプルについてのハイブリダイゼーションデータが獲得され、デ
ータは正規化され、そして生成されたTEPは、示差発現されるポリヌクレオチ
ドの同じまたは類似の選択されるセットを有するアレイを使用して作製されたR
EPと比較される。2つのサンプル間で示差発現される配列に対応するプローブ
は、サンプルのうちの一方について、他方にくらべて減少されるかまたは増加さ
れるハイブリダイゼーション効力を示す。
In one embodiment of the invention, comparing TEP and REP comprises hybridizing a test sample with a reference array, wherein the reference array comprises
It has one or more reference sequences for use in hybridization with a sample. A reference sequence comprises all of the differentially expressed polynucleotides described herein, at least one of them, or any subset thereof. Hybridization data for the test samples were acquired, the data were normalized, and the TEPs generated were R generated using an array with the same or similar selected set of differentially expressed polynucleotides.
Compared to EP. Probes corresponding to sequences that are differentially expressed between the two samples show reduced or increased hybridization potency for one of the samples compared to the other.

【0126】 サンプルと参照アレイとのハイブリダイゼーションからのデータの回収のため
の方法は、当該分野において周知である。例えば、参照サンプルおよび試験サン
プルのポリヌクレオチドは、検出可能な蛍光標識を使用して作製され得、サンプ
ルにおけるポリヌクレオチドのハイブリダイゼーションは、例えば、顕微鏡およ
び基材に光を当てるための光源を使用して、検出可能な標識の存在についてマイ
クロアレイをスキャンすることによって検出され得る。光子計数器は、基材から
の蛍光を検出し、一方、x−y平行移動(translation)段階は基材
の位置を変化させる。本発明の方法において使用され得る共焦点検出デバイスは
、米国特許第5,631,734号において記載される。走査型レーザー顕微鏡
は、Shalonら、Genome Res.(1996)6:639において
記載される。適切な励起線を使用するスキャンは、使用される各蛍光団について
行われる。次いで、スキャンから作製されるデジタル画像が、その後の分析のた
めに組合わされる。任意の特定のアレイエレメントについて、1つのサンプル(
例えば、試験サンプル)からの蛍光シグナルの比率は、別のサンプル(例えば、
参照サンプル)からの蛍光シグナルと比較され、そして相対的なシグナル強度が
決定される。
Methods for recovery of data from hybridization of a sample with a reference array are well known in the art. For example, the polynucleotides of the reference and test samples can be made using a detectable fluorescent label, and hybridization of the polynucleotides in the sample can be performed using, for example, a microscope and a light source to illuminate the substrate. And can be detected by scanning the microarray for the presence of detectable label. The photon counter detects the fluorescence from the substrate, while the xy translation step changes the position of the substrate. Confocal detection devices that can be used in the method of the present invention are described in US Pat. No. 5,631,734. Scanning laser microscopes are described by Shalon et al., Genome Res. (1996) 6: 639. A scan using the appropriate excitation line is performed for each fluorophore used. The digital images produced from the scan are then combined for subsequent analysis. One sample (for any particular array element
For example, the ratio of the fluorescence signal from a test sample is
The fluorescent signal from the reference sample) is compared and the relative signal intensity is determined.

【0127】 アレイへのハイブリダイゼーションから回収されるデータを分析するための方
法は、当該分野において周知である。例えば、ハイブリダイゼーションの検出が
蛍光標識を含む場合、データ分析は、回収されたデータからの基材の位置の関数
として蛍光強度を決定する工程、アウトライアー(すなわち、予め決定された統
計学的分布から逸脱するデータ)を除く工程、および残りのデータから標的の相
対的な結合親和性を算定する工程を包含し得る。得られるデータは、標的とプロ
ーブとの間の結合親和性に従って変化する各領域における強度で、画像として表
示され得る。
Methods for analyzing the data collected from hybridization to arrays are well known in the art. For example, if the detection of hybridization involves a fluorescent label, data analysis may include determining fluorescence intensity as a function of substrate position from the collected data, outliers (ie, predetermined statistical distributions). Data) that deviates from the above), and calculating the relative binding affinity of the target from the remaining data. The data obtained can be displayed as an image, with the intensity in each region varying according to the binding affinity between the target and the probe.

【0128】 一般に、試験サンプルは、試験サンプルから作製されるTEPを、参照サンプ
ルから(例えば、癌、癌の特定の状態、異形成と相関するサンプル、癌以外の疾
患に罹患したサンプル、正常サンプルなどから)作製される1つ以上のREPと
比較することによって、疾患状態または非疾患状態と相関する遺伝子発現プロフ
ィールに対応する遺伝子発現プロフィールを有すると分類される。TEPとRE
Pとの間の適合、または実質的な適合についての基準は、参照配列の同じまたは
実質的に同じセットの発現、および実質的に同じレベル(例えば、サンプルの正
規化後に選択された参照配列と相関するシグナルについて、サンプル間で有意差
がない、または所定の参照配列についてのシグナル強度における、少なくとも約
25%〜約40%を超えない差異)でのこれらの参照遺伝子の発現を含む。一般
に、TEPとREPとの間のパターン適合は、本発明の示差発現される遺伝子の
うちの少なくとも1つの、それらのうちの全ての、またはそれらのうちの任意の
サブセットの、発現における適合、好ましくは定性的または定量的な発現レベル
における適合を含む。
Generally, a test sample is a TEP made from a test sample that is derived from a reference sample (eg, cancer, a particular condition of cancer, a sample that correlates with dysplasia, a sample affected by a disease other than cancer, a normal sample). Are classified as having a gene expression profile that corresponds to a gene expression profile that correlates with a diseased or non-diseased state by comparison with one or more REPs that are produced. TEP and RE
The criteria for a match, or a substantial match, with P are expression of the same or substantially the same set of reference sequences, and substantially the same level (eg, with the reference sequence selected after normalization of the sample). Expression of these reference genes with no significant difference between samples for correlated signals, or a difference in signal intensity for a given reference sequence of not less than about 25% to about 40%). Generally, a pattern match between TEP and REP is a match in expression of at least one, all of them, or any subset thereof of the differentially expressed genes of the invention, preferably Includes adaptation in qualitative or quantitative expression levels.

【0129】 パターン適合化は、手動で行われ得るか、またはコンピュータープログラムを
使用して行われ得る。基質マトリクス(例えば、アレイ)の調製、このようなマ
トリクスとともに使用するオリゴヌクレオチドの設計、プローブの標識化、ハイ
ブリダイゼーション条件、ハイブリダイズされたマトリクスのスキャニング、お
よび生成されるパターンの分析(比較分析を含む)のための方法は、例えば米国
特許第5,800,992号において記載される。
Pattern matching can be done manually or using computer programs. Preparation of substrate matrices (eg, arrays), design of oligonucleotides for use with such matrices, probe labeling, hybridization conditions, scanning of hybridized matrices, and analysis of the patterns produced (comparative analysis Methods for including) are described, for example, in US Pat. No. 5,800,992.

【0130】 (癌の診断、予後、および管理) 本発明のポリヌクレオチドおよびそれらの遺伝子産物は、発癌経路に沿う最も
初期の変化を検出する遺伝子マーカーまたは生化学的マーカー(例えば、血液も
しくは組織中の)として、ならびに/または種々の治療学的および予防的介入の
効力をモニターするために、特に重要である。例えば、あるポリヌクレオチドの
発現のレベルは、より貧弱な予後の指標であり得、それゆえ、患者に対してより
攻撃的な化学療法または放射線療法を保証し、逆もまた同じである。患者におけ
る処置の応答および結果に関連して新規な代理の腫瘍特異的特徴との相関は、腫
瘍の分子プロフィールに基づいて作製される治療の設計を許容する予後の指標を
規定し得る。これらの治療は、抗体標的化および遺伝子治療を包含する。あるポ
リヌクレオチドの発現を決定すること、ならびに患者のプロフィールを正常な組
織および疾患の改変体における公知の発現と比較することは、処置の特異性に関
して、および患者の苦痛のないレベルに関しての両方で、患者についての最も良
好な可能な処置の決定を許容する。ポリヌクレオチド発現のような代理の腫瘍マ
ーカーはまた、より良好な分類のために、従って、癌の異なる形態および疾患状
態を診断および処置するために、使用され得る。本発明のポリヌクレオチドの発
現レベルの同定から得られ得る腫瘍学において広範に使用される2つの分類は、
癌障害の病期分類、および癌組織の性質の悪性度分類である。
Diagnosis, Prognosis, and Management of Cancer The polynucleotides and their gene products of the present invention are genetic or biochemical markers (eg, in blood or tissue) that detect the earliest changes along the carcinogenic pathway. Of) and / or to monitor the efficacy of various therapeutic and prophylactic interventions. For example, the level of expression of a given polynucleotide may be indicative of a poorer prognosis, thus warranting more aggressive chemotherapy or radiation therapy to the patient, and vice versa. Correlation with novel surrogate tumor-specific characteristics in relation to treatment response and outcome in patients may define prognostic indicators that allow the design of treatments made based on the molecular profile of the tumor. These therapies include antibody targeting and gene therapy. Determining the expression of a polynucleotide, and comparing a patient's profile to known expression in normal tissue and disease variants, both with respect to treatment specificity and with regard to the patient's pain-free level. , Allows the decision of the best possible treatment for the patient. Surrogate tumor markers such as polynucleotide expression can also be used for better classification, and thus for diagnosing and treating different forms of cancer and disease states. Two classes of widely used in oncology that may result from the identification of expression levels of the polynucleotides of the invention are:
It is a staging of cancer disorders and a grading of the nature of the cancerous tissue.

【0131】 本発明のポリヌクレオチドは、潜在的に悪性の事象を、それらがひどい形態学
的レベルで検出可能である前に、分子レベルで検出するために、癌を有するかま
たは癌に感受性の患者をモニターするために有用であり得る。さらに、癌の1つ
の型について重要であるとして同定される本発明のポリヌクレオチドはまた、癌
の他の型の発生または発生の危険性についての関連性を有し得、例えば、ここで
はポリヌクレオチドは種々の癌の型にわたって示差発現される。従って、例えば
、転移性の結腸癌について臨床学的関連性を有するポリヌクレオチドの発現はま
た、胃癌または子宮内膜癌について臨床学的関連性を有し得る。
The polynucleotides of the invention have or are susceptible to cancer in order to detect potentially malignant events at the molecular level before they are detectable at the terrible morphological level. It can be useful for monitoring patients. In addition, the polynucleotides of the invention identified as being important for one type of cancer may also have relevance for the development or risk of developing another type of cancer, eg, a polynucleotide herein. Is differentially expressed across various cancer types. Thus, for example, expression of a polynucleotide having clinical relevance for metastatic colon cancer may also have clinical relevance for gastric cancer or endometrial cancer.

【0132】 (病期分類)病期分類は、患者において癌の状態がどのくらい進行されたかを
記載するために、医師によって使用されるプロセスである。病期分類は、予後を
決定するにおいて、処置を計画するにおいて、およびこのような処置の結果を評
価するにおいて、医師を補助する。病期分類の系は、癌の種類とともに変化する
が、一般に以下の「TNM」系を含む:腫瘍の型は、Tによって示され;癌がリ
ンパ節の近くに転移したか否かは、Nによって示され;および癌が身体のより遠
位の部分に転移したか否かは、Mによって示される。一般に、癌が、任意のリン
パ節に広がることなく原発性病変の領域においてのみ検出可能である場合、これ
は病期Iと呼ばれる。腫瘍が最も近接のリンパ節にのみ広がった場合、これは病
期IIと呼ばれる。病期IIIにおいて、癌は一般に、原発性病変の部位にほと
んど近位のリンパ節に広がっている。身体の遠位の部分(例えば、肝臓、骨、脳
、または他の部位)に広がった癌は、病期IVであり、最も進行した病期である
Staging Staging is a process used by physicians to describe how advanced a cancerous condition is in a patient. Staging aids physicians in determining prognosis, in planning treatment, and in assessing the results of such treatment. Staging systems vary with cancer type, but generally include the following "TNM" systems: tumor type is indicated by T; whether the cancer has metastasized to lymph nodes is N , And whether the cancer has spread to more distant parts of the body is indicated by M. Generally, if cancer is detectable only in the area of the primary lesion without spreading to any lymph nodes, it is referred to as stage I. If the tumor has spread only to the closest lymph nodes, it is called stage II. In stage III, the cancer has generally spread to lymph nodes almost proximal to the site of the primary lesion. Cancer that has spread to distant parts of the body (eg, liver, bones, brain, or other sites) is stage IV and is the most advanced stage.

【0133】 本発明のポリヌクレオチドは、癌の攻撃性(例えば、転移可能性)、および身
体の異なる領域における存在についてのマーカーを同定することによって、病期
分類プロセスの微調律を容易にし得る。従って、高い転移可能性の癌を示すポリ
ヌクレオチドを有する病期IIの癌は、境界の病期II腫瘍を病期III腫瘍へ
変化するために使用され得、より攻撃性の治療を正当化する。逆に、より低い転
移可能性の癌を示すポリヌクレオチドの存在は、腫瘍のより保存的な病期分類を
許容する。
The polynucleotides of the invention may facilitate fine tuning of the staging process by identifying markers for cancer aggressiveness (eg metastatic potential) and presence in different regions of the body. Thus, stage II cancers with polynucleotides that represent highly metastatic cancers can be used to transform borderline stage II tumors into stage III tumors, justifying a more aggressive treatment. . Conversely, the presence of polynucleotides that represent less metastatic cancers allows more conservative staging of tumors.

【0134】 (癌の悪性度分類)悪性度は、腫瘍がその同じ型の正常な組織にどのくらい近
く似ているかを記載するために使用される用語である。腫瘍の顕微鏡的な見かけ
は、細胞形態学、細胞組織化、および分化の他のマーカーのようなパラメーター
に基づいて腫瘍の悪性度を同定するために使用される。一般的な法則として、腫
瘍の悪性度は、その増殖の速度または攻撃性に対応し、未分化のまたは高い悪性
度の腫瘍は、十分に分化されたまたは低い悪性度の腫瘍よりも攻撃性である。以
下の指針は一般に、腫瘍を悪性度分類するために使用される:1)GX悪性度は
、評価され得ない;2)G1 十分に分化される;G2 中程度に十分に分化さ
れる;3)G3 不十分に分化される;4)G4 未分化。本発明のポリヌクレ
オチドは、これが腫瘍の細胞の分化の状態を決定するにおいて補助し得るのみで
なく、これらはまた腫瘍の攻撃性(例えば、転移可能性)を決定するにおいて価
値がある、分化以外の因子を同定し得るので、腫瘍の悪性度を決定するにおいて
特に価値があり得る。
Cancer Grading Grade is a term used to describe how closely a tumor resembles the same type of normal tissue. The microscopic appearance of tumors is used to identify tumor grade based on parameters such as cell morphology, cell organization, and other markers of differentiation. As a general rule, a tumor's grade corresponds to its rate of growth or aggressiveness, with undifferentiated or high-grade tumors being more aggressive than well-differentiated or low-grade tumors. is there. The following guidelines are generally used to grade tumors: 1) GX grade cannot be assessed; 2) G1 well differentiated; G2 moderately well differentiated; 3 ) G3 poorly differentiated; 4) G4 undifferentiated. The polynucleotides of the present invention not only help this in determining the status of differentiation of tumor cells, but they are also valuable in determining tumor aggressiveness (eg, metastatic potential), other than differentiation. Can be of particular value in determining the grade of a tumor as it can identify

【0135】 (肺癌の検出)本発明のポリヌクレオチドは、被験体において肺癌を検出する
ために使用され得る。1ダースよりも多くの異なる種類の肺癌があるが、肺癌の
2つの主な型は、小細胞および非小細胞であり、これは全ての肺癌症例のうちの
約90%を包含する。小細胞癌腫(また燕麦細胞癌腫と呼ばれる)は通常、より
大きな気管支の1つにおいて開始し、非常に迅速に増殖し、そして診断の時まで
には大きくなる傾向がある。非小細胞肺癌(NSCLC)は、肺癌の3つの一般
的なサブタイプから構成される。類表皮癌腫(また偏平上皮細胞癌腫と呼ばれる
)は通常、より大きな気管支の1つにおいて開始し、そして比較的ゆっくりと増
殖する。これらの腫瘍の大きさは、非常に小さいサイズから非常に大きいサイズ
までの範囲であり得る。腺癌腫は、肺の外側の表面近くで増殖を開始し、そして
大きさおよび増殖速度の両方において変化し得る。いくつかのゆっくりと増殖す
る腺癌腫は、肺胞細胞癌として記載される。大きな細胞癌腫は、肺の表面近くで
開始し、迅速に増殖し、そして診断されるときには、増殖は通常、非常に大きい
。肺癌の他のあまり一般的でない形態は、カルチノイド、円柱腫、粘膜表皮性中
皮腫および悪性中皮腫である。
Detection of Lung Cancer The polynucleotides of the present invention can be used to detect lung cancer in a subject. Although there are more than a dozen different types of lung cancer, the two major types of lung cancer are small cells and non-small cells, which comprises approximately 90% of all lung cancer cases. Small cell carcinoma (also called oat cell carcinoma) usually starts in one of the larger bronchi, grows very quickly, and tends to grow by the time of diagnosis. Non-small cell lung cancer (NSCLC) is composed of three common subtypes of lung cancer. Epidermoid carcinoma (also called squamous cell carcinoma) usually starts in one of the larger bronchi and grows relatively slowly. The size of these tumors can range from very small to very large sizes. Adenocarcinomas begin to grow near the outer surface of the lung and can vary in both size and growth rate. Some slowly growing adenocarcinomas are described as alveolar cell carcinoma. Large cell carcinomas start near the surface of the lung, grow rapidly, and when diagnosed, the growth is usually very large. Other less common forms of lung cancer are carcinoids, cylinders, mucoepidermoid mesothelioma and malignant mesothelioma.

【0136】 本発明のポリヌクレオチド、例えば、正常細胞対癌性肺細胞(例えば、高いま
たは低い転移可能性の腫瘍細胞)において、もしくは癌性肺細胞の型の間(例え
ば、高い転移性対低い転移性)で、差示的に発現されるポリヌクレオチドは、肺
癌の型を区別するために、ならびにある患者の癌に特異的な特徴を同定するため
に、および適切な治療を選択するために、使用され得る。例えば、患者のバイオ
プシーが、低い転移可能性と関連されるポリヌクレオチドを発現する場合、これ
は病変を除去するための外科手術において患者の肺のより大きな部分を残すこと
を正当化し得る。あるいは、高い転移可能性と関連されるポリヌクレオチドの発
現を伴うより小さな病変は、転移が病理学的試験を介して同定され得ない場合で
あっても、肺組織および/またはその周囲のリンパ節のより根治的な除去を正当
化し得る。
Polynucleotides of the invention, eg, in normal cells versus cancerous lung cells (eg, high or low metastatic potential tumor cells) or between cancerous lung cell types (eg, high metastatic versus low). (Metastatic), differentially expressed polynucleotides are used to distinguish types of lung cancer, as well as to identify cancer-specific features in a patient, and to select the appropriate treatment. , Can be used. For example, if a patient's biopsy expresses a polynucleotide associated with low metastatic potential, this may justify leaving a larger portion of the patient's lungs in surgery to remove the lesion. Alternatively, smaller lesions with the expression of polynucleotides associated with high metastatic potential may be present in lung tissue and / or surrounding lymph nodes, even if metastases cannot be identified through pathological examination. May justify a more radical removal of.

【0137】 (乳癌の検出)大多数の乳癌は、腺癌腫のサブタイプであり、これは以下のよ
うにまとめられ得る:1)腺管癌インサイチュ(DCIS)、面皰癌を含む;2
)浸潤性(または侵襲性)腺管癌(IDC);3)小葉癌インサイチュ(LCI
S);4)浸潤性(または侵襲性)小葉癌(ILC);5)炎症性乳癌;6)髄
様癌;7)粘液性癌;8)乳頭のパジェット病;9)葉状腫瘍、および10)管
状腫癌。
Breast Cancer Detection The majority of breast cancers are subtypes of adenocarcinomas and can be summarized as follows: 1) ductal carcinoma in situ (DCIS), including comedone cancer; 2
) Invasive (or invasive) ductal carcinoma (IDC); 3) Lobular carcinoma in situ (LCI)
S); 4) invasive (or invasive) lobular carcinoma (ILC); 5) inflammatory breast cancer; 6) medullary carcinoma; 7) mucinous carcinoma; 8) Paget's disease of the nipple; 9) lobular tumor, and 10 ) Tubular carcinoma.

【0138】 本発明のポリヌクレオチドの発現は、乳癌の診断および管理において、ならび
に乳癌の型の間を区別するために使用され得る。乳癌の検出は、本発明の任意の
適切なポリヌクレオチドの発現レベルを、単独でまたは組合わせてのいずれかで
使用して決定され得る。乳癌の攻撃性の性質および/または転移可能性の決定は
また、本発明の1つ以上のポリヌクレオチドのレベルを比較し、そして癌性組織
において変化することが知られる別の配列のレベル(例えば、ER発現)を比較
することによって決定され得る。さらに、乳癌の発生は、ステロイドホルモン(
例えば、テストステロンもしくはエストロゲン)のレベルに対する、または他の
ホルモン(例えば、成長ホルモン、インスリン)に対する、差示的に発現される
ポリヌクレオチドの発現の比率を試験することによって、検出され得る。従って
、特異的マーカーポリヌクレオチドの発現は、正常な乳組織と癌性の乳組織との
間を区別するため、起源の異なる細胞を伴う乳癌の間を区別するため、異なる潜
在的な転移速度を伴う乳癌の間を区別するなどのために、使用され得る。
Expression of the polynucleotides of the invention can be used in the diagnosis and management of breast cancer and to distinguish between breast cancer types. Breast cancer detection can be determined using the expression levels of any suitable polynucleotide of the invention, either alone or in combination. Determining the aggressive nature and / or metastatic potential of breast cancer also compares the levels of one or more polynucleotides of the invention and the levels of other sequences known to be altered in cancerous tissue (eg, , ER expression). In addition, the development of breast cancer depends on the steroid hormone (
For example, it can be detected by testing the ratio of the expression of the differentially expressed polynucleotide to the level of testosterone or estrogen) or to other hormones (eg growth hormone, insulin). Thus, expression of the specific marker polynucleotide differentiates between normal and cancerous breast tissue, and thus between breast cancers with cells of different origin, resulting in different potential metastasis rates. It can be used to distinguish between associated breast cancers, and so on.

【0139】 (結腸癌の検出)適切な発現パターンを示す本発明のポリヌクレオチドは、被
験体において結腸癌を検出するために使用され得る。結腸直腸癌は、ヒトにおけ
る最も共通の新生物の1つであり、そしておそらく遺伝性の新生物の最も頻繁な
形態である。予防および初期の検出は、結腸直腸癌を制御および治癒する際に重
要な因子である。結腸直腸癌は、結腸の内層において形成する、細胞の良性の増
殖物である小さなポリープとして開始する。数年間の期間にわたって、これらの
ポリープのいくつかはさらなる変異を蓄積し、そして癌性になる。複数の家族性
結腸直腸癌疾患が同定されており、これは以下のようにまとめられる:1)家族
性腺腫様ポリポシス(FAP);2)ガードナー症候群;3)遺伝性非ポリポシ
ス結腸癌(HNPCC);および4)Ashkenazi Jewsにおける家
族性結腸直腸癌。本発明の適切なポリヌクレオチドの発現は、結腸直腸癌の診断
、予後、および管理において使用され得る。結腸癌の検出は、任意のこれらの配
列の発現レベルを単独で、または発現のレベルと組合わせて使用して決定され得
る。結腸癌の攻撃性の性質および/または転移可能性の決定は、本発明の1つ以
上のポリヌクレオチドのレベルを比較し、そして癌組織において変化することが
知られる別の配列(例えば、p53、DCC ras、lor FAPの発現)
の総レベルを比較することによって決定され得る(例えば、Fearon ER
ら、Cell(1990)61(5):759;Hamilton SRら、C
ancer(1993)72:957;Bodmer Wら、Nat Gene
t.(1994)4(3):217;Fearon ER、Ann NY Ac
ad Sci.(1995)768:101を参照のこと)。例えば、結腸癌の
発生は、癌遺伝子(例えば、ras)または腫瘍抑制遺伝子(例えば、FAPま
たはp53)のレベルに対する本発明の任意のポリヌクレオチドの比率を試験す
ることによって検出され得る。従って、特異的マーカーポリヌクレオチドの発現
は、正常な結腸組織と癌性の結腸組織との間を区別するため、起源の異なる細胞
を伴う結腸癌の間を区別するため、異なる潜在的な転移速度を伴う結腸癌の間を
区別するなどのために、使用され得る。
Detection of Colon Cancer Polynucleotides of the invention that exhibit the appropriate expression pattern can be used to detect colon cancer in a subject. Colorectal cancer is one of the most common neoplasms in humans, and is probably the most frequent form of hereditary neoplasm. Prevention and early detection are important factors in controlling and curing colorectal cancer. Colorectal cancer begins as small polyps, which are benign growths of cells that form in the lining of the colon. Over a period of several years, some of these polyps accumulate additional mutations and become cancerous. Multiple familial colorectal cancer diseases have been identified and are summarized as follows: 1) familial adenomatous polyposis (FAP); 2) Gardner's syndrome; 3) hereditary non-polyposis colon cancer (HNPCC). And 4) Familial colorectal cancer in Ashkenazi James. Expression of the appropriate polynucleotides of the invention can be used in the diagnosis, prognosis, and management of colorectal cancer. Detection of colon cancer can be determined using the expression level of any of these sequences alone or in combination with the level of expression. Determining the aggressive nature and / or metastatic potential of colon cancer is the comparison of the levels of one or more polynucleotides of the invention, and another sequence known to be altered in cancer tissue (eg p53, Expression of DCC ras and lor FAP)
Can be determined by comparing the total levels of (eg, Fearon ER
Et al., Cell (1990) 61 (5): 759; Hamilton SR et al., C.
ancer (1993) 72: 957; Bodmer W et al., Nat Gene.
t. (1994) 4 (3): 217; Fearon ER, Ann NY Ac.
ad Sci. (1995) 768: 101). For example, colon cancer development can be detected by testing the ratio of any polynucleotide of the invention to the level of an oncogene (eg, ras) or tumor suppressor gene (eg, FAP or p53). Thus, the expression of the specific marker polynucleotides differentiates between normal and cancerous colon tissue, and thus between colon cancers with cells of different origin, different potential metastasis rates. It can be used, for example, to distinguish between colon cancers with.

【0140】 (前立腺癌の検出)適切な差示的発現パターンを示すポリヌクレオチドおよび
それらの対応する遺伝子および遺伝子産物は、被験体における前立腺癌を検出す
るために使用され得る。95%を超える原発性前立腺癌は、腺癌である。徴候お
よび症状には、以下が挙げられる:頻尿(特に夜間)、排尿不能、排尿の開始ま
たは自制の困難性、弱いかまたは中断された排尿の流れ、ならびに下半身の背部
、股関節部または大腿上方における頻繁な痛みまたは凝り。
Detection of Prostate Cancer Polynucleotides displaying their appropriate differential expression patterns and their corresponding genes and gene products can be used to detect prostate cancer in a subject. Over 95% of primary prostate cancers are adenocarcinomas. Signs and symptoms include: frequent urination (especially at night), inability to urinate, difficulty in initiating or controlling urination, weak or interrupted micturition flow, and lower back, hip or upper thigh. Frequent pain or stiffness in.

【0141】 前立腺癌の多くの徴候および症状が、種々の他の非癌性状態によって引き起こ
され得る。例えば、多くのこれらの徴候および症状のうちの1つの一般的な原因
は、良性の前立腺肥大、すなわちBPHと呼ばれる状態である。BPHにおいて
、前立腺はより大きくなり、そして流れまたは尿をブロックし得るか、あるいは
性的機能を妨げ得る。本発明の方法および組成物は、前立腺癌とこのような非癌
性状態との間を区別するために使用され得る。本発明の方法は、診断の従来の方
法(例えば、デジタル直腸試験(digital rectal exam)お
よび/または前立腺特異的抗原(PSA)(前立腺により産生されかつ分泌され
る物質)のレベルの検出)と組み合わされて使用され得る。
Many signs and symptoms of prostate cancer can be caused by a variety of other non-cancerous conditions. For example, a common cause of one of many of these signs and symptoms is a benign prostatic hypertrophy, a condition called BPH. In BPH, the prostate may become larger and block flow or urine, or interfere with sexual function. The methods and compositions of the present invention can be used to distinguish between prostate cancer and such non-cancerous conditions. The methods of the invention are combined with conventional methods of diagnosis, eg, digital rectal exam and / or detection of levels of prostate specific antigen (PSA), a substance produced and secreted by the prostate. Can be used.

【0142】 (ペプチドアナログおよびアンタゴニストについてスクリーニングするための
ポリヌクレオチドの使用) 本発明のポリヌクレオチドおよび対応する全長遺伝子によってコードされるポ
リぺプチドは、コードされるポリぺプチドの中からレセプターのような結合パー
トナーを同定するために、ペプチドライブラリーをスクリーニングするために使
用され得る。ペプチドライブラリーは、当該分野において公知の方法に従って合
成され得る(例えば、米国特許第5,010,175号およびWO91/178
23を参照のこと)。本発明のポリぺプチドのアゴニストまたはアンタゴニスト
は、シグナル伝達、抗体結合、レセプター結合、分裂促進アッセイ、走化性アッ
セイなどのような当該分野において公知の任意の利用可能な方法を使用してスク
リーニングされ得る。アッセイ条件は理想的には、ネイティブな活性がインビボ
で示される条件、すなわち、生理学的pH、温度、およびイオン強度下の条件に
類似するべきである。適切なアゴニストまたはアンタゴニストは、被験体におい
て毒性の副作用を引き起こさない濃度で、ネイティブな活性の強力な阻害または
増強を示す。ネイティブなポリぺプチドへの結合を競合するアゴニストまたはア
ンタゴニストは、ネイティブな濃度に等しいかまたはこれよりも大きい濃度を必
要とし得るが、ポリぺプチドに不可逆的に結合し得るインヒビターは、ネイティ
ブな濃度に類似する濃度において添加され得る。
Use of Polynucleotides to Screen for Peptide Analogs and Antagonists Polypeptides encoded by the polynucleotides of the invention and the corresponding full-length genes are labeled as receptors among the encoded polypeptides. It can be used to screen peptide libraries to identify binding partners. Peptide libraries can be synthesized according to methods known in the art (eg, US Pat. No. 5,010,175 and WO 91/178).
23). Agonists or antagonists of the polypeptides of the invention are screened using any available method known in the art such as signal transduction, antibody binding, receptor binding, mitogenic assays, chemotaxis assays and the like. obtain. Assay conditions should ideally be similar to those in which native activity is shown in vivo, ie under physiological pH, temperature, and ionic strength. Suitable agonists or antagonists exhibit potent inhibition or enhancement of native activity at concentrations that do not cause toxic side effects in the subject. An agonist or antagonist that competes for binding to a native polypeptide may require a concentration equal to or greater than the native concentration, while an inhibitor capable of irreversibly binding to a polypeptide is Can be added at a concentration similar to.

【0143】 このようなスクリーニングおよび実験は、本発明のポリヌクレオチドに対応す
る遺伝子またはcDNAによってコードされる、レセプターのような新規なポリ
ぺプチド結合パートナー、および新規な結合パートナーの少なくとも1つのペプ
チドアゴニストまたはアンタゴニストの同定を導き得る。このようなアゴニスト
およびアンタゴニストは、レセプターがネイティブである細胞において、または
遺伝子操作の結果としてレセプターを保持する細胞において、レセプター機能を
調節、増強、または阻害するために使用され得る。さらに、新規なレセプターは
公知のレセプターと生物学的に重要な特徴を共有する場合、アゴニスト/アンタ
ゴニスト結合についての情報は、公知のレセプターの改善されたアゴニスト/ア
ンタゴニストの開発を容易にし得る。
Such screens and experiments are performed to detect novel polypeptide binding partners, such as receptors, encoded by a gene or cDNA corresponding to a polynucleotide of the invention, and at least one peptide agonist of the novel binding partner. Alternatively, it may lead to the identification of antagonists. Such agonists and antagonists can be used to modulate, enhance, or inhibit receptor function in cells where the receptor is native or in cells which retain the receptor as a result of genetic engineering. Moreover, where the novel receptor shares biologically important characteristics with known receptors, information about agonist / antagonist binding may facilitate the development of improved agonist / antagonists of known receptors.

【0144】 (薬学的組成物および治療学的使用) 本発明の薬学的組成物は、治療学的に有効な量において、特許請求の範囲に記
載されている発明のポリぺプチド、抗体、またはポリヌクレオチド(アンチセン
スヌクレオチドおよびリボザイムを含む)を含み得る。本明細書中で使用される
ように用語「治療学的に有効な量」は、所望の疾患もしくは状態を処置、軽減、
または予防するための、または検出可能な治療学的または予防的効果を示すため
の、治療学的薬剤の量をいう。効果は、例えば、化学マーカーまたは抗原レベル
によって検出され得る。治療学的効果はまた、体温の低下のような身体的症状に
おける減少を含む。被験体についての正確な有効量は、被験体の大きさおよび健
常度、状態の性質および程度、ならびに投与のために選択される治療薬または治
療薬の組合せに依存する。従って、正確な有効量を予め特定することは有用でな
い。しかし、所定の状態についての有効量は、日常的な実験によって決定され、
および臨床医の判断の範囲内である。本発明の目的のために、有効用量は、一般
に、これが投与される個体において、約0.01mg/kg〜50mg/kg、
または0.05mg/kg〜約10mg/kgのDNA構築物である。
Pharmaceutical Compositions and Therapeutic Uses The pharmaceutical compositions of the present invention comprise a therapeutically effective amount of a polypeptide, antibody, or of the claimed invention. Polynucleotides may be included, including antisense nucleotides and ribozymes. The term “therapeutically effective amount” as used herein treats, alleviates a desired disease or condition,
Or, refers to the amount of a therapeutic agent to prevent, or to exhibit a detectable therapeutic or prophylactic effect. Effects can be detected by, for example, chemical markers or antigen levels. The therapeutic effect also includes a decrease in physical symptoms such as decreased body temperature. The precise effective amount for a subject will depend on the subject's size and health, the nature and extent of the condition, and the therapeutic agent or combination of therapeutic agents selected for administration. Therefore, it is not useful to pre-determine the exact effective amount. However, the effective amount for a given condition is determined by routine experimentation,
And within the judgment of the clinician. For purposes of this invention, an effective dose is generally about 0.01 mg / kg to 50 mg / kg in the individual to whom it is administered,
Or 0.05 mg / kg to about 10 mg / kg DNA construct.

【0145】 薬学的組成物はまた、薬学的に受容可能なキャリアを含み得る。用語「薬学的
に受容可能なキャリア」は、抗体またはポリぺプチドのような治療学的薬剤、遺
伝子、および他の治療学的薬剤の投与のためのキャリアをいう。この用語は、組
成物を受ける個体に有害な抗体の生成をそれ自身誘導せず、および過度の毒性を
伴わずに投与され得る任意の薬学的キャリアをいう。適切なキャリアは、タンパ
ク質、多糖、ポリ乳酸、ポリグリコール酸、ポリマーアミノ酸、アミノ酸コポリ
マー、および不活性なウイルス粒子のような大きな、ゆっくりと代謝される高分
子であり得る。このようなキャリアは当業者に周知である。治療学的組成物にお
ける薬学的に受容可能なキャリアは、水、生理食塩水、グリセロール、およびエ
タノールのような液体を含み得る。湿潤化剤または乳化剤、pH緩衝化剤などの
ような補助物質もまた、このようなビヒクルに存在し得る。代表的に、治療学的
組成物は、注射可能な、液体溶液または懸濁液のいずれかとして調製され;注射
の前に液体ビヒクル中に入れて溶液または懸濁液とするのに適切な固体形態もま
た、調製され得る。リポソームは、薬学的に受容可能なキャリアの規定内に含ま
れる。薬学的に受容可能な塩もまた、薬学的組成物中に存在し得る(例えば、塩
化水素塩、臭化水素塩、リン酸塩、硫酸塩などのような無機酸塩;および酢酸塩
、プロピオン酸塩、マロン酸塩、安息香酸塩などのような有機酸の塩)。薬学的
に受容される腑形剤の徹底的な考察は、Remington’s Pharma
ceutical Sciences(Mack Pub. Co.、N.J. 1991)において利用可能である。
The pharmaceutical composition may also include a pharmaceutically acceptable carrier. The term "pharmaceutically acceptable carrier" refers to a carrier for administration of therapeutic agents such as antibodies or polypeptides, genes, and other therapeutic agents. The term refers to any pharmaceutical carrier that does not itself induce the production of antibodies harmful to the individual receiving the composition and can be administered without undue toxicity. Suitable carriers can be large, slowly metabolized macromolecules such as proteins, polysaccharides, polylactic acids, polyglycolic acids, polymeric amino acids, amino acid copolymers, and inactive virus particles. Such carriers are well known to those of ordinary skill in the art. Pharmaceutically acceptable carriers in therapeutic compositions may include liquids such as water, saline, glycerol and ethanol. Auxiliary substances such as wetting or emulsifying agents, pH buffering agents and the like, may also be present in such vehicles. Typically, therapeutic compositions are prepared as either injectable, liquid solutions or suspensions; solid forms suitable for solution or suspension in liquid vehicles prior to injection. Forms can also be prepared. Liposomes are included within the definition of pharmaceutically acceptable carriers. Pharmaceutically acceptable salts may also be present in pharmaceutical compositions (eg, inorganic salts such as hydrogen chloride, hydrobromide, phosphates, sulphates and the like; and acetates, propiones. Salts of organic acids such as acid salts, malonates, benzoates, etc.). A thorough discussion of pharmaceutically acceptable excipients can be found in Remington's Pharma.
available in Scientific Sciences (Mack Pub. Co., NJ 1991).

【0146】 (送達方法)一旦処方されると、本発明の組成物は、(1)被験体に直接的に
投与され得る(例えば、ポリヌクレオチドまたはポリぺプチドとして)か;また
は(2)被験体に由来する細胞にエクスビボで送達され得る(例えば、エクスビ
ボ遺伝子治療におけるように)。組成物の直接的な送達は一般に、非経口注射(
例えば、皮下、腹腔内、静脈内もしくは筋肉内、腫瘍内、または組織の間質腔へ
の)によって達成される。投与の他の態様としては、経口投与および肺投与、坐
薬、および経皮適用、針、および遺伝子銃またはハイポスプレイが挙げられる。
投薬処置は、単回用量スケジュールまたは複数用量スケジュールであり得る。
Methods of Delivery Once formulated, the compositions of the invention can be (1) directly administered to a subject (eg, as a polynucleotide or polypeptide); or (2) a subject. It can be delivered ex vivo to cells from the body (eg, as in ex vivo gene therapy). Direct delivery of the composition is generally by parenteral injection (
For example, subcutaneously, intraperitoneally, intravenously or intramuscularly, intratumorally, or into the interstitial space of tissue). Other modes of administration include oral and pulmonary administration, suppositories, and transdermal applications, needles, and gene guns or hypospray.
Dosage treatment may be a single dose schedule or a multiple dose schedule.

【0147】 エクスビボ送達および被験体への形質転換された細胞の再移植のための方法は
、当該分野において公知であり、ならびに例えば、国際公開第WO93/147
78号において記載される。イクスビボ適用において有用な細胞の例としては、
例えば、幹細胞、特に造血幹細胞、リンパ細胞、マクロファージ、樹状細胞、ま
たは腫瘍細胞が挙げられる。一般に、エクスビボおよびインビトロ適用のための
核酸の送達は、例えば、デキストラン媒介性のトランスフェクション、リン酸カ
ルシウム沈澱、ポリブレン媒介性のトランスフェクション、プロトプラスト融合
、電気泳動、リポソーム中のポリヌクレオチドのカプセル化、および核へのDN
Aの直接的なマイクロインジェクションによって達成され得、全て当該分野にお
いて周知である。
Methods for ex vivo delivery and reimplantation of transformed cells into a subject are known in the art, and, eg, WO 93/147.
No. 78. Examples of cells useful in ex vivo applications include:
Examples include stem cells, especially hematopoietic stem cells, lymphoid cells, macrophages, dendritic cells, or tumor cells. In general, delivery of nucleic acids for ex vivo and in vitro applications includes, for example, dextran-mediated transfection, calcium phosphate precipitation, polybrene-mediated transfection, protoplast fusion, electrophoresis, encapsulation of polynucleotides in liposomes, and nuclear. DN to
A can be achieved by direct microinjection of A, all well known in the art.

【0148】 一旦、本発明のポリヌクレオチドに対応する遺伝子が、新生物、形成異常、お
よび過形成のような、増殖障害と相関することが見出されると、障害は、提供さ
れるポリヌクレオチド、対応するポリぺプチド、または他の対応する分子(例え
ば、アンチセンス、リボザイムなど)に基づく治療学的薬剤の投与による処置に
影響を受けやすい。
Once the gene corresponding to the polynucleotide of the invention is found to correlate with proliferative disorders, such as neoplasia, dysplasia, and hyperplasia, the disorder is the provided polynucleotide, corresponding Are susceptible to treatment by administration of a therapeutic agent based on a polypeptide or other corresponding molecule (eg, antisense, ribozyme, etc.).

【0149】 本発明の薬学的組成物の投与の用量および手段は、治療学的組成物の特異的な
質、患者の状態、年齢、および体重、疾患の進行、ならびに他の関連の因子に基
づいて決定される。例えば、本発明のポリヌクレオチド治療学的組成物薬剤の投
与は、局所投与または全身投与を含み、注射、経口投与、パーティクルガン、ま
たはカテーテル法による投与、および局所的な投与が挙げられる。好ましくは、
治療学的ポリヌクレオチド組成物は、本明細書中に開示されるポリヌクレオチド
の少なくとも12、22、25、30、または35の連続したntのポリヌクレ
オチドに作動可能に連結されるプロモーターを含有する発現構築物を含む。種々
の方法が、治療学的組成物を身体の特定の部位に直接的に投与するために使用さ
れ得る。例えば、小さな転移性病変が位置づけられ、そして治療学的組成物は、
腫瘍の体内のいくつかの異なる位置において数回注射される。あるいは、腫瘍を
作用する動脈が同定され、そして治療学的組成物は、組成物を腫瘍に直接的に送
達するために、このような動脈に注射される。壊死癌を有する腫瘍は吸引され、
そして組成物は、腫瘍のいまや空の中心に直接的に注射される。アンチセンス組
成物は、例えば、組成物の局所的な適用によって腫瘍の表面に直接的に投与され
る。X線画像化は、特定の上述の送達法を補助するために使用される。
The dose and means of administration of the pharmaceutical compositions of the present invention will be based on the specific quality of the therapeutic composition, the condition, age and weight of the patient, disease progression, and other relevant factors. Will be decided. For example, administration of the polynucleotide therapeutic composition agents of the invention includes local or systemic administration, including injection, oral administration, particle gun, or catheterization, and topical administration. Preferably,
The therapeutic polynucleotide composition comprises an expression containing a promoter operably linked to at least 12, 22, 25, 30, or 35 contiguous nt polynucleotides of the polynucleotides disclosed herein. Includes constructs. Various methods can be used to administer the therapeutic composition directly to a specific site in the body. For example, a small metastatic lesion is located and the therapeutic composition is
It is injected several times at several different locations within the body of the tumor. Alternatively, the tumor-acting artery is identified and the therapeutic composition is injected into such artery to deliver the composition directly to the tumor. Tumors with necrotic cancer are aspirated,
The composition is then injected directly into the now empty center of the tumor. The antisense composition is administered directly to the surface of the tumor, for example by topical application of the composition. X-ray imaging is used to aid in certain of the above delivery methods.

【0150】 アンチセンスポリヌクレオチド、サブゲノムポリヌクレオチド、または特定の
組織に対する抗体を含有する治療学的組成物のレセプター媒介性の標的化送達が
また、使用され得る。レセプター媒介性のDNA送達技術は、例えば、Find
eisら、Trends Biotechnol.(1993)11:202;
Chiouら、Gene Therapeutics:Methods And
Applications Of Direct Gene Transfe
r(J.A.Wolff編)(1994);Wuら、J. Biol. Che
m.(1988)263:621;Wuら、J. Biol. Chem.(1
994)269:542;Zenkeら、Proc. Natl. Acad.
Sci.(USA)(1990)87:3655;Wuら、J. Biol.
Chem.(1991)266:338において記載される。ポリヌクレオチ
ドを含有する治療学的組成物は、遺伝子治療プロトコルにおける局所投与につい
て、約100ng〜約200mgのDNAの範囲において投与される。約500
ngから約50mg、約1μg〜約2mg、約5μg〜約500μg、および約
20μg〜約100μgのDNAの濃度範囲はまた、遺伝子治療プロトコルの間
に使用され得る。作用の(例えば、コードされる遺伝子産物のレベルを増強する
または阻害するための)方法、形質転換および発現の効力のような因子は、アン
チセンスサブゲノムポリヌクレオチドの最大の効力のために必要とされる投薬量
を影響する考慮すべき事柄である。組織のより大きな領域にわたってより優れた
発現が所望される場合、アンチセンスサブゲノムポリヌクレオチドのより多くの
量、もしくは投与の継続的なプロトコルにおいて再投与される同じ量、または例
えば、腫瘍部位の異なる近接のまたは近い組織部分への数回の投与が、ポジティ
ブな治療学的結果を達成するために必要とされ得る。全ての場合において、臨床
試験における日常的な実験は、至適な治療学的効果についての特定の範囲を決定
する。抗炎症活性を有するポリぺプチドまたはタンパク質をコードするポリヌク
レオチド関連性の遺伝子についての、適切な使用、用量、および投与は、米国特
許第5,654,173号において記載される。
Receptor-mediated targeted delivery of therapeutic compositions containing antisense polynucleotides, subgenomic polynucleotides, or antibodies to specific tissues can also be used. Receptor-mediated DNA delivery techniques are described, for example, in Find.
eis et al., Trends Biotechnol. (1993) 11: 202;
Chiou et al., Gene Therapeutics: Methods And
Applications Of Direct Gene Transfer
r (JA Wolff eds.) (1994); Wu et al. Biol. Che
m. (1988) 263: 621; Wu et al., J. Am. Biol. Chem. (1
994) 269: 542; Zenke et al., Proc. Natl. Acad.
Sci. (USA) (1990) 87: 3655; Wu et al. Biol.
Chem. (1991) 266: 338. Therapeutic compositions containing polynucleotides are administered in the range of about 100 ng to about 200 mg of DNA for topical administration in gene therapy protocols. About 500
Concentration ranges of ng to about 50 mg, about 1 μg to about 2 mg, about 5 μg to about 500 μg, and about 20 μg to about 100 μg of DNA can also be used during gene therapy protocols. Factors such as methods of action (eg, for enhancing or inhibiting levels of the encoded gene product), transformation and expression potency are required for maximal potency of the antisense subgenomic polynucleotides. It is a consideration that affects the dosage that is given. If better expression is desired over a larger area of tissue, a higher amount of antisense subgenomic polynucleotide, or the same amount re-administered in a continuous protocol of administration, or, for example, at different tumor sites Several doses to adjacent or near tissue parts may be required to achieve a positive therapeutic result. In all cases, routine experimentation in clinical trials will determine a particular range for optimal therapeutic effect. Suitable uses, doses, and administrations for polynucleotide-related genes encoding polypeptides or proteins with anti-inflammatory activity are described in US Pat. No. 5,654,173.

【0151】 本発明の治療学的ポリヌクレオチドおよびポリぺプチドは、遺伝子送達ビヒク
ルを使用して送達され得る。遺伝子送達ビヒクルは、ウイルス起源または非ウイ
ルス起源であり得る(概して、Jolly、Cancer Gene Ther
apy(1994)1:51;Kimura、Human Gene Ther
apy(1994)5:845;Connelly、Human Gene T
herapy(1995)1:815;およびKaplitt、Nature
Genetics(1994)6:148を参照のこと)。このようなコード配
列の発現は、内因性の哺乳動物または異種プロモーターを使用して誘導され得る
。コード配列の発現は、構成的または調節性のいずれかであり得る。
The therapeutic polynucleotides and polypeptides of the present invention can be delivered using gene delivery vehicles. Gene delivery vehicles can be of viral or non-viral origin (generally Jolly, Cancer Gene Ther.
apy (1994) 1:51; Kimura, Human Gene Ther.
apy (1994) 5: 845; Connelly, Human Gene T.
herapy (1995) 1: 815; and Kaplitt, Nature.
Genetics (1994) 6: 148). Expression of such coding sequences can be induced using endogenous mammalian or heterologous promoters. Expression of the coding sequence can be either constitutive or regulated.

【0152】 所望のポリヌクレオチドの送達のためのウイルスベースのベクター、および所
望の細胞における発現は、当該分野において周知である。例示的なウイルスベー
スのベヒクルとしては、組換えレトロウイルス(例えば、WO90/07936
;WO94/03622;WO93/25698;WO93/25234;米国
特許第5,219,740号;WO93/11230;WO93/10218;
米国特許第4,777,127号;英国特許第2,200,651号;EP 0 345 242;およびWO91/02805を参照のこと)、αウイルスベ
ースのベクター(例えば、シンドビスウイルスベクター、セムリキ森林ウイルス
(ATCC VR−67;ATCC VR−1247)、ロスリバーウイルス(
ATCC VR−373;ATCC VR−1246)、およびベネズエラウマ
脳炎ウイルス(ATCC VR−923;ATCC VR−1250;ATCC VR 1249;ATCC VR−532)、およびアデノ随伴ウイルス(A
AV)ベクター(例えば、WO94/12649、WO93/03769;WO
93/19191;WO94/28938;WO95/11984、およびWO
95/00655を参照のこと)が挙げられるが、これらに制限されない。Cu
riel. Hum. Gene Ther.(1992)3:147において
記載されるような殺傷されたアデノウイルスに連結されるDNAの投与もまた、
用いられ得る。
Viral-based vectors for delivery of desired polynucleotides and expression in desired cells are well known in the art. Exemplary virus-based vehicles include recombinant retroviruses (eg, WO90 / 07936).
WO94 / 03622; WO93 / 25698; WO93 / 25234; US Patent No. 5,219,740; WO93 / 11230; WO93 / 10218;
See U.S. Patent No. 4,777,127; British Patent No. 2,200,651; EP 0 345 242; and WO 91/02805), alphavirus-based vectors (e.g., Sindbis virus vector, Semliki Forest). Virus (ATCC VR-67; ATCC VR-1247), Ross River virus (
ATCC VR-373; ATCC VR-1246), and Venezuelan Equine Encephalitis virus (ATCC VR-923; ATCC VR-1250; ATCC VR 1249; ATCC VR-532), and adeno-associated virus (A).
AV) vector (eg, WO94 / 12649, WO93 / 03769; WO
93/19191; WO94 / 28938; WO95 / 11984, and WO
95/00655), but is not limited thereto. Cu
riel. Hum. Gene Ther. (1992) 3: 147, administration of DNA linked to a killed adenovirus is also
Can be used.

【0153】 非ウイルス送達ベヒクルおよび方法がまた、用いられ得、殺傷されたアデノウ
イルス単独に連結されるかまたは連結されないポリカチオン性の濃縮されたDN
A(例えば、Curiel,Hum. Gene Ther.(1992)3:
147を参照のこと);リガンド連結化DNA(例えば、Wu、J. Biol
. Chem.(1989)264:16985を参照のこと);真核生物細胞
送達ベヒクル細胞(例えば、米国特許第5,814,482号;WO95/07
994;WO96/17072;WO95/30763;およびWO97/42
338を参照のこと)、ならびに核電荷中和化、または細胞膜との融合が挙げら
れるがこれらに制限されない。裸のDNAもまた、用いられ得る。例示的な裸の
DNAの導入方法は、WO90/11092および米国特許第5,580,85
9号において記載される。遺伝子送達ベヒクルとして作用し得るリポソームは、
米国特許第5,422,120号;WO95/13796号;WO94/236
97;WO91/14445;およびEP 0524968において記載される
。さらなるアプローチは、Philip、Mol. Cell. Biol.(
1994)14:2411、およびWoffendin、Proc. Natl
. Acad. Sci.(1994)91:1581において記載される。
Non-viral delivery vehicles and methods can also be used, polycationic enriched DN, with or without ligation to killed adenovirus alone.
A (eg Curiel, Hum. Gene Ther. (1992) 3:
147); ligand-ligated DNA (eg, Wu, J. Biol.
. Chem. (1989) 264: 16985); eukaryotic cell delivery vehicle cells (eg, US Pat. No. 5,814,482; WO95 / 07).
994; WO96 / 17072; WO95 / 30763; and WO97 / 42
338), as well as, but not limited to, nuclear charge neutralization, or fusion with cell membranes. Naked DNA can also be used. Exemplary naked DNA introduction methods are described in WO 90/11092 and US Pat. No. 5,580,85.
No. 9 is described. Liposomes that can act as gene delivery vehicles are
U.S. Pat. No. 5,422,120; WO95 / 13796; WO94 / 236
97; WO 91/14445; and EP 0524968. A further approach is described by Philip, Mol. Cell. Biol. (
1994) 14: 2411, and Woffendin, Proc. Natl
. Acad. Sci. (1994) 91: 1581.

【0154】 使用のために適切なさらなる非ウイルス送達は、Woffendinら、Pr
oc. Natl. Acad. Sci. USA(1994)91(24)
:11581において記載されるアプローチのような機械的送達系を含む。さら
に、コード配列およびこのような配列の発現の産物は、光重合化ヒドロゲル材料
の沈着または電離放射線の使用を介して送達され得る(例えば、米国特許第5,
206,152号およびWO92/11033を参照のこと)。コード配列の送
達のために使用され得る遺伝子送達のための他の従来の方法としては、例えば、
手持ちの遺伝子移入パーティクルガン(例えば、米国特許第5,149,655
号を参照のこと)の使用;移入された遺伝子の活性化のための電離放射線の使用
(例えば、米国特許第5,206,152号およびWO92/11033を参照
のこと)が挙げられる。
Additional non-viral delivery suitable for use is described by Woffendin et al., Pr.
oc. Natl. Acad. Sci. USA (1994) 91 (24)
: 11581, including mechanical delivery systems. In addition, the coding sequences and the products of expression of such sequences can be delivered through the deposition of photopolymerized hydrogel materials or the use of ionizing radiation (eg, US Pat.
206, 152 and WO 92/11033). Other conventional methods for gene delivery that may be used for delivery of coding sequences include, for example:
Hand-held gene transfer particle gun (see, eg, US Pat. No. 5,149,655)
Use of ionizing radiation for activation of transferred genes (see, eg, US Pat. No. 5,206,152 and WO 92/11033).

【0155】 本発明は、特に有利な実施態様を記載する以下の実施例を参照することによっ
て、今や説明される。しかし、これらの実施態様は説明であって、本発明を制限
するとしてはいかようにも解釈されないことに、留意されるべきである。
The invention will now be illustrated by reference to the following examples which describe particularly advantageous embodiments. However, it should be noted that these embodiments are illustrative and are not to be construed as limiting the invention in any way.

【0156】 (実施例) 以下の実施例は、例証の目的のために主に提供される。本発明の処方物、投与
量、投与の方法および他のパラメーターが、本発明の精神および範囲より逸脱せ
ずに、種々の方法においてさらに改変され得るか、もしくは置換され得るという
ことが当業者に対して容易に明らかである。
Examples The following examples are provided primarily for purposes of illustration. It will be apparent to those skilled in the art that the formulations, dosages, methods of administration and other parameters of the present invention can be further modified or substituted in various ways without departing from the spirit and scope of the invention. In contrast, it is easily apparent.

【0157】 (実施例1:生物学的材料の供給源および生物学的材料によって発現される新
規なポリヌクレオチドの概要) cDNAライブラリーを、ヒト結腸癌細胞株Km12L4−A(Morika
waら、Cancer Research(1998)48:6863)、KM
12C(Morikawaら、Cancer Res.(1988)48:19
43−1948)、またはMDA−MB−231(Brinkleyら、Can
cer Res.(1980)40:3118−3129)のいずれかから構築
し、これらの細胞を、細胞から単離されたmRNAからcDNAライブラリーを
構築するために使用した。これらの細胞株によって発現される配列を単離し、そ
して分析し;ほとんどの配列は、約275〜300ヌクレオチド長であった。K
M12L4−A細胞株は、KM12C細胞株に由来する。KM12C細胞株は、
不十分な転移性(低い転移性)であり、Duke病期B2の外科的標本からの培
養物において樹立された(Morikawaら、Cancer Res.(19
88)48:6863)。KML4−Aは、KM12Cに由来する非常に転移性
の亜株である(Yeatmanら、Nucl. Acids. Res.(19
95)23:4007;Bao−Lingら、Proc.Annu. Meet
. Am. Assoc. Cancer. Res.(1995)21:32
69)。KM12CおよびKM12C由来の細胞株(例えば、KM12L4、K
M12L4−Aなど)は、結腸癌の研究についてのモデル細胞株として当該分野
において十分に認識される(例えば、Moriakawaら、前出;Radin
skyら、Clin. Cancer Res.(1995)1:19;Yea
tmanら(1995)前出;Yeatmanら、Clin. Exp. Me
tastasis(1996)14:246を参照のこと)。MDA−MB−2
31細胞株は、胸水から元来単離され(Cailleau、J. Natl.
Cancer Inst.(1974)53:661)、高い転移可能性であり
、そして乳癌と一致してヌードマウスにおいて不十分に分化した腺癌病期(gr
ade)IIを形成する。
Example 1 Source of Biological Material and Overview of Novel Polynucleotides Expressed by Biological Material A cDNA library was constructed using the human colon cancer cell line Km12L4-A (Morika).
wa et al., Cancer Research (1998) 48: 6863), KM.
12C (Morikawa et al., Cancer Res. (1988) 48:19.
43-1948), or MDA-MB-231 (Brinkley et al., Can.
cer Res. (1980) 40: 3118-3129) and these cells were used to construct a cDNA library from mRNA isolated from the cells. The sequences expressed by these cell lines were isolated and analyzed; most sequences were approximately 275-300 nucleotides in length. K
The M12L4-A cell line is derived from the KM12C cell line. The KM12C cell line
Poor metastasis (low metastasis), established in cultures from Duke stage B2 surgical specimens (Morikawa et al. Cancer Res. (19).
88) 48: 6863). KML4-A is a highly metastatic substrain derived from KM12C (Yatman et al., Nucl. Acids. Res. (19
95) 23: 4007; Bao-Ling et al., Proc. Annu. Meet
. Am. Assoc. Cancer. Res. (1995) 21:32
69). KM12C and KM12C-derived cell lines (eg, KM12L4, K
M12L4-A) is well recognized in the art as a model cell line for the study of colon cancer (eg Morikawa et al., Supra; Radin.
sky et al., Clin. Cancer Res. (1995) 1:19; Yea
tman et al. (1995) supra; Yetman et al., Clin. Exp. Me
astasis (1996) 14: 246). MDA-MB-2
The 31 cell line was originally isolated from pleural effusion (Cailleau, J. Natl.
Cancer Inst. (1974) 53: 661), highly metastatic, and poorly differentiated adenocarcinoma stage (gr) in nude mice consistent with breast cancer.
ade) II is formed.

【0158】 単離されたポリヌクレオチドの配列を、XBLASTマスキングプログラム(
Claverie「Effective Large−Scale Seque
nce Similarity Searches」Computer Met
hods for Macromolecular Sequence Ana
lysis、Doolitte編、Meth. Enzymol. 266:2
12−227 Academic Press、NY、NY(1996);特に
、Claverie、「Automated DNA Sequencing
and Analysis Techniques」Adamsら編、第36章
、267頁 Academic Press、San Diego、1994、
およびClaverieら、Comput. Chem.(1993)17:1
91を参照のこと)を使用して、先ずマスクし、低い複雑性の配列を排除した。
一般に、マスキングは、配列の低い複雑性に起因して比較的小さい目的の配列を
排除すること、および複数の配列に共通の反復領域(例えば、Alu反復)に対
する類似性に基づいて複数の「ヒット」を排除すること以外は、最終的な検索結
果に影響しない。マスキングは、43個の配列の排除を生じた。次いで、残りの
配列をBLASTN対GenBank検索において使用し;70%よりも大きい
重複、99%の同一性、および1×10-40未満のp値を示す配列を排除した。
この検索からの配列はまた、包括的なパラメーターが適合した場合に排除された
が、この配列はリボソーム由来またはベクター由来であった。
The sequence of the isolated polynucleotide was sequenced using the XBLAST masking program (
Claverie "Effective Large-Scale Sequence"
nce Similarity Searches "Computer Met
hods for Macromolecular Sequence Ana
Lysis, edited by Doolite, Meth. Enzymol. 266: 2
12-227 Academic Press, NY, NY (1996); in particular, Claverie, "Automated DNA Sequencing.
and Analysis Techniques "Adams et al., Ed., Chapter 36, p. 267 Academic Press, San Diego, 1994,
And Claverie et al., Comput. Chem. (1993) 17: 1
91)) was used to mask first and eliminate low complexity sequences.
In general, masking excludes relatively small sequences of interest due to the low complexity of the sequences, and multiple “hits” based on similarity to repeat regions common to multiple sequences (eg, Alu repeats). It does not affect the final search results, except for the exclusion of "." Masking resulted in the exclusion of 43 sequences. The remaining sequences were then used in a BLASTN vs. GenBank search; sequences showing greater than 70% overlap, 99% identity, and p-value less than 1 × 10 −40 were excluded.
The sequences from this search were also excluded if the global parameters were matched, but the sequences were either ribosome-derived or vector-derived.

【0159】 以前の検索から得られた配列を3つの群(以下の1、2、および3)に分類し
、そしてBLASTX対NRP(非重複性のタンパク質)データベース検索にお
いて検索した:(1)未知(GenBank検索におけるヒットなし)、(2)
弱い類似性(45%を超える同一性および1×10-5未満のp値)、ならびに(
3)高い類似性(60%を超える重複、80%を超える同一性、および1×10-5 未満のp値)。70%を超える重複、99%を超える同一性、および1×10-40 未満のp値を有する配列を排除した。
Sequences obtained from previous searches were grouped into three groups (1, 2, and 3 below) and searched in a BLASTX vs. NRP (non-redundant protein) database search: (1) unknown (No hit in GenBank search), (2)
Weak similarity (greater than 45% identity and p-value less than 1 × 10 −5 ), and (
3) High similarity (> 60% duplication,> 80% identity, and p-value <1 x 10-5 ). Sequences with greater than 70% overlap, greater than 99% identity, and p-value less than 1 × 10 −40 were excluded.

【0160】 残りの配列を、未知(ヒットなし)、弱い類似性、および高い類似性(上述の
ようなパラメーター)として分類した。2つの検索を、これらの配列に対して行
った。先ず、BLAST対ESTデータベース検索を行い、そして99%を超え
る重複、99%を超える類似性、および1×10-40未満のp値を有する配列を
排除した。ヒト起源のデータベース配列に比較される場合、1×10-65未満の
p値を有する配列もまた排除された。第2に、BLASTN対Patent G
eneSeqデータベースを行い、そして99%を超える同一性、1×10-40
未満のp値、および99%を超える重複を有する配列を排除した。
The remaining sequences were classified as unknown (no hit), weak similarity, and high similarity (parameters as above). Two searches were performed on these sequences. First, a BLAST vs. EST database search was performed and sequences with> 99% overlap,> 99% similarity, and p-value <1 × 10 −40 were excluded. Sequences with p-values less than 1 × 10 −65 when compared to database sequences of human origin were also excluded. Second, BLASTN vs. Patent G
done eneSeq database and greater than 99% identity, 1 × 10 -40
Sequences with p-values less than, and greater than 99% duplication were excluded.

【0161】 残りの配列を、データセットにおける他の規則および重複性を使用するスクリ
ーニングに供した。ヒト起源のデータベース配列に関して1×10-111未満のp
値を有する配列を特異的に排除した。最終的な結果は、添付の配列表において配
列番号1〜982として列挙され、および表1A(特許請求の範囲の前に挿入さ
れる)においてまとめられる、982個の配列を提供した。各同定されたポリヌ
クレオチドは、少なくとも部分的なmRNA転写物からの配列を示す。
The remaining sequences were subjected to screening using other rules and redundancy in the dataset. P less than 1 × 10 −111 for database sequences of human origin
Sequences with values were specifically excluded. The final results provided 982 sequences, listed as SEQ ID NOS: 1-982 in the attached sequence listing and summarized in Table 1A (inserted before the claims). Each identified polynucleotide represents a sequence from at least a partial mRNA transcript.

【0162】 表1Aは以下を提供する:1)本明細書における使用のために各配列に割り当
てられる配列番号;2)配列が始めて出願された米国の優先特許出願の出願日;
3)優先出願に割り当てられた代理人整理番号(内部使用のため);4)優先出
願における配列に割り当てられた配列番号;5)配列の内部識別子として使用さ
れる配列名;および6)配列が単離されたクローンに割り当てられた名前。提供
されるポリヌクレオチドが部分的なmRNA転写物を示すので、本発明の2つ以
上のポリヌクレオチドは、同じmRNA転写物および同じ遺伝子の異なる領域を
示し得る。従って、2つ以上の配列番号は同じクローンに属するとして同定され
る場合、いずれかの配列は、全長mRNAまたは全長遺伝子を得るために使用さ
れ得る。
Table 1A provides: 1) the SEQ ID NO assigned to each sequence for use herein; 2) the filing date of the US priority patent application in which the sequence was first filed;
3) the agent reference number assigned to the priority application (for internal use); 4) the sequence number assigned to the sequence in the priority application; 5) the sequence name used as the internal identifier of the sequence; and 6) the sequence The name assigned to the isolated clone. Two or more polynucleotides of the invention may represent the same mRNA transcript and different regions of the same gene, as the provided polynucleotides represent partial mRNA transcripts. Thus, if two or more SEQ ID NOs are identified as belonging to the same clone, either sequence can be used to obtain full length mRNA or full length gene.

【0163】 配列番号1〜982の配列を確認するために、自動装置の回収(retrie
val)系を使用してクローンをライブラリーから回収し、そして回収されたク
ローンのインサートを再配列決定した。これらの「確認(validation
)」配列は、配列表において配列番号983〜996として提供され、そして「
確認」配列のまとめは、表1B(特許請求の範囲の前に挿入される)において提
供される。表1Bは以下を提供する:1)本明細書における使用のために各配列
に割り当てられる配列番号;2)得られた「確認」配列に割り当てられたサンプ
ル名;ならびに3)示された「確認」配列を含むクローンの名前。「確認」配列
は、元来の配列と相関し得、これらは、表1Aを参照することによって確認する
。「確認」配列はしばしば、元来のポリヌクレオチド配列よりも長いので、従っ
てさらなる配列情報を提供する。全ての確認配列は、対応するクローン、または
本明細書中に記載されるcDNAライブラリー(例えば、配列表において提供さ
れる配列から設計されるプライマーを使用して)のいずれかから得られ得る。
In order to confirm the sequences of SEQ ID NOs: 1 to 982, an automated device retreat was used.
val) system was used to recover clones from the library and the inserts of the recovered clones were re-sequenced. These "validation (validation
) "Sequences are provided in the sequence listing as SEQ ID NOs: 983-996, and"
A summary of "confirmation" sequences is provided in Table 1B (inserted before the claims). Table 1B provides: 1) the SEQ ID NO assigned to each sequence for use herein; 2) the sample name assigned to the resulting "confirmed"sequence; and 3) the indicated "confirmed". The name of the clone containing the sequence. The "confirmation" sequences can be correlated with the original sequences, which are confirmed by reference to Table 1A. The “confirmation” sequence is often longer than the original polynucleotide sequence and therefore provides additional sequence information. All confirmation sequences can be obtained from either the corresponding clones or the cDNA libraries described herein (eg, using primers designed from the sequences provided in the sequence listing).

【0164】 (実施例2:遺伝子産物の機能を同定するための公的なデータベース検索の結
果) 配列番号1〜1079を、全ての3つのリーディングフレームにおいて翻訳し
、そしてヌクレオチド配列および翻訳されたアミノ酸配列を、GenBank(
ヌクレオチド配列)またはNon−Redundant Protein(アミ
ノ酸配列)データベースのいずれかにおいて、相同な配列について検索するため
の問合せ配列として使用した。問合せ配列および個々の配列を、http://
ww.ncbi.nlm.nih.gov/BLAST/でのworld wi
de webを介して利用可能なBLAST 2.0プログラムを使用して、整
列した(Altschulら、Nucleic Acids Res.(199
7)25:3389−3402をまた参照のこと)。配列を、実施例1において
上記されるように低い複雑性をマスクするためのXBLASTプログラムを使用
して、反復配列またはポリA配列の検索を防ぐために種々の程度にマスクした。
Example 2: Results of a public database search to identify the function of the gene product SEQ ID NOs: 1-1079 were translated in all three reading frames and the nucleotide sequence and translated amino acids Sequence the GenBank (
Nucleotide sequences) or Non-Redundant Protein (amino acid sequence) databases were used as query sequences to search for homologous sequences. The query sequence and individual sequences can be found at http: //
ww. ncbi. nlm. nih. world wi at gov / BLAST /
Aligned using the BLAST 2.0 program available via de web (Altschul et al., Nucleic Acids Res. (199
7) 25: 3389-3402). Sequences were masked to varying degrees to prevent searches for repetitive or poly A sequences using the XBLAST program to mask low complexity as described above in Example 1.

【0165】 表2Aおよび2B(特許請求の範囲の前に挿入される)は、1×10-2以下の
p値を有する整列の要約を提供し、本発明の配列と示される公的なデータベース
の配列との間の実質的な相同性を示す。表2Aは、問合せ配列の配列番号、相同
配列のGenBankデータベース登録の登録(アクセッション)番号、および
整列のp値を提供する。表2Aは、問合せ配列の配列番号、相同配列のNon−
Redundant Proteinデータベース登録の登録番号、および整列
のp値を提供する。表2Aおよび2Bにおいて提供される整列は、本明細書の出
願の直前の時点で、DNA配列またはアミノ酸配列に対して最も良好に利用可能
な整列である。表2Aおよび2Bにおいて列挙される配列番号によってコードさ
れるポリぺプチドの活性は、報告される最近接配列または密接に関連される配列
の活性に実質的に同じであるかまたは実質的に類似であることが、推定され得る
。最も近い配列の登録番号が報告され、最近接配列によって示される活性および
機能に対する公的に利用可能な参照を提供する。それぞれの最近接配列の活性お
よび機能に関する公的な情報は、本出願において参考として援用される。また参
考として援用されるのは、配列、ならびに表2において列挙される最近接配列お
よびそれらの相関する配列の推定の活性および実際の活性ならびに推定の機能お
よび実際の機能に関する全ての公的に利用可能な情報である。整列のために使用
される検索プログラムおよびデータベース、ならびにp値の算定もまた示される
Tables 2A and 2B (inserted before the claims) provide a summary of alignments with p-values of 1 × 10 −2 or less, and the public databases designated sequences of the invention. Shows substantial homology with the sequences of. Table 2A provides the sequence number of the query sequence, the accession number of the GenBank database entry for the homologous sequence, and the p-value for the alignment. Table 2A shows the sequence number of the query sequence and the homologous sequence Non-
It provides the registration number of the Redundant Protein database registration and the p-value of the alignment. The alignments provided in Tables 2A and 2B are the best available alignments for DNA or amino acid sequences at the time just before the filing of the present application. The activity of the polypeptide encoded by the SEQ ID NOs listed in Tables 2A and 2B is substantially the same as or substantially similar to the activity of the reported closest or closely related sequences. It can be assumed that there is. The closest sequence accession number is reported, providing a publicly available reference to the activity and function exhibited by the closest sequence. Public information regarding the activity and function of each closest sequence is incorporated by reference in this application. Also incorporated by reference is the sequence, as well as the putative activity and actual activity of the closest sequences listed in Table 2 and their correlated sequences, and all publicly available uses for putative and actual functions. This is possible information. Also shown are the search programs and databases used for the alignment, and p-value calculations.

【0166】 最近接配列のポリヌクレオチド配列の全長配列またはフラグメントは、対応す
るポリヌクレオチドの全長の配列を同定しかつ単離するために、プローブおよび
プライマーとして使用され得る。最近接配列は、対応するポリヌクレオチドの全
長の配列についてのライブラリーを構築するために使用されるべき組織または細
胞型を示し得る。
Full-length sequences or fragments of the closest polynucleotide sequences can be used as probes and primers to identify and isolate full-length sequences of the corresponding polynucleotides. The closest sequence may indicate the tissue or cell type to be used to construct the library for the full length sequence of the corresponding polynucleotide.

【0167】 (実施例3:本発明のポリヌクレオチドを有する連続する配列の同定) 新規なポリヌクレオチドを使用して、配列番号1〜982のポリヌクレオチド
のいずれかが連続する配列の同定を容易にする(例えば、ポリヌクレオチドが別
のDNA配列の5’伸長を生じる配列を提供して、所定のポリヌクレオチドおよ
び他のDNA配列から構成される、より長い連続する配列の産生を生じる)か否
かを決定するために公に利用可能なデータベースおよび所有されている(pro
prietary)データベースをスクリーニングした。コンティグ化を、Wi
sconsin大学からのGCGのGelmergeアプリケーション(デフォ
ルト設定)を使用して実施した。
Example 3 Identification of Contiguous Sequences Comprising a Polynucleotide of the Invention The novel polynucleotides are used to facilitate the identification of sequences contiguous with any of the polynucleotides of SEQ ID NOs: 1-982. (E.g., the polynucleotide provides a sequence that results in a 5'extension of another DNA sequence, resulting in the production of a longer, contiguous sequence composed of the given polynucleotide and other DNA sequences). Publicly available databases to determine and owned (pro
The database was screened. Wiring the contig
It was performed using GCG's Gelmerge application from Sconsin University (default setting).

【0168】 これらのパラメータを使用して、83のコンティグ化配列を生成した。これら
のコンティグ化配列を、配列番号997〜1079(表1Cを参照のこと)とし
て提供する。表1Cは、コンティグ配列の配列番号、コンティグを作製するため
に使用される配列の名前、およびコンティグを提供する対応する配列名の配列と
ともに使用される、公に利用可能な試験的ヒトコンセンサス(THC)配列の登
録番号を提供する。表1Cの配列名を、使用されるポリヌクレオチドの配列番号
関連付けて、表1Aおよび1Bに参照することによりコンティグを生成し得る。
These parameters were used to generate 83 contigated sequences. These contigated sequences are provided as SEQ ID NOs: 997-1079 (see Table 1C). Table 1C provides the publicly available test human consensus (THC) used with the sequence number of the contig sequence, the name of the sequence used to make the contig, and the sequence of the corresponding sequence name that provides the contig. ) Provide the accession number of the sequence. The contigs can be generated by associating the sequence names in Table 1C with the SEQ ID numbers of the polynucleotides used and referring to Tables 1A and 1B.

【0169】 コンティグ化配列(配列番号997〜1079)は、本発明の別のポリヌクレ
オチド配列を含む、より長い配列を示す。次いで、コンティグ化した配列を3つ
の全てのリーディングフレーム中で翻訳して、上記のようなBLASTプログラ
ムを用いて、個々の配列との最善の整列を決定した。この配列を、実施例1にお
いて上記に記載されるような低い複雑性をマスキングするためのXBLASTプ
ログラムを用いてマスキングした。以下でより詳細に記載されるように、いくつ
かのコンティグ化配列は、公知のタンパク質ファミリーに属するポリペプチドの
特徴を有し(従って、これらのタンパク質ファミリーの新たなメンバーを示す)
、および/または公知の機能的ドメイン(以下の実施例4および表3を参照のこ
と)を含む、ポリペプチドをコードすることが見出された。従って、本発明は、
本明細書中で同定されるタンパク質ファミリーおよび/または機能的ドメインに
関連する生物学的活性を保持するこのようなポリヌクレオチドのフラグメント、
融合物、ならびに改変体を包含する。
Contigated sequences (SEQ ID NOs: 997-1079) represent longer sequences that include another polynucleotide sequence of the invention. The contigated sequences were then translated in all three reading frames and the BLAST program as described above was used to determine the best alignment with the individual sequences. This sequence was masked using the XBLAST program for masking low complexity as described above in Example 1. As described in more detail below, some contiguous sequences have the characteristics of polypeptides belonging to known protein families (thus indicating new members of these protein families).
, And / or a known functional domain (see Example 4 and Table 3 below). Therefore, the present invention provides
A fragment of such a polynucleotide that retains a biological activity associated with the protein family and / or functional domain identified herein,
Fusions, as well as variants are included.

【0170】 (実施例4:タンパク質ファミリーのメンバー) 配列番号1〜1079を、上述に本明細書中で記載されるように、プロフィー
ル検索を行うために使用した。本発明のポリヌクレオチドのいくつかは、公知の
タンパク質ファミリーに属するポリぺプチドの特徴を有し(従って、これらのタ
ンパク質ファミリーの新たなメンバー(nmembers)を示す)、および/
または公知の機能的なドメインを含む、ポリぺプチドをコードすることが見出さ
れた。表3(特許請求の範囲の前に挿入される)は、問合せ配列の配列番号、プ
ロフィールヒットの簡単な記載、個々の配列内の問合せ配列の位置(「開始」お
よび「停止」として示される)、および個々の配列に関する問合せ配列の配向(
方向、「Dir」)を提供し、ここで順方向(for)は、整列が配列表におい
て提供される配列と同じ方向(左から右)においてであることを示し、および逆
方向(rev)は、整列が配列表において提供される配列に相補的な配列を有す
ることを示す。
Example 4: Protein Family Members SEQ ID NOS: 1-1079 were used to perform a profile search, as described herein above. Some of the polynucleotides of the invention have the characteristics of polypeptides belonging to known protein families (thus indicating new members of these protein families), and / or
Alternatively, it has been found to encode a polypeptide containing a known functional domain. Table 3 (inserted before the claims) shows the sequence number of the query sequence, a brief description of the profile hits, the position of the query sequence within the individual sequences (designated as "start" and "stop"). , And the orientation of the query sequence for individual sequences (
Direction, "Dir"), where the forward direction (for) indicates that the alignment is in the same direction (left to right) as the sequences provided in the sequence listing, and the reverse direction (rev) is , Shows that the alignment has a sequence complementary to the sequence provided in the sequence listing.

【0171】 いくつかのポリヌクレオチドは、問合せ配列が重複するプロフィール領域を含
む、および/またはこの配列が2つの異なる機能的ドメインを含む、複数のプロ
フィールヒットを示した。表3のそれぞれのプロフィールヒットは、以下でより
詳細に記載される。プロフィールについての略語(カッコ内に提供される)は、
PfamデータベースおよびPrositeデータベースにおけるプロフィール
を同定するために使用された略語である。Pfamデータベースは、以下の任意
のURLS:http://pfam.wustl.edu/index.ht
ml;http://www.sanger.ac.uk/Software/
Pfam/;およびhttp://www.cgr.ki.se/Pfam/を
介してアクセスされ得る。Prositeデータベースは、http://ww
w.expasy.ch/prosite/にてアクセスされ得る。種々のプロ
フィールに関してPfamデータベースおよびPrositeデータベースにお
いて利用可能な公的な情報は、種々のタンパク質ファミリーおよびタンパク質ド
メインの活性、機能、およびコンセンサス配列を含むがこれらに制限されず、本
明細書中に参考として援用される。
Some polynucleotides showed multiple profile hits, including profile regions with overlapping query sequences, and / or this sequence containing two different functional domains. Each profile hit in Table 3 is described in more detail below. Abbreviations for profiles (provided in brackets) are:
Abbreviations used to identify profiles in the Pfam and Prosite databases. The Pfam database can be any of the following URLS: http: // pfam. wastel. edu / index. ht
ml; http: // www. sanger. ac. uk / Software /
Pfam /; and http: // www. cgr. ki. It can be accessed via se / Pfam /. The Prosite database is http: // www
w. expasy. It can be accessed at ch / prosite /. Public information available in the Pfam and Prosite databases for various profiles includes, but is not limited to, the activity, function, and consensus sequences of various protein families and protein domains, and is incorporated herein by reference. Incorporated.

【0172】 (14−3−3ファミリー(14 3 3;Pfam Pfam登録番号PF
00244))配列番号1053は、14−3−3タンパク質ファミリーメンバ
ーをコードする配列に対応する。14−3−3タンパク質ファミリーは、哺乳動
物の脳組織において非常に豊富であるとして最初に同定され、かつニューロン中
に優先的に位置する、密接に関連する約30kDの酸性のホモ二量体タンパク質
の群を含む(Aitkenら、Trends Biochem. Sci.(1
995)20:95−97;Morrison Science(1994)2
66:56−57;およびXiaoら、Nature(1995)376:18
8−191)。14−3−3タンパク質は、複数の生物学的活性を有し、この生
物学的活性は、シグナル伝達経路および細胞周期における重要な役割を含む。1
4−3−3タンパク質は、キナーゼ(例えば、PKCまたはRaf−1)と相互
作用し、ならびにチロシンヒドロキシラーゼおよびトリプトファンヒドロキシラ
ーゼのプロテインキナーゼ依存性のアクチベーターとしてもまた機能し得る。1
4−3−3タンパク質配列は、極めて十分に保存され、そして2つの非常に保存
された領域を含む:第1は、N末端部分において位置される11残基のペプチド
であり;第2は、C末端部分において位置される20アミノ酸領域である。コン
センサスパターンは以下の通りである:1)R−N−L−[LIV]−S−[V
G]−[GA]−Y−[KN]−N−[IVA];2)Y−K−[DE]−S−
T−L−I−[IM]−Q−L−[LF]−[RHC]−D−N−[LF]−T
−[LS]−W−[TAN]−[SAD]。
(14-3-3 Family (1433; Pfam Pfam Registration No. PF
00244)) SEQ ID NO: 1053 corresponds to the sequence encoding the 14-3-3 protein family member. The 14-3-3 protein family was first identified as being highly abundant in mammalian brain tissue and is preferentially located in neurons, a closely related acidic homodimer protein of approximately 30 kD. (Aitken et al., Trends Biochem. Sci. (1
995) 20: 95-97; Morrison Science (1994) 2.
66: 56-57; and Xiao et al., Nature (1995) 376: 18.
8-191). The 14-3-3 protein has multiple biological activities, which include important roles in signaling pathways and the cell cycle. 1
4-3-3 proteins interact with kinases (eg PKC or Raf-1) and may also function as protein kinase-dependent activators of tyrosine hydroxylase and tryptophan hydroxylase. 1
The 4-3-3 protein sequence is very well conserved and contains two highly conserved regions: the first is an 11 residue peptide located in the N-terminal portion; the second is It is a 20 amino acid region located in the C-terminal part. The consensus pattern is as follows: 1) R-NL- [LIV] -S- [V
G]-[GA] -Y- [KN] -N- [IVA]; 2) Y-K- [DE] -S-
T-L-I- [IM] -Q-L- [LF]-[RHC] -DN- [LF] -T
-[LS] -W- [TAN]-[SAD].

【0173】 (Ank反復(ANK:Pham登録番号PF0023))配列番号311は
、Ank反復含有タンパク質をコードするポリヌクレオチドを示す。アンキリン
モチーフは、24個のタンデムな33アミノ酸モチーフを有するタンパク質アン
キリンにちなんで名付けられた33アミノ酸配列である。Ank反復は、もとも
と細胞周期制御タンパク質cdc10として同定された(Breedenら,N
ature(1987)329:651)。アンキリン反復を含有するタンパク
質としては、アンキリン、ミオトロピン(myotropin)、I−κBタン
パク質、細胞周期タンパク質cdc10、Notchレセプター(Matsun
oら,Development (1997)124(21):4265);主
要組織適合遺伝子複合体のクラスIII領域のG9a(またはBAT8)(Bi
ochem J.290:811−818,1993)、FABP、GABP、
53BP2、Lin12、glp−1、SW14、およびSW16が挙げられる
。アンキリン反復の機能は、タンパク質間相互作用における役割と適合する(B
ork,Proteins(1993)17(4):363;Lambertお
よびBennet、Eur.J.Biochem.(1993)211:1;K
errら,Current Op.Cell Biol.(1992)4:49
6;Bennetら,J.Biol.Chem.(1980)255:6424
)。
(Ank Repeat (ANK: Pham Accession No. PF0023)) SEQ ID NO: 311 shows a polynucleotide encoding an Ank repeat containing protein. The ankyrin motif is a 33 amino acid sequence named after the protein ankyrin which has a 24 tandem 33 amino acid motif. The Ank repeat was originally identified as the cell cycle regulatory protein cdc10 (Breeden et al., N.
ature (1987) 329: 651). Examples of proteins containing ankyrin repeats include ankyrin, myotropin, I-κB protein, cell cycle protein cdc10, Notch receptor (Matsun).
O, et al., Development (1997) 124 (21): 4265); G9a (or BAT8) (Bi) in the class III region of the major histocompatibility complex.
ochem J. 290: 811-818, 1993), FABP, GABP,
53BP2, Lin12, glp-1, SW14, and SW16. The function of ankyrin repeats is compatible with its role in protein-protein interactions (B
ork, Proteins (1993) 17 (4): 363; Lambert and Bennet, Eur. J. Biochem. (1993) 211: 1; K
err et al., Current Op. Cell Biol. (1992) 4:49.
6; Bennet et al. Biol. Chem. (1980) 255: 6424.
).

【0174】 (種々の細胞活性と関連するATPアーゼ(ATPアーゼ;PFam登録番号
PF0004))配列番号1035、1058および1072は、多様な細胞活
性と関連するATPアーゼ(AAA)のファミリーのメンバーをコードする配列
に対応する。AAAタンパク質ファミリーは、ATP結合部位を含む約220ア
ミノ酸の保存された領域を共有する多数のATPアーゼから構成される(Fro
ehlichら、J.Cell.Biol.(1991)114:443;Er
dmannら、Cell(1991)64:499;Petersら、EMBO J.(1990)9:1757;Kunauら、Biochimie(199
3)75:209−224;Confalonieriら、BioEssays
(1995)17:639;http://yeamob.pci.chemi
e.uni−tuebingen.de/AAA/Description.h
tml)。AAAドメインは、1または2コピーで存在し得、ATP依存性タン
パク質クランプ(clamp)として作用し(Confalonieriら(1
995)BioEssays 17:639)、そしてドメインの中心部分にお
いて位置した非常に保存された領域を含む。コンセンサスパターンは以下である
:[LIVMT]−x−[LIVMT]−[LIVMF]−x−[GATMC]
−[ST]−[NS]−x(4)−[LIVM]−D−x−A−[LIFA]−
x−R。
ATPases Associated with Various Cellular Activities (ATPases; PFam Accession No. PF0004) SEQ ID NOs: 1035, 1058 and 1072 encode members of the ATPase (AAA) family that are associated with diverse cellular activities. Corresponds to the array you want. The AAA protein family is composed of multiple ATPases that share a conserved region of approximately 220 amino acids containing the ATP binding site (Fro
ehlich et al. Cell. Biol. (1991) 114: 443; Er.
dmann et al., Cell (1991) 64: 499; Peters et al., EMBO J. et al. (1990) 9: 1757; Kunau et al., Biochimie (199).
3) 75: 209-224; Confalonieri et al., BioEssays.
(1995) 17: 639; http: // yeamob. pci. chemi
e. uni-tuebingen. de / AAA / Description. h
tml). The AAA domain may be present in 1 or 2 copies and acts as an ATP-dependent protein clamp (Confalonieri et al. (1
995) BioEssays 17: 639), and contains a highly conserved region located in the central portion of the domain. The consensus pattern is: [LIVMT] -x- [LIVMT]-[LIVMF] -x- [GATMC].
-[ST]-[NS] -x (4)-[LIVM] -D-x-A- [LIFA]-
x-R.

【0175】 (塩基性領域およびロイシンジッパー転写因子(BZIP;Pfam登録番号
PF00170))配列番号918は、塩基領域およびロイシンジッパー転写因
子のファミリーの新規なメンバーをコードするポリヌクレオチドを示す。真核生
物DNA結合転写因子のbZIPスーパーファミリー(Hurst、Prote
in Prof.(1995)2:105;およびEllenbergerら、
Curr.Opin.Struct.Biol.(1994)4:12)は、配
列特異的DNA結合を媒介する塩基性領域、続いて二量体化に必要とされるロイ
シンジッパーを含むタンパク質を含有する。このタンパク質ファミリーについて
のコンセンサスパターンは以下である:[KR]−x(1,3)−[RKSAQ
]−N−x(2)−[SAQ](2)−x−[RKTAENQ]−x−R−x−
[RK]。
Basic Region and Leucine Zipper Transcription Factor (BZIP; Pfam Accession No. PF00170) SEQ ID NO: 918 sets forth a polynucleotide encoding a novel member of the base region and leucine zipper transcription factor family. The bZIP superfamily of eukaryotic DNA-binding transcription factors (Hurst, Prote
in Prof. (1995) 2: 105; and Ellenberger et al.,
Curr. Opin. Struct. Biol. (1994) 4:12) contain a basic region that mediates sequence-specific DNA binding, followed by a protein containing a leucine zipper that is required for dimerization. The consensus pattern for this protein family is: [KR] -x (1,3)-[RKSAQ
] -N-x (2)-[SAQ] (2) -x- [RKTAENQ] -x-R-x-
[RK].

【0176】 (EFハンド(Efhand;Pfam登録番号PF00036))配列番号
242は、EF−ハンドタンパク質ファミリーのメンバーをコードするポリヌク
レオチドに対応し、カルシウム結合ドメインは、同じ進化的なファミリーに属す
る多くのカルシウム結合タンパク質によって共有される(Kawasakiら、
Protein.Prof.(1995)2:305−490)。このドメイン
は、両側で12残基のαヘリックスドメインにより隣接する12残基ループであ
り、ここでカルシウムイオンは、5角形の2錐体立体配座中に配位される。結合
に関与する6残基は、1位、3位、5位、7位、9位および12位にあり;これ
らの残基は、X、Y、Z、−Y、−Xおよび−Zによって示される。12位での
不変(invariant)なGluまたはAspは、Caを連結するための2
つの酸素を提供する(2つ(bidentate)のリガンド)。コンセンサス
パターンは、完全なEFハンドループ、ならびにループに続きかつ常に疎水性で
あるようである最初の残基を含む:D−x−[DNS]−{ILVFYW}−[
DENSTG]−[DNQGHRK]−{GP}−[LIVMC]−[DENQ
STAGC]−x(2)−[DE]−[LIVMFYW]。
(EFhand; Pfam accession number PF00036) SEQ ID NO: 242 corresponds to a polynucleotide encoding a member of the EF-hand protein family, the calcium-binding domain belonging to many evolutionary families. Shared by calcium-binding proteins (Kawasaki et al.,
Protein. Prof. (1995) 2: 305-490). This domain is a 12-residue loop flanked on each side by a 12-residue α-helix domain, where the calcium ion is coordinated into a pentagonal, bipyramidal conformation. The six residues involved in binding are at positions 1, 3, 5, 7, 9 and 12; these residues are represented by X, Y, Z, -Y, -X and -Z. Shown. The invariant Glu or Asp at position 12 is 2 for linking Ca
It provides two oxygens (two ligands). The consensus pattern contains the complete EF hand loop, as well as the first residue following the loop and that seems to be always hydrophobic: Dx- [DNS]-{ILVFYW}-[
DENSTG]-[DNQGHRK]-{GP}-[LIVMC]-[DENQ
STAGC] -x (2)-[DE]-[LIVMFYW].

【0177】 (Etsドメイン(Ets Nterm;Pfam登録番号PF110178
))配列番号547、それによりそれを確認する配列は、ETSドメインにおけ
るN末端相同性を有するポリペプチドをコードするポリヌクレオチドを示す。こ
のファミリーのタンパク質は、DNA結合に関与する、保存されたドメイン(「
ETSドメイン」)を含む。このドメインは、プリンリッチな配列を認識するよ
うである;これは、約85〜90アミノ酸長であり、そして芳香族残基および正
に荷電した残基が豊富である(Wasylykら、Eur.J.Biochem
.(1993)211:718)。ets遺伝子ファミリーは、DNA結合タン
パク質の新規なクラスをコードし、この各々は、特異的DNA配列を結合し、そ
して共通のコア(core)トリヌクレオチド配列GGAを含む配列と特異的に
相互作用するetsドメインを含む。etsドメインに加えて、ネイティブなe
tsタンパク質は、このタンパク質の生物学的特異性を調節し得る他の配列を含
む。ets遺伝子およびタンパク質は、種々の本質的な生物学的プロセス(細胞
増殖、分化および発生を含む)に関与し、そして3つのメンバーは、癌原性プロ
セスに関係する。
(Ets Domain (Ets Nterm; Pfam Registration No. PF110178
)) SEQ ID NO: 547, the sequence which confirms it, shows a polynucleotide encoding a polypeptide having N-terminal homology in the ETS domain. Proteins in this family are conserved domains (““
ETS domain "). This domain appears to recognize purine-rich sequences; it is approximately 85-90 amino acids long and is rich in aromatic and positively charged residues (Wasylyk et al., Eur. J. . Biochem
. (1993) 211: 718). The ets gene family encodes a novel class of DNA binding proteins, each of which binds a specific DNA sequence and interacts specifically with sequences containing the common core trinucleotide sequence GGA. Contains the domain. native e in addition to ets domain
The ts protein contains other sequences that may regulate the biological specificity of this protein. The ets genes and proteins are involved in a variety of essential biological processes, including cell proliferation, differentiation and development, and three members are involved in carcinogenic processes.

【0178】 (FKH;Pfam登録番号PF00250)配列番号925は、フォークヘ
ッド(forkhead)ドメインを含むポリペプチドをコードする遺伝子に対
応する。このフォークヘッドドメイン(「翼状(winged)ヘリックス」と
しても公知である)は、真核生物転写因子のファミリーに存在し、そしてDNA
結合に関与する約100アミノ酸残基の保存されたドメインである(Weige
lら、Cell(1990)63:455−456;Clarkら、Natur
e(1993)364:412−420)。フォークヘッドドメインを含む哺乳
動物遺伝子には、以下をコードする遺伝子が挙げられる:1)転写活性化因子(
例えば、HNF−3−αタンパク質、HNF−3−βタンパク質およびHNF−
3−γタンパク質(これらは、多くの肝臓遺伝子のシス作用性調節領域と相互作
用する);2)インターロイキンエンハンサー結合因子(ILF)(これは、H
IV−1 LTRおよびインターロイキン−2プロモーターにおいてプリンリッ
チなNFAT様モチーフに結合し、そして重要なウイルスおよび細胞プロモータ
ーエレメントの陽性調節および陰性調節の両方に関与する);3)転写因子BF
−1(これは、脳の発生の領域の細分の確立において、および終脳の発生におい
て重要な役割を果たす);4)ヒトHTLF(これは、ヒトT細胞白血病ウイル
スの長い末端反復(HTLV−I LTR)においてプリンリッチ領域に結合す
る);5)転写因子FREAC−1(FKHL5、HFH−8)、FREAC−
2(FKHL6)、FREAC−3(FKHL7、FKH−1)、FREAC−
4(FKHL8)、FREAC−5(FKHL9、FKH−2、HFH−6)、
FREAC−6(FKHL10、HFH−5)、FREAC−7(FKHL11
)、FREAC−8(FKHL12、HFH−7)、FKH−3、FKH−4、
FKH−5、HFH−1およびHFH−4);6)ヒトAFX1(これは、急性
白血病を生じる染色体転座に関与する);ならびに7)ヒトFKHR(これは、
横紋筋肉腫を生じる染色体転座に関与する)。このフォークドメインは、高度に
保存され、そして2つのコンセンサスパターンによって検出される:第1は、こ
のドメインのN末端切片に対応する;第2は、このドメインの中央の切片に位置
されるヘプタペプチドに対応する。コンセンサスパターンは、以下の通りである
:1)[KR]−P−[PTQ]−[FYLVQH]−S−[FY]−x(2)
−[LIVM]−x(3,4)−[AC]−[LIM];および2)W−[QK
R]−[NS]−S−[LIV]−R−H。
(FKH; Pfam accession number PF00250) SEQ ID NO: 925 corresponds to the gene encoding the polypeptide containing the forkhead domain. This forkhead domain (also known as the "winged helix") is present in the family of eukaryotic transcription factors, and DNA
It is a conserved domain of about 100 amino acid residues involved in binding (Weige
1 et al., Cell (1990) 63: 455-456; Clark et al., Nature.
e (1993) 364: 412-420). Mammalian genes containing the forkhead domain include genes that encode: 1) transcriptional activators (
For example, HNF-3-α protein, HNF-3-β protein and HNF-
3-γ proteins, which interact with cis-acting regulatory regions of many liver genes; 2) interleukin enhancer binding factor (ILF), which is H
Binds to purine-rich NFAT-like motifs in the IV-1 LTR and interleukin-2 promoter and is involved in both positive and negative regulation of important viral and cellular promoter elements); 3) transcription factor BF
-1 (which plays an important role in establishing subdivisions of regions of brain development and in telencephalon development); 4) human HTLF (which is the human T-cell leukemia virus long terminal repeat (HTLV- I LTR) binds to the purine-rich region); 5) transcription factors FREAC-1 (FKHL5, HFH-8), FREEC-
2 (FKHL6), FREAC-3 (FKHL7, FKH-1), FREAC-
4 (FKHL8), FREAC-5 (FKHL9, FKH-2, HFH-6),
FREAC-6 (FKHL10, HFH-5), FREAC-7 (FKHL11
), FREAC-8 (FKHL12, HFH-7), FKH-3, FKH-4,
FKH-5, HFH-1 and HFH-4); 6) human AFX1 (which is involved in chromosomal translocations that cause acute leukemia); and 7) human FKHR (which is
Involved in chromosomal translocations that give rise to rhabdomyosarcoma). This fork domain is highly conserved and is detected by two consensus patterns: the first corresponds to the N-terminal segment of this domain; the second is the heptapeptide located in the middle segment of this domain. Corresponding to. The consensus pattern is as follows: 1) [KR] -P- [PTQ]-[FYLVQH] -S- [FY] -x (2).
-[LIVM] -x (3,4)-[AC]-[LIM]; and 2) W- [QK
R]-[NS] -S- [LIV] -RH.

【0179】 (C末端ドメインが保存されたヘリカーゼ(ヘリカーゼ C;Pfam登録番
号PF00271))配列番号227および1058は、DEAD/Hヘリカー
ゼファミリーの新規なメンバーをコードするポリヌクレオチドを示す。DEAD
ボックスファミリーは、ATP依存性の核酸の非巻線(unwinding)に
関与する多くの真核生物タンパク質および原核生物タンパク質を含む。上記のタ
ンパク質のDEADボックスファミリーメンバーの全ては、多くの保存された配
列モチーフを共有し、これらのいくつかはDEADファミリーに特異的であるが
、一方その他は、他のATP結合タンパク質によってかまたはヘリカーゼ「スー
パーファミリー」に属するタンパク質によって共有される(Hodgman、N
ature(1988)333:22およびNature(1988)333:
578;http://www.expasy.ch/www/linder/
HELICASES_TEXT.html)。これらのモチーフの1つは、「D
−E−A−D−ボックス」と呼ばれ、これは、ATP結合タンパク質のBモチー
フの特定のバージョンを示す。いくつかの他のタンパク質は、第2のAspの代
わりにHisを有するサブファミリーに属し、それゆえに、「D−E−A−H−
ボックス」タンパク質といわれる(Wassarman D.A.ら、Natu
re(1991)349:463;Harosh I.ら、Nucleic A
cids Res.(1991)19:6331;Koonin E.V.らJ
.Gen.Virol.(1992)73:989;http://www.e
xpasy.ch/www/linder/HELICASES_TEXT.h
tml)。以下のサインパターンは、両方のサブファミリーについてメンバーを
同定するために使用される:1)[LIVMF](2)−D−E−A−D−[R
KEN]−x−[LIVMFYGSTN];および2)[GSAH]−x−[L
IVMF](3)−D−E−[ALIV]−H−[NECR]。
Helicase with Conserved C-Terminal Domain (Helicase C; Pfam Accession No. PF00271) SEQ ID NOs: 227 and 1058 show polynucleotides encoding novel members of the DEAD / H helicase family. DEAD
The box family includes many eukaryotic and prokaryotic proteins involved in ATP-dependent unwinding of nucleic acids. All of the DEAD box family members of the above proteins share many conserved sequence motifs, some of which are specific to the DEAD family, while others are due to other ATP binding proteins or to helicase. Shared by proteins belonging to the "superfamily" (Hodgman, N
Nature (1988) 333: 22 and Nature (1988) 333:
578; http: // www. expasy. ch / www / linder /
HELICASES_TEXT. html). One of these motifs is "D
-EAD-box ", which represents a specific version of the B motif of the ATP binding protein. Some other proteins belong to a subfamily that has His in place of the second Asp, and thus "DEA-H-
Referred to as "box" proteins (Wassarman DA, et al. Natu.
re (1991) 349: 463; Harosh I. et al. Nucleic A
cids Res. (1991) 19: 6331; Koonin E .; V. La J
. Gen. Virol. (1992) 73: 989; http: // www. e
xpasy. ch / www / linder / HELICASES_TEXT. h
tml). The following signature patterns are used to identify members for both subfamilies: 1) [LIVMF] (2) -DEAD- [R
KEN] -x- [LIVMFYGSTN]; and 2) [GSAH] -x- [L
IVMF] (3) -DE- [ALIV] -H- [NECR].

【0180】 (Kazalセリンプロテアーゼインヒビターファミリーサイン(Kazal
;Pfam登録番号PF00050))配列番号97は、Kazalインヒビタ
ーファミリーのセリンプロテアーゼインヒビターをコードする遺伝子のポリヌク
レオチドに対応する(Laskowskiら、Annu.Rev.Bioche
m.(1980)49:593−626)。Kazalセリンプロテアーゼイン
ヒビターの基本的な構造(インヒビターの型のような)は、Pfam登録番号P
F00050で記載される。このファミリーに属することが公知である例示的な
タンパク質には、以下が挙げられる:脾性分泌トリプシンインヒビター(PST
I)(この生理学的機能は、脾臓内のチモーゲンの、トリプシン触媒された成熟
前活性化を妨げることである);哺乳動物精液アクロシンインヒビタービター;
イヌおよびネコ顎下腺ダブルヘッド(double−headed)プロテアー
ゼインヒビター(これは、2つのKazal型ドメイン(第1はトリプシンを阻
害するドメインであり、第2はエラスターゼを阻害するドメインである)を含む
);アンドロゲンによって誘導されるマウス前立腺分泌糖タンパク質(これは、
抗トリプシン活性を示す);鳥類オボムコイド;ニワトリオボインヒビター(o
voinhibitor);ならびにヒルトリプシンインヒビターBdelli
n B−3。コンセンサスパターンは、以下の通りである:C−x(7)−C−
x(6)−Y−x(3)−C−x(2,3)−C(ここで、4つのCは、ジスル
フィド結合に関与する)。
(Kazal Serine Protease Inhibitor Family Signature (Kazal
Pfam accession number PF00050)) SEQ ID NO: 97 corresponds to the polynucleotide of the gene encoding the serine protease inhibitor of the Kazal inhibitor family (Laskowski et al., Annu. Rev. Bioche.
m. (1980) 49: 593-626). The basic structure of Kazal serine protease inhibitors (such as the type of inhibitor) is Pfam accession number P
F00050. Exemplary proteins known to belong to this family include: splenic secretory trypsin inhibitor (PST)
I) (this physiological function is to prevent trypsin-catalyzed premature activation of zymogen in the spleen); mammalian semen acrosin inhibitor bitter;
Dog and cat submandibular double-headed protease inhibitor, which contains two Kazal-type domains, the first is a domain that inhibits trypsin and the second is a domain that inhibits elastase. A mouse prostate secretory glycoprotein induced by androgen (
Shows antitrypsin activity); avian ovomucoid; chicken ovo inhibitor (o
and a hirutrypsin inhibitor Bdelli
n B-3. The consensus pattern is as follows: C-x (7) -C-
x (6) -Yx (3) -Cx (2,3) -C, where the four Cs are involved in the disulfide bond.

【0181】 (MAPキナーゼキナーゼ(mkk))配列番号635および992は、MA
Pキナーゼキナーゼ(mkk)ファミリーのメンバーを示す。MAPキナーゼ(
MAPK)は、シグナル伝達に関与し、そして細胞周期および細胞増殖の制御に
おいて重要である。MAPキナーゼキナーゼ(MAPKK)は、MAPキナーゼ
をリン酸化し、そして活性化する、二重特異性プロテインキナーゼである。MA
PKKホモログは、酵母、無脊椎動物、両生類、および哺乳動物において見出さ
れている。さらに、MAPKK/MAPKリン酸化スイッチは、酵母におけるお
よび脊椎動物における異なる経路において活性化される基本的なモジュールを構
成する。MAPKKは、核に達する前にシグナルが通過しなければならない必要
不可欠なトランスデューサーである。概説について、例えば、Biologiq
ue Biol.Cell(1993)79:193−207;Nishida
ら、Trends Biochem Sci(1993)18:128−31;
Ruderman Curr Opin Cell Biol(1993)5:
207−13:Dhanasekaranら、Oncogene(1998)1
7:1447−55;Kieferら、Biochem Soc Trans(
1997)25:491−8;およびHill.Cell Signal(19
96)8:533−44を参照のこと。
(MAP Kinase Kinase (mkk)) SEQ ID NOS: 635 and 992 are MA
1 shows members of the P kinase kinase (mkk) family. MAP kinase (
MAPK) is involved in signal transduction and is important in the control of cell cycle and cell proliferation. MAP kinase kinase (MAPKK) is a bispecific protein kinase that phosphorylates and activates MAP kinase. MA
PKK homologs have been found in yeast, invertebrates, amphibians, and mammals. Furthermore, the MAPKK / MAPK phosphorylation switch constitutes a basic module that is activated in different pathways in yeast and in vertebrates. MAPKKs are essential transducers that signals must pass through before they reach the nucleus. For an overview, see, for example, Biologiq
ue Biol. Cell (1993) 79: 193-207; Nishida.
Et al., Trends Biochem Sci (1993) 18: 128-31;
Ruderman Curr Opin Cell Biol (1993) 5:
207-13: Dhanasekaran et al., Oncogene (1998) 1.
7: 1447-55; Kiefer et al., Biochem Soc Trans (
1997) 25: 491-8; and Hill. Cell Signal (19
96) 8: 533-44.

【0182】 (神経伝達物質ゲート制御イオンチャネル(neur_chan;Pfam登
録番号PF00065))配列番号1078は、神経伝達物質ゲート制御イオン
チャネルをコードする配列に対応する。神経伝達物質ゲート制御イオンチャネル
は、化学シナプスでの迅速なシグナル伝達についての分子基準を提供し、特定の
神経伝達分子の結合の際に一時的にイオンチャンネルを形成するシナップス後性
のオリゴマー膜貫通複合体である。神経伝達物質ゲート制御レセプターの5つの
型が公知である:1)ニコチン性アセチルコリンレセプター(AchR);2)
グリシンレセプター;3)γ−アミノ酪酸(GABA)レセプター;4)セロト
ニン5HT3レセプター;および5)グルタミン酸レセプター。神経伝達物質ゲ
ート制御イオンチャネルからのサブユニットの全ての公知の配列は、構造的に関
連し、そして大きな細胞外グリコシル化N末端リガンド結合ドメイン、続いてイ
オンチャンネルを形成する3つの疎水性膜貫通領域、続いて可変長の細胞内領域
から構成される。第4の疎水性領域は、配列のC末端にて見出される。コンセン
サスパターンは:C−x−[LIVMFQ]−x−[LIVMF]−x(2)−
[FY]−P−x−D−x(3)−Cであり、ここで2つのCはジスルフィド結
合によって連結される。
(Neurotransmitter Gated Ion Channel (neur_chan; Pfam Accession No. PF00065)) SEQ ID NO: 1078 corresponds to a sequence encoding a neurotransmitter gated ion channel. Neurotransmitter-gated ion channels provide the molecular basis for rapid signaling at chemical synapses, and post-synaptic oligomeric transmembranes that transiently form ion channels upon binding of specific neurotransmitter molecules. It is a complex. Five types of neurotransmitter gated receptors are known: 1) nicotinic acetylcholine receptor (AchR); 2).
Glycine receptor; 3) γ-aminobutyric acid (GABA) receptor; 4) serotonin 5HT3 receptor; and 5) glutamate receptor. All known sequences of subunits from neurotransmitter-gated ion channels are structurally related and a large extracellular glycosylated N-terminal ligand binding domain, followed by three hydrophobic transmembrane spanning ion channels. It consists of a region followed by an intracellular region of variable length. The fourth hydrophobic region is found at the C-terminus of the sequence. The consensus pattern is: Cx- [LIVMFQ] -x- [LIVMF] -x (2)-
[FY] -P-x-D-x (3) -C, where the two Cs are linked by a disulfide bond.

【0183】 (PDZドメイン(PDZ:Pfam登録番号PF00595))配列番号5
23および980は、PDZドメイン(DHRドメインまたはGLGFドメイン
としても公知である)を含む遺伝子に対応する。PDZドメインは、80〜10
0残基の反復を含み、これらのいくつかは、イオンチャネルおよび/またはレセ
プターのC末端テトラペプチドモチーフX−Ser/Thr−X−Val−CO
O−と相互作用し、そしてこれは、哺乳動物タンパク質ならびに細菌、酵母およ
び植物において見出される(Pontigら、Protein Sci.(19
97)6(2):464−8)。1つ以上のPDZドメインを含むタンパク質は
、多様な膜関連タンパク質(グアニル酸キナーゼホモログ、いくつかのプロテイ
ンホスファターゼおよびプロテインキナーゼ、ニューロン酸化窒素シンターゼ、
およびいくつかのジストロフィン関連タンパク質(集合的にシントロフィン(s
yntrophin)として公知である)のMAGUKファミリーのメンバーを
含む)のMAGUK膜のメンバーを含む)において見出される(Ponting
ら、Bioessays(1997)19(6):469−79)。多くのPD
Zドメイン含有タンパク質は、非常に特定された亜膜性部位に局在化され、それ
らが細胞連結形成、レセプターまたはチャネルクラスター形成、および細胞内シ
グナル伝達事象に関することが示唆される。例えば、いくつかのMAGUKのP
DZドメインは、NMDAレセプターサブユニットのサブセットのC末端ポリペ
プチドおよび/またはShaker型K+チャネルと相互作用する。他のPDZ
ドメインは、他の膜貫通レセプターの類似のリガンドを結合することが示されて
いる。細胞連結関連タンパク質において、PDZは、それらのC末端への結合に
よる膜イオンチャネルのクラスター形成を媒介する。PDZドメインを含むいく
つかのタンパク質のX線結晶学構造は、解析されている(例えば、Doyleら
、Cell(1996)85(7):1067−76を参照のこと)。
(PDZ domain (PDZ: Pfam accession number PF00595)) SEQ ID NO: 5
23 and 980 correspond to genes containing the PDZ domain (also known as the DHR domain or the GLGF domain). PDZ domain is 80 to 10
It contains 0 residue repeats, some of which are C-terminal tetrapeptide motifs X-Ser / Thr-X-Val-CO of ion channels and / or receptors.
It interacts with O-and is found in mammalian proteins and in bacteria, yeast and plants (Pontig et al., Protein Sci. (19).
97) 6 (2): 464-8). Proteins containing one or more PDZ domains are associated with diverse membrane-associated proteins (guanylate kinase homologs, some protein phosphatases and protein kinases, neuronal nitric oxide synthase,
And several dystrophin-related proteins (collectively syntrophin (s
(including members of the MAGUK family of proteins (known as yntropins)) (including members of the MAGUK membrane) (ponting).
Et al., Bioessays (1997) 19 (6): 469-79). Many PD
Z domain-containing proteins are localized to well-defined submembrane sites, suggesting that they are involved in cell junction formation, receptor or channel cluster formation, and intracellular signaling events. For example, some P of MAGUK
The DZ domain interacts with C-terminal polypeptides of a subset of NMDA receptor subunits and / or Shaker-type K + channels. Other PDZ
Domains have been shown to bind similar ligands for other transmembrane receptors. In cell-linkage related proteins, PDZs mediate clustering of membrane ion channels by binding to their C-termini. The X-ray crystallographic structures of several proteins containing PDZ domains have been solved (see, eg, Doyle et al., Cell (1996) 85 (7): 1067-76).

【0184】 (プロテインホスファターゼ2A調節性サブユニットPR55サイン(PR5
5;Pfam登録番号PF01240))配列番号1028は、プロテインホス
ファターゼ2A調節性サブユニットをコードする遺伝子に対応する。プロテイン
ホスファターゼ2A(PP2A)は、シグナル伝達に関与する代謝酵素およびタ
ンパク質の調節を含む細胞性機能の多くの局面に関与するセリン/スレオニンホ
スファターゼである。PP2Aは、65Kdの調節性サブユニット(PR65、
サブユニットAとも呼ばれる)に会合する触媒サブユニットから構成されるコア
からなる三量体酵素である;次いで、この複合体は、第3の可変サブユニット(
サブユニットB)と会合し、これは、ホロ酵素に対して異なる特性を与える(M
ayerら、Trends Cell Biol.(1994)4:287−2
91)。可変サブユニットの形態の1つは、55Kdタンパク質(PR55)で
あり、これは、哺乳動物において高度に保存されている(ここで、3つのアイソ
フォームが存在することが公知である)。このサブユニットは、基質認識機能を
実施し得るか、または適切な細胞下(subcellular)の区画の酵素複
合体の標的化を担い得る。2つの完全に保存された15残基の配列(一方は、N
末端領域に位置し、他方は、タンパク質の中央に位置する)は、以下のコンセン
サスパターンについての基準として付与される:1)E−F−D−Y−L−K−
S−L−E−I−E−E−K−I−N;2)N−[AG]−H−[TA]−Y−
H−I−N−S−I−S−[LIVN]−N−S−D。
(Protein phosphatase 2A regulatory subunit PR55 signature (PR5
5; Pfam accession number PF01240)) SEQ ID NO: 1028 corresponds to the gene encoding the protein phosphatase 2A regulatory subunit. Protein phosphatase 2A (PP2A) is a serine / threonine phosphatase involved in many aspects of cellular function, including regulation of metabolic enzymes and proteins involved in signal transduction. PP2A is a 65 Kd regulatory subunit (PR65,
Is a trimeric enzyme consisting of a core composed of catalytic subunits associated with subunit A); this complex then forms a third variable subunit (
Subunit B), which confers different properties to the holoenzyme (M
ayer et al., Trends Cell Biol. (1994) 4: 287-2.
91). One form of variable subunit is the 55Kd protein (PR55), which is highly conserved in mammals, where it is known that there are three isoforms. This subunit may perform the substrate recognition function or may be responsible for targeting the enzyme complex to the appropriate subcellular compartment. Two perfectly conserved 15-residue sequences (one for N
Located in the terminal region, the other in the center of the protein) is given as a reference for the following consensus pattern: 1) E-F-D-Y-L-K-
S-LE-IE-E-K-I-N; 2) N- [AG] -H- [TA] -Y-
H-I-N-S-I-S- [LIVN] -N-S-D.

【0185】 (プロテインキナーゼ(protkinase;Pfam登録番号PF000
69))配列番号635、992および1078は、種々の経路においてタンパ
ク質のリン酸化を触媒するプロテインキナーゼをコードするポリヌクレオチドを
示し、そして癌に関与する。真核生物のプロテインキナーゼ(Hanksら、F
ASEB J.(1995)9:576;Hunter,Meth.Enzym
ol.(1991)200:3:Hanksら、Meth.Enzymol.(
1991)200:38;Hanks、Curr.Opin.Struct.B
iol.(1991)1:369;Hanksら、Science(1988)
241:42)は、セリン/スレオニンおよびチロシンプロテインキナーゼの両
方に共通の保存された触媒コアを共有するタンパク質の非常に広範囲なファミリ
ーに属する。プロテインキナーゼの触媒ドメインにおいて多くの保存された領域
がある。第1の領域は、触媒ドメインのN末端の端に位置され、リジン残基の近
傍における残基のグリシンリッチストレッチであり、これはATP結合に関与す
ることが示されている。第2の領域は、触媒ドメインの中心部分に位置され、酵
素の触媒活性に重要である保存されたアスパラギン酸残基を含む(Knight
onら、Science(1991)253:407)。
(Protein Kinase (protkinase; Pfam Accession No. PF000
69)) SEQ ID NOS: 635, 992 and 1078 represent polynucleotides encoding protein kinases that catalyze the phosphorylation of proteins in various pathways and are involved in cancer. Eukaryotic protein kinases (Hanks et al., F
ASEB J. (1995) 9: 576; Hunter, Meth. Enzym
ol. (1991) 200: 3: Hanks et al., Meth. Enzymol. (
1991) 200: 38; Hanks, Curr. Opin. Struct. B
iol. (1991) 1: 369; Hanks et al., Science (1988).
241: 42) belongs to a very broad family of proteins that share a common conserved catalytic core for both serine / threonine and tyrosine protein kinases. There are many conserved regions in the catalytic domain of protein kinases. The first region, located at the N-terminal end of the catalytic domain, is a glycine-rich stretch of residues near the lysine residue, which has been shown to be involved in ATP binding. The second region is located in the central part of the catalytic domain and contains a conserved aspartic acid residue that is important for the catalytic activity of the enzyme (Knight).
on et al., Science (1991) 253: 407).

【0186】 プロテインキナーゼプロフィールは、この第2の領域について2つの特徴的な
パターンを含む:一方は、セリン/スレオニンキナーゼに特異的であり、そして
他方はチロシンキナーゼに特異的である。第3のプロフィールは、整列(Han
ksら、FASEB J.(1995)9:576)に基づき、そして全触媒ド
メインを覆う。コンセンサスパターンは以下のとおりである:1)[LIV]−
G−{P}−G−{P}−[FYWMGSTNH]−[SGA]−{PW}−[
LIVCAT]−{PD}−x−[GSTACLIVMFY]−x(5,18)
−[LIVMFYWCSTAR]−[AIVP]−[LIVMFAGCKR]−
K、ここでKは、ATPを結合する;2)[LIVMFYC]−x−[HY]−
x−D−[LIVMFY]−K−x(2)−N−[LIVMFYCT](3)、
ここでDは、活性部位残基である;および3)[LIVMFYC]−x−[HY
]−D−[LIVMFY]−[RSTAC]−x(2)−N−[LIVMFYC
]、ここでDは、活性部位残基である。
The protein kinase profile contains two characteristic patterns for this second region: one specific for serine / threonine kinases and the other specific for tyrosine kinases. The third profile is the alignment (Han
Ks et al., FASEB J .; (1995) 9: 576) and covers the entire catalytic domain. The consensus pattern is as follows: 1) [LIV]-
G- {P} -G- {P}-[FYWMGSTNH]-[SGA]-{PW}-[
LIVCAT]-{PD} -x- [GSTACLIVMFY] -x (5,18)
-[LIVMFYWCSTAR]-[AIVP]-[LIVMFAGCKR]-
K, where K binds ATP; 2) [LIVMFYC] -x- [HY]-
x-D- [LIVMFY] -Kx (2) -N- [LIVMFYCT] (3),
Where D is an active site residue; and 3) [LIVMFYC] -x- [HY
] -D- [LIVMFY]-[RSTAC] -x (2) -N- [LIVMFYC
], Where D is an active site residue.

【0187】 (Rasファミリータンパク質(ras;Pfam登録番号PF00071)
)配列場号527は、小さなGTP/GDP結合タンパク質のrasファミリー
をコードするポリヌクレオチドを示す(Valenciaら、1991、Bio
chemistry 30:4637−4648)。Rasファミリーメンバー
は、一般に、GTPアーゼ全体の刺激因子として、特定のグアニンヌクレオチド
交換因子(GEF)および特定のGTPアーゼ活性化タンパク質(GAP)を必
要とする。ras関連タンパク質のうち、最も高い程度の配列保存は、グアニン
ヌクレオチド結合に直接的に関与する4つの領域において見出される。最初の2
つは、ほとんどのホスフェートおよびMg2+結合部位(PM部位)を構成し、
そしてこれは、G−ドメインの最初の半分に位置される。他の2つの領域は、グ
アノシン結合に関与し、これは、この分子のC末端半分に位置される。ras関
連タンパク質のモチーフおよび保存された構造的特徴は、Valenciaら、
1991、Biochemistry 30:4637−4648に記載される
。rasタンパク質の主要なコンセンサスパターンは、以下である:D−T−A
−G−Q−E−K−[LF]−G−G−L−R−[DE]−G−Y−Y。
(Ras Family Protein (ras; Pfam Accession No. PF00071)
) Sequence field number 527 shows a polynucleotide encoding the ras family of small GTP / GDP binding proteins (Valencia et al., 1991, Bio).
Chemistry 30: 4637-4648). Ras family members generally require specific guanine nucleotide exchange factors (GEFs) and specific GTPase activating proteins (GAPs) as stimulators of overall GTPases. The highest degree of sequence conservation among ras-related proteins is found in the four regions directly involved in guanine nucleotide binding. First two
One constitutes most of the phosphate and Mg2 + binding sites (PM sites),
And it is located in the first half of the G-domain. The other two regions are involved in guanosine binding, which is located in the C-terminal half of the molecule. The ras-related protein motifs and conserved structural features are reviewed by Valencia et al.
1991, Biochemistry 30: 4637-4648. The major consensus patterns of ras protein are: DTA
-G-Q-E-K- [LF] -G-G-LR- [DE] -G-Y-Y.

【0188】 (Src相同ドメイン3(SH3;Pfam登録番号PF00018))配列
番号450は、Src相同ドメインを含む遺伝子に対応する。Src相同性3(
SH3)ドメインは、いくつかの細胞質タンパク質チロシンキナーゼ(例えば、
Src、Abl、Lck)の非触媒部分における保存された配列として最初に同
定された約60アミノ酸残基の小タンパク質ドメインである(Mayerら、N
ature(1988)332:272−275)。その時以来、非常に種々の
他の細胞内タンパク質または膜結合タンパク質において見出されている(Mus
acchioら、FEBS Lett.(1992)307:55−61;Pa
wsonら、Curr.Biol.(1993)3:434−442;Maye
rら、Trends Cell Biol.(1993)3:8−13;Paw
sonら、Nature(1995)373:573−580)。このSH3ド
メインは、2つの密接にパックされたアンチパラレルβシートとして配列された
5つまたは6つのβ鎖からなる特徴的な折り畳み(fold)を有する。このリ
ンカー領域は、短いヘリックスを含み得る(Kuriyanら、Curr.Op
in.Struct.Biol.(1993)3:828−827)。このSH
3ドメインは、プロリンリッチなペプチドへの結合を介して特異的タンパク質複
合体のアセンブリを媒介することが考えられる(Mortonら、Curr.B
iol.(1994)4:615−617)。一般に、SH3ドメインは、所定
のタンパク質において単一コピーとして見出されるが、2つのSH3ドメインを
有する有意な数のタンパク質、および3コピーまたは4コピーを有する少数のタ
ンパク質が存在する。SH3ドメインを検出するためのプロフィールは、5つの
無ギャップブロックおよび4リンカー領域の全部で62の一致位置からなる構造
整列に基づく。
(Src Homology Domain 3 (SH3; Pfam Accession No. PF00018)) SEQ ID NO: 450 corresponds to the gene containing the Src homology domain. Src homology 3 (
The SH3) domain is associated with several cytoplasmic protein tyrosine kinases (eg,
Src, Abl, Lck) is a small protein domain of approximately 60 amino acid residues that was first identified as a conserved sequence in the non-catalytic part of (Sca, Ack, Lck) (Mayer et al., N.
ature (1988) 332: 272-275). Since then, it has been found in a great variety of other intracellular or membrane-bound proteins (Mus.
accio et al., FEBS Lett. (1992) 307: 55-61; Pa
Wson et al., Curr. Biol. (1993) 3: 434-442; Maye.
r et al., Trends Cell Biol. (1993) 3: 8-13; Paw.
Son et al., Nature (1995) 373: 573-580). The SH3 domain has a characteristic fold consisting of 5 or 6 β-strands arranged as two closely packed anti-parallel β-sheets. This linker region may contain a short helix (Kuriyan et al., Curr. Op.
in. Struct. Biol. (1993) 3: 828-827). This SH
The 3 domain is thought to mediate the assembly of specific protein complexes via binding to proline-rich peptides (Morton et al., Curr. B.
iol. (1994) 4: 615-617). Generally, the SH3 domain is found as a single copy in a given protein, but there are significant numbers of proteins with two SH3 domains, and a few proteins with 3 or 4 copies. The profile for detecting the SH3 domain is based on a structural alignment consisting of 5 ungapped blocks and a total of 62 coincident positions of the 4 linker regions.

【0189】 (トリプシン(トリプシン;Pfam登録番号PF00089))。配列番号
635、995および984は、トリプシンファミリーの新規なセリンプロテア
ーゼに対応する。トリプシンファミリー由来のセリンプロテアーゼの触媒活性は
、ヒスチジン(それ自体がセリンに水素結合されている)に対して水素結合した
アスパラギン酸残基を含む電荷リレー系により提供される。活性部位のセリンお
よびヒスチジン残基に近接する配列はよく保存されている(Brenner,N
ature(1988)334:528)。このトリプシンタンパク質ファミリ
ーについてのコンセンサスパターンは、以下である:1)〔LIVM〕−〔ST
〕−A−〔STAG〕−H−C(ここでHは、活性部位残基である);2)〔D
NSTAGC〕−〔GSTAPIMVQH〕−x(2)−G−〔DE〕−S−G
−〔GS〕−〔SAPHV〕−〔LIVMFYWH〕−〔LIVMFYSTAN
QH〕(ここでSは、活性部位残基である)。このファミリーに属することが公
知のすべての配列は、最初の保存されたグリシンを損失した18個の異なるプロ
テアーゼを除き、上記のコンセンサス配列により検出される。タンパク質がセリ
ンおよびヒスチジンの両方の活性部位特徴を含む場合、それがトリプシンファミ
リーセリンプロテアーゼである可能性は、100%である。
(Trypsin (trypsin; Pfam accession number PF00089)). SEQ ID NOs: 635, 995 and 984 correspond to novel serine proteases of the trypsin family. The catalytic activity of serine proteases from the trypsin family is provided by a charge relay system containing an aspartic acid residue hydrogen bonded to histidine, which is itself hydrogen bonded to serine. The sequences flanking the active site serine and histidine residues are well conserved (Brenner, N.
ature (1988) 334: 528). The consensus pattern for this trypsin protein family is: 1) [LIVM]-[ST
] -A- [STAG] -HC (where H is an active site residue); 2) [D
NSTAGC]-[GSTAPIMVQH] -x (2) -G- [DE] -SG
-[GS]-[SAPHV]-[LIVMFYWH]-[LIVMFYSTAN
QH] (where S is an active site residue). All sequences known to belong to this family are detected by the consensus sequence above, except for 18 different proteases that lost the first conserved glycine. If the protein contains both serine and histidine active site features, then the probability that it is a trypsin family serine protease is 100%.

【0190】 (WDドメイン、G−β反復(WDドメイン;Pfam登録番号PF0040
0))。配列番号505、721および1018は、WDドメイン/G−β反復
ファミリーのメンバーを示す。βトランスデューシン(G−β)は、膜貫通レセ
プターによって産生されたシグナルの伝達において媒介物として作用するグアニ
ンヌクレオチド結合タンパク質(Gタンパク質)の3つのサブユニット(α、β
およびγ)の1つである(Gliman、Annu.Rev.Biochem.
(1987)56:615)。このαサブユニットは、GTPに結合し、そして
加水分解する;このβおよびγサブユニットは、GTPによるGDPの置換、な
らびに膜固定およびレセプター認識を必要とする。高等真核生物において、G−
βは、約340アミノ酸残基の高度に保存されたタンパク質の小さい複数遺伝子
ファミリーとして存在する。構造的に、G−βは、それぞれ中央Trp−Asp
モチーフを含む約40残基の8つの直列反復(このタイプの反復は、時々、WD
−40反復と呼ばれる)。WDドメイン/G−β反復ファミリーについてのコン
センサスパターンは以下である:〔LIVMSTAC〕−〔LIVMFYWST
AGC〕−〔LIMSTAG〕−〔LIVMSTAGC〕−x(2)−〔DN〕
−x(2)−〔LIVMWSTAC〕−x−〔LIVMFSTAG〕−W−〔D
EN〕−〔LIVMFSTAGCN〕。
(WD domain, G-β repeat (WD domain; Pfam accession number PF0040
0)). SEQ ID NOs: 505, 721 and 1018 show members of the WD domain / G-β repeat family. β-transducin (G-β) is a three-subunit (α, β) subunit of guanine nucleotide-binding protein (G protein) that acts as a mediator in the transduction of signals produced by transmembrane receptors.
And γ) (Gliman, Annu. Rev. Biochem.
(1987) 56: 615). The α subunit binds and hydrolyzes GTP; the β and γ subunits require GDP displacement of GDP, as well as membrane anchoring and receptor recognition. In higher eukaryotes, G-
β exists as a small multigene family of highly conserved proteins of approximately 340 amino acid residues. Structurally, G-β has a central Trp-Asp, respectively.
8 tandem repeats of approximately 40 residues containing the motif (this type of repeat is sometimes referred to as WD
-40 repeats). The consensus pattern for the WD domain / G-β repeat family is: [LIVMSTAC]-[LIVMFYWST
AGC]-[LIMSTAG]-[LIVMSTAGC] -x (2)-[DN]
-X (2)-[LIVMWSTAC] -x- [LIVMFSTAG] -W- [D
EN]-[LIVMFSTAGCN].

【0191】 (WW/rsp5/WWPドメイン特徴およびプロフィール(WWドメイン;
Pfam登録番号PF00397))。配列番号606は、WWドメインを含む
タンパク質をコードする遺伝子に対応する。このWWドメイン(Borkら、T
rends Biochem.Sci.(1994)19:531−533;A
ndreら,Biochem.Biophys.Res.Commun.(19
94)205:1201−1205;Hofmannら、FEBS Lett.
(1995)358:153−157;Sudolら、FEBS Lett.(
1995)369:67−71;http://www.bork.embl−
heidelberg.de/Modules/ww−gif.html)(r
sp5またはWWPとしても公知)は、多数の関連しないタンパク質の短い保存
領域として発見された。それらのジストロフィンのうち、この遺伝子は、デュシ
ェーヌ筋ジストロフィーの原因である。約35残基の範囲であるこのドメインは
、いくつかのタンパク質において4回まで繰り返される。タンパク質が特定のプ
ロリンモチーフである〔AP〕−P−P−〔AP〕−Yと結合し、従ってSH3
ドメインにいくらか似ていることが示された(Chenら,Proc.Natl
.Acad.Sci.USA(1995)92:7819−7823)。このW
Wドメインは、4つの保存された芳香族の位置(一般にはトリプトファン)の周
囲に集められたβ鎖を含む。WWまたはWWPの名称は、2つのトリプトファン
の存在および保存された1つのプロリンの存在に由来する。このWWドメインは
、頻繁にシグナル伝達プロセスにおけるタンパク質に典型的な他のドメインに結
合する。WWドメインについてのコンセンサスパターンは、以下である::W−
x(9,11)−〔VFY〕−〔FYW〕−x(6,7)−〔GSTNE〕−〔
GSTQCR〕−〔FYW〕−x−(2)−P。
(WW / rsp5 / WWP domain characteristics and profile (WW domain;
Pfam registration number PF00397)). SEQ ID NO: 606 corresponds to the gene encoding the protein containing the WW domain. This WW domain (Bork et al., T
rends Biochem. Sci. (1994) 19: 531-533; A
ndre et al., Biochem. Biophys. Res. Commun. (19
94) 205: 1201-1205; Hofmann et al., FEBS Lett.
(1995) 358: 153-157; Sudol et al., FEBS Lett. (
1995) 369: 67-71; http: // www. Bork. embl-
heidelberg. de / Modules / ww-gif. html) (r
(also known as sp5 or WWP) was discovered as a short conserved region of many unrelated proteins. Of those dystrophins, this gene is responsible for Duchenne muscular dystrophy. This domain, which spans approximately 35 residues, is repeated up to four times in some proteins. The protein binds to a specific proline motif, [AP] -PP- [AP] -Y, thus SH3
It has been shown to be somewhat similar to domains (Chen et al., Proc. Natl.
. Acad. Sci. USA (1995) 92: 7819-7823). This W
The W domain contains a β chain assembled around four conserved aromatic positions (generally tryptophan). The name WW or WWP derives from the presence of two tryptophans and the conserved one proline. This WW domain frequently binds to other domains that are typical of proteins in signal transduction processes. The consensus pattern for the WW domain is: W-
x (9,11)-[VFY]-[FYW] -x (6,7)-[GSTNE]-[
GSTQCR]-[FYW] -x- (2) -P.

【0192】 (ジンクフィンガー、C2H2型(Zincfing C2H2;Pfam登
録番号PF00096))。いくつかの配列は、核酸結合を容易にするジンクフ
ィンガードメインを含むC2H2型のジンクフィンガータンパク質ファミリー(
Klugら、Trends Biochem.Sci.(1987)12:46
4;Evansら、Cell(1988)52:1;Payreら、FEBS
Lett.(1988)234:245;Millerら、EMBO J.(1
985)4:1609;およびBerg、Proc.Natl.Acad.Sc
i.USA(1988)85:99)のメンバーをコードするポリヌクレオチド
に対応した。保存された亜鉛リガンド残基に加えて、多くの他の位置もまた、C
2H2ジンクフィンガーの構造完全性に重要である(Rosenfeldら、J
.Biomol.Struct.Dyn.(1993)11:557)。最も良
好に保存される位置は、一般に芳香族または脂肪族残基であり、第2のシステイ
ンの後ろの4つの残基に位置する。C2H2ジンクフィンガーについてのコンセ
ンサスパターンは:C−x(2,4)−C−x(3)−[LIVMFYWC]−
x(8)−H−x(3,5)−Hである。2つのCおよび2つのHは、亜鉛リガ
ンドである。
(Zinc finger, C2H2 type (Zincfing C2H2; Pfam registration number PF00096)). Some sequences contain a zinc finger domain of the C2H2 type that contains a zinc finger domain that facilitates nucleic acid binding (
Klug et al., Trends Biochem. Sci. (1987) 12:46.
4; Evans et al., Cell (1988) 52: 1; Payre et al., FEBS.
Lett. (1988) 234: 245; Miller et al., EMBO J. et al. (1
985) 4: 1609; and Berg, Proc. Natl. Acad. Sc
i. USA (1988) 85:99). In addition to the conserved zinc ligand residue, many other positions also have C
Important for the structural integrity of the 2H2 zinc finger (Rosenfeld et al., J.
. Biomol. Struct. Dyn. (1993) 11: 557). The best conserved positions are generally aromatic or aliphatic residues, located four residues after the second cysteine. The consensus pattern for the C2H2 zinc finger is: Cx (2,4) -Cx (3)-[LIVMFYWC]-
x (8) -H-x (3,5) -H. Two Cs and two Hs are zinc ligands.

【0193】 (ジンクフィンガー、C3HC4型(RINGフィンガー)特徴(Zincf
ing C3H4;Pfam登録番号PF00097))。配列番号805およ
び1078は、C3HC4型ジンクフィンガー特徴を有するポリペプチドをコー
ドするポリヌクレオチドを示す。多数の真核生物タンパク質およびウイルスタン
パク質は、この特徴を含み、これは主に、亜鉛の2つの原子を結合する40〜6
0残基の保存されたシステインリッチドメインである(Borden K.L.
B.ら、Curr.Opin.Struct.Biol.(1996)6:39
5)、そしておそらく、タンパク質間相互作用の媒介に関与する。亜鉛連結系の
3D構造は、RINGドメインに対して独特であり、そして「交叉装具(cro
ss−brace)モチーフと称される。このドメインにおけるシステインの間
隔は、以下である:C−x(2)−C−x(9〜39)−C−x(1〜3)−H
−x(2〜3)−C−x(2)−C−x(4〜48)−C−x(2)−C。C3
HC4フィンガーについての特徴パターンは、以下のドメインの中心領域に基づ
く:C−x−H−x−[LIVMFY]−C−x(2)−C−[LIVMYA]
(Zinc finger, C3HC4 type (RING finger) characteristics (Zincf
ing C3H4; Pfam registration number PF00097)). SEQ ID NOs: 805 and 1078 set forth polynucleotides encoding polypeptides having C3HC4 type zinc finger characteristics. Many eukaryotic and viral proteins contain this feature, which is predominantly 40-6, which connects the two atoms of zinc.
It is a conserved cysteine-rich domain of 0 residues (Borden KL;
B. Curr. Opin. Struct. Biol. (1996) 6:39.
5), and possibly involved in mediating protein-protein interactions. The 3D structure of the zinc-linked system is unique to the RING domain, and the "cross prosthesis (cro).
ss-brace) motif. The spacing of cysteines in this domain is: Cx (2) -Cx (9-39) -Cx (1-3) -H.
-X (2-3) -Cx (2) -Cx (4-48) -Cx (2) -C. C3
The characteristic pattern for the HC4 fingers is based on the central region of the following domains: Cx-Hx- [LIVMFY] -Cx (2) -C- [LIVMYA].
.

【0194】 (ジンクフィンガー、CCHC型(Zincfing CCHC;Pfam登
録番号PF00098))。配列番号693,973および1078は、CCH
Cジンクフィンガーのファミリーのメンバーをコードする遺伝子に対応する。原
型CCHCジンクフィンガー構造はHIVタンパク質に由来するので、このドメ
インはまた、レトロウイルス型ジンクフィンガードメインと称される。このファ
ミリーはまた、真核生物遺伝子調節に関与するタンパク質(例えば、C.ele
gans GLH−1)を含む。この構造は、18残基のジンクフィンガーであ
る;整列におけるindelの例は存在しない。CCHC型ジンクフィンガード
メインを規定するモチーフは、以下である:C−X2−C−X4−H−X4−C
(Summers J Cell Biochem 1991粘1月;45(1
):41−8)。このドメインは、例えば、HIV−1ヌクレオカプシドタンパ
ク質、モロニーマウス白血病ウイルスヌクレオカプシドタンパク質NCp10(
De Rocquignyら、Nucleic Acids Res.(199
3)21:823−9)、およびミエリン転写因子1(Myt1)(Kimら、
J.Neurosci.Res.(1997)59:272−90)に見出され
る。
(Zinc finger, CCHC type (Zincfing CCHC; Pfam registration number PF00098)). SEQ ID NOs: 693, 973 and 1078 are CCH
Corresponds to the gene encoding a member of the C zinc finger family. This domain is also referred to as the retroviral zinc finger domain because the original CCHC zinc finger structure is derived from the HIV protein. This family also includes proteins involved in eukaryotic gene regulation (eg, C. ele).
gans GLH-1). This structure is an 18-residue zinc finger; there are no examples of indels in the alignment. The motif defining the CCHC-type zinc finger domain is: C-X2-C-X4-H-X4-C.
(Summers J Cell Biochem 1991 Mu January; 45 (1
): 41-8). This domain includes, for example, the HIV-1 nucleocapsid protein, Moloney murine leukemia virus nucleocapsid protein NCp10 (
De Rocquigny et al., Nucleic Acids Res. (199
3) 21: 823-9), and myelin transcription factor 1 (Myt1) (Kim et al.,
J. Neurosci. Res. (1997) 59: 272-90).

【0195】 (実施例5:本発明のポリヌクレオチドの示差的発現:ライブラリーの説明お
よび示差的発現の検出) 本発明のポリヌクレオチドの相対的な発現レベルを、細胞株および患者組織サ
ンプルを含む種々の供給源から調製されたいくつかのライブラリーにおいて評価
した。表4は、これらのライブラリーの概要を提供する。これには、省略したラ
イブラリー名(本明細書において以後使用)、cDNAライブラリーを調製する
のに用いたmRNA供給源、以下の表で用いられるライブラリーの「ニックネー
ム」(引用符で囲んで)、およびライブラリーにおけるおよそのクローン数が挙
げられる。
Example 5 Differential Expression of Polynucleotides of the Invention: Library Description and Detection of Differential Expression Relative expression levels of the polynucleotides of the invention include cell lines and patient tissue samples. It was evaluated in several libraries prepared from different sources. Table 4 provides a summary of these libraries. This includes the abbreviated library name (used hereafter), the mRNA source used to prepare the cDNA library, the "nickname" of the library used in the table below (enclosed in quotation marks). ), And the approximate number of clones in the library.

【0196】[0196]

【表1】 [Table 1]

【0197】 KM12L4、KM12C、およびMDA−MB−231細胞株は、上記の実
施例1において記載される。MCF7細胞株は、乳腺癌の胸水に由来した。そし
てこれは、非転移性である。MV−522細胞株は、ヒト肺癌腫に由来し、そし
て高転移能力である。UCP−3細胞株は、低い転移性のヒト肺癌腫細胞株であ
り;MV−522は、UCP−3の高い転移性の改変体である。これらの細胞株
は、ヒト乳癌および肺癌の研究のためのモデルとして当該分野において十分に認
識されている(例えば、Chandrasekaranら、Cancer Re
s.(1979)39:870(MDA−MB−231およびMCF−7);G
astparら、J Med Chem(1998)41:4965(MDA−
MB−231およびMCF−7);Ransonら、Br J Cancer(
1998)77:1586(MDA−MB−231およびMCF−7);Kua
ngら、Nucleic Acids Res(1998)26:1116(M
DA−MB−231およびMCF−7);Varkiら、Int J Canc
er(1987)40:46(UCP−3);Varkiら、Tumour B
iol.(1990)11:327;(MV−522およびUCP−3);Va
rkiら、Anticancer Res.(1990)10:637;(MV
−522);Kelnerら、Anticancer Res(1995)15
:867(MV−522);およびZhangら、Anticancer Dr
ugs(1997)8:696(MV522)を参照のこと)。ライブラリー1
5〜20のサンプルは、2つの異なる患者(UC#2およびUC#3)に由来す
る。bFGF処理されたHMEVCは、10ng/mlで2時間のbFGFとの
インキュベーションによって調製され;VEGF処理されたHMEVCは、20
ng/ml VEGFとの2時間のインキュベーションによって調製された。そ
れぞれの増殖因子とのインキュベーション後、細胞を洗浄し、そして溶解緩衝液
をRNA調製のために添加した。GRRpzおよびWOca細胞株は、Donn
a M.Peehl博士、Department of Medicine、S
tanford University School of Medicin
eによって提供された。GRRpzは、正常な前立腺上皮に由来した。WOca
細胞株は、Gleasonグレード4細胞株である。
The KM12L4, KM12C, and MDA-MB-231 cell lines are described in Example 1 above. The MCF7 cell line was derived from breast pleural effusion. And it is non-metastatic. The MV-522 cell line is derived from human lung carcinoma and is highly metastatic. The UCP-3 cell line is a low metastatic human lung carcinoma cell line; MV-522 is a highly metastatic variant of UCP-3. These cell lines are well recognized in the art as models for the study of human breast and lung cancers (eg Chandracekaran et al. Cancer Re.
s. (1979) 39: 870 (MDA-MB-231 and MCF-7); G.
aspar et al., J Med Chem (1998) 41: 4965 (MDA-
MB-231 and MCF-7); Ranson et al., Br J Cancer (
1998) 77: 1586 (MDA-MB-231 and MCF-7); Kua.
ng et al., Nucleic Acids Res (1998) 26: 1116 (M.
DA-MB-231 and MCF-7); Varki et al., Int J Canc.
er (1987) 40:46 (UCP-3); Varki et al., Tumour B.
iol. (1990) 11: 327; (MV-522 and UCP-3); Va
rki et al., Anticancer Res. (1990) 10: 637; (MV
-522); Kelner et al., Anticancer Res (1995) 15
: 867 (MV-522); and Zhang et al., Anticancer Dr.
ugs (1997) 8: 696 (MV522)). Library 1
The 5-20 samples are from two different patients (UC # 2 and UC # 3). bFGF-treated HMEVC was prepared by incubation with bFGF at 10 ng / ml for 2 hours; VEGF-treated HMEVC had 20
Prepared by incubation with ng / ml VEGF for 2 hours. After incubation with each growth factor, cells were washed and lysis buffer was added for RNA preparation. The GRRpz and WOca cell lines were Donn
aM. Dr. Peehl, Department of Medicine, S
tanford University School of Medicine
provided by e. GRRpz was derived from normal prostate epithelium. WOca
The cell line is a Gleason grade 4 cell line.

【0198】 それぞれのライブラリーは、示されるmRNA供給源において発現されるmR
NAを順に表すcDNAクローンのコレクションから構成される。各ライブラリ
ーにおける数百万の配列の分析を容易にするために、配列をクラスターに割当て
た。「クローンのクラスター」の概念は、約300個の7bpオリゴヌクレオチ
ドプローブのパネルへのそれらのハイブリダイゼーションパターンに基づくcD
NAクローンの選別/グループ化に由来する(Drmanacら、Genomi
cs(1996)37(1):29を参照のこと)。組織ライブラリーからのラ
ンダムなcDNAクローンを、300個の7bpオリゴヌクレオチドに中程度の
ストリンジェンシーでハイブリダイズさせる。各オリゴヌクレオチドは、その特
定のクローンへの特異的なハイブリダイゼーションのいくつかの尺度を有する。
300個のプローブについてのハイブリダイゼーションのこれらの尺度の300
個の組合わせは、特異的なクローンについての「ハイブリダイゼーション特徴」
に等しい。類似の配列を有するクローンは、類似のハイブリダイゼーション特徴
を有する。これらの特徴を分析するための選別/グループ化アルゴリズムを開発
することによって、ライブラリーにおけるクローンの群が同定され得、そしてコ
ンピューターで集められる。クローンのこれらの群は「クラスター」と呼ばれる
。アルゴリズムにおける選択のストリンジェンシー(古典的なライブラリーcD
NAスクリーニングプロトコルにおけるハイブリダイゼーションのストリンジェ
ンシーに類似する)に依存して、各クラスターの「純度」が制御され得る。例え
ば、ちょうど人為的結果が、最も高いストリンジェンシーであってでも、400
bp cDNAフラグメントを有するcDNAライブラリーの「web−lab
」スクリーニングにおいて生じ得るように、クラスター形成の人為的結果は、コ
ンピューターによるクラスター形成において生じ得る。本明細書中のクラスター
の実行において使用されるストリンジェンシーは、一般に同じcDNAまたは密
接に関連するcDNA由来であるクローンの群を提供する。密接に関連するクロ
ーンは、同じcDNAの異なる長さのクローン、高度に関連した遺伝子ファミリ
ーからの密接に関連したクローン、または同じcDNAのスプライス改変体の結
果であり得る。
Each library contains the mR expressed in the indicated mRNA source.
It consists of a collection of cDNA clones representing NA in order. Sequences were assigned to clusters to facilitate analysis of millions of sequences in each library. The concept of "cluster of clones" is based on their hybridization pattern into a panel of approximately 300 7 bp oligonucleotide probes, cdD.
Derived from selection / grouping of NA clones (Drmanac et al., Genomi
cs (1996) 37 (1): 29). Random cDNA clones from a tissue library are hybridized to 300 7 bp oligonucleotides with moderate stringency. Each oligonucleotide has several measures of specific hybridization to its particular clone.
300 of these measures of hybridization for 300 probes
The individual combinations are the "hybridization characteristics" for specific clones.
be equivalent to. Clones with similar sequences have similar hybridization characteristics. By developing a selection / grouping algorithm to analyze these characteristics, groups of clones in the library can be identified and computationally assembled. These groups of clones are called "clusters". Stringency of choice in algorithms (classical library cd
Depending on the stringency of hybridization in the NA screening protocol), the "purity" of each cluster can be controlled. For example, even if the artificial result is the highest stringency, 400
"web-lab" of a cDNA library containing a bp cDNA fragment
As with screening, the artifacts of clustering can occur with computerized clustering. The stringency used in the implementation of the clusters herein generally provides a group of clones that are derived from the same or closely related cDNAs. Closely related clones can be the result of different length clones of the same cDNA, closely related clones from a highly related gene family, or splice variants of the same cDNA.

【0199】 選択したクラスターについての示差的な発現は、先ず第1のライブラリーにお
いて選択したクラスターに対応するcDNAクローン(1回目におけるクローン
)の数を決定し、そして第2のライブラリーにおいて選択したクラスターに対応
するcDNAクローン(2回目におけるクローン)の数を決定することによって
、評価された。第2のライブラリーに比較して第1のライブラリーにおいて選択
したクラスターの示差的な発現は、2つのライブラリー間の発現パーセントの「
比率」として表される。一般に、「比率」は:1)第1のライブラリーにおいて
選択したクラスターに対応するクローンの数を、第1のライブラリーからの分析
したクローンの総数で除算することによって、第1のライブラリーにおいて選択
したクラスターの発現パーセントを算定し;2)第2のライブラリーにおいて選
択したクラスターに対応するクローンの数を、第2のライブラリーからの分析し
たクローンの総数で除算することによって、第2のライブラリーにおいて選択し
たクラスターの発現パーセントを算定し;3)第1のライブラリーからの算定し
た発現パーセントを、第2のライブラリーからの算定した発現パーセントで除算
することによって、算定される。ライブラリーにおける選択されるクラスターに
対応する「クローンの数」が、ゼロである場合、算定を補助するために値は1に
設定される。比率を算定する際に使用される式は、比較されるそれぞれのライブ
ラリーの「深さ」、すなわち、各ライブラリーにおいて分析したクローンの総数
を考慮する。
Differential expression for selected clusters first determined the number of cDNA clones (clones in the first round) corresponding to the selected cluster in the first library and selected in the second library. It was evaluated by determining the number of cDNA clones corresponding to the cluster (clones in the second round). The differential expression of the selected clusters in the first library as compared to the second library is the percentage of expression between the two libraries.
Expressed as "ratio". Generally, the "ratio" is: 1) in the first library, by dividing the number of clones corresponding to the selected cluster in the first library by the total number of clones analyzed from the first library. Calculating the percent expression of the selected cluster; 2) dividing the number of clones corresponding to the selected cluster in the second library by the total number of clones analyzed from the second library. Calculated by calculating the percent expression of the selected clusters in the library; 3) dividing the calculated percent expression from the first library by the calculated percent expression from the second library. If the "number of clones" corresponding to the selected cluster in the library is zero, the value is set to 1 to aid the calculation. The formula used in calculating ratios takes into account the “depth” of each library being compared, ie the total number of clones analyzed in each library.

【0200】 一般に、ポリヌクレオチドは、比率の値が少なくとも約2よりも多く、好まし
くは少なくとも約3よりも多く、より好ましくは少なくとも約5よりも多い場合
、2つのサンプル間で有意に示差発現されると言われ、ここでは比率の値は、上
記の方法を使用して算定される。示差的な発現の有意性は、zスコア検定(Za
r、Biostatistical Analysis、Prentice H
all,Inc.、USA、「Differences between Pr
oportions」、296−298頁(1974))を使用して決定される
Generally, a polynucleotide is significantly differentially expressed between two samples if the ratio value is at least greater than about 2, preferably greater than at least about 3, and more preferably greater than at least about 5. , Where the ratio values are calculated using the above method. The significance of the differential expression was determined by the z-score test (Za
r, Biostatistical Analysis, Prentice H
all, Inc. , USA, “Differences between Pr
pp. 296-298 (1974)).

【0201】 (実施例6〜11:本発明のポリヌクレオチドの示差的な発現) 例えば、高転移能力の癌組織に由来する細胞と低い転移性の癌組織に由来する
細胞との間、および高い転移性の癌組織と正常な組織とに由来する細胞の間で示
差発現される多くのポリヌクレオチド配列が、同定されている。これらの配列に
対応する遺伝子の発現のレベルの評価は、診断、予後、および/または処置にお
いて(例えば、治療の合理的な設計、治療の間または治療後のモニタリングなど
を容易にするために)価値があり得る。さらに、本明細書中に記載される示差発
現される配列に対応する遺伝子は、例えば、転移性表現型の発生の調節(例えば
、阻害または促進)におけるそれらの関与に起因して、治療標的であり得る。例
えば、正常なまたは非転移性の腫瘍細胞に比較して高転移能力の細胞において発
現が増加される遺伝子に対応する配列は、脈管形成、分化、細胞複製、および転
移のようなプロセスに関与する遺伝子または調節配列をコードし得る。
Examples 6-11: Differential Expression of Polynucleotides of the Invention For example, between cells derived from cancerous tissue with high metastatic potential and cells derived from low metastatic cancerous tissue, and high. Many polynucleotide sequences have been identified that are differentially expressed between cells derived from metastatic cancer tissue and normal tissue. Assessing the level of expression of genes corresponding to these sequences can be used in diagnosis, prognosis, and / or treatment (eg, to facilitate rational design of therapy, monitoring during or after therapy, etc.). Can be worth it. In addition, genes corresponding to the differentially expressed sequences described herein may be targeted at therapeutic targets due to, for example, their involvement in the regulation (eg, inhibition or promotion) of development of the metastatic phenotype. possible. For example, sequences corresponding to genes whose expression is increased in cells with high metastatic potential compared to normal or non-metastatic tumor cells are involved in processes such as angiogenesis, differentiation, cell replication, and metastasis. Gene or regulatory sequence.

【0202】 本明細書中に記載される、示差発現されるポリヌクレオチドの相対的な発現レ
ベルの検出は、治療の選択において臨床医を導く価値ある情報を提供し得る。例
えば、転移性の細胞または高い転移可能性の細胞において発現が増加する遺伝子
に対応するこれらのポリヌクレオチドのうちの1つ以上の発現レベルを示す患者
のサンプルは、その患者に対するより積極的な処置を保証し得る。対照的に、低
い転移可能性の細胞の発現レベルと関連する発現レベルに対応するポリヌクレオ
チド配列の発現レベルの検出は、全体の病理学が示唆するよりもポジティブな予
後を保証し得る。
Detection of relative expression levels of differentially expressed polynucleotides, as described herein, can provide valuable information to guide the clinician in selecting a treatment. For example, a sample of a patient exhibiting expression levels of one or more of these polynucleotides corresponding to genes whose expression is increased in metastatic or highly metastatic cells is treated with a more aggressive treatment for that patient. Can be guaranteed. In contrast, detection of the expression levels of polynucleotide sequences corresponding to those associated with low metastatic potential cells may warrant a more positive prognosis than is suggested by gross pathology.

【0203】 本発明の多くのポリヌクレオチド配列は、未処理のヒト微小血管内皮細胞(H
MVEC)に比較して、増殖因子で処理されたHMVEC間で示差発現される。
増殖因子で処理されたHMVECと未処理のHMVECとの間で示差発現される
配列は、脈管形成、転移(細胞移動)、ならびに他の発生プロセスおよび発癌性
プロセスに関与する遺伝子産物をコードする配列を示し得る。例えば、未処理の
HMVECに比べて増殖因子(例えば、bFGFまたはVEGF)で処理された
HMVECにおいてより高度に発現される配列は、化学療法剤の薬物標的として
作用し得、例えば、このようなアップレギュレートされた遺伝子の発現を減少す
ること、またはそのコードされた遺伝子産物の活性を阻害することは、腫瘍細胞
の脈管形成を阻害するように作用する。結腸癌組織におけるこれらの配列の発現
の検出は、これらの組織における悪性の状態の達成の防止に関連する、診断情報
、予後情報、および/または処置情報を決定する際に価値があり得、そして患者
についての危険性評価において重要であり得る。従って、これらのポリヌクレオ
チドのうちの1つ以上の増加したレベルを示す患者のサンプルは、可能な限り早
期に悪性状態を把握するために、より周到な注意手順またはより頻繁なスクリー
ニング手順を保証し得る。
Many of the polynucleotide sequences of the present invention are found in naive human microvascular endothelial cells (H
Differentially expressed between growth factor treated HMVECs compared to MVECs).
Sequences differentially expressed between growth factor-treated and untreated HMVECs encode gene products involved in angiogenesis, metastasis (cell migration), and other developmental and oncogenic processes. The sequence can be shown. For example, sequences that are more highly expressed in HMVEC treated with growth factors (eg, bFGF or VEGF) as compared to untreated HMVEC may act as drug targets for chemotherapeutic agents, such as Decreasing the expression of a regulated gene or inhibiting the activity of its encoded gene product acts to inhibit tumor cell angiogenesis. Detection of the expression of these sequences in colon cancer tissues may be valuable in determining diagnostic, prognostic, and / or treatment information associated with preventing the achievement of malignant conditions in these tissues, and It may be important in a risk assessment for a patient. Therefore, a sample of patients exhibiting increased levels of one or more of these polynucleotides warrants more careful attention procedures or more frequent screening procedures to ascertain malignant status as early as possible. obtain.

【0204】 従って、本明細書中に記載されるポリヌクレオチドの示差的な発現は、例えば
、危険性評価、患者処置などについての、診断マーカー、予後マーカーとして使
用され得る。これらのポリヌクレオチド配列はまた、他の公知の分子マーカーお
よび/または生化学的マーカーと組合わせて使用され得る。以下の実施例は、特
定の細胞株および患者組織サンプルからのポリヌクレオチドの相対的な発現レベ
ルを提供する。
Accordingly, the differential expression of the polynucleotides described herein can be used as a diagnostic, prognostic marker, eg, for risk assessment, patient treatment, etc. These polynucleotide sequences can also be used in combination with other known molecular and / or biochemical markers. The following examples provide the relative expression levels of polynucleotides from specific cell lines and patient tissue samples.

【0205】 (実施例6:高転移可能性乳癌細胞 対 低転移可能性乳癌細胞) 以下の表は、高転移可能性乳癌細胞と低転移可能性乳癌細胞との間で示差発現
される遺伝子を示すポリヌクレオチドについてのデータを要約する。
Example 6: High metastatic breast cancer cells versus low metastatic breast cancer cells The table below lists genes that are differentially expressed between high and low metastatic breast cancer cells. The data for the indicated polynucleotides are summarized.

【0206】 表5.高転移可能性乳癌細胞(lib3)>低転移可能性乳癌細胞(lib4
Table 5. Breast cancer cells with high metastatic potential (lib3)> Breast cancer cells with low metastatic potential (lib4)
)

【0207】[0207]

【表2】 [Table 2]

【0208】 表6.低転移可能性乳癌細胞(lib4)>高転移可能性乳癌細胞(lib3
Table 6. Breast cancer cells with low metastatic potential (lib4)> Breast cancer cells with high metastatic potential (lib3)
)

【0209】[0209]

【表3】 [Table 3]

【0210】 (実施例7:高転移可能性肺癌細胞 対 低転移可能性肺癌細胞) 以下は、高転移可能性肺癌細胞と低転移可能性肺癌細胞との間で示差発現され
る遺伝子を示すポリヌクレオチドを要約する。
Example 7 High Metastatic Potential Lung Cancer Cells vs. Low Metastatic Potential Lung Cancer Cells The following is a poly showing differentially expressed genes between highly metastatic and low metastatic lung cancer cells. Summarize the nucleotides.

【0211】 表7.高転移可能性肺癌細胞(lib8)>低転移可能性肺癌細胞(lib9
Table 7. High metastatic lung cancer cells (lib8)> Low metastatic lung cancer cells (lib9)
)

【0212】[0212]

【表4】 [Table 4]

【0213】 (実施例8:高転移可能性結腸癌細胞 対 低転移可能性結腸癌細胞) 表8は、高転移可能性結腸癌細胞と低転移可能性結腸癌細胞との間で示差発現
される遺伝子を示すポリヌクレオチドを要約する。
Example 8 Highly Metastatic Metastatic Colon Cancer Cells vs Low Metastatic Metastatic Colon Cancer Cells Table 8 is differentially expressed between high and low metastatic colon cancer cells. The polynucleotides that represent the genes are summarized.

【0214】 表8.低転移可能性結腸癌細胞(lib2)>高転移可能性結腸癌細胞(li
b1)
Table 8. Low metastatic metastatic colon cancer cells (lib2)> High metastatic metastatic colon cancer cells (li)
b1)

【0215】[0215]

【表5】 [Table 5]

【0216】 (実施例9:高腫瘍可能性結腸組織 対 転移した結腸癌組織) 以下の表は、患者の高腫瘍可能性結腸癌細胞と高転移可能性結腸癌細胞由来の
細胞との間で示差発現される遺伝子を示すポリヌクレオチドを要約する。
Example 9: High Tumor Probability Colon Tissues vs. Metastasized Colon Cancer Tissues The following table shows between high tumor potential colon cancer cells and cells from high metastatic potential colon cancer cells of patients. The polynucleotides that represent the differentially expressed genes are summarized.

【0217】 表9.高腫瘍可能性結腸組織(lib16) 対 高転移結腸組織(lib1
7)
Table 9. Highly tumor-prone colon tissue (lib16) versus highly metastatic colon tissue (lib1)
7)

【0218】[0218]

【表6】 [Table 6]

【0219】 (実施例10:複数のライブラリーにわたる示差的発現) 複数のライブラリーにわたって示差発現される遺伝子を示す多くのポリヌクレ
オチド配列が、同定された。組織または任意の起原におけるこれらの配列の発現
は、これらの組織における悪性状態の達成の予防に関連する診断的、予後的およ
び/または処置の情報を決定する際に有益であり得、ならびに患者についての危
険度の評価において重要であり得る。これらのポリヌクレオチドはまた、例えば
、腫瘍の転移の危険度の非組織特異的マーカーとして役立ち得る。以下の表10
は、このデータを要約する。
Example 10: Differential Expression Across Multiple Libraries A number of polynucleotide sequences were identified that represent genes that are differentially expressed across multiple libraries. Expression of these sequences in tissues or any origin may be beneficial in determining diagnostic, prognostic and / or treatment information associated with prevention of achievement of malignant conditions in these tissues, and patient Can be important in assessing the risk of These polynucleotides may also serve as non-tissue specific markers of risk of tumor metastasis, for example. Table 10 below
Summarizes this data.

【0220】[0220]

【表7】 [Table 7]

【0221】 いくつかのポリヌクレオチドは、異なる起源のライブラリーにおいて反対の異
なる発現傾向を示した(例えば、配列番号316を参照のこと)。これらのデー
タは、転移の発生に関連するいくつかの遺伝子の示差的な発現パターンが、起源
の組織に特異的な遺伝子に特有な役割を示すことを、示唆する。
Some polynucleotides showed opposite differential expression trends in libraries of different origin (see, eg, SEQ ID NO: 316). These data suggest that the differential expression patterns of some genes involved in the development of metastases indicate a unique role for the tissue-specific genes of origin.

【0222】 当業者は、せいぜい慣用的である実験を使用して、本明細書中に記載される本
発明の特定の実施態様に対する多くの等価物を認識するか、または確認し得る。
このような特定の実施態様および等価物は、前記の特許請求の範囲により包含さ
れることが意図される。
Those skilled in the art will be able to recognize or ascertain the many equivalents to the particular embodiments of the invention described herein using experiments that are at best routine.
Such particular embodiments and equivalents are intended to be covered by the following claims.

【0223】 本明細書中に引用される全ての刊行物および特許出願は、あたかも各々個々の
刊行物または特許出願が参考として援用されるように特にかつ個々に示されたか
のように、本明細書において参考として援用される。どの刊行物の引用も、本出
願日より前のその開示に対してであり、そして本発明が、先行する発明によって
このような刊行物に先立つように権利を与えられないという承認として解釈され
るべきではない。
All publications and patent applications cited in this specification are described in this specification as if each individual publication or patent application was specifically and individually indicated to be incorporated by reference. Incorporated as a reference in. The citation of any publication is for its disclosure prior to the filing date of the present application and is to be construed as an admission that the invention is not entitled to antedate such publication by virtue of prior invention. Should not be.

【0224】 上記の発明は、理解の明瞭化の目的のために例示および実施例によって幾分詳
細に記載されたが、これは、特定の変更および改変が、添付の特許請求の範囲の
精神または範囲を逸脱することなくなされ得る、本発明の教示に鑑みて、当業者
に容易に明らかである。
While the above invention has been described in some detail by way of illustration and example for purposes of clarity of understanding, it is understood that certain changes and modifications are within the spirit or scope of the appended claims. It will be readily apparent to one of ordinary skill in the art in view of the teachings of the present invention, which may be made without departing from the scope.

【0225】 (寄託情報) 以下の材料は、アメリカンタイプカルチャーコレクション(CMCC=Chi
ron Master Culture Collection)に寄託された
(Deposit Information) The following materials are American Type Culture Collection (CMCC = Chi)
ron Master Culture Collection).

【0226】[0226]

【表8】 [Table 8]

【0227】 さらに、選択されたクローンのプール、ならびに特定のクローンを含むライブ
ラリーは、「ES」番号(内部参照)を割り当てられ、そしてATCCに受託さ
れた。以下の表21は、ES寄託物のATCC受託番号を提供する。これらの全
ては、1999年5月13日に、またはそれ以前に寄託された。これらの寄託物
の各々を含むクローンの名前は、22以上の番号の表において提供される(特許
請求の範囲の後に挿入される)。
In addition, the pool of selected clones, as well as the library containing the particular clones, were assigned an “ES” number (internal reference) and deposited with the ATCC. Table 21 below provides the ATCC Deposit Numbers for ES deposits. All of these were deposited on or before May 13, 1999. The names of the clones containing each of these deposits are provided in the table numbered 22 and above (inserted after the claims).

【0228】 表12:1999年9月23日以前にATCCに寄託されたクローンのプール
およびライブラリー
Table 12: Pools and libraries of clones deposited with the ATCC before September 23, 1999.

【0229】[0229]

【表9】 [Table 9]

【0230】 本明細書中に記載される寄託物は、当業者への便宜としてのみ提供され、そし
て寄託物が米国特許法112において要求されるという承認ではない。寄託され
た材料に含まれるポリヌクレオチドの配列、ならびにそれによってコードされる
ポリペプチドのアミノ酸配列は、本明細書中に参考として援用され、そして本明
細書中の配列の記載とのいかなる矛盾の事象をも制御する。寄託された材料を作
製、使用、または販売するためには、許可が必要であり得、そしてこのような許
可は、本明細書によって付与される。
The deposits described herein are provided solely as a convenience to those of ordinary skill in the art and are not an admission that the deposit is required by US Pat. The sequences of the polynucleotides contained in the deposited material, as well as the amino acid sequences of the polypeptides encoded thereby, are incorporated herein by reference and are in the event of any conflict with the description of the sequences herein. Also controls. A permit may be required to make, use, or sell the deposited material, and such a permit is hereby granted.

【0231】 (プールされたクローンの寄託物からの個々のクローンの回収) ATCC寄託物がcDNAクローンのプールまたはcDNAクローンのライブ
ラリーから構成される場合、この寄託物は、各々のクローンを別々の細菌細胞に
まずトランスフェクトすることによって調製した。次いで、プールまたはライブ
ラリー中のクローンを、複合性(composite)の寄託物中の等価な混合
物のプールとして寄託した。特定のクローンを、当該分野で周知の方法を使用し
て複合性の寄託物から獲得し得る。例えば、特定のクローンを含む細菌細胞を、
単一のコロニーを単離すること、およびそのクローンのインサートの配列に特異
的にハイブリダイズするように設計されたオリゴヌクレオチドプローブ(単数ま
たは複数)(例えば、示された配列番号を有するコードされたポリヌクレオチド
のマスクされていない配列に基づくプローブ)を使用して、標準的なコロニーハ
イブリダイゼーション技術によって特定のクローンを含むコロニーを同定するこ
とにより、同定し得る。このプローブは、約80℃(AまたはTの各々について
2℃、およびGまたはCの各々について4℃を仮定する)のTmを有するように
設計されるべきである。次いで、陽性コロニーを採取し得、培養して増殖させ、
そして組換えクローンを単離し得る。あるいは、この様式において設計されたプ
ローブをPCRに使用して、当該分野で周知の方法に従って、(例えば、寄託さ
れた培養プールからcDNAを精製すること、および対応する所望のポリヌクレ
オチド配列を有する増幅産物を生成するためにPCR反応においてこのプローブ
を使用することによって)プールされたクローンから核酸分子を単離し得る。
Recovery of Individual Clones from Pooled Clone Deposits If the ATCC deposit consists of a pool of cDNA clones or a library of cDNA clones, this deposit separates each clone separately. Prepared by first transfecting bacterial cells. Clones in the pool or library were then deposited as a pool of equivalent mixtures in the composite deposit. Specific clones may be obtained from composite deposits using methods well known in the art. For example, a bacterial cell containing a particular clone,
Isolation of a single colony and oligonucleotide probe (s) designed to specifically hybridize to the sequence of the insert of that clone (eg, encoded with the sequence number shown) (A probe based on the unmasked sequence of the polynucleotide) can be used to identify colonies containing particular clones by standard colony hybridization techniques. This probe should be designed to have a T m of about 80 ° C. (assuming 2 ° C. for each A or T and 4 ° C. for each G or C). Positive colonies can then be picked, cultured and propagated,
The recombinant clone can then be isolated. Alternatively, a probe designed in this manner can be used in PCR according to methods well known in the art (eg purifying cDNA from the deposited culture pool and amplifying with the corresponding desired polynucleotide sequence). Nucleic acid molecules can be isolated from pooled clones (by using this probe in a PCR reaction to generate a product).

【0232】[0232]

【表10】 [Table 10]

【0233】 [0233]

【0234】 [0234]

【0235】 [0235]

【0236】 [0236]

【0237】 [0237]

【0238】 [0238]

【0239】 [0239]

【0240】 [0240]

【0241】 [0241]

【0242】 [0242]

【0243】 [0243]

【0244】 [0244]

【0245】 [0245]

【0246】 [0246]

【0247】 [0247]

【0248】 [0248]

【0249】 [0249]

【0250】 [0250]

【0251】 [0251]

【0252】 [0252]

【0253】 [0253]

【0254】 [0254]

【0255】[0255]

【表11】 [Table 11]

【0256】[0256]

【表12】 [Table 12]

【0257】 [0257]

【0258】 [0258]

【0259】[0259]

【表13】 [Table 13]

【0260】 [0260]

【0261】 [0261]

【0262】 [0262]

【0263】 [0263]

【0264】 [0264]

【0265】 [0265]

【0266】 [0266]

【0267】 [0267]

【0268】 [0268]

【0269】 [0269]

【0270】 [0270]

【0271】 [0271]

【0272】 [0272]

【0273】 [0273]

【0274】 [0274]

【0275】 [0275]

【0276】 [0276]

【0277】 [0277]

【0278】 [0278]

【0279】 [0279]

【0280】 [0280]

【0281】 [0281]

【0282】 [0282]

【0283】 [0283]

【0284】 [0284]

【0285】 [0285]

【0286】 [0286]

【0287】 [0287]

【0288】 [0288]

【0289】 [0289]

【0290】 [0290]

【0291】 [0291]

【0292】 [0292]

【0293】 [0293]

【0294】 [0294]

【0295】 [0295]

【0296】 [0296]

【0297】 [0297]

【0298】 [0298]

【0299】 [0299]

【0300】 [0300]

【0301】 [0301]

【0302】[0302]

【表14】 [Table 14]

【0303】 [0303]

【0304】 [0304]

【0305】 [0305]

【0306】 [0306]

【0307】 [0307]

【0308】 [0308]

【0309】 [0309]

【0310】 [0310]

【0311】 [0311]

【0312】 [0312]

【0313】 [0313]

【0314】 [0314]

【0315】 [0315]

【0316】 [0316]

【0317】 [0317]

【0318】 [0318]

【0319】 [0319]

【0320】 [0320]

【0321】 [0321]

【0322】 [0322]

【0323】 [0323]

【0324】 [0324]

【0325】 [0325]

【0326】 [0326]

【0327】 [0327]

【0328】 [0328]

【0329】 [0329]

【0330】 [0330]

【0331】 [0331]

【0332】 [0332]

【0333】 [0333]

【0334】 [0334]

【0335】 [0335]

【0336】 [0336]

【0337】 [0337]

【0338】 [0338]

【0339】[0339]

【表15】 [Table 15]

【0340】[0340]

【表16】 [Table 16]

【0341】 [0341]

【0342】 [0342]

【0343】 [0343]

【0344】 [0344]

【0345】[0345]

【表17】 [Table 17]

【0346】 [0346]

【配列表】 [Sequence list]

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) C12N 1/21 C12Q 1/68 Z 5/10 C12N 15/00 ZNAA C12Q 1/68 5/00 A (31)優先権主張番号 60/102,380 (32)優先日 平成10年9月29日(1998.9.29) (33)優先権主張国 米国(US) (31)優先権主張番号 60/103,815 (32)優先日 平成10年10月8日(1998.10.8) (33)優先権主張国 米国(US) (31)優先権主張番号 60/105,877 (32)優先日 平成10年10月27日(1998.10.27) (33)優先権主張国 米国(US) (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SL,SZ,TZ,UG,ZW ),EA(AM,AZ,BY,KG,KZ,MD,RU, TJ,TM),AE,AL,AM,AT,AU,AZ, BA,BB,BG,BR,BY,CA,CH,CN,C R,CU,CZ,DE,DK,DM,EE,ES,FI ,GB,GD,GE,GH,GM,HR,HU,ID, IL,IN,IS,JP,KE,KG,KP,KR,K Z,LC,LK,LR,LS,LT,LU,LV,MD ,MG,MK,MN,MW,MX,NO,NZ,PL, PT,RO,RU,SD,SE,SG,SI,SK,S L,TJ,TM,TR,TT,UA,UG,UZ,VN ,YU,ZA,ZW (72)発明者 エスコベド, ジェイム アメリカ合衆国 カリフォルニア 94507, アラモ, ラボルナ ロード 1470 (72)発明者 イニス, マイケル エー. アメリカ合衆国 カリフォルニア 94556, モラガ, コンスタンス プレイス 315 (72)発明者 ガルシア, パブロ ドミンガ アメリカ合衆国 カリフォルニア 94131, サン フランシスコ, チェナリー ス トリート 882 (72)発明者 サドス−クリンガー, ジュリー アメリカ合衆国 カリフォルニア 94707, ケンジントン, レキシントン ロード 280 (72)発明者 ライナハート クリストフ アメリカ合衆国 カリフォルニア 94501, アラメダ, クリントン アベニュー 1633 (72)発明者 ギエス, クラウス ドイツ国 ベルリン ディー−10115, ショセットラッセ 92 (72)発明者 ランダッゾ, フィリッポ アメリカ合衆国 カリフォルニア 94133, サン フランシスコ, チェストナット ストリート 690 アパートメント 403 (72)発明者 ケネディ, ギウリア シー. アメリカ合衆国 カリフォルニア 94116, サン フランシスコ, カステナダ ア ベニュー 360 (72)発明者 ポット, デビッド アメリカ合衆国 カリフォルニア 94112, サン フランシスコ, ナンバー 102, 5ティーエイチ アベニュー 1565 (72)発明者 カッサム, アルタフ アメリカ合衆国 カリフォルニア 94602, オークランド,ハロルド ストリート 2659 (72)発明者 ラムソン, ジョージ アメリカ合衆国 カリフォルニア 94556, モラガ, サンドリンガム ドライブ 232 (72)発明者 ドルマナック, ラドジェ アメリカ合衆国 カリフォルニア 94303, パロ アルト, イースト グリーンウ ィッチ プレイス 850 (72)発明者 クルクベンジャコブ, ラドミール アメリカ合衆国 カリフォルニア 94068, サニーベイル, ヘイバーヒル ドライ ブ 762 (72)発明者 ディックソン, マーク アメリカ合衆国 カリフォルニア 95025, ホリスター, ナンバー ビー., ガ ビラン ドライブ 1411 (72)発明者 ドルマナック, スネザナ アメリカ合衆国 カリフォルニア 94303, パロ アルト, イースト グリーンウ ィッチ プレイス 850 (72)発明者 ラバト, イバン アメリカ合衆国 カリフォルニア 94086, サニーベイル, アカラネス ドライブ 140 (72)発明者 レシュコウィッツ, デナ アメリカ合衆国 カリフォルニア 94087, サニーベイル, ダーシャイアー ウェ イ 678 (72)発明者 キタ, デビッド アメリカ合衆国 カリフォルニア 94404, フォスター シティ, ボウンティ ド ライブ 899 (72)発明者 ガルシア, ベロニカ アメリカ合衆国 カリフォルニア 94086, サニーベイル, アノ ヌエボ 396, アパートメント 412 (72)発明者 ジョーンズ, リー ウィリアム アメリカ合衆国 カリフォルニア 94086, サニーベイル, ナンバー 412 アノ ヌエボ 396 (72)発明者 スタチェ−クレイン, バージット アメリカ合衆国 カリフォルニア 94086, サニーベイル, サウス マリー アベ ニュー 345 Fターム(参考) 4B024 AA01 AA12 AA19 BA80 CA02 CA04 CA09 CA12 CA20 DA01 DA02 DA05 DA11 DA12 GA11 HA11 4B063 QA01 QA20 QQ43 QQ53 QR56 QR84 QS34 QS39 QX10 4B065 AA01X AA58X AA72X AA87X AA93Y AB01 AC14 BA01 CA24 CA44 CA46 4H045 AA10 AA11 BA10 CA40 DA75 EA20 EA50 FA71 FA74 ─────────────────────────────────────────────────── ─── Continued Front Page (51) Int.Cl. 7 Identification Code FI Theme Coat (Reference) C12N 1/21 C12Q 1/68 Z 5/10 C12N 15/00 ZNAA C12Q 1/68 5/00 A (31 ) Priority claim number 60/102, 380 (32) Priority date September 29, 1998 (September 29, 1998) (33) Country of priority claim United States (US) (31) Priority claim number 60/103 , 815 (32) Priority date October 8, 1998 (Oct. 8, 1998) (33) Priority claiming country United States (US) (31) Priority claim number 60/105, 877 (32) Priority date Heisei October 27, 2010 (October 27, 1998) (33) Priority claiming countries United States (US) (81) Designated countries EP (AT, BE, CH, CY, DE, DK, ES, FI, FR, GB , GR, IE, IT, LU, MC, NL, PT, SE), A (BF, BJ, CF, CG, CI, CM, GA, GN, GW, ML, MR, NE, SN, TD, TG), AP (GH, GM, KE, LS, MW, SD, SL, SZ, TZ, UG, ZW), EA (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM), AE, AL, AM, AT, AU, AZ, BA, BB, BG, BR, BY, CA, CH, CN, CR, CU, CZ, DE, DK, DM, EE, ES, FI, GB, GD, GE, GH, GM, HR, HU, ID, IL, IN, IS, JP , KE, KG, KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV, MD, MG, MK, MN, MW, MX, NO, NZ, PL, PT, RO, RU, SD, SE, SG, SI, SK, SL, TJ, TM, TR, TT, UA, UG, UZ, N, YU, ZA, ZW (72) inventor Escobedo, Jaime United States California 94507, Alamo, Raboruna load 1470 (72) inventor Innis, Michael er. United States California 94556, Moraga, Constance Place 315 (72) Inventor Garcia, Pablo Dominga United States California 94131, San Francisco, Chenery Street 882 (72) Inventor Sados Klinger, Julie United States California 94707, Kensington, Lexington Road 280 ( 72) Inventor Linahart Christoff, California 94501, Alameda, Clinton Avenue 1633 (72) Inventor Gies, Klaus Germany Berlin D-10115, Chossetlass 92 (72) Inventor Randazo, Filippo United States California 94133, San Francisco, Chestnut Street 690 Apartment 403 (72) Inventor Kennedy, Giulian Sea. United States California 94116, San Francisco, Castenada Avenue 360 (72) Inventor Pot, David United States California 94112, San Francisco, Number 102, 5T Avenue 1565 (72) Inventor Cassam, Altaf United States California 94602, Oakland, Harold Street 2659 (72) Inventor Ramson, George United States California 94556, Moraga, Sandringham Drive 232 (72) Inventor Dolmanac, Ladge United States California 94303, Palo Alto, East Greenwich Place 850 (72) Inventor Kurk Benjacob, Radmir United States California 94068, Sunnyvale, Haverhill Drive 762 (72) Inventor Dickson, Mark United States California 95025, Hollister, Number B. , Gabiran Drive 1411 (72) Inventor Dormanac, Snezana United States California 94303, Palo Alto, East Greenwich Place 850 (72) Inventor Rabat, Iban United States California 94086, Sunnyvale, Akaranes Drive 140 (72) Inventor Reshko Witts, Dena United States California 94087, Sunnyvale, Darshire Way 678 (72) Inventor Kita, David United States California 94404, Foster City, Bounty Drive 899 (72) Inventor Garcia, Veronica United States California 94086, Sunnyvale, Anno Nuevo 396 , Apartment 412 (72) Inventor Jones, Lee William United States California 94086, Sunnyvale, number 412 Anon Bo 396 (72) Inventor Stacey Crane, Bargit United States California 94086, Sunnyvale, South Mary Avenue 345 F Term (reference) 4B024 AA01 AA12 AA19 BA80 CA02 CA04 CA09 CA12 CA20 DA01 DA02 DA05 DA11 DA12 GA11 HA11 4B063 QA01 QA20 QQ43Q QR56 QR84 QS34 QS39 QX10 4B065 AA01X AA58X AA72X AA87X AA93Y AB01 AC14 BA01 CA24 CA44 CA46 4H045 AA10 AA11 BA10 CA40 DA75 EA20 EA50 FA71 FA74

Claims (12)

【特許請求の範囲】[Claims] 【請求項1】 ポリヌクレオチドのライブラリーであって、配列番号1〜1
079のうちの少なくとも1つの配列情報を含む、ライブラリー。
1. A library of polynucleotides, SEQ ID NOs: 1 to 1.
A library comprising sequence information for at least one of 079.
【請求項2】 前記ライブラリーが核酸アレイ上に提供される、請求項1に
記載のライブラリー。
2. The library of claim 1, wherein the library is provided on a nucleic acid array.
【請求項3】 前記ライブラリーがコンピューター読み出し可能フォーマッ
トで提供される、請求項1に記載のライブラリー。
3. The library of claim 1, wherein the library is provided in computer readable format.
【請求項4】 前記ライブラリーが、コントロール細胞と相対的に高転移能
力の細胞において示差発現される遺伝子に対応するポリヌクレオチドを含み、該
コントロール細胞は正常細胞または低転移能力の細胞であり、そしてここで前記
配列は、配列番号350、571、781、778、756、779、691、
686、916、および969からなる群から選択される、請求項1に記載のラ
イブラリー。
4. The library comprises a polynucleotide corresponding to a gene that is differentially expressed in a cell having a high metastatic potential relative to a control cell, the control cell being a normal cell or a cell having a low metastatic potential, And here, the sequences are SEQ ID NOS: 350, 571, 781, 778, 756, 779, 691,
The library of claim 1 selected from the group consisting of 686, 916, and 969.
【請求項5】 前記ライブラリーが、コントロール細胞と相対的に低転移能
力の癌細胞において示差発現される遺伝子に対応するポリヌクレオチドを含み、
該コントロール細胞は正常細胞または高転移能力の細胞であり、そしてここで前
記配列は、配列番号34、57、103、110、113、189、214、3
59、521、532、533、536、547、549、554、555、5
58、561、562、572、582、584、587、589、590、5
91、592、599、603、607、609、623、624、635、6
36、637、641、646、647、648、650、653、654、6
56、657、および661からなる群から選択される、請求項1に記載のライ
ブラリー。
5. The library comprises a polynucleotide corresponding to a gene that is differentially expressed in a cancer cell having a relatively low metastatic potential as compared with a control cell,
The control cells are normal cells or cells with high metastatic potential, and wherein the sequences are SEQ ID NOs: 34, 57, 103, 110, 113, 189, 214, 3
59, 521, 532, 533, 536, 547, 549, 554, 555, 5
58, 561, 562, 572, 582, 584, 587, 589, 590, 5
91, 592, 599, 603, 607, 609, 623, 624, 635, 6
36, 637, 641, 646, 647, 648, 650, 653, 654, 6
The library of claim 1, selected from the group consisting of 56, 657, and 661.
【請求項6】 配列番号1〜1079の同定した配列またはその縮重変異体
もしくはフラグメントに対して少なくとも90%の配列同一性を有するヌクレオ
チド配列を含む、単離されたポリヌクレオチド。
6. An isolated polynucleotide comprising a nucleotide sequence having at least 90% sequence identity to the identified sequences of SEQ ID NOs: 1-1079 or degenerate variants or fragments thereof.
【請求項7】 請求項6に記載のポリヌクレオチドを含む、組換え宿主細胞
7. A recombinant host cell comprising the polynucleotide of claim 6.
【請求項8】 請求項6に記載のポリヌクレオチドによってコードされる、
単離されたポリペプチド。
8. A polynucleotide encoded by the polynucleotide of claim 6,
Isolated polypeptide.
【請求項9】 請求項8に記載のポリペプチドを特異的に結合する、抗体。9. An antibody that specifically binds to the polypeptide of claim 8. 【請求項10】 請求項6に記載のポリヌクレオチドを含む、ベクター。10. A vector comprising the polynucleotide according to claim 6. 【請求項11】 ATCC受託番号xx、またはxxとして寄託されたクロ
ーンに含まれる、目的のヌクレオチド配列を含む、ポリヌクレオチド。
11. A polynucleotide comprising the nucleotide sequence of interest contained in ATCC Deposit No. xx, or the clone deposited as xx.
【請求項12】 哺乳動物細胞の癌性状態に相関して示差発現される遺伝子
を検出する方法であって、該方法は以下の工程: 癌であると疑われる細胞に由来する試験サンプルにおいて示差発現された少な
くとも1つ遺伝子産物を検出する工程であって、ここで該遺伝子産物は、配列番
号34、57、100、103、110、113、189、209、214、3
16、350、359、370、521、532、533、536、547、5
49、554、555、558、561、562、571、572、582、5
84、587、589、590、591、592、599、603、607、6
09、623、624、635、636、637、641、645、646、6
47、648、650、653、654、656、657、661、781、7
78、756、779、691、686、854、916、および969のうち
の少なくとも1つの配列に対応する遺伝子によってコードされる、工程; を包含し、 ここで該示差発現される遺伝子産物の検出は、該試験サンプルが由来した該細
胞の癌性状態に相関する、方法。
12. A method for detecting a gene differentially expressed in correlation with the cancerous state of a mammalian cell, the method comprising the steps of: differentially in a test sample derived from cells suspected of being cancerous. Detecting at least one expressed gene product, wherein said gene product is SEQ ID NO: 34, 57, 100, 103, 110, 113, 189, 209, 214, 3,
16, 350, 359, 370, 521, 532, 533, 536, 547, 5
49, 554, 555, 558, 561, 562, 571, 572, 582, 5
84, 587, 589, 590, 591, 592, 599, 603, 607, 6
09, 623, 624, 635, 636, 637, 641, 645, 646, 6
47, 648, 650, 653, 654, 656, 657, 661, 781, 7
78, 756, 779, 691, 686, 854, 916, and 969 encoded by a gene corresponding to a sequence of the gene, wherein the detection of the differentially expressed gene product comprises: , Correlating with the cancerous state of the cells from which the test sample was derived.
JP2000572363A 1998-09-28 1999-09-23 Human genes and gene expression products Withdrawn JP2003530816A (en)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
US10218098P 1998-09-28 1998-09-28
US10216198P 1998-09-28 1998-09-28
US60/102,161 1998-09-28
US60/102,180 1998-09-28
US10238098P 1998-09-29 1998-09-29
US60/102,380 1998-09-29
US10381598P 1998-10-08 1998-10-08
US60/103,815 1998-10-08
US10587798P 1998-10-27 1998-10-27
US60/105,877 1998-10-27
PCT/US1999/022226 WO2000018916A2 (en) 1998-09-28 1999-09-23 Human genes and gene expression products

Publications (1)

Publication Number Publication Date
JP2003530816A true JP2003530816A (en) 2003-10-21

Family

ID=27537030

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000572363A Withdrawn JP2003530816A (en) 1998-09-28 1999-09-23 Human genes and gene expression products

Country Status (4)

Country Link
EP (1) EP1144636A2 (en)
JP (1) JP2003530816A (en)
AU (1) AU6263999A (en)
WO (1) WO2000018916A2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013032381A (en) * 2004-05-11 2013-02-14 Ganymed Pharmaceuticals Ag Identification of surface-associated antigen for purpose of diagnosing and treating tumor

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6511834B1 (en) 2000-03-24 2003-01-28 Millennium Pharmaceuticals, Inc. 32142,21481,25964,21686, novel human dehydrogenase molecules and uses therefor
US6627423B2 (en) 2000-03-24 2003-09-30 Millennium Pharmaceuticals, Inc. 21481, a novel dehydrogenase molecule and uses therefor
GB0106782D0 (en) * 2001-03-19 2001-05-09 Univ The Glasgow Polypeptides, methods and means
US7449548B2 (en) 2001-12-07 2008-11-11 Agensys, Inc. Nucleic acid and corresponding protein entitled 193P1E1B useful in treatment and detection of cancer
US20040081653A1 (en) 2002-08-16 2004-04-29 Raitano Arthur B. Nucleic acids and corresponding proteins entitled 251P5G2 useful in treatment and detection of cancer
EP3112474A1 (en) * 2015-06-29 2017-01-04 Evonik Degussa GmbH Method of detecting avian necrotic enteritis

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL101943A0 (en) * 1991-05-24 1992-12-30 Genentech Inc Structure,production and use of heregulin
US5633161A (en) * 1995-03-29 1997-05-27 Millennium Pharmaceuticals, Inc. Murine gene fomy030 coding for tumor progression inhibitor
WO1999033982A2 (en) * 1997-12-23 1999-07-08 Chiron Corporation Human genes and gene expression products i

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013032381A (en) * 2004-05-11 2013-02-14 Ganymed Pharmaceuticals Ag Identification of surface-associated antigen for purpose of diagnosing and treating tumor
JP2015083576A (en) * 2004-05-11 2015-04-30 ガニュメート・ファーマシューティカルズ・アクチェンゲゼルシャフトGanymed Pharmaceuticals Ag Identification of surface-associated antigen for purpose of diagnosing and treating tumor
US9255131B2 (en) 2004-05-11 2016-02-09 Ganymed Pharmaceuticals Ag Identification of surface-associated antigens for tumor diagnosis and therapy
JP2016179986A (en) * 2004-05-11 2016-10-13 ガニュメート・ファーマシューティカルズ・アクチェンゲゼルシャフトGanymed Pharmaceuticals Ag Identification of surface associated antigens for purpose of diagnosis and treatment of tumor
US9533043B2 (en) 2004-05-11 2017-01-03 Biontech Ag Identification of surface-associated antigens for tumor diagnosis and therapy
JP2018104464A (en) * 2004-05-11 2018-07-05 ガニュメート・ファーマシューティカルズ・アクチェンゲゼルシャフトGanymed Pharmaceuticals Ag Identification of surface associated antigens for purpose of diagnosis and treatment of tumor
US10724103B2 (en) 2004-05-11 2020-07-28 Biontech Ag Identification of surface associated antigen FLJ31461 for tumor diagnosis and therapy

Also Published As

Publication number Publication date
WO2000018916A3 (en) 2000-11-16
WO2000018916A2 (en) 2000-04-06
EP1144636A2 (en) 2001-10-17
AU6263999A (en) 2000-04-17

Similar Documents

Publication Publication Date Title
US7122373B1 (en) Human genes and gene expression products V
JP2003518920A (en) New human genes and gene expression products
US20070243176A1 (en) Human genes and gene expression products
JP2002500010A (en) Human genes and gene expression products I
JP2004502406A (en) Human genes and human gene expression products
US20020076735A1 (en) Diagnostic and therapeutic methods using molecules differentially expressed in cancer cells
JP2002519000A (en) Human genes and gene expression products II
JP2002517244A (en) Genes and gene expression products that are differentially regulated in prostate cancer
JP2011254830A (en) Polynucleotide related to colon cancer
US20030215803A1 (en) Human genes and gene expression products isolated from human prostate
US20030065156A1 (en) Novel human genes and gene expression products I
JP2003530816A (en) Human genes and gene expression products
JP2003528630A (en) Human genes and expression products
CA2430794A1 (en) Human genes and gene expression products isolated from human prostate
US7355025B2 (en) Marker molecules associated with lung tumors
EP1466988A2 (en) Genes and gene expression products that are differentially regulated in prostate cancer

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20061205