JP2008507261A - Novel nucleotide and amino acid sequences for lung cancer diagnosis, and assays and methods of use thereof - Google Patents

Novel nucleotide and amino acid sequences for lung cancer diagnosis, and assays and methods of use thereof Download PDF

Info

Publication number
JP2008507261A
JP2008507261A JP2007519922A JP2007519922A JP2008507261A JP 2008507261 A JP2008507261 A JP 2008507261A JP 2007519922 A JP2007519922 A JP 2007519922A JP 2007519922 A JP2007519922 A JP 2007519922A JP 2008507261 A JP2008507261 A JP 2008507261A
Authority
JP
Japan
Prior art keywords
pea
amino acid
amino acids
acid sequence
isolated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007519922A
Other languages
Japanese (ja)
Other versions
JP2008507261A5 (en
Inventor
ポロック,サラ
レビン,ズリット
ノヴィク,アミト
ダハリ,ドゥビル
ソレク,ロテム
トポリク,アミル
サメア−グリーンワルド,シャ−リー
セラ−タヴォル,オスナット
ディベル,アレキサンダー
コジョカル,ガッド,エス.
アヤロン−ソファー,マイケル
ワラチ,シラ
アキヴァ,ピンチャス
ケレン,ナオミ
シェメシ,ロネン
Original Assignee
コンピュゲン ユーエスエイ,インク.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by コンピュゲン ユーエスエイ,インク. filed Critical コンピュゲン ユーエスエイ,インク.
Priority claimed from US11/051,720 external-priority patent/US7569662B2/en
Publication of JP2008507261A publication Critical patent/JP2008507261A/en
Publication of JP2008507261A5 publication Critical patent/JP2008507261A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification

Abstract

高感度且つ正確な新規の肺癌用マーカー。これらのマーカーは、正常な肺組織とは対照的に肺癌中で特異的に過剰発現する。患者サンプルにおける単独または組み合わせたこれらのマーカーの測定により、診断医が肺癌の診断予測と相関させることができる情報が得られる。本発明のマーカーは、単独または組み合わせて、肺癌と非癌状態とを高度に識別検出する。  Highly sensitive and accurate novel marker for lung cancer. These markers are specifically overexpressed in lung cancer in contrast to normal lung tissue. Measurement of these markers, alone or in combination, in patient samples provides information that can be correlated with a diagnostic predictor of lung cancer. The markers of the present invention, alone or in combination, highly discriminate and detect lung cancer and non-cancerous states.

Description

発明の分野
本発明は、肺癌の診断マーカーである新規のヌクレオチド配列およびタンパク質配列ならびにそのアッセイおよび使用方法に関する。
FIELD OF THE INVENTION The present invention relates to novel nucleotide and protein sequences that are diagnostic markers for lung cancer and to assays and methods of use thereof.

発明の背景
肺癌は、米国の男性および女性の癌死亡の主な原因であり、1994年に推定172,000の新規の症例が報告されている。全肺癌患者の5年生存率は、診断時の病期と無関係に、13%でしかない。これは、疾患がまだ限局している検出症例の5年生存率が46%であることと対照的である。しかし、肺癌は、疾患の拡大前に16%しか発見されない。肺癌は、小細胞肺癌または非小細胞肺癌に大きく分類される。非小細胞肺癌は、腺癌、気管支肺胞癌(bronchoalveolar−alveolar)、扁平上皮癌、および大細胞癌にさらに分類される。ほぼ75〜85%の肺癌が非小細胞肺癌であり、15〜25%が小細胞肺癌である。
BACKGROUND OF THE INVENTION Lung cancer is the leading cause of cancer death in men and women in the United States, with an estimated 172,000 new cases reported in 1994. The 5-year survival rate for all lung cancer patients is only 13%, regardless of the stage at diagnosis. This is in contrast to the 5-year survival rate of 46% of detected cases where disease is still localized. However, only 16% of lung cancers are found before the spread of the disease. Lung cancer is broadly classified into small cell lung cancer or non-small cell lung cancer. Non-small cell lung cancer is further classified into adenocarcinoma, bronchoalveolar-alveolar, squamous cell carcinoma, and large cell carcinoma. Approximately 75-85% of lung cancers are non-small cell lung cancer and 15-25% are small cell lung cancer.

疾患が進行した病期に達するまでしばしば臨床症状が認められないので、早期発見は困難である。現在、診断は、胸部X線の使用、痰に含まれる細胞型の分析、および気管支のファイバースコープ試験が用いられている。癌の型および病期によって治療計画を決定し、治療計画には、手術、放射線療法、および/または化学療法が含まれる。   Early detection is difficult because clinical symptoms are often not observed until the disease has reached an advanced stage. Currently, diagnosis uses chest x-ray, analysis of cell types contained in sputum, and bronchial fiberscope testing. The treatment plan is determined by the type and stage of the cancer, and the treatment plan includes surgery, radiation therapy, and / or chemotherapy.

原発性疾患、転移性疾患、および再発性疾患の早期発見は、肺癌を罹患した個体の予後に有意に影響を与え得る。初期段階で診断された非小細胞肺癌は、より進行した段階で診断されたものより結果が有意に良好である。同様に、小細胞肺癌の早期診断もより良好な予後の可能性を秘めている。   Early detection of primary disease, metastatic disease, and recurrent disease can significantly affect the prognosis of individuals suffering from lung cancer. Non-small cell lung cancer diagnosed at an early stage has significantly better results than those diagnosed at a more advanced stage. Similarly, early diagnosis of small cell lung cancer also has the potential for better prognosis.

現行の放射線療法薬、化学療法薬、および生物毒素は強力な細胞毒素であるにもかかわらず、これらは正常な細胞と悪性細胞とを区別せず、副作用および用量規定毒性を生じる。肺癌特異的癌マーカーが依然として必要である。患者由来サンプル中の肺癌マーカーの存在を検出するために使用することができる試薬およびキットが依然として必要である。肺癌を有する個体のスクリーニング方法および診断方法、ならびに肺癌と診断された患者の治療に対する応答、疾患の進行、および疾患の再発のモニタリング方法が依然として必要である。肺癌を有する個体の肺癌型を決定するための試薬、キット、および方法が依然として必要である。肺癌細胞を特異的にターゲティングすることができる組成物が依然として必要である。肺癌細胞に特異的に結合することができる造影剤が依然として必要である。改良された肺癌細胞の画像化方法が依然として必要である。肺癌細胞に特異的に結合することができる治療薬が依然として必要である。肺癌を罹患している疑いのある個体の改良された治療方法が依然として必要である。   Although current radiotherapeutic agents, chemotherapeutic agents, and biotoxins are potent cytotoxins, they do not distinguish between normal and malignant cells and produce side effects and dose limiting toxicity. Lung cancer specific cancer markers are still needed. There remains a need for reagents and kits that can be used to detect the presence of lung cancer markers in patient derived samples. There remains a need for methods of screening and diagnosing individuals with lung cancer, as well as responses to treatment of patients diagnosed with lung cancer, disease progression, and methods of monitoring disease recurrence. There remains a need for reagents, kits, and methods for determining the type of lung cancer in individuals with lung cancer. There is still a need for compositions that can specifically target lung cancer cells. There remains a need for contrast agents that can specifically bind to lung cancer cells. There remains a need for improved methods of imaging lung cancer cells. There remains a need for therapeutic agents that can specifically bind to lung cancer cells. There remains a need for improved methods of treating individuals suspected of having lung cancer.

発明の要旨
背景技術は、単独または組み合わせて十分に高感度および/または正確な肺癌用マーカーを教示も示唆もしていない。
SUMMARY OF THE INVENTION The background art neither teaches nor suggests sufficiently sensitive and / or accurate markers for lung cancer, alone or in combination.

本発明は、高感度且つ正確な肺癌用の新規のマーカーを提供することによって背景技術のこれらの欠点を克服している。さらに、これらのマーカーは、小細胞肺癌または非小細胞肺癌などの異なる肺癌型を区別することができ、さらに腺癌、扁平上皮癌、および大細胞癌などの非小細胞肺癌型を区別することができる。これらのマーカーは、正常な肺組織と対照的に肺癌中で特異的に過剰発現する。患者(生体)サンプル中での単独または組み合わせたこれらのマーカーの測定により、診断医が予想される肺癌診断と相関し得る情報が得られる。本発明のマーカーにより、単独または組み合わせて、肺癌と非癌性状態とが高度に差分検出される。   The present invention overcomes these shortcomings of the background art by providing a novel marker for lung cancer that is sensitive and accurate. Furthermore, these markers can distinguish different lung cancer types such as small cell lung cancer or non-small cell lung cancer, and further distinguish non small cell lung cancer types such as adenocarcinoma, squamous cell carcinoma and large cell cancer Can. These markers are specifically overexpressed in lung cancer in contrast to normal lung tissue. Measurement of these markers alone or in combination in patient (biological) samples provides information that can be correlated with the diagnosis of a lung cancer that a diagnostician would expect. The marker of the present invention is highly differentially detected between lung cancer and non-cancerous condition alone or in combination.

本発明の好ましい実施形態によれば、任意選択的に本発明の好ましい実施形態と共に使用することができる適切な生体サンプルの例には、血液、血清、血漿、血球、尿、痰、唾液、糞便、髄液またはCSF、リンパ液、皮膚の外分泌物、気道、腸管、および尿生殖路、涙、ミルク、神経組織、肺組織、任意のヒト器官または組織(任意の腫瘍組織または正常組織、洗浄によって得られた任意の(例えば、気管支系または胸管系の)サンプル、およびin vivo細胞培養構成要素のサンプルが含まれる)が含まれるが、これらに限定されない。好ましい実施形態では、生体サンプルは、肺組織および/または痰および/または血清サンプルおよび/または尿サンプルおよび/または任意の他の組織または液体サンプルを含む。サンプルを、任意選択的に、サンプルを抗体と接触させる前および/または任意の他の診断アッセイの実施前に適切な溶出剤で希釈することができる。   According to a preferred embodiment of the present invention, examples of suitable biological samples which can optionally be used with the preferred embodiment of the present invention include blood, serum, plasma, blood cells, urine, sputum, saliva, feces , Cerebrospinal fluid or CSF, lymph fluid, exocrine skin, airway, intestine, and urogenital tract, tears, milk, nervous tissue, lung tissue, any human organ or tissue (any tumor tissue or normal tissue, obtained by lavage Including, but not limited to, any (eg, bronchial or thoracic duct) samples and samples of in vivo cell culture components. In a preferred embodiment, the biological sample comprises lung tissue and / or sputum and / or serum sample and / or urine sample and / or any other tissue or fluid sample. The sample can optionally be diluted with an appropriate eluting agent prior to contacting the sample with the antibody and / or performing any other diagnostic assay.

細胞局在化に関するテキストで与えられた情報を、以下の4つの異なるソフトウェアプログラムにしたがって確定した:膜貫通領域の予想のための(i)tmhmm(Center for Biological Sequence Analysis,Technical University of Denmark DTU,http://www.cbs.dtu.dk/services/TMHMM/TMHMM2.0b.guide.php由来)または(ii)tmpred(ISREC Bionformatics group and the LICR Information Technology Office,Ludwig Institute for Cancer Research,Swiss Institute of Bioinformatics,http://www.ch.embnet.org/software/TMPRED_form.htmlによって維持されたEMBnet;シグナルペプチド予想のための(iii)signalp_hmmまたは(iv)signalp_nn(共に、Center for Biological Sequence Analysis,Technical University of Denmark DTU,http://www.cbs.dtu.dk/services/SignalP/background/prediction.php由来)。用語「signalp_hmm」および「signalp_nn」は、プログラムSignalPについての2つの操作モードをいい、hmmはHidden Markov Modelをいい、nnは神経回路網をいう。公知のタンパク質局在化および/または遺伝子構造の手による検査ならびに各発明者による発見的方法の使用によっても局在化を決定した。ある場合には、細胞局在化予想の手による検査について、発明者らは、ProLoc計算プラットフォーム(Einat Hazkani−Covo,Erez Levanon,Galit Rotman,Dan Graur and Amit Novik;(2004)“Evolution of multicellularity in metazoa:comparative analysis of the subcellular localization of proteins in Saccharomyces,Drosophila and Caenorhabditis.” Cell Biology International 2004;28(3):171−8.)を使用し、このプラットフォームは、種々のパラメータ(タンパク質ドメイン(例えば、タンパク質内の膜貫通領域およびその局在化の予想)、pI、タンパク質の長さ、アミノ酸組成、予め注釈をつけたタンパク質に対する相同性、一定のオルガネラにタンパク質を向かわせる配列パターン(核局在化シグナル(NLS)、ミトコンドリア局在化シグナルなど)の認識、シグナルペプチドおよびアンカーのモデリング、ならびに単一区画に特異的なPfam由来の固有のドメインの使用が含まれる)に基づいてタンパク質局在化を予想する。   The information given in the text on cellular localization was determined according to the following four different software programs: (i) tmhmm (Center for Biological Sequence Analysis, Technical University of Denmark DTU, for the prediction of transmembrane regions) http://www.cbs.dtu.dk/services/TMHMM/TMHMM2.0b.guide.php) or (ii) tmpred (ISREC Bionformatics group and the LICR Information Technology Office, Ludwig Institute for Cancer Research, Swiss Inst EMBnet maintained by tute of Bioinformatics, http://www.ch.embnet.org/software/TMPRED_form.html; (iii) signalp_hmm or (iv) signalp_nn for signal peptide prediction (both, Center for Biological Sequence Analysis Technical University of Denmark DTU, from http://www.cbs.dtu.dk/services/SignalP/background/prediction.php) The terms "signalp_hmm" and "signalp_nn" refer to two for the program SignalP Hmm means Hidden Markov Model, nn means neural network, also by manual inspection of known protein localization and / or gene structure and also by the use of heuristics by each inventor In some cases, for the manual examination of cell localization prediction, we used the ProLoc calculation platform (Einat Hazkani-Covo, Erez Levanon, Galit Rotman, Dan Graur and Amit Novik; (2004). “Evolution of multicellularity in metazoa: comparative analysis of the subcellular localization of protee ns in Saccharomyces, Drosophila and Caenorhabditis. Using Cell Biology International 2004; 28 (3): 171-8.), This platform has various parameters (eg, the protein domain (eg, the transmembrane domain in the protein and its localization expected), pI, Protein length, amino acid composition, homology to previously annotated proteins, recognition of sequence patterns (NLS, mitochondrial localization signals etc.) that direct the proteins to certain organelles, signal peptides The protein localization is predicted based on and modeling of the anchor, as well as the use of a unique domain specific to Pfam specific to a single compartment.

SNP(一塩基多型)に関するテキストから情報が得られる。略語の説明を以下に示す。「T−>C」は、例えば、SNPによってテーブル中に与えられた位置がTからCに変化することを意味する。同様に、「M−>Q」は、例えば、SNPにより、対応するアミノ酸配列中のメチオニン(M)がグアニン(Q)に変化したことを意味する。ヌクレオチド配列SNPの右側の文字の代わりに、スペースが存在する場合、フレームシフトが生じたことを示す。フレームシフトを、ハイフン(−)で示すこともできる。終止コドンを、右側にアスタリスク(*)で示す。SNPの記載の一部として、SNP自体の上記記述後に括弧内にコメントを見出すことができる。このコメントは、示したANPを使用して作製したSwissProtエントリーに対する識別子であるFTIdを含み得る。FTIdは固有且つ安定なフィーチャー(feature)識別子であり、フィーチャーテーブル中の位置特異的注釈から特化したタンパク質関連データベースへのリンクを直接的に構築する。FTIdは常に記述フィールド中のフィーチャーの最後の構成要素である:FTId=XXX_数(XXXは、6桁数から下線によって分離された特定のフィーチャーキーの3文字表記である)。本発明の選択されたスプライスバリアントの野生型タンパク質のアミノ酸変異の表では、第1行目のヘッダーは、「アミノ酸配列上のSNPの位置」であり、アミノ酸配列上の公知の変異の位置を示す。SNPを、任意選択的に、単独または1つまたは複数の他のSNPおよび/または任意の他の診断マーカーと組み合わせて、本発明の診断マーカーとして使用することができる。本発明の好ましい実施形態は、このようなSNP(以下に示した公知の(WTまたは野生型)タンパク質配列上のSNPならびにこのようなSNPによって形成された新規の核酸配列および/またはアミノ酸配列、および/または本明細書中に記載の変異アミノ酸配列および/または核酸配列上の任意のSNPが含まれるが、これらに限定されない)を含む。   Information can be obtained from text on SNPs (single nucleotide polymorphisms). An explanation of the abbreviations is given below. "T-> C" means, for example, that the position given in the table by the SNP changes from T to C. Similarly, "M-> Q" means, for example, that a methionine (M) in the corresponding amino acid sequence has been changed to guanine (Q) by SNP. The presence of a space instead of the right-hand letter of the nucleotide sequence SNP indicates that a frame shift has occurred. Frame shifts can also be indicated by a hyphen (-). The stop codon is indicated to the right with an asterisk (*). As part of the description of the SNP, comments can be found in parentheses after the above description of the SNP itself. This comment may include FTId, which is an identifier for a SwissProt entry created using the ANP shown. The FTId is a unique and stable feature identifier, which directly builds a link from the location specific annotation in the feature table to a specialized protein related database. FTId is always the last component of the feature in the Description field: FTId = XXX_number (XXX is a three letter representation of a particular feature key separated by an underscore from a 6 digit number). In the table of amino acid mutations of wild-type proteins of selected splice variants of the present invention, the header on the first line is "the position of the SNP on the amino acid sequence" and indicates the position of the known mutation on the amino acid sequence . The SNPs can be used as diagnostic markers of the present invention, optionally, alone or in combination with one or more other SNPs and / or any other diagnostic markers. Preferred embodiments of the invention include such SNPs (the SNPs on the known (WT or wild type) protein sequences as shown below as well as novel nucleic acid and / or amino acid sequences formed by such SNPs, and And / or includes, but is not limited to, any SNPs on the variant amino acid sequences and / or nucleic acid sequences described herein.

公知のタンパク質との相同性に関してテキスト中に示した情報を、以下の特定の(非デフォルト)パラメータを使用したSmith−Waterman version 5.1.2によって決定した:
−model=sw.model
−GAPEXT=0
−GAPOP=100.0
−MATRIX=blosum100
The information given in the text for homology with known proteins was determined by Smith-Waterman version 5.1.2 using the following specific (non-default) parameters:
-Model = sw. model
-GAPEXT = 0
-GAPOP = 100.0
-MATRIX = blosum 100

ESTに基づいた癌中のクラスターの過剰発現に関する情報が得られる。このような過剰発現分析に関するp値の手がかりは以下である:

−ライブラリベースの統計学:細胞株中での発現レベルを含まないP値(P1)
−ライブラリベースの統計学:細胞株中での発現レベルを含むP値(P2)
−ESTクローン統計学:細胞株中での発現レベルを含まないP値(SP1)
−ESTクローン統計学:細胞株中での発現レベルを含まない推定過剰発現率(R3)
− ESTクローン統計学:細胞株中での発現レベルを含むP値(SP2)
− ESTクローン統計学:細胞株中での発現レベルを含む推定過剰発現率(R4)
Information is obtained on the overexpression of clusters in cancer based on EST. The clues to the p value for such overexpression analysis are:

Library-based statistics: P-values without expression levels in cell lines (P1)
Library based statistics: P value including expression level in cell lines (P2)
-EST clone statistics: P value without expression level in cell lines (SP1)
-EST clone statistics: estimated overexpression rate (R3) without expression level in cell lines
-EST clone statistics: P value including expression level in cell line (SP2)
-EST clone statistics: estimated overexpression rate (R4), including expression levels in cell lines

ライブラリベースの統計学は、全ライブラリにわたる統計学をいい、ESTクローン統計学は、特定の組織または癌からのESTについてのみの発現をいう。   Library-based statistics refers to statistics across all libraries, EST clonal statistics refers to expression only for ESTs from a particular tissue or cancer.

マイクロアレイに基づいた癌中のクラスターの過剰発現についての情報が得られる。マイクロアレイの基準として、特定のセグメントパラグラフでは、省略していない組織名を、発現を測定したチップ型を基準として使用した。マイクロアレイの結果は以下の2つのタイプがある:本発明によるデザインによって調製したマイクロアレイ由来のタイプ(マイクロアレイ作製手順は、本明細書中の「材料と実験手順」の項に詳述している)およびAffymetrix technologyを使用したマイクロアレイ由来の型。マイクロアレイ基準として、特定のセグメントパラグラフでは、省略していない組織名を、発現を測定したチップ型を基準として使用した。本発明によるデザインにしたがって調製したマイクロアレイについて、プローブ名は、クラスター(遺伝子)名から始まり、識別番号が続く。Affymetrixデータから得たオリゴヌクレオチドマイクロアレイの結果は、Affymetrix Inc,Santa Clara,CA,USAから利用可能なチップに由来した(例えば、www.affymetrix.com/products/arrays/specific/hgu133.affxのHuman Genome U133(HG−U133)Set;www.affymetrix.com/products/arrays/specific/hgu133av2.affxのGeneChip Human Genome U133A 2.0 Array;およびwww.affymetrix.com/products/arrays/specific/hgu133plus.affxのHuman Genome U133 Plus 2.0 Arrayに関するデータを参照のこと)。プローブ名は、Affymetrix命名規則のあとにくる。データは、NCBI Gene Expression Omnibus(www.ncbi.nlm.nih.gov/projects/geo/ and Edgar et al,Nucleic Acids Research,2002,Vol.30,No.1 207−210を参照のこと)から利用可能である。Series GSE1133データベース(2004年3月公開)のデータセット(結果を含む)は、www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1133から利用可能である;これらの結果の参考文献は以下である:Su et al(Proc Natl Acad Sci U S A.2004 Apr 20;101(16):6062−7.Epub 2004 Apr 09)。本発明者がデザインしたプローブを以下に列挙する。

>H61775_0_11_0
CCCCAGCTTTTATAGAGCGGCCCAAGGAAGAATATTTCCAAGAAGTAGGG
>M85491_0_0_25999
GACATCTTTGCATATCATGTCAGAGCTATAACATCATTGTGGAGAAGCTC
>M85491_0_14_0
GTCATGAAAATCAACACCGAGGTGCGGAGCTTCGGACCTGTGTCCCGCAG
>Z21368_0_0_61857
AGTTCATCCTTCTTCAGTGTGACCAGTAAATTCTTCCCATACTCTTGAAG
>HUMGRP5E_0_0_16630
GCTGATATGGAAGTTGGGGAATCTGAATTGCCAGAGAATCTTGGGAAGAG
>HUMGRP5E_0_2_0
TCTCATAGAAGCAAAGGAGAACAGAAACCACCAGCCACCTCAACCCAAGG
>D56406_0_5_0
TCTGACTTTTACGGACTTGGCTTGTTAGAAGGCTGAAAGATGATGGCAGG
>F05068_0_0_5744
ACGGGAGGGAAGGAAGGTGTGCGGGAGGAGTTCTCTGTCTCCACTCCCCT
>F05068_0_0_5754
CAAGGGGAACTGACCGTTGGTCCCGAAGGTCTAGAAGTGAATGGGAGCAG
>F05068_0_8_0
CTGGGCTTGGACTTCGGAGTTTTGCCATTGCCAGTGGGACGTCTGAGACT
>F05068_0_1_5751
TCTTAGCAGGTAGGTGCCGCAGACCCTGCGGGTTAAGAGGTGGGGTGGGG
>H38804_0_3_0
CGTAATTGCAGTGCATTTAGACAGGCATCTATTTGGACCTGTTTCTATCT
>HSENA78_0_1_0
TGAAGAGTGTGAGGAAAACCTATGTTTGCCGCTTAAGCTTTCAGCTCAGC
>R00299_0_8_0
CCAAGGCTCGTCTGCGCACCTTGTGTCTTGTAGGGTATGGTATGTGGGAC
>Z44808_0_8_0
AAAAGCATGAGTTTCTGACCAGCGTTCTGGACGCGCTGTCCACGGACATG
>Z44808_0_0_72347
ATGTTCTTAGGAGGCAAGCCAGGAGAAGCCGGGTCTGACTTTTCAGCTCA
>Z44808_0_0_72349
TCCTCCAGACCCAAAGCCACAACCCATCGCAAGTCAAGAACACTTTCCAG
>AA161187_0_0_433
ACCCTGGGTGGGCAAAAACGTGCTTTCCCGGACGGGGTTGAAGGGGAGAA
>AA161187_0_0_430
TGGAGACTGTTGCCCCACTCTGCAGATGCAGAAACGGAGGCTTGGCTGCT
>R66178_0_7_0
CCAGTGTGGTATCCTGGGAAACTCGGTTAAAAGGTGAGGCAGAGTACCAG
>HUMPHOSLIP_0_0_18458
AAGGAAGCAGGACCAGTGGATGTGAGGCGTGGTCGAAGAACAACAGAAAG
>HUMPHOSLIP_0_0_18487
ACAGGGGCCAGATGGTGACCCATGACCCAGCCTAAAAGGCAGCCAGAGGG
>AI076020_0_3_0
ATCAGCACTGCCACCTACACCACGGTGCCGCGCGTGGCCTTCTACGCCGG
>T23580_0_0_902
GTGAAACCCCATTGGCTTCATTGGCTCCTTGATTTAAACCACGCCCGGCT
>T23580_0_0_901
TGAGTCCGTGTTATATCATCTGGTCTCATTGATAGGCGGGATAGGGAGGG
>M79217_0_9_0
TTTGTGGAATAGCAACCCATGGTTATGGCGAGTGACCCGACGTGATCTGG
>M62096_0_0_20588
AAGGCTTAGGTGCAAAGCCATTGGATACCATACCTGAGACCACACAGCCA
>M62096_0_7_0
ACCAGAAGCAGCTGTCCAGACTCCGAGACGAAATTGAGGAGAAGCAGAAA
>M78076_0_7_0
GAGAAGATGAACCCGCTGGAACAGTATGAGCGAAAGGTGAATGCGTCTGT
>T99080_0_0_58896
AACTCACAGCAAGAGCTGTGTTCCAGTTAGCTTTGCTACCAGTTATGCAG
>T08446_0_9_0
CATTTCCACTACGAGAACGTTGACTTTGGCCACATTCAGCTCCTGCTGTC
>HUMCA1XIA_0_0_14909
GCTGCAATCTAAGTTTCGGAATACTTATACCACTCCAGAAATAATCCTCG
>HUMCA1XIA_0_18_0
TTCAGAACTGTTAACATCGCTGACGGGAAGTGGCATCGGGTAGCAATCAG
>T11628_0_9_0
ACAAGATCCCCGTGAAGTACCTGGAGTTCATCTCGGAATGCATCATCCAG
>T11628_0_0_45174
TAAACAATCAAAGAGCATGTTGGCCTGGTCCTTTGCTAGGTACTGTAGAG
>T11628_0_0_45161
TGCCTCGCCACAATGGCACCTGCCCTAAAATAGCTTCCCATGTGAGGGCT
>HUMCEA_0_0_96
CAAGAGGGGTTTGGCTGAGACTTTAGGATTGTGATTCAGCTTAGAGGGAC
>HUMCEA_0_0_15183
CCTGGTGGGAGCCCATGAGAAGCGAGTTCTCTGTGCAACGGACTTAGTAA
>HUMCEA_0_0_15182
GCTCCCTGGAGCATCAGCATCATATTCTGGGGTGGAGTCTATCTGGTTCT
>HUMCEA_0_0_15168
TCCTGCCTGTCACCTGAAGTTCTAGATCATTCCCTGGACTCCACTCTATC
>HUMCEA_0_0_15180
TTTAACACAGGATTGGGACAGGATTCAGAGGGACACTGTGGCCCTTCTAC
>R35137_0_5_0
TATGTGGAGGTGGTGAACATGGACGCTGCAGTGCAGCAGCAGATGCTGAA
>Z25299_0_3_0
AACTCTGGCACCTTGGGCTGTGGAAGGCTCTGGAAAGTCCTTCAAAGCTG
>HSSTROL3_0_0_12518
ATGAGAGTAACCTCACCCGTGCACTAGTTTACAGAGCATTCACTGCCCCA
>HSSTROL3_0_0_12517
CAGAGATGAGAGCCTGGAGCATTGCAGATGCCAGGGACTTCACAAATGAA
>HSS100PCB_0_0_12280
CTCAAAATGAAACTCCCTCTCGCAGAGCACAATTCCAATTCGCTCTAAAA
>R20779_0_0_30670
CCGCGTTGCTTCTAGAGGCTGAATGCCTTTCAAATGGAGAAGGCTTCCAT
Information is obtained on the overexpression of clusters in cancer based on microarrays. As a reference of the microarray, in a specific segment paragraph, a non-omitted tissue name was used as a reference of the chip type whose expression was measured. There are two types of microarray results: Microarray-derived types prepared by the design according to the present invention (Microarray construction procedures are detailed in the section "Materials and Experimental Procedures" herein) and Microarray-derived type using Affymetrix technology. As a microarray standard, in a specific segment paragraph, non-omitted tissue names were used as a standard for the chip type whose expression was measured. For microarrays prepared according to the design according to the invention, the probe names start with the cluster (gene) name and follow the identification number. The oligonucleotide microarray results obtained from the Affymetrix data were from a chip available from Affymetrix Inc, Santa Clara, CA, USA (e.g. Human Genome at www.affymetrix.com/products/arrays/specific/hgu133.affx U133 (HG-U133) Set; www.affymetrix.com/products/arrays/specific/hgu133av2.affx GeneChip Human Genome U133A 2.0 Array; and www.affymetrix.com/products/arrays/specific/hgu133plus.affx Hu an Genome U133 Plus 2.0 see data on Array). Probe names follow the Affymetrix naming convention. Data are available from NCBI Gene Expression Omnibus (www.ncbi.nlm.nih.gov/projects/geo/ and Edgar et al, Nucleic Acids Research, 2002, Vol. 30, No. 1207-210) It is possible. The data set (including results) of the Series GSE1133 database (released in March 2004) is www. ncbi. nlm. nih. gov / geo / query / acc. cgi? acc = GSE1133 available; references for these results are: Su et al (Proc Natl Acad Sci USA A. 2004 Apr 20; 101 (16): 6062-7. Epub 2004 Apr 09). The probes designed by the inventor are listed below.

> H61775_0_11_0
CCCCAGCTTTTATAGAGCGGGCCCAAGGAAAGATATTTCCAGAAGTAGGG
> M85491_0_0_25999
GACATCTTTGCATATCATGTCAGAGCTATAACATCATTGTGGAGAAGCTC
> M85491_0_14_0
GTCATGAAAATCAACACCGAGGTGCGGAGCTTCGGACCTGTGTCCCGCAG
> Z21368_0_0_61857
AGTTCATCCTTCTTCAGTGTGACCAGTAAATTCTTCCCATACTCTTGAAG
> HUMGRP5E_0_0_16630
GCTGATATGGAAGTTGGGGAATCTGAATTGCCAGAGAATCTTGGGAAGAG
> HUMGRP5E_0_2_0
TCTCATAGAAGCAAGAGGAGACAGAAACCACCAGCCACCTCAACCCAAGG
> D56406_0_5_0
TCTGACTTTTACGGACTTGGCTTGTTAGAGGCAGAAGATGATGGCAGG
> F05068_0_0_5744
ACGGGAGGGA AGGA AGGTGTGCGGAGGAGGTTTCTGCTCCACTCCCCT
> F05068_0_0_5754
CAAGGGGAACTGACCGTTGGTCCCGAAGGTCTAGAAGTGAATGGGAGCAG
> F05068_0_8_0
CTGGGCTTGGACTTCGGAGTTTGCCATTGCCAGTGGGACGTCTGAGACT
> F05068_0_1_5751
TCTTAGCAGGTAGGTGCGCGCAGACCCTGCGGGTTAAGAGGTGGGGTGGGG
> H38804_0_3_0
CGTAATTGCAGTGCATTTAGACAGGCATCTATTTGGACCTGTTTCTATCT
> HSENA 78_0_1_0
TGAAGAGTGTGAGAAAACCTATGTTTGCGCCTTAAAGCTTTCAGCTCAGC
> R00299_0_8_0
CCAAGGCTCGTCTGCGCACCTTGTGTCTTGTAGGGTATGGTATGTGGGAC
> Z44808_0_8_0
AAAAGCATGAGTTTCTGACCAGCGTTCTGGACGCGCTGTCCACGGACATG
> Z44808_0_0_72347
ATGTTCTTAGGAGGCAAGCCAGGAGAAGCCGGGTCTGACTTTTCAGCTCA
> Z44808_0_0_72349
TCCTCCAGACCCAAAGCCACAACCCATCGCAAGTCAAGAACACTTTCCAG
> AA161187_0_0_433
ACCCTGGGTGGGCAAAAACGTGCTTCCCGGACGGGGTTGAAGGGGAGAA
> AA161187_0_0_430
TGGAGACTGTTGCCCCACTCTGCAGATGCAGAACGGAGGCTTGGCTGCT
> R66178_0_7_0
CCAGTGTGGTATCCTGGGAAACTCTGGTTAAAGGTGAGGCAGAGTACCAG
> HUMPHOSLIP_0_0_18458
AAGGAAGCAGGACCAGTGGATGTGAGGCGTGGTCGAAGAACAACAGAAAG
> HUMPHOSLIP_0_0_18487
ACAGGGGCCAGATGGTGACCCATGACCCAGCCTAAAAGGCAGCCAAGAGGG
> AI076020_0_3_0
ATCAGCACTGCCACCTACACCACGGTGCCGCGCGTGGCCTTCTAC GCCGG
> T23580_0_0_902
GTGAAACCCCATTGGCTTCATTGGCTCCTTGATTTAAACCACGCCCGGCT
> T23580_0_0_901
TGAGTCCCGTGTTATATCATCTGGTCTCATTGATAGGCGGGATAGGGAGGG
> M79217_0_9_0
TTTGTGGAATAGCAACCCATGGTTATGGCGAGTGACCCGACGTGATCTGG
> M62096_0_0_20588
AAGGCTTAGGTGCAAAGCCATTGGATACCATACCTGAGACCACACAGCACA
> M62096_0_7_0
ACCAGAAGCTGTCCAGACTCCGAGACGAAATTGAGGGAGAAGCAGAAA
> M78076_0_7_0
GAGAAGATGAACCCGCTGGAACAGTATGAGCGAAAGGTGAATGCGTCTGT
> T99080_0_0_58896
AACTC AC AGCA AG AGC TG TTTCC AG TT AT AGC TT T CT CCAC GT GT GC AG
> T08446_0_9_0
CATTTCCACTACGAGAACGTTGACTTTGGCCACATTCAGCTCCTGCTGTC
> HUMCA1XIA_0_0_14909
GCTGCAATCTAAGTTTCGGAATACTTATACCACTCCAGAAATAATATCTCG
> HUMCA1XIA_0_18_0
TTCAGAACTGTTAACATCGCTGACGGGAAGTGGCATCGGGTAGCAATCAG
> T11628_0_9_0
ACAAG ATCC CCGTGA AG TACTCTGGAGTT CATCTCGGAATGCAT CATCCAG
> T11628_0_0_45174
TAAAACAATCAAAGAGCATGTTGGCCTGGCTCCTTTGCTAGGTACTGTAGAG
> T11628_0_0_45161
TGCCTCGCCACAAGTGGCACCTGCCCCTAAAATAGCTTCCCATGTGAGGCT
> HUMCEA_0_0_96
CAAGAGGGGTTTGGCTGAGACTTTAGGATTGTGATTCAGCTTAGAGGGAC
> HUMCEA_0_0_15183
CCTGGTGGAGCCCATGAGAAGCGAGTTTCTGTGCAACGGACTTAGTAA
> HUMCEA_0_0_15182
GCTCCCTGGAGCATCAGCATCATATTCTGGGGTGGAGTCTATCTGGTTCT
> HUMCEA_0_0_15168
TCCTGCCTGTCACCTGAAGTTCTAGATCATTCCCTGGACTCCACTCTATC
> HUMCEA_0_0_15180
TTTAACACAGGGATTGGGACAGGATTCAGAGGGACACTGTGGCCCTTCTAC
> R35137_0_5_0
TATGTGGAGGTGGTGAACATGGACGCTGCAGTGCAGCACAGATGCTGAA
> Z25299_0_3_0
AACTCTGGGCACCTTGGGCTGTGGAAGCTCTGGAAGTCCTTCAAAGCTG
> HSSTROL3_0_0_12518
ATGAGAGTAACTCTCCACCCGTGCACTAGTTTAGAGACATTCACTGCCCCA
> HSSTROL3_0_0_12517
CAGAGATGAGAGCCTGGAGCATTGCAGATGCGAGGACTTCACAAATGAA
> HSS100PCB_0_0_12280
CTC AAAATGA AACTCC CT CTC GC AGAGCACAAATTCCAATTCGCTCTAAAA
> R20779_0_0_30670
CCGCGTTGCTTCTAGAGGCTGAATGCCTTTC AAATGGAGAAGGCTTCCAT

以下の組織の略語のリストを、TAAヒストグラムで使用した。用語「TAA」は、「腫瘍関連抗原」を示し、テキスト中に示したTAAヒストグラムは、以下の実施例1〜5に詳述するように、バイオマーカー選択エンジンによって予想される癌組織発現パターンを示す。
「BONE」は「骨」であり;
「COL」は「結腸」であり;
「EPI」は「上皮」であり;
「GEN」は「全体(general)」であり;
「LIVER」は「肝臓」であり;
「LUN」は「肺」であり;
「LYMPH」は「リンパ節」であり;
「MARROW」は「骨髄」であり;
「OVA」は「卵巣」であり;
「PANCREAS」は「膵臓」であり;
「PRO」は「前立腺」であり;
「STOMACH」は「胃」であり;
「TCELL」は「T細胞」であり;
「THYROID」は「甲状腺」であり;
「MAM」は「乳房」であり;
「BRAIN」は「脳」であり;
「UTERUS」は「子宮」であり;
「SKIN」は「皮膚」であり;
「KIDNEY」は「腎臓」であり;
「MUSCLE」は「筋肉」であり;
「ADREN」は「副腎」であり;
「HEAD」は「頭頸部」であり;
「BLADDER」は「膀胱」である。
The following list of tissue abbreviations was used in the TAA histogram: The term "TAA" refers to "tumor associated antigen" and the TAA histogram shown in the text, as detailed in Examples 1-5 below, shows the cancer tissue expression pattern predicted by the biomarker selection engine Show.
"BONE" is "bone";
"COL" is "colon";
"EPI" is "epithelial";
"GEN" is "general";
"LIVER" is the "liver";
"LUN" is "lung";
"LYMPH" is a "lymph node";
"MARROW" is the "bone marrow";
"OVA" is "ovary";
"PANCREAS" is "pancreas";
"PRO" is "prostate";
"STOMACH" is "stomach";
"TCELL" is "T cell";
"THYROID" is the "thyroid";
"MAM" is "breast";
"BRAIN" is the "brain";
"UTERUS" is "the womb";
"SKIN" is "skin";
"KIDNEY" is the "kidney";
"MUSCLE" is "muscle";
"ADREN" is the "adrenal gland";
"HEAD" is "head and neck";
"BLADDER" is the "bladder".

用語「セグメント」、「seg」、および「ノード」は、本発明の核酸配列に関して交換可能に使用されることに留意すべきであり、これらは、下記の1つまたは複数の性質を有することが示された核酸配列の一部をいう。これらはまた、下記でより詳細に記載されるように、完全な核酸配列を構築するために使用された基礎単位である。任意選択的且つ好ましくは、これらは、本発明の実施形態であり(例えば、アンプリコン、ハイブリッド形成単位として)、そして/またはこれらに任意選択的にプライマーおよび/もしくは相補オリゴヌクレオチドが由来してもよく、そして/または任意の他の使用のためのオリゴヌクレオチドの例である。   It should be noted that the terms "segment", "seg" and "node" are used interchangeably with respect to the nucleic acid sequences of the invention, which may have one or more of the following properties Refers to a portion of the indicated nucleic acid sequence. These are also the building blocks used to construct complete nucleic acid sequences, as described in more detail below. Optionally and preferably, these are embodiments of the invention (e.g. as an amplicon, as a hybridization unit), and / or optionally from which primers and / or complementary oligonucleotides are optionally derived. An example of an oligonucleotide for well and / or any other use.

本明細書中で使用される、句「肺癌」は、小細胞肺癌および非小細胞肺癌が含まれる肺の癌(肺腺癌、扁平上皮癌、および腺癌が含まれるが、これらに限定されない)をいう。   As used herein, the phrase "lung cancer" refers to lung cancer including small cell lung cancer and non-small cell lung cancer including, but not limited to, lung adenocarcinoma, squamous cell carcinoma, and adenocarcinoma Say).

本発明の文脈中の用語「マーカー」は、肺癌(または上記の容態の1つ)を罹患していない被験体から採取した匹敵するサンプルと比較して、肺癌(または指示的容態(indicative condition)の1つ)を罹患した被験体(患者)から採取したサンプル中で異なって存在する核酸フラグメント、ペプチド、またはポリペプチドをいう。   The term "marker" in the context of the present invention refers to lung cancer (or indicative condition) as compared to a comparable sample taken from a subject not afflicted with lung cancer (or one of the above mentioned conditions). And nucleic acid fragments, peptides or polypeptides which are present differently in a sample taken from a subject (patient) suffering from

句「異なって存在する」は、肺癌(または上記の容態の1つ)を罹患していない患者から採取した匹敵するサンプルと比較して、肺癌(または指示的容態の1つ)を罹患した患者から採取したサンプル中に存在するマーカーの量が異なることをいう。例えば、ハイブリッド形成および/またはNATベースのアッセイによって測定したところ、核酸フラグメントは、任意選択的に、一方のサンプル中の核酸フラグメント量が他方のサンプル中の核酸フラグメント量と有意に異なる場合、2サンプル間で異なって存在し得る。ポリペプチドは、一方のサンプル中のポリペプチド量が他方のサンプル中のポリペプチド量と有意に異なる場合、2サンプル間で異なって存在する。マーカーが一方のサンプルで検出可能であるが、他方のサンプルで検出不可能である場合、このようなマーカーを異なって存在すると見なすことができることに留意すべきである。   The phrase “differently present” refers to a patient suffering from lung cancer (or one of the indicative conditions) as compared to a comparable sample taken from a patient not suffering from lung cancer (or one of the above conditions) The amount of marker present in the sample taken from is different. For example, as determined by hybridization and / or NAT-based assays, the nucleic acid fragments optionally have two samples if the amount of nucleic acid fragments in one sample is significantly different from the amount of nucleic acid fragments in the other sample. There may be differences between them. Polypeptides are present differently between two samples if the amount of polypeptide in one sample is significantly different from the amount of polypeptide in the other sample. It should be noted that if a marker is detectable in one sample but not in the other sample, such a marker can be considered to be present differently.

本明細書中で使用される、句「診断」は、病的状態の存在または性質の同定を意味する。診断方法は、その感度および特異性の点で異なる。診断アッセイの「感度」は、陽性反応を示す罹患個体の比率(「真の陽性」の比率)である。アッセイによって検出されない罹患個体は、「偽陰性」であえる。罹患せず、且つアッセイで陽性反応を示す被験体を、「真の陰性」と呼ぶ。診断アッセイの「特異性」は、1−偽陽性率(式中、「偽陰性」率を、陽性反応を示す罹患していない被験体の比率と定義する)である。特定の診断方法で容態を確実に診断できないとはいえ、この方法が診断を補助する明確な表示をする場合、十分である。   As used herein, the phrase "diagnosis" means the identification of the presence or nature of a pathological condition. Diagnostic methods differ in their sensitivity and specificity. The "sensitivity" of a diagnostic assay is the proportion of diseased individuals who show a positive response (the proportion of "true positives"). Affected individuals not detected by the assay will be "false negatives". Subjects who do not suffer and who test positive in the assay are termed "true negatives". The “specificity” of a diagnostic assay is the 1-false positive rate (where “false negative” rate is defined as the proportion of non-diseased subjects who show a positive response). Although certain diagnostic methods may not reliably diagnose the condition, it is sufficient if the method provides a clear indication to aid the diagnosis.

本明細書中で使用される、句「診断」は、疾患または症状の分類、疾患の重症度の決定、疾患の進行のモニタリング、疾患の結果および/または回復の見込みの予測をいう。用語「検出」はまた、任意選択的に、上記のいずれかを含み得る。   As used herein, the phrase "diagnosis" refers to classification of a disease or condition, determination of the severity of the disease, monitoring of the progression of the disease, prediction of the outcome of the disease and / or the likelihood of recovery. The term "detection" may also optionally include any of the above.

本発明の疾患の診断を、被験体から得た生体サンプル中の本発明のポリヌクレオチドまたはポリペプチドレベルの決定によって行うことができ、決定されたレベルは、疾患素因または疾患の有無と相関し得る。「被験体から得た生体サンプル」はまた、任意選択的に、以下でさらに詳述するように、被験体から物理的に取り出していないサンプルを含み得ることに留意すべきである。   Diagnosis of a disease of the invention can be made by determination of polynucleotide or polypeptide levels of the invention in a biological sample obtained from a subject, and the determined level can be correlated with a predisposition to the disease or the presence or absence of a disease. . It should be noted that "a biological sample obtained from a subject" may also optionally include a sample that has not been physically removed from the subject, as described in further detail below.

本明細書中で使用される、用語「レベル」は、本発明のRNAおよび/もしくはタンパク質の発現レベルまたはマーカーのDNAコピー数をいう。   As used herein, the term "level" refers to the DNA copy number of the expression level or marker of the RNA and / or protein of the present invention.

典型的には、被験体から得た生体サンプル中のマーカーレベルは、健常な個体から得た類似のサンプル中の同一の変異型のレベルと異なる(すなわち、多いか少ない)(生体サンプルの例は、本明細書中に記載されている)。   Typically, the level of markers in a biological sample obtained from a subject is different (i.e. more or less) from the level of the same variant in similar samples obtained from healthy individuals (examples of biological samples are , As described herein).

多数の周知の組織または流動物の回収方法を使用して、被験体から生体サンプルを回収し、被験体中の目的の変異型のDNA、RNA、および/またはポリペプチドのレベルを決定することができる。   Using a number of well-known tissue or fluid collection methods to collect a biological sample from a subject and to determine the level of the mutant DNA, RNA, and / or polypeptide of interest in the subject it can.

例には、細針生検、針生検、コアニードル生検(core needle biopsy)、および外科生検(例えば、脳生検)、および洗浄が含まれるが、これらに限定されない。使用手順に関係なく、一旦生検/サンプルが得られると、変異型のレベルを決定し、それにより診断することができる。   Examples include, but are not limited to, fine needle biopsy, needle biopsy, core needle biopsy, and surgical biopsy (eg, brain biopsy), and lavage. Regardless of the procedure used, once a biopsy / sample is obtained, the level of the variant can be determined and thereby diagnosed.

同一起源の正常組織中の同一変異型のレベルの決定を、正常組織と対照的な変異型の発現および/または増幅の増加および/または発現の減少を検出するために同時に行うことが好ましい。   Preferably, the determination of the level of the same variant in normal tissue of the same origin is carried out simultaneously in order to detect an increase in expression and / or amplification of the variant in contrast to normal tissue and / or a decrease in expression.

マーカーの「試験量」は、肺癌(または指示的容態の1つ)の診断と一致する被験体サンプル中のマーカーの量をいう。試験量は、絶対量(例えば、μg/ml)または相対量(例えば、シグナルの相対強度)のいずれかであり得る。   The "test dose" of a marker refers to the amount of marker in a subject sample consistent with the diagnosis of lung cancer (or one of the indicative conditions). The test amount can be either an absolute amount (eg, μg / ml) or a relative amount (eg, relative intensity of signal).

マーカーの「コントロール量」は、マーカーの試験量と比較すべき任意の量または量の範囲であり得る。例えば、マーカーのコントロール量は、肺癌(または指示的容態の1つ)患者または肺癌(または指示的容態の1つ)を罹患していないヒトのマーカーの量であり得る。コントロール量は、絶対量(例えば、μg/ml)または相対量(例えば、シグナルの相対強度)のいずれかであり得る。   The "control amount" of a marker can be any amount or range of amounts to be compared to the test amount of the marker. For example, the control amount of the marker can be that of the lung cancer (or one of the indicating condition) patients or the marker of a human not afflicted with lung cancer (or one of the indicating conditions). Control amounts can be either absolute amounts (eg, μg / ml) or relative amounts (eg, relative intensity of signal).

「検出」は、検出すべき目的物の存在、非存在、または量の同定をいう。   "Detection" refers to the identification of the presence, absence or amount of the object to be detected.

「標識」は、顕微鏡手段、光化学的手段、生化学的手段、免疫化学的手段、または化学的手段によって検出可能な任意の部分または要素(item)を含む。例えば、有用な標識には、32P、35S、蛍光色素、電子密度の高い試薬、酵素(例えば、一般に、ELISAで使用される)、ビオチン−ストレプトアビジン、ジオキシゲニン、抗血清もしくはモノクローナル抗体を利用可能なハプテンおよびタンパク質、または標的と配列が相補的な核酸分子が含まれる。標識は、しばしば、放射性、発色性、または蛍光のシグナルなどの測定可能なシグナルを生じ、これらを使用して、サンプル中の結合標識量を定量することができる。標識を、共有結合、イオン結合、ファンデルワールス結合、または水素結合のいずれかによってプライマーまたはプローブ中に組み込むか、これらに結合させることができる(例えば、放射性ヌクレオチドまたはストレプトアビジンによって認識されるビオチン化ヌクレオチドの組み込み)。標識を、直接または間接的に検出することができる。間接的検出は、直接または間接的な第1の標識への第2の標識の結合を含み得る。例えば、標識は、ストレプトアビジンの結合パートナーであるビオチンまたは特異的にハイブリッド形成することができる相補配列の結合パートナーであるヌクレオチド配列などの結合パートナーのリガンドであり得る。結合パートナー自体を直接検出することができ、例えば、抗体自体を蛍光分子で標識することができる。結合パートナーは間接的にも検出することができ、例えば、相補ヌクレオチド配列を有する核酸は、他の標識核酸分子とのハイブリッド形成によって検出することができる分岐DNA分子の一部であり得る(例えば、P.D.Fahrlander and A.Klausner,Bio/Technology 6:1165(1988)を参照のこと)。例えば、シンチレーション計数、デンシトメトリー、またはフローサイトメトリーによってシグナルを定量する。 A "label" includes any part or item detectable by microscopic means, photochemical means, biochemical means, immunochemical means, or chemical means. For example, useful labels include 32 P, 35 S, fluorochromes, electron-dense reagents, enzymes (eg, commonly used in ELISA), biotin-streptavidin, dioxigenin, antisera or monoclonal antibodies Possible haptens and proteins, or nucleic acid molecules complementary in sequence to the target are included. Labels often produce measurable signals such as radioactive, chromogenic or fluorescent signals, which can be used to quantify the amount of bound label in a sample. The label can be incorporated into or attached to the primer or probe by either covalent, ionic, van der Waals, or hydrogen bonding (eg, biotinylated as recognized by radioactive nucleotides or streptavidin) Nucleotide incorporation). The label can be detected directly or indirectly. Indirect detection can include direct or indirect attachment of a second label to the first label. For example, the label can be a ligand of binding partner such as biotin which is a binding partner of streptavidin or a nucleotide sequence which is a binding partner of a complementary sequence capable of specifically hybridizing. The binding partner itself can be detected directly, for example the antibody itself can be labeled with a fluorescent molecule. The binding partner can also be detected indirectly, eg, a nucleic acid having a complementary nucleotide sequence can be part of a branched DNA molecule which can be detected by hybridization with another labeled nucleic acid molecule (eg, See P. D. Fahrlander and A. Klausner, Bio / Technology 6: 1165 (1988)). For example, signal is quantified by scintillation counting, densitometry, or flow cytometry.

任意選択的および好ましくは免疫アッセイと共に使用するための例示的な検出可能な標識には、磁性ビーズ、蛍光色素、放射性標識、酵素(例えば、西洋ワサビペルオキシダーゼ、アルカリホスファターゼ、およびELISAで一般的に使用されている他の酵素)、および熱量測定標識(コロイド金もしくは着色ガラスなど)、またはプラスチックビーズが含まれるが、これらに限定されない。あるいは、サンプル中のマーカーを、間接的アッセイ(例えば、第2の標識抗体を使用して結合したマーカー特異的抗体を検出する)を使用し、そして/または競合アッセイまたは阻害アッセイ(例えば、マーカーの異なるエピトープに結合するモノクローナル抗体を混合物と同時にインキュベートする)で検出することができる。   Exemplary detectable labels for use with optional and preferably immunoassays include magnetic beads, fluorochromes, radioactive labels, enzymes (such as horseradish peroxidase, alkaline phosphatase, and commonly used in ELISAs) And other enzymes, and calorimetric labels (such as colloidal gold or colored glass), or plastic beads, but not limited thereto. Alternatively, a marker in the sample is used in an indirect assay (eg, using a second labeled antibody to detect bound marker specific antibody) and / or a competition assay or an inhibition assay (eg, of the marker) The monoclonal antibodies that bind to different epitopes can be detected simultaneously with the mixture).

「免疫アッセイ」は、抗原に特異的に結合する抗体を使用するアッセイである。免疫アッセイは、抗原を単離、ターゲティング、および/または定量するための特定の抗体の特異的結合特性の使用によって特徴づけられる。   An "immunoassay" is an assay that uses an antibody that specifically binds an antigen. Immunoassays are characterized by the use of specific binding properties of a particular antibody to isolate, target, and / or quantify antigen.

句、抗体に「特異的に(または選択的に)結合する」または「〜と特異的に(または選択的に)免疫反応性を示す」は、タンパク質またはペプチド(または他のエピトープ)をいう場合、タンパク質または他の生物製剤(biologics)の不均一な集団中のタンパク質の存在を決定する結合反応をいう。したがって、指定の免疫アッセイ条件下で、特定の抗体は、特定のタンパク質にバックグラウンド(非特異的シグナル)の少なくとも2倍を超えて結合し、サンプル中に存在する他のタンパク質に有意な量で実質的に結合しない。このような条件下での抗体の特異的結合は、特定のタンパク質に対するその特異性について選択された抗体が必要であり得る。例えば、ラット、マウス、またはヒトなどの特定の種由来の精液塩基性タンパク質に対して惹起したポリクローナル抗体を選択して、精液塩基性タンパク質と特異的に免疫反応するが、他のタンパク質(精液塩基性タンパク質の多型性変異型および対立遺伝子を除く)と反応しないポリクローナル抗体のみを得ることができる。他の種から精液塩基性タンパク質分子と交差反応する抗体を引くことによって、この選択を行うことができる。種々の免疫アッセイ形式を使用して、特定のタンパク質と特異的な免疫反応性を示す抗体を選択することができる。例えば、固相ELISA免疫アッセイを日常的に使用して、タンパク質と特異的免疫反応性を示す抗体を選択する(例えば、特異的免疫反応性を検出するために使用することができる免疫アッセイの形式および条件の説明については、Harlow & Lane,Antibodies,A Laboratory Manual(1988)を参照のこと)。典型的には、特異的反応または選択的反応は、バックグラウンドシグナルまたはノイズの少なくとも2倍、より典型的にはバックグラウンドの10〜100倍である。   The phrase "specifically (or selectively) binds" to an antibody or "specifically (or selectively) immunoreactive with" refers to a protein or peptide (or other epitope) , A binding reaction that determines the presence of a protein in a heterogeneous population of proteins or other biologics. Thus, under designated immunoassay conditions, the particular antibody binds to the particular protein at least twice background (nonspecific signal) and in significant amounts to other proteins present in the sample It does not bind substantially. Specific binding of an antibody under such conditions may require an antibody selected for its specificity for a particular protein. For example, a polyclonal antibody raised against semen basic protein from a specific species such as rat, mouse, or human is selected to specifically immunoreact with semen basic protein, but other proteins It is possible to obtain only polyclonal antibodies which do not react with the polymorphic protein variants and alleles). This selection can be made by subtracting antibodies that cross-react with semen basic protein molecules from other species. Various immunoassay formats can be used to select antibodies that exhibit specific immunoreactivity with a particular protein. For example, solid-phase ELISA immunoassays are routinely used to select antibodies that exhibit specific immunoreactivity with a protein (eg, a format of immunoassay that can be used to detect specific immunoreactivity) And for a description of the conditions see Harlow & Lane, Antibodies, A Laboratory Manual (1988)). Typically, the specific or selective reaction is at least twice background signal or noise, more typically 10 to 100 times background.

本発明の好ましい実施形態によれば、好ましくは、任意の上記核酸配列および/またはアミノ酸配列は、これらの配列と少なくとも約70%、好ましくは少なくとも約80%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同な任意の配列をさらに含む。   According to a preferred embodiment of the present invention, preferably, any of the above nucleic acid sequences and / or amino acid sequences are at least about 70%, preferably at least about 80%, more preferably at least about 90%, most Preferably, it further comprises any sequence that is at least about 95% homologous.

他で示さない限り、全ての実験データは、本発明の変異型に関し、試験されたセグメントにしたがって命名される(記載のように発現をRT−PCRによって試験した場合)。   Unless otherwise indicated, all experimental data are named according to the segment tested for the variants of the invention (when expression is tested by RT-PCR as described).

本発明の実施形態として本明細書中に示した全ての核酸配列および/またはアミノ酸配列は、その単離形態(単離ポリヌクレオチド(全転写物が含まれる)、オリゴヌクレオチド(全セグメント、アンプリコン、およびプライマーが含まれる)、ペプチド(全てのテール、架橋、挿入、または先端(任意選択的に、本明細書中に記載の他の抗体エピトープが含まれる)、および/またはポリペプチド(全タンパク質が含まれる)が含まれる)など)に関する。オリゴヌクレオチドとポリヌクレオチドまたはペプチドとポリペプチドとを、任意選択的に、交換可能に使用することができることに留意すべきである。   All nucleic acid and / or amino acid sequences set forth herein as embodiments of the present invention are in isolated form (including isolated polynucleotides, including all transcripts), oligonucleotides (all segments, amplicons) , And primers, peptides (all tails, crosslinks, insertions, or tips (optionally including other antibody epitopes described herein), and / or polypeptides (whole protein) Is included)). It should be noted that oligonucleotides and polynucleotides or peptides and polypeptides can optionally be used interchangeably.

本発明の好ましい実施形態によれば、配列番号1および2を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising SEQ ID NO: 1 and 2.

本発明の好ましい実施形態によれば、配列番号1022、1023、1024、1025、1026、および1027を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NOs: 1022, 1023, 1024, 1025, 1026 and 1027.

本発明の好ましい実施形態によれば、配列番号1281および1282を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NO: 1281 and 1282.

本発明の好ましい実施形態によれば、配列番号3および4を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NO: 3 and 4.

本発明の好ましい実施形態によれば、配列番号1028、1029、1030、1031、1032、1033、1034、1035、1036、1037、および1038を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NOs: 1028, 1029, 1030, 1031, 1032, 1033, 1034, 1034, 1035, 1036, 1037 and 1038.

本発明の好ましい実施形態によれば、配列番号1283および1284を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NO: 1283 and 1284.

本発明の好ましい実施形態によれば、配列番号5、6、7、および8を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NO: 5, 6, 7 and 8.

本発明の好ましい実施形態によれば、配列番号1039、1040、1041、1042、1043、1044、1045、1046、1047、1048、1049、1050、1051、1052、1053、1054、1055、1056、1057、1058、1059、1060、1061、1062、1063、1064、1065、および1066を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, SEQ ID NO: 1039, 1040, 1041, 1042, 1043, 1045, 1046, 1047, 1048, 1049, 1050, 1051, 1052, 1053, 1054, 1055, 1056, 1057, Provided are isolated polynucleotides comprising 1058, 1059, 1060, 1061, 1062, 1063, 1064, 1065, and 1066.

本発明の好ましい実施形態によれば、配列番号1285、1286、1287、および1288を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NOs: 1285, 1286, 1287 and 1288.

本発明の好ましい実施形態によれば、配列番号9、10、11、12、13、14、および15を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NOs: 9, 10, 11, 12, 13, 14, and 15.

本発明の好ましい実施形態によれば、配列番号1067、1068、1069、1070、1071、1072、1073、1074、1075、1076、1077、1078、1079、1080、1081、1082、1083、1084、1085、1086、1087、1088、1089、1090、1091、1092、1093、1094、1095、1096、1097、1098、1099、および1100を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, SEQ ID NO: 1067, 1068, 1069, 1070, 1071, 1072, 1073, 1074, 1075, 1076, 1077, 1078, 1079, 1080, 1081, 1082, 1083, 1084, 1085, Provided are isolated polynucleotides comprising 1086, 1087, 1088, 1089, 1090, 1091, 1092, 1093, 1094, 1095, 1096, 1097, 1098, 1099, and 1100.

本発明の好ましい実施形態によれば、配列番号1289、1290、1291、1292、1293、および1294を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polypeptide comprising SEQ ID NOs: 1289, 1290, 1291, 1292, 1293 and 1294.

本発明の好ましい実施形態によれば、配列番号20および21を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising SEQ ID NO: 20 and 21.

本発明の好ましい実施形態によれば、配列番号1130、1131、1132、1133、および1134を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NOs: 1130, 1131, 1132, 1133 and 1134.

本発明の好ましい実施形態によれば、配列番号1299および1300を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NO: 1299 and 1300.

本発明の好ましい実施形態によれば、配列番号22、23、および24を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NO: 22, 23 and 24.

本発明の好ましい実施形態によれば、配列番号1135、1136、1137、1138、1139、1140、1141、1142、1143、および1144を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NOs: 1135, 1136, 1137, 1138, 1139, 1140, 1141, 1142, 1143, and 1144.

本発明の好ましい実施形態によれば、配列番号1301、1302、および1303を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polypeptide comprising SEQ ID NOs: 1301, 1302 and 1303.

本発明の好ましい実施形態によれば、配列番号25、26、および27を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising SEQ ID NO: 25, 26 and 27.

本発明の好ましい実施形態によれば、配列番号1145、1146、1147、1148、1149、1150、1151、1152、1153、1154、1155、および1156を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NOs: 1145, 1146, 1147, 1148, 1149, 1150, 1151, 1152, 1153, 1154, 1155, and 1156.

本発明の好ましい実施形態によれば、配列番号1304および1305を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NOs: 1304 and 1305.

本発明の好ましい実施形態によれば、配列番号28を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising SEQ ID NO: 28.

本発明の好ましい実施形態によれば、配列番号1157、1158、1159、1160、1161、1162、1163、1164、1165、1166、1167、1168、1169、1170、および1171を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NOs: 1157, 1158, 1159, 1160, 1161, 1162, 1163, 1164, 1165, 1166, 1167, 1168, 1169, 1170, and 1171. Do.

本発明の好ましい実施形態によれば、配列番号1306を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NO: 1306.

本発明の好ましい実施形態によれば、配列番号29および30を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising SEQ ID NO: 29 and 30.

本発明の好ましい実施形態によれば、配列番号1172、1173、1174、1175、1176、1177、1178、1179、1180、1181、1182、1183、1184、1185、1186、1187、1188、1189、1190、および1191を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, SEQ ID NO: 1172, 1173, 1174, 1176, 1177, 1178, 1179, 1180, 1181, 1182, 1183, 1184, 1185, 1186, 1187, 1188, 1189, 1190, And 1191 is provided.

本発明の好ましい実施形態によれば、配列番号1307および1308を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NOs: 1307 and 1308.

本発明の好ましい実施形態によれば、配列番号31を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising SEQ ID NO: 31.

本発明の好ましい実施形態によれば、配列番号1192、1193、1194、1195、1196、1197、および1198を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NOS: 1192, 1193, 1194, 1195, 1196, 1197, and 1198.

本発明の好ましい実施形態によれば、配列番号1309を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NO: 1309.

本発明の好ましい実施形態によれば、配列番号32を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising SEQ ID NO: 32.

本発明の好ましい実施形態によれば、配列番号1199、1200、1201、1202、1203、1204、1205、1206、1207、1208、1209、1210、1211、1212、1213、1214、および1215を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, an isolation comprising SEQ ID NOs: 1199, 1200, 1201, 1202, 1203, 1204, 1205, 1206, 1207, 1208, 1210, 1211, 1212, 1213, 1214, and 1215 Provide a polynucleotide.

本発明の好ましい実施形態によれば、配列番号1310を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NO: 1310.

本発明の好ましい実施形態によれば、配列番号33を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising SEQ ID NO: 33.

本発明の好ましい実施形態によれば、配列番号1216および1217、1218、1219、1220、1221、1222、1223、1224、1225、1226、および1227を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there are provided isolated polynucleotides comprising SEQ ID NOs: 1216 and 1217, 1218, 1219, 1220, 1221, 1222, 1223, 1224, 1225, 1225, 1226, and 1227.

本発明の好ましい実施形態によれば、配列番号1311を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NO: 1311.

本発明の好ましい実施形態によれば、配列番号34を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising SEQ ID NO: 34.

本発明の好ましい実施形態によれば、配列番号1228、1229、1230、1231、1232、および1223を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NO: 1228, 1229, 1230, 1231, 1232 and 1223.

本発明の好ましい実施形態によれば、配列番号1312を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NO: 1312.

本発明の好ましい実施形態によれば、配列番号35を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising SEQ ID NO: 35.

本発明の好ましい実施形態によれば、配列番号1234、1235、1236、1237、1238、1239、1240、1241、1242、1243、1244、1245、1246、1247、1248、1249、1250、1251、1252、1253、および1254を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the invention SEQ ID NO: 1234, 1235, 1236, 1238, 1239, 1240, 1241, 1242, 1243, 1244, 1245, 1246, 1247, 1248, 1249, 1249, 1250, 1251, 1252, An isolated polynucleotide comprising 1253, and 1254 is provided.

本発明の好ましい実施形態によれば、配列番号1313を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NO: 1313.

本発明の好ましい実施形態によれば、配列番号36、37、38、39、および40を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising SEQ ID NOs: 36, 37, 38, 39 and 40.

本発明の好ましい実施形態によれば、配列番号1255、1256、1257、1258、1259、1260、1261、1262、1263、1264、1265、1266、1267、1268、1269、1270、1271、1272、1273、1274、および1275を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, SEQ ID NO: 1255, 1256, 1257, 1258, 1259, 1260, 1261, 1262, 1263, 1264, 1265, 1266, 1267, 1268, 1269, 1270, 1271, 1272, 1273, Provided is an isolated polynucleotide comprising 1274 and 1275.

本発明の好ましい実施形態によれば、配列番号1314、1315、1316、および1317を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NOs: 1314, 1315, 1316 and 1317.

本発明の好ましい実施形態によれば、配列番号125、126、127、128、129、および130を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NO: 125, 126, 127, 128, 129 and 130.

本発明の好ましい実施形態によれば、配列番号887、888、889、890、891、892、893、894、895、896、897、898、899、900、901、および902を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, an isolated polynucleotide comprising SEQ ID NOs: 887, 888, 889, 890, 891, 892, 893, 894, 895, 896, 897, 898, 899, 900, 901, and 902. I will provide a.

本発明の好ましい実施形態によれば、配列番号1394、1395、1396、1397、および1398を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NO: 1394, 1395, 1396, 1397, and 1398.

本発明の好ましい実施形態によれば、配列番号131および132の転写物を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising a transcript of SEQ ID NO: 131 and 132.

本発明の好ましい実施形態によれば、配列番号903、904、905、906、907、907、908、および909を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NOs: 903, 904, 905, 906, 907, 907, 908 and 909.

本発明の好ましい実施形態によれば、配列番号1399および1400を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NOs: 1399 and 1400.

本発明の好ましい実施形態によれば、配列番号99、100、101、および102を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising SEQ ID NO: 99, 100, 101 and 102.

本発明の好ましい実施形態によれば、配列番号742、743、744、745、746、747、748、749、750、751、752、753、754、755、756、757、758、759、760、761、762、763、764、765、766、767、768、769、770、771、772、773、774、775、776、777、778、779、780、781、782、783、784、785、786、787、および788を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, SEQ ID NOs: 742, 743, 744, 745, 746, 747, 749, 750, 751, 752, 753, 754, 755, 756, 757, 758, 759, 760, 761, 762, 763, 764, 765, 766, 767, 768, 769, 770, 771, 772, 773, 775, 776, 777, 778, 779, 781, 782, 783, 784, 785, Provided are isolated polynucleotides comprising 786, 787, and 788.

本発明の好ましい実施形態によれば、配列番号1372、1373、1374、および1375を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NOs: 1372, 1373, 1374 and 1375.

本発明の好ましい実施形態によれば、配列番号134を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising SEQ ID NO: 134.

本発明の好ましい実施形態によれば、配列番号913、914、915、916、917、918、919、920、921、922、923、924、925、926、927、928、929、930、931、932、933、934、935、および936を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, SEQ ID NOs: 913, 914, 915, 916, 917, 918, 919, 920, 921, 922, 924, 925, 926, 927, 928, 929, 930, 931, Provided are isolated polynucleotides comprising 932, 933, 934, 935, and 936.

本発明の好ましい実施形態によれば、配列番号1402を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NO: 1402.

本発明の好ましい実施形態によれば、配列番号133を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising SEQ ID NO: 133.

本発明の好ましい実施形態によれば、配列番号910、911、および912を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NO: 910, 911 and 912.

本発明の好ましい実施形態によれば、配列番号141、142、および142を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising SEQ ID NO: 141, 142 and 142.

本発明の好ましい実施形態によれば、配列番号961、962、963、964、965、966、967、968、969、970、971、972、973、974、975、976、977、978、979、980、981、982、983、984、985、986、987、988、989、および990を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, SEQ ID NO: 961, 962, 963, 964, 966, 966, 968, 969, 970, 971, 972, 974, 975, 976, 977, 978, 979, Provided are isolated polynucleotides comprising 980, 981, 982, 983, 984, 985, 986, 987, 988, 989, and 990.

本発明の好ましい実施形態によれば、タンパク質名:
HUMOSTRO_PEA_1_PEA_1_P21、
HUMOSTRO_PEA_1_PEA_1_P25、
HUMOSTRO_PEA_1_PEA_1_P30を含む単離ポリペプチドを提供する。
According to a preferred embodiment of the present invention, the protein name:
HUMOSTRO_PEA_1_PEA_1_P21,
HUMOSTRO_PEA_1_PEA_1_P25,
Provided is an isolated polypeptide comprising HUMOSTRO_PEA_1_PEA_1_P30.

本発明の好ましい実施形態によれば、配列番号51、52、53、54、55、56、および57を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising SEQ ID NOs: 51, 52, 53, 54, 55, 56 and 57.

本発明の好ましい実施形態によれば、配列番号518、519、520、521、522、523、524、525、526、527、528、529、530、531、532、533、534、535、536、537、538、539、540、541、542、543、544、545、546、547、548、549、550、551、552、553、554、555、556、557、558、559、560、561、562、563、564、565、566、567、568、569、および570を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, SEQ ID NOs: 518, 519, 520, 521, 522, 523, 524, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 552, 553, 554, 555, 556, 557, 558, 559, 560, 561, Provided are isolated polynucleotides comprising 562, 563, 564, 565, 566, 567, 568, 569, and 570.

本発明の好ましい実施形態によれば、配列番号1327、1328、1329、1330、1331、1332、および1333を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NOs: 1327, 1328, 1329, 1330, 1331, 1332, and 1333.

本発明の好ましい実施形態によれば、配列番号135、136、137、138、139、および140を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NOs: 135, 136, 137, 138, 139 and 140.

本発明の好ましい実施形態によれば、配列番号937、938、939、940、941、942、943、944、945、946、947、948、949、950、951、952、953、954、955、956、957、958、959、および960を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, SEQ ID NO: 937, 938, 939, 940, 941, 942, 943, 944, 945, 946, 947, 948, 949, 950, 951, 952, 953, 953, 954, 955, Provided are isolated polynucleotides comprising 956, 957, 958, 959, and 960.

本発明の好ましい実施形態によれば、配列番号1403、1404、1405、1406、1407、および1408を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polypeptide comprising SEQ ID NO: 1403, 1404, 1405, 1406, 1407, and 1408.

本発明の好ましい実施形態によれば、配列番号41、42、43、44、45、46、および47を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NOs: 41, 42, 43, 44, 45, 46 and 47.

本発明の好ましい実施形態によれば、配列番号482、483、484、495、486、487、488、489、490、491、492、493、494、495、496、497、498、499、500、および501を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, SEQ ID NO: 482, 483, 484, 495, 486, 487, 488, 489, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, And an isolated polynucleotide comprising 501.

本発明の好ましい実施形態によれば、配列番号1318、1319、1320、1321、1322、および1323を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NOs: 1318, 1319, 1320, 1321, 1322 and 1323.

本発明の好ましい実施形態によれば、配列番号121、122、123、および124を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NOs: 121, 122, 123 and 124.

本発明の好ましい実施形態によれば、配列番号876、877、878、879、880、881、882、883、884、885、および886を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NO: 876, 877, 878, 879, 880, 881, 882, 883, 884, 885, and 886.

本発明の好ましい実施形態によれば、配列番号1390、1391、1392、および1393を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NOs: 1390, 1391, 1392 and 1393.

本発明の好ましい実施形態によれば、配列番号48、49、および50を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NO: 48, 49, and 50.

本発明の好ましい実施形態によれば、配列番号502、503、504、505、506、507、508、509、510、511、512、513、514、515、516、および517を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, an isolated polynucleotide comprising SEQ ID NOs: 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, and 517. I will provide a.

本発明の好ましい実施形態によれば、配列番号1324、1325、および1326を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polypeptide comprising SEQ ID NO: 1324, 1325 and 1326.

本発明の好ましい実施形態によれば、配列番号1464および1465を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising SEQ ID NO: 1464 and 1465.

本発明の好ましい実施形態によれば、配列番号1276、1277、1278、1279、および1280を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NO: 1276, 1277, 1278, 1279, and 1280.

本発明の好ましい実施形態によれば、配列番号1415を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NO: 1415.

転写物に対応するタンパク質名:
HSU33147_PEA_1_P5;HSU33147_PEA_1_T1;HSU33147_PEA_1_T2。
Protein names corresponding to transcripts:
HSU33147_PEA_1_P5; HSU33147_PEA_1_T1; HSU33147_PEA_1_T2.

本発明の好ましい実施形態によれば、配列番号58を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising SEQ ID NO: 58.

本発明の好ましい実施形態によれば、配列番号571、572、573、574、575、576、577、および578を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising SEQ ID NOs: 571, 572, 573, 574, 575, 576, 577 and 578.

本発明の好ましい実施形態によれば、配列番号1334を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polypeptide comprising SEQ ID NO: 1334.

本発明の好ましい実施形態によれば、配列番号74、75、76、77、78、79、80、81、および82を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NO: 74, 75, 76, 77, 78, 79, 80, 81 and 82.

本発明の好ましい実施形態によれば、配列番号659、660、661、662、663、664、665、666、667、668、669、670、671、672、673、674、675、676、677、678、679、680、681、682、683、684、685、686、687、688、689、690、691、692、および693を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, SEQ ID NOs: 659, 660, 661, 662, 662, 664, 665, 666, 667, 669, 670, 671, 672, 673, 674, 675, 676, 677, Provided are isolated polynucleotides comprising 678, 679, 680, 681, 682, 683, 684, 685, 686, 687, 688, 689, 690, 691, 692, and 693.

本発明の好ましい実施形態によれば、配列番号1350、1351、1352、1353、1354、1355、1356、および1357を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polypeptide comprising SEQ ID NOs: 1350, 1351, 1352, 1353, 1354, 1355, 1356, and 1357.

本発明の好ましい実施形態によれば、配列番号:転写物名T23580_T10を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising SEQ ID NO: Transcript name T23580_T10.

本発明の好ましい実施形態によれば、配列番号579、580、581、582、および583を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising SEQ ID NO: 579, 580, 581, 582, and 583.

本発明の好ましい実施形態によれば、配列番号1335を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NO: 1335.

本発明の好ましい実施形態によれば、配列番号59、60、61、62、63、および64を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NO: 59, 60, 61, 62, 63 and 64.

本発明の好ましい実施形態によれば、配列番号584、585、586、587、588、589、590、591、592、593、594、595、596、597、598、599、600、601、602、603、604、605、606、607、608、609、610、611、612、613、614、および615を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, SEQ ID NO: 584, 585, 586, 587, 588, 589, 590, 591, 592, 593, 594, 595, 596, 597, 598, 599, 600, 601, 602, Provided are isolated polynucleotides comprising 603, 604, 605, 606, 607, 608, 609, 610, 611, 612, 613, 614, and 615.

本発明の好ましい実施形態によれば、配列番号1336、1337、1338、1339、および1340を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NOs: 1336, 1337, 1338, 1339, and 1340.

本発明の好ましい実施形態によれば、配列番号65、66、67、68、69、70、71、72、および73を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NO: 65, 66, 67, 68, 69, 70, 71, 72 and 73.

本発明の好ましい実施形態によれば、配列番号616、617、618、619、620、621、622、623、624、625、626、627、628、629、630、631、632、633、634、635、636、637、638、639、640、641、642、643、644、645、646、647、648、649、650、651、652、653、654、655、656、657、658、および659を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, SEQ ID NOs: 616, 617, 618, 619, 620, 621, 622, 623, 624, 626, 627, 628, 629, 630, 631, 632, 633, 634, 635, 636, 637, 638, 639, 640, 641, 642, 643, 644, 645, 646, 647, 649, 650, 651, 652, 653, 654, 655, 656, 657, 658, and 659 Providing an isolated polynucleotide comprising

本発明の好ましい実施形態によれば、配列番号1341、1342、1343、1344、1345、1346、1347、1348、および1349を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polypeptide comprising SEQ ID NOs: 1341, 1342, 1343, 1344, 1345, 1346, 1347, 1348 and 1349.

本発明の好ましい実施形態によれば、配列番号83、84、85、86、87、88、89、90、91、92、93、94、95、および96を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NO: 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, and 96.

本発明の好ましい実施形態によれば、配列番号695、696、697、698、699、700、701、702、703、704、および705を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NO: 695, 696, 697, 698, 699, 700, 701, 702, 703, 704 and 705.

本発明の好ましい実施形態によれば、配列番号1358、1359、1360、1361、1362、1363、1364、1365、1366、1367、1368、および1369を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polypeptide comprising SEQ ID NOs: 1358, 1359, 1360, 1361, 1362, 1363, 1364, 1365, 1366, 1367, 1368, and 1369.

本発明の好ましい実施形態によれば、配列番号97および98を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NO: 97 and 98.

本発明の好ましい実施形態によれば、配列番号706、707、708、709、710、711、712、713、714、715、716、717、718、719、720、721、722、723、724、725、726、727、728、729、730、731、732、733、734、735、736、737、738、739、740、および741を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, SEQ ID NOs: 706, 707, 708, 709, 710, 711, 712, 714, 715, 716, 717, 719, 720, 721, 722, 722, 724, Provided are isolated polynucleotides comprising 725, 726, 727, 728, 729, 730, 731, 732, 733, 734, 735, 736, 737, 738, 739, 740, and 741.

本発明の好ましい実施形態によれば、配列番号1370および1371を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NOs: 1370 and 1371.

本発明の好ましい実施形態によれば、配列番号103、104、105、106、107、および108を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NOs: 103, 104, 105, 106, 107 and 108.

本発明の好ましい実施形態によれば、配列番号789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、805、806、807、808、809、810、811、812、および813を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, SEQ ID NO: 789, 790, 791, 792, 792, 793, 794, 795, 796, 797, 798, 799, 800, 801, 802, 803, 804, 805, 806, 807, Provided are isolated polynucleotides comprising 808, 809, 810, 811, 812, and 813.

本発明の好ましい実施形態によれば、配列番号1376、1377、1378、および1379を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NO: 1376, 1377, 1378 and 1379.

本発明の好ましい実施形態によれば、配列番号114、115、116、117、118、および119を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NOs: 114, 115, 116, 117, 118 and 119.

本発明の好ましい実施形態によれば、配列番号856、857、858、859、860、861、862、863、864、865、866、867、868、869、870、871、872、873、874、および875を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, SEQ ID NO: 856, 857, 858, 859, 860, 861, 862, 863, 864, 866, 867, 868, 869, 870, 871, 872, 873, 874, And an isolated polynucleotide comprising 875.

本発明の好ましい実施形態によれば、配列番号1385、1386、1387、1388、および1389を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NO: 1385, 1386, 1387, 1388, and 1389.

本発明の好ましい実施形態によれば、配列番号144、145、146、147、148、および149を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising SEQ ID NO: 144, 145, 146, 147, 148 and 149.

本発明の好ましい実施形態によれば、配列番号991、992、993、994、995、996、997、998、999、1000、1001、1002、1003、1004、1005、1006、1007、1008、1009、1010、1011、1012、1013、1014、1015、および1016を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, SEQ ID NO: 991, 992, 993, 994, 995, 996, 997, 998, 999, 1000, 1001, 1002, 1003, 1004, 1005, 1006, 1007, 1008, 1009, Provided are isolated polynucleotides comprising 1010, 1011, 1012, 1013, 1014, 1015, and 1016.

本発明の好ましい実施形態によれば、配列番号1409、1410、1411、1412、および1413を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NOs: 1409, 1410, 1411, 1412 and 1413.

本発明の好ましい実施形態によれば、配列番号150を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising SEQ ID NO: 150.

本発明の好ましい実施形態によれば、配列番号1017、1018、1019、1020、および1021を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NOs: 1017, 1018, 1019, 1020 and 1021.

本発明の好ましい実施形態によれば、配列番号1414を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising SEQ ID NO: 1414.

本発明の好ましい実施形態によれば、配列番号109、110、111、112、および113を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polynucleotide comprising SEQ ID NOs: 109, 110, 111, 112 and 113.

本発明の好ましい実施形態によれば、配列番号814、815、816、817、818、819、820、821、822、823、824、825、826、827、829、830、831、832、833、834、835、836、837、838、839、840、841、842、843、844、845、846、847、848、849、850、851、852、853、854、および855を含む単離ポリヌクレオチドを提供する。   According to a preferred embodiment of the present invention, SEQ ID NOs: 814, 815, 816, 817, 818, 819, 820, 821, 822, 823, 824, 825, 826, 827, 829, 830, 831, 832, 833, An isolated polynucleotide comprising 834, 835, 836, 837, 838, 839, 840, 841, 842, 843, 844, 845, 846, 847, 848, 849, 850, 851, 852, 853, 854, and 855. I will provide a.

本発明の好ましい実施形態によれば、配列番号1380、1381、1382、1383、および1384を含む単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, there is provided an isolated polypeptide comprising SEQ ID NOs: 1380, 1381, 1382, 1383 and 1384.

本発明の好ましい実施形態によれば、HSSTROL3_P4をコードする単離キメラポリペプチドであって、MM11_HUMANのアミノ酸1〜163に対応し、HSSTROL3_P4のアミノ酸1〜163にも対応するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWと少なくとも90%相同な第1のアミノ酸配列と、HSSTROL3_P4のアミノ酸164に対応する架橋アミノ酸Hと、MM11_HUMANのアミノ酸165〜445に対応し、HSSTROL3_P4のアミノ酸165〜445にも対応するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQGAQYWVYDGEKPVLGPAPLTELGLVRFPVHAALVWGPEKNKIYFFRGRDYWRFHPSTRRVDSPVPRRATDWRGVPSEIDAAFQDADGと少なくとも90%相同な第2のアミノ酸配列と、HSSTROL3_P4のアミノ酸446〜496に対応する配列ALGVRQLVGGGHSSRFSHLVVAGLPHACHRKSGSSSQVLCPEPSALLSVAGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、架橋アミノ酸、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、HSSTROL3_P4をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, the isolated chimeric polypeptide encoding HSSTROL3_P4, which corresponds to amino acids 1 to 163 of MM11 _HUMAN and also corresponds to amino acids 1 to 163 of HSSTROL3 _P4, corresponds to The first amino acid sequence, the bridging amino acid H corresponding to amino acid 164 of HSSTROL3_P4, and the amino acid of MM11_HUMAN It corresponds to Amino Acids 165-445, JididieruPiefudiJipijijiaierueieichieiefuefuPikeitieichiaruijidibuieichiefudiwaidiitidaburyutiaijididikyujitidieruerukyubuieieieichiiefujieichibuierujierukyueichititieieikeieieruemuesueiefuwaitiefuaruwaiPieruesueruesuPididishiarujibuikyueichieruwaijikyuPidaburyuPitibuitiesuarutiPieieruJipikyueijiaiditienuiaieiPieruiPidieiPiPidieishiieiesuefudieibuiesutiaiarujiieruefuefuefukeieijiefubuidaburyuarueruarujijikyuerukyuPijiwaiPieierueiesuarueichidaburyukyujieruPiesupibuidieieiefuidieikyujieichiaidaburyuefuefukyujieikyuwaidaburyubuiwaidijiikeiPibuieruJipiEipierutiierujierubuiaruefuPibuieichieieierubuidaburyuJipiikeienukeiaiwaiefuefuarujiarudiwaidaburyuaruefueichiPiesutiaruarubuidiesuPVPRRATDWRGVPSEIDAAFQDADG at least 90 corresponding to amino acids 165-445 of HSSTROL3_P4 A polypeptide having at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90% with a polypeptide having the homologous second amino acid sequence and the sequence ALGVRQLVGGGHSSRFSHLV VAGLPHACHRKSGSSSQVLPPEPSALLSVAG corresponding to amino acids 446 to 496 of HSSTROL3_P4. Most preferably, it comprises at least a 95% homologous third amino acid sequence, wherein said first amino acid sequence, bridging amino acid, second amino acid sequence, and third amino acid sequence are adjacent and in sequential order Provided is an isolated chimeric polypeptide encoding HSSTROL3_P4.

本発明の好ましい実施形態によれば、HSSTROL3_P4のテールをコードする単離ポリペプチドであって、HSSTROL3_P4中の配列ALGVRQLVGGGHSSRFSHLVVAGLPHACHRKSGSSSQVLCPEPSALLSVAGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HSSTROL3_P4のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of HSSTROL3_P4, which is at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence ALGVRQLVGGGHSSRFSHLVVAGLPHACHRKSGSSSQVCLEPPSALLSVAG in HSSTROL3_P4. More preferably, an isolated polypeptide encoding the tail of HSSTROL3_P4 is provided that comprises a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、HSSTROL3_P5をコードする単離キメラポリペプチドであって、MM11_HUMANのアミノ酸1〜163に対応し、HSSTROL3_P5のアミノ酸1〜163にも対応するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWと少なくとも90%相同な第1のアミノ酸配列と、HSSTROL3_P5のアミノ酸164に対応する架橋アミノ酸Hと、MM11_HUMANのアミノ酸165〜358に対応し、HSSTROL3_P5のアミノ酸165〜358にも対応するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQと少なくとも90%相同な第2のアミノ酸配列と、HSSTROL3_P5のアミノ酸359〜382に対応する配列ELGFPSSTGRDESLEHCRCQGLHKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、架橋アミノ酸、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、HSSTROL3_P5をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, the isolated chimeric polypeptide encoding HSSTROL3_P5, which corresponds to amino acids 1 to 163 of MM11 _HUMAN and also corresponds to amino acids 1 to 163 of HSSTROL3 _P5. The first amino acid sequence, the bridging amino acid H corresponding to amino acid 164 of HSSTROL3_P5, and the amino acid of MM11_HUMAN Corresponds to Amino Acids 165-358, corresponding GDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQ and at least 90% homologous to a second amino acid sequence to amino acids 165-358 of HSSTROL3_P5, the polypeptide having a sequence corresponding to ELGFPSSTGRDESLEHCRCQGLHK to amino acid 359-382 of HSSTROL3_P5 At least 70 A third amino acid sequence, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous, said first amino acid sequence being a bridging amino acid, Provided is an isolated chimeric polypeptide encoding HSSTROL3_P5, wherein the two amino acid sequences and the third amino acid sequence are adjacent and in sequential order.

本発明の好ましい実施形態によれば、HSSTROL3_P5のテールをコードする単離ポリペプチドであって、HSSTROL3_P5中の配列ELGFPSSTGRDESLEHCRCQGLHKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HSSTROL3_P5のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of HSSTROL3_P5, comprising at least 70%, optionally at least about 80%, preferably at least about 85% of the sequence ELGFPSSTGRDESLEHCRCQGLHK in HSSTROL3_P5. More preferably, provided is an isolated polypeptide encoding the tail of HSSTROL3_P5, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、HSSTROL3_P7をコードする単離キメラポリペプチドであって、MM11_HUMANのアミノ酸1〜163に対応し、HSSTROL3_P7のアミノ酸1〜163にも対応するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWと少なくとも90%相同な第1のアミノ酸配列と、HSSTROL3_P7のアミノ酸164に対応する架橋アミノ酸Hと、MM11_HUMANのアミノ酸165〜359に対応し、HSSTROL3_P7のアミノ酸165〜359にも対応するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQGと少なくとも90%相同な第2のアミノ酸配列と、HSSTROL3_P7のアミノ酸360〜370に対応する配列TTGVSTPAPGVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、架橋アミノ酸、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、HSSTROL3_P7をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, the isolated chimeric polypeptide encoding HSSTROL3_P7, which corresponds to amino acids 1 to 163 of MM11 _HUMAN and to amino acids 1 to 163 of HSSTROL3 _P7, also corresponds to The first amino acid sequence, the bridging amino acid H corresponding to amino acid 164 of HSSTROL3_P7, and the amino acid of MM11_HUMAN Corresponds to Amino Acids 165-359, corresponding GDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQG and at least 90% homologous to a second amino acid sequence to amino acids 165-359 of HSSTROL3_P7, the polypeptide having a sequence corresponding to TTGVSTPAPGV to amino acid 360-370 of HSSTROL3_P7 At least 70%, optionally at least The first amino acid sequence, the bridging amino acid, the second amino acid sequence, and the third amino acid sequence that is 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; Provided is an isolated chimeric polypeptide encoding HSSTROL3_P7, wherein the third amino acid sequence is in a contiguous and sequential order.

本発明の好ましい実施形態によれば、HSSTROL3_P7のテールをコードする単離ポリペプチドであって、HSSTROL3_P7中の配列TTGVSTPAPGVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HSSTROL3_P7のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of HSSTROL3_P7, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence TTGVSTPAPGV in HSSTROL3_P7. More preferably, provided is an isolated polypeptide encoding the tail of HSSTROL3_P7, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、HSSTROL3_P8をコードする単離キメラポリペプチドであって、MM11_HUMANのアミノ酸1〜163に対応し、HSSTROL3_P8のアミノ酸1〜163にも対応するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWと少なくとも90%相同な第1のアミノ酸配列と、HSSTROL3_P8のアミノ酸164に対応する架橋アミノ酸Hと、MM11_HUMANのアミノ酸165〜286に対応し、HSSTROL3_P8のアミノ酸165〜286にも対応するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEと少なくとも90%相同な第2のアミノ酸配列と、HSSTROL3_P8のアミノ酸278〜301に対応する配列VRPCLPVPLLLCWPLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、架橋アミノ酸、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、HSSTROL3_P8をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, the isolated chimeric polypeptide encoding HSSTROL3_P8, which corresponds to amino acids 1 to 163 of MM11 _HUMAN and also corresponds to amino acids 1 to 163 of HSSTROL3 _P8. The first amino acid sequence, the bridging amino acid H corresponding to amino acid 164 of HSSTROL3_P8, and the amino acid of MM11_HUMAN GDLPDFPGGILAHAFFFPKTHREGDVHFDYDETTIDDDQGTDLLQVAAHEFGHVLQQHTTAAKALMSAFYTFRYPLSDGRDQQTPRTPSIPLGPIP GILPTQGTPQGPRTPSIPL GELPFET A signal that corresponds to at least 90% of the other members of the network. 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous a third amino acid sequence, 1 amino acid sequence, crosslinked amino acid, the second amino acid sequence, and a third amino acid sequence, contiguous and in sequential order, provides an isolated chimeric polypeptide coding HSSTROL3_P8.

本発明の好ましい実施形態によれば、HSSTROL3_P8のテールをコードする単離ポリペプチドであって、HSSTROL3_P8中の配列VRPCLPVPLLLCWPLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HSSTROL3_P8のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of HSSTROL3_P8, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence VRPCLPVPLLLCWPL in HSSTROL3_P8. More preferably, provided is an isolated polypeptide encoding the tail of HSSTROL3_P8, comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、HSSTROL3_P9をコードする単離キメラポリペプチドであって、MM11_HUMANのアミノ酸1〜96に対応し、HSSTROL3_P9のアミノ酸1〜96にも対応するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKと少なくとも90%相同な第1のアミノ酸配列と、MM11_HUMANのアミノ酸113〜163に対応し、HSSTROL3_P9のアミノ酸97〜147にも対応するRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWと少なくとも90%相同な第2のアミノ酸配列と、HSSTROL3_P9のアミノ酸148に対応する架橋アミノ酸Hと、MM11_HUMANのアミノ酸165〜359に対応し、HSSTROL3_P9のアミノ酸149〜343にも対応するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQGと少なくとも90%相同な第3のアミノ酸配列と、HSSTROL3_P9のアミノ酸344に対応する配列TTGVSTPAPGVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第4のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、架橋アミノ酸、第3のアミノ酸配列、および第4のアミノ酸配列が、隣接し、且つ連続した順序にある、HSSTROL3_P9をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding HSSTROL3_P9, which corresponds to amino acids 1 to 96 of MM11 HUMAN and also to amino acids 1 to 96 of HSSTROL3_P9. RIRLFPWQLVQEQVRQTMAEALKVWSDVTPL TFTEVHEGRAMIDI FARYW corresponding to the first amino acid sequence and amino acids 113 to 163 of MM11_HUMAN and also to amino acids 97 to 147 of HSSTROL3_P9 Homologous second amino acid sequence, a crosslinking amino acids H corresponding to amino acid 148 of HSSTROL3_P9, corresponding to amino acids 165-359 of MM11_HUMAN, first of at least 90% homologous to the corresponding GDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQG to amino acids 149-343 of HSSTROL3_P9 Amino acid sequence of 3, and HSSTROL3_P9 A fourth amino acid sequence that is at least 70%, optionally at least 80%, preferably at least 85%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to a polypeptide having the sequence TTGVSTPAPGV corresponding to amino acid 344 And wherein the first amino acid sequence, the second amino acid sequence, the bridging amino acid, the third amino acid sequence, and the fourth amino acid sequence are adjacent and in a sequential order, the isolation encoding HSSTROL3_P9 Provided is a chimeric polypeptide.

本発明の好ましい実施形態によれば、HSSTROL3_P9の縁(edge)部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がKRを含み、以下の構造:アミノ酸番号96−x〜96のいずれかから始まり、アミノ酸番号97+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HSSTROL3_P9の縁部分をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding the edge portion of HSSTROL3_P9, having a length "n", wherein n is at least about 10 amino acids in length, optionally Of at least about 20 amino acids in length, preferably at least about 30 amino acids in length, more preferably at least about 40 amino acids in length, and most preferably at least about 50 amino acids in length); Structure: having a sequence beginning with any of amino acid numbers 96-x to 96 and ending with amino acid number 97 + ((n-2) -x), wherein x varies from 0 to n-2 Provided is an isolated chimeric polypeptide encoding the rim portion of HSSTROL3_P9, which comprises the polypeptide.

本発明の好ましい実施形態によれば、HSSTROL3_P9のテールをコードする単離ポリペプチドであって、HSSTROL3_P9中の配列TTGVSTPAPGVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HSSTROL3_P9のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of HSSTROL3_P9, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence TTGVSTPAPGV in HSSTROL3_P9. Provided is an isolated polypeptide encoding the tail of HSSTROL3_P9, more preferably comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、HUMCA1XIA_P14をコードする単離キメラポリペプチドであって、CA1B_HUMAN_V5のアミノ酸1〜1056に対応し、HUMCA1XIA_P14のアミノ酸1〜1056にも対応するMEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDRGFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGPRGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQGLPGPQGPIGPPGEKGPQGKPGLAGLPGADGPPGHPGKEGQSGEKGALGPPGPQGPIGYPGPRGVKGADGVRGLKGSKGEKGEDGFPGFKGDMGLKGDRGEVGQIGPRGEDGPEGPKGRAGPTGDPGPSGQAGEKGKLGVPGLPGYPGRQGPKGSTGFPGFPGANGEKGARGVAGKPGPRGQRGPTGPRGSRGARGPTGKPGPKGTSGGDGPPGPPGERGPQGPQGPVGFPGPKGPPGPPGKDGLPGHPGQRGETGFQGKTGPPGPGGVVGPQGPTGETGPIGERGHPGPPGPPGEQGLPGAAGKEGAKGDPGPQGISGKDGPAGLRGFPGERGLPGAQGAPGLKGGEGPQGPPGPVと少なくとも90%相同な第1のアミノ酸配列と、HUMCA1XIA_P14のアミノ酸1057〜1081に対応する配列VSMMIINSQTIMVVNYSSSFITLMLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCA1XIA_P14をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding HUMCA1XIA_P14, corresponds to amino acids 1 to 1056 of CA1B_HUMAN_V5, corresponding to amino acids 1 to 1056 of HUMCA1XIA_P14 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQ LITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGES DPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDRGFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGPRGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQGLPGPQGPIGPPGEKGPQGKPGLAGLPGADGPPGHPGKEGQSGEKGALGPPGPQGPIGYPGPRGVKGADGVRGLKGSKGEKGEDGFPGFKGDMGLKGDRGEVGQIGPRGEDGPEGPKGRAGPTGDPGPSGQAGEKGKLGVPGLPGYPGRQGPKGSTGFPGFPGANGEKGARGVAGKPGPRGQRGPTGPRG A first amino acid sequence at least 90% homologous to EsuarujieiaruJipitijikeiPiJipikeijitiesujijidiJipipijipipijiiaruJipikyuJipikyuJipibuijiefupijipikeiJipipijipipijikeidijierupijieichipijikyuarujiitijiefukyujikeitijipipiJipijijibuibuiJipikyuJipitijiitiJipiaijiiarujieichiPiJipipijipipijiikyujieruPijieieijikeiijieikeijidipiJipikyujiaiesujikeidiJipieijieruarujiefuPijiiRGLPGAQGAPGLKGGEGPQGPPGPV, polypeptide at least 70% with a sequence corresponding to VSMMIINSQTIMVVNYSSSFITLML to amino acid 1057 to 1081 of HUMCA1XIA_P14, optionally at least 80%, preferably at least 85%, more preferably Is at least 90%, most preferably at least 95% homologous And a amino acid sequence, the first amino acid sequence and a second amino acid sequence, contiguous and in sequential order, provides an isolated chimeric polypeptide coding HUMCA1XIA_P14.

本発明の好ましい実施形態によれば、HUMCA1XIA_P14のテールをコードする単離ポリペプチドであって、HUMCA1XIA_P14中の配列VSMMIINSQTIMVVNYSSSFITLMLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMCA1XIA_P14のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of HUMCA1XIA_P14, comprising at least 70%, optionally at least about 80%, preferably at least about 85% of the sequence VSMMIINSQTIMVVNYSSSFITLML in HUMCA1XIA_P14 More preferably, provided is an isolated polypeptide encoding the tail of HUMCA1XIA_P14, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、HUMCA1XIA_P15をコードする単離キメラポリペプチドであって、CA1B_HUMANのアミノ酸1〜714に対応し、HUMCA1XIA_P15のアミノ酸1〜714にも対応するMEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDRGFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGPRGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQGLPGPQGPIGPPGEKと少なくとも90%相同な第1のアミノ酸配列と、HUMCA1XIA_P15のアミノ酸715〜729に対応する配列MCCNLSFGILIPLQKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCA1XIA_P15をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding HUMCA1XIA_P15, corresponding to amino acids 1-714 of CA1B_HUMAN, corresponding to amino acids 1-714 of HUMCA1XIA_P15 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITG PKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGESGDPGP A first amino acid sequence at least 90% homologous to JipiarujibuikyujipipiJipitijikeiPijikeiarujiaruPijieidijijiarujiemuPijiiPijieikeijidiarujiefudijieruPijieruPijidikeijieichiarujiiaruJipikyuJipipijipipijididijiemuarujiidijiiaiJipiarujieruPijiieiJipiarujierueruJipiarujitiPijieiPijikyuPijiemueijibuidijipipiJipikeijienuemuJipikyujiiPiJipiPGQQGNPGPQGLPGPQGPIGPPGEK, polypeptide at least 70% with a sequence corresponding to MCCNLSFGILIPLQK to amino acid 715-729 of HUMCA1XIA_P15, optionally at least 80%, preferably at least 85%, more preferably Comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first amino acid sequence The present invention provides an isolated chimeric polypeptide encoding HUMCA1XIA_P15, wherein the second amino acid sequence is in a contiguous and sequential order.

本発明の好ましい実施形態によれば、HUMCA1XIA_P15のテールをコードする単離ポリペプチドであって、HUMCA1XIA_P15中の配列MCCNLSFGILIPLQKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMCA1XIA_P15のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of HUMCA1XIA_P15, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence MCCNLSFGILIPLQK in HUMCA1XIA_P15. More preferably, provided is an isolated polypeptide encoding the tail of HUMCA1XIA_P15, comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、HUMCA1XIA_P16をコードする単離キメラポリペプチドであって、CA1B_HUMANのアミノ酸1〜648に対応し、HUMCA1XIA_P16のアミノ酸1〜648にも対応するMEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDRGFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAと少なくとも90%相同な第1のアミノ酸配列と、CA1B_HUMANのアミノ酸667〜714に対応し、HUMCA1XIA_P16のアミノ酸649〜696にも対応するGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQGLPGPQGPIGPPGEKと少なくとも90%相同な第2のアミノ酸配列と、HUMCA1XIA_P16のアミノ酸697〜738に対応する配列VSFSFSLFYKKVIKFACDKRFVGRHDERKVVKLSLPLYLIYEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCA1XIA_P16をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding HUMCA1XIA_P16, corresponding to amino acids 1-648 of CA1B_HUMAN, corresponding to amino acids 1-648 of HUMCA1XIA_P16 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITG PKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGESGDPGP The first amino acid sequence at least 90% homologous to JipiarujibuikyujipipiJipitijikeiPijikeiarujiaruPijieidijijiarujiemuPijiiPijieikeijidiarujiefudijieruPijieruPijidikeijieichiarujiiaruJipikyuJipiPGPPGDDGMRGEDGEIGPRGLPGEA, corresponding to amino acids 667-714 of CA1B_HUMAN, corresponding GMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQGLPGPQGPIGPPGEK and at least 90% homologous to a second amino acid sequence, the HUMCA1XIA_P16 to amino acids 649-696 of HUMCA1XIA_P16 At least 70% with the polypeptide having the sequence VSFSFSLFYKKVIKFACDKRFVGRHDERKVVKLSLPLYLIYE corresponding to amino acids 697-738, Said first amino acid sequence, said second amino acid sequence comprising a third amino acid sequence, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous And a third amino acid sequence, in contiguous and sequential order, provides an isolated chimeric polypeptide encoding HUMCA1XIA_P16.

本発明の好ましい実施形態によれば、HUMCA1XIA_P16の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がAGを含み、以下の構造:アミノ酸番号648−x〜648のいずれかから始まり、アミノ酸番号649+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HUMCA1XIA_P16の縁部分をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding the rim portion of HUMCA1XIA_P16, having a length "n", wherein n is at least about 10 amino acids in length, optionally at least about 20 amino acids in length, preferably at least about 30 amino acids in length, more preferably at least about 40 amino acids in length, most preferably at least about 50 amino acids in length), wherein at least two amino acids comprise AG; A polypeptide having a sequence beginning with any of the numbers 648-x-648 and ending with the amino acid number 649 + ((n-2) -x), wherein x varies from 0 to n-2. Provided is an isolated chimeric polypeptide encoding an edge portion of HUMCA1XIA_P16, including:

本発明の好ましい実施形態によれば、HUMCA1XIA_P16のテールをコードする単離ポリペプチドであって、HUMCA1XIA_P16中の配列VSFSFSLFYKKVIKFACDKRFVGRHDERKVVKLSLPLYLIYEと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMCA1XIA_P16のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of HUMCA1XIA_P16, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence VSFSFSLFYKKVIKFACDKRFVGRHDERKVVKLSLPLYLIYE in the sequence HUMCA1XIA_P16 More preferably, provided is an isolated polypeptide encoding the tail of HUMCA1XIA_P16, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、HUMCA1XIA_P17をコードする単離キメラポリペプチドであって、CA1B_HUMANのアミノ酸1〜260に対応し、HUMCA1XIA_P17のアミノ酸1〜260にも対応するMEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEと少なくとも90%相同な第1のアミノ酸配列と、HUMCA1XIA_P17のアミノ酸261〜273に対応する配列VRSTRPEKVFVFQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCA1XIA_P17をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding HUMCA1XIA_P17, corresponding to amino acids 1-260 of CA1B_HUMAN, corresponding to amino acids 1-260 of HUMCA1XIA_P17 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITG At least 70%, optionally at least 80%, preferably at least 85%, more preferably a first amino acid sequence at least 90% homologous to PKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDE and the sequence VRSTRPEKVFVFQ corresponding to amino acids 261 to 273 of HUMCA1XIA_P17 Comprises HUMCA1XIA_P17, comprising a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first amino acid sequence and said second amino acid sequence being adjacent and in sequential order An isolated chimeric polypeptide is provided.

本発明の好ましい実施形態によれば、HUMCA1XIA_P17のテールをコードする単離ポリペプチドであって、HUMCA1XIA_P17中の配列VRSTRPEKVFVFQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMCA1XIA_P17のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of HUMCA1XIA_P17, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence VRSTRPEKVFVFQ in HUMCA1XIA_P17 More preferably, an isolated polypeptide encoding the tail of HUMCA1XIA_P17, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R20779_P2をコードする単離キメラポリペプチドであって、STC2_HUMANのアミノ酸1〜169に対応し、R20779_P2のアミノ酸1〜169にも対応するMCAERLGQFMTLALVLATFDPARGTDATNPPEGPQDRSSQQKGRLSLQNTAEIQHCLVNAGDVGCGVFECFENNSCEIRGLHGICMTFLHNAGKFDAQGKSFIKDALKCKAHALRHRFGCISRKCPAIREMVSQLQRECYLKHDLCAAAQENTRVIVEMIHFKDLLLHEと少なくとも90%相同な第1のアミノ酸配列と、R20779_P2のアミノ酸170〜187に対応する配列CYKIEITMPKRRKVKLRDを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R20779_P2をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, according to a preferred embodiment of the present invention, the R20779.Ph. The first amino acid sequence and the sequence CYKIEITMPKRRKVK corresponding to amino acids 170 to 187 of R20779_P2 A polypeptide having RD and a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; Provided is an isolated chimeric polypeptide encoding R20779_P2 in which the amino acid sequence of 1 and the second amino acid sequence are adjacent and in sequential order.

本発明の好ましい実施形態によれば、R20779_P2のテールをコードする単離ポリペプチドであって、R20779_P2中の配列CYKIEITMPKRRKVKLRDと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R20779_P2のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of R20779_P2, comprising at least 70%, optionally at least about 80%, preferably at least about 85% of the sequence CYKIEITMPKRRKVKLRD in R20779_P2 More preferably, provided is an isolated polypeptide encoding the tail of R20779_P2, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、HUMOSTRO_PEA_1_PEA_1_P21をコードする単離キメラポリペプチドであって、OSTP_HUMANのアミノ酸1〜58に対応し、HUMOSTRO_PEA_1_PEA_1_P21のアミノ酸1〜58にも対応するMRIAVICFCLLGITCAIPVKQADSGSSEEKQLYNKYPDAVATWLNPDPSQKQNLLAPQと少なくとも90%相同な第1のアミノ酸配列と、HUMOSTRO_PEA_1_PEA_1_P21のアミノ酸59〜64に対応する配列VFLNFSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMOSTRO_PEA_1_PEA_1_P21をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding HUMOSTRO_PEA_1_PEA_1_P21, corresponding to amino acids 1 to 58 of OSTP_HUMAN and also corresponding to amino acids 1 to 58 of HUMOSTRO_PEA_1_PEA_1_P21 At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably a polypeptide having the first amino acid sequence and the sequence VFLNFS corresponding to amino acids 59 to 64 of HUMOSTRO_PEA_1_PEA_1_P21 Is at least 95 And a homologous second amino acid sequence, the first amino acid sequence and a second amino acid sequence, contiguous and in sequential order, provides an isolated chimeric polypeptide coding HUMOSTRO_PEA_1_PEA_1_P21.

本発明の好ましい実施形態によれば、HUMOSTRO_PEA_1_PEA_1_P21のテールをコードする単離ポリペプチドであって、HUMOSTRO_PEA_1_PEA_1_P21中の配列VFLNFSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMOSTRO_PEA_1_PEA_1_P21のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of HUMOSTRO_PEA_1_PEA_1_P21, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence VFLNFS in HUMOSTRO_PEA_1_PEA_1_P21 More preferably, provided is an isolated polypeptide encoding the tail of HUMOSTRO_PEA_1_PEA_1_P21, comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、HUMOSTRO_PEA_1_PEA_1_P25をコードする単離キメラポリペプチドであって、OSTP_HUMANのアミノ酸1〜31に対応し、HUMOSTRO_PEA_1_PEA_1_P25のアミノ酸1〜31にも対応するMRIAVICFCLLGITCAIPVKQADSGSSEEKQと少なくとも90%相同な第1のアミノ酸配列と、HUMOSTRO_PEA_1_PEA_1_P25のアミノ酸32〜32に対応する配列Hを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMOSTRO_PEA_1_PEA_1_P25をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding HUMOSTRO_PEA_1_PEA_1_P25, which is at least 90% homologous to MRIAVICFCLLGITCAIPVKQADSGSSEEKQ, which corresponds to amino acids 1 to 31 of OSTP_HUMAN and also to amino acids 1 to 31 of HUMOSTRO_PEA_1_PEA_1_P25. The polypeptide having the first amino acid sequence and the sequence H corresponding to amino acids 32-32 of HUMOSTRO_PEA_1_PEA_1_P25 and at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably Comprises a second amino acid sequence which is at least 95% homologous, said first amino acid sequence and 2 amino acid sequences, contiguous and in sequential order, provides an isolated chimeric polypeptide coding HUMOSTRO_PEA_1_PEA_1_P25.

本発明の好ましい実施形態によれば、HUMOSTRO_PEA_1_PEA_1_P30をコードする単離キメラポリペプチドであって、OSTP_HUMANのアミノ酸1〜31に対応し、HUMOSTRO_PEA_1_PEA_1_P30のアミノ酸1〜31にも対応するMRIAVICFCLLGITCAIPVKQADSGSSEEKQと少なくとも90%相同な第1のアミノ酸配列と、HUMOSTRO_PEA_1_PEA_1_P30のアミノ酸32〜39に対応する配列VSIFYVFIを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMOSTRO_PEA_1_PEA_1_P30をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding HUMOSTRO_PEA_1_PEA_1_P30, which is at least 90% homologous to MRIAVICFCLLGITCAIPVKQADSGSSEEKQ, which corresponds to amino acids 1 to 31 of OSTP_HUMAN and also to amino acids 1 to 31 of HUMOSTRO_PEA_1_PEA_1_P30. At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably a polypeptide having the first amino acid sequence and the sequence VSIFYVFI corresponding to amino acids 32-39 of HUMOSTRO_PEA_1_PEA_1_P30 Contains at least a 95% homologous second amino acid sequence, and Acid sequence and a second amino acid sequence, contiguous and in sequential order, provides an isolated chimeric polypeptide coding HUMOSTRO_PEA_1_PEA_1_P30.

本発明の好ましい実施形態によれば、HUMOSTRO_PEA_1_PEA_1_P30のテールをコードする単離ポリペプチドであって、HUMOSTRO_PEA_1_PEA_1_P30中の配列VSIFYVFIと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMOSTRO_PEA_1_PEA_1_P30のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of HUMOSTRO_PEA_1_PEA_1_P30, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence VSIFYVFI in HUMOSTRO_PEA_1_PEA_1_P30 More preferably, provided is an isolated polypeptide encoding the tail of HUMOSTRO_PEA_1_PEA_1_P30, comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P10をコードする単離キメラポリペプチドであって、PLTP_HUMANのアミノ酸1〜67に対応し、HUMPHOSLIP_PEA_2_P10のアミノ酸1〜67にも対応するMALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEと少なくとも90%相同な第1のアミノ酸配列と、PLTP_HUMANのアミノ酸163〜493に対応し、HUMPHOSLIP_PEA_2_P10のアミノ酸68〜398にも対応するKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLLDTVPVRSSVDELVGIDYSLMKDPVASTSNLDMDFRGAFFPLTERNWSLPNRAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLDMLLRATYFGSIVLLSPAVIDSPLKLELRVLAPPRCTIKPSGTTISVTASVTIALVPPDQPEVQLSSMTMDARLSAKMALRGKALRTQLDLRRFRIYSNHSALESLALIPLQAPLKTMLQIGVMPMLNERTWRGVQIPLPEGINFVHEVVTNHAGFLTIGADLHFAKGLREVIEKNRPADVRASTAPTPSTAAVと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMPHOSLIP_PEA_2_P10をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding HUMPHOSLIP_PEA_2_P10, corresponding to amino acids 1 to 67 of PLTP_HUMAN and also corresponding to amino acids 1 to 67 of HUMPHOSLIP_PEA_2_P10. The first amino acid sequence corresponds to amino acids 163 to 493 of PLTP_HUMAN, and also corresponds to amino acids 68 to 398 of HUMPHOSLIP_PEA_2_P10. KVYDFLSTFITSGMFRNLQQICPVLYHAGTPVLLNSLLDTVPVRSSVDELVIDYSLMKDP ASTSNLDMDFRGAFFPLTERNWSLPNRAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLDMLLRATYFGSIVLLSPAVIDSPLKLELRVLAPPRCTIKPSGTTISVTASVTIALVPPDQPEVQLSSMTMDARLSAKMALRGKALRTQLDLRRFRIYSNHSALESLALIPLQAPLKTMLQIGVMPMLNERTWRGVQIPLPEGINFVHEVVTNHAGFLTIGADLHFAKGLREVIEKNRPADVRASTAPTPSTAAV and and at least 90% homologous to a second amino acid sequence, the sequence of the first amino acid sequence and a second amino acid sequence, adjacent and continuous There provides isolated chimeric polypeptide coding HUMPHOSLIP_PEA_2_P10.

本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P10の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がEKを含み、以下の構造:アミノ酸番号67−x〜67のいずれかから始まり、アミノ酸番号68+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HUMPHOSLIP_PEA_2_P10の縁部分をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding the rim portion of HUMPHOSLIP_PEA_2_P10, having a length “n”, where n is at least about 10 amino acids in length, optionally at least about 20 amino acids in length, preferably at least about 30 amino acids in length, more preferably at least about 40 amino acids in length, most preferably at least about 50 amino acids in length), wherein at least two amino acids comprise EK; A polypeptide having a sequence beginning with any of the numbers 67-x to 67 and ending with the amino acid number 68 + ((n-2) -x), wherein x varies from 0 to n-2. Provided is an isolated chimeric polypeptide encoding the edge portion of HUMPHOSLIP_PEA_2_P10.

本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P12をコードする単離キメラポリペプチドであって、PLTP_HUMANのアミノ酸1〜427に対応し、HUMPHOSLIP_PEA_2_P12のアミノ酸1〜427にも対応するMALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLRFRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASVSRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLLDTVPVRSSVDELVGIDYSLMKDPVASTSNLDMDFRGAFFPLTERNWSLPNRAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLDMLLRATYFGSIVLLSPAVIDSPLKLELRVLAPPRCTIKPSGTTISVTASVTIALVPPDQPEVQLSSMTMDARLSAKMALRGKALRTQLDLRRFRIYSNHSALESLALIPLQAPLKTMLQIGVMPMLNと少なくとも90%相同な第1のアミノ酸配列と、HUMPHOSLIP_PEA_2_P12のアミノ酸428〜432に対応する配列GKAGVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMPHOSLIP_PEA_2_P12をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding HUMPHOSLIP_PEA_2_P12, corresponding to amino acids 1-427 of PLTP_HUMAN, corresponding to amino acids 1-427 of HUMPHOSLIP_PEA_2_P12 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLRFRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASVSRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLLDTVPVRSSVDELV A first amino acid sequence at least 90% homologous to AidiwaiesueruemukeidiPibuieiesutiesuenuerudiemudiefuarujieiefuefuPierutiiaruenudaburyuesueruPienuarueibuiiPikyuerukyuiiiaruemubuiwaibuieiefuesuiefuefuefudiesueiemuiesuwaiefuarueijieierukyuerueruerubuijidikeibuiPieichidierudiemuerueruarueitiwaiefujiesuaibuierueruesuPieibuiaidiesuPierukeieruieruarubuierueiPiPiarushitiaikeiPiesujititiaiesubuitieiesubuitiaieierubuiPiPidikyuPiibuikyueruesuesuemutiemudieiarueruesueikeiemueieruarujikeieieruarutikyuerudieruaruaruefuaruaiwaiesuenueichiesueieruESLALIPLQAPLKTMLQIGVMPMLN, polypeptide at least 70% with a sequence corresponding to GKAGV to amino acid 428-432 of HUMPHOSLIP_PEA_2_P12, optionally at least 80%, preferably at least 85%, more Good Or encoding HUMPHOSLIP_PEA_2_P12, comprising a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first and second amino acid sequences being adjacent and in sequential order An isolated chimeric polypeptide is provided.

本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P12のテールをコードする単離ポリペプチドであって、HUMPHOSLIP_PEA_2_P12中の配列GKAGVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMPHOSLIP_PEA_2_P12のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of HUMPHOSLIP_PEA_2_P12, comprising at least 70%, optionally at least about 80%, preferably at least about 85% of the sequence GKAGV in HUMPHOSLIP_PEA_2_P12 More preferably, provided is an isolated polypeptide encoding the tail of HUMPHOSLIP_PEA_2_P12, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P31をコードする単離キメラポリペプチドであって、PLTP_HUMANのアミノ酸1〜67に対応し、HUMPHOSLIP_PEA_2_P31のアミノ酸1〜67にも対応するMALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEと少なくとも90%相同な第1のアミノ酸配列と、HUMPHOSLIP_PEA_2_P31のアミノ酸68〜98に対応する配列PGLERGADKFPVVGGSSLFLALDLTLRPPVGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMPHOSLIP_PEA_2_P31をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding HUMPHOSLIP_PEA_2_P31, corresponding to amino acids 1 to 67 of PLTP_HUMAN and also corresponding to amino acids 1 to 67 of HUMPHOSLIP_PEA_2_P31. At least 70%, optionally at least 80%, preferably at least 85%, more preferably less with the first amino acid sequence and a polypeptide having the sequence PGLERGADKFPVVGGSLSLALDLTLP PVG corresponding to amino acids 68 to 98 of HUMPHOSLIP_PEA_2_P31 Encoding HUMPHOSLIP_PEA_2_P31, comprising a second amino acid sequence of at least 90%, most preferably at least 95% homology, said first amino acid sequence and said second amino acid sequence being adjacent and in sequential order An isolated chimeric polypeptide is provided.

本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P31のテールをコードする単離ポリペプチドであって、HUMPHOSLIP_PEA_2_P31中の配列PGLERGADKFPVVGGSSLFLALDLTLRPPVGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMPHOSLIP_PEA_2_P31のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of HUMPHOSLIP_PEA_2_P31, which is at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence PGLERGADKFPVVGGSLFLALDLTLPVG in the HUMPHOSLIP_PEA_2_P31 More preferably, provided is an isolated polypeptide encoding the tail of HUMPHOSLIP_PEA_2_P31, comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P33をコードする単離キメラポリペプチドであって、PLTP_HUMANのアミノ酸1〜183に対応し、HUMPHOSLIP_PEA_2_P33のアミノ酸1〜183にも対応するMALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLRFRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASVSRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQと少なくとも90%相同な第1のアミノ酸配列と、HUMPHOSLIP_PEA_2_P33のアミノ酸184〜200に対応する配列VWAATGRRVARVGMLSLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMPHOSLIP_PEA_2_P33をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding HUMPHOSLIP_PEA_2_P33, corresponding to amino acids 1-183 of PLTP_HUMAN, at least 90% homologous with the corresponding MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLRFRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASVSRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQ to amino acids 1-183 of HUMPHOSLIP_PEA_2_P33 First amino acid sequence and HUMPHOS At least 70%, optionally at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 90%, most preferably at least 95% homologous to a polypeptide having the sequence VWAATGRRVARVGMLSL corresponding to amino acids 184 to 200 of IP_PEA_2_P33 An isolated chimeric polypeptide encoding HUMPHOSLIP_PEA_2_P33, comprising two amino acid sequences, wherein the first and second amino acid sequences are adjacent and in sequential order.

本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P33のテールをコードする単離ポリペプチドであって、HUMPHOSLIP_PEA_2_P33中の配列VWAATGRRVARVGMLSLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMPHOSLIP_PEA_2_P33のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of HUMPHOSLIP_PEA_2_P33, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence VWAATGRRVARVGMLSL in HUMPHOSLIP_PEA_2_P33 More preferably, provided is an isolated polypeptide encoding the tail of HUMPHOSLIP_PEA_2_P33, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P34をコードする単離キメラポリペプチドであって、PLTP_HUMANのアミノ酸1〜205に対応し、HUMPHOSLIP_PEA_2_P34のアミノ酸1〜205にも対応するMALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLRFRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASVSRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLLDTVPVと少なくとも90%相同な第1のアミノ酸配列と、HUMPHOSLIP_PEA_2_P34のアミノ酸206〜217に対応する配列LWTSLLALTIPSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMPHOSLIP_PEA_2_P34をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding HUMPHOSLIP_PEA_2_P34, corresponding to amino acids 1-205 of PLTP_HUMAN, the corresponding MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLRFRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASVSRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLLDTVPV to amino acids 1-205 of HUMPHOSLIP_PEA_2_P34 least 90 At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, of a polypeptide having the sequence LWTSLLALTIPS corresponding to amino acids 206 to 217 of HUMPHOSLIP_PEA_2_P34 with the homologous first amino acid sequence An isolated chimeric polypeptide encoding HUMPHOSLIP_PEA_2_P34, comprising a second amino acid sequence that is most preferably at least 95% homologous, said first amino acid sequence and the second amino acid sequence being in contiguous and sequential order I will provide a.

本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P34のテールをコードする単離ポリペプチドであって、HUMPHOSLIP_PEA_2_P34中の配列LWTSLLALTIPSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMPHOSLIP_PEA_2_P34のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of HUMPHOSLIP_PEA_2_P34, comprising at least 70%, optionally at least about 80%, preferably at least about 85% of the sequence LWTSLLALTIPS in HUMPHOSLIP_PEA_2_P34 More preferably, provided is an isolated polypeptide encoding the tail of HUMPHOSLIP_PEA_2_P34, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P35をコードする単離キメラポリペプチドであって、PLTP_HUMANのアミノ酸1〜109に対応し、HUMPHOSLIP_PEA_2_P35のアミノ酸1〜109にも対応するMALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLRFRRQLLYWFと少なくとも90%相同な第1のアミノ酸配列と、第2のアミノ酸配列と、Lを含む架橋アミノ酸Hと、PLTP_HUMANのアミノ酸163〜183に対応し、HUMPHOSLIP_PEA_2_P35のアミノ酸111〜131にも対応するKVYDFLSTFITSGMRFLLNQQと少なくとも90%相同な第3のアミノ酸配列と、HUMPHOSLIP_PEA_2_P35のアミノ酸132〜148に対応する配列VWAATGRRVARVGMLSLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第4のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、第3のアミノ酸配列、および第4のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMPHOSLIP_PEA_2_P35をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding HUMPHOSLIP_PEA_2_P35, corresponding to amino acids 1-109 of PLTP_HUMAN and also corresponding to amino acids 1-109 of HUMPHOSLIP_PEA_2_P35, MALGFALFLAKALVTKALEQQEGL LTIQETIELIT7 is a UT The first amino acid sequence, the second amino acid sequence, the bridging amino acid H including L, and the amino acids 163 to 183 of PLTP_HUMAN, and the amino acids 111 to 1 of HUMPHOSLIP_PEA_2_P35 And at least 70%, optionally at least 80%, preferably at least 80%, with a polypeptide having the third amino acid sequence at least 90% homologous to KVYDFLSTFITSGMFRNLQQ and the sequence VWAATGRRVARVGMLSL corresponding to amino acids 132-148 of HUMPHOSLIP_PEA_2_P35. Said first amino acid sequence, the second amino acid sequence, the third amino acid sequence, and the fourth amino acid sequence comprising a fourth amino acid sequence that is 85%, more preferably at least 90%, most preferably at least 95% homologous; Provided is an isolated chimeric polypeptide encoding HUMPHOSLIP_PEA_2_P35, wherein the amino acid sequences are in contiguous and sequential order.

本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P35の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がFLKを含み、以下の構造(HUMPHOSLIP_PEA_2_P35に対応する番号付け):アミノ酸番号109−x〜109のいずれかから始まり、アミノ酸番号111+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HUMPHOSLIP_PEA_2_P35の縁部分をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding the rim portion of HUMPHOSLIP_PEA_2_P35, having a length “n”, where n is at least about 10 amino acids long, optionally at least about 20 amino acids in length, preferably at least about 30 amino acids in length, more preferably at least about 40 amino acids in length, most preferably at least about 50 amino acids in length, wherein at least two amino acids comprise FLK and have the following structure (HUMPHOSLIP_PEA_2_P35 Numbering corresponding to: beginning with any of amino acid numbers 109-x to 109 and ending with amino acid number 111 + ((n-2) -x), where x varies from 0 to n-2 Comprising a polypeptide, having a sequence, HUMPHOSLIP_P It provides an isolated chimeric polypeptide coding edges of A_2_P35.

本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P35のテールをコードする単離ポリペプチドであって、HUMPHOSLIP_PEA_2_P35中の配列VWAATGRRVARVGMLSLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMPHOSLIP_PEA_2_P35のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of HUMPHOSLIP_PEA_2_P35, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence VWAATGRRVARVGMLSL in HUMPHOSLIP_PEA_2_P35 More preferably, provided is an isolated polypeptide encoding the tail of HUMPHOSLIP_PEA_2_P35, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R38144_PEA_2_P6をコードする単離キメラポリペプチドであって、CT31_HUMANのアミノ酸1〜412に対応し、R38144_PEA_2_P6のアミノ酸1〜412にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQDAGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWVQMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLPEFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESIEKISKVECGFATと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P6のアミノ酸413〜449に対応する配列LASFSHMSDQRSARPQAGQPHGVVLPGRDCEIPLPPVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P6をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding R38144_PEA_2_P6, corresponding to amino acids 1-412 of CT31_HUMAN, corresponding to amino acids 1-412 of R38144_PEA_2_P6 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVALM A first amino acid sequence at least 90% homologous to ErudaburyuiesuaruesudiaijierubuijienueichiaidibuierutijikeidaburyubuieikyudieijiaijieijibuidiesuwaiefuiwaierubuikeijieiaieruerukyudikeikeieruemueiemuefueruiwaienukeieiaiaruenuwaitiaruefudididaburyuwaierudaburyubuikyuemuwaikeijitibuiesuemuPibuiefukyuesueruieiwaidaburyuPijierukyuesueruaijidiaidienueiemuarutiefueruenuwaiwaitibuidaburyukeikyuefujijieruPiiefuwaienuaiPikyujiwaitibuiikeiaruijiwaiPieruaruPiieruaiiesueiemuwaieruwaiarueitijidipiTLLELGRDAVESIEKISKVECGFAT, polypeptide at least 70% with a sequence corresponding to LASFSHMSDQRSARPQAGQPHGVVLPGRDCEIPLPPV to amino acid 413-449 of R38144_PEA_2_P6, optionally at least 80%, preferably at least 85%, Preferably, it encodes R38144_PEA_2_P6, which comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first amino acid sequence and the second amino acid sequence being adjacent and in sequential order An isolated chimeric polypeptide is provided.

本発明の好ましい実施形態によれば、R38144_PEA_2_P6のテールをコードする単離ポリペプチドであって、R38144_PEA_2_P6中の配列LASFSHMSDQRSARPQAGQPHGVVLPGRDCEIPLPPVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P6のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of R38144_PEA_2_P6, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence LASFSHMSDQRSARPQAGQPHGVVLPGRDCEIPLPPV in R38144_PEA_2_P6 More preferably, provided is an isolated polypeptide encoding the tail of R38144_PEA_2_P6, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R38144_PEA_2_P13をコードする単離キメラポリペプチドであって、CT31_HUMANのアミノ酸1〜323に対応し、R38144_PEA_2_P13のアミノ酸1〜323にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQDAGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWVQMYKGTVSMPVFQSLEAYWPGLQと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P13のアミノ酸324〜341に対応する配列NLLKAQCTSTVPRGIPPSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P13をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding R38144_PEA_2_P13, corresponding to amino acids 1-323 of CT31_HUMAN, corresponding to amino acids 1-323 of R38144_PEA_2_P13 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVA MRLWSRSDIGLVGNHID VLTGKWVAQDAGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWVQMYKGTVSMPVF QLEAYWPGLQ The first amino acid sequence which is at least 90% homologous to R38144_PEA_2_P13, a sequence corresponding to the amino acids 324 to 341 of the amino acids R38144_PEA_2_P13, comprising a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first amino acid sequence and the second amino acid sequence being adjacent and in sequential order It provides isolated chimeric polypeptides that over de.

本発明の好ましい実施形態によれば、R38144_PEA_2_P13のテールをコードする単離ポリペプチドであって、R38144_PEA_2_P13中の配列NLLKAQCTSTVPRGIPPSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P13のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of R38144_PEA_2_P13, which is at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence NLLKAQCTSTVPPRGIPPS in R38144_PEA_2_P13 More preferably, provided is an isolated polypeptide encoding the tail of R38144_PEA_2_P13, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R38144_PEA_2_P15をコードする単離キメラポリペプチドであって、CT31_HUMANのアミノ酸1〜282に対応し、R38144_PEA_2_P15のアミノ酸1〜282にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQDAGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P15のアミノ酸283〜287に対応する配列PHWRHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P15をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding R38144_PEA_2_P15, corresponding to amino acids 1-282 of CT31_HUMAN, corresponding to amino acids 1-282 of R38144_PEA_2_P15 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVA MRLWESSDIGLVGNHID VLT GKWVAQDAGIGAGVDSYFEYLVKGAILLQDKKLMAMFLE The first amino acid sequence at least 90% homologous to the polypeptide having the sequence PHWRH corresponding to amino acids 283-287 of R38144_PEA_2_P15, at least 70%, optionally at least 80%, preferably at least 85%, more preferably Comprises R38144_PEA_2_P15, which comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first amino acid sequence and the second amino acid sequence being adjacent and in sequential order An isolated chimeric polypeptide is provided.

本発明の好ましい実施形態によれば、R38144_PEA_2_P15のテールをコードする単離ポリペプチドであって、R38144_PEA_2_P15中の配列PHWRHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P15のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of R38144_PEA_2_P15, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence PHWRH in R38144_PEA_2_P15 More preferably, provided is an isolated polypeptide encoding the tail of R38144_PEA_2_P15, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R38144_PEA_2_P19をコードする単離キメラポリペプチドであって、CT31_HUMANのアミノ酸1〜412に対応し、R38144_PEA_2_P19のアミノ酸1〜412にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQDAGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWVQMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLPEFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESIEKISKVECGFATと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P19のアミノ酸413〜433に対応する配列KRSRSVAQAGVQWCDHDSPQPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P19をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding R38144_PEA_2_P19, corresponding to amino acids 1-412 of CT31_HUMAN, corresponding to amino acids 1-412 of R38144_PEA_2_P19 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVA A first amino acid sequence at least 90% homologous to EmuaruerudaburyuiesuaruesudiaijierubuijienueichiaidibuierutijikeidaburyubuieikyudieijiaijieijibuidiesuwaiefuiwaierubuikeijieiaieruerukyudikeikeieruemueiemuefueruiwaienukeieiaiaruenuwaitiaruefudididaburyuwaierudaburyubuikyuemuwaikeijitibuiesuemuPibuiefukyuesueruieiwaidaburyuPijierukyuesueruaijidiaidienueiemuarutiefueruenuwaiwaitibuidaburyukeikyuefujijieruPiiefuwaienuaiPikyujiwaitibuiikeiaruijiwaiPieruaruPiieruaiiesueiemuwaieruwaiarueitijidipiTLLELGRDAVESIEKISKVECGFAT, polypeptide at least 70% with a sequence corresponding to KRSRSVAQAGVQWCDHDSPQP to amino acid 413-433 of R38144_PEA_2_P19, optionally at least 80%, preferably at least 85%, more Preferably at least 90 An isolated chimeric poly encoding R38144_PEA_2_P19, comprising a second amino acid sequence which is most preferably at least 95% homologous, said first amino acid sequence and the second amino acid sequence being adjacent and in sequential order Provide a peptide.

本発明の好ましい実施形態によれば、R38144_PEA_2_P19のテールをコードする単離ポリペプチドであって、R38144_PEA_2_P19中の配列KRSRSVAQAGVQWCDHDSPQPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P19のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of R38144_PEA_2_P19, which is at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence KRSRSVAQAGVQWCDHDSPQ in R38144_PEA_2_P19. More preferably, provided is an isolated polypeptide encoding the tail of R38144_PEA_2_P19, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R38144_PEA_2_P24をコードする単離キメラポリペプチドであって、CT31_HUMANのアミノ酸1〜121に対応し、R38144_PEA_2_P24のアミノ酸1〜121にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRと少なくとも90%相同な第1のアミノ酸配列と、CT31_HUMANのアミノ酸282〜578に対応する配列EYNKAIRNYTRFDDWYLWVQMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLPEFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESIEKISKVECGFATIKDLRDHKLDNRMESFFLAETVKYLYLLFDPTNFIHNNGSTFDAVITPYGECILGAGGYIFNTEAHPIDPAALHCCQRLKEEQWEVEDLMREFYSLKRSRSKFQKNTVSSGPWEPPARPGTLFSPENHDQARERKPAKQKVPLLSCPSQPFTSKLALLGQVFLDSSと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P24をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, the isolated chimeric polypeptide encoding R38144_PEA_2_P24, which corresponds to amino acids 1 to 121 of CT31_HUMAN and also to amino acids 1 to 121 of R38144 _PEA_2 _P24, is MPFRLLIPLGLLCALLPQHHGAPGPDGPHPHYPRKKAMFYHAYDSIFEN FIF LPDIGTITBIT GIT GIT GIT GIT First amino acid sequence and sequence corresponding to amino acids 282 to 578 of CT31_HUMAN EYNKAIRNYTRFDDWYLWVQMYKGTVSMPVFQSLEAYWPGLQSLIGDI NAMRTFLNYYTVWKQFGGLPEFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESIEKISKVECGFATIKDLRDHKLDNRMESFFLAETVKYLYLLFDPTNFIHNNGSTFDAVITPYGECILGAGGYIFNTEAHPIDPAALHCCQRLKEEQWEVEDLMREFYSLKRSRSKFQKNTVSSGPWEPPARPGTLFSPENHDQARERKPAKQKVPLLSCPSQPFTSKLALLGQVFLDSS and and at least 90% homologous to a second amino acid sequence, the first amino acid sequence and a second amino acid sequence is in the order in which adjacent and contiguous, the R38144_PEA_2_P24 It provides isolated chimeric polypeptides that over de.

本発明の好ましい実施形態によれば、R38144_PEA_2_P24の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がREを含み、以下の構造:アミノ酸番号121−x〜121のいずれかから始まり、アミノ酸番号122+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、R38144_PEA_2_P24の縁部分をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding the rim portion of R38144_PEA_2_P24, having a length “n”, wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids in length, preferably at least about 30 amino acids in length, more preferably at least about 40 amino acids in length, most preferably at least about 50 amino acids in length), wherein at least two amino acids comprise RE; A polypeptide having a sequence beginning with any of the numbers 121-x to 121 and ending with the amino acid number 122 + ((n-2) -x), wherein x varies from 0 to n-2. Provided is an isolated chimeric polypeptide encoding the edge portion of R38144_PEA_2_P24, including:

本発明の好ましい実施形態によれば、R38144_PEA_2_P36をコードする単離キメラポリペプチドであって、AAH16184のアミノ酸1〜36に対応し、R38144_PEA_2_P36のアミノ酸1〜36にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P36のアミノ酸37〜60に対応する配列FWGMSQNSKEWLKCSRTAWTLILMを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P36をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding R38144_PEA_2_P36, which corresponds to amino acids 1 to 36 of AAH 16184 and also to amino acids 1 to 36 of R38144_PEA 2 _P36 is at least 90% homologous to MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYR At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably a polypeptide having the first amino acid sequence and the sequence FWGMSQNSKEWLKCSRTAWTLILM corresponding to amino acids 37-60 of R38144_PEA_2_P36 Comprises a second amino acid sequence which is at least 95% homologous, said first amino acid sequence Beauty second amino acid sequence, contiguous and in sequential order, provides an isolated chimeric polypeptide coding R38144_PEA_2_P36.

本発明の好ましい実施形態によれば、R38144_PEA_2_P36のテールをコードする単離ポリペプチドであって、R38144_PEA_2_P36中の配列FWGMSQNSKEWLKCSRTAWTLILMと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P36のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of R38144_PEA_2_P36, which is at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence FWGMSQNSKEWLCCTTAWTLILM in R38144_PEA_2_P36 More preferably, provided is an isolated polypeptide encoding the tail of R38144_PEA_2_P36, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R38144_PEA_2_P36をコードする単離キメラポリペプチドであって、AAQ88943のアミノ酸1〜35に対応し、R38144_PEA_2_P36のアミノ酸1〜35にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P36のアミノ酸36〜60に対応する配列RFWGMSQNSKEWLKCSRTAWTLILMを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P36をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, it is an isolated chimeric polypeptide encoding R38144_PEA_2_P36, which is at least 90% homologous to MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHY which corresponds to amino acids 1 to 35 of AAQ 88943 and also to amino acids 1 to 35 of R38144_PEA_2_P36. At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably a polypeptide having the first amino acid sequence and the sequence RFWGMSQNSKEWLKCSRTAWTLILM corresponding to amino acids 36 to 60 of R38144_PEA_2_P36 Comprises a second amino acid sequence which is at least 95% homologous, said first amino acid sequence Beauty second amino acid sequence, contiguous and in sequential order, provides an isolated chimeric polypeptide coding R38144_PEA_2_P36.

本発明の好ましい実施形態によれば、R38144_PEA_2_P36のテールをコードする単離ポリペプチドであって、R38144_PEA_2_P36中の配列RFWGMSQNSKEWLKCSRTAWTLILMと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P36のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of R38144_PEA_2_P36, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence RFWGMSQ NSKEWLCKCSRTAWTLILM in R38144_PEA_2_P36 More preferably, provided is an isolated polypeptide encoding the tail of R38144_PEA_2_P36, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R38144_PEA_2_P36をコードする単離キメラポリペプチドであって、CT31_HUMANのアミノ酸1〜36に対応し、R38144_PEA_2_P36のアミノ酸1〜36にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P36のアミノ酸37〜60に対応する配列FWGMSQNSKEWLKCSRTAWTLILMを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P36をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, it is an isolated chimeric polypeptide encoding R38144_PEA_2_P36, which is at least 90% homologous to MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYR which corresponds to amino acids 1 to 36 of CT31_HUMAN and also to amino acids 1 to 36 of R38144_PEA_2_P36. At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably a polypeptide having the first amino acid sequence and the sequence FWGMSQNSKEWLKCSRTAWTLILM corresponding to amino acids 37-60 of R38144_PEA_2_P36 Comprises a second amino acid sequence which is at least 95% homologous, said first amino acid sequence And a second amino acid sequence, contiguous and in sequential order, provides an isolated chimeric polypeptide coding R38144_PEA_2_P36.

本発明の好ましい実施形態によれば、R38144_PEA_2_P36のテールをコードする単離ポリペプチドであって、R38144_PEA_2_P36中の配列FWGMSQNSKEWLKCSRTAWTLILMと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P36のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of R38144_PEA_2_P36, which is at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence FWGMSQNSKEWLCCTTAWTLILM in R38144_PEA_2_P36 More preferably, provided is an isolated polypeptide encoding the tail of R38144_PEA_2_P36, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、AA161187_P6をコードする単離キメラポリペプチドであって、AA161187_P6のアミノ酸1〜42に対応するHTREGTLGGQKRAFPDGVEGEKGRGRAWGAASRGSAVPLTIRと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、TEST_HUMANのアミノ酸31〜314に対応し、AA161187_P6のアミノ酸43〜326にも対応するGPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIKEDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIFGDMVCAGNAQGGKDACFGDSGGPLACNKNGLWYQIGVVSWGVGCGRPNRPGVYTNISHHFEWIQKLMAQSGMSQPDPSWPLLFFPLLWALPLLGPVと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、AA161187_P6をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding AA161187_P6, comprising at least 70%, optionally at least 80%, preferably at least 85% HTREGTLGGQKRAFPDGVEGEKGRGRAW assgsaVPLTIR corresponding to amino acids 1-42 of AA161187_P6. %, More preferably at least 90%, most preferably at least 95% corresponding to the first amino acid sequence homologous and at least 95% homologous to amino acids 31 to 314 of TEST_HUMAN and also to amino acids 43 to 326 of AA161187_P6 WSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIKEDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIFGDMVCAGNAQGGKDACFGDSGGPLACNKNGLWYQIGVVSWGVGCGRPNRPGVYTNISHHFEWIQKLMAQSGMSQPDPSWPLLFFPLLWALPLLGPV and and at least 90% homologous to a second amino acid sequence, the first amino acid sequence and a second amino acid sequence, contiguous and in sequential order, the isolated chimeric polypeptide encoding AA161187_P6 I will provide a.

本発明の好ましい実施形態によれば、AA161187_P6の先端をコードする単離ポリペプチドであって、AA161187_P6の配列HTREGTLGGQKRAFPDGVEGEKGRGRAWGAASRGSAVPLTIRと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、AA161187_P6の先端をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tip of AA161187_P6, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence HTREGTLGGQKRAFPDGVEVEGEKGRGRAWGAASRGSAVPLTIR of the AA161187_P6 Provided is an isolated polypeptide encoding the tip of AA161187_P6, which comprises a polypeptide that is preferably at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、AA161187_P13をコードする単離キメラポリペプチドであって、TEST_HUMANのアミノ酸1〜183に対応し、AA161187_P13のアミノ酸1〜183にも対応するMGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIKEDEと少なくとも90%相同な第1のアミノ酸配列と、AA161187_P13のアミノ酸184〜213に対応する配列GSSGRHHKQLYVQPPLPQVQFPQGHLWRHGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、AA161187_P13をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding a JIT, which corresponds to amino acids 1 to 183 of AA_116187_P13 and corresponds to A1 to 183 amino acids of AA161187_P13, also corresponds to A1 to 183 amino acids of AA161187_P13. First amino acid sequence, amino acids 184 to 21 of AA161187_P13 And a second amino acid sequence that is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to the polypeptide having the sequence GSSGRHHKQLYVQPPLPQVQFPQGHLWRHG The present invention provides an isolated chimeric polypeptide encoding AA161187_P13, wherein said first amino acid sequence and said second amino acid sequence are adjacent and in sequential order.

本発明の好ましい実施形態によれば、AA161187_P13のテールをコードする単離ポリペプチドであって、AA161187_P13中の配列GSSGRHHKQLYVQPPLPQVQFPQGHLWRHGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、AA161187_P13のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of AA161187_P13, which is at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence GSSGRHHKQLYVQPPLPQVQFPQGHLWRHG in AA161187_P13 More preferably, an isolated polypeptide encoding the tail of AA161187_P13, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、AA161187_P14をコードする単離キメラポリペプチドであって、TEST_HUMANのアミノ酸1〜183に対応し、AA161187_P14のアミノ酸1〜183にも対応するMGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIKEDEと少なくとも90%相同な第1のアミノ酸配列と、AA161187_P14のアミノ酸184〜307に対応する配列GCCLSPSHYRPHSTAISPHPPGSSGRHHKQLYVQPPLPQVQFPQGHLWRHGLCWQCPRREGCLLRECPCHHSQPRKASCVPVPYLTLMPTPGGGDCCPTLQMQKRRLGCCQGEEEDVHPVYPAPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、AA161187_P14をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, the isolated chimeric polypeptide encoding JIT is a JIG, which corresponds to amino acids 1 to 183 of AA_116187_PHAN and corresponds to A1 to 183 amino acids of AA161187_PHAN. First amino acid sequence and amino acids 184 to 30 of AA161187_P14 The corresponding GCC LSP SHPH P STAH STA I P H S G P R GH Q Q LP Q Q FP Q GH L W RH H GL CW Q C REG C L H CH C Q P PK ASC VP VP LLT LTP TP G G D CC T Q MQEDR HP G C P Q at least 80%, optionally at least 80%, preferably at least 85%. Provided is an isolated chimeric polypeptide encoding AA161187_P14, wherein said first amino acid sequence and said second amino acid sequence are adjacent and in sequential order.

本発明の好ましい実施形態によれば、AA161187_P14のテールをコードする単離ポリペプチドであって、AA161187_P14中の配列GCCLSPSHYRPHSTAISPHPPGSSGRHHKQLYVQPPLPQVQFPQGHLWRHGLCWQCPRREGCLLRECPCHHSQPRKASCVPVPYLTLMPTPGGGDCCPTLQMQKRRLGCCQGEEEDVHPVYPAPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、AA161187_P14のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, the isolated polypeptide encoding the tail of AA161187_P14, which is the tail of AA161187_P14, and which is in the sequence of More preferably, an isolated polypeptide encoding the tail of AA161187_P14, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、AA161187_P18をコードする単離キメラポリペプチドであって、AA161187_P18のアミノ酸1〜42に対応する配列HTREGTLGGQKRAFPDGVEGEKGRGRAWGAASRGSAVPLTIRを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、TEST_HUMANのアミノ酸31〜86に対応し、AA161187_P18のアミノ酸43〜98にも対応するGPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETと少なくとも90%相同な第2のアミノ酸配列と、TEST_HUMANのアミノ酸89〜235に対応し、AA161187_P18のアミノ酸99〜245にも対応するDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIKEDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIFGDMVCAGNAQGGKDACFと少なくとも90%相同な第3のアミノ酸配列と、AA161187_P18のアミノ酸246〜265に対応する配列VSVPATTPSPGKHPVSLCLIを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第4のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、第3のアミノ酸配列、および第4のアミノ酸配列が、隣接し、且つ連続した順序にある、AA161187_P18をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding AA161187_P18, comprising at least 70%, optionally at least 80% of the polypeptide having the sequence HTREGTLGGQKRAFPDGVEGEGEGRGAASRGSAVPLTIR corresponding to amino acids 1-42 of AA161187_P18 GPCGRRVTISRIVGGEDAELGRWPWQGSLLRWDSHVCGVSLLSHRWALTAAHCFET, corresponding to a first amino acid sequence, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous and corresponding to amino acids 31 to 86 of TEST_HUMAN and also to amino acids 43 to 98 of AA161187_P18 And at least 90% DLDPDSGWMVQFGQLTSMPSFLSQA YET, corresponding to amino acids 89 to 235 of the TEST_HUMAN and corresponding to amino acids 99-245 of the AA161187_P18, is equivalent to amino acids 89 to 235 of the TEST_HUMAN, and also corresponds to At least 70%, optionally at least 80%, preferably less, with a polypeptide having the corresponding sequence VSVPATTSPSGKHPVSL CLI Said first amino acid sequence, the second amino acid sequence, the third amino acid sequence, and the fourth amino acid sequence also comprising 85%, more preferably at least 90%, most preferably at least 95% homologous fourth amino acid sequence; The present invention provides an isolated chimeric polypeptide encoding AA161187_P18, wherein the amino acid sequences of SEQ ID NO: are in a contiguous and sequential order.

本発明の好ましい実施形態によれば、AA161187_P18の先端をコードする単離ポリペプチドであって、AA161187_P18の配列HTREGTLGGQKRAFPDGVEGEKGRGRAWGAASRGSAVPLTIRと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、AA161187_P18の先端をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tip of AA161187_P18, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence HTREGTLGGQKRAFPDGVEGEGEGRGAGASRGSAVPLTIR of the AA161187_P18 Provided is an isolated polypeptide encoding the tip of AA161187_P18, which comprises a polypeptide that is preferably at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、AA161187_P18の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がTDを含み、以下の構造:アミノ酸番号98−x〜99のいずれかから始まり、アミノ酸番号99+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、AA161187_P18の縁部分をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding the rim portion of AA161187_P18, having a length "n", wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids in length, preferably at least about 30 amino acids in length, more preferably at least about 40 amino acids in length, most preferably at least about 50 amino acids in length), wherein at least two amino acids comprise TD and have the following structure: A polypeptide having a sequence beginning with any of the numbers 98-x to 99 and ending with the amino acid number 99 + ((n-2) -x), wherein x varies from 0 to n-2. Provided is an isolated chimeric polypeptide encoding the edge portion of AA161187_P18, including.

本発明の好ましい実施形態によれば、AA161187_P18のテールをコードする単離ポリペプチドであって、AA161187_P18中の配列VSVPATTPSPGKHPVSLCLIと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、AA161187_P18のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of AA161187_P18, comprising at least 70%, optionally at least about 80%, preferably at least about 85% of the sequence VSVPATTPSPGKHPVSLCLI in AA161187_P18. Provided is an isolated polypeptide encoding the tail of AA161187_P18, more preferably comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、AA161187_P19をコードする単離キメラポリペプチドであって、TEST_HUMANのアミノ酸1〜183に対応し、AA161187_P19のアミノ酸1〜183にも対応するMGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIKEDEと少なくとも90%相同な第1のアミノ酸配列と、AA161187_P19のアミノ酸184〜188に対応する配列DKRTQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、AA161187_P19をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, the isolated chimeric polypeptide encoding JIT is a JIG, which corresponds to amino acids 1 to 183 of AA_116187_PHAN and also corresponds to amino acids 1 to 183 of AA_161187_PHAN. First amino acid sequence, amino acids 184 to 18 of AA161187_P19 And a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to the polypeptide having the sequence DKRTQ corresponding to Provided is an isolated chimeric polypeptide encoding AA161187_P19, wherein said first amino acid sequence and said second amino acid sequence are adjacent and in sequential order.

本発明の好ましい実施形態によれば、AA161187_P19のテールをコードする単離ポリペプチドであって、AA161187_P19中の配列DKRTQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、AA161187_P19のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of AA161187_P19, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence DKRTQ in AA161187_P19. More preferably, an isolated polypeptide encoding the tail of AA161187_P19, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、Z25299_PEA_2_P2をコードする単離キメラポリペプチドであって、ALK1_HUMANのアミノ酸1〜131に対応し、Z25299_PEA_2_P2のアミノ酸1〜131にも対応するMKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPECQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTRRKPGKCPVTYGQCLMLNPPNFCEMDGQCKRDLKCCMGMCGKSCVSPVKと少なくとも90%相同な第1のアミノ酸配列と、Z25299_PEA_2_P2のアミノ酸132〜139に対応する配列GKQGMRAHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z25299_PEA_2_P2をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, the isolated chimeric polypeptide encoding Z25299_PEA_2_P2, which corresponds to amino acids 1 to 131 of ALK1_HUMAN and also corresponds to amino acids 1 to 131 of Z25299_PEA_2_P2, is MKSSGLFPFLVL LGLTBWEGSQGPLYQPEQGTIJGTCIT GIGTI At least 70%, optionally less, with a polypeptide having the first amino acid sequence and the sequence GKQGMRAH corresponding to amino acids 132-139 of Z25299_PEA_2_P2 Comprising at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95%, of a second amino acid sequence homologous, said first and second amino acid sequences being adjacent and Provided is an isolated chimeric polypeptide encoding Z25299_PEA_2_P2 in sequential order.

本発明の好ましい実施形態によれば、Z25299_PEA_2_P2のテールをコードする単離ポリペプチドであって、Z25299_PEA_2_P2中の配列GKQGMRAHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z25299_PEA_2_P2のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of Z25299_PEA_2_P2, comprising at least 70%, optionally at least about 80%, preferably at least about 85% of the sequence GKQGMRAH in Z25299_PEA_2_P2 More preferably, provided is an isolated polypeptide encoding the tail of Z25299_PEA_2_P2 comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、Z25299_PEA_2_P3をコードする単離キメラポリペプチドであって、ALK1_HUMANのアミノ酸1〜131に対応し、Z25299_PEA_2_P3のアミノ酸1〜131にも対応するMKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPECQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTRRKPGKCPVTYGQCLMLNPPNFCEMDGQCKRDLKCCMGMCGKSCVSPVKと少なくとも90%相同な第1のアミノ酸配列と、Z25299_PEA_2_P3のアミノ酸132〜156に対応する配列GEKRHHKQLRDQEVDPLEMRRHSAGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z25299_PEA_2_P3をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, the isolated chimeric polypeptide encoding Z25299_PEA_2_P3, which corresponds to amino acids 1 to 131 of ALK1_HUMAN and also corresponds to amino acids 1 to 131 of Z25299_PEA_2_P3. Polypeptide having a first amino acid sequence and the sequence GEKRHHKQLRDQEVDPLEMRHSAG corresponding to amino acids 132 to 156 of Z25299_PEA_2_P3 Said first and second amino acids comprising a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous Provided is an isolated chimeric polypeptide encoding Z25299_PEA_2_P3 in a contiguous and sequential order.

本発明の好ましい実施形態によれば、Z25299_PEA_2_P3のテールをコードする単離ポリペプチドであって、Z25299_PEA_2_P3中の配列GEKRHHKQLRDQEVDPLEMRRHSAGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z25299_PEA_2_P3のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of Z25299_PEA_2_P3, which is at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence GEKRHHKQLRDRDEVEVPLPMLRHSAG in Z25299_PEA_2_P3 More preferably, provided is an isolated polypeptide encoding the tail of Z25299_PEA_2_P3 comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、Z25299_PEA_2_P7をコードする単離キメラポリペプチドであって、ALK1_HUMANのアミノ酸1〜81に対応し、Z25299_PEA_2_P7のアミノ酸1〜81にも対応するMKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPECQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPと少なくとも90%相同な第1のアミノ酸配列と、Z25299_PEA_2_P7のアミノ酸82〜89に対応する配列RGSLGSAQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z25299_PEA_2_P7をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding Z25299_PEA_2_P7, which corresponds to amino acids 1 to 81 of ALK1_HUMAN and also to amino acids 1 to 81 of Z25299_PEA_2_P7. The polypeptide having the sequence RGSLGSAQ corresponding to amino acids 82-89 of the first amino acid sequence and Z25299_PEA_2_P7 and at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably Is at least 95% phase And a second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, provides an isolated chimeric polypeptide coding Z25299_PEA_2_P7.

本発明の好ましい実施形態によれば、Z25299_PEA_2_P7のテールをコードする単離ポリペプチドであって、Z25299_PEA_2_P7中の配列RGSLGSAQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z25299_PEA_2_P7のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of Z25299_PEA_2_P7, comprising at least 70%, optionally at least about 80%, preferably at least about 85% of the sequence RGSLGSAQ in Z25299_PEA_2_P7. More preferably, provided is an isolated polypeptide encoding the tail of Z25299_PEA_2_P7, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、Z25299_PEA_2_P10をコードする単離キメラポリペプチドであって、ALK1_HUMANのアミノ酸1〜82に対応し、Z25299_PEA_2_P10のアミノ酸1〜82にも対応するMKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPECQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTと少なくとも90%相同な第1のアミノ酸配列を含む、Z25299_PEA_2_P10をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding Z25299_PEA_2_P10, corresponding to amino acids 1 to 82 of ALK1_HUMAN and also corresponding to amino acids 1 to 82 of Z25299_PEA_2_P10, Provided is an isolated chimeric polypeptide encoding Z25299_PEA_2_P10, comprising a first amino acid sequence.

本発明の好ましい実施形態によれば、R66178_P3をコードする単離キメラポリペプチドであって、PVR1_HUMANのアミノ酸1〜334に対応し、R66178_P3のアミノ酸1〜334にも対応するMARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLHCSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFLRPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWIEGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRNPNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVTIEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTLFFKGPINYSLAGTYICEATNPIGTRSGQVEVNITと少なくとも90%相同な第1のアミノ酸配列と、R66178_P3のアミノ酸335〜354に対応する配列GEGHSLPISPGVLQTQNCGPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R66178_P3をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding R66178_P3, corresponding to amino acids 1-334 of PVR1_HUMAN, corresponding to amino acids 1-334 of R66178_P3 MARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLHCSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFLRPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWIEGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRNPNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRF ESLTLNVQYEPEVTIEGFDGNWYLQRMDV KLTKADANPPATEYHWTTLSLP SKGKGVEAQNRTLFFKGPINYSLAG ITIC ETITGIGS SGQVNVIT The first amino acid sequence which is at least 90% homologous to the amino acid 335-354 of R66178_P3. Comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, the first amino acid sequence and the second amino acid sequence encoding R66178_P3, adjacent and in sequential order Isolated chimeric polypeptide To provide.

本発明の好ましい実施形態によれば、R66178_P3のテールをコードする単離ポリペプチドであって、R66178_P3中の配列GEGHSLPISPGVLQTQNCGPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R66178_P3のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of R66178_P3 and at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence GEGHSLPISPGVLQTQNCGP in R66178_P3. Provided is an isolated polypeptide encoding the tail of R66178_P3, more preferably comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R66178_P4をコードする単離キメラポリペプチドであって、PVR1_HUMANのアミノ酸1〜334に対応し、R66178_P4のアミノ酸1〜334にも対応するMARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLHCSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFLRPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWIEGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRNPNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVTIEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTLFFKGPINYSLAGTYICEATNPIGTRSGQVEVNITと少なくとも90%相同な第1のアミノ酸配列と、R66178_P4のアミノ酸335〜352に対応する配列AFCQLIYPGKGRTRARMFを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R66178_P4をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding R66178_P4, corresponding to amino acids 1-334 of PVR1_HUMAN, corresponding to amino acids 1-334 of R66178_P4 MARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLHCSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFLRPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWIEGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRNPNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRF ESLTLNVQYEPEVTIEGFDGNWYLQRMDV KLTCKADANPPATEYHWTTLSLP SKGKGVEAQNRTLFFKPINYSLAG ITIC ETITGIGSGVEVNIT The first amino acid sequence which is at least 90% homologous to the amino acid 335-352 of R66178_P4. Comprises a second amino acid sequence that is at least 90%, most preferably at least 95% homologous, the first amino acid sequence and the second amino acid sequence encoding R66178_P4, adjacent and in sequential order Isolated chimeric polypeptide Subjected to.

本発明の好ましい実施形態によれば、R66178_P4のテールをコードする単離ポリペプチドであって、R66178_P4中の配列AFCQLIYPGKGRTRARMFと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R66178_P4のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of R66178_P4, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence AFCQLIYPGKGRTRARMF in R66178_P4. Provided is an isolated polypeptide encoding the tail of R66178_P4, more preferably comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R66178_P8をコードする単離キメラポリペプチドであって、PVR1_HUMANのアミノ酸1〜330に対応し、R66178_P8のアミノ酸1〜330にも対応するMARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLHCSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFLRPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWIEGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRNPNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVTIEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTLFFKGPINYSLAGTYICEATNPIGTRSGQVEと少なくとも90%相同な第1のアミノ酸配列と、R66178_P8のアミノ酸331〜363に対応する配列NSPTPRLLPNMGGAPGRCPRPSLGAWRGASCWCを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R66178_P8をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding R66178_P8, corresponding to amino acids 1-330 of PVR1_HUMAN, corresponding to amino acids 1-330 of R66178_P8 MARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLHCSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFLRPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWIEGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRNPNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRF ESLTLNVQYEPEVTIEGFDGNWYLKTRMADANPPATEYHWT LSHSLPGKGVEAQNRTLFFKGPINYSLAG ITIC ETIIGTGSQQVE The first amino acid sequence which is at least 90% homologous to the amino acid 331 to 333 of R66178_P8 and the NSCTPRLNMGMGGRCPRPGAG Comprises R66178_P8, comprising a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first amino acid sequence and the second amino acid sequence being adjacent and in a consecutive order single It provides a chimeric polypeptide.

本発明の好ましい実施形態によれば、R66178_P8のテールをコードする単離ポリペプチドであって、R66178_P8中の配列NSPTPRLLPNMGGAPGRCPRPSLGAWRGASCWCと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R66178_P8のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of R66178_P8, which is at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence NSPTPRLLPNMGGAPGRCPRPSLGAWRGASCWC in R66178_P8. Provided is an isolated polypeptide encoding the tail of R66178_P8, which more preferably comprises a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、HSU33147_PEA_1_P5をコードする単離キメラポリペプチドであって、MGBA_HUMANのアミノ酸1〜78に対応し、HSU33147_PEA_1_P5のアミノ酸1〜78にも対応するMKLLMVLMLAALSQHCYAGSGCPLLENVISKTINPQVSKTEYKELLQEFIDDNATTNAIDELKECFLNQTDETLSNVEと少なくとも90%相同な第1のアミノ酸配列と、MGBA_HUMANのアミノ酸82〜93に対応し、HSU33147_PEA_1_P5のアミノ酸79〜90にも対応するQLIYDSSLCDLFと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HSU33147_PEA_1_P5をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding HSU33147_PEA_1_P5, which corresponds to amino acids 1 to 78 of MGBA_HUMAN and also to amino acids 1 to 78 of HSU33147_PEA_1_P5, is MKLLMVLMLAALSQ HC YAGGSGCPLLENVISKTINPQ VSKTEOKELL QEFIDDNATTN A first amino acid sequence, and a second amino acid sequence corresponding to amino acids 82 to 93 of MGBA_HUMAN and also corresponding to amino acids 79 to 90 of HSU33147_PEA_1_P5 and QLIYDSSLCDLF at least 90% homologous to the first amino acid sequence; The second amino acid sequence is Adjacent, and in sequential order, it provides an isolated chimeric polypeptide coding HSU33147_PEA_1_P5.

本発明の好ましい実施形態によれば、HSU33147_PEA_1_P5の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がEQを含み、以下の構造:アミノ酸番号78−x〜78のいずれかから始まり、アミノ酸番号79+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HSU33147_PEA_1_P5の縁部分をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding the edge portion of HSU33147_PEA_1_P5, having a length “n”, where n is at least about 10 amino acids long, optionally at least about 20 amino acids in length, preferably at least about 30 amino acids in length, more preferably at least about 40 amino acids in length, most preferably at least about 50 amino acids in length), wherein at least two amino acids comprise EQ and have the following structure: A polypeptide having a sequence beginning with any of the numbers 78-x to 78 and ending with the amino acid number 79 + ((n-2) -x), wherein x varies from 0 to n-2. Provided is an isolated chimeric polypeptide encoding the edge portion of HSU33147_PEA_1_P5, including:

本発明の好ましい実施形態によれば、HSU33147_PEA_1_P5をコードする単離キメラポリペプチドであって、MGBA_HUMANのアミノ酸1〜78に対応し、HSU33147_PEA_1_P5のアミノ酸1〜78にも対応するMKLLMVLMLAALSQHCYAGSGCPLLENVISKTINPQVSKTEYKELLQEFIDDNATTNAIDELKECFLNQTDETLSNVEと少なくとも90%相同な第1のアミノ酸配列と、MGBA_HUMANのアミノ酸82〜93に対応し、HSU33147_PEA_1_P5のアミノ酸79〜90にも対応するQLIYDSSLCDLFと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HSU33147_PEA_1_P5をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding HSU33147_PEA_1_P5, which corresponds to amino acids 1 to 78 of MGBA_HUMAN and also to amino acids 1 to 78 of HSU33147_PEA_1_P5, is MKLLMVLMLAALSQ HC YAGGSGCPLLENVISKTINPQ VSKTEOKELL QEFIDDNATTN A first amino acid sequence, and a second amino acid sequence corresponding to amino acids 82 to 93 of MGBA_HUMAN and also corresponding to amino acids 79 to 90 of HSU33147_PEA_1_P5 and QLIYDSSLCDLF at least 90% homologous to the first amino acid sequence; The second amino acid sequence is Adjacent, and in sequential order, it provides an isolated chimeric polypeptide coding HSU33147_PEA_1_P5.

本発明の好ましい実施形態によれば、HSU33147_PEA_1_P5の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がEQを含み、以下の構造:アミノ酸番号78−x〜78のいずれかから始まり、アミノ酸番号79+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HSU33147_PEA_1_P5の縁部分をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding the edge portion of HSU33147_PEA_1_P5, having a length “n”, where n is at least about 10 amino acids long, optionally at least about 20 amino acids in length, preferably at least about 30 amino acids in length, more preferably at least about 40 amino acids in length, most preferably at least about 50 amino acids in length), wherein at least two amino acids comprise EQ and have the following structure: A polypeptide having a sequence beginning with any of the numbers 78-x to 78 and ending with the amino acid number 79 + ((n-2) -x), wherein x varies from 0 to n-2. Provided is an isolated chimeric polypeptide encoding the edge portion of HSU33147_PEA_1_P5, including:

本発明の好ましい実施形態によれば、M78076_PEA_1_P3をコードする単離キメラポリペプチドであって、APP1_HUMANのアミノ酸1〜517に対応し、M78076_PEA_1_P3のアミノ酸1〜517にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P3のアミノ酸518〜519に対応する配列GEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P3をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding M78076_PEA_1_P3, corresponding to amino acids 1-517 of APP1_HUMAN, corresponding to amino acids 1-517 of M78076_PEA_1_P3 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAV A first amino acid sequence at least 90% homologous to DiPiesutiaruesudaburyuPiPijiesuarubuiijieiidiiiiiiesuefuPikyuPibuididiwaiefubuiiPiPikyueiiiiiitibuiPipipiesuesueichitierueibuibuijikeibuitiPitiPiaruPitidijibuidiaiwaiefujiemuPijiiaiesuieichiijiefueruarueikeiemudieruiiaruaruemuarukyuaienuibuiemuaruidaburyueiemueidienukyuesukeienueruPikeieidiarukyueieruenuieichiefukyuesuaierukyutieruiikyubuiesujiiarukyuaruerubuiitieichieitiarubuiaieieruaienudikyuaruarueieieruijiefuerueieierukyueidiPiPikyueiiarubuieruerueieruaruaruwaieruarueiikyukeiikyuarueichitieruarueichiwaikyueichibuieieibuidiPiikeieikyukyuemuaruefukyubuieichitieichierukyubuiaiiiarubuienukyuesuerujieruerudikyuenuPieichierueikyuieruaruPikyuaikyuieruerueichiesuieichieruJipiSELEAPAPGGSSEDKGGLQPPDSKD, the M78076_PEA_1_P3 A second, at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to a polypeptide having the sequence GE corresponding to minonic acid 518-519. And an isolated chimeric polypeptide encoding M78076_PEA_1_P3 in which the first and second amino acid sequences are adjacent and in sequential order.

本発明の好ましい実施形態によれば、M78076_PEA_1_P4をコードする単離キメラポリペプチドであって、APP1_HUMANのアミノ酸1〜526に対応し、M78076_PEA_1_P4のアミノ酸1〜526にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P4のアミノ酸527〜541に対応する配列ECLTVNPSLQIPLNPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P4をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding M78076_PEA_1_P4, corresponding to amino acids 1-526 of APP1_HUMAN, corresponding to amino acids 1-526 of M78076_PEA_1_P4 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAV The first amino acid sequence at least 90% homologous to DPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKG, M78076_ A polypeptide having at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homology to the polypeptide having the sequence ECLTVNPSLQIPLNP corresponding to amino acids 527 to 541 of EA_1_P4 An isolated chimeric polypeptide encoding M78076_PEA_1_P4, comprising two amino acid sequences, wherein said first and second amino acid sequences are adjacent and in sequential order.

本発明の好ましい実施形態によれば、M78076_PEA_1_P4のテールをコードする単離ポリペプチドであって、M78076_PEA_1_P4中の配列ECLTVNPSLQIPLNPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M78076_PEA_1_P4のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of M78076_PEA_1_P4, comprising at least 70%, optionally at least about 80%, preferably at least about 85% of the sequence ECLTVNPSLQIPLNP in M78076_PEA_1_P4. More preferably, provided is an isolated polypeptide encoding the tail of M78076_PEA_1_P4, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、M78076_PEA_1_P12をコードする単離キメラポリペプチドであって、APP1_HUMANのアミノ酸1〜526に対応し、M78076_PEA_1_P12のアミノ酸1〜526にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P12のアミノ酸527〜544に対応する配列ECVCSKGFPFPLIGDSEGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P12をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding M78076_PEA_1_P12, corresponding to amino acids 1-526 of APP1_HUMAN, corresponding to amino acids 1-526 of M78076_PEA_1_P12 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGT The first amino acid sequence at least 90% homologous to VGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKG, M7807 A polypeptide having the sequence ECVCSKGFPFPLIGDSEG corresponding to amino acids 527 to 544 of PEA_1_P12 at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous An isolated chimeric polypeptide encoding M78076_PEA_1_P12, comprising two amino acid sequences, wherein said first and second amino acid sequences are adjacent and in sequential order.

本発明の好ましい実施形態によれば、M78076_PEA_1_P12のテールをコードする単離ポリペプチドであって、M78076_PEA_1_P12中の配列ECVCSKGFPFPLIGDSEGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M78076_PEA_1_P12のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of M78076_PEA_1_P12, comprising at least 70%, optionally at least about 80%, preferably at least about 85% of the sequence ECVCSKGFPFPLIGDSEG in M78076_PEA_1_P12. More preferably, provided is an isolated polypeptide encoding the tail of M78076_PEA_1_P12, comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、M78076_PEA_1_P14をコードする単離キメラポリペプチドであって、APP1_HUMANのアミノ酸1〜570に対応し、M78076_PEA_1_P14のアミノ酸1〜570にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKVNASVPRGFPFHSSEIQRDELと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P14のアミノ酸571〜619に対応する配列VRGGTAGYLGEETRGQRPGCDSQSHTGPSKKPSAPSPLPAGTSWDRGVPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P14をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding M78076_PEA_1_P14, corresponding to amino acids 1-570 of APP1_HUMAN, corresponding to amino acids 1-570 of M78076_PEA_1_P14 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGT VGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKVNASV At least 70%, optionally at least 80%, preferably at least 85%, more preferably a first amino acid sequence at least 90% homologous to RGFPFHSEIQRDEL and a polypeptide having the sequence VRGGTAGYLGEETRGQQRPGCDSQSHTGPSKKPSAPSPLPAGTSWDRGVP corresponding to amino acids 571-619 of M78076_PEA_1_P14 Comprises M78076_PEA_1_P14, comprising a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first and second amino acid sequences being adjacent and in sequential order An isolated chimeric polypeptide is provided.

本発明の好ましい実施形態によれば、M78076_PEA_1_P14のテールをコードする単離ポリペプチドであって、M78076_PEA_1_P14中の配列VRGGTAGYLGEETRGQRPGCDSQSHTGPSKKPSAPSPLPAGTSWDRGVPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M78076_PEA_1_P14のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of M78076_PEA_1_P14, comprising at least 70%, optionally at least about 80%, preferably at least about 85% of the sequence VRGGTAGYLGEETRGQRPGCDCSQSHTGPSKKPSAPSPLPAGTSWDRGVP in M78076_PEA_1_P14 More preferably, provided is an isolated polypeptide encoding the tail of M78076_PEA_1_P14, comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、M78076_PEA_1_P21をコードする単離キメラポリペプチドであって、APP1_HUMANのアミノ酸1〜352に対応し、M78076_PEA_1_P21のアミノ酸1〜352にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEと少なくとも90%相同な第1のアミノ酸配列と、APP1_HUMANのアミノ酸406〜650に対応し、M78076_PEA_1_P21のアミノ酸353〜597にも対応するAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKVNASVPRGFPFHSSEIQRDELAPAGTGVSREAVSGLLIMGAGGGSLIVLSMLLLRRKKPYGAISHGVVEVDPMLTLEEQQLRELQRHGYENPTYRFLEERPと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P21をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding M78076_PEA_1_P21, corresponding to amino acids 1-352 of APP1_HUMAN, corresponding to amino acids 1-352 of M78076_PEA_1_P21 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGT The first amino acid sequence at least 90% homologous to BuijidiPiesutiaruesudaburyuPiPijiesuarubuiijieiidiiiiiiesuefuPikyuPibuididiwaiefubuiiPiPikyueiiiiiitibuiPipipiesuesueichitierueibuibuijikeibuitiPitiPiaruPitidijibuidiaiwaiefujiemuPijiiaiesuieichiijiefueruarueikeiemudieruiiaruaruemuarukyuaienuiVMREWAMADNQSKNLPKADRQALNE, corresponding to amino acids 406-650 of APP1_HUMAN, corresponding to amino acids 353-597 of M78076_PEA_1_P21 AERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTL A first amino acid sequence and a second amino acid sequence containing at least a 90% homology with a second amino acid sequence, and an N-terminal peptide chain, and provide.

本発明の好ましい実施形態によれば、M78076_PEA_1_P21の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がEAを含み、以下の構造:アミノ酸番号352−x〜352のいずれかから始まり、アミノ酸番号353+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、M78076_PEA_1_P21の縁部分をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding the rim portion of M78076_PEA_1_P21, having a length “n”, wherein n is at least about 10 amino acids in length, optionally at least about at least about 20 amino acids in length, preferably at least about 30 amino acids in length, more preferably at least about 40 amino acids in length, most preferably at least about 50 amino acids in length), wherein at least two amino acids comprise EA; A polypeptide having a sequence beginning at any of the numbers 352-x to 352 and ending at the amino acid number 353 + ((n-2) -x), wherein x varies from 0 to n-2 Provided is an isolated chimeric polypeptide encoding an edge portion of M78076_PEA_1_P21, including:

本発明の好ましい実施形態によれば、M78076_PEA_1_P24をコードする単離キメラポリペプチドであって、APP1_HUMANのアミノ酸1〜481に対応し、M78076_PEA_1_P24のアミノ酸1〜481にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P24のアミノ酸482〜498に対応する配列RECLLPWLPLQISEGRSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P24をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding M78076_PEA_1_P24, corresponding to amino acids 1-481 of APP1_HUMAN, corresponding to amino acids 1-481 of M78076_PEA_1_P24 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGT The first amino acid sequence at least 90% homologous to BuijidiPiesutiaruesudaburyuPiPijiesuarubuiijieiidiiiiiiesuefuPikyuPibuididiwaiefubuiiPiPikyueiiiiiitibuiPipipiesuesueichitierueibuibuijikeibuitiPitiPiaruPitidijibuidiaiwaiefujiemuPijiiaiesuieichiijiefueruarueikeiemudieruiiaruaruemuarukyuaienuibuiemuaruidaburyueiemueidienukyuesukeienueruPikeieidiarukyueieruenuieichiefukyuesuaierukyutieruiikyubuiesujiiarukyuaruerubuiitieichieitiarubuiaieieruaienudikyuaruarueieieruijiefuerueieierukyueidiPiPikyueiiarubuieruerueieruaruaruwaieruarueiikyukeiikyuarueichitieruarueichiwaikyueichibuieieibuidiPiikeieikyukyuemuaruefukyubuieichitieichierukyubuiaiEERVNQSLGLLDQNPHLAQELRPQI, sequence RECLLPWLPLQISEG corresponding to amino acids 482-498 of M78076_PEA_1_P24 A polypeptide comprising S and a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; Provided is an isolated chimeric polypeptide encoding M78076_PEA_1_P24, wherein the amino acid sequence of 1 and the second amino acid sequence are adjacent and in sequential order.

本発明の好ましい実施形態によれば、M78076_PEA_1_P24のテールをコードする単離ポリペプチドであって、M78076_PEA_1_P24中の配列RECLLPWLPLQISEGRSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M78076_PEA_1_P24のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of M78076_PEA_1_P24, comprising at least 70%, optionally at least about 80%, preferably at least about 85% of the sequence RECLLPWLPLQISEGRS in M78076_PEA_1_P24. More preferably, provided is an isolated polypeptide encoding the tail of M78076_PEA_1_P24, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、M78076_PEA_1_P2をコードする単離キメラポリペプチドであって、APP1_HUMANのアミノ酸1〜449に対応し、M78076_PEA_1_P2のアミノ酸1〜449にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P2のアミノ酸450〜588に対応する配列LTSFQLPNAPLFLRRPRLRLFSCPLDPLSVSWTPSYPLNTASLPLPSLSAQLPDPETWTLTCCVFDPCFLALGFLLPPPSILCSVPWIFTAFPRIVFFFFFFLRQVLALSPRQESSVRSWLIATSTSWVQAILLPQPLEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P2をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding M78076_PEA_1_P2, corresponding to amino acids 1-449 of APP1_HUMAN, corresponding to amino acids 1-449 of M78076_PEA_1_P2 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAV The first amino acid sequence at least 90% homologous to DiPiesutiaruesudaburyuPiPijiesuarubuiijieiidiiiiiiesuefuPikyuPibuididiwaiefubuiiPiPikyueiiiiiitibuiPipipiesuesueichitierueibuibuijikeibuitiPitiPiaruPitidijibuidiaiwaiefujiemuPijiiaiesuieichiijiefueruarueikeiemudieruiiaruaruemuarukyuaienuibuiemuaruidaburyueiemueidienukyuesukeienueruPikeieidiarukyueieruenuieichiefukyuesuaierukyutieruiikyubuiesujiiarukyuaruerubuiitieichieitiarubuiaieieruaienudikyuaruarueieieruijiefuerueieierukyueidiPiPikyueiiarubuieruerueieruaruaruwaieruarueiikyukeiikyuRHTLRHYQHVAAVDPEKAQQMRFQV, sequence LTSFQLPNAPLFLRRPRLRLFSCPLDPLSVSWTPSYPLNTASLPLPSLSA corresponding to amino acids 450-588 of M78076_PEA_1_P2 LPDPETWTLTCCVFDPCFLALGF LLPLPPPSILSCPWIFTAFPRIVFFFFFFLRQVLALSPRQESSVRSWLIATSTSWVQAILLPQPLE and containing a second amino acid sequence at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to the second amino acid sequence; Provided is an isolated chimeric polypeptide encoding M78076_PEA_1_P2 in which the amino acid sequence of 1 and the second amino acid sequence are adjacent and in sequential order.

本発明の好ましい実施形態によれば、M78076_PEA_1_P2のテールをコードする単離ポリペプチドであって、M78076_PEA_1_P2中の配列LTSFQLPNAPLFLRRPRLRLFSCPLDPLSVSWTPSYPLNTASLPLPSLSAQLPDPETWTLTCCVFDPCFLALGFLLPPPSILCSVPWIFTAFPRIVFFFFFFLRQVLALSPRQESSVRSWLIATSTSWVQAILLPQPLEと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M78076_PEA_1_P2のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of M78076_PEA_1_P2 comprising the following in the sequence L78076_PEA_1_P2: More preferably, an isolated polypeptide encoding the tail of M78076_PEA_1_P2 comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous To provide.

本発明の好ましい実施形態によれば、M78076_PEA_1_P25をコードする単離キメラポリペプチドであって、APP1_HUMANのアミノ酸1〜448に対応し、M78076_PEA_1_P25のアミノ酸1〜448にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P25のアミノ酸449〜505に対応する配列PQNPNSQPRAAGSLEVIISHPFVRRLEILISPFQFQNSIPKNSQIVPAASPRGTSSPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P25をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding M78076_PEA_1_P25, corresponding to amino acids 1-448 of APP1_HUMAN, corresponding to amino acids 1-448 of M78076_PEA_1_P25 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGT The first amino acid sequence at least 90% homologous to BuijidiPiesutiaruesudaburyuPiPijiesuarubuiijieiidiiiiiiesuefuPikyuPibuididiwaiefubuiiPiPikyueiiiiiitibuiPipipiesuesueichitierueibuibuijikeibuitiPitiPiaruPitidijibuidiaiwaiefujiemuPijiiaiesuieichiijiefueruarueikeiemudieruiiaruaruemuarukyuaienuibuiemuaruidaburyueiemueidienukyuesukeienueruPikeieidiarukyueieruenuieichiefukyuesuaierukyutieruiikyubuiesujiiarukyuaruerubuiitieichieitiarubuiaieieruaienudikyuaruarueieieruijiefuerueieierukyueidiPiPikyueiiarubuieruerueieruaruaruwaieruarueiikyukeiiQRHTLRHYQHVAAVDPEKAQQMRFQ, sequence PQNPNSQPRAAGSLEVIISHPFVRRLEILISPFQFQNSIPKNSQIVPA corresponding to amino acids 449-505 of M78076_PEA_1_P25 Said polypeptide comprising a polypeptide having SPRGTSSP and a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; Provided is an isolated chimeric polypeptide encoding M78076_PEA_1_P25, wherein the amino acid sequence of 1 and the second amino acid sequence are adjacent and in sequential order.

本発明の好ましい実施形態によれば、M78076_PEA_1_P25のテールをコードする単離ポリペプチドであって、M78076_PEA_1_P25中の配列PQNPNSQPRAAGSLEVIISHPFVRRLEILISPFQFQNSIPKNSQIVPAASPRGTSSPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M78076_PEA_1_P25のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of M78076_PEA_1_P25, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence PQNNPSTQPRAAGSLEVIISHPFVRRLEILISPFQFQNSIPKNSQIVPAASPRTSSP in M78076_PEA_1_P25 More preferably, provided is an isolated polypeptide encoding the tail of M78076_PEA_1_P25, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、M79217_PEA_1_P1をコードする単離キメラポリペプチドであって、BAA25445のアミノ酸13〜931に対応し、M79217_PEA_1_P1のアミノ酸1〜919にも対応するMTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYYLTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKRQELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQPKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYDSDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVVLRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQSTFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKIESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTCKNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATRLFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSLSDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAAAEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDFYRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEFQAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPKLPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLRHDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHKYYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIKVTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVDSVLFKTRLPHDKTKCFKFIと少なくとも90%相同な第1のアミノ酸配列を含む、M79217_PEA_1_P1をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding M79217_PEA_1_P1, corresponds to amino acids 13-931 of BAA25445, corresponding to amino acids 1-919 of M79217_PEA_1_P1 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYYLTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKRQELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQPKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYDSDQFVFGSYLDPLVKQAFQATARA VYVTENADIACLYVILVGEMQEPVVLRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQSTFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKIESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTCKNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATRLFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSLSDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAAAEIPHRS KAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDFYRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEFQAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPKLPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLRHDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHKYYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIKVTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMP Provided is an isolated chimeric polypeptide encoding M79217_PEA_1_P1, comprising a first amino acid sequence that is at least 90% homologous to LLYTQFRVDSVLFKTRLPHDKTKCFKFI.

本発明の好ましい実施形態によれば、M79217_PEA_1_P2をコードする単離キメラポリペプチドであって、EXL3_HUMANのアミノ酸1〜807に対応し、M79217_PEA_1_P2のアミノ酸1〜807にも対応するMTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYYLTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKRQELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQPKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYDSDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVVLRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQSTFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKIESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTCKNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATRLFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSLSDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAAAEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDFYRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEFQAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPKLPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLRHDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHKと少なくとも90%相同な第1のアミノ酸配列と、EXL3_HUMANのアミノ酸820〜919に対応し、M79217_PEA_1_P2のアミノ酸808〜907にも対応するAIRDMVDEYINCEDIAMNFLVSHITRKPPIKVTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVDSVLFKTRLPHDKTKCFKFIと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M79217_PEA_1_P2をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding M79217_PEA_1_P2, corresponding to amino acids 1-807 of EXL3_HUMAN, corresponding to amino acids 1-807 of M79217_PEA_1_P2 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYYLTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKRQELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQPKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYDSDQFVFGSYLDPLVKQAFQATAR NVYVTENADIACLYVILVGEMQEPVVLRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQSTFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKIESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTCKNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATRLFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSLSDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAAAEIPHR The first amino acid sequence at least 90% homologous to JikeieieijitidiPienuemueidienujidierudieruJipibuiitiiPiPiwaiEiesupiaruwaieruaruenuefutierutibuitidiefuwaiaruesudaburyuenushieiPiJipiefueichieruefuPieichitiPiefudiPibuieruPiesuieikeiefuerujiesujitijiefuaruPiaijijijieijijiesujikeiiefukyueieierujijienubuiPiaruikyuefutibuibuiemuerutiwaiiaruiibuieruemuenuesueruiarueruenujieruPiwaieruenukeibuibuibuibuidaburyuenuesuPikeieruPiesuidieruerudaburyuPidiaijibuiPiaiemubuibuiarutiikeienuesueruenuenuaruefueruPidaburyuenuiaiitiieiaieruesuaidididieieichieruarueichidiiaiemuefujiefuarubuidaburyuaruieiarudiaruaibuijiefuPijiaruwaieichieidaburyudiaipehaQSWLYNSNYSCELSMVLTGAAFFHK, corresponding to amino acids 820-919 of EXL3_HUMAN, corresponding to amino acids 808-907 of M79217_PEA_1_P2 A second amino acid sequence that is at least 90% homologous to the second amino acid sequence and at least 90% homologous to the second amino acid sequence, and the first and second amino acid sequences are adjacent and continuous. provide.

本発明の好ましい実施形態によれば、M79217_PEA_1_P2の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がKAを含み、以下の構造:アミノ酸番号807−x〜807のいずれかから始まり、アミノ酸番号808+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、M79217_PEA_1_P2の縁部分をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding the edge portion of M79217_PEA_1_P2, having a length “n”, where n is at least about 10 amino acids long, optionally at least about 20 amino acids in length, preferably at least about 30 amino acids in length, more preferably at least about 40 amino acids in length, most preferably at least about 50 amino acids in length), wherein at least two amino acids comprise KA and have the following structure: A polypeptide having a sequence beginning with any of the numbers 807-x to 807 and ending at the amino acid number 808 + ((n-2) -x), where x varies from 0 to n-2. Provided is an isolated chimeric polypeptide encoding the edge portion of M79217_PEA_1_P2, including:

本発明の好ましい実施形態によれば、M79217_PEA_1_P4をコードする単離キメラポリペプチドであって、M79217_PEA_1_P4のアミノ酸1〜51に対応する配列PELRQPARLGLPECWDYRHEPRCPAQMGSHFIVQAGLKLLASSKPPKCWDYを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、EXL3_HUMANのアミノ酸759〜919に対応し、M79217_PEA_1_P4のアミノ酸52〜212にも対応するRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHKYYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIKVTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVDSVLFKTRLPHDKTKCFKFIと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M79217_PEA_1_P4をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding M79217_PEA_1_P4, comprising at least 70%, optionally at least 80%, of a polypeptide having the sequence PELRQPARLGPECWDWDHERHEPRCPAQMGSHFIVQLAGLSK SK PK PKCWDY corresponding to amino acids 1 to 51 of M79217_PEA_1_P4 RVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGA corresponding to the first amino acid sequence, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous and corresponding to amino acids 759 to 919 of EXL3_HUMAN and also to amino acids 52 to 212 of M79217_PEA_1_P4 FFHKYYALYLYSYVMPQAIRDMVDEYINCDIAMNFLVSHITRKPPIKVTSRWTFRCPGQALSHDDSHHFHERHKCINFFVKVYVYPGYMLYTQFRVDSVLFKTRLPHDKTKKKFI containing a second amino acid sequence and at least one of the first and second amino acid sequences, and the corresponding ones, and the corresponding ones provide.

本発明の好ましい実施形態によれば、M79217_PEA_1_P4の先端をコードする単離ポリペプチドであって、M79217_PEA_1_P4の配列PELRQPARLGLPECWDYRHEPRCPAQMGSHFIVQAGLKLLASSKPPKCWDYと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M79217_PEA_1_P4の先端をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tip of M79217_PEA_1_P4, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence PELRQPARLGPLECPEDW Provided is an isolated polypeptide encoding the tip of M79217_PEA_1_P4, which preferably comprises a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、M79217_PEA_1_P8をコードする単離キメラポリペプチドであって、EXL3_HUMANのアミノ酸1〜807に対応し、M79217_PEA_1_P8のアミノ酸1〜807にも対応するMTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYYLTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKRQELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQPKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYDSDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVVLRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQSTFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKIESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTCKNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATRLFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSLSDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAAAEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDFYRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEFQAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPKLPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLRHDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHKと少なくとも90%相同な第1のアミノ酸配列と、M79217_PEA_1_P8のアミノ酸808〜812に対応する配列VRKSWを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M79217_PEA_1_P8をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding M79217_PEA_1_P8, corresponding to amino acids 1-807 of EXL3_HUMAN, corresponding to amino acids 1-807 of M79217_PEA_1_P8 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYYLTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKRQELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQPKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYDSDQFVFGSYLDPLVKQAFQATAR NVYVTENADIACLYVILVGEMQEPVVLRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQSTFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKIESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTCKNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATRLFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSLSDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAAAEIPHR GKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDFYRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEFQAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPKLPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLRHDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHK at least 90% homologous with the same a first amino acid sequence, a polypeptide at least 70% with a sequence corresponding to VRKSW to amino acid 808-812 of M79217_PEA_1_P8, Ren Said first amino acid sequence and said second amino acid sequence comprising a second amino acid sequence, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous. Provides an isolated chimeric polypeptide encoding M79217_PEA_1_P8, in contiguous and sequential order.

本発明の好ましい実施形態によれば、M79217_PEA_1_P8のテールをコードする単離ポリペプチドであって、M79217_PEA_1_P8中の配列VRKSWと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M79217_PEA_1_P8のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of M79217_PEA_1_P8, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence VRKSW in M79217_PEA_1_P8 More preferably, provided is an isolated polypeptide encoding the tail of M79217_PEA_1_P8, comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、M62096_PEA_1_P4をコードする単離キメラポリペプチドであって、M62096_PEA_1_P4のアミノ酸1〜6に対応する配列MATYIHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、KF5C_HUMANのアミノ酸239〜957に対応し、M62096_PEA_1_P4のアミノ酸7〜725にも対応するVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQKと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P4をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding M62096_PEA_1_P4 comprising at least 70%, optionally at least 80% of a polypeptide having the sequence MATYIH corresponding to amino acids 1 to 6 of M62096_PEA_1_P4. VSKTGAEGLSNAGSLEKTHTHVP YRDSKMTRILQGLSGTIEGTICTITGITCITGITCITGIV VSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQD LSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQK and and at least 90% homologous to a second amino acid sequence, Oyo said first amino acid sequence The present invention provides an isolated chimeric polypeptide encoding M62096_PEA_1_P4, wherein the second amino acid sequence is in a contiguous and sequential order.

本発明の好ましい実施形態によれば、M62096_PEA_1_P4の先端をコードする単離ポリペプチドであって、M62096_PEA_1_P4の配列MATYIHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M62096_PEA_1_P4の先端をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tip of M62096_PEA_1_P4, which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably with the sequence MATYIH of M62096_PEA_1_P4 Provided is an isolated polypeptide encoding the tip of M62096_PEA_1_P4, which preferably comprises a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、M62096_PEA_1_P5をコードする単離キメラポリペプチドであって、KF5C_HUMANのアミノ酸284〜957に対応し、M62096_PEA_1_P5のアミノ酸1〜674にも対応するMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQKと少なくとも90%相同な第1のアミノ酸配列を含む、M62096_PEA_1_P5をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding M62096_PEA_1_P5, corresponding to amino acids 284-957 of KF5C_HUMAN, corresponding to amino acids 1-674 of M62096_PEA_1_P5 MTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQE EDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFL NNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQK and containing at least 90% homologous first amino acid sequence, provides an isolated chimeric polypeptide coding M62096_PEA_1_P5.

本発明の好ましい実施形態によれば、M62096_PEA_1_P3をコードする単離キメラポリペプチドであって、KF5C_HUMANのアミノ酸365〜957に対応し、M62096_PEA_1_P3のアミノ酸1〜593にも対応するMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQKと少なくとも90%相同な第1のアミノ酸配列を含む、M62096_PEA_1_P3をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding M62096_PEA_1_P3, corresponding to amino acids 365-957 of KF5C_HUMAN, corresponding to amino acids 1-593 of M62096_PEA_1_P3 MELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFT ARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAH AQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQK and containing at least 90% homologous first amino acid sequence, provides an isolated chimeric polypeptide coding M62096_PEA_1_P3.

本発明の好ましい実施形態によれば、M62096_PEA_1_P7をコードする単離キメラポリペプチドであって、M62096_PEA_1_P7のアミノ酸1〜19に対応する配列MTQNFRLMWNILLFPLNFSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、KF5C_HUMANのアミノ酸738〜957に対応し、M62096_PEA_1_P7のアミノ酸20〜239にも対応するLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQKと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P7をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding M62096_PEA_1_P7, comprising a polypeptide having the sequence MTQNFRLMWNILLFPLNFS corresponding to amino acids 1-19 of M62096_PEA_1_P7, at least 70%, optionally at least 80% LNQKLQLEQELLSLL YDLKLELDLKLDL KLDAREGLKGLEETV SQ LQQ L And at least 90% at the end, it is at the same timing as the G77 and it is the N-SIP and the APIP) and it is the NIP API ... and the YTIP is the NIPIPIP ... which it is the G ... provide.

本発明の好ましい実施形態によれば、M62096_PEA_1_P7の先端をコードする単離ポリペプチドであって、M62096_PEA_1_P7の配列MTQNFRLMWNILLFPLNFSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M62096_PEA_1_P7の先端をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tip of M62096_PEA_1_P7, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence MTQNFRLMWNILLFPLNFS of M62096_PEA_1_P7 Provided is an isolated polypeptide encoding the tip of M62096_PEA_1_P7, preferably comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、M62096_PEA_1_P8をコードする単離キメラポリペプチドであって、KF5C_HUMANのアミノ酸1〜736に対応し、M62096_PEA_1_P8のアミノ酸1〜736にも対応するMADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFDRVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLHDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNEHSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRと少なくとも90%相同な第1のアミノ酸配列と、M62096_PEA_1_P8のアミノ酸737〜737に対応する配列Eを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P8をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding M62096_PEA_1_P8, corresponding to amino acids 1-736 of KF5C_HUMAN, corresponding to amino acids 1-736 of M62096_PEA_1_P8 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFDRVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLHDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNEHSSRSHSIFLINIKQENVETEKK SGKLYLVDLAGSEKVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLK If the following elements are only required to be a part, but not limited to a member of a member of a member of a member, a member of a member of a member, a member of a member, a member of a member, only a member of a member of a s, b, ss, e, ss, e, ses, rela ,,,,,,,,,,,,,,,,,,,,,,,,,,,,, only sss. Preferably comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous An isolated chimeric polypeptide encoding M62096_PEA_1_P8, wherein the first and second amino acid sequences are adjacent and in sequential order.

本発明の好ましい実施形態によれば、M62096_PEA_1_P9をコードする単離キメラポリペプチドであって、KF5C_HUMANのアミノ酸1〜454に対応し、M62096_PEA_1_P9のアミノ酸1〜454にも対応するMADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFDRVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLHDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNEHSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDEと少なくとも90%相同な第1のアミノ酸配列と、M62096_PEA_1_P9のアミノ酸455〜514に対応する配列VKNAIYFFFHKVLLLLFVVDVCSRNLIGIEAFHNYRIMWKFLGRCPFTASYKLIITEFRKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P9をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding M62096_PEA_1_P9, corresponding to amino acids 1-454 of KF5C_HUMAN, corresponding to amino acids 1-454 of M62096_PEA_1_P9 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFDRVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLHDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNEHSSRSHSIFLINIKQENVETEKK The first amino acid sequence at least 90% homologous to EsujikeieruwaierubuidierueijiesuikeibuiesukeitijieiijieibuierudiieikeienuaienukeiesueruesueierujienubuiaiesueierueiijitikeitieichibuiPiwaiarudiesukeiemutiaruaierukyudiesuerujijienushiarutitiaibuiaishishiesuPiesubuiefuenuieiitikeiesutieruemuefujikyuarueikeitiaikeienutibuiesubuienueruierutieiiidaburyukeikeikeiwaiikeiikeiikeienukeitierukeienubuiaikyueichieruiemuieruenuarudaburyuaruenujiieibuiPiidiikyuaiesueikeidikyukeienueruiPishidienutiPiaiaidienuaieiPibuibuieijiaiesutiiikeiikeiwaidiiiaiesuesueruwaiarukyuerudiDKDDEINQQSQLAEKLKQQMLDQDE, sequence VKNAIYFFFHKVLLLLFVVDVCSRNLIGIEAFHNYRIMWKFLGRC corresponding to amino acids 455-514 of M62096_PEA_1_P9 A polypeptide having FTASYKLIITE FRK and a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; Provided is an isolated chimeric polypeptide encoding M62096_PEA_1_P9, wherein the amino acid sequence of 1 and the second amino acid sequence are in contiguous and sequential order.

本発明の好ましい実施形態によれば、M62096_PEA_1_P9のテールをコードする単離ポリペプチドであって、M62096_PEA_1_P9中の配列VKNAIYFFFHKVLLLLFVVDVCSRNLIGIEAFHNYRIMWKFLGRCPFTASYKLIITEFRKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M62096_PEA_1_P9のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of M62096_PEA_1_P9, which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, preferably at least about 80% More preferably, provided is an isolated polypeptide encoding the tail of M62096_PEA_1_P9, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、M62096_PEA_1_P10をコードする単離キメラポリペプチドであって、M62096_PEA_1_P10のアミノ酸1〜19に対応する配列MTQNFRLMWNILLFPLNFSを有するポリペプチドとと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、KF5C_HUMANのアミノ酸738〜815に対応し、M62096_PEA_1_P10のアミノ酸20〜97にも対応するLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKと少なくとも90%相同な第2のアミノ酸配列と、M62096_PEA_1_P10のアミノ酸98〜125に対応する配列VSSLCLNGTEKKIKDGREESFSVEISLAを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P10をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding M62096_PEA_1_P10, comprising a polypeptide having the sequence MTQNFRLMWNILLFPLNFS corresponding to amino acids 1-19 of M62096_PEA_1_P10, at least 70%, optionally at least 80 %, Preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to the first amino acid sequence and corresponds to amino acids 738 to 815 of KF5C_HUMAN and also to amino acids 20 to 97 of M62096_PEA_1_P10 LNQKLQLEQEKLSSDYNKLKIEDQ EREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLT At least 70%, optionally at least 80%, preferably at least 85%, more preferably a second amino acid sequence at least 90% homologous to RVKK and a polypeptide having the sequence VSSLCLNGTEKKIKDGREESFSVEISLA corresponding to amino acids 98 to 125 of M62096_PEA_1_P10 Comprises a third amino acid sequence which is at least 90%, most preferably at least 95% homologous, the first amino acid sequence, the second amino acid sequence and the third amino acid sequence being adjacent and contiguous An isolated chimeric polypeptide encoding M62096_PEA_1_P10 is provided.

本発明の好ましい実施形態によれば、M62096_PEA_1_P10の先端をコードする単離ポリペプチドであって、M62096_PEA_1_P10の配列MTQNFRLMWNILLFPLNFSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M62096_PEA_1_P10の先端をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tip of M62096_PEA_1_P10, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence MTQNFRLMWNILLFPLNFS of M62096_PEA_1_P10 Provided is an isolated polypeptide encoding the tip of M62096_PEA_1_P10, preferably comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、M62096_PEA_1_P10のテールをコードする単離ポリペプチドであって、M62096_PEA_1_P10中の配列VSSLCLNGTEKKIKDGREESFSVEISLAと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M62096_PEA_1_P10のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of M62096_PEA_1_P10, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence VSSLCLNGTEKKIKDGREESFSVEISLA in M62096_PEA_1_P10 More preferably, provided is an isolated polypeptide encoding the tail of M62096_PEA_1_P10, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、M62096_PEA_1_P11をコードする単離キメラポリペプチドであって、KF5C_HUMANのアミノ酸1〜372に対応し、M62096_PEA_1_P11のアミノ酸1〜372にも対応するMADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFDRVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLHDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNEHSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNと少なくとも90%相同な第1のアミノ酸配列と、M62096_PEA_1_P11のアミノ酸373〜385に対応する配列DFLAAHVFGKLLEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P11をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding M62096_PEA_1_P11, corresponding to amino acids 1-372 of KF5C_HUMAN, corresponding to amino acids 1-372 of M62096_PEA_1_P11 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFDRVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLHDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNEHSSRSHSIFLINIKQENVETE KLSGKLYLVDLAGESEKVSKTGEGAGELDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQSLEGNCRTSIVICSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAE A clubhead that is at least 90% homologous to the HKK EK EK EK EK EK EK EMLE NLR JH, a 11, 620 620 620 620 620 Comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first amino acid sequence and 2 amino acid sequences, contiguous and in sequential order, provides an isolated chimeric polypeptide coding M62096_PEA_1_P11.

本発明の好ましい実施形態によれば、M62096_PEA_1_P11のテールをコードする単離ポリペプチドであって、M62096_PEA_1_P11中の配列DFLAAHVFGKLLEと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M62096_PEA_1_P11のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of M62096_PEA_1_P11, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence DFLAAHVFGKLLE in M62096_PEA_1_P11. More preferably, provided is an isolated polypeptide encoding the tail of M62096_PEA_1_P11, comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、M62096_PEA_1_P12をコードする単離キメラポリペプチドであって、KF5C_HUMANのアミノ酸1〜323に対応し、M62096_PEA_1_P12のアミノ酸1〜323にも対応するMADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFDRVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLHDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNEHSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRと少なくとも90%相同な第1のアミノ酸配列と、M62096_PEA_1_P12のアミノ酸324〜324に対応する配列Vを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P12をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding M62096_PEA_1_P12, corresponding to amino acids 1-323 of KF5C_HUMAN, corresponding to amino acids 1-323 of M62096_PEA_1_P12 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFDRVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLHDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNEHSSRSHSIFLINIKQENVETE KLSGKLYLVDLAGSEK VSKTGAEGAN LEXN INKSLSA LGN VISALA EGTK THVPYRDSKTMTRILQDSLGGNCRTTIVICCS VFNEATKSTLMFGQR The first amino acid sequence which is at least 90% homologous to the M62096_PEA_1_P12 and the polypeptide having the sequence V corresponding to amino acids 324 to 324 at least 70% Comprises M62096_PEA_1_P12, which comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first amino acid sequence and the second amino acid sequence being adjacent and in sequential order Isolated chimeric polypeptide Subjected to.

本発明の好ましい実施形態によれば、T99080_PEA_4_P5をコードする単離キメラポリペプチドであって、T99080_PEA_4_P5のアミノ酸1〜30に対応する配列MPASARLAGAGLLLAFLRALGCAGRAPGLSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、ACYO_HUMAN_V1のアミノ酸1〜99に対応し、T99080_PEA_4_P5のアミノ酸31〜129にも対応するMAEGNTLISVDYEIFGKVQGVFFRKHTQAEGKKLGLVGWVQNTDRGTVQGQLQGPISKVRHMQEWLETRGSPKSHIDKANFNNEKVILKLDYSDFQIVKと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T99080_PEA_4_P5をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding T99080_PEA_4_P5, comprising at least 70%, optionally at least 80% of a polypeptide having the sequence MPASARAGAGGLLLAFLRALGCAGRAPGLS corresponding to amino acids 1 to 30 of T99080_PEA_4_P5 Preferably corresponds to a first amino acid sequence of at least 85%, more preferably at least 90%, most preferably at least 95% and corresponds to amino acids 1 to 99 of ACYO_HUMAN_V1 and also to amino acids 31 to 129 of T99080_PEA_4_P5 An isolated chimeric polypeptide encoding T99080_PEA_4_P5, comprising a second amino acid sequence at least 90% homologous to ETRGSPKSHIDKANFNNEK VILKLDYSDFQIVK, wherein said first and second amino acid sequences are adjacent and in sequential order provide.

本発明の好ましい実施形態によれば、T99080_PEA_4_P5の先端をコードする単離ポリペプチドであって、T99080_PEA_4_P5の配列MPASARLAGAGLLLAFLRALGCAGRAPGLSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T99080_PEA_4_P5の先端をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tip of T99080_PEA_4_P5, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence MPASARAGAGAGLLLAFLRALGCAGRAPGLS of T99080_PEA_4_P5 Provided is an isolated polypeptide encoding the tip of T99080_PEA_4_P5, preferably comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、T99080_PEA_4_P8をコードする単離キメラポリペプチドであって、T99080_PEA_4_P8のアミノ酸1〜1に対応する配列Mを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、ACYO_HUMAN_V1のアミノ酸28〜99に対応し、T99080_PEA_4_P8のアミノ酸2〜73にも対応するQAEGKKLGLVGWVQNTDRGTVQGQLQGPISKVRHMQEWLETRGSPKSHIDKANFNNEKVILKLDYSDFQIVKと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T99080_PEA_4_P8をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding T99080_PEA_4_P8, wherein the polypeptide has a sequence M corresponding to amino acids 1 to 1 of T99080_PEA_4_P8 and at least 70%, optionally at least 80% Preferably, at least 85%, more preferably at least 90%, most preferably at least 95% of the first amino acid sequence homologous and corresponding to amino acids 28 to 99 of ACYO_HUMAN_V1 and also to amino acids 2 to 73 of T99080_PEA_4_P8 And a second amino acid sequence that is at least 90% homologous The first amino acid sequence and a second amino acid sequence, contiguous and in sequential order, provides an isolated chimeric polypeptide coding T99080_PEA_4_P8.

本発明の好ましい実施形態によれば、T08446_PEA_1_P18をコードする単離キメラポリペプチドであって、SNXQ_HUMANのアミノ酸1〜185に対応し、T08446_PEA_1_P18のアミノ酸1〜185にも対応するMLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMEと少なくとも90%相同な第1のアミノ酸配列と、T08446_PEA_1_P18のアミノ酸186〜1305に対応する配列LDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYCを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T08446_PEA_1_P18をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding T08446_PEA_1_P18, corresponding to amino acids 1-185 of SNXQ_HUMAN, at least 90% homologous with the corresponding MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWME to amino acids 1-185 of T08446_PEA_1_P18 First amino acid sequence, T08446_PEA_1_ 18 sequence corresponding to amino acids 186 to 1305 of LDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSME ESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELL GAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSC PPDHLGYSAPQHPARRPTPPESPLYSSLPSPAPRSRSDPGPP VPRLPQ KQRAP WGPRTPHRVPGPWGPPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLEGEGQTRSYC and at least 70%, optionally at least 80%, and at least 90% Provided is an isolated chimeric polypeptide encoding T08446_PEA_1_P18, wherein the amino acid sequence of 1 and the second amino acid sequence are adjacent and in sequential order.

本発明の好ましい実施形態によれば、T08446_PEA_1_P18のテールをコードする単離ポリペプチドであって、T08446_PEA_1_P18中の配列LDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYCと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T08446_PEA_1_P18をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoded by the tail T08446_PEA_1_P18, sequences in T08446_PEA_1_P18 LDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVR HDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAP ASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGA SEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYC at least 70%, optionally at least about 80%, single preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the polypeptide encoding T08446_PEA_1_P18 An isolated polypeptide is provided.

本発明の好ましい実施形態によれば、T08446_PEA_1_P18をコードする単離キメラポリペプチドであって、T08446_PEA_1_P18のアミノ酸1〜443に対応する配列MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、Q9NT23のアミノ酸1〜674に対応し、T08446_PEA_1_P18のアミノ酸444〜1117にも対応するHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGASEGSPYSGと少なくとも90%相同な第2のアミノ酸配列と、T08446_PEA_1_P18のアミノ酸1118に対応する架橋アミノ酸Pと、Q9NT23のアミノ酸676〜862に対応し、T08446_PEA_1_P18のアミノ酸1119〜1305にも対応するTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYCと少なくとも90%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、架橋アミノ酸、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、T08446_PEA_1_P18をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding T08446_PEA_1_P18, corresponding to amino acids 1-443 of T08446_PEA_1_P18 sequence MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWW A part of the ssssss 14DeI 14D, D, D, G, S, GSM only, only, not limited to the above, not limited to the above, not limited to the above, not limited to us. The amino acids of T08446_PEA_1_P18 corresponding to 1 to 674 Also it corresponds to the 444~1117 HDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLT FRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPA And at least 90% homologous second amino acid sequence LDRGENLYYEIGASEGSPYSG, a crosslinking amino acid P corresponding to amino acid 1118 of T08446_PEA_1_P18, corresponding to amino acids 676-862 of Q9NT23, small and TRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYC corresponding to amino acids 1119-1305 of T08446_PEA_1_P18 T08446_PEA_1_P18, which comprises a third amino acid sequence that is both 90% homologous, the first amino acid sequence, the second amino acid sequence, the bridging amino acid, and the third amino acid sequence being adjacent and in sequential order Provided is an isolated chimeric polypeptide that encodes.


本発明の好ましい実施形態によれば、T08446_PEA_1_P18の先端をコードする単離ポリペプチドであって、T08446_PEA_1_P18の配列MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T08446_PEA_1_P18の先端をコードする単離ポリペプチドを提供する。

According to a preferred embodiment of the present invention, an isolated polypeptide encoded by the tip of T08446_PEA_1_P18, sequences T08446_PEA_1_P18 MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSE A part of a group of a member of a group of a member of a group is only a part of a group of a member of a member, only a part of a member of a group, only a member of a member. Provide an isolated polypeptide.

本発明の好ましい実施形態によれば、T08446_PEA_1_P18をコードする単離キメラポリペプチドであって、T08446_PEA_1_P18のアミノ酸1〜1010に対応する配列MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、Q96CP3のアミノ酸1〜295に対応し、T08446_PEA_1_P18のアミノ酸1011〜1305にも対応するLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYCと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T08446_PEA_1_P18をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding T08446_PEA_1_P18, corresponding to amino acids 1 to 1010 of T08446_PEA_1_P18 sequence MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSW RGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTP EPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPP A polypeptide having at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous amino acid sequence of the amino acid sequence of LRGPAQVSAGLAGGGGRDAPEAAAQSPCSVP SQVPTPGFSPAPLPLPGVP KPGLYPLGPPSFQPSSPAVWRSSLGP corresponding to .about.295 and corresponding to amino acids 1011 to 1305 of T08446_PEA_1_P18 APLDRGENLYYEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYC and and at least 90% homologous to a second amino acid sequence, the first amino acid sequence and a second amino acid sequence, contiguous and in sequential order, the isolated chimeric polypeptide encoding T08446_PEA_1_P18 I will provide a.

本発明の好ましい実施形態によれば、T08446_PEA_1_P18の先端をコードする単離ポリペプチドであって、T08446_PEA_1_P18の配列MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T08446_PEA_1_P18の先端をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoded by the tip of T08446_PEA_1_P18, sequences T08446_PEA_1_P18 MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSE VELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAER KGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERA QQVAEQQSQQEGGTPTPASQSPHRSLSLSLEVGGEPLGTSGSGPRPSNLAHPGAWVPGPPPYLPRQQQSDGLLRSPRPMTSRRG and at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous polypeptide, including T80446_PEA_18P Provided is an isolated polypeptide.

本発明の好ましい実施形態によれば、T08446_PEA_1_P18をコードする単離キメラポリペプチドであって、T08446_PEA_1_P18のアミノ酸1〜154に対応する配列MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、BAC86902のアミノ酸1〜861に対応し、T08446_PEA_1_P18のアミノ酸155〜1015にも対応するMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGLRGPAと少なくとも90%相同な第2のアミノ酸配列と、T08446_PEA_1_P18のアミノ酸1016〜1043に対応する配列QVSAQLRAGGGGRDAPEAAAQSPCSVPSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列と、BAC86902のアミノ酸862〜989に対応し、T08446_PEA_1_P18のアミノ酸1044〜1171にも対応するQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSと少なくとも90%相同な第4のアミノ酸配列と、T08446_PEA_1_P18のアミノ酸1172〜1305に対応する配列APQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYCを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第5のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、第3のアミノ酸配列、第4のアミノ酸配列、および第5のアミノ酸配列が、隣接し、且つ連続した順序にある、T08446_PEA_1_P18をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, it is an isolated chimeric polypeptide coding for T08446_PEA_1_P18 and corresponding to amino acids 1-154 of T08446_PEA. , Preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to the first amino acid sequence. And, corresponding to amino acids 1 to 861 of BAC86902, corresponding to amino acids 155 to 1015 of T08446_PEA_1_P18 MLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGK SEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDP And at least 90% homologous second amino acid sequence ErutiefuarushiesuesuPitipijidipiEipiPiEiesupiEipipieipasuEiefupiPiarubuitiPikyueiaiesuPiaruJipitiesuPiEiesupieieierudiaiesuiPierueibuiesubuiPiPieibuieruieruerujieijijieiPieiesueitiPitiPieieruesuPijiaruesueruaruPieichieruaiPieruerueruarujieiieiPierutidieishikyukyuiemushiesukeieruarujieikyuJipieruJipidiemuiesupierupipipipieruesuerueruaruPijijieiPipipipipikeienuPieiarueruemueierueierueiiarueikyukyubuieiikyukyuesukyukyuishijijitiPiPieiesukyuesuPiefueichiaruesueruesueruibuijijiiPierujitiesujiesuJipipipienuesuerueieichiPijieidaburyubuiPiJipipipiwaieruPiaruQQSDGSLLRSQRPMGTSRRGLRGPA, sequence QVSAQLRAGGGGRDAPEA corresponding to amino acids 1016 to 1,043 in T08446_PEA_1_P18 A third amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to a polypeptide having AQSPCSVPS and amino acid 862 of BAC 86902 A sequence of at least 90% A peptide having the sequence APQHPARRPTPPEPLYVNLAGPGPSPASSSSSPPAHPRSSQPQQQRAP WGPRTPHRVPGPWGPPE PLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAPPPP YPTGSTHSQSQRSQ SQHQSIG SQH corresponding to the amino acids 1172 to 1305 and at least 80% as appropriate And the first amino acid sequence, the second amino acid sequence, the third amino acid sequence, the fourth amino acid sequence, and the fifth amino acid sequence are adjacent and in a consecutive order, T08446_PEA_ Provided is an isolated chimeric polypeptide encoding 1_P18.

本発明の好ましい実施形態によれば、T08446_PEA_1_P18の先端をコードする単離ポリペプチドであって、T08446_PEA_1_P18の配列MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T08446_PEA_1_P18の先端をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tip of T08446_PEA_1_P18, which is the sequence of T08446_PEA_1_P18, MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPGPGPGPGOKRFPHHPHILPLPDEGGLITQIV GELQ I The end of T08446_PEA_1_P18, preferably comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous. It provides an isolated polypeptide encoding.

本発明の好ましい実施形態によれば、T08446_PEA_1_P18の縁部分をコードする単離ポリペプチドであって、T08446_PEA_1_P18に対応するQVSAQLRAGGGGRDAPEAAAQSPCSVPSをコードする配列と少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なアミノ酸配列を含む、T08446_PEA_1_P18の縁部分をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the edge portion of T08446_PEA_1_P18, which is at least 70%, optionally at least about 80%, preferably at least 70% of the sequence encoding QVSAQLRAGGGGRDAPEAAAQSPCSVPPS corresponding to T08446_PEA_1_P18 Provided is an isolated polypeptide encoding an edge portion of T08446_PEA_1_P18 that comprises an amino acid sequence that is at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、T08446_PEA_1_P18のテールをコードする単離ポリペプチドであって、T08446_PEA_1_P18中の配列APQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYCと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T08446_PEA_1_P18のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of T08446_PEA_1_P18, which is in the sequence of T08446_PEA_1_P18: More preferably, provided is an isolated polypeptide encoding the tail of T08446_PEA_1_P18, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous. To.

本発明の好ましい実施形態によれば、T11628_PEA_1_P2をコードする単離キメラポリペプチドであって、T11628_PEA_1_P2のアミノ酸1〜55に対応する配列MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、Q8WVH6のアミノ酸1〜99に対応し、T11628_PEA_1_P2のアミノ酸56〜154にも対応するMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQGと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T11628_PEA_1_P2をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding T11628_PEA_1_P2 comprising a polypeptide having the sequence MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKDFDKFKHLKSEDE corresponding to amino acids 1 to 55 of T11628_PEA_1_P2 and at least 70%, optionally at least 80% , Preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to the first amino acid sequence and corresponding to amino acids 1 to 99 of Q8WVH6 and also to amino acids 56 to 154 of T11628_PEA_1_P2 An isolated chimeric polypeptide encoding T11628_PEA_1_P2 comprising a second amino acid sequence that is at least 90% homologous to YLEFISECII QVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG, wherein said first and second amino acid sequences are adjacent and in a sequential order provide.

本発明の好ましい実施形態によれば、T11628_PEA_1_P2の先端をコードする単離ポリペプチドであって、T11628_PEA_1_P2の配列MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T11628_PEA_1_P2の先端をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tip of T11628_PEA_1_P2, which is at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence Provided is an isolated polypeptide encoding the tip of T11628_PEA_1_P2 that comprises a polypeptide that is preferably at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、T11628_PEA_1_P5をコードする単離キメラポリペプチドであって、MYG_HUMAN_V1のアミノ酸56〜154に対応し、T11628_PEA_1_P5のアミノ酸1〜99にも対応するMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQGと少なくとも90%相同な第1のアミノ酸配列を含む、T11628_PEA_1_P5をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding T11628_PEA_1_P5, comprising: Provided is an isolated chimeric polypeptide encoding T11628_PEA_1_P5, comprising a first amino acid sequence.

本発明の好ましい実施形態によれば、T11628_PEA_1_P7をコードする単離キメラポリペプチドであって、MYG_HUMAN_V1のアミノ酸1〜134に対応し、T11628_PEA_1_P7のアミノ酸1〜134にも対応するMGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKと少なくとも90%相同な第1のアミノ酸配列と、T11628_PEA_1_P7のアミノ酸135〜135に対応する配列Gを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T11628_PEA_1_P7をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding T11628_PEA_1_P7, corresponding to amino acids 1 to 134 of MYG_HUMAN_V1 and corresponding to amino acids 1 to 134 of T11628_PEA_1_P7, also corresponding to amino acids 1 to 134. At least 70%, optionally less, with a polypeptide having the first amino acid sequence and a sequence G corresponding to amino acids 135-135 of T11628_PEA_1_P7 And a second amino acid sequence that is 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous, said first and second amino acid sequences being adjacent Provided is an isolated chimeric polypeptide encoding T11628_PEA_1_P7, and in sequential order.

本発明の好ましい実施形態によれば、T11628_PEA_1_P10をコードする単離キメラポリペプチドであって、T11628_PEA_1_P10のアミノ酸1〜55に対応する配列MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、Q8WVH6のアミノ酸1〜99に対応し、T11628_PEA_1_P10のアミノ酸56〜154にも対応するMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQGと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T11628_PEA_1_P10をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding T11628_PEA_1_P10, comprising at least 70%, optionally at least 80%, of a polypeptide having the sequence MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKDFDKFKHLKDEDE corresponding to amino acids 1 to 55 of T11628_PEA_1_P10 , Preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to the first amino acid sequence, and corresponding to amino acids 1 to 99 of Q8WVH6 and also to amino acids 56 to 154 of T11628_PEA_1_P10 An isolated chimeric polypeptide encoding T11628_PEA_1_P10, comprising a second amino acid sequence which is at least 90% homologous to PVKYLEFISECII QVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG, wherein said first and second amino acid sequences are adjacent and in sequential order provide.

本発明の好ましい実施形態によれば、T11628_PEA_1_P10の先端をコードする単離ポリペプチドであって、T11628_PEA_1_P10の配列MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T11628_PEA_1_P10の先端をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tip of T11628_PEA_1_P10, which is at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence Provided is an isolated polypeptide encoding the tip of T11628_PEA_1_P10, which comprises a polypeptide that is preferably at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R35137_PEA_1_PEA_1_PEA_1_P9をコードする単離キメラポリペプチドであって、ALAT_HUMAN_V1のアミノ酸1〜274に対応し、R35137_PEA_1_PEA_1_PEA_1_P9のアミノ酸1〜274にも対応するMASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQTRECIEAVIRFAFEERLFLLADEVと少なくとも90%相同な第1のアミノ酸配列と、R35137_PEA_1_PEA_1_PEA_1_P9のアミノ酸275〜385に対応する配列RGAGEREAGQQSAPVTPCALPGVPGQRVRRGFAVPLIQEGAHGDGAALRRAAGACLLPLHLQGLHGRVRAYEAGGGSRAMARPSSPDGPPPPPHLTWPCAGAGSAAAMWRWを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R35137_PEA_1_PEA_1_PEA_1_P9をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding R35137_PEA_1_PEA_1_PEA_1_P9, corresponding to amino acids 1-274 of ALAT_HUMAN_V1, corresponding to amino acids 1-274 of R35137_PEA_1_PEA_1_PEA_1_P9 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATL A first amino acid sequence at least 90% homologous to IerujieibuikyubuidiwaiwaierudiiiarueidaburyueierudibuieiierueichiarueierujikyueiarudieichishiaruPiarueierushibuiaienuPijienupitijikyubuiQTRECIEAVIRFAFEERLFLLADEV, polypeptide at least 70% with a sequence corresponding to RGAGEREAGQQSAPVTPCALPGVPGQRVRRGFAVPLIQEGAHGDGAALRRAAGACLLPLHLQGLHGRVRAYEAGGGSRAMARPSSPDGPPPPPHLTWPCAGAGSAAAMWRW to amino acid 275-385 of R35137_PEA_1_PEA_1_PEA_1_P9, optionally at least 80%, preferably at least 85%, more preferably Is at least 90%, most preferably less Also provided is an isolated chimeric polypeptide encoding R35137_PEA_1_PEA_1_PEA_1_P9, comprising a second amino acid sequence that is also 95% homologous, said first amino acid sequence and said second amino acid sequence being adjacent and in sequential order .

本発明の好ましい実施形態によれば、R35137_PEA_1_PEA_1_PEA_1_P9のテールをコードする単離ポリペプチドであって、R35137_PEA_1_PEA_1_PEA_1_P9中の配列RGAGEREAGQQSAPVTPCALPGVPGQRVRRGFAVPLIQEGAHGDGAALRRAAGACLLPLHLQGLHGRVRAYEAGGGSRAMARPSSPDGPPPPPHLTWPCAGAGSAAAMWRWと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R35137_PEA_1_PEA_1_PEA_1_P9のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of R35137_PEA_1_PEA_1_PEA_1_P9, comprising: More preferably, it encodes the tail of R35137_PEA_1_PEA_1_PEA_1_P9, which comprises a polypeptide that is at least about 90%, most preferably at least about 95% homologous. To provide a releasing polypeptide.

本発明の好ましい実施形態によれば、R35137_PEA_1_PEA_1_PEA_1_P8をコードする単離キメラポリペプチドであって、ALAT_HUMAN_V1のアミノ酸1〜320に対応し、R35137_PEA_1_PEA_1_PEA_1_P8のアミノ酸1〜320にも対応するMASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQTRECIEAVIRFAFEERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPYAGQQELASFHSTSKGYMGECと少なくとも90%相同な第1のアミノ酸配列と、R35137_PEA_1_PEA_1_PEA_1_P8のアミノ酸321〜346に対応する配列VRTRRVGARGPWPGPPRPMGHPLLRTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R35137_PEA_1_PEA_1_PEA_1_P8をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding R35137_PEA_1_PEA_1_PEA_1_P8, it corresponds to amino acids 1 to 320 of ALAT_HUMAN_V1, corresponding to amino acids 1 to 320 of R35137_PEA_1_PEA_1_PEA_1_P8 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATL A first amino acid sequence at least 90% homologous to IerujieibuikyubuidiwaiwaierudiiiarueidaburyueierudibuieiierueichiarueierujikyueiarudieichishiaruPiarueierushibuiaienuPijienupitijikyubuikyutiaruishiaiieibuiaiaruefueiefuiiarueruefueruerueidiibuiwaikyudienubuiwaieieijiesukyuefueichiesuefukeikeibuieruemuiMGPPYAGQQELASFHSTSKGYMGEC, polypeptide at least 70% with a sequence corresponding to VRTRRVGARGPWPGPPRPMGHPLLRT to amino acid 321-346 of R35137_PEA_1_PEA_1_PEA_1_P8, optionally at least 80%, preferably at least 85%, more preferably Comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first amino acid sequence and the second amino acid sequence Amino acid sequences, contiguous and in sequential order, provides an isolated chimeric polypeptide coding R35137_PEA_1_PEA_1_PEA_1_P8.

本発明の好ましい実施形態によれば、R35137_PEA_1_PEA_1_PEA_1_P8のテールをコードする単離ポリペプチドであって、R35137_PEA_1_PEA_1_PEA_1_P8中の配列VRTRRVGARGPWPGPPRPMGHPLLRTと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R35137_PEA_1_PEA_1_PEA_1_P8のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of R35137_PEA_1_PEA_1_PEA_1_P8, which is at least 70%, optionally at least about 80%, preferably at least about 85%, with the VTRTRVGARGPWPGPPRPMGH PLLRT in the sequence R35137_PEA_1_PEA_1_PEA_1_P8 More preferably, provided is an isolated polypeptide encoding the tail of R35137_PEA_1_PEA_1_PEA_1_P8, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R35137_PEA_1_PEA_1_PEA_1_P11をコードする単離キメラポリペプチドであって、ALAT_HUMAN_V1のアミノ酸1〜229に対応し、R35137_PEA_1_PEA_1_PEA_1_P11のアミノ酸1〜229にも対応するMASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQARと少なくとも90%相同な第1のアミノ酸配列と、ALAT_HUMAN_V1のアミノ酸455〜496に対応し、R35137_PEA_1_PEA_1_PEA_1_P11のアミノ酸230〜271にも対応するSGFGQREGTYHFRMTILPPLEKLRLLLEKLSRFHAKFTLEYSと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R35137_PEA_1_PEA_1_PEA_1_P11をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding R35137_PEA_1_PEA_1_PEA_1_P11, corresponding to amino acids 1-229 of ALAT_HUMAN_V1, corresponding to amino acids 1-229 of R35137_PEA_1_PEA_1_PEA_1_P11 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSA The first amino acid sequence which is at least 90% homologous to LAELGAVQVDYYLDEERAWALDVAELHRALQAR and corresponding to amino acids 455 to 496 of ALAT_HUMAN_V1 and also corresponding to amino acids 230 to 271 of R35137_PEA_1_PEA_1_PEA_1_P11 The present invention provides an isolated chimeric polypeptide encoding R35137_PEA_1_PEA_1_PEA_1_P11, wherein the first and second amino acid sequences are adjacent and in sequential order.

本発明の好ましい実施形態によれば、R35137_PEA_1_PEA_1_PEA_1_P11の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がRSを含み、以下の構造:アミノ酸番号229−x〜229のいずれかから始まり、アミノ酸番号230+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、R35137_PEA_1_PEA_1_PEA_1_P11の縁部分をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding the rim portion of R35137_PEA_1_PEA_1_PEA_1_P11, having a length “n”, where n is at least about 10 amino acids in length, optionally at least about at least about 20 amino acids in length, preferably at least about 30 amino acids in length, more preferably at least about 40 amino acids in length, most preferably at least about 50 amino acids in length), wherein at least two amino acids comprise RS; A polypeptide having a sequence beginning with any of the numbers 229-x to 229 and ending at the amino acid number 230 + ((n-2) -x), wherein x varies from 0 to n-2. Code the edge part of R35137_PEA_1_PEA_1_PEA_1_P11, including That provides isolated chimeric polypeptides.

本発明の好ましい実施形態によれば、R35137_PEA_1_PEA_1_PEA_1_P2をコードする単離キメラポリペプチドであって、ALAT_HUMAN_V1のアミノ酸1〜274に対応し、R35137_PEA_1_PEA_1_PEA_1_P2のアミノ酸1〜274にも対応するMASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQTRECIEAVIRFAFEERLFLLADEVと少なくとも90%相同な第1のアミノ酸配列と、R35137_PEA_1_PEA_1_PEA_1_P2のアミノ酸275〜399に対応する配列RGAGEREAGQQSAPVTPCALPGVPGQRVRRGFAVPLIQEGAHGDGAALRRAAGACLLPLHLQGLHGRVRVPRRLCGGGEHGRCSAAADAEADECAAVPAGARTGPAGPGGQPARAHRPLLCAVPGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R35137_PEA_1_PEA_1_PEA_1_P2をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding R35137_PEA_1_PEA_1_PEA_1_P2, corresponding to amino acids 1-274 of ALAT_HUMAN_V1, corresponding to amino acids 1-274 of R35137_PEA_1_PEA_1_PEA_1_P2 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATL A first amino acid sequence at least 90% homologous to IerujieibuikyubuidiwaiwaierudiiiarueidaburyueierudibuieiierueichiarueierujikyueiarudieichishiaruPiarueierushibuiaienuPijienupitijikyubuiQTRECIEAVIRFAFEERLFLLADEV, polypeptide at least 70% with a sequence corresponding to RGAGEREAGQQSAPVTPCALPGVPGQRVRRGFAVPLIQEGAHGDGAALRRAAGACLLPLHLQGLHGRVRVPRRLCGGGEHGRCSAAADAEADECAAVPAGARTGPAGPGGQPARAHRPLLCAVPG to amino acid 275-399 of R35137_PEA_1_PEA_1_PEA_1_P2, optionally at least 80%, preferably at least 85%, more preferably At least An isolation encoding R35137_PEA_1_PEA_1_PEA_1_P2, which comprises a second amino acid sequence of 0%, most preferably at least 95% homology, said first amino acid sequence and said second amino acid sequence being adjacent and in sequential order Provided is a chimeric polypeptide.

本発明の好ましい実施形態によれば、R35137_PEA_1_PEA_1_PEA_1_P2のテールをコードする単離ポリペプチドであって、R35137_PEA_1_PEA_1_PEA_1_P2中の配列RGAGEREAGQQSAPVTPCALPGVPGQRVRRGFAVPLIQEGAHGDGAALRRAAGACLLPLHLQGLHGRVRVPRRLCGGGEHGRCSAAADAEADECAAVPAGARTGPAGPGGQPARAHRPLLCAVPGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R35137_PEA_1_PEA_1_PEA_1_P2のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of R35137_PEA_1_PEA_1_PEA_1_P2, which is a tag that is used in the sequence of R35137_PEA_1_PEA_1_PEA_1_P2 and which is RGIGETAGQQQRPVQQQRVHQGLEGALGLIGITHI, which is an isolated polypeptide encoding the tail of G35. More preferably, R35137_PEA_1_PEA_1_PEA_ comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous. It provides an isolated polypeptide encoding a tail _p2.

本発明の好ましい実施形態によれば、R35137_PEA_1_PEA_1_PEA_1_P4をコードする単離キメラポリペプチドであって、ALAT_HUMAN_V1のアミノ酸1〜494に対応し、R35137_PEA_1_PEA_1_PEA_1_P4のアミノ酸1〜494にも対応するMASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQTRECIEAVIRFAFEERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPYAGQQELASFHSTSKGYMGECGFRGGYVEVVNMDAAVQQQMLKLMSVRLCPPVPGQALLDLVVSPPAPTDPSFAQFQAEKQAVLAELAAKAKLTEQVFNEAPGISCNPVQGAMYSFPRVQLPPRAVERAQELGLAPDMFFCLRLLEETGICVVPGSGFGQREGTYHFRMTILPPLEKLRLLLEKLSRFHAKFTLEと少なくとも90%相同な第1のアミノ酸配列と、R35137_PEA_1_PEA_1_PEA_1_P4のアミノ酸495〜555に対応する配列SPGRLWSPLYLLLMPGGVGWGGCWAPASLQVPNKAVWQSDSKKEALAAAWPAPTCLPFLQAを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R35137_PEA_1_PEA_1_PEA_1_P4をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding R35137_PEA_1_PEA_1_PEA_1_P4, corresponding to amino acids 1-494 of ALAT_HUMAN_V1, corresponding to amino acids 1-494 of R35137_PEA_1_PEA_1_PEA_1_P4 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATL The first amino acid sequence at least 90% homologous to ELGAVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQTRECIEAVIRFAFEERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPYAGQQELASFHSTSKGYMGECGFRGGYVEVVNMDAAVQQQMLKLMSVRLCPPVPGQALLDLVVSPPAPTDPSFAQFQAEKQAVLAELAAKAKLTEQVFNEAPGISCNPVQGAMYSFPRVQLPPRAVERAQELGLAPDMFFCLRLLEETGICVVPGSGFGQREGTYHFRMTILPPLEKLRLLLEKLSRFHAKFTLE, R35137_PEA_1 PEA_1_PEA_1_P4 amino acid sequence corresponding to amino acids 495 to 555 of SPGRLWSPLYLLLMPGGVGWGCWAPASLQVPNKAVWQSDSKKEALAAAWPAPTCPLQA at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous An isolated chimeric polypeptide encoding R35137_PEA_1_PEA_1_PEA_1_P4, comprising two amino acid sequences, wherein the first amino acid sequence and the second amino acid sequence are adjacent and in sequential order.

本発明の好ましい実施形態によれば、R35137_PEA_1_PEA_1_PEA_1_P4のテールをコードする単離ポリペプチドであって、R35137_PEA_1_PEA_1_PEA_1_P4中の配列SPGRLWSPLYLLLMPGGVGWGGCWAPASLQVPNKAVWQSDSKKEALAAAWPAPTCLPFLQAと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R35137_PEA_1_PEA_1_PEA_1_P4のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of R35137_PEA_1_PEA_1_P4, at least 70, at least 70, at least 70. More preferably, provided is an isolated polypeptide encoding the tail of R35137_PEA_1_PEA_1_PEA_1_P4, comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R11723_PEA_1_P6をコードする単離キメラポリペプチドであって、R11723_PEA_1_P6のアミノ酸1〜110に対応する配列MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGSPCRGLAPGREEQRALHKAGAVGGGVRを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、Q8IXM0のアミノ酸1〜112に対応し、R11723_PEA_1_P6のアミノ酸111〜122にも対応するMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P6をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding R11723_PEA_1_P6, which corresponds to amino acids 1 to 110 of R11723_PEA_1_P6. , Preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to the first amino acid sequence, corresponding to amino acids 1-112 of Q8IXM0, amino acid 11 of R11723_PEA_1_P6 ... A corresponding amino acid sequence includes a second amino acid sequence at least 90% homologous to the second amino acid sequence, and the corresponding ones Provided is a polypeptide.

本発明の好ましい実施形態によれば、R11723_PEA_1_P6の先端をコードする単離ポリペプチドであって、R11723_PEA_1_P6の配列MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGSPCRGLAPGREEQRALHKAGAVGGGVRと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P6の先端をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tip of R11723_PEA_1_P6, comprising: R11723_PEA_1_P6, which is a sequence of MWVLGIAATFCCFLFLLPALQQQCYQCEEFQLNNDCSSPEFIVNCNCTVNVQQEMMECSASLACIAGSAG GGLAPG E LEG I Provided is an isolated polypeptide encoding the tip of R11723_PEA_1_P6, preferably comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R11723_PEA_1_P6をコードする単離キメラポリペプチドであって、Q96AC2のアミノ酸1〜83に対応し、R11723_PEA_1_P6のアミノ酸1〜83にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P6のアミノ酸84〜222に対応する配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P6をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding R11723_PEA_1_P6, which corresponds to amino acids 1 to 83 of Q96AC2 and also to amino acids 1 to 83 of R11723_PEA_1_P6. The first amino acid sequence and the sequence corresponding to amino acids 84 to 222 of R11723_PEA_1_P6 SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPR A polypeptide having at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95%, of a second amino acid sequence homologous to the polypeptide having VVLGFGRSHDPPPNLVGHPAYGQCHNNQPWADTSRRERQRKHSMRTQ; Provided is an isolated chimeric polypeptide encoding R11723_PEA_1_P6 in which the first and second amino acid sequences are in contiguous and sequential order.

本発明の好ましい実施形態によれば、R11723_PEA_1_P6のテールをコードする単離ポリペプチドであって、R11723_PEA_1_P6中の配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P6のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, according to a preferred embodiment of the invention, according to a preferred embodiment of the invention An isolated polypeptide encoding the tail of R11723_PEA_1_P6, more preferably comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous To provide.

本発明の好ましい実施形態によれば、R11723_PEA_1_P6をコードする単離キメラポリペプチドであって、Q8N2G4のアミノ酸1〜83に対応し、R11723_PEA_1_P6のアミノ酸1〜83にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P6のアミノ酸84〜222に対応する配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P6をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding R11723_PEA_1_P6, which corresponds to amino acids 1 to 83 of Q8N2G4 and also to amino acids 1 to 83 of R11723_PEA_1_P6. The first amino acid sequence and the sequence corresponding to amino acids 84 to 222 of R11723_PEA_1_P6: A polypeptide having at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95%, of a second amino acid sequence homologous to the polypeptide having VVLGFGRSHDPPPNLVGHPAYGQCHNNQPWADTSRRERQRKHSMRTQ; Provided is an isolated chimeric polypeptide encoding R11723_PEA_1_P6 in which the first and second amino acid sequences are in contiguous and sequential order.

本発明の好ましい実施形態によれば、R11723_PEA_1_P6のテールをコードする単離ポリペプチドであって、R11723_PEA_1_P6中の配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P6のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, according to a preferred embodiment of the invention, according to a preferred embodiment of the invention An isolated polypeptide encoding the tail of R11723_PEA_1_P6, more preferably comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous To provide.

本発明の好ましい実施形態によれば、R11723_PEA_1_P6をコードする単離キメラポリペプチドであって、BAC85518のアミノ酸24〜106に対応し、R11723_PEA_1_P6のアミノ酸1〜83にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P6のアミノ酸84〜222に対応する配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P6をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding R11723_PEA_1_P6, corresponding to amino acids 24 to 106 of BAC 85518 and corresponding to amino acids 1 to 83 of R11723_PEA_1_P6. The first amino acid sequence and the sequence corresponding to amino acids 84 to 222 of R11723_PEA_1_P6 SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPE GPRPVVLGFGRSHDPPPNLVGHPAYGQCHNNQPWADTSRRERQRKHSMRTQ comprising a second amino acid sequence homologous to the polypeptide having at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95%. Provided is an isolated chimeric polypeptide encoding R11723_PEA_1_P6 in which the first and second amino acid sequences are in contiguous and sequential order.

本発明の好ましい実施形態によれば、R11723_PEA_1_P6のテールをコードする単離ポリペプチドであって、R11723_PEA_1_P6中の配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P6のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, according to a preferred embodiment of the invention, according to a preferred embodiment of the invention An isolated polypeptide encoding the tail of R11723_PEA_1_P6, more preferably comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous To provide.

本発明の好ましい実施形態によれば、R11723_PEA_1_P7をコードする単離キメラポリペプチドであって、Q96AC2のアミノ酸1〜64に対応し、R11723_PEA_1_P7のアミノ酸1〜64にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P7のアミノ酸65〜93に対応する配列SHCVTRLECSGTISAHCNLCLPGSNDHPTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P7をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding R11723_PEA_1_P7, which corresponds to amino acids 1 to 64 of Q96AC2 and also to amino acids 1 to 64 of R11723_PEA_1_P7. At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably a polypeptide having the first amino acid sequence and the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT corresponding to amino acids 65-93 of R11723_PEA_1_P7 Is at least 95% phase And a second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, provides an isolated chimeric polypeptide coding R11723_PEA_1_P7.

本発明の好ましい実施形態によれば、R11723_PEA_1_P7のテールをコードする単離ポリペプチドであって、R11723_PEA_1_P7中の配列SHCVTRLECSGTISAHCNLCLPGSNDHPTと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P7のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of R11723_PEA_1_P7, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT in R11723_PEA_1_P7 More preferably, provided is an isolated polypeptide encoding the tail of R11723_PEA_1_P7, comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R11723_PEA_1_P7をコードする単離キメラポリペプチドであって、Q8N2G4のアミノ酸1〜64に対応し、R11723_PEA_1_P7のアミノ酸1〜64にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P7のアミノ酸65〜93に対応する配列SHCVTRLECSGTISAHCNLCLPGSNDHPTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P7をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding R11723_PEA_1_P7, which corresponds to amino acids 1 to 64 of Q8N2G4 and also to amino acids 1 to 64 of R11723_PEA_1_P7. At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably a polypeptide having the first amino acid sequence and the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT corresponding to amino acids 65-93 of R11723_PEA_1_P7 Is at least 95% phase And a second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, provides an isolated chimeric polypeptide coding R11723_PEA_1_P7.

本発明の好ましい実施形態によれば、R11723_PEA_1_P7のテールをコードする単離ポリペプチドであって、R11723_PEA_1_P7中の配列SHCVTRLECSGTISAHCNLCLPGSNDHPTと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P7のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of R11723_PEA_1_P7, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT in R11723_PEA_1_P7 More preferably, provided is an isolated polypeptide encoding the tail of R11723_PEA_1_P7, comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R11723_PEA_1_P7をコードする単離キメラポリペプチドであって、R11723_PEA_1_P7のアミノ酸1〜5に対応する配列MWVLGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、BAC85273のアミノ酸22〜80に対応し、R11723_PEA_1_P7のアミノ酸6〜64にも対応するIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGと少なくとも90%相同な第2のアミノ酸配列と、R11723_PEA_1_P7のアミノ酸65〜93に対応する配列SHCVTRLECSGTISAHCNLCLPGSNDHPTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1、第2、および第3のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P7をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding R11723_PEA_1_P7, comprising a polypeptide having the sequence MWVLG corresponding to amino acids 1 to 5 of R11723_PEA_1_P7, at least 70%, optionally at least 80% IAATFCGLFLPFLPAL QIQCYQCEEFQLNNDSSPEFIVNCNCTVNVQDMCQKEVMEQS corresponds to the first amino acid sequence which is preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous and corresponding to amino acids 22 to 80 of BAC 85 273 and also to amino acids 6 to 64 of R11723_PEA_1_P7. R11723_PEA_1_P7 with a second amino acid sequence at least 90% homologous to A third polypeptide having at least 70%, optionally at least 80%, preferably at least 85%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homology to the polypeptide having the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT corresponding to amino acids 65 to 93 The present invention provides an isolated chimeric polypeptide encoding R11723_PEA_1_P7, which comprises an amino acid sequence, and wherein the first, second and third amino acid sequences are adjacent and in sequential order.

本発明の好ましい実施形態によれば、R11723_PEA_1_P7の先端をコードする単離ポリペプチドであって、R11723_PEA_1_P7の配列MWVLGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P7の先端をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tip of R11723_PEA_1_P7, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence MWVLG of R11723_PEA_1_P7 Provided is an isolated polypeptide encoding the tip of R11723_PEA_1_P7, which comprises a polypeptide that is preferably at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R11723_PEA_1_P7のテールをコードする単離ポリペプチドであって、R11723_PEA_1_P7中の配列SHCVTRLECSGTISAHCNLCLPGSNDHPTと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P7のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of R11723_PEA_1_P7, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT in R11723_PEA_1_P7 More preferably, provided is an isolated polypeptide encoding the tail of R11723_PEA_1_P7, comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R11723_PEA_1_P7をコードする単離キメラポリペプチドであって、BAC85518のアミノ酸24〜87に対応し、R11723_PEA_1_P7のアミノ酸1〜64にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P7のアミノ酸65〜93に対応する配列SHCVTRLECSGTISAHCNLCLPGSNDHPTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P7をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding R11723_PEA_1_P7, corresponding to amino acids 24 to 87 of BAC 85518 and corresponding to amino acids 1 to 64 of R11723_PEA_1_P7. At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably a polypeptide having the first amino acid sequence and the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT corresponding to amino acids 65-93 of R11723_PEA_1_P7 Is at least 9 % Phase and a same a second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, provides an isolated chimeric polypeptide coding R11723_PEA_1_P7.

本発明の好ましい実施形態によれば、R11723_PEA_1_P7のテールをコードする単離ポリペプチドであって、R11723_PEA_1_P7中の配列SHCVTRLECSGTISAHCNLCLPGSNDHPTと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P7のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of R11723_PEA_1_P7, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT in R11723_PEA_1_P7 More preferably, provided is an isolated polypeptide encoding the tail of R11723_PEA_1_P7, comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R11723_PEA_1_P13をコードする単離キメラポリペプチドであって、Q96AC2のアミノ酸1〜63に対応し、R11723_PEA_1_P13のアミノ酸1〜63にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P13のアミノ酸64〜84に対応する配列DTKRTNTLLFEMRHFAKQLTTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P13をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding R11723_PEA_1_P13, which corresponds to amino acids 1 to 63 of Q96AC2 and also to amino acids 1 to 63 of R11723_PEA_1_P13. At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably a polypeptide having the first amino acid sequence and the sequence DTKRTNTLLFEMRHFAKAKTT corresponding to amino acids 64-84 of R11723_PEA_1_P13 Is at least 95% homologous to the second And a acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, provides an isolated chimeric polypeptide coding R11723_PEA_1_P13.

本発明の好ましい実施形態によれば、R11723_PEA_1_P13のテールをコードする単離ポリペプチドであって、R11723_PEA_1_P13中の配列DTKRTNTLLFEMRHFAKQLTTと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P13のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of R11723_PEA_1_P13, which is at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence DTKRTNTLLFEMRHFAKQLTT in R11723_PEA_1_P13 More preferably, provided is an isolated polypeptide encoding the tail of R11723_PEA_1_P13, comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R11723_PEA_1_P10をコードする単離キメラポリペプチドであって、Q96AC2のアミノ酸1〜63に対応し、R11723_PEA_1_P10のアミノ酸1〜63にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P10のアミノ酸64〜90に対応する配列DRVSLCHEAGVQWNNFSTLQPLPPRLKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P10をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding R11723_PEA_1_P10, which corresponds to amino acids 1 to 63 of Q96AC2 and also to amino acids 1 to 63 of R11723_PEA_1_P10. At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably a polypeptide having the first amino acid sequence and the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK corresponding to amino acids 64-90 of R11723_PEA_1_P10 Is at least 95% phase And a second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, provides an isolated chimeric polypeptide coding R11723_PEA_1_P10.

本発明の好ましい実施形態によれば、R11723_PEA_1_P10のテールをコードする単離ポリペプチドであって、R11723_PEA_1_P10中の配列DRVSLCHEAGVQWNNFSTLQPLPPRLKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P10のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of R11723_PEA_1_P10, which is at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK in R11723_PEA_1_P10 More preferably, provided is an isolated polypeptide encoding the tail of R11723_PEA_1_P10, comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R11723_PEA_1_P10をコードする単離キメラポリペプチドであって、Q8N2G4のアミノ酸1〜63に対応し、R11723_PEA_1_P10のアミノ酸1〜63にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P10のアミノ酸64〜90に対応する配列DRVSLCHEAGVQWNNFSTLQPLPPRLKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P10をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding R11723_PEA_1_P10, which corresponds to amino acids 1 to 63 of Q8N2G4 and also to amino acids 1 to 63 of R11723_PEA_1_P10. At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably a polypeptide having the first amino acid sequence and the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK corresponding to amino acids 64-90 of R11723_PEA_1_P10 Is at least 95% phase And a second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, provides an isolated chimeric polypeptide coding R11723_PEA_1_P10.

本発明の好ましい実施形態によれば、R11723_PEA_1_P10のテールをコードする単離ポリペプチドであって、R11723_PEA_1_P10中の配列DRVSLCHEAGVQWNNFSTLQPLPPRLKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P10のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of R11723_PEA_1_P10, which is at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK in R11723_PEA_1_P10 More preferably, provided is an isolated polypeptide encoding the tail of R11723_PEA_1_P10, comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R11723_PEA_1_P10をコードする単離キメラポリペプチドであって、R11723_PEA_1_P10のアミノ酸1〜5に対応する配列MWVLGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、BAC85273のアミノ酸22〜79に対応し、R11723_PEA_1_P10のアミノ酸6〜63にも対応するIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAと少なくとも90%相同な第2のアミノ酸配列と、R11723_PEA_1_P10のアミノ酸64〜90に対応する配列DRVSLCHEAGVQWNNFSTLQPLPPRLKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1、第2、および第3のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P10をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding R11723_PEA_1_P10, comprising a polypeptide having the sequence MWVLG corresponding to amino acids 1 to 5 of R11723_PEA_1_P10, at least 70%, optionally at least 80% IAATFCCLGLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSA corresponds to the first amino acid sequence, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous and corresponding to amino acids 22 to 79 of BAC 85 273 and also to amino acids 6 to 63 of R11723_PEA_1_P10. A second amino acid sequence at least 90% homologous to A polypeptide having the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK corresponding to amino acids 64-90 of 10 at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous And an isolated chimeric polypeptide encoding R11723_PEA_1_P10, wherein the first, second and third amino acid sequences are adjacent and in sequential order.

本発明の好ましい実施形態によれば、R11723_PEA_1_P10の先端をコードする単離ポリペプチドであって、R11723_PEA_1_P10の配列MWVLGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P10の先端をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tip of R11723_PEA_1_P10, wherein the sequence MWVLG of R11723_PEA_1_P10 and at least 70%, optionally at least about 80%, preferably at least about 85%, more Provided is an isolated polypeptide encoding the tip of R11723_PEA_1_P10, which comprises a polypeptide that is preferably at least about 90%, and most preferably at least about 95% homologous.


本発明の好ましい実施形態によれば、R11723_PEA_1_P10のテールをコードする単離ポリペプチドであって、R11723_PEA_1_P10中の配列DRVSLCHEAGVQWNNFSTLQPLPPRLKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P10のテールをコードする単離ポリペプチドを提供する。

According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of R11723_PEA_1_P10, which is at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK in R11723_PEA_1_P10 More preferably, provided is an isolated polypeptide encoding the tail of R11723_PEA_1_P10, comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R11723_PEA_1_P10をコードする単離キメラポリペプチドであって、BAC85518のアミノ酸24〜86に対応し、R11723_PEA_1_P10のアミノ酸1〜63にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P10のアミノ酸64〜90に対応する配列DRVSLCHEAGVQWNNFSTLQPLPPRLKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P10をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding R11723_PEA_1_P10, corresponding to amino acids 24 to 86 of BAC 85518 and corresponding to amino acids 1 to 63 of R11723_PEA_1_P10. At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably a polypeptide having the first amino acid sequence and the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK corresponding to amino acids 64-90 of R11723_PEA_1_P10 Is at least 9 % Phase and a same a second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, provides an isolated chimeric polypeptide coding R11723_PEA_1_P10.

本発明の好ましい実施形態によれば、R11723_PEA_1_P10のテールをコードする単離ポリペプチドであって、R11723_PEA_1_P10中の配列DRVSLCHEAGVQWNNFSTLQPLPPRLKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P10のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of R11723_PEA_1_P10, which is at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK in R11723_PEA_1_P10 More preferably, provided is an isolated polypeptide encoding the tail of R11723_PEA_1_P10, comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R16276_PEA_1_P7をコードする単離キメラポリペプチドであって、NOV_HUMANのアミノ酸1〜41に対応し、R16276_PEA_1_P7のアミノ酸1〜41にも対応するMQSVQSTSFCLRKQCLCLTFLLLHLLGQVAATQRCPPQCPGと少なくとも90%相同な第1のアミノ酸配列と、R16276_PEA_1_P7のアミノ酸42に対応する架橋アミノ酸Qと、NOV_HUMANのアミノ酸43〜103に対応し、R16276_PEA_1_P7のアミノ酸43〜103にも対応するCPATPPTCAPGVRAVLDGCSCCLVCARQRGESCSDLEPCDESSGLYCDRSADPSNQTGICTと少なくとも90%相同な第2のアミノ酸配列と、R16276_PEA_1_P7のアミノ酸104〜111に対応する配列GNPAPSAVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、架橋アミノ酸、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、R16276_PEA_1_P7をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, it is an isolated chimeric polypeptide encoding R16276_PEA_1_P7, which corresponds to amino acids 1 to 41 of NOV_HUMAN and also to amino acids 1 to 41 of R16276_PEA_1_P7 at least 90% homologous to MQSV CPATPPTCAPGPRA VLDGCSCCLCGARGGSCSDLEPCDESSGLYCDRSADPSNQTGICT corresponding to the first amino acid sequence and to the bridge amino acid Q corresponding to amino acid 42 of R16276_PEA_1_P7 and to amino acids 43 to 103 of NOV_HUMAN and also to amino acids 43 to 103 of R16276_PEA_1_P7 At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, of a second amino acid sequence homologous and a polypeptide having the sequence GNPAPSDAV corresponding to amino acids 104 to 111 of R16276_PEA_1_P7. Most preferably, it comprises at least a 95% homologous third amino acid sequence, wherein said first amino acid sequence, bridging amino acid, second amino acid sequence, and third amino acid sequence are adjacent and in sequential order Provided is an isolated chimeric polypeptide encoding R16276_PEA_1_P7.

本発明の好ましい実施形態によれば、R16276_PEA_1_P7のテールをコードする単離ポリペプチドであって、R16276_PEA_1_P7中の配列GNPAPSAVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R16276_PEA_1_P7のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of R16276_PEA_1_P7, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence GNPAPSAV in R16276_PEA_1_P7 More preferably, provided is an isolated polypeptide encoding the tail of R16276_PEA_1_P7, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R16276_PEA_1_P7をコードする単離キメラポリペプチドであって、NOV_HUMANのアミノ酸1〜41に対応し、R16276_PEA_1_P7のアミノ酸1〜41にも対応するMQSVQSTSFCLRKQCLCLTFLLLHLLGQVAATQRCPPQCPGと少なくとも90%相同な第1のアミノ酸配列と、R16276_PEA_1_P7のアミノ酸42に対応する架橋アミノ酸Qと、NOV_HUMANのアミノ酸43〜103に対応し、R16276_PEA_1_P7のアミノ酸43〜103にも対応するCPATPPTCAPGVRAVLDGCSCCLVCARQRGESCSDLEPCDESSGLYCDRSADPSNQTGICTと少なくとも90%相同な第2のアミノ酸配列と、R16276_PEA_1_P7のアミノ酸104〜111に対応する配列GNPAPSAVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、架橋アミノ酸、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、R16276_PEA_1_P7をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, it is an isolated chimeric polypeptide encoding R16276_PEA_1_P7, which corresponds to amino acids 1 to 41 of NOV_HUMAN and also to amino acids 1 to 41 of R16276_PEA_1_P7 at least 90% homologous to MQSV CPATPPTCAPGPRA VLDGCSCCLCGARGGSCSDLEPCDESSGLYCDRSADPSNQTGICT corresponding to the first amino acid sequence and to the bridge amino acid Q corresponding to amino acid 42 of R16276_PEA_1_P7 and to amino acids 43 to 103 of NOV_HUMAN and also to amino acids 43 to 103 of R16276_PEA_1_P7 At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, of a second amino acid sequence homologous and a polypeptide having the sequence GNPAPSDAV corresponding to amino acids 104 to 111 of R16276_PEA_1_P7. Most preferably, it comprises at least a 95% homologous third amino acid sequence, wherein said first amino acid sequence, bridging amino acid, second amino acid sequence, and third amino acid sequence are adjacent and in sequential order Provided is an isolated chimeric polypeptide encoding R16276_PEA_1_P7.

本発明の好ましい実施形態によれば、R16276_PEA_1_P7のテールをコードする単離ポリペプチドであって、R16276_PEA_1_P7中の配列GNPAPSAVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R16276_PEA_1_P7のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of R16276_PEA_1_P7, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence GNPAPSAV in R16276_PEA_1_P7 More preferably, provided is an isolated polypeptide encoding the tail of R16276_PEA_1_P7, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、HUMCEA_PEA_1_P4をコードする単離キメラポリペプチドであって、CEA5_HUMANのアミノ酸1〜234に対応し、HUMCEA_PEA_1_P4のアミノ酸1〜234にも対応するMESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREIIYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSISSNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTLTLFNVTRNDTASYKCETQNPVSARRSDSVILNVLと少なくとも90%相同な第1のアミノ酸配列と、HUMCEA_PEA_1_P4のアミノ酸235〜315に対応する配列CEYICSSLAQAASPNPQGQRQDFSVPLRFKYTDPQPWTSRLSVTFCPRKTWADQVLTKNRRGGAASVLGGSGSTPYDGRNRを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCEA_PEA_1_P4をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding HUMCEA_PEA_1_P4, corresponding to amino acids 1-234 of CEA5_HUMAN, corresponding to amino acids 1-234 of HUMCEA_PEA_1_P4 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREIIYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSISSNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTLTLFNVTRNDTASYKCETQNPVSA A polypeptide having a first amino acid sequence which is at least 90% homologous to RSDSVILNVL and a sequence corresponding to amino acids 235 to 315 of HUMCEA_PEA_1_P4 CEYICSSLAQAASPNPQGQRQDFSVPLRFY TDPQPWTSRLSVTFCRTKDRTG NRAGGAASVLGGSGSTPYDGRNR and at least 70%, preferably at least 80%, preferably at least 80% Comprises HUMCEA_PEA_1_P4, which comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first amino acid sequence and the second amino acid sequence being adjacent and in sequential order An isolated chimeric polypeptide is provided.

本発明の好ましい実施形態によれば、HUMCEA_PEA_1_P4のテールをコードする単離ポリペプチドであって、HUMCEA_PEA_1_P4中の配列CEYICSSLAQAASPNPQGQRQDFSVPLRFKYTDPQPWTSRLSVTFCPRKTWADQVLTKNRRGGAASVLGGSGSTPYDGRNRと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMCEA_PEA_1_P4のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of HUMCEA_PEA_1_P4, wherein at least 70%, preferably at least 70%, preferably at least 70%. More preferably, provided is an isolated polypeptide encoding the tail of HUMCEA_PEA_1_P4, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、HUMCEA_PEA_1_P5をコードする単離キメラポリペプチドであって、CEA5_HUMANのアミノ酸1〜675に対応し、HUMCEA_PEA_1_P5のアミノ酸1〜675にも対応するMESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREIIYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSISSNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTLTLFNVTRNDTASYKCETQNPVSARRSDSVILNVLYGPDAPTISPLNTSYRSGENLNLSCHAASNPPAQYSWFVNGTFQQSTQELFIPNITVNNSGSYTCQAHNSDTGLNRTTVTTITVYAEPPKPFITSNNSNPVEDEDAVALTCEPEIQNTTYLWWVNNQSLPVSPRLQLSNDNRTLTLLSVTRNDVGPYECGIQNELSVDHSDPVILNVLYGPDDPTISPSYTYYRPGVNLSLSCHAASNPPAQYSWLIDGNIQQHTQELFISNITEKNSGLYTCQANNSASGHSRTTVKTITVSAELPKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLSNGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISPPDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNNGTYACFVSNLATGRNNSIVKSITVSと少なくとも90%相同な第1のアミノ酸配列と、HUMCEA_PEA_1_P5のアミノ酸676〜719に対応する配列GKWLPGASASYSGVESIWFSPKSQEDIFFPSLCSMGTRKSQILSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCEA_PEA_1_P5をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding HUMCEA_PEA_1_P5, corresponding to amino acids 1-675 of CEA5_HUMAN, corresponding to amino acids 1-675 of HUMCEA_PEA_1_P5 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREIIYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSISSNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTLTLFNVTRNDTASYKCETQNPVSA RSDSVILNVLYGPDAPTISPLNTSYRSGENLNLSCHAASNPPAQYSWFVNGTFQQSTQELFIPNITVNNSGSYTCQAHNSDTGLNRTTVTTITVYAEPPKPFITSNNSNPVEDEDAVALTCEPEIQNTTYLWWVNNQSLPVSPRLQLSNDNRTLTLLSVTRNDVGPYECGIQNELSVDHSDPVILNVLYGPDDPTISPSYTYYRPGVNLSLSCHAASNPPAQYSWLIDGNIQQHTQELFISNITEKNSGLYTCQANNSASGHSRTTVKTITVSAELPKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLSNGNRTL The LIFH s s s s s s s s s s s s sssssssssssssssssss a required amino acid sequence of at least 90% homology with the 1st amino acid sequence and a HUMCEA_PEA5_ P5 Comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first amino acid sequence and the second amino acid sequence Provided is an isolated chimeric polypeptide encoding HUMCEA_PEA_1_P5, wherein the amino acid sequences are in contiguous and sequential order.

本発明の好ましい実施形態によれば、HUMCEA_PEA_1_P5のテールをコードする単離ポリペプチドであって、HUMCEA_PEA_1_P5中の配列GKWLPGASASYSGVESIWFSPKSQEDIFFPSLCSMGTRKSQILSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMCEA_PEA_1_P5のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of HUMCEA_PEA_1_P5, which is at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence GKWLPGASASYSGVESIWFSPKSQEDFFPSLCSMGTRKSQILS in the sequence HUMCEA_PEA_1_P5 More preferably, provided is an isolated polypeptide encoding the tail of HUMCEA_PEA_1_P5, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、HUMCEA_PEA_1_P19をコードする単離キメラポリペプチドであって、CEA5_HUMANのアミノ酸1〜232に対応し、HUMCEA_PEA_1_P19のアミノ酸1〜232にも対応するMESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREIIYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSISSNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTLTLFNVTRNDTASYKCETQNPVSARRSDSVILNと少なくとも90%相同な第1のアミノ酸配列と、CEA5_HUMANのアミノ酸589〜702に対応し、HUMCEA_PEA_1_P19のアミノ酸233〜346にも対応するVLYGPDTPIISPPDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNNGTYACFVSNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVALIと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCEA_PEA_1_P19をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding HUMCEA_PEA_1_P19, corresponding to amino acids 1-232 of CEA5_HUMAN, corresponding to amino acids 1-232 of HUMCEA_PEA_1_P19 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREIIYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSISSNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTLTLFNVTRNDTASYKCETQNPV ARLYSDSVILN is a first amino acid sequence that is at least 90% homologous to ARRS SDS VILN and corresponds to amino acids 589-702 of CEA5_HUMAN and also corresponds to amino acids 233-346 of HUMCEA_PEA_1_P19. Provided is an isolated chimeric polypeptide encoding HUMCEA_PEA_1_P19, wherein the first and second amino acid sequences are adjacent and in sequential order.

本発明の好ましい実施形態によれば、HUMCEA_PEA_1_P19の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がNVを含み、以下の構造:アミノ酸番号232−x〜232のいずれかから始まり、アミノ酸番号233+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HUMCEA_PEA_1_P19の縁部分をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding the edge portion of HUMCEA_PEA_1_P19, having a length “n”, wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids in length, preferably at least about 30 amino acids in length, more preferably at least about 40 amino acids in length, most preferably at least about 50 amino acids in length), wherein at least two amino acids comprise NV and have the following structure: A polypeptide having a sequence beginning with any of the numbers 232-x-232 and ending with the amino acid number 233 + ((n-2) -x), wherein x varies from 0 to n-2 Provided is an isolated chimeric polypeptide encoding an edge portion of HUMCEA_PEA_1_P19.

本発明の好ましい実施形態によれば、HUMCEA_PEA_1_P20をコードする単離キメラポリペプチドであって、CEA5_HUMANのアミノ酸1〜142に対応し、HUMCEA_PEA_1_P20のアミノ酸1〜142にも対応するMESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREIIYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPと少なくとも90%相同な第1のアミノ酸配列と、CEA5_HUMANのアミノ酸499〜702に対応し、HUMCEA_PEA_1_P20のアミノ酸143〜346にも対応するELPKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLSNGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISPPDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNNGTYACFVSNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVALIと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCEA_PEA_1_P20をコードする単離キメラポリペプチドを提供する。   A MELPTUS JET JPG JUT is a JCH, which is the isolated chimeric polypeptide coding for HUMC. This is an isolated chimeric polypeptide coding for HUMC. The first amino acid sequence corresponds to amino acids 499-702 of CEA5_HUMAN and to amino acids 143-346 of HUMCEA_PEA_1_P20 And a corresponding ELPKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLSNGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISPPDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNNGTYACFVSNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVALI at least 90% homologous second amino acid sequence, the first amino acid sequence and a second amino acid sequence, contiguous and in sequential order, isolated chimera encoding HUMCEA_PEA_1_P20 Provided is a polypeptide.

本発明の好ましい実施形態によれば、HUMCEA_PEA_1_P20の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がPEを含み、以下の構造:アミノ酸番号142−x〜142のいずれかから始まり、アミノ酸番号143+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HUMCEA_PEA_1_P20の縁部分をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding the edge portion of HUMCEA_PEA_1_P20, having a length “n”, wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids in length, preferably at least about 30 amino acids in length, more preferably at least about 40 amino acids in length, most preferably at least about 50 amino acids in length), wherein at least two amino acids comprise PE; A polypeptide having a sequence beginning with any of the numbers 142-x to 142 and ending with the amino acid number 143 + ((n-2) -x), wherein x varies from 0 to n-2 Provided is an isolated chimeric polypeptide encoding an edge portion of HUMCEA_PEA_1_P20.

本発明の好ましい実施形態によれば、Z44808_PEA_1_P5をコードする単離キメラポリペプチドであって、SMO2_HUMANのアミノ酸1〜441に対応し、Z44808_PEA_1_P5のアミノ酸1〜441にも対応するMLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQKPLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKTPRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQVKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQCHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQLQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEERVVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNNDKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQと少なくとも90%相同な第1のアミノ酸配列と、Z44808_PEA_1_P5のアミノ酸442〜464に対応する配列DAMVVSSRPKATTHRKSRTLSRRを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z44808_PEA_1_P5をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding Z44808_PEA_1_P5, corresponding to amino acids 1-441 of SMO2_HUMAN, corresponding to amino acids 1-441 of Z44808_PEA_1_P5 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQKPLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKTPRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQVKSRQNKTNKNSVSSCDQEHQSA A first amino acid sequence at least 90% homologous to IieikeikyuPikeienudienubuibuiaipiishieieichijijieruwaikeiPibuikyushieichiPiesutijiwaishidaburyushibuierubuiditijiaruPiaiPijitiesutiaruwaiikyuPikeishidienutieiarueieichiPieikeieiarudieruwaikeijiarukyuerukyujishiPijieikeikeieichiiefuerutiesubuierudieieruesutidiemubuieichieieiesudiPiesuesuesuesujiarueruesuiPidiPiesueichitieruiiarubuibuieichidaburyuwaiefukeieruerudikeienuesuesujidiaijikeikeiiaikeiPiefukeiaruefueruarukeikeiesukeiPikeikeishibuikeikeiefubuiiwaishidibuienuenudikeiesuaiesubuikyuieruemujishierujibuieiKEDGKADTKKRHTPRGHAESTSNRQ, polypeptide at least 70% with a sequence corresponding to DAMVVSSRPKATTHRKSRTLSRR to amino acid 442-464 of Z44808_PEA_1_P5, optionally at least 80%, Preferably, it comprises a second amino acid sequence which is at least 85%, more preferably at least 90%, most preferably at least 95% homologous, said first and second amino acid sequences being adjacent and in a consecutive order Provided is an isolated chimeric polypeptide encoding Z44808_PEA_1_P5.

本発明の好ましい実施形態によれば、Z44808_PEA_1_P5のテールをコードする単離ポリペプチドであって、Z44808_PEA_1_P5中の配列DAMVVSSRPKATTHRKSRTLSRRと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z44808_PEA_1_P5のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of Z44808_PEA_1_P5, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence DAMVVSsRPKATTHRKSRTLSRR in Z44808_PEA_1_P5 More preferably, provided is an isolated polypeptide encoding the tail of Z44808_PEA_1_P5, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、Z44808_PEA_1_P6をコードする単離キメラポリペプチドであって、SMO2_HUMANのアミノ酸1〜428に対応し、Z44808_PEA_1_P6のアミノ酸1〜428にも対応するMLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQKPLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKTPRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQVKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQCHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQLQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEERVVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNNDKSISVQELMGCLGVAKEDGKADTKKRHと少なくとも90%相同な第1のアミノ酸配列と、Z44808_PEA_1_P6のアミノ酸429〜434に対応する配列RSKRNLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z44808_PEA_1_P6をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding Z44808_PEA_1_P6, corresponding to amino acids 1-428 of SMO2_HUMAN, corresponding to amino acids 1-428 of Z44808_PEA_1_P6 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQKPLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKTPRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQVKSRQNKTNKNSVSSCDQEHQSA A first amino acid sequence at least 90% homologous to IieikeikyuPikeienudienubuibuiaipiishieieichijijieruwaikeiPibuikyushieichiPiesutijiwaishidaburyushibuierubuiditijiaruPiaiPijitiesutiaruwaiikyuPikeishidienutieiarueieichiPieikeieiarudieruwaikeijiarukyuerukyujishiPijieikeikeieichiiefuerutiesubuierudieieruesutidiemubuieichieieiesudiPiesuesuesuesujiarueruesuiPidiPiesueichitieruiiarubuibuieichidaburyuwaiefukeieruerudikeienuesuesujidiaijikeikeiiaikeiPiefukeiaruefueruarukeikeiesukeiPikeikeishibuikeikeiefubuiiwaishidibuienuenudikeiesuISVQELMGCLGVAKEDGKADTKKRH, polypeptide at least 70% with a sequence corresponding to RSKRNL to amino acid 429-434 of Z44808_PEA_1_P6, optionally at least 80%, preferably at least 85%, more Preferably at least 90%, An isolated chimeric polypeptide encoding Z44808_PEA_1_P6, preferably also comprising a second amino acid sequence which is at least 95% homologous, said first and second amino acid sequences being adjacent and in sequential order .

本発明の好ましい実施形態によれば、Z44808_PEA_1_P6のテールをコードする単離ポリペプチドであって、Z44808_PEA_1_P6中の配列RSKRNLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z44808_PEA_1_P6のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of Z44808_PEA_1_P6, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence RSKRNL in Z44808_PEA_1_P6 More preferably, provided is an isolated polypeptide encoding the tail of Z44808_PEA_1_P6, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、Z44808_PEA_1_P7をコードする単離キメラポリペプチドであって、SMO2_HUMANのアミノ酸1〜441に対応し、Z44808_PEA_1_P7のアミノ酸1〜441にも対応するMLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQKPLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKTPRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQVKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQCHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQLQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEERVVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNNDKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQと少なくとも90%相同な第1のアミノ酸配列と、Z44808_PEA_1_P7のアミノ酸442〜454に対応する配列LLWLRGKVSFYCFを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z44808_PEA_1_P7をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding Z44808_PEA_1_P7, corresponding to amino acids 1-441 of SMO2_HUMAN, corresponding to amino acids 1-441 of Z44808_PEA_1_P7 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQKPLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKTPRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQVKSRQNKTNKNSVSSCDQEHQSA A first amino acid sequence at least 90% homologous to IieikeikyuPikeienudienubuibuiaipiishieieichijijieruwaikeiPibuikyushieichiPiesutijiwaishidaburyushibuierubuiditijiaruPiaiPijitiesutiaruwaiikyuPikeishidienutieiarueieichiPieikeieiarudieruwaikeijiarukyuerukyujishiPijieikeikeieichiiefuerutiesubuierudieieruesutidiemubuieichieieiesudiPiesuesuesuesujiarueruesuiPidiPiesueichitieruiiarubuibuieichidaburyuwaiefukeieruerudikeienuesuesujidiaijikeikeiiaikeiPiefukeiaruefueruarukeikeiesukeiPikeikeishibuikeikeiefubuiiwaishidibuienuenudikeiesuaiesubuikyuieruemujishierujibuieiKEDGKADTKKRHTPRGHAESTSNRQ, polypeptide at least 70% with a sequence corresponding to LLWLRGKVSFYCF to amino acid 442-454 of Z44808_PEA_1_P7, optionally at least 80%, preferably at least Z44808_PEA_1_P7 comprising a second amino acid sequence that is 5%, more preferably at least 90%, most preferably at least 95% homologous, said first and second amino acid sequences being in a contiguous and consecutive order Provided is an isolated chimeric polypeptide that encodes.

本発明の好ましい実施形態によれば、Z44808_PEA_1_P7のテールをコードする単離ポリペプチドであって、Z44808_PEA_1_P7中の配列LLWLRGKVSFYCFと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z44808_PEA_1_P7のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of Z44808_PEA_1_P7, comprising at least 70%, optionally at least about 80%, preferably at least about 85% of the sequence LLWLRGKVSFYCF in Z44808_PEA_1_P7. More preferably, provided is an isolated polypeptide encoding the tail of Z44808_PEA_1_P7, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、Z44808_PEA_1_P11をコードする単離キメラポリペプチドであって、SMO2_HUMANのアミノ酸1〜170に対応し、Z44808_PEA_1_P11のアミノ酸1〜170にも対応するMLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQKPLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKTPRCPGSVNEKLPQREGTGKTと少なくとも90%相同な第1のアミノ酸配列と、SMO2_HUMANのアミノ酸188〜446に対応し、Z44808_PEA_1_P11のアミノ酸171〜429にも対応するDIASRYPTLWTEQVKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQCHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQLQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEERVVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNNDKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQPRKQGと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z44808_PEA_1_P11をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding Z44808_PEA_1_P11, it corresponds to amino acids 1 - 170 of SMO2_HUMAN, at least 90% homologous I and MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQKPLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKTPRCPGSVNEKLPQREGTGKT corresponding to amino acids 1 - 170 of Z44808_PEA_1_P11 The first amino acid sequence corresponds to amino acids 188 to 446 of SMO2_HUMAN, Z Also amino acids 171-429 of 4808_PEA_1_P11 and a corresponding DIASRYPTLWTEQVKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQCHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQLQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEERVVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNNDKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQPRKQG at least 90% homologous second amino acid sequence, wherein the first and second amino acid distribution , Adjacent, and in sequential order, provides an isolated chimeric polypeptide coding Z44808_PEA_1_P11.

本発明の好ましい実施形態によれば、Z44808_PEA_1_P11の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がTDを含み、以下の構造:アミノ酸番号170−x〜170のいずれかから始まり、アミノ酸番号171+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、Z44808_PEA_1_P11の縁部分をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding the edge portion of Z44808_PEA_1_P11, having a length “n”, wherein n is at least about 10 amino acids in length, optionally at least about at least about 20 amino acids in length, preferably at least about 30 amino acids in length, more preferably at least about 40 amino acids in length, most preferably at least about 50 amino acids in length), wherein at least two amino acids comprise TD and have the following structure: A polypeptide having a sequence beginning with any of the numbers 170-x to 170 and ending with the amino acid number 171 + ((n-2)-x), wherein x varies from 0 to n-2 Provided is an isolated chimeric polypeptide encoding the edge portion of Z44808_PEA_1_P11, including.

本発明の好ましい実施形態によれば、H61775_P16をコードする単離キメラポリペプチドであって、Q9P2J2のアミノ酸11〜93に対応し、H61775_P16のアミノ酸1〜83にも対応するMVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRPPLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVGと少なくとも90%相同な第1のアミノ酸配列と、H61775_P16のアミノ酸84〜152に対応する配列DCGFPAFRELKRAETVSPVFFTRRCIWEDLKSTGFSPAGGGRPPGGGPRTQEDSGLPCWRSSCSVTLQVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、H61775_P16をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding H61775_P16, corresponding to amino acids 11 to 93 of Q9P2J2 and corresponding to amino acids 1 to 83 of H61775_P16. At least 70%, optionally at least 80%, with a polypeptide having the first amino acid sequence and the sequence DCGFPAFRELKRAETEVSPFFTFRTRICIWEDLKSTSFSPAGGRPPGGG PRTQEDSGLPCCWSRSSTLQV corresponding to amino acids 84-152 of H61775_P16, optionally at least 80%, Preferably, it comprises a second amino acid sequence which is at least 85%, more preferably at least 90%, most preferably at least 95% homologous, said first and second amino acid sequences being adjacent and in a consecutive order Provided is an isolated chimeric polypeptide encoding H61775_P16.

本発明の好ましい実施形態によれば、H61775_P16のテールをコードする単離ポリペプチドであって、H61775_P16中の配列DCGFPAFRELKRAETVSPVFFTRRCIWEDLKSTGFSPAGGGRPPGGGPRTQEDSGLPCWRSSCSVTLQVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、H61775_P16のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of H61775_P16, which is at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence DCGFPAFRELKRAETEVPVPFFTRRCIWEDLKSTGFSPAGGGRPPGGGPRTQEDSGPCPCRSSCSVTLQV in H61775_P16 Provided is an isolated polypeptide encoding the tail of H61775_P16, more preferably comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、H61775_P16をコードする単離キメラポリペプチドであって、AAQ88495のアミノ酸1〜83に対応し、H61775_P16のアミノ酸1〜83にも対応するMVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRPPLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVGと少なくとも90%相同な第1のアミノ酸配列と、H61775_P16のアミノ酸84〜152に対応する配列DCGFPAFRELKRAETVSPVFFTRRCIWEDLKSTGFSPAGGGRPPGGGPRTQEDSGLPCWRSSCSVTLQVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、H61775_P16をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding H61775_P16, corresponding to amino acids 1 to 83 of AAQ 88495 and also corresponding to amino acids 1 to 83 of H61775_P16, is at least 90% homologous to A polypeptide having at least 70%, optionally at least 80% with a polypeptide having the first amino acid sequence and the sequence DCGFPAFRELKRAETEVSPFFTFRTRICIWEDLKSTGFSPAGGGRPPGGGPRTQEDSGLPCCWSRSSTLQV corresponding to amino acids 84-152 of H61775_P16 Preferably, it comprises a second amino acid sequence which is at least 85%, more preferably at least 90%, most preferably at least 95% homologous, said first and second amino acid sequences being adjacent and in sequential order , Provides an isolated chimeric polypeptide encoding H61775_P16.

本発明の好ましい実施形態によれば、H61775_P16のテールをコードする単離ポリペプチドであって、H61775_P16中の配列DCGFPAFRELKRAETVSPVFFTRRCIWEDLKSTGFSPAGGGRPPGGGPRTQEDSGLPCWRSSCSVTLQVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、H61775_P16のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of H61775_P16, which is at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence DCGFPAFRELKRAETEVPVPFFTRRCIWEDLKSTGFSPAGGGRPPGGGPRTQEDSGPCPCRSSCSVTLQV in H61775_P16 Provided is an isolated polypeptide encoding the tail of H61775_P16, more preferably comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、H61775_P17をコードする単離キメラポリペプチドであって、Q9P2J2のアミノ酸11〜93に対応し、H61775_P17のアミノ酸1〜83にも対応するMVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRPPLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVGと少なくとも90%相同な第1のアミノ酸配列を含む、H61775_P17をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding H61775_P17, corresponding to amino acids 11 to 93 of Q9P2J2 and corresponding to amino acids 1 to 83 of H61775_P17. Provided is an isolated chimeric polypeptide encoding H61775_P17, which comprises a first amino acid sequence.

本発明の好ましい実施形態によれば、H61775_P17をコードする単離キメラポリペプチドであって、AAQ88495のアミノ酸1〜83に対応し、H61775_P17のアミノ酸1〜83にも対応するMVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRPPLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVGと少なくとも90%相同な第1のアミノ酸配列を含む、H61775_P17をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding H61775_P17, corresponding to amino acids 1 to 83 of AAQ 88495 and also corresponding to amino acids 1 to 83 of H61775_P17, is at least 90% homologous to Provided is an isolated chimeric polypeptide encoding H61775_P17, which comprises a first amino acid sequence.

本発明の好ましい実施形態によれば、M85491_PEA_1_P13をコードする単離キメラポリペプチドであって、EPB2_HUMANのアミノ酸1〜476に対応し、M85491_PEA_1_P13のアミノ酸1〜476にも対応するMALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYDENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSIPSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQVDLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRIIQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVPIGRCMCKAGFEAVENGTVCRGCPSGTFKANQGDEACTHCPINSRTTSEGATNCVCRNGYYRADLDPLDMPCTTIPSAPQAVISSVNETSLMLEWTPPRDSGGREDLVYNIICKSCGSGRGACTRCGDNVQYAPRQLGLTEPRIYISDLLAHTQYTFEIQAVNGVTDQSPFSPQFASVNITTNQAAPSAVSIMHQVSRTVDSITLSWSQPDQPNGVILDYELQYYEKと少なくとも90%相同な第1のアミノ酸配列と、M85491_PEA_1_P13のアミノ酸477〜496に対応する配列VPIGWVLSPSPTSLRAPLPGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、M85491_PEA_1_P13をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding M85491_PEA_1_P13, corresponding to amino acids 1-476 of EPB2_HUMAN, corresponding to amino acids 1-476 of M85491_PEA_1_P13 MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYDENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSIPSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQVDLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRIIQNGAIFQETLSGAESTSLVA The first amino acid sequence at least 90% homologous to ArujiesushiaieienueiiibuidibuiPiaikeieruwaishienujidijiidaburyuerubuiPiaijiarushiemushikeieijiefuieibuiienujitibuishiarujishiPiesujitiefukeieienukyujidiieishitieichishiPiaienuesuarutitiesuijieitienushibuishiaruenujiwaiwaiarueidierudiPierudiemuPishititiaiPiesueiPikyueibuiaiesuesubuienuitiesueruemueruidaburyutiPiPiarudiesujijiaruidierubuiwaienuaiaishikeiesushijiesujiarujieishitiarushijidienubuikyuwaieiPiarukyuerujierutiiPiaruaiwaiaiesudieruerueieichitikyuwaitiefuiaikyueibuienujibuitidikyuesuPiefuesuPikyuefueiesubuienuaititienukyueieiPiesueibuiesuaiemueichikyubuiesuarutibuidiesuITLSWSQPDQPNGVILDYELQYYEK, sequence VPIGWVLSPSPTSLRAPLPG corresponding to amino acids 477-496 of M85491_PEA_1_P13 A first amino acid sequence having at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homology to the polypeptide having Provided is an isolated chimeric polypeptide encoding M85491_PEA_1_P13, wherein the second amino acid sequence is in a contiguous and sequential order.

本発明の好ましい実施形態によれば、M85491_PEA_1_P13のテールをコードする単離ポリペプチドであって、M85491_PEA_1_P13中の配列VPIGWVLSPSPTSLRAPLPGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of M85491_PEA_1_P13, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence VPIGWVLSPSPTSLRAPLPG in M85491_PEA_1_P13 More preferably, an isolated polypeptide encoding a tail of at least about 90%, most preferably at least about 95% homologous polypeptide is provided.

本発明の好ましい実施形態によれば、M85491_PEA_1_P14をコードする単離キメラポリペプチドであって、EPB2_HUMANのアミノ酸1〜270に対応し、M85491_PEA_1_P14のアミノ酸1〜270にも対応するMALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYDENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSIPSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQVDLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRIIQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVPIGRCMCKAGFEAVENGTVCRと少なくとも90%相同な第1のアミノ酸配列と、M85491_PEA_1_P14のアミノ酸271〜301に対応する配列ERQDLTMLSRLVLNSWPQMILPPQPPKVLELを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、M85491_PEA_1_P14をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding M85491_PEA_1_P14, corresponding to amino acids 1-270 of EPB2_HUMAN, corresponding to amino acids 1-270 of M85491_PEA_1_P14 MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYDENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSIPSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQVDLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRIIQNGAIFQETLSGAESTSLVA A polypeptide having at least 70%, optionally at least 80%, preferably at least 85%, preferably having a first amino acid sequence at least 90% homologous to RGSCIANAEEVDVPIKLYCNGDGEWLVPIGRCMCKAGFEAVENGTVCR and the sequence ERQDLTMLSRLVLSNSWPQMILPPPQPPKVLEL corresponding to amino acids 271 to 301 of M85491_PEA_1_P14 Is an isolated chimera encoding M85491_PEA_1_P14, comprising a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first and second amino acid sequences being adjacent and in sequential order Provided is a polypeptide.

本発明の好ましい実施形態によれば、M85491_PEA_1_P14のテールをコードする単離ポリペプチドであって、M85491_PEA_1_P14中の配列ERQDLTMLSRLVLNSWPQMILPPQPPKVLELと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M85491_PEA_1_P14のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of M85491_PEA_1_P14, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence ERQDLTMLRSRLVLNSSWQMIPPPPPPKVLEL in M85491_PEA_1_P14 More preferably, provided is an isolated polypeptide encoding the tail of M85491_PEA_1_P14, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、T39971_P6をコードする単離キメラポリペプチドであって、VTNC_HUMANのアミノ酸1〜276に対応し、T39971_P6のアミノ酸1〜276にも対応するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGと少なくとも90%相同な第1のアミノ酸配列と、T39971_P6のアミノ酸277〜283に対応する配列TQGVVGDを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、T39971_P6をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding T39971_P6, corresponding to amino acids 1-276 of VTNC_HUMAN, corresponding to amino acids 1-276 of T39971_P6 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVL And a polypeptide having a sequence of TQGVVGD corresponding to amino acids 277 to 283 of T39971_P6, at least 70%, optionally at least 80%, preferably at least 85%, more preferably a first amino acid sequence at least 90% homologous to PDYPRNISDDGFD. Is an isolated chimera encoding T39971_P6, comprising a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first and second amino acid sequences being in a contiguous and sequential order Provided is a polypeptide.

本発明の好ましい実施形態によれば、T39971_P6のテールをコードする単離ポリペプチドであって、T39971_P6中の配列TQGVVGDと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T39971_P6のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of T39971_P6, which is at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence TQGVVGD in T39971_P6. More preferably, provided is an isolated polypeptide encoding the tail of T39971_P6, comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、T39971_P9をコードする単離キメラポリペプチドであって、VTNC_HUMANのアミノ酸1〜325に対応し、T39971_P9のアミノ酸1〜325にも対応するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSAVFEHFAMMQRDSWEDIFELLFWGRTと少なくとも90%相同な第1のアミノ酸配列と、VTNC_HUMANのアミノ酸357〜478に対応し、T39971_P9のアミノ酸326〜447にも対応するSGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRATWLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHLと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、T39971_P9をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding T39971_P9, corresponding to amino acids 1-325 of VTNC_HUMAN, corresponding to amino acids 1-325 of T39971_P9 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVL The first amino acid sequence at least 90% homologous to PidiwaiPiaruenuaiesudijiefudijiaiPidienubuidieieierueieruPieieichiesuwaiesujiaruiarubuiwaiefuefukeijikeikyuwaidaburyuiwaikyuefukyueichikyuPiesukyuiishiijiesuesueruesueiVFEHFAMMQRDSWEDIFELLFWGRT, corresponding to amino acids 357-478 of VTNC_HUMAN, and a corresponding SGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRATWLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHL at least 90% homologous second amino acid sequence to amino acids 326-447 of T39971_P9, The first and second amino acid sequences are adjacent to each other And, and in sequential order, it provides an isolated chimeric polypeptide coding T39971_P9.

本発明の好ましい実施形態によれば、T39971_P9の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がTSを含み、以下の構造:アミノ酸番号325−x〜325のいずれかから始まり、アミノ酸番号326+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、T39971_P9の縁部分をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding the rim portion of T39971_P9, having a length "n", wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids in length, preferably at least about 30 amino acids in length, more preferably at least about 40 amino acids in length, most preferably at least about 50 amino acids in length), wherein at least two amino acids comprise TS and have the following structure: A polypeptide having a sequence beginning with any of the numbers 325-x to 325 and ending with the amino acid number 326 + ((n-2) -x), wherein x varies from 0 to n-2 Provided is an isolated chimeric polypeptide encoding the edge portion of T39971_P9, including:

本発明の好ましい実施形態によれば、T39971_P11をコードする単離キメラポリペプチドであって、VTNC_HUMANのアミノ酸1〜326に対応し、T39971_P11のアミノ酸1〜326にも対応するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSAVFEHFAMMQRDSWEDIFELLFWGRTSと少なくとも90%相同な第1のアミノ酸配列と、VTNC_HUMANのアミノ酸442〜478に対応し、T39971_P11のアミノ酸327〜363にも対応するDKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHLと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、T39971_P11をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding T39971_P11, corresponding to amino acids 1-326 of VTNC_HUMAN, corresponding to amino acids 1-326 of T39971_P11 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDG LQDQ with a first amino acid sequence that is at least 90% homologous to the first amino acid sequence of at least 90% homologous to the TPNC_HUMAN and also to the amino acids 327-363 of the T 399 71 _ P 11 The present invention provides an isolated chimeric polypeptide encoding T39971_P11, wherein the first and second amino acid sequences are adjacent and in sequential order.

本発明の好ましい実施形態によれば、T39971_P11の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がSDを含み、以下の構造:アミノ酸番号326−x〜326のいずれかから始まり、アミノ酸番号327+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、T39971_P11の縁部分をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding the edge portion of T39971_P11, which has a length "n", wherein n is at least about 10 amino acids in length, optionally at least about 20 amino acids in length, preferably at least about 30 amino acids in length, more preferably at least about 40 amino acids in length, most preferably at least about 50 amino acids in length), wherein at least two amino acids comprise SD and have the following structure: A polypeptide having a sequence beginning with any of the numbers 326-x to 326 and ending at the amino acid number 327 + ((n-2) -x), wherein x varies from 0 to n-2. Provided is an isolated chimeric polypeptide encoding the edge portion of T39971_P11, including:

本発明の好ましい実施形態によれば、T39971_P11をコードする単離キメラポリペプチドであって、Q9BSH7のアミノ酸1〜326に対応し、T39971_P11のアミノ酸1〜326にも対応するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSAVFEHFAMMQRDSWEDIFELLFWGRTSと少なくとも90%相同な第1のアミノ酸配列と、Q9BSH7のアミノ酸442〜478に対応し、T39971_P11のアミノ酸327〜363にも対応するDKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHLと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、T39971_P11をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding T39971_P11, corresponding to amino acids 1-326 of Q9BSH7, corresponding to amino acids 1-326 of T39971_P11 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDP The first amino acid sequence at least 90% homologous to WaiPiaruenuaiesudijiefudijiaiPidienubuidieieierueieruPieieichiesuwaiesujiaruiarubuiwaiefuefukeijikeikyuwaidaburyuiwaikyuefukyueichikyuPiesukyuiishiijiesuesueruesueibuiFEHFAMMQRDSWEDIFELLFWGRTS, corresponding to amino acids 442-478 of Q9BSH7, and a corresponding DKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHL at least 90% homologous second amino acid sequence to amino acids 327-363 of T39971_P11, The present invention provides an isolated chimeric polypeptide encoding T39971_P11, wherein the first and second amino acid sequences are adjacent and in sequential order.

本発明の好ましい実施形態によれば、T39971_P11の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がSDを含み、以下の構造:アミノ酸番号326−x〜326のいずれかから始まり、アミノ酸番号327+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、T39971_P11の縁部分をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding the edge portion of T39971_P11, which has a length "n", wherein n is at least about 10 amino acids in length, optionally at least about 20 amino acids in length, preferably at least about 30 amino acids in length, more preferably at least about 40 amino acids in length, most preferably at least about 50 amino acids in length), wherein at least two amino acids comprise SD and have the following structure: A polypeptide having a sequence beginning with any of the numbers 326-x to 326 and ending at the amino acid number 327 + ((n-2) -x), wherein x varies from 0 to n-2. Provided is an isolated chimeric polypeptide encoding the edge portion of T39971_P11, including:

本発明の好ましい実施形態によれば、T39971_P12をコードする単離キメラポリペプチドであって、VTNC_HUMANのアミノ酸1〜223に対応し、T39971_P12のアミノ酸1〜223にも対応するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKと少なくとも90%相同な第1のアミノ酸配列と、T39971_P12のアミノ酸224〜238に対応する配列VPGAVGQGRKHLGRVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、T39971_P12をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding T39971_P12, corresponding to amino acids 1-223 of VTNC_HUMAN, MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFK at least 90% homologous to corresponding to amino acids 1-223 of T39971_P12 At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably a polypeptide having the sequence VPGAVGQGRKHLGRV corresponding to amino acids 224 to 238 of T39971_P12. An isolated chimeric polypeptide encoding T39971_P12 is provided, which comprises a second amino acid sequence which is preferably at least 95% homologous, said first and second amino acid sequences being adjacent and in sequential order.

本発明の好ましい実施形態によれば、T39971_P12のテールをコードする単離ポリペプチドであって、T39971_P12中の配列VPGAVGQGRKHLGRVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T39971_P12のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of T39971_P12, comprising at least 70%, optionally at least about 80%, preferably at least about 85% of the sequence VPGAVGQGRKHLGRV in T39971_P12. Provided is an isolated polypeptide encoding the tail of T39971_P12, more preferably comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、T39971_P12をコードする単離キメラポリペプチドであって、Q9BSH7のアミノ酸1〜223に対応し、T39971_P12のアミノ酸1〜223にも対応するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKと少なくとも90%相同な第1のアミノ酸配列と、T39971_P12のアミノ酸224〜238に対応する配列VPGAVGQGRKHLGRVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、T39971_P12をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding T39971_P12, corresponding to amino acids 1-223 of Q9BSH7, at least 90% homologous with the corresponding MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFK to amino acids 1-223 of T39971_P12 First At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% of the amino acid sequence and a polypeptide having the sequence VPGAVGQGRKHLGRV corresponding to amino acids 224 to 238 of T39971_P12 An isolated chimeric polypeptide encoding T39971_P12, which comprises a% homologous second amino acid sequence, wherein the first and second amino acid sequences are adjacent and in sequential order.

本発明の好ましい実施形態によれば、T39971_P12のテールをコードする単離ポリペプチドであって、T39971_P12中の配列VPGAVGQGRKHLGRVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T39971_P12のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of T39971_P12, comprising at least 70%, optionally at least about 80%, preferably at least about 85% of the sequence VPGAVGQGRKHLGRV in T39971_P12. Provided is an isolated polypeptide encoding the tail of T39971_P12, more preferably comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、Z21368_PEA_1_P2をコードする単離キメラポリペプチドであって、SUL1_HUMANのアミノ酸1〜761に対応し、Z21368_PEA_1_P2のアミノ酸1〜761にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNと少なくとも90%相同な第1のアミノ酸配列と、Z21368_PEA_1_P2のアミノ酸762〜790に対応する配列PHKYSAHGRTRHFESATRTTNGAQKLSRIを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P2をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding Z21368_PEA_1_P2, corresponding to amino acids 1-761 of SUL1_HUMAN, corresponding to amino acids 1-761 of Z21368_PEA_1_P2 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAA HGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYD A first amino acid sequence at least 90% homologous to EnueruiiiiierukyubuierukyuPiaruenuaieikeiarueichidiijieichikeiJipiarudierukyueiesuesujijienuarujiaruemuerueidiesuesuenueibuiJipiPititibuiarubuitieichikeishiefuaieruPienudiesuaieichishiiaruieruwaikyuesueiarueidaburyukeidieichikeieiwaiaidikeiiaiieierukyudikeiaikeienueruaruibuiarujieichierukeiaruarukeiPiiishiesushiesukeikyuesuwaiwaienukeiikeijibuikeikeikyuikeierukeiesueichierueichiPiefukeiieieikyuibuidiesukeierukyueruefukeiienuenuaruaruarukeikeiiarukeiikeiaruarukyuarukeijiEECSLPGLTCFTHDNNHWQTAPFWN, at least 70% with a polypeptide having a sequence corresponding to PHKYSAHGRTRHFESATRTTNGAQKLSRI to amino acid 762-790 of Z21368_PEA_1_P2, optionally at least 80%, preferably less Z21368_PEA_1_P2 comprising a second amino acid sequence both 85%, more preferably at least 90%, most preferably at least 95% homologous, said first and second amino acid sequences being adjacent and in sequential order An isolated chimeric polypeptide encoding

本発明の好ましい実施形態によれば、Z21368_PEA_1_P2のテールをコードする単離ポリペプチドであって、Z21368_PEA_1_P2中の配列PHKYSAHGRTRHFESATRTTNGAQKLSRIと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z21368_PEA_1_P2のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of Z21368_PEA_1_P2, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence PHKYSAHGRTRHFESATRTTNGAQKLSRI in Z21368_PEA_1_P2 More preferably, provided is an isolated polypeptide encoding the tail of Z21368_PEA_1_P2, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、Z21368_PEA_1_P5をコードする単離キメラポリペプチドであって、Q7Z2W2のアミノ酸1〜57に対応し、Z21368_PEA_1_P5のアミノ酸1〜57にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELと少なくとも90%相同な第1のアミノ酸配列と、Aを含む第2の架橋アミノ酸配列と、Q7Z2W2のアミノ酸139〜871に対応し、Z21368_PEA_1_P5のアミノ酸59〜791にも対応するFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEGと少なくとも90%相同な第3のアミノ酸配列とを含み、前記第1、第2、および第3のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P5をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, it is an isolated chimeric polypeptide encoding Z21368_PEA_1_P5, which is at least 90% homologous to MKYSCCALVLGLTLGSCSTVRSPRFRIQQERKNIRPNIILVLTDDQDVEL corresponding to amino acids 1 to 57 of Q7Z2W2 and also to amino acids 1 to 57 of Z21368_PEA_1_P5. The first amino acid sequence, the second cross-linked amino acid sequence including A, and the corresponding amino acids 139-871 of Q7Z2W2 and the corresponding amino acids 59-791 of Z21368_PEA_1_P5 MVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSV At least 90% homologous with the FEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEG And an isolated chimeric polypeptide encoding Z21368_PEA_1_P5, wherein the first, second and third amino acid sequences are adjacent and in sequential order.

本発明の好ましい実施形態によれば、Z21368_PEA_1_P5の縁部分をコードする単離ポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がLAFを含み、以下の構造(Z21368_PEA_1_P5に対応する番号付け):アミノ酸番号57−x〜57のいずれかから始まり、アミノ酸番号59+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、の縁部分をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the edge portion of Z21368_PEA_1_P5, having a length “n”, wherein n is at least about 10 amino acids in length, optionally at least about 20 Preferably at least about 30 amino acids in length, more preferably at least about 40 amino acids in length and most preferably at least about 50 amino acids in length, wherein at least two amino acids comprise LAF and have the following structure (Z21368_PEA_1_P5) Corresponding numbering): A sequence beginning with any of the amino acid numbers 57-x to 57 and ending with amino acid number 59 + ((n-2) -x), where x varies from 0 to n-2 And an isolated polypeptide encoding an edge portion of the polypeptide, including the polypeptide.

本発明の好ましい実施形態によれば、Z21368_PEA_1_P5をコードする単離キメラポリペプチドであって、Z21368_PEA_1_P5のアミノ酸1〜751に対応する配列MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、AAH12997のアミノ酸1〜40に対応し、Z21368_PEA_1_P5のアミノ酸752〜791にも対応するLRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEGと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P5をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding Z21368_PEA_1_P5, corresponding to amino acids 1-751 of Z21368_PEA_1_P5 sequence MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLV GKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNL --------------------EVEVHHLHLRKRRKR PEECSCSQQS ck NQQQQQQQ ck ck. LRSCQGYKQCNPRP corresponding to 40 to 40 and also corresponding to amino acids 752 to 791 of Z21368_PEA_1_P5 An isolated chimeric polypeptide encoding Z21368_PEA_1_P5, comprising a second amino acid sequence that is at least 90% homologous to KNLDVGNKDGGSYDLHRGQLWDGWEG, wherein said first and second amino acid sequences are in contiguous and sequential order.

本発明の好ましい実施形態によれば、Z21368_PEA_1_P5の先端をコードする単離ポリペプチドであって、Z21368_PEA_1_P5の配列MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMEと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z21368_PEA_1_P5の先端をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoded by the tip of Z21368_PEA_1_P5, sequences Z21368_PEA_1_P5 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVP FIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEE A part of a part of the subject is at least a part of the lower part of the end of the subject is at the end of the lower part at the end of the lower part at the end of the lower part at the lower part of the lower part is at the end of the lower part at the lower part of the lower part at the end of the lower part of the lower part of the lower part of the lower part of the lower part of the lower part of the lower part; Provided is an isolated polypeptide.

本発明の好ましい実施形態によれば、Z21368_PEA_1_P5をコードする単離キメラポリペプチドであって、SUL1_HUMANのアミノ酸1〜57に対応し、Z21368_PEA_1_P5のアミノ酸1〜57にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELと少なくとも90%相同な第1のアミノ酸配列と、SUL1_HUMANのアミノ酸138〜871に対応し、Z21368_PEA_1_P5のアミノ酸58〜791にも対応するAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEGと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P5をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, it is an isolated chimeric polypeptide encoding Z21368_PEA_1_P5, which is at least 90% homologous to MKYSCCALVLGLTLGSCSTVRSPRFRIQQERKNIRPNIILVLTDDQDVEL corresponding to amino acids 1-57 of SUL1_HUMAN and also corresponding to amino acids 1-57 of Z21368_PEA_1_P5. The first amino acid sequence corresponds to amino acids 138-871 of SUL1_HUMAN and also corresponds to amino acids 58-791 of Z21368_PEA_1_P5. HGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYD At least 90% homologous second amino acid and NLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEG An isolated chimeric polypeptide encoding Z21368_PEA_1_P5, comprising: a sequence, wherein said first and second amino acid sequences are in contiguous and sequential order.

本発明の好ましい実施形態によれば、Z21368_PEA_1_P5の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がLAを含み、以下の構造:アミノ酸番号57−x〜57のいずれかから始まり、アミノ酸番号58+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、Z21368_PEA_1_P5の縁部分をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding the edge portion of Z21368_PEA_1_P5, having a length “n”, where n is at least about 10 amino acids long, optionally at least about 20 amino acids in length, preferably at least about 30 amino acids in length, more preferably at least about 40 amino acids in length, most preferably at least about 50 amino acids in length), wherein at least two amino acids comprise LA; A polypeptide having a sequence beginning with any of the numbers 57-x to 57 and ending with the amino acid number 58 + ((n-2) -x), wherein x varies from 0 to n-2. Provided is an isolated chimeric polypeptide encoding an edge portion of Z21368_PEA_1_P5, including:

本発明の好ましい実施形態によれば、Z21368_PEA_1_P15をコードする単離キメラポリペプチドであって、SUL1_HUMANのアミノ酸1〜416に対応し、Z21368_PEA_1_P15のアミノ酸1〜416にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGと少なくとも90%相同な第1のアミノ酸配列を含む、Z21368_PEA_1_P15をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding Z21368_PEA_1_P15, corresponding to amino acids 1-416 of SUL1_HUMAN, corresponding to amino acids 1-416 of Z21368_PEA_1_P15 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISH APHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERG and containing at least 90% homologous first amino acid sequence, provides an isolated chimeric polypeptide coding Z21368_PEA_1_P15.

本発明の好ましい実施形態によれば、Z21368_PEA_1_P16をコードする単離キメラポリペプチドであって、SUL1_HUMANのアミノ酸1〜397に対応し、Z21368_PEA_1_P16のアミノ酸1〜397にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRと少なくとも90%相同な第1のアミノ酸配列と、Z21368_PEA_1_P16のアミノ酸398〜410に対応する配列CVIVPPLSQPQIHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P16をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding Z21368_PEA_1_P16, corresponding to amino acids 1-397 of SUL1_HUMAN, corresponding to amino acids 1-397 of Z21368_PEA_1_P16 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISH A first amino acid sequence at least 90% homologous to EipieichiJipiidiesueiPikyuefuesukeieruwaiPienueiesukyueichiaitiPiesuwaienuwaieiPienuemudikeieichidaburyuaiemukyuwaitiJipiemueruPiaieichiemuiefutienuaierukyuarukeiaruerukyutieruemuesubuididiesubuiiarueruwaienuemuerubuiitijiieruienutiwaiaiaiwaitieidieichijiwaieichiaijikyuefujierubuikeijikeiesuemuPiwaidiefudiaiarubuiPiefuefuaiaruJipiesubuiiPijiesuaibuiPikyuaibuieruenuaidierueiPitiaierudiaieiGLDTPPDVDGKSVLKLLDPEKPGNR, polypeptide at least 70% with a sequence corresponding to CVIVPPLSQPQIH to amino acid 398-410 of Z21368_PEA_1_P16, optionally at least 80%, preferably at least 85%, more Preferably a second at least 90%, most preferably at least 95% homologous. And a amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, provides an isolated chimeric polypeptide coding Z21368_PEA_1_P16.

本発明の好ましい実施形態によれば、Z21368_PEA_1_P16のテールをコードする単離ポリペプチドであって、Z21368_PEA_1_P16中の配列CVIVPPLSQPQIHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z21368_PEA_1_P16のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of Z21368_PEA_1_P16, comprising at least 70%, optionally at least about 80%, preferably at least about 85% of the sequence CVIVPPLSQPQIH in Z21368_PEA_1_P16. More preferably, provided is an isolated polypeptide encoding the tail of Z21368_PEA_1_P16, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、Z21368_PEA_1_P22をコードする単離キメラポリペプチドであって、SUL1_HUMANのアミノ酸1〜188に対応し、Z21368_PEA_1_P22のアミノ酸1〜188にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKと少なくとも90%相同な第1のアミノ酸配列と、Z21368_PEA_1_P22のアミノ酸189〜210に対応する配列ARYDGDQPRCAPRPRGLSPTVFを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P22をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide coding Z21368_PEA_1_P22, corresponding to amino acids 1-188 of SUL1_HUMAN, at least 90% homologous with the corresponding MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAK to amino acids 1-188 of Z21368_PEA_1_P22 First amino acid sequence, Z21368_PEA A polypeptide having a sequence ARYDDGDQPRCAPRPRGSPTVF corresponding to amino acids 189-210 of 1_P22 at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous An isolated chimeric polypeptide encoding Z21368_PEA_1_P22, comprising two amino acid sequences, wherein said first and second amino acid sequences are in contiguous and sequential order.

本発明の好ましい実施形態によれば、Z21368_PEA_1_P22のテールをコードする単離ポリペプチドであって、Z21368_PEA_1_P22中の配列ARYDGDQPRCAPRPRGLSPTVFと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z21368_PEA_1_P22のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of Z21368_PEA_1_P22, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence ARYDGDQPRCAPRPRGLSPTVF in Z21368_PEA_1_P22 More preferably, provided is an isolated polypeptide encoding the tail of Z21368_PEA_1_P22, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、Z21368_PEA_1_P23をコードする単離キメラポリペプチドであって、Q7Z2W2のアミノ酸1〜137に対応し、Z21368_PEA_1_P23のアミノ酸1〜137にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTと少なくとも90%相同な第1のアミノ酸配列と、Z21368_PEA_1_P23のアミノ酸138〜145に対応する配列GLLHRLNHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P23をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, the isolated chimeric polypeptide encoding Z21368_PEA_1_P23, which corresponds to amino acids 1 to 137 of Q7 Z2 W2 and also to amino acids 1 to 137 of Z21 368 PEA_1 _P23, corresponds to At least 70% optionally with a polypeptide having the first amino acid sequence and the sequence GLLHRLNH corresponding to amino acids 138-145 of Z21368_PEA_1_P23 Alternatively, it comprises a second amino acid sequence that is at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous, said first and second amino acid sequences being adjacent And provides an isolated chimeric polypeptide encoding Z21368_PEA_1_P23, in sequential order.

本発明の好ましい実施形態によれば、Z21368_PEA_1_P23のテールをコードする単離ポリペプチドであって、Z21368_PEA_1_P23中の配列GLLHRLNHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z21368_PEA_1_P23のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of Z21368_PEA_1_P23, which is at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence GLLHRLNH in Z21368_PEA_1_P23. More preferably, provided is an isolated polypeptide encoding the tail of Z21368_PEA_1_P23, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、Z21368_PEA_1_P23をコードする単離キメラポリペプチドであって、SUL1_HUMANのアミノ酸1〜137に対応し、Z21368_PEA_1_P23のアミノ酸1〜137にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTと少なくとも90%相同な第1のアミノ酸配列と、Z21368_PEA_1_P23のアミノ酸138〜145に対応する配列GLLHRLNHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P23をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, the isolated chimeric polypeptide encoding Z21368_PEA_1_P23, which corresponds to amino acids 1-137 of SUL1_HUMAN, and also corresponds to amino acids 1-137 of Z21368_PEA_1_P23, is MKYSCCALVLGLSLQIRQNQTLILDTLQHITH I I I I I G I A polypeptide having the first amino acid sequence and the sequence GLLHRLNH corresponding to amino acids 138 to 145 of Z21368_PEA_1_P23; A second amino acid sequence, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous, wherein said first and second amino acid sequences are Provided is an isolated chimeric polypeptide encoding Z21368_PEA_1_P23 adjacent and in sequential order.

本発明の好ましい実施形態によれば、Z21368_PEA_1_P23のテールをコードする単離ポリペプチドであって、Z21368_PEA_1_P23中の配列GLLHRLNHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z21368_PEA_1_P23のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of Z21368_PEA_1_P23, which is at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence GLLHRLNH in Z21368_PEA_1_P23. More preferably, provided is an isolated polypeptide encoding the tail of Z21368_PEA_1_P23, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、HUMGRP5E_P4をコードする単離キメラポリペプチドであって、GRP_HUMANのアミノ酸1〜127に対応し、HUMGRP5E_P4のアミノ酸1〜127にも対応するMRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLMGKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQPKALGNQQPSWDSEDSSNFKDVGSKGKと少なくとも90%相同な第1のアミノ酸配列と、GRP_HUMANのアミノ酸135〜148に対応し、HUMGRP5E_P4のアミノ酸128〜141にも対応するGSQREGRNPQLNQQと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、HUMGRP5E_P4をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, the isolated chimeric polypeptide encoding HUMGRP5E_P4, corresponding to amino acids 1 to 127 of GRP_HUMAN and corresponding to amino acids 1 to 127 of HUMGRP5E_P4, also corresponds to The first amino acid sequence corresponds to amino acids 135 to 148 of GRP_HUMAN, and also corresponds to amino acids 128 to 141 of HUMGRP5E_P4, and is at least 90% homologous to GSQREGRNPQLNQQ And a amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, provides an isolated chimeric polypeptide coding HUMGRP5E_P4.

本発明の好ましい実施形態によれば、HUMGRP5E_P4の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がKGを含み、以下の構造:アミノ酸番号127−x〜127のいずれかから始まり、アミノ酸番号128+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HUMGRP5E_P4の縁部分をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding the rim portion of HUMGRP5E_P4, comprising a length "n", wherein n is at least about 10 amino acids in length, optionally at least about 20 amino acids in length, preferably at least about 30 amino acids in length, more preferably at least about 40 amino acids in length, most preferably at least about 50 amino acids in length), wherein at least two amino acids comprise KG and have the following structure: A polypeptide having a sequence beginning with any of the numbers 127-x to 127 and ending with the amino acid number 128 + ((n-2) -x), wherein x varies from 0 to n-2. Provided is an isolated chimeric polypeptide encoding an edge portion of HUMGRP5E_P4, including:

本発明の好ましい実施形態によれば、HUMGRP5E_P5をコードする単離キメラポリペプチドであって、GRP_HUMANのアミノ酸1〜127に対応し、HUMGRP5E_P5のアミノ酸1〜127にも対応するMRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLMGKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQPKALGNQQPSWDSEDSSNFKDVGSKGKと少なくとも90%相同な第1のアミノ酸配列と、HUMGRP5E_P5のアミノ酸128〜142に対応する配列DSLLQVLNVKEGTPSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、HUMGRP5E_P5をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding HUMGRP5E_P5, corresponding to amino acids 1 to 127 of GRP_HUMAN and corresponding to amino acids 1 to 127 of HUMGRP5E_P5, also corresponding to At least 70%, optionally at least 80% preferably with a polypeptide having the first amino acid sequence and the sequence DSLLQVLNVKEGTPS corresponding to amino acids 128-142 of HUMGRP5E_P5 Or a second amino acid sequence which is at least 85%, more preferably at least 90%, most preferably at least 95% homologous, said first and second amino acid sequences being adjacent and in a consecutive order Provided is an isolated chimeric polypeptide encoding HUMGRP5E_P5.

本発明の好ましい実施形態によれば、HUMGRP5E_P5のテールをコードする単離ポリペプチドであって、HUMGRP5E_P5中の配列DSLLQVLNVKEGTPSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMGRP5E_P5のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of HUMGRP5E_P5, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence DSLLQVLNVKEGTPS in HUMGRP5E_P5. Provided is an isolated polypeptide encoding the tail of HUMGRP5E_P5, more preferably comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、D56406_PEA_1_P2をコードする単離キメラポリペプチドであって、NEUT_HUMANのアミノ酸1〜120に対応し、D56406_PEA_1_P2のアミノ酸1〜120にも対応するMMAGMKIQLVCMLLLAFSSWSLCSDSEEEMKALEADFLTNMHTSKISKAHVPSWKMTLLNVCSLVNNLNSPAEETGEVHEEELVARRKLPTALDGFSLEAMLTIYQLHKICHSRAFQHWEと少なくとも90%相同な第1のアミノ酸配列と、D56406_PEA_1_P2のアミノ酸121〜151に対応する配列ARWLTPVIPALWEAETGGSRGQEMETIPANTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列と、NEUT_HUMANのアミノ酸121〜170に対応し、D56406_PEA_1_P2のアミノ酸152〜201にも対応するLIQEDILDTGNDKNGKEEVIKRKIPYILKRQLYENKPRRPYILKRDSYYYと少なくとも90%相同な第3のアミノ酸配列とを含み、前記第1、第2、および第3のアミノ酸配が、隣接し、且つ連続した順序にある、D56406_PEA_1_P2をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding D56406_PEA_1_P2, which corresponds to amino acids 1-120 of NEUT_HUMAN and also corresponds to amino acids 1-120 of D56406_PEA_1_P2, is MMAGMKIQLVCMCLLAFSLSCSLSESLSCSLESCLSEEMSLTCSLECSHIGHGLITHITHI At least a polypeptide having the first amino acid sequence and the sequence ARWLTPVIPALWEAETGGSRGQEMETIPANT corresponding to amino acids 121 to 151 of D56406_PEA_1_P2 A second amino acid sequence of 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95%, corresponding to amino acids 121 to 170 of NEUT_HUMAN, D56406_PEA_1_P2 And a third amino acid sequence that is at least 90% homologous to LIQEDILDTGNDKNGKEEVIKRKIPYILKRQLYENKPRRPYILKRDSYYY, which also corresponds to amino acids 152-201 of SEQ ID NO: 1, wherein said first, second and third amino acid sequences are adjacent and in a consecutive order, Provided is an isolated chimeric polypeptide encoding D56406_PEA_1_P2.

本発明の好ましい実施形態によれば、D56406_PEA_1_P2の縁部分をコードする単離ポリペプチドであって、D56406_PEA_1_P2に対応するARWLTPVIPALWEAETGGSRGQEMETIPANTをコードする配列と少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なアミノ酸配列を含む、D56406_PEA_1_P2の縁部分をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the edge portion of D56406_PEA_1_P2, which is at least 70%, optionally at least about 80%, preferably at least 70% of the sequence encoding ARWLTPVIPALWEAETGGSRGQEMETIPANT corresponding to D56406_PEA_1_P2 Provided is an isolated polypeptide encoding an edge portion of D56406_PEA_1_P2 comprising an amino acid sequence that is at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、D56406_PEA_1_P5をコードする単離キメラポリペプチドであって、NEUT_HUMANのアミノ酸1〜23に対応し、D56406_PEA_1_P5のアミノ酸1〜23にも対応するMMAGMKIQLVCMLLLAFSSWSLCと少なくとも90%相同な第1のアミノ酸配列と、NEUT_HUMANのアミノ酸26〜170に対応し、D56406_PEA_1_P5のアミノ酸24〜168にも対応するSEEEMKALEADFLTNMHTSKISKAHVPSWKMTLLNVCSLVNNLNSPAEETGEVHEEELVARRKLPTALDGFSLEAMLTIYQLHKICHSRAFQHWELIQEDILDTGNDKNGKEEVIKRKIPYILKRQLYENKPRRPYILKRDSYYYと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、D56406_PEA_1_P5をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, it is an isolated chimeric polypeptide encoding D56406_PEA_1_P5, which is at least 90% homologous to MMAGMKI QLVCMCLLAFSSWLC corresponding to amino acids 1-23 of NEUT_HUMAN and also corresponding to amino acids 1-23 of D56406_PEA_1_P5. SEEMEKALEADFLTTNMHTSKISKAHVPS WKMTLNVCSL VNLESPLEHPELEQLHHKICHSTRAFQHWELIQEDLITGIPGIKE corresponds to amino acid 26 to 170 of NEUT_HUMAN and also corresponds to amino acid 24 to 168 of DUT4406_PEA_1_P5. LKRQLYENKPRRPYILKRDSYYY and and at least 90% homologous to a second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, provides an isolated chimeric polypeptide coding D56406_PEA_1_P5.

本発明の好ましい実施形態によれば、D56406_PEA_1_P5の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がCSを含み、以下の構造:アミノ酸番号23−x〜24のいずれかから始まり、アミノ酸番号+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、D56406_PEA_1_P5の縁部分をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding the edge portion of D56406_PEA_1_P5, having a length “n”, wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids in length, preferably at least about 30 amino acids in length, more preferably at least about 40 amino acids in length, most preferably at least about 50 amino acids in length), wherein at least two amino acids comprise CS and have the following structure: A polypeptide having a sequence beginning with any of the numbers 23-x-24 and ending with the amino acid number + ((n-2) -x), where x varies from 0 to n-2. Provided is an isolated chimeric polypeptide encoding an edge portion of D56406_PEA_1_P5, including:

本発明の好ましい実施形態によれば、D56406_PEA_1_P6をコードする単離キメラポリペプチドであって、NEUT_HUMANのアミノ酸1〜45に対応し、D56406_PEA_1_P6のアミノ酸1〜45にも対応するMMAGMKIQLVCMLLLAFSSWSLCSDSEEEMKALEADFLTNMHTSKと少なくとも90%相同な第1のアミノ酸配列と、NEUT_HUMANのアミノ酸121〜170に対応し、D56406_PEA_1_P6のアミノ酸46〜95にも対応するLIQEDILDTGNDKNGKEEVIKRKIPYILKRQLYENKPRRPYILKRDSYYYと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、D56406_PEA_1_P6をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding D56406_PEA_1_P6, which corresponds to amino acids 1 to 45 of NEUT_HUMAN and also to amino acids 1 to 45 of D56406_PEA_1_P6 at least 90% homologous to MMAGMKIQL The first and second amino acid sequences, and LIQEDILTDGNDNGNGEKEVIKRKIK YPRK YLYKRQLYENKPRLYNKDSYYY corresponding to amino acids 121 to 170 of NEUT_HUMAN and also to amino acids 46 to 95 of D56406_PEA_1_P6, comprising the first and second amino acid sequences The amino acid sequences are adjacent and In connection with the order, it provides an isolated chimeric polypeptide coding D56406_PEA_1_P6.

本発明の好ましい実施形態によれば、D56406_PEA_1_P6の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がKLを含み、以下の構造:アミノ酸番号45−x〜46のいずれかから始まり、アミノ酸番号46+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、D56406_PEA_1_P6の縁部分をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding the edge portion of D56406_PEA_1_P6, having a length “n”, wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids in length, preferably at least about 30 amino acids in length, more preferably at least about 40 amino acids in length, most preferably at least about 50 amino acids in length), wherein at least two amino acids comprise KL and have the following structure: A polypeptide having a sequence beginning with any of the numbers 45-x to 46 and ending with the amino acid number 46 + ((n-2) -x), wherein x varies from 0 to n-2. Provided is an isolated chimeric polypeptide encoding an edge portion of D56406_PEA_1_P6, including:

本発明の好ましい実施形態によれば、F05068_PEA_1_P7をコードする単離キメラポリペプチドであって、ADML_HUMANのアミノ酸1〜33に対応し、F05068_PEA_1_P7のアミノ酸1〜33にも対応するMKLVSVALMYLGSLAFLGADTARLDVASEFRKKと少なくとも90%相同な第1のアミノ酸配列を含む、F05068_PEA_1_P7をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding F05068_PEA_1_P7, which corresponds to amino acids 1 to 33 of ADML_HUMAN and also corresponds to amino acids 1 to 33 of F05068_PEA_1_P7 at least 90% homologous to MKLVS Provided is an isolated chimeric polypeptide encoding F05068_PEA_1_P7, comprising a first amino acid sequence.

本発明の好ましい実施形態によれば、F05068_PEA_1_P8をコードする単離キメラポリペプチドであって、ADML_HUMANのアミノ酸1〜82に対応し、F05068_PEA_1_P8のアミノ酸1〜82にも対応するMKLVSVALMYLGSLAFLGADTARLDVASEFRKKWNKWALSRGKRELRMSSSYPTGLADVKAGPAQTLIRPQDMKGASRSPEDと少なくとも90%相同な第1のアミノ酸配列と、F05068_PEA_1_P8のアミノ酸83〜83に対応する配列Rを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、F05068_PEA_1_P8をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding F05068_PEA_1_P8, which corresponds to amino acids 1 to 82 of ADML_HUMAN and also to amino acids 1 to 82 of F05068_PEA_1_P8. At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably a polypeptide having a first amino acid sequence and a sequence R corresponding to amino acids 83 to 83 of F05068_PEA_1_P8 Is at least 95% homologous to the second And a acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, provides an isolated chimeric polypeptide coding F05068_PEA_1_P8.

本発明の好ましい実施形態によれば、H14624_P15をコードする単離キメラポリペプチドであって、Q9HAP5のアミノ酸1〜167に対応し、H14624_P15のアミノ酸1〜167にも対応するMLQGPGSLLLLFLASHCCLGSARGLFLFGQPDFSYKRSNCKPIPANLQLCHGIEYQNMRLPNLLGHETMKEVLEQAGAWIPLVMKQCHPDTKKFLCSLFAPVCLDDLDETIQPCHSLCVQVKDRCAPVMSAFGFPWPDMLECDRFPQDNDLCIPLASSDHLLPATEEと少なくとも90%相同な第1のアミノ酸配列と、H14624_P15のアミノ酸168〜180に対応する配列GKPSLLLPHSLLGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、H14624_P15をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, the isolated chimeric polypeptide encoding H14624_J15 is an H15624_P15 encoding, corresponding to amino acids 1 to 167 of Q9 HAP5, and also corresponding to amino acids 1 to 167 of H14624_P15. A amino acid sequence having a first amino acid sequence and a sequence GKPSLLLPHSLLG corresponding to amino acids 168 to 180 of H14624_P15 Said first and second comprising a peptide and a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous. The present invention provides an isolated chimeric polypeptide encoding H14624_P15, wherein the amino acid sequences of SEQ ID NO: are in contiguous and sequential order.

本発明の好ましい実施形態によれば、H14624_P15のテールをコードする単離ポリペプチドであって、H14624_P15中の配列GKPSLLLPHSLLGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、H14624_P15のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of H14624_P15, comprising at least 70%, optionally at least about 80%, preferably at least about 85% of the sequence GKPSLLLLPHSLLG in H14624_P15. Provided is an isolated polypeptide encoding the tail of H14624_P15, more preferably comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、H38804_PEA_1_P5をコードする単離キメラポリペプチドであって、H38804_PEA_1_P5のアミノ酸1〜57に対応する配列MGRVRTLAGECSAQAQAQSLLAVVLSAPPSGGTPSARLSVRSPSPRDPWGLWAPVLQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、BUB3_HUMANのアミノ酸1〜324に対応し、H38804_PEA_1_P5のアミノ酸58〜381にも対応するMTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWDTSVRLYDVPANSMRLKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMHDLNTDQENLVGTHDAPIRCVEYCPEVNVMVTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRLIVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIEGRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQIYPVNAISFHNIHNTFATGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYEMDDTEHPEDGIFIRQVTDAETKPKと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、H38804_PEA_1_P5をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding H38804_PEA_1_P5, comprising at least 70%, optionally at least 80% of a polypeptide having the sequence MGRVRTLAGECSAAQAQLALAVSVLSAPPSGTPSALDPWSGLWAPVLQ corresponding to amino acids 1 to 57 of H38804_PEA_1_P5 MTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWSTS, corresponding to a first amino acid sequence, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous and corresponding to amino acids 1-324 of BUB3_HUMAN and also to amino acids 58-381 of H38804_PEA_1_P5 YDVPANSMRLKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMHDLNTDQENLVGTHDAPIRCVEYCPEVNVMVTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRLIVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIEGRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQIYPVNAISFHNIHNTFATGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYEMDDTEHPEDGIFIRQVTDAETKPK and and at least 90% homologous to a second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and In connection with the order, it provides an isolated chimeric polypeptide coding H38804_PEA_1_P5.

本発明の好ましい実施形態によれば、H38804_PEA_1_P5の先端をコードする単離ポリペプチドであって、H38804_PEA_1_P5の配列MGRVRTLAGECSAQAQAQSLLAVVLSAPPSGGTPSARLSVRSPSPRDPWGLWAPVLQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、H38804_PEA_1_P5の先端をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tip of H38804_PEA_1_P5, which is at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence MGRVRTLAGECSAAQAQLASLVLSAPPS SGGTPSALDPWSGLWAPVLQ of H38804_PEA_1_P5 Provided is an isolated polypeptide encoding the tip of H38804_PEA_1_P5, which preferably comprises a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、H38804_PEA_1_P17をコードする単離キメラポリペプチドであって、H38804_PEA_1_P17のアミノ酸1〜57に対応する配列MGRVRTLAGECSAQAQAQSLLAVVLSAPPSGGTPSARLSVRSPSPRDPWGLWAPVLQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、BUB3_HUMANのアミノ酸1〜328に対応し、H38804_PEA_1_P17のアミノ酸58〜385にも対応するMTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWDTSVRLYDVPANSMRLKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMHDLNTDQENLVGTHDAPIRCVEYCPEVNVMVTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRLIVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIEGRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQIYPVNAISFHNIHNTFATGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYEMDDTEHPEDGIFIRQVTDAETKPKSPCTと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、H38804_PEA_1_P17をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding H38804_PEA_1_P17, comprising at least 70%, optionally at least 80% of a polypeptide having the sequence MGRVRTLAGECSAAQAQLASLVLSAPPSGTPSALDPWSGLWAPVLQ corresponding to amino acids 1 to 57 of H38804_PEA_1_P17 , Preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to the first amino acid sequence corresponding to amino acids 1-328 of BUB3_HUMAN and also corresponding to amino acids 58-385 of H38804_PEA_1_P17 VRLYDVPANSMRLKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMHDLNTDQENLVGTHDAPIRCVEYCPEVNVMVTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRLIVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIEGRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQIYPVNAISFHNIHNTFATGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYEMDDTEHPEDGIFIRQVTDAETKPKSPCT and and at least 90% homologous to a second amino acid sequence, wherein the first and second amino acid distribution is Adjacent, and in sequential order, it provides an isolated chimeric polypeptide coding H38804_PEA_1_P17.

本発明の好ましい実施形態によれば、H38804_PEA_1_P17の先端をコードする単離ポリペプチドであって、H38804_PEA_1_P17の配列MGRVRTLAGECSAQAQAQSLLAVVLSAPPSGGTPSARLSVRSPSPRDPWGLWAPVLQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、H38804_PEA_1_P17の先端をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tip of H38804_PEA_1_P17, which is at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence MGRVRTLAGECSAAQAQALSA Provided is an isolated polypeptide encoding the tip of H38804_PEA_1_P17, which comprises a polypeptide that is preferably at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、HSENA78_P2をコードする単離キメラポリペプチドであって、SZ05_HUMANのアミノ酸1〜81に対応し、HSENA78_P2のアミノ酸1〜81にも対応するMSLLSSRAARVPGPSSSLCALLVLLLLLTQPGPIASAGPAAAVLRELRCVCLQTTQGVHPKMISNLQVFAIGPQCSKVEVVと少なくとも90%相同な第1のアミノ酸配列を含む、HSENA78_P2をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding HSENA 78_P2, corresponding to amino acids 1 to 81 of SZ05_HUMAN and corresponding to amino acids 1 to 81 of HSENA 78_P2, MSLL SSRA Provided is an isolated chimeric polypeptide encoding HSENA 78_P2 comprising a first amino acid sequence.

本発明の好ましい実施形態によれば、HUMODCA_P9をコードする単離キメラポリペプチドであって、HUMODCA_P9のアミノ酸1〜29に対応する配列MKSLTATSSMKVLLPRTFWTRKLMKFLLLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、DCOR_HUMANのアミノ酸151〜461に対応し、HUMODCA_P9のアミノ酸30〜340にも対応するLVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGSGCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEEITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQTGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKYYSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGFQRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRHRAACASASINVと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、HUMODCA_P9をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding HUMODCA_P9 comprising at least 70%, optionally at least 80% of the polypeptide having the sequence MKSLTATSSMKVLLPRTFWTRKLMKFLLL corresponding to amino acids 1-29 of HUMODCA_P9 LVLRIA TDD SKAVCRL SV KFAGLT RIDEL VEG HV GS GC TD PET F F V Q AIS DALG M DIGGGFPGSEDVKLKFEEITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQTGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKYYSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGFQRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRHRAACASASINV and and at least 90% homologous to a second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, provides an isolated chimeric polypeptide coding HUMODCA_P9 .

本発明の好ましい実施形態によれば、HUMODCA_P9の先端をコードする単離ポリペプチドであって、HUMODCA_P9の配列MKSLTATSSMKVLLPRTFWTRKLMKFLLLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMODCA_P9の先端をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tip of HUMODCA_P9, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence MKSLTATSSMKVLLPRTF WTRKLMKFLLL of HUMODCA_P9 Provided is an isolated polypeptide encoding the tip of HUMODCA_P9 comprising a polypeptide that is preferably at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、HUMODCA_P9をコードする単離キメラポリペプチドであって、HUMODCA_P9のアミノ酸1〜29に対応する配列MKSLTATSSMKVLLPRTFWTRKLMKFLLLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、AAA59968のアミノ酸40〜350に対応し、HUMODCA_P9のアミノ酸30〜340にも対応するLVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGSGCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEEITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQTGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKYYSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGFQRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRHRAACASASINVと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、HUMODCA_P9をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding HUMODCA_P9 comprising at least 70%, optionally at least 80% of the polypeptide having the sequence MKSLTATSSMKVLLPRTFWTRKLMKFLLL corresponding to amino acids 1-29 of HUMODCA_P9 LVLRIA TDD SKAVCRL SV KF GATRL T ID VVG SF HGF GS GC TD PET F V Q AIS DALS DAV G GGFPGSEDVKLKFEEITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQTGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKYYSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGFQRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRHRAACASASINV and and at least 90% homologous to a second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, provides an isolated chimeric polypeptide coding HUMODCA_P9 .

本発明の好ましい実施形態によれば、HUMODCA_P9の先端をコードする単離ポリペプチドであって、HUMODCA_P9の配列MKSLTATSSMKVLLPRTFWTRKLMKFLLLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMODCA_P9の先端をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tip of HUMODCA_P9, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence MKSLTATSSMKVLLPRTF WTRKLMKFLLL of HUMODCA_P9 Provided is an isolated polypeptide encoding the tip of HUMODCA_P9 comprising a polypeptide that is preferably at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、HUMODCA_P9をコードする単離キメラポリペプチドであって、HUMODCA_P9のアミノ酸1〜29に対応する配列MKSLTATSSMKVLLPRTFWTRKLMKFLLLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、AAH14562のアミノ酸86〜396に対応し、HUMODCA_P9のアミノ酸30〜340にも対応するLVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGSGCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEEITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQTGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKYYSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGFQRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRHRAACASASINVと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、HUMODCA_P9をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding HUMODCA_P9 comprising at least 70%, optionally at least 80% of the polypeptide having the sequence MKSLTATSSMKVLLPRTFWTRKLMKFLLL corresponding to amino acids 1-29 of HUMODCA_P9 LVLRIA TDD SKAVCRL SV KFAGLT RIV EL KELIGNID V VG V SF G GS G PET F F V Q AIS DALS L GGFPGSEDVKLKFEEITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQTGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKYYSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGFQRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRHRAACASASINV and and at least 90% homologous to a second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, provides an isolated chimeric polypeptide coding HUMODCA_P9 .

本発明の好ましい実施形態によれば、HUMODCA_P9の先端をコードする単離ポリペプチドであって、HUMODCA_P9の配列MKSLTATSSMKVLLPRTFWTRKLMKFLLLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMODCA_P9の先端をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tip of HUMODCA_P9, comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence MKSLTATSSMKVLLPRTF WTRKLMKFLLL of HUMODCA_P9 Provided is an isolated polypeptide encoding the tip of HUMODCA_P9 comprising a polypeptide that is preferably at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R00299_P3をコードする単離キメラポリペプチドであって、R00299_P3のアミノ酸1〜44に対応する配列MAEKALLCPSSAGLGTWPWVLNSAWPVLPLAVDQGVDWRPRGPVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、Q9NWT9のアミノ酸74〜191に対応し、R00299_P3のアミノ酸45〜162にも対応するSSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDLELNPIRSKIVRAFFDNRNLRKGPSGLADEINFEDFLTIMSYFRPIDTTMDEEQVELSRKEKLRFLFHMYDSDSDGRITLEEYRNVと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1、第2、および第3のアミノ酸配が、隣接し、且つ連続した順序にある、R00299_P3をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding R00299_P3 comprising at least 70%, optionally at least 80% of the polypeptide having the sequence MAEKALLCPSSAGLGTWPWVLNSAWPVLPLAVDQGVDWRPRGPV corresponding to amino acids 1-44 of R00299_P3 , Preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to the first amino acid sequence and corresponding to amino acids 74 to 191 of Q9NWT9 and also to amino acids 45 to 162 of R00299_P3 An isolated chimeric polypeptide encoding R00299_P3 comprising a second amino acid sequence at least 90% homologous to RPIDTTM DEEQVELSRKEKLRFLFHMYDSDSDGRITLEYYRNV, said first, second and third amino acid sequences being adjacent and in sequential order I will provide a.

本発明の好ましい実施形態によれば、R00299_P3の先端をコードする単離ポリペプチドであって、R00299_P3の配列MAEKALLCPSSAGLGTWPWVLNSAWPVLPLAVDQGVDWRPRGPVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R00299_P3の先端をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tip of R00299_P3 comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence MAEKALLCPSSAGLGTWPWVLNSAWPVLPLDVGVDWRPRGPV of the sequence R00299_P3 Provided is an isolated polypeptide encoding the tip of R00299_P3 comprising a polypeptide that is preferably at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R00299_P3のテールをコードする単離ポリペプチドであって、R00299_P3中の配列VEELLSGNPHIEKESARSIADGAMMEAASVCMGQMEPDQVYEGITFEDFLKIWQGIDIETKMHVRFLNMETMALCHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R00299_P3のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of R00299_P3, which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85% More preferably, an isolated polypeptide encoding the tail of R00299_P3 comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、R00299_P3をコードする単離キメラポリペプチドであって、R00299_P3のアミノ酸1〜44に対応する配列MAEKALLCPSSAGLGTWPWVLNSAWPVLPLAVDQGVDWRPRGPVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、TESC_HUMANのアミノ酸21〜214に対応し、R00299_P3のアミノ酸45〜238にも対応するSSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDLELNPIRSKIVRAFFDNRNLRKGPSGLADEINFEDFLTIMSYFRPIDTTMDEEQVELSRKEKLRFLFHMYDSDSDGRITLEEYRNVVEELLSGNPHIEKESARSIADGAMMEAASVCMGQMEPDQVYEGITFEDFLKIWQGIDIETKMHVRFLNMETMALCHと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R00299_P3をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding R00299_P3 comprising at least 70%, optionally at least 80% of the polypeptide having the sequence MAEKALLCPSSAGLGTWPWVLNSAWPVLPLAVDQGVDWRPRGPV corresponding to amino acids 1-44 of R00299_P3 Preferably, at least 85%, more preferably at least 90%, most preferably at least 95% homologous to the first amino acid sequence corresponding to amino acids 21 to 214 of TESC_HUMAN and also corresponding to amino acids 45 to 238 of R00299_P3 MSYFRPIDTTMDEEQVELSRKEKLRFLFHMYDSDSDGRITLEEYRNVVEELLSGNPHIEKESARSIADGAMMEAASVCMGQMEPDQVYEGITFEDFLKIWQGIDIETKMHVRFLNMETMALCH and and at least 90% homologous to a second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, provides an isolated chimeric polypeptide coding R00299_P3.

本発明の好ましい実施形態によれば、R00299_P3の先端をコードする単離ポリペプチドであって、R00299_P3の配列MAEKALLCPSSAGLGTWPWVLNSAWPVLPLAVDQGVDWRPRGPVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R00299_P3の先端をコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tip of R00299_P3 comprising at least 70%, optionally at least about 80%, preferably at least about 85%, of the sequence MAEKALLCPSSAGLGTWPWVLNSAWPVLPLDVGVDWRPRGPV of the sequence R00299_P3 Provided is an isolated polypeptide encoding the tip of R00299_P3 comprising a polypeptide that is preferably at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、W60282_PEA_1_P14をコードする単離キメラポリペプチドであって、Q8IXD7のアミノ酸1〜66に対応し、W60282_PEA_1_P14のアミノ酸1〜66にも対応するMRILQLILLALATGLVGGETRIIKGFECKPHSQPWQAALFEKTRLLCGATLIAPRWLLTAAHCLKPと少なくとも90%相同な第1のアミノ酸配列と、W60282_PEA_1_P14のアミノ酸67〜80に対応する配列TPASHLAMRQHHHHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、W60282_PEA_1_P14をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, it is an isolated chimeric polypeptide encoding W60282_PEA_1_P14, which corresponds to amino acids 1 to 66 of Q8IXD7 and also to amino acids 1 to 66 of W60282_PEA_1_P14. The polypeptide having the first amino acid sequence and the sequence TPASHLAMRQHHHH corresponding to amino acids 67-80 of W60282_PEA_1_P14 and at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably Is a second amino acid sequence that is at least 95% homologous Wherein the door, the first and second amino acid distribution is contiguous, and in sequential order, provides an isolated chimeric polypeptide coding W60282_PEA_1_P14.

本発明の好ましい実施形態によれば、W60282_PEA_1_P14のテールをコードする単離ポリペプチドであって、W60282_PEA_1_P14中の配列TPASHLAMRQHHHHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、W60282_PEA_1_P14のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the invention, an isolated polypeptide encoding the tail of W60282_PEA_1_P14, comprising at least 70%, optionally at least about 80%, preferably at least about 85% of the sequence TPASHLAMQHHHH in W60282_PEA_1_P14 More preferably, provided is an isolated polypeptide encoding the tail of W60282_PEA_1_P14, comprising a polypeptide that is at least about 90%, and most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、Z41644_PEA_1_P10をコードする単離キメラポリペプチドであって、SZ14_HUMANのアミノ酸1〜95に対応し、Z41644_PEA_1_P10のアミノ酸1〜95にも対応するMRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPHCEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRと少なくとも90%相同な第1のアミノ酸配列と、Z41644_PEA_1_P10のアミノ酸96〜123に対応する配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z41644_PEA_1_P10をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding Z41644_PEA_1_P10, corresponding to amino acids 1-95 of SZ14_HUMAN and also corresponding to amino acids 1-95 of Z41644_PEA_1_P10 The polypeptide having the first amino acid sequence and the sequence YAPPLLTFLPTRPSCGGSQDGKGPPHQVI corresponding to amino acids 96 to 123 of Z41644_PEA_1_P10 at least 70%, optionally at least 80%, preferably less Z41644_PEA_1_P10 also comprising a second amino acid sequence which is also 85%, more preferably at least 90%, most preferably at least 95% homologous, said first and second amino acid sequences being adjacent and in sequential order An isolated chimeric polypeptide encoding

本発明の好ましい実施形態によれば、Z41644_PEA_1_P10のテールをコードする単離ポリペプチドであって、Z41644_PEA_1_P10中の配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z41644_PEA_1_P10のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of Z41644_PEA_1_P10, which is at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence YAPPLLTFLPTRPSCSGSQDGKGPPHQVI in Z41644_PEA_1_P10 More preferably, provided is an isolated polypeptide encoding the tail of Z41644_PEA_1_P10, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、Z41644_PEA_1_P10をコードする単離キメラポリペプチドであって、Q9NS21のアミノ酸13〜107に対応し、Z41644_PEA_1_P10のアミノ酸1〜95にも対応するMRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPHCEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRと少なくとも90%相同な第1のアミノ酸配列と、Z41644_PEA_1_P10のアミノ酸96〜123に対応する配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z41644_PEA_1_P10をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding Z41644_PEA_1_P10, corresponding to amino acids 13 to 107 of Q9 NS21 and also corresponding to amino acids 1 to 95 of Z41644 _PEA_1_P10. At least 70%, optionally at least 80%, preferably at least 80%, preferably at least 80%, of the polypeptide having the first amino acid sequence and the sequence YAPPLLTFLPTRPSCGGSQDGKGPPHQVI corresponding to amino acids 96 to 123 of Z41644_PEA_1_P10 Z41644_PEA_1_P10 comprising a second amino acid sequence that is 5%, more preferably at least 90%, most preferably at least 95% homologous, said first and second amino acid sequences being in a contiguous and consecutive order Provided is an isolated chimeric polypeptide that encodes.

本発明の好ましい実施形態によれば、Z41644_PEA_1_P10のテールをコードする単離ポリペプチドであって、Z41644_PEA_1_P10中の配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z41644_PEA_1_P10のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of Z41644_PEA_1_P10, which is at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence YAPPLLTFLPTRPSCSGSQDGKGPPHQVI in Z41644_PEA_1_P10 More preferably, provided is an isolated polypeptide encoding the tail of Z41644_PEA_1_P10, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、Z41644_PEA_1_P10をコードする単離キメラポリペプチドであって、AAQ89265のアミノ酸13〜107に対応し、Z41644_PEA_1_P10のアミノ酸1〜95にも対応するMRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPHCEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRと少なくとも90%相同な第1のアミノ酸配列と、Z41644_PEA_1_P10のアミノ酸96〜123に対応する配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z41644_PEA_1_P10をコードする単離キメラポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated chimeric polypeptide encoding Z41644_PEA_1_P10, corresponding to amino acids 13 to 107 of AAQ 89 265 and also corresponding to amino acids 1 to 95 of Z41644_PEA_1_P10 MRL The polypeptide having the first amino acid sequence and the sequence YAPPLLTFLPTRPSCGGSQDGKGPPHQVI corresponding to amino acids 96 to 123 of Z41644_PEA_1_P10 at least 70%, optionally at least 80%, preferably less Z41644_PEA_1_P10 also comprising a second amino acid sequence which is also 85%, more preferably at least 90%, most preferably at least 95% homologous, said first and second amino acid sequences being adjacent and in sequential order An isolated chimeric polypeptide encoding

本発明の好ましい実施形態によれば、Z41644_PEA_1_P10のテールをコードする単離ポリペプチドであって、Z41644_PEA_1_P10中の配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z41644_PEA_1_P10のテールをコードする単離ポリペプチドを提供する。   According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of Z41644_PEA_1_P10, which is at least 70%, optionally at least about 80%, preferably at least about 85%, with the sequence YAPPLLTFLPTRPSCSGSQDGKGPPHQVI in Z41644_PEA_1_P10 More preferably, provided is an isolated polypeptide encoding the tail of Z41644_PEA_1_P10, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

本発明の好ましい実施形態によれば、アミノ酸配列のエピトープに特異的に結合することができる抗体を提供する。   According to a preferred embodiment of the present invention, there is provided an antibody capable of specifically binding to an epitope of an amino acid sequence.

任意選択的に、アミノ酸配列は、架橋、縁部分、テール、先端、または挿入に対応する。   Optionally, the amino acid sequence corresponds to a bridge, an edge, a tail, a tip, or an insertion.

任意選択的に、抗体は、前記エピトープを有するスプライスバリアントと対応する公知のタンパク質とを区別することができる。   Optionally, the antibody can distinguish between splice variants carrying said epitope and the corresponding known proteins.

本発明の好ましい実施形態によれば、前記請求項のいずれか1項に記載のスプライスバリアントの過剰発現を検出する肺癌検出用キットを提供する。   According to a preferred embodiment of the present invention, there is provided a kit for detecting a lung cancer which detects overexpression of the splice variant according to any one of the above claims.

任意選択的に、キットは、NATベースのテクノロジーを含む。   Optionally, the kit comprises NAT based technology.

任意選択的に、キットは、前記請求項のいずれか1項に記載の核酸配列に選択的にハイブリッド形成することができる少なくとも1つのプライマー対をさらに含む。   Optionally, the kit further comprises at least one primer pair capable of selectively hybridizing to the nucleic acid sequence according to any one of the preceding claims.

任意選択的に、前記キットが、前記請求項のいずれか1項に記載の核酸配列に選択的にハイブリッド形成することができる少なくとも1つのオリゴヌクレオチドをさらに含む。   Optionally, the kit further comprises at least one oligonucleotide capable of selectively hybridizing to the nucleic acid sequence according to any one of the preceding claims.

任意選択的に、キットは、前記請求項のいずれか1項に記載の抗体を含む。   Optionally, the kit comprises an antibody according to any one of the preceding claims.

任意選択的に、キットは、ELISAまたはウェスタンブロットの実施のための少なくとも1つの試薬をさらに含む。   Optionally, the kit further comprises at least one reagent for performing an ELISA or Western blot.

本発明の好ましい実施形態によれば、前記請求項のいずれか1項に記載のスプライスバリアントの過剰発現を検出する工程を含む、肺癌の検出方法。   According to a preferred embodiment of the present invention, a method of detecting lung cancer comprising the step of detecting overexpression of the splice variant according to any one of the preceding claims.

任意選択的に、過剰発現の検出を、NATベースのテクノロジーを使用して実施する。   Optionally, detection of overexpression is performed using NAT based technology.

任意選択的に、過剰発現の検出を、免疫アッセイを使用して実施する。   Optionally, detection of overexpression is performed using an immunoassay.

任意選択的に、免疫アッセイは、前記請求項のいずれか1項に記載の抗体を含む。   Optionally, the immunoassay comprises an antibody according to any one of the preceding claims.

本発明の好ましい実施形態によれば、上記の核酸配列もしくはそのフラグメントのいずれかまたは上記のアミノ酸配列もしくはそのフラグメントを含む、肺癌を検出することができるバイオマーカーを提供する。   According to a preferred embodiment of the present invention there is provided a biomarker capable of detecting lung cancer comprising any of the above nucleic acid sequences or fragments thereof or the above amino acid sequences or fragments thereof.

本発明の好ましい実施形態によれば、前記請求項のいずれか1項に記載のバイオマーカーまたは方法もしくはアッセイで肺癌細胞を検出する工程を含む、肺癌のスクリーニング方法を提供する。   According to a preferred embodiment of the present invention, there is provided a method of screening for lung cancer, comprising the step of detecting lung cancer cells with the biomarker or method or assay according to any one of the above claims.

本発明の好ましい実施形態によれば、前記請求項のいずれか1項に記載のバイオマーカーもしくは抗体または方法もしくはアッセイで肺癌細胞を検出する工程を含む、肺癌の診断方法を提供する。   According to a preferred embodiment of the present invention, there is provided a method of diagnosing a lung cancer, comprising the step of detecting lung cancer cells with the biomarker or antibody or method or assay according to any one of the preceding claims.

本発明の好ましい実施形態によれば、前記請求項のいずれか1項に記載のバイオマーカーもしくは抗体または方法もしくはアッセイで肺癌細胞を検出する工程を含む、疾患の進行および/または治療有効性および/または肺癌の再発をモニタリングする方法を提供する。   According to a preferred embodiment of the present invention, the disease progression and / or the therapeutic efficacy and / or the step of detecting lung cancer cells with a biomarker or antibody or method or assay according to any one of the preceding claims. Or provide a method to monitor the recurrence of lung cancer.

本発明の好ましい実施形態によれば、前記請求項のいずれか1項に記載のバイオマーカーもしくは抗体または方法もしくはアッセイで肺癌細胞を検出する工程と、前記検出によって治療を選択する工程とを含む、肺癌治療の選択方法を提供する。   According to a preferred embodiment of the present invention, the method comprises detecting lung cancer cells with the biomarker or antibody or method or assay according to any one of the preceding claims, and selecting a treatment by said detection. Provide a method of choice for lung cancer treatment.

他で定義しない限り、本明細書中で使用した全ての技術用語および科学用語は、本発明に属する当業者によって一般に理解されている意味を有する。以下の参考文献により、当業者は、本発明で使用した多数の用語の一般的定義が得られる:Singleton et al.,Dictionary of Microbiology and Molecular Biology(2nd ed.1994);The Cambridge Dictionary of Science and Technology(Walker ed.,1988);The Glossary of Genetics,5th Ed.,R.Rieger et al.(eds.),Springer Verlag(1991);およびHale & Marham,The Harper Collins Dictionary of Biology(1991)。これらは全て、本明細書中に完全に記載されているかのように本明細書中で参考として援用される。本明細書中で使用される場合、以下の用語は、他で明記しない限り、これらに帰する意味を有する。   Unless defined otherwise, all technical and scientific terms used herein have meanings as commonly understood by one of ordinary skill in the art to which this invention belongs. The following references give the person skilled in the art a general definition of the many terms used in the present invention: Singleton et al. Dictionary of Microbiology and Molecular Biology (2nd ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed. , R. Rieger et al. (Eds.), Springer Verlag (1991); and Hale & Marham, The Harper Collins Dictionary of Biology (1991). All of which are incorporated herein by reference as if fully set forth herein. As used herein, the following terms have the meaning ascribed to them, unless otherwise specified.

好ましい実施形態の説明
本発明は、高感度且つ正確な新規の肺癌マーカーである。さらに、少なくとも一定のこれらのマーカーは、単独または組み合わせて、小細胞癌、大細胞癌、扁平上皮癌、および腺癌などの種々の肺癌型を区別することができる。これらのマーカーは、正常な肺組織と対照的に、肺癌で特異的に差分発現し、好ましくは過剰発現する。患者サンプル中の単独または組み合わせたこれらのマーカーの測定により、診断医が有望な肺癌診断と相関させることができる情報が得られる。本発明のマーカーにより、単独または組み合わせて、肺癌と非癌状態とが高度に差分検出される。本発明のマーカーを、単独または組み合わせて、肺癌の予後、予想、スクリーニング、早期検診、治療の選択、治療のモニタリングに使用することができる。例えば、任意選択的および好ましくは、これらのマーカーを、肺癌の病期分類および/または疾患進行のモニタリングに使用することができる。さらに、本発明のマーカーを、単独または組み合わせて、肺以外の解剖学的位置で見出される転移源の検出に使用することができる。また、1つまたは複数のマーカーを、任意選択的に、1つまたは複数の他の癌マーカー(本明細書中に記載のもの以外)と組み合わせて使用することができる。本発明の任意選択的な実施形態によれば、このような組み合わせを使用して、小細胞癌、大細胞癌、扁平上皮癌、および腺癌などの種々の肺癌型を区別することができる。さらに、本発明のマーカーを、単独または組み合わせて、消失による他の腫瘍型の検出(例えば、肺癌の5%を占めるカルチノイド腫瘍の検出)に使用することができる。
DESCRIPTION OF PREFERRED EMBODIMENTS The present invention is a novel sensitive and accurate novel lung cancer marker. Furthermore, at least certain of these markers, alone or in combination, can distinguish different types of lung cancer, such as small cell carcinoma, large cell carcinoma, squamous cell carcinoma, and adenocarcinoma. These markers are differentially expressed, preferably overexpressed, in lung cancer, in contrast to normal lung tissue. Measurement of these markers alone or in combination in patient samples provides information that can be correlated with a promising lung cancer diagnosis by a diagnostician. The marker of the present invention is highly differentially detected between lung cancer and non-cancerous condition alone or in combination. The markers of the present invention can be used alone or in combination for prognosis, prediction, screening, early screening, treatment selection, treatment monitoring of lung cancer. For example, optionally and preferably, these markers can be used for staging of lung cancer and / or monitoring of disease progression. In addition, the markers of the present invention can be used alone or in combination to detect metastatic sources found at anatomical locations other than lung. Also, one or more markers can optionally be used in combination with one or more other cancer markers (other than those described herein). According to optional embodiments of the invention, such combinations can be used to distinguish different types of lung cancer, such as small cell carcinoma, large cell carcinoma, squamous cell carcinoma, and adenocarcinoma. In addition, the markers of the invention, alone or in combination, can be used for detection of other tumor types by elimination (eg detection of carcinoid tumors accounting for 5% of lung cancers).

本発明のマーカーを、単独または組み合わせて、肺癌の予後、予想、スクリーニング、早期検診、病期分類、治療の選択、治療のモニタリングに使用することができる。例えば、任意選択的および好ましくは、これらのマーカーを、肺癌の病期分類および/または疾患進行のモニタリングに使用することができる。さらに、本発明のマーカーを、単独または組み合わせて、肺以外の解剖学的位置で見出される転移源の検出に使用することができる。また、1つまたは複数のマーカーを、任意選択的に、1つまたは複数の他の癌マーカー(本明細書中に記載のもの以外)と組み合わせて使用することができる。   The markers of the present invention can be used alone or in combination for lung cancer prognosis, prognosis, screening, early screening, staging, selection of treatment, monitoring of treatment. For example, optionally and preferably, these markers can be used for staging of lung cancer and / or monitoring of disease progression. In addition, the markers of the present invention can be used alone or in combination to detect metastatic sources found at anatomical locations other than lung. Also, one or more markers can optionally be used in combination with one or more other cancer markers (other than those described herein).

本発明の方法を使用して明らかとなり、且つ本明細書中に記載の生体分子配列(アミノ酸配列および/または核酸配列)を、疾患の治療または予防のための組織もしくは病理学的マーカーとしておよび/または薬物もしくは薬物標的として有効に利用することができる。   The biomolecular sequences (amino acid sequences and / or nucleic acid sequences) which are revealed using the method of the invention and described herein as a tissue or pathological marker for the treatment or prevention of a disease and / or Or it can be effectively used as a drug or drug target.

これらのマーカーは、肺癌条件下で血流に特異的に放出され、そして/または、そうでなければ、肺癌組織もしくは細胞中でさらにより高いレベルで発現するか、特異的に発現する。患者サンプル中の単独または組み合わせたこれらのマーカーの測定により、診断医が有望な肺癌診断と相関させることができる情報が得られる。   These markers are specifically released into the bloodstream under lung cancer conditions and / or are otherwise expressed or specifically expressed at higher levels in lung cancer tissues or cells. Measurement of these markers alone or in combination in patient samples provides information that can be correlated with a promising lung cancer diagnosis by a diagnostician.

したがって、本発明はまた、肺癌および/または指示的容態の診断アッセイ、ならびに、任意選択的および好ましくは、被験体(患者)から採取したサンプル、より好ましくはいくつかの血液サンプル型における肺癌および/または指示的容態の検出のためのこのようなマーカーの使用方法に関する。   Thus, the present invention also provides a diagnostic assay for lung cancer and / or indicative condition, and optionally and preferably, lung cancer in a sample taken from a subject (patient), more preferably in some blood sample types and / or Or to the use of such markers for the detection of an indicative condition.

別の実施形態では、本発明は、架橋、テール、先端、および/もしくは挿入、ならびに/またはこのようなペプチドのアナログ、ホモログ、および誘導体に関する。このような架橋、テール、先端、および/または挿入を、実施例により詳細に記載する。   In another embodiment, the invention relates to crosslinks, tails, tips and / or insertions, and / or analogues, homologues and derivatives of such peptides. Such crosslinking, tails, tips and / or insertions are described in more detail in the examples.

本明細書中で使用される、「テール」は、本発明のスプライスバリアントに固有のアミノ酸配列の末端のペプチド配列をいう。したがって、任意選択的に、このようなテールを有するスプライスバリアントは、典型的には、スプライスバリアントの少なくとも第1の部分が対応する公知のタンパク質の一部と高度に相同し(しばしば、100%同一)、変異型の少なくとも第2の部分はテールを含むという点で、キメラと見なすことができる。   As used herein, "tail" refers to the peptide sequence at the end of the amino acid sequence unique to the splice variant of the invention. Thus, optionally, such tailed splice variants are typically highly homologous to the part of the known protein to which at least a first part of the splice variant corresponds (frequently 100% identical) And at least a second part of the variant may be considered as a chimera in that it comprises a tail.

本明細書中で使用される、「先端」は、本発明のスプライスバリアントに固有のアミノ酸配列の最初のペプチド配列をいう。したがって、このような先端を有するスプライスバリアントは、任意選択的に、スプライスバリアントの少なくとも第1の部分が先端を含み、少なくとも第2の部分が、典型的には、対応する公知のタンパク質の一部と高度に相同する(しばしば、100%同一)という点でキメラと見なすことができる。   As used herein, "tip" refers to the first peptide sequence of an amino acid sequence unique to a splice variant of the invention. Thus, a splice variant having such a tip, optionally, wherein at least a first portion of the splice variant comprises a tip and at least a second portion is typically a portion of the corresponding known protein It can be regarded as a chimera in that it is highly homologous (often 100% identical).

本明細書中で使用される、「縁部分」は、野生型または公知のタンパク質中で連結されなかった本発明のスプライスバリアントの2つの部分の間の接続(connection)をいう。縁は、任意選択的に、変異型の上記の「公知のタンパク質」部分とテールとの間の連結によって起こる可能性があり、そして/または、例えば、野生型配列の内部部分がもはや存在しない場合に起こる可能性があり、その結果、公知のタンパク質中で過去には隣接していなかった配列の2つの部分がスプライスバリアント中で隣接する。「架橋」は、任意選択的に、上記の縁部分であり得るが、先端と変異型の「公知のタンパク質」部分との間の連結部、テールと変異型の「公知のタンパク質」部分との間の連結部、または挿入と変異型の「公知のタンパク質」との間の連結部も含まれ得る。   As used herein, "edge portion" refers to a connection between two parts of a splice variant of the invention that has not been linked in wild-type or known proteins. The rim may optionally be caused by the linkage between the above-mentioned "known protein" portion of the variant and the tail and / or, for example, when the internal part of the wild-type sequence is no longer present The two parts of the sequence that were not previously adjacent in the known protein are adjacent in the splice variant. The "cross-linking" may optionally be the above mentioned edge, but at the junction between the tip and the variant "known protein" moiety, the tail and the variant "known protein" moiety Or between the insertion and the variant "known protein" may also be included.

任意選択的および好ましくは、テール、先端、または固有の挿入と変異型の「公知のタンパク質」部分との間の架橋は、少なくとも約10アミノ酸、より好ましくは少なくとも約20アミノ酸、もっと好ましくは少なくとも約30アミノ酸、さらにより好ましくは少なくとも約40アミノ酸を含み、その中の少なくとも1つのアミノ酸がテール/先端/挿入に由来し、少なくとも1つのアミノ酸が変異型の「公知のタンパク質」部分に由来する。また、任意選択的に、架橋は、約10〜約40個の任意の数(例えば、10、11、12、13、...37、38、39、40アミノ酸長またはその間の任意の数)のアミノ酸を含み得る。   Optionally and preferably, the cross-linking between the tail, the tip, or the unique insertion and the variant "known protein" moiety is at least about 10 amino acids, more preferably at least about 20 amino acids, more preferably at least about Thirty amino acids, even more preferably at least about 40 amino acids, of which at least one amino acid is derived from tail / tip / insertion and at least one amino acid is derived from the variant "known protein" portion. Also, optionally, the crosslinks are any number from about 10 to about 40 (e.g. 10, 11, 12, 13, ... 37, 38, 39, 40 amino acids long or any number in between) May contain amino acids of

架橋を、いずれかの方向で配列の長さを超えて伸長することができないことに留意すべきであり、架橋の記載毎に、架橋の長さが配列自体を超えて伸長しないような様式で読み取られると仮定すべきである。   It should be noted that the crosslinks can not extend beyond the length of the sequence in either direction, and for each description of the crosslink, in such a way that the length of the crosslink does not extend beyond the sequence itself It should be assumed that it is read.

さらに、以下の一定の文脈においてスライディングウィンドウに関して架橋を記載する。例えば、架橋の一定の記載は以下を特徴とする:2つの縁の間の架橋(公知のタンパク質の一部は変異型中に存在しない)を、任意選択的に以下のように記載することができる:CONTIG−NAME_P1(タンパク質名を示す)の架橋部分(長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がXX(架橋の中心の2アミノ酸、縁の各末端に由来する)を含み、以下の構造(CONTIG−NAME_P1の配列による番号づけ):アミノ酸番号49−x〜49(例えば)のいずれかから始まり、アミノ酸番号50+((n−2)−x)(例えば)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む。この例では、nが10〜50アミノ酸長の間の任意のアミノ酸数である架橋を含むと読み取るべきである。さらに、架橋ポリペプチドは配列を超えて伸長することができず、したがって、49−x(例えば)は少なくとも1であり、50+((n−2)−x)(例えば)は全アミノ酸長を超えないように読み取るべきである。   In addition, we will describe bridging in terms of sliding windows in the following fixed contexts: For example, certain descriptions of crosslinking are characterized as follows: Optionally, the crosslinking between the two edges (some of the known proteins are not present in the variant) is described as follows: Capable: Cross-linked moiety of CONTIG-NAME_P1 (indicating the protein name) (length “n” (wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids long, preferably at least about 30 amino acids long) , More preferably at least about 40 amino acids in length, most preferably at least about 50 amino acids in length, wherein at least two amino acids comprise XX (two amino acids at the center of the bridge, from each end of the rim), The following structure (numbering according to the sequence of CONTIG-NAME_P1): starting from any of amino acids 49-x to 49 (for example), amino acids No. 50 + ((n-2) -x) (for example) (wherein x varies from 0 to n-2), and includes a polypeptide. It should be read to include a cross-link that is any amino acid number between 50 amino acids long Further, the cross-linked polypeptide can not extend beyond the sequence, and thus 49-x (for example) is at least 1. Yes, 50 + ((n-2) -x) (for example) should be read so as not to exceed the total amino acid length.

別の実施形態では、本発明は、本発明のスプライスバリアントおよびそのペプチドフラグメントを特異的に認識する抗体を提供する。好ましくは、このような抗体は、本発明のスプライスバリアントを差分的に認識するが、対応する公知のタンパク質(このような公知のタンパク質を、以下の実施例中でそのスプライスバリアントに関して考察する)を認識しない。   In another embodiment, the invention provides antibodies that specifically recognize the splice variants of the invention and peptide fragments thereof. Preferably, such an antibody differentially recognizes the splice variants of the present invention, but the corresponding known proteins (such known proteins are discussed in relation to the splice variants in the following examples) not recognize.

別の実施形態では、本発明は、本発明のスプライスバリアントをコードし、本明細書中に列挙した配列のいずれか1つに記載のヌクレオチド配列またはこれに相補的な配列を有する単離核酸分子を提供する。別の実施形態では、本発明は、本明細書中に列挙した配列のいずれか1つに記載のヌクレオチド配列またはこれに相補的な配列を有する単離核酸分子を提供する。別の実施形態では、本発明は、本発明の核酸分子と特異的にハイブリッド形成することができる少なくとも約12ヌクレオチドのオリゴヌクレオチドを提供する。別の実施形態では、本発明は、本発明の単離核酸を含む、ベクター、細胞、リポソーム、および組成物を提供する。   In another embodiment, the present invention is an isolated nucleic acid molecule encoding a splice variant of the invention and having the nucleotide sequence set forth in any one of the sequences listed herein or a sequence complementary thereto. I will provide a. In another embodiment, the invention provides an isolated nucleic acid molecule having a nucleotide sequence set forth in any one of the sequences listed herein, or a sequence complementary thereto. In another embodiment, the invention provides an oligonucleotide of at least about 12 nucleotides capable of specifically hybridizing to a nucleic acid molecule of the invention. In another embodiment, the invention provides vectors, cells, liposomes, and compositions comprising the isolated nucleic acids of the invention.

別の実施形態では、本発明は、抗体が生体サンプル中のスプライスバリアントと特異的に相互作用するが、公知の対応するタンパク質(公知のタンパク質を、以下の実施例中でそのスプライスバリアントに関して考察する)を認識しない条件下で生体サンプルを本発明のスプライスバリアントを特異的に認識する抗体と接触させる工程と、前記相互作用を検出する工程と、相互作用の存在が生体サンプル中のスプライスバリアントの存在と相関することとを含む、生体サンプル中の本発明のスプライスバリアントの検出方法を提供する。   In another embodiment, the present invention specifically refers to a known corresponding protein, wherein the antibody specifically interacts with a splice variant in a biological sample (the known protein is discussed with respect to the splice variant in the following examples) Contacting the biological sample with an antibody that specifically recognizes the splice variant of the present invention under conditions not recognizing A), detecting the interaction, and the presence of the interaction the presence of the splice variant in the biological sample And detecting and / or correlating the splice variant of the present invention in a biological sample.

別の実施形態では、本発明は、単離核酸分子または少なくともほぼ最短の長さのオリゴヌクレオチドフラグメントを生体サンプルの核酸材料とハイブリッド形成させる工程と、ハイブリッド形成複合体を検出する工程と、ハイブリッド形成複合体の存在が生体サンプル中のスプライスバリアントの核酸配列の存在と相関することとを含む、生体サンプル中のスプライスバリアントの核酸配列の検出方法を提供する。   In another embodiment, the invention comprises the steps of hybridizing an isolated nucleic acid molecule or an oligonucleotide fragment of at least about the shortest length with nucleic acid material of a biological sample, detecting a hybridization complex, and hybridization. Provided is a method of detecting a nucleic acid sequence of a splice variant in a biological sample, including the presence of the complex correlating with the presence of the nucleic acid sequence of the splice variant in the biological sample.

本発明によれば、本明細書中に記載のスプライスバリアントは、肺癌診断のための限定されないマーカーの例である。本発明の各スプライスバリアントマーカーを、単独または組み合わせて、種々の用途(肺癌の予後、予想、スクリーニング、早期検診、進行の判断、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない)に使用することができる。   According to the invention, the splice variants described herein are examples of non-limiting markers for lung cancer diagnosis. Each splice variant marker of the present invention may be used alone or in combination in various applications (including but not limited to lung cancer prognosis, prognosis, screening, early screening, assessment of progression, treatment selection, and treatment monitoring) Can be used).

本発明の任意選択的であるが好ましい実施形態によれば、本発明の任意のマーカーを、任意選択的に、単独または組み合わせて使用することができる。このような組み合わせは、任意選択的に、本明細書中に記載の複数のマーカー(任意選択的に、マーカーの任意の小組み合わせ(subcombination)および/または少なくとも1つの他のマーカー(例えば、公知のマーカー)を特色とする組み合わせが含まれる)を含み得る。さらに、このような組み合わせを、任意選択的および好ましくは、本明細書中に記載の任意のマーカーと本明細書中に記載の任意の他のマーカー、および/または任意の他の公知のマーカー、および/または任意の他のマーカーとの間の定量的または半定量的測定の比の決定に関して上記のように使用することができる。本明細書中に記載の任意のマーカー(またはその組み合わせ)と公知のマーカーとの間のこのような比に関して、より好ましくは、公知のマーカーは、各クラスターまたは遺伝子に関して以下により詳細に記載の「公知のタンパク質」を含む。   According to an optional but preferred embodiment of the present invention, any of the markers of the present invention may optionally be used alone or in combination. Such combinations optionally include a plurality of markers described herein (optionally, any subcombination of markers and / or at least one other marker (eg, known) (Including a combination featuring a marker). Furthermore, such combinations are optionally and preferably any marker described herein and any other marker described herein, and / or any other known marker, It can be used as described above for the determination of the ratio of quantitative or semi-quantitative measurement between and / or any other marker. With regard to such a ratio between any marker (or combination thereof) described herein and the known marker, more preferably, the known marker is described in more detail below for each cluster or gene. "Known proteins" is included.

本発明の他の好ましい実施形態によれば、スプライスバリアントタンパク質もしくはそのフラグメントまたはスプライスバリアントの核酸配列もしくはそのフラグメントを、肺癌検出用のバイオマーカーと特徴づけることができ、それにより、バイオマーカーは、任意選択的に、上記の任意のバイオマーカーを含み得る。   According to another preferred embodiment of the invention, the nucleic acid sequence of the splice variant protein or fragment thereof or splice variant thereof or a fragment thereof can be characterized as a biomarker for lung cancer detection, whereby the biomarker is any Optionally, any of the above mentioned biomarkers can be included.

本発明のさらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、本明細書中に記載のスプライスバリアントタンパク質に対応する核酸配列によってコードされる任意のアミノ酸配列またはそのフラグメントを含む。このようなアミノ酸配列またはそのフラグメントに関する任意のオリゴペプチドまたはペプチドを、任意選択的に(さらにまたはあるいは)、バイオマーカー(テール、先端、挿入、縁、または架橋として表現されるこれらのタンパク質の固有のアミノ酸配列が含まれるが、これらに限定されない)として使用することもできる。本発明はまた、任意選択的に、このようなオリゴヌクレオチドまたはタンパク質を認識し、そして/またはこれらによって誘発することができる抗体を含む。   According to yet another preferred embodiment of the present invention, optionally and preferably any amino acid sequence encoded by the nucleic acid sequence corresponding to the splice variant protein as described herein or a fragment thereof including. Any oligopeptides or peptides relating to such amino acid sequences or fragments thereof are optionally (additionally or alternatively) biomarkers (specific to those proteins expressed as tails, tips, insertions, edges or crosslinks It can also be used as an amino acid sequence, including but not limited to). The invention also optionally includes antibodies capable of recognizing and / or eliciting such oligonucleotides or proteins.

本発明はまた、任意選択的および好ましくは、任意選択的に、任意の適用のための上記の本発明のスプライスバリアントに対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。   The invention also optionally and preferably comprises any nucleic acid sequence or fragment or amino acid sequence or fragment thereof corresponding to the above-described splice variant of the invention for any application.

方法またはアッセイの非限定的な例を、以下に記載する。   Non-limiting examples of methods or assays are described below.

本発明はまた、このような診断方法またはアッセイに基づいたキットに関する。   The invention also relates to a kit based on such a diagnostic method or assay.

核酸配列およびオリゴヌクレオチド
本発明の種々の実施形態は、上記の核酸配列、その配列フラグメント、これとハイブリッド形成可能な配列、これと相同な配列、異なるコドン使用頻度を有する類似のポリペプチドをコードする配列、無作為またはターゲティングされた様式で天然に存在するか人為的に誘導された1つまたは複数のヌクレオチドの欠失、挿入、または置換などの変異によって特徴づけられる変化した配列を含む。
Nucleic Acid Sequences and Oligonucleotides Various embodiments of the invention encode similar polypeptides having the nucleic acid sequences described above, their sequence fragments, sequences hybridizable therewith, sequences homologous thereto, different codon usage Sequences, including altered sequences characterized by mutations such as deletions, insertions or substitutions of one or more naturally occurring or artificially derived nucleotides in a random or targeted manner.

本発明は、本明細書中に記載の核酸配列、そのフラグメント、これとハイブリッド形成可能な配列、これと相同な配列(例えば、下記の核酸配列と少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも95%、または100%同一)、異なるコドン使用頻度を有する類似のポリペプチドをコードする配列、無作為またはターゲティングされた様式で天然に存在するか人為的に誘導された1つまたは複数のヌクレオチドの欠失、挿入、または置換などの変異によって特徴づけられる変化した配列を含む。本発明はまた、本発明のポリペプチドに固有の配列領域を含む相同な核酸配列(すなわち、本発明のポリヌクレオチド配列の一部を形成する)を含む。   The present invention provides nucleic acid sequences as described herein, fragments thereof, sequences hybridizable therewith, sequences homologous thereto (eg at least 50%, at least 55%, at least 60% of the nucleic acid sequences described below) At least 65%, at least 70%, at least 75%, at least 80%, at least 85%, at least 95%, or 100% identical), sequences encoding similar polypeptides with different codon usage, random or targeted And altered sequences characterized by mutations such as deletions, insertions, or substitutions of one or more naturally occurring or artificially derived nucleotides in a uniform manner. The invention also includes homologous nucleic acid sequences (ie, forming part of the polynucleotide sequences of the invention) comprising sequence regions unique to the polypeptides of the invention.

本発明のポリヌクレオチド配列が依然に同定されていないポリペプチドをコードする場合、本発明はまた、上記の単離ポリヌクレオチドおよびその各核酸フラグメントによってコードされる新規のポリペプチドまたはその一部を含む。   Where the polynucleotide sequences of the invention encode a polypeptide that has not yet been identified, the invention also includes the novel polypeptides encoded by the isolated polynucleotides described above and their respective nucleic acid fragments or parts thereof .

「核酸フラグメント」、「オリゴヌクレオチド」、または「ポリヌクレオチド」は、核酸のポリマーをいうために本明細書中で交換可能に使用される。本発明のポリヌクレオチド配列は、RNA配列、相補ポリヌクレオチド配列(cDNA)、ゲノムポリヌクレオチド配列、および/または複合ポリヌクレオチド配列(例えば、上記の組み合わせ)の形態で単離および提供される一本鎖または二本鎖の核酸配列をいう。   "Nucleic acid fragment", "oligonucleotide", or "polynucleotide" are used interchangeably herein to refer to a polymer of nucleic acid. The polynucleotide sequences of the present invention may be single-stranded isolated and provided in the form of RNA sequences, complementary polynucleotide sequences (cDNA), genomic polynucleotide sequences, and / or complex polynucleotide sequences (eg, combinations of the above). Or double-stranded nucleic acid sequence.

本明細書中で使用される、句「相補ポリヌクレオチド配列」は、逆転写酵素または任意の他のRNA依存性DNAポリメラーゼを使用した伝令RNAの逆転写由来の配列をいう。このような配列を、その後、DNA依存性DNAポリメラーゼを使用して、in vivoまたはin vitroで増幅させることができる。   As used herein, the phrase "complementary polynucleotide sequence" refers to a sequence from reverse transcription of messenger RNA using reverse transcriptase or any other RNA dependent DNA polymerase. Such sequences can then be amplified in vivo or in vitro using a DNA-dependent DNA polymerase.

本明細書中で使用される、句「ゲノムポリヌクレオチド配列」は、染色体に由来し(単離され)、それにより、染色体の隣接部分を示す配列をいう。   As used herein, the phrase "genomic polynucleotide sequence" refers to a sequence that is derived (isolated) from a chromosome, thereby indicating the flanking portion of the chromosome.

本明細書中で使用される、句「複合ポリヌクレオチド配列」は、ゲノム配列およびcDNA配列から構成される配列をいう。複合配列は、本発明のポリペプチドをコードするために必要ないくつかのエクソン配列およびこれらの間を介在するいくつかのイントロン配列を含み得る。イントロン配列は任意の供給源(他の遺伝子が含まれる)に由来することができ、典型的には、保存スプライシングシグナル配列が含まれる。このようなイントロン配列には、シス作用発現調節エレメントがさらに含まれ得る。   As used herein, the phrase "composite polynucleotide sequence" refers to a sequence composed of genomic and cDNA sequences. The composite sequence may include some exon sequences necessary to encode the polypeptide of the present invention and some intron sequences intervening therebetween. Intron sequences can be derived from any source, including other genes, and typically include conserved splicing signal sequences. Such intron sequences may further include cis-acting expression regulatory elements.

本発明の好ましい実施形態は、オリゴヌクレオチドプローブを含む。   Preferred embodiments of the invention include oligonucleotide probes.

本発明によって利用することができるオリゴヌクレオチドプローブの例は、本発明の任意の変異型の固有の配列領域に相補的な配列(本発明の架橋、テール、先端、および/もしくは挿入のアミノ酸配列をコードするヌクレオチド配列、ならびに/または本明細書中に記載の任意のヌクレオチド配列の等価な部分(本明細書中に記載のノード、セグメント、またはアンプリコンのヌクレオチド配列が含まれるが、これらに限定されない)が含まれるが、これらに限定されない)を含む一本鎖ポリヌクレオチドである。   An example of an oligonucleotide probe that can be utilized according to the invention is a sequence complementary to the unique sequence region of any variant of the invention (the amino acid sequence of the crosslink, tail, tip and / or insertion of the invention) A nucleotide sequence that encodes, and / or an equivalent portion of any of the nucleotide sequences described herein (including, but not limited to, the nucleotide sequences of nodes, segments, or amplicons described herein A single stranded polynucleotide, including, but not limited to).

あるいは、本発明のオリゴヌクレオチドプローブを、上記核酸配列のいずれかに含まれる核酸配列、特に、上記の部分(本発明の架橋、テール、先端、および/もしくは挿入のアミノ酸配列をコードするヌクレオチド配列、ならびに/または本明細書中に記載の任意のヌクレオチド配列の等価な部分(本明細書中に記載のノード、セグメント、またはアンプリコンのヌクレオチド配列が含まれるが、これらに限定されない)が含まれるが、これらに限定されない)とハイブリッド形成するようにデザインすることができる。   Alternatively, the oligonucleotide probe of the present invention may be a nucleic acid sequence included in any of the above nucleic acid sequences, in particular, a nucleotide sequence encoding the amino acid sequence of the crosslink, tail, tip and / or insertion of the portion (the present invention; And / or equivalent parts of any of the nucleotide sequences described herein, including but not limited to the node, segment, or amplicon nucleotide sequences described herein Can be designed to hybridize with (not limited to) these.

本発明の技術によってデザインしたオリゴヌクレオチドを、酵素合成または固相合成などの当該分野で公知の任意のオリゴヌクレオチド合成方法にしたがって生成することができる。固相合成実施のための装置および試薬は、例えば、Applied Biosystemsから市販されている。任意の他のこのような合成手段も使用することができ、実際のオリゴヌクレオチド合成は、十分に当業者の能力の範囲内であり、例えば、固相化学(例えば、シアノエチルホスホラミダイトおよびその後の脱保護、脱塩、および例えば自動化トリチル−on(trityl−on)法またはHPLCによる精製)を使用した“Molecular Cloning:A laboratory Manual" Sambrook et al.,(1989);"Current Protocols in Molecular Biology" Volumes I−III Ausubel,R.M.,ed.(1994);Ausubel et al.,"Current Protocols in Molecular Biology",John Wiley and Sons,Baltimore,Maryland(1989);Perbal,"A Practical Guide to Molecular Cloning",John Wiley & Sons,New York(1988)and "Oligonucleotide Synthesis" Gait,M.J.,ed.(1984)に詳述の確立された方法によって実施することができる。   Oligonucleotides designed by the techniques of the present invention can be generated according to any oligonucleotide synthesis method known in the art, such as enzyme synthesis or solid phase synthesis. Devices and reagents for performing solid phase synthesis are commercially available from, for example, Applied Biosystems. Any other such synthetic means can also be used, and the actual oligonucleotide synthesis is well within the ability of one skilled in the art, eg, solid phase chemistry (eg cyanoethyl phosphoramidite and subsequent) Deprotection, desalting, and purification using, for example, the automated Trityl-on (trityl-on) method or HPLC), "Molecular Cloning: A laboratory Manual" Sambrook et al. (1989); "Current Protocols in Molecular Biology" Volumes I-III Ausubel, R., et al. M. , Ed. (1994); Ausubel et al. , "Current Protocols in Molecular Biology", John Wiley and Sons, Baltimore, Maryland (1989); Perbal, "A Practical Guide to Molecular Cloning", John Wiley & Sons, New York (1988) and "Oligonucleotide Synthesis" Gait, M. . J. , Ed. It can be implemented by the established method detailed in (1984).

本発明のこの態様にしたがって使用されるオリゴヌクレオチドは、約10〜約200塩基、好ましくは約15〜約150塩基、より好ましくは約20〜約100塩基、最も好ましくは約20〜約50塩基の範囲から選択される長さを有するものである。好ましくは、本発明のオリゴヌクレオチドは、少なくとも17塩基、少なくとも18塩基、少なくとも19塩基、少なくとも20塩基、少なくとも22塩基、少なくとも25塩基、少なくとも30塩基、または少なくとも40塩基が本発明のバイオマーカーと特異的にハイブリッド形成可能であることを特徴とする。   Oligonucleotides used in accordance with this aspect of the invention may have from about 10 to about 200 bases, preferably about 15 to about 150 bases, more preferably about 20 to about 100 bases, most preferably about 20 to about 50 bases. It has a length selected from the range. Preferably, in the oligonucleotide of the present invention, at least 17 bases, at least 18 bases, at least 19 bases, at least 20 bases, at least 20 bases, at least 22 bases, at least 25 bases, at least 30 bases, or at least 40 bases are specific to the biomarkers of the present invention It is characterized in that it is hybridizable.

本発明のオリゴヌクレオチドは、3’→5’リン酸ジエステル結合で結合したプリンおよびピリミジン塩基からなる複素環式ヌクレオシドを含み得る。   The oligonucleotide of the present invention may comprise a heterocyclic nucleoside consisting of a purine and a pyrimidine base linked by a 3 'to 5' phosphodiester bond.

好ましくは、使用されるオリゴヌクレオチドは、以下に広範に記載されるように、1つまたは複数の骨格、ヌクレオシド間結合、または塩基で修飾されたものである。   Preferably, the oligonucleotides used are those modified with one or more backbones, internucleoside linkages, or bases, as broadly described below.

本発明のこの態様に有用な好ましいオリゴヌクレオチドの特定の例には、修飾骨格または非天然ヌクレオシド間結合を含むオリゴヌクレオチドが含まれる。修飾骨格を有するオリゴヌクレオチドには、米国特許第4,469,863号;同第4,476,301号;同第5,023,243号;同第5,177,196号;同第5,188,897号;同第5,264,423号;同第5,276,019号;同第5,278,302号;同第5,286,717号;同第5,321,131号;同第5,399,676号;同第5,405,939号;同第5,453,496号;同第5,455,233号;同第5,466,677号;同第5,476,925号;同第5,519,126号;同第5,536,821号;同第5,541,306号;同第5,550,111号;同第5,563,253号;同第5,571,799号;同第5,587,361号;および同第5,625,050号に開示のように、骨格中にリン原子を保持するものが含まれる。   Specific examples of preferred oligonucleotides useful in this aspect of the invention include oligonucleotides containing modified backbones or non-naturally occurring internucleoside linkages. Oligonucleotides having a modified backbone include, for example, U.S. Patent Nos. 4,469,863; 4,476,301; 5,023,243; 5,177,196; 188, 897; 5,264, 423; 5, 276, 019; 5, 278, 302; 5, 286, 717; 5, 321, 131; Nos. 5,399,676; 5,405,939; 5,453,496; 5,455,233; 5,466,677; 5,476. 5,925,126; 5,536,821; 5,541,306; 5,550,111; 5,563,253; 5,571,799; 5,587,361; and 5,625, As disclosed in No. 50, include those that retain a phosphorus atom in the backbone.

好ましい修飾オリゴヌクレオチド骨格には、例えば、ホスホロチオエート、キラルホスホロチオエート、ホスホロジチオエート、ホスホトリエステル、アルミアルキルホスホトリエステル、メチルおよび他のアルキルホスホネート(3’−アルキレンホスホネートおよびキラルホスホネートが含まれる)、ホスフィネート、ホスホラミデート(3’−アミノホスホラミデートおよびアミノアルキルホスホラミデートが含まれる)、チオノホスホラミデート、チオノアルキルホスホネート、チオノアルキルホスホトリエステル、ならびに通常の3’−5’結合を有するボラノホスフェート、これらの2’−5’結合アナログ、およびヌクレオシド単位の隣接対が3’−5’と5’−3’または2’−5’と5’−2’とで結合している極性が逆のものが含まれる。種々の塩、混合塩、および遊離酸形態も使用することができる。   Preferred modified oligonucleotide backbones include, for example, phosphorothioates, chiral phosphorothioates, phosphorodithioates, phosphotriesters, aluminum alkyl phosphotriesters, methyl and other alkyl phosphonates (including 3'-alkylene phosphonates and chiral phosphonates), Phosphinates, phosphoramidates (including 3'-aminophosphoramidates and aminoalkylphosphoramidates), thionophosphoramidates, thionoalkyl phosphonates, thionoalkyl phosphotriesters, and conventional 3'-5 ' Bonded boranophosphates, their 2'-5 'linked analogues, and adjacent pairs of nucleoside units are linked by 3'-5' and 5'-3 'or 2'-5' and 5'-2 ' The polarity is reversed It includes those. Various salts, mixed salts, and free acid forms can also be used.

あるいは、リン原子を含まない修飾オリゴヌクレオチド骨格は、短鎖アルキルもしくはシクロアルキルヌクレオシド間結合、混合ヘテロ原子およびアルキルもしくはシクロアルキルヌクレオシド間結合、または1つまたは複数の短鎖ヘテロ原子もしくは複素環式ヌクレオシド間結合によって形成された骨格を有する。これらには、モルホリノ結合(その一部がヌクレオシドの糖部分から形成されている);シロキサン骨格、スルフィド、スルホキシド、およびスルホン骨格;ホルムアセチルおよびチオホルムアセチル骨格;メチレンホルムアセチルおよびチオホルムアセチル骨格;アルケン含有骨格;スルファメート骨格;メチレンイミノおよびメチレンヒドラジノ骨格;スルホネートおよびスルホンアミド骨格;アミド骨格を有する骨格、ならびに混合されたN、O、S、およびCH成分を有する骨格が含まれ、これらは、米国特許第5,034,506号;同第5,166,315号;同第5,185,444号;同第5,214,134号;同第5,216,141号;同第5,235,033号;同第5,264,562号;同第5,264,564号;同第5,405,938号;同第5,434,257号;同第5,466,677号;同第5,470,967号;同第5,489,677号;同第5,541,307号;同第5,561,225号;同第5,596,086号;同第5,602,240号;同第5,610,289号;同第5,602,240号;同第5,608,046号;同第5,610,289号;同第5,618,704号;同第5,623,070号;同第5,663,312号;同第5,633,360号;同第5,677,437号;および同第5,677,439号に開示されている。 Alternatively, the modified oligonucleotide backbone that does not contain a phosphorus atom can be a short alkyl or cycloalkyl internucleoside linkage, a mixed heteroatom and an alkyl or cycloalkyl internucleoside linkage, or one or more short heteroatoms or heterocyclic nucleosides. It has a skeleton formed by interlinking. These include morpholino linkages (part of which are formed from the sugar moieties of the nucleosides); siloxane backbone, sulfide, sulfoxide, and sulfone backbones; formacetyl and thioformacetyl backbones; methyleneformacetyl and thioformacetyl backbones; Alkene-containing backbone; sulfamate backbone; methyleneimino and methylenehydrazino backbone; sulfonate and sulfonamide backbone; backbone with amide backbone, and backbone with mixed N, O, S, and CH 2 components, which include U.S. Patent Nos. 5,034,506; 5,166,315; 5,185,444; 5,214,134; 5,216,141; , 235, 033; the same 5,264, 562; the same 5,264, 5 No.64; No.5,405,938; No.5,434,257; No.5,466,677; No.5,470,967; No.5,489,677; 5,541,307; 5,561,225; 5,596,086; 5,602,240; 5,610,289; 5,602,240 No. 5,608,046; No. 5,610,289; No. 5,618,704; No. 5,623,070; No. 5,663,312; 633,360; 5,67,437; and 5,677,439.

本発明で使用することができる他のオリゴヌクレオチドは、糖とヌクレオシド間結合の両方が修飾されたもの(すなわち、ヌクレオチド単位の骨格が新規の基で置換されている)である。塩基単位は、適切なポリヌクレオチド標的との相補性のために維持されている。このようなオリゴヌクレオチド模倣物の例には、ペプチド核酸(PNA)が含まれる。PNA化合物の調製を教示した米国特許には、米国特許第5,539,082号;同第5,714,331号および同第5,719,262号(それぞれ本明細書中で参考として援用される)が含まれるが、これらに限定されない。本発明で使用することができる他の骨格修飾は、米国特許第6,303,374号に開示されている。   Other oligonucleotides that can be used in the present invention are those in which both the sugar and the internucleoside linkage have been modified (ie, the backbone of the nucleotide unit has been replaced by a novel group). Base units are maintained for complementarity with the appropriate polynucleotide target. Examples of such oligonucleotide mimetics include peptide nucleic acids (PNAs). US Patents that teach the preparation of PNA compounds include US Patent Nos. 5,539,082; 5,714,331 and 5,719,262, each of which is incorporated herein by reference. Is included, but is not limited thereto. Other backbone modifications that can be used in the present invention are disclosed in US Pat. No. 6,303,374.

本発明のオリゴヌクレオチドはまた、塩基の修飾または置換を含み得る。本明細書中で使用される、「非修飾」または「天然の」塩基には、プリン塩基であるアデニン(A)およびグアニン(G)ならびにピリミジン塩基であるチミン(T)、シトシン(C)、およびウラシル(U)が含まれる。修飾塩基には、5−メチルシトシン(5−me−C)、5−ヒドロキシメチルシトシン、キサンチン、ヒポキサンチン、2−アミノアデニン、アデニンおよびグアニンの6−メチルおよび他のアルキル誘導体、アデニンおよびグアニンの2−プロピルおよび他のアルキル誘導体、2−チオウラシル、2−チオチミン、および2−チオシトシン、5−ハロウラシルおよびシトシン、5−プロピニルウラシルおよびシトシン、6−アゾウラシル、シトシン、およびチミン、5−ウラシル(シュードウラシル)、4−チオウラシル、8−ハロ、8−アミノ、8−チオール、8−チオアルキル、8−ヒドロキシ、および他の8置換アデニンおよびグアニン、5−ハロ(特に5−ブロモ)、5−トリフルオロメチル、および他の5置換ウラシルおよびシトシン、7−メチルグアニンおよび7−メチルアデニン、8−アザグアニンおよび8−アザアデニン、7−デアザグアニンおよび7−デアザアデニン、ならびに3−デアザグアニンおよび3−デアザアデニンなどの他の合成塩基および天然の塩基が含まれるが、これらに限定されない。本発明のオリゴマー化合物の結合親和性の増加に特に有用なさらなる塩基には、5置換ピリミジン、6−アザピリミジン、およびN−2、N−6、およびO−6置換プリン(2−アミノプロピルアデニン、5−プロピニルウラシル、および5−プロピニルシトシンが含まれる)が含まれる。5−メチルシトシン置換により、核酸二重鎖の安定性が0.6〜1.2℃増加することが示されており、この置換は、さらにより詳細には、2’−O−メトキシエチル糖修飾と組み合わせた場合、現在好ましい塩基置換である。   The oligonucleotides of the present invention may also include base modifications or substitutions. As used herein, “unmodified” or “natural” bases include the purine bases adenine (A) and guanine (G) and the pyrimidine bases thymine (T), cytosine (C), And uracil (U) are included. Modified bases include 5-methylcytosine (5-me-C), 5-hydroxymethylcytosine, xanthine, hypoxanthine, 2-aminoadenine, adenine and 6-methyl and other alkyl derivatives of guanine, adenine and guanine 2-propyl and other alkyl derivatives, 2-thiouracil, 2-thiothymine, and 2-thiocytosine, 5-halouracil and cytosine, 5-propynyluracil and cytosine, 6-azouracil, cytosine, and thymine, 5-uracil (sudouracil (sudouracil) ), 4-thiouracil, 8-halo, 8-amino, 8-thiol, 8-thioalkyl, 8-hydroxy, and other 8-substituted adenines and guanines, 5-halo (especially 5-bromo), 5-trifluoromethyl , And other 5-substituted uracils and cis But includes other synthetic and natural bases such as syn, 7-methylguanine and 7-methyladenine, 8-azaguanine and 8-azaadenine, 7-deazaguanine and 7-deazaadenine, and 3-deazaguanine and 3-deazaadenine. Not limited to these. Additional bases particularly useful for increasing the binding affinity of the oligomeric compounds of the invention include 5-substituted pyrimidines, 6-azapyrimidines, and N-2, N-6, and O-6 substituted purines (2-aminopropyladenine , 5-propynyluracil, and 5-propynylcytosine are included. 5-methylcytosine substitution has been shown to increase the stability of the nucleic acid duplex by 0.6-1.2 ° C., and this substitution is even more particularly the 2'-O-methoxyethyl sugar When combined with modifications, it is the presently preferred base substitution.

本発明のオリゴヌクレオチドの別の修飾は、オリゴヌクレオチドの活性、細胞分布、または細胞取り込みを増大させるオリゴヌクレオチドへの1つまたは複数の部分または抱合体(conjugate)の化学結合を含む。このような部分には、米国特許第6,303,374号に開示のように、コレステロール部分などの脂質部分、コール酸、チオエーテル(例えば、ヘキシル−S−トリチルチオール)、チオコレステロール、脂肪族鎖(例えば、ドデカンジオールまたはウンデシル残基)、リン脂質(例えば、ジヘキサデシル−rac−グリセロールまたはトリエチルアンモニウム1,2−ジ−O−ヘキサデシル−rac−グリセロ−3−H−ホスホネート)、ポリアミンもしくはポリエチレングリコール鎖、またはアダマンタン酢酸、パルミチル部分、またはオクタデシルアミンもしくはヘキシルアミノ−カルボニル−オキシコレステロール部分が含まれるが、これらに限定されない。   Another modification of the oligonucleotides of the invention involves chemical coupling of one or more moieties or conjugates to the oligonucleotide to increase the activity, cellular distribution or cellular uptake of the oligonucleotide. Such moieties include lipid moieties such as cholesterol moieties, cholic acid, thioethers (eg, hexyl-S-tritylthiol), thiocholesterol, aliphatic chains as disclosed in US Pat. No. 6,303,374. (Eg dodecanediol or undecyl residue), phospholipids (eg dihexadecyl-rac-glycerol or triethylammonium 1,2-di-O-hexadecyl-rac-glycero-3-H-phosphonate), polyamine or polyethylene glycol chains Or adamantane acetic acid, palmityl moiety, or octadecylamine or hexylamino-carbonyl-oxycholesterol moiety, including but not limited to.

所与のオリゴヌクレオチド分子の全ての位置が均一に修飾される必要はなく、実際、1つを超える上記修飾を1つの化合物またはオリゴヌクレオチド内の1つのヌクレオチドにさえも組み込むことができる。   It is not necessary that all positions of a given oligonucleotide molecule be uniformly modified, in fact, more than one of the above modifications may be incorporated into even one nucleotide within one compound or oligonucleotide.

本発明のオリゴヌクレオチドが診断薬としてのより有効な使用および/または生物学的利用能、治療有効性の増加および細胞傷害性の減少のためにさらに修飾することができると認識される。   It is recognized that the oligonucleotides of the invention can be further modified for more effective use as a diagnostic and / or bioavailability, increased therapeutic efficacy and decreased cytotoxicity.

本発明のポリヌクレオチドの細胞発現を可能にするために、上記核酸配列の1つの少なくともコード領域を含み、少なくとも1つのシス作用調節エレメントをさらに含む本発明の核酸構築物を使用することができる。本明細書中で使用される、句「シス作用調節エレメント」は、トランス作用調節因子に結合してその下流に存在するコード配列の転写を調節するポリヌクレオチド配列、好ましくはプロモーターをいう。   In order to allow cellular expression of the polynucleotide of the invention, it is possible to use the nucleic acid construct of the invention which comprises at least the coding region of one of the above nucleic acid sequences and which further comprises at least one cis-acting regulatory element. As used herein, the phrase "cis-acting regulatory element" refers to a polynucleotide sequence, preferably a promoter, which binds to a trans-acting regulator and regulates transcription of a coding sequence present downstream thereof.

任意の適切なプロモーター配列を、本発明の核酸構築物によって使用することができる。   Any suitable promoter sequence can be used with the nucleic acid constructs of the invention.

好ましくは、本発明の核酸構築物によって使用されるプロモーターは、形質転換された特異的細胞集団中で活性である。細胞型特異的および/または組織特異的プロモーターの例には、肝臓特異的であるアルブミンプロモーター、リンパ特異的プロモーター(Calame et al.,(1988)Adv.Immunol.43:235−275)、特に、T細胞受容体(Winoto et al.,(1989)EMBO J.8:729−733))および免疫グロブリン(Banerji et al.(1983)Cell 33729−740)のプロモーター、神経フィラメントプロモーターなどのニューロン特異的プロモーター(Byrne et al.(1989)Proc.Natl.Acad.Sci.USA 86:5473−5477)、膵臓特異的プロモーター(Edlunch et al.(1985)Science 230:912−916)または乳腺特異的プロモーター(乳清プロモーター(U.S.Pat.No.4,873,316 and European Application Publication No.264,166)など)などのプロモーターが含まれる。本発明の核酸構築物は、プロモーター配列に隣接するか遠位に存在し、構築物由来の転写の上方制御で機能し得るエンハンサーをさらに含み得る。   Preferably, the promoter used by the nucleic acid construct of the invention is active in the transformed specific cell population. Examples of cell type specific and / or tissue specific promoters include the albumin promoter which is liver specific, the lymph specific promoter (Calame et al., (1988) Adv. Immunol. 43: 235-275), in particular Promoters for T cell receptor (Winoto et al., (1989) EMBO J. 8: 729-733) and immunoglobulins (Banerji et al. (1983) Cell 33729-740), neuron specific such as neurofilament promoter Promoter (Byrne et al. (1989) Proc. Natl. Acad. Sci. USA 86: 5473-5477), a pancreas specific promoter (Edlunch et al. (1985) Science 230). 912-916) or a mammary gland specific promoter (such as whey promoter (U.S. Pat. No. 4, 873, 316 and European Application Publication No. 264, 166), etc.). The nucleic acid construct of the present invention may further comprise an enhancer which is adjacent to or distal to the promoter sequence and which may function in the upregulation of transcription from the construct.

本発明の核酸構築物は、好ましくは、適切な選択マーカーおよび/または複製起点をさらに含む。好ましくは、使用される核酸構築物は、大腸菌においてその両方(構築物が適切な選択マーカーおよび複製起点を含む)が増殖し、最適な細胞における増殖または遺伝子および組織における組み込みに適合し得るシャトルベクターである。本発明の構築物は、例えば、プラスミド、バクミド、ファージミド、コスミド、ファージ、ウイルス、または人工染色体であり得る。   The nucleic acid construct of the invention preferably further comprises a suitable selectable marker and / or an origin of replication. Preferably, the nucleic acid construct used is a shuttle vector, which both grow in E. coli (the construct contains an appropriate selectable marker and an origin of replication) and which is compatible with growth in optimal cells or integration in genes and tissues. . The constructs of the invention may be, for example, plasmids, bacmids, phagemids, cosmids, phages, viruses, or artificial chromosomes.

適切な構築物の例には、pcDNA3、pcDNA3.1(+/−)、pGL3,PzeoSV2(+/−)、pDisplay、pEF/myc/cyto、pCMV/myc/cyto(それぞれInvitrogen Co.(www.invitrogen.com)から市販されている)が含まれるが、これらに限定されない。レトロウイルスベクターおよびパッケージング系の例は、Clontech,San Diego,Calif.から市販されており、Retro−XベクターであるpLNCXおよびpLXSNが含まれ、これらは、複数のクローニング部位にクローニング可能であり、導入遺伝子がCMVプロモーターから転写される。導入遺伝子が5’LTRプロモーターから転写されるpBabeなどのMo−MuLV由来のベクターも含まれる。   Examples of suitable constructs include pcDNA3, pcDNA3.1 (+/-), pGL3, PzeoSV2 (+/-), pDisplay, pEF / myc / cyto, pCMV / myc / cyto (Invitrogen Co. (www. Invitrogen respectively). Commercially available from .com) but are not limited thereto. Examples of retroviral vectors and packaging systems are described by Clontech, San Diego, Calif. And are Retro-X vectors pLNCX and pLXSN, which can be cloned into multiple cloning sites, and transgenes are transcribed from the CMV promoter. Also included are vectors derived from Mo-MuLV such as pBabe, in which the transgene is transcribed from the 5 'LTR promoter.

現在好ましいin vivo核酸導入技術には、アデノウイルス、レンチウイルス、単純ヘルペスI型ウイルス、またはアデノ随伴ウイルス(AAV)、および脂質ベースの系などのウイルス構築物または非ウイルス構築物でのトランスフェクションが含まれる。遺伝子の脂質媒介性導入に有用な脂質は、例えば、DOTMA、DOPE、およびDC−Chol(Tonkinson et al.,Cancer Investigation,14(1):54−65(1996))である。遺伝子治療で用いる最も好ましい構築物は、ウイルス、最も好ましくはアデノウイルス、AAV、レンチウイルス、またはレトロウイルスである。レトロウイルス構築物などのウイルス構築物は、少なくとも1つの転写プロモーター/エンハンサー若しくは遺伝子座限定(defining)エレメント、または選択的スプライシング、核RNA輸送、もしくはメッセンジャーの翻訳後修飾などの他の手段によって遺伝子発現を調節する他のエレメントを含む。このようなベクター構築物はまた、ウイルス構築物中に既に存在しない限り、使用されるウイルスに適切なパッケージングシグナル、長末端反復(LTR)もしくはその一部、ならびにプラス鎖およびマイナス鎖のプライマー結合部位を含む。さらに、このような構築物は、典型的には、配置される宿主細胞からのペプチドの分泌のためのシグナルペプチドを含む。好ましくは、この目的のためのシグナル配列は、哺乳動物シグナル配列または本発明のポリペプチド変異型のシグナル配列である。任意選択的に、構築物はまた、ポリアデニル化を指示するシグナルならびに1つまたは複数の制限部位および転写終結配列を含み得る。例として、このような構築物は、典型的には、5’LTR、tRNA結合部位、パッケージングシグナル、二本鎖DNA合成起点、および3’LTR、またはその一部を含む。カチオン性脂質、ポリリジン、およびデンドリマーなどの非ウイルス性の他のベクターを使用することができる。   Currently preferred in vivo nucleic acid transfer techniques include transfection with viral or non-viral constructs such as adenovirus, lentivirus, herpes simplex virus type I, or adeno-associated virus (AAV), and lipid-based systems . Lipids useful for lipid-mediated transfer of genes are, for example, DOTMA, DOPE, and DC-Chol (Tonkinson et al., Cancer Investigation, 14 (1): 54-65 (1996)). The most preferred constructs for use in gene therapy are viruses, most preferably adenovirus, AAV, lentivirus or retrovirus. A viral construct, such as a retroviral construct, regulates gene expression by at least one transcriptional promoter / enhancer or locus defining element or other means such as alternative splicing, nuclear RNA transport, or post-translational modification of messengers Contains other elements that Such vector constructs will also, unless already present in the virus construct, the packaging signal appropriate for the virus used, the long terminal repeat (LTR) or part thereof, and the primer binding sites of the plus and minus strands. Including. In addition, such constructs typically include a signal peptide for secretion of the peptide from the host cell in which it is placed. Preferably, the signal sequence for this purpose is a mammalian signal sequence or a signal sequence of a polypeptide variant of the invention. Optionally, the construct may also include a signal that directs polyadenylation, as well as one or more restriction sites and a transcription termination sequence. By way of example, such constructs typically comprise a 5 'LTR, a tRNA binding site, a packaging signal, a double stranded DNA synthesis origin, and a 3' LTR, or a portion thereof. Other non-viral vectors such as cationic lipids, polylysine and dendrimers can be used.

ハイブリッド形成アッセイ
生体サンプル中の目的の核酸の検出を、任意選択的に、オリゴヌクレオチドプローブを使用したハイブリッド形成ベースのアッセイによって行うことができる(本発明のプローブの非限定的な例は前述した)。
Hybridization Assay The detection of a nucleic acid of interest in a biological sample can optionally be carried out by a hybridization based assay using oligonucleotide probes (non-limiting examples of probes of the invention are described above) .

伝統的なハイブリッド形成アッセイには、PCR、RT−PCR、実時間PCR、RNアーゼ保護、in situハイブリッド形成、プライマー伸長、サザンブロット(DNA検出)、ドットブロットまたはスロットブロット(DNA、RNA)、およびノーザンブロット(RNA検出)(NAT型アッセイを、以下により詳細に記載する)が含まれる。最近、PNAが記載されている(Nielsen et al.1999,Current Opin.Biotechnol.10:71−75)。他の検出方法には、ディップスティック機構上にプローブを含むキットなどが含まれる。   Traditional hybridization assays include PCR, RT-PCR, real-time PCR, RNase protection, in situ hybridization, primer extension, Southern blot (DNA detection), dot blot or slot blot (DNA, RNA), and Northern blot (RNA detection) (NAT-type assay is described in more detail below) is included. Recently, PNA has been described (Nielsen et al. 1999, Current Opin. Biotechnol. 10: 71-75). Other detection methods include kits and the like that include a probe on a dipstick mechanism.

生体サンプル中の目的の変異型(すなわち、DNAまたはRNA)を検出可能なハイブリッド形成ベースのアッセイは、10、15、20、または30〜100ヌクレオチド長、好ましくは10〜50ヌクレオチド長、より好ましくは40〜50ヌクレオチド長であり得るオリゴヌクレオチドの使用に依存する。   A hybridization based assay capable of detecting a variant of interest (ie, DNA or RNA) in a biological sample is 10, 15, 20 or 30 to 100 nucleotides long, preferably 10 to 50 nucleotides long, more preferably It depends on the use of oligonucleotides which may be 40-50 nucleotides in length.

したがって、本発明の単離ポリヌクレオチド(オリゴヌクレオチド)は、好ましくは、中程度からストリンジェントなハイブリッド形成条件下で本明細書中に記載の核酸配列のいずれかとハイブリッド形成可能である。   Thus, the isolated polynucleotide (oligonucleotide) of the invention is preferably capable of hybridizing to any of the nucleic acid sequences described herein under moderate to stringent hybridization conditions.

中程度からストリンジェントなハイブリッド形成条件は、10%硫酸デキストラン、1M NaCl、1%SDS、および5×106cpmの32P標識プローブ(65℃)などを含むハイブリッド形成溶液、0.2×SSCおよび0.1%SDSの最終洗浄溶液、ならびに65℃での最終洗浄によって特徴づけられるのに対し、中程度のハイブリッド形成を、10%硫酸デキストラン、1M NaCl、1%SDS、および5×10cpmの32P標識プローブ(65℃)を含むハイブリッド形成溶液、1×SSCおよび0.1%SDSの最終洗浄溶液、ならびに50℃での最終洗浄を使用して行う。 Moderate to stringent hybridization conditions include hybridization solutions containing 10% dextran sulfate, 1 M NaCl, 1% SDS, and 5 × 10 6 cpm of 32 P-labeled probe (65 ° C.), 0.2 × SSC and 0 Medium hybridization is characterized by 10% dextran sulfate, 1 M NaCl, 1% SDS, and 5 × 10 6 cpm, as characterized by a final wash solution of 0.1% SDS and a final wash at 65 ° C. A hybridization solution containing a 32 P-labeled probe (65 ° C.), a final wash solution of 1 × SSC and 0.1% SDS, and a final wash at 50 ° C. are used.

より一般に、短い核酸(200bp長未満(例えば、17〜40bp長))のハイブリッド形成を、所望のストリンジェンシーにしたがって修正することができる以下の例示的ハイブリッド形成プロトコールを使用して行うことができる:(i)6×SSCおよび1%SDSまたは3M TMACI、0.01Mリン酸ナトリウム(pH6.8)、1mM EDTA(pH7.6)、0.5%SDS、100μg/ml変性サケ精子DNA、および0.1%無脂肪粉乳のハイブリッド形成溶液、Tmよりも1〜1.5℃低いハイブリッド形成温度、Tmよりも1〜1.5℃低い3M TMACI、0.01Mリン酸ナトリウム(pH6.8)、1mM EDTA(pH7.6)、0.5%SDSの最終洗浄溶液、(ii)6×SSCおよび0.1%SDSまたは3M TMACI、0.01Mリン酸ナトリウム(pH6.8)、1mM EDTA(pH7.6)、0.5%SDS、100μg/ml変性サケ精子DNA、および0.1%無脂肪粉乳のハイブリッド形成溶液、Tmよりも2〜2.5℃低いハイブリッド形成温度、Tmよりも1〜1.5℃低いハイブリッド形成温度での3M TMACI、0.01Mリン酸ナトリウム(pH6.8)、1mM EDTA(pH7.6)、0.5%SDSの最終洗浄溶液、6×SSCの最終洗浄溶液、ならびに22℃での最終洗浄、(iii)6×SSCおよび1%SDSまたは3M TMACI、0.01Mリン酸ナトリウム(pH6.8)、1mM EDTA(pH7.6)、0.5%SDS、100μg/ml変性サケ精子DNA、および0.1%無脂肪粉乳のハイブリッド溶液、ハイブリッド形成温度。   More generally, hybridization of short nucleic acids (less than 200 bp in length (eg, 17-40 bp in length)) can be performed using the following exemplary hybridization protocol, which can be corrected according to the desired stringency: (I) 6 × SSC and 1% SDS or 3 M TMACI, 0.01 M sodium phosphate (pH 6.8), 1 mM EDTA (pH 7.6), 0.5% SDS, 100 μg / ml denatured salmon sperm DNA, and 0 1% non-fat milk powder hybridization solution, hybridization temperature 1 to 1.5 ° C. lower than Tm, 3 M TMACI 1 to 1.5 ° C. lower than Tm, 0.01 M sodium phosphate (pH 6.8), Final wash solution of 1 mM EDTA (pH 7.6), 0.5% SDS, (ii) 6 × SSC and 0.1% Hybridization of DS or 3M TMACI, 0.01 M sodium phosphate (pH 6.8), 1 mM EDTA (pH 7.6), 0.5% SDS, 100 μg / ml denatured salmon sperm DNA, and 0.1% nonfat dry milk Solution, hybridization temperature 2 to 2.5 ° C. lower than Tm, 3 M TMACI at hybridization temperature 1 to 1.5 ° C. lower than Tm, 0.01 M sodium phosphate (pH 6.8), 1 mM EDTA (pH 7) .6) final wash solution of 0.5% SDS, final wash solution of 6 × SSC, and final wash at 22 ° C., (iii) 6 × SSC and 1% SDS or 3 M TMACI, 0.01 M sodium phosphate (PH 6.8), 1 mM EDTA (pH 7.6), 0.5% SDS, 100 μg / ml denatured salmon sperm DNA, and 0. 1% non-fat milk powder hybrid solution, hybridization temperature.

ハイブリッド二重鎖を、多数の方法によって検出することができる。典型的には、ハイブリッド二重鎖を非ハイブリッド形成核酸から分離し、二重鎖に結合した標識を検出する。このような標識は、当該分野で標準的に使用されている放射性、蛍光、生物、または酵素のタグまたは標識をいう。標識を、生体サンプル由来のオリゴヌクレオチドプローブまたは核酸のいずれかに抱合することができる。   Hybrid duplexes can be detected by a number of methods. Typically, the hybrid duplex is separated from non-hybridizing nucleic acid and the label bound to the duplex is detected. Such labels refer to radioactive, fluorescent, biological, or enzymatic tags or labels that are commonly used in the art. The label can be conjugated to either an oligonucleotide probe or nucleic acid from a biological sample.

多数の周知の方法によってプローブを標識することができる。放射性標識の非限定的な例には、3H、14C、32P、および35Sが含まれる。検出可能なマーカーの非限定的な例には、リガンド、フルオロフォア、化学発光物質、酵素、および抗体が含まれる。本発明の方法の感度を上げることができるプローブと共に使用する他の検出可能なマーカーには、ビオチンおよび放射性ヌクレオチドが含まれる。特定の標識の選択によりプローブに結合する様式が決定されることが当業者に明らかとなる。   Probes can be labeled by a number of well known methods. Non-limiting examples of radioactive labels include 3H, 14C, 32P, and 35S. Non-limiting examples of detectable markers include ligands, fluorophores, chemiluminescers, enzymes, and antibodies. Other detectable markers for use with probes that can increase the sensitivity of the methods of the invention include biotin and radioactive nucleotides. It will be apparent to one skilled in the art that the choice of a particular label will determine the manner in which it binds to the probe.

例えば、ビオチン化dNTPもしくはrNTPの組み込みまたはいくつかの類似の手段(例えば、RNAへのビオチンのソラレン誘導体の光架橋)およびその後の標識ストレプトアビジン(例えば、フィコエリトリン抱合ストレプトアビジン)または等価物の付加によって本発明のオリゴヌクレオチドを合成後に標識することができる。あるいは、蛍光標識オリゴヌクレオチドプローブを使用する場合、フルオレセイン、リサミン、フィコエリトリン、ローダミン(Perkin Elmer Cetus)、Cy2、Cy3、Cy3.5、Cy5、Cy5.5、Cy7、およびFluorX(Amersham)など(例えば、Kricka et al.(1992),Academic Press San Diego,Calif)を、オリゴヌクレオチドに結合させることができる。   For example, by incorporation of biotinylated dNTPs or rNTPs or some similar means (eg photocrosslinking of psoralen derivatives of biotin to RNA) and subsequent addition of labeled streptavidin (eg phycoerythrin conjugated streptavidin) or equivalent The oligonucleotides of the invention can be labeled after synthesis. Alternatively, when using a fluorescently labeled oligonucleotide probe, fluorescein, lissamine, phycoerythrin, rhodamine (Perkin Elmer Cetus), Cy2, Cy3, Cy3.5, Cy5, Cy5.5, Cy7, FluorX (Amersham), etc. (eg, Kricka et al. (1992), Academic Press San Diego, Calif.) Can be attached to oligonucleotides.

当業者は、洗浄工程を使用して、過剰な標的DNAまたはプローブおよび非結合抱合体を洗い流すことを認識している。さらに、標準的な不均一アッセイ形式は、オリゴヌクレオチドプライマーおよびプローブ上に存在する標識を使用したハイブリッドの検出に適切である。   One skilled in the art recognizes that washing steps are used to wash away excess target DNA or probe and unbound conjugate. In addition, standard heterogeneous assay formats are suitable for detection of hybrids using labels present on oligonucleotide primers and probes.

種々のコントロールを有用に使用してハイブリッド形成アッセイの精度を改良することができることが認識される。例えば、サンプルを無関係のプローブとハイブリッド形成し、ハイブリッド形成前にRNアーゼAで処理して偽ハイブリッド形成を評価することができる。   It is recognized that various controls can be usefully used to improve the accuracy of the hybridization assay. For example, the sample can be hybridized with an irrelevant probe and treated with RNase A prior to hybridization to assess pseudohybridization.

本発明は特定の核酸配列の検出のための標識の使用に特に依存しないが、このような標識は、検出感度を高めるので有利であり得る。さらに、標識により自動化が可能である。プローブを、多数の周知の方法によって標識することができる。   Although the present invention does not particularly rely on the use of a label for the detection of a particular nucleic acid sequence, such a label may be advantageous as it increases the detection sensitivity. In addition, the labeling allows automation. Probes can be labeled by a number of well known methods.

一般に知られるように、放射性ヌクレオチドを、いくつかの方法によって本発明のプローブに組み込むことができる。放射性標識の非限定的な例には、H、14C、32P、および35Sが含まれる。 As is commonly known, radioactive nucleotides can be incorporated into the probes of the invention by several methods. Non-limiting examples of radioactive labels include 3 H, 14 C, 32 P, and 35 S.

当業者は、洗浄工程を使用して過剰な標的DNAまたはプローブおよび非結合抱合体を洗い流すことができることを認識する。さらに、標準的な不均一アッセイ形式は、オリゴヌクレオチドプライマーおよびプローブ上に存在する標識を使用したハイブリッドの検出に適切である。   One skilled in the art will recognize that washing steps can be used to wash away excess target DNA or probe and unbound conjugate. In addition, standard heterogeneous assay formats are suitable for detection of hybrids using labels present on oligonucleotide primers and probes.

種々のコントロールを有用に使用してハイブリッド形成アッセイの精度を改良することができることが認識される。   It is recognized that various controls can be usefully used to improve the accuracy of the hybridization assay.

本発明のプローブを、天然に存在する糖−リン酸骨格ならびに修飾骨格(ホスホロチオエート、ジチオネート、アルキルホスホネート、およびa−ヌクレオチドなどが含まれる)と共に使用することができる。本発明のプローブを、リボ核酸(RNA)またはデオキシリボ核酸(DNA)(好ましくはDNA)から構築することができる。   The probes of the invention can be used with naturally occurring sugar-phosphate backbones as well as modified backbones, including phosphorothioates, dithionates, alkyl phosphonates, and a-nucleotides. The probes of the invention can be constructed from ribonucleic acid (RNA) or deoxyribonucleic acid (DNA) (preferably DNA).

NATアッセイ
生体サンプル中の目的の核酸を、任意選択的に、例えば、PCR(例えば、実時間PCR等のそのバリエーション)などの核酸増幅テクノロジーを含むNATベースのアッセイによって検出することもできる。
NAT Assay The nucleic acid of interest in a biological sample can optionally be detected by a NAT-based assay that includes nucleic acid amplification technology such as, for example, PCR (eg, variations thereof such as real-time PCR).

本明細書中で使用される、「プライマー」は、標的配列とアニーリング(ハイブリッド形成)し、それにより適切な条件下でのDNA合成の出発点としての機能を果たすことができる二本鎖領域を作製することができるオリゴヌクレオチドと定義する。   As used herein, a "primer" is a double-stranded region that can anneal (hybridize) to a target sequence, thereby serving as a starting point for DNA synthesis under appropriate conditions. It is defined as an oligonucleotide that can be produced.

選択された配列、標的配列、または核酸配列を、多数の適切な方法によって増幅することができる。一般に、Kwoh et al.,1990,Am.Biotechnol.Lab.8:14を参照のこと。多数の増幅技術が記載されており、当業者の特定のニーズに合わせるように容易に適合させることができる。増幅技術の非限定的な例には、ポリメラーゼ連鎖反応(PCR)、リガーゼ連鎖反応(LCR)、鎖置換増幅(SDA)、転写ベースの増幅、q3レプリカーゼ系、およびNASBAが含まれる(Kwoh et al.,1989,Proc.NatI.Acad.Sci.USA 86,1173−1177;Lizardi et al.,1988,BioTechnology 6:1197−1202;Malek et al.,1994,Methods Mol.Biol.,28:253−260;およびSambrook et al.,1989,supra)。   Selected sequences, target sequences, or nucleic acid sequences can be amplified by a number of suitable methods. In general, Kwoh et al. , 1990, Am. Biotechnol. Lab. See 8:14. A large number of amplification techniques have been described and can be easily adapted to meet the specific needs of the person skilled in the art. Non-limiting examples of amplification techniques include polymerase chain reaction (PCR), ligase chain reaction (LCR), strand displacement amplification (SDA), transcription based amplification, q3 replicase system, and NASBA (Kwoh et al. USA, 1989, Proc. Nat I. Acad. Sci. USA 86, 1173-1177; Lizardi et al., 1988, BioTechnology 6: 1197-1202; Malek et al., 1994, Methods Mol. Biol., 28: 253-. 260; and Sambrook et al., 1989, supra).

用語「増幅対」(または「プライマー対」)は、本明細書中で、多数の増幅プロセス型の1つ(好ましくはポリメラーゼ連鎖反応)による選択された核酸配列の増幅で共に使用されるように選択される本発明のオリゴヌクレオチド(オリゴ)対をいう。他の増幅プロセス型には、以下でより詳細に説明されるように、リガーゼ連鎖反応、鎖置換増幅、または核酸配列ベースの増幅が含まれる。当該分野で一般に知られるように、選択された条件下で相補配列に結合するようにオリゴをデザインする。   The term "amplification pair" (or "primer pair") is used herein as it is used together in amplification of a selected nucleic acid sequence by one of a number of amplification process types, preferably polymerase chain reaction. Refers to the selected oligonucleotide (oligo) pair of the present invention. Other types of amplification processes include ligase chain reaction, strand displacement amplification, or nucleic acid sequence based amplification, as described in more detail below. The oligos are designed to bind to the complementary sequence under selected conditions, as is generally known in the art.

1つの特定の実施形態では、患者由来の核酸サンプルの増幅を、最も豊富な差分発現する核酸の増幅を好む条件下で増幅する。1つの好ましい実施形態では、最も豊富なmRNAの増幅を好む条件下で患者由来のmRNAサンプルに対してRT−PCRを行う。別の好ましい実施形態では、差分発現する核酸の増幅を同時に行う。このような方法を、差分発現する核酸配列の代わりに差分発現するタンパク質の検出に適合することができることが当業者に理解される。   In one particular embodiment, amplification of a nucleic acid sample from a patient is amplified under conditions that favor amplification of the most abundant differentially expressed nucleic acid. In one preferred embodiment, RT-PCR is performed on mRNA samples from patients under conditions that favor amplification of the most abundant mRNA. In another preferred embodiment, amplification of differentially expressed nucleic acids is performed simultaneously. It is understood by one skilled in the art that such methods can be adapted to the detection of differentially expressed proteins instead of differentially expressed nucleic acid sequences.

本発明を実施するための核酸(すなわち、DNAまたはRNA)を、周知の方法によって得ることができる。   Nucleic acids (ie, DNA or RNA) for carrying out the present invention can be obtained by known methods.

本発明のオリゴヌクレオチドプライマーは、使用される特定のアッセイ形式、特定のニーズ、およびターゲティングされるゲノムに依存して任意の適切な長さであり得る。任意選択的に、オリゴヌクレオチドプライマーは、少なくとも12ヌクレオチド長、好ましくは15分子と24分子との間であり、これらを、選択した核酸増幅システムに特に適切になるように適合することができる。当該分野で一般に知られるように、オリゴヌクレオチドプライマーを、そのターゲティングされる配列へのそのハイブリッド形成の融点を考慮することによってデザインすることができる(Sambrook et al.,1989,Molecular Cloning −A Laboratory Manual,2nd Edition,CSH Laboratories;Ausubel et al.,1989,in Current Protocols in Molecular Biology,John Wiley & Sons Inc.,N.Y.)。   The oligonucleotide primers of the invention may be of any suitable length, depending on the particular assay format used, the particular needs, and the genome targeted. Optionally, the oligonucleotide primers are at least 12 nucleotides in length, preferably between 15 and 24 molecules, which can be adapted to be particularly suitable for the chosen nucleic acid amplification system. As is commonly known in the art, an oligonucleotide primer can be designed by considering the melting point of its hybridization to its targeted sequence (Sambrook et al., 1989, Molecular Cloning-A Laboratory Manual Ausubel et al., 1989, in Current Protocols in Molecular Biology, John Wiley & Sons Inc., N. Y.).

アンチセンスオリゴヌクレオチドを使用して、目的のスプライスイソ型の発現を定量することができることが認識される。このような検出を、プレmRNAレベルで行う。本質的に、目的のスプライス部位からの転写を定量する能力は、スプライス部位の近づき易さに影響をうけ得る。オリゴヌクレオチドは、スプライシング因子とスプライス部位配列を競合し得る。したがって、アンチセンスオリゴヌクレオチド活性の低さは、スプライシング活性を示す。   It is recognized that antisense oligonucleotides can be used to quantify the expression of the splice isoform of interest. Such detection is performed at the pre-mRNA level. In essence, the ability to quantify transcription from the splice site of interest can be influenced by the accessibility of the splice site. Oligonucleotides can compete with splice factor sequences for splice site sequences. Thus, low antisense oligonucleotide activity indicates splicing activity.

ポリメラーゼ連鎖反応および他の核酸増幅反応は、当該分野で周知である(これらの反応の種々の非限定的な例を、以下により詳細に記載する)。本発明の態様のオリゴヌクレオチド対を、好ましくは、適合する融点(Tm)(例えば、7℃未満、好ましくは5℃未満、より好ましくは4℃未満、最も好ましくは3℃未満、理想的には3℃と0℃の間で異なる融点)を有するように選択する。   Polymerase chain reactions and other nucleic acid amplification reactions are well known in the art (various non-limiting examples of these reactions are described in more detail below). The oligonucleotide pairs of the aspects of the invention are preferably matched melting point (Tm) (eg less than 7 ° C., preferably less than 5 ° C., more preferably less than 4 ° C., most preferably less than 3 ° C., ideally It is chosen to have different melting points) between 3 ° C and 0 ° C.

ポリメラーゼ連鎖反応(PCR):Mullis and Mullis et al.に付与された米国特許第4,683,195号および同第4,683,202号に記載のように、ポリメラーゼ連鎖反応(PCR)は、クローニングおよび精製を行うことなくゲノムDNAの混合物中の標的配列のセグメントの濃度を増加させる方法である。このテクノロジーにより、低標的配列濃度の問題に対する1つのアプローチが得られる。PCRを使用して、標的濃度を容易に検出可能なレベルに直接増加させることができる。この標的配列の増幅プロセスは、二本鎖標的配列の各鎖と所望の標的配列を含むDNA混合物とが相補的である1モル過剰の2つのオリゴヌクレオチドプライマーの移入を含む。混合物を変性させ、その後ハイブリッド形成させる。ハイブリッド形成後、プライマーをポリメラーゼで伸長して、相補鎖を形成する。変性工程、ハイブリッド形成(アニーリング)工程、およびポリメラーゼ伸長(延長)工程を必要に応じて繰り返し、比較的高濃度の所望の標的配列のセグメントを得ることができる。   Polymerase chain reaction (PCR): Mullis and Mullis et al. Polymerase chain reaction (PCR), as described in US Pat. Nos. 4,683,195 and 4,683,202, assigned to the assignee of the present invention, targets in a mixture of genomic DNA without cloning and purification. It is a method of increasing the concentration of segments of the sequence. This technology provides one approach to the problem of low target sequence concentration. PCR can be used to directly increase the target concentration to easily detectable levels. The process of amplification of this target sequence involves the transfer of a 1 molar excess of two oligonucleotide primers in which each strand of the double stranded target sequence and the DNA mixture containing the desired target sequence are complementary. The mixture is denatured and then hybridized. After hybridization, the primers are extended with a polymerase to form a complementary strand. The steps of denaturation, hybridization (annealing), and polymerase extension (extension) can be repeated as necessary to obtain a relatively high concentration of segments of the desired target sequence.

所望の標的配列のセグメントの長さは、相互に関連するプライマーの相対的位置によって決定されるので、この長さは調節可能なパラメーターである。所望の標的配列のセグメントが混合物中で支配的な配列(濃度に関して)になるので、これらを、「PCR増幅された」と考えられる。   This length is a tunable parameter, as the length of the segment of the desired target sequence is determined by the relative position of the primers relative to one another. These are considered "PCR amplified" because the segments of the desired target sequence become the predominant sequences (in terms of concentration) in the mixture.

リガーゼ連鎖反応(LCRまたはLAR):リガーゼ連鎖反応(LCR;時折、「リガーゼ増幅反応」(LAR)という)は、十分に認識されている別の核酸増幅方法に発展している。LCRでは、4つのオリゴヌクレオチド、標的DNAの1つの鎖と固有にハイブリッド形成する2つの隣接オリゴヌクレオチド、および反対の鎖とハイブリッド形成する隣接オリゴヌクレオチドの相補組を混合し、混合物にDNAリガーゼを添加する。連結点で完全に相補的である場合、リガーゼはハイブリッド形成した各分子対と共有結合する。重要には、LCRでは、ギャップやミスマッチが無く標的サンプル中の配列と塩基対を形成する場合のみ、2つのプローブが互いにライゲーションする。変性サイクルの繰り返しおよびライゲーションにより、DNAの短いセグメントが増幅する。LCRはまたは、1塩基の変化の検出を強化するためにPCRと組み合わせて使用されている(例えば、Segev,PCT公開番号W09001069 A1(1990)を参照のこと)。しかし、このアッセイで使用される4つのオリゴヌクレオチドが対合して2つの短いライゲーション可能なフラグメントを形成することができるので、標的と独立したバックグラウンドシグナルが生成される可能性がある。変異体スクリーニングのためのLCRの使用は、特定の核酸の位置の試験に制限される。   Ligase chain reaction (LCR or LAR): Ligase chain reaction (LCR; sometimes referred to as "ligase amplification reaction" (LAR)) has evolved into another well-recognized method of nucleic acid amplification. In LCR, four oligonucleotides, two flanking oligonucleotides that specifically hybridize to one strand of target DNA, and a complementary set of flanking oligonucleotides that hybridize to the opposite strand are mixed, and DNA ligase is added to the mixture Do. The ligase is covalently linked to each hybridized pair of molecules if they are completely complementary at the junction point. Importantly, in LCR, the two probes ligate to each other only if they form a base pair with the sequence in the target sample without gaps or mismatches. Repeated cycles of denaturation and ligation amplify short segments of DNA. LCR has also been used in combination with PCR to enhance detection of single base changes (see, eg, Segev, PCT Publication No. W09001069 A1 (1990)). However, as the four oligonucleotides used in this assay can be paired to form two short ligatable fragments, a background signal independent of the target may be generated. The use of LCRs for mutant screening is limited to the testing of specific nucleic acid positions.

自己保持合成反応(Self−Sustained−Synthetic−Reaction)(3SR/NASBA):自己保持配列複製反応(3SR)は、一定温度でRNA配列を指数関数的に増幅させることができる転写ベースのin vitro増幅システムである。次いで、増幅したRNAを、変異検出のために使用することができる。この方法では、オリゴヌクレオチドプライマーを使用して、目的の配列の5’末端にファージRNAポリメラーゼプロモーターを付加する。第2のプライマー、逆転写酵素、RNアーゼH、RNAポリメラーゼ、およびリボ−およびデオキシリボヌクレオチド三リン酸を含む酵素と基質のカクテルでは、標的配列は転写、cDNA合成、および第2の鎖合成のラウンドが反復されて目的の領域が増幅される。変異を検出するための3SRの使用は、速度的にDNAの小セグメント(例えば、200〜300塩基対)のスクリーニングに制限される。   Self-Sustained-Synthetic-Reaction (3SR / NASBA): Self-maintaining Sequence Replication Reaction (3SR) is a transcription-based in vitro amplification that can exponentially amplify RNA sequences at constant temperature It is a system. The amplified RNA can then be used for mutation detection. In this method, an oligonucleotide primer is used to add a phage RNA polymerase promoter to the 5 'end of the sequence of interest. For a cocktail of enzyme and substrate containing a second primer, reverse transcriptase, RNase H, RNA polymerase, and ribo- and deoxyribonucleotide triphosphates, the target sequence is a round of transcription, cDNA synthesis, and second strand synthesis. Is repeated to amplify the region of interest. The use of 3SR to detect mutations is kinetically limited to the screening of small segments of DNA (e.g. 200-300 base pairs).

Q−ベータ(Qβ)レプリカーゼ:この方法では、目的の配列を認識するプローブを、Qβレプリカーゼのための複製可能なRNAテンプレートに結合させる。配列特異的ライゲーション工程の使用によって、非ハイブリッド形成プローブの複製に起因する偽陽性についての事前に同定された主な問題に取り組んだ。しかし、利用可能な熱安定性DNAリガーゼはこのRNA基質に有効でないので、ライゲーションを、T4DNAリガーゼによって低温(37℃)で行わなければならない。これにより、LCRにおけるような特異性の達成手段としての高温の使用が回避され、ライゲーション事象を使用して、連結部位での変異を検出することができるが、他の場所は検出できない。   Q-beta (Qβ) replicase: In this method, a probe that recognizes the sequence of interest is attached to a replicable RNA template for Qβ replicase. The use of a sequence specific ligation step addressed the major issues previously identified for false positives due to replication of non-hybridizing probes. However, ligation must be performed at low temperature (37 ° C.) with T4 DNA ligase since the available thermostable DNA ligase is not effective for this RNA substrate. This avoids the use of high temperature as a means of achieving specificity as in LCR, and ligation events can be used to detect mutations at the ligation site but not elsewhere.

首尾の良い診断方法は、非常に特異的でなければならない。容易な核酸ハイブリッド形成の特異性の調節方法は、反応温度の調節による。3SR/NASBAおよびQβは全て大量のシグナルを生成することができる一方で、それぞれに関与する1つまたは複数の酵素を高温で(すなわち、55℃超)使用することができない。したがって、プローブの非特異的ハイブリッド形成を回避するために反応温度を上げることができない。低温でより容易にプローブを融解するためにプローブを短くする場合、複雑なゲノム中で1つを超える完全な適合が得られる可能性が増加する。これらの理由のために、PCRおよびLCRは、現在、検出テクノロジーの研究分野の中心となっている。   Successful diagnostic methods should be very specific. A method of modulation of the specificity of easy nucleic acid hybridization is by modulation of the reaction temperature. While 3SR / NASBA and Qβ can all produce large amounts of signal, one or more enzymes involved can not be used at high temperature (ie above 55 ° C.). Therefore, the reaction temperature can not be raised to avoid nonspecific hybridization of the probe. If you shorten the probe to melt the probe more easily at low temperatures, the possibility of obtaining more than one perfect match in complex genomes increases. For these reasons, PCR and LCR are currently at the center of research in detection technology.

PCRおよびLCRにおける増幅手順の基本は、1サイクルの産物がその後の全サイクルで使用可能なテンプレートとなり、それにより、各サイクル毎に集団が倍増するという事実である。任意のこのような倍増システムの最終収率を、以下のように表現することができる:(1+X)=y(式中、「X」は平均効率(各サイクルでのコピー率)であり、「n」はサイクル数であり、「y」は全効率または反応収率である)。各標的DNAコピーを各ポリメラーゼ連鎖反応サイクルにおけるテンプレートとして使用する場合、平均効率は100%である。PCRを20サイクル行う場合、収率は220(すなわち、出発物質の1,048,576倍のコピー)である。反応条件によって平均効率が85%に減少する場合、20サイクルの収率は1.8520(すなわち、出発物質の220,513倍のコピー)にしかならない。言い換えれば、85%の効率でのPCRの実施では、100%の効率での反応実施と比較して最終生成物は21%しか得られない。平均効率が50%に減少した反応では、可能な生成物は1%未満である。 The basis of the amplification procedure in PCR and LCR is the fact that the product of one cycle becomes a usable template for all subsequent cycles, thereby doubling the population with each cycle. The final yield of any such doubling system can be expressed as: (1 + X) n = y, where “X” is the average efficiency (copy rate at each cycle), "N" is the number of cycles and "y" is the overall efficiency or reaction yield). When each target DNA copy is used as a template in each polymerase chain reaction cycle, the average efficiency is 100%. When performing PCR of 20 cycles, the yield is 2 20 (i.e., 1,048,576 times copies of the starting material). If the reaction conditions reduce the average efficiency to 85%, the yield of 20 cycles is only 1.85 20 (ie 220,513 copies of the starting material). In other words, performing PCR at 85% efficiency yields only 21% of the final product as compared to running reaction at 100% efficiency. For reactions where the average efficiency is reduced to 50%, less than 1% of possible products.

実際には、日常的なポリメラーゼ連鎖反応で理論上の最大収率を達成するのは稀であり、PCRは、通常、より低い収率を補うために20サイクルを超えて実施する。平均効率50%では、理論上での20サイクルで100万倍の増幅を達成するために、34サイクルを要し、より低い効率では、必要なサイクル数は非常に多くなる。さらに、意図する標的よりも高い平均効率で増幅する任意のバックグラウンド産物が主要な産物になる。   In practice, it is rare to achieve theoretical maximum yields in routine polymerase chain reactions, and PCR is usually performed for more than 20 cycles to compensate for lower yields. With an average efficiency of 50%, 34 cycles are required to achieve a million-fold amplification in 20 cycles in theory, and with lower efficiencies the number of cycles required is very high. In addition, any background product that amplifies with an average efficiency higher than the intended target will be the major product.

また、多数の可変因子(variable)(標的DNAの長さおよび二次構造、プライマーの長さおよびデザイン、プライマーおよびdNTPの濃度、ならびに緩衝液の組成などが含まれる)がPCRの平均効率に影響を与え得る。外因性DNA(例えば、実験室の表面に溢れたDNA)との反応の汚染または相互汚染も主な検討材料である。それぞれの異なるプライマー対および標的配列のための反応条件を慎重に至適化しなければならず、経験豊富な研究者でさえもこのプロセスに数日を要し得る。このプロセスの困難さ(多数の技術的配慮および他の要因が含まれる)が、臨床目的でのPCRの使用における重大な欠点である。実際、PCRは、依然として有意な様式で臨床市場に進出していない。LCRも各標的配列について異なるオリゴヌクレオチド配列を使用するために至適化しなければならないので、LCRでも同様の懸念が生じる。さらに、両方法には、正確な温度サイクリングを可能にするために高価な装置が必要である。   Also, numerous variables (including target DNA length and secondary structure, primer length and design, primer and dNTP concentrations, buffer composition, etc.) affect the average efficiency of PCR. Can be given. Contamination or cross-contamination of reactions with exogenous DNA (eg, DNA that has spilled over the surface of a laboratory) is also a primary consideration. The reaction conditions for each different primer pair and target sequence must be carefully optimized, and even experienced researchers can take several days for this process. The difficulty of this process, which includes numerous technical considerations and other factors, is a major drawback in the use of PCR for clinical purposes. In fact, PCR has not yet entered the clinical market in a significant manner. Similar concerns arise with LCR as LCR must also be optimized to use different oligonucleotide sequences for each target sequence. Furthermore, both methods require expensive equipment to enable accurate temperature cycling.

対立遺伝子の変化の研究などにおける核酸検出テクノロジーの多くの適用は、複雑なバックグラウンド中の特定の配列の検出だけでなく、少数または1つのヌクレオチドが異なる配列の区別も含む。PCRによる対立遺伝子特異的変異型の1つの検出方法は、テンプレート鎖とプライマーの3’末端との間にミスマッチが存在する場合にTaqポリメラーゼがDNA鎖を合成することが困難であるという事実に基づく。対立遺伝子特異的変異型を、たった1つの可能性のある対立遺伝子と完全に適合するプライマーの使用によって検出することができ、他の対立遺伝子とのミスマッチはプライマーの伸長を回避するように作用し、それにより、この配列の増幅が回避される。この方法は、ミスマッチの塩基組成がミスマッチを超える伸長を回避する能力に影響を与え、一定のミスマッチが伸長を回避しないか最小の影響しか与えないという点で、実質的に制限される。   Many applications of nucleic acid detection technology, such as in the study of allelic variation, include not only the detection of specific sequences in complex backgrounds, but also the discrimination of sequences that differ by a few or one nucleotide. One method of detecting allele-specific variants by PCR is based on the fact that it is difficult for Taq polymerase to synthesize DNA strands in the presence of a mismatch between the template strand and the 3 'end of the primer. . Allele-specific variants can be detected by the use of primers that are completely compatible with only one possible allele, and mismatches with other alleles act to avoid primer extension. , Thereby avoiding amplification of this sequence. This method is substantially limited in that the base composition of the mismatch affects the ability to avoid extension beyond the mismatch, and certain mismatches do not avoid or have minimal effect on extension.

LCRでのライゲーションを回避する効果がより高い類似の3’ミスマッチストラテジーを使用する。任意のミスマッチは、熱安定性リガーゼの作用を有効に遮断するが、LCRは依然として標的独立性バックグラウンドライゲーション産物が増幅を開始するという欠点を有する。さらに、各位置でヌクレオチドを同定するためのPCRとその後のLCRとの組み合わせも、臨床検査室での取扱いが困難であることが明らかである。   Use a similar 3 'mismatch strategy that is more effective at avoiding ligation in LCR. While any mismatch effectively blocks the action of the thermostable ligase, LCR still has the disadvantage that target-independent background ligation products initiate amplification. Furthermore, it is clear that the combination of PCR to identify the nucleotide at each position and the subsequent LCR is also difficult to handle in the clinical laboratory.

本発明の種々の好ましい実施形態の直接検出方法は、例えば、サイクリングプローブ反応(CPR)または分岐(branched)DNA分析であり得る。   The direct detection method of the various preferred embodiments of the present invention may be, for example, cycling probe reaction (CPR) or branched DNA analysis.

利用可能な核酸の検出量が十分である場合、より多数の標的のコピーを作製する代わりに(例えば、PCRおよびLCRなどの場合)、この配列が直接検出されるという利点がある。より顕著には、シグナルを指数関数的に増幅しない方法は、定量分析により適切である。1つのオリゴヌクレオチドへの複数の色素の結合によってシグナルが増強された場合でさえも、最終シグナル強度と標的量とは直接相関する。このようなシステムは、反応産物自体がさらなる反応を促進せず、それにより、産物による実験室表面の汚染が懸念されるほど多くはないというさらなる利点を有する。最近考案された技術は、放射能使用を排除しようと努め、そして/または自動化できる形式での感度が改良されている。2つの例は、「サイクリングプローブ反応」(CPR)および「分岐DNA」(bDNA)である。   If the amount of detection of the available nucleic acid is sufficient, it has the advantage that this sequence is detected directly instead of making more copies of the target (eg in the case of eg PCR and LCR). More notably, methods that do not amplify the signal exponentially are better for quantitative analysis. Even when the signal is enhanced by the binding of multiple dyes to one oligonucleotide, the final signal intensity and target amount are directly correlated. Such a system has the further advantage that the reaction product itself does not promote further reactions, whereby the contamination of the laboratory surface by the product is not so great as to be concerned. Recently devised techniques seek to eliminate the use of radioactivity and / or have improved sensitivity in a form that can be automated. Two examples are "cycling probe reaction" (CPR) and "branched DNA" (bDNA).

サイクリングプローブ反応(CPR):サイクリングプローブ反応(CPR)は、中央部分がRNAから作製されており、2つの末端がDNAで作製されている長いキメラオリゴヌクレオチドを使用する。標的DNAへのプローブのハイブリッド形成および熱安定性RNアーゼHへの曝露により、RNA部分が消化される。これによって二重鎖の残存DNA部分が不安定になり、標的DNAからプローブの残りが放出し、別のプローブ分子がプロセスを繰り返す。切断プローブ分子形態のシグナルは、直線的速度で蓄積する。反復プロセスはシグナルを増加させる一方で、オリゴヌクレオチドのRNA部分は、サンプル調製を通して保持され得るRNアーゼに対して脆弱である。   Cycling Probe Reaction (CPR): The Cycling Probe Reaction (CPR) uses a long chimeric oligonucleotide, the central part of which is made from RNA and the two ends made of DNA. Hybridization of the probe to the target DNA and exposure to the thermostable RNase H digest the RNA portion. This destabilizes the remaining DNA portion of the duplex, releasing the rest of the probe from the target DNA, and another probe molecule repeats the process. Signals in the form of cleaved probe molecules accumulate at a linear rate. While the iterative process increases the signal, the RNA portion of the oligonucleotide is vulnerable to RNase which can be retained throughout sample preparation.

分岐DNA:分岐DNA(bDNA)は、各オリゴヌクレオチドが35〜40のラベル(例えば、アルカリホスファターゼ酵素)を保有できる分岐構造のオリゴヌクレオチドを含む。これによりハイブリッド形成由来のシグナルが増強される一方で、非特異的結合のシグナルも同様に増加する。   Branched DNA: Branched DNA (bDNA) includes oligonucleotides of a branched structure in which each oligonucleotide can carry 35-40 labels (e.g., alkaline phosphatase enzyme). While this enhances the signal from hybridization, the signal for nonspecific binding also increases.

本発明の種々の好ましい実施形態の少なくとも1つの配列の変化を、例えば、制限フラグメント長多型(RFLP分析)、対立遺伝子特異的オリゴヌクレオチド(ASO)分析、変性/温度勾配ゲル電気泳動(DGGE/TGGE)、一本鎖高次構造多型(SSCP)分析、またはジデオキシフィンガープリンティング(ddF)によって検出することができる。   Changes in at least one sequence of various preferred embodiments of the present invention can be made, for example, restriction fragment length polymorphism (RFLP analysis), allele specific oligonucleotide (ASO) analysis, denaturing / temperature gradient gel electrophoresis (DGGE / TGGE), single-strand conformation polymorphism (SSCP) analysis, or can be detected by dideoxy fingerprinting (ddF).

特定の核酸配列および配列の変化を検出可能な試験の需要は、臨床診断で急速に増大しつつある。ヒトおよび病原性生物由来の遺伝子についての核酸配列データが蓄積されているので、今までのところ、特定の配列内の変異のための迅速且つ費用効果が高く、使いやすい試験への需要が急速に増大している。   The need for tests that can detect specific nucleic acid sequences and sequence variations is rapidly increasing in clinical diagnostics. With the accumulation of nucleic acid sequence data for genes from humans and pathogenic organisms, so far there has been a rapid demand for rapid, cost-effective and easy-to-use tests for mutations within specific sequences. It is increasing.

核酸セグメントを変異についてスキャンする方法は一握りしか考案されていない。各試験サンプル(例えば、細菌単離物)の全遺伝子配列を決定することが1つの選択肢である。約600ヌクレオチド未満の配列では、増幅材料(例えば、PCR反応産物)を使用してこれを行うことができる。これにより、目的のセグメントのクローニングに伴う時間および費用が回避される。しかし、専用の装置および高度に訓練された者が必要であり、この方法は非常に骨が折れ、且つ費用が高いので、臨床目的で実践的且つ有効ではない。   Only a handful of methods have been devised to scan nucleic acid segments for mutations. Determining the entire gene sequence of each test sample (eg, a bacterial isolate) is one option. For sequences of less than about 600 nucleotides, this can be done using amplification material (eg, PCR reaction products). This avoids the time and expense associated with cloning the segment of interest. However, specialized equipment and highly trained personnel are required, and this method is very laborious and expensive, so it is not practical and effective for clinical purposes.

配列決定に関連する困難さを考慮して、核酸の所与のセグメントを、いくつかの他のレベルで特徴づけることができる。最も低い分解能では、電気泳動によって、サンプルゲル上での公知の標準の泳動との比較によって分子サイズを決定することができる。電気泳動前の制限酵素の組み合わせでの切断によって、より詳細な分子の実態(picture)を得て、順序付けられたマップを構築することができる。フラグメント内の特定の配列の存在を、標識プローブのハイブリッド形成によって検出することができるか、正確なヌクレオチド配列を、部分的化学的分解または鎖終結(chain−terminating)ヌクレオチドアナログの存在下でのプライマー伸長によって決定することができる。   Given the difficulties associated with sequencing, a given segment of nucleic acid can be characterized at several other levels. At the lowest resolution, the size of the molecule can be determined by electrophoresis by comparison with the migration of a known standard on a sample gel. Cleavage with a combination of restriction enzymes prior to electrophoresis can give a more detailed picture of the molecule and construct an ordered map. The presence of a specific sequence within the fragment can be detected by hybridization of the labeled probe, or the correct nucleotide sequence, primers in the presence of partial chemical degradation or chain-terminating nucleotide analogues It can be determined by extension.

制限フラグメント長多型(RFLP):類似配列間の1塩基の相違の検出には、しばしば、最も高い分解能での分析が必要である。問題のヌクレオチドの位置が予め知られている場合については、直接配列決定することなく1塩基の変化を試験する方法がいくつか開発されている。例えば、目的の変異が制限認識配列の範囲内で起こる場合、診断ツールとして消化パターンの変化を使用することができる(例えば、制限フラグメント長多型(RFLP)分析)。   Restriction fragment length polymorphism (RFLP): Detection of single base differences between similar sequences often requires analysis at the highest resolution. For cases where the position of the nucleotide in question is previously known, several methods have been developed to test single base changes without direct sequencing. For example, changes in digestion patterns can be used as a diagnostic tool if the mutation of interest occurs within the limits of the recognition sequence (eg, restriction fragment length polymorphism (RFLP) analysis).

1つの点変異はまた、RFLPの作製または破壊によって検出されている。ミスマッチでの切断によって生成されたRNAフラグメントの存在およびサイズによって、変異を検出し、局在化する。一般に、「ミスマッチ化学的切断」(MCC)と命名されている1塩基置換を検出するための別のストラテジーを使用する場合、DNAヘテロ二重鎖中の1つのヌクレオチドミスマッチを、いくつかの化学物質によっても認識および切断する。しかし、この方法には、四酸化オスミウムおよびピペリジンが必要であり、これら2つは非常に有毒な化合物であり、臨床検査室での使用は適切ではない。   One point mutation has also been detected by making or destroying RFLP. Mutations are detected and localized by the presence and size of the RNA fragments generated by cleavage at the mismatch. In general, when using another strategy to detect single base substitutions, termed "mismatch chemical cleavage" (MCC), one nucleotide mismatch in the DNA heteroduplex may be a number of chemicals. Also recognize and disconnect. However, this method requires osmium tetroxide and piperidine, which are very toxic compounds, and their use in clinical laboratories is not appropriate.

RFLP分析は感度が低く、大量のサンプルが必要である。RFLP分析を、点変異の検出に使用する場合、その性質により、公知の制限エンドヌクレアーゼの制限配列内に含まれる1塩基変化のみの検出に制限される。さらに、大部分の利用可能な酵素は4〜6塩基対の配列を認識し、多数の大量DNA操作には頻繁に切断され過ぎる。したがって、小断片の場合のみに適用可能であるが、ほとんどの変異はこのような部位の範囲内にない。   RFLP analysis is less sensitive and requires large samples. When RFLP analysis is used for the detection of point mutations, by its nature it is limited to the detection of only single base changes contained within the restriction sequences of known restriction endonucleases. In addition, most available enzymes recognize sequences of 4 to 6 base pairs and are cleaved too often for large scale DNA manipulations. Thus, while applicable only in the case of small fragments, most mutations are not within the scope of such sites.

8塩基対を特異的に認識する一握りのレアカット(rare−cutting)制限酵素が単離されており、これらは遺伝子マッピングに広く使用されているが、これらの酵素は数が少なく、G+Cリッチ配列の認識に制限され、高度にクラスター化される傾向のある部位を切断する。最近、12個を超える塩基対に特異性を示すグループIイントロンによってコードされるエンドヌクレアーゼが発見されたが、これらは少数である。   A handful of rare-cutting restriction enzymes that specifically recognize 8 base pairs have been isolated and are widely used for gene mapping, but these enzymes are few and G + C rich sequences The site is restricted to the recognition of and tends to be highly clustered. Recently, endonucleases encoded by group I introns showing specificity for more than 12 base pairs have been discovered, but these are few.

対立遺伝子特異的オリゴヌクレオチド(ASO):認識配列が変化しない場合、プライマー伸長またはライゲーション事象が適合またはミスマッチの指標として使用する(bused)ことができるように、変異ヌクレオチド付近とハイブリッド形成するための対立遺伝子特異的オリゴヌクレオチド(ASO)をデザインすることができる。放射性標識対立遺伝子特異的オリゴヌクレオチド(ASO)を使用したハイブリッド形成も特定の点変異の検出に適用されている。この方法は、1つのヌクレオチドが異なる短いDNAフラグメントの融点の相違に基づく。ストリンジェントなハイブリッド形成および洗浄条件二より、変異と野生型対立遺伝子とを区別することができる。PCR産物に適用したASOアプローチも、多くの研究者によって、ras遺伝子およびgsp/gip癌遺伝子の点変異を検出および特徴づけるために広く使用されている。複数の位置に種々のヌクレオチドの変化が存在するので、ASO法は、全ての可能な癌遺伝子変異を対象とするために多数のオリゴヌクレオチドを使用する必要がある。   Allele-Specific Oligonucleotide (ASO): Allele for hybridisation near a mutated nucleotide, so that primer extension or ligation events can be used as an indicator of a match or mismatch if the recognition sequence does not change. Gene specific oligonucleotides (ASO) can be designed. Hybridization using radioactively labeled allele specific oligonucleotides (ASO) has also been applied to the detection of specific point mutations. This method is based on the differences in melting temperatures of short DNA fragments that differ by one nucleotide. Mutations and wild-type alleles can be distinguished by stringent hybridization and wash conditions. The ASO approach applied to PCR products is also widely used by many researchers to detect and characterize point mutations in ras genes and gsp / gip oncogenes. As there are different nucleotide changes at multiple positions, the ASO method requires the use of multiple oligonucleotides to cover all possible oncogene mutations.

上記の技術のいずれか(すなわち、RFLPおよびASO)の使用には、試験前に変異が疑われる正確な位置を知らなければならない。言い換えると、これらの技術は、目的の遺伝子または配列内の変異の存在を検出する必要がある場合、適用不可能である。   The use of any of the above techniques (i.e. RFLP and ASO) must know the exact location where the mutation is suspected before testing. In other words, these techniques are not applicable if it is necessary to detect the presence of mutations in the gene or sequence of interest.

変性/温度勾配ゲル電気泳動(DGGE/TGGE):2つの他の方法は、小さな配列の変化に応じた電気泳動移動度の変化の検出に依存する。これらの方法のうち、「変性/温度勾配ゲル電気泳動」(DGGE)は、勾配ゲルで電気泳動によって分離した場合に僅かに異なる配列が異なる局所融解パターンを示すという所見に基づく。この様式では、その電気泳動移動度が変化に対応することによって1つのヌクレオチドにおけるホモ二重鎖とヘテロ二重鎖の融解特性の相違が変異の存在を検出することができるので、変異型を区別することができる。分析すべきフラグメント(通常、PCR産物)を、G−C塩基対の長いストレッチ(30〜80)の一方の端に「クランプし」、鎖を完全に解離することなく目的の配列を完全に変性させる。DNAフラグメントへのGC「クランプ」の結合により、変異フラグメントが増加し、DGGEによって認識することができる。1つのプライマーへのGCクランプの結合は、確実に増幅配列の解離温度を低くするために重要である。温度勾配を使用して技術が改良されており、この方法をRNA:RNA二重鎖に適用することもできる。   Denaturing / Temperature Gradient Gel Electrophoresis (DGGE / TGGE): Two other methods rely on detection of changes in electrophoretic mobility in response to small sequence changes. Of these methods, "denaturing / temperature gradient gel electrophoresis" (DGGE) is based on the finding that slightly different sequences show different local melting patterns when separated by electrophoresis on gradient gels. In this manner, the difference in melting characteristics of homoduplex and heteroduplex in one nucleotide can detect the presence of a mutation, by corresponding to changes in its electrophoretic mobility, thus distinguishing variants. can do. The fragment to be analyzed (usually the PCR product) is "clamped" to one end of a long stretch (30-80) of G-C base pairs to completely denature the desired sequence without completely dissociating the strand Let The binding of the GC "clamp" to the DNA fragment increases the mutated fragment and can be recognized by DGGE. Binding of the GC clamp to one primer is important to ensure that the dissociation temperature of the amplified sequence is lowered. The technique is improved using a temperature gradient, and this method can also be applied to RNA: RNA duplexes.

変性条件を試験すべき各DNA型に至適化しなければならないことにより、DGGEの利用が制限される。さらに、この方法には、ゲルを調製し、電気泳動時に必要な高温を維持するための専用の装置が必要である。試験すべき各配列の1つのオリゴヌクレオチドにクランプされたテールの合成に関連する費用も主な検討材料である。さらに、DGGEには、長い泳動時間が必要である。DGGEの長い泳動時間を、一定変性剤ゲル電気泳動(constant denaturant gel electrophoresis(CDGE)と呼ばれるDGGEの改良型によって短くした。CDGEには、変異検出の有効性を高めるために異なる変性条件下でゲルを泳動するが必要である。   Having to optimize denaturing conditions for each DNA type to be tested limits the use of DGGE. In addition, this method requires a dedicated device to prepare the gel and maintain the high temperature required during electrophoresis. The cost associated with the synthesis of the tail clamped to one oligonucleotide of each sequence to be tested is also a major consideration. Furthermore, DGGE requires long migration times. The long migration time of DGGE was shortened by a modified version of DGGE called constant denaturant gel electrophoresis (CDGE), which under different denaturing conditions to increase the effectiveness of mutation detection. It is necessary to migrate.

温度勾配ゲル電気泳動(TGGE)と呼ばれるDGGEに類似の技術は、化学変性勾配よりもむしろ温度勾配を使用する。TGGEには、電場に対して垂直に配向した温度勾配を生じることができる専用装置を使用することが必要である。TGGEは、比較的小さなDNAフラグメントの変異を検出することができ、それにより、大きな遺伝子セグメントのスキャニングにはゲルの泳動前に複数のPCR産物を使用する必要がある。   A similar technique to DGGE, called temperature gradient gel electrophoresis (TGGE), uses a temperature gradient rather than a chemical denaturation gradient. TGGE requires the use of specialized equipment capable of producing a temperature gradient oriented perpendicular to the electric field. TGGE can detect mutations in relatively small DNA fragments, which requires the use of multiple PCR products prior to gel migration for scanning of large gene segments.

一本鎖高次構造多型(SSCP):「一本鎖高次構造多型」(SSCP)と呼ばれる別の一般的な方法は、Hayashi,Sekya and colleaguesによって開発され、この方法は、単一の核酸鎖が未変性条件下で特徴的な高次構造を取ることができ、これらの高次構造が電気泳動移動度に影響を与えるという所見に基づく。相補鎖は、十分に異なる構造を有すると予想され、一方の鎖を他方の鎖から分離することができる。フラグメント内の配列の変化も高次構造を変化させ、それにより、移動度が変化し、これを配列の変動についてのアッセイとして使用可能である。   Single Strand Conformational Polymorphism (SSCP): Another common method, referred to as "single-strand conformation polymorphism" (SSCP), was developed by Hayashi, Sekya and colleagues, and this method is Based on the observation that the nucleic acid strand of can take a characteristic higher-order structure under native conditions, and these higher-order structures affect the electrophoretic mobility. Complementary strands are expected to have sufficiently different structures, and one strand can be separated from the other. Sequence variations within fragments also alter conformations, thereby altering mobility, which can be used as an assay for sequence variation.

SSCPプロセスは、両鎖を標識したDNAセグメント(例えば、PCR産物)の変性、および分子内相互作用が起こり得るが、泳動を妨げないようなその後の未変性ポリアクリルアミドゲルでのゆっくりとした電気泳動による分離を含む。この技術は、ゲルの組成および温度の変動に対する感度が非常に高い。外見上類似の条件下での異なる研究所で得られたデータの比較が比較的困難であるであることにより、この方法は非常に制限される。   The SSCP process is a slow electrophoresis on a native polyacrylamide gel so that denaturation of the DNA segment (eg, PCR product) labeled on both strands and intramolecular interaction may occur but does not prevent migration. Including separation by This technique is very sensitive to variations in gel composition and temperature. This method is very limited by the relative difficulty of comparing data obtained at different laboratories under apparently similar conditions.

ジデオキシフィンガープリンティング(ddF):ジデオキシフィンガープリンティング(ddF)は、変異の存在について遺伝子をスキャニングするために開発された別の技術である。ddF技術は、サンガージデオキシ配列決定とSSCPとの構成要素を組み合わせている。1つのジデオキシターミネーターを使用してジデオキシ配列決定反応を行い、その後、反応産物を、未変性ポリアクリルアミドゲルで電気泳動して、SSCP分析と同様に終結セグメントの移動度の変化を検出する。ddFは感度の増大に関してはSSCPよりも改良されているが、ddFには、高価なジデオキシヌクレオチドの使用が必要であり、この技術は、SSCPに適切なサイズ(すなわち、変異の最適な検出のための200〜300塩基のフラグメント)のフラグメントの分析にさらに制限される。   Dideoxy fingerprinting (ddF): Dideoxy fingerprinting (ddF) is another technique developed to scan genes for the presence of mutations. The ddF technology combines the components of Sanger dideoxy sequencing and SSCP. The dideoxy sequencing reaction is performed using one dideoxy terminator, and then the reaction product is electrophoresed on a native polyacrylamide gel to detect changes in the mobility of the termination segment as in SSCP analysis. While ddF is an improvement over SSCP with respect to increased sensitivity, ddF requires the use of expensive dideoxynucleotides, and this technique has the appropriate size for SSCP (ie for optimal detection of mutations). Analysis of fragments of 200 to 300 bases).

上記制限に加えて、これら全ての方法は、分析することができる核酸フラグメントのサイズに制限される。直接配列決定アプローチには、600塩基対を超える配列がクローニングに必要であり、その結果、全フラグメントを対象とするための検出サブクローニングまたはプライマーウォーキングのいずれかのために時間および費用を要する。SSCPおよびDGGEは、さらにより厳密にサイズの制限を受ける。配列の変化によって感度が減少するので、これらの方法は、より大きなフラグメントに適切でないと見なされる。SSCPは、伝えられるところによれば、200塩基対フラグメントの90%の1塩基置換を検出することができるにもかかわらず、400塩基対フラグメントでは検出は50%未満に低下する。同様に、フラグメントの長さが500塩基対に達する場合、DGGEの感度は低下する。直接配列決定とSSCPとを組み合わせたddF技術も、スクリーニングできるDNAが比較的小さいサイズに制限される。   In addition to the above limitations, all these methods are limited to the size of nucleic acid fragments that can be analyzed. Direct sequencing approaches require more than 600 base pairs of sequence for cloning, so that it takes time and expense for either detection subcloning or primer walking to cover all fragments. SSCP and DGGE are more strictly limited in size. These methods are considered unsuitable for larger fragments, as changes in sequence reduce sensitivity. Although SSCPs are reportedly able to detect 90% single base substitutions of 200 base pair fragments, detection decreases to less than 50% for 400 base pair fragments. Similarly, the sensitivity of DGGE decreases when the fragment length reaches 500 base pairs. The ddF technique, which combines direct sequencing and SSCP, is also limited to the relatively small size of DNA that can be screened.

本発明の現在好ましい実施形態に因れば、腫瘍細胞または癌患者由来の細胞における本明細書中に記載の核酸配列のいずれかを検索する工程を、以下の適切な技術によって行う:核酸配列決定、ポリメラーゼ連鎖反応、リガーゼ連鎖反応、自律的合成反応、Qβ−レプリカーゼ、サイクリングプローブ反応、分岐DNA、制限フラグメント長多型分析、ミスマッチの化学的切断、ヘテロ二重鎖分析、対立遺伝子特異的オリゴヌクレオチド、変性勾配ゲル電気泳動、一定変性剤ゲル電気泳動、温度勾配ゲル電気泳動、およびジデオキシフィンガープリンティングが含まれるが、これらに限定されない。   According to the presently preferred embodiment of the present invention, the step of searching for any of the nucleic acid sequences described herein in tumor cells or cells from cancer patients is carried out by the following appropriate techniques: Nucleic Acid Sequencing Polymerase chain reaction, ligase chain reaction, autonomous synthesis reaction, Qβ-replicase, cycling probe reaction, branched DNA, restriction fragment length polymorphism analysis, chemical cleavage of mismatch, heteroduplex analysis, allele specific oligonucleotide These include, but are not limited to, denaturing gradient gel electrophoresis, constant denaturant gel electrophoresis, temperature gradient gel electrophoresis, and dideoxy fingerprinting.

チップまたは他のこのようなデバイスを使用して任意選択的に検出することもできる。分析すべき候補領域を含む核酸サンプルを、単離し、増幅し、レポーター基で標識することが好ましい。このレポーター基は、フィコエリトリンなどの蛍光基であり得る。次いで、標識核酸を、フルイディクスステーション(fluidics station)を使用してチップ上に固定したプローブとインキュベートし、シリコンおよびガラス基板中のフルイディクスデバイス、特にミクロキャピラリーデバイスの構築が記載されている。   It can also be optionally detected using a chip or other such device. It is preferred that the nucleic acid sample containing the candidate region to be analyzed is isolated, amplified and labeled with a reporter group. The reporter group may be a fluorescent group such as phycoerythrin. The labeled nucleic acid is then incubated with the probes immobilized on the chip using a fluidics station, and the construction of fluidics devices in silicon and glass substrates, in particular microcapillary devices, is described.

一旦反応が完了すると、チップをスキャナに挿入し、ハイブリッド形成パターンを検出する。既に核酸に組み込まれており、この時点でチップに付着したプローブに結合しているレポーター基から放出されたシグナルとしてハイブリッド形成データを収集する。チップ上に固定された各プローブの配列および位置を承知しているので、所与のプローブとハイブリッド形成している核酸の同一性を決定することができる。   Once the reaction is complete, insert the tip into a scanner and detect the hybridization pattern. Hybridization data is collected as the signal emitted from the reporter group that is already incorporated into the nucleic acid and is now attached to the probe attached to the chip. Knowing the sequence and position of each probe immobilized on the chip, the identity of the nucleic acid hybridizing to a given probe can be determined.

自動化装置といと共に使用する場合、上記検出方法を使用して、疾患および/または病的状態について複数のサンプルを迅速且つ容易にスクリーニングすることができると認識される。   When used in conjunction with an automated device, it is recognized that the above detection methods can be used to rapidly and easily screen multiple samples for disease and / or pathological conditions.

アミノ酸配列決定およびペプチド
用語「ポリペプチド」、「ペプチド」、および「タンパク質」を、アミノ酸残基のポリマーをいうために本明細書中で交換可能に使用する。この用語は、1つまたは複数のアミノ酸残基が対応する天然に存在するアミノ酸のアナログまたは模倣物および天然に存在するアミノ酸ポリマーであるアミノ酸に適用する。ポリペプチドを、例えば、炭水化物残基の付加によって修飾して糖タンパク質を形成することができる。用語「ポリペプチド」、「ペプチド」、および「タンパク質」には、非糖タンパク質だけでなく、糖タンパク質が含まれる。
Amino Acid Sequencing and Peptides The terms "polypeptide", "peptide" and "protein" are used interchangeably herein to refer to a polymer of amino acid residues. The term applies to amino acids in which one or more amino acid residues are analogs or mimetics of the corresponding naturally occurring amino acids and polymers of naturally occurring amino acids. The polypeptide can be modified, for example, by the addition of carbohydrate residues to form a glycoprotein. The terms "polypeptide", "peptide" and "protein" include glycoproteins as well as non-glycoproteins.

ポリペプチド産物を、標準的な固相技術などの使用によって生化学的に合成することができる。このような方法には、排他的固相合成、部分的固相合成方法、フラグメント縮重、古典的液体合成が含まれるが、これらに限定されない。これらの方法を、ペプチドが比較的短い場合(すなわち、10kDa)、および/または組換え技術によって産生することができず(すなわち、核酸配列によってコードされない)、それにより異なる化学的性質を含む場合に使用することが好ましい。   Polypeptide products can be biochemically synthesized by use of standard solid phase techniques and the like. Such methods include, but are not limited to, exclusive solid phase synthesis, partial solid phase synthesis methods, fragment degeneracy, classical liquid synthesis. These methods may be used where the peptide is relatively short (ie 10 kDa) and / or can not be produced recombinantly (ie not encoded by the nucleic acid sequence), thereby comprising different chemical properties. It is preferred to use.

固相ポリペプチド合成手順は当該分野で周知であり、John Morrow Stewart and Janis Dillaha Young,Solid Phase Peptide Syntheses(2nd Ed.,Pierce Chemical Company,1984)にさらに記載されている。   Solid phase polypeptide synthesis procedures are well known in the art and are further described in John Morrow Stewart and Janis Dillaha Young, Solid Phase Peptide Syntheses (2nd Ed., Pierce Chemical Company, 1984).

合成ポリペプチドを、任意選択的に分取高速液体クロマトグラフィ(Creighton T.(1983)Proteins,structures and molecular principles.WH Freeman and Co.N.Y.)によって精製し、その後、その組成をアミノ酸配列決定によって確認することができる。   The synthetic polypeptide is optionally purified by preparative high performance liquid chromatography (Creighton T. (1983) Proteins, structures and molecular principles. WH Freeman and Co. N. Y.) and then its composition is amino acid sequencing. It can be confirmed by

大量のポリペプチドを所望する場合、ポリペプチドを、Bitter et al.,(1987)Methods in Enzymol.153:516−544,Studier et al.(1990)Methods in Enzymol.185:60−89,Brisson et al.(1984)Nature 310:511−514,Takamatsu et al.(1987)EMBO J.6:307−311,Coruzzi et al.(1984)EMBO J.3:1671−1680 and Brogli et al.,(1984)Science 224:838−843,Gurley et al.(1986)Mol.Cell.Biol.6:559−565 and Weissbach & Weissbach,1988,Methods for Plant Molecular Biology,Academic Press,NY,Section VIII,pp 421−463等に記載の組換え技術を使用して生成することができる。   If large amounts of polypeptide are desired, the polypeptide may be modified as described by Bitter et al. , (1987) Methods in Enzymol. 153: 516-544, Studier et al. (1990) Methods in Enzymol. 185: 60-89, Brisson et al. (1984) Nature 310: 511-514, Takamatsu et al. (1987) EMBO J. 6: 307-311, Coruzzi et al. (1984) EMBO J. 3: 1671-1680 and Brogli et al. (1984) Science 224: 838-843, Gurley et al. (1986) Mol. Cell. Biol. 6: 559-565 and Weissbach & Weissbach, 1988, Methods for Plant Molecular Biology, Academic Press, NY, Section VIII, pp 421-463 and the like.

本発明はまた、本発明のポリヌクレオチド配列によってコードされるポリペプチドおよび本明細書中に記載のアミノ酸配列によるポリペプチドを含む。本発明はまた、これらのポリペプチドのホモログを含み、このようなホモログは、下記アミノ酸配列と少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも95%、またはさらに100%相同あり得るが、これらは、任意選択的および好ましくは以下を含むデフォルトパラメーターを使用したNational Center of Biotechnology Information(NCBI)のBlastPソフトウェアを使用して決定することができる:フィルタリングはオン(このオプションは、Seg(タンパク質)プログラムを使用してクエリーから反復配列または複雑さの低い配列をフィルタリングする)、タンパク質についてのスコアリング行列はBLOSUM62であり、ワードサイズは3であり、E値は10であり、ギャップコストは11,1(初期化および伸長)であり、表示するアラインメント数は50である。任意選択的に、核酸配列の同一性/相同性を、National Center of Biotechnology Information(NCBI)のBlastNソフトウェアの使用によって決定することができ、このソフトウェアは、好ましくはDUSTフィルタープログラムを使用し、好ましくは、E値が10、複雑さの低い配列をフィルタリングし、ワードサイズが11である。最終的に、本発明はまた、上記ポリペプチドのフラグメントおよび変異(無作為またはターゲティングされた様式での天然に存在するか人為的に誘導された1つまたは複数のアミノ酸の欠失、挿入、または置換など)を有するポリペプチドを含む。   The invention also includes the polypeptides encoded by the polynucleotide sequences of the invention and polypeptides according to the amino acid sequences as described herein. The invention also includes homologs of these polypeptides, such homologs being at least 50%, at least 55%, at least 60%, at least 65%, at least 70%, at least 75%, at least 80% of the amino acid sequence %, At least 85%, at least 95%, or even 100% homologous, but using BlastP software from the National Center of Biotechnology Information (NCBI) using default parameters, optionally and preferably including Can be determined: filtering is on (this option filters repetitive or low complexity sequences from queries using the Seg (protein) program , Scoring matrix for proteins is BLOSUM62, word size is 3, E value is 10, gap costs are 11,1 (initialization and extension), the alignment number of display is 50. Optionally, the identity / homology of the nucleic acid sequences can be determined by use of the BlastN software of the National Center of Biotechnology Information (NCBI), which preferably uses the DUST filter program, preferably , E-values of 10, filtering low complexity arrays, word size is 11. Finally, the invention also relates to fragments and mutations of the above polypeptides (deletions, insertions, or deletion of one or more naturally occurring or artificially derived amino acids in a random or targeted manner Including polypeptides having substitutions, etc.).

本発明によって同定されるペプチドが、分解産物、合成ペプチドもしくは組換えペプチドおよびペプチド模倣物、典型的には、例えば、ペプチドをより安定にする一方で、ペプチドの体内または細胞への透過をより可能にする修飾を有し得る合成ペプチドならびにペプチドアナログであるペプトイドおよびセミペプトイドであり得ると認識される。このような修飾には、N末端修飾、Cま単修飾、ペプチド結合修飾(CH2−NH、CH2−S、CH2−S=O、O=C−NH、CH2−O、CH2−CH2、S=C−NH、CH=CH、またはCF=CHが含まれるが、これらに限定されない)、骨格修飾、および残基修飾が含まれるが、これらに限定されない。ペプチド模倣化合物の調製方法は当該分野で周知であり、明記されている。これに関するさらなる詳細を、以下に記載する。   The peptides identified by the present invention are degradation products, synthetic peptides or recombinant peptides and peptidomimetics, typically, for example, making the peptide more stable while allowing more penetration of the peptide into the body or cells It is recognized that it may be a synthetic peptide that may have a modification to make peptoids and peptide analogs that are peptoids and semipeptoids. Such modifications include N-terminal modification, C single modification, peptide bond modification (CH2-NH, CH2-S, CH2-S = O, O = C-NH, CH2-O, CH2-CH2, S = C-NH, CH = CH, or CF = CH, including, but not limited to, backbone modifications, and residue modifications, including, but not limited to. Methods for preparing peptidomimetic compounds are well known in the art and are specified. Further details regarding this are described below.

ペプチド内のペプチド結合(−CO−NH−)を、例えば、N−メチル化結合(−N(CH3)−CO−)、エステル結合(−C(R)H−C−O−O−C(R)−N−)、ケトメチレン結合(−CO−CH2−)、α−アザ結合(−NH−N(R)−CO−)(式中、Rは任意のアルキル(例えば、メチル)である)、カルバ(carba)結合(−CH2−NH−)、ヒドロキシエチレン結合(−CH(OH)−CH2−)、チオアミド結合(−CS−NH−)、オレフィン二重結合(−CH=CH−)、レトロアミド結合(−NH−CO−)、ペプチド誘導体(−N(R)−CH2−CO−)(式中、Rは、炭素原子状に天然に存在する「通常の」側鎖である)に置換することができる。   The peptide bond (-CO-NH-) in the peptide is, for example, N-methylated bond (-N (CH3) -CO-), ester bond (-C (R) H-C-O-O-C ( R) -N-), ketomethylene bond (-CO-CH2-), α-aza bond (-NH-N (R) -CO-) (wherein R is any alkyl (eg, methyl)) , Carba (carba) bond (-CH 2 -NH-), hydroxyethylene bond (-CH (OH)-CH 2-), thioamide bond (-CS-NH-), olefin double bond (-CH = CH-), Retroamide bond (-NH-CO-), peptide derivative (-N (R) -CH2-CO-), wherein R is a "normal" side chain naturally occurring at the carbon atom It can be replaced.

これらの修飾は、ペプチド鎖に沿った結合のいずれか、さらにはいくつか(2〜3)が同時に生じ得る。   These modifications may occur simultaneously with any, or even some (2-3) of linkages along the peptide chain.

天然の芳香族アミノ酸(Trp、Tyr、およびPhe)を、フェニルグリシン、TIC、ナフチレルアニン(naphthylelanine)、Pheの環メチル化誘導体、Pheのハロゲン化誘導体、またはo−メチル−Tyrなどの非天然酸に置換することができる。   Natural aromatic amino acids (Trp, Tyr and Phe) to non-natural acids such as phenylglycine, TIC, naphthylelanine, ring methylated derivatives of Phe, halogenated derivatives of Phe, or o-methyl-Tyr It can be replaced.

上記に加えて、本発明のペプチドには、1つまたは複数の修飾アミノ酸または1つまたは複数の非アミノ酸単量体(例えば、脂肪酸、複合糖質など)も含まれ得る。   In addition to the above, the peptides of the invention may also include one or more modified amino acids or one or more non-amino acid monomers (eg fatty acids, complex carbohydrates etc).

明細書および以下の特許請求の範囲で使用される、用語「アミノ酸」は、20種の天然に存在するアミノ酸(これらのアミノ酸は、しばしば、in vivoで翻訳後に修飾されている(例えば、ヒドロキシプロリン、ホスホセリン、およびホスホトレオニンが含まれる))および通常でない(unusual)アミノ酸(2−アミノアジピン酸、ヒドロキシリジン、イソデスモシン、ノルバリン、ノルロイシン、およびオルニチンが含まれるが、これらに限定されない)が含まれると理解される。さらに、用語「アミノ酸」には、D型およびL型のアミノ酸が含まれる。   As used in the specification and claims that follow, the term "amino acid" refers to the twenty naturally occurring amino acids (these amino acids are often post-translationally modified in vivo (eg, hydroxyproline) (Including phosphoserine and phosphothreonine) and unusual amino acids (including but not limited to 2-aminoadipate, hydroxylysine, isodesmosine, norvaline, norleucine and ornithine) Be understood. Furthermore, the term "amino acid" includes D- and L-amino acids.

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

本発明のペプチドを可溶化形態のペプチドが必要とされる診断で使用することが好ましいので、本発明のペプチドには、好ましくは、1つまたは複数の非天然または天然の極性アミノ酸(その水酸基含有側鎖によってペプチドの可溶性を増加させることができるセリンおよびトレオニンが含まれるが、これらに限定されない)が含まれる。   Preferably, one or more non-natural or natural polar amino acids (whose hydroxyl groups are included) are preferably used in the peptide of the invention, since it is preferred to use the peptide of the invention in diagnostics where the peptide in soluble form is required. These include, but are not limited to, serine and threonine, which can increase the solubility of the peptide by the side chain.

本発明のペプチドを線状形態で使用することが好ましいが、環状化がペプチド特性を重大に妨害しない場合、ペプチドの環状化形態も使用することができると認識される。   It is preferred to use the peptides of the invention in linear form, but it is recognized that if the cyclisation does not significantly interfere with the peptide properties, it is also possible to use cyclised forms of the peptide.

本発明のペプチドを、標準的な固相技術などの使用によって生化学的に合成することができる。これらの方法には、当該分野で周知の排他的固相合成、部分的固相合成方法、フラグメント縮重、古典的液体合成が含まれる。これらの方法を、ペプチドが比較的短い場合(すなわち、10kDa)、および/または組換え技術によって産生することができず(すなわち、核酸配列によってコードされない)、それにより異なる化学的性質を含む場合に使用することが好ましい。   The peptides of the invention can be biochemically synthesized by use of standard solid phase techniques and the like. These methods include exclusive solid phase synthesis, partial solid phase synthesis methods, fragment degeneracy, classical liquid synthesis well known in the art. These methods may be used where the peptide is relatively short (ie 10 kDa) and / or can not be produced recombinantly (ie not encoded by the nucleic acid sequence), thereby comprising different chemical properties. It is preferred to use.

合成ペプチドを、分取高速液体クロマトグラフィによって精製し、その組成をアミノ酸配列決定によって確認することができる。   Synthetic peptides can be purified by preparative high performance liquid chromatography and their composition can be confirmed by amino acid sequencing.

大量の本発明のペプチドを所望する場合、本発明のペプチドを、Bitter et al.,(1987)Methods in Enzymol.153:516−544,Studier et al.(1990)Methods in Enzymol.185:60−89,Brisson et al.(1984)Nature 310:511−514,Takamatsu et al.(1987)EMBO J.6:307−311,Coruzzi et al.(1984)EMBO J.3:1671−1680 and Brogli et al.,(1984)Science 224:838−843,Gurley et al.(1986)Mol.Cell.Biol.6:559−565 and Weissbach & Weissbach,1988,Methods for Plant Molecular Biology,Academic Press,NY,Section VIII,pp 421−463などおよび上記にも記載の組換え技術を使用して生成することができる。   When large amounts of the peptide of the present invention are desired, the peptide of the present invention can be used as described in Bitter et al. , (1987) Methods in Enzymol. 153: 516-544, Studier et al. (1990) Methods in Enzymol. 185: 60-89, Brisson et al. (1984) Nature 310: 511-514, Takamatsu et al. (1987) EMBO J. 6: 307-311, Coruzzi et al. (1984) EMBO J. 3: 1671-1680 and Brogli et al. (1984) Science 224: 838-843, Gurley et al. (1986) Mol. Cell. Biol. 6: 559-565 and Weissbach & Weissbach, 1988, Methods for Plant Molecular Biology, Academic Press, NY, Section VIII, pp 421-463, etc. and can also be produced using recombinant techniques as described above.

抗体
「抗体」は、好ましくは、免疫グロブリン遺伝子によって実質的にコードされるポリペプチドまたはエピトープ(例えば、抗原)に特異的に結合して認識するそのフラグメントをいう。認識される免疫グロブリン遺伝子には、κおよびλ軽鎖定常領域遺伝子、α、γ、δ、ε、およびμ重鎖定常領域遺伝子、ならびに無数の免疫グロブリン可変領域遺伝子が含まれる。抗体は、例えば、インタクトな免疫グロブリンまたは種々のペプチダーゼでの消化によって産生される多数の十分に特徴づけられたフラグメントとして存在する。これには、例えば、Fab’およびF(ab)’フラグメントが含まれる。本明細書中で使用される、用語「抗体」には、全抗体の修飾によって産生されるか、組換えDNA法を使用してde novoで合成される抗体フラグメントも含まれる。抗体には、ポリクローナル抗体、モノクローナル抗体、キメラ抗体、ヒト化抗体、または単鎖抗体も含まれる。抗体の「Fc」部分は、1つまたは複数の重鎖定常領域(CH1、CH2、およびCH3)を含むが、重鎖可変領域は含まれない免疫グロブリン重鎖の一部をいう。
Antibody "Antibody" preferably refers to a polypeptide substantially encoded by an immunoglobulin gene or a fragment thereof that specifically binds and recognizes an epitope (e.g. an antigen). The recognized immunoglobulin genes include the kappa and lambda light chain constant region genes, the alpha, gamma, delta, epsilon, and mu heavy chain constant region genes, as well as the myriad immunoglobulin variable region genes. Antibodies exist, eg, as intact immunoglobulins or as a number of well-characterized fragments produced by digestion with various peptidases. This includes, for example, Fab ′ and F (ab) ′ 2 fragments. As used herein, the term "antibody" also includes antibody fragments that are produced by modification of whole antibodies or synthesized de novo using recombinant DNA methods. Antibodies also include polyclonal antibodies, monoclonal antibodies, chimeric antibodies, humanized antibodies, or single chain antibodies. The "Fc" portion of an antibody refers to that portion of an immunoglobulin heavy chain that contains one or more heavy chain constant regions (CH1, CH2, and CH3) but does not include the heavy chain variable region.

マクロファージに結合することができる抗体の機能的フラグメント(Fab、F(ab’)2、およびFvなど)を以下に記載する:(1)Fab:抗体分子の1価の抗原結合フラグメントを含み、インタクトな軽鎖および1つの重鎖の一部を得るための酵素パパインでの全抗体の消化によって産生することができるフラグメント、(2)Fab’:インタクトな軽鎖および重鎖の一部を得るための全抗体のペプシンでの処理およびその後の還元によって得ることができる抗体分子のフラグメントであって、1つの抗体分子あたり2つのFab’フラグメントが得られる、(3)(Fab’)2:酵素ペプシンで全抗体を処理し、その後還元しないで得ることができる抗体のフラグメントであって、(Fab’)2は2つのジスルフィド結合によって互いに保持された2つのFab’フラグメントの二量体である、(4)Fv:2つの鎖として発現される軽鎖の可変領域および重鎖の可変領域を含む遺伝し操作されたフラグメントとして定義される、(5)単鎖抗体(「SCA」):遺伝子が融合された単鎖分子として適切なポリペプチドリンカーによって連結された軽鎖の可変領域および重鎖の可変領域を含む遺伝子操作された分子。   Functional fragments of antibodies capable of binding to macrophages (Fab, F (ab ') 2 and Fv etc.) are described below: (1) Fab: containing a monovalent antigen-binding fragment of an antibody molecule, intact Fragments that can be produced by digestion of whole antibodies with the enzyme papain to obtain part of the light chain and one heavy chain, (2) Fab ': to obtain parts of the intact light chain and heavy chain (3) (Fab ′) 2: Enzyme pepsin, which is a fragment of an antibody molecule obtainable by treatment of the whole antibody with pepsin and subsequent reduction, wherein two Fab ′ fragments are obtained per antibody molecule. A fragment of the antibody that can be obtained without treatment with whole antibody and then (Fab ′) 2 has two disulfide bonds (4) Fv: defined as a genetically engineered fragment comprising the light chain variable region and the heavy chain variable region expressed as two chains, thus being a dimer of two Fab ′ fragments held together (5) Single-chain antibody ("SCA"): A genetically engineered molecule comprising a light chain variable region and a heavy chain variable region linked by a suitable polypeptide linker as a single chain molecule fused to a gene .

ポリクローナル抗体およびモノクローナル抗体ならびにそのフラグメントの産生方法は当該分野で周知である(例えば、Harlow and Lane,Antibodies:A Laboratory Manual,Cold Spring Harbor Laboratory,New York,1988(本明細書中で参考として援用される)を参照のこと)。   Methods of producing polyclonal and monoclonal antibodies and fragments thereof are well known in the art (e.g. Harlow and Lane, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory, New York, 1988 (incorporated herein by reference). See)).

本発明の抗体フラグメントを、抗体のタンパク質分解性加水分解または大腸菌もしくは哺乳動物細胞(例えば、チャイニーズハムスター卵巣細胞培養または他のタンパク質発現系)中でのフラグメントをコードするDNAの発現によって調製することができる。抗体フラグメントを、従来の方法による全抗体のペプシンまたはパパイン消化によって得ることができる。例えば、抗体フラグメントを、ペプシンで抗体を酵素切断し、それにより、F(ab’)2と示される5Sフラグメントを得ることによって産生することができる。このフラグメントを、チオール還元剤を使用してさらに切断し、任意選択的にジスルフィド結合の切断に起因するスルフヒドリル基を保護して、1価の3.5S Fab’フラグメントを生成することができる。あるいは、ペプシンを使用した酵素切断により、2つの1価のFab’フラグメントおよびFcフラグメントが直接生成される。これらの方法は、例えば、Goldenbergに付与された米国特許第4,036,945号および同第4,331,647号ならびにこれらに含まれる引例(これらの特許は、その全体が本明細書中で参考として援用される)に記載されている。Porter,R.R.[Biochem.J.73:119−126(1959)]も参照のこと。フラグメントがインタクトな抗体によって認識される抗原に結合する限り、1価の軽鎖−重鎖フラグメントを形成するための重鎖の分離、フラグメントのさなる切断、またはさらなる酵素的、化学的、または遺伝子技術などの他の抗体の切断方法も使用することができる。   The antibody fragments of the invention may be prepared by proteolytic hydrolysis of the antibodies or expression of DNA encoding the fragments in E. coli or mammalian cells (eg, Chinese hamster ovary cell culture or other protein expression systems) it can. Antibody fragments can be obtained by pepsin or papain digestion of whole antibodies by conventional methods. For example, antibody fragments can be produced by enzymatic cleavage of antibodies with pepsin, thereby obtaining a 5S fragment designated F (ab ') 2. This fragment can be further cleaved using a thiol reducing agent to optionally protect the sulfhydryl group resulting from cleavage of the disulfide bond to produce a monovalent 3.5S Fab 'fragment. Alternatively, enzymatic cleavage using pepsin produces two monovalent Fab 'fragments and Fc fragments directly. These methods are described, for example, in US Pat. Nos. 4,036,945 and 4,331,647 to Goldenberg and the references contained therein (these patents are herein incorporated by reference in their entirety). Is incorporated by reference). Porter, R .; R. [Biochem. J. 73: 119-126 (1959)]. Separation of heavy chain to form monovalent light chain-heavy chain fragment, further cleavage of fragment, or additional enzymatic, chemical, or gene so long as the fragment binds to the antigen recognized by the intact antibody Other antibody cleavage methods, such as techniques, can also be used.

Fvフラグメントは、VH鎖およびVL鎖の会合を含む。Inbar et al.[Proc.Nat’l Acad.Sci.USA 69:2659−62(19720]に記載のように、この会合は、非極性であり得る。あるいは、可変鎖を、分子間ジスルフィド結合またはグルタルアルデヒドなどの化学物質による架橋によって結合することができる。好ましくは、Fvフラグメントは、ペプチドリンカーによって連結したVH鎖およびVL鎖を含む。これらの単鎖抗原結合タンパク質(sFv)を、オリゴヌクレオチドによって連結されたVHおよびVLドメインをコードするDNA配列を含む構造遺伝子の構築によって調製する。構造遺伝子を、発現ベクターに挿入し、その後、大腸菌などの宿主細胞に移入する。組換え宿主細胞は、2つのVドメインを架橋するリンカーペプチドを有する1つのポリペプチド鎖を合成する。sFvの生成方法は、例えば、Whitlow and Filpula,Methods 2:97−105(1991);Bird et al.,Science 242:423−426(1988);Pack et al.,Bio/Technology 11:1271−77(1993);および米国特許第4,946,778号(その全体が本明細書中で参考として援用される)に記載されている。   Fv fragments comprise an association of VH and VL chains. Inbar et al. [Proc. Nat'l Acad. Sci. This association may be nonpolar, as described in USA 69: 2659-62 (19720) Alternatively, the variable chains can be linked by crosslinking with intermolecular disulfide bonds or chemicals such as glutaraldehyde Preferably, the Fv fragment comprises VH and VL chains linked by a peptide linker These single chain antigen binding proteins (sFv) comprise DNA sequences encoding VH and VL domains linked by an oligonucleotide The structural gene is prepared by construction of a structural gene, which is then inserted into an expression vector and then transferred into a host cell such as E. coli etc. The recombinant host cell is a single polypeptide with a linker peptide bridging the two V domains. For example, the method for producing sFv is hitlow and Filpula, Methods 2: 97-105 (1991); Bird et al., Science 242: 423-426 (1988); Pack et al., Bio / Technology 11: 1271-77 (1993); No. 4,946,778, which is incorporated herein by reference in its entirety.

抗体フラグメントの別の形態は、1つの相補性決定領域(CDR)をコードするペプチドである。CDRペプチド(「最小認識単位」)を、目的の抗体のCDRをコードする遺伝子の構築によって得ることができる。このような遺伝子を、例えば、ポリメラーゼ連鎖反応を使用して抗体産生細胞のRNAから可変領域を合成することによって調製する(例えば、Larrick and Fry [Methods,2:106−10(1991)]を参照のこと)。   Another form of antibody fragment is a peptide encoding one complementarity determining region (CDR). CDR peptides ("minimal recognition units") can be obtained by construction of a gene encoding a CDR of an antibody of interest. Such genes are prepared, for example, by synthesizing variable regions from RNA of antibody producing cells using polymerase chain reaction (see, eg, Larrick and Fry [Methods, 2: 106-10 (1991)]. ).

非ヒト(例えば、マウス)抗体のヒト化形態は、非ヒト免疫グロブリン由来の最小配列を含む免疫グロブリンのキメラ分子、免疫グロブリン鎖、またはそのフラグメント(Fv、Fab、Fab’、F(ab’)、または抗体の他の抗原結合サブシーケンスなど)である。ヒト化抗体には、レシピエントの相補性決定領域(CDR)由来の残基が所望の特異性、親和性、および能力を有するマウス、ラット、またはウサギ等の非ヒト種のCDR由来の残基(ドナー抗体)に置換されたヒト免疫グロブリン(レシピエント抗体)が含まれる。いくつかの例では、ヒト免疫グロブリンのFvフレームワーク残基を、対応する非ヒト残基に置換する。ヒト化抗体はまた、レシピエント抗体や移入されたCDRまたはフレームワーク配列で認められない残基を含み得る。一般に、ヒト化抗体は、少なくとも1つ、典型的には2つの可変ドメインの実質的に全てを含み、全てまたは実質的に全てのCDR領域は非ヒト免疫グロブリンのCDRに対応し、全てまたは実質的に全てのFR領域はヒト免疫グロブリンコンセンサス配列のFR領域である。ヒト化抗体はまた、任意選択的に、免疫グロブリンの定常領域(Fc)の少なくとも一部、典型的には、ヒト免疫グロブリンの定常領域を含む(Jones et al.,Nature,321:522−525(1986);Riechmann et al.,Nature,332:323−329(1988);およびPresta,Curr.Op.Struct.Biol.,2:593−596(1992))。   The humanized form of the non-human (eg, murine) antibody is a chimeric molecule of an immunoglobulin comprising a minimal sequence derived from a non-human immunoglobulin, an immunoglobulin chain, or a fragment thereof (Fv, Fab, Fab ', F (ab') Or other antigen binding subsequences of an antibody, etc.). For humanized antibodies, residues from non-human species such as mice, rats, or rabbits, having the desired specificity, affinity, and ability, are the residues from the recipient's complementarity determining region (CDR) have the desired specificity, affinity, and ability It includes human immunoglobulin (recipient antibody) substituted with (donor antibody). In some instances, Fv framework residues of human immunoglobulin are replaced by corresponding non-human residues. Humanized antibodies may also comprise residues which are not found in the recipient antibody or in the imported CDR or framework sequences. In general, a humanized antibody comprises substantially all of at least one, typically two, variable domains, all or substantially all of the CDR regions correspond to CDRs of non-human immunoglobulin, all or substantially Indeed, all FR regions are those of human immunoglobulin consensus sequences. The humanized antibody optionally also comprises at least a portion of an immunoglobulin constant region (Fc), typically that of a human immunoglobulin (Jones et al., Nature 321: 522-525). (1986); Riechmann et al., Nature, 332: 323-329 (1988); and Presta, Curr. Op. Struct. Biol., 2: 593-596 (1992)).

非ヒト抗体のヒト化方法は、当該分野で周知である。一般に、ヒト化抗体は、非ヒトである供給源由来の抗体に移入された1つまたは複数のアミノ酸残基を有する。これらの非ヒトアミノ酸残基を、しばしば、移入残基(import residue)といい、典型的には、移入可変ドメインから採取される。ヒト化を、本質的に、Winter and co−workers [Jones et al.,Nature,321:522−525(1986);Riechmann et al.,Nature 332:323−327(1988);Verhoeyen et al.,Science,239:1534−1536(1988)]の方法にしたがって、げっ歯類CDRまたはCDR配列へのヒト抗体の対応する配列の置換によって行うことができる。したがって、このようなヒト化抗体は、実質的にインタクト未満のヒト可変ドメインが非ヒト種由来の対応する配列に置換されているキメラ抗体(米国特許第4,186,567号)である。実際には、ヒト化抗体は、典型的には、いくつかのCDR残基およびおそらくいくつかのFR残基がげっ歯類抗体中の類似の部位由来の残基に置換されたヒト抗体である。   Methods for humanizing non-human antibodies are well known in the art. In general, humanized antibodies have one or more amino acid residues transferred to an antibody from a source that is non-human. These non-human amino acid residues are often referred to as import residues, which are typically taken from an import variable domain. Humanization is essentially determined according to Winter and co-workers [Jones et al. , Nature, 321: 522-525 (1986); Riechmann et al. , Nature 332: 323-327 (1988); Verhoeyen et al. Chem., 239: 1534-1536 (1988)] by substituting the corresponding sequences of human antibodies for rodent CDRs or CDR sequences. Accordingly, such humanized antibodies are chimeric antibodies (US Pat. No. 4,186,567), wherein substantially less than an intact human variable domain has been substituted by the corresponding sequence from a non-human species. In practice, humanized antibodies are typically human antibodies in which some CDR residues and possibly some FR residues are substituted by residues from analogous sites in rodent antibodies .

ヒト抗体を、当該分野で公知の種々の技術(ファージディスプレイライブラリー(Hoogenboom and Winter,J.Mol.Biol.,227:381(1991);Marks et al.,J.Mol.Biol.,222:581(1991))が含まれる)を使用して産生することもできる。Cole et al.and Boerner et al.の技術もヒトモノクローナル抗体の調製に利用可能である(Cole et al.,Monoclonal Antibodies and Cancer Therapy,Alan R.Liss,p.77(1985)and Boerner et al.,J.Immunol.,147(1):86−95(1991))。同様に、ヒト抗体を、トランスジェニック動物(例えば、内因性免疫グロブリン遺伝子が部分的または完全に不活化されているマウス)へのヒト免疫グロブリン遺伝子座の移入によって作製することができる。攻撃誘発の際、ヒト抗体の産生が認められ、これは、あらゆる点でヒトで認められる性質(遺伝子の再編成、アセンブリ、および抗体レパートリーが含まれる)に酷似している。このアプローチは、例えば、米国特許第5,545,807号;同第5,545,806号;同第5,569,825号;同第5,625,126号;同第5,633,425号;同第5,661,016号、および以下の科学刊行物に記載されている:Marks et al.,Bio/Technology 10,:779−783(1992);Lonberg et al.,Nature 368:856−859(1994);Morrison,Nature 368 812−13(1994);Fishwild et al.,Nature Biotechnology 14,845−51(1996);Neuberger,Nature Biotechnology 14:826(1996);and Lonberg and Huszar,Intern.Rev.Immunol.13,65−93(1995)。   Human antibodies can be prepared by various techniques known in the art (phage display library (Hoogenboom and Winter, J. Mol. Biol., 227: 381 (1991); Marks et al., J. Mol. Biol., 222: 581 (1991)) can also be used. Cole et al. and Boerner et al. Techniques are also available for the preparation of human monoclonal antibodies (Cole et al., Monoclonal Antibodies and Cancer Therapy, Alan R. Liss, p. 77 (1985) and Boerner et al., J. Immunol., 147 (1 ): 86-95 (1991)). Similarly, human antibodies can be made by transfer of human immunoglobulin loci into transgenic animals (eg, mice in which the endogenous immunoglobulin genes have been partially or completely inactivated). During the challenge, production of human antibodies is observed which closely resembles in all respects the properties observed in humans, including gene rearrangement, assembly and antibody repertoire. This approach is described, for example, in U.S. Patent Nos. 5,545,807; 5,545,806; 5,569,825; 5,625,126; 5,633,425. No. 5,661,016, and the following scientific publications: Marks et al. , Bio / Technology 10: 779-783 (1992); Lonberg et al. Nature 368: 856-859 (1994); Morrison, Nature 368 812-13 (1994); Fishwild et al. , Nature Biotechnology 14, 845-51 (1996); Neuberger, Nature Biotechnology 14: 826 (1996); and Lonberg and Huszar, Intern. Rev. Immunol. 13, 65-93 (1995).

好ましくは、本発明のこの態様の抗体は、本発明のポリペプチド変異型の少なくとも1つのエピトープに特異的に結合する。本明細書中で使用される、用語「エピトープ」は、抗体のパラトープが結合する抗原上の任意の抗原決定基をいう。   Preferably, the antibody of this aspect of the invention specifically binds at least one epitope of a polypeptide variant of the invention. As used herein, the term "epitope" refers to any antigenic determinant on an antigen to which the paratope of an antibody binds.

エピトープ決定基は、通常、アミノ酸または炭水化物の側鎖等の分子の化学的に活性な表面群からなり、通常、特異的な三次元構造特性および特異的な電荷の特徴を有する。   Epitopic determinants usually consist of chemically active surface groupings of molecules such as amino acids or carbohydrate side chains and usually have specific three dimensional structural characteristics and specific charge characteristics.

任意選択的に、下記のように、1つまたは複数の翻訳後修飾(グリコシル化および/またはリン酸化が含まれるが、これらに限定されない)の変化によって固有のエピトープを変異型中に作製することができる。このような変化により、例えば、特定の部位でのグリコシル化の除去によって新規のエピトープを作製することもできる。   Optionally, creating unique epitopes in the variants by alteration of one or more post-translational modifications (including but not limited to glycosylation and / or phosphorylation) as described below Can. Such changes can also generate new epitopes, for example by removal of glycosylation at specific sites.

本発明のエピトープはまた、任意選択的に、線状ポリペプチド自体における固有の配列部分に連続的であるが、依然として組み合わせてエピトープを形成することができる、変異型の少なくとも1つの他の部分と組み合わせた本発明の変異型の固有の配列部分の一部または全部を含み得る。1つまたは複数の固有の配列部分は、任意選択的に、1つまたは複数の変異型の他の不連続部分(公知のタンパク質の一部と高い相同性を有し得る部分が含まれる)と組み合わせてエピトープを形成することができる。   The epitope of the present invention is also optionally contiguous with at least one other portion of the variant, which is contiguous with the unique sequence portion in the linear polypeptide itself but can still be combined to form the epitope. It may comprise some or all of the unique sequence parts of the variants of the invention in combination. One or more unique sequence parts, optionally, one or more other discrete parts of the variant (including parts that may have high homology with parts of known proteins) The epitopes can be formed in combination.

免疫アッセイ
本発明の別の実施形態では、免疫アッセイを使用して、サンプル中のマーカーを定性的または定量的に検出および分析することができる。この方法は、マーカーに特異的に結合する抗体を準備する工程と、サンプルを抗体に接触させる工程と、サンプル中のマーカーに結合した抗体の複合体の存在を検出する工程を含む。
Immunoassays In another embodiment of the invention, immunoassays can be used to qualitatively or quantitatively detect and analyze markers in a sample. The method comprises the steps of providing an antibody that specifically binds to the marker, contacting the sample with the antibody, and detecting the presence of a complex of the antibody bound to the marker in the sample.

マーカーに特異的に結合する抗体を調製するために、精製したタンパク質マーカーを使用することができる。タンパク質マーカーに特異的に結合する抗体を、当該分野で公知の任意の適切な方法を使用して調製することができる。   Purified protein markers can be used to prepare antibodies that specifically bind the markers. Antibodies that specifically bind to protein markers can be prepared using any suitable method known in the art.

抗体を準備した後、マーカーを、十分に認識された多数の免疫学的結合アッセイを使用して検出および/または定量することができる。有用なアッセイには、例えば、酵素免疫アッセイ(EIA)(酵素結合免疫吸着アッセイ(ELISA)など)、放射免疫アッセイ(RIA)、ウェスタンブロットアッセイ、またはスロットブロットアッセイが含まれる(例えば、米国特許第4,366,241号;同第4,376,110号;同第4,517,288号;および同第4,837,168号を参照のこと)。一般に、被験体から得たサンプルを、マーカーに特異的に結合する抗体と接触させることができる。   After preparing the antibodies, the markers can be detected and / or quantified using a number of well-recognized immunological binding assays. Useful assays include, for example, enzyme immunoassay (EIA) (such as enzyme linked immunosorbent assay (ELISA)), radioimmunoassay (RIA), western blot assay, or slot blot assay (eg, US Pat. Nos. 4,366,241; 4,376,110; 4,517,288; and 4,837,168). In general, a sample obtained from a subject can be contacted with an antibody that specifically binds the marker.

任意選択的に、抗体を、抗体とサンプルとの接触前に固体支持体に固定して、複合体の線状およびその後の単離を容易にすることができる。固体支持体の例には、例えば、マイクロタイタープレート、スティック、ビーズ、またはマイクロビーズの形態のガラスまたはプラスチックが含まれるが、これらに限定されない。抗体を、固体支持体に付着させることもできる。   Optionally, the antibody can be immobilized on a solid support prior to contacting the antibody with the sample to facilitate linear and subsequent isolation of the complex. Examples of solid supports include, but are not limited to, glass or plastic in the form of, for example, microtiter plates, sticks, beads, or microbeads. The antibodies can also be attached to a solid support.

サンプルの抗体とのインキュベーション後、混合物を洗浄し、形成された抗体−マーカー複合体を、検出することができる。洗浄混合物と検出試薬とのインキュベーションによってこれを行うことができる。あるいは、サンプル中のマーカーを、例えば、第2の標識抗体を使用して結合したマーカー−特異的抗体を検出する直接アッセイ、および/または、例えば、マーカーの異なるエピトープに結合するモノクローナル抗体を混合物と同時にインキュベートする競合アッセイまたは阻害アッセイを使用して検出することができる。   After incubation of the sample with the antibody, the mixture can be washed and the antibody-marker complex formed can be detected. This can be done by incubation of the wash mixture with the detection reagent. Alternatively, a direct assay that detects markers in the sample, eg, bound marker-specific antibodies using a second labeled antibody, and / or a mixture of monoclonal antibodies that bind, for example, different epitopes of the marker It can be detected using co-incubated competition or inhibition assays.

アッセイを通して、試薬の各組合わせ後にインキュベーションおよび/または洗浄工程が必要であり得る。インキュベーション工程は、約5秒間から数時間まで、好ましくは約5分から約24時間まで変化し得る。しかし、インキュベーション時間は、アッセイの形式、マーカー、溶液の体積、および濃度などに依存する。通常、アッセイを、周囲温度で行うが、10℃〜40℃などの範囲で行うことができる。   Throughout the assay, incubation and / or washing steps may be required after each combination of reagents. The incubation step may vary from about 5 seconds to several hours, preferably from about 5 minutes to about 24 hours. However, the incubation time depends on the assay format, markers, volume of solution, concentration and so on. Typically, the assay is performed at ambient temperature, but can be performed in a range such as 10 ° C to 40 ° C.

免疫アッセイを使用して、被験体由来のサンプル中のマーカー試験量を決定することができる。第1に、サンプル中の試験量のマーカーを、上記の免疫アッセイ方法を使用して検出することができる。マーカーがサンプル中に存在する場合、サンプル中にマーカーが存在する場合、マーカーは、上記の適切なインキュベーション条件下でマーカーと特異的に結合する抗体との抗体−マーカー複合体を形成する。任意選択的に、抗体−マーカー複合体量を、標準との比較によって決定することができる。上記のように、測定単位をコントロール量および/またはシグナルと比較することができる限り、マーカーの試験量を、絶対単位中で測定する必要はない。   Immunoassays can be used to determine the marker test amount in a sample from a subject. First, markers of the test amount in a sample can be detected using the immunoassay method described above. If a marker is present in the sample, and the marker is present in the sample, the marker forms an antibody-marker complex with an antibody that specifically binds the marker under the appropriate incubation conditions described above. Optionally, the amount of antibody-marker complex can be determined by comparison to a standard. As mentioned above, it is not necessary to measure the test amount of marker in absolute units, as long as the unit of measurement can be compared to the control amount and / or signal.

本発明のポリペプチドと特異的に相互作用するが、例えば、野生型タンパク質または他のイソ型と相互作用しない抗体を使用することが好ましい。このような抗体は、例えば、本発明のポリペプチド変異型の固有の配列部分(下により詳細に記載されている架橋、先端、テール、および挿入が含まれるが、これらに限定されない)に指向する。本発明の抗体の好ましい実施形態を、「抗体」の項により詳細に記載している。   It is preferred to use an antibody that specifically interacts with the polypeptide of the invention but does not, for example, interact with wild-type protein or other isoforms. Such antibodies are directed, for example, to the unique sequence portions of the polypeptide variants of the invention, including but not limited to the crosslinks, tips, tails, and insertions described in more detail below. . Preferred embodiments of the antibodies of the invention are described in more detail in the section "Antibodies".

放射免疫アッセイ(RIA):あるバージョンでは、この方法は、所望の基質の沈降、以下に詳述する方法では、アガロースビーズなどの沈殿可能なキャリア上に固定した特異的抗体および放射性標識抗体結合タンパク質(例えば、I125で標識したプロテインA)を含む。沈降ペレット数は、基質量に比例する。 Radioimmunoassay (RIA): In one version, this method involves precipitation of the desired substrate, specific antibodies and radiolabeled antibody binding proteins immobilized on a precipitable carrier such as agarose beads in the method detailed below (Eg, Protein A labeled with 125 ). The number of sedimented pellets is proportional to the base mass.

RIAの別のバージョンでは、標識基質および非標識抗体結合タンパク質を使用する。未知量の基質を含むサンプルを、種々の量で添加する。標識基質の沈降数の減少は、添加したサンプル中の基質の量に比例する。   Another version of RIA uses labeled substrate and unlabeled antibody binding protein. Samples containing unknown amounts of substrate are added in various amounts. The reduction in the number of precipitates of labeled substrate is proportional to the amount of substrate in the added sample.

酵素結合免疫吸着アッセイ(ELISA):この方法は、タンパク質基質を含むサンプル(例えば、固定した細胞またはタンパク質溶液)のマイクロタイタープレートのウェルなどの表面への固定を含む。酵素にカップリングした基質特異的抗体を適用し、基質に結合させる。次いで、抗体の存在を検出し、抗体に結合した酵素を使用した比色反応によって定量する。この方法で一般に使用される酵素には、西洋ワサビペルオキシダーゼおよびアルカリホスファターゼが含まれる。十分に較正されており、且つ直線の反応範囲内の場合、サンプル中の基質の存在量は、発色量に比例する。一般に基質標準を使用して、量的精度を改良する。   Enzyme-Linked Immunosorbent Assay (ELISA): This method involves the immobilization of a sample (eg, immobilized cells or protein solution) containing a protein substrate to a surface, such as a well of a microtiter plate. A substrate specific antibody coupled to the enzyme is applied and allowed to bind to the substrate. The presence of the antibody is then detected and quantified by colorimetric reaction using an enzyme coupled to the antibody. Enzymes commonly used in this method include horseradish peroxidase and alkaline phosphatase. When well calibrated and within the linear reaction range, the amount of substrate present in the sample is proportional to the amount of color developed. Substrate standards are generally used to improve quantitative accuracy.

ウェスタンブロット:この方法は、アクリルアミドゲルによる他のタンパク質からの基質の分離およびその後の膜(例えば、ナイロンまたはPVDF)への基質の移動を含む。次いで、基質の存在を、基質に特異的な抗体によって検出し、その後、抗体結合試薬によって結合する。抗体結合試薬は、例えば、プロテインAまたは他の抗体であり得る。抗体結合試薬を、上記のように、放射性標識するか、酵素に結合させることができる。オートラジオグラフィ、比色試薬、または化学発光によって検出することができる。この方法によって基質を定量し、電気泳動の際のアクリルアミドゲルにおける移動距離を示す膜の相対的位置によってその同一性を決定可能である。   Western Blot: This method involves the separation of the substrate from the other proteins by acrylamide gel and the subsequent transfer of the substrate to a membrane (eg nylon or PVDF). The presence of the substrate is then detected by an antibody specific for the substrate and then bound by an antibody binding reagent. The antibody binding reagent can be, for example, protein A or another antibody. The antibody binding reagent can be radioactively labeled or conjugated to an enzyme as described above. It can be detected by autoradiography, colorimetric reagents, or chemiluminescence. The substrate can be quantified by this method and its identity can be determined by the relative position of the membrane, which indicates the migration distance in the acrylamide gel during electrophoresis.

免疫組織化学的分析:この方法は、基質特異的抗体による固定細胞におけるin situでの基質の検出を含む。基質特異的抗体を、酵素に結合するかフルオロフォアに結合することができる。顕微鏡および主観的評価によって検出する。酵素結合抗体を使用する場合、比色反応が必要であり得る。   Immunohistochemical analysis: This method involves the detection of substrate in situ in fixed cells by substrate specific antibodies. Substrate specific antibodies can be conjugated to an enzyme or to a fluorophore. Detect by microscopy and subjective assessment. When using enzyme linked antibodies, a colorimetric reaction may be required.

蛍光標示式細胞分取(FACS):この方法は、基質特異的抗体による細胞におけるin situでの基質の検出を含む。基質特異的抗体を、光ビーム(light beam)からの通過時の各細胞から放出された光の波長を読み取る細胞分取装置によって検出する。この方法は、2つまたはそれ以上の抗体を同時に使用することができる。   Fluorescence activated cell sorting (FACS): This method involves detection of substrate in situ in cells by substrate specific antibodies. Substrate specific antibodies are detected by a cell sorting device which reads the wavelength of light emitted from each cell as it passes from the light beam. This method can use two or more antibodies simultaneously.

ラジオイメージング法
これらの方法には、陽電子放出型断層撮影(PET)、単光子放出型コンピュータ断層撮影(SPECT)が含まれるが、これらに限定されない。これらの両技術は、非浸襲性であり、これらを使用して、広範な種々の組織事象および/または機能を検出および/または測定することができる(例えば、癌細胞の検出など)。PETと異なり、SPECTを、任意選択的に、2つの標識と同時に使用することができる。SPECTも同様に、例えば、費用および使用することができる標識の型に関していくつかの他の利点を有する。例えば、米国特許第6,696,686号は、乳癌検出のためのSPECTの使用を記載しており、この特許は、本明細書中で完全に記載されているかのように本明細書中で参考として援用される。
Radio Imaging Methods These methods include, but are not limited to, positron emission tomography (PET), single photon emission computed tomography (SPECT). Both these techniques are non-invasive and can be used to detect and / or measure a wide variety of tissue events and / or functions (eg, detection of cancer cells, etc.). Unlike PET, SPECT can optionally be used simultaneously with two labels. SPECT likewise has several other advantages, for example, in terms of cost and type of label that can be used. For example, U.S. Patent No. 6,696,686 describes the use of SPECT for breast cancer detection, as this patent is fully described herein. It is incorporated as a reference.

ディスプレイライブラリー
本発明のさらに別の態様によれば、それぞれが本発明のポリペプチド配列由来の少なくとも6個、少なくとも7個、少なくとも8個、少なくとも9個、少なくとも10個、少なくとも10〜15個、少なくとも12〜17個、少なくとも15〜20個、少なくとも15〜30個、または少なくとも20〜50個の連続したアミノ酸を表示する複数のディスプレイ送達体(ファージ、ウイルス、または細菌など)を含むディスプレイライブラリーを提供する。
Display Library According to yet another aspect of the invention, at least 6, at least 7, at least 8, at least 9, at least 10, at least 10-15, each from the polypeptide sequence of the invention Display library comprising a plurality of display vehicles (such as phage, viruses or bacteria) displaying at least 12-17, at least 15-20, at least 15-30, or at least 20-50 contiguous amino acids I will provide a.

このようなディスプレイライブラリーの構築方法は、当該分野で周知である。このような方法は、例えば、Young AC,et al.,"The three−dimensional structures of a polysaccharide binding antibody to Cryptococcus neoformans and its complex with a peptide from a phage display library:implications for the identification of peptide mimotopes" J Mol Biol 1997 Dec 12;274(4):622−34;Giebel LB et al. "Screening of cyclic peptide phage libraries identifies ligands that bind streptavidin with high affinities" Biochemistry 1995 Nov 28;34(47):15430−5;Davies EL et al.,"Selection of specific phage−display antibodies using libraries derived from chicken immunoglobulin genes" J Immunol Methods 1995 Oct 12;186(1):125−35;Jones C RT al."Current trends in molecular recognition and bioseparation" J Chromatogr A 1995 Jul 14;707(1):3−22;Deng SJ et al."Basis for selection of improved carbohydrate−binding single−chain antibodies from synthetic gene libraries" Proc Natl Acad Sci U S A 1995 May 23;92(11):4992−6;and Deng SJ et al."Selection of antibody single−chain variable fragments with improved carbohydrate binding by phage display" J Biol Chem 1994 Apr 1;269(13):9533−8(本明細書中で参考として援用される)に記載されている。   Methods for constructing such display libraries are well known in the art. Such methods are described, for example, in Young AC, et al. "The three-dimensional structures of a polysaccharide binding antibody to Cryptococcus neoformans and its complex with a peptide from a phage display library: implications for the identification of peptide mimotopes" J Mol Biol 1997 Dec 12; 274 (4): 622-34 Giebel LB et al. Davies EL et al., "Biochemistry 1995 Nov 28; 34 (47): 15430-5; Davies EL et al.," Determination of cyclic peptide phage libraries with identity identities that bind streptavidin with high affinity ". J. Immunol Methods 1995 Oct 12; 186 (1): 125-35; Jones C RT al., "Selection of specific phage-displaying antibodies using libraries derived from chicken immunoglobin genes". "Current trends in molecular recognition and bioseparation" J Chromatogr A 1995 Jul 14; 707 (1): 3-22; Deng SJ et al. Proc Natl Acad Sci USA 1995 May 23; 92 (11): 4992-6; and Deng SJ et al. "Basis for selection of improved carbohydrate-binding single-chain antibodies from synthetic gene libraries". "Selection of antibody single-chain variable fragments with improved carbohydrate binding by phage display" J Biol Chem 1994 Apr. 1; 269 (13): 9533-8, which is incorporated herein by reference.

以下の項は、候補マーカーの例(第1項)およびこれらのマーカーの例についての実験データ(第2項)に関する。   The following sections relate to examples of candidate markers (section 1) and experimental data for examples of these markers (section 2).

候補マーカーの例の項
この項は、本発明の配列の例(その例示的選択方法が含まれる)に関する。
Example of Candidate Markers Section This section relates to examples of sequences of the present invention, including exemplary selection methods thereof.

本発明の生体分子を明らかにするために取り掛かった方法の説明
ヒトESTおよびcDNAを、GenBankバージョン136(2003年6月15日のftp.ncbi.nih.gov/genbank/release.notes/gb136.release.notes);2003年4月のNCBIゲノムアセンブリ;2003年6月のRefSeq配列;Genbankバージョン139(2003年12月);NCBIのヒトゲノム(Build 34)(2003年10月から);および2003年12月からのRefSeq配列;およびIncyte CorporationのLifeSeqライブラリー(ESTのみ;Wilmington,DE,USA)から得た。GenBank配列に関して、EST(GBEST)の項由来のヒトEST配列および霊長類(GBPRI)の項由来のヒトmRNA配列を使用し、ヒトヌクレオチドRefSeq mRNA配列も使用した(例えば、www.ncbi.nlm.nih.gov/Genbank/GenbankOverview.htmlおよびESTの項の参考文献(www.ncbi.nlm.nih.gov/dbEST/を参照のこと);dbEST(GenBank中のESTデータベース)の一般的な参考文献(Boguski et al,Nat Genet.1993 Aug;4(4):332−3に見出すことができる)(その全てが本明細書中に完全に記載されているかのように本明細書中で参考として援用される)を参照のこと)。
Description of the method taken to reveal the biomolecule of the present invention Human EST and cDNA, GenBank version 136 (ftp. Ncbi. Nih. Gov / genbank / release. Notes / gb136. Release June 15, 2003 April 2003 NCBI genome assembly; June 2003 RefSeq sequence; Genbank version 139 (December 2003); NCBI human genome (Build 34) (from October 2003); And from the LifeSeq library of the Incyte Corporation (EST only; Wilmington, DE, USA). For GenBank sequences, human EST sequences from the EST (GBEST) section and human mRNA sequences from the primate (GBPRI) section were used, and a human nucleotide RefSeq mRNA sequence was also used (eg www.ncbi.nlm.nih) .Gov / Genbank / GenbankOverview.html and references in the section EST (see www.ncbi.nlm.nih.gov/dbEST/); general references (dbuski) for dbEST (EST database in GenBank) et al, Nat Genet. 1993 Aug; 4 (4): 332-3), which is incorporated herein by reference as if fully described herein. See))

新規のスプライス変異型を、Sorek,R.,Ast,G.& Graur,D.Alu−containing exons are alternatively spliced.Genome Res 12,1060−7(2002);米国特許第6,625,545号;2004年5月27日にUS20040101876として公開された米国特許出願番号10/426,002号(その全てが本明細書中に完全に記載されているかのように本明細書中で参考として援用される)に記載のLEADSクラスター化およびアセンブリシステムを使用して予想した。簡単に述べれば、ソフトウェアは、反復、ベクター、および免疫グロブリンから発現配列を取り除く。次いで、ソフトウェアは、発現配列を、選択的スプライシングを考慮したゲノムおよび遺伝子または部分的遺伝子を示す「クラスター」への発現配列と重複するクラスターとアラインメントする。   Novel splice variants are described by Sorek, R. et al. , Ast, G., et al. & Graur, D. Alu-containing exons are alternatively spliced. Genome Res 12, 1060-7 (2002); US Patent No. 6,625, 545; US Patent Application No. 10/426, 002, published May 27, 2004 as US 20040101876 (all of which are incorporated herein by reference. The prediction was made using the LEADS clustering and assembly system as described herein) as if fully described therein. Briefly, software removes expression sequences from repeats, vectors, and immunoglobulins. The software then aligns the expressed sequence with a cluster that overlaps the expressed sequence into genomes and genes or "clusters" representing partial genes that allow for alternative splicing.

これらを、GeneCarta(Compugen,Tel−Aviv,Israel)プラットフォームを使用して注釈づけした。GeneCartaプラットフォームは、豊富な注釈づけプール、(特に、スプライシングした配列の)配列情報、染色体情報、アラインメント、およびさらなる情報(SNP、遺伝子オントロジーターム、発現プロフィール、機能分析、詳細なドメイン構造、既知および推定タンパク質および詳細な相同性レポートなど)を含む。   These were annotated using the GeneCarta (Compugen, Tel-Aviv, Israel) platform. GeneCarta platform has rich annotation pool, sequence information (especially spliced sequences), chromosomal information, alignment, and additional information (SNP, gene ontology terms, expression profile, functional analysis, detailed domain structure, known and presumed Including proteins and detailed homology reports).

候補選択方法に関して簡単に説明する。しかし、この説明を記述のみを目的として説明し、本発明を制限することを決して意図しないことに留意すべきである。発現配列のデータベースの使用による腫瘍組織中で過剰発現する遺伝子および/またはそのスプライスバリアントを見出すようにデザインされた計算プロセスによって潜在的マーカーを同定した。手作業の分類プロセスにしたがって決定したESTライブラリー中の情報に関連する種々のパラメータを使用して、癌組織中で過剰発現する遺伝子および/またはそのスプライスバリアントの位置づけを補助した。選択方法の詳細な説明を、以下の実施例1に示す。癌マーカー選択エンジンおよび以下のウェットバリデーション(wet validation)段階の概要のまとめを図1に示す。   The candidate selection method will be briefly described. However, it should be noted that this description is given for the purpose of description only and is in no way intended to limit the present invention. Potential markers were identified by computational processes designed to find overexpressed genes and / or their splice variants in tumor tissue by using databases of expressed sequences. Various parameters related to the information in the EST library determined according to the manual classification process were used to aid in the localization of overexpressed genes and / or their splice variants in cancerous tissue. A detailed description of the selection method is given in Example 1 below. A summary of the cancer marker selection engine and the following wet validation step summary is shown in FIG.

実施例1:差分発現した遺伝子産物の同定−アルゴリズム
差分発現した遺伝子産物と構成性に発現した遺伝子(すなわち、ハウスキーピング遺伝子)とを区別するために、頻度分析に基づくアルゴリズムを設定した。癌で過剰発現した転写物の同定のための特定のアルゴリズムを、以下に記載する。
Example 1: Identification of differentially expressed gene products-Algorithm In order to distinguish between differentially expressed gene products and constitutively expressed genes (ie, housekeeping genes), an algorithm based on frequency analysis was set up. Specific algorithms for the identification of transcripts overexpressed in cancer are described below.

乾式分析(Dry analysis)
ライブラリー注釈づけ−ESTライブラリーを以下にしたがって手作業で分類する。
・組織の起源
・生体供給源−ESTライブラリーの構築のために頻繁に使用される生体供給源の例には、癌細胞株、正常組織、癌組織、胎児組織、および他(正常細胞株、正常細胞株のプール、癌細胞株、およびその組み合わせなど)が含まれる。これらの組織/細胞株に関する以下に使用した略語の特定の説明を上に示す。
・ライブラリー構築のプロトコール−種々の方法がライブラリー構築分野で公知であり、標準化ライブラリー構築、非標準化ライブラリー構築、サブトラクションライブラリー、ORESTESなどが含まれる。時折、ライブラリー構築のプロトコールを示さないと認識される。
Dry analysis
Library Annotation-EST library is manually classified according to the following.
-Tissue origin-Biological source-Examples of biological sources frequently used for construction of EST libraries include cancer cell lines, normal tissues, cancer tissues, fetal tissues, and others (normal cell lines, Normal cell line pools, cancer cell lines, and combinations thereof). Specific descriptions of the abbreviations used below for these tissues / cell lines are given above.
Library Construction Protocol-Various methods are known in the library construction art and include standardized library construction, non-standardized library construction, subtraction library, ORESTES, etc. It is occasionally recognized that the library construction protocol is not indicated.

以下の規則に従う。   Follow the rules below.

同一の生体サンプル由来のESTライブラリーを、1つのライブラリーと見なす。   The EST library from the same biological sample is considered as one library.

上記平均レベルで汚染されている(例えば、DNA汚染など)ESTライブラリーを排除した。このような汚染の存在を、以下のように決定した。各ライブラリーについて、他のスプライシング配列内に完全に含まれない非スプライシングESTを計数した。(他の配列と比較した)このような配列の比率は、分析した全ライブラリーの平均よりも標準偏差が少なくとも4高い場合、ライブラリーを汚染としてタグ化し、以下の分析でのさらなる考慮から排除した(さらなる詳細については、Sorek,R.& Safer,H.M.A novel algorithm for computational identification of contaminated EST libraries.Nucleic Acids Res 31,1067−74(2003)も参照のこと)。   The EST library contaminated at the above average levels (eg, DNA contamination etc.) was excluded. The presence of such contamination was determined as follows. For each library, non-splicing ESTs that were not completely contained within other splicing sequences were counted. The ratio of such sequences (compared to other sequences) will tag the library as a contamination if it is at least 4 standard deviations higher than the average of the whole library analyzed and excluded from further consideration in the following analysis (See also Sorek, R. & Safer, H. M. A. novel algorithm for computational identification of contaminated EST libraries. Nucleic Acids Res 31, 1067-74 (2003) for further details).

少なくとも5つの配列(目的の組織由来の少なくとも2つの配列が含まれる)を有するクラスター(遺伝子)を分析した。上記のように、スプライスバリアントを、LEADSソフトウェアパッケージの使用によって同定した。   Clusters (genes) with at least 5 sequences (including at least 2 sequences from the tissue of interest) were analyzed. As mentioned above, splice variants were identified by use of the LEADS software package.

実施例2:癌中で過剰発現する遺伝子の同定
2つの異なるスコアリングアルゴリズムを開発した。
Example 2: Identification of Overexpressed Genes in Cancer Two different scoring algorithms were developed.

ライブラリースコア−多数の癌ライブラリーによって支持される候補配列は、特異的且つ有効な診断マーカーとして機能する可能性がより高い。   Library score-Candidate sequences supported by multiple cancer libraries are more likely to function as specific and effective diagnostic markers.

基本アルゴリズム−各クラスターのために、クラスターに対する癌ライブラリーおよび正常ライブラリーの寄与配列を計数した。フィッシャーの正確確率検定を使用して、癌ライブラリーおよび正常なライブラリーの総数と比較して癌ライブラリーがクラスター中で有意に過剰発現するかどうかをチェックした。   Basic Algorithm-For each cluster, the contributing sequences of cancer library and normal library to cluster were counted. Fisher's exact test was used to check if the cancer library was significantly over-expressed in clusters compared to the total number of cancer library and normal library.

ライブラリーの計数:クラスターに関与しない限り、小ライブラリー(例えば、1000配列未満)を、考慮から排除した。この理由のために、ライブラリーの総数を、各クラスターについて実際に調整している。   Library Counting: Small libraries (e.g. less than 1000 sequences) were excluded from consideration unless involved in a cluster. For this reason, the total number of libraries is actually adjusted for each cluster.

クローン番号スコア−一般に、EST数は、正常なライブラリーと比較して癌ライブラリーではるかに多く、これは、実際の過剰発現を示し得る。   Clone number score-Generally, EST numbers are much higher in cancer libraries compared to normal libraries, which may indicate actual overexpression.

アルゴリズム−
クローン計数:ESTクローンの計数のために、プロトコールが実際の発現レベルをどの程度反映しているという本発明者らの信念に基づいて、各ライブラリープロトコールクラスに以下の重みを付けた。
(i)非正規化:1
(ii)正規化:0.2
(iii)他の全てのクラス:0.1
Algorithm-
Clone Counting: For the counting of EST clones, each library protocol class was weighted as follows based on our belief that the protocol reflects the actual expression level.
(I) Denormalization: 1
(Ii) Normalization: 0.2
(Iii) All other classes: 0.1

クローン数スコア−癌ライブラリー由来の重みをつけたESTクローンの総数を、正常ライブラリー由来のESTクローンと比較した。1つのライブラリーが多数のスコアに寄与することを回避するために、所与のクラスターの最も多くのライブラリーに与えるライブラリーの寄与を2クローンに制限した。   Clone number score-The total number of weighted EST clones from the cancer library was compared to EST clones from normal library. In order to avoid one library contributing to multiple scores, the library contribution given to the most libraries of a given cluster was limited to 2 clones.

スコアを、

Figure 2008507261
(式中、c−クラスター中の「癌」クローンの重み付けした数、
C−全「癌」ライブラリー中のクローンの重み付けした数、
n−クラスター中の「正常」クローンの重み付けした数、
N−全「正常」ライブラリー中のクローンの重み付けした数
)として計算した。 Score,
Figure 2008507261
Where the weighted number of "cancer" clones in the c-cluster,
C-weighted number of clones in the whole "cancer" library,
Weighted number of "normal" clones in n-cluster,
Calculated as N-weighted number of clones in all "normal" libraries.

クローン数スコアの有意性−フィッシャーの正確確率検定を使用して、癌ライブラリーおよび正常なライブラリー由来のESTクローンの総数と比較して癌ライブラリー由来のESTクローンがクラスター中で有意に過剰発現するかどうかをチェックした。   Clone number score significance-Significantly over-expressed in a cluster of EST clones from cancer library compared to the total number of EST clones from cancer library and normal library using Fisher's exact test I checked if I would like to.

以下の2つの検索アプローチを使用して、一般的な癌特異的候補または腫瘍特異的候補のいずれかを見出した。
・癌細胞株由来のライブラリーと同様に、腫瘍組織由来のライブラリー/配列を計数する(「正常」細胞株は無視した)。
・腫瘍組織由来のライブラリー/配列のみを計数する。
The following two search approaches were used to find either general cancer-specific or tumor-specific candidates.
• Count libraries / sequences from tumor tissue as well as libraries from cancer cell lines ("normal" cell lines were ignored).
Count only libraries / sequences from tumor tissue.

実施例3:組織特異的遺伝子の同定
組織特異的クラスターの検出のために、組織ライブラリー/配列を、クラスター中のライブラリー/配列の総数と比較した。上記と類似の統計ツールを使用して、組織特異的遺伝子を同定した。組織の略語は癌組織と同一であるが、見出し「正常組織」と共に示す。
Example 3 Identification of Tissue Specific Genes For detection of tissue specific clusters, the tissue library / sequence was compared to the total number of libraries / sequences in the cluster. Similar statistical tools as above were used to identify tissue specific genes. The tissue abbreviation is identical to the cancer tissue but is shown with the heading "normal tissue".

アルゴリズム−各試験組織Tおよび各試験クラスターについて、以下を試験した。   Algorithm-For each test tissue T and each test cluster, the following was tested:

1.各クラスターは、組織T由来の少なくとも2つのライブラリーを含む。クラスター中の組織T由来の少なくとも3つのクローン(上記のように重み付けした)、および
2.組織T由来のクローンは、試験クラスターに関与する全クローンの少なくとも40%である。
1. Each cluster contains at least two libraries from tissue T. 1. at least three clones from tissue T in the cluster (weighted as above), and Tissue T derived clones are at least 40% of all clones involved in the test cluster.

数が統計的に有意であることをチェックするために、フィッシャーの正確確率検定のP値を、ライブラリーおよび重み付けしたクローンの両方について計算した。   To check that the numbers are statistically significant, the Fisher's exact test P value was calculated for both the library and the weighted clones.

実施例4:癌中で過剰発現しないクラスターの癌中で過剰発現したスプライスバリアントの同定
固有の領域を含む癌特異的スプライスバリアントを同定した。
Example 4: Identification of Splice Variants Overexpressed in Cancer of Clusters Not Overexpressed in Cancer A cancer specific splice variant comprising a unique region was identified.

スプライスバリアント中の固有の配列領域の同定
領域を、各スプライスバリアント中で共に常に出現するか出現しない隣接エクソン群と定義する。
Identification of Unique Sequence Regions in Splice Variants Regions are defined as adjacent exons that always or do not appear together in each splice variant.

「セグメント」(時折、「seg」または「ノード」という)は、公知のスプライシング内部(inside)を含まない最も短い隣接転写領域と定義する。   A "segment" (sometimes referred to as a "seg" or "node") is defined as the shortest adjacent transcription region that does not contain known splicing inside.

信頼できるESTのみを、領域およびセグメントの分析のために考慮した。以下の場合、ESTを、信頼できないと定義した。
(i)非スプライシング、
(ii)RNAによって対象とされないこと、
(iii)スプライシングESTによって対象とされないこと、および
(iv)長ポリAストレッチの近位のゲノムの末端部分または長ポリTストレッチの近位の開始部分(start)とのアラインメント。
Only reliable ESTs were considered for analysis of regions and segments. EST was defined as unreliable if:
(I) non-splicing,
(Ii) not targeted by RNA;
(Iii) not targeted by spliced ESTs, and (iv) alignment with the proximal end portion of the long poly A stretch or the proximal start of the long poly T stretch.

さらなるスコアリングのために信頼できる領域を選択した。以下の場合、固有の配列領域を、信頼できると見なした。
(i)ゲノムとのアラインメント、および
(ii)2EST超に支持される領域。
Trusted regions were selected for further scoring. Unique sequence regions were considered to be reliable if:
(I) alignment with the genome, and (ii) a region favored over 2 ESTs.

アルゴリズム
各固有の配列領域により、転写物組を以下の2つの群に分ける。
(i)この領域を含む転写物(TA群)
(ii)この領域を含まない転写物(TB群)
Algorithm The transcript set is divided into two groups according to each unique sequence region:
(I) Transcripts including this region (TA group)
(Ii) Transcripts not including this region (TB group)

各クラスターのESTクローン組を、以下の3つの群に分ける。
(i)群TAの転写物(に由来する)を支持するもの(S1)。
(ii)群TBの転写物を支持するもの(S2)。
(iii)両群由来の転写物を支持するもの(S3)。
The EST clone sets of each cluster are divided into the following three groups.
(I) those that support (derived from) transcripts of group TA (S1).
(Ii) those that support transcripts of group TB (S2).
(Iii) Supporting transcripts from both groups (S3).

上記のライブラリーおよびクローン数のスコアを、S1群に与えた。   The above library and clone number scores were given to the S1 group.

フィッシャーの正確確率検定のP値を使用して、S2と比較してS1が癌ESTクローンによって有意に富化するかどうか、およびクラスターバックグラウンド(S1+S2+S3)と比較して、S1が癌ESTクローンによって有意に富化するかどうかをチェックした。   Using the Fisher's exact test P value, whether S1 is significantly enriched by cancer EST clones compared to S2, and S1 compared to cluster background (S1 + S2 + S3) It was checked whether it enriched significantly.

したがって、固有の配列領域の同定および転写物群の分割を図2に示す。これらの各固有の配列領域は、「ノード」とも呼ばれるセグメントに対応する。   Thus, the identification of unique sequence regions and the segmentation of transcripts are shown in FIG. Each of these unique array regions correspond to segments, also called "nodes".

領域1:全転写物に共通であり、それにより、変異型が検出されたと見なさない;領域2:転写物1に特異的;領域3:転写物2および3に特異的、領域4:転写物3に特異的、領域5:転写物1および2に特異的、領域6:転写物1に特異的。   Region 1: common to all transcripts, so no mutations are considered to be detected; region 2: specific for transcript 1; region 3: specific for transcripts 2 and 3, region 4: transcript Specific for 3, region 5: specific for transcripts 1 and 2, region 6: specific for transcript 1.

実施例5:癌中で加除発現した遺伝子の癌特異的スプライスバリアントの同定
以下の遺伝子のEST支持(mRNAなし)領域の検索:
(i)公知の癌マーカー
(ii)公開されたマイクロアレイ実験において癌中で過剰発現することが示された遺伝子。
Example 5 Identification of Cancer-Specific Splice Variants of Genes Expressed Excise and Depression in Cancer Search for the EST Support (No mRNA) Region of the Following Genes:
(I) Known cancer markers (ii) Genes shown to be overexpressed in cancer in published microarray experiments.

信頼できるEST支持領域を、最低でも以下の1つによって支持されると定義した。
(i)3つのスプライシングEST、
(ii)2ライブラリー由来の2つのスプライシングEST、
(iii)2ライブラリー由来の10個の非スプライシングEST、または
(iv)3つのライブラリー。
A reliable EST support region was defined as supported by at least one of the following:
(I) Three splicing ESTs
(Ii) 2 spliced ESTs from 2 libraries,
(Iii) 10 non-splicing ESTs from 2 libraries, or (iv) 3 libraries.

実際のマーカーの例
以下の例は、特定の実際のマーカーの例に関する。
Actual Marker Examples The following examples relate to specific actual marker examples.

実験例の項
この項は、これらの配列ならびに例示的な制限されない方法、アッセイ、およびその使用の例を含む実験を記載する実施例に関する。全実験で実施した研究の基礎として使用したので、材料と実験手順を最初に説明する。
EXPERIMENTAL TERMS This section relates to the examples describing experiments including these sequences as well as exemplary non-limiting methods, assays, and examples of their use. Materials and experimental procedures are described first, as they were used as a basis for the studies carried out in all experiments.

本発明のマーカーを、種々の癌性および非癌性組織サンプルでのその発現に関して試験した。パネル中で使用したサンプルを、以下の表2に記載する。正常組織パネル中で使用したサンプルを、以下の表3に記載する。次いで、試験を、以下の「材料と実験手順」の項に記載のように行った。   The markers of the invention were tested for their expression in various cancerous and non-cancerous tissue samples. The samples used in the panel are described in Table 2 below. The samples used in the normal tissue panel are described in Table 3 below. The test was then conducted as described in the "Materials and Experimental Procedures" section below.

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

材料と実験手順
RNAの調製−RNAをClontech(Franklin Lakes,NJ USA 07417,www.clontech.com)、BioChain Inst.Inc.(Hayward,CA 94545 USA www.biochain.com)、ABS(Wilmington,DE 19801,USA,http://www.absbioreagents.com)、またはAmbion(Austin,TX 78744 USA,http://www.ambion.com)から得た。あるいは、RNAを、製造者の説明書にしたがって、TRI試薬(Molecular Research Center)を使用して、組織サンプルから生成した。組織およびRNAサンプルを、患者または死亡後に得た。総RNAサンプルを、DNアーゼI(Ambion)で処理し、RNeasyカラム(Qiagen)を使用して精製した。
Materials and Experimental Procedures Preparation of RNA-RNA was obtained from Clontech (Franklin Lakes, NJ USA 07417, www.clontech.com), BioChain Inst. Inc. (Hayward, CA 94545 USA www.biochain.com), ABS (Wilmington, DE 1980, USA, http://www.absbioreagents.com), or Ambion (Austin, TX 78744 USA, http: //www.ambion. com). Alternatively, RNA was generated from tissue samples using TRI reagent (Molecular Research Center) according to the manufacturer's instructions. Tissue and RNA samples were obtained after patient or death. Total RNA samples were treated with DNase I (Ambion) and purified using RNeasy columns (Qiagen).

RT−PCR−精製RNA(1μg)を、総体積が15.6μlで150ngのRandom Hexamerプライマー(Invitrogen)および500μM dNTPと混合した。混合物を、65℃で5分間インキュベートし、氷上で急速冷却した。その後、5μlの5×SuperscritpII第1鎖緩衝液(Invitrogen)、2.4μlの0.1M DTT、および40単位のRNasin(Promega)を添加し、混合物を、25℃で10分間インキュベートし、その後、42℃で2分間さらにインキュベートした。次いで、1μl(200単位)のSuperscritpII(Invitrogen)を添加し、反応物(最終体積は25μl)を、42℃で50分間インキュベートし、その後、70℃で15分間インキュベートした。得られたcDNAを、TE緩衝液(10mM Tris(pH=8)、1mM EDTA(pH=8))で20倍希釈した。   RT-PCR-purified RNA (1 μg) was mixed with 150 ng Random Hexamer primer (Invitrogen) and 500 μM dNTPs in a total volume of 15.6 μl. The mixture was incubated at 65 ° C. for 5 minutes and chilled on ice. Then 5 μl of 5 × Superscritp II first strand buffer (Invitrogen), 2.4 μl of 0.1 M DTT, and 40 units of RNasin (Promega) are added and the mixture is incubated for 10 minutes at 25 ° C., then Further incubation at 42 ° C. for 2 minutes. Then, 1 μl (200 units) of Superscritp II (Invitrogen) was added and the reaction (final volume 25 μl) was incubated for 50 minutes at 42 ° C. and then for 15 minutes at 70 ° C. The cDNA obtained was diluted 20 fold with TE buffer (10 mM Tris (pH = 8), 1 mM EDTA (pH = 8)).

実時間RT−PCR分析−上記のように調製したcDNA(5μl)を、特異的プライマーおよびUNG酵素(Eurogentech、ABI、またはRoche)を使用したSYBR Green Iアッセイ(PE Applied Biosystems)を使用して実時間PCR反応におけるテンプレートとして使用した。以下のように増幅を行なった:50℃で2分間、95℃で10分間、その後、95℃で15秒間を40サイクル、その後、60℃で1分間。PE Applied BiosystemsSDS7000の使用によって検出を行った。反応物が蛍光の閾値レベル(Ct)を達成したサイクルを記録し、これを使用して、RT反応中の相対転写量を計算した。相対量を、式:Q=効率^−Ctを使用して計算した。PCR反応効率を、いくつかの逆転写(RT)反応の連続希釈物の使用によって作成した検量線から計算した。RT反応の固有の相違を最小にするために、得られた相対量を、いくつかのハウスキーピング(HSKP)遺伝子の相対量の相乗平均に正規化した。定量的実時間PCR分析の概要のまとめを、図3に示す。示されるように、x軸は、サイクル数を示す。C=閾値サイクル点(増幅曲線が実験で設定した蛍光閾値を交差するサイクルである)。この点は、PCR産物のシグナルがバックグラウンドレベル(受動的色素ROX)を超えるが、以前として幾何/対数期にある計算したサイクル数である。(示されるように、一旦蛍光レベルが測定閾値を交差すると、幾何学的増大期となり、その間の測定は最も正確であり、その後、直線期(linear phase)およびプラトー期となる;定量的測定のために、後者の2つの期からは正確に測定されない)。y軸は、正規化レポーター蛍光を示す。この分析型は相対的定量を行うことに留意すべきである。 Real-time RT-PCR analysis-cDNA (5 μl) prepared as described above was prepared using SYBR Green I assay (PE Applied Biosystems) using specific primers and UNG enzyme (Eurogentech, ABI or Roche) Used as template in time PCR reaction. Amplification was performed as follows: 2 minutes at 50 ° C., 10 minutes at 95 ° C., then 40 cycles of 15 seconds at 95 ° C., then 1 minute at 60 ° C. Detection was performed by use of PE Applied Biosystems SDS7000. The cycle at which the reaction achieved the threshold level of fluorescence (Ct) was recorded and used to calculate the relative transcript level in the RT reaction. The relative amount was calculated using the formula: Q = efficiency ^ -Ct . PCR reaction efficiency was calculated from a standard curve generated by use of serial dilutions of several reverse transcription (RT) reactions. To minimize intrinsic differences in RT responses, the relative amounts obtained were normalized to the geometric mean of the relative amounts of several housekeeping (HSKP) genes. A summary of the quantitative real-time PCR analysis summary is shown in FIG. As shown, the x-axis indicates the number of cycles. C T = threshold cycle point (the cycle at which the amplification curve crosses the experimentally set fluorescence threshold). This point is the calculated number of cycles where the signal of the PCR product is above the background level (passive dye ROX) but still in the geometric / logarithmic phase. (As shown, once the fluorescence level crosses the measurement threshold, there is a geometric growth phase, the measurement between which is the most accurate, and then the linear phase and plateau phase; Because the latter two phases are not accurately measured). The y-axis shows normalized reporter fluorescence. It should be noted that this analysis type performs relative quantification.

試験パネル中の全実施例中で測定されたハウスキーピング遺伝子の配列は以下であった:
ユビキチン(GenBankアクセッション番号BC000449)
ユビキチン順方向プライマー(配列番号326):ATTTGGGTCGCGGTTCTTG
ユビキチン逆方向プライマー(配列番号327):TGCCTTGACATTCTCGATGGT
ユビキチン−アンプリコン(配列番号328)
ATTTGGGTCGCGGTTCTTGTTTGTGGATCGCTGTGATCGTCACTTGACAATGCAGATCTTCGTGAAGACTCTGACTGGTAAGACCATCACCCTCGAGG TTGAGCCCAGTGACACCATCGAGAATGTCAAGGCA

SDHA(GenBankアクセッション番号NM_004168)
SDHA順方向プライマー(配列番号329):TGGGAACAAGAGGGCATCTG
SDHA逆方向プライマー(配列番号330):CCACCACTGCATCAAATTCATG
SDHA−アンプリコン(配列番号331):TGGGAACAAGAGGGCATCTGCTAAAGTTTCAGATTCCATTTCTGCTCAGTATCCAGTAGTGGATCATGAATTTGATGCAGTGGTGG

PBGD(GenBankアクセッション番号BC019323),
PBGD順方向プライマー(配列番号332):TGAGAGTGATTCGCGTGGG
PBGD逆方向プライマー(配列番号333):CCAGGGTACGAGGCTTTCAAT
PBGD−アンプリコン(配列番号334):TGAGAGTGATTCGCGTGGGTACCCGCAAGAGCCAGCTTGCTCGCATACAGACGGACAGTGTGGTGGCAACATTGAAAGCCTCGTACCCTGG

HPRT1(GenBankアクセッション番号NM_000194),
HPRT1順方向プライマー(配列番号1295):TGACACTGGCAAAACAATGCA
HPRT1逆方向プライマー(配列番号1296):GGTCCTTTTCACCAGCAAGCT
HPRT1−アンプリコン(配列番号1297):TGACACTGGCAAAACAATGCAGACTTTGCTTTCCTTGGTCAGGCAGTATAATCCAAAGATGGTCAAGGTCGCAAGCTTGCTGGTGAAAAGGACC
The sequence of the housekeeping gene determined in all the examples in the test panel was:
Ubiquitin (GenBank Accession No. BC000449)
Ubiquitin forward primer (SEQ ID NO: 326): ATTTGGGTCGCGGTTCTTG
Ubiquitin reverse primer (SEQ ID NO: 327): TGCCTTGACATTCTCGATGGT
Ubiquitin-Amplicon (SEQ ID NO: 328)
ATTTGGGTCGCGGTTCTTGTTTGTGATCGTCTGTGATCGTC ACTTGACAATGCAGATCTTCGTGAGAGCTCTGACTGGTAAGACCATC ACCCTCGAGG TTGAGCCCAGTGACACACCGAGAATGTCAAGGCA

SDHA (GenBank accession number NM_004168)
SDHA forward primer (SEQ ID NO: 329): TGGGAACAAGAGGGCATCTG
SDHA reverse primer (SEQ ID NO: 330): CCACCACTGCATCAAATTCATG
SDHA-Amplicon (SEQ ID NO: 331): TGGGAACAAGAGGGCATCTGCTAAAGTTTCAGATTCCATTTCTGCTCGATCATCCAGTAGTGGATCATGAATTTGATGCAGTGGTGG

PBGD (GenBank accession number BC019323),
PBGD forward primer (SEQ ID NO: 332): TGAGAGTGATTCGCGTGGG
PBGD reverse primer (SEQ ID NO: 333): CCAGGGTACGAGGCTTTCAAT
PBGD-Amplicon (SEQ ID NO: 334): TGAGTGTGATTCGCGTGGGTACCCCGAAGACGAGCAGCTTGCTC GCATACAGACGGACAGTGTGGGCAACATTGAAAGCCTCGTACCCTGG

HPRT1 (GenBank accession number NM_000194),
HPRT1 forward primer (SEQ ID NO: 1295): TGACACTGGCAAAACAATGCA
HPRT1 reverse primer (SEQ ID NO: 1296): GGTCCTTTTCACCAGCAAGCT
HPRT1- amplicon (SEQ ID NO: 1297): TGACACTGGCAAACAATGCAGACTTTGCTTTCCTTGGTCAGGCAGTATAATCAAAGATGGTCAAGGTCGCAAGCTTGCTGATGAAAAGGACC

正常組織サンプルにおける全実施例中で測定されたハウスキーピング遺伝子の配列は以下であった:

RPL19(GenBankアクセッション番号NM_000981),
RPL19順方向プライマー(配列番号1298):TGGCAAGAAGAAGGTCTGGTTAG
RPL19逆方向プライマー(配列番号1420):TGATCAGCCCATCTTTGATGAG
RPL19 –アンプリコン(配列番号1630):TGGCAAGAAGAAGGTCTGGTTAGACCCCAATGAGACCAATGAAATCGCCAATGCCAACTCCCGTCAGCAGATCCGGAAGCTCATCAAAGATGGGCTGATCA
TATAボックス(GenBankアクセッション番号NM_003194),
TATAボックス順方向プライマー(配列番号1631):CGGTTTGCTGCGGTAATCAT
TATAボックス逆方向プライマー(配列番号1632):TTTCTTGCTGCCAGTCTGGAC
TATAボックス–アンプリコン(配列番号1633):CGGTTTGCTGCGGTAATCATGAGGATAAGAGAGCCACGAACCACGGCACTGATTTTCAGTTCTGGGAAAATGGTGTGCACAGGAGCCAAGAGTGAAGAACAGTCCAGACTGGCAGCAAGAAA
ユビキチン(GenBankアクセッション番号BC000449)
ユビキチン順方向プライマー(配列番号326):ATTTGGGTCGCGGTTCTTG
ユビキチン逆方向プライマー(配列番号327):TGCCTTGACATTCTCGATGGT
ユビキチン−アンプリコン(配列番号328)
ATTTGGGTCGCGGTTCTTGTTTGTGGATCGCTGTGATCGTCACTTGACAATGCAGATCTTCGTGAAGACTCTGACTGGTAAGACCATCACCCTCGAGG TTGAGCCCAGTGACACCATCGAGAATGTCAAGGCA
SDHA(GenBankアクセッション番号NM_004168)
SDHA順方向プライマー(配列番号329):TGGGAACAAGAGGGCATCTG
SDHA逆方向プライマー(配列番号330):CCACCACTGCATCAAATTCATG
SDHA−アンプリコン(配列番号331):TGGGAACAAGAGGGCATCTGCTAAAGTTTCAGATTCCATTTCTGCTCAGTATCCAGTAGTGGATCATGAATTTGATGCAGTGGTGG
The sequence of the housekeeping gene measured in all the examples in normal tissue samples was:

RPL 19 (GenBank accession number NM_000981),
RPL 19 forward primer (SEQ ID NO: 1298): TGGCAAGAAGAAGGTCTGGTTAG
RPL19 reverse primer (SEQ ID NO: 1420): TGATCAGCCCATCTTTGATGAG
RPL19 – amplicon (SEQ ID NO: 1630): TGGCAAGAAGAAGGTCTGGTTAGACCCCAATGAGACCAATGAAATGCCCAATGCAACTACTCCGTCAGCAGATCCGGAAGCTCATCAAAGATGGGCTGATCA
TATA box (GenBank accession number NM_003194),
TATA box forward primer (SEQ ID NO: 1631): CGGTTTGCTGCGGTAATCAT
TATA box reverse primer (SEQ ID NO: 1632): TTTCTTGCTGCCAGTCTGGAC
TATA box – amplicon (SEQ ID NO: 1633): CGGTTTGCTGCGGTAATCATGAGGATAAGAGAGCCACGAACACAGCGAC ACTGATTTTCAGTTC TGGGAAAATGGTGTGCACAGGAGCCAAGAGTGAAGAACAAGTCCAGACTGGCAAGCAAAAA
Ubiquitin (GenBank Accession No. BC000449)
Ubiquitin forward primer (SEQ ID NO: 326): ATTTGGGTCGCGGTTCTTG
Ubiquitin reverse primer (SEQ ID NO: 327): TGCCTTGACATTCTCGATGGT
Ubiquitin-Amplicon (SEQ ID NO: 328)
ATTTGGGTCGCGGTTCTTGTTTGTGATCGTCTGTGATCGTC ACTTGACAATGCAGATCTTCGTGAGAGCTCTGACTGGTAAGACCATC ACCCTCGAGG TTGAGCCCAGTGACACACCGAGAATGTCAAGGCA
SDHA (GenBank accession number NM_004168)
SDHA forward primer (SEQ ID NO: 329): TGGGAACAAGAGGGCATCTG
SDHA reverse primer (SEQ ID NO: 330): CCACCACTGCATCAAATTCATG
SDHA-Amplicon (SEQ ID NO: 331): TGGGAACAAGAGGGCATCTGCTAAAGTTTCAGATTCCATTTCTGCTCGATCATCCAGTAGTGGATCATGAATTTGATGCAGTGGTGG

オリゴヌクレオチドベースのマイクロアレイ実験プロトコール
マイクロアレイの構築
マイクロアレイ(チップ)を、BioRobotics Limited(Cambridge,UK)のMicroGrid II MGII 600ロボットを使用したピン沈着(deposition)によってプリントした。A.Shoshan et al,“Optical technologies and informatics”,Proceedings of SPIE.Vol 4266,pp.86−95(2001)に記載のように、50量体のオリゴヌクレオチド標的配列を、Compugen Ltd(Tel−Aviv,IL)によってデザインした。デザインしたオリゴヌクレオチドを合成し、Sigma−Genosysシステム(The Woodlands,TX,US)を使用した脱塩によって精製し、全てのオリゴヌクレオチドを、5’末端でC6アミノ修飾リンカーに連結するか、CodeLinkスライド(Cat #25−6700−01 Amersham Bioscience,Piscataway,NJ,US)に直接付着させる。標的配列を形成する50量体のオリゴヌクレオチドを、最初に、Ultra−pure DDW(Cat # 01−866−1A Kibbutz Beit−Haemek,Israel)中に50μMの濃度まで懸濁した。スライドへのプリント前に、オリゴヌクレオチドを、300mMリン酸ナトリウム(pH 8.5)に最終濃度150mMまで再懸濁し、相対湿度35〜40%、21℃でプリントした。
Oligonucleotide-Based Microarray Experiment Protocol Microarray Construction Microarrays (chips) were printed by pin deposition using a MicroGrid II MGII 600 robot from Bio Robotics Limited (Cambridge, UK). A. Shoshan et al, "Optical technologies and informatics", Proceedings of SPIE. Vol 4266, pp. A 50-mer oligonucleotide target sequence was designed by Compugen Ltd (Tel-Aviv, IL) as described in 86-95 (2001). The designed oligonucleotides are synthesized and purified by desalting using the Sigma-Genosys system (The Woodlands, TX, US), and all oligonucleotides are linked at the 5 'end to a C6 amino modified linker or CodeLink slide (Cat # 25-6700-01 Amersham Bioscience, Piscataway, NJ, US) directly attached. The 50-mer oligonucleotides forming the target sequence were first suspended in Ultra-pure DDW (Cat # 01-866-1A Kibbutz Beit-Haemek, Israel) to a concentration of 50 μM. Before printing on slides, the oligonucleotides were resuspended in 300 mM sodium phosphate (pH 8.5) to a final concentration of 150 mM and printed at 21-40C, 35-40% relative humidity.

各スライドは、32個のサブアレイ中に全部で9792個のフィーチャーを含んでいた。4224個のフィーチャーは、2つずつプリントされた本発明の目的の配列および負のコントロールであった。さらなる288このフィーチャー(3つずつプリントした96個の標的配列)は、Human Evaluation Library2,Compugen Ltd,Israelのハウスキーピング遺伝子を含んでいた。別の384個のフィーチャーは、Array Control product(Array control− sense oligo spots,Ambion Inc. Austin,TX.Cat#1781,Lot #112K06)で市販されている大腸菌遺伝子のオリゴである大腸菌スパイク1〜6である。   Each slide contained a total of 9792 features in 32 subarrays. The 4224 features were the target sequence and negative control of the present invention printed two by two. An additional 288 features (96 target sequences printed in triplicate) contained the housekeeping gene from Human Evaluation Library 2, Compugen Ltd, Israel. Another 384 features are E. coli spikes 1 to 6, which are oligos of E. coli genes that are commercially available at Array Control product (Array control-sense oligo spots, Ambion Inc. Austin, TX, Cat # 1781, Lot # 112 K06). It is.

プリントしたスライドのカップリング後プロセシング
ガラス(CodeLink)スライドへのオリゴヌクレオチドのスポッティング後、スライドを、密封NaCl湿室(相対湿度70〜75%)中で24時間インキュベートした。
Post-Coupling of the Printed Slides After spotting the oligonucleotides onto a processing glass (CodeLink) slide, the slides were incubated for 24 hours in a sealed NaCl humid chamber (70-75% relative humidity).

スライドを、残存反応基のブロッキングのために、スライドの50℃のブロッキング溶液(0.1M Tris、50mMエタノールアミン、0.1%SDSを含む10ml/スライドの緩衝液)中で15分間のインキュベーションによって処理した。次いで、スライドを、Ultra−pure DDW(2回蒸留水)で2回リンスした。次いで、スライドを、50℃の洗浄液(10ml/スライド、4×SSC、0.1%SDS)で30分間震盪器上で洗浄した。次いで、スライドを、Ultra−pure DDWで2回リンスし、800rpmで3分間の遠心分離によって乾燥させた。   Slides are incubated for 15 minutes in 50 ° C. blocking solution (0.1 M Tris, 50 mM ethanolamine, 10 ml buffer containing 0.1% SDS) for blocking the remaining reactive groups. It was processed. The slides were then rinsed twice with Ultra-pure DDW (double distilled water). The slides were then washed on a shaker for 30 minutes with a 50 ° C. wash (10 ml / slide, 4 × SSC, 0.1% SDS). The slides were then rinsed twice with Ultra-pure DDW and dried by centrifugation at 800 rpm for 3 minutes.

次に、ハイブリッド形成プロトコールの自動操作を補助するために、スライドを、VentanaDiscoveryハイブリッド形成ステーションバーコード接着剤で処理した。プリントしたスライドを、Bio−Optica(Milan,Italy)血液(hematology)染色デバイスにロードし、50mlの3−アミノプロピルトリエトキシシラン(Sigma A3648 lot #122K589)中で10分間インキュベートした。過剰な液体を乾燥させ、スライドを、20mm/Hgの暗所減圧デシケーター(Pelco 2251,Ted Pella,Inc.Redding CA)中で3時間インキュベートした。   The slides were then treated with VentanaDiscovery hybridization station barcode adhesive to aid in the automation of the hybridization protocol. The printed slides were loaded onto a Bio-Optica (Milan, Italy) hematology staining device and incubated in 50 ml of 3-aminopropyltriethoxysilane (Sigma A3648 lot # 122K589) for 10 minutes. Excess liquid was allowed to dry and slides were incubated for 3 hours in a 20 mm / Hg dark vacuum desiccator (Pelco 2251, Ted Pella, Inc. Redding CA).

マイクロアレイ実験を行うために、Ventana Discovery HybStation™でのミニ溶離カラムを使用するGenisphere 900−RP(ランダムプライマー)を使用した以下のプロトコールに従った。簡単に述べれば、デバイス自体が提供する説明書および情報に関して記載のようにプロトコールを行った。プロトコールは、cDNA合成および標識を含んでいた。cDNA濃度を、OliGreen ssDNA定量試薬およびキットとともに使用するTBS−380(Turner Biosystems.Sunnyvale,CA.)PicoFlourを使用して測定した。   In order to conduct microarray experiments, the following protocol was followed using Genisphere 900-RP (Random Primer) using mini-elution column on Ventana Discovery HybStation < Briefly, the protocol was performed as described for the instructions and information provided by the device itself. The protocol included cDNA synthesis and labeling. cDNA concentrations were measured using TBS-380 (Turner Biosystems. Sunnyvale, CA.) PicoFlour used with OliGreen ssDNA quantitation reagent and kit.

提供されたプロトコール(Discovery Hybridization Station Tuscon AZ)に従って、Ventanaハイブリッド形成デバイスを使用してハイブリッド形成を行った。   Hybridization was performed using a Ventana hybridization device according to the provided protocol (Discovery Hybridization Station Tuscon AZ).

次いで、スライドを、Axon Instruments Inc のGenePix 4000Bデュアルレーザースキャナを使用してスキャンし、GenePix Pro 5.0ソフトウェアによって分析した。   The slides were then scanned using Axon Instruments Inc's GenePix 4000B dual laser scanner and analyzed by GenePix Pro 5.0 software.

オリゴヌクレオチドベースのマイクロアレイ作製および実験の流れの概要のまとめを、図4および5に示す。   A summary of the oligonucleotide-based microarray fabrication and experimental flow summary is shown in FIGS. 4 and 5.

簡単に述べれば、図4に示すように、15μMのDNAオリゴヌクレオチドを、Amersham’CodeLink’ガラススライド上に沈着(プリント)し、十分に輪郭を示す「スポット」を作製した。これらのスライドを、調査疎水性ポリマー化学物質(chemistry)で被覆し、C6−アミン修飾を介してDNAオリゴヌクレオチドの5’末端に共有結合する活性な3次元表面を作製する。この結合により、全長DNAオリゴヌクレオチドをcDNAとのハイブリッド形成に利用可能であり、より低いバックグラウンド、高感度、および再現性も得られることを確実にする。   Briefly, as shown in FIG. 4, 15 μM DNA oligonucleotides were deposited (printed) on Amersham'CodeLink 'glass slides to create well-contoured “spots”. These slides are coated with a survey hydrophobic polymer chemistry to create an active three-dimensional surface covalently attached to the 5 'end of the DNA oligonucleotide via C6-amine modification. This conjugation ensures that full-length DNA oligonucleotides are available for hybridization with cDNA and that lower background, high sensitivity, and reproducibility are also obtained.

図5は、マイクロアレイ実験の実施方法を示す。左側および右側のステージを、任意選択的に、ステージ4(ハイブリッド形成)まで任意の順序(並行を含む)で行うことができることに留意すべきである。簡単に述べれば、左側では、標的オリゴヌクレオチドを顕微鏡用のガラススライド(任意選択的に他の材料を使用することができる)上にスポッティングしてスポッティングスライドを形成する(ステージ1)。右側では、コントロールサンプルRNAおよび癌サンプルRNAを、それぞれCy3およびCy5標識して(ステージ2)、標識プローブを形成する。コントロールおよび癌サンプルは、対応する組織に由来する(例えば、正常な前立腺組織および癌性前立腺組織)ことに留意すべきである。さらに、RNAが採取された組織を、以下の「チップ」(マイクロアレイ)からのオリゴヌクレオチドの過剰発現に関する特定のクラスターについてのデータの特定の例に示す(例えば、癌性前立腺組織および正常組織を上記のように試験したチップについては「前立腺」)。ステージ3では、プローブを混合する。ステージ4では、ハイブリッド形成を行って、プロセシングしたスライドを形成する。ステージ5では、スライドを洗浄し、スキャンして画像ファイルを作成し、その後、ステージ6でデータを分析した。   FIG. 5 shows how to perform a microarray experiment. It should be noted that the left and right stages can optionally be performed in any order (including parallel) up to stage 4 (hybridization). Briefly, on the left side, target oligonucleotides are spotted onto glass slides for microscopy (optionally other materials can be used) to form spotting slides (stage 1). On the right, control and cancer sample RNAs are Cy3 and Cy5 labeled (stage 2), respectively, to form labeled probes. It should be noted that control and cancer samples are derived from corresponding tissues (eg, normal prostate tissue and cancerous prostate tissue). In addition, the tissues from which the RNA was taken are shown below as specific examples of data for particular clusters for overexpression of oligonucleotides from the "chip" (microarray) (eg cancerous prostate tissue and normal tissue "Prostate" for tips tested as in At stage 3, the probes are mixed. At stage 4, hybridization is performed to form a processed slide. At stage 5, the slides were washed and scanned to create an image file, and then data was analyzed at stage 6.

以下のクラスターが、肺癌で過剰発現することが見出された。
W60282_PEA_1
F05068_PEA_1
H38804_PEA_1
HSENA78
T39971
(R00299)
H14624
Z41644_PEA_1
Z25299_PEA_2
HSSTROL3
HUMTREFAC_PEA_2
HSS100PCB
HSU33147_PEA_1
HUMCA1XIA
H61775
HUMGRP5E
HUMODCA
AA161187
R66178
D56406_PEA_1
M85491_PEA_1
Z21368_PEA_1
HUMCA1XIA
R20779
R38144_PEA_2
Z44808_PEA_1
HUMOSTRO_PEA_1_PEA_1
R11723_PEA_3
AI076020
T23580
M79217_PEA_1
M62096_PEA_1
M78076_PEA_1
T99080_PEA_4
T08446_PEA_1
R16276_PEA_1
The following clusters were found to be overexpressed in lung cancer.
W60282_PEA_1
F05068_PEA_1
H38804_PEA_1
HSENA 78
T39971
(R00299)
H14624
Z41644_PEA_1
Z25299_PEA_2
HSSTROL3
HUMTREFAC_PEA_2
HSS 100 PCB
HSU33147_PEA_1
HUMCA1 XIA
H61775
HUMGRP5E
HUMODCA
AA 161 187
R66178
D56406_PEA_1
M85491_PEA_1
Z21368_PEA_1
HUMCA1 XIA
R20779
R38144_PEA_2
Z44808_PEA_1
HUMOSTRO_PEA_1_PEA_1
R11723_PEA_3
AI076020
T23580
M79217_PEA_1
M62096_PEA_1
M78076_PEA_1
T99080_PEA_4
T08446_PEA_1
R16276_PEA_1

以下のクラスターが、肺小細胞癌で過剰発現することが見出された。

H61775
HUMGRP5E
M85491_PEA_1
Z44808_PEA_1
AA161187
R66178
HUMPHOSLIP_PEA_2

AI076020
T23580
M79217_PEA_1
M62096_PEA_1
M78076_PEA_1
T99080_PEA_4
T08446_PEA_1

The following clusters were found to be overexpressed in small cell lung cancer.

H61775
HUMGRP5E
M85491_PEA_1
Z44808_PEA_1
AA 161 187
R66178
HUMPHOSLIP_PEA_2

AI076020
T23580
M79217_PEA_1
M62096_PEA_1
M78076_PEA_1
T99080_PEA_4
T08446_PEA_1

以下のクラスターが、肺腺癌で過剰発現することが見出された。
R00299
M85491_PEA_1
Z21368_PEA_1
HUMCA1XIA
AA161187
R66178
T11628_PEA_1
The following clusters were found to be overexpressed in lung adenocarcinoma.
R00299
M85491_PEA_1
Z21368_PEA_1
HUMCA1 XIA
AA 161 187
R66178
T11628_PEA_1

以下のクラスターが、肺扁平上皮細胞で過剰発現することが見出された。
HUMODCA
R00299
D56406_PEA_1
Z44808_PEA_1
Z21368_PEA_1
HUMCA1XIA
AA161187
R66178
HUMCEA_PEA_1
R35137_PEA_1_PEA_1_PEA_1
The following clusters were found to be overexpressed in lung squamous cells.
HUMODCA
R00299
D56406_PEA_1
Z44808_PEA_1
Z21368_PEA_1
HUMCA1 XIA
AA 161 187
R66178
HUMCEA_PEA_1
R35137_PEA_1_PEA_1_PEA_1

クラスターH61775についての説明
クラスターH61775は、目的の2つの転写物および6つのセグメントを特徴とし、その名称を、それぞれ表4および5に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表6に示す。
Description of Cluster H61775 Cluster H61775 features 2 transcripts and 6 segments of interest, the names of which are shown in Tables 4 and 5 respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 6.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

クラスターH61775を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図6のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   Cluster H61775 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The terms "numbers" in the right column of the table and the numbers on the y-axis of FIG. 6 refer to the weighted expression of ESTs in each category as "ppm" (the ppm of ESTs of a particular cluster in this category by ppm Ratio of expression to expression of all ESTs).

概して、図6および表7中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):脳悪性脳腫瘍および異なる組織由来の悪性腫瘍の混合物。   In general, as shown for the histograms in FIG. 6 and Table 7, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: a mixture of brain malignant brain tumors and malignant tumors from different tissues.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、コンティグH61775は、上記の表3に示した2つの転写物を特徴とする。本発明の各変異タンパク質の説明を、ここに示す。   As mentioned above, Contig H61775 features the two transcripts shown in Table 3 above. A description of each mutein of the present invention is given here.

本発明の変異タンパク質H61775_P16は、出願書類の最後に示すアミノ酸配列を有し、転写物H61775_T21によってコードされる。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein H61775_P16 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript H61775_T21. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

H61775_P16とQ9P2J2(配列番号1694)との比較の報告
1.Q9P2J2のアミノ酸11〜93に対応し、H61775_P16のアミノ酸1〜83にも対応するMVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRPPLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVGと少なくとも90%相同な第1のアミノ酸配列と、H61775_P16のアミノ酸84〜152に対応する配列DCGFPAFRELKRAETVSPVFFTRRCIWEDLKSTGFSPAGGGRPPGGGPRTQEDSGLPCWRSSCSVTLQVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、H61775_P16をコードする単離キメラポリペプチド。
Report of comparison of H61775_P16 and Q9P2J2 (SEQ ID NO: 1694). Corresponding to the amino acids 11 to 93 of Q9P2J2 and to the amino acids 1 to 83 of H61775_P16, corresponding to the 1st amino acid sequence of H61775_P16, and to the UT At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous Of and a amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, the isolated chimeric polypeptide coding H61775_P16.

2.H61775_P16中の配列DCGFPAFRELKRAETVSPVFFTRRCIWEDLKSTGFSPAGGGRPPGGGPRTQEDSGLPCWRSSCSVTLQVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、H61775_P16のテールをコードする単離ポリペプチド。   2. H61775_P16 comprising a sequence of at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence An isolated polypeptide encoding a tail.

H61775_P16とAAQ88495(配列番号1695)との比較の報告
1.AAQ88495のアミノ酸1〜83に対応し、H61775_P16のアミノ酸1〜83にも対応するMVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRPPLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVGと少なくとも90%相同な第1のアミノ酸配列と、H61775_P16のアミノ酸84〜152に対応する配列DCGFPAFRELKRAETVSPVFFTRRCIWEDLKSTGFSPAGGGRPPGGGPRTQEDSGLPCWRSSCSVTLQVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、H61775_P16をコードする単離キメラポリペプチド。
Report on comparison of H61775_P16 with AAQ88495 (SEQ ID NO: 1695) A corresponding amino acid 1 to 83 of AAQ 88495 and a corresponding amino acid 1 to 83 of H61775_P16 are also used as the first amino acid sequence of H61775_P16 and the corresponding amino acid 84 to 15 At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous And a second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, the isolated chimeric polypeptide coding H61775_P16.

2.H61775_P16中の配列DCGFPAFRELKRAETVSPVFFTRRCIWEDLKSTGFSPAGGGRPPGGGPRTQEDSGLPCWRSSCSVTLQVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、H61775_P16のテールをコードする単離ポリペプチド。   2. H61775_P16 comprising a sequence of at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The mutein is considered to be positioned as follows with respect to secretory cells. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質H61775_P16はまた、表9に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H61775_P16配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein H61775_P16 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing the other amino acids, and listing the other amino acids, as shown in Table 9; It indicates whether it is known and the presence of a known SNP in the mutein H61775_P16 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質H61775_P16は、以下の転写物によってコードされる:H61775_T21(配列は出願書類の最後に示す)。転写物H61775_T21のコード部分を太字で示し、このコード部分は261位から開始され、716位で終結する。転写物はまた、表10に列挙した以下のSNPを有する(ヌクレオチド酸配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H61775_P16配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein H61775_P16 is encoded by the following transcript: H61775_T21 (sequences shown at the end of the application). The coding portion of the transcript H61775_T21 is shown in bold, starting from position 261 and ending at position 716. The transcript also has the following SNPs listed in Table 10 (showing its position on the nucleotide acid sequence, listing another nucleic acid, the last column indicating whether the SNP is known, a mutein The presence of a known SNP in the H61775_P16 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質H61775_P17は、出願書類の最後に示すアミノ酸配列を有し、転写物H61775_T22によってコードされる。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein H61775_P17 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript H61775_T22. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

H61775_P17とQ9P2J2との比較の報告
1.Q9P2J2のアミノ酸11〜93に対応し、H61775_P17のアミノ酸1〜83にも対応するMVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRPPLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVGと少なくとも90%相同な第1のアミノ酸配列を含む、H61775_P17をコードする単離キメラポリペプチド。
Report of comparison between H61775_P17 and Q9P2J2 An isolated chimeric polypeptide encoding H61775_P17 comprising the first amino acid sequence which is at least 90% homologous to MVWCLGLAVLSLVISSQGADGRGKPEV VSV VGRAGE SV VL GC DLL PHA GRP PLH VIEW LR FGFL LPI FIF IQ FG PRISP I, corresponding to amino acids 11 to 93 of Q9 P2 J2.

H61775_P17とAAQ88495との比較の報告
1.AAQ88495のアミノ酸1〜83に対応し、H61775_P17のアミノ酸1〜83にも対応するMVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRPPLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVGと少なくとも90%相同な第1のアミノ酸配列を含む、H61775_P17をコードする単離キメラポリペプチド。
Report of comparison between H61775_P17 and AAQ88495 1. An isolated chimeric polypeptide encoding H61775_P17 comprising the first amino acid sequence which is at least 90% homologous to MVWCLGLAVLSLVISSQGADGRGKPEV VSV VGRAGE SV VLGCDLLPPA GRPPLHVIEW LRGFGLIPIF IQFGLYSPRIDVY corresponding to amino acids 1 to 83 of AAQ 88495 and corresponding to H61775 P17 amino acids 1 to 83.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The mutein is considered to be positioned as follows with respect to secretory cells. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質H61775_P17はまた、表11に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H61775_P17配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein H61775_P17 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing the other amino acids, and listing the other amino acids, as shown in Table 11 It indicates whether it is known and the presence of a known SNP in the mutein H61775_P17 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質H61775_P17は、以下の転写物によってコードされる:H61775_T22(配列は出願書類の最後に示す)。転写物H61775_T22のコード部分を太字で示し、このコード部分は261位から開始され、509位で終結する。転写物はまた、表12に列挙した以下のSNPを有する(ヌクレオチド酸配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H61775_P17配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein H61775_P17 is encoded by the following transcript: H61775_T22 (sequences shown at the end of the application). The coding portion of the transcript H61775_T22 is shown in bold, starting from position 261 and ending at position 509. The transcript also has the following SNPs listed in Table 12 (showing its position on the nucleotide acid sequence, listing another nucleic acid, the last column shows if the SNP is known, the mutein The presence of known SNPs in the H61775_P17 sequence supports the deduced sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターH61775は、上の表4に列挙した6つのセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster H61775 features the six segments listed in Table 4 above, the sequences of which are shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターH61775_node_2は、17個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H61775_T21およびH61775_T22。以下の表13は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H61775_node_2 of the present invention is supported by 17 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H61775_T21 and H61775_T22. Table 13 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH61775_node_4は、20個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H61775_T21およびH61775_T22。以下の表14は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H61775_node_4 of the present invention is supported by 20 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H61775_T21 and H61775_T22. Table 14 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH61775_node_6は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H61775_T22。以下の表15は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

Figure 2008507261
The segment cluster H61775_node_6 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: H61775_T22. Table 15 below describes the start and end positions of this segment on each transcript.
Figure 2008507261

本発明のセグメントクラスターH61775_node_8は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H61775_T21。以下の表16は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H61775_node_8 of the present invention is supported by five libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H61775_T21. Table 16 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターH61775_node_0は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H61775_T21およびH61775_T22。以下の表17は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H61775_node_0 of the present invention is supported by four libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H61775_T21 and H61775_T22. Table 17 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH61775_node_5を、以下の転写物中に見出すことができる:H61775_T22。以下の表18は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H61775_node_5 of the invention can be found in the following transcript: H61775_T22. Table 18 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、この遺伝子のマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表19に示す)。   Microarray (chip) data of this gene is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (for lung cancer) (shown in Table 19).

Figure 2008507261
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/Psw0RJLCti/aLAXQjXh07:Q9P2J2

Sequence documentation:

Alignment of: H61775_P16 x Q9P2J2 ..

Alignment segment 1/1:

Quality: 803.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
11 MVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRP 60
. . .
51 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 83
|||||||||||||||||||||||||||||||||
61 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 93






Sequence name: /tmp/Psw0RJLCti/aLAXQjXh07:AAQ88495

Sequence documentation:

Alignment of: H61775_P16 x AAQ88495 ..

Alignment segment 1/1:

Quality: 803.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRP 50
. . .
51 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 83
|||||||||||||||||||||||||||||||||
51 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 83






Sequence name: /tmp/naab8yR3GC/pSM4l2IL5o:Q9P2J2

Sequence documentation:

Alignment of: H61775_P17 x Q9P2J2 ..

Alignment segment 1/1:

Quality: 803.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
11 MVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRP 60
. . .
51 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 83
|||||||||||||||||||||||||||||||||
61 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 93






Sequence name: /tmp/naab8yR3GC/pSM4l2IL5o:AAQ88495

Sequence documentation:

Alignment of: H61775_P17 x AAQ88495 ..

Alignment segment 1/1:

Quality: 803.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRP 50
. . .
51 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 83
|||||||||||||||||||||||||||||||||
51 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 83

Mutated protein alignment against previously known proteins:
Sequence name: / tmp / Psw0RJLCti / aLAXQjXh07: Q9P2J2

Sequence documentation:

Alignment of: H61775_P16 x Q9P2J2 ..

Alignment segment 1/1:

Quality: 803.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MVWCLGLLSLVISSQGADGRGKPEV VSV VGRAGESVVLGCDLLPPAGRP 50
||||||||||||||||||||||||||||||||||||||||
11 MVWCLLAVLSLVISQGADGRGPPEV VSV VGRAGESVVLGCDLLPPAGRP 60
....
51 PLHVIEWLRFGFLLPIFIFFGLYSPRIDPDYVG 83
||||||||||||||||||||||||||||||
61 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 93






Sequence name: / tmp / Psw0RJLCti / aLAXQjXh07: AAQ88495

Sequence documentation:

Alignment of: H61775_P16 x AAQ88495 ..

Alignment segment 1/1:

Quality: 803.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MVWCLGLLSLVISSQGADGRGKPEV VSV VGRAGESVVLGCDLLPPAGRP 50
||||||||||||||||||||||||||||||||||||||||
1 MVWCLGLLSLVISSQGADGRGKPEV VSV VGRAGESVVLGCDLLPPAGRP 50
....
51 PLHVIEWLRFGFLLPIFIFFGLYSPRIDPDYVG 83
||||||||||||||||||||||||||||||
51 PLHVIEWLRFGFLLPIFIFFGLYSPRIDPDYVG 83






Sequence name: / tmp / naab8yR3GC / pSM4l2IL5o: Q9P2J2

Sequence documentation:

Alignment of: H61775_P17 x Q9P2J2 ..

Alignment segment 1/1:

Quality: 803.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MVWCLGLLSLVISSQGADGRGKPEV VSV VGRAGESVVLGCDLLPPAGRP 50
||||||||||||||||||||||||||||||||||||||||
11 MVWCLLAVLSLVISQGADGRGPPEV VSV VGRAGESVVLGCDLLPPAGRP 60
....
51 PLHVIEWLRFGFLLPIFIFFGLYSPRIDPDYVG 83
||||||||||||||||||||||||||||||
61 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 93






Sequence name: / tmp / naab8yR3GC / pSM4l2IL5o: AAQ88495

Sequence documentation:

Alignment of: H61775_P17 x AAQ88495 ..

Alignment segment 1/1:

Quality: 803.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MVWCLGLLSLVISSQGADGRGKPEV VSV VGRAGESVVLGCDLLPPAGRP 50
||||||||||||||||||||||||||||||||||||||||
1 MVWCLGLLSLVISSQGADGRGKPEV VSV VGRAGESVVLGCDLLPPAGRP 50
....
51 PLHVIEWLRFGFLLPIFIFFGLYSPRIDPDYVG 83
||||||||||||||||||||||||||||||
51 PLHVIEWLRFGFLLPIFIFFGLYSPRIDPDYVG 83

正常および癌性肺組織における配列名H61775seg8中に示すアンプリコンによって検出可能な免疫グロブリンスーパーファミリーメンバー9のH61775転写物の発現
seg8、H61775seg8アンプリコン(配列番号1636)、およびH61775seg8F2(配列番号1634)、およびH61775seg8R2(配列番号1635)プライマーによって検出可能な免疫グロブリンスーパーファミリーメンバー9の転写物を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子–PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン(配列番号334)、プライマーの配列番号332および333)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン– HPRT1−アンプリコン(配列番号1297)、プライマーの配列番号1295および1296)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン– ユビキチン−アンプリコン(配列番号328)、プライマーの配列番号326および327)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン– SDHA−アンプリコン(配列番号331)、プライマーの配列番号329および330)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
Expression of H61775 transcript of immunoglobulin superfamily member 9 detectable by an amplicon as shown in sequence name H61775seg8 in normal and cancerous lung tissue seg8, H61775 seg8 amplicon (SEQ ID NO: 1636), and H61775 seg8 F2 (SEQ ID NO: 1634) And transcripts of immunoglobulin superfamily member 9 detectable by H61775seg8R2 (SEQ ID NO: 1635) primers were measured by real-time PCR. In parallel, four housekeeping genes – PBGD (GenBank accession number BC019232, amplicon – PBGD-amplicon (SEQ ID NO: 334), primers SEQ ID NO: 332 and 333), HPRT1 (GenBank accession) Session No. NM — 000194, Amplicon – HPRT 1-Amplicon (SEQ ID NO: 1297), Primers SEQ ID Nos. 1295 and 1296), Ubiquitin (GenBank Accession No. BC000449, Amplicon – Ubiquitin-Amplicon (SEQ ID No) 328), SEQ ID NO: 326 and 327) of the primers, and SDHA (GenBank Accession No. NM_004168, amplicon – SDHA-Amplicon (SEQ ID NO: 331) Was measured similarly primers SEQ ID NO: 329 and 330). For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. The normalized volume of each RT sample is the median volume of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99, Table 2, "tissue samples in the test panel") Divided to obtain the magnification of upregulation of each sample relative to the median of normal PM samples.

図7は、正常サンプルと比較した癌性肺サンプルにおける上記免疫グロブリンスーパーファミリーメンバー9の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも5倍の過剰発現を示すサンプルの数および比率を、下に示す。   FIG. 7 is a histogram showing over expression of the above immunoglobulin superfamily member 9 in cancerous lung samples compared to normal samples. The numbers and proportions of samples showing at least 5 times overexpression of the total number of samples tested are shown below.

図7から明らかなように、癌サンプル中の上記アンプリコンによって検出可能な免疫グロブリンスーパーファミリーメンバー9転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、15個の腺癌サンプルのうち11個、16個の扁平上皮細胞癌サンプルのうち12個、4個の大細胞癌サンプルのうち1個、8個の小細胞癌サンプルのうち8個で少なくとも5倍の過剰発現が見出された。   As apparent from FIG. 7, the expression of immunoglobulin superfamily member 9 transcripts detectable by the above amplicon in a cancer sample is a non-cancerous sample (sample numbers 47-50, 90-93, 96-99, It was significantly higher than Table 2, "Tissue samples in test panel". Obviously, 11 out of 15 adenocarcinoma samples, 12 out of 16 squamous cell carcinoma samples, 1 out of 4 large cell carcinoma samples, 8 out of 8 small cell carcinoma samples Over expression of at least 5 fold was found.

下記のように、これらの結果の有意性を検証するために、統計分析を適用した。   Statistical analysis was applied to verify the significance of these results as described below.

肺癌サンプル対正常組織サンプルにおける上記アンプリコンによって検出可能な免疫グロブリンスーパーファミリーメンバー9転写物の発現レベルの相違についてのP値を、T検定によって6.5E−02と決定された。腺癌では、最小値は、扁平上皮細胞癌で7.62E−03であり、小細胞癌で1.5E−03であった。   The P value for the difference in expression levels of immunoglobulin superfamily member 9 transcripts detectable by the amplicon in lung cancer samples versus normal tissue samples was determined by T-test to be 6.5E-02. For adenocarcinoma, the minimum was 7.62 E-03 for squamous cell carcinoma and 1.5 E-03 for small cell carcinoma.

5倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、P値は、腺癌で9.62E−04、扁平上皮細胞癌で5.9E−04であり、10倍過剰発現の閾値は、小細胞癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は7.14E−05であった。上記値は、結果が統計的に有意であることを示す。   The 5-fold overexpression threshold was found to be different between cancer and normal samples, P value is 9.62E-04 for adenocarcinoma, 5.9E-04 for squamous cell carcinoma, 10 The threshold for fold overexpression was found to differ between small cell carcinoma and normal samples, checked by Fisher's exact test, and the P value was 7.14E-05. The above values indicate that the results are statistically significant.

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:H61775seg8F2順方向プライマーおよびH61775seg8R2逆方向プライマー。   Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used only as non-limiting examples of suitable primer pairs: H61775seg8F2 forward primer and H61775seg8R2 reverse Direction primer.

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:H61775seg8。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : H61775seg8.

H61775seg8F2(配列番号1634)
GAAGGCTCTTGTCACTTACTAGCCAT
H61775seg8R2(配列番号1635)
TGTCACCATATTTAATCCTCCCAA
H61775seg8(配列番号1636)
GAAGGCTCTTGTCACTTACTAGCCATGTGATTTTGGAAAGAAACTTAACATTAATTCCTTCAGCTACAATGGAATTCTTGGGAGGATTAAATATGGTGACA
H61775 seg 8 F 2 (SEQ ID NO: 1634)
GAAGGCTCTTGTCACTTACTAGCCAT
H61775seg8R2 (SEQ ID NO: 1635)
TGTCACCATATTTAATCCTCCCAA
H61775 seg 8 (SEQ ID NO: 1636)
GAAGGCTCTTGTCACTTACTAGCCATGTGTATTATGAGTAGAAACTTAACTAATTAATTCAATTCAGCTACAATGGAATTCTTGGGAGGATTAATATATGGTGACA

異なる正常組織における配列名H61775seg8中に示すアンプリコンによって検出可能な免疫グロブリンスーパーファミリーメンバー9のH61775転写物の発現
H61775seg8アンプリコン(配列番号1636)、H61775 seg8F2(配列番号1634)、およびH61775seg8R2(配列番号1635)によって検出可能な免疫グロブリンスーパーファミリーメンバー9の転写物を、実時間PCRによって測定した。並行して4つのハウスキーピング遺伝子−RPL19(GenBankアクセッション番号NM_000981、RPL19 アンプリコン(配列番号1630))、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン(配列番号1633))、ユビキチン(GenBankアクセッション番号BC000449;アンプリコン–ユビキチン−アンプリコン(配列番号328))、およびSDHA(GenBankアクセッション番号NM_004168;アンプリコン–SDHA−アンプリコン(配列番号331))を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、卵巣サンプル(サンプル番号18〜20、表4、「正常パネル中の組織サンプル」)の量の中央値で割って、卵巣サンプルに対する各サンプルの相対発現値を得た。
Expression of the H61775 Transcript of Immunoglobulin Superfamily Member 9 Detectable by the Amplicon Shown in the Sequence Name H61775seg8 in Different Normal Tissues H61775seg8 amplicon (SEQ ID NO: 1636), H61775 seg8F2 (SEQ ID NO: 1634), and H61775seg8R2 (SEQ ID NO: 1 Transcripts of immunoglobulin superfamily member 9 detectable by 1635) were measured by real-time PCR. In parallel, four housekeeping genes-RPL19 (GenBank Accession No. NM_000981, RPL19 amplicon (SEQ ID No. 1630)), TATA box (GenBank Accession No. NM_003194, TATA amplicon (SEQ ID No. 1633)), ubiquitin (GenBank Access No. Session number BC000449; amplicon – ubiquitin amplicon (SEQ ID NO: 328), and SDHA (GenBank accession number NM_004168; amplicon – SDHA amplicon (SEQ ID NO: 331)) similarly measured did. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. The normalized amount of each RT sample is divided by the median of the amount of ovary samples (Sample Nos. 18-20, Table 4, "Tissue samples in normal panel") to obtain relative expression values of each sample relative to ovary samples Obtained.

H61775seg8F2(配列番号1634)
GAAGGCTCTTGTCACTTACTAGCCAT
H61775seg8R2(配列番号1635)
TGTCACCATATTTAATCCTCCCAA
H61775seg8(配列番号1636)
GAAGGCTCTTGTCACTTACTAGCCATGTGATTTTGGAAAGAAACTTAACATTAATTCCTTCAGCTACAATGGAATTCTTGGGAGGATTAAATATGGTGACA
H61775 seg 8 F 2 (SEQ ID NO: 1634)
GAAGGCTCTTGTCACTTACTAGCCAT
H61775seg8R2 (SEQ ID NO: 1635)
TGTCACCATATTTAATCCTCCCAA
H61775 seg 8 (SEQ ID NO: 1636)
GAAGGCTCTTGTCACTTACTAGCCATGTGTATTATGAGTAGAAACTTAACTAATTAATTCAATTCAGCTACAATGGAATTCTTGGGAGGATTAATATATGGTGACA

結果を図8に示し、これは、異なる正常組織における配列名H61775seg8中に示すアンプリコンによって検出可能な免疫グロブリンスーパーファミリーメンバー9のH61775転写物の発現を示す。   The results are shown in FIG. 8, which shows the expression of the H61775 transcript of immunoglobulin superfamily member 9 detectable by the amplicon shown in the sequence name H61775seg8 in different normal tissues.

クラスターM85491の説明
クラスターM85491は、目的の2つの転写物および11個のセグメントを特徴とし、その名称を、それぞれ表20および21に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表22に示す。
Description of Cluster M85491 Cluster M85491 features 2 transcripts of interest and 11 segments, the names of which are shown in Tables 20 and 21 respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 22.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質EphrinB型受容体2(前駆体)(SwissProtアクセッション識別子EPB2_HUMAN、同義語EC 2.7.1.112、チロシン−タンパク質キナーゼ受容体EPH−3、DRT、受容体タンパク質−チロシンキナーゼHEK5、ERKとしても公知である)(配列番号1417)の変異型である。   These sequences are known from the known protein Ephrin type B receptor 2 (precursor), previously referred to herein as protein (SwissProt accession identifier EPB2_HUMAN, synonym EC 2.7.1.112, tyrosine-protein) A variant of the kinase receptor EPH-3, DRT, receptor protein-tyrosine kinase HEK5, also known as ERK) (SEQ ID NO: 1417).

タンパク質EphrinB型受容体2(前駆体)は、以下の機能を有することが公知であるか、そのように見なされている:ephrin−Bファミリーメンバーの受容体。タンパク質EphrinB型受容体2(前駆体)の配列を、「タンパク質EphrinB型受容体2(前駆体)アミノ酸配列」(配列番号1417)として出願書類の最後に示す。この配列の公知の多型を、表23に示す。   The protein Ephrin type B receptor 2 (precursor) is known or is considered to have the following functions: receptor of the ephrin-B family member. The sequence of the protein Ephrin type B receptor 2 (precursor) is shown at the end of the application as "protein Ephrin type B receptor 2 (precursor) amino acid sequence" (SEQ ID NO: 1417). Known polymorphisms of this sequence are shown in Table 23.

Figure 2008507261
Figure 2008507261

局在化したタンパク質EphrinB型受容体2(前駆体)は、I型膜タンパク質と考えられる。   The localized protein Ephrin type B receptor 2 (precursor) is considered to be a type I membrane protein.

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けであるタンパク質アミノ酸リン酸化、膜貫通受容体タンパク質チロシンキナーゼシグナル伝達経路、ニューロン新生、分子機能に関連する注釈付けであるタンパク質チロシンキナーゼ、受容体、膜貫通エフリン受容体、ATP結合、トランスフェラーゼ、および細胞成分に関連する注釈付けである内在性膜タンパク質。   The following GO annotation applies to previously known proteins. The following annotations have been found: protein amino acid phosphorylation which is an annotation related to biological processes, transmembrane receptor protein tyrosine kinase signaling pathway, a protein which is an annotation related to neurogenesis, molecular function Endogenous membrane proteins that are annotations related to tyrosine kinases, receptors, transmembrane ephrin receptors, ATP binding, transferases, and cellular components.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

クラスターM85491を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図9のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   Cluster M85491 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The terms "numbers" in the right column of the table and the numbers on the y-axis of FIG. 9 refer to the weighted expression of ESTs in each category as "ppm" (the ppm of ESTs of a particular cluster in this category by ppm Ratio of expression to expression of all ESTs).

概して、図9および表24中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):上皮悪性脳腫瘍および異なる組織由来の悪性腫瘍の混合物。   In general, as shown for the histograms in FIG. 9 and Table 24, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: a mixture of epithelial malignant brain tumors and malignant tumors from different tissues.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、クラスターM85491は、上の表20に列挙した2つの転写物を特徴とする。これらの転写物は、タンパク質EphrinB型受容体2(前駆体)の変異型であるタンパク質をコードする。本発明の各変異型の説明をここに記載する。   As mentioned above, cluster M85491 is characterized by the two transcripts listed in Table 20 above. These transcripts encode proteins which are variants of the protein Ephrin type B receptor 2 (precursor). A description of each variant of the invention is provided herein.

本発明の変異タンパク質M85491_PEA_1_P13は、出願書類の最後に示すアミノ酸配列を有し、転写物M85491_PEA_1_T16によってコードされる。公知のタンパク質(EphrinB型受容体2(前駆体))に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein M85491_PEA_1_P13 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript M85491_PEA_1_T16. An alignment to a known protein (Ephrin type B receptor 2 (precursor)) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

M85491_PEA_1_P13とEPB2_HUMANとの間の比較の報告
1.EPB2_HUMANのアミノ酸1〜476に対応し、M85491_PEA_1_P13のアミノ酸1〜476にも対応するMALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYDENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSIPSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQVDLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRIIQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVPIGRCMCKAGFEAVENGTVCRGCPSGTFKANQGDEACTHCPINSRTTSEGATNCVCRNGYYRADLDPLDMPCTTIPSAPQAVISSVNETSLMLEWTPPRDSGGREDLVYNIICKSCGSGRGACTRCGDNVQYAPRQLGLTEPRIYISDLLAHTQYTFEIQAVNGVTDQSPFSPQFASVNITTNQAAPSAVSIMHQVSRTVDSITLSWSQPDQPNGVILDYELQYYEKと少なくとも90%相同な第1のアミノ酸配列と、M85491_PEA_1_P13のアミノ酸477〜496に対応する配列VPIGWVLSPSPTSLRAPLPGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、M85491_PEA_1_P13をコードする単離キメラポリペプチド。
Report on comparison between M85491_PEA_1_P13 and EPB2_HUMAN 1. Corresponding to amino acids 1 to 476 of EPB2_HUMAN, corresponding to amino acids 1 to 476 of M85491_PEA_1_P13 MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYDENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSIPSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQVDLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRIIQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVPIGRCMCKAGFEAVENGTVCRGCPSGT A first amino acid sequence at least 90% homologous to KeieienukyujidiieishitieichishiPiaienuesuarutitiesuijieitienushibuishiaruenujiwaiwaiarueidierudiPierudiemuPishititiaiPiesueiPikyueibuiaiesuesubuienuitiesueruemueruidaburyutiPiPiarudiesujijiaruidierubuiwaienuaiaishikeiesushijiesujiarujieishitiarushijidienubuikyuwaieiPiarukyuerujierutiiPiaruaiwaiaiesudieruerueieichitikyuwaitiefuiaikyueibuienujibuitidikyuesuPiefuesuPikyuefueiesubuienuaititienukyueieiPiesueibuiesuaiemueichikyubuiesuarutibuidiesuITLSWSQPDQPNGVILDYELQYYEK, polypeptide at least 70% with a sequence corresponding to VPIGWVLSPSPTSLRAPLPG to amino acid 477-496 of M85491_PEA_1_P13, optionally at least 80%, preferably at least 85%, more Preferably An isolated chimeric poly encoding M85491_PEA_1_P13, comprising a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first and second amino acid sequences being in a contiguous and sequential order peptide.

2.M85491_PEA_1_P13中の配列VPIGWVLSPSPTSLRAPLPGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M85491_PEA_1_P13のテールをコードする単離ポリペプチド。   2. M85491_PEA_1_P13 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence VPIGWVLSPSPTSLRAPLPG in M85491_PEA_1_P13 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The mutein is considered to be positioned as follows with respect to secretory cells. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質M85491_PEA_1_P13は、以下の転写物によってコードされる:M85491_PEA_1_T16(配列は出願書類の最後に示す)。転写物M85491_PEA_1_T16のコード部分を太字で示し、このコード部分は143位から開始され、1630位で終結する。転写物はまた、表26に列挙した以下のSNPを有する(ヌクレオチド酸配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M85491_PEA_1_P13配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M85491_PEA_1_P13 is encoded by the following transcript: M85491_PEA_1_T16 (sequences shown at the end of the application). The code portion of transcript M85491_PEA_1_T16 is shown in bold, this code portion starting at position 143 and ending at position 1630. The transcript also has the following SNPs listed in Table 26 (showing its position on the nucleotide acid sequence, listing another nucleic acid, and the last column indicating if the SNP is known, a mutein The presence of known SNPs in the M85491_PEA_1_P13 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質M85491_PEA_1_P14は、出願書類の最後に示すアミノ酸配列を有し、転写物M85491_PEA_1_T20によってコードされる。公知のタンパク質(EphrinB型受容体2(前駆体))に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein M85491_PEA_1_P14 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript M85491_PEA_1_T20. An alignment to a known protein (Ephrin type B receptor 2 (precursor)) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

M85491_PEA_1_P14とEPB2_HUMANとの間の比較の報告
1.EPB2_HUMANのアミノ酸1〜270に対応し、M85491_PEA_1_P14のアミノ酸1〜270にも対応するMALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYDENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSIPSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQVDLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRIIQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVPIGRCMCKAGFEAVENGTVCRと少なくとも90%相同な第1のアミノ酸配列と、M85491_PEA_1_P14のアミノ酸271〜301に対応する配列ERQDLTMLSRLVLNSWPQMILPPQPPKVLELを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、M85491_PEA_1_P14をコードする単離キメラポリペプチド。
Report on comparison between M85491_PEA_1_P14 and EPB2_HUMAN 1. Corresponding to amino acids 1 to 270 of EPB2_HUMAN, at least the corresponding MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYDENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSIPSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQVDLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRIIQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVPIGRCMCKAGFEAVENGTVCR to amino acid 1 to 270 of M85491_PEA_1_P14 A polypeptide having a first amino acid sequence of 0% homology and the sequence ERQDLTMLSRLVLSNSWPQMILPPPQPPKVLEL corresponding to amino acids 271 to 301 of M85491_PEA_1_P14, at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90 An isolated chimeric polypeptide encoding M85491_PEA_1_P14, comprising a second amino acid sequence that is%, most preferably at least 95% homologous, said first and second amino acid sequences being adjacent and in sequential order.

2.M85491_PEA_1_P14中の配列ERQDLTMLSRLVLNSWPQMILPPQPPKVLELと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M85491_PEA_1_P14のテールをコードする単離ポリペプチド。   2. M85491_PEA_1_P14 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence ERQDLTLSRLVLNSWPQMILPPPLPKVLEL in M85491_PEA_1_P14 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The mutein is considered to be positioned as follows with respect to secretory cells. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質M85491_PEA_1_P14は、以下の転写物によってコードされる:M85491_PEA_1_T20(配列は出願書類の最後に示す)。転写物M85491_PEA_1_T20のコード部分を太字で示し、このコード部分は143位から開始され、1045位で終結する。転写物はまた、表27に列挙した以下のSNPを有する(ヌクレオチド酸配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M85491_PEA_1_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M85491_PEA_1_P14 is encoded by the following transcript: M85491_PEA_1_T20 (sequences shown at the end of the application). The code portion of transcript M85491_PEA_1_T20 is shown in bold, this code portion starting at position 143 and ending at position 1045. The transcript also has the following SNPs listed in Table 27 (showing its position on the nucleotide acid sequence, listing another nucleic acid, and the last column indicating if the SNP is known, a mutein The presence of known SNPs in the M85491_PEA_1_P14 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターM85491は、上の表21に列挙した11個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster M85491 is characterized by the eleven segments listed in Table 21 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターM85491_PEA_1_node_0は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M85491_PEA_1_T16およびM85491_PEA_1_T20。以下の表28は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M85491_PEA_1_node_0 of the present invention is supported by 5 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M85491_PEA_1_T16 and M85491_PEA_1_T20. Table 28 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM85491_PEA_1_node_13は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M85491_PEA_1_T20。以下の表29は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M85491_PEA_1_node_13 of the present invention is supported by six libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M85491_PEA_1_T20. Table 29 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM85491_PEA_1_node_21は、18個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M85491_PEA_1_T16。以下の表30は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M85491_PEA_1_node_21 of the present invention is supported by 18 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M85491_PEA_1_T16. Table 30 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM85491_PEA_1_node_23は、18個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M85491_PEA_1_T16。以下の表31は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M85491_PEA_1_node_23 of the present invention is supported by 18 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M85491_PEA_1_T16. Table 31 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM85491_PEA_1_node_24は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M85491_PEA_1_T16。以下の表32は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M85491_PEA_1_node_24 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M85491_PEA_1_T16. Table 32 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM85491_PEA_1_node_8は、25個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M85491_PEA_1_T16およびM85491_PEA_1_T20。以下の表33は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M85491_PEA_1_node_8 of the present invention is supported by 25 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M85491_PEA_1_T16 and M85491_PEA_1_T20. Table 33 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表34に示す)。   Microarray (chip) data for this segment is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (for lung cancer) (shown in Table 34).

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM85491_PEA_1_node_9は、20個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M85491_PEA_1_T16およびM85491_PEA_1_T20。以下の表35は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M85491_PEA_1_node_9 of the present invention is supported by 20 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M85491_PEA_1_T16 and M85491_PEA_1_T20. Table 35 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターM85491_PEA_1_node_10は、17個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M85491_PEA_1_T16およびM85491_PEA_1_T20。以下の表36は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M85491_PEA_1_node_10 of the present invention is supported by 17 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M85491_PEA_1_T16 and M85491_PEA_1_T20. Table 36 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM85491_PEA_1_node_18は、15個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M85491_PEA_1_T16。以下の表37は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M85491_PEA_1_node_18 of the present invention is supported by 15 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M85491_PEA_1_T16. Table 37 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM85491_PEA_1_node_19は、15個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M85491_PEA_1_T16。以下の表38は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M85491_PEA_1_node_19 of the present invention is supported by 15 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M85491_PEA_1_T16. Table 38 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM85491_PEA_1_node_6は、11個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M85491_PEA_1_T16およびM85491_PEA_1_T20。以下の表39は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M85491_PEA_1_node_6 of the present invention is supported by 11 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M85491_PEA_1_T16 and M85491_PEA_1_T20. Table 39 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/qfmsU9VtxS/DylcLC9j8v:EPB2_HUMAN

Sequence documentation:

Alignment of: M85491_PEA_1_P13 x EPB2_HUMAN ..

Alignment segment 1/1:

Quality: 4726.00 Escore: 0
Matching length: 476 Total length: 476
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYD 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYD 50
. . . . .
51 ENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSI 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 ENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSI 100
. . . . .
101 PSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQV 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 PSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQV 150
. . . . .
151 DLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRI 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 DLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRI 200
. . . . .
201 IQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVP 250
. . . . .
251 IGRCMCKAGFEAVENGTVCRGCPSGTFKANQGDEACTHCPINSRTTSEGA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 IGRCMCKAGFEAVENGTVCRGCPSGTFKANQGDEACTHCPINSRTTSEGA 300
. . . . .
301 TNCVCRNGYYRADLDPLDMPCTTIPSAPQAVISSVNETSLMLEWTPPRDS 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 TNCVCRNGYYRADLDPLDMPCTTIPSAPQAVISSVNETSLMLEWTPPRDS 350
. . . . .
351 GGREDLVYNIICKSCGSGRGACTRCGDNVQYAPRQLGLTEPRIYISDLLA 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 GGREDLVYNIICKSCGSGRGACTRCGDNVQYAPRQLGLTEPRIYISDLLA 400
. . . . .
401 HTQYTFEIQAVNGVTDQSPFSPQFASVNITTNQAAPSAVSIMHQVSRTVD 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 HTQYTFEIQAVNGVTDQSPFSPQFASVNITTNQAAPSAVSIMHQVSRTVD 450
. .
451 SITLSWSQPDQPNGVILDYELQYYEK 476
||||||||||||||||||||||||||
451 SITLSWSQPDQPNGVILDYELQYYEK 476






Sequence name: /tmp/rmnzuDbot6/GiHbjeU8iR:EPB2_HUMAN

Sequence documentation:

Alignment of: M85491_PEA_1_P14 x EPB2_HUMAN ..

Alignment segment 1/1:

Quality: 2673.00 Escore: 0
Matching length: 270 Total length: 270
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYD 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYD 50
. . . . .
51 ENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSI 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 ENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSI 100
. . . . .
101 PSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQV 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 PSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQV 150
. . . . .
151 DLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRI 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 DLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRI 200
. . . . .
201 IQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVP 250
. .
251 IGRCMCKAGFEAVENGTVCR 270
||||||||||||||||||||
251 IGRCMCKAGFEAVENGTVCR 270


Mutated protein alignment against previously known proteins:
Sequence name: / tmp / qfmsU9VtxS / DylcLC9j8v: EPB2_HUMAN

Sequence documentation:

Alignment of: M85491_PEA_1_P13 x EPB2_HUMAN ..

Alignment segment 1/1:

Quality: 4726.00 Escore: 0
Matching length: 476 Total length: 476
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MALRRLGAALLLLPLLAVAEETLMDSTTATAELGWMHPPSGWEEVSGYD 50
||||||||||||||||||||||||||||||||||||||||
1 MALRRLGAALLLLPLLAVAEETLMDSTTATAELGWMHPPSGWEEVSGYD 50
....
51 ENMNTIRTYQ VCNVFFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSI 100
||||||||||||||||||||||||||||||||||||||||
51 ENMNTIRTYQ VCNVFFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSI 100
....
101 PSVPGSCKETFNLYYYEAFD FSAT KTTFPNWMENPWVKVDTIAADESFSQV 150
||||||||||||||||||||||||||||||||||||||||
101 PSVPGSCKETFNLYYYEAFD FSAT KTTFPNWMENPWVKVDTIAADESFSQV 150
....
151 DLGGRVMKINTEVRSFGPVSSRGYLAFQDYGGCMSLIAVRVFYRKCPRI 200
||||||||||||||||||||||||||||||||||||||||
151 DLGGRVMKINTEVRSFGPVSSRGYLAFQDYGGCMSLIAVRVFYRKCPRI 200
....
201 IQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVP 250
||||||||||||||||||||||||||||||||||||||||
201 IQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVP 250
....
251 IGRCMCKAGFEAVENGTVCRGCPSGTFKANQGDEACTHCPINSRTTSEGA 300
||||||||||||||||||||||||||||||||||||||||
251 IGRCMCKAGFEAVENGTVCRGCPSGTFKANQGDEACTHCPINSRTTSEGA 300
....
301 TNCVCRNGYYRADLDPLDMPPCTTIPSAPQAVISSVNETSLLEWTPPRDS 350
||||||||||||||||||||||||||||||||||||||||
301 TNCVCRNGYYRADLDPLDMPPCTTIPSAPQAVISSVNETSLLEWTPPRDS 350
....
351 GGREDLVYNIICKSCGSGRGACTRCGDNVQYAPRQLGLTEPRIYISDLLA 400
||||||||||||||||||||||||||||||||||||||||
351 GGREDLVYNIICKSCGSGRGACTRCGDNVQYAPRQLGLTEPRIYISDLLA 400
....
401 HTQYTFEIQAVNGVTDQSPSPQFASVNITTNQAAPSAVSIMHQVSRTVD 450
||||||||||||||||||||||||||||||||||||||||
401 HTQYTFEIQAVNGVTDQSPSPQFASVNITTNQAAPSAVSIMHQVSRTVD 450
.
451 SITLSWSQPDQPNGL VIDYELQYYEK 476
||||||||||||||||||||||||
451 SITLSWSQPDQPNGL VIDYELQYYEK 476






Sequence name: / tmp / rmnzuDbot6 / GiHbjeU8iR: EPB2_HUMAN

Sequence documentation:

Alignment of: M85491_PEA_1_P14 x EPB2_HUMAN ..

Alignment segment 1/1:

Quality: 2673.00 Escore: 0
Matching length: 270 Total length: 270
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MALRRLGAALLLLPLLAVAEETLMDSTTATAELGWMHPPSGWEEVSGYD 50
||||||||||||||||||||||||||||||||||||||||
1 MALRRLGAALLLLPLLAVAEETLMDSTTATAELGWMHPPSGWEEVSGYD 50
....
51 ENMNTIRTYQ VCNVFFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSI 100
||||||||||||||||||||||||||||||||||||||||
51 ENMNTIRTYQ VCNVFFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSI 100
....
101 PSVPGSCKETFNLYYYEAFD FSAT KTTFPNWMENPWVKVDTIAADESFSQV 150
||||||||||||||||||||||||||||||||||||||||
101 PSVPGSCKETFNLYYYEAFD FSAT KTTFPNWMENPWVKVDTIAADESFSQV 150
....
151 DLGGRVMKINTEVRSFGPVSSRGYLAFQDYGGCMSLIAVRVFYRKCPRI 200
||||||||||||||||||||||||||||||||||||||||
151 DLGGRVMKINTEVRSFGPVSSRGYLAFQDYGGCMSLIAVRVFYRKCPRI 200
....
201 IQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVP 250
||||||||||||||||||||||||||||||||||||||||
201 IQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVP 250
.
251 IGRCMCKAGFEAVENGTVCR 270
|||||||||||||||||||
251 IGRCMCKAGFEAVENGTVCR 270


正常および癌性肺組織における配列名M85491seg24中に示すアンプリコンによって検出可能なエフリンB型受容体2前駆体(EC2.7.1.112)(チロシン−タンパク質キナーゼ受容体EPH−3)M8549転写物の発現
seg24、M85491seg24アンプリコン(配列番号1639)、M85491seg24F(配列番号1637)、およびM85491seg24R(配列番号1638)プライマーによって検出可能なエフリンB型受容体2前駆体(EC2.7.1.112)(チロシン−タンパク質キナーゼ受容体EPH−3)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
Ephrin type-B receptor 2 precursor (EC 2.7. 1. 112) (tyrosine-protein kinase receptor EPH-3) M8549 transcript detectable by an amplicon as shown in sequence name M 85491 seg 24 in normal and cancerous lung tissue Ephrin type-B receptor 2 precursor (EC 2.7.1.112) detectable by primers seg24, M85491 seg24 amplicon (SEQ ID NO: 1639), M85491 seg 24 F (SEQ ID NO: 1637), and M85491 seg 24 R (SEQ ID NO: 1638) The expression of tyrosine-protein kinase receptor EPH-3) transcripts was measured by real-time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – PBGD-Amplicon, SEQ ID No. 334), HPRT1 (GenBank Accession No. NM_000194, Amplicon – HPRT1- Amplicons, SEQ ID NO: 1297), Ubiquitin (GenBank Accession No. BC000449, Amplicon – Ubiquitin-Amplicon SEQ ID NO: 328), and SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA-Amplicon SEQ ID NO: 331) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. The normalized volume of each RT sample is the median volume of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99, Table 2, "tissue samples in the test panel") Divided to obtain the magnification of upregulation of each sample relative to the median of normal PM samples.

以下の図10は、正常サンプルと比較した癌性肺サンプルにおける上記のエフリンB型受容体2前駆体(EC2.7.1.112)(チロシン−タンパク質キナーゼ受容体EPH−3)転写物の過剰発現を示すヒストグラムである。値は、2連の実験の平均を示す。エラーバーは、得られた最小値および最大値を示す。試験した全サンプル数のうちの少なくとも3倍の過剰発現を示すサンプルの数および比率を下に示す。    FIG. 10 below shows the excess of the above-described Ephrin type-B receptor 2 precursor (EC 2.7.1.112) (tyrosine-protein kinase receptor EPH-3) transcript in cancerous lung samples compared to normal samples. It is a histogram which shows expression. Values represent the average of duplicate experiments. Error bars indicate the obtained minimum and maximum values. The numbers and proportions of samples showing at least 3 times overexpression of the total number of samples tested are shown below.

図10から明らかなように、上記アンプリコン癌サンプルによって検出可能なエフリンB型受容体2前駆体(EC2.7.1.112)(チロシン−タンパク質キナーゼ受容体EPH−3)転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、15個の腺癌サンプルのうち9個および8個の小細胞癌サンプルのうち4個で少なくとも3倍の過剰発現が見出された。   As apparent from FIG. 10, the expression of Ephrin type-B receptor 2 precursor (EC 2.7. 1. 112) (tyrosine-protein kinase receptor EPH-3) transcript detectable by the above amplicon cancer sample is , Non-cancerous samples (sample numbers 47-50, 90-93, 96-99, Table 2, "tissue samples in test panel") were significantly higher. Clearly, at least 3-fold overexpression was found in 9 out of 15 adenocarcinoma samples and 4 out of 8 small cell carcinoma samples.

下記のように、これらの結果の有意性を検証するために、統計分析に適用した。   Statistical analysis was applied to verify the significance of these results, as described below.

3倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、腺癌で7.42E−03、小細胞癌で5.69E−02であった。上記値は、結果が統計的に有意であることを示す。   The 3-fold overexpression threshold was found to be different between cancer and normal samples, and when checked by Fisher's exact test, the P value is 7.42E-03 in adenocarcinoma, small cell carcinoma It was 5.69E-02. The above values indicate that the results are statistically significant.

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:M85491seg24F順方向プライマーおよびM85491seg24R逆方向プライマー。   Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used only as non-limiting examples of suitable primer pairs: M85491 seg24F forward primer and M85491 seg24 R reverse Direction primer.

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:M85491seg24。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : M85491 seg 24.

M85491seg24F(配列番号1637)−GGCGTCTTTCTCCCTCTGAAC
M85491seg24R(配列番号1638)−GTCCCATTCTGGGTGCTGTG
M85491seg24(配列番号1639)–GGCGTCTTTCTCCCTCTGAACCTCAGTTTCCACCTGTGTCGAGTGTGGGTGAGACCCCTCGCGGGGAGCTATGCAGGTTACGGAGAAAAGGCAGCACAGCACCCAGAATGGGAC
M85491 seg 24 F (SEQ ID NO: 1637)-GGCGTCTTTTCTCCCCTGAAC
M85491 seg 24 R (SEQ ID NO: 1638)-GTCCCATTCTGGGTGCTGTG
M85491 seg 24 (SEQ ID NO: 1639) > GGCGTTCTTTCTCCTCTCCAACTCCAGTTTCCACCTGTGTGAGTGTGGGTGAGACCCCTCGCGGGGAGCTATGCAGGTTACGGAAGAAAGGCAGCAGCACCCAGAATGGCAC

異なる正常組織における配列名M85491seg24中に示すアンプリコンによって検出可能なエフリンB型受容体2前駆体(EC2.7.1.112)(チロシン−タンパク質キナーゼ受容体EPH−3)M8549転写物の発現
M85491seg24アンプリコン(配列番号1639)、M85491seg24F(配列番号1637)、およびM85491seg24R(配列番号1638)によって検出可能なエフリンB型受容体2前駆体転写物の発現を、実時間PCRによって測定した。並行して4つのハウスキーピング遺伝子−RPL19(GenBankアクセッション番号NM_000981、RPL19アンプリコン,配列番号1630)、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン,配列番号1633)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン、配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168;アンプリコン–SDHA−アンプリコン、配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、肺サンプル(上記のサンプル番号15〜17、表2、「正常パネル中の組織サンプル」)の量の中央値で割って、肺サンプルに対する各サンプルの相対発現値を得た。
Expression of Ephrin type-B receptor 2 precursor (EC 2.7.1.112) (tyrosine-protein kinase receptor EPH-3) M8549 transcript detectable by an amplicon shown in the sequence name M85491 seg24 in different normal tissues The expression of Ephrin type-B receptor 2 precursor transcripts detectable by amplicons (SEQ ID NO: 1639), M85491seg24F (SEQ ID NO: 1637), and M85491seg24R (SEQ ID NO: 1638) was measured by real-time PCR. In parallel, four housekeeping genes-RPL19 (GenBank Accession No. NM_000981, RPL19 amplicon, SEQ ID No. 1630), TATA box (GenBank Accession No. NM_003194, TATA amplicon, SEQ ID No. 1633), ubiquitin (GenBank Accession No. BC000449, amplicon – ubiquitin amplicon, SEQ ID NO: 328), and SDHA (GenBank accession number NM_004168; amplicon >#8211; SDHA-amplicon, SEQ ID NO: 331) were similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. The relative expression of each sample relative to the lung sample divided by the median of the amounts of lung samples (Sample Nos. 15-17 above, Table 2, "Tissue Samples in Normal Panel") above each RT sample I got a value.

M85491seg24F(配列番号1637)−GGCGTCTTTCTCCCTCTGAAC
M85491seg24R(配列番号1638)−GTCCCATTCTGGGTGCTGTG
M85491seg24(配列番号1639)–GGCGTCTTTCTCCCTCTGAACCTCAGTTTCCACCTGTGTCGAGTGTGGGTGAGACCCCTCGCGGGGAGCTATGCAGGTTACGGAGAAAAGGCAGCACAGCACCCAGAATGGGAC
M85491 seg 24 F (SEQ ID NO: 1637)-GGCGTCTTTTCTCCCCTGAAC
M85491 seg 24 R (SEQ ID NO: 1638)-GTCCCATTCTGGGTGCTGTG
M85491 seg 24 (SEQ ID NO: 1639) > GGCGTTCTTTCTCCTCTCCAACTCCAGTTTCCACCTGTGTGAGTGTGGGTGAGACCCCTCGCGGGGAGCTATGCAGGTTACGGAAGAAAGGCAGCAGCACCCAGAATGGCAC

図11に示す結果は、異なる正常組織における配列名M85491seg24中に示された、アンプリコンによって検出可能なエフリンB型受容体2前駆体(チロシン−タンパク質キナーゼ受容体EPH−3)M85491転写物の発現を示す。   The results shown in FIG. 11 are the expression of Ephrin type-B receptor 2 precursor (tyrosine-protein kinase receptor EPH-3) M85491 transcript detectable by an amplicon as shown in the sequence name M85491 seg24 in different normal tissues Indicates

クラスターT39971の説明
クラスターT39971は、目的の4つの転写物および28個のセグメントを特徴とし、その名称を、それぞれ表40および41に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表42に示す。
Description of Cluster T39971 Cluster T39971 is characterized by 4 transcripts of interest and 28 segments, the names of which are shown in Tables 40 and 41, respectively, and the sequences themselves are shown at the end of the application. Selected protein variants are shown in Table 42.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるビトロネクチン前駆体(SwissProtアクセッション識別子VTNC_HUMAN、同義語血清核酸因子;S−タンパク質;V75としても公知である)(配列番号1418)の変異型である。   These sequences are known proteins Vitronectin precursor (SwissProt accession identifier VTNC_HUMAN, synonym serum nucleic acid factor; S-protein; also known as V75), which is a known protein previously referred to herein as a protein It is a variant of SEQ ID NO: 1418).

タンパク質ビトロネクチン前駆体は、以下の機能を有することが公知であるか、そのように見なされている:ビトロネクチンは、血清および組織で見出される細胞接着および核酸因子である。ビトロネクチンは、グリコサミノグリカンおよびプロテオグリカンと相互作用する。インテグリンファミリーの一定のメンバーによって認識されて、細胞−基質接着分子としての機能を果たす。末端細胞溶解性補体経路の膜障害効果のインヒビター。タンパク質ビトロネクチン前駆体の配列を、「ビトロネクチン前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表4に示す。   The protein vitronectin precursor is known or considered to have the following functions: Vitronectin is a cell adhesion and nucleic acid factor found in serum and tissues. Vitronectin interacts with glycosaminoglycans and proteoglycans. It is recognized by certain members of the integrin family and serves as a cell-substrate adhesion molecule. Inhibitors of the membrane damaging effects of the distal cytolytic complement pathway. The sequence of the protein vitronectin precursor is shown at the end of the application as "vitronectin precursor amino acid sequence". Known polymorphisms of this sequence are shown in Table 4.

Figure 2008507261
Figure 2008507261

タンパク質ビトロネクチン前駆体の局在化は、細胞外と考えられる。   Localization of the protein vitronectin precursor is considered extracellular.

以前に公知のタンパク質はまた、以下の適応症および/または潜在的治療用途を有する:癌、黒色腫。ヒトにおける臨床/治療用途(例えば、抗体または小分子の標的として、および/または直接的な治療として)が調査されており、これらの調査に関連する利用可能な情報は以下である。以前に公知のタンパク質の潜在的な薬学的に関連するか治療に関連する活性は以下である:αβ3インテグリンアンタゴニスト、アポトーシスアゴニスト。クラスターによって示されたタンパク質の治療における役割が予想されている。このタンパク質またはその一部を、潜在的治療に適用する(抗癌薬)ために使用するか使用することができる薬物データベースまたは公的なデータベース(例えば、上記)に情報が存在するので、クラスターをこの分野に割り当てた。   The previously known proteins also have the following indications and / or potential therapeutic applications: cancer, melanoma. Clinical / therapeutic applications in humans (e.g. as targets for antibodies or small molecules and / or as direct therapy) are being investigated and available information related to these investigations is: Potential pharmaceutically relevant or therapeutically relevant activities of previously known proteins are: αβ3 integrin antagonists, apoptosis agonists. The therapeutic role of proteins displayed by clusters is expected. Because information is present in drug databases or public databases (eg, above) that may or may not be used to apply this protein or a portion thereof to a potential treatment (anti-cancer drug), the clusters Assigned to this area.

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである免疫応答、細胞接着、分子機能に関連する注釈付けであるタンパク質結合、ヘパリン結合、および細胞成分に関連する注釈付けである細胞外空間。   The following GO annotation applies to previously known proteins. The following annotations were found: immune responses related to biological processes, immune responses, cell adhesion, protein binding related to molecular function, protein binding, heparin binding, and annotations related to cellular components Extracellular space.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

クラスターT39971を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図12のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   Cluster T39971 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The terms "numbers" in the right column of the table and the numbers on the y-axis of FIG. 12 refer to the weighted expression of ESTs in each category as "ppm" (the ppm of ESTs of a particular cluster in this category by ppm Ratio of expression to expression of all ESTs).

概して、図12および表44中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):肝臓癌、肺悪性腫瘍、および膵臓癌。   As shown generally for the histograms in FIG. 12 and Table 44, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: liver cancer, lung malignancy, and pancreatic cancer.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、クラスターT39971は、上の表40に列挙した4つの転写物を特徴とする。これらの転写物は、ビトロネクチン前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster T39971 is characterized by the four transcripts listed in Table 40 above. These transcripts encode a protein that is a mutated form of vitronectin precursor. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質T39971_P6は、出願書類の最後に示すアミノ酸配列を有し、転写物T39971_T5によってコードされる。公知のタンパク質(ビトロネクチン前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein T39971_P6 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript T39971_T5. An alignment to a known protein (vitronectin precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

T39971_P6とVTNC_HUMANとの間の比較の報告
1.VTNC_HUMANのアミノ酸1〜276に対応し、T39971_P6のアミノ酸1〜276にも対応するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGと少なくとも90%相同な第1のアミノ酸配列と、T39971_P6のアミノ酸277〜283に対応する配列TQGVVGDを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、T39971_P6をコードする単離キメラポリペプチド。
Report of comparison between T39971_P6 and VTNC_HUMAN 1. Corresponding to amino acids 1-276 of VTNC_HUMAN, at least a MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKG corresponding to amino acids 1-276 of T39971_P6 9 % And a polypeptide having the sequence TQGVVGD corresponding to amino acids 277 to 283 of T39971_P6 and at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90% An isolated chimeric polypeptide encoding T39971_P6, most preferably comprising a second amino acid sequence which is at least 95% homologous, said first and second amino acid sequences being adjacent and in sequential order.

2.T39971_P6中の配列TQGVVGDと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T39971_P6のテールをコードする単離ポリペプチド。   2. T39971_P6 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence TQGVVGD in T39971_P6 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The mutein is considered to be positioned as follows with respect to secretory cells. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質T39971_P6はまた、表46に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T39971_P6配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T39971_P6 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 46) It is shown whether it is known and the presence of a known SNP in the mutein T39971_P6 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質T39971_P6は、以下の転写物によってコードされる:T39971_T5(配列は出願書類の最後に示す)。転写物T39971_T5のコード部分を太字で示し、このコード部分は756位から開始され、1604位で終結する。転写物はまた、表47に列挙した以下のSNPを有する(ヌクレオチド酸配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T39971_P6配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T39971_P6 is encoded by the following transcript: T39971_T5 (sequences shown at the end of the application). The coding portion of the transcript T39971_T5 is shown in bold, starting from position 756 and ending at position 1604. The transcript also has the following SNPs listed in Table 47 (showing its position on the nucleotide acid sequence, listing another nucleic acid, and the last column indicating if the SNP is known, a mutein The presence of known SNPs in the T39971_P6 sequence supports the deduced sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

本発明の変異タンパク質T39971_P9は、出願書類の最後に示すアミノ酸配列を有し、転写物T39971_T10によってコードされる。公知のタンパク質(ビトロネクチン前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein T39971_P9 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript T39971_T10. An alignment to a known protein (vitronectin precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

T39971_P9とVTNC_HUMANとの間の比較の報告
1.VTNC_HUMANのアミノ酸1〜325に対応し、T39971_P9のアミノ酸1〜325にも対応するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSAVFEHFAMMQRDSWEDIFELLFWGRTと少なくとも90%相同な第1のアミノ酸配列と、VTNC_HUMANのアミノ酸357〜478に対応し、T39971_P9のアミノ酸326〜447にも対応するSGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRATWLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHLと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、T39971_P9をコードする単離キメラポリペプチド。
Report of comparison between T39971_P9 and VTNC_HUMAN 1. Corresponding to amino acids 1 to 325 of VTNC_HUMAN, corresponding to amino acids 1 to 325 of T39971_P9 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQ SQQHQPSQ EEC GEL S 2 90 90 90 90 90 SG SG SG 399 399 399 399 399 399 399 399 399 399 399 399 399 399 399 399 399 399 399 399 399 399 399 399. An isolated chimeric polypeptide encoding T39971_P9, wherein said first and second amino acid sequences are in contiguous and sequential order.

2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がTSを含み、以下の構造:アミノ酸番号325−x〜325のいずれかから始まり、アミノ酸番号326+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、T39971_P9の縁部分をコードする単離キメラポリペプチド。   2. Length “n” (wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long, most preferably at least about 50 amino acids long, at least two amino acids comprising TS, starting from any of the following structures: amino acid numbers 325-x to 325, amino acid numbers 326 + ((n-2) -x) (formula An isolated chimeric polypeptide encoding the edge portion of T39971_P9, comprising a polypeptide, having a sequence terminating in: x) varying from 0 to n-2).

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The mutein is considered to be positioned as follows with respect to secretory cells. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質T39971_P9はまた、表48に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T39971_P9配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T39971_P9 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 48) It is shown whether it is known and the presence of a known SNP in the mutein T39971_P9 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質T39971_P9は、以下の転写物によってコードされる:T39971_T10(配列は出願書類の最後に示す)。転写物T39971_T10のコード部分を太字で示し、このコード部分は756位から開始され、2096位で終結する。転写物はまた、表49に列挙した以下のSNPを有する(ヌクレオチド酸配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T39971_P9配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T39971_P9 is encoded by the following transcript: T39971_T10 (sequences shown at the end of the application). The coding portion of transcript T39971_T10 is shown in bold and this coding portion starts at position 756 and ends at position 2096. The transcript also has the following SNPs listed in Table 49 (showing its position on the nucleotide acid sequence, listing another nucleic acid, and the last column indicating if the SNP is known, a mutein The presence of known SNPs in the T39971_P9 sequence supports the deduced sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

本発明の変異タンパク質T39971_P11は、出願書類の最後に示すアミノ酸配列を有し、転写物T39971_T12によってコードされる。公知のタンパク質(ビトロネクチン前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein T39971_P11 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript T39971_T12. An alignment to a known protein (vitronectin precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

T39971_P11とVTNC_HUMANとの間の比較の報告
1.VTNC_HUMANのアミノ酸1〜326に対応し、T39971_P11のアミノ酸1〜326にも対応するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSAVFEHFAMMQRDSWEDIFELLFWGRTSと少なくとも90%相同な第1のアミノ酸配列と、VTNC_HUMANのアミノ酸442〜478に対応し、T39971_P11のアミノ酸327〜363にも対応するDKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHLと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、T39971_P11をコードする単離キメラポリペプチド。
Report of comparison between T39971_P11 and VTNC_HUMAN 1. Corresponding to amino acids 1 to 326 of VTNC_HUMAN, corresponding to amino acids 1 to 326 of T39971_P11 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEY A first amino acid sequence which is at least 90% homologous to FQHQPSQEECEGSSLSAVFEHFAM MQRDWEDIF WGRTS, and DKYYRVNLRTRRVDTVTVDPPYPRSIAQYWLGCPAPGHL corresponding to amino acids 442-478 of VTNC_HUMAN, and also to amino acids 323-363 of T39971_P11 An isolated chimeric polypeptide encoding T39971_P11, wherein said first and second amino acid sequences are in contiguous and sequential order.

2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がSDを含み、以下の構造:アミノ酸番号326−x〜326のいずれかから始まり、アミノ酸番号327+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、T39971_P11の縁部分をコードする単離キメラポリペプチド。   2. Length “n” (wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long, most preferably at least about 50 amino acids long, at least two amino acids comprising SD, starting from any of the following structures: amino acids nos. 326-x to 326, amino acids nos. 327 + ((n-2)-x) (formula An isolated chimeric polypeptide encoding the edge portion of T39971_P11, comprising a polypeptide, having a sequence terminating in:

T39971_P11とQ9BSH7(配列番号1696)との間の比較の報告
1.Q9BSH7のアミノ酸1〜326に対応し、T39971_P11のアミノ酸1〜326にも対応するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSAVFEHFAMMQRDSWEDIFELLFWGRTSと少なくとも90%相同な第1のアミノ酸配列と、Q9BSH7のアミノ酸442〜478に対応し、T39971_P11のアミノ酸327〜363にも対応するDKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHLと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、T39971_P11をコードする単離キメラポリペプチド。
Report of the comparison between T39971_P11 and Q9BSH7 (SEQ ID NO: 1696) Corresponding to amino acids 1 to 326 of Q9BSH7, corresponding to amino acids 1 to 326 of T39971_P11 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQH A first amino acid sequence at least 90% homologous to PSQEECEGSSLSAVFEHFAM MQRDWEDFIWGRTS, and a second amino acid sequence comprising at least 90% homology to DKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHL corresponding to amino acids 442-478 of Q9BSH7 and also corresponding to amino acids 324-363 of T39971_P11 An isolated chimeric polypeptide encoding T39971_P11, wherein said first and second amino acid sequences are in contiguous and sequential order.

2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がSDを含み、以下の構造:アミノ酸番号326−x〜326のいずれかから始まり、アミノ酸番号327+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、T39971_P11の縁部分をコードする単離キメラポリペプチド。   2. Length “n” (wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long, most preferably at least about 50 amino acids long, at least two amino acids comprising SD, starting from any of the following structures: amino acids nos. 326-x to 326, amino acids nos. 327 + ((n-2)-x) (formula An isolated chimeric polypeptide encoding the edge portion of T39971_P11, comprising a polypeptide, having a sequence terminating in:

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The mutein is considered to be positioned as follows with respect to secretory cells. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質T39971_P11はまた、表50に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T39971_P11配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T39971_P11 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing the other amino acids, and listing the other amino acids, as shown in Table 50), the last column shows the SNPs It indicates whether it is known and the presence of a known SNP in the mutein T39971_P11 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質T39971_P11は、以下の転写物によってコードされる:T39971_T12(配列は出願書類の最後に示す)。転写物T39971_T12のコード部分を太字で示し、このコード部分は756位から開始され、1844位で終結する。転写物はまた、表51に列挙した以下のSNPを有する(ヌクレオチド酸配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T39971_P11配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T39971_P11 is encoded by the following transcript: T39971_T12 (sequences shown at the end of the application). The coding portion of transcript T39971_T12 is shown in bold and this coding portion starts from position 756 and ends at position 1844. The transcript also has the following SNPs listed in Table 51 (showing its position on the nucleotide acid sequence, listing another nucleic acid, and the last column indicating if the SNP is known, a mutein The presence of known SNPs in the T39971_P11 sequence supports the deduced sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質T39971_P12は、出願書類の最後に示すアミノ酸配列を有し、転写物T39971_T16によってコードされる。公知のタンパク質(ビトロネクチン前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein T39971_P12 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript T39971_T16. An alignment to a known protein (vitronectin precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

T39971_P12とVTNC_HUMANとの間の比較の報告
1.VTNC_HUMANのアミノ酸1〜223に対応し、T39971_P12のアミノ酸1〜223にも対応するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKと少なくとも90%相同な第1のアミノ酸配列と、T39971_P12のアミノ酸224〜238に対応する配列VPGAVGQGRKHLGRVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、T39971_P12をコードする単離キメラポリペプチド。
Report of comparison between T39971_P12 and VTNC_HUMAN 1. Corresponding to amino acids 1-223 of VTNC_HUMAN, first amino acid sequence at least 90% homologous to the corresponding MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFK to amino acids 1-223 of T39971_P12, corresponding to amino acids 224-238 of T39971_P12 sequence VPGAVGQ A polypeptide comprising RKHLGRV and a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; An isolated chimeric polypeptide encoding T39971_P12, wherein the first and second amino acid sequences are in contiguous and sequential order.

2.T39971_P12中の配列VPGAVGQGRKHLGRVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T39971_P12のテールをコードする単離ポリペプチド。   2. T39971_P12 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence VPGAVGQGRKHLRVR in T39971_P12 An isolated polypeptide encoding a tail.

T39971_P12とQ9BSH7との間の比較の報告
1.Q9BSH7のアミノ酸1〜223に対応し、T39971_P12のアミノ酸1〜223にも対応するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKと少なくとも90%相同な第1のアミノ酸配列と、T39971_P12のアミノ酸224〜238に対応する配列VPGAVGQGRKHLGRVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、T39971_P12をコードする単離キメラポリペプチド。
Report of comparison between T39971_P12 and Q9BSH7 1. Corresponding to amino acids 1-223 of Q9BSH7, first amino acid sequence at least 90% homologous to the corresponding MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFK to amino acids 1-223 of T39971_P12, corresponding to amino acids 224-238 of T39971_P12 sequence VPGAVGQGRKH A polypeptide comprising GRV and a second amino acid sequence at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; An isolated chimeric polypeptide encoding T39971_P12, wherein the first and second amino acid sequences are in contiguous and sequential order.

2.T39971_P12中の配列VPGAVGQGRKHLGRVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T39971_P12のテールをコードする単離ポリペプチド。   2. T39971_P12 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence VPGAVGQGRKHLRVR in T39971_P12 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The mutein is considered to be positioned as follows with respect to secretory cells. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質T39971_P12はまた、表52に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T39971_P12配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T39971_P12 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 52) It is shown whether it is known and the presence of a known SNP in the mutein T39971_P12 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質T39971_P12は、以下の転写物によってコードされる:T39971_T16(配列は出願書類の最後に示す)。転写物T39971_T16のコード部分を太字で示し、このコード部分は756位から開始され、1469位で終結する。転写物はまた、表53に列挙した以下のSNPを有する(ヌクレオチド酸配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T39971_P12配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T39971_P12 is encoded by the following transcript: T39971_T16 (sequences shown at the end of the application). The coding portion of the transcript T39971_T16 is shown in bold, starting from position 756 and ending at position 1469. The transcript also has the following SNPs listed in Table 53 (showing its position on the nucleotide acid sequence, listing another nucleic acid, and the last column indicating if the SNP is known, a mutein The presence of known SNPs in the T39971_P12 sequence supports the deduced sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターT39971は、上の表41に列挙した28個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster T39971 is characterized by the 28 segments listed in Table 41 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターT39971_node_0は、76個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表54は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_0 of the present invention is supported by 76 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16, and T39971_T5. Table 54 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_18は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T16。以下の表55は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_18 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: T39971_T16. Table 55 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_21は、99個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、およびT39971_T5。以下の表56は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_21 of the present invention is supported by 99 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T39971_T10, T39971_T12, and T39971_T5. Table 56 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_22は、7個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T5。以下の表57は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_22 of the present invention is supported by seven libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T39971_T5. Table 57 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_23は、101個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、およびT39971_T5。以下の表58は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_23 of the present invention is supported by 101 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T39971_T10, T39971_T12, and T39971_T5. Table 58 below describes the beginning and ending positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_31は、94個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10およびT39971_T5。以下の表59は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_31 of the present invention is supported by 94 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T39971_T10 and T39971_T5. Table 59 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_33は、77個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、およびT39971_T5。以下の表60は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_33 of the present invention is supported by 77 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T39971_T10, T39971_T12, and T39971_T5. Table 60 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_7は、87個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表61は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_7 of the present invention is supported by 87 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16, and T39971_T5. Table 61 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターT39971_node_1を、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表62は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_1 according to the invention can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16, and T39971_T5. Table 62 below describes the beginning and ending positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_10は、77個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表63は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_10 of the present invention is supported by 77 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16, and T39971_T5. Table 63 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_11は、79個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表64は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_11 of the present invention is supported by 79 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16, and T39971_T5. Table 64 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_12を、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表65は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_12 according to the invention can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16, and T39971_T5. Table 65 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_15は、79個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表66は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_15 of the present invention is supported by 79 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16, and T39971_T5. Table 66 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_16を、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表67は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_16 of the invention can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16, and T39971_T5. Table 67 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_17は、86個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表68は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_17 of the present invention is supported by 86 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16, and T39971_T5. Table 68 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_26は、85個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T5。以下の表69は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_26 of the present invention is supported by 85 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T39971_T5. Table 69 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_27は、90個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T5。以下の表70は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_27 of the present invention is supported by 90 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T39971_T5. Table 70 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_28を、以下の転写物中に見出すことができる:T39971_T10およびT39971_T5。以下の表71は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_28 according to the invention can be found in the following transcript: T39971_T10 and T39971_T5. Table 71 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_29は、99個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10およびT39971_T5。以下の表72は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_29 of the present invention is supported by 99 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T39971_T10 and T39971_T5. Table 72 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_3は、78個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表73は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_3 of the present invention is supported by 78 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16, and T39971_T5. Table 73 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_30を、以下の転写物中に見出すことができる:T39971_T10およびT39971_T5。以下の表74は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_30 of the invention can be found in the following transcripts: T39971_T10 and T39971_T5. Table 74 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_34を、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、およびT39971_T5。以下の表75は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_34 of the invention can be found in the following transcripts: T39971_T10, T39971_T12, and T39971_T5. Table 75 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_35を、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、およびT39971_T5。以下の表76は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_35 of the invention can be found in the following transcripts: T39971_T10, T39971_T12, and T39971_T5. Table 76 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_36は、51個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、およびT39971_T5。以下の表77は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_36 of the present invention is supported by 51 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T39971_T10, T39971_T12, and T39971_T5. Table 77 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_4を、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表78は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_4 according to the invention can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16, and T39971_T5. Table 78 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_5は、80個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表79は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_5 of the present invention is supported by 80 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16, and T39971_T5. Table 79 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_8を、以下の転写物中に見出すことができる:T39971_T10、T39971_T16、およびT39971_T5。以下の表80は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_8 of the invention can be found in the following transcripts: T39971_T10, T39971_T16, and T39971_T5. Table 80 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT39971_node_9を、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表81は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T39971_node_9 of the invention can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16, and T39971_T5. Table 81 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/xkraCL2OcZ/43L7YcPH7x:VTNC_HUMAN

Sequence documentation:

Alignment of: T39971_P6 x VTNC_HUMAN ..

Alignment segment 1/1:

Quality: 2774.00 Escore: 0
Matching length: 278 Total length: 278
Matching Percent Similarity: 99.64 Matching Percent Identity: 99.64
Total Percent Similarity: 99.64 Total Percent Identity: 99.64
Gaps: 0

Alignment:
. . . . .
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
. . . . .
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
. . . . .
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
. . . . .
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
. . . . .
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
. .
251 PDNVDAALALPAHSYSGRERVYFFKGTQ 278
|||||||||||||||||||||||||| |
251 PDNVDAALALPAHSYSGRERVYFFKGKQ 278






Sequence name: /tmp/X4DeeuSlB4/yMubSR5FPs:VTNC_HUMAN

Sequence documentation:

Alignment of: T39971_P9 x VTNC_HUMAN ..

Alignment segment 1/1:

Quality: 4430.00 Escore: 0
Matching length: 447 Total length: 478
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 93.51 Total Percent Identity: 93.51
Gaps: 1

Alignment:
. . . . .
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
. . . . .
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
. . . . .
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
. . . . .
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
. . . . .
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
. . . . .
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
. . . . .
301 VFEHFAMMQRDSWEDIFELLFWGRT......................... 325
|||||||||||||||||||||||||
301 VFEHFAMMQRDSWEDIFELLFWGRTSAGTRQPQFISRDWHGVPGQVDAAM 350
. . . . .
326 ......SGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRAT 369
||||||||||||||||||||||||||||||||||||||||||||
351 AGRIYISGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRAT 400
. . . . .
370 WLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLR 419
||||||||||||||||||||||||||||||||||||||||||||||||||
401 WLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLR 450
. .
420 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 447
||||||||||||||||||||||||||||
451 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 478






Sequence name: /tmp/jvp1VtnxNy/wxNSeFVZZw:VTNC_HUMAN

Sequence documentation:

Alignment of: T39971_P11 x VTNC_HUMAN ..

Alignment segment 1/1:

Quality: 3576.00 Escore: 0
Matching length: 363 Total length: 478
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 75.94 Total Percent Identity: 75.94
Gaps: 1

Alignment:
. . . . .
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
. . . . .
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
. . . . .
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
. . . . .
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
. . . . .
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
. . . . .
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
. . . . .
301 VFEHFAMMQRDSWEDIFELLFWGRTS........................ 326
||||||||||||||||||||||||||
301 VFEHFAMMQRDSWEDIFELLFWGRTSAGTRQPQFISRDWHGVPGQVDAAM 350
. . . . .
326 .................................................. 326

351 AGRIYISGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRAT 400
. . . . .
327 .........................................DKYYRVNLR 335
|||||||||
401 WLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLR 450
. .
336 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 363
||||||||||||||||||||||||||||
451 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 478






Sequence name: /tmp/jvp1VtnxNy/wxNSeFVZZw:Q9BSH7

Sequence documentation:

Alignment of: T39971_P11 x Q9BSH7 ..

Alignment segment 1/1:

Quality: 3576.00 Escore: 0
Matching length: 363 Total length: 478
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 75.94 Total Percent Identity: 75.94
Gaps: 1

Alignment:
. . . . .
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
. . . . .
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
. . . . .
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
. . . . .
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
. . . . .
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
. . . . .
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
. . . . .
301 VFEHFAMMQRDSWEDIFELLFWGRTS........................ 326
||||||||||||||||||||||||||
301 VFEHFAMMQRDSWEDIFELLFWGRTSAGTRQPQFISRDWHGVPGQVDAAM 350
. . . . .
326 .................................................. 326

351 AGRIYISGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRAM 400
. . . . .
327 .........................................DKYYRVNLR 335
|||||||||
401 WLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLR 450
. .
336 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 363
||||||||||||||||||||||||||||
451 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 478






Sequence name: /tmp/fgebv7ir4i/48bTBMziJ0:VTNC_HUMAN

Sequence documentation:

Alignment of: T39971_P12 x VTNC_HUMAN ..

Alignment segment 1/1:

Quality: 2237.00 Escore: 0
Matching length: 223 Total length: 223
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
. . . . .
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
. . . . .
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
. . . . .
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
. .
201 GIEGPIDAAFTRINCQGKTYLFK 223
|||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFK 223






Sequence name: /tmp/fgebv7ir4i/48bTBMziJ0:Q9BSH7

Sequence documentation:

Alignment of: T39971_P12 x Q9BSH7 ..

Alignment segment 1/1:

Quality: 2237.00 Escore: 0
Matching length: 223 Total length: 223
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
. . . . .
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
. . . . .
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
. . . . .
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
. .
201 GIEGPIDAAFTRINCQGKTYLFK 223
|||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFK 223



Mutated protein alignment against previously known proteins:
Sequence name: / tmp / xkraCL2OcZ / 43L7YcPH7x: VTNC_HUMAN

Sequence documentation:

Alignment of: T39971_P6 x VTNC_HUMAN ..

Alignment segment 1/1:

Quality: 2774.00 Escore: 0
Matching length: 278 Total length: 278
Matching Percent Similarity: 99.64 Matching Percent Identity: 99.64
Total Percent Similarity: 99.64 Total Percent Identity: 99.64
Gaps: 0

Alignment:
....
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCCQCDECSYYQSC 50
||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCCQCDECSYYQSC 50
....
51 CTDYTAECKPQVTRGDVFTMPTEPEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPTEPEYTVYDDGEEKNNATVHEQVGGPSLTS 100
....
101 DLQAQKGNPQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||
101 DLQAQKGNPQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
....
151 AEEELCSGKPFDFFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDFFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
....
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGLPLDPDYPRNIDGFDGI 250
||||||||||||||||||||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGLPLDPDYPRNIDGFDGI 250
.
251 PDNVDAALALPAHSYSGRERVYFFKGTQ 278
||||||||||||||||||||||||
251 PDNVDAALALPAHSYSGRERVYFFKGKQ 278






Sequence name: / tmp / X4DeeuSlB4 / yMubSR5FPs: VTNC_HUMAN

Sequence documentation:

Alignment of: T39971_P9 x VTNC_HUMAN ..

Alignment segment 1/1:

Quality: 4430.00 Escore: 0
Matching length: 447 Total length: 478
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 93.51 Total Percent Identity: 93.51
Gaps: 1

Alignment:
....
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCCQCDECSYYQSC 50
||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCCQCDECSYYQSC 50
....
51 CTDYTAECKPQVTRGDVFTMPTEPEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPTEPEYTVYDDGEEKNNATVHEQVGGPSLTS 100
....
101 DLQAQKGNPQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||
101 DLQAQKGNPQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
....
151 AEEELCSGKPFDFFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDFFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
....
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGLPLDPDYPRNIDGFDGI 250
||||||||||||||||||||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGLPLDPDYPRNIDGFDGI 250
....
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
||||||||||||||||||||||||||||||||||||||||
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
....
301 VFEHFAM MQ RDSWEDIF ELFWGRT ..................................... 325
||||||||||||||||||||||||
301 VFEHFAMMQRDWSEDIFELLF WGRTS AGTRQPQ FISRDWGHVPGQVDAAM 350
....
326 ...... SGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRAT 369
||||||||||||||||||||||||||||||||||||||
351 AGRIYISGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRAT 400
....
370 WLSLFSSEESNLGANNYDDYRMDWLV PATCEPIQSFFFFSGDKYYRVNLR 419
||||||||||||||||||||||||||||||||||||||||
401 WLSLFSSEESNLGANNYDDYRMDWLV PATCEPIQSVFFFSGDKYYRVNLR 450
.
420 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 447
||||||||||||||||||||||||||
451 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 478






Sequence name: / tmp / jvp1VtnxNy / wxNSeFVZZw: VTNC_HUMAN

Sequence documentation:

Alignment of: T39971_P11 x VTNC_HUMAN ..

Alignment segment 1/1:

Quality: 3576.00 Escore: 0
Matching length: 363 Total length: 478
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 75.94 Total Percent Identity: 75.94
Gaps: 1

Alignment:
....
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCCQCDECSYYQSC 50
||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCCQCDECSYYQSC 50
....
51 CTDYTAECKPQVTRGDVFTMPTEPEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPTEPEYTVYDDGEEKNNATVHEQVGGPSLTS 100
....
101 DLQAQKGNPQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||
101 DLQAQKGNPQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
....
151 AEEELCSGKPFDFFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDFFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
....
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGLPLDPDYPRNIDGFDGI 250
||||||||||||||||||||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGLPLDPDYPRNIDGFDGI 250
....
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
||||||||||||||||||||||||||||||||||||||||
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
....
301 VFEHFAMMQRDWSEDIFELLFWGRTS ......................... 326
||||||||||||||||||||||||
301 VFEHFAMMQRDWSEDIFELLF WGRTS AGTRQPQ FISRDWGHVPGQVDAAM 350
....
326 ...................................................... 326

351 AGRIYISGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRAT 400
....
327 ..................................... DKYYRVNLR 335
|||||||||
401 WLSLFSSEESNLGANNYDDYRMDWLV PATCEPIQSVFFFSGDKYYRVNLR 450
.
336 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 363
||||||||||||||||||||||||||
451 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 478






Sequence name: / tmp / jvp1VtnxNy / wxNSeFVZZw: Q9BSH7

Sequence documentation:

Alignment of: T39971_P11 x Q9BSH7 ..

Alignment segment 1/1:

Quality: 3576.00 Escore: 0
Matching length: 363 Total length: 478
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 75.94 Total Percent Identity: 75.94
Gaps: 1

Alignment:
....
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCCQCDECSYYQSC 50
||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCCQCDECSYYQSC 50
....
51 CTDYTAECKPQVTRGDVFTMPTEPEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPTEPEYTVYDDGEEKNNATVHEQVGGPSLTS 100
....
101 DLQAQKGNPQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||
101 DLQAQKGNPQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
....
151 AEEELCSGKPFDFFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDFFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
....
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGLPLDPDYPRNIDGFDGI 250
||||||||||||||||||||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGLPLDPDYPRNIDGFDGI 250
....
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
||||||||||||||||||||||||||||||||||||||||
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
....
301 VFEHFAMMQRDWSEDIFELLFWGRTS ......................... 326
||||||||||||||||||||||||
301 VFEHFAMMQRDWSEDIFELLF WGRTS AGTRQPQ FISRDWGHVPGQVDAAM 350
....
326 ...................................................... 326

351 AGRIYISGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRAM 400
....
327 ..................................... DKYYRVNLR 335
|||||||||
401 WLSLFSSEESNLGANNYDDYRMDWLV PATCEPIQSVFFFSGDKYYRVNLR 450
.
336 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 363
||||||||||||||||||||||||||
451 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 478






Sequence name: / tmp / fgebv7ir4i / 48bTBMziJ0: VTNC_HUMAN

Sequence documentation:

Alignment of: T39971_P12 x VTNC_HUMAN ..

Alignment segment 1/1:

Quality: 2237.00 Escore: 0
Matching length: 223 Total length: 223
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCCQCDECSYYQSC 50
||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCCQCDECSYYQSC 50
....
51 CTDYTAECKPQVTRGDVFTMPTEPEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPTEPEYTVYDDGEEKNNATVHEQVGGPSLTS 100
....
101 DLQAQKGNPQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||
101 DLQAQKGNPQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
....
151 AEEELCSGKPFDFFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDFFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
.
201 GIEGPIDAAFTRINCQGKTYLFK 223
||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFK 223






Sequence name: / tmp / fgebv7ir4i / 48bTBMziJ0: Q9BSH7

Sequence documentation:

Alignment of: T39971_P12 x Q9BSH7 ..

Alignment segment 1/1:

Quality: 2237.00 Escore: 0
Matching length: 223 Total length: 223
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCCQCDECSYYQSC 50
||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCCQCDECSYYQSC 50
....
51 CTDYTAECKPQVTRGDVFTMPTEPEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPTEPEYTVYDDGEEKNNATVHEQVGGPSLTS 100
....
101 DLQAQKGNPQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||
101 DLQAQKGNPQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
....
151 AEEELCSGKPFDFFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDFFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
.
201 GIEGPIDAAFTRINCQGKTYLFK 223
||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFK 223



クラスターZ21368の説明
クラスターZ21368は、目的の7つの転写物および34個のセグメントを特徴とし、その名称を、それぞれ表82および83に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表84に示す。
Description of Cluster Z21368 Cluster Z21368 features 7 transcripts of interest and 34 segments, the names of which are shown in Tables 82 and 83, respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 84.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質である細胞外スルファターゼSulf−1前駆体(SwissProtアクセッション識別子SUL1_HUMAN、同義語はEC3.1.6−、HSulf−1としても公知である)(配列番号1419)の変異型である。   These sequences are known as extracellular sulfatase Sulf-1 precursor (SwissProt accession identifier SUL1_HUMAN, synonym EC1. Is also a variant of (SEQ ID NO: 1419).

タンパク質細胞外スルファターゼSulf−1前駆体は、以下の機能を有することが公知であるか、そのように見なされている:アリールスルファターゼ活性および高度に特異的なエンドグルコサミン−6−スルファターゼ活性を示す。これは、インタクトなヘパリンの特定の小区域内のグルコサミンのC−6位から硫酸塩を除去することができる。HSPG(ヘパラン硫酸プロテオグリカン)硫酸化を減少させ、ヘパリン依存性成長因子によるシグナル伝達を阻害し、増殖を減少させ、外因性刺激に対する応答のアポトーシスを容易にする。細胞外スルファターゼSulf−1前駆体の配列を、「細胞外スルファターゼSulf−1前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表85に示す。   The protein extracellular sulfatase Sulf-1 precursor is known or considered to have the following functions: It exhibits arylsulfatase activity and highly specific endoglucosamine-6-sulfatase activity. This can remove the sulfate from the C-6 position of glucosamine in certain sub-zones of intact heparin. It reduces HSPG (heparan sulfate proteoglycan) sulfation, inhibits heparin-dependent growth factor signaling, reduces proliferation and facilitates apoptosis in response to exogenous stimuli. The sequence of the extracellular sulfatase Sulf-1 precursor is shown at the end of the application as "extracellular sulfatase Sulf-1 precursor amino acid sequence". Known polymorphisms of this sequence are shown in Table 85.

Figure 2008507261
Figure 2008507261

タンパク質細胞外スルファターゼSulf−1前駆体の局在化は、小胞体およびゴルジ層板と考えられる。細胞表面上にも局在化している(類似性による)。   Localization of the protein extracellular sulfatase Sulf-1 precursor is considered to be the endoplasmic reticulum and Golgi lamina. It is also localized on the cell surface (due to similarity).

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けであるアポトーシス、代謝、ヘパラン硫酸プロテオグリカン代謝、分子機能に関連する注釈付けであるアリールスルファターゼ、ヒドロラーゼ、および細胞成分に関連する注釈付けである細胞外空間、小胞体、ゴルジ層板。   The following GO annotation applies to previously known proteins. The following annotations have been found: related to biological processes, such as apoptosis, metabolism, heparan sulfate proteoglycan metabolism, arylsulfatases that are related to molecular function, hydrolases, and cellular components. Annotated extracellular space, endoplasmic reticulum, Golgi stack.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

クラスターZ21368を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図13のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   Cluster Z21368 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The terms "numbers" in the right column of the table and the numbers on the y-axis of Fig. 13 refer to the weighted expression of ESTs in each category as "ppm" (the ppm of ESTs of a particular cluster in this category by ppm Ratio of expression to expression of all ESTs).

概して、図13および表86中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):上皮悪性脳腫瘍、異なる組織由来の悪性腫瘍の混合物、および膵臓癌。   In general, as shown for the histograms in FIG. 13 and Table 86, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: epithelial malignant brain tumors, a mixture of malignant tumors from different tissues, and pancreatic cancer.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、クラスターZ21368は、上の表1に列挙した7つの転写物を特徴とする。これらの転写物は、タンパク質細胞外スルファターゼSulf−1前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster Z21368 is characterized by the seven transcripts listed in Table 1 above. These transcripts encode proteins which are variants of the protein extracellular sulfatase Sulf-1 precursor. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質Z21368_PEA_1_P2は、出願書類の最後に示すアミノ酸配列を有し、転写物Z21368_PEA_1_T5によってコードされる。公知のタンパク質(細胞外スルファターゼSulf−1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein Z21368_PEA_1_P2 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript Z21368_PEA_1_T5. An alignment to a known protein (extracellular sulfatase Sulf-1 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

Z21368_PEA_1_P2とSUL1_HUMANとの比較の報告
1.SUL1_HUMANのアミノ酸1〜761に対応し、Z21368_PEA_1_P2のアミノ酸1〜761にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNと少なくとも90%相同な第1のアミノ酸配列と、Z21368_PEA_1_P2のアミノ酸762〜790に対応する配列PHKYSAHGRTRHFESATRTTNGAQKLSRIを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P2をコードする単離キメラポリペプチド。
Report on comparison of Z21368_PEA_1_P2 with SUL1_HUMAN 1. Corresponding to amino acids 1 to 761 of SUL1_HUMAN, corresponding to amino acids 1 to 761 of Z21368_PEA_1_P2 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNI QRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPT A first amino acid sequence at least 90% homologous to BuiarubuitieichikeishiefuaieruPienudiesuaieichishiiaruieruwaikyuesueiarueidaburyukeidieichikeieiwaiaidikeiiaiieierukyudikeiaikeienueruaruibuiarujieichierukeiaruarukeiPiiishiesushiesukeikyuesuwaiwaienukeiikeijibuikeikeikyuikeierukeiesueichierueichiPiefukeiieieikyuibuidiesukeierukyueruefukeiienuenuaruaruarukeikeiiarukeiikeiaruarukyuarukeijiEECSLPGLTCFTHDNNHWQTAPFWN, polypeptide at least 70% with a sequence corresponding to PHKYSAHGRTRHFESATRTTNGAQKLSRI to amino acid 762-790 of Z21368_PEA_1_P2, optionally at least 80%, preferably at least 85%, more preferably Comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, and An isolated chimeric polypeptide encoding Z21368_PEA_1_P2, wherein said first and second amino acid sequences are in contiguous and sequential order.

2.Z21368_PEA_1_P2中の配列PHKYSAHGRTRHFESATRTTNGAQKLSRIと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z21368_PEA_1_P2のテールをコードする単離ポリペプチド。   2. Z21368_PEA_1_P2 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence PHKYSAHGRTRHFESATRTTNGAQKLSRI in Z21368_PEA_1_P2 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The mutein is considered to be positioned as follows with respect to secretory cells. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質Z21368_PEA_1_P2は、以下の転写物によってコードされる:Z21368_PEA_1_T5(配列は出願書類の最後に示す)。転写物Z21368_PEA_1_T5のコード部分を太字で示し、このコード部分は529位から開始され、2898位で終結する。   The mutein Z21368_PEA_1_P2 is encoded by the following transcript: Z21368_PEA_1_T5 (sequences shown at the end of the application). The code portion of the transcript Z21368_PEA_1_T5 is shown in bold, starting from position 529 and ending at position 2898.

本発明の変異タンパク質Z21368_PEA_1_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物Z21368_PEA_1_T9によってコードされる。公知のタンパク質(細胞外スルファターゼSulf−1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein Z21368_PEA_1_P5 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript Z21368_PEA_1_T9. An alignment to a known protein (extracellular sulfatase Sulf-1 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

Z21368_PEA_1_P5とQ7Z2W2(配列番号1697)との比較の報告
1.Q7Z2W2のアミノ酸1〜57に対応し、Z21368_PEA_1_P5のアミノ酸1〜57にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELと少なくとも90%相同な第1のアミノ酸配列と、Aを含む第2の架橋アミノ酸配列と、Q7Z2W2のアミノ酸139〜871に対応し、Z21368_PEA_1_P5のアミノ酸59〜791にも対応するFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEGと少なくとも90%相同な第3のアミノ酸配列とを含み、前記第1、第2、および第3のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P5をコードする単離キメラポリペプチド。
Report on comparison of Z21368_PEA_1_P5 with Q7Z2W2 (SEQ ID NO: 1697). MKYSCCALVLAGLTEL GSL CST VRSPR SPR VRSPR FRG IQ corresponding to amino acids 1 to 57 of Q7Z2W2 and also to amino acids 1 to 57 of Z21368_PEA_1_P5 A first amino acid sequence that is at least 90% homologous to DER Q Corresponding to 871 and corresponding to amino acids 59 to 791 of Z21368_PEA_1_P5 FFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSYMMYPMRPVMVMISAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIPLPIP HMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADS NAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEG and and at least 90% homologous to a third amino acid sequence, wherein the first, second, and third amino acid distribution is in the order in which adjacent and contiguous, Z2 An isolated chimeric polypeptide encoding 1368_PEA_1_P5.

2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がLAFを含み、以下の構造(Z21368_PEA_1_P5に対応する番号付け):アミノ酸番号57−x〜57のいずれかから始まり、アミノ酸番号59+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、Z21368_PEA_1_P5の縁部分をコードする単離ポリペプチド。   2. Length “n” (wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long, most preferably at least about 50 amino acids long, at least two amino acids comprising LAF, the following structure (numbering corresponding to Z21368_PEA_1_P5): starting from any of amino acid numbers 57-x to 57, amino acid number 59+ ((n -2)-x) An isolated polypeptide encoding the edge portion of Z21368_PEA_1_P5, comprising a polypeptide, having a sequence terminating at: where x varies from 0 to n-2.

Z21368_PEA_1_P5とAAH12997(配列番号1698)との比較の報告
1.Z21368_PEA_1_P5のアミノ酸1〜751に対応する配列MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、AAH12997のアミノ酸1〜40に対応し、Z21368_PEA_1_P5のアミノ酸752〜791にも対応するLRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEGと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P5をコードする単離キメラポリペプチド。
Report on the comparison of Z21368_PEA_1_P5 with AAH12997 (SEQ ID NO: 1698). Corresponding to amino acids 1 to 751 of Z21368_PEA_1_P5 array MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVD KSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQ FKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNHNHQQTAPFWNLGSFCACTSSNNNTYWCLRTTVNETHNFLFCEFATGFLEYFDM T FLYNTTVHTVERGILN QL HTV QLME With a polypeptide having at least 70%, optionally at least 80%, preferably at least 85%, preferably at least 90%, most preferably at least 95H, To 40, and also to amino acids 752-791 of Z21368_PEA_1_P5, which comprises a second amino acid sequence that is at least 90% homologous to LRSCQGYKQ CNPRP KNLD GGN KD GSY DL HR G QLG WDEGEG, An isolated chimeric polypeptide encoding Z21368_PEA_1_P5, wherein the first and second amino acid sequences are in contiguous and sequential order.

2.Z21368_PEA_1_P5の配列MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMEと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z21368_PEA_1_P5の先端をコードする単離ポリペプチド。   2. Array of Z21368_PEA_1_P5 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPG RFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERK And at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous polypeptide H. Isolated polypeptide.

Z21368_PEA_1_P5とSUL1_HUMANとの比較の報告
1.SUL1_HUMANのアミノ酸1〜57に対応し、Z21368_PEA_1_P5のアミノ酸1〜57にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELと少なくとも90%相同な第1のアミノ酸配列と、SUL1_HUMANのアミノ酸138〜871に対応し、Z21368_PEA_1_P5のアミノ酸58〜791にも対応するAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEGと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P5をコードする単離キメラポリペプチド。
Report on comparison of Z21368_PEA_1_P5 with SUL1_HUMAN 1. The first amino acid sequence corresponding to amino acids 1 to 57 of SUL1_HUMAN and corresponding to amino acids 1 to 57 of Z21368_PEA_1_P5 MKYSCCALVLGELLTGSL CST VRSRPRSPRFTRGRIQQERKNIRPNIILVLTDQDVEL corresponding to amino acids 138 to 871 of SUL1_HUMAN, corresponding to amino acids 138 to 871 of SUL1_HUMAN Also corresponding to AFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKE KHGFDYAKDYFTDLITNESINYFK MS KRMMY PHRP VMVM VISHA PHGP EDSAPQ FSKLY PNAS QTPSYNYAPNMDKHWIMQYPTGPMLPIHMEFTNI QRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPT VRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEG and and at least 90% homologous to a second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, Z21368_PEA_1_P 5. An isolated chimeric polypeptide encoding 5.

2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がLAを含み、以下の構造:アミノ酸番号57−x〜57のいずれかから始まり、アミノ酸番号58+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、Z21368_PEA_1_T5の縁部分をコードする単離キメラポリペプチド。   2. Length “n” (wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long, most preferably at least about 50 amino acids in length, at least two amino acids comprising LA, starting from any of the following structures: amino acid numbers 57-x to 57, amino acid numbers 58 + ((n-2) -x) (formula An isolated chimeric polypeptide encoding an edge portion of Z21368_PEA_1_T5, comprising a polypeptide, having a sequence terminating in:), wherein x varies from 0 to n-2.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The mutein is considered to be positioned as follows with respect to secretory cells. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質Z21368_PEA_1_P5は、以下の転写物によってコードされる:Z21368_PEA_1_T9(配列は出願書類の最後に示す)。転写物Z21368_PEA_1_T9のコード部分を太字で示し、このコード部分は556位から開始され、2928位で終結する。   The mutein Z21368_PEA_1_P5 is encoded by the following transcript: Z21368_PEA_1_T9 (sequences shown at the end of the application). The code portion of the transcript Z21368_PEA_1_T9 is shown in bold, starting from position 556 and ending at position 2928.

本発明の変異タンパク質Z21368_PEA_1_P15は、出願書類の最後に示すアミノ酸配列を有し、転写物Z21368_PEA_1_T23によってコードされる。公知のタンパク質(細胞外スルファターゼSulf−1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein Z21368_PEA_1_P15 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript Z21368_PEA_1_T23. An alignment to a known protein (extracellular sulfatase Sulf-1 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

Z21368_PEA_1_P15とSUL1_HUMANとの比較の報告
1.SUL1_HUMANのアミノ酸1〜416に対応し、Z21368_PEA_1_P15のアミノ酸1〜416にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGと少なくとも90%相同な第1のアミノ酸配列を含む、Z21368_PEA_1_P15をコードする単離キメラポリペプチド。
Report on comparison of Z21368_PEA_1_P15 with SUL1_HUMAN 1. Corresponding to amino acids 1 to 416 of SUL1_HUMAN, corresponding to amino acids 1 to 416 of Z21368_PEA_1_P15 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTN LQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERG and containing at least 90% homologous first amino acid sequence, isolated chimeric polypeptide coding Z21368_PEA_1_P15.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The mutein is considered to be positioned as follows with respect to secretory cells. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質Z21368_PEA_1_P15は、以下の転写物によってコードされる:Z21368_PEA_1_T23(配列は出願書類の最後に示す)。転写物Z21368_PEA_1_T23のコード部分を太字で示し、このコード部分は691位から開始され、1938位で終結する。   The mutein Z21368_PEA_1_P15 is encoded by the following transcript: Z21368_PEA_1_T23 (sequences shown at the end of the application). The code portion of the transcript Z21368_PEA_1_T23 is shown in bold, starting from position 691 and ending at position 1938.

本発明の変異タンパク質Z21368_PEA_1_P16は、出願書類の最後に示すアミノ酸配列を有し、転写物Z21368_PEA_1_T24によってコードされる。公知のタンパク質(細胞外スルファターゼSulf−1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein Z21368_PEA_1_P16 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript Z21368_PEA_1_T24. An alignment to a known protein (extracellular sulfatase Sulf-1 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

Z21368_PEA_1_P16とSUL1_HUMANとの比較の報告
1.SUL1_HUMANのアミノ酸1〜397に対応し、Z21368_PEA_1_P16のアミノ酸1〜397にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRと少なくとも90%相同な第1のアミノ酸配列と、Z21368_PEA_1_P16のアミノ酸398〜410に対応する配列CVIVPPLSQPQIHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P16をコードする単離キメラポリペプチド。
Report on comparison of Z21368_PEA_1_P16 with SUL1_HUMAN 1. Corresponding to amino acids 1 to 397 of SUL1_HUMAN, corresponding to amino acids 1 to 397 of Z21368_PEA_1_P16 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTN LQRKRLQTLMSVDDSVERLYNMLVETYII YTADHGYHIGQFGLVKGKSMPYDFDIRVPFIRGPSVEPGSIVPQIV IVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEPKNR A first amino acid sequence of Z21368_PEA_1_P16, a sequence of 3 to 45 ° C, Is at least 90%, most preferably at least 95% homologous, with a second amino acid sequence, said first and second amino acid sequences being adjacent and in consecutive order, Z21368_PEA_ Isolated chimeric polypeptide encoding _P16.

2.Z21368_PEA_1_P16中の配列CVIVPPLSQPQIHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z21368_PEA_1_P16のテールをコードする単離ポリペプチド。   2. The Z21368_PEA_1_P16 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 90%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence CVIVPPLSQPQIH in Z21368_PEA_1_P16 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The mutein is considered to be positioned as follows with respect to secretory cells. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質Z21368_PEA_1_P16は、以下の転写物によってコードされる:Z21368_PEA_1_T24(配列は出願書類の最後に示す)。転写物Z21368_PEA_1_T24のコード部分を太字で示し、このコード部分は691位から開始され、1920位で終結する。   The mutein Z21368_PEA_1_P16 is encoded by the following transcript: Z21368_PEA_1_T24 (sequences shown at the end of the application). The code portion of the transcript Z21368_PEA_1_T24 is shown in bold, starting at position 691 and ending at position 1920.

本発明の変異タンパク質Z21368_PEA_1_P22は、出願書類の最後に示すアミノ酸配列を有し、転写物Z21368_PEA_1_T10によってコードされる。公知のタンパク質(細胞外スルファターゼSulf−1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein Z21368_PEA_1_P22 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript Z21368_PEA_1_T10. An alignment to a known protein (extracellular sulfatase Sulf-1 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

Z21368_PEA_1_P22とSUL1_HUMANとの比較の報告
1.SUL1_HUMANのアミノ酸1〜188に対応し、Z21368_PEA_1_P22のアミノ酸1〜188にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKと少なくとも90%相同な第1のアミノ酸配列と、Z21368_PEA_1_P22のアミノ酸189〜210に対応する配列ARYDGDQPRCAPRPRGLSPTVFを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P22をコードする単離キメラポリペプチド。
Report on comparison of Z21368_PEA_1_P22 with SUL1_HUMAN 1. Corresponding to amino acids 1-188 of SUL1_HUMAN, Poripepu having a MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAK corresponding to amino acids 1-188 of Z21368_PEA_1_P22 the first amino acid sequence at least 90% homologous, sequences corresponding to ARYDGDQPRCAPRPRGLSPTVF to amino acid 189-210 of Z21368_PEA_1_P22 And a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous, said first and second An isolated chimeric polypeptide encoding Z21368_PEA_1_P22, wherein the amino acid sequences of are in the contiguous and sequential order.

2.Z21368_PEA_1_P22中の配列ARYDGDQPRCAPRPRGLSPTVFと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z21368_PEA_1_P22のテールをコードする単離ポリペプチド。   2. Z21368_PEA_1_P22 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence ARYDGDQPRCAPRPRGSPTVF in Z21368_PEA_1_P22 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The mutein is considered to be positioned as follows with respect to secretory cells. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質Z21368_PEA_1_P22は、以下の転写物によってコードされる:Z21368_PEA_1_T10(配列は出願書類の最後に示す)。転写物Z21368_PEA_1_T10のコード部分を太字で示し、このコード部分は691位から開始され、1320位で終結する。   The mutein Z21368_PEA_1_P22 is encoded by the following transcript: Z21368_PEA_1_T10 (sequences shown at the end of the application). The code portion of transcript Z21368_PEA_1_T10 is shown in bold, starting at position 691 and ending at position 1320.

本発明の変異タンパク質Z21368_PEA_1_P23は、出願書類の最後に示すアミノ酸配列を有し、転写物Z21368_PEA_1_T11によってコードされる。公知のタンパク質(細胞外スルファターゼSulf−1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein Z21368_PEA_1_P23 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript Z21368_PEA_1_T11. An alignment to a known protein (extracellular sulfatase Sulf-1 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

Z21368_PEA_1_P23とQ7Z2W2との比較の報告
1.Q7Z2W2のアミノ酸1〜137に対応し、Z21368_PEA_1_P23のアミノ酸1〜137にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTと少なくとも90%相同な第1のアミノ酸配列と、Z21368_PEA_1_P23のアミノ酸138〜145に対応する配列GLLHRLNHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P23をコードする単離キメラポリペプチド。
Report of comparison between Z21368_PEA_1_P23 and Q7Z2W2. MKYSCALVLGELLGHSLCSTVRSRSLCSTVRSPRFRGRIQQ EH which corresponds to the amino acid 1 to 137 of the Q7Z2W2 and corresponds to the amino acid 1 to 137 of the Z21368_PEA_1_P23, and it is a UFJ 7 At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least And a 5% homologous second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, the isolated chimeric polypeptide coding Z21368_PEA_1_P23.

2.Z21368_PEA_1_P23中の配列GLLHRLNHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z21368_PEA_1_P23のテールをコードする単離ポリペプチド。   2. Z21368_PEA_1_P23 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence GLLHRLNH in Z21368_PEA_1_P23 An isolated polypeptide encoding a tail.

Z21368_PEA_1_P23とSUL1_HUMANとの比較の報告
1.SUL1_HUMANのアミノ酸1〜137に対応し、Z21368_PEA_1_P23のアミノ酸1〜137にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTと少なくとも90%相同な第1のアミノ酸配列と、Z21368_PEA_1_P23のアミノ酸138〜145に対応する配列GLLHRLNHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P23をコードする単離キメラポリペプチド。
Report on comparison of Z21368_PEA_1_P23 with SUL1_HUMAN 1. MKYSCAL VL ELL LG LSL CST VRS PR SPR FR G R IQ Q E R K NI Q N T L T Q D Q EL T G H T GH T RF IN Q GH T H RF NG N NH Y N H Y N H Y N H Y N H Y N H H N H Y N H Y N H H At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably small And a Kutomo 95% homologous second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, the isolated chimeric polypeptide coding Z21368_PEA_1_P23.

2.Z21368_PEA_1_P23中の配列GLLHRLNHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z21368_PEA_1_P23のテールをコードする単離ポリペプチド。   2. Z21368_PEA_1_P23 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence GLLHRLNH in Z21368_PEA_1_P23 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The mutein is considered to be positioned as follows with respect to secretory cells. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質Z21368_PEA_1_P23は、以下の転写物によってコードされる:Z21368_PEA_1_T11(配列は出願書類の最後に示す)。転写物Z21368_PEA_1_T11のコード部分を太字で示し、このコード部分は691位から開始され、1125位で終結する。   The mutein Z21368_PEA_1_P23 is encoded by the following transcript: Z21368_PEA_1_T11 (sequences shown at the end of the application). The coding part of the transcript Z21368_PEA_1_T11 is shown in bold, starting from position 691 and ending at position 1125.

上記のように、クラスターZ21368は、上の表2に列挙した34個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster Z21368 is characterized by the 34 segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターZ21368_PEA_1_node_0は、8個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:21368_PEA_1_T9。以下の表88は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_0 of the present invention is supported by eight libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: 21368_PEA_1_T9. Table 88 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_15は、26個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表89は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_15 of the present invention is supported by 26 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 89 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_19は、24個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、およびZ21368_PEA_1_T6。以下の表90は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_19 of the present invention is supported by 24 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, and Z21368_PEA_1_T6. Table 90 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_2は、15個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、およびZ21368_PEA_1_T6。以下の表91は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_2 of the present invention is supported by 15 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, and Z21368_PEA_1_T6. Table 91 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_21は、37個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表92は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_21 of the present invention is supported by 37 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 92 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_33は、45個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表93は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_33 of the present invention is supported by 45 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 93 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_36は、44個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表94は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_36 of the present invention is supported by 44 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 94 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_37は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T24。以下の表95は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_37 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z21368_PEA_1_T24. Table 95 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_39は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T23およびZ21368_PEA_1_T24。以下の表96は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_39 of the present invention is supported by five libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z21368_PEA_1_T23 and Z21368_PEA_1_T24. Table 96 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_4は、13個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、およびZ21368_PEA_1_T24。以下の表97は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_4 of the present invention is supported by 13 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, and Z21368_PEA_1_T24. Table 97 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_41は、49個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表98は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_41 of the present invention is supported by 49 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 98 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_43は、52個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表99は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_43 of the present invention is supported by 52 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 99 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_45は、64個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表100は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_45 of the present invention is supported by 64 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 100 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_53は、60個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表101は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_53 of the present invention is supported by 60 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 101 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_56は、50個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、およびZ21368_PEA_1_T9。以下の表102は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_56 of the present invention is supported by 50 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z21368_PEA_1_T10, Z21368_PEA_1_T11, and Z21368_PEA_1_T9. Table 102 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_58は、71個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表103は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_58 of the present invention is supported by 71 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 103 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_66は、142個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表104は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_66 of the present invention is supported by 142 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 104 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_67は、181個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表105は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_67 of the present invention is supported by 181 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 105 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_69は、150個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表106は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_69 of the present invention is supported by 150 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 106 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターZ21368_PEA_1_node_11は、26個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表107は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_11 of the present invention is supported by 26 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 107 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_12は、23個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表108は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_12 of the present invention is supported by 23 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 108 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_16を、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表109は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_16 according to the invention can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6, Z21368_PEA. Table 109 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_17は、19個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表110は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_17 of the present invention is supported by 19 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 110 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_23は、36個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表111は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_23 of the present invention is supported by 36 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 111 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_24は、36個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表112は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_24 of the present invention is supported by 36 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 112 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_30は、39個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表113は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_30 of the present invention is supported by 39 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 113 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_31は、40個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表114は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_31 of the present invention is supported by 40 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 114 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_38は、45個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表115は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_38 of the present invention is supported by 45 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 115 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_47は、61個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表116は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_47 of the present invention is supported by 61 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 116 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_49は、57個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表117は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_49 of the present invention is supported by 57 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 117 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_51は、46個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表118は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_51 of the present invention is supported by 46 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 118 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_61は、61個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表119は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_61 of the present invention is supported by 61 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 119 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_68は、87個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表120は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_68 of the present invention is supported by 87 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 120 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ21368_PEA_1_node_7は、29個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表121は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z21368_PEA_1_node_7 of the present invention is supported by 29 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 121 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

このクラスターの少なくとも一部の過剰発現を、オリゴヌクレオチドおよび1つまたは複数のチップによって決定した。結果は以下であった。オリゴヌクレオチドZ21368_0_0_61857をTAAチップ上に供し、肺癌(全体)、肺腺癌、および扁平上皮細胞癌で過剰発現することが見出された。   Overexpression of at least a portion of this cluster was determined by the oligonucleotide and one or more chips. The results were as follows. The oligonucleotide Z21368_0_0_61857 was provided on a TAA chip and found to be overexpressed in lung cancer (total), lung adenocarcinoma, and squamous cell carcinoma.

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/5ER3vIMKE2/9L0Y7lDlTQ:SUL1_HUMAN

Sequence documentation:

Alignment of: Z21368_PEA_1_P2 x SUL1_HUMAN ..

Alignment segment 1/1:

Quality: 7664.00 Escore: 0
Matching length: 761 Total length: 761
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . . . .
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
. . . . .
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
. . . . .
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
. . . . .
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
. . . . .
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
. . . . .
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
. . . . .
401 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 450
. . . . .
451 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 500
. . . . .
501 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 550
. . . . .
551 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 600
. . . . .
601 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 650
. . . . .
651 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 700
. . . . .
701 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 750
.
751 NNHWQTAPFWN 761
|||||||||||
751 NNHWQTAPFWN 761






Sequence name: /tmp/tt3yfXIUKV/YxSTFWr66h:Q7Z2W2

Sequence documentation:

Alignment of: Z21368_PEA_1_P5 x Q7Z2W2 ..

Alignment segment 1/1:

Quality: 7869.00 Escore: 0
Matching length: 791 Total length: 871
Matching Percent Similarity: 99.87 Matching Percent Identity: 99.87
Total Percent Similarity: 90.70 Total Percent Identity: 90.70
Gaps: 1

Alignment:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELA.......................................... 58
|||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . . . .
59 ......................................FFGKYLNEYNGS 70
||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTVFFGKYLNEYNGS 150
. . . . .
71 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 120
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
. . . . .
121 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 170
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
. . . . .
171 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 220
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
. . . . .
221 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 270
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
. . . . .
271 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 320
||||||||||||||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
. . . . .
321 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 370
||||||||||||||||||||||||||||||||||||||||||||||||||
401 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 450
. . . . .
371 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 420
||||||||||||||||||||||||||||||||||||||||||||||||||
451 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 500
. . . . .
421 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 470
||||||||||||||||||||||||||||||||||||||||||||||||||
501 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 550
. . . . .
471 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 520
||||||||||||||||||||||||||||||||||||||||||||||||||
551 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 600
. . . . .
521 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 570
||||||||||||||||||||||||||||||||||||||||||||||||||
601 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 650
. . . . .
571 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 620
||||||||||||||||||||||||||||||||||||||||||||||||||
651 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 700
. . . . .
621 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 670
||||||||||||||||||||||||||||||||||||||||||||||||||
701 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 750
. . . . .
671 NNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEY 720
||||||||||||||||||||||||||||||||||||||||||||||||||
751 NNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEY 800
. . . . .
721 FDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDV 770
||||||||||||||||||||||||||||||||||||||||||||||||||
801 FDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDV 850
. .
771 GNKDGGSYDLHRGQLWDGWEG 791
|||||||||||||||||||||
851 GNKDGGSYDLHRGQLWDGWEG 871






Sequence name: /tmp/tt3yfXIUKV/YxSTFWr66h:AAH12997

Sequence documentation:

Alignment of: Z21368_PEA_1_P5 x AAH12997 ..

Alignment segment 1/1:

Quality: 420.00 Escore: 0
Matching length: 40 Total length: 40
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . .
752 LRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEG 791
||||||||||||||||||||||||||||||||||||||||
1 LRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEG 40






Sequence name: /tmp/tt3yfXIUKV/YxSTFWr66h:SUL1_HUMAN

Sequence documentation:

Alignment of: Z21368_PEA_1_P5 x SUL1_HUMAN ..

Alignment segment 1/1:

Quality: 7878.00 Escore: 0
Matching length: 791 Total length: 871
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 90.82 Total Percent Identity: 90.82
Gaps: 1

Alignment:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVEL........................................... 57
|||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . . . .
58 .....................................AFFGKYLNEYNGS 70
|||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
. . . . .
71 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 120
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
. . . . .
121 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 170
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
. . . . .
171 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 220
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
. . . . .
221 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 270
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
. . . . .
271 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 320
||||||||||||||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
. . . . .
321 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 370
||||||||||||||||||||||||||||||||||||||||||||||||||
401 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 450
. . . . .
371 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 420
||||||||||||||||||||||||||||||||||||||||||||||||||
451 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 500
. . . . .
421 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 470
||||||||||||||||||||||||||||||||||||||||||||||||||
501 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 550
. . . . .
471 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 520
||||||||||||||||||||||||||||||||||||||||||||||||||
551 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 600
. . . . .
521 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 570
||||||||||||||||||||||||||||||||||||||||||||||||||
601 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 650
. . . . .
571 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 620
||||||||||||||||||||||||||||||||||||||||||||||||||
651 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 700
. . . . .
621 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 670
||||||||||||||||||||||||||||||||||||||||||||||||||
701 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 750
. . . . .
671 NNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEY 720
||||||||||||||||||||||||||||||||||||||||||||||||||
751 NNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEY 800
. . . . .
721 FDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDV 770
||||||||||||||||||||||||||||||||||||||||||||||||||
801 FDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDV 850
. .
771 GNKDGGSYDLHRGQLWDGWEG 791
|||||||||||||||||||||
851 GNKDGGSYDLHRGQLWDGWEG 871






Sequence name: /tmp/AVAZGWHuF0/RzHFOnHIsT:SUL1_HUMAN

Sequence documentation:

Alignment of: Z21368_PEA_1_P15 x SUL1_HUMAN ..

Alignment segment 1/1:

Quality: 4174.00 Escore: 0
Matching length: 416 Total length: 416
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . . . .
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
. . . . .
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
. . . . .
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
. . . . .
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
. . . . .
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
. . . . .
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
.
401 NKKAKIWRDTFLVERG 416
||||||||||||||||
401 NKKAKIWRDTFLVERG 416






Sequence name: /tmp/JhwgRdKqmt/kqSmjxkWWk:SUL1_HUMAN

Sequence documentation:

Alignment of: Z21368_PEA_1_P16 x SUL1_HUMAN ..

Alignment segment 1/1:

Quality: 3985.00 Escore: 0
Matching length: 397 Total length: 397
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . . . .
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
. . . . .
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
. . . . .
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
. . . . .
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
. . . . .
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
. . . .
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNR 397
|||||||||||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNR 397






Sequence name: /tmp/GPlnIw3BOg/zXFdxqG4ow:SUL1_HUMAN

Sequence documentation:

Alignment of: Z21368_PEA_1_P22 x SUL1_HUMAN ..

Alignment segment 1/1:

Quality: 1897.00 Escore: 0
Matching length: 188 Total length: 188
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . . . .
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
. . .
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAK 188
||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAK 188


Sequence name: /tmp/oji5Fs74fB/8xeB9KrGjp:Q7Z2W2

Sequence documentation:

Alignment of: Z21368_PEA_1_P23 x Q7Z2W2 ..

Alignment segment 1/1:

Quality: 1368.00 Escore: 0.000511
Matching length: 137 Total length: 137
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . .
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRT 137
|||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRT 137






Sequence name: /tmp/oji5Fs74fB/8xeB9KrGjp:SUL1_HUMAN

Sequence documentation:

Alignment of: Z21368_PEA_1_P23 x SUL1_HUMAN ..

Alignment segment 1/1:

Quality: 1368.00 Escore: 0.000511
Matching length: 137 Total length: 137
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . .
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRT 137
|||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRT 137



Mutated protein alignment against previously known proteins:
Sequence name: / tmp / 5ER3vIMKE2 / 9L0Y7lDlTQ: SUL1_HUMAN

Sequence documentation:

Alignment of: Z21368_PEA_1_P2 x SUL1_HUMAN ..

Alignment segment 1/1:

Quality: 7664.00 Escore: 0
Matching length: 761 Total length: 761
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MKYSCCALVLALGLGELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLALGLGELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
....
51 DDQDVELGSLQVMNKTRKIMEHGGAGTFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGAGTFINAFVTTPMCCPSRSSMLTGKYV 100
....
101 HNHNVYTNNENC SSP SW QAM HEPRTF AVYLNNTGYRTAFFGKYLNEYNGS 150
||||||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENC SSP SW QAM HEPRTF AVYLNNTGYRTAFFGKYLNEYNGS 150
....
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKE KHGFDYAKDYFTDLITNESI 200
||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKE KHGFDYAKDYFTDLITNESI 200
....
201 NYFKMSKRMMYPHRPVMMMVISHAAPHGPEDSAPQFSKLYPNA SQIPTSYN 250
||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMMYPHRPVMMMVISHAAPHGPEDSAPQFSKLYPNA SQIPTSYN 250
....
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
....
301 VETGELENTYII YTADHGYHIGQFGLVKGKSMPYDFDIRVPFIRGPSVE 350
||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYII YTADHGYHIGQFGLVKGKSMPYDFDIRVPFIRGPSVE 350
....
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
||||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
....
401 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 450
||||||||||||||||||||||||||||||||||||||||
401 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 450
....
451 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 500
||||||||||||||||||||||||||||||||||||||||
451 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 500
....
501 DKECSCRESGYRASRSQRKSMQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 550
||||||||||||||||||||||||||||||||||||||||
501 DKECSCRESGYRASRSQRKSMQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 550
....
551 EGEIYDINLEEEEEL QVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 600
||||||||||||||||||||||||||||||||||||||||
551 EGEIYDINLEEEEEL QVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 600
....
601 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 650
||||||||||||||||||||||||||||||||||||||||
601 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 650
....
651 EALQDKIKNLREVRGHLKRRK PEECSCSKQS YYNKEKGVKKQEKLKSHLH 700
||||||||||||||||||||||||||||||||||||||||
651 EALQDKIKNLREVRGHLKRRK PEECSCSKQS YYNKEKGVKKQEKLKSHLH 700
....
701 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRQRKGEECSLPGLTCFTHD 750
||||||||||||||||||||||||||||||||||||||||
701 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRQRKGEECSLPGLTCFTHD 750
.
751 NNHWQTAPFWN 761
|||||||||||
751 NNHWQTAPFWN 761






Sequence name: / tmp / tt3yfXIUKV / YxSTFWr66h: Q7Z2W2

Sequence documentation:

Alignment of: Z21368_PEA_1_P5 x Q7Z2W2 ..

Alignment segment 1/1:

Quality: 7869.00 Escore: 0
Matching length: 791 Total length: 871
Matching Percent Similarity: 99.87 Matching Percent Identity: 99.87
Total Percent Similarity: 90.70 Total Percent Identity: 90.70
Gaps: 1

Alignment:
....
1 MKYSCCALVLALGLGELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLALGLGELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
....
51 DDQDVELA ......................................... 58
||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGAGTFINAFVTTPMCCPSRSSMLTGKYV 100
....
59 ................................... FFGKYLNEYNGS 70
||||||||||||
101 HNHNVYTNNENC SSP SW QAM HEPRTF AVYLNN TG YRT VFF KKYLNEYNGS 150
....
71 YIPPGWREWLGLIKNSRFYNYTVCRNGIKE KHGFDYAKDYFTDLITNESI 120
||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKE KHGFDYAKDYFTDLITNESI 200
....
121 NYFKMSKRMMYPHRPVMMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 170
||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMMYPHRPVMMMVISHAAPHGPEDSAPQFSKLYPNA SQIPTSYN 250
....
171 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 220
||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
....
221 VETGELENTYII YTADHGYHIGQFGLVKGKSMPYDFDIRVPFIRGPSVE 270
||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYII YTADHGYHIGQFGLVKGKSMPYDFDIRVPFIRGPSVE 350
....
271 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 320
||||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
....
321 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 370
||||||||||||||||||||||||||||||||||||||||
401 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 450
....
371 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 420
||||||||||||||||||||||||||||||||||||||||
451 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 500
....
421 DKECSCRSGYRASRSQRKSMQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 470
||||||||||||||||||||||||||||||||||||||||
501 DKECSCRESGYRASRSQRKSMQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 550
....
471 EGEIYDINLEEEEELQ VLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 520
||||||||||||||||||||||||||||||||||||||||
551 EGEIYDINLEEEEEL QVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 600
....
521 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 570
||||||||||||||||||||||||||||||||||||||||
601 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 650
....
571 EALQDKIKNLREVRGHLKRRK PEECSCSKQS YYNKEKGVKKQEKLKSHLH 620
||||||||||||||||||||||||||||||||||||||||
651 EALQDKIKNLREVRGHLKRRK PEECSCSKQS YYNKEKGVKKQEKLKSHLH 700
....
621 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRQRKGEECSLPGLTCFTHD 670
||||||||||||||||||||||||||||||||||||||||
701 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRQRKGEECSLPGLTCFTHD 750
....
671 NNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEY 720
||||||||||||||||||||||||||||||||||||||||
751 NNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEY 800
....
721 FDMNTDPYQLTNTVHTVERGILNQLHVLMELRSCQGYKQCNPRPKNLDV 770
||||||||||||||||||||||||||||||||||||||||
801 FDMNTDPYQLTNTVHTVERGILNQLHVLMELRSCQGYKQCNPRPKNLDV 850
.
771 GNKDGGSYDLHRGQLWDGWEG 791
||||||||||||||||||||
851 GNKDGGSYDLHRGQLWDGWEG 871






Sequence name: / tmp / tt3yfXIUKV / YxSTFWr66h: AAH12997

Sequence documentation:

Alignment of: Z21368_PEA_1_P5 x AAH12997 ..

Alignment segment 1/1:

Quality: 420.00 Escore: 0
Matching length: 40 Total length: 40
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
752 LRSCQGYKQ CNPRP KNLD GGN KDGGSYDLHRGQLWDGWEG 791
|||||||||||||||||||||||||||||||||||
1 LRSCQGYKQ CNPRPKNLDV GGN KDGGSYDLHRGQLWDGWEG 40






Sequence name: / tmp / tt3yfXIUKV / YxSTFWr66h: SUL1_HUMAN

Sequence documentation:

Alignment of: Z21368_PEA_1_P5 x SUL1_HUMAN ..

Alignment segment 1/1:

Quality: 7878.00 Escore: 0
Matching length: 791 Total length: 871
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 90.82 Total Percent Identity: 90.82
Gaps: 1

Alignment:
....
1 MKYSCCALVLALGLGELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLALGLGELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
....
51 DDQDVEL ....................................... 57
||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGAGTFINAFVTTPMCCPSRSSMLTGKYV 100
....
58 ...................................... AFFGKYLNEYNGS 70
||||||||||||
101 HNHNVYTNNENC SSP SW QAM HEPRTF AVYLNNTGYRTAFFGKYLNEYNGS 150
....
71 YIPPGWREWLGLIKNSRFYNYTVCRNGIKE KHGFDYAKDYFTDLITNESI 120
||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKE KHGFDYAKDYFTDLITNESI 200
....
121 NYFKMSKRMMYPHRPVMMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 170
||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMMYPHRPVMMMVISHAAPHGPEDSAPQFSKLYPNA SQIPTSYN 250
....
171 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 220
||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
....
221 VETGELENTYII YTADHGYHIGQFGLVKGKSMPYDFDIRVPFIRGPSVE 270
||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYII YTADHGYHIGQFGLVKGKSMPYDFDIRVPFIRGPSVE 350
....
271 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 320
||||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
....
321 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 370
||||||||||||||||||||||||||||||||||||||||
401 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 450
....
371 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 420
||||||||||||||||||||||||||||||||||||||||
451 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 500
....
421 DKECSCRSGYRASRSQRKSMQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 470
||||||||||||||||||||||||||||||||||||||||
501 DKECSCRESGYRASRSQRKSMQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 550
....
471 EGEIYDINLEEEEELQ VLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 520
||||||||||||||||||||||||||||||||||||||||
551 EGEIYDINLEEEEEL QVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 600
....
521 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 570
||||||||||||||||||||||||||||||||||||||||
601 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 650
....
571 EALQDKIKNLREVRGHLKRRK PEECSCSKQS YYNKEKGVKKQEKLKSHLH 620
||||||||||||||||||||||||||||||||||||||||
651 EALQDKIKNLREVRGHLKRRK PEECSCSKQS YYNKEKGVKKQEKLKSHLH 700
....
621 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRQRKGEECSLPGLTCFTHD 670
||||||||||||||||||||||||||||||||||||||||
701 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRQRKGEECSLPGLTCFTHD 750
....
671 NNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEY 720
||||||||||||||||||||||||||||||||||||||||
751 NNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEY 800
....
721 FDMNTDPYQLTNTVHTVERGILNQLHVLMELRSCQGYKQCNPRPKNLDV 770
||||||||||||||||||||||||||||||||||||||||
801 FDMNTDPYQLTNTVHTVERGILNQLHVLMELRSCQGYKQCNPRPKNLDV 850
.
771 GNKDGGSYDLHRGQLWDGWEG 791
||||||||||||||||||||
851 GNKDGGSYDLHRGQLWDGWEG 871






Sequence name: / tmp / AVAZGWHuF0 / RzHFOnHIsT: SUL1_HUMAN

Sequence documentation:

Alignment of: Z21368_PEA_1_P15 x SUL1_HUMAN ..

Alignment segment 1/1:

Quality: 4174.00 Escore: 0
Matching length: 416 Total length: 416
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MKYSCCALVLALGLGELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLALGLGELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
....
51 DDQDVELGSLQVMNKTRKIMEHGGAGTFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGAGTFINAFVTTPMCCPSRSSMLTGKYV 100
....
101 HNHNVYTNNENC SSP SW QAM HEPRTF AVYLNNTGYRTAFFGKYLNEYNGS 150
||||||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENC SSP SW QAM HEPRTF AVYLNNTGYRTAFFGKYLNEYNGS 150
....
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKE KHGFDYAKDYFTDLITNESI 200
||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKE KHGFDYAKDYFTDLITNESI 200
....
201 NYFKMSKRMMYPHRPVMMMVISHAAPHGPEDSAPQFSKLYPNA SQIPTSYN 250
||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMMYPHRPVMMMVISHAAPHGPEDSAPQFSKLYPNA SQIPTSYN 250
....
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
....
301 VETGELENTYII YTADHGYHIGQFGLVKGKSMPYDFDIRVPFIRGPSVE 350
||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYII YTADHGYHIGQFGLVKGKSMPYDFDIRVPFIRGPSVE 350
....
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
||||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
.
401 NKKAKIWRDTFLVERG 416
||||||||||||||||
401 NKKAKIWRDTFLVERG 416






Sequence name: / tmp / JhwgRdKqmt / kqSmjxkWWk: SUL1_HUMAN

Sequence documentation:

Alignment of: Z21368_PEA_1_P16 x SUL1_HUMAN ..

Alignment segment 1/1:

Quality: 3985.00 Escore: 0
Matching length: 397 Total length: 397
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MKYSCCALVLALGLGELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLALGLGELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
....
51 DDQDVELGSLQVMNKTRKIMEHGGAGTFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGAGTFINAFVTTPMCCPSRSSMLTGKYV 100
....
101 HNHNVYTNNENC SSP SW QAM HEPRTF AVYLNNTGYRTAFFGKYLNEYNGS 150
||||||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENC SSP SW QAM HEPRTF AVYLNNTGYRTAFFGKYLNEYNGS 150
....
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKE KHGFDYAKDYFTDLITNESI 200
||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKE KHGFDYAKDYFTDLITNESI 200
....
201 NYFKMSKRMMYPHRPVMMMVISHAAPHGPEDSAPQFSKLYPNA SQIPTSYN 250
||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMMYPHRPVMMMVISHAAPHGPEDSAPQFSKLYPNA SQIPTSYN 250
....
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
....
301 VETGELENTYII YTADHGYHIGQFGLVKGKSMPYDFDIRVPFIRGPSVE 350
||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYII YTADHGYHIGQFGLVKGKSMPYDFDIRVPFIRGPSVE 350
....
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEPPGNR 397
|||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEPPGNR 397






Sequence name: / tmp / GPlnIw3BOg / zXFdxqG4ow: SUL1_HUMAN

Sequence documentation:

Alignment of: Z21368_PEA_1_P22 x SUL1_HUMAN ..

Alignment segment 1/1:

Quality: 1897.00 Escore: 0
Matching length: 188 Total length: 188
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MKYSCCALVLALGLGELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLALGLGELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
....
51 DDQDVELGSLQVMNKTRKIMEHGGAGTFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGAGTFINAFVTTPMCCPSRSSMLTGKYV 100
....
101 HNHNVYTNNENC SSP SW QAM HEPRTF AVYLNNTGYRTAFFGKYLNEYNGS 150
||||||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENC SSP SW QAM HEPRTF AVYLNNTGYRTAFFGKYLNEYNGS 150
....
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAK 188
|||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAK 188


Sequence name: / tmp / oji5Fs74fB / 8xeB9KrGjp: Q7Z2W2

Sequence documentation:

Alignment of: Z21368_PEA_1_P23 x Q7Z2W2 ..

Alignment segment 1/1:

Quality: 1368.00 Escore: 0.000511
Matching length: 137 Total length: 137
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MKYSCCALVLALGLGELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLALGLGELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
....
51 DDQDVELGSLQVMNKTRKIMEHGGAGTFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGAGTFINAFVTTPMCCPSRSSMLTGKYV 100
....
101 HNHNVYTNNENC SSP SW QAM HEPRTFAVYLNNTGYRT 137
||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENC SSP SW QAM HEPRTFAVYLNNTGYRT 137






Sequence name: / tmp / oji5Fs74fB / 8xeB9KrGjp: SUL1_HUMAN

Sequence documentation:

Alignment of: Z21368_PEA_1_P23 x SUL1_HUMAN ..

Alignment segment 1/1:

Quality: 1368.00 Escore: 0.000511
Matching length: 137 Total length: 137
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MKYSCCALVLALGLGELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLALGLGELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
....
51 DDQDVELGSLQVMNKTRKIMEHGGAGTFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGAGTFINAFVTTPMCCPSRSSMLTGKYV 100
....
101 HNHNVYTNNENC SSP SW QAM HEPRTFAVYLNNTGYRT 137
||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENC SSP SW QAM HEPRTFAVYLNNTGYRT 137



正常および癌性肺組織における配列名Z21368junc17−21中に示すアンプリコンによって検出可能なSUL1_HUMAN細胞外スルファターゼSulf−1Z21368転写物の発現
junc17−21セグメント、Z21368junc17−21アンプリコン (配列番号1642)、およびZ21368junc17−21F(配列番号1640)、Z21368junc17−21R(配列番号1641)プライマーによって検出可能なSUL1_HUMAN−細胞外スルファターゼSulf−1転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン、配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」、上記)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
Expression of SUL1_HUMAN extracellular sulfatase Sulf-1 Z21 368 transcript detectable by an amplicon as shown in sequence name Z21 368 jun c17 -21 in normal and cancerous lung tissue junc 17-21 segment, Z21 368 jun c17 -21 amplicon (SEQ ID NO 1642), and Z21 368 junc17 The expression of SUL1_HUMAN-extracellular sulfatase Sulf-1 transcripts detectable by -21F (SEQ ID NO: 1640), Z21368 junc 17-21 R (SEQ ID NO: 1641) primers was measured by real-time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – PBGD-Amplicon, SEQ ID No. 334), HPRT1 (GenBank Accession No. NM_000194, Amplicon – HPRT1- Amplicons, SEQ ID NO: 1297), Ubiquitin (GenBank Accession No. BC000449, Amplicon – Ubiquitin-Amplicon, SEQ ID NO: 328), and SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA-Amplifier Recon SEQ ID NO: 331) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. The normalized amount of each RT sample is the middle of the normal postmortem (PM) sample (sample numbers 47-50, 90-93, 96-99, Table 2, "tissue sample in test panel", above) Divide by the value to obtain the magnification of the upregulation of each sample relative to the median of normal PM samples.

図14は、正常サンプルと比較した癌性肺サンプルにおける上記SUL1_HUMAN−細胞外スルファターゼSulf−1転写物の過剰発現を示すヒストグラムである。値は、2連の実験の平均を示す。エラーバーは、得られた最小値および最大値を示す。図14から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なSUL1_HUMAN−細胞外スルファターゼSulf−1転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、15個の腺癌サンプルのうち10個、16個の扁平上皮細胞癌サンプルのうち16個、4個の大細胞癌サンプルのうち0個、8個の小細胞癌サンプルのうち0個で少なくとも5倍の過剰発現が見出された。   FIG. 14 is a histogram showing over expression of the SUL1_HUMAN-extracellular sulfatase Sulf-1 transcript in cancerous lung samples compared to normal samples. Values represent the average of duplicate experiments. Error bars indicate the obtained minimum and maximum values. As apparent from FIG. 14, the expression of SUL1_HUMAN-extracellular sulfatase Sulf-1 transcript detectable by the above amplicon in a cancer sample is a non-cancerous sample (sample numbers 47-50, 90-93, 96- 99, Table 2, "Tissue samples in test panel" was significantly higher. Clearly, 10 out of 15 adenocarcinoma samples, 16 out of 16 squamous cell carcinoma samples, 0 out of 4 large cell carcinoma samples, 0 out of 8 small cell carcinoma samples Over expression of at least 5 fold was found.

5倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、腺癌で3.56E−04、扁平上皮細胞癌で9.66E−03であった。上記値は、結果が統計的に有意であることを示す。   The 5-fold overexpression threshold was found to be different between cancer and normal samples, checked by Fisher's exact test, P value is 3.56E-04 for adenocarcinoma, squamous cell carcinoma in adenocarcinoma And 9.66E-03. The above values indicate that the results are statistically significant.

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:Z21368junc17−21F順方向プライマーおよびZ21368junc17−21R逆方向プライマー。   Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used only as non-limiting examples of suitable primer pairs: Z21368junc17-21F forward primer and Z21368 junc 17-21 R reverse primer.

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:Z21368junc17−21。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : Z21368 junc 17-21.

順方向プライマー(配列番号1640):GGACGGATACAGCAGGAACG
逆方向アンプリコン(配列番号1641):TATTTTCCAAAAAAGGCCAGCTC
アンプリコン(配列番号1642):GGACGGATACAGCAGGAACGAAAAAACATCCGACCCAACATTATTCTTGTGCTTACCGATGATCAAGATGTGGAGCTGGCCTTTTTTGGAAAATA
Forward primer (SEQ ID NO: 1640): GGACGGATACAGCAGGAACG
Reverse Amplicon (SEQ ID NO: 1641): TATTTTCCAAAAAGGGCCAGCT
Amplicon (SEQ ID NO: 1642): GGACGGATACAGCAGGAACAAAAAACATCCGACCCAACATTATTCTTGTGCTTACCGATGATCAAGATGTGGAGCTGGCCTTTTTTGAAAATA

異なる正常組織における配列名Z21368junc17−21中に示すアンプリコンによって検出可能なSUL1_HUMAN細胞外スルファターゼSulf−1Z21368転写物の発現
Z21368junc17−21アンプリコン(配列番号1642)、Z21368junc17−21F(配列番号1640)、およびZ21368junc17−21R(配列番号1641)によって検出可能なSUL1_HUMAN細胞外スルファターゼSulf−1転写物の発現を、実時間PCRによって測定した。並行して4つのハウスキーピング遺伝子−RPL19(GenBankアクセッション番号NM_000981、RPL19アンプリコン、配列番号1630)、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン、配列番号1633)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン、配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168;アンプリコン–SDHA−アンプリコン、配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、乳房サンプル(上記のサンプル番号33〜35、表3、「正常パネル中の組織サンプル」)の量の中央値で割って、乳房サンプルの中央値に対する各サンプルの相対発現値を得た。
Expression of SUL1_HUMAN extracellular sulfatase Sulf-1 Sulfate transcript detectable by an amplicon as shown in sequence name Z21368junc17-21 in different normal tissues Z21368junc17-21 amplicon (SEQ ID NO: 1642), Z21368 junc17-21F (SEQ ID NO: 1640), and The expression of SUL1_HUMAN extracellular sulfatase Sulf-1 transcripts detectable by Z21368 junc17-21R (SEQ ID NO: 1641) was measured by real time PCR. In parallel, four housekeeping genes-RPL19 (GenBank Accession No. NM_000981, RPL19 amplicon, SEQ ID No. 1630), TATA box (GenBank Accession No. NM_003194, TATA amplicon, SEQ ID No. 1633), ubiquitin (GenBank Accession No. BC000449, amplicon – ubiquitin amplicon, SEQ ID NO: 328), and SDHA (GenBank accession number NM_004168; amplicon >#8211; SDHA-amplicon, SEQ ID NO: 331) were similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. Divide the normalized amount of each RT sample by the median of the amount of breast samples (Sample Nos. 33-35 above, Table 3, "Tissue samples in normal panel"), to each sample relative to the median of breast samples The relative expression value of was obtained.


順方向プライマー(配列番号1640):GGACGGATACAGCAGGAACG
逆方向アンプリコン(配列番号1641):TATTTTCCAAAAAAGGCCAGCTC
アンプリコン(配列番号1642):GGACGGATACAGCAGGAACGAAAAAACATCCGACCCAACATTATTCTTGTGCTTACCGATGATCAAGATGTGGAGCTGGCCTTTTTTGGAAAATA

Forward primer (SEQ ID NO: 1640): GGACGGATACAGCAGGAACG
Reverse Amplicon (SEQ ID NO: 1641): TATTTTCCAAAAAGGGCCAGCT
Amplicon (SEQ ID NO: 1642): GGACGGATACAGCAGGAACAAAAAACATCCGACCCAACATTATTCTTGTGCTTACCGATGATCAAGATGTGGAGCTGGCCTTTTTTGAAAATA

結果を図15に示し、これは、異なる正常組織における配列名Z21368junc17−21中に示されたアンプリコンによって検出可能な細胞外スルファターゼSulf−1Z21368転写物の発現を示す。   The results are shown in FIG. 15, which shows the expression of extracellular sulfatase Sulf-1 Z21368 transcripts detectable by the amplicon shown in the sequence name Z21368 junc17-21 in different normal tissues.

正常および癌性肺組織における配列名Z21368seg39中に示すアンプリコンによって検出可能なSUL1_HUMAN−細胞外スルファターゼSulf−1Z21368転写物の発現
seg39、Z21368seg39アンプリコン(配列番号1645)、ならびにプライマーZ21368seg39F(配列番号1643)およびZ21368seg39R(配列番号1644)によって検出可能なSUL1_HUMAN−細胞外スルファターゼSulf−1転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
Expression of SUL1_HUMAN-extracellular sulfatase Sulf-1 Z21 368 transcript detectable by an amplicon shown in sequence name Z21 368 seg 39 in normal and cancerous lung tissue seg39, Z21 368 seg 39 amplicon (SEQ ID NO: 1645), and primer Z21 368 seg 39 F (SEQ ID NO: 1643) And the expression of SUL1_HUMAN-extracellular sulfatase Sulf-1 transcript detectable by Z21368 seg39R (SEQ ID NO: 1644) was measured by real time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – PBGD-Amplicon, SEQ ID No. 334), HPRT1 (GenBank Accession No. NM_000194, Amplicon – HPRT1- Amplicons, SEQ ID NO: 1297), Ubiquitin (GenBank Accession No. BC000449, Amplicon – Ubiquitin-Amplicon SEQ ID NO: 328), and SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA-Amplicon SEQ ID NO: 331) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. The normalized volume of each RT sample is the median volume of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99, Table 2, "tissue samples in the test panel") Divided to obtain the magnification of upregulation of each sample relative to the median of normal PM samples.

図16は、正常サンプルと比較した癌性肺サンプルにおける上記SUL1_HUMAN−細胞外スルファターゼSulf−1転写物の過剰発現を示すヒストグラムである。値は、2連の実験の平均を示す。エラーバーは、得られた最小値および最大値を示す。図16から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なSUL1_HUMAN−細胞外スルファターゼSulf−1転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、15個の腺癌サンプルのうち8個、16個の扁平上皮細胞癌サンプルのうち5個、および4個の大細胞癌サンプルのうち1個で少なくとも5倍の過剰発現が見出された。   FIG. 16 is a histogram showing over expression of the SUL1_HUMAN-extracellular sulfatase Sulf-1 transcript in cancerous lung samples compared to normal samples. Values represent the average of duplicate experiments. Error bars indicate the obtained minimum and maximum values. As apparent from FIG. 16, the expression of SUL1_HUMAN-extracellular sulfatase Sulf-1 transcript detectable by the above amplicon in a cancer sample is a non-cancerous sample (sample numbers 47-50, 90-93, 96- 99, Table 2, "Tissue samples in test panel" was significantly higher. Apparently, at least 5-fold overexpression was found in 8 out of 15 adenocarcinoma samples, 5 out of 16 squamous cell carcinoma samples, and 1 out of 4 large cell carcinoma samples. It was done.

下記のように、これらの結果の有意性を検証するために、統計分析に適用した。   Statistical analysis was applied to verify the significance of these results, as described below.

肺癌サンプル対正常組織サンプルにおける上記アンプリコンによって検出可能なSUL1_HUMAN−細胞外スルファターゼSulf−1転写物の発現レベルの相違についてのP値を、T検定によって、腺癌で2.17E−04、扁平上皮細胞癌で9.94E−03、大細胞癌で2.17E−01と決定された。   P value for differences in expression levels of SUL1_HUMAN-extracellular sulfatase Sulf-1 transcripts detectable by the above amplicon in lung cancer samples versus normal tissue samples, by T-test, 2.17E-04 in adenocarcinoma, squamous epithelium It was determined to be 9.94E-03 for cell carcinoma and 2.17E-01 for large cell carcinoma.

5倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、P値は、フィッシャーの正確確率検定によってチェックしたところ、腺癌で1.74E−02、扁平上皮細胞癌で1.58E−01であり、大細胞癌で4.33E−01であった。上記値は、結果が統計的に有意であることを示す。   The 5-fold overexpression threshold was found to be different between cancer and normal samples, and P value was checked by Fisher's exact test, 1.74E-02 for adenocarcinoma, squamous cell carcinoma Of the large cell carcinoma and 4.33 E-01. The above values indicate that the results are statistically significant.

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:Z21368seg39F順方向プライマーおよびZ21368seg39R逆方向プライマー。   Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used only as non-limiting examples of suitable primer pairs: Z21368 seg39 F forward primer and Z21 368 seg 39 R reverse Direction primer.

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:Z21368seg39。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : Z21368 seg 39.


プライマー:
順方向プライマー Z21368seg39F(配列番号1643):GTTGCATTTCTCAGTGCTGGTTT
逆方向プライマー Z21368seg39R(配列番号1644):AGGGTGCCGGGTGAGG
アンプリコン Z21368seg39(配列番号1645):GTTGCATTTCTCAGTGCTGGTTTCTAATCAGACCAGTGGATTGAGTTTCTCTACCATCCTCCCCACGTTCTTCTCTAAGCTGCCTCCAAGCCTCACCCGGCACCCT

Primer:
Forward primer Z21368seg39F (SEQ ID NO: 1643): GTTGCATTTCTCAGTGCTGGTTT
Reverse primer Z21368seg39R (SEQ ID NO: 1644): AGGGTGCCGGGTGAGG
Amplicon Z21368 seg 39 (SEQ ID NO: 1645): GTTGCATTTCTCAGTGCTGGTTTCTAATCAGACCAGTGGGATTGAGTTTCTACTACATCCTCCCCCACGTTCTTCTTAAGCTGGCTCCAAAGCCTCACCCGGCACCCT

異なる正常組織における配列名Z21368seg39中に示すアンプリコンによって検出可能なSUL1_HUMAN−細胞外スルファターゼSulf−1Z21368転写物の発現
Z21368seg39アンプリコン(配列番号1645)、Z21368seg39F(配列番号1643)、Z21368seg39R(配列番号1644)によって検出可能なSUL1_HUMAN−細胞外スルファターゼSulf−1転写物の発現を、実時間PCRによって測定した。並行して4つのハウスキーピング遺伝子−[RPL19(GenBankアクセッション番号NM_000981、RPL19アンプリコン,配列番号1630)、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン,配列番号1633)、UBC(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン、配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン、配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、乳房サンプル(上記のサンプル番号33〜35、表3)の量の中央値で割って、乳房サンプルの中央値に対する各サンプルの相対発現値を得た。
Expression of SUL1_HUMAN-extracellular sulfatase Sulf-1 Z21368 transcript detectable by an amplicon as shown in sequence name Z21368seg39 in different normal tissues Z21368seg39 amplicon (SEQ ID NO: 1645), Z21368 seg39F (SEQ ID NO: 1643), Z21368 seg39R (SEQ ID NO: 1644) The expression of SUL1_HUMAN-extracellular sulfatase Sulf-1 transcripts detectable by was measured by real-time PCR. In parallel, four housekeeping genes-[RPL19 (GenBank Accession No. NM_000981, RPL19 Amplicon, SEQ ID No. 1630), TATA box (GenBank Accession No. NM_003194, TATA Amplicon, SEQ ID No. 1633), UBC (GenBank Accession No. BC000449, amplicon – ubiquitin amplicon, SEQ ID NO: 328), and SDHA (GenBank Accession No. NM_004168, amplicon >#8211; SDHA amplicon, SEQ ID NO: 331) were similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. The normalized amount of each RT sample was divided by the median of the amounts of breast samples (Sample Nos. 33-35 above, Table 3) to obtain relative expression values of each sample relative to the median of breast samples.

順方向プライマー Z21368seg39F(配列番号1643):GTTGCATTTCTCAGTGCTGGTTT
逆方向プライマー Z21368seg39R(配列番号1644):AGGGTGCCGGGTGAGG
アンプリコンZ 21368seg39(配列番号1645):GTTGCATTTCTCAGTGCTGGTTTCTAATCAGACCAGTGGATTGAGTTTCTCTACCATCCTCCCCACGTTCTTCTCTAAGCTGCCTCCAAGCCTCACCCGGCACCCT
Forward primer Z21368seg39F (SEQ ID NO: 1643): GTTGCATTTCTCAGTGCTGGTTT
Reverse primer Z21368seg39R (SEQ ID NO: 1644): AGGGTGCCGGGTGAGG
Amplicon Z 21368 seg 39 (SEQ ID NO: 1645): GTTGCATTTCTCAGTGCTGGTTTCTAATCAGACCAGTGGGATTGAGTTTCTACTACATCCTCCCCCACGTTCTTCTTAAGCTGCCTCCAAGCCTCACCCGGCACCCT

結果を図17に示し、これは、異なる正常組織における配列名Z21368seg39中に示すアンプリコンによって検出可能なSUL1_HUMAN−細胞外スルファターゼSulf−1Z21368転写物の発現を示す。   The results are shown in FIG. 17, which shows the expression of SUL1_HUMAN-extracellular sulfatase Sulf-1 Z21368 transcripts detectable by the amplicon shown in the sequence name Z21368 seg39 in different normal tissues.

PBGD−アンプリコン(配列番号334)、HPRT1−アンプリコン(配列番号1297)、ユビキチン−アンプリコン(配列番号328)、SDHA−アンプリコン(配列番号331)、PBGD−アンプリコン(配列番号334)、HPRT1−アンプリコン(配列番号1297)、ユビキチン−アンプリコン(配列番号328)、SDHA−アンプリコン(配列番号331)、RPL19アンプリコン(配列番号1630)、TATAアンプリコン(配列番号1633)、ユビキチン−アンプリコン(配列番号328)、SDHA−アンプリコン(配列番号331)   PBGD-amplicon (SEQ ID NO: 334), HPRT1-amplicon (SEQ ID NO: 1297), ubiquitin-amplicon (SEQ ID NO: 328), SDHA-amplicon (SEQ ID NO: 331), PBGD-amplicon (SEQ ID NO: 334) HPRT1- amplicon (SEQ ID NO: 1297), ubiquitin amplicon (SEQ ID NO: 328), SDHA-amplicon (SEQ ID NO: 331), RPL19 amplicon (SEQ ID NO: 1630), TATA amplicon (SEQ ID NO: 1633), ubiquitin- Amplicon (SEQ ID NO: 328), SDHA-Amplicon (SEQ ID NO: 331)

クラスターHUMGRP5Eの説明
クラスターHUMGRP5Eは、目的の2つの転写物および5個のセグメントを特徴とし、その名称を、それぞれ表160および161に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表162に示す。
Description of cluster HUMGRP5E The cluster HUMGRP5E is characterized by two transcripts and five segments of interest, the names of which are shown in Tables 160 and 161 respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 162.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるガストリン放出ペプチド前駆体(SwissProtアクセッション識別子GRP_HUMAN、同義語はGRP、GRP−10)(配列番号1421)の変異型である。   These sequences are mutations of the known protein gastrin-releasing peptide precursor (SwissProt accession identifier GRP_HUMAN, synonym: GRP, GRP-10) (SEQ ID NO: 1421), which is a known protein, previously known herein as a protein It is a type.

ガストリン放出ペプチドは、以下の機能を有することが公知であるか、そのように見なされている:ガストリン放出および他の消化管ホルモンを刺激する。タンパク質ガストリン放出ペプチド前駆体の配列を、「ガストリン放出ペプチド前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表163に示す。   Gastrin releasing peptides are known or considered to have the following functions: to stimulate gastrin release and other gut hormones. The sequence of the protein gastrin releasing peptide precursor is shown at the end of the application as "gastrin releasing peptide precursor amino acid sequence". Known polymorphisms of this sequence are shown in Table 163.

Figure 2008507261
Figure 2008507261

タンパク質ガストリン放出ペプチドの局在化は、分泌と考えられる。   Localization of the protein gastrin releasing peptide is considered secretion.

以前に公知のタンパク質はまた、以下の適応症および/または潜在的治療用途を有する:II型糖尿病。ヒトにおける臨床/治療用途(例えば、抗体または小分子の標的として、および/または直接的な治療として)が調査されており、これらの調査に関連する利用可能な情報は以下である。以前に公知のタンパク質の潜在的な薬学的に関連するか治療に関連する活性は以下である:ボンベシンアンタゴニスト、インスリノトロピンアゴニスト。クラスターによって示されたタンパク質の治療における役割が予想されている。このタンパク質またはその一部を、潜在的治療に適用する(食欲抑制剤/肥満抑制薬、ホルモンの放出、抗癌、呼吸器、抗糖尿病薬)ために使用するか使用することができる薬物データベースまたは公的なデータベース(例えば、上記)に情報が存在するので、クラスターをこの分野に割り当てた。   The previously known proteins also have the following indications and / or potential therapeutic applications: Type II diabetes. Clinical / therapeutic applications in humans (e.g. as targets for antibodies or small molecules and / or as direct therapy) are being investigated and available information related to these investigations is: Potential pharmaceutically relevant or therapeutically relevant activities of previously known proteins are: bombesin antagonists, insulinotropin agonists. The therapeutic role of proteins displayed by clusters is expected. Drug database that can or can be used to apply this protein or part thereof for potential treatment (appetite / obesity suppressant, hormone release, anti-cancer, respiratory, anti-diabetic) Clusters were assigned to this area as the information exists in public databases (eg, above).

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けであるシグナル伝達、神経ペプチドシグナル伝達、分子機能に関連する注釈付けである成長因子、および細胞成分に関連する注釈付けである分泌。   The following GO annotation applies to previously known proteins. The following annotations have been found: in signal processing that is related to biological processes, neuropeptide signaling, growth factors that are related to molecular function, and in annotations related to cellular components. There is a secretion.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

上記のように、クラスターHUMGRP5Eは、上の表160に列挙した2つの転写物を特徴とする。これらの転写物は、タンパク質ガストリン放出ペプチド前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster HUMGRP5E is characterized by the two transcripts listed in Table 160 above. These transcripts encode proteins which are variants of the protein gastrin releasing peptide precursor. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質HUMGRP5E_P4は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMGRP5E_T4によってコードされる。公知のタンパク質(ガストリン放出ペプチド前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HUMGRP5E_P4 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HUMGRP5E_T4. An alignment to a known protein (gastrin releasing peptide precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HUMGRP5E_P4とGRP_HUMANとの比較の報告
1.GRP_HUMANのアミノ酸1〜127に対応し、HUMGRP5E_P4のアミノ酸1〜127にも対応するMRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLMGKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQPKALGNQQPSWDSEDSSNFKDVGSKGKと少なくとも90%相同な第1のアミノ酸配列と、GRP_HUMANのアミノ酸135〜148に対応し、HUMGRP5E_P4のアミノ酸128〜141にも対応するGSQREGRNPQLNQQと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、HUMGRP5E_P4をコードする単離キメラポリペプチド。
Report comparison of HUMGRP5E_P4 with GRP_HUMAN 1. MRGSELPLVLALGLCLAPGRAPGPAPGAGTGTVLTK MYPRGHNHWAGHMGKKSTGESSSVSERGSLLKQQLREY ARLEGLEKENQQPQALQQP QLSQDSS FK FK 対 応 対 応 対 応 対 応 GRP MR _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 7 HUMG comprising a second amino acid sequence that is at least 90% homologous to the corresponding GSQREGRNPQLNQQ, wherein said first and second amino acid sequences are adjacent and in sequential order Isolated chimeric polypeptide encoding P5E_P4.

2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がKGを含み、以下の構造:アミノ酸番号127−x〜127のいずれかから始まり、アミノ酸番号128+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HUMGRP5E_P4の縁部分をコードする単離キメラポリペプチド。   2. Length “n” (wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long, most preferably at least about 50 amino acids in length, at least two amino acids comprising KG, starting from any of the following structures: amino acid numbers 127-x to 127, amino acid numbers 128 + ((n-2) -x) (formula An isolated chimeric polypeptide encoding an edge portion of HUMGRP5E_P4, comprising a polypeptide, having a sequence terminating in: x) varying from 0 to n-2).

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HUMGRP5E_P4はまた、表164に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMGRP5E_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMGRP5E_P4 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 164) It indicates whether it is known and the presence of a known SNP in the mutant protein HUMGRP5E_P4 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質HUMGRP5E_P4は、以下の転写物によってコードされる:HUMGRP5E_T4(配列は出願書類の最後に示す)。転写物HUMGRP5E_T4のコード部分を太字で示し、このコード部分は622位から開始され、1044位で終結する。転写物はまた、表165に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMGRP5E_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMGRP5E_P4 is encoded by the following transcript: HUMGRP5E_T4 (sequences shown at the end of the application). The coding portion of the transcript HUMGRP5E_T4 is shown in bold, starting from position 622 and ending at position 1044. The transcript also has the following SNPs listed in Table 165 (indicating its position on the nucleotide sequence and listing another nucleic acid, the last column indicating whether the SNP is known, the mutein HUMGRP5E_P4 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質HUMGRP5E_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMGRP5E_T5によってコードされる。公知のタンパク質(ガストリン放出ペプチド前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HUMGRP5E_P5 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HUMGRP5E_T5. An alignment to a known protein (gastrin releasing peptide precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HUMGRP5E_P5とGRP_HUMANとの比較の報告
1.GRP_HUMANのアミノ酸1〜127に対応し、HUMGRP5E_P5のアミノ酸1〜127にも対応するMRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLMGKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQPKALGNQQPSWDSEDSSNFKDVGSKGKと少なくとも90%相同な第1のアミノ酸配列と、HUMGRP5E_P5のアミノ酸128〜142に対応する配列DSLLQVLNVKEGTPSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、HUMGRP5E_P5をコードする単離キメラポリペプチド。
Report comparison of HUMGRP5E_P5 with GRP_HUMAN 1. MHR GEL PLVLLULCLCLAPRAPGPRPGVLEGELLHCLHCLIPRAPGLPLPAGPGIPLEGCLIPTVLHCLIVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVCLVSPCLVCLV LYCLIPJHSPLJCLVJCLV LY, JHJHQHQHJLQQN. At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous And a acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, the isolated chimeric polypeptide coding HUMGRP5E_P5.

2.HUMGRP5E_P5中の配列DSLLQVLNVKEGTPSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMGRP5E_P5のテールをコードする単離ポリペプチド。   2. A HUMGRP5E_P5 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence DSLLQVLNVKEGTPS in HUMGRP5E_P5 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HUMGRP5E_P5はまた、表166に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMGRP5E_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMGRP5E_P5 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing the other amino acids, and listing the other amino acids, and the last column shows the SNPs), as shown in Table 166 It indicates whether it is known and the presence of a known SNP in the mutant protein HUMGRP5E_P5 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質HUMGRP5E_P5は、以下の転写物によってコードされる:HUMGRP5E_T5(配列は出願書類の最後に示す)。転写物HUMGRP5E_T5のコード部分を太字で示し、このコード部分は622位から開始され、1047位で終結する。転写物はまた、表167に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMGRP5E_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMGRP5E_P5 is encoded by the following transcript: HUMGRP5E_T5 (sequences shown at the end of the application). The coding part of the transcript HUMGRP5E_T5 is shown in bold, starting from position 622 and ending at position 1047. The transcript also has the following SNPs listed in Table 167 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, the mutein HUMGRP5E_P5 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターHUMGRP5Eは、上の表161に列挙した5個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster HUMGRP5E is characterized by the five segments listed in Table 161 above, the sequences of which are shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターHUMGRP5E_node_0は、21個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMGRP5E_T4およびHUMGRP5E_T5。以下の表168は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMGRP5E_node_0 of the present invention is supported by 21 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMGRP5E_T4 and HUMGRP5E_T5. Table 168 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMGRP5E_node_2は、27個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMGRP5E_T4およびHUMGRP5E_T5。以下の表169は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMGRP5E_node_2 of the present invention is supported by 27 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMGRP5E_T4 and HUMGRP5E_T5. Table 169 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMGRP5E_node_8は、26個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMGRP5E_T4およびHUMGRP5E_T5。以下の表170は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMGRP5E_node_8 of the present invention is supported by 26 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMGRP5E_T4 and HUMGRP5E_T5. Table 170 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターHUMGRP5E_node_3を、以下の転写物中に見出すことができる:HUMGRP5E_T4およびHUMGRP5E_T5。以下の表171は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMGRP5E_node_3 according to the invention can be found in the following transcript: HUMGRP5E_T4 and HUMGRP5E_T5. Table 171 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMGRP5E_node_7を、以下の転写物中に見出すことができる:HUMGRP5E_T5。以下の表172は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMGRP5E_node_7 according to the invention can be found in the following transcript: HUMGRP5E_T5. Table 172 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、この遺伝子のマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表173に示す)。   Microarray (chip) data of this gene is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (for lung cancer) (shown in Table 173).

Figure 2008507261
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/412zs2mwyT/B0wjOUAX0d:GRP_HUMAN

Sequence documentation:

Alignment of: HUMGRP5E_P4 x GRP_HUMAN ..

Alignment segment 1/1:

Quality: 1291.00 Escore: 0
Matching length: 141 Total length: 148
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 95.27 Total Percent Identity: 95.27
Gaps: 1

Alignment:
. . . . .
1 MRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLM 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLM 50
. . . . .
51 GKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQ 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 GKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQ 100
. . . .
101 PKALGNQQPSWDSEDSSNFKDVGSKGK.......GSQREGRNPQLNQQ 141
||||||||||||||||||||||||||| ||||||||||||||
101 PKALGNQQPSWDSEDSSNFKDVGSKGKVGRLSAPGSQREGRNPQLNQQ 148






Sequence name: /tmp/1me9ldnvfv/KbP5io8PtU:GRP_HUMAN

Sequence documentation:

Alignment of: HUMGRP5E_P5 x GRP_HUMAN ..

Alignment segment 1/1:

Quality: 1248.00 Escore: 0
Matching length: 127 Total length: 127
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLM 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLM 50
. . . . .
51 GKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQ 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 GKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQ 100
. .
101 PKALGNQQPSWDSEDSSNFKDVGSKGK 127
|||||||||||||||||||||||||||
101 PKALGNQQPSWDSEDSSNFKDVGSKGK 127


Mutated protein alignment against previously known proteins:
Sequence name: / tmp / 412zs2mwyT / B0wjOUAX0d: GRP_HUMAN

Sequence documentation:

Alignment of: HUMGRP5E_P4 x GRP_HUMAN ..

Alignment segment 1/1:

Quality: 1291.00 Escore: 0
Matching length: 141 Total length: 148
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 95.27 Total Percent Identity: 95.27
Gaps: 1

Alignment:
....
1 MRGSELPLVLLALVLCLAPGRAVPLPAGGGTVLTK MYPRGNHAWAVGHLM 50
||||||||||||||||||||||||||||||||||||||||
1 MRGSELPLVLLALVLCLAPGRAVPLPAGGGTVLTK MYPRGNHAWAVGHLM 50
....
51 GKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLEEAKENRNHQPPQ 100
||||||||||||||||||||||||||||||||||||||||
51 GKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLEEAKENRNHQPPQ 100
....
101 PKALGNQQPSWDSEDSSNFKDVGSKGGK ....... GSQREGRNPQLNQQ 141
||||||||||||||||||||||||||||||||||
101 PKALGNQQPSWDSEDSSNFKDVGSKGGKVGRLSAPGSQREGRNPQLNQQ 148






Sequence name: / tmp / 1me9ldnvfv / KbP5io8PtU: GRP_HUMAN

Sequence documentation:

Alignment of: HUMGRP5E_P5 x GRP_HUMAN ..

Alignment segment 1/1:

Quality: 1248.00 Escore: 0
Matching length: 127 Total length: 127
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MRGSELPLVLLALVLCLAPGRAVPLPAGGGTVLTK MYPRGNHAWAVGHLM 50
||||||||||||||||||||||||||||||||||||||||
1 MRGSELPLVLLALVLCLAPGRAVPLPAGGGTVLTK MYPRGNHAWAVGHLM 50
....
51 GKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLEEAKENRNHQPPQ 100
||||||||||||||||||||||||||||||||||||||||
51 GKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLEEAKENRNHQPPQ 100
.
101 PKALGNQQPSWDSEDSSNFKDVSKSGK 127
|||||||||||||||||||||||||
101 PKALGNQQPSWDSEDSSNFKDVSKSGK 127


正常および癌性肺組織における配列名HUMGRP5Ejunc3−7中に示すアンプリコンによって検出可能なGRP_HUMAN−ガストリン放出ペプチド(HUMGRP5E)転写物の発現
HUMGRP5Ejunc3−7アンプリコン(配列番号1648)、ならびにHUMGRP5Ejunc3−7F(配列番号1646)およびHUMGRP5Ejunc3−7R(配列番号1647)プライマーによって検出可能なGRP_HUMAN−ガストリン放出ペプチド転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験サンプル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
Expression of GRP_HUMAN-gastrin releasing peptide (HUMGRP5E) transcript detectable by an amplicon as shown in sequence name HUMGRP5Ejunc3-7 in normal and cancerous lung tissue HUMGRP5Ejunc3-7 amplicon (SEQ ID NO: 1648), and HUMGRP5Ejunc3-7F (sequence No. 1646) and HUMGRP5 Ejunc3-7R (SEQ ID NO: 1647) The expression of GRP_HUMAN-gastrin releasing peptide transcripts detectable by primers was measured by real-time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – PBGD-Amplicon, SEQ ID No. 334), HPRT1 (GenBank Accession No. NM_000194, Amplicon – HPRT1- Amplicons, SEQ ID NO: 1297), Ubiquitin (GenBank Accession No. BC000449, Amplicon – Ubiquitin-Amplicon SEQ ID NO: 328), and SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA-Amplicon SEQ ID NO: 331) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. The normalized amount of each RT sample is the median amount of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99, Table 2, "tissue samples in test samples") Divided to obtain the magnification of upregulation of each sample relative to the median of normal PM samples.

図16は、正常サンプルと比較したいくつかの癌性肺サンプルにおける上記GRP_HUMAN−ガストリン放出ペプチド転写物の過剰発現を示すヒストグラムである。図19から明らかなように、いくつかの癌サンプル中の上記アンプリコンによって検出可能なGRP_HUMAN−ガストリン放出ペプチド転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験サンプル中の組織サンプル」)よりも有意に高かった。明白には、15個の腺癌サンプルのうち2個および8個の小細胞癌サンプルのうち7個で少なくとも10倍の過剰発現が見出された。   FIG. 16 is a histogram showing over expression of the GRP_HUMAN-gastrin releasing peptide transcript in several cancerous lung samples compared to normal samples. As apparent from FIG. 19, the expression of GRP_HUMAN-gastrin releasing peptide transcripts detectable by the above amplicon in several cancer samples is a non-cancerous sample (sample numbers 47 to 50, 90 to 93, 96 to 99, Table 2, "Tissue samples in test samples" was significantly higher. Clearly, at least 10-fold overexpression was found in 2 out of 15 adenocarcinoma samples and 7 out of 8 small cell carcinoma samples.

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:HUMGRP5Ejunc3−7F順方向プライマーおよびHUMGRP5Ejunc3−7R逆方向プライマー。   Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used only as non-limiting examples of suitable primer pairs: HUMGRP5 Ejunc3-7F forward primer and HUMGRP5 Ejunc3-7R reverse primer.

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:HUMGRP5Ejunc3−7。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : HUMGRP5 Ejunc 3-7.


HUMGRP5Ejunc3−7F(配列番号1646)
ACCAGCCACCTCAACCCA
HUMGRP5Ejunc3−7R(配列番号1647)
CTGGAGCAGAGAGTCTTTGCCT
HUMGRP5Ejunc3−7(配列番号1648)
ACCAGCCACCTCAACCCAAGGCCCTGGGCAATCAGCAGCCTTCGTGGGATTCAGAGGATAGCAGCAACTTCAAAGATGTAGGTTCAAAAGGCAAAGACTCTCTGCTCCAG

HUMGRP5 Ejunc 3-7F (SEQ ID NO: 1646)
ACCAGGCACCTCCAACCCA
HUMGRP5 Ejunc 3-7R (SEQ ID NO: 1647)
CTGGAGCAGAGAGTCTTTGCCT
HUMGRP5 Ejunc 3-7 (SEQ ID NO: 1648)
ACCAGCC ACCTCA ACCCA AGGCCCTGGGCAATCAGCAGCCCTTCGTGGGATTCAGAGGATAGCAGCAACTTCAAAGATGTAGGTTCAAAAGGCAAAGACTCTCGTCC G

異なる正常組織における配列名HUMGRP5Ejunc3−7中に示すアンプリコンによって検出可能なGRP_HUMAN−ガストリン放出ペプチド(HUMGRP5E)転写物の発現
HUMGRP5Ejunc3−7アンプリコン(配列番号1648)、ならびにHUMGRP5Ejunc3−7F(配列番号1646)およびHUMGRP5Ejunc3−7R(配列番号1647)によって検出可能なGRP_HUMAN−ガストリン放出ペプチド転写物の発現を、実時間PCRによって測定した。並行して4つのハウスキーピング遺伝子−RPL19(GenBankアクセッション番号NM_000981、RPL19アンプリコン、配列番号1630)、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン,配列番号1633)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン、配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン、配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、乳房サンプル(上記のサンプル番号33〜35、表3、「正常パネルにおける組織サンプル」)の量の中央値で割って、乳房サンプルの中央値に対する各サンプルの相対発現値を得た。
Expression of GRP_HUMAN-gastrin releasing peptide (HUMGRP5E) transcript detectable by the amplicon shown in the sequence name HUMGRP5Ejunc3-7 in different normal tissues HUMGRP5Ejunc3-7 amplicon (SEQ ID NO: 1648), as well as HUMGRP5 Ejunc3-7F (SEQ ID NO: 1646) And expression of GRP_HUMAN-gastrin releasing peptide transcripts detectable by HUMGRP5Ejunc3-7R (SEQ ID NO: 1647) was measured by real time PCR. In parallel, four housekeeping genes-RPL19 (GenBank Accession No. NM_000981, RPL19 amplicon, SEQ ID No. 1630), TATA box (GenBank Accession No. NM_003194, TATA amplicon, SEQ ID No. 1633), ubiquitin (GenBank Accession No. BC000449, amplicon – ubiquitin-amplicon, SEQ ID NO: 328), and SDHA (GenBank accession number NM_004168, amplicon – SDHA-amplicon, SEQ ID NO: 331) were similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. Divide the normalized amount of each RT sample by the median of the amount of breast samples (Sample Nos. 33-35 above, Table 3, "Tissue Samples in Normal Panel") to obtain each sample relative to the median of breast samples Relative expression values were obtained.


HUMGRP5Ejunc3−7F(配列番号1646)
ACCAGCCACCTCAACCCA
HUMGRP5Ejunc3−7R(配列番号1647)
CTGGAGCAGAGAGTCTTTGCCT
HUMGRP5Ejunc3−7(配列番号1648)
ACCAGCCACCTCAACCCAAGGCCCTGGGCAATCAGCAGCCTTCGTGGGATTCAGAGGATAGCAGCAACTTCAAAGATGTAGGTTCAAAAGGCAAAGACTCTCTGCTCCAG

HUMGRP5 Ejunc 3-7F (SEQ ID NO: 1646)
ACCAGGCACCTCCAACCCA
HUMGRP5 Ejunc 3-7R (SEQ ID NO: 1647)
CTGGAGCAGAGAGTCTTTGCCT
HUMGRP5 Ejunc 3-7 (SEQ ID NO: 1648)
ACCAGCC ACCTCA ACCCA AGGCCCTGGGCAATCAGCAGCCCTTCGTGGGATTCAGAGGATAGCAGCAACTTCAAAGATGTAGGTTCAAAAGGCAAAGACTCTCGTCC G

結果を図20に示し、これは、異なる正常組織における配列名HUMGRP5Ejunc3−7中に示すアンプリコンによって検出可能なGRP_HUMAN−ガストリン放出ペプチド(HUMGRP5E)転写物の発現転写物の発現を示す。   The results are shown in FIG. 20, which shows the expression transcripts of GRP_HUMAN-gastrin releasing peptide (HUMGRP5E) transcript detectable by an amplicon as shown in the sequence name HUMGRP5Ejunc3-7 in different normal tissues.

クラスターD56406の説明
クラスターD56406は、目的の3つの転写物および10個のセグメントを特徴とし、その名称を、それぞれ表174および175に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表176に示す。
Description of Cluster D56406 Cluster D56406 features 3 transcripts of interest and 10 segments, the names of which are shown in Tables 174 and 175, respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 176.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるニューロテンシン/ニューロメジンN前駆体(以下を含む:大ニューロメジンN(Large neuromedin N)(NmN−125)、ニューロメジンN(NmN)(NN)、ニューロテンシン(NT)、テールペプチド)(SwissProtアクセッション識別子NEUT_HUMAN)(配列番号1422)の変異型である。   These sequences are known proteins, previously known herein as proteins known as neurotensin / neuromedin N precursor (including: large neuromedin N) (NmN-125), neuromedin N (NmN) (NN), neurotensin (NT), tail peptide) (SwissProt accession identifier NEUT_HUMAN) (SEQ ID NO: 1422).

タンパク質ニューロテンシン/ニューロメジンN前駆体は、以下の機能を有することが公知であるか、そのように見なされている:ニューロテンシンは脂肪代謝の調節において内分泌または傍分泌の役割を果たし得る。これにより、平滑筋の収縮が起こる。タンパク質ニューロテンシン/ニューロメジンN前駆体の配列を、「ニューロテンシン/ニューロメジンN前駆体(以下を含む:大ニューロメジンN(NmN−125)、ニューロメジンN(NmN)(NN)、ニューロテンシン(NT)、テールペプチド)アミノ酸配列」として出願書類の最後に示す。タンパク質ニューロテンシン/ニューロメジンN前駆体の局在化は、分泌と考えられる(分泌小胞内へのパッケージング)。   The protein neurotensin / neuromedin N precursor is known or considered to have the following function: Neurotensin may play an endocrine or paracrine role in the regulation of fat metabolism. This causes contraction of smooth muscle. The sequence of the protein neurotensin / neuromedin N precursor “neurotensin / neuromedin N precursor (including: large neuromedin N (NmN-125), neuromedin N (NmN) (NN), neurotensin (NT), tail It is shown at the end of the application as "peptide" amino acid sequence ". The localization of the protein neurotensin / neuromedin N precursor is considered to be secretion (packaging into secretory vesicles).

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けであるシグナル伝達、分子機能に関連する注釈付けである神経ペプチドホルモン、および細胞成分に関連する注釈付けである可溶性画分。   The following GO annotation applies to previously known proteins. The following annotations were found: signal transduction that is related to biological processes, signal transduction that is related to molecular functions, neuropeptide hormones that are related to molecular functions, and soluble fractions that are annotated related to cellular components .

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

上記のように、クラスターD56406は、上の表174に列挙した3つの転写物を特徴とする。これらの転写物は、ニューロテンシン/ニューロメジンN前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster D56406 is characterized by the three transcripts listed in Table 174 above. These transcripts encode a protein that is a mutated form of neurotensin / neuromedin N precursor. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質D56406_PEA_1_P2は、出願書類の最後に示すアミノ酸配列を有し、転写物D56406_PEA_1_T3によってコードされる。公知のタンパク質(ニューロテンシン/ニューロメジンN前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein D56406_PEA_1_P2 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript D56406_PEA_1_T3. An alignment to a known protein (neurotensin / neuromedin N precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

D56406_PEA_1_P2とNEUT_HUMANとの間の比較の報告
1.NEUT_HUMANのアミノ酸1〜120に対応し、D56406_PEA_1_P2のアミノ酸1〜120にも対応するMMAGMKIQLVCMLLLAFSSWSLCSDSEEEMKALEADFLTNMHTSKISKAHVPSWKMTLLNVCSLVNNLNSPAEETGEVHEEELVARRKLPTALDGFSLEAMLTIYQLHKICHSRAFQHWEと少なくとも90%相同な第1のアミノ酸配列と、D56406_PEA_1_P2のアミノ酸121〜151に対応する配列ARWLTPVIPALWEAETGGSRGQEMETIPANTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列と、NEUT_HUMANのアミノ酸121〜170に対応し、D56406_PEA_1_P2のアミノ酸152〜201にも対応するLIQEDILDTGNDKNGKEEVIKRKIPYILKRQLYENKPRRPYILKRDSYYYと少なくとも90%相同な第3のアミノ酸配列とを含み、前記第1、第2、および第3のアミノ酸配が、隣接し、且つ連続した順序にある、D56406_PEA_1_P2をコードする単離キメラポリペプチド。
Report of the comparison between D56406_PEA_1_P2 and NEUT_HUMAN 1. A corresponding MMA GMlQl vmllla fssl ssd sDsL sDs s s corresponding to amino acids 1-120 of NEUT_HUMAN and d56 406 _ PEA _ P2 s s s s s s s s s s s s s s s s s s At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferred Or a second amino acid sequence that is at least 95% homologous, and a third amino acid sequence that is at least 90% homologous to LIQEDILDTGNDNGNGKEEVIKRKIPYILKRQLYENKPRRPYILKRDSYYY corresponding to amino acids 121 to 170 of NEUT_HUMAN and also to amino acids 152 to 201 of D56406_PEA_1_P2 An isolated chimeric polypeptide encoding D56406_PEA_1_P2, wherein said first, second and third amino acid sequences are in contiguous and sequential order.

2.D56406_PEA_1_P2に対応するARWLTPVIPALWEAETGGSRGQEMETIPANTをコードする配列と少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なアミノ酸配列を含む、D56406_PEA_1_P2の縁部分をコードする単離ポリペプチド。   2. An amino acid sequence at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence encoding ARWLTPVIPALWEAETGGSRGQEMETIPANT corresponding to D56406_PEA_1_P2 An isolated polypeptide encoding the edge portion of D56406_PEA_1_P2 comprising.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質D56406_PEA_1_P2はまた、表177に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質D56406_PEA_1_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein D56406_PEA_1_P2 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids and listing the other amino acids, as shown in Table 177), and the last column shows the SNP It is shown whether it is known and the presence of a known SNP in the mutein D56406_PEA_1_P2 sequence supports the putative sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質D56406_PEA_1_P2は、以下の転写物によってコードされる:D56406_PEA_1_T3(配列は出願書類の最後に示す)。転写物D56406_PEA_1_T3のコード部分を太字で示し、このコード部分は106位から開始され、708位で終結する。転写物はまた、表178に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質D56406_PEA_1_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein D56406_PEA_1_P2 is encoded by the following transcript: D56406_PEA_1_T3 (sequences shown at the end of the application). The code portion of transcript D56406_PEA_1_T3 is shown in bold and starts at position 106 and ends at position 708. The transcript also has the following SNPs listed in Table 178 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein D56406_PEA_1_P2 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質D56406_PEA_1_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物D56406_PEA_1_T6によってコードされる。公知のタンパク質(ニューロテンシン/ニューロメジンN前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein D56406_PEA_1_P5 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript D56406_PEA_1_T6. An alignment to a known protein (neurotensin / neuromedin N precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

D56406_PEA_1_P5とNEUT_HUMANとの間の比較の報告
1.NEUT_HUMANのアミノ酸1〜23に対応し、D56406_PEA_1_P5のアミノ酸1〜23にも対応するMMAGMKIQLVCMLLLAFSSWSLCと少なくとも90%相同な第1のアミノ酸配列と、NEUT_HUMANのアミノ酸26〜170に対応し、D56406_PEA_1_P5のアミノ酸24〜168にも対応するSEEEMKALEADFLTNMHTSKISKAHVPSWKMTLLNVCSLVNNLNSPAEETGEVHEEELVARRKLPTALDGFSLEAMLTIYQLHKICHSRAFQHWELIQEDILDTGNDKNGKEEVIKRKIPYILKRQLYENKPRRPYILKRDSYYYと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、D56406_PEA_1_P5をコードする単離キメラポリペプチド。
Report of the comparison between D56406_PEA_1_P5 and NEUT_HUMAN 1. A first amino acid sequence that is at least 90% homologous to MMAGMKI QL VCMCLLA FSS SWLC corresponding to amino acids 1-23 of NEUT_HUMAN and also to amino acids 1-23 of D56406_PEA_1_P5 and amino acids 24-168 of D56406_PEA_1_P5 corresponding to amino acids 26-170 of NEUT_HUMAN SEEMKALEADLFLTNMHTSKISKAHVPSWKMTLLNVCSLVNLNNSPAEETGEVHEEEL VARRKLPTALDSLEAMLTI YQLHKICHSRAFQHWELIQEDILDTGDNGNGNGEKEVK IKRIQLYENKPRQYRPKILSYDSY comprising a second amino acid sequence comprising at least a 90% homology to the first Preliminary second amino acid distribution is contiguous, and in sequential order, the isolated chimeric polypeptide coding D56406_PEA_1_P5.

2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がCSを含み、以下の構造:アミノ酸番号23−x〜23のいずれかから始まり、アミノ酸番号24+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、D56406_PEA_1_P5の縁部分をコードする単離キメラポリペプチド。   2. Length “n” (wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long, most preferably at least about 50 amino acids in length, at least two amino acids comprising CS, starting from any of the following structures: amino acid numbers 23-x-23, amino acid numbers 24 + ((n-2) -x) (formula D56406_PEA_1_P5 isolated chimeric polypeptide comprising a polypeptide, wherein the polypeptide has a sequence terminating in: x) varying from 0 to n-2).

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質D56406_PEA_1_P5はまた、表179に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質D56406_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein D56406_PEA_1_P5 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column, as shown in Table 179); It indicates whether it is known and the presence of a known SNP in the mutein D56406_PEA_1_P5 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質D56406_PEA_1_P5は、以下の転写物によってコードされる:D56406_PEA_1_T6(配列は出願書類の最後に示す)。転写物D56406_PEA_1_T6のコード部分を太字で示し、このコード部分は106位から開始され、609位で終結する。転写物はまた、表180に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質D56406_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein D56406_PEA_1_P5 is encoded by the following transcript: D56406_PEA_1_T6 (sequences shown at the end of the application). The code portion of transcript D56406_PEA_1_T6 is shown in bold, starting at position 106 and ending at position 609. The transcript also has the following SNPs listed in Table 180 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein D56406_PEA_1_P5 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質D56406_PEA_1_P6は、出願書類の最後に示すアミノ酸配列を有し、転写物D56406_PEA_1_T7によってコードされる。公知のタンパク質(ニューロテンシン/ニューロメジンN前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein D56406_PEA_1_P6 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript D56406_PEA_1_T7. An alignment to a known protein (neurotensin / neuromedin N precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

D56406_PEA_1_P6とNEUT_HUMANとの間の比較の報告
1.NEUT_HUMANのアミノ酸1〜45に対応し、D56406_PEA_1_P6のアミノ酸1〜45にも対応するMMAGMKIQLVCMLLLAFSSWSLCSDSEEEMKALEADFLTNMHTSKと少なくとも90%相同な第1のアミノ酸配列と、NEUT_HUMANのアミノ酸121〜170に対応し、D56406_PEA_1_P6のアミノ酸46〜95にも対応するLIQEDILDTGNDKNGKEEVIKRKIPYILKRQLYENKPRRPYILKRDSYYYと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、D56406_PEA_1_P6をコードする単離キメラポリペプチド。
Report of the comparison between D56406_PEA_1_P6 and NEUT_HUMAN 1. The first amino acid sequence corresponding to amino acids 1 to 45 of NEUT_HUMAN, corresponding to amino acids 1 to 45 of D56406_PEA_1_P6, also corresponds to amino acids 121 to 170 of NEUT_HUMAN, amino acids 46 to 95 of D56406_PEA_1_P6, corresponding to amino acids 121 to 170 of NEUT_HUMAN An isolated chimeric polypeptide encoding D56406_PEA_1_P6, comprising a second amino acid sequence which is at least 90% homologous to LIQEDILDTGND KNGKEEVIKRKIPYILKRQLYENKPRRPYILKRDSYYY, which also corresponds to SEQ ID NO: 1, the first and second amino acid sequences being adjacent and in a consecutive order .

2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がKLを含み、以下の構造:アミノ酸番号45−x〜45のいずれかから始まり、アミノ酸番号46+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、D56406_PEA_1_P6の縁部分をコードする単離キメラポリペプチド。   2. Length “n” (wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long, most preferably at least about 50 amino acids long, at least two amino acids comprising KL, starting from any of the following structures: amino acids 45-x-45, amino acids 46 + ((n-2) -x) (formula A D56406_PEA_1_P6 isolated chimeric polypeptide comprising a polypeptide, wherein the polypeptide has a sequence terminating in: x) varying from 0 to n-2).

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質D56406_PEA_1_P6はまた、表181に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質D56406_PEA_1_P6配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein D56406_PEA_1_P6 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing the other amino acids, and listing the other amino acids, as shown in Table 181), and the last column contains SNPs It is shown whether it is known and the presence of a known SNP in the mutein D56406_PEA_1_P6 sequence supports the putative sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質D56406_PEA_1_P6は、以下の転写物によってコードされる:D56406_PEA_1_T7(配列は出願書類の最後に示す)。転写物D56406_PEA_1_T7のコード部分を太字で示し、このコード部分は106位から開始され、390位で終結する。転写物はまた、表182に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質D56406_PEA_1_P6配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein D56406_PEA_1_P6 is encoded by the following transcript: D56406_PEA_1_T7 (sequences shown at the end of the application). The code portion of transcript D56406_PEA_1_T7 is shown in bold and begins at position 106 and ends at position 390. The transcript also has the following SNPs listed in Table 182 (indicating its position on the nucleotide sequence and listing another nucleic acid, the last column indicating whether the SNP is known, mutein D56406_PEA_1_P6 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターD56406は、上の表2に列挙した10個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster D56406 is characterized by the ten segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターD56406_PEA_1_node_0は、48個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:D56406_PEA_1_T3、D56406_PEA_1_T6、およびD56406_PEA_1_T7。以下の表183は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster D56406_PEA_1_node_0 of the present invention is supported by 48 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: D56406_PEA_1_T3, D56406_PEA_1_T6, and D56406_PEA_1_T7. Table 183 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表184に示す)。   Microarray (chip) data for this segment is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (for lung cancer) (shown in Table 184).

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターD56406_PEA_1_node_13は、43個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:D56406_PEA_1_T3、D56406_PEA_1_T6、およびD56406_PEA_1_T7。以下の表185は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster D56406_PEA_1_node_13 of the present invention is supported by 43 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: D56406_PEA_1_T3, D56406_PEA_1_T6, and D56406_PEA_1_T7. Table 185 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターD56406_PEA_1_node_11は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:D56406_PEA_1_T3。以下の表186は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster D56406_PEA_1_node_11 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: D56406_PEA_1_T3. Table 186 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターD56406_PEA_1_node_2を、以下の転写物中に見出すことができる:D56406_PEA_1_T3およびD56406_PEA_1_T7。以下の表187は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster D56406_PEA_1_node_2 of the invention can be found in the following transcript: D56406_PEA_1_T3 and D56406_PEA_1_T7. Table 187 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターD56406_PEA_1_node_3は、46個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:D56406_PEA_1_T3、D56406_PEA_1_T6、およびD56406_PEA_1_T7。以下の表188は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster D56406_PEA_1_node_3 of the present invention is supported by 46 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: D56406_PEA_1_T3, D56406_PEA_1_T6, and D56406_PEA_1_T7. Table 188 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターD56406_PEA_1_node_5は、48個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:D56406_PEA_1_T3およびD56406_PEA_1_T6。以下の表189は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster D56406_PEA_1_node_5 of the present invention is supported by 48 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: D56406_PEA_1_T3 and D56406_PEA_1_T6. Table 189 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターD56406_PEA_1_node_6は、34個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:D56406_PEA_1_T3およびD56406_PEA_1_T6。以下の表190は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster D56406_PEA_1_node_6 of the present invention is supported by 34 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: D56406_PEA_1_T3 and D56406_PEA_1_T6. Table 190 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターD56406_PEA_1_node_7は、32個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:D56406_PEA_1_T3およびD56406_PEA_1_T6。以下の表191は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster D56406_PEA_1_node_7 of the present invention is supported by 32 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: D56406_PEA_1_T3 and D56406_PEA_1_T6. Table 191 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターD56406_PEA_1_node_8を、以下の転写物中に見出すことができる:D56406_PEA_1_T3およびD56406_PEA_1_T6。以下の表192は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster D56406_PEA_1_node_8 according to the invention can be found in the following transcript: D56406_PEA_1_T3 and D56406_PEA_1_T6. Table 192 below describes the beginning and ending positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターD56406_PEA_1_node_9は、31個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:D56406_PEA_1_T3およびD56406_PEA_1_T6。以下の表193は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster D56406_PEA_1_node_9 of the present invention is supported by 31 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: D56406_PEA_1_T3 and D56406_PEA_1_T6. Table 193 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/jU49325aMA/8F0XuN7La5:NEUT_HUMAN

Sequence documentation:

Alignment of: D56406_PEA_1_P2 x NEUT_HUMAN ..

Alignment segment 1/1:

Quality: 1591.00 Escore: 0
Matching length: 170 Total length: 201
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 84.58 Total Percent Identity: 84.58
Gaps: 1

Alignment:
. . . . .
1 MMAGMKIQLVCMLLLAFSSWSLCSDSEEEMKALEADFLTNMHTSKISKAH 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MMAGMKIQLVCMLLLAFSSWSLCSDSEEEMKALEADFLTNMHTSKISKAH 50
. . . . .
51 VPSWKMTLLNVCSLVNNLNSPAEETGEVHEEELVARRKLPTALDGFSLEA 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VPSWKMTLLNVCSLVNNLNSPAEETGEVHEEELVARRKLPTALDGFSLEA 100
. . . . .
101 MLTIYQLHKICHSRAFQHWEARWLTPVIPALWEAETGGSRGQEMETIPAN 150
||||||||||||||||||||
101 MLTIYQLHKICHSRAFQHWE.............................. 120
. . . . .
151 TLIQEDILDTGNDKNGKEEVIKRKIPYILKRQLYENKPRRPYILKRDSYY 200
|||||||||||||||||||||||||||||||||||||||||||||||||
121 .LIQEDILDTGNDKNGKEEVIKRKIPYILKRQLYENKPRRPYILKRDSYY 169

201 Y 201
|
170 Y 170






Sequence name: /tmp/wWui8Kd4y9/zbf3ihRwnR:NEUT_HUMAN

Sequence documentation:

Alignment of: D56406_PEA_1_P5 x NEUT_HUMAN ..

Alignment segment 1/1:

Quality: 1572.00 Escore: 0
Matching length: 168 Total length: 170
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 98.82 Total Percent Identity: 98.82
Gaps: 1

Alignment:
. . . . .
1 MMAGMKIQLVCMLLLAFSSWSLC..SEEEMKALEADFLTNMHTSKISKAH 48
||||||||||||||||||||||| |||||||||||||||||||||||||
1 MMAGMKIQLVCMLLLAFSSWSLCSDSEEEMKALEADFLTNMHTSKISKAH 50
. . . . .
49 VPSWKMTLLNVCSLVNNLNSPAEETGEVHEEELVARRKLPTALDGFSLEA 98
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VPSWKMTLLNVCSLVNNLNSPAEETGEVHEEELVARRKLPTALDGFSLEA 100
. . . . .
99 MLTIYQLHKICHSRAFQHWELIQEDILDTGNDKNGKEEVIKRKIPYILKR 148
||||||||||||||||||||||||||||||||||||||||||||||||||
101 MLTIYQLHKICHSRAFQHWELIQEDILDTGNDKNGKEEVIKRKIPYILKR 150
. .
149 QLYENKPRRPYILKRDSYYY 168
||||||||||||||||||||
151 QLYENKPRRPYILKRDSYYY 170






Sequence name: /tmp/f5d07fF5D7/E4N5xjUIAN:NEUT_HUMAN

Sequence documentation:

Alignment of: D56406_PEA_1_P6 x NEUT_HUMAN ..

Alignment segment 1/1:

Quality: 844.00 Escore: 0
Matching length: 95 Total length: 170
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 55.88 Total Percent Identity: 55.88
Gaps: 1

Alignment:
. . . . .
1 MMAGMKIQLVCMLLLAFSSWSLCSDSEEEMKALEADFLTNMHTSK..... 45
|||||||||||||||||||||||||||||||||||||||||||||
1 MMAGMKIQLVCMLLLAFSSWSLCSDSEEEMKALEADFLTNMHTSKISKAH 50
. . . . .
45 .................................................. 45

51 VPSWKMTLLNVCSLVNNLNSPAEETGEVHEEELVARRKLPTALDGFSLEA 100
. . . . .
46 ....................LIQEDILDTGNDKNGKEEVIKRKIPYILKR 75
||||||||||||||||||||||||||||||
101 MLTIYQLHKICHSRAFQHWELIQEDILDTGNDKNGKEEVIKRKIPYILKR 150
. .
76 QLYENKPRRPYILKRDSYYY 95
||||||||||||||||||||
151 QLYENKPRRPYILKRDSYYY 170


Mutated protein alignment against previously known proteins:
Sequence name: / tmp / jU49325aMA / 8F0XuN7La5: NEUT_HUMAN

Sequence documentation:

Alignment of: D56406_PEA_1_P2 x NEUT_HUMAN ..

Alignment segment 1/1:

Quality: 1591.00 Escore: 0
Matching length: 170 Total length: 201
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 84.58 Total Percent Identity: 84.58
Gaps: 1

Alignment:
....
1 MMAGMKIQLVCMLLAFSSWSLCSDSEEEMKALEADFLTNMHTSKISKAH 50
||||||||||||||||||||||||||||||||||||||||
1 MMAGMKIQLVCMLLAFSSWSLCSDSEEEMKALEADFLTNMHTSKISKAH 50
....
51 VPSW KMTLLNVCSL VNNL NSPA EETGEVHEEELVARRKLPTALDGFSLEA 100
||||||||||||||||||||||||||||||||||||||||
51 VPSW KMTLLNVCSL VNNL NSPA EETGEVHEEELVARRKLPTALDGFSLEA 100
....
101 MLTIYQLHKICHSRAFQHEARWLTPIPALWEAETGGSRGQEMETIPAN 150
|||||||||||||||||||
101 MLTIYQLHKICHSRAFQHWE ................................... 120
....
151 TLIQEDILDTGNDKNGKEEVIKRKIPYILKRQLYENKPRRPYILKRDSYY 200
||||||||||||||||||||||||||||||||||||||||
121. LIQEDILDTGNDKNGKEEVIKRKIPYILKRQLYENKPRRPYILKRDSYY 169

201 Y 201
|
170 Y 170






Sequence name: / tmp / wWui8Kd4y9 / zbf3ihRwnR: NEUT_HUMAN

Sequence documentation:

Alignment of: D56406_PEA_1_P5 x NEUT_HUMAN ..

Alignment segment 1/1:

Quality: 1572.00 Escore: 0
Matching length: 168 Total length: 170
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 98.82 Total Percent Identity: 98.82
Gaps: 1

Alignment:
....
1 MMAGMKIQLVCMLLAFSSWSLC..SEEEMKALEADFLTNMHTSKISKAH 48
|||||||||||||||||||||||||||||||||||||||
1 MMAGMKIQLVCMLLAFSSWSLCSDSEEEMKALEADFLTNMHTSKISKAH 50
....
49 VPSWKMTLLNVCSLVNL NNSPA EETGEVHEEEL VARRKLPTALDGFSLEA 98
||||||||||||||||||||||||||||||||||||||||
51 VPSW KMTLLNVCSL VNNL NSPA EETGEVHEEELVARRKLPTALDGFSLEA 100
....
99 MLTIYQLHKICHSRAFQHWELIQEDILDTGDNKNGKEEVIKRKIPYILKR 148
||||||||||||||||||||||||||||||||||||||||
101 MLTIYQLHKICHSRAFQHWELIQEDILDTGDNKNGKEEVIKRKIPYILKR 150
.
149 QLYENKPRRPYILKRDSYYY 168
|||||||||||||||||||
151 QLYENKPRRPYILKRDSYYY 170






Sequence name: / tmp / f5d07fF5D7 / E4N5xjUIAN: NEUT_HUMAN

Sequence documentation:

Alignment of: D56406_PEA_1_P6 x NEUT_HUMAN ..

Alignment segment 1/1:

Quality: 844.00 Escore: 0
Matching length: 95 Total length: 170
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 55.88 Total Percent Identity: 55.88
Gaps: 1

Alignment:
....
1 MMAGMKIQLVCMLLAFSSWSLCSDSEEEMKALEADFLTNHMHTSK ..... 45
|||||||||||||||||||||||||||||||||||||||
1 MMAGMKIQLVCMLLAFSSWSLCSDSEEEMKALEADFLTNMHTSKISKAH 50
....
45 ...................................................... . 45

51 VPSW KMTLLNVCSL VNNL NSPA EETGEVHEEELVARRKLPTALDGFSLEA 100
....
46 ............ LIQEDILDTGNDKNGKEEVIKRKIPYILKR 75
||||||||||||||||||||||||||||
101 MLTIYQLHKICHSRAFQHWELIQEDILDTGDNKNGKEEVIKRKIPYILKR 150
.
76 QLYENKPRRPYILKRDSYYY 95
|||||||||||||||||||
151 QLYENKPRRPYILKRDSYYY 170


クラスターF05068の説明
クラスターF05068は、目的の3つの転写物および12個のセグメントを特徴とし、その名称を、それぞれ表194および195に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表196に示す。
Description of Cluster F05068 Cluster F05068 features 3 transcripts of interest and 12 segments, the names of which are shown in Tables 194 and 195, respectively, and the sequences themselves are shown at the end of the application. Selected protein variants are shown in Table 196.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるADM前駆体(以下を含む:アドレノメデュリン(AM)、プロアドレノメデュリンN−20末端ペプチド(ProAM−N20)(ProAMN−末端20ペプチド)(PAMP))(SwissProtアクセッション識別子ADML_HUMAN)(配列番号1423)の変異型である。   These sequences are known proteins, previously known herein as ADM precursors (including: adrenomedullin (AM), proadrenomedullin N-20 terminal peptide (ProAM-N20) (ProAMN- A variant of the terminal 20 peptide) (PAMP)) (SwissProt accession identifier ADML_HUMAN) (SEQ ID NO: 1423).

タンパク質ADM前駆体は、以下の機能を有することが公知であるか、そのように見なされている:AMおよびPAMPは、強力な降圧薬および血管拡張薬である。多数の作用が報告されており、流動物および電解質のホメオスタシスの生理学的調節について最も言及されている。腎臓では、AMは、利尿薬およびナトリウム利尿薬であり、AMおよびPAMPは共に直接的副腎作用によってアルドステロン分泌を阻害する。下垂体では、両ペプチドは、生理学的に関連する用量で、基本的ACTH分泌を阻害する。両ペプチドは、脳内および下垂体内で血漿体積の減少を促進するように作用するようである(血管内でのその血圧低下作用を補足する作用)。タンパク質ADM前駆体の配列を、「ADM前駆体(以下を含む:アドレノメデュリン(AM)、プロアドレノメデュリンN−20末端ペプチド(ProAM−N20)(ProAMN−末端20ペプチド)(PAMP)アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表197に示す。   The protein ADM precursor is known or considered to have the following functions: AM and PAMP are potent antihypertensive and vasodilator. A large number of effects have been reported, with the most mention of the physiological control of fluid and electrolyte homeostasis. In the kidney, AM is a diuretic and natriuretic, and both AM and PAMP inhibit aldosterone secretion by direct adrenal effects. In the pituitary, both peptides inhibit basal ACTH secretion at physiologically relevant doses. Both peptides appear to act to promote a reduction in plasma volume in the brain and in the pituitary body (action to complement its blood pressure lowering action in blood vessels). The sequence of the protein ADM precursor is referred to as "ADM precursor (including: adrenomedullin (AM), pro-adrenomedullin N-20 terminal peptide (ProAM-N20) (ProAMN-terminal 20 peptide) (PAMP)) amino acid sequence" The known polymorphisms of this sequence are shown in Table 197.

Figure 2008507261
Figure 2008507261

タンパク質ADM前駆体の局在化は、分泌と考えられる。   Localization of the protein ADM precursor is considered secretion.

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けであるcAMP生合成、プロゲステロン生合成、シグナル伝達、細胞−細胞シグナル伝達、妊娠、排泄、循環、創傷応答、分子機能に関連する注釈付けであるリガンド、ホルモン、および細胞成分に関連する注釈付けである鎖妨害空間、可溶性画分。   The following GO annotation applies to previously known proteins. The following annotations were found: annotations related to biological processes: cAMP biosynthesis, progesterone biosynthesis, signal transduction, cell-cell signaling, pregnancy, excretion, circulation, wound response, molecular function Related annotations Ligands, hormones, and stranding spaces that are annotations related to cellular components, soluble fractions.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

クラスターF05068を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図21のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   Cluster F05068 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The terms "numbers" in the right column of the table and the numbers on the y-axis of FIG. 21 refer to the weighted expression of ESTs in each category as "ppm" (for ESTs of a particular cluster in this category by ppm Ratio of expression to expression of all ESTs).

概して、図21および表198中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):子宮悪性腫瘍。   In general, as shown for the histograms in FIG. 21 and Table 198, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: uterine malignancy.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、クラスターF05068は、上の表194に列挙した3つの転写物を特徴とする。これらの転写物は、ADM前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster F05068 is characterized by the three transcripts listed in Table 194 above. These transcripts encode proteins that are variants of ADM precursor. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質F05068_PEA_1_P7は、出願書類の最後に示すアミノ酸配列を有し、転写物F05068_PEA_1_T3およびF05068_PEA_1_T6によってコードされる。公知のタンパク質(ADM前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein F05068_PEA_1_P7 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcripts F05068_PEA_1_T3 and F05068_PEA_1_T6. An alignment to a known protein (ADM precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

F05068_PEA_1_P7とADML_HUMANとの間の比較の報告
1.ADML_HUMANのアミノ酸1〜33に対応し、F05068_PEA_1_P7のアミノ酸1〜33にも対応するMKLVSVALMYLGSLAFLGADTARLDVASEFRKKと少なくとも90%相同な第1のアミノ酸配列を含む、F05068_PEA_1_P7をコードする単離キメラポリペプチド。
Report of comparison between F05068_PEA_1_P7 and ADML_HUMAN 1. An isolated chimeric polypeptide encoding F05068_PEA_1_P7, comprising a first amino acid sequence at least 90% homologous to MKLVSVALMYLGSLAFLGADTARLD VASE FRKK corresponding to amino acids 1 to 33 of ADML_HUMAN and also to amino acids 1 to 33 of F05068_PEA_1_P7.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質F05068_PEA_1_P7はまた、表200に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質F05068_PEA_1_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein F05068_PEA_1_P7 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column, as shown in Table 200) It is shown whether it is known and the presence of a known SNP in the mutant protein F05068_PEA_1_P7 sequence supports the predicted sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質F05068_PEA_1_P7は、以下の転写物によってコードされる:F05068_PEA_1_T3およびF05068_PEA_1_T6(配列は出願書類の最後に示す)。   The mutein F05068_PEA_1_P7 is encoded by the following transcript: F05068_PEA_1_T3 and F05068_PEA_1_T6 (sequences shown at the end of the application).

転写物F05068_PEA_1_T3のコード部分を太字で示し、このコード部分は267位から開始され、365位で終結する。転写物はまた、表201に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質F05068_PEA_1_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The coding part of the transcript F05068_PEA_1_T3 is shown in bold, starting from position 267 and ending at position 365. The transcript also has the following SNPs listed in Table 201 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein F05068_PEA_1_P7 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

転写物F05068_PEA_1_T6のコード部分を太字で示し、このコード部分は267位から開始され、365位で終結する。転写物はまた、表202に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質F05068_PEA_1_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The coding part of the transcript F05068_PEA_1_T6 is shown in bold, starting from position 267 and ending at position 365. The transcript also has the following SNPs listed in Table 202 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein F05068_PEA_1_P7 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

本発明の変異タンパク質F05068_PEA_1_P8は、出願書類の最後に示すアミノ酸配列を有し、転写物F05068_PEA_1_T4によってコードされる。公知のタンパク質(ADM前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein F05068_PEA_1_P8 according to the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript F05068_PEA_1_T4. An alignment to a known protein (ADM precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

F05068_PEA_1_P8とADML_HUMANとの間の比較の報告
1.ADML_HUMANのアミノ酸1〜82に対応し、F05068_PEA_1_P8のアミノ酸1〜82にも対応するMKLVSVALMYLGSLAFLGADTARLDVASEFRKKWNKWALSRGKRELRMSSSYPTGLADVKAGPAQTLIRPQDMKGASRSPEDと少なくとも90%相同な第1のアミノ酸配列と、F05068_PEA_1_P8のアミノ酸83〜83に対応する配列Rを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、F05068_PEA_1_P8をコードする単離キメラポリペプチド。
Report on comparison between F05068_PEA_1_P8 and ADML_HUMAN 1. MKLVS VALMYLGSL ALFADTALLD VASE corresponding to amino acids 1-82 of FADML_HUMAN and corresponding to amino acids 1-82 of F05068_PEA_1_P8 F05068_PEA_7_P4 and a first amino acid sequence that is at least 90% homologous to at least 90% homologous to Said first and second amino acids comprising a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous The distribution is adjacent and in sequential order, F05068_PEA_ Isolated chimeric polypeptide encoding _P8.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質F05068_PEA_1_P8はまた、表203に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質F05068_PEA_1_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein F05068_PEA_1_P8 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 203) It is shown whether it is known and the presence of a known SNP in the mutant protein F05068_PEA_1_P8 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質F05068_PEA_1_P8は、以下の転写物によってコードされる:F05068_PEA_1_T4(配列は出願書類の最後に示す)。転写物F05068_PEA_1_T4のコード部分を太字で示し、このコード部分は267位から開始され、515位で終結する。転写物はまた、表204に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質F05068_PEA_1_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein F05068_PEA_1_P8 is encoded by the following transcript: F05068_PEA_1_T4 (sequences shown at the end of the application). The code portion of the transcript F05068_PEA_1_T4 is shown in bold, starting from position 267 and ending at position 515. The transcript also has the following SNPs listed in Table 204 (indicating its position on the nucleotide sequence and listing another nucleic acid, the last column indicating whether the SNP is known, mutein F05068_PEA_1_P8 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

上記のように、クラスターF05068は、上の表2に列挙した12個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster F05068 is characterized by the 12 segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターF05068_PEA_1_node_0は、143個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:F05068_PEA_1_T3、F05068_PEA_1_T4、およびF05068_PEA_1_T6。以下の表205は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster F05068_PEA_1_node_0 of the present invention is supported by 143 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: F05068_PEA_1_T3, F05068_PEA_1_T4, and F05068_PEA_1_T6. Table 205 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターF05068_PEA_1_node_10は、127個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:F05068_PEA_1_T3、F05068_PEA_1_T4、およびF05068_PEA_1_T6。以下の表206は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster F05068_PEA_1_node_10 of the present invention is supported by 127 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: F05068_PEA_1_T3, F05068_PEA_1_T4, and F05068_PEA_1_T6. Table 206 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターF05068_PEA_1_node_12は、123個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:F05068_PEA_1_T3、F05068_PEA_1_T4、およびF05068_PEA_1_T6。以下の表207は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster F05068_PEA_1_node_12 of the present invention is supported by 123 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: F05068_PEA_1_T3, F05068_PEA_1_T4, and F05068_PEA_1_T6. Table 207 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターF05068_PEA_1_node_13は、181個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:F05068_PEA_1_T3、F05068_PEA_1_T4、およびF05068_PEA_1_T6。以下の表208は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster F05068_PEA_1_node_13 of the present invention is supported by 181 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: F05068_PEA_1_T3, F05068_PEA_1_T4, and F05068_PEA_1_T6. Table 208 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターF05068_PEA_1_node_4は、15個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:F05068_PEA_1_T3およびF05068_PEA_1_T6。以下の表209は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster F05068_PEA_1_node_4 of the present invention is supported by 15 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: F05068_PEA_1_T3 and F05068_PEA_1_T6. Table 209 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターF05068_PEA_1_node_8は、13個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:F05068_PEA_1_T4およびF05068_PEA_1_T6。以下の表210は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster F05068_PEA_1_node_8 of the present invention is supported by 13 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: F05068_PEA_1_T4 and F05068_PEA_1_T6. Table 210 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターF05068_PEA_1_node_11は、112個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:F05068_PEA_1_T3、F05068_PEA_1_T4、およびF05068_PEA_1_T6。以下の表211は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster F05068_PEA_1_node_11 of the present invention is supported by 112 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: F05068_PEA_1_T3, F05068_PEA_1_T4, and F05068_PEA_1_T6. Table 211 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターF05068_PEA_1_node_3は、145個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:F05068_PEA_1_T3、F05068_PEA_1_T4、およびF05068_PEA_1_T6。以下の表212は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster F05068_PEA_1_node_3 of the present invention is supported by 145 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: F05068_PEA_1_T3, F05068_PEA_1_T4, and F05068_PEA_1_T6. Table 212 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターF05068_PEA_1_node_5は、124個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:F05068_PEA_1_T3、F05068_PEA_1_T4、およびF05068_PEA_1_T6。以下の表213は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster F05068_PEA_1_node_5 of the present invention is supported by 124 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: F05068_PEA_1_T3, F05068_PEA_1_T4, and F05068_PEA_1_T6. Table 213 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターF05068_PEA_1_node_6は、110個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:F05068_PEA_1_T3、F05068_PEA_1_T4、およびF05068_PEA_1_T6。以下の表214は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster F05068_PEA_1_node_6 of the present invention is supported by 110 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: F05068_PEA_1_T3, F05068_PEA_1_T4, and F05068_PEA_1_T6. Table 214 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターF05068_PEA_1_node_7は、109個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:F05068_PEA_1_T3、F05068_PEA_1_T4、およびF05068_PEA_1_T6。以下の表215は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster F05068_PEA_1_node_7 of the present invention is supported by 109 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: F05068_PEA_1_T3, F05068_PEA_1_T4, and F05068_PEA_1_T6. Table 215 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターF05068_PEA_1_node_9は、114個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:F05068_PEA_1_T3、F05068_PEA_1_T4、およびF05068_PEA_1_T6。以下の表216は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster F05068_PEA_1_node_9 of the present invention is supported by 114 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: F05068_PEA_1_T3, F05068_PEA_1_T4, and F05068_PEA_1_T6. Table 216 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/kEsi3RWsCN/1svdhjfiNV:ADML_HUMAN

Sequence documentation:

Alignment of: F05068_PEA_1_P7 x ADML_HUMAN ..

Alignment segment 1/1:

Quality: 304.00 Escore: 0
Matching length: 33 Total length: 33
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . .
1 MKLVSVALMYLGSLAFLGADTARLDVASEFRKK 33
|||||||||||||||||||||||||||||||||
1 MKLVSVALMYLGSLAFLGADTARLDVASEFRKK 33






Sequence name: /tmp/tcrlWIx4kg/aghbr8Eh8n:ADML_HUMAN

Sequence documentation:

Alignment of: F05068_PEA_1_P8 x ADML_HUMAN ..

Alignment segment 1/1:

Quality: 791.00 Escore: 0
Matching length: 82 Total length: 82
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKLVSVALMYLGSLAFLGADTARLDVASEFRKKWNKWALSRGKRELRMSS 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKLVSVALMYLGSLAFLGADTARLDVASEFRKKWNKWALSRGKRELRMSS 50
. . .
51 SYPTGLADVKAGPAQTLIRPQDMKGASRSPED 82
||||||||||||||||||||||||||||||||
51 SYPTGLADVKAGPAQTLIRPQDMKGASRSPED 82


Mutated protein alignment against previously known proteins:
Sequence name: / tmp / kEsi3RWsCN / 1svdhjfiNV: ADML_HUMAN

Sequence documentation:

Alignment of: F05068_PEA_1_P7 x ADML_HUMAN ..

Alignment segment 1/1:

Quality: 304.00 Escore: 0
Matching length: 33 Total length: 33
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MKLVSVALMYLGSLAFLGADTARLDVASEFRKK 33
||||||||||||||||||||||||||||||
1 MKLVSVALMYLGSLAFLGADTARLDVASEFRKK 33






Sequence name: / tmp / tcrlWIx4kg / aghbr8Eh8n: ADML_HUMAN

Sequence documentation:

Alignment of: F05068_PEA_1_P8 x ADML_HUMAN ..

Alignment segment 1/1:

Quality: 791.00 Escore: 0
Matching length: 82 Total length: 82
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MKLVSVALMYLGSLAFLGADTARLDVASEFRKKWNKWALSRGKRELRMSS 50
||||||||||||||||||||||||||||||||||||||||
1 MKLVSVALMYLGSLAFLGADTARLDVASEFRKKWNKWALSRGKRELRMSS 50
....
51 SYPTGLADKKAGAP AQTLIRPQDMKGASRSPED 82
||||||||||||||||||||||||||||||
51 SYPTGLADKKAGAP AQTLIRPQDMKGASRSPED 82

クラスターH14624の説明
クラスターH14624は、目的の1つの転写物および15個のセグメントを特徴とし、その名称を、それぞれ表217および218に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表219に示す。
Description of cluster H14624 Cluster H14624 is characterized by one transcript and 15 segments of interest, the names of which are shown in Tables 217 and 218, respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 219.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

クラスターH14624を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図22のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   Cluster H14624 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The terms "numbers" in the right column of the table and the numbers on the y-axis of Fig. 22 refer to the weighted expression of ESTs in each category as "ppm" (the ppm of ESTs of a particular cluster in this category by ppm Ratio of expression to expression of all ESTs).

概して、図22および表220中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):結腸直腸癌、上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、肺悪性脳腫瘍、および膵臓癌。   In general, as shown for the histograms in FIG. 22 and Table 220, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: colorectal cancer, epithelial malignancies, a mixture of malignancies from different tissues, lung malignant brain tumors, and pancreatic cancer.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、コンティグH14624は、上の表217に列挙した1つの転写物を特徴とする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, contig H14624 is characterized by one transcript as listed in Table 217 above. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質H14624_P15は、出願書類の最後に示すアミノ酸配列を有し、転写物H14624_T20によってコードされる。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein H14624_P15 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript H14624_T20. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

H14624_P15とQ9HAP5(配列番号1701)との間の比較の報告
1.Q9HAP5のアミノ酸1〜167に対応し、H14624_P15のアミノ酸1〜167にも対応するMLQGPGSLLLLFLASHCCLGSARGLFLFGQPDFSYKRSNCKPIPANLQLCHGIEYQNMRLPNLLGHETMKEVLEQAGAWIPLVMKQCHPDTKKFLCSLFAPVCLDDLDETIQPCHSLCVQVKDRCAPVMSAFGFPWPDMLECDRFPQDNDLCIPLASSDHLLPATEEと少なくとも90%相同な第1のアミノ酸配列と、H14624_P15のアミノ酸168〜180に対応する配列GKPSLLLPHSLLGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、H14624_P15をコードする単離キメラポリペプチド。
Report on comparison between H14624_P15 and Q9 HAP5 (SEQ ID NO: 1701) This is a GH JFH, and corresponds to a GH JH, and is a GH JH JH. At least 70%, optionally at least 80%, preferably at least 85%, more preferably Is an isolated chimera encoding H14624_P15, comprising a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first and second amino acid sequences being adjacent and in sequential order Polypeptide.

2.H14624_P15中の配列GKPSLLLPHSLLGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、H14624_P15のテールをコードする単離ポリペプチド。   2. H14624_P15 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence GKPSLLLPHSLLG in H14624_P15 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質H14624_P15はまた、表222に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H14624_P15配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein H14624_P15 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 222) It indicates whether it is known and the presence of a known SNP in the mutein H14624_P15 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質H14624_P15は、以下の転写物によってコードされる:H14624_T20(配列は出願書類の最後に示す)。転写物H14624_T20のコード部分を太字で示し、このコード部分は857位から開始され、1396位で終結する。転写物はまた、表223に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H14624_P15配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein H14624_P15 is encoded by the following transcript: H14624_T20 (sequences shown at the end of the application). The coding portion of transcript H14624_T20 is shown in bold and this coding portion starts at position 857 and ends at position 1396. The transcript also has the following SNPs listed in Table 223 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein H14624_P15 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターH14624は、上の表2に列挙した15個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster H14624 is characterized by the 15 segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターH14624_node_0は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H14624_T20。以下の表224は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H14624_node_0 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H14624_T20. Table 224 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH14624_node_16は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H14624_T20。以下の表225は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H14624_node_16 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H14624_T20. Table 225 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH14624_node_3は、67個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H14624_T20。以下の表226は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H14624_node_3 of the present invention is supported by 67 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H14624_T20. Table 226 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターH14624_node_10を、以下の転写物中に見出すことができる:H14624_T20。以下の表227は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H14624_node_10 according to the invention can be found in the following transcript: H14624_T20. Table 227 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH14624_node_11は、99個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H14624_T20。以下の表228は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H14624_node_11 of the present invention is supported by 99 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H14624_T20. Table 228 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH14624_node_12を、以下の転写物中に見出すことができる:H14624_T20。以下の表229は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H14624_node_12 according to the invention can be found in the following transcript: H14624_T20. Table 229 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH14624_node_13は、124個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H14624_T20。以下の表230は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H14624_node_13 of the present invention is supported by 124 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H14624_T20. Table 230 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH14624_node_14は、114個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H14624_T20。以下の表231は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H14624_node_14 of the present invention is supported by 114 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H14624_T20. Table 231 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH14624_node_15は、124個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H14624_T20。以下の表232は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H14624_node_15 of the present invention is supported by 124 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H14624_T20. Table 232 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH14624_node_4は、65個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H14624_T20。以下の表233は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H14624_node_4 of the present invention is supported by 65 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H14624_T20. Table 233 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH14624_node_5を、以下の転写物中に見出すことができる:H14624_T20。以下の表234は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H14624_node_5 according to the invention can be found in the following transcript: H14624_T20. Table 234 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH14624_node_6を、以下の転写物中に見出すことができる:H14624_T20。以下の表235は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H14624_node_6 according to the invention can be found in the following transcript: H14624_T20. Table 235 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH14624_node_7を、以下の転写物中に見出すことができる:H14624_T20。以下の表236は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H14624_node_7 according to the invention can be found in the following transcript: H14624_T20. Table 236 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH14624_node_8は、85個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H14624_T20。以下の表237は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H14624_node_8 of the present invention is supported by 85 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H14624_T20. Table 237 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH14624_node_9は、87個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H14624_T20。以下の表238は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H14624_node_9 of the present invention is supported by 87 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H14624_T20. Table 238 below describes the beginning and ending positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/Upb1SbFkrj/N4PrGQAB2V:Q9HAP5

Sequence documentation:

Alignment of: H14624_P15 x Q9HAP5 ..

Alignment segment 1/1:

Quality: 1702.00 Escore: 0
Matching length: 167 Total length: 167
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MLQGPGSLLLLFLASHCCLGSARGLFLFGQPDFSYKRSNCKPIPANLQLC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MLQGPGSLLLLFLASHCCLGSARGLFLFGQPDFSYKRSNCKPIPANLQLC 50
. . . . .
51 HGIEYQNMRLPNLLGHETMKEVLEQAGAWIPLVMKQCHPDTKKFLCSLFA 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 HGIEYQNMRLPNLLGHETMKEVLEQAGAWIPLVMKQCHPDTKKFLCSLFA 100
. . . . .
101 PVCLDDLDETIQPCHSLCVQVKDRCAPVMSAFGFPWPDMLECDRFPQDND 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 PVCLDDLDETIQPCHSLCVQVKDRCAPVMSAFGFPWPDMLECDRFPQDND 150
.
151 LCIPLASSDHLLPATEE 167
|||||||||||||||||
151 LCIPLASSDHLLPATEE 167



Mutated protein alignment against previously known proteins:
Sequence name: / tmp / Upb1SbFkrj / N4PrGQAB2V: Q9HAP5

Sequence documentation:

Alignment of: H14624_P15 x Q9HAP5 ..

Alignment segment 1/1:

Quality: 1702.00 Escore: 0
Matching length: 167 Total length: 167
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MLQGPGSLLLLFLASHCCLGSARGLFLFGQPDFSYKRSNCKPIPANLQLC 50
||||||||||||||||||||||||||||||||||||||||
1 MLQGPGSLLLLFLASHCCLGSARGLFLFGQPDFSYKRSNCKPIPANLQLC 50
....
51 HGIEYQNMRLPNLLGHETM KEVLEQAGAWIPLVMKQCHPDTKKFLCSLFA 100
||||||||||||||||||||||||||||||||||||||||
51 HGIEYQNMRLPNLLGHETM KEVLEQAGAWIPLVMKQCHPDTKKFLCSLFA 100
....
101 PVCLDDLDETIQPCHSLCVQVKDRCAPVMSAFGFPWPDMECDRFPQDND 150
||||||||||||||||||||||||||||||||||||||||
101 PVCLDDLDETIQPCHSLCVQVKDRCAPVMSAFGFPWPDMECDRFPQDND 150
.
151 LCIPLASSDHLLPATEE 167
||||||||||||||||
151 LCIPLASSDHLLPATEE 167


クラスターH38804説明
クラスターH38804は、目的の2つの転写物および20個のセグメントを特徴とし、その名称を、それぞれ表239および240に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表241に示す。
Cluster H 38804 Description Cluster H 38804 is characterized by two transcripts of interest and 20 segments, the names of which are shown in Tables 239 and 240, respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 241.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質である有糸分裂チェックポイントタンパク質BUB3(SwissProtアクセッション識別子BUB3_HUMAN)(配列番号1424)の変異型である。   These sequences are variants of the mitotic checkpoint protein BUB3 (SwissProt accession identifier BUB3_HUMAN) (SEQ ID NO: 1424), which is a known protein, referred to herein as a previously known protein.

タンパク質有糸分裂チェックポイントタンパク質BUB3は、以下の機能を有することが公知であるか、そのように見なされている:BUB1の動原体局在化に必要である。タンパク質有糸分裂チェックポイントタンパク質BUB3の配列を、「有糸分裂チェックポイントタンパク質BUB3アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表242に示す。   The protein mitotic checkpoint protein BUB3 is known or considered to have the following functions: It is required for the centromeric localization of BUB1. The sequence of the protein mitotic checkpoint protein BUB3 is shown at the end of the application as "mitotic checkpoint protein BUB3 amino acid sequence". Known polymorphisms of this sequence are shown in Table 242.

Figure 2008507261
Figure 2008507261

タンパク質有糸分裂チェックポイントタンパク質BUB3の局在化は、核と考えられる。   The localization of the protein mitotic checkpoint protein BUB3 is considered to be the nucleus.

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである有糸分裂、有糸分裂チェックポイント、有糸分裂紡錘体チェックポイント、細胞増殖、および細胞成分に関連する注釈付けである核。   The following GO annotation applies to previously known proteins. The following annotations were found: annotations related to biological processes: mitosis, mitotic checkpoint, mitotic spindle checkpoint, cell proliferation, and annotated related to cellular components Is the nucleus.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

クラスターH38804を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図23のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   Cluster H38804 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The terms "numbers" in the right column of the table and the numbers on the y-axis of FIG. 23 refer to the weighted expression of ESTs in each category as "ppm" (for ESTs of a particular cluster in this category by ppm Ratio of expression to expression of all ESTs).

概して、図23および表243中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):移行上皮癌、脳悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および胃癌。   In general, as shown for the histograms in FIG. 23 and Table 243, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: transitional cell carcinoma, brain malignancy, a mixture of malignancies from different tissues, and gastric cancer.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、クラスターH38804は、上の表239に列挙した2つの転写物を特徴とする。これらの転写物は、タンパク質有糸分裂チェックポイントタンパク質BUB3の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster H38804 is characterized by the two transcripts listed in Table 239 above. These transcripts encode a protein that is a mutated form of the protein mitotic checkpoint protein BUB3. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質H38804_PEA_1_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物H38804_PEA_1_T8によってコードされる。公知のタンパク質(有糸分裂チェックポイントタンパク質BUB3)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein H38804_PEA_1_P5 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript H38804_PEA_1_T8. An alignment to a known protein (mitotic checkpoint protein BUB3) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

H38804_PEA_1_P5とBUB3_HUMANとの間の比較の報告
1.H38804_PEA_1_P5のアミノ酸1〜57に対応する配列MGRVRTLAGECSAQAQAQSLLAVVLSAPPSGGTPSARLSVRSPSPRDPWGLWAPVLQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、BUB3_HUMANのアミノ酸1〜324に対応し、H38804_PEA_1_P5のアミノ酸58〜381にも対応するMTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWDTSVRLYDVPANSMRLKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMHDLNTDQENLVGTHDAPIRCVEYCPEVNVMVTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRLIVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIEGRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQIYPVNAISFHNIHNTFATGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYEMDDTEHPEDGIFIRQVTDAETKPKと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、H38804_PEA_1_P5をコードする単離キメラポリペプチド。
Report of comparison between H38804_PEA_1_P5 and BUB3_HUMAN 1. H38804_PEA_1_P5 at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous with the polypeptide having the sequence MGRVRTLAGECSAAQAQSLAVLSAPPS SGGTPSALDPRSGLWAPVLQ corresponding to amino acids 1-57 of H38804 1 amino acid sequence corresponding to amino acids 1-324 of BUB3_HUMAN and corresponding to amino acids 58-381 of H38804_PEA_1_P5, MTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWSLYLYDPASNSMRLKYQHTGAVLDCAFYDPTHAWSGGLDHQLDMGDNTLVEN DAPIRCVEYCPEVNVMVTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRLIVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIEGRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQIYPVNAISFHNIHNTFATGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYEMDDTEHPEDGIFIRQVTDAETKPK and and at least 90% homologous to a second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, the isolated chimeric polypeptide coding H38804_PEA_1_P5.

2.H38804_PEA_1_P5の配列MGRVRTLAGECSAQAQAQSLLAVVLSAPPSGGTPSARLSVRSPSPRDPWGLWAPVLQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、H38804_PEA_1_P5の先端をコードする単離ポリペプチド。   2. The tip of H38804_PEA_1_P5 comprising the polypeptide of at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence MGRVRTLAGECSAAQAQLASL VSL An isolated polypeptide encoding

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、2つのうちの1つのシグナルペプチド推定プログラム(HMM:Signal peptide,NN:NO)によってこのタンパク質がシグナルペプチドを有すると推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is considered to be secreted as it is presumed that this protein has a signal peptide by one of two signal peptide estimation programs (HMM: Signal peptide, NN: NO).

変異タンパク質H38804_PEA_1_P5はまた、表245に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H38804_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein H38804_PEA_1_P5 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column, as shown in Table 245) It indicates whether it is known and the presence of a known SNP in the mutant protein H38804_PEA_1_P5 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質H38804_PEA_1_P5は、以下の転写物によってコードされる:H38804_PEA_1_T8(配列は出願書類の最後に示す)。転写物H38804_PEA_1_T8のコード部分を太字で示し、このコード部分は475位から開始され、1617位で終結する。転写物はまた、表246に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H38804_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein H38804_PEA_1_P5 is encoded by the following transcript: H38804_PEA_1_T8 (sequences shown at the end of the application). The coding portion of the transcript H38804_PEA_1_T8 is shown in bold, starting from position 475 and ending at position 1617. The transcript also has the following SNPs listed in Table 246 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein H38804_PEA_1_P5 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

本発明の変異タンパク質H38804_PEA_1_P17は、出願書類の最後に示すアミノ酸配列を有し、転写物H38804_PEA_1_T24によってコードされる。公知のタンパク質(有糸分裂チェックポイントタンパク質BUB3)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein H38804_PEA_1_P17 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript H38804_PEA_1_T24. An alignment to a known protein (mitotic checkpoint protein BUB3) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

H38804_PEA_1_P17とBUB3_HUMANとの間の比較の報告
1.H38804_PEA_1_P17のアミノ酸1〜57に対応する配列MGRVRTLAGECSAQAQAQSLLAVVLSAPPSGGTPSARLSVRSPSPRDPWGLWAPVLQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、BUB3_HUMANのアミノ酸1〜328に対応し、H38804_PEA_1_P17のアミノ酸58〜385にも対応するMTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWDTSVRLYDVPANSMRLKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMHDLNTDQENLVGTHDAPIRCVEYCPEVNVMVTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRLIVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIEGRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQIYPVNAISFHNIHNTFATGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYEMDDTEHPEDGIFIRQVTDAETKPKSPCTと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、H38804_PEA_1_P17をコードする単離キメラポリペプチド。
Report of comparison between H38804_PEA_1_P17 and BUB3_HUMAN 1. H38804_PEA_1_P17 at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to the polypeptide having the sequence MGRVRTLAGECSAAQAQLASLVSLSPGSPGPLDLSGLWAPAVQ corresponding to amino acids 1 to 57 of H38804 1 amino acid sequence corresponding to amino acids 1 to 328 of BUB3_HUMAN, and corresponding to amino acids 58 to 385 of H38804_PEA_1_P17, MTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWSLYLYDPASNSMRLKYQHTGAVLDCAFYDPTHAWSGGLDHQLDMGDQENLV THDAPIRCVEYCPEVNVMVTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRLIVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIEGRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQIYPVNAISFHNIHNTFATGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYEMDDTEHPEDGIFIRQVTDAETKPKSPCT and and at least 90% homologous to a second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, the isolated chimeric polypeptide coding H38804_PEA_1_P17.

2.H38804_PEA_1_P17の配列MGRVRTLAGECSAQAQAQSLLAVVLSAPPSGGTPSARLSVRSPSPRDPWGLWAPVLQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、H38804_PEA_1_P17の先端をコードする単離ポリペプチド。   2. H38804_PEA_1_P17 the tip of H38804_PEA_1_P17 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence MGRVRTLAGECSAAQAQLASLV An isolated polypeptide encoding

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、2つのうちの1つのシグナルペプチド推定プログラム(HMM:Signal peptide,NN:NO)によってこのタンパク質がシグナルペプチドを有すると推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is considered to be secreted as it is presumed that this protein has a signal peptide by one of two signal peptide estimation programs (HMM: Signal peptide, NN: NO).

変異タンパク質H38804_PEA_1_P17はまた、表247に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H38804_PEA_1_P17配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein H38804_PEA_1_P17 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing the other amino acids, and listing the other amino acids, as shown in Table 247; It is shown whether it is known and the presence of a known SNP in the mutant protein H38804_PEA_1_P17 sequence supports the deduced sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質H38804_PEA_1_P17は、以下の転写物によってコードされる:H38804_PEA_1_T24(配列は出願書類の最後に示す)。転写物H38804_PEA_1_T24のコード部分を太字で示し、このコード部分は475位から開始され、1629位で終結する。転写物はまた、表248に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H38804_PEA_1_P17配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein H38804_PEA_1_P17 is encoded by the following transcript: H38804_PEA_1_T24 (sequences shown at the end of the application). The coding portion of the transcript H38804_PEA_1_T24 is shown in bold, starting from position 475 and ending at position 1629. The transcript also has the following SNPs listed in Table 248 (showing its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein H38804_PEA_1_P17 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

上記のように、クラスターH38804は、上の表2に列挙した20個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster H38804 is characterized by the 20 segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターH38804_PEA_1_node_0は、125個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表249は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H38804_PEA_1_node_0 of the present invention is supported by 125 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H38804_PEA_1_T24 and H38804_PEA_1_T8. Table 249 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH38804_PEA_1_node_1は、9個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表250は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H38804_PEA_1_node_1 of the present invention is supported by nine libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H38804_PEA_1_T24 and H38804_PEA_1_T8. Table 250 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH38804_PEA_1_node_16は、214個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表251は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H38804_PEA_1_node_16 of the present invention is supported by 214 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H38804_PEA_1_T24 and H38804_PEA_1_T8. Table 251 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH38804_PEA_1_node_19は、198個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表252は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H38804_PEA_1_node_19 of the present invention is supported by 198 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H38804_PEA_1_T24 and H38804_PEA_1_T8. Table 252 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH38804_PEA_1_node_24は、180個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表253は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H38804_PEA_1_node_24 of the present invention is supported by 180 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H38804_PEA_1_T24 and H38804_PEA_1_T8. Table 253 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH38804_PEA_1_node_25は、28個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T8。以下の表254は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H38804_PEA_1_node_25 of the present invention is supported by 28 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H38804_PEA_1_T8. Table 254 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH38804_PEA_1_node_28は、38個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T8。以下の表255は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H38804_PEA_1_node_28 of the present invention is supported by 38 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H38804_PEA_1_T8. Table 255 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH38804_PEA_1_node_29は、259個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表256は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H38804_PEA_1_node_29 of the present invention is supported by 259 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H38804_PEA_1_T24 and H38804_PEA_1_T8. Table 256 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH38804_PEA_1_node_30は、169個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表257は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H38804_PEA_1_node_30 of the present invention is supported by 169 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H38804_PEA_1_T24 and H38804_PEA_1_T8. Table 257 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターH38804_PEA_1_node_10は、179個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表258は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H38804_PEA_1_node_10 of the present invention is supported by 179 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H38804_PEA_1_T24 and H38804_PEA_1_T8. Table 258 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH38804_PEA_1_node_12は、181個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表259は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H38804_PEA_1_node_12 of the present invention is supported by 181 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H38804_PEA_1_T24 and H38804_PEA_1_T8. Table 259 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH38804_PEA_1_node_13は、187個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表260は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H38804_PEA_1_node_13 of the present invention is supported by 187 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H38804_PEA_1_T24 and H38804_PEA_1_T8. Table 260 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH38804_PEA_1_node_14は、179個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表261は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H38804_PEA_1_node_14 of the present invention is supported by 179 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H38804_PEA_1_T24 and H38804_PEA_1_T8. Table 261 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH38804_PEA_1_node_2は、156個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表262は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H38804_PEA_1_node_2 of the present invention is supported by 156 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H38804_PEA_1_T24 and H38804_PEA_1_T8. Table 262 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH38804_PEA_1_node_20は、162個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表263は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H38804_PEA_1_node_20 of the present invention is supported by 162 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H38804_PEA_1_T24 and H38804_PEA_1_T8. Table 263 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH38804_PEA_1_node_23を、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表264は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H38804_PEA_1_node_23 according to the invention can be found in the following transcript: H38804_PEA_1_T24 and H38804_PEA_1_T8. Table 264 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH38804_PEA_1_node_26は、21個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T8。以下の表265は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H38804_PEA_1_node_26 of the present invention is supported by 21 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H38804_PEA_1_T8. Table 265 below describes the beginning and ending positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH38804_PEA_1_node_3は、162個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表266は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H38804_PEA_1_node_3 of the present invention is supported by 162 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H38804_PEA_1_T24 and H38804_PEA_1_T8. Table 266 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH38804_PEA_1_node_4は、172個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表267は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H38804_PEA_1_node_4 of the present invention is supported by 172 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H38804_PEA_1_T24 and H38804_PEA_1_T8. Table 267 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH38804_PEA_1_node_5を、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表268は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H38804_PEA_1_node_5 according to the invention can be found in the following transcript: H38804_PEA_1_T24 and H38804_PEA_1_T8. Table 268 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/RR4oV8zYLg/QlORqeqpIp:BUB3_HUMAN

Sequence documentation:

Alignment of: H38804_PEA_1_P5 x BUB3_HUMAN ..

Alignment segment 1/1:

Quality: 3244.00 Escore: 0
Matching length: 324 Total length: 324
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
58 MTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWDTSVRLYDVPANSMR 107
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWDTSVRLYDVPANSMR 50
. . . . .
108 LKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMHDLNTDQENLVGTHDAPIR 157
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMHDLNTDQENLVGTHDAPIR 100
. . . . .
158 CVEYCPEVNVMVTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRL 207
||||||||||||||||||||||||||||||||||||||||||||||||||
101 CVEYCPEVNVMVTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRL 150
. . . . .
208 IVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIE 257
||||||||||||||||||||||||||||||||||||||||||||||||||
151 IVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIE 200
. . . . .
258 GRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQIYPVNAISFHNIHNTFA 307
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQIYPVNAISFHNIHNTFA 250
. . . . .
308 TGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYE 357
||||||||||||||||||||||||||||||||||||||||||||||||||
251 TGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYE 300
. .
358 MDDTEHPEDGIFIRQVTDAETKPK 381
||||||||||||||||||||||||
301 MDDTEHPEDGIFIRQVTDAETKPK 324




Sequence name: /tmp/Db0dQEpSuo/Lr8HPXaeBg:BUB3_HUMAN

Sequence documentation:

Alignment of: H38804_PEA_1_P17 x BUB3_HUMAN ..

Alignment segment 1/1:

Quality: 3288.00 Escore: 0
Matching length: 328 Total length: 328
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
58 MTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWDTSVRLYDVPANSMR 107
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWDTSVRLYDVPANSMR 50
. . . . .
108 LKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMHDLNTDQENLVGTHDAPIR 157
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMHDLNTDQENLVGTHDAPIR 100
. . . . .
158 CVEYCPEVNVMVTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRL 207
||||||||||||||||||||||||||||||||||||||||||||||||||
101 CVEYCPEVNVMVTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRL 150
. . . . .
208 IVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIE 257
||||||||||||||||||||||||||||||||||||||||||||||||||
151 IVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIE 200
. . . . .
258 GRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQIYPVNAISFHNIHNTFA 307
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQIYPVNAISFHNIHNTFA 250
. . . . .
308 TGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYE 357
||||||||||||||||||||||||||||||||||||||||||||||||||
251 TGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYE 300
. .
358 MDDTEHPEDGIFIRQVTDAETKPKSPCT 385
||||||||||||||||||||||||||||
301 MDDTEHPEDGIFIRQVTDAETKPKSPCT 328


Mutated protein alignment against previously known proteins:
Sequence name: / tmp / RR4oV8zYLg / QlORqeqpIp: BUB3_HUMAN

Sequence documentation:

Alignment of: H38804_PEA_1_P5 x BUB3_HUMAN ..

Alignment segment 1/1:

Quality: 3244.00 Escore: 0
Matching length: 324 Total length: 324
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
58 MTGSNEFKLNQPPEDGIS SVKF SPNT SQFLLVSS WDTSVRLYDVPANSMR 107
||||||||||||||||||||||||||||||||||||||||
1 MTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWDTSVRLYDVPANSMR 50
....
108 LKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMDLNTDQENLVGTHDAPIR 157
||||||||||||||||||||||||||||||||||||||||
51 LKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMDLNTDQENLVGTHDAPIR 100
....
158 CVEYCPEVNMVMTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRL 207
||||||||||||||||||||||||||||||||||||||||
101 CVEYCPEVNMVMTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRL 150
....
208 IGGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIE 257
||||||||||||||||||||||||||||||||||||||||
151 IVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIE 200
....
258 GRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQ IYPVNAISFHNIHTFA 307
||||||||||||||||||||||||||||||||||||||||
201 GRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQ IYPVNAISFHNIHNTFA 250
....
308 TGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYE 357
||||||||||||||||||||||||||||||||||||||||
251 TGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYE 300
.
358 MDDTEHPEDGIFIRQVTDAETKP 381
|||||||||||||||||||||||
301 MDDTEHPEDGIFIRQVTDAETKPK 324




Sequence name: / tmp / Db0dQEpSuo / Lr8HPXaeBg: BUB3_HUMAN

Sequence documentation:

Alignment of: H38804_PEA_1_P17 x BUB3_HUMAN ..

Alignment segment 1/1:

Quality: 3288.00 Escore: 0
Matching length: 328 Total length: 328
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
58 MTGSNEFKLNQPPEDGIS SVKF SPNT SQFLLVSS WDTSVRLYDVPANSMR 107
||||||||||||||||||||||||||||||||||||||||
1 MTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWDTSVRLYDVPANSMR 50
....
108 LKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMDLNTDQENLVGTHDAPIR 157
||||||||||||||||||||||||||||||||||||||||
51 LKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMDLNTDQENLVGTHDAPIR 100
....
158 CVEYCPEVNMVMTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRL 207
||||||||||||||||||||||||||||||||||||||||
101 CVEYCPEVNMVMTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRL 150
....
208 IGGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIE 257
||||||||||||||||||||||||||||||||||||||||
151 IVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIE 200
....
258 GRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQ IYPVNAISFHNIHTFA 307
||||||||||||||||||||||||||||||||||||||||
201 GRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQ IYPVNAISFHNIHNTFA 250
....
308 TGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYE 357
||||||||||||||||||||||||||||||||||||||||
251 TGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYE 300
.
358 MDDTEHPEDGIFIRQVTDAETKPKSPCT 385
||||||||||||||||||||||||||
301 MDDTE HPED GIFIRQVTDAETKP KSPCT 328

クラスターHSENA78の説明
クラスターHSENA78は、目的の1つの転写物および7個のセグメントを特徴とし、その名称を、それぞれ表269および270に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表271に示す。
Description of cluster HSENA 78 The cluster HSENA 78 features one transcript and 7 segments of interest, the names of which are shown in Tables 269 and 270, respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 271.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質である小誘導性サイトカイン(Small inducible cytokine)B5前駆体(SwissProtアクセッション識別子SZ05_HUMAN、同義語CXCL5、上皮由来好中球活性化タンパク質78、好中球活性化ペプチドENA−78としても公知である)(配列番号1425)の変異型である。   These sequences are Small Inducible Cytokine B5 Precursor (SwissProt Accession Identifier SZ05_HUMAN, synonym CXCL5, synonym for CXCL5, an epithelial derived neutrophil), which is a known protein, previously known herein as a protein. Activation protein 78, a variant of (also known as neutrophil activation peptide ENA-78) (SEQ ID NO: 1425).

タンパク質小誘導性サイトカインB5前駆体は、以下の機能を有することが公知であるか、そのように見なされている:好中球活性化に関与する。タンパク質小誘導性サイトカインB5前駆体の配列を、「小誘導性サイトカインB5前駆体アミノ酸配列」として出願書類の最後に示す。タンパク質小誘導性サイトカインB5前駆体の局在化は、分泌と考えられる。   The small protein inducible cytokine B5 precursor is known or is considered to have the following function: involved in neutrophil activation. The sequence of the small protein inducible cytokine B5 precursor is shown at the end of the application as "small inducible cytokine B5 precursor amino acid sequence". Localization of the small protein inducible cytokine B5 precursor is considered secretion.

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである走化性、シグナル伝達、細胞−細胞シグナル伝達、細胞増殖のポジティブコントロール、分子機能に関連する注釈付けであるケモカイン。   The following GO annotation applies to previously known proteins. The following annotations were found: annotation related to biological processes: chemotaxis, signal transduction, cell-cell signaling, positive control of cell proliferation, chemokines related to molecular function .

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

クラスターHSENA78を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図24のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   Cluster HSENA 78 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The terms "numbers" in the right column of the table and the numbers on the y-axis of FIG. 24 refer to the weighted expression of ESTs in each category as "ppm" (the ppm of ESTs of a particular cluster in this category by ppm) Ratio of expression to expression of all ESTs).

概して、図24および表272中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):上皮悪性腫瘍および肺悪性腫瘍。   As shown generally for the histograms in FIG. 24 and Table 272, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: epithelial malignancy and lung malignancy.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、クラスターHSENA78は、上の表269に列挙した1つの転写物を特徴とする。これらの転写物は、タンパク質小誘導性サイトカインB5前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster HSENA 78 is characterized by one transcript as listed in Table 269 above. These transcripts encode proteins which are variants of the small protein inducible cytokine B5 precursor. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質HSENA78_P2は、出願書類の最後に示すアミノ酸配列を有し、転写物HSENA78_T5によってコードされる。公知のタンパク質(小誘導性サイトカインB5前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HSENA 78_P2 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HSENA 78_T5. An alignment to a known protein (small inducible cytokine B5 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HSENA78_P2とSZ05_HUMANとの間の比較の報告
1.SZ05_HUMANのアミノ酸1〜81に対応し、HSENA78_P2のアミノ酸1〜81にも対応するMSLLSSRAARVPGPSSSLCALLVLLLLLTQPGPIASAGPAAAVLRELRCVCLQTTQGVHPKMISNLQVFAIGPQCSKVEVVと少なくとも90%相同な第1のアミノ酸配列を含む、HSENA78_P2をコードする単離キメラポリペプチド。
Report of the comparison between HSENA 78_P2 and SZ05_HUMAN 1. MSLLSSRAARVPPSSSLCALL VLLLLLT GPGPIASAGPAAVLRELRCV CLQTT QGVHPK MISNLQ VFAIGPQCSKVEVV corresponding to amino acids 1-81 of SZ05_HUMAN and corresponding to amino acids 1-81 of HSENA 78_P2 An isolated chimeric polypeptide comprising HSENA 78_P2 comprising a first amino acid sequence at least 90% homologous to VIVAIGPQCSKVEVV.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HSENA78_P2はまた、表274に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSENA78_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HSENA 78_P2 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 274) It is indicated whether it is known and the presence of a known SNP in the mutant protein HSENA 78_P2 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質HSENA78_P2は、以下の転写物によってコードされる:HSENA78_T5(配列は出願書類の最後に示す)。転写物HSENA78_T5のコード部分を太字で示し、このコード部分は149位から開始され、391位で終結する。転写物はまた、表275に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSENA78_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HSENA 78_P2 is encoded by the following transcript: HSENA 78_T5 (sequences shown at the end of the application). The coding portion of the transcript HSENA 78_T5 is shown in bold, starting from position 149 and ending at position 391. The transcript also has the following SNPs listed in Table 275 (showing its position on the nucleotide sequence, listing another nucleic acid, the last column indicating if the SNP is known, mutein HSENA 78_P2 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターHSENA78は、上の表270に列挙した7個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As noted above, cluster HSENA 78 features the seven segments listed in Table 270 above, the sequences of which are shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターHSENA78_node_0は、24個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSENA78_T5。以下の表276は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSENA 78_node_0 of the present invention is supported by 24 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSENA 78_T5. Table 276 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHSENA78_node_2は、22個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSENA78_T5。以下の表277は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSENA 78_node_2 of the present invention is supported by 22 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSENA 78_T5. Table 277 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHSENA78_node_6は、68個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSENA78_T5。以下の表278は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSENA 78_node 6 of the present invention is supported by 68 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSENA 78_T5. Table 278 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHSENA78_node_9は、28個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSENA78_T5。以下の表279は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSENA 78_node_9 of the present invention is supported by 28 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSENA 78_T5. Table 279 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターHSENA78_node_3は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSENA78_T5。以下の表280は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSENA 78_node_3 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: HSENA 78_T5. Table 280 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHSENA78_node_4は、17個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSENA78_T5。以下の表281は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSENA 78_node_4 of the present invention is supported by 17 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSENA 78_T5. Table 281 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHSENA78_node_8を、以下の転写物中に見出すことができる:HSENA78_T5。以下の表282は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSENA 78_node_8 according to the invention can be found in the following transcript: HSENA 78_T5. Table 282 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/5kiQY6MxWx/pLnTrxsCqk:SZ05_HUMAN

Sequence documentation:

Alignment of: HSENA78_P2 x SZ05_HUMAN ..

Alignment segment 1/1:

Quality: 767.00 Escore: 0
Matching length: 81 Total length: 81
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MSLLSSRAARVPGPSSSLCALLVLLLLLTQPGPIASAGPAAAVLRELRCV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MSLLSSRAARVPGPSSSLCALLVLLLLLTQPGPIASAGPAAAVLRELRCV 50
. . .
51 CLQTTQGVHPKMISNLQVFAIGPQCSKVEVV 81
|||||||||||||||||||||||||||||||
51 CLQTTQGVHPKMISNLQVFAIGPQCSKVEVV 81


Mutated protein alignment against previously known proteins:
Sequence name: / tmp / 5kiQY6MxWx / pLnTrxsCqk: SZ05_HUMAN

Sequence documentation:

Alignment of: HSENA 78_P2 x SZ05_HUMAN ..

Alignment segment 1/1:

Quality: 767.00 Escore: 0
Matching length: 81 Total length: 81
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MSLLSSRAARVPPSSSLCALLLLLLLTQPGPIASGPAAVLRELRCV 50
||||||||||||||||||||||||||||||||||||||||
1 MSLLSSRAARVPPSSSLCALLLLLLLTQPGPIASGPAAVLRELRCV 50
....
51 CLQTTQGVHPKMISNLQVFAIGPQCSKVEVV 81
|||||||||||||||||||||||||||||
51 CLQTTQGVHPKMISNLQVFAIGPQCSKVEVV 81

クラスターHUMODCAの説明
クラスターHUMODCAは、目的の1つの転写物および17個のセグメントを特徴とし、その名称を、それぞれ表283および284に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表285に示す。
Description of cluster HUMODCA The cluster HUMODCA is characterized by one transcript and 17 segments of interest, the names of which are given in Tables 283 and 284, respectively, and the sequence itself is given at the end of the application. Selected protein variants are shown in Table 285.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるオルニチンデカルボキシラーゼ(SwissProtアクセッション識別子DCOR_HUMAN、同義語はEC4.1.1.17、ODCとしても公知である)(配列番号1426)の変異型である。   These sequences are the known proteins ornithine decarboxylase (SwissProt accession identifier DCOR_HUMAN, synonym EC4.1.1.17, also known as ODC), which is a known protein, previously known herein as a protein. (SEQ ID NO: 1426) is a mutated form.

タンパク質オルニチンデカルボキシラーゼは、以下の機能を有することが公知であるか、そのように見なされている:ポリアミン生合成、第1(律速)段階。タンパク質オルニチンデカルボキシラーゼの配列を、「オルニチンデカルボキシラーゼアミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表286に示す。   The protein ornithine decarboxylase is known or is considered to have the following function: polyamine biosynthesis, first (rate-limiting) step. The sequence of the protein ornithine decarboxylase is shown at the end of the application as "ornithine decarboxylase amino acid sequence". Known polymorphisms of this sequence are shown in Table 286.

Figure 2008507261
Figure 2008507261

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けであるポリアミン生合成および分子機能に関連する注釈付けであるオルニチンデカルボキシラーゼ、リアーゼ。   The following GO annotation applies to previously known proteins. The following annotations were found: ornithine decarboxylase, a lyase, which is an annotation related to polyamine biosynthesis and molecular function which is an annotation related to biological processes.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

クラスターHUMODCAを、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図25のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   The cluster HUMODCA can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The terms "numbers" in the right column of the table and the numbers on the y-axis of FIG. 25 refer to the weighted expression of ESTs in each category as "ppm" (for ESTs of a particular cluster in this category by ppm Ratio of expression to expression of all ESTs).

概して、図25および表287中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):脳悪性腫瘍、結腸直腸癌、上皮悪性腫瘍、および異なる組織由来の悪性腫瘍の混合物。   In general, as shown for the histograms in FIG. 25 and Table 287, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: brain malignancy, colorectal cancer, epithelial malignancy, and a mixture of malignancies from different tissues.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、クラスターHUMODCAは、上の表283に列挙した1つの転写物を特徴とする。これらの転写物は、タンパク質オルニチンデカルボキシラーゼの変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster HUMODCA is characterized by one transcript as listed in Table 283 above. These transcripts encode proteins which are variants of the protein ornithine decarboxylase. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質HUMODCA_P9は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMODCA_T17によってコードされる。公知のタンパク質(オルニチンデカルボキシラーゼ)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HUMODCA_P9 according to the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HUMODCA_T17. An alignment to a known protein (ornithine decarboxylase) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HUMODCA_P9とDCOR_HUMANとの間の比較の報告
1.HUMODCA_P9のアミノ酸1〜29に対応する配列MKSLTATSSMKVLLPRTFWTRKLMKFLLLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、DCOR_HUMANのアミノ酸151〜461に対応し、HUMODCA_P9のアミノ酸30〜340にも対応するLVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGSGCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEEITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQTGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKYYSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGFQRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRHRAACASASINVと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、HUMODCA_P9をコードする単離キメラポリペプチド。
Report on comparison between HUMODCA_P9 and DCOR_HUMAN 1. At least 70%, optionally at least 80%, preferably at least 85%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to a polypeptide having the sequence MKSLTATSSMKVLLPRTFTRKLMKFLLL corresponding to amino acids 1-29 of HUMODCA_P9 1 and an amino acid sequence of DCOR_HUMAN corresponding to amino acids 151 to 461, and corresponding to amino acids 30 to 340 of HUMODCA_P9 LVLRIA TDD SKAVCRL SVKGA GRTLS RLLL EREKALN ID V VG SF HV GS GC TD PET FV AAIS DARC VFD MGF SAFTLAVNIIAKKIVLKEQTGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKYYSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGFQRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRHRAACASASINV and and at least 90% homologous to a second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, the isolated chimeric polypeptide coding HUMODCA_P9.

2.HUMODCA_P9の配列MKSLTATSSMKVLLPRTFWTRKLMKFLLLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMODCA_P9の先端をコードする単離ポリペプチド。   2. The tip of HUMODCA_P9 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence MKSLTATSSMKVLLPRTFTRKLMKFLLL of HUMODCA_P9 An isolated polypeptide encoding

HUMODCA_P9とAAA59968(配列番号1702)との間の比較の報告
1.HUMODCA_P9のアミノ酸1〜29に対応する配列MKSLTATSSMKVLLPRTFWTRKLMKFLLLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、AAA59968のアミノ酸40〜350に対応し、HUMODCA_P9のアミノ酸30〜340にも対応するLVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGSGCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEEITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQTGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKYYSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGFQRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRHRAACASASINVと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、HUMODCA_P9をコードする単離キメラポリペプチド。
Report of the comparison between HUMODCA_P9 and AAA59968 (SEQ ID NO: 1702) At least 70%, optionally at least 80%, preferably at least 85%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to a polypeptide having the sequence MKSLTATSSMKVLLPRTFTRKLMKFLLL corresponding to amino acids 1-29 of HUMODCA_P9 The amino acid sequence of 1 and amino acid 40 to 350 of AAA59968 and corresponding to amino acid 30 to 340 of HUMODCA_P9 LVLRIA TDD SKAVCRL SVKGA TLRTSRLL ERRA EKEL NID VVG SF GS GSD TPET FV TLAVNIIAKKIVLKEQTGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKYYSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGFQRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRHRAACASASINV and and at least 90% homologous to a second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, the isolated chimeric polypeptide coding HUMODCA_P9.

2.HUMODCA_P9の配列MKSLTATSSMKVLLPRTFWTRKLMKFLLLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMODCA_P9の先端をコードする単離ポリペプチド。   2. The tip of HUMODCA_P9 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence MKSLTATSSMKVLLPRTFTRKLMKFLLL of HUMODCA_P9 An isolated polypeptide encoding

HUMODCA_P9とAAH14562(配列番号1703)との間の比較の報告
1.HUMODCA_P9のアミノ酸1〜29に対応する配列MKSLTATSSMKVLLPRTFWTRKLMKFLLLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、AAH14562のアミノ酸86〜396に対応し、HUMODCA_P9のアミノ酸30〜340にも対応するLVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGSGCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEEITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQTGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKYYSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGFQRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRHRAACASASINVと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、HUMODCA_P9をコードする単離キメラポリペプチド。
Report of the comparison between HUMODCA_P9 and AAH14562 (SEQ ID NO: 1703) At least 70%, optionally at least 80%, preferably at least 85%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to a polypeptide having the sequence MKSLTATSSMKVLLPRTFTRKLMKFLLL corresponding to amino acids 1-29 of HUMODCA_P9 1 and the amino acid sequence of AAH14562 corresponding to amino acids 86 to 396 and corresponding to amino acids 30 to 340 of HUMODCA_P9 LVLRIA TDD SKAVCRL SVKGA TLRTSRLL ERRA KELN ID V VG SF HV GS GC TD PET FV TLAVNIIAKKIVLKEQTGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKYYSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGFQRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRHRAACASASINV and and at least 90% homologous to a second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, the isolated chimeric polypeptide coding HUMODCA_P9.

2.HUMODCA_P9の配列MKSLTATSSMKVLLPRTFWTRKLMKFLLLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMODCA_P9の先端をコードする単離ポリペプチド。   2. The tip of HUMODCA_P9 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence MKSLTATSSMKVLLPRTFTRKLMKFLLL of HUMODCA_P9 An isolated polypeptide encoding

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HUMODCA_P9はまた、表289に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMODCA_P9配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMODCA_P9 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing the other amino acids, and listing the other amino acids, as shown in Table 289) It is indicated whether it is known and the presence of a known SNP in the mutant protein HUMODCA_P9 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

変異タンパク質HUMODCA_P9は、以下の転写物によってコードされる:HUMODCA_T17(配列は出願書類の最後に示す)。転写物HUMODCA_T17のコード部分を太字で示し、このコード部分は528位から開始され、1547位で終結する。転写物はまた、表290に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMODCA_P9配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMODCA_P9 is encoded by the following transcript: HUMODCA_T17 (sequences shown at the end of the application). The coding part of the transcript HUMODCA_T17 is shown in bold, starting from position 528 and ending at position 1547. The transcript also has the following SNPs listed in Table 290 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, the mutein HUMODCA_P9 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

上記のように、クラスターHUMODCAは、上の表284に列挙した17個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As noted above, cluster HUMODCA is characterized by the 17 segments listed in Table 284 above, the sequences of which are shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターHUMODCA_node_1は、76個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表291は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMODCA_node_1 of the present invention is supported by 76 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMODCA_T17. Table 291 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMODCA_node_25は、190個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表292は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMODCA_node_25 of the present invention is supported by 190 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMODCA_T17. Table 292 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMODCA_node_32は、249個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表293は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMODCA_node_32 of the present invention is supported by 249 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMODCA_T17. Table 293 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMODCA_node_36は、348
個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表294は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
The segment cluster HUMODCA_node_36 of the present invention is 348
Supported by a library. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMODCA_T17. Table 294 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMODCA_node_39は、297個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表295は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMODCA_node_39 of the present invention is supported by 297 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMODCA_T17. Table 295 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMODCA_node_41は、230個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表296は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMODCA_node_41 of the present invention is supported by 230 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMODCA_T17. Table 296 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターHUMODCA_node_0は、9個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表297は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMODCA_node_0 of the present invention is supported by nine libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMODCA_T17. Table 297 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMODCA_node_10は、107個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表298は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMODCA_node_10 of the present invention is supported by 107 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMODCA_T17. Table 298 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMODCA_node_12は、132個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表299は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMODCA_node_12 of the present invention is supported by 132 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMODCA_T17. Table 299 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMODCA_node_13は、126個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表300は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMODCA_node_13 of the present invention is supported by 126 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMODCA_T17. Table 300 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMODCA_node_2は、81個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表301は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMODCA_node_2 of the present invention is supported by 81 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMODCA_T17. Table 301 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMODCA_node_27は、185個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表302は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMODCA_node_27 of the present invention is supported by 185 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMODCA_T17. Table 302 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMODCA_node_3は、85個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表303は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMODCA_node_3 of the present invention is supported by 85 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMODCA_T17. Table 303 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMODCA_node_30は、196個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表304は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMODCA_node_30 of the present invention is supported by 196 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMODCA_T17. Table 304 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMODCA_node_34は、259個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表305は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMODCA_node_34 of the present invention is supported by 259 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMODCA_T17. Table 305 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMODCA_node_38は、272個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表306は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMODCA_node_38 of the present invention is supported by 272 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMODCA_T17. Table 306 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMODCA_node_40は、239個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表307は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMODCA_node_40 of the present invention is supported by 239 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMODCA_T17. Table 307 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/y03EwE6i01/dRQ5l2K6e2:DCOR_HUMAN

Sequence documentation:

Alignment of: HUMODCA_P9 x DCOR_HUMAN ..

Alignment segment 1/1:

Quality: 3056.00 Escore: 0
Matching length: 311 Total length: 311
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
30 LVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGS 79
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGS 200
. . . . .
80 GCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEE 129
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEE 250
. . . . .
130 ITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQ 179
||||||||||||||||||||||||||||||||||||||||||||||||||
251 ITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQ 300
. . . . .
180 TGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKY 229
||||||||||||||||||||||||||||||||||||||||||||||||||
301 TGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKY 350
. . . . .
230 YSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGF 279
||||||||||||||||||||||||||||||||||||||||||||||||||
351 YSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGF 400
. . . . .
280 QRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRH 329
||||||||||||||||||||||||||||||||||||||||||||||||||
401 QRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRH 450
.
330 RAACASASINV 340
|||||||||||
451 RAACASASINV 461






Sequence name: /tmp/y03EwE6i01/dRQ5l2K6e2:AAA59968

Sequence documentation:

Alignment of: HUMODCA_P9 x AAA59968 ..

Alignment segment 1/1:

Quality: 3056.00 Escore: 0
Matching length: 311 Total length: 311
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
30 LVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGS 79
||||||||||||||||||||||||||||||||||||||||||||||||||
40 LVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGS 89
. . . . .
80 GCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEE 129
||||||||||||||||||||||||||||||||||||||||||||||||||
90 GCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEE 139
. . . . .
130 ITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQ 179
||||||||||||||||||||||||||||||||||||||||||||||||||
140 ITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQ 189
. . . . .
180 TGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKY 229
||||||||||||||||||||||||||||||||||||||||||||||||||
190 TGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKY 239
. . . . .
230 YSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGF 279
||||||||||||||||||||||||||||||||||||||||||||||||||
240 YSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGF 289
. . . . .
280 QRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRH 329
||||||||||||||||||||||||||||||||||||||||||||||||||
290 QRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRH 339
.
330 RAACASASINV 340
|||||||||||
340 RAACASASINV 350






Sequence name: /tmp/y03EwE6i01/dRQ5l2K6e2:AAH14562

Sequence documentation:

Alignment of: HUMODCA_P9 x AAH14562 ..

Alignment segment 1/1:

Quality: 3056.00 Escore: 0
Matching length: 311 Total length: 311
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
30 LVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGS 79
||||||||||||||||||||||||||||||||||||||||||||||||||
86 LVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGS 135
. . . . .
80 GCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEE 129
||||||||||||||||||||||||||||||||||||||||||||||||||
136 GCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEE 185
. . . . .
130 ITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQ 179
||||||||||||||||||||||||||||||||||||||||||||||||||
186 ITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQ 235
. . . . .
180 TGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKY 229
||||||||||||||||||||||||||||||||||||||||||||||||||
236 TGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKY 285
. . . . .
230 YSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGF 279
||||||||||||||||||||||||||||||||||||||||||||||||||
286 YSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGF 335
. . . . .
280 QRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRH 329
||||||||||||||||||||||||||||||||||||||||||||||||||
336 QRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRH 385
.
330 RAACASASINV 340
|||||||||||
386 RAACASASINV 396

Mutated protein alignment against previously known proteins:
Sequence name: / tmp / y03EwE6i01 / dRQ5l2K6e2: DCOR_HUMAN

Sequence documentation:

Alignment of: HUMODCA_P9 x DCOR_HUMAN ..

Alignment segment 1/1:

Quality: 3056.00 Escore: 0
Matching length: 311 Total length: 311
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
30 LVLRIA TDD SK AVC RL SV KF GATLRTS RLL LER ER KELN ID V VG V SF HVGS 79
||||||||||||||||||||||||||||||||||||||||
151 LVLRIATDDD SKAVCRL SVKFGATLRTSLLLLERAKELNIDVVG VSFHVGS 200
....
80 GCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEE 129
||||||||||||||||||||||||||||||||||||||||
201 GCTDPETFVQAISDARCLVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEE 250
....
130 ITGVINPALDKYFPSDSGVRIIAEGPRYYVASAFTLAVNII AKKIVLKEQ 179
||||||||||||||||||||||||||||||||||||||||
251 ITGVINPALDKYFPSDSDVRIIAEPGRYYVASAFTLAVNII AKKIVLKEQ 300
....
180 TGSDDEDESSEQTF MYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKY 229
||||||||||||||||||||||||||||||||||||||||
301 TGSDDEDESSEQTF MYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKY 350
....
230 YSSSIWGPTCDGLDRIVERCDLPEMVHVGDWMLFENMGAYTVAAASTFNGF 279
||||||||||||||||||||||||||||||||||||||||
351 YSSSIWGPTCDGLDRIVERCDLPEMVHVGDWMLFENMGAYTVAAASTFNGF 400
....
280 QRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSAWESGMKRH 329
||||||||||||||||||||||||||||||||||||||||
401 QRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSAWESGMKRH 450
.
330 RAACASASINV 340
|||||||||||
451 RAACASASINV 461






Sequence name: / tmp / y03EwE6i01 / dRQ5l2K6e2: AAA59968

Sequence documentation:

Alignment of: HUMODCA_P9 x AAA59968 ..

Alignment segment 1/1:

Quality: 3056.00 Escore: 0
Matching length: 311 Total length: 311
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
30 LVLRIA TDD SK AVC RL SV KF GATLRTS RLL LER ER KELN ID V VG V SF HVGS 79
||||||||||||||||||||||||||||||||||||||||
40 LVLRIA TDD SKAVCRL SVKFGATLRTSLRLLERAKELNIDVVGVSFHVGS 89
....
80 GCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEE 129
||||||||||||||||||||||||||||||||||||||||
90 GCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEE 139
....
130 ITGVINPALDKYFPSDSGVRIIAEGPRYYVASAFTLAVNII AKKIVLKEQ 179
||||||||||||||||||||||||||||||||||||||||
140 ITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNII AKKI VLKEQ 189
....
180 TGSDDEDESSEQTF MYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKY 229
||||||||||||||||||||||||||||||||||||||||
190 TGSDDEDESSEQTF MYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKY 239
....
230 YSSSIWGPTCDGLDRIVERCDLPEMVHVGDWMLFENMGAYTVAAASTFNGF 279
||||||||||||||||||||||||||||||||||||||||
240 YSSSIWGPTCDGLDRIVERCDLPEMVHVGDWMLFENMGAYTVAAASTFNGF 289
....
280 QRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSAWESGMKRH 329
||||||||||||||||||||||||||||||||||||||||
290 QRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVISAWESGMKRH 339
.
330 RAACASASINV 340
|||||||||||
340 RAACASASINV 350






Sequence name: / tmp / y03EwE6i01 / dRQ5l2K6e2: AAH14562

Sequence documentation:

Alignment of: HUMODCA_P9 x AAH14562 ..

Alignment segment 1/1:

Quality: 3056.00 Escore: 0
Matching length: 311 Total length: 311
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
30 LVLRIA TDD SK AVC RL SV KF GATLRTS RLL LER ER KELN ID V VG V SF HVGS 79
||||||||||||||||||||||||||||||||||||||||
86 LVLRIATDKSKAVCRLSVKFGATLRTSLRLLERAKELNIDVVGVSFHVGS 135
....
80 GCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEE 129
||||||||||||||||||||||||||||||||||||||||
136 GCTDPETFVQ AISDARCLVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEE 185
....
130 ITGVINPALDKYFPSDSGVRIIAEGPRYYVASAFTLAVNII AKKIVLKEQ 179
||||||||||||||||||||||||||||||||||||||||
186 ITGVINPALDKYFPSDSGVRIIAEGPRYYVASAFTLAVNII AKKI VLKEQ 235
....
180 TGSDDEDESSEQTF MYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKY 229
||||||||||||||||||||||||||||||||||||||||
236 TGSDDEDESSEQTF MYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKY 285
....
230 YSSSIWGPTCDGLDRIVERCDLPEMVHVGDWMLFENMGAYTVAAASTFNGF 279
||||||||||||||||||||||||||||||||||||||||
286 YSSSIWGPTCDGLDRIVERCDLPEMVHVGDWMLFENMGAYTVAAASTFNGF 335
....
280 QRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSAWESGMKRH 329
||||||||||||||||||||||||||||||||||||||||
336 QRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVISAWESGMKRH 385
.
330 RAACASASINV 340
|||||||||||
386 RAACASASINV 396

クラスターR00299の説明
クラスターR00299は、目的の1つの転写物および12個のセグメントを特徴とし、その名称を、それぞれ表308および309に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表310に示す。
Description of cluster R00299 Cluster R00299 features one transcript and 12 segments of interest, the names of which are shown in Tables 308 and 309, respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 310.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるテスカルシン(Tescalcin)(SwissProtアクセッション識別子TESC_HUMAN、同義語TSCとしても公知である)(配列番号1427)の変異型である。   These sequences are variants of the known protein Tescalcin (SwissProt accession identifier TESC_HUMAN, also known as synonym TSC) (SEQ ID NO: 1427), a known protein, previously known herein as a protein. It is.

タンパク質テスカルシンは、以下の機能を有することが公知であるか、そのように見なされている:カルシウムに結合する。タンパク質テスカルシンの配列を、「テスカルシンアミノ酸配列」として出願書類の最後に示す。   The protein tescalcin is known or considered to have the following function: It binds calcium. The sequence of the protein Tescalcin is shown at the end of the application as "Tescalcin amino acid sequence".

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:分子機能に関連する注釈付けであるカルシウム結合。   The following GO annotation applies to previously known proteins. The following annotations were found: calcium binding, which is an annotation related to molecular function.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

クラスターR00299を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図26のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   Cluster R00299 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The terms "numbers" in the right column of the table and the numbers on the y-axis of Fig. 26 refer to the weighted expression of ESTs in each category as "ppm" (for ESTs of a particular cluster in this category by ppm Ratio of expression to expression of all ESTs).

概して、図26および表311中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):肺悪性腫瘍。   In general, as shown for the histograms in FIG. 26 and Table 311, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: lung malignancy.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、クラスターR00299は、上の表308に列挙した1つの転写物を特徴とする。これらの転写物は、タンパク質テスカルシンの変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster R00299 features one transcript as listed in Table 308 above. These transcripts encode a protein which is a mutated form of the protein tescalcin. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質R00299_P3は、出願書類の最後に示すアミノ酸配列を有し、転写物R00299_T2によってコードされる。公知のタンパク質(テスカルシン)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein R00299_P3 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript R00299_T2. An alignment to a known protein (Tescalcin) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

R00299_P3とQ9NWT9(配列番号1704)との間の比較の報告
1.R00299_P3のアミノ酸1〜44に対応する配列MAEKALLCPSSAGLGTWPWVLNSAWPVLPLAVDQGVDWRPRGPVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、Q9NWT9のアミノ酸74〜191に対応し、R00299_P3のアミノ酸45〜162にも対応するSSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDLELNPIRSKIVRAFFDNRNLRKGPSGLADEINFEDFLTIMSYFRPIDTTMDEEQVELSRKEKLRFLFHMYDSDSDGRITLEEYRNVと少なくとも90%相同な第2のアミノ酸配列と、R00299_P3のアミノ酸163〜238に対応する配列VEELLSGNPHIEKESARSIADGAMMEAASVCMGQMEPDQVYEGITFEDFLKIWQGIDIETKMHVRFLNMETMALCHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1、第2、および第3のアミノ酸配が、隣接し、且つ連続した順序にある、R00299_P3をコードする単離キメラポリペプチド。
Report of comparison between R00299_P3 and Q9NWT9 (SEQ ID NO: 1704) At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to a polypeptide having the sequence MAEKALLCPSSAGLGTWPWVLNSAWPVLPLAVDQGVDWRPRGPV corresponding to amino acids 1-44 of R00299_P3 1 amino acid sequence corresponding to amino acids 74 to 191 of Q9NWT9 and corresponding to amino acids 45 to 162 of R00299_P3 SSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDELNPIRSK IRNAPRDNASRDRNRNRKGPSGLADEINFEDLFLTIMSYFQELSRKEKLRFLFLFMYSDSDDGIPLEIEVIV A polypeptide having at least 70%, optionally at least 80%, preferably at least 85%, preferably with a second amino acid sequence 90% homologous and a polypeptide having the sequence VEELLSGNPHIEKESARSIADGAMMEAASVCMGQMEPDQ corresponding to amino acids 163 to 238 of R00299_P3 with YE A single encoding R00299_P3 comprising a third amino acid sequence which is 90%, most preferably at least 95% homologous, said first, second and third amino acid sequences being in a contiguous and sequential order Detached chimeric polypeptide.

2.R00299_P3の配列MAEKALLCPSSAGLGTWPWVLNSAWPVLPLAVDQGVDWRPRGPVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R00299_P3の先端をコードする単離ポリペプチド。   2. The tip of R00299_P3 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence MAEKALL CPSS AGLGTW PWWVLNSAWPVLPLDV GVDWRPRGPV An isolated polypeptide encoding

3.R00299_P3中の配列VEELLSGNPHIEKESARSIADGAMMEAASVCMGQMEPDQVYEGITFEDFLKIWQGIDIETKMHVRFLNMETMALCHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R00299_P3のテールをコードする単離ポリペプチド。   3. R00299_P3 containing a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence VEELLS GN PHIEKESAR S An isolated polypeptide encoding a tail.

R00299_P3とTESC_HUMANとの間の比較の報告
1.R00299_P3のアミノ酸1〜44に対応する配列MAEKALLCPSSAGLGTWPWVLNSAWPVLPLAVDQGVDWRPRGPVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、TESC_HUMANのアミノ酸21〜214に対応し、R00299_P3のアミノ酸45〜238にも対応するSSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDLELNPIRSKIVRAFFDNRNLRKGPSGLADEINFEDFLTIMSYFRPIDTTMDEEQVELSRKEKLRFLFHMYDSDSDGRITLEEYRNVVEELLSGNPHIEKESARSIADGAMMEAASVCMGQMEPDQVYEGITFEDFLKIWQGIDIETKMHVRFLNMETMALCHと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R00299_P3をコードする単離キメラポリペプチド。
Report of comparison between R00299_P3 and TESC_HUMAN 1. At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to a polypeptide having the sequence MAEKALLCPSSAGLGTWPWVLNSAWPVLPLAVDQGVDWRPRGPV corresponding to amino acids 1-44 of R00299_P3 1 and corresponding to amino acids 21 to 214 of TESC_HUMAN and corresponding to amino acids 45 to 238 of R00299_P3 SSDQIEQLHRRFKQLSGDQPTIRKENNNNNNPDNELPDIRNPIRSK IVRAFFDRNRNRKGPSGLADEINFEDLFLTIMSYFQELSRKEKLRFLFLFHMYDSDSDGDRIELYNV EELLSGNPHIEKESARSIADGAMMEAASVCMGQMEPDQVYEGITFEDFLKIWQGIDIETKMHVRFLNMETMALCH and and at least 90% homologous to a second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, the isolated chimeric polypeptide coding R00299_P3.

2.R00299_P3の配列MAEKALLCPSSAGLGTWPWVLNSAWPVLPLAVDQGVDWRPRGPVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R00299_P3の先端をコードする単離ポリペプチド。   2. The tip of R00299_P3 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence MAEKALL CPSS AGLGTW PWWVLNSAWPVLPLDV GVDWRPRGPV An isolated polypeptide encoding

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、2つのうちの1つのシグナルペプチド推定プログラム(HMM:Signal peptide,NN:NO)によってこのタンパク質がシグナルペプチドを有すると推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is considered to be secreted as it is presumed that this protein has a signal peptide by one of two signal peptide estimation programs (HMM: Signal peptide, NN: NO).

変異タンパク質R00299_P3はまた、表313に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R00299_P3配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R00299_P3 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows the SNPs as shown in Table 313) It indicates whether it is known and the presence of a known SNP in the mutant protein R00299_P3 sequence supports the deduced sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質R00299_P3は、以下の転写物によってコードされる:R00299_T2(配列は出願書類の最後に示す)。転写物R00299_T2のコード部分を太字で示し、このコード部分は142位から開始され、855位で終結する。転写物はまた、表314に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R00299_P3配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R00299_P3 is encoded by the following transcript: R00299_T2 (sequences shown at the end of the application). The coding portion of transcript R00299_T2 is shown in bold, starting from position 142 and ending at position 855. The transcript also has the following SNPs listed in Table 314 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein R00299_P3 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターR00299は、上の表309に列挙した12個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As noted above, cluster R00299 features the twelve segments listed in Table 309 above, the sequences of which are shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターR00299_node_2は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R00299_T2。以下の表315は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R00299_node_2 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R00299_T2. Table 315 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR00299_node_30は、75個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R00299_T2。以下の表316は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R00299_node_30 of the present invention is supported by 75 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R00299_T2. Table 316 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターR00299_node_10は、46個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R00299_T2。以下の表317は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R00299_node_10 of the present invention is supported by 46 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R00299_T2. Table 317 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR00299_node_14は、61個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R00299_T2。以下の表318は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R00299_node_14 of the present invention is supported by 61 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R00299_T2. Table 318 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR00299_node_15を、以下の転写物中に見出すことができる:R00299_T2。以下の表319は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R00299_node_15 of the invention can be found in the following transcript: R00299_T2. Table 319 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR00299_node_20は、66個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R00299_T2。以下の表320は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R00299_node_20 of the present invention is supported by 66 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R00299_T2. Table 320 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR00299_node_23は、71個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R00299_T2。以下の表321は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R00299_node_23 of the present invention is supported by 71 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R00299_T2. Table 321 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR00299_node_25は、62個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R00299_T2。以下の表322は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R00299_node_25 of the present invention is supported by 62 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R00299_T2. Table 322 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR00299_node_28を、以下の転写物中に見出すことができる:R00299_T2。以下の表323は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R00299_node_28 according to the invention can be found in the following transcript: R00299_T2. Table 323 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR00299_node_31は、48個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R00299_T2。以下の表324は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R00299_node_31 of the present invention is supported by 48 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R00299_T2. Table 324 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR00299_node_5は、45個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R00299_T2。以下の表325は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R00299_node_5 of the present invention is supported by 45 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R00299_T2. Table 325 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR00299_node_9を、以下の転写物中に見出すことができる:R00299_T2。以下の表326は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R00299_node_9 according to the invention can be found in the following transcript: R00299_T2. Table 326 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、この遺伝子のマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表327に示す)。   Microarray (chip) data of this gene is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (for lung cancer) (shown in Table 327).

Figure 2008507261
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/OleVDhrKQ0/EjblgLomjM:Q9NWT9

Sequence documentation:

Alignment of: R00299_P3 x Q9NWT9 ..

Alignment segment 1/1:

Quality: 1162.00 Escore: 0
Matching length: 118 Total length: 118
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
45 SSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDLELNPIRSKIVRAFFDNR 94
||||||||||||||||||||||||||||||||||||||||||||||||||
74 SSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDLELNPIRSKIVRAFFDNR 123
. . . . .
95 NLRKGPSGLADEINFEDFLTIMSYFRPIDTTMDEEQVELSRKEKLRFLFH 144
||||||||||||||||||||||||||||||||||||||||||||||||||
124 NLRKGPSGLADEINFEDFLTIMSYFRPIDTTMDEEQVELSRKEKLRFLFH 173
.
145 MYDSDSDGRITLEEYRNV 162
||||||||||||||||||
174 MYDSDSDGRITLEEYRNV 191






Sequence name: /tmp/OleVDhrKQ0/EjblgLomjM:TESC_HUMAN

Sequence documentation:

Alignment of: R00299_P3 x TESC_HUMAN ..

Alignment segment 1/1:

Quality: 1920.00 Escore: 0
Matching length: 194 Total length: 194
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
45 SSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDLELNPIRSKIVRAFFDNR 94
||||||||||||||||||||||||||||||||||||||||||||||||||
21 SSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDLELNPIRSKIVRAFFDNR 70
. . . . .
95 NLRKGPSGLADEINFEDFLTIMSYFRPIDTTMDEEQVELSRKEKLRFLFH 144
||||||||||||||||||||||||||||||||||||||||||||||||||
71 NLRKGPSGLADEINFEDFLTIMSYFRPIDTTMDEEQVELSRKEKLRFLFH 120
. . . . .
145 MYDSDSDGRITLEEYRNVVEELLSGNPHIEKESARSIADGAMMEAASVCM 194
||||||||||||||||||||||||||||||||||||||||||||||||||
121 MYDSDSDGRITLEEYRNVVEELLSGNPHIEKESARSIADGAMMEAASVCM 170
. . . .
195 GQMEPDQVYEGITFEDFLKIWQGIDIETKMHVRFLNMETMALCH 238
||||||||||||||||||||||||||||||||||||||||||||
171 GQMEPDQVYEGITFEDFLKIWQGIDIETKMHVRFLNMETMALCH 214

Mutated protein alignment against previously known proteins:
Sequence name: / tmp / OleVDhrKQ0 / EjblgLomjM: Q9NWT9

Sequence documentation:

Alignment of: R00299_P3 x Q9NWT9 ..

Alignment segment 1/1:

Quality: 1162.00 Escore: 0
Matching length: 118 Total length: 118
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
45 SSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDLELNPIRSKIVRAFFDNR 94
||||||||||||||||||||||||||||||||||||||||
74 SSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDLELNPIRSKIVRAFFDNR 123
....
95 NLRKGPSGLADEINFEDFLTIMSYFRPIDTTM DEEQVELSRKEKLRFLF 144
||||||||||||||||||||||||||||||||||||||||
124 NLRKGPSGLADEINFEDFLTIMSYFRPIDTTM DEEQVELSRKEKLLFLF 173
.
145 MYDSDSDGRITLEEYRNV 162
|||||||||||||||||
174 MYDSDSDGRITLEEYRNV 191






Sequence name: / tmp / OleVDhrKQ0 / EjblgLomjM: TESC_HUMAN

Sequence documentation:

Alignment of: R00299_P3 x TESC_HUMAN ..

Alignment segment 1/1:

Quality: 1920.00 Escore: 0
Matching length: 194 Total length: 194
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
45 SSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDLELNPIRSKIVRAFFDNR 94
||||||||||||||||||||||||||||||||||||||||
21 SSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDLELNPIRSKIVRAFFDNR 70
....
95 NLRKGPSGLADEINFEDFLTIMSYFRPIDTTM DEEQVELSRKEKLRFLF 144
||||||||||||||||||||||||||||||||||||||||
71 NLRKGPSGLADEINFEDFLTIMSYFRPIDTTM DEEQVELSRKEKLLFLFH 120
....
145 MYDSDSDGRITLEEYRNVVEELLSGNPHIEKESARSIADGAMMEAASVCM 194
||||||||||||||||||||||||||||||||||||||||
121 MYDSDSDGRITLEEYRN VVEELLSGNPHIEKESARSIADGAMMEAASVCM 170
....
195 GQMEPDQVYEGITFEDFLKIWQGIDIETKMHVRFLNMETMALCH 238
||||||||||||||||||||||||||||||||||||||
171 GQMEPDQVYEGITFEDFLKIWQGIDIETKMHVRFLNMETMALCH 214

クラスターW60282の説明
クラスターW60282は、目的の1つの転写物および6個のセグメントを特徴とし、その名称を、それぞれ表328および329に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表330に示す。
Description of cluster W60282 Cluster W60282 is characterized by one transcript and 6 segments of interest, the names of which are shown in Tables 328 and 329, respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 330.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるカリクレイン11前駆体(SwissProtアクセッション識別子KLKB_HUMAN、同義語EC3.4.21.−、ヒッポスタシン(Hippostasin)、チロシン様プロテアーゼとしても公知である)(配列番号1428)の変異型である。   These sequences are known proteins kallikrein 11 precursor (SwissProt accession identifier KLKB_HUMAN, synonym EC3.4.21.-, Hippostasin, Tyrosine-like, previously known herein as a protein). A variant of (also known as a protease) (SEQ ID NO: 1428).

タンパク質カリクレイン11前駆体は、以下の機能を有することが公知であるか、そのように見なされている:多機能プロテアーゼの可能性がある。Phe−Arg−4−メチルクマリル−7−アミド(カリクレイン基質)を有効に切断し、カリクレインおよび
トリプシンの他の基質を弱く切断する。タンパク質カリクレイン11前駆体の配列を、「カリクレイン11前駆体アミノ酸配列」として出願書類の最後に示す。タンパク質カリクレイン11前駆体の局在化は、分泌と考えられる。
The protein kallikrein 11 precursor is known or considered to have the following functions: There is the possibility of a multifunctional protease. It effectively cleaves Phe-Arg-4-methylcoumaryl-7-amide (kallikrein substrate) and weakly cleaves kallikrein and other substrates of trypsin. The sequence of the protein kallikrein 11 precursor is shown at the end of the application as "kallikrein 11 precursor amino acid sequence". Localization of the protein kallikrein 11 precursor is considered secretion.

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けであるタンパク質分解およびペプチド分解、分子機能に関連する注釈付けであるキモトリプシン、トリプシン、セリン型ペプチダーゼ、ヒドロラーゼ。   The following GO annotation applies to previously known proteins. The following annotations have been found: proteolysis and peptide degradation that are relevant to biological processes, chymotrypsin, trypsin, serine peptidases, hydrolases that are annotations that relate to molecular function.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

上記のように、クラスターW60282は、上の表1に列挙した1つの転写物を特徴とする。これらの転写物は、タンパク質カリクレイン11前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster W60282 features one transcript as listed in Table 1 above. These transcripts encode proteins which are variants of the protein kallikrein 11 precursor. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質W60282_PEA_1_P14は、出願書類の最後に示すアミノ酸配列を有し、転写物W60282_PEA_1_T11によってコードされる。公知のタンパク質(カリクレイン11前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein W60282_PEA_1_P14 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript W60282_PEA_1_T11. An alignment to a known protein (kallikrein 11 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

W60282_PEA_1_P14とQ8IXD7(配列番号1705)との間の比較の報告
1.Q8IXD7のアミノ酸1〜66に対応し、W60282_PEA_1_P14のアミノ酸1〜66にも対応するMRILQLILLALATGLVGGETRIIKGFECKPHSQPWQAALFEKTRLLCGATLIAPRWLLTAAHCLKPと少なくとも90%相同な第1のアミノ酸配列と、W60282_PEA_1_P14のアミノ酸67〜80に対応する配列TPASHLAMRQHHHHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、W60282_PEA_1_P14をコードする単離キメラポリペプチド。
Report of comparison between W60282_PEA_1_P14 and Q8IXD7 (SEQ ID NO: 1705) The first amino acid sequence which is at least 90% homologous to MRILQLILLALATGLVGGETRIIKGECCKPHSQPWQAALFEKTRLLCATLAPHP corresponding to amino acids 1 to 66 of Q8IXD7 and corresponding to amino acids 1 to 66 of W60282_PEA_1_P14. Said first and second amino acids comprising a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous W60282_PEA_1_P14, where the arrangements are adjacent and in sequential order Code isolated chimeric polypeptide.

2.W60282_PEA_1_P14中の配列TPASHLAMRQHHHHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、W60282_PEA_1_P14のテールをコードする単離ポリペプチド。   2. W60282_PEA_1_P14 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence TPASHLMRQHHHH in W60282_PEA_1_P14 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質W60282_PEA_1_P14はまた、表331に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質W60282_PEA_1_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein W60282_PEA_1_P14 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids and listing the other amino acids, as shown in Table 331), and the last column shows the SNPs It is shown whether it is known and the presence of a known SNP in the mutein W60282_PEA_1_P14 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質W60282_PEA_1_P14は、以下の転写物によってコードされる:W60282_PEA_1_T11(配列は出願書類の最後に示す)。転写物W60282_PEA_1_T11のコード部分を太字で示し、このコード部分は705位から開始され、944位で終結する。転写物はまた、表332に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質W60282_PEA_1_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein W60282_PEA_1_P14 is encoded by the following transcript: W60282_PEA_1_T11 (sequences shown at the end of the application). The code portion of transcript W60282_PEA_1_T11 is shown in bold, starting at position 705 and ending at position 944. The transcript also has the following SNPs listed in Table 332 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein W60282_PEA_1_P14 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターW60282は、上の表329に列挙した6個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As noted above, cluster W60282 features the six segments listed in Table 329 above, the sequences of which are shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターW60282_PEA_1_node_10は、45個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:W60282_PEA_1_T11。以下の表333は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster W60282_PEA_1_node_10 of the present invention is supported by 45 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: W60282_PEA_1_T11. Table 333 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターW60282_PEA_1_node_18は、49個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:W60282_PEA_1_T11。以下の表334は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster W60282_PEA_1_node_18 of the present invention is supported by 49 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: W60282_PEA_1_T11. Table 334 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターW60282_PEA_1_node_22は、67個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:W60282_PEA_1_T11。以下の表335は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster W60282_PEA_1_node_22 of the present invention is supported by 67 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: W60282_PEA_1_T11. Table 335 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターW60282_PEA_1_node_5は、20個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:W60282_PEA_1_T11。以下の表336は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster W60282_PEA_1_node_5 of the present invention is supported by 20 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: W60282_PEA_1_T11. Table 336 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターW60282_PEA_1_node_21は、48個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:W60282_PEA_1_T11。以下の表337は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster W60282_PEA_1_node_21 of the present invention is supported by 48 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: W60282_PEA_1_T11. Table 337 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターW60282_PEA_1_node_8は、39個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:W60282_PEA_1_T11。以下の表338は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster W60282_PEA_1_node_8 of the present invention is supported by 39 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: W60282_PEA_1_T11. Table 338 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/rL7Wdc5hYg/eLOAfKIgqD:KLKB_HUMAN

Sequence documentation:

Alignment of: W60282_PEA_1_P14 x KLKB_HUMAN ..

Alignment segment 1/1:

Quality: 645.00 Escore: 0
Matching length: 72 Total length: 72
Matching Percent Similarity: 94.44 Matching Percent Identity: 94.44
Total Percent Similarity: 94.44 Total Percent Identity: 94.44
Gaps: 0

Alignment:
. . . . .
1 MRILQLILLALATGLVGGETRIIKGFECKPHSQPWQAALFEKTRLLCGAT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRILQLILLALATGLVGGETRIIKGFECKPHSQPWQAALFEKTRLLCGAT 50
. .
51 LIAPRWLLTAAHCLKPTPASHL 72
|||||||||||||||| ||
51 LIAPRWLLTAAHCLKPRYIVHL 72






Sequence name: /tmp/rL7Wdc5hYg/eLOAfKIgqD:Q8IXD7

Sequence documentation:

Alignment of: W60282_PEA_1_P14 x Q8IXD7 ..

Alignment segment 1/1:

Quality: 642.00 Escore: 0
Matching length: 66 Total length: 66
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MRILQLILLALATGLVGGETRIIKGFECKPHSQPWQAALFEKTRLLCGAT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRILQLILLALATGLVGGETRIIKGFECKPHSQPWQAALFEKTRLLCGAT 50
.
51 LIAPRWLLTAAHCLKP 66
||||||||||||||||
51 LIAPRWLLTAAHCLKP 66



Mutated protein alignment against previously known proteins:
Sequence name: / tmp / rL7Wdc5hYg / eLOAfKIgqD: KLKB_HUMAN

Sequence documentation:

Alignment of: W60282_PEA_1_P14 x KLKB_HUMAN ..

Alignment segment 1/1:

Quality: 645.00 Escore: 0
Matching length: 72 Total length: 72
Matching Percent Similarity: 94.44 Matching Percent Identity: 94.44
Total Percent Similarity: 94.44 Total Percent Identity: 94.44
Gaps: 0

Alignment:
....
1 MRILQLILLALATGLVGGETRIIKKGECCKPHSQPWQAALFEKTRLLCGAT 50
||||||||||||||||||||||||||||||||||||||||
1 MRILQLILLALATGLVGGETRIIKKGECCKPHSQPWQAALFEKTRLLCGAT 50
.
51 LIAPRWLLTAAHCLKPTPASHL 72
||||||||||||||||
51 LIAPRWLLTAAHCLKPRYIVHL 72






Sequence name: / tmp / rL7Wdc5hYg / eLOAfKIgqD: Q8IXD7

Sequence documentation:

Alignment of: W60282_PEA_1_P14 x Q8IXD7 ..

Alignment segment 1/1:

Quality: 642.00 Escore: 0
Matching length: 66 Total length: 66
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MRILQLILLALATGLVGGETRIIKKGECCKPHSQPWQAALFEKTRLLCGAT 50
||||||||||||||||||||||||||||||||||||||||
1 MRILQLILLALATGLVGGETRIIKKGECCKPHSQPWQAALFEKTRLLCGAT 50
.
51 LIAPRWLLTAAHCLKP 66
||||||||||||||||
51 LIAPRWLLTAAHCLKP 66


クラスターZ41644の説明
クラスターW60282は、目的の1つの転写物および21個のセグメントを特徴とし、その名称を、それぞれ表339および340に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表341に示す。
Description of cluster Z41644 Cluster W60282 features one transcript and 21 segments of interest, the names of which are shown in Tables 339 and 340, respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 341.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質である小誘導性サイトカインB14前駆体(SwissProtアクセッション識別子SZ14_HUMAN、同義語CXCL14、ケモカインBRAKとしても公知である)(配列番号1429)の変異型である。   These sequences are the small inducible cytokine B14 precursor (SwissProt accession identifier SZ14_HUMAN, synonym CXCL14, also known as the chemokine BRAK), a known protein known previously as a protein previously known herein (sequence No. 1429).

タンパク質小誘導性サイトカインB14前駆体の配列を、「小誘導性サイトカインB14前駆体アミノ酸配列」として出願書類の最後に示す。タンパク質小誘導性サイトカインB14前駆体の局在化は、分泌と考えられる。   The sequence of the small protein inducible cytokine B14 precursor is shown at the end of the application as "small inducible cytokine B14 precursor amino acid sequence". Localization of the small protein inducible cytokine B14 precursor is considered to be secreted.

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである走化性、シグナル伝達、細胞−細胞シグナル伝達、分子機能に関連する注釈付けであるケモカイン。   The following GO annotation applies to previously known proteins. The following annotations have been found: Chemotaxis, which is an annotation related to biological processes, signaling, cell-cell signaling, an annex related to molecular function.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

クラスターZ41644を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図27のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   Cluster Z41644 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The terms "numbers" in the right column of the table and the numbers on the y-axis of Fig. 27 refer to the weighted expression of ESTs in each category as "ppm" (for ESTs of a particular cluster in this category by ppm Ratio of expression to expression of all ESTs).

概して、図27および表342中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):肺悪性腫瘍。   In general, as shown for the histograms in FIG. 27 and Table 342, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: lung malignancy.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、クラスターZ41644は、上の表339に列挙した1つの転写物を特徴とする。これらの転写物は、タンパク質小誘導性サイトカインB14前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster Z41644 is characterized by one transcript as listed in Table 339 above. These transcripts encode proteins which are variants of the small protein inducible cytokine B14 precursor. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質Z41644_PEA_1_P10は、出願書類の最後に示すアミノ酸配列を有し、転写物41644_PEA_1_T5によってコードされる。公知のタンパク質(小誘導性サイトカインB14前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein Z41644_PEA_1_P10 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript 41644_PEA_1_T5. An alignment to a known protein (small inducible cytokine B14 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

Z41644_PEA_1_P10とSZ14_HUMANとの間の比較の報告
1.SZ14_HUMANのアミノ酸1〜95に対応し、Z41644_PEA_1_P10のアミノ酸1〜95にも対応するMRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPHCEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRと少なくとも90%相同な第1のアミノ酸配列と、Z41644_PEA_1_P10のアミノ酸96〜123に対応する配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z41644_PEA_1_P10をコードする単離キメラポリペプチド。
Report of comparison between Z41644_PEA_1_P10 and SZ14_HUMAN 1. MRL ILAALL LLLLY LYTARWD GSK CK CSR KEK QUICKLY RYV PK PHY EK PHE EE LYQ EQ LQ EQ LQ HEK QFK LQ KF LYQQ LYQ WKH LYQ WQH LYQH LYQ ST 第 416 LL LL LL LL A second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; The first and second amino acid distribution is contiguous, and in sequential order, the isolated chimeric polypeptide coding Z41644_PEA_1_P10.

2.Z41644_PEA_1_P10中の配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z41644_PEA_1_P10のテールをコードする単離ポリペプチド。   2. Comprising a polypeptide at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 90%, most preferably at least about 95% homologous to the sequence YAPPLLTFLPTRPSCG SQDQKGPPHQVI in Z41644_PEA_1_P10, Z41644_PEA_1_P10 of An isolated polypeptide encoding a tail.

Z41644_PEA_1_P10とQ9NS21(配列番号1706)との間の比較の報告
1.Q9NS21のアミノ酸13〜107に対応し、Z41644_PEA_1_P10のアミノ酸1〜95にも対応するMRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPHCEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRと少なくとも90%相同な第1のアミノ酸配列と、Z41644_PEA_1_P10のアミノ酸96〜123に対応する配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z41644_PEA_1_P10をコードする単離キメラポリペプチド。
Report of the comparison between Z41644_PEA_1_P10 and Q9NS21 (SEQ ID NO: 1706) A pair of Gl7-Gl7-G7-G7: A second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; And a second amino acid distribution is contiguous, and in sequential order, the isolated chimeric polypeptide coding Z41644_PEA_1_P10.

2.Z41644_PEA_1_P10中の配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z41644_PEA_1_P10のテールをコードする単離ポリペプチド   2. Comprising a polypeptide at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 90%, most preferably at least about 95% homologous to the sequence YAPPLLTFLPTRPSCG SQDQKGPPHQVI in Z41644_PEA_1_P10, Z41644_PEA_1_P10 of An isolated polypeptide encoding a tail

Z41644_PEA_1_P10とAAQ89265(配列番号781)との間の比較の報告
1.AAQ89265のアミノ酸13〜107に対応し、Z41644_PEA_1_P10のアミノ酸1〜95にも対応するMRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPHCEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRと少なくとも90%相同な第1のアミノ酸配列と、Z41644_PEA_1_P10のアミノ酸96〜123に対応する配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z41644_PEA_1_P10をコードする単離キメラポリペプチド。
Report of the comparison between Z41644_PEA_1_P10 and AAQ89265 (SEQ ID NO: 781) Corresponding to amino acids 13-107 of AAQ89265, first amino acid sequence at least 90% homologous to the corresponding MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPHCEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR to amino acids 1-95 of Z41644_PEA_1_P10, the polypeptide having a sequence corresponding to YAPPLLTFLPTRPSCGSQDGKGPPHQVI to amino acid 96-123 of Z41644_PEA_1_P10 A second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; The first and second amino acid distribution is contiguous, and in sequential order, the isolated chimeric polypeptide coding Z41644_PEA_1_P10.

2.Z41644_PEA_1_P10中の配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z41644_PEA_1_P10のテールをコードする単離ポリペプチド。   2. Comprising a polypeptide at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 90%, most preferably at least about 95% homologous to the sequence YAPPLLTFLPTRPSCG SQDQKGPPHQVI in Z41644_PEA_1_P10, Z41644_PEA_1_P10 of An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質Z41644_PEA_1_P10はまた、表344に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z41644_PEA_1_P10配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein Z41644_PEA_1_P10 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 344) It is shown whether it is known and the presence of a known SNP in the mutant protein Z41644_PEA_1_P10 sequence supports the deduced sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質Z41644_PEA_1_P10は、以下の転写物によってコードされる:Z41644_PEA_1_T5(配列は出願書類の最後に示す)。転写物Z41644_PEA_1_T5のコード部分を太字で示し、このコード部分は744位から開始され、1112位で終結する。転写物はまた、表345に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z41644_PEA_1_P10配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein Z41644_PEA_1_P10 is encoded by the following transcript: Z41644_PEA_1_T5 (sequences shown at the end of the application). The code portion of transcript Z41644_PEA_1_T5 is shown in bold, starting at position 744 and ending at position 1112. The transcript also has the following SNPs listed in Table 345 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein Z41644_PEA_1_P10 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターZ41644は、上の表340に列挙した21個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As noted above, cluster Z41644 features the 21 segments listed in Table 340 above, the sequences of which are shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターZ41644_PEA_1_node_0は、53個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表346は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z41644_PEA_1_node_0 of the present invention is supported by 53 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 346 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ41644_PEA_1_node_11は、9個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表347は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z41644_PEA_1_node_11 of the present invention is supported by nine libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 347 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ41644_PEA_1_node_12は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表348は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z41644_PEA_1_node_12 of the present invention is supported by six libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 348 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ41644_PEA_1_node_15は、23個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表349は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z41644_PEA_1_node_15 of the present invention is supported by 23 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 349 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ41644_PEA_1_node_20は、260個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表350は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z41644_PEA_1_node_20 of the present invention is supported by 260 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 350 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ41644_PEA_1_node_24は、185個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表351は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z41644_PEA_1_node_24 of the present invention is supported by 185 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 351 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターZ41644_PEA_1_node_1は、53個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表352は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z41644_PEA_1_node_1 of the present invention is supported by 53 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 352 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ41644_PEA_1_node_10は、138個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表353は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z41644_PEA_1_node_10 of the present invention is supported by 138 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 353 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ41644_PEA_1_node_13を、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表354は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z41644_PEA_1_node_13 according to the invention can be found in the following transcript: Z41644_PEA_1_T5. Table 354 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ41644_PEA_1_node_16は、152個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表355は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z41644_PEA_1_node_16 of the present invention is supported by 152 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 355 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ41644_PEA_1_node_17を、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表356は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z41644_PEA_1_node_17 according to the invention can be found in the following transcript: Z41644_PEA_1_T5. Table 356 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ41644_PEA_1_node_19は、112個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表357は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z41644_PEA_1_node_19 of the present invention is supported by 112 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 357 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ41644_PEA_1_node_2は、58個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表358は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z41644_PEA_1_node_2 of the present invention is supported by 58 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 358 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ41644_PEA_1_node_21を、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表359は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z41644_PEA_1_node_21 according to the invention can be found in the following transcript: Z41644_PEA_1_T5. Table 359 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ41644_PEA_1_node_22は、164個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表360は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z41644_PEA_1_node_22 of the present invention is supported by 164 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 360 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ41644_PEA_1_node_23は、169個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表361は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z41644_PEA_1_node_23 of the present invention is supported by 169 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 361 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ41644_PEA_1_node_25は、138個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表362は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z41644_PEA_1_node_25 of the present invention is supported by 138 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 362 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ41644_PEA_1_node_3は、75個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表363は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z41644_PEA_1_node_3 of the present invention is supported by 75 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 363 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ41644_PEA_1_node_4は、61個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表364は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z41644_PEA_1_node_4 of the present invention is supported by 61 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 364 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ41644_PEA_1_node_6は、101個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表365は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z41644_PEA_1_node_6 of the present invention is supported by 101 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 365 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ41644_PEA_1_node_9は、134個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表366は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z41644_PEA_1_node_9 of the present invention is supported by 134 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 366 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/p5SSvhT9Xp/HQeIMsUrfm:SZ14_HUMAN

Sequence documentation:

Alignment of: Z41644_PEA_1_P10 x SZ14_HUMAN ..

Alignment segment 1/1:

Quality: 953.00 Escore: 0
Matching length: 95 Total length: 95
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 50
. . . .
51 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR 95
|||||||||||||||||||||||||||||||||||||||||||||
51 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR 95






Sequence name: /tmp/p5SSvhT9Xp/HQeIMsUrfm:Q9NS21

Sequence documentation:

Alignment of: Z41644_PEA_1_P10 x Q9NS21 ..

Alignment segment 1/1:

Quality: 957.00 Escore: 0
Matching length: 96 Total length: 96
Matching Percent Similarity: 100.00 Matching Percent Identity: 98.96
Total Percent Similarity: 100.00 Total Percent Identity: 98.96
Gaps: 0

Alignment:
. . . . .
1 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 50
||||||||||||||||||||||||||||||||||||||||||||||||||
13 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 62
. . . .
51 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRY 96
|||||||||||||||||||||||||||||||||||||||||||||:
63 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRF 108






Sequence name: /tmp/p5SSvhT9Xp/HQeIMsUrfm:AAQ89265

Sequence documentation:

Alignment of: Z41644_PEA_1_P10 x AAQ89265 ..

Alignment segment 1/1:

Quality: 953.00 Escore: 0
Matching length: 95 Total length: 95
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 50
||||||||||||||||||||||||||||||||||||||||||||||||||
13 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 62
. . . .
51 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR 95
|||||||||||||||||||||||||||||||||||||||||||||
63 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR 107



Mutated protein alignment against previously known proteins:
Sequence name: / tmp / p5SSvhT9Xp / HQeIMsUrfm: SZ14_HUMAN

Sequence documentation:

Alignment of: Z41644_PEA_1_P10 x SZ14_HUMAN ..

Alignment segment 1/1:

Quality: 953.00 Escore: 0
Matching length: 95 Total length: 95
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MRLLAAALLLLLLALYTARWDDSKCKCSKRPKIRYSDVKKLEMKPKYPH 50
||||||||||||||||||||||||||||||||||||||||
1 MRLLAAALLLLLLALYTARWDDSKCKCSKRPKIRYSDVKKLEMKPKYPH 50
....
51 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR 95
|||||||||||||||||||||||||||||||||||||||
51 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR 95






Sequence name: / tmp / p5SSvhT9Xp / HQeIMsUrfm: Q9NS21

Sequence documentation:

Alignment of: Z41644_PEA_1_P10 x Q9NS21 ..

Alignment segment 1/1:

Quality: 957.00 Escore: 0
Matching length: 96 Total length: 96
Matching Percent Similarity: 100.00 Matching Percent Identity: 98.96
Total Percent Similarity: 100.00 Total Percent Identity: 98.96
Gaps: 0

Alignment:
....
1 MRLLAAALLLLLLALYTARWDDSKCKCSKRPKIRYSDVKKLEMKPKYPH 50
||||||||||||||||||||||||||||||||||||||||
13 MRLLAAALLLLLLALYTARWDDSKCKCSKRPKIRYSDVKKLEMKPKYPH 62
....
51 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRY 96
|||||||||||||||||||||||||||||||||||: |
63 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRF 108






Sequence name: / tmp / p5SSvhT9Xp / HQeIMsUrfm: AAQ89265

Sequence documentation:

Alignment of: Z41644_PEA_1_P10 x AAQ89265 ..

Alignment segment 1/1:

Quality: 953.00 Escore: 0
Matching length: 95 Total length: 95
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MRLLAAALLLLLLALYTARWDDSKCKCSKRPKIRYSDVKKLEMKPKYPH 50
||||||||||||||||||||||||||||||||||||||||
13 MRLLAAALLLLLLALYTARWDDSKCKCSKRPKIRYSDVKKLEMKPKYPH 62
....
51 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR 95
|||||||||||||||||||||||||||||||||||||||
63 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR 107


クラスターZ44808の説明
クラスターZ44808は、目的の5つの転写物および21個のセグメントを特徴とし、その名称を、それぞれ表367および368に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表369に示す。
Description of Cluster Z44808 Cluster Z44808 is characterized by 5 transcripts and 21 segments of interest, the names of which are shown in Tables 367 and 368 respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 369.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるSPARC関連モジュラーカルシウム結合タンパク質2前駆体(SwissProtアクセッション識別子SMO2_HUMAN)、同義語分泌性モジュラーカルシウム結合タンパク質2、SMOC−2、平滑筋関連タンパク質2、SMAP−2、MSTP117としても公知である)(配列番号1430)の変異型である。   These sequences are known proteins called SPARC-related modular calcium-binding protein 2 precursor (SwissProt accession identifier SMO2_HUMAN), which is a protein previously known herein, synonym secretory modular calcium-binding protein 2, SMOC -2, a variant of smooth muscle related protein 2, also known as SMAP-2, MSTP117) (SEQ ID NO: 1430).

タンパク質SPARC関連モジュラーカルシウム結合タンパク質2前駆体は、以下の機能を有することが公知であるか、そのように見なされている:カルシウム結合。タンパク質SPARC関連モジュラーカルシウム結合タンパク質2前駆体の配列を、「SPARC関連モジュラーカルシウム結合タンパク質2前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表370に示す。   The protein SPARC related modular calcium binding protein 2 precursor is known or is considered to have the following functions: calcium binding. The sequence of the protein SPARC related modular calcium binding protein 2 precursor is shown at the end of the application as "SPARC related modular calcium binding protein 2 precursor amino acid sequence". Known polymorphisms of this sequence are shown in Table 370.

Figure 2008507261
Figure 2008507261

タンパク質SPARC関連モジュラーカルシウム結合タンパク質2前駆体の局在化は、分泌と考えられる。   The localization of the protein SPARC related modular calcium binding protein 2 precursor is considered to be secreted.

クラスターZ44808を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図28のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   Cluster Z44808 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The terms “number” in the right column of the table and the numbers on the y-axis of FIG. 28 refer to the weighted expression of ESTs in each category as “ppm” (the ppm of ESTs of a particular cluster in this category by ppm Ratio of expression to expression of all ESTs).

概して、図28および表371中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):結腸直腸癌、肺癌、および膵臓癌。   In general, as shown for the histograms in FIG. 28 and Table 371, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: colorectal cancer, lung cancer and pancreatic cancer.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、クラスターZ44808は、上の表367に列挙した5つの転写物を特徴とする。これらの転写物は、タンパク質SPARC関連モジュラーカルシウム結合タンパク質2前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster Z44808 is characterized by the five transcripts listed in Table 367 above. These transcripts encode a protein which is a variant of the protein SPARC related modular calcium binding protein 2 precursor. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質Z44808_PEA_1_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物Z44808_PEA_1_T4によってコードされる。公知のタンパク質(SPARC関連モジュラーカルシウム結合タンパク質2前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein Z44808_PEA_1_P5 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript Z44808_PEA_1_T4. An alignment to a known protein (SPARC related modular calcium binding protein 2 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

Z44808_PEA_1_P5とSMO2_HUMANとの間の比較の報告
1.SMO2_HUMANのアミノ酸1〜441に対応し、Z44808_PEA_1_P5のアミノ酸1〜441にも対応するMLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQKPLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKTPRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQVKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQCHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQLQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEERVVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNNDKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQと少なくとも90%相同な第1のアミノ酸配列と、Z44808_PEA_1_P5のアミノ酸442〜464に対応する配列DAMVVSSRPKATTHRKSRTLSRRを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z44808_PEA_1_P5をコードする単離キメラポリペプチド。
Report of comparison between Z44808_PEA_1_P5 and SMO2_HUMAN 1. Corresponding to amino acids 1 to 441 of SMO2_HUMAN, corresponding to amino acids 1 to 441 of Z44808_PEA_1_P5 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQKPLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKTPRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQVKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQCHPSTGYCWCVLVDTGRPIPGTSTRYE A first amino acid sequence at least 90% homologous to PikeishidienutieiarueieichiPieikeieiarudieruwaikeijiarukyuerukyujishiPijieikeikeieichiiefuerutiesubuierudieieruesutidiemubuieichieieiesudiPiesuesuesuesujiarueruesuiPidiPiesueichitieruiiarubuibuieichidaburyuwaiefukeieruerudikeienuesuesujidiaijikeikeiiaikeiPiefukeiaruefueruarukeikeiesukeiPikeikeishibuikeikeiefubuiiwaishidibuienuenudikeiesuaiesubuikyuieruemujishierujibuieiKEDGKADTKKRHTPRGHAESTSNRQ, polypeptide at least 70% with a sequence corresponding to DAMVVSSRPKATTHRKSRTLSRR to amino acid 442-464 of Z44808_PEA_1_P5, optionally at least 80%, preferably at least 85%, more preferably Is at least 90%, most preferably at least 95% homologous to the second amino acid And a sequence, the first and second amino acid distribution is contiguous, and in sequential order, the isolated chimeric polypeptide coding Z44808_PEA_1_P5.

2.Z44808_PEA_1_P5中の配列DAMVVSSRPKATTHRKSRTLSRRと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z44808_PEA_1_P5のテールをコードする単離ポリペプチド。   2. Z44808_PEA_1_P5 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence DAMVVSSRPKATTHRKSRTLSRR in Z44808_PEA_1_P5 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質Z44808_PEA_1_P5は、以下の転写物によってコードされる:Z44808_PEA_1_T4(配列は出願書類の最後に示す)。転写物Z44808_PEA_1_T4のコード部分を太字で示し、このコード部分は586位から開始され、1977位で終結する。転写物はまた、表373に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z44808_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein Z44808_PEA_1_P5 is encoded by the following transcript: Z44808_PEA_1_T4 (sequences shown at the end of the application). The coding portion of the transcript Z44808_PEA_1_T4 is shown in bold, starting from position 586 and ending at position 1977. The transcript also has the following SNPs listed in Table 373 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein Z44808_PEA_1_P5 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質Z44808_PEA_1_P6は、出願書類の最後に示すアミノ酸配列を有し、転写物Z44808_PEA_1_T5によってコードされる。公知のタンパク質(SPARC関連モジュラーカルシウム結合タンパク質2前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein Z44808_PEA_1_P6 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript Z44808_PEA_1_T5. An alignment to a known protein (SPARC related modular calcium binding protein 2 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

Z44808_PEA_1_P6とSMO2_HUMANとの間の比較の報告
1.SMO2_HUMANのアミノ酸1〜428に対応し、Z44808_PEA_1_P6のアミノ酸1〜428にも対応するMLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQKPLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKTPRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQVKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQCHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQLQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEERVVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNNDKSISVQELMGCLGVAKEDGKADTKKRHと少なくとも90%相同な第1のアミノ酸配列と、Z44808_PEA_1_P6のアミノ酸429〜434に対応する配列RSKRNLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z44808_PEA_1_P6をコードする単離キメラポリペプチド。
Report of comparison between Z44808_PEA_1_P6 and SMO2_HUMAN 1. Corresponding to amino acids 1 to 428 of SMO2_HUMAN, corresponding to amino acids 1 to 428 of Z44808_PEA_1_P6 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQKPLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKTPRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQVKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQCHPSTGYCWCVLVDTGRPIPGTSTRYE PKCDNTARAHPAKARDLYKGRQLQGCPGAKKHEFLTSVLDALSTHDHDHAAASDPSSSSGRLSEPDPSHLEEEVHHWYFKLDKNSNSGIGKKEIKPFKFKKRKKSKPKKCVKKFVEYCDV PHI VIL MGCLA VA DG 、 に に に 44 44 44 44 44 44 Comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first and second amino acid sequences being contiguous and In consecutive order, isolated chimeric polypeptide coding Z44808_PEA_1_P6.

2.Z44808_PEA_1_P6中の配列RSKRNLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z44808_PEA_1_P6のテールをコードする単離ポリペプチド。   2. Z44808_PEA_1_P6 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence RSKRNL in Z44808_PEA_1_P6 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質Z44808_PEA_1_P6はまた、表374に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z44808_PEA_1_P6配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein Z44808_PEA_1_P6 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 374) It indicates whether it is known and the presence of a known SNP in the mutant protein Z44808_PEA_1_P6 sequence supports the deduced sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質Z44808_PEA_1_P6は、以下の転写物によってコードされる:Z44808_PEA_1_T5(配列は出願書類の最後に示す)。転写物Z44808_PEA_1_T5のコード部分を太字で示し、このコード部分は586位から開始され、1887位で終結する。転写物はまた、表375に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z44808_PEA_1_P6配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein Z44808_PEA_1_P6 is encoded by the following transcript: Z44808_PEA_1_T5 (sequences shown at the end of the application). The code portion of the transcript Z44808_PEA_1_T5 is shown in bold, starting at position 586 and ending at position 1887. The transcript also has the following SNPs listed in Table 375 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein Z44808_PEA_1_P6 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質Z44808_PEA_1_P7は、出願書類の最後に示すアミノ酸配列を有し、転写物Z44808_PEA_1_T9によってコードされる。公知のタンパク質(SPARC関連モジュラーカルシウム結合タンパク質2前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein Z44808_PEA_1_P7 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript Z44808_PEA_1_T9. An alignment to a known protein (SPARC related modular calcium binding protein 2 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

Z44808_PEA_1_P7とSMO2_HUMANとの間の比較の報告
1.SMO2_HUMANのアミノ酸1〜441に対応し、Z44808_PEA_1_P7のアミノ酸1〜441にも対応するMLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQKPLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKTPRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQVKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQCHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQLQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEERVVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNNDKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQと少なくとも90%相同な第1のアミノ酸配列と、Z44808_PEA_1_P7のアミノ酸442〜454に対応する配列LLWLRGKVSFYCFを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z44808_PEA_1_P7をコードする単離キメラポリペプチド。
Report of comparison between Z44808_PEA_1_P7 and SMO2_HUMAN 1. Corresponding to amino acids 1 to 441 of SMO2_HUMAN, corresponding to amino acids 1 to 441 of Z44808_PEA_1_P7 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQKPLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKTPRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQVKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQCHPSTGYCWCVLVDTGRPIPGTSTRYE A part of the UT is not only required to be a part of one or more of the following ssssasse ssss elements such as the following elements of the sss during the sss during the sss during the sss during the event of the sss. Comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, 1 and a second amino acid distribution is contiguous, and in sequential order, the isolated chimeric polypeptide coding Z44808_PEA_1_P7.

2.Z44808_PEA_1_P7中の配列LLWLRGKVSFYCFと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z44808_PEA_1_P7のテールをコードする単離ポリペプチド。   2. Z44808_PEA_1_P7 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence LLWLRGKVSFYCF in Z44808_PEA_1_P7 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質Z44808_PEA_1_P7はまた、表376に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z44808_PEA_1_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein Z44808_PEA_1_P7 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing the other amino acids, and listing the other amino acids, as shown in Table 376), and the last column is the SNP It is shown whether it is known and the presence of a known SNP in the mutant protein Z44808_PEA_1_P7 sequence supports the predicted sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質Z44808_PEA_1_P7は、以下の転写物によってコードされる:Z44808_PEA_1_T9(配列は出願書類の最後に示す)。転写物Z44808_PEA_1_T9のコード部分を太字で示し、このコード部分は586位から開始され、1947位で終結する。転写物はまた、表377に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z44808_PEA_1_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein Z44808_PEA_1_P7 is encoded by the following transcript: Z44808_PEA_1_T9 (sequences shown at the end of the application). The code portion of the transcript Z44808_PEA_1_T9 is shown in bold, starting at position 586 and ending at position 1947. The transcript also has the following SNPs listed in Table 377 (showing its position on the nucleotide sequence and listing another nucleic acid, the last column shows whether the SNP is known, mutein Z44808_PEA_1_P7 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質Z44808_PEA_1_P11は、出願書類の最後に示すアミノ酸配列を有し、転写物Z44808_PEA_1_T11によってコードされる。この転写物の同定を、以下の引用文献に記載の非ESTベースの選択的スプライシングの同定方法を使用して行った:Sorek R et al.,Genome Res.(2004)14:1617−23。公知のタンパク質(SPARC関連モジュラーカルシウム結合タンパク質2前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein Z44808_PEA_1_P11 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript Z44808_PEA_1_T11. Identification of this transcript was performed using the non-EST based alternative splicing identification method described in the following cited reference: Sorek R et al. , Genome Res. (2004) 14: 1617-23. An alignment to a known protein (SPARC related modular calcium binding protein 2 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

Z44808_PEA_1_P11とSMO2_HUMANとの間の比較の報告
1.SMO2_HUMANのアミノ酸1〜170に対応し、Z44808_PEA_1_P11のアミノ酸1〜170にも対応するMLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQKPLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKTPRCPGSVNEKLPQREGTGKTと少なくとも90%相同な第1のアミノ酸配列と、SMO2_HUMANのアミノ酸188〜446に対応し、Z44808_PEA_1_P11のアミノ酸171〜429にも対応するDIASRYPTLWTEQVKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQCHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQLQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEERVVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNNDKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQPRKQGと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z44808_PEA_1_P11をコードする単離キメラポリペプチド。
Report of comparison between Z44808_PEA_1_P11 and SMO2_HUMAN 1. Corresponding to amino acids 1 - 170 of SMO2_HUMAN, first amino acid sequence at least 90% homologous to the corresponding MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQKPLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKTPRCPGSVNEKLPQREGTGKT to amino acids 1 - 170 of Z44808_PEA_1_P11, corresponding to amino acids 188-446 of SMO2_HUMAN, the Z44808_PEA_1_P11 amino 171-429 Also corresponding DIASRYPTLWTEQVKSRQNKTN NSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQCHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQLQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEERVVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNNDKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQPRKQG and and at least 90% homologous to a second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, the isolated chimeric polypeptide coding Z44808_PEA_1_P11.

2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がTDを含み、以下の構造:アミノ酸番号170−x〜170のいずれかから始まり、アミノ酸番号171+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、Z44808_PEA_1_P11の縁部分をコードする単離キメラポリペプチド。   2. Length “n” (wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long, most preferably at least about 50 amino acids long, at least two amino acids comprising TD, starting from any of the following structures: amino acids 170-x to 170, amino acids 171 + ((n-2)-x) (formula An isolated chimeric polypeptide encoding an edge portion of Z44808_PEA_1_P11, which comprises a polypeptide, wherein the sequence has a sequence terminating at 0) to n-2).

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質Z44808_PEA_1_P11はまた、表378に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z44808_PEA_1_P11配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein Z44808_PEA_1_P11 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing the other amino acids, and listing the other amino acids, as shown in Table 378), and the last column contains SNPs It indicates whether it is known and the presence of a known SNP in the mutant protein Z44808_PEA_1_P11 sequence supports the predicted sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質Z44808_PEA_1_P11は、以下の転写物によってコードされる:Z44808_PEA_1_T11(配列は出願書類の最後に示す)。転写物Z44808_PEA_1_T11のコード部分を太字で示し、このコード部分は586位から開始され、1872位で終結する。転写物はまた、表379に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z44808_PEA_1_P11配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein Z44808_PEA_1_P11 is encoded by the following transcript: Z44808_PEA_1_T11 (sequences shown at the end of the application). The code portion of transcript Z44808_PEA_1_T11 is shown in bold and this code portion starts at position 586 and ends at position 1872. The transcript also has the following SNPs listed in Table 379 (showing its position on the nucleotide sequence and listing another nucleic acid, the last column indicating whether the SNP is known, mutein Z44808_PEA_1_P11 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターZ44808は、上の表368に列挙した21個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster Z44808 is characterized by the 21 segments listed in Table 368 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターZ44808_PEA_1_node_0は、29個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、Z44808_PEA_1_T5、Z44808_PEA_1_T8、およびZ44808_PEA_1_T9。以下の表380は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z44808_PEA_1_node_0 of the present invention is supported by 29 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z44808_PEA_1_T11, Z44808_PEA_1_T4, Z44808_PEA_1_T5, Z44808_PEA_1_T8, and Z44808_PEA_1_T9. Table 380 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ44808_PEA_1_node_16は、39個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、Z44808_PEA_1_T5、Z44808_PEA_1_T8、およびZ44808_PEA_1_T9。以下の表381は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z44808_PEA_1_node_16 of the present invention is supported by 39 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z44808_PEA_1_T11, Z44808_PEA_1_T4, Z44808_PEA_1_T5, Z44808_PEA_1_T8, and Z44808_PEA_1_T9. Table 381 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ44808_PEA_1_node_2は、34個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、Z44808_PEA_1_T5、Z44808_PEA_1_T8、およびZ44808_PEA_1_T9。以下の表382は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z44808_PEA_1_node_2 of the present invention is supported by 34 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z44808_PEA_1_T11, Z44808_PEA_1_T4, Z44808_PEA_1_T5, Z44808_PEA_1_T8, and Z44808_PEA_1_T9. Table 382 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ44808_PEA_1_node_24は、52個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、Z44808_PEA_1_T5、Z44808_PEA_1_T8、およびZ44808_PEA_1_T9。以下の表383は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z44808_PEA_1_node_24 of the present invention is supported by 52 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z44808_PEA_1_T11, Z44808_PEA_1_T4, Z44808_PEA_1_T5, Z44808_PEA_1_T8, and Z44808_PEA_1_T9. Table 383 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ44808_PEA_1_node_32は、17個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T4およびZ44808_PEA_1_T8。以下の表384は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z44808_PEA_1_node_32 of the present invention is supported by 17 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z44808_PEA_1_T4 and Z44808_PEA_1_T8. Table 384 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ44808_PEA_1_node_33は、133個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、およびZ44808_PEA_1_T5。以下の表385は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z44808_PEA_1_node_33 of the present invention is supported by 133 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z44808_PEA_1_T11, Z44808_PEA_1_T4, and Z44808_PEA_1_T5. Table 385 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ44808_PEA_1_node_36は、117個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、およびZ44808_PEA_1_T5。以下の表386は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z44808_PEA_1_node_36 of the present invention is supported by 117 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z44808_PEA_1_T11, Z44808_PEA_1_T4, and Z44808_PEA_1_T5. Table 386 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ44808_PEA_1_node_37は、120個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、およびZ44808_PEA_1_T5。以下の表387は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z44808_PEA_1_node_37 of the present invention is supported by 120 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z44808_PEA_1_T11, Z44808_PEA_1_T4, and Z44808_PEA_1_T5. Table 387 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ44808_PEA_1_node_41は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T9。以下の表388は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z44808_PEA_1_node_41 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z44808_PEA_1_T9. Table 388 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターZ44808_PEA_1_node_11は、25個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T4、Z44808_PEA_1_T5、Z44808_PEA_1_T8、およびZ44808_PEA_1_T9。以下の表389は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z44808_PEA_1_node_11 of the present invention is supported by 25 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z44808_PEA_1_T4, Z44808_PEA_1_T5, Z44808_PEA_1_T8, and Z44808_PEA_1_T9. Table 389 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ44808_PEA_1_node_13は、28個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、Z44808_PEA_1_T5、Z44808_PEA_1_T8、およびZ44808_PEA_1_T9。以下の表390は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z44808_PEA_1_node_13 of the present invention is supported by 28 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z44808_PEA_1_T11, Z44808_PEA_1_T4, Z44808_PEA_1_T5, Z44808_PEA_1_T8, and Z44808_PEA_1_T9. Table 390 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ44808_PEA_1_node_18は、27個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、Z44808_PEA_1_T5、Z44808_PEA_1_T8、およびZ44808_PEA_1_T9。以下の表391は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z44808_PEA_1_node_18 of the present invention is supported by 27 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z44808_PEA_1_T11, Z44808_PEA_1_T4, Z44808_PEA_1_T5, Z44808_PEA_1_T8, and Z44808_PEA_1_T9. Table 391 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ44808_PEA_1_node_22は、33個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、Z44808_PEA_1_T5、Z44808_PEA_1_T8、およびZ44808_PEA_1_T9。以下の表392は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z44808_PEA_1_node_22 of the present invention is supported by 33 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z44808_PEA_1_T11, Z44808_PEA_1_T4, Z44808_PEA_1_T5, Z44808_PEA_1_T8, and Z44808_PEA_1_T9. Table 392 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表393に示す)。   Microarray (chip) data for this segment is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (for lung cancer) (shown in Table 393).

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ44808_PEA_1_node_26は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T5。以下の表394は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z44808_PEA_1_node_26 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z44808_PEA_1_T5. Table 394 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表395に示す)。   Microarray (chip) data for this segment is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (for lung cancer) (shown in Table 395).

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ44808_PEA_1_node_30は、44個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、Z44808_PEA_1_T5、Z44808_PEA_1_T8、およびZ44808_PEA_1_T9。以下の表396は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z44808_PEA_1_node_30 of the present invention is supported by 44 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z44808_PEA_1_T11, Z44808_PEA_1_T4, Z44808_PEA_1_T5, Z44808_PEA_1_T8, and Z44808_PEA_1_T9. Table 396 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ44808_PEA_1_node_34は、70個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、およびZ44808_PEA_1_T5。以下の表397は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z44808_PEA_1_node_34 of the present invention is supported by 70 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z44808_PEA_1_T11, Z44808_PEA_1_T4, and Z44808_PEA_1_T5. Table 397 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ44808_PEA_1_node_35を、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、およびZ44808_PEA_1_T5。以下の表398は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z44808_PEA_1_node_35 according to the invention can be found in the following transcripts: Z44808_PEA_1_T11, Z44808_PEA_1_T4, and Z44808_PEA_1_T5. Table 398 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ44808_PEA_1_node_39は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T9。以下の表399は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z44808_PEA_1_node_39 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: Z44808_PEA_1_T9. Table 399 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ44808_PEA_1_node_4は、33個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、Z44808_PEA_1_T5、Z44808_PEA_1_T8、およびZ44808_PEA_1_T9。以下の表400は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z44808_PEA_1_node_4 of the present invention is supported by 33 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z44808_PEA_1_T11, Z44808_PEA_1_T4, Z44808_PEA_1_T5, Z44808_PEA_1_T8, and Z44808_PEA_1_T9. Table 400 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ44808_PEA_1_node_6は、30個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、Z44808_PEA_1_T5、Z44808_PEA_1_T8、およびZ44808_PEA_1_T9。以下の表401は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z44808_PEA_1_node_6 of the present invention is supported by 30 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z44808_PEA_1_T11, Z44808_PEA_1_T4, Z44808_PEA_1_T5, Z44808_PEA_1_T8, and Z44808_PEA_1_T9. Table 401 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ44808_PEA_1_node_8は、25個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、Z44808_PEA_1_T5、Z44808_PEA_1_T8、およびZ44808_PEA_1_T9。以下の表402は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z44808_PEA_1_node_8 of the present invention is supported by 25 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z44808_PEA_1_T11, Z44808_PEA_1_T4, Z44808_PEA_1_T5, Z44808_PEA_1_T8, and Z44808_PEA_1_T9. Table 402 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/vUqLu6eAVZ/K3JDuPvaLo:SMO2_HUMAN

Sequence documentation:

Alignment of: Z44808_PEA_1_P5 x SMO2_HUMAN ..

Alignment segment 1/1:

Quality: 4440.00 Escore: 0
Matching length: 441 Total length: 441
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
. . . . .
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
. . . . .
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
. . . . .
151 PRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 PRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
. . . . .
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQ 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQ 250
. . . . .
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
. . . . .
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
. . . . .
351 VVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 VVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
. . . .
401 DKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQ 441
|||||||||||||||||||||||||||||||||||||||||
401 DKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQ 441






Sequence name: /tmp/QSUNfTsJ5y/kLOw5Vb6SD:SMO2_HUMAN

Sequence documentation:

Alignment of: Z44808_PEA_1_P6 x SMO2_HUMAN ..

Alignment segment 1/1:

Quality: 4310.00 Escore: 0
Matching length: 428 Total length: 428
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
. . . . .
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
. . . . .
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
. . . . .
151 PRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 PRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
. . . . .
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQ 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQ 250
. . . . .
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
. . . . .
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
. . . . .
351 VVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 VVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
. .
401 DKSISVQELMGCLGVAKEDGKADTKKRH 428
||||||||||||||||||||||||||||
401 DKSISVQELMGCLGVAKEDGKADTKKRH 428






Sequence name: /tmp/MZVdR4PVdM/5uN8RwViJ1:SMO2_HUMAN

Sequence documentation:

Alignment of: Z44808_PEA_1_P7 x SMO2_HUMAN ..

Alignment segment 1/1:

Quality: 4440.00 Escore: 0
Matching length: 441 Total length: 441
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
. . . . .
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
. . . . .
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
. . . . .
151 PRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 PRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
. . . . .
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQ 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQ 250
. . . . .
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
. . . . .
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
. . . . .
351 VVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 VVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
. . . .
401 DKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQ 441
|||||||||||||||||||||||||||||||||||||||||
401 DKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQ 441






Sequence name: /tmp/3fGVxqLloe/J5mQduAd0F:SMO2_HUMAN

Sequence documentation:

Alignment of: Z44808_PEA_1_P11 x SMO2_HUMAN ..

Alignment segment 1/1:

Quality: 4228.00 Escore: 0
Matching length: 429 Total length: 446
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 96.19 Total Percent Identity: 96.19
Gaps: 1

Alignment:
. . . . .
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
. . . . .
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
. . . . .
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
. . . . .
151 PRCPGSVNEKLPQREGTGKT.................DIASRYPTLWTEQ 183
|||||||||||||||||||| |||||||||||||
151 PRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
. . . . .
184 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQ 233
||||||||||||||||||||||||||||||||||||||||||||||||||
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQ 250
. . . . .
234 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 283
||||||||||||||||||||||||||||||||||||||||||||||||||
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
. . . . .
284 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 333
||||||||||||||||||||||||||||||||||||||||||||||||||
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
. . . . .
334 VVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 383
||||||||||||||||||||||||||||||||||||||||||||||||||
351 VVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
. . . .
384 DKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQPRKQG 429
||||||||||||||||||||||||||||||||||||||||||||||
401 DKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQPRKQG 446



Mutated protein alignment against previously known proteins:
Sequence name: / tmp / vUqLu6eAVZ / K3JDuPvaLo: SMO2_HUMAN

Sequence documentation:

Alignment of: Z44808_PEA_1_P5 x SMO2_HUMAN ..

Alignment segment 1/1:

Quality: 4440.00 Escore: 0
Matching length: 441 Total length: 441
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
||||||||||||||||||||||||||||||||||||||||
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
....
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
||||||||||||||||||||||||||||||||||||||||
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
....
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
||||||||||||||||||||||||||||||||||||||||
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
....
151 PRCPGSVNEKLPQREGTGKTDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
||||||||||||||||||||||||||||||||||||||||
151 PRCPGSVNEKLPQREGTGKTDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
....
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNV VIPECAHGGLYKPVQ 250
||||||||||||||||||||||||||||||||||||||||
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNV VIPECAHGGLYKPVQ 250
....
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
||||||||||||||||||||||||||||||||||||||||
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
....
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
||||||||||||||||||||||||||||||||||||||||
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
....
351 VVHWYFKLLDKNSSGDGIKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
||||||||||||||||||||||||||||||||||||||||
351 VVHWYFKLLDKNSSGDGIKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
....
401 DKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQ 441
||||||||||||||||||||||||||||||||||||
401 DKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQ 441






Sequence name: / tmp / QSUNfTsJ5y / kLOw5Vb6SD: SMO2_HUMAN

Sequence documentation:

Alignment of: Z44808_PEA_1_P6 x SMO2_HUMAN ..

Alignment segment 1/1:

Quality: 4310.00 Escore: 0
Matching length: 428 Total length: 428
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
||||||||||||||||||||||||||||||||||||||||
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
....
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
||||||||||||||||||||||||||||||||||||||||
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
....
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
||||||||||||||||||||||||||||||||||||||||
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
....
151 PRCPGSVNEKLPQREGTGKTDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
||||||||||||||||||||||||||||||||||||||||
151 PRCPGSVNEKLPQREGTGKTDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
....
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNV VIPECAHGGLYKPVQ 250
||||||||||||||||||||||||||||||||||||||||
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNV VIPECAHGGLYKPVQ 250
....
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
||||||||||||||||||||||||||||||||||||||||
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
....
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
||||||||||||||||||||||||||||||||||||||||
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
....
351 VVHWYFKLLDKNSSGDGIKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
||||||||||||||||||||||||||||||||||||||||
351 VVHWYFKLLDKNSSGDGIKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
.
401 DKSIS VQELMGCLGVAKEDGKADTKKRH 428
||||||||||||||||||||||||||
401 DKSIS VQELMGCLGVAKEDGKADTKKRH 428






Sequence name: / tmp / MZVdR4PVdM / 5uN8RwViJ1: SMO2_HUMAN

Sequence documentation:

Alignment of: Z44808_PEA_1_P7 x SMO2_HUMAN ..

Alignment segment 1/1:

Quality: 4440.00 Escore: 0
Matching length: 441 Total length: 441
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
||||||||||||||||||||||||||||||||||||||||
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
....
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
||||||||||||||||||||||||||||||||||||||||
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
....
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
||||||||||||||||||||||||||||||||||||||||
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
....
151 PRCPGSVNEKLPQREGTGKTDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
||||||||||||||||||||||||||||||||||||||||
151 PRCPGSVNEKLPQREGTGKTDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
....
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNV VIPECAHGGLYKPVQ 250
||||||||||||||||||||||||||||||||||||||||
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNV VIPECAHGGLYKPVQ 250
....
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
||||||||||||||||||||||||||||||||||||||||
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
....
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
||||||||||||||||||||||||||||||||||||||||
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
....
351 VVHWYFKLLDKNSSGDGIKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
||||||||||||||||||||||||||||||||||||||||
351 VVHWYFKLLDKNSSGDGIKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
....
401 DKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQ 441
||||||||||||||||||||||||||||||||||||
401 DKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQ 441






Sequence name: / tmp / 3fGVxqLloe / J5mQduAd0F: SMO2_HUMAN

Sequence documentation:

Alignment of: Z44808_PEA_1_P11 x SMO2_HUMAN ..

Alignment segment 1/1:

Quality: 4228.00 Escore: 0
Matching length: 429 Total length: 446
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 96.19 Total Percent Identity: 96.19
Gaps: 1

Alignment:
....
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
||||||||||||||||||||||||||||||||||||||||
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
....
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
||||||||||||||||||||||||||||||||||||||||
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
....
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
||||||||||||||||||||||||||||||||||||||||
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
....
151 PRCPGSGNEKLPQREGTGKT .............. DIASRYPTLWTEQ 183
|||||||||||||||||||||||||||||
151 PRCPGSVNEKLPQREGTGKTDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
....
184 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNV VIPECAHGGLYKPVQ 233
||||||||||||||||||||||||||||||||||||||||
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNV VIPECAHGGLYKPVQ 250
....
234 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 283
||||||||||||||||||||||||||||||||||||||||
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
....
284 LQGCPGAKKHEFLTSV LDALSDLM VHAASDPSSSSGRLSEPDPSHTLEER 333
||||||||||||||||||||||||||||||||||||||||
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
....
334 VVHWYFKLLDKNSSGDGIKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 383
||||||||||||||||||||||||||||||||||||||||
351 VVHWYFKLLDKNSSGDGIKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
....
384 DKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQPQG 429
|||||||||||||||||||||||||||||||||||||||
401 DKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQPQG 446


正常および癌性肺組織における配列名Z44808junc8−11中に示すアンプリコンによって検出可能なSMO2_HUMAN SPARC関連モジュラーカルシウム結合タンパク質2前駆体Z44808転写物の発現
junc8−11、Z44808junc8−11アンプリコン(配列番号1651)、ならびにZ44808junc8−11F(配列番号1649)およびZ44808junc8−11R(配列番号1650)プライマーによって検出可能なSMO2_HUMAN SPARC関連モジュラーカルシウム結合タンパク質2前駆体(分泌性モジュラーカルシウム結合タンパク質2)(SMOC−2)(平滑筋関連タンパク質2)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
Expression of SMO2_HUMAN SPARC related modular calcium binding protein 2 precursor Z44808 transcript detectable by an amplicon as shown in SEQ ID NO: Z44808junc8-11 in normal and cancerous lung tissues junc8-11, Z44808junc8-11 amplicon (SEQ ID NO: 1651) SMO2_HUMAN SPARC related modular calcium binding protein 2 precursor (secretory modular calcium binding protein 2) (SMOC-2) (SMOC-2) detectable by Z44808 junc 8-11F (SEQ ID NO: 1649) and Z44808 junc 8-11 R (SEQ ID NO: 1650) primers Muscle related protein 2) Transcript expression was measured by real time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – PBGD-Amplicon, SEQ ID No. 334), HPRT1 (GenBank Accession No. NM_000194, Amplicon – HPRT1- Amplicons, SEQ ID NO: 1297), Ubiquitin (GenBank Accession No. BC000449, Amplicon – Ubiquitin-Amplicon SEQ ID NO: 328), and SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA-Amplicon SEQ ID NO: 331) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. The normalized amount of each RT sample is the center of the amount of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99 above, Table 2, "tissue samples in the test panel") Divide by the value to obtain the magnification of the upregulation of each sample relative to the median of normal PM samples.

図29は、正常サンプルと比較したいくつかの癌性肺サンプルにおける上記SMO2_HUMAN SPARC関連モジュラーカルシウム結合タンパク質2前駆体転写物の過剰発現を示すヒストグラムである。   FIG. 29 is a histogram showing over expression of the SMO2_HUMAN SPARC related modular calcium binding protein 2 precursor transcript in several cancerous lung samples compared to normal samples.

図29から明らかなように、いくつかの癌サンプル中の上記アンプリコンによって検出可能なSMO2_HUMAN SPARC関連モジュラーカルシウム結合タンパク質2前駆体転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、15個の腺癌サンプルのうち2個および8個の小細胞癌サンプルのうち3個で少なくとも5倍の過剰発現が見出された。   As evident from FIG. 29, the expression of SMO2_HUMAN SPARC related modular calcium binding protein 2 precursor transcripts detectable by the above amplicon in several cancer samples is a non-cancerous sample (sample nos. 47-50, 90) ~ 93, 96-99, Table 2, "Tissue samples in test panel" was significantly higher. Apparently, at least 5-fold overexpression was found in 2 out of 15 adenocarcinoma samples and 3 out of 8 small cell carcinoma samples.

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:Z44808junc8−11F順方向プライマーおよびZ44808junc8−11 R逆方向プライマー。   Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used only as non-limiting examples of suitable primer pairs: Z44808junc8-11F forward primer and Z44808 junc 8-11 R reverse primer.

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:Z44808junc8−11。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : Z44808 junc 8-11.


順方向プライマー(配列番号1649):GAAGGCACAGGAAAAACAGATATTG
逆方向プライマー(配列番号1650):TGGTGCTCTTGGTCACAGGAT
アンプリコン(配列番号1651):GAAGGCACAGGAAAAACAGATATTGCATCACGTTACCCTACCCTTTGGACTGAACAGGTTAAAAGTCGGCAGAACAAAACCAATAAGAATTCAGTGTCATCCTGTGACCAAGAGCACCA

Forward primer (SEQ ID NO: 1649): GAAGGCACAGGAAAAACAGATATTG
Reverse primer (SEQ ID NO: 1650): TGGTGCTCTTGGTCACAGAGAT
Amplicon (SEQ ID NO: 1651): GAAGGCACAGGAAAAACGATATTGCATCACGTTACCCTACCCTTTGGACTGAACAGGTTAAAAGTCGGCAGAACAAAACCAATAAGAATTCAGTGTGATCCTGTGACCAAGAGCACCA

異なる正常組織に配列名Z44808junc8−11中に示すアンプリコンによって検出可能なSMO2_HUMAN SPARC関連モジュラーカルシウム結合タンパク質2前駆体(分泌性モジュラーカルシウム結合タンパク質2)(SMOC−2)(平滑筋関連タンパク質2)Z44808転写物の発現
Z44808junc8−11アンプリコン(配列番号1651)ならびにプライマーZ44808junc8−11F(配列番号1649)およびZ44808junc8−11R (配列番号1650)によって検出可能なSMO2_HUMAN SPARC関連モジュラーカルシウム結合タンパク質2前駆体(分泌性モジュラーカルシウム結合タンパク質2)(SMOC−2)(平滑筋関連タンパク質2)Z44808転写物の発現を、実時間PCRによって測定した。並行して4つのハウスキーピング遺伝子−RPL19(GenBankアクセッション番号NM_000981、RPL19アンプリコン、配列番号1630)、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン,配列番号1633)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン、配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン、配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、卵巣サンプル(サンプル番号18〜20、表3)の量の中央値で割って、卵巣サンプルの中央値に対する各サンプルの相対発現値を得た。
SMO2_HUMAN SPARC related modular calcium binding protein 2 precursor (secretory modular calcium binding protein 2) (SMOC-2) (smooth muscle related protein 2) Z44808 detectable by the amplicon shown in the sequence name Z44808 junc 8-11 in different normal tissues Transcript expression Z44808junc8-11 amplicon (SEQ ID NO: 1651) and SMO2_HUMAN SPARC related modular calcium binding protein 2 precursor detectable by the primers Z44808junc 8-11F (SEQ ID NO: 1649) and Z44808 junc 8-11R (SEQ ID NO: 1650) (secretory property Generation of modular calcium binding protein 2) (SMOC-2) (smooth muscle associated protein 2) Z44808 transcript The expression was measured by real time PCR. In parallel, four housekeeping genes-RPL19 (GenBank Accession No. NM_000981, RPL19 amplicon, SEQ ID No. 1630), TATA box (GenBank Accession No. NM_003194, TATA amplicon, SEQ ID No. 1633), ubiquitin (GenBank Accession No. BC000449, amplicon – ubiquitin-amplicon, SEQ ID NO: 328), and SDHA (GenBank accession number NM_004168, amplicon – SDHA-amplicon, SEQ ID NO: 331) were similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. The normalized amount of each RT sample was divided by the median of the amounts of ovary samples (Sample Nos. 18-20, Table 3) to obtain the relative expression value of each sample relative to the median of the ovary samples.


プライマー:
順方向プライマー(配列番号1649):GAAGGCACAGGAAAAACAGATATTG
逆方向プライマー(配列番号1650):TGGTGCTCTTGGTCACAGGAT
アンプリコン(配列番号1651):GAAGGCACAGGAAAAACAGATATTGCATCACGTTACCCTACCCTTTGGACTGAACAGGTTAAAAGTCGGCAGAACAAAACCAATAAGAATTCAGTGTCATCCTGTGACCAAGAGCACCA

Primer:
Forward primer (SEQ ID NO: 1649): GAAGGCACAGGAAAAACAGATATTG
Reverse primer (SEQ ID NO: 1650): TGGTGCTCTTGGTCACAGAGAT
Amplicon (SEQ ID NO: 1651): GAAGGCACAGGAAAAACGATATTGCATCACGTTACCCTACCCTTTGGACTGAACAGGTTAAAAGTCGGCAGAACAAAACCAATAAGAATTCAGTGTGATCCTGTGACCAAGAGCACCA

結果を図18に示し、これは、異なる正常組織に配列名Z44808junc8−11中に示すアンプリコンによって検出可能なSMO2_HUMAN SPARC関連モジュラーカルシウム結合タンパク質2前駆体(分泌性モジュラーカルシウム結合タンパク質2)(SMOC−2)(平滑筋関連タンパク質2)Z44808の発現を示す。   The results are shown in FIG. 18, which shows that SMO2_HUMAN SPARC related modular calcium binding protein 2 precursor (secretory modular calcium binding protein 2) detectable by an amplicon shown in the sequence name Z44808 junc 8-11 in different normal tissues (SMOC- 2) (Smooth muscle related protein 2) The expression of Z44808 is shown.

クラスターAA161187の説明
クラスターAA161187は、目的の7つの転写物および20個のセグメントを特徴とし、その名称を、それぞれ表403および404に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表405に示す。
Description of cluster AA161187 Cluster AA161187 is characterized by 7 transcripts and 20 segments of interest, the names of which are shown in Tables 403 and 404, respectively, and the sequences themselves are shown at the end of the application. Selected protein variants are shown in Table 405.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるテスチシン(Testisin)前駆体(SwissProtアクセッション識別子TEST_HUMAN)、同義語EC3.4.21.−、好酸球セリンプロテアーゼ1、ESP−1、UNQ266/PRO303としても公知である)(配列番号1431)の変異型である。   These sequences are known proteins Testisin precursor (SwissProt accession identifier TEST_HUMAN), which is a known protein, previously known herein as protein, with the synonym EC 3.4.21. Eosinophil serine protease 1, also known as ESP-1, UNQ266 / PRO303 (SEQ ID NO 1431).

タンパク質テスチシン前駆体は、以下の機能を有することが公知であるか、そのように見なされている:精巣生殖細胞成熟に関連するタンパク質分解事象を調節することができる。タンパク質テスチシン前駆体の配列を、「テスチシン前駆体アミノ酸配列」として出願書類の最後に示す。タンパク質テスチシン前駆体の局在化は、GPI−アンカーによって膜に結合していると考えられる。   The protein testerin precursor is known or considered to have the following functions: It can modulate the proteolytic events associated with testicular germ cell maturation. The sequence of the proteinessicin precursor is shown at the end of the application as "testicin precursor amino acid sequence". The localization of the protein testerin precursor is thought to be membrane bound by the GPI-anchor.

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:分子機能に関連する注釈付けであるセリン型ペプチダーゼおよび細胞成分に関連する注釈付けである膜画分、細胞質、原形質膜。   The following GO annotation applies to previously known proteins. The following annotations were found: serine type peptidases that are related to molecular function, membrane fractions that are annotations related to cellular components, cytoplasm, plasma membrane.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

クラスターAA161187を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の左側のカラム中の用語「数」および図30のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   Cluster AA161187 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The terms “number” in the left column of the table and the number on the y-axis of FIG. 30 refer to the weighted expression of ESTs in each category as “ppm” (the ppm of ESTs of a particular cluster in this category by ppm Ratio of expression to expression of all ESTs).

概して、図30および表406中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):悪性脳腫瘍、上皮悪性腫瘍、および異なる組織由来の悪性腫瘍の混合物。   In general, as shown for the histograms in FIG. 30 and Table 406, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: malignant brain tumors, epithelial malignancies, and a mixture of malignancies from different tissues.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、クラスターAA161187は、上の表403に列挙した7つの転写物を特徴とする。これらの転写物は、タンパク質テスチシン前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster AA161187 is characterized by the seven transcripts listed in Table 403 above. These transcripts encode a protein that is a mutated form of the protein testerin precursor. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質AA161187_P1は、出願書類の最後に示すアミノ酸配列を有し、転写物AA161187_T0によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定されるので、分泌されると考えられる。   The mutein AA161187_P1 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript AA161187_T0. The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is considered to be secreted, as both signal peptide estimation programs presume this protein to have a signal peptide.

変異タンパク質AA161187_P1はまた、表408に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AA161187_P1配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein AA161187_P1 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 408) It is indicated whether it is known and the presence of a known SNP in the mutant protein AA161187_P1 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質AA161187_P1は、以下の転写物によってコードされる:AA161187_T0(配列は出願書類の最後に示す)。転写物AA161187_T0のコード部分を太字で示し、このコード部分は107位から開始され、1048位で終結する。転写物はまた、表409に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AA161187_P1配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein AA161187_P1 is encoded by the following transcript: AA161187_T0 (sequences shown at the end of the application). The code portion of transcript AA161187_T0 is shown in bold and this code portion starts at position 107 and ends at position 1048. The transcript also has the following SNPs listed in Table 409 (showing its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein AA161187_P1 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質AA161187_P6は、出願書類の最後に示すアミノ酸配列を有し、転写物AA161187_T7によってコードされる。公知のタンパク質(テスチシン前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein AA161187_P6 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript AA161187_T7. An alignment to a known protein (testicin precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

AA161187_P6とTEST_HUMANとの間の比較の報告
1.AA161187_P6のアミノ酸1〜42に対応するHTREGTLGGQKRAFPDGVEGEKGRGRAWGAASRGSAVPLTIRと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、TEST_HUMANのアミノ酸31〜314に対応し、AA161187_P6のアミノ酸43〜326にも対応するGPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIKEDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIFGDMVCAGNAQGGKDACFGDSGGPLACNKNGLWYQIGVVSWGVGCGRPNRPGVYTNISHHFEWIQKLMAQSGMSQPDPSWPLLFFPLLWALPLLGPVと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、AA161187_P6をコードする単離キメラポリペプチド。
Report of comparison between AA161187_P6 and TEST_HUMAN 1. A first amino acid sequence that is at least 70%, optionally at least 80%, preferably at least 85%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to HTREGTLGGQKRAFPDGVEGEKGRAWGAASRGSAVPLTIR corresponding to amino acids 1-42 of AA161187_P6 , Corresponding to amino acids 31 to 314 of TEST_HUMAN and corresponding to amino acids 43 to 326 of AA 161 187 _P 6 GPCGRRVITSRIVGGEDAELGRWPWQGSLLRWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMQFGSMTSFLSQAYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQ ASTFEFENRTDCWVTGWGYIKEDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIFGDMVCAGNAQGGKDACFGDSGGPLACNKNGLWYQIGVVSWGVGCGRPNRPGVYTNISHHFEWIQKLMAQSGMSQPDPSWPLLFFPLLWALPLLGPV and and at least 90% homologous to a second amino acid sequence, the first amino acid sequence and a second amino acid sequence, contiguous and in sequential order, the isolated chimeric polypeptide coding AA161187_P6.

2.AA161187_P6の配列HTREGTLGGQKRAFPDGVEGEKGRGRAWGAASRGSAVPLTIRと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、AA161187_P6の先端をコードする単離ポリペプチド。   2. The tip of AA161187_P6 comprising a polypeptide that is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence HTREGTLGGQKRAFPDGVEGEKGRAWGAASRGSAVPLTIR of AA161187_P6 An isolated polypeptide encoding

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、部分的タンパク質であるが、両膜貫通領域推定プログラムによってこのタンパク質が膜貫通領域を有すると推定されるので、膜と考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: membrane. Although protein localization is a partial protein, it is considered to be a membrane because both transmembrane domain estimation programs presume that this protein has a transmembrane domain.

変異タンパク質AA161187_P6はまた、表410に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AA161187_P6配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein AA161187_P6 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 410) It is shown whether it is known and the presence of a known SNP in the mutant protein AA161187_P6 sequence supports the deduced sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質テスチシン前駆体と比較した変異タンパク質AA161187_P6のグリコシル化部位を表411に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of mutant protein AA161187_P6 compared to the known protein testerin precursor are shown in Table 411 (showing its position on the amino acid sequence in the first column, the second column has a glycosylation site in the mutant protein) The last column indicates whether this position differs on the mutant protein).

Figure 2008507261
Figure 2008507261

変異タンパク質AA161187_P6は、以下の転写物によってコードされる:AA161187_T7(配列は出願書類の最後に示す)。転写物AA161187_T7のコード部分を太字で示し、このコード部分は1位から開始され、979位で終結する。転写物はまた、表412に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AA161187_P6配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein AA161187_P6 is encoded by the following transcript: AA161187_T7 (sequences shown at the end of the application). The coding portion of transcript AA161187 T7 is shown in bold and this coding portion starts from position 1 and ends at position 979. The transcript also has the following SNPs listed in Table 412 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein AA161187_P6 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質AA161187_P13は、出願書類の最後に示すアミノ酸配列を有し、転写物AA161187_T15によってコードされる。公知のタンパク質(テスチシン前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein AA161187_P13 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript AA161187_T15. An alignment to a known protein (testicin precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

AA161187_P13とTEST_HUMANとの間の比較の報告
1.TEST_HUMANのアミノ酸1〜183に対応し、AA161187_P13のアミノ酸1〜183にも対応するMGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIKEDEと少なくとも90%相同な第1のアミノ酸配列と、AA161187_P13のアミノ酸184〜213に対応する配列GSSGRHHKQLYVQPPLPQVQFPQGHLWRHGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、AA161187_P13をコードする単離キメラポリペプチド。
Report of comparison between AA161187_P13 and TEST_HUMAN 1. Corresponding to amino acids 1-183 of TEST_HUMAN, the polypeptide having a MGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIKEDE corresponding to amino acids 1-183 of AA161187_P13 the first amino acid sequence at least 90% homologous, sequences corresponding to GSSGRHHKQLYVQPPLPQVQFPQGHLWRHG to amino acid 184-213 of AA161187_P13 Less Said first amino acid sequence and the second amino acid sequence both at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; An isolated chimeric polypeptide encoding AA161187_P13, wherein the two amino acid sequences are in contiguous and sequential order.

2.AA161187_P13中の配列GSSGRHHKQLYVQPPLPQVQFPQGHLWRHGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、AA161187_P13のテールをコードする単離ポリペプチド。   2. AA161187_P13 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence GSSGRHHKQLYVQPPLPQVQFPQGHLWRH in AA161187_P13, An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質AA161187_P13はまた、表413に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AA161187_P13配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein AA161187_P13 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing the other amino acids, and listing the other amino acids, as shown in Table 413) It is indicated whether it is known and the presence of a known SNP in the mutein AA161187_P13 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質テスチシン前駆体と比較した変異タンパク質AA161187_P13のグリコシル化部位を表414に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of mutant protein AA161187_P13 compared to the known protein testerin precursor are shown in Table 414 (showing its position on the amino acid sequence in the first column, the second column has a glycosylation site in the mutant protein) The last column indicates whether this position differs on the mutant protein).

Figure 2008507261
Figure 2008507261

変異タンパク質AA161187_P13は、以下の転写物によってコードされる:AA161187_T15(配列は出願書類の最後に示す)。転写物AA161187_T15のコード部分を太字で示し、このコード部分は107位から開始され、745位で終結する。転写物はまた、表415に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AA161187_P13配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein AA161187_P13 is encoded by the following transcript: AA161187_T15 (sequences shown at the end of the application). The code portion of transcript AA161187_T15 is shown in bold and this code portion starts at position 107 and ends at position 745. The transcript also has the following SNPs listed in Table 415 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein AA161187_P13 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質AA161187_P14は、出願書類の最後に示すアミノ酸配列を有し、転写物AA161187_T16によってコードされる。公知のタンパク質(テスチシン前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein AA161187_P14 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript AA161187_T16. An alignment to a known protein (testicin precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

AA161187_P14とTEST_HUMANとの間の比較の報告
1.TEST_HUMANのアミノ酸1〜183に対応し、AA161187_P14のアミノ酸1〜183にも対応するMGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIKEDEと少なくとも90%相同な第1のアミノ酸配列と、AA161187_P14のアミノ酸184〜307に対応する配列GCCLSPSHYRPHSTAISPHPPGSSGRHHKQLYVQPPLPQVQFPQGHLWRHGLCWQCPRREGCLLRECPCHHSQPRKASCVPVPYLTLMPTPGGGDCCPTLQMQKRRLGCCQGEEEDVHPVYPAPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、AA161187_P14をコードする単離キメラポリペプチド。
Report of comparison between AA161187_P14 and TEST_HUMAN 1. Corresponding to amino acids 1-183 of TEST_HUMAN, first amino acid sequence at least 90% homologous to the corresponding MGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIKEDE to amino acids 1-183 of AA161187_P14, corresponding to amino acids 184-307 of AA161187_P14 sequence GCCLSPSHYRPHSTAISPHPPGSSGRHHKQLYVQPPLPQVQFP A polypeptide having at least 70%, optionally at least 80%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to the second amino acid sequence An isolated chimeric polypeptide encoding AA161187_P14, wherein the amino acid sequence of 1 and the second amino acid sequence are in contiguous and sequential order.

2.AA161187_P14中の配列GCCLSPSHYRPHSTAISPHPPGSSGRHHKQLYVQPPLPQVQFPQGHLWRHGLCWQCPRREGCLLRECPCHHSQPRKASCVPVPYLTLMPTPGGGDCCPTLQMQKRRLGCCQGEEEDVHPVYPAPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、AA161187_P14のテールをコードする単離ポリペプチド。   2. At least 70% of the sequence GCCLSPHYSHRIPISPHPPGSGGHHQQPPQQQQFPQGHLWRHGLCLCWQPRREGCLCPHHQPRKASCVPVPYLTMPTPGGGDCCPQGEEEDVHPVIPAP in the sequence of AA161187_P14, optionally at least about 80%, preferably at least about 70%, for example. An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質AA161187_P14はまた、表416に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AA161187_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein AA161187_P14 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids and listing the other amino acids, as shown in Table 416), and the last column shows SNPs It is indicated whether it is known and the presence of a known SNP in the mutant protein AA161187_P14 sequence supports the deduced sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質テスチシン前駆体と比較した変異タンパク質AA161187_P14のグリコシル化部位を表417に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of mutant protein AA161187_P14 compared to the known protein testerin precursor are shown in Table 417 (showing its position on the amino acid sequence in the first column, the second column has a glycosylation site in the mutant protein) The last column indicates whether this position differs on the mutant protein).

Figure 2008507261
Figure 2008507261

変異タンパク質AA161187_P14は、以下の転写物によってコードされる:AA161187_T16(配列は出願書類の最後に示す)。転写物AA161187_T16のコード部分を太字で示し、このコード部分は107位から開始され、1027位で終結する。転写物はまた、表418に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AA161187_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein AA161187_P14 is encoded by the following transcript: AA161187_T16 (sequences shown at the end of the application). The coding portion of transcript AA161187_T16 is shown in bold, starting at position 107 and ending at position 1027. The transcript also has the following SNPs listed in Table 418 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein AA161187_P14 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質AA161187_P18は、出願書類の最後に示すアミノ酸配列を有し、転写物AA161187_T20によってコードされる。公知のタンパク質(テスチシン前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein AA161187_P18 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript AA161187_T20. An alignment to a known protein (testicin precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

AA161187_P18とTEST_HUMANとの間の比較の報告
1.AA161187_P18のアミノ酸1〜42に対応する配列HTREGTLGGQKRAFPDGVEGEKGRGRAWGAASRGSAVPLTIRを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、TEST_HUMANのアミノ酸31〜86に対応し、AA161187_P18のアミノ酸43〜98にも対応するGPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETと少なくとも90%相同な第2のアミノ酸配列と、TEST_HUMANのアミノ酸89〜235に対応し、AA161187_P18のアミノ酸99〜245にも対応するDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIKEDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIFGDMVCAGNAQGGKDACFと少なくとも90%相同な第3のアミノ酸配列と、AA161187_P18のアミノ酸246〜265に対応する配列VSVPATTPSPGKHPVSLCLIを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第4のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、第3のアミノ酸配列、および第4のアミノ酸配列が、隣接し、且つ連続した順序にある、AA161187_P18をコードする単離キメラポリペプチド。
Report of comparison between AA161187_P18 and TEST_HUMAN 1. At least 70%, optionally at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 90%, most preferably at least 95% homologous to the polypeptide having the sequence HTREGTLGGQKRAFPDGVEGERGGRAWGAASRGSAVPLTIR corresponding to amino acids 1-42 of AA161187_P18 1, an amino acid sequence corresponding to amino acids 31 to 86 of TEST_HUMAN and corresponding to amino acids 43 to 98 of AA161187_P18. AA161187_P1 A corresponding DLCSPS GWFQFQQQHQFSMQFHQHQFQQFHQHQHQHQHQFSMQFHQFHQFHQFSMQFHQFHQFH. , Preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to a fourth amino acid sequence Seen, the first amino acid sequence, the second amino acid sequence, a third amino acid sequence, and the fourth amino acid sequence is adjacent, and in sequential order, the isolated chimeric polypeptide coding AA161187_P18.

2.AA161187_P18の配列HTREGTLGGQKRAFPDGVEGEKGRGRAWGAASRGSAVPLTIRと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、AA161187_P18の先端をコードする単離ポリペプチド。   2. The tip of AA161187_P18, comprising a polypeptide that is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence HTREGTLGGQKRAFPDGVEGEKGRAWGAASRGSAVPLTIR of AA161187_P18 An isolated polypeptide encoding

3.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がTDを含み、以下の構造:アミノ酸番号98−x〜98のいずれかから始まり、アミノ酸番号99+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、AA161187_P18の縁部分をコードする単離キメラポリペプチド。   3. Length “n” (wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long, most preferably at least about 50 amino acids long, at least two amino acids comprising TD, starting from any of the following structures: amino acids nos. 98-x to 98, amino acids nos. 99 + ((n-2)-x) (formula An isolated chimeric polypeptide encoding an edge portion of AA161187_P18, comprising a polypeptide having a sequence terminating in: x) varying from 0 to n-2).

AA161187_P18中の配列VSVPATTPSPGKHPVSLCLIと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、AA161187_P18のテールをコードする単離ポリペプチド。   AA161187_P18 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence VSVPATTSPSGKHPVSLCL1 in AA161187_P18 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、部分的タンパク質であるが、両膜貫通領域推定プログラムによってこのタンパク質が膜貫通領域を有すると推定されるので、膜と考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: membrane. Although protein localization is a partial protein, it is considered to be a membrane because both transmembrane domain estimation programs presume that this protein has a transmembrane domain.

変異タンパク質AA161187_P18はまた、表419に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AA161187_P18配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein AA161187_P18 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 419) It is indicated whether it is known and the presence of a known SNP in the mutant protein AA161187_P18 sequence supports the deduced sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質テスチシン前駆体と比較した変異タンパク質AA161187_P18のグリコシル化部位を表420に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of mutant protein AA161187_P18 compared to the known protein testerin precursor are shown in Table 420 (showing its position on the amino acid sequence in the first column, the second column has a glycosylation site in the mutant protein) The last column indicates whether this position differs on the mutant protein).

Figure 2008507261
Figure 2008507261

変異タンパク質AA161187_P18は、以下の転写物によってコードされる:AA161187_T20(配列は出願書類の最後に示す)。転写物AA161187_T20のコード部分を太字で示し、このコード部分は1位から開始され、796位で終結する。転写物はまた、表421に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AA161187_P18配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein AA161187_P18 is encoded by the following transcript: AA161187_T20 (sequences shown at the end of the application). The coding portion of transcript AA161187_T20 is shown in bold and this coding portion starts from position 1 and ends at position 796. The transcript also has the following SNPs listed in Table 421 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein AA161187_P18 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質AA161187_P19は、出願書類の最後に示すアミノ酸配列を有し、転写物AA161187_T21によってコードされる。公知のタンパク質(テスチシン前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein AA161187_P19 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript AA161187_T21. An alignment to a known protein (testicin precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

AA161187_P19とTEST_HUMANとの間の比較の報告
1.TEST_HUMANのアミノ酸1〜183に対応し、AA161187_P19のアミノ酸1〜183にも対応するMGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIKEDEと少なくとも90%相同な第1のアミノ酸配列と、AA161187_P19のアミノ酸184〜188に対応する配列DKRTQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、AA161187_P19をコードする単離キメラポリペプチド。
Report of comparison between AA161187_P19 and TEST_HUMAN 1. Corresponding to amino acids 1-183 of TEST_HUMAN, the polypeptide having a MGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIKEDE corresponding to amino acids 1-183 of AA161187_P19 the first amino acid sequence at least 90% homologous, sequences corresponding to DKRTQ to amino acid 184-188 of AA161187_P19 And at least 70%, optionally at least 80%, preferred Comprises a second amino acid sequence which is at least 85%, more preferably at least 90%, most preferably at least 95% homologous, the first amino acid sequence and the second amino acid sequence being adjacent and contiguous order An isolated chimeric polypeptide encoding AA161187_P19, wherein

2.AA161187_P19中の配列DKRTQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、AA161187_P19のテールをコードする単離ポリペプチド。   2. AA161187_P19 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence DKRTQ in AA161187_P19 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質AA161187_P19はまた、表422に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AA161187_P19配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein AA161187_P19 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 422) It is shown whether it is known and the presence of a known SNP in the mutant protein AA161187_P19 sequence supports the deduced sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質テスチシン前駆体と比較した変異タンパク質AA161187_P19のグリコシル化部位を表423に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of mutant protein AA161187_P19 compared to the known protein testerin precursor are shown in Table 423 (showing its position on the amino acid sequence in the first column, the second column has a glycosylation site in the mutant protein) The last column indicates whether this position differs on the mutant protein).

Figure 2008507261
Figure 2008507261

変異タンパク質AA161187_P19は、以下の転写物によってコードされる:AA161187_T21(配列は出願書類の最後に示す)。転写物AA161187_T21のコード部分を太字で示し、このコード部分は107位から開始され、670位で終結する。転写物はまた、表424に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AA161187_P19配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein AA161187_P19 is encoded by the following transcript: AA161187_T21 (sequences shown at the end of the application). The code portion of transcript AA161187_T21 is shown in bold and this code portion starts at position 107 and ends at position 670. The transcript also has the following SNPs listed in Table 424 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein AA161187_P19 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターAA161187は、上の表404に列挙した20個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As noted above, cluster AA 161 187 features the twenty segments listed in Table 404 above, the sequences of which are shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターAA161187_node_0は、21個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T15、AA161187_T16、AA161187_T21、およびAA161187_T22。以下の表425は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AA161187_node_0 of the present invention is supported by 21 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: AA161187_T0, AA161187_T15, AA161187_T16, AA161187_T21, and AA161187_T22. Table 425 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターAA161187_node_6は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T7およびAA161187_T20。以下の表426は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AA161187_node_6 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: AA161187_T7 and AA161187_T20. Table 426 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターAA161187_node_14は、35個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T7、AA161187_T15、AA161187_T16、AA161187_T20、AA161187_T21、およびAA161187_T22。以下の表427は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AA161187_node_14 of the present invention is supported by 35 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: AA161187_T0, AA161187_T7, AA161187_T15, AA161187_T16, AA161187_T20, AA161187_T21, and AA161187_T22. Table 427 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターAA161187_node_16は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T22。以下の表428は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AA161187_node_16 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: AA161187_T22. Table 428 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターAA161187_node_25は、13個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T16およびAA161187_T20。以下の表429は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AA161187_node_25 of the present invention is supported by 13 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: AA161187_T16 and AA161187_T20. Table 429 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表430に示す)。   Microarray (chip) data for this segment is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (for lung cancer) (shown in Table 430).

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターAA161187_node_26は、39個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T7、AA161187_T15、AA161187_T16、およびAA161187_T20。以下の表431は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AA161187_node_26 of the present invention is supported by 39 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: AA161187_T0, AA161187_T7, AA161187_T15, AA161187_T16, and AA161187_T20. Table 431 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターAA161187_node_28は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T21。以下の表432は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AA161187_node_28 of the present invention is supported by 4 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: AA161187_T21. Table 432 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターAA161187_node_4は、22個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T7、AA161187_T15、AA161187_T16、AA161187_T21、およびAA161187_T22。以下の表433は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AA161187_node_4 of the present invention is supported by 22 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: AA161187_T0, AA161187_T7, AA161187_T15, AA161187_T16, AA161187_T21, and AA161187_T22. Table 433 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターAA161187_node_7を、以下の転写物中に見出すことができる:AA161187_T7およびAA161187_T20。以下の表434は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AA161187_node_7 of the invention can be found in the following transcripts: AA161187_T7 and AA161187_T20. Table 434 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターAA161187_node_8は、23個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T7、AA161187_T15、AA161187_T16、AA161187_T20、AA161187_T21、およびAA161187_T22。以下の表435は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AA161187_node_8 of the present invention is supported by 23 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: AA161187_T0, AA161187_T7, AA161187_T15, AA161187_T16, AA161187_T20, AA161187_T21, and AA161187_T22. Table 435 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターAA161187_node_9は、24個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T7、AA161187_T15、AA161187_T16、AA161187_T20、AA161187_T21、およびAA161187_T22。以下の表436は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AA161187_node_9 of the present invention is supported by 24 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: AA161187_T0, AA161187_T7, AA161187_T15, AA161187_T16, AA161187_T20, AA161187_T21, and AA161187_T22. Table 436 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターAA161187_node_10は、25個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T7、AA161187_T15、AA161187_T16、AA161187_T20、AA161187_T21、およびAA161187_T22。以下の表437は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AA161187_node_10 of the present invention is supported by 25 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: AA161187_T0, AA161187_T7, AA161187_T15, AA161187_T16, AA161187_T20, AA161187_T21, and AA161187_T22. Table 437 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターAA161187_node_12を、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T7、AA161187_T15、AA161187_T16、AA161187_T21、およびAA161187_T22。以下の表438は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AA161187_node_12 according to the invention can be found in the following transcripts: AA161187_T0, AA161187_T7, AA161187_T15, AA161187_T16, AA161187_T21, and AA161187_T22. Table 438 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターAA161187_node_13は、25個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T7、AA161187_T15、AA161187_T16、AA161187_T20、AA161187_T21、およびAA161187_T22。以下の表439は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AA161187_node_13 of the present invention is supported by 25 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: AA161187_T0, AA161187_T7, AA161187_T15, AA161187_T16, AA161187_T20, AA161187_T21, and AA161187_T22. Table 439 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターAA161187_node_19は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T16。以下の表440は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AA161187_node_19 of the present invention is supported by four libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: AA161187_T16. Table 440 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターAA161187_node_20は、28個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T7、AA161187_T16、およびAA161187_T20。以下の表441は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AA161187_node_20 of the present invention is supported by 28 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: AA161187_T0, AA161187_T7, AA161187_T16, and AA161187_T20. Table 441 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターAA161187_node_21は、31個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T7、AA161187_T15、AA161187_T16、およびAA161187_T20。以下の表442は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AA161187_node_21 of the present invention is supported by 31 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: AA161187_T0, AA161187_T7, AA161187_T15, AA161187_T16, and AA161187_T20. Table 442 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターAA161187_node_22は、34個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T7、AA161187_T15、AA161187_T16、およびAA161187_T20。以下の表443は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AA161187_node_22 of the present invention is supported by 34 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: AA161187_T0, AA161187_T7, AA161187_T15, AA161187_T16, and AA161187_T20. Table 443 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターAA161187_node_23は、31個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T7、AA161187_T16、およびAA161187_T20。以下の表444は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AA161187_node_23 of the present invention is supported by 31 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: AA161187_T0, AA161187_T7, AA161187_T16, and AA161187_T20. Table 444 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターAA161187_node_24は、12個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T16およびAA161187_T20。以下の表445は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AA161187_node_24 of the present invention is supported by 12 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: AA161187_T16 and AA161187_T20. Table 445 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: TEST_HUMAN

Sequence documentation:

Alignment of: AA161187_P6 x TEST_HUMAN ..

Alignment segment 1/1:

Quality: 2894.00 Escore: 0
Matching length: 284 Total length: 284
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
43 GPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTA 92
||||||||||||||||||||||||||||||||||||||||||||||||||
31 GPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTA 80
. . . . .
93 AHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRY 142
||||||||||||||||||||||||||||||||||||||||||||||||||
81 AHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRY 130
. . . . .
143 LGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIK 192
||||||||||||||||||||||||||||||||||||||||||||||||||
131 LGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIK 180
. . . . .
193 EDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIFGDMVCAGNAQGG 242
||||||||||||||||||||||||||||||||||||||||||||||||||
181 EDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIFGDMVCAGNAQGG 230
. . . . .
243 KDACFGDSGGPLACNKNGLWYQIGVVSWGVGCGRPNRPGVYTNISHHFEW 292
||||||||||||||||||||||||||||||||||||||||||||||||||
231 KDACFGDSGGPLACNKNGLWYQIGVVSWGVGCGRPNRPGVYTNISHHFEW 280
. . .
293 IQKLMAQSGMSQPDPSWPLLFFPLLWALPLLGPV 326
||||||||||||||||||||||||||||||||||
281 IQKLMAQSGMSQPDPSWPLLFFPLLWALPLLGPV 314






Sequence name: TEST_HUMAN

Sequence documentation:

Alignment of: AA161187_P13 x TEST_HUMAN ..

Alignment segment 1/1:

Quality: 1829.00 Escore: 0
Matching length: 183 Total length: 183
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAEL 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAEL 50
. . . . .
51 GRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQF 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 GRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQF 100
. . . . .
101 GQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 GQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYT 150
. . .
151 KHIQPICLQASTFEFENRTDCWVTGWGYIKEDE 183
|||||||||||||||||||||||||||||||||
151 KHIQPICLQASTFEFENRTDCWVTGWGYIKEDE 183






Sequence name: TEST_HUMAN

Sequence documentation:

Alignment of: AA161187_P14 x TEST_HUMAN ..

Alignment segment 1/1:

Quality: 1829.00 Escore: 0
Matching length: 183 Total length: 183
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAEL 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAEL 50
. . . . .
51 GRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQF 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 GRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQF 100
. . . . .
101 GQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 GQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYT 150
. . .
151 KHIQPICLQASTFEFENRTDCWVTGWGYIKEDE 183
|||||||||||||||||||||||||||||||||
151 KHIQPICLQASTFEFENRTDCWVTGWGYIKEDE 183






Sequence name: TEST_HUMAN

Sequence documentation:

Alignment of: AA161187_P18 x TEST_HUMAN ..

Alignment segment 1/1:

Quality: 1957.00 Escore: 0
Matching length: 203 Total length: 205
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 99.02 Total Percent Identity: 99.02
Gaps: 1

Alignment:
. . . . .
43 GPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTA 92
||||||||||||||||||||||||||||||||||||||||||||||||||
31 GPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTA 80
. . . . .
93 AHCFET..DLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRY 140
|||||| ||||||||||||||||||||||||||||||||||||||||||
81 AHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRY 130
. . . . .
141 LGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIK 190
||||||||||||||||||||||||||||||||||||||||||||||||||
131 LGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIK 180
. . . . .
191 EDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIFGDMVCAGNAQGG 240
||||||||||||||||||||||||||||||||||||||||||||||||||
181 EDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIFGDMVCAGNAQGG 230

241 KDACF 245
|||||
231 KDACF 235






Sequence name: TEST_HUMAN

Sequence documentation:

Alignment of: AA161187_P19 x TEST_HUMAN ..

Alignment segment 1/1:

Quality: 1829.00 Escore: 0
Matching length: 183 Total length: 183
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAEL 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAEL 50
. . . . .
51 GRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQF 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 GRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQF 100
. . . . .
101 GQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 GQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYT 150
. . .
151 KHIQPICLQASTFEFENRTDCWVTGWGYIKEDE 183
|||||||||||||||||||||||||||||||||
151 KHIQPICLQASTFEFENRTDCWVTGWGYIKEDE 183



Mutated protein alignment against previously known proteins:
Sequence name: TEST_HUMAN

Sequence documentation:

Alignment of: AA161187_P6 x TEST_HUMAN ..

Alignment segment 1/1:

Quality: 2894.00 Escore: 0
Matching length: 284 Total length: 284
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
43 GPCGRRVITSRIVGGEDAEL GRWPWQGSLRLWDSHVCGVSLLSHRWALTA 92
||||||||||||||||||||||||||||||||||||||||
31 GPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTA 80
....
93 AHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRY 142
||||||||||||||||||||||||||||||||||||||||
81 AHCFETYSDLDPPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRY 130
....
143 LGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDWVTGWGYIK 192
||||||||||||||||||||||||||||||||||||||||
131 LGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIK 180
....
193 EDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIGFDMVCAGNAQGG 242
||||||||||||||||||||||||||||||||||||||||
181 EDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIGFDMVCAGNAQGG 230
....
243 KDACFGDSGGPLACNKNGLWYQIGVVSWGVGCGRPNRPGVYTNISHHFEW 292
||||||||||||||||||||||||||||||||||||||||
231 KDACFGDSGGPLACNKNGLWYQIGVVSWGVGCGRPNRPGVYTNISHHFEW 280
....
293 IQKLMAQSGMSQPDPPSWPLLFFPLLWALPLLGPV 326
|||||||||||||||||||||||||||||||
281 IQKLMAQSGMSQPDPPSWPLLFFPLLWALPLLGPV 314






Sequence name: TEST_HUMAN

Sequence documentation:

Alignment of: AA161187_P13 x TEST_HUMAN ..

Alignment segment 1/1:

Quality: 1829.00 Escore: 0
Matching length: 183 Total length: 183
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MGARGALLLLALLLARAGLRKPESQ EAAPLSGPCGRVTORSIVGGEDAEL 50
||||||||||||||||||||||||||||||||||||||||
1 MGARGALLLLALLLARAGLRKPESQ EAAPLSGPCGRVTORSIVGGEDAEL 50
....
51 GRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLDSPSGWMVQF 100
||||||||||||||||||||||||||||||||||||||||
51 GRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLDSPSGWMVQF 100
....
101 GQLTSMPSFWSLQAYY TRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYT 150
||||||||||||||||||||||||||||||||||||||||
101 GQLTSMPSFWSLQAYY TRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYT 150
....
151 KHIQPICLQASTFEFENRTDCW VTGWGYIKEDE 183
||||||||||||||||||||||||||||||
151 KHIQPICLQASTFEFENRTDCW VTGWGYIKEDE 183






Sequence name: TEST_HUMAN

Sequence documentation:

Alignment of: AA161187_P14 x TEST_HUMAN ..

Alignment segment 1/1:

Quality: 1829.00 Escore: 0
Matching length: 183 Total length: 183
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MGARGALLLLALLLARAGLRKPESQ EAAPLSGPCGRVTORSIVGGEDAEL 50
||||||||||||||||||||||||||||||||||||||||
1 MGARGALLLLALLLARAGLRKPESQ EAAPLSGPCGRVTORSIVGGEDAEL 50
....
51 GRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLDSPSGWMVQF 100
||||||||||||||||||||||||||||||||||||||||
51 GRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLDSPSGWMVQF 100
....
101 GQLTSMPSFWSLQAYY TRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYT 150
||||||||||||||||||||||||||||||||||||||||
101 GQLTSMPSFWSLQAYY TRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYT 150
....
151 KHIQPICLQASTFEFENRTDCW VTGWGYIKEDE 183
||||||||||||||||||||||||||||||
151 KHIQPICLQASTFEFENRTDCW VTGWGYIKEDE 183






Sequence name: TEST_HUMAN

Sequence documentation:

Alignment of: AA161187_P18 x TEST_HUMAN ..

Alignment segment 1/1:

Quality: 1957.00 Escore: 0
Matching length: 203 Total length: 205
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 99.02 Total Percent Identity: 99.02
Gaps: 1

Alignment:
....
43 GPCGRRVITSRIVGGEDAEL GRWPWQGSLRLWDSHVCGVSLLSHRWALTA 92
||||||||||||||||||||||||||||||||||||||||
31 GPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTA 80
....
93 AHCFET .. DLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRY 140
|||||||||||||||||||||||||||||||||||||||
81 AHCFETYSDLDPPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRY 130
....
141 LGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIK 190
||||||||||||||||||||||||||||||||||||||||
131 LGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIK 180
....
191 EDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIGFDMVCAGNAQGG 240
||||||||||||||||||||||||||||||||||||||||
181 EDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIGFDMVCAGNAQGG 230

241 KDACF 245
||||||
231 KDACF 235






Sequence name: TEST_HUMAN

Sequence documentation:

Alignment of: AA161187_P19 x TEST_HUMAN ..

Alignment segment 1/1:

Quality: 1829.00 Escore: 0
Matching length: 183 Total length: 183
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MGARGALLLLALLLARAGLRKPESQ EAAPLSGPCGRVTORSIVGGEDAEL 50
||||||||||||||||||||||||||||||||||||||||
1 MGARGALLLLALLLARAGLRKPESQ EAAPLSGPCGRVTORSIVGGEDAEL 50
....
51 GRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLDSPSGWMVQF 100
||||||||||||||||||||||||||||||||||||||||
51 GRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLDSPSGWMVQF 100
....
101 GQLTSMPSFWSLQAYY TRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYT 150
||||||||||||||||||||||||||||||||||||||||
101 GQLTSMPSFWSLQAYY TRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYT 150
....
151 KHIQPICLQASTFEFENRTDCW VTGWGYIKEDE 183
||||||||||||||||||||||||||||||
151 KHIQPICLQASTFEFENRTDCW VTGWGYIKEDE 183


正常および癌性肺組織における配列名AA161187seg25中に示すアンプリコンによって検出可能なホモ・サピエンスプロテアーゼ、セリン、21(テスチシン)(PRSS21)AA161187転写物の発現
seg25、AA161187seg25アンプリコン(配列番号1654)、ならびにプライマーAA161187seg17F2(配列番号1652)およびAA161187seg17R2(配列番号1653)によって検出可能なホモ・サピエンスプロテアーゼ、セリン、21(テスチシン)(PRSS21)AA161187転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
Expression of homo-sapiens protease, serine, 21 (testicin) (PRSS21) AA161187 transcript detectable by an amplicon shown in sequence name AA161187 seg 25 in normal and cancerous lung tissue seg25, AA 161 187 seg 25 amplicon (SEQ ID NO: 1654), and The expression of the homo-sapiens protease, serine, 21 (testicin) (PRSS21) AA161187 transcripts detectable by primers AA161187 seg17 F2 (SEQ ID NO: 1652) and AA161187 seg 17 R2 (SEQ ID NO: 1653) was measured by real time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – PBGD-Amplicon, SEQ ID No. 334), HPRT1 (GenBank Accession No. NM_000194, Amplicon – HPRT1- Amplicons, SEQ ID NO: 1297), Ubiquitin (GenBank Accession No. BC000449, Amplicon – Ubiquitin-Amplicon SEQ ID NO: 328), and SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA-Amplicon SEQ ID NO: 331) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. Normalized PM samples by dividing the normalized volume of each RT sample by the median volume of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99, Table 2 above) Magnifications of upregulation of each sample to the median of were obtained.

図64は、正常サンプルと比較したいくつかの癌性肺サンプルにおける上記ホモ・サピエンスプロテアーゼ、セリン、21(テスチシン)(PRSS21)転写物の過剰発現を示すヒストグラムである。   FIG. 64 is a histogram showing over expression of the homo-Sapiens protease, serine, 21 (testicin) (PRSS21) transcripts in several cancerous lung samples compared to normal samples.

図64から明らかなように、いくつかの癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンスプロテアーゼ、セリン、21(テスチシン)(PRSS21)転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2)よりも有意に高かった。明白には、15個の腺癌サンプルのうち1個および16個の扁平上皮細胞癌サンプルのうち3個、4個の大細胞癌サンプルのうち1個で少なくとも6倍の過剰発現が見出された。   As evident from FIG. 64, the expression of the homo-Sapiens protease, Serine, 21 (Testicin) (PRSS21) transcript, detectable by the above amplicon in several cancer samples, is a non-cancerous sample (Sample No. 46). 50, 90-93, 96-99, Table 2) significantly higher. Apparently, at least 6-fold overexpression was found in 1 out of 15 adenocarcinoma samples and 3 out of 16 squamous cell carcinoma samples and 1 out of 4 large cell carcinoma samples. The

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:AA161187seg17F2順方向プライマーおよびAA161187seg17R2逆方向プライマー。   Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used only as non-limiting examples of suitable primer pairs: AA161187seg17F2 forward primer and AA161187seg17R2 reverse Direction primer.

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:AA161187seg25。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : AA 161 187 seg 25.


プライマー:
順方向プライマーAA161187seg17F2(配列番号1652):CCCTGTGCCTTATTTGACCCT
逆方向プライマーAA161187seg17R2(配列番号1653):GCTGGGTAGACTGGGTGCA
アンプリコンAA161187seg25(配列番号1654):CCTGTGCCTTATTTGACCCTCATGCCAACCCCGGGAGGTGGAGACTGTTGCCCCACTCTGCAGATGCAGAAACGGAGGCTTGGCTGCTGCCAGGGGGAGGA

Primer:
Forward primer AA161187seg17F2 (SEQ ID NO: 1652): CCCTGTGCCTTATTTGACCCT
Reverse primer AA161187seg17R2 (SEQ ID NO: 1653): GCTGGGTAGACTGGGTGCA
Amplicon AA 161 187 seg 25 (SEQ ID NO: 1654): CCTGTGCCTTATTTGACCCTCATGCCAACCCCGGGAGGGTGAGTG ACTGCTGACTCCAGCTAGCAAGAACGGAGGCTTGGCTGCTGCAGGGGGAGGA

クラスターR66178の説明
クラスターR66178は、目的の3つの転写物および16個のセグメントを特徴とし、その名称を、それぞれ表446および447に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表448に示す。
Description of Cluster R66178 Cluster R66178 features 3 transcripts of interest and 16 segments, the names of which are shown in Tables 446 and 447 respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 448.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるポリオウイルス受容体関連タンパク質1前駆体(SwissProtアクセッション識別子PVR1_HUMAN)、同義語ヘルペスウイルス侵入メディエーターC、HveC、ネクチン1、ヘルペスウイルスIg様受容体、HIgR、CD111抗原としても公知である)(配列番号1432)の変異型である。   These sequences are known proteins poliovirus receptor-related protein 1 precursor (SwissProt accession identifier PVR1_HUMAN), which is a known protein previously known in the present specification, synonym Herpes virus entry mediator C, HveC, Nectin 1. A variant of the herpes virus Ig-like receptor, also known as HIgR, CD111 antigen) (SEQ ID NO: 1432).

タンパク質ポリオウイルス受容体関連タンパク質1前駆体は、以下の機能を有することが公知であるか、そのように見なされている:おそらく細胞接着に関与する、細胞へのαヘルペスウイルス(HSV−1、HSV−2、および仮性狂犬病ウイルス)侵入の受容体。タンパク質ポリオウイルス受容体関連タンパク質1前駆体の配列を、「ポリオウイルス受容体関連タンパク質1前駆体アミノ酸配列」として出願書類の最後に示す。タンパク質ポリオウイルス受容体関連タンパク質1前駆体の局在化は、I型膜タンパク質(イソ型αおよびδ)、分泌(イソ型γ)と考えられる。   The protein poliovirus receptor-related protein 1 precursor is known or considered to have the following functions: Alpha-herpesvirus (HSV-1 to cell, possibly involved in cell adhesion) HSV-2, and pseudorabies virus) receptors for invasion. The sequence of the protein poliovirus receptor related protein 1 precursor is shown at the end of the application as "poliovirus receptor related protein 1 precursor amino acid sequence". The localization of the protein poliovirus receptor-related protein 1 precursor is considered to be type I membrane proteins (isoforms α and δ) and secretion (isoform γ).

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである免疫応答、細胞−細胞接着、分子機能に関連する注釈付けである細胞接着受容体、タンパク質結合、共同受容体、細胞成分に関連する注釈付けである接着結合、内在性膜タンパク質。   The following GO annotation applies to previously known proteins. The following annotations were found: immune responses that are related to biological processes, cell-cell adhesion, cell adhesion receptors that are related to molecular function, protein binding, co-receptors, Adhesive junctions, integral membrane proteins that are annotations related to cellular components.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

上記のように、クラスターR66178は、上の表1に列挙した3つの転写物を特徴とする。これらの転写物は、タンパク質ポリオウイルス受容体関連タンパク質1前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster R66178 is characterized by the three transcripts listed in Table 1 above. These transcripts encode proteins which are variants of the protein poliovirus receptor related protein 1 precursor. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質R66178_P3は、出願書類の最後に示すアミノ酸配列を有し、転写物R66178_T2によってコードされる。公知のタンパク質(ポリオウイルス受容体関連タンパク質1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein R66178_P3 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript R66178_T2. An alignment to a known protein (poliovirus receptor related protein 1 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

R66178_P3とPVR1_HUMANとの間の比較の報告
1.PVR1_HUMANのアミノ酸1〜334に対応し、R66178_P3のアミノ酸1〜334にも対応するMARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLHCSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFLRPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWIEGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRNPNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVTIEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTLFFKGPINYSLAGTYICEATNPIGTRSGQVEVNITと少なくとも90%相同な第1のアミノ酸配列と、R66178_P3のアミノ酸335〜354に対応する配列GEGHSLPISPGVLQTQNCGPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R66178_P3をコードする単離キメラポリペプチド。
Report on comparison between R66178_P3 and PVR1_HUMAN Corresponding to amino acids 1 to 334 of PVR1_HUMAN, corresponding to amino acids 1 to 334 of R66178_P3 MARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLHCSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFLRPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWIEGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRNPNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVTIEGFDGNWYLQRMDVKLTCKADANPPATEYHWT At least 70%, optionally at least 80%, preferably at least 85%, with a polypeptide having the sequence GEGHSLPISPGGVLQTQNCGP corresponding to the first amino acid sequence at least 90% homologous to LNGSLPKGVEAQNRTLFFKGPINYAGAGTYTYEATNAGIGTGSGVEVNIT and amino acids 335-354 of R66178_P3 Comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, the first amino acid sequence and the second amino acid sequence encoding R66178_P3, adjacent and in sequential order Isolated chimeric polypeptide.

2.R66178_P3中の配列GEGHSLPISPGVLQTQNCGPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R66178_P3のテールをコードする単離ポリペプチド。   2. R66178_P3 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence GEGHSLPISPVGVLQTQNCGP in R66178_P3 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質R66178_P3はまた、表449に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R66178_P3配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R66178_P3 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing the other amino acids, and listing the other amino acids, as shown in Table 449) It is shown whether it is known and the presence of a known SNP in the mutant protein R66178_P3 sequence supports the deduced sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質ポリオウイルス受容体関連タンパク質1前駆体と比較した変異タンパク質R66178_P3のグリコシル化部位を表450に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein R66178_P3 compared to the known protein poliovirus receptor related protein 1 precursor are shown in Table 450 (showing its position on the amino acid sequence in the first column, the second column Indicates whether the site of transformation is present in the mutein and the last column indicates whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質R66178_P3は、以下の転写物によってコードされる:R66178_T2(配列は出願書類の最後に示す)。転写物R66178_T2のコード部分を太字で示し、このコード部分は634位から開始され、1695位で終結する。転写物はまた、表451に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R66178_P3配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R66178_P3 is encoded by the following transcript: R66178_T2 (sequences shown at the end of the application). The coding part of the transcript R66178_T2 is shown in bold, starting from position 634 and ending at position 1695. The transcript also has the following SNPs listed in Table 451 (showing its position on the nucleotide sequence and listing another nucleic acid, the last column indicating whether the SNP is known, mutein R66178_P3 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質R66178_P4は、出願書類の最後に示すアミノ酸配列を有し、転写物R66178_T3によってコードされる。公知のタンパク質(ポリオウイルス受容体関連タンパク質1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein R66178_P4 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript R66178_T3. An alignment to a known protein (poliovirus receptor related protein 1 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

R66178_P4とPVR1_HUMANとの間の比較の報告
1.PVR1_HUMANのアミノ酸1〜334に対応し、R66178_P4のアミノ酸1〜334にも対応するMARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLHCSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFLRPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWIEGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRNPNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVTIEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTLFFKGPINYSLAGTYICEATNPIGTRSGQVEVNITと少なくとも90%相同な第1のアミノ酸配列と、R66178_P4のアミノ酸335〜352に対応する配列AFCQLIYPGKGRTRARMFを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R66178_P4をコードする単離キメラポリペプチド。
Report of comparison between R66178_P4 and PVR1_HUMAN Corresponding to amino acids 1 to 334 of PVR1_HUMAN, corresponding to amino acids 1 to 334 of R66178_P4 MARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLHCSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFLRPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWIEGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRNPNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVTIEGFDGNWYLQRMDVKLTCKADANPPATEYHWT At least 70%, optionally at least 80%, preferably at least 85%, with a polypeptide having the first amino acid sequence at least 90% homologous to LNGSLPKGVEAQNRTLFFKGPINYAGAGTYTYEATATIG PIGTRSGQ VEVNIT and the sequence AFCQLIYPGKGRTRARMMF corresponding to amino acids 335-352 of R66178_P4 Comprises a second amino acid sequence that is at least 90%, most preferably at least 95% homologous, the first amino acid sequence and the second amino acid sequence encoding R66178_P4, adjacent and in sequential order Isolated chimeric polypeptide.

2.R66178_P4中の配列AFCQLIYPGKGRTRARMFと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R66178_P4のテールをコードする単離ポリペプチド。   2. R66178_P4 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence AFCQLIYPGKGRTRARMF in R66178_P4 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質R66178_P4はまた、表452に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R66178_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R66178_P4 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing the other amino acids, and listing the other amino acids, as shown in Table 452, the last It is shown whether it is known and the presence of known SNPs in the mutein R66178_P4 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質ポリオウイルス受容体関連タンパク質1前駆体と比較した変異タンパク質R66178_P4のグリコシル化部位を表453に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein R66178_P4 compared to the known protein poliovirus receptor related protein 1 precursor are shown in Table 453 (showing its position on the amino acid sequence in the first column, the second column Indicates whether the site of transformation is present in the mutein and the last column indicates whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質R66178_P4は、以下の転写物によってコードされる:R66178_T3(配列は出願書類の最後に示す)。転写物R66178_T3のコード部分を太字で示し、このコード部分は634位から開始され、1689位で終結する。転写物はまた、表454に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R66178_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R66178_P4 is encoded by the following transcript: R66178_T3 (sequences shown at the end of the application). The coding part of the transcript R66178_T3 is shown in bold, starting from position 634 and ending at position 1689. The transcript also has the following SNPs listed in Table 454 (showing its position on the nucleotide sequence and listing another nucleic acid, the last column shows whether the SNP is known, mutein R66178_P4 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質R66178_P8は、出願書類の最後に示すアミノ酸配列を有し、転写物R66178_T7によってコードされる。公知のタンパク質(ポリオウイルス受容体関連タンパク質1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。 The mutein R66178_P8 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript R66178_T7. An alignment to a known protein (poliovirus receptor related protein 1 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

R66178_P8とPVR1_HUMANとの間の比較の報告
1.PVR1_HUMANのアミノ酸1〜330に対応し、R66178_P8のアミノ酸1〜330にも対応するMARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLHCSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFLRPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWIEGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRNPNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVTIEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTLFFKGPINYSLAGTYICEATNPIGTRSGQVEと少なくとも90%相同な第1のアミノ酸配列と、R66178_P8のアミノ酸331〜363に対応する配列NSPTPRLLPNMGGAPGRCPRPSLGAWRGASCWCを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R66178_P8をコードする単離キメラポリペプチド。
Report on comparison between R66178_P8 and PVR1_HUMAN Corresponding to amino acids 1 to 330 of PVR1_HUMAN, corresponding to amino acids 1 to 330 of R66178_P8 MARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLHCSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFLRPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWIEGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRNPNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVTIEGFDGNWYLQRMDVKLTCKADANPPATEYHWT At least 70%, preferably at least 80%, preferably at least 85%, more preferably a first amino acid sequence which is at least 90% homologous to LNGSLPKGVEAQNRTLFFKGPINYSLAGICTYNPIGTRSGQVE and a sequence NSPTPRLLPNMGGAPGRCPRPSLGAWRGASCWC corresponding to amino acids 331 to 363 of R66178_P8, preferably at least 85%, preferably at least 85% Comprises R66178_P8, comprising a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first amino acid sequence and the second amino acid sequence being adjacent and in a consecutive order Isolated chimeric polypeptide.

2.R66178_P8中の配列NSPTPRLLPNMGGAPGRCPRPSLGAWRGASCWCと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R66178_P8のテールをコードする単離ポリペプチド。   2. R66178_P8 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence NSPTPRLLPNMGGAPGRCPRPSLGAWRGASCWC in R66178_P8 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質R66178_P8はまた、表455に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R66178_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R66178_P8 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing the other amino acids, and listing the other amino acids, as shown in Table 455), and the last column is the SNP It is shown whether it is known and the presence of a known SNP in the mutein R66178_P8 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質ポリオウイルス受容体関連タンパク質1前駆体と比較した変異タンパク質R66178_P8のグリコシル化部位を表456に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein R66178_P8 compared to the known protein poliovirus receptor related protein 1 precursor are shown in Table 456 (showing its position on the amino acid sequence in the first column, the second column Indicates whether the site of transformation is present in the mutein and the last column indicates whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質R66178_P8は、以下の転写物によってコードされる:R66178_T7(配列は出願書類の最後に示す)。転写物R66178_T7のコード部分を太字で示し、このコード部分は634位から開始され、1722位で終結する。転写物はまた、表457に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R66178_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R66178_P8 is encoded by the following transcript: R66178_T7 (sequences shown at the end of the application). The coding part of the transcript R66178_T7 is shown in bold, starting from position 634 and ending at position 1722. The transcript also has the following SNPs listed in Table 457 (indicating its position on the nucleotide sequence and listing another nucleic acid, the last column indicating whether the SNP is known, mutein R66178_P8 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターR66178は、上の表2に列挙した16個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster R66178 is characterized by the sixteen segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターR66178_node_0は、19個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T2、R66178_T3、およびR66178_T7。以下の表458は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R66178_node_0 of the present invention is supported by 19 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R66178_T2, R66178_T3, and R66178_T7. Table 458 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR66178_node_6は、39個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T2、R66178_T3、およびR66178_T7。以下の表459は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R66178_node_6 of the present invention is supported by 39 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R66178_T2, R66178_T3, and R66178_T7. Table 459 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR66178_node_8は、39個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T2、R66178_T3、およびR66178_T7。以下の表460は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R66178_node_8 of the present invention is supported by 39 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R66178_T2, R66178_T3, and R66178_T7. Table 460 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表461に示す)。   Microarray (chip) data for this segment is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (for lung cancer) (shown in Table 461).

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR66178_node_15は、40個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T2、R66178_T3、およびR66178_T7。以下の表462は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R66178_node_15 of the present invention is supported by 40 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R66178_T2, R66178_T3, and R66178_T7. Table 462 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR66178_node_24は、10個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T2。以下の表463は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R66178_node_24 of the present invention is supported by 10 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R66178_T2. Table 463 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR66178_node_26は、24個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T7。以下の表464は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R66178_node_26 of the present invention is supported by 24 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R66178_T7. Table 464 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR66178_node_27は、12個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T7。以下の表465は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R66178_node_27 of the present invention is supported by 12 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R66178_T7. Table 465 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターR66178_node_4は、21個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T2、R66178_T3、およびR66178_T7。以下の表466は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R66178_node_4 of the present invention is supported by 21 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R66178_T2, R66178_T3, and R66178_T7. Table 466 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR66178_node_5を、以下の転写物中に見出すことができる:R66178_T2、R66178_T3、およびR66178_T7。以下の表467は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R66178_node_5 of the invention can be found in the following transcripts: R66178_T2, R66178_T3, and R66178_T7. Table 467 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR66178_node_9は、44個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T2、R66178_T3、およびR66178_T7。以下の表468は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R66178_node_9 of the present invention is supported by 44 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R66178_T2, R66178_T3, and R66178_T7. Table 468 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR66178_node_11は、44個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T2、R66178_T3、およびR66178_T7。以下の表469は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R66178_node_11 of the present invention is supported by 44 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R66178_T2, R66178_T3, and R66178_T7. Table 469 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR66178_node_16を、以下の転写物中に見出すことができる:R66178_T2およびR66178_T3。以下の表470は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R66178_node_16 of the invention can be found in the following transcripts: R66178_T2 and R66178_T3. Table 470 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR66178_node_18は、13個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T3。以下の表471は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R66178_node_18 of the present invention is supported by 13 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R66178_T3. Table 471 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR66178_node_19を、以下の転写物中に見出すことができる:R66178_T3。以下の表472は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R66178_node_19 according to the invention can be found in the following transcript: R66178_T3. Table 472 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR66178_node_20は、12個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T3。以下の表473は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R66178_node_20 of the present invention is supported by 12 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R66178_T3. Table 473 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR66178_node_21は、11個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T3。以下の表474は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R66178_node_21 of the present invention is supported by 11 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R66178_T3. Table 474 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: PVR1_HUMAN

Sequence documentation:

Alignment of: R66178_P3 x PVR1_HUMAN ..

Alignment segment 1/1:

Quality: 3286.00 Escore: 0
Matching length: 334 Total length: 334
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLH 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLH 50
. . . . .
51 CSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFL 100
. . . . .
101 RPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWI 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 RPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWI 150
. . . . .
151 EGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRN 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 EGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRN 200
. . . . .
201 PNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVT 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 PNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVT 250
. . . . .
251 IEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTL 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 IEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTL 300
. . .
301 FFKGPINYSLAGTYICEATNPIGTRSGQVEVNIT 334
||||||||||||||||||||||||||||||||||
301 FFKGPINYSLAGTYICEATNPIGTRSGQVEVNIT 334






Sequence name: PVR1_HUMAN

Sequence documentation:

Alignment of: R66178_P4 x PVR1_HUMAN ..

Alignment segment 1/1:

Quality: 3294.00 Escore: 0
Matching length: 336 Total length: 336
Matching Percent Similarity: 99.70 Matching Percent Identity: 99.70
Total Percent Similarity: 99.70 Total Percent Identity: 99.70
Gaps: 0

Alignment:
. . . . .
1 MARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLH 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLH 50
. . . . .
51 CSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFL 100
. . . . .
101 RPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWI 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 RPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWI 150
. . . . .
151 EGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRN 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 EGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRN 200
. . . . .
201 PNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVT 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 PNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVT 250
. . . . .
251 IEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTL 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 IEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTL 300
. . .
301 FFKGPINYSLAGTYICEATNPIGTRSGQVEVNITAF 336
|||||||||||||||||||||||||||||||||| |
301 FFKGPINYSLAGTYICEATNPIGTRSGQVEVNITEF 336






Sequence name: PVR1_HUMAN

Sequence documentation:

Alignment of: R66178_P8 x PVR1_HUMAN ..

Alignment segment 1/1:

Quality: 3250.00 Escore: 0
Matching length: 330 Total length: 330
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLH 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLH 50
. . . . .
51 CSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFL 100
. . . . .
101 RPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWI 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 RPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWI 150
. . . . .
151 EGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRN 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 EGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRN 200
. . . . .
201 PNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVT 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 PNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVT 250
. . . . .
251 IEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTL 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 IEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTL 300
. . .
301 FFKGPINYSLAGTYICEATNPIGTRSGQVE 330
||||||||||||||||||||||||||||||
301 FFKGPINYSLAGTYICEATNPIGTRSGQVE 330



Mutated protein alignment against previously known proteins:
Sequence name: PVR1_HUMAN

Sequence documentation:

Alignment of: R66178_P3 x PVR1_HUMAN ..

Alignment segment 1/1:

Quality: 3286.00 Escore: 0
Matching length: 334 Total length: 334
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MARMGLAGA AGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLH 50
||||||||||||||||||||||||||||||||||||||||
1 MARMGLAGA AGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLH 50
....
51 CSFANPLPSVKITQVTWQKSTNGSK QNVAIYNPSMGVSLAPYRERVEFL 100
||||||||||||||||||||||||||||||||||||||||
51 CSFANPLPSVKITQVTWQKSTNGSK QNVAIYNPSMGVSLAPYRERVEFL 100
....
101 RPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWI 150
||||||||||||||||||||||||||||||||||||||||
101 RPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWI 150
....
151 EGTQAVLRAKKGQDDKVLVATCTSANGKPPSV VSWETRLKGEAEYQEIRN 200
||||||||||||||||||||||||||||||||||||||||
151 EGTQAVLRAKKGQDDKVLVATCTSANGKPPSV VSWETRLKGEAEYQEIRN 200
....
201 PNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVT 250
||||||||||||||||||||||||||||||||||||||||
201 PNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVT 250
....
251 IEGFDGNWYLQRMDV KLTCKADANPPATEEHWTTLNGSLPKGVEAQNRTL 300
||||||||||||||||||||||||||||||||||||||||
251 IEGFDGNWYLQRMDV KLTCKADANPPATEEHWTTLNGSLPKGVEAQNRTL 300
....
301 FFKPINYSLAGTYCEATNPIGTRSGQVEVNIT 334
|||||||||||||||||||||||||||||||
301 FFKPINYSLAGTYCEATNPIGTRSGQVEVNIT 334






Sequence name: PVR1_HUMAN

Sequence documentation:

Alignment of: R66178_P4 x PVR1_HUMAN ..

Alignment segment 1/1:

Quality: 3294.00 Escore: 0
Matching length: 336 Total length: 336
Matching Percent Similarity: 99.70 Matching Percent Identity: 99.70
Total Percent Similarity: 99.70 Total Percent Identity: 99.70
Gaps: 0

Alignment:
....
1 MARMGLAGA AGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLH 50
||||||||||||||||||||||||||||||||||||||||
1 MARMGLAGA AGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLH 50
....
51 CSFANPLPSVKITQVTWQKSTNGSK QNVAIYNPSMGVSLAPYRERVEFL 100
||||||||||||||||||||||||||||||||||||||||
51 CSFANPLPSVKITQVTWQKSTNGSK QNVAIYNPSMGVSLAPYRERVEFL 100
....
101 RPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWI 150
||||||||||||||||||||||||||||||||||||||||
101 RPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWI 150
....
151 EGTQAVLRAKKGQDDKVLVATCTSANGKPPSV VSWETRLKGEAEYQEIRN 200
||||||||||||||||||||||||||||||||||||||||
151 EGTQAVLRAKKGQDDKVLVATCTSANGKPPSV VSWETRLKGEAEYQEIRN 200
....
201 PNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVT 250
||||||||||||||||||||||||||||||||||||||||
201 PNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVT 250
....
251 IEGFDGNWYLQRMDV KLTCKADANPPATEEHWTTLNGSLPKGVEAQNRTL 300
||||||||||||||||||||||||||||||||||||||||
251 IEGFDGNWYLQRMDV KLTCKADANPPATEEHWTTLNGSLPKGVEAQNRTL 300
....
301 FFKPINYSLAGTYCEATNPIGTRSGQVEVNITAF 336
||||||||||||||||||||||||||||||
301 FFKPINYSLAGTYCEATNPIGTRSGQVEVNITEF 336






Sequence name: PVR1_HUMAN

Sequence documentation:

Alignment of: R66178_P8 x PVR1_HUMAN ..

Alignment segment 1/1:

Quality: 3250.00 Escore: 0
Matching length: 330 Total length: 330
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MARMGLAGA AGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLH 50
||||||||||||||||||||||||||||||||||||||||
1 MARMGLAGA AGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLH 50
....
51 CSFANPLPSVKITQVTWQKSTNGSK QNVAIYNPSMGVSLAPYRERVEFL 100
||||||||||||||||||||||||||||||||||||||||
51 CSFANPLPSVKITQVTWQKSTNGSK QNVAIYNPSMGVSLAPYRERVEFL 100
....
101 RPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWI 150
||||||||||||||||||||||||||||||||||||||||
101 RPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWI 150
....
151 EGTQAVLRAKKGQDDKVLVATCTSANGKPPSV VSWETRLKGEAEYQEIRN 200
||||||||||||||||||||||||||||||||||||||||
151 EGTQAVLRAKKGQDDKVLVATCTSANGKPPSV VSWETRLKGEAEYQEIRN 200
....
201 PNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVT 250
||||||||||||||||||||||||||||||||||||||||
201 PNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVT 250
....
251 IEGFDGNWYLQRMDV KLTCKADANPPATEEHWTTLNGSLPKGVEAQNRTL 300
||||||||||||||||||||||||||||||||||||||||
251 IEGFDGNWYLQRMDV KLTCKADANPPATEEHWTTLNGSLPKGVEAQNRTL 300
....
301 FFKPINYSLAGTYCEATNPIGTRSGQVE 330
||||||||||||||||||||||||||||
301 FFKPINYSLAGTYCEATNPIGTRSGQVE 330


クラスターHUMPHOSLIPの説明
クラスターHUMPHOSLIPは、目的の7つの転写物および53個のセグメントを特徴とし、その名称を、それぞれ表475および476に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表477に示す。
Description of cluster HUMPHOSLIP The cluster HUMPHOSLIP is characterized by 7 transcripts and 53 segments of interest, the names of which are shown in Tables 475 and 476 respectively and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 477.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるリン脂質輸送タンパク質前駆体(SwissProtアクセッション識別子PLTP_HUMAN、同義語脂質輸送タンパク質IIとしても公知である)(配列番号1433)の変異型である。   These sequences are phospholipid transfer protein precursors (SwissProt accession identifier PLTP_HUMAN, also known as synonym lipid transfer protein II), which is a known protein, which is referred to herein as a protein previously known as SEQ ID NO: 1433).

タンパク質リン脂質輸送タンパク質前駆体は、以下の機能を有することが公知であるか、そのように見なされている:HDLをより大きい粒子およびより小さい粒子に変換する。細胞外リン脂質輸送およびHDL粒子の調整で重要な役割を果たし得る。タンパク質リン脂質輸送タンパク質前駆体の配列を、「リン脂質輸送タンパク質前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表478に示す。   Protein Phospholipid Transfer Protein Precursors are known or are considered to have the following functions: Convert HDL into larger and smaller particles. It may play an important role in extracellular phospholipid transport and modulation of HDL particles. The sequence of the protein phospholipid transfer protein precursor is shown at the end of the application as "phospholipid transfer protein precursor amino acid sequence". Known polymorphisms of this sequence are shown in Table 478.

Figure 2008507261
Figure 2008507261

タンパク質リン脂質輸送タンパク質前駆体の局在化は、分泌と考えられる。   Localization of the protein phospholipid transport protein precursor is considered secretion.

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである脂質代謝、脂質輸送、分子機能に関連する注釈付けである脂質結合、細胞成分に関連する注釈付けである細胞外。   The following GO annotation applies to previously known proteins. The following annotations were found: lipid metabolism, lipid transport, annotation related to biological processes, lipid binding, annotation related to molecular function, extracellular, annotation related to cellular components .

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

このクラスターについて、少なくとも1つのオリゴヌクレオチドが、クラスターの過剰発現を証明することが見出されたが、以下に列挙した少なくとも1つの転写物/セグメントでは見出されなかった。以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。前記のように、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、肺癌に関して、このセグメントに達するが、以下の他のセグメント/転写物は達しないことが見出された(表479に示す)。   For this cluster, at least one oligonucleotide was found to demonstrate overexpression of the cluster, but not in at least one transcript / segment listed below. Microarray (chip) data for this segment is also available, as follows. As noted above, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment for lung cancer but not the other segments / transcripts below (shown in Table 479).

Figure 2008507261
Figure 2008507261

上記のように、クラスターHUMPHOSLIPは、上の表1に列挙した7つの転写物を特徴とする。これらの転写物は、タンパク質リン脂質輸送タンパク質前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, the cluster HUMPHOSLIP is characterized by the seven transcripts listed in Table 1 above. These transcripts encode proteins which are variants of the protein phospholipid transport protein precursor. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質HUMPHOSLIP_PEA_2_P10は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMPHOSLIP_PEA_2_T17によってコードされる。公知のタンパク質(リン脂質輸送タンパク質前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HUMPHOSLIP_PEA_2_P10 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HUMPHOSLIP_PEA_2_T17. An alignment to known proteins (phospholipid transfer protein precursors) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HUMPHOSLIP_PEA_2_P10とPLTP_HUMANとの間の比較の報告
1.PLTP_HUMANのアミノ酸1〜67に対応し、HUMPHOSLIP_PEA_2_P10のアミノ酸1〜67にも対応するMALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEと少なくとも90%相同な第1のアミノ酸配列と、PLTP_HUMANのアミノ酸163〜493に対応し、HUMPHOSLIP_PEA_2_P10のアミノ酸68〜398にも対応するKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLLDTVPVRSSVDELVGIDYSLMKDPVASTSNLDMDFRGAFFPLTERNWSLPNRAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLDMLLRATYFGSIVLLSPAVIDSPLKLELRVLAPPRCTIKPSGTTISVTASVTIALVPPDQPEVQLSSMTMDARLSAKMALRGKALRTQLDLRRFRIYSNHSALESLALIPLQAPLKTMLQIGVMPMLNERTWRGVQIPLPEGINFVHEVVTNHAGFLTIGADLHFAKGLREVIEKNRPADVRASTAPTPSTAAVと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMPHOSLIP_PEA_2_P10をコードする単離キメラポリペプチド。
Report of comparison between HUMPHOSLIP_PEA_2_P10 and PLTP_HUMAN 1. MALGFAL FLALLAGA EEF PG CCK IR VTS KALELE V KQ EGL L FLE EQ ELET I IT L P L DIG RG G E G F YNISE corresponding to amino acids 1 to 67 of PLTP_HUMAN and corresponding to amino acids 1 to 67 of HUMPHOSLIP_PEA_2_P10 Also corresponds to KVYDFLSTFITSGMRFLNQQICPVLYHAGTPVLLSLLDTVPVRSSVDELDESYLMKPDVASTSLDMDFRGAFFPLTERNWSLPNRAVEPQLQEEERMVYVAFSEFFDSAMESYFR GALQLLLVGDKVPHDLDMLLRATYFGSIVLLSPAVIDSPLKLELRVLAPPRCTIKPSGTTISVTASVTIALVPPDQPEVQLSSMTMDARLSAKMALRGKALRTQLDLRRFRIYSNHSALESLALIPLQAPLKTMLQIGVMPMLNERTWRGVQIPLPEGINFVHEVVTNHAGFLTIGADLHFAKGLREVIEKNRPADVRASTAPTPSTAAV and and at least 90% homologous to a second amino acid sequence, the first amino acid sequence and a second amino acid sequence, contiguous and in sequential order, the isolated chimeric polypeptide encoding HUMPHOSLIP_PEA_2_P10 .

2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がEKを含み、以下の構造:アミノ酸番号67−x〜67のいずれかから始まり、アミノ酸番号68+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HUMPHOSLIP_PEA_2_P10の縁部分をコードする単離キメラポリペプチド。   2. Length “n” (wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long, most preferably at least about 50 amino acids in length, at least two amino acids comprising EK, starting from any of the following structures: amino acid numbers 67-x to 67, amino acid numbers 68 + ((n-2) -x) (formula An isolated chimeric polypeptide encoding the edge portion of HUMPHOSLIP_PEA_2_P10, comprising a polypeptide, having a sequence terminating in:), with a sequence terminating at 0 to n-2).

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HUMPHOSLIP_PEA_2_P10はまた、表480に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P10配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMPHOSLIP_PEA_2_P10 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows the SNPs as shown in Table 480) It indicates whether it is known and the presence of a known SNP in the mutant protein HUMPHOSLIP_PEA_2_P10 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質リン脂質輸送タンパク質前駆体と比較した変異タンパク質HUMPHOSLIP_PEA_2_P10のグリコシル化部位を表481に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein HUMPHOSLIP_PEA_2_P10 compared to known protein phospholipid transfer protein precursors are shown in Table 481 (showing its position on the amino acid sequence in the first column, the second column has a glycosylation site It indicates whether it is present in the mutein and the last column shows whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質HUMPHOSLIP_PEA_2_P10は、以下の転写物によってコードされる:HUMPHOSLIP_PEA_2_T17(配列は出願書類の最後に示す)。転写物HUMPHOSLIP_PEA_2_T17のコード部分を太字で示し、このコード部分は276位から開始され、1469位で終結する。転写物はまた、表482に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P10配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMPHOSLIP_PEA_2_P10 is encoded by the following transcript: HUMPHOSLIP_PEA_2_T17 (sequences shown at the end of the application). The code portion of the transcript HUMPHOSLIP_PEA_2_T17 is shown in bold, starting from position 276 and ending at position 1469. The transcript also has the following SNPs listed in Table 482 (showing its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, the mutein HUMPHOSLIP_PEA_2_P10 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

本発明の変異タンパク質HUMPHOSLIP_PEA_2_P12は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMPHOSLIP_PEA_2_T19によってコードされる。公知のタンパク質(リン脂質輸送タンパク質前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HUMPHOSLIP_PEA_2_P12 according to the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HUMPHOSLIP_PEA_2_T19. An alignment to known proteins (phospholipid transfer protein precursors) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HUMPHOSLIP_PEA_2_P12とPLTP_HUMANとの間の比較の報告
1.PLTP_HUMANのアミノ酸1〜427に対応し、HUMPHOSLIP_PEA_2_P12のアミノ酸1〜427にも対応するMALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLRFRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASVSRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLLDTVPVRSSVDELVGIDYSLMKDPVASTSNLDMDFRGAFFPLTERNWSLPNRAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLDMLLRATYFGSIVLLSPAVIDSPLKLELRVLAPPRCTIKPSGTTISVTASVTIALVPPDQPEVQLSSMTMDARLSAKMALRGKALRTQLDLRRFRIYSNHSALESLALIPLQAPLKTMLQIGVMPMLNと少なくとも90%相同な第1のアミノ酸配列と、HUMPHOSLIP_PEA_2_P12のアミノ酸428〜432に対応する配列GKAGVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMPHOSLIP_PEA_2_P12をコードする単離キメラポリペプチド。
Report of comparison between HUMPHOSLIP_PEA_2_P12 and PLTP_HUMAN 1. Corresponding to amino acids 1 to 427 of PLTP_HUMAN, corresponding to amino acids 1 to 427 of HUMPHOSLIP_PEA_2_P12 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLRFRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASVSRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLLDTVPVRSSVDELVGIDYSLMKDPVASTSNLDMDFRGAFFPLTERNWSLPNRAVEPQLQEEERMVYVAFSEFF DSAMESYFRAGALQLLLVGDKVPHDLML LYFTYFLSIFLLSPA DSPSL KLELRAPPCTIKPSGTTISV TASVPIALVP PDQPEVQLSSMTMDARLSAKMALRG KALRT QL DRRI RISN HSL ASL SL PL Q PL M PL M is a 7-port metal sheet and a metal sheet Comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first amino acid sequence and 2 amino acid sequences, contiguous and in sequential order, the isolated chimeric polypeptide coding HUMPHOSLIP_PEA_2_P12.

2.HUMPHOSLIP_PEA_2_P12中の配列GKAGVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMPHOSLIP_PEA_2_P12のテールをコードする単離ポリペプチド。   2. Of HUMPHOSLIP_PEA_2_P12 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence GKAGV in HUMPHOSLIP_PEA_2_P12 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HUMPHOSLIP_PEA_2_P12はまた、表483に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P12配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMPHOSLIP_PEA_2_P12 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, enumerating other amino acids, and the last column shows SNPs as shown in Table 483) It indicates whether it is known and the presence of a known SNP in the mutant protein HUMPHOSLIP_PEA_2_P12 sequence supports the deduced sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質リン脂質輸送タンパク質前駆体と比較した変異タンパク質HUMPHOSLIP_PEA_2_P12のグリコシル化部位を表484に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein HUMPHOSLIP_PEA_2_P12 compared to known protein phospholipid transfer protein precursors are shown in Table 484 (showing its position on the amino acid sequence in the first column, the second column has glycosylation sites It indicates whether it is present in the mutein and the last column shows whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質HUMPHOSLIP_PEA_2_P12は、以下の転写物によってコードされる:HUMPHOSLIP_PEA_2_T19(配列は出願書類の最後に示す)。転写物HUMPHOSLIP_PEA_2_T19のコード部分を太字で示し、このコード部分は276位から開始され、1571位で終結する。転写物はまた、表485に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P12配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMPHOSLIP_PEA_2_P12 is encoded by the following transcript: HUMPHOSLIP_PEA_2_T19 (sequences shown at the end of the application). The code portion of the transcript HUMPHOSLIP_PEA_2_T19 is shown in bold, starting from position 276 and ending at position 1571. The transcript also has the following SNPs listed in Table 485 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, the mutein HUMPHOSLIP_PEA_2_P12 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

本発明の変異タンパク質HUMPHOSLIP_PEA_2_P30は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMPHOSLIP_PEA_2_T6によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The mutein HUMPHOSLIP_PEA_2_P30 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HUMPHOSLIP_PEA_2_T6. The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HUMPHOSLIP_PEA_2_P30はまた、表486に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P30配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMPHOSLIP_PEA_2_P30 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows the SNPs as shown in Table 486) It indicates whether it is known and the presence of a known SNP in the mutant protein HUMPHOSLIP_PEA_2_P30 sequence supports the predicted sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質HUMPHOSLIP_PEA_2_P30は、以下の転写物によってコードされる:HUMPHOSLIP_PEA_2_T6(配列は出願書類の最後に示す)。転写物HUMPHOSLIP_PEA_2_T6のコード部分を太字で示し、このコード部分は276位から開始され、431位で終結する。転写物はまた、表487に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P30配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMPHOSLIP_PEA_2_P30 is encoded by the following transcript: HUMPHOSLIP_PEA_2_T6 (sequences shown at the end of the application). The code portion of the transcript HUMPHOSLIP_PEA_2_T6 is shown in bold, starting from position 276 and ending at position 431. The transcript also has the following SNPs listed in Table 487 (indicating its position on the nucleotide sequence and listing another nucleic acid, the last column indicates whether the SNP is known, the mutein HUMPHOSLIP_PEA_2_P30 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

本発明の変異タンパク質HUMPHOSLIP_PEA_2_P31は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMPHOSLIP_PEA_2_T7によってコードされる。公知のタンパク質(リン脂質輸送タンパク質前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HUMPHOSLIP_PEA_2_P31 of the present invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HUMPHOSLIP_PEA_2_T7. An alignment to known proteins (phospholipid transfer protein precursors) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HUMPHOSLIP_PEA_2_P31とPLTP_HUMANとの間の比較の報告
1.PLTP_HUMANのアミノ酸1〜67に対応し、HUMPHOSLIP_PEA_2_P31のアミノ酸1〜67にも対応するMALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEと少なくとも90%相同な第1のアミノ酸配列と、HUMPHOSLIP_PEA_2_P31のアミノ酸68〜98に対応する配列PGLERGADKFPVVGGSSLFLALDLTLRPPVGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMPHOSLIP_PEA_2_P31をコードする単離キメラポリペプチド。
Report of comparison between HUMPHOSLIP_PEA_2_P31 and PLTP_HUMAN 1. MALGFAL FLALLAGA EEF PG CCK IR VTS ALELE V KQ EGLR LLEQ ELET I TIP L G RG G E G YY HJ corresponding to amino acids 1 to 67 of PLTP_HUMAN and corresponding to amino acids 1 to 67 of HUMPHOSL_PEA_2_P 31 Said second amino acid sequence comprising a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; Ami of 2 Acid sequence, contiguous and in sequential order, the isolated chimeric polypeptide coding HUMPHOSLIP_PEA_2_P31.

2.HUMPHOSLIP_PEA_2_P31中の配列PGLERGADKFPVVGGSSLFLALDLTLRPPVGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMPHOSLIP_PEA_2_P31のテールをコードする単離ポリペプチド。   2. HUMPHOSLIP_PEA_2_P31 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence PGLERGADKFPVVGGSLSLALDLTLP PVG in An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HUMPHOSLIP_PEA_2_P31はまた、表488に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P31配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMPHOSLIP_PEA_2_P31 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, enumerating other amino acids, and the last column shows SNPs as shown in Table 488) It indicates whether it is known and the presence of a known SNP in the mutant protein HUMPHOSLIP_PEA_2_P31 sequence supports the deduced sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質リン脂質輸送タンパク質前駆体と比較した変異タンパク質HUMPHOSLIP_PEA_2_P31のグリコシル化部位を表489に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of mutant protein HUMPHOSLIP_PEA_2_P31 compared to known protein phospholipid transfer protein precursors are shown in Table 489 (showing its position on the amino acid sequence in the first column, the second column has glycosylation sites It indicates whether it is present in the mutein and the last column shows whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質HUMPHOSLIP_PEA_2_P31は、以下の転写物によってコードされる:HUMPHOSLIP_PEA_2_T7(配列は出願書類の最後に示す)。転写物HUMPHOSLIP_PEA_2_T7のコード部分を太字で示し、このコード部分は276位から開始され、569位で終結する。転写物はまた、表490に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P31配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMPHOSLIP_PEA_2_P31 is encoded by the following transcript: HUMPHOSLIP_PEA_2_T7 (sequences shown at the end of the application). The code portion of the transcript HUMPHOSLIP_PEA_2_T7 is shown in bold, starting from position 276 and ending at position 569. The transcript also has the following SNPs listed in Table 490 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, the mutein HUMPHOSLIP_PEA_2_P31 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

本発明の変異タンパク質HUMPHOSLIP_PEA_2_P33は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMPHOSLIP_PEA_2_T14によってコードされる。公知のタンパク質(リン脂質輸送タンパク質前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HUMPHOSLIP_PEA_2_P33 of the present invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HUMPHOSLIP_PEA_2_T14. An alignment to known proteins (phospholipid transfer protein precursors) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HUMPHOSLIP_PEA_2_P33とPLTP_HUMANとの間の比較の報告
1.PLTP_HUMANのアミノ酸1〜183に対応し、HUMPHOSLIP_PEA_2_P33のアミノ酸1〜183にも対応するMALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLRFRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASVSRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQと少なくとも90%相同な第1のアミノ酸配列と、HUMPHOSLIP_PEA_2_P33のアミノ酸184〜200に対応する配列VWAATGRRVARVGMLSLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMPHOSLIP_PEA_2_P33をコードする単離キメラポリペプチド。
Report of comparison between HUMPHOSLIP_PEA_2_P33 and PLTP_HUMAN 1. Corresponding to amino acids 1-183 of PLTP_HUMAN, the polypeptide having a MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLRFRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASVSRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQ corresponding to amino acids 1-183 of HUMPHOSLIP_PEA_2_P33 the first amino acid sequence at least 90% homologous, sequences corresponding to VWAATGRRVARVGMLSL to amino acid 184-200 of HUMPHOSLIP_PEA_2_P33 Said second amino acid sequence comprising a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; An isolated chimeric polypeptide encoding HUMPHOSLIP_PEA_2_P33, wherein the two amino acid sequences are in contiguous and sequential order.

2.HUMPHOSLIP_PEA_2_P33中の配列VWAATGRRVARVGMLSLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMPHOSLIP_PEA_2_P33のテールをコードする単離ポリペプチド。   2. HUMPHOSLIP_PEA_2_P33 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence VWAATGRRVARVGMLSL in HUMPHOSLIP_PEA_2_P33 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HUMPHOSLIP_PEA_2_P33はまた、表491に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P33配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMPHOSLIP_PEA_2_P33 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows the SNPs, as shown in Table 491) It indicates whether it is known and the presence of a known SNP in the mutant protein HUMPHOSLIP_PEA_2_P33 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質リン脂質輸送タンパク質前駆体と比較した変異タンパク質HUMPHOSLIP_PEA_2_P33のグリコシル化部位を表492に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein HUMPHOSLIP_PEA_2_P33 compared to known protein phospholipid transfer protein precursors are shown in Table 492 (showing its position on the amino acid sequence in the first column, the second column has glycosylation sites It indicates whether it is present in the mutein and the last column shows whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質HUMPHOSLIP_PEA_2_P33は、以下の転写物によってコードされる:HUMPHOSLIP_PEA_2_T14(配列は出願書類の最後に示す)。転写物HUMPHOSLIP_PEA_2_T14のコード部分を太字で示し、このコード部分は276位から開始され、875位で終結する。転写物はまた、表493に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P33配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMPHOSLIP_PEA_2_P33 is encoded by the following transcript: HUMPHOSLIP_PEA_2_T14 (sequences shown at the end of the application). The code portion of the transcript HUMPHOSLIP_PEA_2_T14 is shown in bold, starting from position 276 and ending at position 875. The transcript also has the following SNPs listed in Table 493 (showing its position on the nucleotide sequence and listing another nucleic acid, the last column shows if the SNP is known, the mutein HUMPHOSLIP_PEA_2_P33 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

本発明の変異タンパク質HUMPHOSLIP_PEA_2_P34は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMPHOSLIP_PEA_2_T16によってコードされる。公知のタンパク質(リン脂質輸送タンパク質前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HUMPHOSLIP_PEA_2_P34 according to the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HUMPHOSLIP_PEA_2_T16. An alignment to known proteins (phospholipid transfer protein precursors) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HUMPHOSLIP_PEA_2_P34とPLTP_HUMANとの間の比較の報告
1.PLTP_HUMANのアミノ酸1〜205に対応し、HUMPHOSLIP_PEA_2_P34のアミノ酸1〜205にも対応するMALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLRFRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASVSRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLLDTVPVと少なくとも90%相同な第1のアミノ酸配列と、HUMPHOSLIP_PEA_2_P34のアミノ酸206〜217に対応する配列LWTSLLALTIPSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMPHOSLIP_PEA_2_P34をコードする単離キメラポリペプチド。
Report of comparison between HUMPHOSLIP_PEA_2_P34 and PLTP_HUMAN 1. Corresponding to amino acids 1-205 of PLTP_HUMAN, first amino acid sequence at least 90% homologous to the corresponding MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLRFRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASVSRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLLDTVPV to amino acids 1-205 of HUMPHOSLIP_PEA_2_P34, corresponding to amino acids 206-217 of HUMPHOSLIP_PEA_2_P34 sequence LWTSL A polypeptide having ALTIPS and a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; An isolated chimeric polypeptide encoding HUMPHOSLIP_PEA_2_P34, wherein the amino acid sequence of 1 and the second amino acid sequence are adjacent and in sequential order.

2.HUMPHOSLIP_PEA_2_P34中の配列LWTSLLALTIPSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMPHOSLIP_PEA_2_P34のテールをコードする単離ポリペプチド。   2. HUMPHOSLIP_PEA_2_P34 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence LWTSLLALTIPS in HUMPHOSLIP_PEA_2_P34 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HUMPHOSLIP_PEA_2_P34はまた、表494に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P34配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMPHOSLIP_PEA_2_P34 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows the SNPs as shown in Table 494) It indicates whether it is known and the presence of a known SNP in the mutant protein HUMPHOSLIP_PEA_2_P34 sequence supports the deduced sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質リン脂質輸送タンパク質前駆体と比較した変異タンパク質HUMPHOSLIP_PEA_2_P34のグリコシル化部位を表495に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of mutant protein HUMPHOSLIP_PEA_2_P34 compared to known protein phospholipid transfer protein precursors are shown in Table 495 (showing its position on the amino acid sequence in the first column, the second column has glycosylation sites It indicates whether it is present in the mutein and the last column shows whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質HUMPHOSLIP_PEA_2_P34は、以下の転写物によってコードされる:HUMPHOSLIP_PEA_2_T16(配列は出願書類の最後に示す)。転写物HUMPHOSLIP_PEA_2_T16のコード部分を太字で示し、このコード部分は276位から開始され、926位で終結する。転写物はまた、表496に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P34配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMPHOSLIP_PEA_2_P34 is encoded by the following transcript: HUMPHOSLIP_PEA_2_T16 (sequences shown at the end of the application). The code portion of the transcript HUMPHOSLIP_PEA_2_T16 is shown in bold, starting from position 276 and ending at position 926. The transcript also has the following SNPs listed in Table 496 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, the mutein HUMPHOSLIP_PEA_2_P34 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

本発明の変異タンパク質HUMPHOSLIP_PEA_2_P35は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMPHOSLIP_PEA_2_T18によってコードされる。公知のタンパク質(リン脂質輸送タンパク質前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HUMPHOSLIP_PEA_2_P35 according to the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HUMPHOSLIP_PEA_2_T18. An alignment to known proteins (phospholipid transfer protein precursors) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HUMPHOSLIP_PEA_2_P35とPLTP_HUMANとの間の比較の報告
1.PLTP_HUMANのアミノ酸1〜109に対応し、HUMPHOSLIP_PEA_2_P35のアミノ酸1〜109にも対応するMALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLRFRRQLLYWFと少なくとも90%相同な第1のアミノ酸配列と、Lを含むアミノ酸配列を架橋する第2のアミノ酸配列と、PLTP_HUMANのアミノ酸163〜183に対応し、HUMPHOSLIP_PEA_2_P35のアミノ酸111〜131にも対応するKVYDFLSTFITSGMRFLLNQQと少なくとも90%相同な第3のアミノ酸配列と、HUMPHOSLIP_PEA_2_P35のアミノ酸132〜148に対応する配列VWAATGRRVARVGMLSLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第4のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、第3のアミノ酸配列、および第4のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMPHOSLIP_PEA_2_P35をコードする単離キメラポリペプチド。
Report on comparison between HUMPHOSLIP_PEA_2_P35 and PLTP_HUMAN 1. MALFFAL FLH meeting at least 90% of the amino acid sequence A third amino acid sequence which is at least 90% homologous to KVYDFLSTFITSGMFRNLQQ, which corresponds to amino acids 163 to 183 of and also to amino acids 111 to 131 of HUMPHOSLIP_PEA_2_P35, and HUMPH At least 70%, optionally at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 90%, most preferably at least 95% homologous to a polypeptide having the sequence VWAATGRRVARVGMLSL corresponding to amino acids 132 to 148 of SLIP_PEA_2_P35 A single HMPHOSLIP_PEA_2_P35 encoding comprising the four amino acid sequences, wherein said first amino acid sequence, second amino acid sequence, third amino acid sequence and fourth amino acid sequence are adjacent and in sequential order Detached chimeric polypeptide.

2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がFLKを含み、以下の構造(HUMPHOSLIP_PEA_2_P35に対応する番号付け):アミノ酸番号109−x〜109のいずれかから始まり、アミノ酸番号111+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HUMPHOSLIP_PEA_2_P35の縁部分をコードする単離キメラポリペプチド。   2. Length “n” (wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long, most preferably at least about Having the length of 50 amino acids, at least two amino acids comprising FLK and having the following structure (numbering corresponding to HUMPHOSLIP_PEA_2_P35): starting from any of amino acids 109-x to 109, amino acids 111+ ((n -2)-x) An isolated chimeric polypeptide encoding the edge portion of HUMPHOSLIP_PEA_2_P35, comprising a polypeptide, having a sequence terminating at: where x varies from 0 to n-2.

3.HUMPHOSLIP_PEA_2_P35中の配列VWAATGRRVARVGMLSLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMPHOSLIP_PEA_2_P35のテールをコードする単離ポリペプチド。   3. HUMPHOSLIP_PEA_2_P35 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence VWAATGRRVARVGMLSL in HUMPHOSLIP_PEA_2_P35 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HUMPHOSLIP_PEA_2_P35はまた、表497に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P35配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMPHOSLIP_PEA_2_P35 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows the SNP as shown in Table 497) It indicates whether it is known and the presence of a known SNP in the mutant protein HUMPHOSLIP_PEA_2_P35 sequence supports the deduced sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質リン脂質輸送タンパク質前駆体と比較した変異タンパク質HUMPHOSLIP_PEA_2_P35のグリコシル化部位を表498に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein HUMPHOSLIP_PEA_2_P35 compared to known protein phospholipid transfer protein precursors are shown in Table 498 (showing its position on the amino acid sequence in the first column, the second column has glycosylation sites It indicates whether it is present in the mutein and the last column shows whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質HUMPHOSLIP_PEA_2_P35は、以下の転写物によってコードされる:HUMPHOSLIP_PEA_2_T18(配列は出願書類の最後に示す)。転写物HUMPHOSLIP_PEA_2_T18のコード部分を太字で示し、このコード部分は276位から開始され、719位で終結する。転写物はまた、表499に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P35配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMPHOSLIP_PEA_2_P35 is encoded by the following transcript: HUMPHOSLIP_PEA_2_T18 (sequences shown at the end of the application). The code portion of the transcript HUMPHOSLIP_PEA_2_T18 is shown in bold, starting from position 276 and ending at position 719. The transcript also has the following SNPs listed in Table 499 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, the mutein HUMPHOSLIP_PEA_2_P35 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

上記のように、クラスターHUMPHOSLIPは、上の表2に列挙した53個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, the cluster HUMPHOSLIP is characterized by the 53 segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_0は、150個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表500は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_0 of the present invention is supported by 150 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 500 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_19は、186個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、およびHUMPHOSLIP_PEA_2_T19。以下の表501は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_19 of the present invention is supported by 186 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, and HUMPHOSLIP_PEA_2_T19. Table 501 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_34は、191個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表502は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_34 of the present invention is supported by 191 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 502 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_68は、131個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表503は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_68 of the present invention is supported by 131 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 503 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_70は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表504は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_70 of the present invention is supported by 5 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 504 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_75は、14個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表505は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_75 of the present invention is supported by 14 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 505 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_2は、159個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表506は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_2 of the present invention is supported by 159 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 506 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_3を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表507は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_3 according to the invention can be found in the following transcripts: HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T14, Table 507 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_4を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表508は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_4 according to the invention can be found in the following transcripts: HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T17_E, and Table 508 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_6を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表509は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_6 according to the invention can be found in the following transcripts: HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T17_E. Table 509 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node7を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表510は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node7 according to the invention can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17_HITH Table 510 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_08、171個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表511は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   Segment cluster HUMPHOSLIP_PEA_2_node_08 of the present invention, supported by 171 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 511 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_9は、168個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表512は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_9 of the present invention is supported by 168 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 512 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_14は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T7。以下の表513は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_14 of the present invention is supported by six libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMPHOSLIP_PEA_2_T7. Table 513 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_15を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表514は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_15 according to the invention can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T4_T_14. Table 514 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_16は、179個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表515は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_16 of the present invention is supported by 179 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T18, and HUMPHOSLIP_PEA_2_T19. Table 515 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_17を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表516は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_17 according to the invention can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T4_T_14. Table 516 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_23は、168個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表517は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_23 of the present invention is supported by 168 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 517 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_24を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表518は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_24 according to the invention can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T 、 、 Table 518 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_25は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T14およびHUMPHOSLIP_PEA_2_T18。以下の表519は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_25 of the present invention is supported by 5 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMPHOSLIP_PEA_2_T14 and HUMPHOSLIP_PEA_2_T18. Table 519 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_26は、163個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表520は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_26 of the present invention is supported by 163 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 520 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_2を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表521は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_2 according to the invention can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T14, Table 521 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_30は、181個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表522は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_30 of the present invention is supported by 181 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 522 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_33は、173個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表523は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_33 of the present invention is supported by 173 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 523 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_36は、163個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表524は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_36 of the present invention is supported by 163 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 524 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_37を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表525は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_37 according to the invention can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T UT Table 525 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_39は、166個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表525は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_39 of the present invention is supported by 166 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 525 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_40は、199個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表526は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_40 of the present invention is supported by 199 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 526 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_41は、186個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表527は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_41 of the present invention is supported by 186 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 527 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_42を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表528は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_42 according to the invention can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T4 Table 528 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_44は、185個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表529は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_44 of the present invention is supported by 185 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 529 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_45は、197個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表530は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_45 of the present invention is supported by 197 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 530 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_47は、223個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表531は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_47 of the present invention is supported by 223 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 531 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_51を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表532は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_51 of the present invention can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T 、 、 Table 532 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_52は、235個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表533は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_52 of the present invention is supported by 235 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 533 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_53は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T19。以下の表534は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_53 of the present invention is supported by 5 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMPHOSLIP_PEA_2_T19. Table 534 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_54は、236個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表535は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_54 of the present invention is supported by 236 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 535 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_55は、232個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表536は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_55 of the present invention is supported by 232 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 536 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_58を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表537は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_58 of the present invention can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T 、 、 Table 537 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_59は、230個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表538は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_59 of the present invention is supported by 230 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 538 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_60を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表539は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_60 according to the invention can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T 、 Table 539 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_61を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表540は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_61 according to the invention can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T UT Table 540 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_62を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表541は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_62 according to the invention can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T 、 Table 541 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_63を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表542は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_63 according to the invention can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T 、 HO Table 542 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_64を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表543は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_64 according to the invention can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T UT Table 543 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_65を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表544は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_65 according to the invention can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T 、 、 Table 544 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_66は、180個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表545は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_66 of the present invention is supported by 180 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 545 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_67を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表546は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_67 according to the invention can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T UT 、 Table 546 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_69を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表547は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_69 according to the invention can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T UT Table 547 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_71を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表548は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_71 according to the invention can be found in the following transcripts: Table 548 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_72は、7個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表549は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_72 of the present invention is supported by seven libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 549 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_73は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表550は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_73 of the present invention is supported by 5 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 550 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_74は、10個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表551は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMPHOSLIP_PEA_2_node_74 of the present invention is supported by 10 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMPHOSLIP_PEA_2_T6, HUMPHOSLIP_PEA_2_T7, HUMPHOSLIP_PEA_2_T14, HUMPHOSLIP_PEA_2_T16, HUMPHOSLIP_PEA_2_T17, HUMPHOSLIP_PEA_2_T18, and HUMPHOSTI. Table 551 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: PLTP_HUMAN

Sequence documentation:

Alignment of: HUMPHOSLIP_PEA_2_P10 x PLTP_HUMAN ..

Alignment segment 1/1:

Quality: 3716.00 Escore: 0
Matching length: 398 Total length: 493
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 80.73 Total Percent Identity: 80.73
Gaps: 1

Alignment:
. . . . .
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
. . . . .
51 IPDLRGKEGHFYYNISE................................. 67
|||||||||||||||||
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
. . . . .
67 .................................................. 67

101 FRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASV 150
. . . . .
68 ............KVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLL 105
||||||||||||||||||||||||||||||||||||||
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLL 200
. . . . .
106 DTVPVRSSVDELVGIDYSLMKDPVASTSNLDMDFRGAFFPLTERNWSLPN 155
||||||||||||||||||||||||||||||||||||||||||||||||||
201 DTVPVRSSVDELVGIDYSLMKDPVASTSNLDMDFRGAFFPLTERNWSLPN 250
. . . . .
156 RAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLD 205
||||||||||||||||||||||||||||||||||||||||||||||||||
251 RAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLD 300
. . . . .
206 MLLRATYFGSIVLLSPAVIDSPLKLELRVLAPPRCTIKPSGTTISVTASV 255
||||||||||||||||||||||||||||||||||||||||||||||||||
301 MLLRATYFGSIVLLSPAVIDSPLKLELRVLAPPRCTIKPSGTTISVTASV 350
. . . . .
256 TIALVPPDQPEVQLSSMTMDARLSAKMALRGKALRTQLDLRRFRIYSNHS 305
||||||||||||||||||||||||||||||||||||||||||||||||||
351 TIALVPPDQPEVQLSSMTMDARLSAKMALRGKALRTQLDLRRFRIYSNHS 400
. . . . .
306 ALESLALIPLQAPLKTMLQIGVMPMLNERTWRGVQIPLPEGINFVHEVVT 355
||||||||||||||||||||||||||||||||||||||||||||||||||
401 ALESLALIPLQAPLKTMLQIGVMPMLNERTWRGVQIPLPEGINFVHEVVT 450
. . . .
356 NHAGFLTIGADLHFAKGLREVIEKNRPADVRASTAPTPSTAAV 398
|||||||||||||||||||||||||||||||||||||||||||
451 NHAGFLTIGADLHFAKGLREVIEKNRPADVRASTAPTPSTAAV 493






Sequence name: PLTP_HUMAN

Sequence documentation:

Alignment of: HUMPHOSLIP_PEA_2_P12 x PLTP_HUMAN ..

Alignment segment 1/1:

Quality: 4101.00 Escore: 0
Matching length: 427 Total length: 427
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
. . . . .
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
. . . . .
101 FRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASV 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 FRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASV 150
. . . . .
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLL 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLL 200
. . . . .
201 DTVPVRSSVDELVGIDYSLMKDPVASTSNLDMDFRGAFFPLTERNWSLPN 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 DTVPVRSSVDELVGIDYSLMKDPVASTSNLDMDFRGAFFPLTERNWSLPN 250
. . . . .
251 RAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLD 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 RAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLD 300
. . . . .
301 MLLRATYFGSIVLLSPAVIDSPLKLELRVLAPPRCTIKPSGTTISVTASV 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 MLLRATYFGSIVLLSPAVIDSPLKLELRVLAPPRCTIKPSGTTISVTASV 350
. . . . .
351 TIALVPPDQPEVQLSSMTMDARLSAKMALRGKALRTQLDLRRFRIYSNHS 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 TIALVPPDQPEVQLSSMTMDARLSAKMALRGKALRTQLDLRRFRIYSNHS 400
. .
401 ALESLALIPLQAPLKTMLQIGVMPMLN 427
|||||||||||||||||||||||||||
401 ALESLALIPLQAPLKTMLQIGVMPMLN 427






Sequence name: PLTP_HUMAN

Sequence documentation:

Alignment of: HUMPHOSLIP_PEA_2_P31 x PLTP_HUMAN ..

Alignment segment 1/1:

Quality: 639.00 Escore: 0
Matching length: 67 Total length: 67
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
.
51 IPDLRGKEGHFYYNISE 67
|||||||||||||||||
51 IPDLRGKEGHFYYNISE 67






Sequence name: PLTP_HUMAN

Sequence documentation:

Alignment of: HUMPHOSLIP_PEA_2_P33 x PLTP_HUMAN ..

Alignment segment 1/1:

Quality: 1767.00 Escore: 0
Matching length: 184 Total length: 184
Matching Percent Similarity: 100.00 Matching Percent Identity: 99.46
Total Percent Similarity: 100.00 Total Percent Identity: 99.46
Gaps: 0

Alignment:
. . . . .
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
. . . . .
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
. . . . .
101 FRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASV 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 FRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASV 150
. . .
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQV 184
|||||||||||||||||||||||||||||||||:
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQI 184






Sequence name: PLTP_HUMAN

Sequence documentation:

Alignment of: HUMPHOSLIP_PEA_2_P34 x PLTP_HUMAN ..

Alignment segment 1/1:

Quality: 1971.00 Escore: 0
Matching length: 205 Total length: 205
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
. . . . .
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
. . . . .
101 FRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASV 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 FRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASV 150
. . . . .
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLL 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLL 200

201 DTVPV 205
|||||
201 DTVPV 205






Sequence name: PLTP_HUMAN

Sequence documentation:

Alignment of: HUMPHOSLIP_PEA_2_P35 x PLTP_HUMAN ..

Alignment segment 1/1:

Quality: 1158.00 Escore: 0
Matching length: 132 Total length: 184
Matching Percent Similarity: 100.00 Matching Percent Identity: 98.48
Total Percent Similarity: 71.74 Total Percent Identity: 70.65
Gaps: 1

Alignment:
. . . . .
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
. . . . .
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
. . . . .
101 FRRQLLYWFL........................................ 110
|||||||||:
101 FRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASV 150
. . .
111 ............KVYDFLSTFITSGMRFLLNQQV 132
|||||||||||||||||||||:
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQI 184






Mutated protein alignment against previously known proteins:
Sequence name: PLTP_HUMAN

Sequence documentation:

Alignment of: HUMPHOSLIP_PEA_2_P10 x PLTP_HUMAN ..

Alignment segment 1/1:

Quality: 3716.00 Escore: 0
Matching length: 398 Total length: 493
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 80.73 Total Percent Identity: 80.73
Gaps: 1

Alignment:
....
1 MALFGALFALLAGAHAEFPGCKIRVTSKALEVKQEGLRFLEQELETIT 50
||||||||||||||||||||||||||||||||||||||||
1 MALFGALFALLAGAHAEFPGCKIRVTSKALEVKQEGLRFLEQELETIT 50
....
51 IPDLRGKEGHFYYNISE ......................................... 67
||||||||||||||||
51 IPDLRGKEGYYNISEEVKVTELQLTSSELDFQPQELMLQITNASLGLR 100
....
67 ...................................................... . 67

101 FRRQLLYWFFYDGGYINASAEGVSTIRTGLELSRDPAGRMK VSNVSCQASV 150
....
68 ............ KVYDFLSTF ITGMMRFLNQQICPVLYHAGTVLLNSLL 105
|||||||||||||||||||||||||||||||||||
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLNQQICPVLYHAGTVLLNSLL 200
....
106 DTVPVRSSVDELVGIDYSLKMPDVASTSLNDLMGAFFPLTERNWSLPN 155
||||||||||||||||||||||||||||||||||||||||
201 DTVPVRSSVDELVGIDYSLKMPDVASSTNLDMDFRGAFFPLTERNWSLPN 250
....
156 RAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLD 205
||||||||||||||||||||||||||||||||||||||||
251 RAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLD 300
....
206 MLLRATYFGSIVLLSPAVIDSPLKLELLRVLAPPRCTIKPSGTTISV TASV 255
||||||||||||||||||||||||||||||||||||||||
301 MLLRATYFGSIVLLSPAVIDSPLKLELLVLAPPRCTIKPSGTTISVTASV 350
....
256 TIALVPPDQPEVQLSSMTMDARLSAKMALRGKALRTQLDLRRFRIYSNHS 305
||||||||||||||||||||||||||||||||||||||||
351 TIALVPPDQPEVQLSSMTM DARLSAKMALRGKALRTQLDLRRFRIYSNHS 400
....
306 ALESLALIPLQAPLKTMLQIGVMPMLNERTWRGVQIPLPEGINFVHEVVT 355
||||||||||||||||||||||||||||||||||||||||
401 ALESLALIPLQAPLKTMLQIGVMPMLNERTWRGVQIPLPEGINFVHEVVT 450
....
356 NHAGFLTIGADLHFAKGLREVIEKNRPADVRASTAPTPSTAAV 398
|||||||||||||||||||||||||||||||||||||
451 NHAGFLTIGADLHFAKGLREVIEKNRPADVRASTAPTPSTAAV 493






Sequence name: PLTP_HUMAN

Sequence documentation:

Alignment of: HUMPHOSLIP_PEA_2_P12 x PLTP_HUMAN ..

Alignment segment 1/1:

Quality: 4101.00 Escore: 0
Matching length: 427 Total length: 427
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MALFGALFALLAGAHAEFPGCKIRVTSKALEVKQEGLRFLEQELETIT 50
||||||||||||||||||||||||||||||||||||||||
1 MALFGALFALLAGAHAEFPGCKIRVTSKALEVKQEGLRFLEQELETIT 50
....
51 IPDLRGKEGYYNISEEVKVTELQLTSSELDFQPQELMLQITNASLGLR 100
||||||||||||||||||||||||||||||||||||||||
51 IPDLRGKEGYYNISEEVKVTELQLTSSELDFQPQELMLQITNASLGLR 100
....
101 FRRQLLYWFFYDGGYINASAEGVSTIRTGLELSRDPAGRMK VSNVSCQASV 150
||||||||||||||||||||||||||||||||||||||||
101 FRRQLLYWFFYDGGYINASAEGVSTIRTGLELSRDPAGRMK VSNVSCQASV 150
....
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLNQQICPVLYHAGTVLLNSLL 200
||||||||||||||||||||||||||||||||||||||||
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLNQQICPVLYHAGTVLLNSLL 200
....
201 DTVPVRSSVDELVGIDYSLKMPDVASSTNLDMDFRGAFFPLTERNWSLPN 250
||||||||||||||||||||||||||||||||||||||||
201 DTVPVRSSVDELVGIDYSLKMPDVASSTNLDMDFRGAFFPLTERNWSLPN 250
....
251 RAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLD 300
||||||||||||||||||||||||||||||||||||||||
251 RAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLD 300
....
301 MLLRATYFGSIVLLSPAVIDSPLKLELLVLAPPRCTIKPSGTTISVTASV 350
||||||||||||||||||||||||||||||||||||||||
301 MLLRATYFGSIVLLSPAVIDSPLKLELLVLAPPRCTIKPSGTTISVTASV 350
....
351 TIALVPPDQPEVQLSSMTM DARLSAKMALRGKALRTQLDLRRFRIYSNHS 400
||||||||||||||||||||||||||||||||||||||||
351 TIALVPPDQPEVQLSSMTM DARLSAKMALRGKALRTQLDLRRFRIYSNHS 400
.
401 ALESLALIPLQAPLKTMLQIGVMPMLN 427
|||||||||||||||||||||||||
401 ALESLALIPLQAPLKTMLQIGVMPMLN 427






Sequence name: PLTP_HUMAN

Sequence documentation:

Alignment of: HUMPHOSLIP_PEA_2_P31 x PLTP_HUMAN ..

Alignment segment 1/1:

Quality: 639.00 Escore: 0
Matching length: 67 Total length: 67
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MALFGALFALLAGAHAEFPGCKIRVTSKALEVKQEGLRFLEQELETIT 50
||||||||||||||||||||||||||||||||||||||||
1 MALFGALFALLAGAHAEFPGCKIRVTSKALEVKQEGLRFLEQELETIT 50
.
51 IPDLRGKEGHFYYNISE 67
||||||||||||||||
51 IPDLRGKEGHFYYNISE 67






Sequence name: PLTP_HUMAN

Sequence documentation:

Alignment of: HUMPHOSLIP_PEA_2_P33 x PLTP_HUMAN ..

Alignment segment 1/1:

Quality: 1767.00 Escore: 0
Matching length: 184 Total length: 184
Matching Percent Similarity: 100.00 Matching Percent Identity: 99.46
Total Percent Similarity: 100.00 Total Percent Identity: 99.46
Gaps: 0

Alignment:
....
1 MALFGALFALLAGAHAEFPGCKIRVTSKALEVKQEGLRFLEQELETIT 50
||||||||||||||||||||||||||||||||||||||||
1 MALFGALFALLAGAHAEFPGCKIRVTSKALEVKQEGLRFLEQELETIT 50
....
51 IPDLRGKEGYYNISEEVKVTELQLTSSELDFQPQELMLQITNASLGLR 100
||||||||||||||||||||||||||||||||||||||||
51 IPDLRGKEGYYNISEEVKVTELQLTSSELDFQPQELMLQITNASLGLR 100
....
101 FRRQLLYWFFYDGGYINASAEGVSTIRTGLELSRDPAGRMK VSNVSCQASV 150
||||||||||||||||||||||||||||||||||||||||
101 FRRQLLYWFFYDGGYINASAEGVSTIRTGLELSRDPAGRMK VSNVSCQASV 150
....
151 SRMHAAFGGTFKKVYDFLSTFITSMRFLNQQV 184
|||||||||||||||||||||||||||: |
151 SRMHAAFGGTFKKVYDFLSTFITSMRFLNQQI 184






Sequence name: PLTP_HUMAN

Sequence documentation:

Alignment of: HUMPHOSLIP_PEA_2_P34 x PLTP_HUMAN ..

Alignment segment 1/1:

Quality: 1971.00 Escore: 0
Matching length: 205 Total length: 205
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MALFGALFALLAGAHAEFPGCKIRVTSKALEVKQEGLRFLEQELETIT 50
||||||||||||||||||||||||||||||||||||||||
1 MALFGALFALLAGAHAEFPGCKIRVTSKALEVKQEGLRFLEQELETIT 50
....
51 IPDLRGKEGYYNISEEVKVTELQLTSSELDFQPQELMLQITNASLGLR 100
||||||||||||||||||||||||||||||||||||||||
51 IPDLRGKEGYYNISEEVKVTELQLTSSELDFQPQELMLQITNASLGLR 100
....
101 FRRQLLYWFFYDGGYINASAEGVSTIRTGLELSRDPAGRMK VSNVSCQASV 150
||||||||||||||||||||||||||||||||||||||||
101 FRRQLLYWFFYDGGYINASAEGVSTIRTGLELSRDPAGRMK VSNVSCQASV 150
....
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLNQQICPVLYHAGTVLLNSLL 200
||||||||||||||||||||||||||||||||||||||||
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLNQQICPVLYHAGTVLLNSLL 200

201 DTVPV 205
||||||
201 DTVPV 205






Sequence name: PLTP_HUMAN

Sequence documentation:

Alignment of: HUMPHOSLIP_PEA_2_P35 x PLTP_HUMAN ..

Alignment segment 1/1:

Quality: 1158.00 Escore: 0
Matching length: 132 Total length: 184
Matching Percent Similarity: 100.00 Matching Percent Identity: 98.48
Total Percent Similarity: 71.74 Total Percent Identity: 70.65
Gaps: 1

Alignment:
....
1 MALFGALFALLAGAHAEFPGCKIRVTSKALEVKQEGLRFLEQELETIT 50
||||||||||||||||||||||||||||||||||||||||
1 MALFGALFALLAGAHAEFPGCKIRVTSKALEVKQEGLRFLEQELETIT 50
....
51 IPDLRGKEGYYNISEEVKVTELQLTSSELDFQPQELMLQITNASLGLR 100
||||||||||||||||||||||||||||||||||||||||
51 IPDLRGKEGYYNISEEVKVTELQLTSSELDFQPQELMLQITNASLGLR 100
....
101 FRRQLLYWFL ......................................... 110
||||||||: |
101 FRRQLLYWFFYDGGYINASAEGVSTIRTGLELSRDPAGRMK VSNVSCQASV 150
....
111 ............ KVYDFLSTFITSMRFLNQQV 132
||||||||||||||||||: |
151 SRMHAAFGGTFKKVYDFLSTFITSMRFLNQQI 184





クラスターAI076020の説明
クラスターAI076020は、目的の1つの転写物および8個のセグメントを特徴とし、その名称を、それぞれ表552および553に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表554に示す。
Description of cluster AI076020 Cluster AI076020 features one transcript and eight segments of interest, the names of which are shown in Tables 552 and 553, respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 554.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるC1q関連因子前駆体(SwissProtアクセッション識別子C1RF_HUMAN)(配列番号1434)の変異型である。   These sequences are variants of C1q-related factor precursor (SwissProt accession identifier C1RF_HUMAN) (SEQ ID NO: 1434), which is a known protein, referred to herein as a previously known protein.

タンパク質C1q関連因子前駆体の配列を、「C1q関連因子前駆体アミノ酸配列」として出願書類の最後に示す。   The sequence of the protein C1q related factor precursor is shown at the end of the application as “C1q related factor precursor amino acid sequence”.

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである運動器官の挙動。   The following GO annotation applies to previously known proteins. The following annotations were found: behavior of the moving organ, which is an annotation related to biological processes.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

クラスターAI076020を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図31のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   Cluster AI076020 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The terms "numbers" in the right column of the table and the numbers on the y-axis of FIG. 31 refer to the weighted expression of ESTs in each category as "ppm" (for ESTs of a particular cluster in this category by ppm Ratio of expression to expression of all ESTs).

概して、図31および表555中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):悪性脳腫瘍および異なる組織由来の悪性腫瘍の混合物。   In general, as shown for the histograms in FIG. 31 and Table 555, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: a mixture of malignant brain tumors and malignant tumors from different tissues.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、クラスターAI076020は、上の表1に列挙した1つの転写物を特徴とする。これらの転写物は、タンパク質C1q関連因子前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster AI076020 is characterized by one transcript as listed in Table 1 above. These transcripts encode proteins which are variants of the protein C1q related factor precursor. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質AI076020_P1は、出願書類の最後に示すアミノ酸配列を有し、転写物AI076020_T0によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The mutein AI076020_P1 according to the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript AI076020_T0. The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質AI076020_P1はまた、表557に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AI076020_P1配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein AI076020_P1 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing the other amino acids, and listing the other amino acids, as shown in Table 557) It indicates whether it is known and the presence of a known SNP in the mutant protein AI076020_P1 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質AI076020_P1は、以下の転写物によってコードされる:AI076020_T0(配列は出願書類の最後に示す)。転写物AI076020_T0のコード部分を太字で示し、このコード部分は261位から開始され、1034位で終結する。転写物はまた、表558に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AI076020_P1配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein AI076020_P1 is encoded by the following transcript: AI076020_T0 (sequences shown at the end of the application). The code portion of transcript AI076020_T0 is shown in bold, starting at position 261 and ending at position 1034. The transcript also has the following SNPs listed in Table 558 (indicating its position on the nucleotide sequence and listing another nucleic acid, the last column indicating whether the SNP is known, the mutein AI076020_P1 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターAI076020は、上の表2に列挙した8個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster AI076020 is characterized by the eight segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターAI076020_node_0は、28個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AI076020_T0。以下の表559は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AI076020_node_0 of the present invention is supported by 28 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: AI076020_T0. Table 559 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表560に示す)。   Microarray (chip) data for this segment is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (for lung cancer) (shown in Table 560).

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターAI076020_node_3は、30個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AI076020_T0。以下の表561は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AI076020_node_3 of the present invention is supported by 30 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: AI076020_T0. Table 561 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターAI076020_node_8は、35個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AI076020_T0。以下の表562は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AI076020_node_8 of the present invention is supported by 35 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: AI076020_T0. Table 562 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターAI076020_node_1は、19個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AI076020_T0。以下の表563は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AI076020_node_1 of the present invention is supported by 19 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: AI076020_T0. Table 563 below describes the start and end position of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターAI076020_node_4は、28個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AI076020_T0。以下の表564は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AI076020_node_4 of the present invention is supported by 28 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: AI076020_T0. Table 564 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターAI076020_node_5は、31個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AI076020_T0。以下の表565は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AI076020_node_5 of the present invention is supported by 31 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: AI076020_T0. Table 565 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターAI076020_node_6は、32個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AI076020_T0。以下の表566は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AI076020_node_6 of the present invention is supported by 32 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: AI076020_T0. Table 566 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターAI076020_node_7は、33個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AI076020_T0。以下の表567は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster AI076020_node_7 of the present invention is supported by 33 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: AI076020_T0. Table 567 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

クラスターT23580の説明
クラスターT23580は、目的の1つの転写物および5個のセグメントを特徴とし、その名称を、それぞれ表568および569に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表570に示す。
Description of Cluster T23580 Cluster T23580 is characterized by one transcript and five segments of interest, the names of which are shown in Tables 568 and 569 respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 570.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれており、以前のSwissProtアクセッション識別子がNP25_HUMANでもある公知のタンパク質である神経タンパク質NP25(SwissProtアクセッション識別子TAG3_HUMAN、同義語神経タンパク質22、NP22、トランスゲリン−3(Transgelin−3)としても公知である)(配列番号1433)の変異型である。   These sequences are referred to herein as previously known proteins, and are known proteins of which the previous SwissProt accession identifier is also NP25_HUMAN, a neuroprotein NP25 (SwissProt accession identifier TAG3_HUMAN, synonymous neuroprotein) 22, NP22, also known as Transgelin-3 (SEQ ID NO: 1433).

タンパク質神経タンパク質NP25の配列を、「神経タンパク質NP25アミノ酸配列」として出願書類の最後に示す。   The sequence of protein neuroprotein NP25 is shown at the end of the application as "neuroprotein NP25 amino acid sequence".

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである中枢神経系発達。   The following GO annotation applies to previously known proteins. The following annotations have been found: Central nervous system development, which is an annotation related to biological processes.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

このクラスターについて、少なくとも1つのオリゴヌクレオチドが、クラスターの過剰発現を証明することが見出されたが、以下に列挙した少なくとも1つの転写物/セグメントでは見出されなかった。以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。前記のように、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、肺癌に関して、このクラスターに達するが、以下の他のセグメント/転写物は達しないことが見出された(表571に示す)。   For this cluster, at least one oligonucleotide was found to demonstrate overexpression of the cluster, but not in at least one transcript / segment listed below. Microarray (chip) data for this segment is also available, as follows. As noted above, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this cluster for lung cancer but not the other segments / transcripts below (shown in Table 571).

Figure 2008507261
Figure 2008507261

上記のように、クラスターT23580は、上の表1に列挙した1つの転写物を特徴とする。これらの転写物は、タンパク質神経タンパク質NP25の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster T23580 is characterized by one transcript as listed in Table 1 above. These transcripts encode a protein that is a mutated form of protein neuroprotein NP25. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質T23580_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物T23580_T10によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、2つのうちの1つのシグナルペプチド推定プログラム(HMM:Signal peptide,NN:NO)によってこのタンパク質がシグナルペプチドを有すると推定されるので、分泌されると考えられる。   The mutein T23580_P5 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript T23580_T10. The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is considered to be secreted as it is presumed that this protein has a signal peptide by one of two signal peptide estimation programs (HMM: Signal peptide, NN: NO).

変異タンパク質T23580_P5はまた、表572に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T23580_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T23580_P5 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing the other amino acids, and listing the other amino acids, and the last It is shown whether it is known and the presence of a known SNP in the mutein T23580_P5 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質T23580_P5は、以下の転写物によってコードされる:T23580_T10(配列は出願書類の最後に示す)。転写物T23580_T10のコード部分を太字で示し、このコード部分は1066位から開始され、1485位で終結する。転写物はまた、表573に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T23580_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T23580_P5 is encoded by the following transcript: T23580_T10 (sequences shown at the end of the application). The code portion of transcript T23580_T10 is shown in bold and this code portion starts at position 1066 and ends at position 1485. The transcript also has the following SNPs listed in Table 573 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein T23580_P5 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターT23580は、上の表2に列挙した5個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster T23 580 is characterized by the five segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターT23580_node_17は、10個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T23580_T10。以下の表574は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T23580_node_17 of the present invention is supported by 10 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T23580_T10. Table 574 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT23580_node_18は、102個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T23580_T10。以下の表575は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T23580_node_18 of the present invention is supported by 102 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T23580_T10. Table 575 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT23580_node_21は、79個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T23580_T10。以下の表576は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T23580_node_21 of the present invention is supported by 79 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T23580_T10. Table 576 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターT23580_node_19を、以下の転写物中に見出すことができる:T23580_T10。以下の表577は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T23580_node_19 of the invention can be found in the following transcript: T23580_T10. Table 577 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT23580_node_20を、以下の転写物中に見出すことができる:T23580_T10。以下の表578は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T23580_node_20 according to the invention can be found in the following transcript: T23580_T10. Table 578 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

クラスターM79217の説明
クラスターM79217は、目的の6つの転写物および32個のセグメントを特徴とし、その名称を、それぞれ表579および580に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表581に示す。
Description of Cluster M79217 Cluster M79217 is characterized by 6 transcripts and 32 segments of interest, the names of which are shown in Tables 579 and 580, respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 581.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるエクソストシン(Exostosin)様3(SwissProtアクセッション識別子EXL3_HUMAN)、同義語EC2.4.1.223、グルクロニル−ガラクトシル−プロテオグリカン4−α−N−アセチルグルコサミニルトランスフェラーゼ、推定腫瘍抑制タンパク質EXTL3、多エクソストシン様タンパク質3、遺伝性多外骨腫症遺伝子イソログ(isolog)、EXT関連タンパク質1としても公知である)(配列番号1436)の変異型である。   These sequences are known proteins Exostosin-like 3 (SwissProt accession identifier EXL3_HUMAN), which is a known protein previously known in the present specification, the synonym EC 2.4.1.223, glucuronyl-galactosyl- Proteoglycan 4-.alpha.-N-acetylglucosaminyltransferase, putative tumor suppressor protein EXTL3, multiple exostocin-like protein 3, hereditary multiple exospermatosis gene isolog (also known as EXT related protein 1) (SEQ ID NO: 1436).

タンパク質エクソストシン様3は、以下の機能を有することが公知であるか、そのように見なされている:グリコシルトランスフェラーゼの可能性がある(類似性による)。タンパク質エクソストシン様3の配列を、「エクソストシン様3アミノ酸配列」として出願書類の最後に示す。タンパク質エクソストシン様3の局在化は、II型膜タンパク質と考えられる。小胞体。   The protein exostocin-like 3 is known or is considered to have the following function: Possible of glycosyltransferases (by similarity). The sequence of protein exostocin-like 3 is shown at the end of the application as "exostocin-like 3 amino acid sequence". Localization of the protein exostocin-like 3 is considered to be a type II membrane protein. Endoplasmic reticulum.

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである細胞の成長および/または維持、分子機能に関連する注釈付けであるトランスフェラーゼ、トランスフェリングリコシル基、および細胞成分に関連する注釈付けである小胞体、内在性膜タンパク質。   The following GO annotation applies to previously known proteins. The following annotations were found: growth and / or maintenance of cells that are related to biological processes, transferases that are annotations related to molecular function, transferrin glycosyl groups, and cell components Annotated endoplasmic reticulum, integral membrane protein.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

上記のように、クラスターM79217は、上の表1に列挙した6つの転写物を特徴とする。これらの転写物は、タンパク質エクソストシン様3の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster M79217 is characterized by the six transcripts listed in Table 1 above. These transcripts encode a protein which is a mutated form of the protein exostocin-like 3. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質M79217_PEA_1_P1は、出願書類の最後に示すアミノ酸配列を有し、転写物M79217_PEA_1_T1によってコードされる。公知のタンパク質(エクソストシン様3)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein M79217_PEA_1_P1 according to the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript M79217_PEA_1_T1. An alignment to a known protein (exostocin-like 3) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

M79217_PEA_1_P1とBAA25445(配列番号1437)との間の比較の報告
1.BAA25445のアミノ酸13〜931に対応し、M79217_PEA_1_P1のアミノ酸1〜919にも対応するMTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYYLTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKRQELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQPKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYDSDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVVLRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQSTFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKIESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTCKNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATRLFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSLSDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAAAEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDFYRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEFQAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPKLPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLRHDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHKYYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIKVTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVDSVLFKTRLPHDKTKCFKFIと少なくとも90%相同な第1のアミノ酸配列を含む、M79217_PEA_1_P1をコードする単離キメラポリペプチド。
Report of the comparison between M79217_PEA_1_P1 and BAA 25445 (SEQ ID NO: 1437) Corresponding to amino acids 13-931 of BAA25445, corresponding to amino acids 1 to 919 of M79217_PEA_1_P1 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYYLTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKRQELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQPKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYDSDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVVLRPAELEKQLYSLPHWRTDGHNHVIINL RKSDTQNLLYNVSTGRAMVAQSTFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKIESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTCKNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATRLFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSLSDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAAAEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDFYRSWNCAPGPF LFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEFQAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPKLPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLRHDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHKYYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIKVTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVDSVLFKTRLPHDKTKCFKFI and containing at least 90% homologous first amino acid sequence, M An isolated chimeric polypeptide encoding 79217_PEA_1_P1.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、Signalp_hmmソフトウェアによってこのタンパク質がシグナルアンカー領域を有すると推定されるので、膜と考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: membrane. Protein localization is considered to be membrane as the Signalp_hmm software presumes that this protein has a signal anchor region.

変異タンパク質M79217_PEA_1_P1は、以下の転写物によってコードされる:M79217_PEA_1_T1(配列は出願書類の最後に示す)。転写物M79217_PEA_1_T1のコード部分を太字で示し、このコード部分は1074位から開始され、3830位で終結する。転写物はまた、表582に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M79217_PEA_1_P1配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M79217_PEA_1_P1 is encoded by the following transcript: M79217_PEA_1_T1 (sequences shown at the end of the application). The coding portion of the transcript M79217_PEA_1_T1 is shown in bold, starting from position 1074 and ending at position 3830. The transcript also has the following SNPs listed in Table 582 (showing its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein M79217_PEA_1_P1 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

本発明の変異タンパク質M79217_PEA_1_P2は、出願書類の最後に示すアミノ酸配列を有し、転写物M79217_PEA_1_T8によってコードされる。公知のタンパク質(エクソストシン様3)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein M79217_PEA_1_P2 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript M79217_PEA_1_T8. An alignment to a known protein (exostocin-like 3) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

M79217_PEA_1_P2とEXL3_HUMANとの間の比較の報告
1.EXL3_HUMANのアミノ酸1〜807に対応し、M79217_PEA_1_P2のアミノ酸1〜807にも対応するMTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYYLTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKRQELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQPKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYDSDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVVLRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQSTFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKIESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTCKNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATRLFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSLSDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAAAEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDFYRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEFQAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPKLPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLRHDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHKと少なくとも90%相同な第1のアミノ酸配列と、EXL3_HUMANのアミノ酸820〜919に対応し、M79217_PEA_1_P2のアミノ酸808〜907にも対応するAIRDMVDEYINCEDIAMNFLVSHITRKPPIKVTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVDSVLFKTRLPHDKTKCFKFIと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M79217_PEA_1_P2をコードする単離キメラポリペプチド。
Report of comparison between M79217_PEA_1_P2 and EXL3_HUMAN 1. Corresponding to amino acids 1 to 807 of EXL3_HUMAN, corresponding to amino acids 1 to 807 of M79217_PEA_1_P2 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYYLTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKRQELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQPKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYDSDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVVLRPAELEKQLYSLPHWRTDGHNHVIIN SRKSDTQNLLYNVSTGRAMVAQSTFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKIESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTCKNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATRLFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSLSDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAAAEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDFYRSWNCAPGP The first amino acid sequence at least 90% homologous to EichieruefuPieichitiPiefudiPibuieruPiesuieikeiefuerujiesujitijiefuaruPiaijijijieijijiesujikeiiefukyueieierujijienubuiPiaruikyuefutibuibuiemuerutiwaiiaruiibuieruemuenuesueruiarueruenujieruPiwaieruenukeibuibuibuibuidaburyuenuesuPikeieruPiesuidieruerudaburyuPidiaijibuiPiaiemubuibuiarutiikeienuesueruenuenuaruefueruPidaburyuenuiaiitiieiaieruesuaidididieieichieruarueichidiiaiemuefujiefuarubuidaburyuaruieiarudiaruaibuijiefuPijiaruwaieichieidaburyudiaipehaQSWLYNSNYSCELSMVLTGAAFFHK, corresponding to amino acids 820-919 of EXL3_HUMAN, corresponding to amino acids 808-907 of M79217_PEA_1_P2 AIRDMVDEYINCEDIAMNFLVSHITRKPPIKVTSRWTFRCPGCPQALSHDDSHF An isolated chimeric polypeptide encoding M79217_PEA_1_P2 comprising a second amino acid sequence that is at least 90% homologous to HERHKC INFFVKVYGYMPLLYTQFRVDSVLFKTRLPHDKTKFKFI and the first and second amino acid sequences are contiguous and in a contiguous order.

2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がKAを含み、以下の構造:アミノ酸番号807−x〜807のいずれかから始まり、アミノ酸番号808+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、M79217_PEA_1_P2の縁部分をコードする単離キメラポリペプチド。   2. Length “n” (wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long, most preferably at least about 50 amino acids in length, at least two amino acids comprising KA, starting from any of the following structures: amino acid numbers 807-x to 807, amino acid numbers 808 + ((n-2)-x) (formula An isolated chimeric polypeptide encoding an edge portion of M79217_PEA_1_P2 comprising a polypeptide, wherein the sequence has a sequence terminating at 0) to n-2).

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、Signalp_hmmソフトウェアによってこのタンパク質がシグナルアンカー領域を有すると推定されるので、膜と考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: membrane. Protein localization is considered to be membrane as the Signalp_hmm software presumes that this protein has a signal anchor region.

変異タンパク質M79217_PEA_1_P2はまた、表583に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M79217_PEA_1_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M79217_PEA_1_P2 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, enumerating other amino acids, and the last column shows SNPs as shown in Table 583) It indicates whether it is known and the presence of a known SNP in the mutein M79217_PEA_1_P2 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質エクソストシン様3と比較した変異タンパク質M79217_PEA_1_P2のグリコシル化部位を表584に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein M79217_PEA_1_P2 compared to the known protein exostocin-like 3 are shown in Table 584 (showing its position on the amino acid sequence in the first column, the second column has a glycosylation site in the mutant protein) The last column indicates whether this position differs on the mutant protein).

Figure 2008507261
Figure 2008507261

変異タンパク質M79217_PEA_1_P2は、以下の転写物によってコードされる:M79217_PEA_1_T8(配列は出願書類の最後に示す)。転写物M79217_PEA_1_T8のコード部分を太字で示し、このコード部分は748位から開始され、3468位で終結する。転写物はまた、表585に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M79217_PEA_1_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M79217_PEA_1_P2 is encoded by the following transcript: M79217_PEA_1_T8 (sequences shown at the end of the application). The code portion of transcript M79217_PEA_1_T8 is shown in bold, this code portion starts at position 748 and ends at position 3468. The transcript also has the following SNPs listed in Table 585 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein M79217_PEA_1_P2 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

本発明の変異タンパク質M79217_PEA_1_P4は、出願書類の最後に示すアミノ酸配列を有し、転写物M79217_PEA_1_T10によってコードされる。公知のタンパク質(エクソストシン様3)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein M79217_PEA_1_P4 according to the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript M79217_PEA_1_T10. An alignment to a known protein (exostocin-like 3) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

M79217_PEA_1_P4とEXL3_HUMANとの間の比較の報告
1.M79217_PEA_1_P4のアミノ酸1〜51に対応する配列PELRQPARLGLPECWDYRHEPRCPAQMGSHFIVQAGLKLLASSKPPKCWDYを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、EXL3_HUMANのアミノ酸759〜919に対応し、M79217_PEA_1_P4のアミノ酸52〜212にも対応するRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHKYYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIKVTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVDSVLFKTRLPHDKTKCFKFIと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M79217_PEA_1_P4をコードする単離キメラポリペプチド。
Report of comparison between M79217_PEA_1_P4 and EXL3_HUMAN 1. At least 70%, optionally at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 90%, most preferably at least 95% homologous to the polypeptide having the sequence PELRQPARLGPECWDYRHEPRCPAQMGSHFIVQAGLKLLASSKP PKCWDY corresponding to amino acids 1 to 51 of M79217_PEA_1_P4 1 and the amino acid sequence of EXL3_HUMAN corresponding to amino acids 759 to 919 and to M79217_PEA_1_P4 corresponding to amino acids 52 to 212. RCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVDSVLFKTRLPHDKTKCFKFI and and at least 90% homologous to a second amino acid sequence, the first amino acid sequence and a second amino acid sequence, contiguous and in sequential order, the isolated chimeric polypeptide coding M79217_PEA_1_P4.

2.M79217_PEA_1_P4の配列PELRQPARLGLPECWDYRHEPRCPAQMGSHFIVQAGLKLLASSKPPKCWDYと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M79217_PEA_1_P4の先端をコードする単離ポリペプチド。   2. M79217_PEA_1_P4 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence of P79. An isolated polypeptide encoding

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、部分的タンパク質であるが、両膜貫通領域推定プログラムによってこのタンパク質が膜貫通領域を有すると推定されるので、膜と考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: membrane. Although protein localization is a partial protein, it is considered to be a membrane because both transmembrane domain estimation programs presume that this protein has a transmembrane domain.

変異タンパク質M79217_PEA_1_P4はまた、表586に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M79217_PEA_1_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M79217_PEA_1_P4 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 586) It is shown whether it is known and the presence of a known SNP in the mutein M79217_PEA_1_P4 sequence supports the putative sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質エクソストシン様3と比較した変異タンパク質M79217_PEA_1_P4のグリコシル化部位を表587に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein M79217_PEA_1_P4 compared to the known protein Exostosin-like 3 are shown in Table 587 (showing its position on the amino acid sequence in the first column, the second column has a glycosylation site in the mutant protein) The last column indicates whether this position differs on the mutant protein).

Figure 2008507261
Figure 2008507261

変異タンパク質M79217_PEA_1_P4は、以下の転写物によってコードされる:M79217_PEA_1_T10(配列は出願書類の最後に示す)。転写物M79217_PEA_1_T10のコード部分を太字で示し、このコード部分は1位から開始され、637位で終結する。転写物はまた、表588に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M79217_PEA_1_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M79217_PEA_1_P4 is encoded by the following transcript: M79217_PEA_1_T10 (sequences shown at the end of the application). The coding part of the transcript M79217_PEA_1_T10 is shown in bold, starting from position 1 and ending at position 637. The transcript also has the following SNPs listed in Table 588 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein M79217_PEA_1_P4 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質M79217_PEA_1_P8は、出願書類の最後に示すアミノ酸配列を有し、転写物M79217_PEA_1_T15によってコードされる。公知のタンパク質(エクソストシン様3)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein M79217_PEA_1_P8 according to the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript M79217_PEA_1_T15. An alignment to a known protein (exostocin-like 3) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

M79217_PEA_1_P8とEXL3_HUMANとの間の比較の報告
1.EXL3_HUMANのアミノ酸1〜807に対応し、M79217_PEA_1_P8のアミノ酸1〜807にも対応するMTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYYLTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKRQELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQPKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYDSDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVVLRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQSTFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKIESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTCKNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATRLFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSLSDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAAAEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDFYRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEFQAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPKLPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLRHDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHKと少なくとも90%相同な第1のアミノ酸配列と、M79217_PEA_1_P8のアミノ酸808〜812に対応する配列VRKSWを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M79217_PEA_1_P8をコードする単離キメラポリペプチド。
Report of comparison between M79217_PEA_1_P8 and EXL3_HUMAN 1. Corresponding to amino acids 1 to 807 of EXL3_HUMAN, corresponding to amino acids 1 to 807 of M79217_PEA_1_P8 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYYLTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKRQELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQPKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYDSDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVVLRPAELEKQLYSLPHWRTDGHNHVIIN SRKSDTQNLLYNVSTGRAMVAQSTFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKIESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTCKNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATRLFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSLSDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAAAEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDFYRSWNCAPGP A first amino acid sequence at least 90% homologous to EichieruefuPieichitiPiefudiPibuieruPiesuieikeiefuerujiesujitijiefuaruPiaijijijieijijiesujikeiiefukyueieierujijienubuiPiaruikyuefutibuibuiemuerutiwaiiaruiibuieruemuenuesueruiarueruenujieruPiwaieruenukeibuibuibuibuidaburyuenuesuPikeieruPiesuidieruerudaburyuPidiaijibuiPiaiemubuibuiarutiikeienuesueruenuenuaruefueruPidaburyuenuiaiitiieiaieruesuaidididieieichieruarueichidiiaiemuefujiefuarubuidaburyuaruieiarudiaruaibuijiefuPijiaruwaieichieidaburyudiaipehaQSWLYNSNYSCELSMVLTGAAFFHK, polypeptide at least 70% with a sequence corresponding to VRKSW to amino acid 808-812 of M79217_PEA_1_P8, optionally at least 80%, preferably at least 85%, more Preferably at least 90%, most preferably less An isolated chimeric polypeptide encoding M79217_PEA_1_P8, which comprises a second amino acid sequence both 95% homologous, said first amino acid sequence and the second amino acid sequence being adjacent and in sequential order.

2.M79217_PEA_1_P8中の配列VRKSWと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M79217_PEA_1_P8のテールをコードする単離ポリペプチド。   2. M79217_PEA_1_P8 comprising a polypeptide at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence VRKSW in M79217_PEA_1_P8 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、Signalp_hmmソフトウェアによってこのタンパク質がシグナルアンカー領域を有すると推定されるので、膜と考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: membrane. Protein localization is considered to be membrane as the Signalp_hmm software presumes that this protein has a signal anchor region.

変異タンパク質M79217_PEA_1_P8はまた、表589に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M79217_PEA_1_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M79217_PEA_1_P8 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, enumerating other amino acids, and the last column shows SNPs as shown in Table 589) It indicates whether it is known and the presence of a known SNP in the mutein M79217_PEA_1_P8 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質エクソストシン様3と比較した変異タンパク質M79217_PEA_1_P8のグリコシル化部位を表590に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein M79217_PEA_1_P8 compared to the known protein exostocin-like 3 are shown in Table 590 (showing its position on the amino acid sequence in the first column, the second column has glycosylation sites in the mutant protein) The last column indicates whether this position differs on the mutant protein).

Figure 2008507261
Figure 2008507261

変異タンパク質M79217_PEA_1_P8は、以下の転写物によってコードされる:M79217_PEA_1_T15(配列は出願書類の最後に示す)。転写物M79217_PEA_1_T15のコード部分を太字で示し、このコード部分は748位から開始され、3183位で終結する。転写物はまた、表591に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M79217_PEA_1_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M79217_PEA_1_P8 is encoded by the following transcript: M79217_PEA_1_T15 (sequences shown at the end of the application). The code portion of transcript M79217_PEA_1_T15 is shown in bold, this code portion starting at position 748 and ending at position 3183. The transcript also has the following SNPs listed in Table 591 (indicating its position on the nucleotide sequence and listing another nucleic acid, the last column indicating whether the SNP is known, mutein M79217_PEA_1_P8 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質M79217_PEA_1_P11は、出願書類の最後に示すアミノ酸配列を有し、転写物M79217_PEA_1_T18によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、2つのうちの1つのシグナルペプチド推定プログラム(HMM:Signal peptide,NN:NO)によってこのタンパク質がシグナルペプチドを有すると推定されるので、分泌されると考えられる。   The mutein M79217_PEA_1_P11 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript M79217_PEA_1_T18. The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is considered to be secreted as it is presumed that this protein has a signal peptide by one of two signal peptide estimation programs (HMM: Signal peptide, NN: NO).

変異タンパク質M79217_PEA_1_P11はまた、表592に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M79217_PEA_1_P11配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M79217_PEA_1_P11 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, enumerating other amino acids, and the last column shows SNPs as shown in Table 592) It is shown whether it is known and the presence of a known SNP in the mutein M79217_PEA_1_P11 sequence supports the putative sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質M79217_PEA_1_P11は、以下の転写物によってコードされる:M79217_PEA_1_T18(配列は出願書類の最後に示す)。転写物M79217_PEA_1_T18のコード部分を太字で示し、このコード部分は1354位から開始され、1674位で終結する。転写物はまた、表593に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M79217_PEA_1_P11配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M79217_PEA_1_P11 is encoded by the following transcript: M79217_PEA_1_T18 (sequences shown at the end of the application). The code portion of the transcript M79217_PEA_1_T18 is shown in bold, starting from position 1354 and ending at position 1674. The transcript also has the following SNPs listed in Table 593 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein M79217_PEA_1_P11 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターM79217は、上の表2に列挙した32個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster M79217 is characterized by the 32 segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターM79217_PEA_1_node_2は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T3。以下の表594は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_2 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M79217_PEA_1_T3. Table 594 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_4は、8個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T8、M79217_PEA_1_T15、およびM79217_PEA_1_T18。以下の表595は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_4 of the present invention is supported by eight libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M79217_PEA_1_T8, M79217_PEA_1_T15, and M79217_PEA_1_T18. Table 595 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_9は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1。以下の表596は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_9 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M79217_PEA_1_T1. Table 596 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_10は、33個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、M79217_PEA_1_T15、およびM79217_PEA_1_T18。以下の表597は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_10 of the present invention is supported by 33 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M79217_PEA_1_T1, M79217_PEA_1_T3, M79217_PEA_1_T8, M79217_PEA_1_T15, and M79217_PEA_1_T18. Table 597 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)表598に示す。   Microarray (chip) data for this segment is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (for lung cancer) as shown in Table 598.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_11は、42個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T15。以下の表599は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_11 of the present invention is supported by 42 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M79217_PEA_1_T1, M79217_PEA_1_T3, M79217_PEA_1_T8, and M79217_PEA_1_T15. Table 599 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_13は、35個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T15。以下の表600は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_13 of the present invention is supported by 35 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M79217_PEA_1_T1, M79217_PEA_1_T3, M79217_PEA_1_T8, and M79217_PEA_1_T15. Table 600 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_14は、65個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T15。以下の表601は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_14 of the present invention is supported by 65 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M79217_PEA_1_T1, M79217_PEA_1_T3, M79217_PEA_1_T8, and M79217_PEA_1_T15. Table 601 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_16は、51個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T15。以下の表602は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_16 of the present invention is supported by 51 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M79217_PEA_1_T1, M79217_PEA_1_T3, M79217_PEA_1_T8, and M79217_PEA_1_T15. Table 602 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_23は、50個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、M79217_PEA_1_T10、およびM79217_PEA_1_T15。以下の表603は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_23 of the present invention is supported by 50 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M79217_PEA_1_T1, M79217_PEA_1_T3, M79217_PEA_1_T8, M79217_PEA_1_T10, and M79217_PEA_1_T15. Table 603 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_24は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T15。以下の表604は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_24 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M79217_PEA_1_T15. Table 604 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_31は、50個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T10。以下の表605は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_31 of the present invention is supported by 50 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M79217_PEA_1_T1, M79217_PEA_1_T3, M79217_PEA_1_T8, and M79217_PEA_1_T10. Table 605 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_33は、71個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T10。以下の表606は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_33 of the present invention is supported by 71 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M79217_PEA_1_T1, M79217_PEA_1_T3, M79217_PEA_1_T8, and M79217_PEA_1_T10. Table 606 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_34は、51個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T10。以下の表607は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_34 of the present invention is supported by 51 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M79217_PEA_1_T1, M79217_PEA_1_T3, M79217_PEA_1_T8, and M79217_PEA_1_T10. Table 607 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_35は、53個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T10。以下の表608は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_35 of the present invention is supported by 53 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M79217_PEA_1_T1, M79217_PEA_1_T3, M79217_PEA_1_T8, and M79217_PEA_1_T10. Table 608 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_37は、58個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T10。以下の表609は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_37 of the present invention is supported by 58 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M79217_PEA_1_T1, M79217_PEA_1_T3, M79217_PEA_1_T8, and M79217_PEA_1_T10. Table 609 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_38は、62個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T10。以下の表610は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_38 of the present invention is supported by 62 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M79217_PEA_1_T1, M79217_PEA_1_T3, M79217_PEA_1_T8, and M79217_PEA_1_T10. Table 610 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_41は、171個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、M79217_PEA_1_T10、およびM79217_PEA_1_T18。以下の表611は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_41 of the present invention is supported by 171 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M79217_PEA_1_T1, M79217_PEA_1_T3, M79217_PEA_1_T8, M79217_PEA_1_T10, and M79217_PEA_1_T18. Table 611 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_44は、89個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、M79217_PEA_1_T10、およびM79217_PEA_1_T18。以下の表612は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_44 of the present invention is supported by 89 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M79217_PEA_1_T1, M79217_PEA_1_T3, M79217_PEA_1_T8, M79217_PEA_1_T10, and M79217_PEA_1_T18. Table 612 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターM79217_PEA_1_node_0は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T3。以下の表613は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_0 of the present invention is supported by 4 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M79217_PEA_1_T3. Table 613 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_7は、11個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T3、M79217_PEA_1_T8、M79217_PEA_1_T15、およびM79217_PEA_1_T18。以下の表614は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_7 of the present invention is supported by 11 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M79217_PEA_1_T3, M79217_PEA_1_T8, M79217_PEA_1_T15, and M79217_PEA_1_T18. Table 614 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_12を、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T15。以下の表615は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_12 according to the invention can be found in the following transcripts: M79217_PEA_1_T1, M79217_PEA_1_T3, M79217_PEA_1_T8, and M79217_PEA_1_T15. Table 615 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_19は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T10。以下の表616は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_19 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: M79217_PEA_1_T10. Table 616 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_21は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T10。以下の表617は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_21 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: M79217_PEA_1_T10. Table 617 below describes the start and end position of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_26は、40個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、およびM79217_PEA_1_T10。以下の表618は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_26 of the present invention is supported by 40 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M79217_PEA_1_T1, M79217_PEA_1_T3, and M79217_PEA_1_T10. Table 618 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_27は、46個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T10。以下の表619は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_27 of the present invention is supported by 46 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M79217_PEA_1_T1, M79217_PEA_1_T3, M79217_PEA_1_T8, and M79217_PEA_1_T10. Table 619 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_30は、47個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T10。以下の表620は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_30 of the present invention is supported by 47 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M79217_PEA_1_T1, M79217_PEA_1_T3, M79217_PEA_1_T8, and M79217_PEA_1_T10. Table 620 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_32は、40個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T10。以下の表621は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_32 of the present invention is supported by 40 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M79217_PEA_1_T1, M79217_PEA_1_T3, M79217_PEA_1_T8, and M79217_PEA_1_T10. Table 621 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_36は、42個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T10。以下の表622は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_36 of the present invention is supported by 42 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M79217_PEA_1_T1, M79217_PEA_1_T3, M79217_PEA_1_T8, and M79217_PEA_1_T10. Table 622 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_39は、57個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T10。以下の表623は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_39 of the present invention is supported by 57 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M79217_PEA_1_T1, M79217_PEA_1_T3, M79217_PEA_1_T8, and M79217_PEA_1_T10. Table 623 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_40は、59個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T10。以下の表624は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_40 of the present invention is supported by 59 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M79217_PEA_1_T1, M79217_PEA_1_T3, M79217_PEA_1_T8, and M79217_PEA_1_T10. Table 624 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_42は、99個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、M79217_PEA_1_T10、およびM79217_PEA_1_T18。以下の表625は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_42 of the present invention is supported by 99 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M79217_PEA_1_T1, M79217_PEA_1_T3, M79217_PEA_1_T8, M79217_PEA_1_T10, and M79217_PEA_1_T18. Table 625 below describes the start and end position of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM79217_PEA_1_node_43は、90個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、M79217_PEA_1_T10、およびM79217_PEA_1_T18。以下の表626は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M79217_PEA_1_node_43 of the present invention is supported by 90 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M79217_PEA_1_T1, M79217_PEA_1_T3, M79217_PEA_1_T8, M79217_PEA_1_T10, and M79217_PEA_1_T18. Table 626 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: BAA25445

Sequence documentation:

Alignment of: M79217_PEA_1_P1 x BAA25445 ..

Alignment segment 1/1:

Quality: 9101.00 Escore: 0
Matching length: 919 Total length: 919
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYY 50
||||||||||||||||||||||||||||||||||||||||||||||||||
13 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYY 62
. . . . .
51 LTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKR 100
||||||||||||||||||||||||||||||||||||||||||||||||||
63 LTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKR 112
. . . . .
101 QELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQ 150
||||||||||||||||||||||||||||||||||||||||||||||||||
113 QELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQ 162
. . . . .
151 PKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
163 PKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYD 212
. . . . .
201 SDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVV 250
||||||||||||||||||||||||||||||||||||||||||||||||||
213 SDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVV 262
. . . . .
251 LRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQ 300
||||||||||||||||||||||||||||||||||||||||||||||||||
263 LRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQ 312
. . . . .
301 STFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKI 350
||||||||||||||||||||||||||||||||||||||||||||||||||
313 STFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKI 362
. . . . .
351 ESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTC 400
||||||||||||||||||||||||||||||||||||||||||||||||||
363 ESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTC 412
. . . . .
401 KNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATR 450
||||||||||||||||||||||||||||||||||||||||||||||||||
413 KNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATR 462
. . . . .
451 LFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSL 500
||||||||||||||||||||||||||||||||||||||||||||||||||
463 LFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSL 512
. . . . .
501 SDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAA 550
||||||||||||||||||||||||||||||||||||||||||||||||||
513 SDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAA 562
. . . . .
551 AEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDF 600
||||||||||||||||||||||||||||||||||||||||||||||||||
563 AEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDF 612
. . . . .
601 YRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEF 650
||||||||||||||||||||||||||||||||||||||||||||||||||
613 YRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEF 662
. . . . .
651 QAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
663 QAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPK 712
. . . . .
701 LPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLR 750
||||||||||||||||||||||||||||||||||||||||||||||||||
713 LPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLR 762
. . . . .
751 HDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLT 800
||||||||||||||||||||||||||||||||||||||||||||||||||
763 HDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLT 812
. . . . .
801 GAAFFHKYYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIK 850
||||||||||||||||||||||||||||||||||||||||||||||||||
813 GAAFFHKYYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIK 862
. . . . .
851 VTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVD 900
||||||||||||||||||||||||||||||||||||||||||||||||||
863 VTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVD 912
.
901 SVLFKTRLPHDKTKCFKFI 919
|||||||||||||||||||
913 SVLFKTRLPHDKTKCFKFI 931






Sequence name: EXL3_HUMAN

Sequence documentation:

Alignment of: M79217_PEA_1_P2 x EXL3_HUMAN ..

Alignment segment 1/1:

Quality: 8873.00 Escore: 0
Matching length: 907 Total length: 919
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 98.69 Total Percent Identity: 98.69
Gaps: 1

Alignment:
. . . . .
1 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYY 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYY 50
. . . . .
51 LTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKR 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKR 100
. . . . .
101 QELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQ 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQ 150
. . . . .
151 PKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 PKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYD 200
. . . . .
201 SDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVV 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 SDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVV 250
. . . . .
251 LRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQ 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 LRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQ 300
. . . . .
301 STFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKI 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 STFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKI 350
. . . . .
351 ESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTC 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 ESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTC 400
. . . . .
401 KNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATR 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 KNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATR 450
. . . . .
451 LFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSL 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 LFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSL 500
. . . . .
501 SDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAA 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 SDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAA 550
. . . . .
551 AEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDF 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 AEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDF 600
. . . . .
601 YRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEF 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 YRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEF 650
. . . . .
651 QAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 QAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPK 700
. . . . .
701 LPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLR 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 LPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLR 750
. . . . .
751 HDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLT 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 HDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLT 800
. . . . .
801 GAAFFHK............AIRDMVDEYINCEDIAMNFLVSHITRKPPIK 838
||||||| |||||||||||||||||||||||||||||||
801 GAAFFHKYYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIK 850
. . . . .
839 VTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVD 888
||||||||||||||||||||||||||||||||||||||||||||||||||
851 VTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVD 900
.
889 SVLFKTRLPHDKTKCFKFI 907
|||||||||||||||||||
901 SVLFKTRLPHDKTKCFKFI 919






Sequence name: EXL3_HUMAN

Sequence documentation:

Alignment of: M79217_PEA_1_P4 x EXL3_HUMAN ..

Alignment segment 1/1:

Quality: 1668.00 Escore: 0
Matching length: 162 Total length: 162
Matching Percent Similarity: 100.00 Matching Percent Identity: 99.38
Total Percent Similarity: 100.00 Total Percent Identity: 99.38
Gaps: 0

Alignment:
. . . . .
51 YRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHK 100
:|||||||||||||||||||||||||||||||||||||||||||||||||
758 FRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHK 807
. . . . .
101 YYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIKVTSRWTF 150
||||||||||||||||||||||||||||||||||||||||||||||||||
808 YYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIKVTSRWTF 857
. . . . .
151 RCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVDSVLFKTR 200
||||||||||||||||||||||||||||||||||||||||||||||||||
858 RCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVDSVLFKTR 907
.
201 LPHDKTKCFKFI 212
||||||||||||
908 LPHDKTKCFKFI 919






Sequence name: EXL3_HUMAN

Sequence documentation:

Alignment of: M79217_PEA_1_P8 x EXL3_HUMAN ..

Alignment segment 1/1:

Quality: 7947.00 Escore: 0
Matching length: 807 Total length: 807
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYY 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYY 50
. . . . .
51 LTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKR 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKR 100
. . . . .
101 QELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQ 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQ 150
. . . . .
151 PKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 PKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYD 200
. . . . .
201 SDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVV 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 SDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVV 250
. . . . .
251 LRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQ 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 LRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQ 300
. . . . .
301 STFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKI 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 STFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKI 350
. . . . .
351 ESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTC 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 ESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTC 400
. . . . .
401 KNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATR 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 KNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATR 450
. . . . .
451 LFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSL 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 LFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSL 500
. . . . .
501 SDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAA 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 SDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAA 550
. . . . .
551 AEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDF 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 AEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDF 600
. . . . .
601 YRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEF 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 YRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEF 650
. . . . .
651 QAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 QAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPK 700
. . . . .
701 LPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLR 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 LPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLR 750
. . . . .
751 HDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLT 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 HDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLT 800

801 GAAFFHK 807
|||||||
801 GAAFFHK 807


Mutated protein alignment against previously known proteins:
Sequence name: BAA25445

Sequence documentation:

Alignment of: M79217_PEA_1_P1 x BAA25445 ..

Alignment segment 1/1:

Quality: 9101.00 Escore: 0
Matching length: 919 Total length: 919
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYY 50
||||||||||||||||||||||||||||||||||||||||
13 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYY 62
....
51 LTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKR 100
||||||||||||||||||||||||||||||||||||||||
63 LTTLDEADEAGKRIFGPRGNELCEVKHLVLDLRIRESVSEELLQLEAKR 112
....
101 QELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQ 150
||||||||||||||||||||||||||||||||||||||||
113 QELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQ 162
....
151 PKLSLPIRLLPE KDDAGLPPP KATRGCRLHNCFDYSRCPLTSGFPVYVYD 200
||||||||||||||||||||||||||||||||||||||||
163 PKLSLPIRLLPE KDDAGLPPP KATRGCRLHNCFDYSRCPLTSGFPVYVYD 212
....
201 SDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPV 250
||||||||||||||||||||||||||||||||||||||||
213 SDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPV 262
....
251 LRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQ 300
||||||||||||||||||||||||||||||||||||||||
263 LRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQ 312
....
301 STFYTVQYRPGGFDLVVSPLVHAMSEPNFMEIPPQVPVCRKYLFTFQGEKI 350
||||||||||||||||||||||||||||||||||||||||
313 STFYTVQYRPGGFDLVVSPLVHAMSEPNFMEIPPQVPVCRKYLFTFQGEKI 362
....
351 ESLRSSLQEARSFEEEMEGDPPADDIDRIIATLKAVQDSKLDQVLVEFTC 400
||||||||||||||||||||||||||||||||||||||||
363 ESLRSSLQEARSFEEEMEGDPPADDIDRIIATLKAV QDSKLDQVLVEFTC 412
....
401 KNQPGPSLPTEWALCGEREDRLELL STTFAL II TPG PDRL VISSG CATR 450
||||||||||||||||||||||||||||||||||||||||
413 KNQPFPSLPTEWALCGEREDRLELL KSTFAL II TPGPR L VIS SG CAT R 462
....
451 LFEALEVGAVPPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSL 500
||||||||||||||||||||||||||||||||||||||||
463 LFEALVEGVPPV VLGEQVQLPYQDMLQWNEAALVVPKPRFTEVHFLLRSL 512
....
501 SDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAA 550
||||||||||||||||||||||||||||||||||||||||
513 SDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAA 562
....
551 AEIPHRSGKAAGTDPDNMADGNDLDLGPVETEPPYASPRYLRNFTLTVTDF 600
||||||||||||||||||||||||||||||||||||||||
563 AEIPHRSGKAAGTDPDNMADGNDLDLGPVETEPPYASPRYLRNFTLTVTDF 612
....
601 YRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGGSGKEF 650
||||||||||||||||||||||||||||||||||||||||
613 YRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGGSGKEF 662
....
651 QAALGGNVPREQFTVVMLTYEREEVLMSNLERLNGLPYLNKVVVVWNSPK 700
||||||||||||||||||||||||||||||||||||||||
663 QAALGGNVPREQFTVVMLTYEREEVLMSNLERLNGLPYLNKVVVVWNSPK 712
....
701 LPSEDLLWPDIGVPIMV VRTEK NSLN NRFLPNEIETEAILSDDDAHLR 750
||||||||||||||||||||||||||||||||||||||||
713 LPSEDLLWPDIGVPIMV VRTEK NSLNNLFLPNEIETEAILSDDDAHLR 762
....
751 HDEIMFGFFRWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLT 800
||||||||||||||||||||||||||||||||||||||||
763 HDEIMFGFFRWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLT 812
....
801 GAAFFHKYYAYLYSYVMPQAIRDMVDEYINCEDIAMLFLSHITRKPPIK 850
||||||||||||||||||||||||||||||||||||||||
813 GAAFFHKYYAYLYSYVMPQAIRDMVDEYINCEDIAMLFLSHITRKPPIK 862
....
851 VTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVD 900
||||||||||||||||||||||||||||||||||||||||
863 VTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVD 912
.
901 SVLFKTRLPHDKTKCFKFI 919
||||||||||||||||||
913 SVLFKTRLPHDKTKCFK 931






Sequence name: EXL3_HUMAN

Sequence documentation:

Alignment of: M79217_PEA_1_P2 x EXL3_HUMAN ..

Alignment segment 1/1:

Quality: 8873.00 Escore: 0
Matching length: 907 Total length: 919
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 98.69 Total Percent Identity: 98.69
Gaps: 1

Alignment:
....
1 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYY 50
||||||||||||||||||||||||||||||||||||||||
1 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYY 50
....
51 LTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKR 100
||||||||||||||||||||||||||||||||||||||||
51 LTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKR 100
....
101 QELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQ 150
||||||||||||||||||||||||||||||||||||||||
101 QELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQ 150
....
151 PKLSLPIRLLPE KDDAGLPPP KATRGCRLHNCFDYSRCPLTSGFPVYVYD 200
||||||||||||||||||||||||||||||||||||||||
151 PKLSLPIRLLPE KDDAGLPPP KATRGCRLHNCFDYSRCPLTSGFPVYVYD 200
....
201 SDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPV 250
||||||||||||||||||||||||||||||||||||||||
201 SDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPV 250
....
251 LRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQ 300
||||||||||||||||||||||||||||||||||||||||
251 LRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQ 300
....
301 STFYTVQYRPGGFDLVVSPLVHAMSEPNFMEIPPQVPVCRKYLFTFQGEKI 350
||||||||||||||||||||||||||||||||||||||||
301 STFYTVQYRPGGFDLVVSPLVHAMSEPNFMEIPPQVPVCRKYLFTFQGEKI 350
....
351 ESLRSSLQEARSFEEEMEGDPPADDIDRIIATLKAVQDSKLDQVLVEFTC 400
||||||||||||||||||||||||||||||||||||||||
351 ESLRSSLQEARSFEEEMEGDPPADDIDRIIATLKAVQDSKLDQVLVEFTC 400
....
401 KNQPGPSLPTEWALCGEREDRLELL STTFAL II TPG PDRL VISSG CATR 450
||||||||||||||||||||||||||||||||||||||||
401 KNQPGPSLPTEWALCGEREDRLELL STTFAL II TPG PDRL VISSG CATR 450
....
451 LFEALEVGAVPPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSL 500
||||||||||||||||||||||||||||||||||||||||
451 LFEALEVGAVPPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSL 500
....
501 SDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAA 550
||||||||||||||||||||||||||||||||||||||||
501 SDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAA 550
....
551 AEIPHRSGKAAGTDPDNMADGNDLDLGPVETEPPYASPRYLRNFTLTVTDF 600
||||||||||||||||||||||||||||||||||||||||
551 AEIPHRSGKAAGTDPDNMADGNDLDLGPVETEPPYASPRYLRNFTLTVTDF 600
....
601 YRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGGSGKEF 650
||||||||||||||||||||||||||||||||||||||||
601 YRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGGSGKEF 650
....
651 QAALGGNVPREQFTVVMLTYEREEVLMSNLERLNGLPYLNKVVVVWNSPK 700
||||||||||||||||||||||||||||||||||||||||
651 QAALGGNVPREQFTVVMLTYEREEVLMSNLERLNGLPYLNKVVVVWNSPK 700
....
701 LPSEDLLWPDIGVPIMV VRTEK NSLN NRFLPNEIETEAILSDDDAHLR 750
||||||||||||||||||||||||||||||||||||||||
701 LPSEDLLWPDIGVPIMV VRTEK NSLN NRFLPNEIETEAILSDDDAHLR 750
....
751 HDEIMFGFFRWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLT 800
||||||||||||||||||||||||||||||||||||||||
751 HDEIMFGFFRWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLT 800
....
801 GAAFFHK ............ AIRDMVDEYINCEDIAMNFLVSHITRKPPIK 838
||||||||||||||||||||||||||||||||||
801 GAAFFHKYYAYLYSYVMPQAIRDMVDEYINCEDIAMLFLSHITRKPPIK 850
....
839 VTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVD 888
||||||||||||||||||||||||||||||||||||||||
851 VTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVD 900
.
889 SVLFKTRLPHDKTKCFK 907
||||||||||||||||||
901 SVLFKTRLPHDKTKCFKFI 919






Sequence name: EXL3_HUMAN

Sequence documentation:

Alignment of: M79217_PEA_1_P4 x EXL3_HUMAN ..

Alignment segment 1/1:

Quality: 1668.00 Escore: 0
Matching length: 162 Total length: 162
Matching Percent Similarity: 100.00 Matching Percent Identity: 99.38
Total Percent Similarity: 100.00 Total Percent Identity: 99.38
Gaps: 0

Alignment:
....
51 YRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHK 100
: ||||||||||||||||||||||||||||||||||||||||
758 FRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHK 807
....
101 YYALYSYVMPQAIRDMVDEYINCEDIAMLFLSHITRKPPIKVTSRWTF 150
||||||||||||||||||||||||||||||||||||||||
808 YAYLYSYVMPQAIRDMVDEYINCEDIAMLFLSHITRKPPIKVTSRWTF 857
....
151 RCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVDSVLFKTR 200
||||||||||||||||||||||||||||||||||||||||
858 RCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVDSVLFKTR 907
.
201 LPHDKTKCFKFI 212
||||||||||||
908 LPHDKTKCFKFI 919






Sequence name: EXL3_HUMAN

Sequence documentation:

Alignment of: M79217_PEA_1_P8 x EXL3_HUMAN ..

Alignment segment 1/1:

Quality: 7947.00 Escore: 0
Matching length: 807 Total length: 807
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYY 50
||||||||||||||||||||||||||||||||||||||||
1 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYY 50
....
51 LTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKR 100
||||||||||||||||||||||||||||||||||||||||
51 LTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKR 100
....
101 QELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQ 150
||||||||||||||||||||||||||||||||||||||||
101 QELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQ 150
....
151 PKLSLPIRLLPE KDDAGLPPP KATRGCRLHNCFDYSRCPLTSGFPVYVYD 200
||||||||||||||||||||||||||||||||||||||||
151 PKLSLPIRLLPE KDDAGLPPP KATRGCRLHNCFDYSRCPLTSGFPVYVYD 200
....
201 SDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPV 250
||||||||||||||||||||||||||||||||||||||||
201 SDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPV 250
....
251 LRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQ 300
||||||||||||||||||||||||||||||||||||||||
251 LRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQ 300
....
301 STFYTVQYRPGGFDLVVSPLVHAMSEPNFMEIPPQVPVCRKYLFTFQGEKI 350
||||||||||||||||||||||||||||||||||||||||
301 STFYTVQYRPGGFDLVVSPLVHAMSEPNFMEIPPQVPVCRKYLFTFQGEKI 350
....
351 ESLRSSLQEARSFEEEMEGDPPADDIDRIIATLKAVQDSKLDQVLVEFTC 400
||||||||||||||||||||||||||||||||||||||||
351 ESLRSSLQEARSFEEEMEGDPPADDIDRIIATLKAVQDSKLDQVLVEFTC 400
....
401 KNQPGPSLPTEWALCGEREDRLELL STTFAL II TPG PDRL VISSG CATR 450
||||||||||||||||||||||||||||||||||||||||
401 KNQPGPSLPTEWALCGEREDRLELL STTFAL II TPG PDRL VISSG CATR 450
....
451 LFEALEVGAVPPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSL 500
||||||||||||||||||||||||||||||||||||||||
451 LFEALEVGAVPPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSL 500
....
501 SDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAA 550
||||||||||||||||||||||||||||||||||||||||
501 SDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAA 550
....
551 AEIPHRSGKAAGTDPDNMADGNDLDLGPVETEPPYASPRYLRNFTLTVTDF 600
||||||||||||||||||||||||||||||||||||||||
551 AEIPHRSGKAAGTDPDNMADGNDLDLGPVETEPPYASPRYLRNFTLTVTDF 600
....
601 YRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGGSGKEF 650
||||||||||||||||||||||||||||||||||||||||
601 YRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGGSGKEF 650
....
651 QAALGGNVPREQFTVVMLTYEREEVLMSNLERLNGLPYLNKVVVVWNSPK 700
||||||||||||||||||||||||||||||||||||||||
651 QAALGGNVPREQFTVVMLTYEREEVLMSNLERLNGLPYLNKVVVVWNSPK 700
....
701 LPSEDLLWPDIGVPIMV VRTEK NSLN NRFLPNEIETEAILSDDDAHLR 750
||||||||||||||||||||||||||||||||||||||||
701 LPSEDLLWPDIGVPIMV VRTEK NSLN NRFLPNEIETEAILSDDDAHLR 750
....
751 HDEIMFGFFRWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLT 800
||||||||||||||||||||||||||||||||||||||||
751 HDEIMFGFFRWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLT 800

801 GAAFFHK 807
||||||||
801 GAAFFHK 807

クラスターM62096の説明
クラスターM62096は、目的の9つの転写物および42個のセグメントを特徴とし、その名称を、それぞれ表627および628に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表629に示す。
Description of cluster M62096 Cluster M62096 is characterized by 9 transcripts and 42 segments of interest, the names of which are shown in Tables 627 and 628, respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 629.

Figure 2008507261
Figure 2008507261


Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるキネシン重鎖イソ型5C(SwissProtアクセッション識別子KF5C_HUMAN)、同義語キネシン重鎖ニューロン特異的2としても公知である)(配列番号1438)の変異型である。   These sequences are also known as kinesin heavy chain isoform 5C (SwissProt accession identifier KF5C_HUMAN), a known protein known previously as a protein previously known herein, the synonym kinesin heavy chain neuron specific 2 ) (SEQ ID NO: 1438).

タンパク質キネシン重鎖イソ型5Cは、以下の機能を有することが公知であるか、そのように見なされている:キネシンは、オルガネラ輸送で役割を果たし得る微小間結合移動(force producing)タンパク質である。タンパク質キネシン重鎖イソ型5Cの配列を、「キネシン重鎖イソ型5Cアミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表630に示す。   The protein kinesin heavy chain isoform 5C is known or considered to have the following function: Kinesin is a micro-promoting bond protein that can play a role in organelle transport . The sequence of the protein kinesin heavy chain isoform 5C is shown at the end of the application as "kinesin heavy chain isoform 5C amino acid sequence". Known polymorphisms of this sequence are shown in Table 630.

Figure 2008507261
Figure 2008507261

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けであるオルガネラの組織化、および生合成、分子機能に関連する注釈付けである微小管モーター、ATP結合、および細胞成分に関連する注釈付けであるキネシン。   The following GO annotation applies to previously known proteins. The following annotations were found: organization of organelles that are relevant to biological processes, and biosynthesis, microtubule motors that are annotations that are relevant to molecular function, ATP binding, and cellular components. Kinesin is a related annotation.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

上記のように、クラスターM62096は、上の表1に列挙した9つの転写物を特徴とする。これらの転写物は、タンパク質キネシン重鎖イソ型5Cの変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster M62096 is characterized by the nine transcripts listed in Table 1 above. These transcripts encode a protein that is a variant of the protein kinesin heavy chain isoform 5C. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質M62096_PEA_1_P4は、出願書類の最後に示すアミノ酸配列を有し、転写物M62096_PEA_1_T6によってコードされる。公知のタンパク質(キネシン重鎖イソ型5C)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein M62096_PEA_1_P4 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript M62096_PEA_1_T6. An alignment to a known protein (kinesin heavy chain isoform 5C) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

M62096_PEA_1_P4とKF5C_HUMANとの間の比較の報告
1.M62096_PEA_1_P4のアミノ酸1〜6に対応する配列MATYIHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、KF5C_HUMANのアミノ酸239〜957に対応し、M62096_PEA_1_P4のアミノ酸7〜725にも対応するVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQKと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P4をコードする単離キメラポリペプチド。
Report on comparison between M62096_PEA_1_P4 and KF5C_HUMAN 1. A polypeptide having at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homology to a polypeptide having the sequence MATYIH corresponding to amino acids 1 to 6 of M62096_PEA_1_P4 The amino acid sequence of 1 and the amino acid 239 to 957 of KF5C_HUMAN and the amino acid 7 to 725 of M62096_PEA_1_P4 correspond to VSKTGAEGAVLDEAKNINKSLSALGGNVISALAEGTKTKVPYRDSKMTRTICCTS VFNG ETCSTGIFGTGAKTIKNTVSVNLELTAETECECL KDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAHQK LSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQK and and at least 90% homologous to a second amino acid sequence, the first amino acid sequence and a second amino acid sequence, contiguous and in sequential order, isolated chimera encoding M62096_PEA_1_P4 Polypeptide.

2.M62096_PEA_1_P4の配列MATYIHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M62096_PEA_1_P4の先端をコードする単離ポリペプチド。   2. The tip of M62096_PEA_1_P4 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence MATYIH of M62096_PEA_1_P4 An isolated polypeptide encoding

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: Intracellular. Protein localization is considered to be intracellular as no transmembrane domain estimation program will deduce that this protein is a transmembrane domain. Furthermore, both signal peptide deducing programs deduce that this protein is a non-secretory protein.

変異タンパク質M62096_PEA_1_P4は、以下の転写物によってコードされる:M62096_PEA_1_T6(配列は出願書類の最後に示す)。転写物M62096_PEA_1_T6のコード部分を太字で示し、このコード部分は108位から開始され、2282位で終結する。転写物はまた、表631に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M62096_PEA_1_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M62096_PEA_1_P4 is encoded by the following transcript: M62096_PEA_1_T6 (sequences shown at the end of the application). The coding part of the transcript M62096_PEA_1_T6 is shown in bold, starting from position 108 and ending at position 2282. The transcript also has the following SNPs listed in Table 631 (indicating its position on the nucleotide sequence and listing another nucleic acid, the last column indicates whether the SNP is known, mutein M62096_PEA_1_P4 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質M62096_PEA_1_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物M62096_PEA_1_T7によってコードされる。公知のタンパク質(キネシン重鎖イソ型5C)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein M62096_PEA_1_P5 according to the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript M62096_PEA_1_T7. An alignment to a known protein (kinesin heavy chain isoform 5C) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

M62096_PEA_1_P5とKF5C_HUMANとの間の比較の報告
1.KF5C_HUMANのアミノ酸284〜957に対応し、M62096_PEA_1_P5のアミノ酸1〜674にも対応するMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQKと少なくとも90%相同な第1のアミノ酸配列を含む、M62096_PEA_1_P5をコードする単離キメラポリペプチド。
Report on comparison between M62096_PEA_1_P5 and KF5C_HUMAN 1. Corresponding to amino acids 284-957 of KF5C_HUMAN, corresponding to amino acids 1 to 674 of M62096_PEA_1_P5 MTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDL EIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKENAM DRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQK and containing at least 90% homologous first amino acid sequence, isolated chimeric polypeptide coding M62096_PEA_1_P5.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: Intracellular. Protein localization is considered to be intracellular as no transmembrane domain estimation program will deduce that this protein is a transmembrane domain. Furthermore, both signal peptide deducing programs deduce that this protein is a non-secretory protein.

変異タンパク質M62096_PEA_1_P5は、以下の転写物によってコードされる:M62096_PEA_1_T7(配列は出願書類の最後に示す)。転写物M62096_PEA_1_T7のコード部分を太字で示し、このコード部分は283位から開始され、2304位で終結する。転写物はまた、表632に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M62096_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M62096_PEA_1_P5 is encoded by the following transcript: M62096_PEA_1_T7 (sequences shown at the end of the application). The coding part of the transcript M62096_PEA_1_T7 is shown in bold, starting from position 283 and ending at position 2304. The transcript also has the following SNPs listed in Table 632 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein M62096_PEA_1_P5 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質M62096_PEA_1_P3は、出願書類の最後に示すアミノ酸配列を有し、転写物M62096_PEA_1_T9によってコードされる。公知のタンパク質(キネシン重鎖イソ型5C)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein M62096_PEA_1_P3 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript M62096_PEA_1_T9. An alignment to a known protein (kinesin heavy chain isoform 5C) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

M62096_PEA_1_P3とKF5C_HUMANとの間の比較の報告
1.KF5C_HUMANのアミノ酸365〜957に対応し、M62096_PEA_1_P3のアミノ酸1〜593にも対応するMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQKと少なくとも90%相同な第1のアミノ酸配列を含む、M62096_PEA_1_P3をコードする単離キメラポリペプチド。
Reporting the comparison between M62096_PEA_1_P3 and KF5C_HUMAN 1. Corresponding to amino acids 365-957 of KF5C_HUMAN, corresponding to amino acids 1 to 593 of M62096_PEA_1_P3 MELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAK KSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQK at least 90% homologous first Containing amino acid sequence, isolated chimeric polypeptide coding M62096_PEA_1_P3.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: Intracellular. Protein localization is considered to be intracellular as no transmembrane domain estimation program will deduce that this protein is a transmembrane domain. Furthermore, both signal peptide deducing programs deduce that this protein is a non-secretory protein.

変異タンパク質M62096_PEA_1_P3は、以下の転写物によってコードされる:M62096_PEA_1_T9(配列は出願書類の最後に示す)。転写物M62096_PEA_1_T9のコード部分を太字で示し、このコード部分は565位から開始され、2343位で終結する。転写物はまた、表633に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M62096_PEA_1_P3配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M62096_PEA_1_P3 is encoded by the following transcript: M62096_PEA_1_T9 (sequences shown at the end of the application). The coding part of the transcript M62096_PEA_1_T9 is shown in bold, starting from position 565 and ending at position 2343. The transcript also has the following SNPs listed in Table 633 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein M62096_PEA_1_P3 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質M62096_PEA_1_P7は、出願書類の最後に示すアミノ酸配列を有し、転写物M62096_PEA_1_T11によってコードされる。公知のタンパク質(キネシン重鎖イソ型5C)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein M62096_PEA_1_P7 according to the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript M62096_PEA_1_T11. An alignment to a known protein (kinesin heavy chain isoform 5C) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

M62096_PEA_1_P7とKF5C_HUMANとの間の比較の報告
1.M62096_PEA_1_P7のアミノ酸1〜19に対応する配列MTQNFRLMWNILLFPLNFSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、KF5C_HUMANのアミノ酸738〜957に対応し、M62096_PEA_1_P7のアミノ酸20〜239にも対応するLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQKと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P7をコードする単離キメラポリペプチド。
Report on comparison between M62096_PEA_1_P7 and KF5C_HUMAN 1. At least 70%, optionally at least 80%, preferably at least 85%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to a polypeptide having the sequence MTQNFRLMWNILLFPLNFS corresponding to amino acids 1-19 of M62096_PEA_1_P7 1 LNQKLQLEQEKLSDSYNCLKIEDQ EREMM KLEKLLLLLNDKREQAREDLKGLEETVSRELQTLHPLKKKV SVEELDNDDGGGSAAQKQQLQILQL LRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQK and and at least 90% homologous to a second amino acid sequence, the first amino acid sequence and a second amino acid sequence, contiguous and in sequential order, the isolated chimeric polypeptide coding M62096_PEA_1_P7.

2.M62096_PEA_1_P7の配列MTQNFRLMWNILLFPLNFSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M62096_PEA_1_P7の先端をコードする単離ポリペプチド。   2. The tip of M62096_PEA_1_P7 comprising a polypeptide that is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence MTQNFRLMWNILLFPLNFS of M62096_PEA_1_P7 An isolated polypeptide encoding

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、2つのうちの1つのシグナルペプチド推定プログラム(HMM:Non−secretory protein,NN:YES)によってこのタンパク質がシグナルペプチドを有すると推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is considered to be secreted since it is presumed that this protein has a signal peptide by one of two signal peptide estimation programs (HMM: Non-secretory protein, NN: YES).

変異タンパク質M62096_PEA_1_P7は、以下の転写物によってコードされる:M62096_PEA_1_T11(配列は出願書類の最後に示す)。転写物M62096_PEA_1_T11のコード部分を太字で示し、このコード部分は633位から開始され、1349位で終結する。転写物はまた、表634に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M62096_PEA_1_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M62096_PEA_1_P7 is encoded by the following transcript: M62096_PEA_1_T11 (sequences shown at the end of the application). The coding portion of the transcript M62096_PEA_1_T11 is shown in bold, starting from position 633 and ending at position 1349. The transcript also has the following SNPs listed in Table 634 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein M62096_PEA_1_P7 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質M62096_PEA_1_P8は、出願書類の最後に示すアミノ酸配列を有し、転写物M62096_PEA_1_T13によってコードされる。公知のタンパク質(キネシン重鎖イソ型5C)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein M62096_PEA_1_P8 according to the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript M62096_PEA_1_T13. An alignment to a known protein (kinesin heavy chain isoform 5C) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

M62096_PEA_1_P8とKF5C_HUMANとの間の比較の報告
1.KF5C_HUMANのアミノ酸1〜736に対応し、M62096_PEA_1_P8のアミノ酸1〜736にも対応するMADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFDRVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLHDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNEHSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRと少なくとも90%相同な第1のアミノ酸配列と、M62096_PEA_1_P8のアミノ酸737〜737に対応する配列Eを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P8をコードする単離キメラポリペプチド。
Reporting the comparison between M62096_PEA_1_P8 and KF5C_HUMAN 1. Corresponding to amino acids 1 to 736 of KF5C_HUMAN, corresponding to amino acids 1 to 736 of M62096_PEA_1_P8 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFDRVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLHDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNEHSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHV YRDSKMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLES A first amino acid sequence at least 90% homologous to the first amino acid sequence, and a ura- Is at least 90%, most preferably at least 95% homologous, with a second amino acid sequence, said first amino acid sequence and said second amino acid sequence being adjacent and in sequential order, M62096_PEA_1 An isolated chimeric polypeptide encoding P8.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: Intracellular. Protein localization is considered to be intracellular as no transmembrane domain estimation program will deduce that this protein is a transmembrane domain. Furthermore, both signal peptide deducing programs deduce that this protein is a non-secretory protein.

変異タンパク質M62096_PEA_1_P8はまた、表635に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M62096_PEA_1_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M62096_PEA_1_P8 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, enumerating other amino acids, and the last column shows SNPs as shown in Table 635) It is shown whether it is known and the presence of a known SNP in the mutein M62096_PEA_1_P8 sequence supports the putative sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質M62096_PEA_1_P8は、以下の転写物によってコードされる:M62096_PEA_1_T13(配列は出願書類の最後に示す)。転写物M62096_PEA_1_T13のコード部分を太字で示し、このコード部分は396位から開始され、2606位で終結する。転写物はまた、表636に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M62096_PEA_1_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M62096_PEA_1_P8 is encoded by the following transcript: M62096_PEA_1_T13 (sequences shown at the end of the application). The coding part of the transcript M62096_PEA_1_T13 is shown in bold, starting from position 396 and ending at position 2606. The transcript also has the following SNPs listed in Table 636 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein M62096_PEA_1_P8 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質M62096_PEA_1_P9は、出願書類の最後に示すアミノ酸配列を有し、転写物M62096_PEA_1_T14によってコードされる。公知のタンパク質(キネシン重鎖イソ型5C)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein M62096_PEA_1_P9 according to the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript M62096_PEA_1_T14. An alignment to a known protein (kinesin heavy chain isoform 5C) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

M62096_PEA_1_P9とKF5C_HUMANとの間の比較の報告
1.KF5C_HUMANのアミノ酸1〜454に対応し、M62096_PEA_1_P9のアミノ酸1〜454にも対応するMADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFDRVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLHDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNEHSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDEと少なくとも90%相同な第1のアミノ酸配列と、M62096_PEA_1_P9のアミノ酸455〜514に対応する配列VKNAIYFFFHKVLLLLFVVDVCSRNLIGIEAFHNYRIMWKFLGRCPFTASYKLIITEFRKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P9をコードする単離キメラポリペプチド。
Report of comparison between M62096_PEA_1_P9 and KF5C_HUMAN Corresponding to amino acids 1 to 454 of KF5C_HUMAN, corresponding to amino acids 1 to 454 of M62096_PEA_1_P9 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFDRVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLHDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNEHSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHV The first amino acid sequence at least 90% homologous to WaiarudiesukeiemutiaruaierukyudiesuerujijienushiarutitiaibuiaishishiesuPiesubuiefuenuieiitikeiesutieruemuefujikyuarueikeitiaikeienutibuiesubuienueruierutieiiidaburyukeikeikeiwaiikeiikeiikeienukeitierukeienubuiaikyueichieruiemuieruenuarudaburyuaruenujiieibuiPiidiikyuaiesueikeidikyukeienueruiPishidienutiPiaiaidienuaieiPibuibuieijiaiesutiiikeiikeiwaidiiiaiesuesueruwaiarukyuerudiDKDDEINQQSQLAEKLKQQMLDQDE, polypeptide at least 70% with a sequence corresponding to VKNAIYFFFHKVLLLLFVVDVCSRNLIGIEAFHNYRIMWKFLGRCPFTASYKLIITEFRK to amino acid 455-514 of M62096_PEA_1_P9, optionally at least 80%, preferably A second amino acid sequence that is at least 85%, more preferably at least 90%, most preferably at least 95% homologous, said first amino acid sequence and the second amino acid sequence being in contiguous and contiguous order An isolated chimeric polypeptide encoding M62096_PEA_1_P9.

2.M62096_PEA_1_P9中の配列VKNAIYFFFHKVLLLLFVVDVCSRNLIGIEAFHNYRIMWKFLGRCPFTASYKLIITEFRKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M62096_PEA_1_P9のテールをコードする単離ポリペプチド。   2. A sequence comprising at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous polypeptide in sequence MKK An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: Intracellular. Protein localization is considered to be intracellular as no transmembrane domain estimation program will deduce that this protein is a transmembrane domain. Furthermore, both signal peptide deducing programs deduce that this protein is a non-secretory protein.

変異タンパク質M62096_PEA_1_P9はまた、表637に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M62096_PEA_1_P9配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M62096_PEA_1_P9 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 637) It is shown whether it is known and the presence of a known SNP in the mutein M62096_PEA_1_P9 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質M62096_PEA_1_P9は、以下の転写物によってコードされる:M62096_PEA_1_T14(配列は出願書類の最後に示す)。転写物M62096_PEA_1_T14のコード部分を太字で示し、このコード部分は396位から開始され、1937位で終結する。転写物はまた、表638に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M62096_PEA_1_P9配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M62096_PEA_1_P9 is encoded by the following transcript: M62096_PEA_1_T14 (sequences shown at the end of the application). The coding part of the transcript M62096_PEA_1_T14 is shown in bold, starting from position 396 and ending at position 1937. The transcript also has the following SNPs listed in Table 638 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein M62096_PEA_1_P9 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質M62096_PEA_1_P10は、出願書類の最後に示すアミノ酸配列を有し、転写物M62096_PEA_1_T15によってコードされる。公知のタンパク質(キネシン重鎖イソ型5C)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein M62096_PEA_1_P10 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript M62096_PEA_1_T15. An alignment to a known protein (kinesin heavy chain isoform 5C) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

M62096_PEA_1_P10とKF5C_HUMANとの間の比較の報告
1.M62096_PEA_1_P10のアミノ酸1〜19に対応する配列MTQNFRLMWNILLFPLNFSを有するポリペプチドとと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、KF5C_HUMANのアミノ酸738〜815に対応し、M62096_PEA_1_P10のアミノ酸20〜97にも対応するLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKと少なくとも90%相同な第2のアミノ酸配列と、M62096_PEA_1_P10のアミノ酸98〜125に対応する配列VSSLCLNGTEKKIKDGREESFSVEISLAを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P10をコードする単離キメラポリペプチド。
Reporting of the comparison between M62096_PEA_1_P10 and KF5C_HUMAN At least 70%, optionally at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 90%, most preferably at least 95% homologous to a polypeptide having the sequence MTQNFRLMWNILLFPLNFS corresponding to amino acids 1-19 of M62096_PEA_1_P10 LNQKLQLEQEKLSSDYNKLKIEDQ EREMKLEK ELLLLND KREQAREDLKGLEETSRELQTLHNLLFVQDLTTRVKK corresponding to amino acids 738 to 815 of KF5C_HUMAN and corresponding to amino acids 20 to 97 of M62096_PEA_1_P10 The amino acid sequence of amino acids A polypeptide having the corresponding sequence VSSLCLNGTEKKIKDGREESFSVEISLA and comprising a third amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous An isolated chimeric polypeptide encoding M62096_PEA_1_P10, wherein the first amino acid sequence, the second amino acid sequence, and the third amino acid sequence are adjacent and in sequential order.

2.M62096_PEA_1_P10の配列MTQNFRLMWNILLFPLNFSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M62096_PEA_1_P10の先端をコードする単離ポリペプチド。   2. The tip of M62096_PEA_1_P10 comprising a polypeptide that is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence MTQNFRLMWNILLFPLNFS of M62096_PEA_1_P10 An isolated polypeptide encoding

3.M62096_PEA_1_P10中の配列VSSLCLNGTEKKIKDGREESFSVEISLAと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M62096_PEA_1_P10のテールをコードする単離ポリペプチド。   3. M62096_PEA_1_P10 comprising a polypeptide at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence VSSLCLNGTEKKIKDGREESFSVEISLA in An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、2つのうちの1つのシグナルペプチド推定プログラム(HMM:Non−secretory protein,NN:YES)によってこのタンパク質がシグナルペプチドを有すると推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is considered to be secreted since it is presumed that this protein has a signal peptide by one of two signal peptide estimation programs (HMM: Non-secretory protein, NN: YES).

変異タンパク質M62096_PEA_1_P10は、以下の転写物によってコードされる:M62096_PEA_1_T15(配列は出願書類の最後に示す)。転写物M62096_PEA_1_T15のコード部分を太字で示し、このコード部分は633位から開始され、1007位で終結する。   The mutein M62096_PEA_1_P10 is encoded by the following transcript: M62096_PEA_1_T15 (sequences shown at the end of the application). The coding part of the transcript M62096_PEA_1_T15 is shown in bold, starting from position 633 and ending at position 1007.

本発明の変異タンパク質M62096_PEA_1_P11は、出願書類の最後に示すアミノ酸配列を有し、転写物M62096_PEA_1_T4によってコードされる。公知のタンパク質(キネシン重鎖イソ型5C)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein M62096_PEA_1_P11 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript M62096_PEA_1_T4. An alignment to a known protein (kinesin heavy chain isoform 5C) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

M62096_PEA_1_P11とKF5C_HUMANとの間の比較の報告
1.KF5C_HUMANのアミノ酸1〜372に対応し、M62096_PEA_1_P11のアミノ酸1〜372にも対応するMADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFDRVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLHDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNEHSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNと少なくとも90%相同な第1のアミノ酸配列と、M62096_PEA_1_P11のアミノ酸373〜385に対応する配列DFLAAHVFGKLLEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P11をコードする単離キメラポリペプチド。
Report on comparison between M62096_PEA_1_P11 and KF5C_HUMAN 1. Corresponding to amino acids 1 to 372 of KF5C_HUMAN, corresponding to amino acids 1 to 372 of M62096_PEA_1_P11 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFDRVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLHDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNEHSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTH PYRSKSMTRILQDSLGGNCRTTIVICCS VSFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKEKEKEKEK NKTLKNVI QH The key amino acid sequence at least 90% homologous to the amino acid 37-385 of M62096_PEA_1_P11 and the peptide having at least 70% Comprises M62096_PEA_1_P11, which comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first amino acid sequence and the second amino acid sequence being adjacent and in sequential order Isolated chimera port Peptide.

2.M62096_PEA_1_P11中の配列DFLAAHVFGKLLEと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M62096_PEA_1_P11のテールをコードする単離ポリペプチド。   2. M62096_PEA_1_P11 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence DFLAAHVFGKLLE in M62096_PEA_1_P11 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: Intracellular. Protein localization is considered to be intracellular as no transmembrane domain estimation program will deduce that this protein is a transmembrane domain. Furthermore, both signal peptide deducing programs deduce that this protein is a non-secretory protein.

変異タンパク質M62096_PEA_1_P11はまた、表639に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M62096_PEA_1_P11配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M62096_PEA_1_P11 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 639) It is shown whether it is known and the presence of a known SNP in the mutein M62096_PEA_1_P11 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質M62096_PEA_1_P11は、以下の転写物によってコードされる:M62096_PEA_1_T4(配列は出願書類の最後に示す)。転写物M62096_PEA_1_T4のコード部分を太字で示し、このコード部分は396位から開始され、1550位で終結する。転写物はまた、表640に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M62096_PEA_1_P11配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M62096_PEA_1_P11 is encoded by the following transcript: M62096_PEA_1_T4 (sequences shown at the end of the application). The coding part of the transcript M62096_PEA_1_T4 is shown in bold, starting from position 396 and ending at position 1550. The transcript also has the following SNPs listed in Table 640 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein M62096_PEA_1_P11 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質M62096_PEA_1_P12は、出願書類の最後に示すアミノ酸配列を有し、転写物M62096_PEA_1_T5によってコードされる。公知のタンパク質(キネシン重鎖イソ型5C)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein M62096_PEA_1_P12 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript M62096_PEA_1_T5. An alignment to a known protein (kinesin heavy chain isoform 5C) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

M62096_PEA_1_P12とKF5C_HUMANとの間の比較の報告
1.KF5C_HUMANのアミノ酸1〜323に対応し、M62096_PEA_1_P12のアミノ酸1〜323にも対応するMADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFDRVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLHDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNEHSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRと少なくとも90%相同な第1のアミノ酸配列と、M62096_PEA_1_P12のアミノ酸324〜324に対応する配列Vを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P12をコードする単離キメラポリペプチド。
Reporting the comparison between M62096_PEA_1_P12 and KF5C_HUMAN Corresponding to amino acids 1 to 323 of KF5C_HUMAN, corresponding to amino acids 1 to 323 of M62096_PEA_1_P12 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFDRVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLHDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNEHSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTH And a polypeptide having a sequence V corresponding to amino acids 324-324 of M62096_PEA_1_P12 at least 70%, optionally at least 80%, preferably at least 85%, more preferably a first amino acid sequence at least 90% homologous to PYRDSKMTRIQDSLGGNCRTTIVICCS VSFNEAETKSTLMFGQR Comprises M62096_PEA_1_P12, which comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first amino acid sequence and the second amino acid sequence being adjacent and in sequential order Isolated chimeric polypeptide.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: Intracellular. Protein localization is considered to be intracellular as no transmembrane domain estimation program will deduce that this protein is a transmembrane domain. Furthermore, both signal peptide deducing programs deduce that this protein is a non-secretory protein.

変異タンパク質M62096_PEA_1_P12はまた、表641に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M62096_PEA_1_P12配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M62096_PEA_1_P12 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, enumerating other amino acids, and the last column shows SNPs as shown in Table 641) It is shown whether it is known and the presence of a known SNP in the mutein M62096_PEA_1_P12 sequence supports the putative sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質M62096_PEA_1_P12は、以下の転写物によってコードされる:M62096_PEA_1_T5(配列は出願書類の最後に示す)。転写物M62096_PEA_1_T5のコード部分を太字で示し、このコード部分は378位から開始され、1349位で終結する。転写物はまた、表642に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M62096_PEA_1_P12配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M62096_PEA_1_P12 is encoded by the following transcript: M62096_PEA_1_T5 (sequences shown at the end of the application). The coding part of the transcript M62096_PEA_1_T5 is shown in bold, starting from position 378 and ending at position 1349. The transcript also has the following SNPs listed in Table 642 (showing its position on the nucleotide sequence and listing another nucleic acid, the last column indicating whether the SNP is known, mutein M62096_PEA_1_P12 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターM62096は、上の表2に列挙した42個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster M62096 is characterized by the 42 segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターM62096_PEA_1_node_0は、14個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表643は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_0 of the present invention is supported by 14 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T13, and M62096_PEA_1_T14. Table 643 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_2は、12個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表644は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_2 of the present invention is supported by 12 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T13, and M62096_PEA_1_T14. Table 644 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_15は、28個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表645は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_15 of the present invention is supported by 28 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T13, and M62096_PEA_1_T14. Table 645 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_17は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T7。以下の表646は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_17 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: M62096_PEA_1_T7. Table 646 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_19は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T6およびM62096_PEA_1_T9。以下の表647は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_19 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M62096_PEA_1_T6 and M62096_PEA_1_T9. Table 647 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_23は、36個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表648は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_23 of the present invention is supported by 36 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T6, M62096_PEA_1_T7, M62096_PEA_1_T9, M62096_PEA_1_T13, and M62096_PEA_1_T14. Table 648 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_27は、35個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表649は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_27 of the present invention is supported by 35 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T6, M62096_PEA_1_T7, M62096_PEA_1_T9, M62096_PEA_1_T13, and M62096_PEA_1_T14. Table 649 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_29は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4。以下の表650は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_29 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: M62096_PEA_1_T4. Table 650 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_31は、24個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表651は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_31 of the present invention is supported by 24 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T6, M62096_PEA_1_T7, M62096_PEA_1_T9, M62096_PEA_1_T13, and M62096_PEA_1_T14. Table 651 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_34は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T14。以下の表652は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_34 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M62096_PEA_1_T14. Table 652 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_36は、26個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T13。以下の表653は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_36 of the present invention is supported by 26 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T6, M62096_PEA_1_T7, M62096_PEA_1_T9, and M62096_PEA_1_T13. Table 653 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_38は、24個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T13。以下の表654は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_38 of the present invention is supported by 24 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T6, M62096_PEA_1_T7, M62096_PEA_1_T9, and M62096_PEA_1_T13. Table 654 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_40は、21個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T13。以下の表655は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_40 of the present invention is supported by 21 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T6, M62096_PEA_1_T7, M62096_PEA_1_T9, and M62096_PEA_1_T13. Table 655 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_48は、7個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T13。以下の表656は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_48 of the present invention is supported by seven libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M62096_PEA_1_T13. Table 656 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_50は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T11およびM62096_PEA_1_T15。以下の表657は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_50 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M62096_PEA_1_T11 and M62096_PEA_1_T15. Table 657 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_56は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T15。以下の表658は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_56 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: M62096_PEA_1_T15. Table 658 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_60は、13個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T11。以下の表659は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_60 of the present invention is supported by 13 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T6, M62096_PEA_1_T7, M62096_PEA_1_T9, and M62096_PEA_1_T11. Table 659 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_65は、51個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T11。以下の表660は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_65 of the present invention is supported by 51 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T6, M62096_PEA_1_T7, M62096_PEA_1_T9, and M62096_PEA_1_T11. Table 660 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_69は、85個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T11。以下の表661は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_69 of the present invention is supported by 85 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T6, M62096_PEA_1_T7, M62096_PEA_1_T9, and M62096_PEA_1_T11. Table 661 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_71は、178個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T11。以下の表662は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_71 of the present invention is supported by 178 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T6, M62096_PEA_1_T7, M62096_PEA_1_T9, and M62096_PEA_1_T11. Table 662 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターM62096_PEA_1_node_1を、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表663は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_1 according to the invention can be found in the transcripts below: M62096_PEA_1_T4, M62096_PEA_1_T13, and M62096_PEA_1_T14. Table 663 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_4は、12個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表664は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_4 of the present invention is supported by 12 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T13, and M62096_PEA_1_T14. Table 664 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_6は、13個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表665は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_6 of the present invention is supported by 13 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T13, and M62096_PEA_1_T14. Table 665 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_7は、19個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表666は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_7 of the present invention is supported by 19 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T13, and M62096_PEA_1_T14. Table 666 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_9は、18個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表667は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_9 of the present invention is supported by 18 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T13, and M62096_PEA_1_T14. Table 667 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_11は、22個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表668は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_11 of the present invention is supported by 22 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T13, and M62096_PEA_1_T14. Table 668 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_13は、24個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表669は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_13 of the present invention is supported by 24 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T13, and M62096_PEA_1_T14. Table 669 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_21は、33個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表670は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_21 of the present invention is supported by 33 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T6, M62096_PEA_1_T7, M62096_PEA_1_T9, M62096_PEA_1_T13, and M62096_PEA_1_T14. Table 670 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_25は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T5およびM62096_PEA_1_T9。以下の表671は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_25 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M62096_PEA_1_T5 and M62096_PEA_1_T9. Table 671 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_33は、20個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表672は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_33 of the present invention is supported by 20 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T6, M62096_PEA_1_T7, M62096_PEA_1_T9, M62096_PEA_1_T13, and M62096_PEA_1_T14. Table 672 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_42は、17個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T13。以下の表673は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_42 of the present invention is supported by 17 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T6, M62096_PEA_1_T7, M62096_PEA_1_T9, and M62096_PEA_1_T13. Table 673 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_44は、19個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T13。以下の表674は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_44 of the present invention is supported by 19 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T6, M62096_PEA_1_T7, M62096_PEA_1_T9, and M62096_PEA_1_T13. Table 674 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_47は、21個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T13。以下の表675は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_47 of the present invention is supported by 21 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T6, M62096_PEA_1_T7, M62096_PEA_1_T9, and M62096_PEA_1_T13. Table 675 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表676に示す)。   Microarray (chip) data for this segment is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (for lung cancer) (shown in Table 676).

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_51は、11個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、M62096_PEA_1_T11、およびM62096_PEA_1_T15。以下の表677は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_51 of the present invention is supported by 11 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T6, M62096_PEA_1_T7, M62096_PEA_1_T9, M62096_PEA_1_T11, and M62096_PEA_1_T15. Table 677 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_53は、10個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、M62096_PEA_1_T11、およびM62096_PEA_1_T15。以下の表678は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_53 of the present invention is supported by 10 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T6, M62096_PEA_1_T7, M62096_PEA_1_T9, M62096_PEA_1_T11, and M62096_PEA_1_T15. Table 678 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_55は、9個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、M62096_PEA_1_T11、およびM62096_PEA_1_T15。以下の表679は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_55 of the present invention is supported by nine libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T6, M62096_PEA_1_T7, M62096_PEA_1_T9, M62096_PEA_1_T11, and M62096_PEA_1_T15. Table 679 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_58は、9個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T11。以下の表680は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_58 of the present invention is supported by nine libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T6, M62096_PEA_1_T7, M62096_PEA_1_T9, and M62096_PEA_1_T11. Table 680 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_62は、14個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T11。以下の表681は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_62 of the present invention is supported by 14 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T6, M62096_PEA_1_T7, M62096_PEA_1_T9, and M62096_PEA_1_T11. Table 681 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_66は、23個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T11。以下の表682は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_66 of the present invention is supported by 23 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T6, M62096_PEA_1_T7, M62096_PEA_1_T9, and M62096_PEA_1_T11. Table 682 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_67を、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T11。以下の表683は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_67 according to the invention can be found in the following transcripts: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T6, M62096_PEA_1_T7, M62096_PEA_1_T9, and M62096_PEA_1_T11. Table 683 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_68を、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T11。以下の表684は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_68 according to the invention can be found in the following transcripts: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T6, M62096_PEA_1_T7, M62096_PEA_1_T9, and M62096_PEA_1_T11. Table 684 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM62096_PEA_1_node_70は、55個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T11。以下の表685は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M62096_PEA_1_node_70 of the present invention is supported by 55 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M62096_PEA_1_T4, M62096_PEA_1_T5, M62096_PEA_1_T6, M62096_PEA_1_T7, M62096_PEA_1_T9, and M62096_PEA_1_T11. Table 685 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P4 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 6936.00 Escore: 0
Matching length: 719 Total length: 719
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
7 VSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRIL 56
||||||||||||||||||||||||||||||||||||||||||||||||||
239 VSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRIL 288
. . . . .
57 QDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELT 106
||||||||||||||||||||||||||||||||||||||||||||||||||
289 QDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELT 338
. . . . .
107 AEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQK 156
||||||||||||||||||||||||||||||||||||||||||||||||||
339 AEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQK 388
. . . . .
157 NLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQ 206
||||||||||||||||||||||||||||||||||||||||||||||||||
389 NLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQ 438
. . . . .
207 SQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVL 256
||||||||||||||||||||||||||||||||||||||||||||||||||
439 SQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVL 488
. . . . .
257 QALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQE 306
||||||||||||||||||||||||||||||||||||||||||||||||||
489 QALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQE 538
. . . . .
307 LSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMAR 356
||||||||||||||||||||||||||||||||||||||||||||||||||
539 LSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMAR 588
. . . . .
357 LYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEA 406
||||||||||||||||||||||||||||||||||||||||||||||||||
589 LYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEA 638
. . . . .
407 KIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKE 456
||||||||||||||||||||||||||||||||||||||||||||||||||
639 KIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKE 688
. . . . .
457 HLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRDL 506
||||||||||||||||||||||||||||||||||||||||||||||||||
689 HLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRDL 738
. . . . .
507 NQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLE 556
||||||||||||||||||||||||||||||||||||||||||||||||||
739 NQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLE 788
. . . . .
557 ETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLE 606
||||||||||||||||||||||||||||||||||||||||||||||||||
789 ETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLE 838
. . . . .
607 NNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKE 656
||||||||||||||||||||||||||||||||||||||||||||||||||
839 NNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKE 888
. . . . .
657 NAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTA 706
||||||||||||||||||||||||||||||||||||||||||||||||||
889 NAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTA 938
.
707 VHAIRGGGGSSSNSTHYQK 725
|||||||||||||||||||
939 VHAIRGGGGSSSNSTHYQK 957






Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P5 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 6520.00 Escore: 0
Matching length: 674 Total length: 674
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
284 MTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSV 333
. . . . .
51 NLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQIS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
334 NLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQIS 383
. . . . .
101 AKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDD 150
||||||||||||||||||||||||||||||||||||||||||||||||||
384 AKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDD 433
. . . . .
151 EINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDE 200
||||||||||||||||||||||||||||||||||||||||||||||||||
434 EINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDE 483
. . . . .
201 VKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQREL 250
||||||||||||||||||||||||||||||||||||||||||||||||||
484 VKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQREL 533
. . . . .
251 SQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEE 300
||||||||||||||||||||||||||||||||||||||||||||||||||
534 SQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEE 583
. . . . .
301 FTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLI 350
||||||||||||||||||||||||||||||||||||||||||||||||||
584 FTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLI 633
. . . . .
351 SQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
634 SQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQ 683
. . . . .
401 DKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIID 450
||||||||||||||||||||||||||||||||||||||||||||||||||
684 DKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIID 733
. . . . .
451 EIRDLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQARED 500
||||||||||||||||||||||||||||||||||||||||||||||||||
734 EIRDLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQARED 783
. . . . .
501 LKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQK 550
||||||||||||||||||||||||||||||||||||||||||||||||||
784 LKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQK 833
. . . . .
551 ISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESAL 600
||||||||||||||||||||||||||||||||||||||||||||||||||
834 ISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESAL 883
. . . . .
601 KEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPA 650
||||||||||||||||||||||||||||||||||||||||||||||||||
884 KEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPA 933
. .
651 SSPTAVHAIRGGGGSSSNSTHYQK 674
||||||||||||||||||||||||
934 SSPTAVHAIRGGGGSSSNSTHYQK 957






Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P3 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 5726.00 Escore: 0
Matching length: 593 Total length: 593
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEK 50
||||||||||||||||||||||||||||||||||||||||||||||||||
365 MELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEK 414
. . . . .
51 EKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYE 100
||||||||||||||||||||||||||||||||||||||||||||||||||
415 EKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYE 464
. . . . .
101 KIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQ 150
||||||||||||||||||||||||||||||||||||||||||||||||||
465 KIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQ 514
. . . . .
151 LTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGI 200
||||||||||||||||||||||||||||||||||||||||||||||||||
515 LTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGI 564
. . . . .
201 IGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
565 IGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMD 614
. . . . .
251 SNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSL 300
||||||||||||||||||||||||||||||||||||||||||||||||||
615 SNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSL 664
. . . . .
301 SEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAH 350
||||||||||||||||||||||||||||||||||||||||||||||||||
665 SEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAH 714
. . . . .
351 QKQLSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSSDYNKLKIEDQERE 400
||||||||||||||||||||||||||||||||||||||||||||||||||
715 QKQLSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSSDYNKLKIEDQERE 764
. . . . .
401 MKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVK 450
||||||||||||||||||||||||||||||||||||||||||||||||||
765 MKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVK 814
. . . . .
451 KSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPK 500
||||||||||||||||||||||||||||||||||||||||||||||||||
815 KSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPK 864
. . . . .
501 LEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMA 550
||||||||||||||||||||||||||||||||||||||||||||||||||
865 LEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMA 914
. . . .
551 RRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQK 593
|||||||||||||||||||||||||||||||||||||||||||
915 RRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQK 957






Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P7 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 2117.00 Escore: 0
Matching length: 220 Total length: 220
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
20 LNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGL 69
||||||||||||||||||||||||||||||||||||||||||||||||||
738 LNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGL 787
. . . . .
70 EETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFL 119
||||||||||||||||||||||||||||||||||||||||||||||||||
788 EETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFL 837
. . . . .
120 ENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAK 169
||||||||||||||||||||||||||||||||||||||||||||||||||
838 ENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAK 887
. . . . .
170 ENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPT 219
||||||||||||||||||||||||||||||||||||||||||||||||||
888 ENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPT 937
. .
220 AVHAIRGGGGSSSNSTHYQK 239
||||||||||||||||||||
938 AVHAIRGGGGSSSNSTHYQK 957






Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P8 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 7146.00 Escore: 0
Matching length: 737 Total length: 737
Matching Percent Similarity: 100.00 Matching Percent Identity: 99.86
Total Percent Similarity: 100.00 Total Percent Identity: 99.86
Gaps: 0

Alignment:
. . . . .
1 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFD 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFD 50
. . . . .
51 RVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 RVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
. . . . .
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
. . . . .
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
. . . . .
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
. . . . .
251 EAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTI 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 EAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTI 300
. . . . .
301 VICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEK 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEK 350
. . . . .
351 EKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIID 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIID 400
. . . . .
401 NIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQML 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 NIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQML 450
. . . . .
451 DQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQ 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 DQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQ 500
. . . . .
501 KSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEI 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 KSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEI 550
. . . . .
551 LNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKS 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 LNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKS 600
. . . . .
601 LVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNM 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 LVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNM 650
. . . . .
651 EQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 EQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMK 700
. . .
701 KALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRE 737
||||||||||||||||||||||||||||||||||||:
701 KALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRD 737






Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P9 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 4434.00 Escore: 0
Matching length: 454 Total length: 454
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFD 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFD 50
. . . . .
51 RVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 RVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
. . . . .
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
. . . . .
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
. . . . .
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
. . . . .
251 EAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTI 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 EAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTI 300
. . . . .
301 VICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEK 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEK 350
. . . . .
351 EKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIID 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIID 400
. . . . .
401 NIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQML 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 NIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQML 450

451 DQDE 454
||||
451 DQDE 454






Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P10 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 747.00 Escore: 0
Matching length: 78 Total length: 78
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
20 LNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGL 69
||||||||||||||||||||||||||||||||||||||||||||||||||
738 LNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGL 787
. .
70 EETVSRELQTLHNLRKLFVQDLTTRVKK 97
||||||||||||||||||||||||||||
788 EETVSRELQTLHNLRKLFVQDLTTRVKK 815






Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P11 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 3634.00 Escore: 0
Matching length: 372 Total length: 372
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFD 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFD 50
. . . . .
51 RVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 RVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
. . . . .
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
. . . . .
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
. . . . .
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
. . . . .
251 EAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTI 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 EAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTI 300
. . . . .
301 VICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEK 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEK 350
. .
351 EKNKTLKNVIQHLEMELNRWRN 372
||||||||||||||||||||||
351 EKNKTLKNVIQHLEMELNRWRN 372






Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P12 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 3145.00 Escore: 0
Matching length: 323 Total length: 323
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFD 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFD 50
. . . . .
51 RVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 RVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
. . . . .
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
. . . . .
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
. . . . .
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
. . . . .
251 EAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTI 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 EAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTI 300
. .
301 VICCSPSVFNEAETKSTLMFGQR 323
|||||||||||||||||||||||
301 VICCSPSVFNEAETKSTLMFGQR 323



Mutated protein alignment against previously known proteins:
Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P4 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 6936.00 Escore: 0
Matching length: 719 Total length: 719
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
7 VSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRSKSMTRIL 56
||||||||||||||||||||||||||||||||||||||||
239 VSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKTMRIL 288
....
57 QDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELT 106
||||||||||||||||||||||||||||||||||||||||
289 QDSLGGNCRTTIVICCSSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELT 338
....
107 AEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPDEQISAKDQK 156
||||||||||||||||||||||||||||||||||||||||
339 AEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQK 388
....
157 NLEPCDNTPIIDNIAPV VAGISTEEKEKYDEEISSLYRQLDDKDDEINQQ 206
||||||||||||||||||||||||||||||||||||||||
389 NLEPCDNTPIIDNIAPV VAGISTEEKEKYDEEISSLYRQLDDKDDEINQQ 438
....
207 SQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVL 256
||||||||||||||||||||||||||||||||||||||||
439 SQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVL 488
....
257 QALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQE 306
||||||||||||||||||||||||||||||||||||||||
489 QALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQE 538
....
307 LSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMAR 356
||||||||||||||||||||||||||||||||||||||||
539 LSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMAR 588
....
357 LYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEA 406
||||||||||||||||||||||||||||||||||||||||
589 LYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEA 638
....
407 KIKSLTTDYMQNMQQRRQREESQDSLSEELAKLAQEKMHEVSFQDKEKE 456
||||||||||||||||||||||||||||||||||||||||
639 KIKSLTDYMQNMQQRRQREESQDSLSEELAKLAQEKMHEVSFQDKEKE 688
....
457 HLTRLQDAEEMKKALEQQMESHREAHQKQLSLRRDEIEEKQKIIDEIRDL 506
||||||||||||||||||||||||||||||||||||||||
689 HLTRLQDAEEMKKALEQQMESHREAHQKQLSLRRDEIEEKQKIIDEIRDL 738
....
507 NQKLQLEQEKLSSDYNKLKIEDQ EREMKLEKLLLLNDKREQAREDLKGLE 556
||||||||||||||||||||||||||||||||||||||||
739 NQKLQLEQEKLSSDYNKLKIEDQ EREMKLEKLLLLNDKREQAREDLKGLE 788
....
557 ETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLE 606
||||||||||||||||||||||||||||||||||||||||
789 ETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLE 838
....
607 NNLEQLTKVHKQLVRDNADLRCELPKLEKLRATAA VKALESALKEAKE 656
||||||||||||||||||||||||||||||||||||||||
839 NNLEQLTKVHKQLVRDNADLRCELPKLEKLRATAA VKALESALKEAKE 888
....
657 NAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPRPGHYPASSPTA 706
||||||||||||||||||||||||||||||||||||||||
889 NAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPRPGYPASSPTA 938
.
707 VHAIRGGGGSSNSTHTHYQK 725
||||||||||||||||||
939 VHAIRGGGGSSNSTHYQK 957






Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P5 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 6520.00 Escore: 0
Matching length: 674 Total length: 674
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MTRILQDSLGGNCRTTIVICCSSPSVFNEAETKSTLMFGQRAKTIKNTSVSV 50
||||||||||||||||||||||||||||||||||||||||
284 MTRILQDSLGGNCRTTIVICCSSPSVFNEAETKSTLMFGQRAKTIKNTVSV 333
....
51 NLELTAEEWKKKYEKEK EK NKTLKNVIQHLEMELNRWRNGEAVPDEQIS 100
||||||||||||||||||||||||||||||||||||||||
334 NLELTAEEWKKKYEKEK EK NKTLKNVIQHLEMELNRWRNGEAVPPEQIS 383
....
101 AKDQK NLEPCD NTP IIDNIAPV VAGISTEEKEKYDEEISSLYRQLDDKDD 150
||||||||||||||||||||||||||||||||||||||||
384 AKDQKN LEPCDNTPIID NIAPV VAGISTEEKEKYDEEISSLYRQLDDKDD 433
....
151 EINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDE 200
||||||||||||||||||||||||||||||||||||||||
434 EINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDE 483
....
201 VKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQREL 250
||||||||||||||||||||||||||||||||||||||||
484 VKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQREL 533
....
251 SQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEE 300
||||||||||||||||||||||||||||||||||||||||
534 SQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEE 583
....
301 FTMARLYISKMKSEVKSLVNRSKLESAQMDSNRKMNASERELAACQLLI 350
||||||||||||||||||||||||||||||||||||||||
584 FTMARLYISKMKSEVKSLVNRSKLESAQMDSNRKMNASERELAACQLLI 633
....
351 SQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQ 400
||||||||||||||||||||||||||||||||||||||||
634 SQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLAQEKMHEVSFQ 683
....
401 DKEKEHLTRLQDAEEMCKALEQQMESHREAHQKQLSRLRDEIEEKQKIID 450
||||||||||||||||||||||||||||||||||||||||
684 DKEKEHLTRLQDAEEMCKALEQQMESHREAHQKQLSRLRDEIEEKQKIID 733
....
451 EIRDLNQKLQLEQEKLSSDYNKLKIEDQ EREMKLEKLLLLNDKREQARED 500
||||||||||||||||||||||||||||||||||||||||
734 EIRDLNQKLQLEQEKLSSDYNKLKIEDQ EREMKLEKLLLLNDKREQARED 783
....
501 LKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQK 550
||||||||||||||||||||||||||||||||||||||||
784 LKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQK 833
....
551 ISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKLRATAERVKALESAL 600
||||||||||||||||||||||||||||||||||||||||
834 ISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKLRATAERVKALESAL 883
....
601 KEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPRPGHYPA 650
||||||||||||||||||||||||||||||||||||||||
884 KEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPRPGHYPA 933
.
651 SSPTAVHAIRGGGGSSNSTHYQK 674
|||||||||||||||||||||||
934 SSPTAVHAIRGGGGSSNSTHYQK 957






Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P3 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 5726.00 Escore: 0
Matching length: 593 Total length: 593
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MELNRWRNGEAVPEDEQISAKDQ KNLE PCD NTP IID NIAP V VAGISTEEK 50
||||||||||||||||||||||||||||||||||||||||
365 MELNRWRNGEAVPEDEQISAKDQ KNLE PCD NTP IID NIAP V VAGISTEEK 414
....
51 EKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYE 100
||||||||||||||||||||||||||||||||||||||||
415 EKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYE 464
....
101 KIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQ 150
||||||||||||||||||||||||||||||||||||||||
465 KIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQ 514
....
151 LTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGI 200
||||||||||||||||||||||||||||||||||||||||
515 LTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGI 564
....
201 IGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMD 250
||||||||||||||||||||||||||||||||||||||||
565 IGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKLESAQMD 614
....
251 SNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSL 300
||||||||||||||||||||||||||||||||||||||||
615 SNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSL 664
....
301 SEELAKLRAQEKMHEVSF QDKEKEHLTRLQDAEEMCKALEQQMESHREAH 350
||||||||||||||||||||||||||||||||||||||||
665 SEELAKLRAQEKMHEVSF QDKEKEHLTRLQDAEEMCKALEQQMESHREAH 714
....
351 QKQSLSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSDSYNKLKIEDQERE 400
||||||||||||||||||||||||||||||||||||||||
715 QKQSLSRLRDEIEEKQKIIDEIRDLNQ KLQLEQEKLSDSYNKLKIEDQERE 764
....
401 MKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVK 450
||||||||||||||||||||||||||||||||||||||||
765 MKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVK 814
....
451 KSVELDNDDGGGSAAQKQ KISFLENNLEQLTKVHKQLVRDNADLRCELPK 500
||||||||||||||||||||||||||||||||||||||||
815 KSVELDNDDGGGSAAQKQ KISFLENNLEQLTKVHKQLVRDNADLRCELPK 864
....
501 LEKRLATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMA 550
||||||||||||||||||||||||||||||||||||||||
865 LEKRLATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMA 914
....
551 RRAHSAQIAKPRPGYPASSPTAVHAIRGGGGSSNSTHYQK 593
|||||||||||||||||||||||||||||||||||||
915 RRAHSAQ IAKPIRPGHYPASSPTAVHAIRGGGGSSNSTHYQK 957






Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P7 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 2117.00 Escore: 0
Matching length: 220 Total length: 220
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
20 LNQKLQLEQEKLSSDYNKLKIEDQ EREMKLEKLLLLNDKREQAREDLKGL 69
||||||||||||||||||||||||||||||||||||||||
738 LNQKLQLEQEKLSSDYNKLKIEDQ EREMKLEKLLLLNDKREQAREDLKGL 787
....
70 EETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFL 119
||||||||||||||||||||||||||||||||||||||||
788 EETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFL 837
....
120 ENNLEQLTKVHKQLVRDNADLRCELPKLEKLRATAA VKALESALKEAK 169
||||||||||||||||||||||||||||||||||||||||
838 ENNLEQLTKVHKQLVRDNADLRCELPKLEKLRATAA VKALESALKEAK 887
....
170 ENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPRPGYPASSPT 219
||||||||||||||||||||||||||||||||||||||||
888 ENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPRPGYPASSPT 937
.
220 AVHAIRGGGGSSNSTHYQK 239
|||||||||||||||||||
938 AVHAIRGGGGSSNSTHYQK 957






Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P8 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 7146.00 Escore: 0
Matching length: 737 Total length: 737
Matching Percent Similarity: 100.00 Matching Percent Identity: 99.86
Total Percent Similarity: 100.00 Total Percent Identity: 99.86
Gaps: 0

Alignment:
....
1 1
||||||||||||||||||||||||||||||||||||||||
1 1
....
51 RVLPPTNTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
||||||||||||||||||||||||||||||||||||||||
51 RVLPPTNTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
....
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
||||||||||||||||||||||||||||||||||||||||
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
....
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
||||||||||||||||||||||||||||||||||||||||
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
....
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
||||||||||||||||||||||||||||||||||||||||
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
....
251 EAKNINKSLSALGNNVISALAEGTKTHVPYRDSKTMRILQDSLGGNCRTTI 300
||||||||||||||||||||||||||||||||||||||||
251 EAKNINKSLSALGNNVISALAEGTKTHVPYRDSKTMRILQDSLGGNCRTTI 300
....
301 VICCSSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEK 350
||||||||||||||||||||||||||||||||||||||||
301 VICCSSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEK 350
....
351 EKNKTLKNVIQHLEMELNRWRNGEAVPPEQISAKDQ KNLE PCD NTPIID 400
||||||||||||||||||||||||||||||||||||||||
351 EKNKTLKNVIQHLEMELNRWRNGEAVPPEQISAKDQ KNLE PCD NTPIID 400
....
401 NIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQ 450
||||||||||||||||||||||||||||||||||||||||
401 NIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQ 450
....
451 DQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQ 500
||||||||||||||||||||||||||||||||||||||||
451 DQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQ 500
....
501 KSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEI 550
||||||||||||||||||||||||||||||||||||||||
501 KSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEI 550
....
551 LNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKS 600
||||||||||||||||||||||||||||||||||||||||
551 LNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKS 600
....
601 LVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNM 650
||||||||||||||||||||||||||||||||||||||||
601 LVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNM 650
....
651 EQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMK 700
||||||||||||||||||||||||||||||||||||||||
651 EQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMK 700
....
701 KALEQQMESHREAHQKQLSLRRDEIEEKQKIIDEIRE 737
||||||||||||||||||||||||||||||: |
701 KALEQQMESHREAHQKQLSLRLRDEIEEKQKIIDEIRD 737






Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P9 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 4434.00 Escore: 0
Matching length: 454 Total length: 454
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 1
||||||||||||||||||||||||||||||||||||||||
1 1
....
51 RVLPPTNTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
||||||||||||||||||||||||||||||||||||||||
51 RVLPPTNTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
....
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
||||||||||||||||||||||||||||||||||||||||
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
....
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
||||||||||||||||||||||||||||||||||||||||
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
....
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
||||||||||||||||||||||||||||||||||||||||
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
....
251 EAKNINKSLSALGNNVISALAEGTKTHVPYRDSKTMRILQDSLGGNCRTTI 300
||||||||||||||||||||||||||||||||||||||||
251 EAKNINKSLSALGNNVISALAEGTKTHVPYRDSKTMRILQDSLGGNCRTTI 300
....
301 VICCSSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEK 350
||||||||||||||||||||||||||||||||||||||||
301 VICCSSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEK 350
....
351 EKNKTLKNVIQHLEMELNRWRNGEAVPPEQISAKDQ KNLE PCD NTPIID 400
||||||||||||||||||||||||||||||||||||||||
351 EKNKTLKNVIQHLEMELNRWRNGEAVPPEQISAKDQ KNLE PCD NTPIID 400
....
401 NIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQ 450
||||||||||||||||||||||||||||||||||||||||
401 NIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQ 450

451 DQDE 454
|||||
451 DQDE 454






Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P10 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 747.00 Escore: 0
Matching length: 78 Total length: 78
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
20 LNQKLQLEQEKLSSDYNKLKIEDQ EREMKLEKLLLLNDKREQAREDLKGL 69
||||||||||||||||||||||||||||||||||||||||
738 LNQKLQLEQEKLSSDYNKLKIEDQ EREMKLEKLLLLNDKREQAREDLKGL 787
.
70 EETVSRELQTLHNLRKLFVQDLTTRVKK 97
||||||||||||||||||||||||||
788 EETVSRELQTLHNLRKLFVQDLTTRVKK 815






Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P11 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 3634.00 Escore: 0
Matching length: 372 Total length: 372
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 1
||||||||||||||||||||||||||||||||||||||||
1 1
....
51 RVLPPTNTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
||||||||||||||||||||||||||||||||||||||||
51 RVLPPTNTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
....
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
||||||||||||||||||||||||||||||||||||||||
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
....
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
||||||||||||||||||||||||||||||||||||||||
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
....
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
||||||||||||||||||||||||||||||||||||||||
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
....
251 EAKNINKSLSALGNNVISALAEGTKTHVPYRDSKTMRILQDSLGGNCRTTI 300
||||||||||||||||||||||||||||||||||||||||
251 EAKNINKSLSALGNNVISALAEGTKTHVPYRDSKTMRILQDSLGGNCRTTI 300
....
301 VICCSSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEK 350
||||||||||||||||||||||||||||||||||||||||
301 VICCSSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEK 350
.
351 EKNKTLKNVIQHLEMELNRWRN 372
|||||||||||||||||||||
351 EKNKTLKNVIQHLEMELNRWRN 372






Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P12 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 3145.00 Escore: 0
Matching length: 323 Total length: 323
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 1
||||||||||||||||||||||||||||||||||||||||
1 1
....
51 RVLPPTNTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
||||||||||||||||||||||||||||||||||||||||
51 RVLPPTNTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
....
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
||||||||||||||||||||||||||||||||||||||||
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
....
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
||||||||||||||||||||||||||||||||||||||||
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
....
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
||||||||||||||||||||||||||||||||||||||||
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
....
251 EAKNINKSLSALGNNVISALAEGTKTHVPYRDSKTMRILQDSLGGNCRTTI 300
||||||||||||||||||||||||||||||||||||||||
251 EAKNINKSLSALGNNVISALAEGTKTHVPYRDSKTMRILQDSLGGNCRTTI 300
.
301 VICCSSPSVFNEAETKSTLMFGQR 323
||||||||||||||||||||||
301 VICCSSPSVFNEAETKSTLMFGQR 323


正常および癌性肺組織における配列名M62069seg19中に示すアンプリコンによって検出可能なホモ・サピエンスタンパク質チロシンホスファターゼ受容体S型(PTPRS)M62069転写物の発現
seg19、M62069seg19アンプリコン(配列番号1657)、ならびにM62069seg19F(配列番号1655)およびM62069seg19R(配列番号1656)プライマーによって検出可能なホモ・サピエンスタンパク質チロシンホスファターゼ受容体S型(PTPRS)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
Expression of homo-Sapiens protein tyrosine phosphatase receptor type S (PTPRS) M62069 transcripts detectable by an amplicon as shown in sequence name M62069 seg19 in normal and cancerous lung tissue seg19, M62069 seg19 amplicon (SEQ ID NO: 1657), and M62069 seg 19 F The expression of homo sapiens protein tyrosine phosphatase receptor type S (PTPRS) transcripts detectable by (SEQ ID NO: 1655) and M62069 seg 19 R (SEQ ID NO: 1656) primers was measured by real-time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – PBGD-Amplicon, SEQ ID No. 334), HPRT1 (GenBank Accession No. NM_000194, Amplicon – HPRT1- Amplicons, SEQ ID NO: 1297), Ubiquitin (GenBank Accession No. BC000449, Amplicon – Ubiquitin-Amplicon SEQ ID NO: 328), and SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA-Amplicon SEQ ID NO: 331) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. Normalized PM samples by dividing the normalized volume of each RT sample by the median volume of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99, Table 2 above) Magnifications of upregulation of each sample to the median of were obtained.

図65は、正常サンプルと比較した癌性肺サンプルにおける上記ホモ・サピエンスタンパク質チロシンホスファターゼ受容体S型(PTPRS)転写物の過剰発現を示すヒストグラムである。値は、2連の実験の平均を示す。エラーバーは、得られた最小値および最大値を示す。   FIG. 65 is a histogram showing over expression of the Homo sapiens protein tyrosine phosphatase receptor S type (PTPRS) transcript in cancerous lung samples compared to normal samples. Values represent the average of duplicate experiments. Error bars indicate the obtained minimum and maximum values.

図65から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンスタンパク質チロシンホスファターゼ受容体S型(PTPRS)転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2)よりも有意に高かった。明白には、15個の腺癌サンプルのうち2個および8個の小細胞癌サンプルのうち8個で少なくとも5倍の過剰発現が見出された。   As apparent from FIG. 65, the expression of the homo-Sapiens protein tyrosine phosphatase receptor type S (PTPRS) transcript detectable by the above amplicon in the cancer sample is a non-cancerous sample (sample numbers 47 to 50, 90) ~ 93, 96-99 (Table 2) were significantly higher. Apparently, at least 5-fold overexpression was found in 2 out of 15 adenocarcinoma samples and 8 out of 8 small cell carcinoma samples.

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:M62069seg19F順方向プライマーおよびM62069seg19R逆方向プライマー。   Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used only as non-limiting examples of suitable primer pairs: M62069 seg19F forward primer and M62069 seg19 R reverse Direction primer.

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:M62069seg19。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : M62069 seg19.

順方向プライマー−M62069seg19F(配列番号1655):GCTGATTGTCCCCATGAAGG
逆方向プライマー−M62069seg19(配列番号1656):TGGCATACGGGAACTCAGTG
アンプリコン(配列番号1657):GCTGATTGTCCCCATGAAGGCCAGCCTTGAAGCTTGGTCAGTCTCCCTAACTGTATGATTGATCCCCACTTATTGCACTACATCACTGAGTTCCCGTATGC
Forward primer-M62069seg19F (SEQ ID NO: 1655): GCTGATTGTCCCCATGAAGG
Reverse primer-M62069 seg 19 (SEQ ID NO: 1656): TGGCATACGGGAACTCAGTG
Amplicon (SEQ ID NO: 1657): GCTGATTGTCCCCATGAAGGCCCAGCCTTGAAATCTTGGTCAGTCTCCTACTAACTG TATGATTGATCCCACTTATTGCACTACATCACTGAGTTCCCCGTATGC

正常および癌性肺組織における配列名M62069seg29中に示すアンプリコンによって検出可能なホモ・サピエンスタンパク質チロシンホスファターゼ受容体S型(PTPRS)M62069転写物の発現
seg29、M62069seg29アンプリコン(配列番号1660)、ならびにM62069seg29F(配列番号1658)およびM62069seg29R(配列番号1659)プライマーによって検出可能なホモ・サピエンスタンパク質チロシンホスファターゼ受容体S型(PTPRS)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
Expression of homo-sapiens protein tyrosine phosphatase receptor type S (PTPRS) M62069 transcripts detectable by an amplicon as shown in sequence name M62069 seg29 in normal and cancerous lung tissue seg29, M62069 seg29 amplicon (SEQ ID NO: 1660), and M62069 seg29 F The expression of homo sapiens protein tyrosine phosphatase receptor type S (PTPRS) transcripts detectable by (SEQ ID NO: 1658) and M62069 seg 29 R (SEQ ID NO: 1659) primers was measured by real-time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – PBGD-Amplicon, SEQ ID No. 334), HPRT1 (GenBank Accession No. NM_000194, Amplicon – HPRT1- Amplicons, SEQ ID NO: 1297), Ubiquitin (GenBank Accession No. BC000449, Amplicon – Ubiquitin-Amplicon SEQ ID NO: 328), and SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA-Amplicon SEQ ID NO: 331) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. Normalized PM samples by dividing the normalized volume of each RT sample by the median volume of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99, Table 2 above) Magnifications of upregulation of each sample to the median of were obtained.

図66は、正常サンプルと比較した癌性肺サンプルにおける上記ホモ・サピエンスタンパク質チロシンホスファターゼ受容体S型(PTPRS)転写物の過剰発現を示すヒストグラムである。値は、2連の実験の平均を示す。エラーバーは、得られた最小値および最大値を示す。   FIG. 66 is a histogram showing over expression of the Homo sapiens protein tyrosine phosphatase receptor type S (PTPRS) transcript in cancerous lung samples compared to normal samples. Values represent the average of duplicate experiments. Error bars indicate the obtained minimum and maximum values.

図66から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンスタンパク質チロシンホスファターゼ受容体S型(PTPRS)転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2)よりも有意に高かった。明白には、15個の腺癌サンプルのうち2個および8個の小細胞癌サンプルのうち7個で少なくとも5倍の過剰発現が見出された。   As apparent from FIG. 66, the expression of the homo-Sapiens protein tyrosine phosphatase receptor type S (PTPRS) transcript detectable by the above amplicon in a cancer sample is a non-cancerous sample (sample numbers 47 to 50, 90) ~ 93, 96-99 (Table 2) were significantly higher. Clearly, at least 5-fold overexpression was found in 2 out of 15 adenocarcinoma samples and 7 out of 8 small cell carcinoma samples.

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:M62069seg29F順方向プライマーおよびM62069seg29R逆方向プライマー。   Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used only as non-limiting examples of suitable primer pairs: M62069 seg 29 F forward primer and M 620 69 seg 29 R reverse Direction primer.

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:M62069seg29。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : M62069 seg 29.


順方向プライマー−M62069seg29F:ATTGAATAATTCAGCACCTGAGGC
逆方向プライマー−M62069seg29R:TTCATATGGCTACTCCCCACCT
アンプリコン:ATTGAATAATTCAGCACCTGAGGCTGGTGGATGATTCTTTGCAATTTGGCAGGAATGGGAGAGTCGGGAGCAGTAGTTGGCAAGGTGGGGAGTAGCCATATGAA

Forward primer-M62069seg29F: ATTGAATAATTCAGCACCTGAGGC
Reverse primer-M62069 seg 29 R: TTCATATGGCTACTCCCC ACCT
Amplicon: ATTGAATAATTCAGCACCTGAGGCTGGTGATGATTCTTTGCAATTTGGCAGGAATGGGAGAGTCGGAGCAGTAGTTGGCAAGGTGGGGAGCCATATGAA

クラスターM78076の説明
クラスターM78076は、目的の9つの転写物および35個のセグメントを特徴とし、その名称を、それぞれ表686および687に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表688に示す。
Description of Cluster M78076 Cluster M78076 features 9 transcripts of interest and 35 segments, the names of which are shown in Tables 686 and 687 respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 688.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるアミロイド様タンパク質1前駆体(SwissProtアクセッション識別子APP1_HUMAN、同義語APLP、APLP−1としても公知である)(配列番号1439)の変異型である。   These sequences are known proteins called amyloid-like protein 1 precursor (SwissProt accession identifier APP1_HUMAN, also known as synonym APLP, APLP-1), which is a known protein, previously known herein as a protein (sequence No. 1439).

タンパク質アミロイド様タンパク質1前駆体は、以下の機能を有することが公知であるか、そのように見なされている:シナプス後機能で役割を果たし得る。C末端γセクレターゼプロセシングフラグメント(ALID1)は、APBB1(Fe65)結合によって転写活性化を活性化する(類似性による)。C末端結合を介してJIPシグナル変換に関連する。細胞Gタンパク質シグナル伝達経路と相互作用し得る。ヘパリンおよびI型コラーゲンなどの細胞外基質成分への結合によって神経突起伸長を調節することができる。γ−CTFペプチドC30は、神経アポトーシスの強力なエンハンサーである(類似性による)。タンパク質アミロイド様タンパク質1前駆体の配列を、「アミロイド様タンパク質1前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表689に示す。   Protein Amyloid-like protein 1 precursor is known or is considered to have the following functions: It may play a role in postsynaptic function. The C-terminal gamma secretase processing fragment (ALID1) activates transcriptional activation by APBB1 (Fe65) binding (by similarity). Related to JIP signal conversion through C-terminal binding. It can interact with cellular G protein signaling pathways. Neurite outgrowth can be modulated by binding to extracellular matrix components such as heparin and type I collagen. The γ-CTF peptide C30 is a potent enhancer of neural apoptosis (by similarity). The sequence of the protein amyloid-like protein 1 precursor is shown at the end of the application as "amyloid-like protein 1 precursor amino acid sequence". Known polymorphisms of this sequence are shown in Table 689.

Figure 2008507261
Figure 2008507261

タンパク質アミロイド様タンパク質1前駆体の局在化は、I型膜タンパク質と考えられる。ゴルジ複合体でのC末端プロセシング。   The localization of the protein amyloid-like protein 1 precursor is considered to be a type I membrane protein. C-terminal processing at the Golgi complex.

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けであるエンドサイトーシス、アポトーシス、細胞接着、ニューロン新生、細胞死、分子機能に関連する注釈付けであるタンパク質結合、ヘパリン結合、および細胞成分に関連する注釈付けである基底膜、被覆小窩、内在性膜タンパク質。   The following GO annotation applies to previously known proteins. The following annotations have been found: annotation related to biological processes endocytosis, apoptosis, cell adhesion, neurogenesis, cell death, protein binding annotated related to molecular function, heparin binding And basement membranes that are annotations related to cellular components, coated pits, integral membrane proteins.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

上記のように、クラスターM78076は、上の表1に列挙した9つの転写物を特徴とする。これらの転写物は、タンパク質アミロイド様タンパク質1前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster M78076 is characterized by the nine transcripts listed in Table 1 above. These transcripts encode proteins which are variants of the protein amyloid-like protein 1 precursor. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質M78076_PEA_1_P3は、出願書類の最後に示すアミノ酸配列を有し、転写物M78076_PEA_1_T2によってコードされる。公知のタンパク質(アミロイド様タンパク質1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein M78076_PEA_1_P3 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript M78076_PEA_1_T2. An alignment to a known protein (amyloid-like protein 1 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

M78076_PEA_1_P3とAPP1_HUMANとの間の比較の報告
1.APP1_HUMANのアミノ酸1〜517に対応し、M78076_PEA_1_P3のアミノ酸1〜517にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P3のアミノ酸518〜519に対応する配列GEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P3をコードする単離キメラポリペプチド。
Report of the comparison between M78076_PEA_1_P3 and APP1_HUMAN 1. Corresponding to amino acids 1 to 517 of APP1_HUMAN, corresponding to amino acids 1 to 517 of M78076_PEA_1_P3 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHT The first amino acid sequence at least 90% homologous to EibuibuijikeibuitiPitiPiaruPitidijibuidiaiwaiefujiemuPijiiaiesuieichiijiefueruarueikeiemudieruiiaruaruemuarukyuaienuibuiemuaruidaburyueiemueidienukyuesukeienueruPikeieidiarukyueieruenuieichiefukyuesuaierukyutieruiikyubuiesujiiarukyuaruerubuiitieichieitiarubuiaieieruaienudikyuaruarueieieruijiefuerueieierukyueidiPiPikyueiiarubuieruerueieruaruaruwaieruarueiikyukeiikyuarueichitieruarueichiwaikyueichibuieieibuidiPiikeieikyukyuemuaruefukyubuieichitieichierukyubuiaiiiarubuienukyuesuerujieruerudikyuenuPieichierueikyuieruaruPikyuaikyuieruerueichiesuieichieruJipiSELEAPAPGGSSEDKGGLQPPDSKD, polypeptide at least 70% with the sequence GE corresponding to amino acids 518-519 of M78076_PEA_1_P3, optionally at least 80% Preferably, it comprises a second amino acid sequence that is at least 85%, more preferably at least 90%, most preferably at least 95% homologous, said first amino acid sequence and said second amino acid sequence being contiguous and contiguous An isolated chimeric polypeptide encoding M78076_PEA_1_P3 in order.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質M78076_PEA_1_P3はまた、表690に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P3配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M78076_PEA_1_P3 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing the other amino acids, and listing the other amino acids, as shown in Table 690), and the last column is the SNP It is shown whether it is known and the presence of a known SNP in the mutein M78076_PEA_1_P3 sequence supports the putative sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質アミロイド様タンパク質1前駆体と比較した変異タンパク質M78076_PEA_1_P3のグリコシル化部位を表691に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of mutant protein M78076_PEA_1_P3 compared to the known protein amyloid-like protein 1 precursor are shown in Table 691 (showing its position on the amino acid sequence in the first column, the second column has glycosylation sites It indicates whether it is present in the mutein and the last column shows whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質M78076_PEA_1_P3は、以下の転写物によってコードされる:M78076_PEA_1_T2(配列は出願書類の最後に示す)。転写物M78076_PEA_1_T2のコード部分を太字で示し、このコード部分は142位から開始され、1698位で終結する。転写物はまた、表692に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P3配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M78076_PEA_1_P3 is encoded by the following transcript: M78076_PEA_1_T2 (sequences shown at the end of the application). The code portion of transcript M78076_PEA_1_T2 is shown in bold, this code portion starts at position 142 and ends at position 1698. The transcript also has the following SNPs listed in Table 692 (showing its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein M78076_PEA_1_P3 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

本発明の変異タンパク質M78076_PEA_1_P4は、出願書類の最後に示すアミノ酸配列を有し、転写物M78076_PEA_1_T3によってコードされる。公知のタンパク質(アミロイド様タンパク質1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein M78076_PEA_1_P4 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript M78076_PEA_1_T3. An alignment to a known protein (amyloid-like protein 1 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

M78076_PEA_1_P4とAPP1_HUMANとの間の比較の報告
1.APP1_HUMANのアミノ酸1〜526に対応し、M78076_PEA_1_P4のアミノ酸1〜526にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P4のアミノ酸527〜541に対応する配列ECLTVNPSLQIPLNPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P4をコードする単離キメラポリペプチド。
Report of the comparison between M78076_PEA_1_P4 and APP1_HUMAN 1. Corresponding to amino acids 1 to 526 of APP1_HUMAN, corresponding to amino acids 1 to 526 of M78076_PEA_1_P4 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHT The first amino acid sequence at least 90% homologous to EibuibuijikeibuitiPitiPiaruPitidijibuidiaiwaiefujiemuPijiiaiesuieichiijiefueruarueikeiemudieruiiaruaruemuarukyuaienuibuiemuaruidaburyueiemueidienukyuesukeienueruPikeieidiarukyueieruenuieichiefukyuesuaierukyutieruiikyubuiesujiiarukyuaruerubuiitieichieitiarubuiaieieruaienudikyuaruarueieieruijiefuerueieierukyueidiPiPikyueiiarubuieruerueieruaruaruwaieruarueiikyukeiikyuarueichitieruarueichiwaikyueichibuieieibuidiPiikeieikyukyuemuaruefukyubuieichitieichierukyubuiaiiiarubuienukyuesuerujieruerudikyuenuPieichierueikyuieruaruPikyuaikyuieruerueichiesuieichieruJipiesuieruieipieipijiGSSEDKGGLQPPDSKDDTPMTLPKG, polypeptide few having a sequence corresponding to ECLTVNPSLQIPLNP to amino acid 527-541 of M78076_PEA_1_P4 Said first amino acid sequence comprising a second amino acid sequence of at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; An isolated chimeric polypeptide encoding M78076_PEA_1_P4, wherein the second amino acid sequence is in contiguous and sequential order.

2.M78076_PEA_1_P4中の配列ECLTVNPSLQIPLNPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M78076_PEA_1_P4のテールをコードする単離ポリペプチド。   2. Of M78076_PEA_1_P4 comprising a polypeptide at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence ECLTVNPSLQIPLNP in M78076_PEA_1_P4 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質M78076_PEA_1_P4はまた、表693に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M78076_PEA_1_P4 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 693) It is shown whether it is known and the presence of a known SNP in the mutein M78076_PEA_1_P4 sequence supports the putative sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質アミロイド様タンパク質1前駆体と比較した変異タンパク質M78076_PEA_1_P4のグリコシル化部位を表694に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of mutant protein M78076_PEA_1_P4 compared to the known protein amyloid-like protein 1 precursor are shown in Table 694 (showing its position on the amino acid sequence in the first column, the second column has glycosylation sites It indicates whether it is present in the mutein and the last column shows whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質M78076_PEA_1_P4は、以下の転写物によってコードされる:M78076_PEA_1_T3(配列は出願書類の最後に示す)。転写物M78076_PEA_1_T3のコード部分を太字で示し、このコード部分は142位から開始され、1764位で終結する。転写物はまた、表695に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M78076_PEA_1_P4 is encoded by the following transcript: M78076_PEA_1_T3 (sequences shown at the end of the application). The code portion of the transcript M78076_PEA_1_T3 is shown in bold, starting from position 142 and ending at position 1764. The transcript also has the following SNPs listed in Table 695 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein M78076_PEA_1_P4 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

本発明の変異タンパク質M78076_PEA_1_P12は、出願書類の最後に示すアミノ酸配列を有し、転写物M78076_PEA_1_T13によってコードされる。公知のタンパク質(アミロイド様タンパク質1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein M78076_PEA_1_P12 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript M78076_PEA_1_T13. An alignment to a known protein (amyloid-like protein 1 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

M78076_PEA_1_P12とAPP1_HUMANとの間の比較の報告
1.APP1_HUMANのアミノ酸1〜526に対応し、M78076_PEA_1_P12のアミノ酸1〜526にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P12のアミノ酸527〜544に対応する配列ECVCSKGFPFPLIGDSEGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P12をコードする単離キメラポリペプチド。
Report of the comparison between M78076_PEA_1_P12 and APP1_HUMAN 1. Corresponding to amino acids 1 to 526 of APP1_HUMAN, corresponding to amino acids 1 to 526 of M78076_PEA_1_P12 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSH A first amino acid sequence at least 90% homologous to ErueibuibuijikeibuitiPitiPiaruPitidijibuidiaiwaiefujiemuPijiiaiesuieichiijiefueruarueikeiemudieruiiaruaruemuarukyuaienuibuiemuaruidaburyueiemueidienukyuesukeienueruPikeieidiarukyueieruenuieichiefukyuesuaierukyutieruiikyubuiesujiiarukyuaruerubuiitieichieitiarubuiaieieruaienudikyuaruarueieieruijiefuerueieierukyueidiPiPikyueiiarubuieruerueieruaruaruwaieruarueiikyukeiikyuarueichitieruarueichiwaikyueichibuieieibuidiPiikeieikyukyuemuaruefukyubuieichitieichierukyubuiaiiiarubuienukyuesuerujieruerudikyuenuPieichierueikyuieruaruPikyuaikyuieruerueichiesuieichieruJipiesuieruieipieipijiGSSEDKGGLQPPDSKDDTPMTLPKG, Poripe having a sequence corresponding to ECVCSKGFPFPLIGDSEG to amino acid 527-544 of M78076_PEA_1_P12 Said first amino acid sequence comprising a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to And an isolated chimeric polypeptide encoding M78076_PEA_1_P12, wherein the second amino acid sequence is adjacent and in sequential order.

2.M78076_PEA_1_P12中の配列ECVCSKGFPFPLIGDSEGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M78076_PEA_1_P12のテールをコードする単離ポリペプチド。   2. M78076_PEA_1_P12 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence ECVCSKGFPFPLI GDSEG in M78076_PEA_1_P12 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質M78076_PEA_1_P12はまた、表696に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P12配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M78076_PEA_1_P12 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, enumerating other amino acids, and the last column shows SNPs as shown in Table 696) It indicates whether it is known and the presence of a known SNP in the mutein M78076_PEA_1_P12 sequence supports the predicted sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質アミロイド様タンパク質1前駆体と比較した変異タンパク質M78076_PEA_1_P12のグリコシル化部位を表697に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutated protein M78076_PEA_1_P12 compared to the known protein amyloid-like protein 1 precursor are shown in Table 697 (showing its position on the amino acid sequence in the first column, the second column has glycosylation sites It indicates whether it is present in the mutein and the last column shows whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質M78076_PEA_1_P12は、以下の転写物によってコードされる:M78076_PEA_1_T13(配列は出願書類の最後に示す)。転写物M78076_PEA_1_T13のコード部分を太字で示し、このコード部分は142位から開始され、1773位で終結する。転写物はまた、表698に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P12配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M78076_PEA_1_P12 is encoded by the following transcript: M78076_PEA_1_T13 (sequences shown at the end of the application). The code portion of transcript M78076_PEA_1_T13 is shown in bold, this code portion starting at position 142 and ending at position 1773. The transcript also has the following SNPs listed in Table 698 (showing its position on the nucleotide sequence and listing another nucleic acid, the last column shows whether the SNP is known, mutein M78076_PEA_1_P12 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

本発明の変異タンパク質M78076_PEA_1_P14は、出願書類の最後に示すアミノ酸配列を有し、転写物M78076_PEA_1_T15によってコードされる。公知のタンパク質(アミロイド様タンパク質1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein M78076_PEA_1_P14 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript M78076_PEA_1_T15. An alignment to a known protein (amyloid-like protein 1 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

M78076_PEA_1_P14とAPP1_HUMANとの間の比較の報告
1.APP1_HUMANのアミノ酸1〜570に対応し、M78076_PEA_1_P14のアミノ酸1〜570にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKVNASVPRGFPFHSSEIQRDELと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P14のアミノ酸571〜619に対応する配列VRGGTAGYLGEETRGQRPGCDSQSHTGPSKKPSAPSPLPAGTSWDRGVPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P14をコードする単離キメラポリペプチド。
Report of the comparison between M78076_PEA_1_P14 and APP1_HUMAN 1. Corresponding to amino acids 1 to 570 of APP1_HUMAN, corresponding to amino acids 1 to 570 of M78076_PEA_1_P14 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSH The first amino acid sequence at least 90% homologous to LAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKVNASVPRGFPFHSSEIQRDEL, M78076_PEA_1_P14 The polypeptide having the sequence VRGGTAGYLGEETRGQRPGCDSQSHTGPSKKPSAPSPLPAGTSWDRGVP corresponding to amino acids 571-619 is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous An isolated chimeric polypeptide encoding M78076_PEA_1_P14, comprising an amino acid sequence, wherein said first and second amino acid sequences are adjacent and in sequential order.

2.M78076_PEA_1_P14中の配列VRGGTAGYLGEETRGQRPGCDSQSHTGPSKKPSAPSPLPAGTSWDRGVPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M78076_PEA_1_P14のテールをコードする単離ポリペプチド。   2. M78076_PEA_1_P14 comprising a polypeptide that is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質M78076_PEA_1_P14はまた、表699に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M78076_PEA_1_P14 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 699) It is shown whether it is known and the presence of a known SNP in the mutein M78076_PEA_1_P14 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質アミロイド様タンパク質1前駆体と比較した変異タンパク質M78076_PEA_1_P14のグリコシル化部位を表700に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of mutant protein M78076_PEA_1_P14 compared to the known protein amyloid-like protein 1 precursor are shown in Table 700 (showing its position on the amino acid sequence in the first column, the second column has glycosylation sites It indicates whether it is present in the mutein and the last column shows whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質M78076_PEA_1_P14は、以下の転写物によってコードされる:M78076_PEA_1_T15(配列は出願書類の最後に示す)。転写物M78076_PEA_1_T15のコード部分を太字で示し、このコード部分は142位から開始され、1998位で終結する。転写物はまた、表701に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M78076_PEA_1_P14 is encoded by the following transcript: M78076_PEA_1_T15 (sequences shown at the end of the application). The coding part of the transcript M78076_PEA_1_T15 is shown in bold, starting from position 142 and ending at position 1998. The transcript also has the following SNPs listed in Table 701 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein M78076_PEA_1_P14 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

本発明の変異タンパク質M78076_PEA_1_P21は、出願書類の最後に示すアミノ酸配列を有し、転写物M78076_PEA_1_T23によってコードされる。公知のタンパク質(アミロイド様タンパク質1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein M78076_PEA_1_P21 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript M78076_PEA_1_T23. An alignment to a known protein (amyloid-like protein 1 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

M78076_PEA_1_P21とAPP1_HUMANとの間の比較の報告
1.APP1_HUMANのアミノ酸1〜352に対応し、M78076_PEA_1_P21のアミノ酸1〜352にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEと少なくとも90%相同な第1のアミノ酸配列と、APP1_HUMANのアミノ酸406〜650に対応し、M78076_PEA_1_P21のアミノ酸353〜597にも対応するAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKVNASVPRGFPFHSSEIQRDELAPAGTGVSREAVSGLLIMGAGGGSLIVLSMLLLRRKKPYGAISHGVVEVDPMLTLEEQQLRELQRHGYENPTYRFLEERPと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P21をコードする単離キメラポリペプチド。
Report of the comparison between M78076_PEA_1_P21 and APP1_HUMAN 1. Corresponding to amino acids 1 to 352 of APP1_HUMAN, corresponding to amino acids 1 to 352 of M78076_PEA_1_P21 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSH The first amino acid sequence at least 90% homologous to ErueibuibuijikeibuitiPitiPiaruPitidijibuidiaiwaiefujiemuPijiiaiesuieichiijiefueruarueikeiemudieruiiaruaruemuarukyuaienuiVMREWAMADNQSKNLPKADRQALNE, corresponding to amino acids 406-650 of APP1_HUMAN, corresponding to amino acids 353-597 of M78076_PEA_1_P21 AERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKVNASVPRGFPFHSSEIQRDELAPAGTGVS EAVSGLLIMGAGGGSLIVLSMLLLRRKKPYGAISHGVVEVDPMLTLEEQQLRELQRHGYENPTYRFLEERP and and at least 90% homologous to a second amino acid sequence, the first amino acid sequence and a second amino acid sequence, contiguous and in sequential order, the isolated chimeric polypeptide coding M78076_PEA_1_P21.

2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がEAを含み、以下の構造:アミノ酸番号352−x〜352のいずれかから始まり、アミノ酸番号353+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、M78076_PEA_1_P21の縁部分をコードする単離キメラポリペプチド。   2. Length “n” (wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long, most preferably at least about 50 amino acids long, at least two amino acids comprising EA, starting from any of the following structures: amino acids nos. 352-x to 352, amino acids nos. 353 + ((n-2) -x) (formula An isolated chimeric polypeptide encoding an edge portion of M78076_PEA_1_P21, comprising a polypeptide, having a sequence terminating in :), wherein x is a change from 0 to n-2.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有することが同意され、両膜貫通領域推定プログラムによってこのタンパク質がこのシグナルペプチドの下流に膜貫通領域を有すると推定されるので、膜と考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: membrane. As for protein localization, both signal peptide estimation programs agree that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has a transmembrane domain downstream of this signal peptide. , Considered a membrane.

変異タンパク質M78076_PEA_1_P21はまた、表702に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P21配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M78076_PEA_1_P21 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, enumerating other amino acids, and the last column shows SNPs as shown in Table 702) It is shown whether it is known and the presence of a known SNP in the mutein M78076_PEA_1_P21 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質アミロイド様タンパク質1前駆体と比較した変異タンパク質M78076_PEA_1_P21のグリコシル化部位を表703に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutated protein M78076_PEA_1_P21 compared to the known protein amyloid-like protein 1 precursor are shown in Table 703 (showing its position on the amino acid sequence in the first column, the second column has a glycosylation site It indicates whether it is present in the mutein and the last column shows whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質M78076_PEA_1_P21は、以下の転写物によってコードされる:M78076_PEA_1_T23(配列は出願書類の最後に示す)。転写物M78076_PEA_1_T23のコード部分を太字で示し、このコード部分は142位から開始され、1932位で終結する。転写物はまた、表704に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P21配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M78076_PEA_1_P21 is encoded by the following transcript: M78076_PEA_1_T23 (sequences shown at the end of the application). The code portion of transcript M78076_PEA_1_T23 is shown in bold, this code portion starting at position 142 and ending at position 1932. The transcript also has the following SNPs listed in Table 704 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein M78076_PEA_1_P21 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質M78076_PEA_1_P24は、出願書類の最後に示すアミノ酸配列を有し、転写物M78076_PEA_1_T26によってコードされる。公知のタンパク質(アミロイド様タンパク質1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein M78076_PEA_1_P24 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript M78076_PEA_1_T26. An alignment to a known protein (amyloid-like protein 1 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

M78076_PEA_1_P24とAPP1_HUMANとの間の比較の報告
1.APP1_HUMANのアミノ酸1〜481に対応し、M78076_PEA_1_P24のアミノ酸1〜481にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P24のアミノ酸482〜498に対応する配列RECLLPWLPLQISEGRSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P24をコードする単離キメラポリペプチド。
Report of the comparison between M78076_PEA_1_P24 and APP1_HUMAN 1. Corresponding to amino acids 1 to 481 of APP1_HUMAN, corresponding to amino acids 1 to 481 of M78076_PEA_1_P24 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSH A first amino acid sequence at least 90% homologous to ErueibuibuijikeibuitiPitiPiaruPitidijibuidiaiwaiefujiemuPijiiaiesuieichiijiefueruarueikeiemudieruiiaruaruemuarukyuaienuibuiemuaruidaburyueiemueidienukyuesukeienueruPikeieidiarukyueieruenuieichiefukyuesuaierukyutieruiikyubuiesujiiarukyuaruerubuiitieichieitiarubuiaieieruaienudikyuaruarueieieruijiefuerueieierukyueidiPiPikyueiiarubuieruerueieruaruaruwaieruarueiikyukeiikyuarueichitieruarueichiwaikyueichibuieieibuidiPiikeieikyukyuemuaruefukyubuieichitieichierukyubuiaiEERVNQSLGLLDQNPHLAQELRPQI, polypeptide at least 70% with a sequence corresponding to RECLLPWLPLQISEGRS to amino acid 482-498 of M78076_PEA_1_P24, optionally at least 80%, preferably at least 85%, more Preferred Or M78076_PEA_1_P24, which comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first and second amino acid sequences being adjacent and in sequential order Isolated chimeric polypeptide.

2.M78076_PEA_1_P24中の配列RECLLPWLPLQISEGRSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M78076_PEA_1_P24のテールをコードする単離ポリペプチド。   2. M78076_PEA_1_P24 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 90%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence RECLLPWLPLQISEGRS in M78076_PEA_1_P24 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質M78076_PEA_1_P24はまた、表705に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P24配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M78076_PEA_1_P24 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing the other amino acids, and listing the other amino acids, as shown in Table 705), and the last column contains SNPs It is shown whether it is known and the presence of a known SNP in the mutein M78076_PEA_1_P24 sequence supports the putative sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質アミロイド様タンパク質1前駆体と比較した変異タンパク質M78076_PEA_1_P24のグリコシル化部位を表706に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of mutant protein M78076_PEA_1_P24 compared to the known protein amyloid-like protein 1 precursor are shown in Table 706 (showing its position on the amino acid sequence in the first column, the second column has glycosylation sites It indicates whether it is present in the mutein and the last column shows whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質M78076_PEA_1_P24は、以下の転写物によってコードされる:M78076_PEA_1_T26(配列は出願書類の最後に示す)。転写物M78076_PEA_1_T26のコード部分を太字で示し、このコード部分は142位から開始され、1635位で終結する。転写物はまた、表707に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P24配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M78076_PEA_1_P24 is encoded by the following transcript: M78076_PEA_1_T26 (sequences shown at the end of the application). The code portion of transcript M78076_PEA_1_T26 is shown in bold, this code portion starting at position 142 and ending at position 1635. The transcript also has the following SNPs listed in Table 707 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein M78076_PEA_1_P24 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質M78076_PEA_1_P2は、出願書類の最後に示すアミノ酸配列を有し、転写物M78076_PEA_1_T27によってコードされる。公知のタンパク質(アミロイド様タンパク質1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein M78076_PEA_1_P2 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript M78076_PEA_1_T27. An alignment to a known protein (amyloid-like protein 1 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

M78076_PEA_1_P2とAPP1_HUMANとの間の比較の報告
1.APP1_HUMANのアミノ酸1〜449に対応し、M78076_PEA_1_P2のアミノ酸1〜449にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P2のアミノ酸450〜588に対応する配列LTSFQLPNAPLFLRRPRLRLFSCPLDPLSVSWTPSYPLNTASLPLPSLSAQLPDPETWTLTCCVFDPCFLALGFLLPPPSILCSVPWIFTAFPRIVFFFFFFLRQVLALSPRQESSVRSWLIATSTSWVQAILLPQPLEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P2をコードする単離キメラポリペプチド。
Reporting of the comparison between M78076_PEA_1_P2 and APP1_HUMAN 1. Corresponding to amino acids 1 to 449 of APP1_HUMAN, corresponding to amino acids 1 to 449 of M78076_PEA_1_P2 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHT The first amino acid sequence at least 90% homologous to EibuibuijikeibuitiPitiPiaruPitidijibuidiaiwaiefujiemuPijiiaiesuieichiijiefueruarueikeiemudieruiiaruaruemuarukyuaienuibuiemuaruidaburyueiemueidienukyuesukeienueruPikeieidiarukyueieruenuieichiefukyuesuaierukyutieruiikyubuiesujiiarukyuaruerubuiitieichieitiarubuiaieieruaienudikyuaruarueieieruijiefuerueieierukyueidiPiPikyueiiarubuieruerueieruaruaruwaieruarueiikyukeiikyuRHTLRHYQHVAAVDPEKAQQMRFQV, sequence LTSFQLPNAPLFLRRPRLRLFSCPLDPLSVSWTPSYPLNTASLPLPSLSAQLPDPETWTLTCCVFDPCFLALGFLLPPPSILCSVPWIFTAFPRIVFFFFFFLR corresponding to amino acids 450-588 of M78076_PEA_1_P2 Said polypeptide comprising VLALSPRQESSVRSWLIATSTSWVQAILLPQPLE and a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; An isolated chimeric polypeptide encoding M78076_PEA_1_P2, wherein the amino acid sequence of 1 and the second amino acid sequence are adjacent and in sequential order.

2.M78076_PEA_1_P2中の配列LTSFQLPNAPLFLRRPRLRLFSCPLDPLSVSWTPSYPLNTASLPLPSLSAQLPDPETWTLTCCVFDPCFLALGFLLPPPSILCSVPWIFTAFPRIVFFFFFFLRQVLALSPRQESSVRSWLIATSTSWVQAILLPQPLEと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M78076_PEA_1_P2のテールをコードする単離ポリペプチド。   2. At least 70%, at least about 70%, at least 70%, at least 70%, the event is selected as described in the following example. An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有することが同意され、両膜貫通領域推定プログラムによってこのタンパク質がこのシグナルペプチドの下流に膜貫通領域を有すると推定されるので、膜と考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: membrane. As for protein localization, both signal peptide estimation programs agree that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has a transmembrane domain downstream of this signal peptide. , Considered a membrane.

変異タンパク質M78076_PEA_1_P2はまた、表708に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M78076_PEA_1_P2 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column, as shown in Table 708) It is shown whether it is known and the presence of a known SNP in the mutein M78076_PEA_1_P2 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質アミロイド様タンパク質1前駆体と比較した変異タンパク質M78076_PEA_1_P2のグリコシル化部位を表709に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of mutant protein M78076_PEA_1_P2 compared to the known protein amyloid-like protein 1 precursor are shown in Table 709 (showing its position on the amino acid sequence in the first column, the second column has glycosylation sites It indicates whether it is present in the mutein and the last column shows whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質M78076_PEA_1_P2は、以下の転写物によってコードされる:M78076_PEA_1_T27(配列は出願書類の最後に示す)。転写物M78076_PEA_1_T27のコード部分を太字で示し、このコード部分は142位から開始され、1905位で終結する。転写物はまた、表710に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M78076_PEA_1_P2 is encoded by the following transcript: M78076_PEA_1_T27 (sequences shown at the end of the application). The code portion of transcript M78076_PEA_1_T27 is shown in bold, this code portion starts at position 142 and ends at position 1905. The transcript also has the following SNPs listed in Table 710 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, the mutein M78076_PEA_1_P2 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

本発明の変異タンパク質M78076_PEA_1_P25は、出願書類の最後に示すアミノ酸配列を有し、転写物M78076_PEA_1_T28によってコードされる。公知のタンパク質(アミロイド様タンパク質1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein M78076_PEA_1_P25 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript M78076_PEA_1_T28. An alignment to a known protein (amyloid-like protein 1 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

M78076_PEA_1_P25とAPP1_HUMANとの間の比較の報告
1.APP1_HUMANのアミノ酸1〜448に対応し、M78076_PEA_1_P25のアミノ酸1〜448にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P25のアミノ酸449〜505に対応する配列PQNPNSQPRAAGSLEVIISHPFVRRLEILISPFQFQNSIPKNSQIVPAASPRGTSSPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P25をコードする単離キメラポリペプチド。
Report of the comparison between M78076_PEA_1_P25 and APP1_HUMAN 1. Corresponding to amino acids 1 to 448 of APP1_HUMAN, corresponding to amino acids 1 to 448 of M78076_PEA_1_P25 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSH The first amino acid sequence at least 90% homologous to ErueibuibuijikeibuitiPitiPiaruPitidijibuidiaiwaiefujiemuPijiiaiesuieichiijiefueruarueikeiemudieruiiaruaruemuarukyuaienuibuiemuaruidaburyueiemueidienukyuesukeienueruPikeieidiarukyueieruenuieichiefukyuesuaierukyutieruiikyubuiesujiiarukyuaruerubuiitieichieitiarubuiaieieruaienudikyuaruarueieieruijiefuerueieierukyueidiPiPikyueiiarubuieruerueieruaruaruwaieruarueiikyukeiiQRHTLRHYQHVAAVDPEKAQQMRFQ, polypeptide at least 70% with a sequence corresponding to PQNPNSQPRAAGSLEVIISHPFVRRLEILISPFQFQNSIPKNSQIVPAASPRGTSSP to amino acid 449-505 of M78076_PEA_1_P25, optionally at least 80%, preferably at least 8 %, More preferably at least 90%, most preferably at least 95%, with a second amino acid sequence, wherein said first and second amino acid sequences are adjacent and in a contiguous order, An isolated chimeric polypeptide encoding M78076_PEA_1_P25.

2.M78076_PEA_1_P25中の配列PQNPNSQPRAAGSLEVIISHPFVRRLEILISPFQFQNSIPKNSQIVPAASPRGTSSPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M78076_PEA_1_P25のテールをコードする単離ポリペプチド。   2. A sequence comprising at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous polypeptide with MQ An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質M78076_PEA_1_P25はまた、表711に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P25配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M78076_PEA_1_P25 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, enumerating other amino acids, and the last column shows SNPs as shown in Table 711) It is shown whether it is known and the presence of a known SNP in the mutein M78076_PEA_1_P25 sequence supports the putative sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質アミロイド様タンパク質1前駆体と比較した変異タンパク質M78076_PEA_1_P25のグリコシル化部位を表712に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of mutant protein M78076_PEA_1_P25 compared to the known protein amyloid-like protein 1 precursor are shown in Table 712 (showing its position on the amino acid sequence in the first column, the second column has glycosylation sites It indicates whether it is present in the mutein and the last column shows whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質M78076_PEA_1_P25は、以下の転写物によってコードされる:M78076_PEA_1_T28(配列は出願書類の最後に示す)。転写物M78076_PEA_1_T28のコード部分を太字で示し、このコード部分は142位から開始され、1656位で終結する。転写物はまた、表713に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P25配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein M78076_PEA_1_P25 is encoded by the following transcript: M78076_PEA_1_T28 (sequences shown at the end of the application). The code portion of transcript M78076_PEA_1_T28 is shown in bold, this code portion starting at position 142 and ending at position 1656. The transcript also has the following SNPs listed in Table 713 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein M78076_PEA_1_P25 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターM78076は、上の表2に列挙した35個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster M78076 is characterized by the 35 segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターM78076_PEA_1_node_0は、47個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表714は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_0 of the present invention is supported by 47 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, M7J7407C4P Table 714 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_10は、70個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表715は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_10 of the present invention is supported by 70 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, M7J7407C4P Table 715 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_15は、74個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表716は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_15 of the present invention is supported by 74 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, M7J7407C4P Table 716 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_18は、95個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表717は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_18 of the present invention is supported by 95 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, M7J7407C4P Table 717 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_20は、99個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表718は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_20 of the present invention is supported by 99 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, M7J7407C4P Table 718 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_24は、105個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表719は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_24 of the present invention is supported by 105 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T26, M78076_PEA_1_T27, and M78076. Table 719 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_26は、99個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表720は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_26 of the present invention is supported by 99 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, M7J7407C4P Table 720 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_29は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T27。以下の表721は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_29 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M78076_PEA_1_T27. Table 721 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_32は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T26およびM78076_PEA_1_T27。以下の表722は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_32 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M78076_PEA_1_T26 and M78076_PEA_1_T27. Table 722 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_35は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2およびM78076_PEA_1_T5。以下の表723は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_35 of the present invention is supported by 4 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M78076_PEA_1_T2 and M78076_PEA_1_T5. Table 723 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_37は、11個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T3およびM78076_PEA_1_T5。以下の表724は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_37 of the present invention is supported by 11 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M78076_PEA_1_T3 and M78076_PEA_1_T5. Table 724 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_46は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T15。以下の表725は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_46 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M78076_PEA_1_T15. Table 725 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_47は、155個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、およびM78076_PEA_1_T23。以下の表726は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_47 of the present invention is supported by 155 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, and M78076_PEA_1_T23. Table 726 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_54は、133個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、およびM78076_PEA_1_T28。以下の表727は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_54 of the present invention is supported by 133 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, and M78076_PEA_1_T28. Table 727 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターM78076_PEA_1_node_1は、47個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表728は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_1 of the present invention is supported by 47 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, M7J7407C4P Table 728 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_2を、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表729は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_2 according to the invention can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15. Table 729 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_3は、52個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表730は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_3 of the present invention is supported by 52 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, M7J7407C4P Table 730 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_6は、59個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表731は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_6 of the present invention is supported by 59 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, M7J7407C4P Table 731 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_7は、64個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表732は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_7 of the present invention is supported by 64 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, M7J7407C4P Table 732 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_12は、71個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表733は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_12 of the present invention is supported by 71 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, M7J7407C4P Table 733 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_22は、92個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表734は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_22 of the present invention is supported by 92 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, M7J7407C4P Table 734 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_27を、以下の転写物中に見出すことができる:M78076_PEA_1_T27。以下の表735は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_27 according to the invention can be found in the following transcript: M78076_PEA_1_T27. Table 735 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_30は、90個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、およびM78076_PEA_1_T27。以下の表736は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_30 of the present invention is supported by 90 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, and M7076. Table 736 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_31は、89個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、およびM78076_PEA_1_T27。以下の表737は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_31 of the present invention is supported by 89 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, and M7076. Table 737 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_34は、103個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、およびM78076_PEA_1_T23。以下の表738は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_34 of the present invention is supported by 103 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, and M78076_PEA_1_T23. Table 738 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_36を、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、およびM78076_PEA_1_T23。以下の表739は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_36 according to the invention can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, and M78076_PEA_1_T23. Table 739 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_41を、以下の転写物中に見出すことができる:M78076_PEA_1_T3およびM78076_PEA_1_T5。以下の表740は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_41 according to the invention can be found in the following transcript: M78076_PEA_1_T3 and M78076_PEA_1_T5. Table 740 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_42を、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T15、およびM78076_PEA_1_T23。以下の表741は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_42 according to the invention can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T15, and M78076_PEA_1_T23. Table 741 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_43は、110個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T15、およびM78076_PEA_1_T23。以下の表742は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_43 of the present invention is supported by 110 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T15, and M78076_PEA_1_T23. Table 742 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表743に示す)。   Microarray (chip) data for this segment is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (for lung cancer) (shown in Table 743).

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_45は、132個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、およびM78076_PEA_1_T23。以下の表744は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_45 of the present invention is supported by 132 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, and M78076_PEA_1_T23. Table 744 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表745に示す)。   Microarray (chip) data for this segment is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (for lung cancer) (shown in Table 745).

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_49は、129個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、およびM78076_PEA_1_T23。以下の表746は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_49 of the present invention is supported by 129 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, and M78076_PEA_1_T23. Table 746 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_50は、125個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、およびM78076_PEA_1_T23。以下の表747は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_50 of the present invention is supported by 125 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, and M78076_PEA_1_T23. Table 747 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_51は、123個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、およびM78076_PEA_1_T23。以下の表748は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_51 of the present invention is supported by 123 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, and M78076_PEA_1_T23. Table 748 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_52を、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、およびM78076_PEA_1_T23。以下の表749は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_52 according to the invention can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, and M78076_PEA_1_T23. Table 749 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターM78076_PEA_1_node_53を、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、およびM78076_PEA_1_T28。以下の表750は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster M78076_PEA_1_node_53 according to the invention can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_TPE. Table 750 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P3 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 5132.00 Escore: 0
Matching length: 517 Total length: 517
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
. . . . .
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
.
501 GGSSEDKGGLQPPDSKD 517
|||||||||||||||||
501 GGSSEDKGGLQPPDSKD 517






Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P4 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 5223.00 Escore: 0
Matching length: 526 Total length: 526
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
. . . . .
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
. .
501 GGSSEDKGGLQPPDSKDDTPMTLPKG 526
||||||||||||||||||||||||||
501 GGSSEDKGGLQPPDSKDDTPMTLPKG 526






Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P12 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 5223.00 Escore: 0
Matching length: 526 Total length: 526
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
. . . . .
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
. .
501 GGSSEDKGGLQPPDSKDDTPMTLPKG 526
||||||||||||||||||||||||||
501 GGSSEDKGGLQPPDSKDDTPMTLPKG 526






Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P14 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 5672.00 Escore: 0
Matching length: 575 Total length: 575
Matching Percent Similarity: 99.48 Matching Percent Identity: 99.48
Total Percent Similarity: 99.48 Total Percent Identity: 99.48
Gaps: 0

Alignment:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
. . . . .
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
. . . . .
501 GGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKV 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 GGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKV 550
. .
551 NASVPRGFPFHSSEIQRDELVRGGT 575
|||||||||||||||||||| ||
551 NASVPRGFPFHSSEIQRDELAPAGT 575






Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P21 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 5822.00 Escore: 0
Matching length: 597 Total length: 650
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 91.85 Total Percent Identity: 91.85
Gaps: 1

Alignment:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NE................................................ 352
||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
353 .....AERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 397
|||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
. . . . .
398 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 447
||||||||||||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
. . . . .
448 GGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKV 497
||||||||||||||||||||||||||||||||||||||||||||||||||
501 GGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKV 550
. . . . .
498 NASVPRGFPFHSSEIQRDELAPAGTGVSREAVSGLLIMGAGGGSLIVLSM 547
||||||||||||||||||||||||||||||||||||||||||||||||||
551 NASVPRGFPFHSSEIQRDELAPAGTGVSREAVSGLLIMGAGGGSLIVLSM 600
. . . . .
548 LLLRRKKPYGAISHGVVEVDPMLTLEEQQLRELQRHGYENPTYRFLEERP 597
||||||||||||||||||||||||||||||||||||||||||||||||||
601 LLLRRKKPYGAISHGVVEVDPMLTLEEQQLRELQRHGYENPTYRFLEERP 650






Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P24 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 4791.00 Escore: 0
Matching length: 485 Total length: 485
Matching Percent Similarity: 99.79 Matching Percent Identity: 99.59
Total Percent Similarity: 99.79 Total Percent Identity: 99.59
Gaps: 0

Alignment:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
. . .
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIRECL 485
|||||||||||||||||||||||||||||||:| |
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELL 485






Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P2 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 4474.00 Escore: 0
Matching length: 454 Total length: 454
Matching Percent Similarity: 99.56 Matching Percent Identity: 99.34
Total Percent Similarity: 99.56 Total Percent Identity: 99.34
Gaps: 0

Alignment:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVL 450
|||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450

451 TSFQ 454
| :|
451 THLQ 454







Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P25 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 4455.00 Escore: 0
Matching length: 448 Total length: 448
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQ 448
||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQ 448


Mutated protein alignment against previously known proteins:
Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P3 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 5132.00 Escore: 0
Matching length: 517 Total length: 517
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MGPASPAARGSRRPRPQPPLPLPLLLLLLLRAQPAIGSLAGGPSGAAEA 50
||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGSRRPRPQPPLPLPLLLLLLLRAQPAIGSLAGGPSGAAEA 50
....
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQ RSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQ RSRRCLRDPQRVLEYCRQMYP 100
....
101 ELQ IARVEQ ATQAIPMERWCGGSRSGSCAHPHHQV VPFRCLPGEFSEAL 150
||||||||||||||||||||||||||||||||||||||||
101 ELQ IARVEQ ATQAIPMERWCGGSRSGSCAHPHHQV VPFRCLPGEFSEAL 150
....
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
....
201 RFRGVEYVCCPPPGTPPTSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPPTSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
....
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLASVVGKVTPTPRPDGMDIYFGM 300
||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLASVVGKVTPTPRPDGMDIYFGM 300
....
301 PGEISEHEGFLAKMDLEERRMRQINEVMREWA AMDNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLAKMDLEERRMRQINEVMREWA AMDNQSKNLPKADRQAL 350
....
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLA ALQ 400
||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLA ALQ 400
....
401 ADPPQAERVLLALLRRYLRAEQKEQRHTHRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALLRRYLRAEQKEQRHTHRHYQHVAAVDPEKAQQMRFQVH 450
....
451 THLQVIEERBN QSLGLLDQ NPHLA QELRPQIQELLHSEHLGPSELAPAP 500
||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERBN QSLGLLDQ NPHLA QELRPQIQELLHSEHLGPSELAPAP 500
.
501 GGSSEDKGGLQPPDSKD 517
||||||||||||||||
501 GGSSEDKGGLQPPDSKD 517






Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P4 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 5223.00 Escore: 0
Matching length: 526 Total length: 526
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MGPASPAARGSRRPRPQPPLPLPLLLLLLLRAQPAIGSLAGGPSGAAEA 50
||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGSRRPRPQPPLPLPLLLLLLLRAQPAIGSLAGGPSGAAEA 50
....
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQ RSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQ RSRRCLRDPQRVLEYCRQMYP 100
....
101 ELQ IARVEQ ATQAIPMERWCGGSRSGSCAHPHHQV VPFRCLPGEFSEAL 150
||||||||||||||||||||||||||||||||||||||||
101 ELQ IARVEQ ATQAIPMERWCGGSRSGSCAHPHHQV VPFRCLPGEFSEAL 150
....
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
....
201 RFRGVEYVCCPPPGTPPTSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPPTSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
....
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLASVVGKVTPTPRPDGMDIYFGM 300
||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLASVVGKVTPTPRPDGMDIYFGM 300
....
301 PGEISEHEGFLAKMDLEERRMRQINEVMREWA AMDNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLAKMDLEERRMRQINEVMREWA AMDNQSKNLPKADRQAL 350
....
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLA ALQ 400
||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLA ALQ 400
....
401 ADPPQAERVLLALLRRYLRAEQKEQRHTHRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALLRRYLRAEQKEQRHTHRHYQHVAAVDPEKAQQMRFQVH 450
....
451 THLQVIEERBN QSLGLLDQ NPHLA QELRPQIQELLHSEHLGPSELAPAP 500
||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERBN QSLGLLDQ NPHLA QELRPQIQELLHSEHLGPSELAPAP 500
.
501 GGSSEDKGGLQPPDSK DDTPMTLPKG 526
||||||||||||||||||||||||
501 GGSSEDKGGLQPPDSK DDTPMTLPKG 526






Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P12 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 5223.00 Escore: 0
Matching length: 526 Total length: 526
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MGPASPAARGSRRPRPQPPLPLPLLLLLLLRAQPAIGSLAGGPSGAAEA 50
||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGSRRPRPQPPLPLPLLLLLLLRAQPAIGSLAGGPSGAAEA 50
....
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQ RSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQ RSRRCLRDPQRVLEYCRQMYP 100
....
101 ELQ IARVEQ ATQAIPMERWCGGSRSGSCAHPHHQV VPFRCLPGEFSEAL 150
||||||||||||||||||||||||||||||||||||||||
101 ELQ IARVEQ ATQAIPMERWCGGSRSGSCAHPHHQV VPFRCLPGEFSEAL 150
....
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
....
201 RFRGVEYVCCPPPGTPPTSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPPTSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
....
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLASVVGKVTPTPRPDGMDIYFGM 300
||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLASVVGKVTPTPRPDGMDIYFGM 300
....
301 PGEISEHEGFLAKMDLEERRMRQINEVMREWA AMDNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLAKMDLEERRMRQINEVMREWA AMDNQSKNLPKADRQAL 350
....
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLA ALQ 400
||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLA ALQ 400
....
401 ADPPQAERVLLALLRRYLRAEQKEQRHTHRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALLRRYLRAEQKEQRHTHRHYQHVAAVDPEKAQQMRFQVH 450
....
451 THLQVIEERBN QSLGLLDQ NPHLA QELRPQIQELLHSEHLGPSELAPAP 500
||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERBN QSLGLLDQ NPHLA QELRPQIQELLHSEHLGPSELAPAP 500
.
501 GGSSEDKGGLQPPDSK DDTPMTLPKG 526
||||||||||||||||||||||||
501 GGSSEDKGGLQPPDSK DDTPMTLPKG 526






Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P14 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 5672.00 Escore: 0
Matching length: 575 Total length: 575
Matching Percent Similarity: 99.48 Matching Percent Identity: 99.48
Total Percent Similarity: 99.48 Total Percent Identity: 99.48
Gaps: 0

Alignment:
....
1 MGPASPAARGSRRPRPQPPLPLPLLLLLLLRAQPAIGSLAGGPSGAAEA 50
||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGSRRPRPQPPLPLPLLLLLLLRAQPAIGSLAGGPSGAAEA 50
....
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQ RSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQ RSRRCLRDPQRVLEYCRQMYP 100
....
101 ELQ IARVEQ ATQAIPMERWCGGSRSGSCAHPHHQV VPFRCLPGEFSEAL 150
||||||||||||||||||||||||||||||||||||||||
101 ELQ IARVEQ ATQAIPMERWCGGSRSGSCAHPHHQV VPFRCLPGEFSEAL 150
....
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
....
201 RFRGVEYVCCPPPGTPPTSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPPTSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
....
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLASVVGKVTPTPRPDGMDIYFGM 300
||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLASVVGKVTPTPRPDGMDIYFGM 300
....
301 PGEISEHEGFLAKMDLEERRMRQINEVMREWA AMDNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLAKMDLEERRMRQINEVMREWA AMDNQSKNLPKADRQAL 350
....
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLA ALQ 400
||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLA ALQ 400
....
401 ADPPQAERVLLALLRRYLRAEQKEQRHTHRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALLRRYLRAEQKEQRHTHRHYQHVAAVDPEKAQQMRFQVH 450
....
451 THLQVIEERBN QSLGLLDQ NPHLA QELRPQIQELLHSEHLGPSELAPAP 500
||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERBN QSLGLLDQ NPHLA QELRPQIQELLHSEHLGPSELAPAP 500
....
501 GGSSEDKGGLQPPDSKDDTMPTLPGGSTEQDA ASPEKEK MNPLEQYERKV 550
||||||||||||||||||||||||||||||||||||||||
501 GGSSEDKGGLQPPDSKDDTMPTLPGGSTEQDA ASPEKEK MNPLEQYERKV 550
.
551 NASVPRGFPFHSSEIQRDELVRGT 575
||||||||||||||||||||
551 NASVPRGFPFHSSEIQRDELAPAGT 575






Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P21 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 5822.00 Escore: 0
Matching length: 597 Total length: 650
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 91.85 Total Percent Identity: 91.85
Gaps: 1

Alignment:
....
1 MGPASPAARGSRRPRPQPPLPLPLLLLLLLRAQPAIGSLAGGPSGAAEA 50
||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGSRRPRPQPPLPLPLLLLLLLRAQPAIGSLAGGPSGAAEA 50
....
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQ RSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQ RSRRCLRDPQRVLEYCRQMYP 100
....
101 ELQ IARVEQ ATQAIPMERWCGGSRSGSCAHPHHQV VPFRCLPGEFSEAL 150
||||||||||||||||||||||||||||||||||||||||
101 ELQ IARVEQ ATQAIPMERWCGGSRSGSCAHPHHQV VPFRCLPGEFSEAL 150
....
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
....
201 RFRGVEYVCCPPPGTPPTSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPPTSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
....
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLASVVGKVTPTPRPDGMDIYFGM 300
||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLASVVGKVTPTPRPDGMDIYFGM 300
....
301 PGEISEHEGFLAKMDLEERRMRQINEVMREWA AMDNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLAKMDLEERRMRQINEVMREWA AMDNQSKNLPKADRQAL 350
....
351 NE .................................................. 352
||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLA ALQ 400
....
353 ..... AERVLLALRRYLRAEQKEQRHTHRHYQHVAAVDPEKAQQMRFQVH 397
|||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALLRRYLRAEQKEQRHTHRHYQHVAAVDPEKAQQMRFQVH 450
....
398 THLQVIEERBN QSLGLLDQ NPHLA QELRPQIQELLHSEHLGPSELAPAP 447
||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERBN QSLGLLDQ NPHLA QELRPQIQELLHSEHLGPSELAPAP 500
....
448 GGSSEDDKGGLQPPDSKDDTMPTLPGGSTEQDA ASPEKEK MNPLEQYERKV 497
||||||||||||||||||||||||||||||||||||||||
501 GGSSEDKGGLQPPDSKDDTMPTLPGGSTEQDA ASPEKEK MNPLEQYERKV 550
....
498 NASVPRGFPFHSEIQRDELAPAGTGVSREAVSGLLIMGAGGGSLISLSM 547
||||||||||||||||||||||||||||||||||||||||
551 NASVPRGFPFHSEIQRDELAPAGTGVSREAVSGLLIMGAGGGSLISLSM 600
....
548 LLLRRKKPYGAISHGVVEVDPMLTLEEQQLRELQRHGYENPTYRFLEERP 597
||||||||||||||||||||||||||||||||||||||||
601 LLLRRKKPYGAISHGVVEVDPMLTLEEQQLRELQRHGYENPTYRFLEERP 650






Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P24 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 4791.00 Escore: 0
Matching length: 485 Total length: 485
Matching Percent Similarity: 99.79 Matching Percent Identity: 99.59
Total Percent Similarity: 99.79 Total Percent Identity: 99.59
Gaps: 0

Alignment:
....
1 MGPASPAARGSRRPRPQPPLPLPLLLLLLLRAQPAIGSLAGGPSGAAEA 50
||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGSRRPRPQPPLPLPLLLLLLLRAQPAIGSLAGGPSGAAEA 50
....
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQ RSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQ RSRRCLRDPQRVLEYCRQMYP 100
....
101 ELQ IARVEQ ATQAIPMERWCGGSRSGSCAHPHHQV VPFRCLPGEFSEAL 150
||||||||||||||||||||||||||||||||||||||||
101 ELQ IARVEQ ATQAIPMERWCGGSRSGSCAHPHHQV VPFRCLPGEFSEAL 150
....
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
....
201 RFRGVEYVCCPPPGTPPTSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPPTSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
....
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLASVVGKVTPTPRPDGMDIYFGM 300
||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLASVVGKVTPTPRPDGMDIYFGM 300
....
301 PGEISEHEGFLAKMDLEERRMRQINEVMREWA AMDNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLAKMDLEERRMRQINEVMREWA AMDNQSKNLPKADRQAL 350
....
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLA ALQ 400
||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLA ALQ 400
....
401 ADPPQAERVLLALLRRYLRAEQKEQRHTHRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALLRRYLRAEQKEQRHTHRHYQHVAAVDPEKAQQMRFQVH 450
....
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIRECL 485
||||||||||||||||||||||||||||: |
451 THLQVIEERBN QSLGLLDQ NPHLA QELRPQIQELL 485






Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P2 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 4474.00 Escore: 0
Matching length: 454 Total length: 454
Matching Percent Similarity: 99.56 Matching Percent Identity: 99.34
Total Percent Similarity: 99.56 Total Percent Identity: 99.34
Gaps: 0

Alignment:
....
1 MGPASPAARGSRRPRPQPPLPLPLLLLLLLRAQPAIGSLAGGPSGAAEA 50
||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGSRRPRPQPPLPLPLLLLLLLRAQPAIGSLAGGPSGAAEA 50
....
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQ RSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQ RSRRCLRDPQRVLEYCRQMYP 100
....
101 ELQ IARVEQ ATQAIPMERWCGGSRSGSCAHPHHQV VPFRCLPGEFSEAL 150
||||||||||||||||||||||||||||||||||||||||
101 ELQ IARVEQ ATQAIPMERWCGGSRSGSCAHPHHQV VPFRCLPGEFSEAL 150
....
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
....
201 RFRGVEYVCCPPPGTPPTSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPPTSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
....
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLASVVGKVTPTPRPDGMDIYFGM 300
||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLASVVGKVTPTPRPDGMDIYFGM 300
....
301 PGEISEHEGFLAKMDLEERRMRQINEVMREWA AMDNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLAKMDLEERRMRQINEVMREWA AMDNQSKNLPKADRQAL 350
....
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLA ALQ 400
||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLA ALQ 400
....
401 ADPPQAERVLLALLRRYLRAEQKEQRHTHRHYQHVAAVDPEKAQQMRFQVL 450
||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALLRRYLRAEQKEQRHTHRHYQHVAAVDPEKAQQMRFQVH 450

451 TSFQ 454
|: |
451 THLQ 454







Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P25 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 4455.00 Escore: 0
Matching length: 448 Total length: 448
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MGPASPAARGSRRPRPQPPLPLPLLLLLLLRAQPAIGSLAGGPSGAAEA 50
||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGSRRPRPQPPLPLPLLLLLLLRAQPAIGSLAGGPSGAAEA 50
....
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQ RSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQ RSRRCLRDPQRVLEYCRQMYP 100
....
101 ELQ IARVEQ ATQAIPMERWCGGSRSGSCAHPHHQV VPFRCLPGEFSEAL 150
||||||||||||||||||||||||||||||||||||||||
101 ELQ IARVEQ ATQAIPMERWCGGSRSGSCAHPHHQV VPFRCLPGEFSEAL 150
....
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
....
201 RFRGVEYVCCPPPGTPPTSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPPTSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
....
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLASVVGKVTPTPRPDGMDIYFGM 300
||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLASVVGKVTPTPRPDGMDIYFGM 300
....
301 PGEISEHEGFLAKMDLEERRMRQINEVMREWA AMDNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLAKMDLEERRMRQINEVMREWA AMDNQSKNLPKADRQAL 350
....
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLA ALQ 400
||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLA ALQ 400
....
401 ADPPQAERVLLALRRYLRAEQKEQRHTHRHYQHVAAVDPEKAQQMRFQ 448
|||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTHRHYQHVAAVDPEKAQQMRFQ 448

クラスターT99080の説明
クラスターT99080は、目的の14個の転写物および11個のセグメントを特徴とし、その名称を、それぞれ表751および752に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表753に示す。
Description of cluster T99080 Cluster T99080 is characterized by 14 transcripts and 11 segments of interest, the names of which are shown in Tables 751 and 752 respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 753.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるアシルホスファターゼ器官共通型イソ酵素(SwissProtアクセッション識別子ACYO_HUMAN、同義語EC3.6.1.7、アシルホスファターゼホスホヒドロラーゼ、アシルホスファターゼ赤血球イソ酵素としても公知である)(配列番号1440)の変異型である。   These sequences are known as acylphosphatase organ common-type isoenzymes (SwissProt accession identifier ACYO_HUMAN, synonym EC 3.6.1.7, acylphosphatase phosphohydrolase), which is a known protein, previously known herein as a protein , A variant form of the acyl phosphatase erythrocyte isoenzyme (SEQ ID NO: 1440).

タンパク質アシルホスファターゼ器官共通型イソ酵素の配列を、「アシルホスファターゼ器官共通型イソ酵素アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表754に示す。   The sequence of the protein acyl phosphatase organ common isoenzyme is shown at the end of the application as "acyl phosphatase organ common isoenzyme amino acid sequence". Known polymorphisms of this sequence are shown in Table 754.

Figure 2008507261
Figure 2008507261

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けであるリン酸塩代謝、分子機能に関連する注釈付けであるアシルホスファターゼ。   The following GO annotation applies to previously known proteins. The following annotations have been found: phosphate metabolism, which is an annotation related to biological processes, and acyl phosphatase, which is an annotation related to molecular function.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

上記のように、クラスターT99080は、上の表1に列挙した14個の転写物を特徴とする。これらの転写物は、タンパク質アシルホスファターゼ器官共通型イソ酵素の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster T99080 features the 14 transcripts listed in Table 1 above. These transcripts encode a protein which is a variant of the protein acyl phosphatase organotypic isoenzyme. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質T99080_PEA_4_P1は、出願書類の最後に示すアミノ酸配列を有し、転写物T99080_PEA_1_T0によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The mutein T99080_PEA_4_P1 according to the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript T99080_PEA_1_T0. The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質T99080_PEA_4_P1はまた、表755に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P1配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T99080_PEA_4_P1 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 755) It indicates whether it is known and the presence of a known SNP in the mutein T99080_PEA_4_P1 sequence supports the putative sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質T99080_PEA_4_P1は、以下の転写物によってコードされる:T99080_PEA_4_T0(配列は出願書類の最後に示す)。転写物T99080_PEA_4_T0のコード部分を太字で示し、このコード部分は226位から開始され、411位で終結する。転写物はまた、表756に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P1配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T99080_PEA_4_P1 is encoded by the following transcript: T99080_PEA_4_T0 (sequences shown at the end of the application). The code portion of the transcript T99080_PEA_4_T0 is shown in bold, starting from position 226 and ending at position 411. The transcript also has the following SNPs listed in Table 756 (showing its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein T99080_PEA_4_P1 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質T99080_PEA_4_P2は、出願書類の最後に示すアミノ酸配列を有し、転写物T99080_PEA_4_T2によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、部分的タンパク質であるが、両膜貫通領域推定プログラムによってこのタンパク質が膜貫通領域を有すると推定されるので、膜と考えられる。   The mutein T99080_PEA_4_P2 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript T99080_PEA_4_T2. The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: membrane. Although protein localization is a partial protein, it is considered to be a membrane because both transmembrane domain estimation programs presume that this protein has a transmembrane domain.

変異タンパク質T99080_PEA_4_P2は、以下の転写物によってコードされる:T99080_PEA_4_T2(配列は出願書類の最後に示す)。転写物T99080_PEA_4_T2のコード部分を太字で示し、このコード部分は1位から開始され、192位で終結する。転写物はまた、表757に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T99080_PEA_4_P2 is encoded by the following transcript: T99080_PEA_4_T2 (sequences shown at the end of the application). The code portion of the transcript T99080_PEA_4_T2 is shown in bold, starting from position 1 and ending at position 192. The transcript also has the following SNPs listed in Table 757 (showing its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein T99080_PEA_4_P2 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質T99080_PEA_4_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物T99080_PEA_4_T6によってコードされる。公知のタンパク質(アシルホスファターゼ器官共通型イソ酵素)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein T99080_PEA_4_P5 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript T99080_PEA_4_T6. An alignment to a known protein (acyl phosphatase common organ isoenzyme) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

T99080_PEA_4_P5とACYO_HUMAN_V1(配列番号1441)との間の比較の報告
1.T99080_PEA_4_P5のアミノ酸1〜30に対応する配列MPASARLAGAGLLLAFLRALGCAGRAPGLSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、ACYO_HUMAN_V1のアミノ酸1〜99に対応し、T99080_PEA_4_P5のアミノ酸31〜129にも対応するMAEGNTLISVDYEIFGKVQGVFFRKHTQAEGKKLGLVGWVQNTDRGTVQGQLQGPISKVRHMQEWLETRGSPKSHIDKANFNNEKVILKLDYSDFQIVKと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T99080_PEA_4_P5をコードする単離キメラポリペプチド。
Report on comparison between T99080_PEA_4_P5 and ACYO_HUMAN_V1 (SEQ ID NO: 1441) At least 70%, optionally at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 90%, most preferably at least 95% homologous to a polypeptide having the sequence MPASARAGAGLLLAFLRALGCAGRAPGLS corresponding to amino acids 1-30 of T99080_PEA_4_P5 The amino acid sequence of 1 and amino acid 1 to 99 of ACYO_HUMAN_V1 and corresponding to amino acid 31 to 129 of T99080_PEA_4_P5 are also used. Wherein the door, the first amino acid sequence and a second amino acid sequence, contiguous and in sequential order, the isolated chimeric polypeptide coding T99080_PEA_4_P5.

2.T99080_PEA_4_P5の配列MPASARLAGAGLLLAFLRALGCAGRAPGLSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T99080_PEA_4_P5の先端をコードする単離ポリペプチド。   2. The tip of T99080_PEA_4_P5 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence MPASARALAGAGLLLAFLRALGCAGRAPGLS of T99080_PEA_4_P5 An isolated polypeptide encoding

公知のタンパク質配列(ACYO_HUMAN)は、出願書類の最後に示す配列より1つまたは複数の変化があり、このアミノ酸配列をACYO_HUMAN_V1と命名することに留意すべきである。これらの変化が起こることは以前に公知であり、以下の表に列挙した。   It should be noted that the known protein sequence (ACYO_HUMAN) has one or more changes from the sequence shown at the end of the application and this amino acid sequence is named ACYO_HUMAN_V1. The occurrence of these changes was previously known and listed in the following table.

Figure 2008507261
Figure 2008507261

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質T99080_PEA_4_P5はまた、表759に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T99080_PEA_4_P5 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, enumerating other amino acids, and the last column shows SNPs as shown in Table 759) It indicates whether it is known and the presence of a known SNP in the mutein T99080_PEA_4_P5 sequence supports the putative sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質T99080_PEA_4_P5は、以下の転写物によってコードされる:T99080_PEA_4_T6(配列は出願書類の最後に示す)。転写物T99080_PEA_4_T6のコード部分を太字で示し、このコード部分は226位から開始され、612位で終結する。転写物はまた、表760に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T99080_PEA_4_P5 is encoded by the following transcript: T99080_PEA_4_T6 (sequences shown at the end of the application). The code portion of transcript T99080_PEA_4_T6 is shown in bold, starting from position 226 and ending at position 612. The transcript also has the following SNPs listed in Table 760 (indicating its position on the nucleotide sequence and listing another nucleic acid, the last column indicating whether the SNP is known, mutein T99080_PEA_4_P5 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質T99080_PEA_4_P8は、出願書類の最後に示すアミノ酸配列を有し、転写物T99080_PEA_4_T9によってコードされる。公知のタンパク質(アシルホスファターゼ器官共通型イソ酵素)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein T99080_PEA_4_P8 according to the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript T99080_PEA_4_T9. An alignment to a known protein (acyl phosphatase common organ isoenzyme) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

T99080_PEA_4_P8とACYO_HUMAN_V1との間の比較の報告
1.T99080_PEA_4_P8のアミノ酸1〜1に対応する配列Mを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、ACYO_HUMAN_V1のアミノ酸28〜99に対応し、T99080_PEA_4_P8のアミノ酸2〜73にも対応するQAEGKKLGLVGWVQNTDRGTVQGQLQGPISKVRHMQEWLETRGSPKSHIDKANFNNEKVILKLDYSDFQIVKと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T99080_PEA_4_P8をコードする単離キメラポリペプチド。
Report of comparison between T99080_PEA_4_P8 and ACYO_HUMAN_V1 1. A polypeptide having a sequence M corresponding to amino acids 1 to 1 of T99080_PEA_4_P8 at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous QAEGKKLGLVGWVQNTDRGTVQQQLQPISKVRHMQEWLETRGSPKSHIDKANFEKEKILNKLDYSDFQIV corresponding to amino acid 28 to 99 of ACYO_HUMAN_V1 and also to amino acid 2 to 73 of T99080_PEA_4_P8 T99080_PEA_, where the two amino acid sequences are in contiguous and sequential order Isolated chimeric polypeptide encoding _P8.

公知のタンパク質配列(ACYO_HUMAN)は、出願書類の最後に示す配列より1つまたは複数の変化があり、このアミノ酸配列をACYO_HUMAN_V1と命名することに留意すべきである。これらの変化が起こることは以前に公知であり、以下の表に列挙した。   It should be noted that the known protein sequence (ACYO_HUMAN) has one or more changes from the sequence shown at the end of the application and this amino acid sequence is named ACYO_HUMAN_V1. The occurrence of these changes was previously known and listed in the following table.

Figure 2008507261
Figure 2008507261

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: Intracellular. Protein localization is considered to be intracellular as no transmembrane domain estimation program will deduce that this protein is a transmembrane domain. Furthermore, both signal peptide deducing programs deduce that this protein is a non-secretory protein.

変異タンパク質T99080_PEA_4_P8は、以下の転写物によってコードされる:T99080_PEA_4_T9(配列は出願書類の最後に示す)。転写物T99080_PEA_4_T9のコード部分を太字で示し、このコード部分は162位から開始され、380位で終結する。転写物はまた、表762に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T99080_PEA_4_P8 is encoded by the following transcript: T99080_PEA_4_T9 (sequences shown at the end of the application). The code portion of the transcript T99080_PEA_4_T9 is shown in bold, starting from position 162 and ending at position 380. The transcript also has the following SNPs listed in Table 762 (showing its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein T99080_PEA_4_P8 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質T99080_PEA_4_P9は、出願書類の最後に示すアミノ酸配列を有し、転写物T99080_PEA_1_T10によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、部分的タンパク質であるが、両膜貫通領域推定プログラムによってこのタンパク質が膜貫通領域を有すると推定されるので、膜と考えられる。   The mutein T99080_PEA_4_P9 according to the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript T99080_PEA_1_T10. The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: membrane. Although protein localization is a partial protein, it is considered to be a membrane because both transmembrane domain estimation programs presume that this protein has a transmembrane domain.

変異タンパク質T99080_PEA_4_P9は、以下の転写物によってコードされる:T99080_PEA_4_T10(配列は出願書類の最後に示す)。転写物T99080_PEA_4_T10のコード部分を太字で示し、このコード部分は1位から開始され、261位で終結する。転写物はまた、表763に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P9配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T99080_PEA_4_P9 is encoded by the following transcript: T99080_PEA_4_T10 (sequences shown at the end of the application). The code part of the transcript T99080_PEA_4_T10 is shown in bold, this code part starts from position 1 and ends at position 261. The transcript also has the following SNPs listed in Table 763 (showing its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein T99080_PEA_4_P9 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質T99080_PEA_4_P10は、出願書類の最後に示すアミノ酸配列を有し、転写物T99080_PEA_1_T11によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、部分的タンパク質であるが、両膜貫通領域推定プログラムによってこのタンパク質が膜貫通領域を有すると推定されるので、膜と考えられる。   The mutein T99080_PEA_4_P10 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript T99080_PEA_1_T11. The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: membrane. Although protein localization is a partial protein, it is considered to be a membrane because both transmembrane domain estimation programs presume that this protein has a transmembrane domain.

変異タンパク質T99080_PEA_4_P10は、以下の転写物によってコードされる:T99080_PEA_4_T11(配列は出願書類の最後に示す)。転写物T99080_PEA_4_T11のコード部分を太字で示し、このコード部分は1位から開始され、240位で終結する。転写物はまた、表764に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P10配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T99080_PEA_4_P10 is encoded by the following transcript: T99080_PEA_4_T11 (sequences shown at the end of the application). The code portion of the transcript T99080_PEA_4_T11 is shown in bold, starting from position 1 and ending at position 240. The transcript also has the following SNPs listed in Table 764 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein T99080_PEA_4_P10 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質T99080_PEA_4_P12は、出願書類の最後に示すアミノ酸配列を有し、転写物T99080_PEA_1_T14によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、部分的タンパク質であるが、両膜貫通領域推定プログラムによってこのタンパク質が膜貫通領域を有すると推定されるので、膜と考えられる。   The mutein T99080_PEA_4_P12 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript T99080_PEA_1_T14. The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: membrane. Although protein localization is a partial protein, it is considered to be a membrane because both transmembrane domain estimation programs presume that this protein has a transmembrane domain.

変異タンパク質T99080_PEA_4_P12は、以下の転写物によってコードされる:T99080_PEA_4_T14(配列は出願書類の最後に示す)。転写物T99080_PEA_4_T14のコード部分を太字で示し、このコード部分は1位から開始され、282位で終結する。   The mutein T99080_PEA_4_P12 is encoded by the following transcript: T99080_PEA_4_T14 (sequences shown at the end of the application). The code portion of the transcript T99080_PEA_4_T14 is shown in bold, starting from position 1 and ending at position 282.

本発明の変異タンパク質T99080_PEA_4_P13は、出願書類の最後に示すアミノ酸配列を有し、転写物T99080_PEA_1_T17によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、部分的タンパク質であるが、両膜貫通領域推定プログラムによってこのタンパク質が膜貫通領域を有すると推定されるので、膜と考えられる。   The mutein T99080_PEA_4_P13 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript T99080_PEA_1_T17. The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: membrane. Although protein localization is a partial protein, it is considered to be a membrane because both transmembrane domain estimation programs presume that this protein has a transmembrane domain.

変異タンパク質T99080_PEA_4_P13は、以下の転写物によってコードされる:T99080_PEA_4_T17(配列は出願書類の最後に示す)。転写物T99080_PEA_4_T17のコード部分を太字で示し、このコード部分は1位から開始され、207位で終結する。   The mutein T99080_PEA_4_P13 is encoded by the following transcript: T99080_PEA_4_T17 (sequences shown at the end of the application). The code portion of the transcript T99080_PEA_4_T17 is shown in bold, starting from position 1 and ending at position 207.

本発明の変異タンパク質T99080_PEA_4_P14は、出願書類の最後に示すアミノ酸配列を有し、転写物T99080_PEA_1_T18によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The mutein T99080_PEA_4_P14 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript T99080_PEA_1_T18. The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質T99080_PEA_4_P14はまた、表765に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T99080_PEA_4_P14 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, enumerating other amino acids, and the last column shows SNPs as shown in Table 765) It indicates whether it is known and the presence of a known SNP in the mutant protein T99080_PEA_4_P14 sequence supports the predicted sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質T99080_PEA_4_P14は、以下の転写物によってコードされる:T99080_PEA_4_T18(配列は出願書類の最後に示す)。転写物T99080_PEA_4_T18のコード部分を太字で示し、このコード部分は226位から開始され、480位で終結する。転写物はまた、表766に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T99080_PEA_4_P14 is encoded by the following transcript: T99080_PEA_4_T18 (sequences shown at the end of the application). The code portion of the transcript T99080_PEA_4_T18 is shown in bold, starting from position 226 and ending at position 480. The transcript also has the following SNPs listed in Table 766 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein T99080_PEA_4_P14 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質T99080_PEA_4_P15は、出願書類の最後に示すアミノ酸配列を有し、転写物T99080_PEA_1_T19によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The mutein T99080_PEA_4_P15 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript T99080_PEA_1_T19. The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質T99080_PEA_4_P15はまた、表767に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P15配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T99080_PEA_4_P15 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 767) It indicates whether it is known and the presence of a known SNP in the mutant protein T99080_PEA_4_P15 sequence supports the predicted sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質T99080_PEA_4_P15は、以下の転写物によってコードされる:T99080_PEA_4_T19(配列は出願書類の最後に示す)。転写物T99080_PEA_4_T19のコード部分を太字で示し、このコード部分は226位から開始され、459位で終結する。転写物はまた、表768に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P15配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T99080_PEA_4_P15 is encoded by the following transcript: T99080_PEA_4_T19 (sequences shown at the end of the application). The code portion of the transcript T99080_PEA_4_T19 is shown in bold, starting from position 226 and ending at position 459. The transcript also has the following SNPs listed in Table 768 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein T99080_PEA_4_P15 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質T99080_PEA_4_P16は、出願書類の最後に示すアミノ酸配列を有し、転写物T99080_PEA_1_T20によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The mutein T99080_PEA_4_P16 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript T99080_PEA_1_T20. The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質T99080_PEA_4_P16はまた、表769に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P16配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T99080_PEA_4_P16 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, enumerating other amino acids, and the last column shows SNPs as shown in Table 769) It is shown whether it is known and the presence of a known SNP in the mutant protein T99080_PEA_4_P16 sequence supports the predicted sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質T99080_PEA_4_P16は、以下の転写物によってコードされる:T99080_PEA_4_T20(配列は出願書類の最後に示す)。転写物T99080_PEA_4_T20のコード部分を太字で示し、このコード部分は226位から開始され、501位で終結する。転写物はまた、表770に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P16配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T99080_PEA_4_P16 is encoded by the following transcript: T99080_PEA_4_T20 (sequences shown at the end of the application). The code portion of the transcript T99080_PEA_4_T20 is shown in bold and this code portion starts from position 226 and ends at position 501. The transcript also has the following SNPs listed in Table 770 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein T99080_PEA_4_P16 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質T99080_PEA_4_P17は、出願書類の最後に示すアミノ酸配列を有し、転写物T99080_PEA_1_T21によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The mutein T99080_PEA_4_P17 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript T99080_PEA_1_T21. The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質T99080_PEA_4_P17はまた、表771に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P17配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T99080_PEA_4_P17 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, enumerating other amino acids, and the last column shows the SNPs as shown in Table 771) It indicates whether it is known and the presence of a known SNP in the mutant protein T99080_PEA_4_P17 sequence supports the predicted sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質T99080_PEA_4_P17は、以下の転写物によってコードされる:T99080_PEA_4_T21(配列は出願書類の最後に示す)。転写物T99080_PEA_4_T21のコード部分を太字で示し、このコード部分は226位から開始され、426位で終結する。転写物はまた、表772に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P17配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T99080_PEA_4_P17 is encoded by the following transcript: T99080_PEA_4_T21 (sequences shown at the end of the application). The code portion of transcript T99080_PEA_4_T21 is shown in bold, starting from position 226 and ending at position 426. The transcript also has the following SNPs listed in Table 772 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein T99080_PEA_4_P17 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターT99080は、上の表2に列挙した11個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster T99080 is characterized by the eleven segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターT99080_PEA_4_node_1は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T99080_PEA_4_T0、T99080_PEA_4_T6、T99080_PEA_4_T13、T99080_PEA_4_T18、T99080_PEA_4_T19、T99080_PEA_4_T20、およびT99080_PEA_4_T21。以下の表773は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T99080_PEA_4_node_1 of the present invention is supported by 5 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T99080_PEA_4_T0, T99080_PEA_4_T6, T99080_PEA_4_T13, T99080_PEA_4_T18, T99080_PEA_4_T19, T99080_PEA_4_T20, and T99080_PEA_4. Table 773 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT99080_PEA_4_node_6は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T99080_PEA_4_T17およびT99080_PEA_4_T21。以下の表774は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T99080_PEA_4_node_6 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T99080_PEA_4_T17 and T99080_PEA_4_T21. Table 774 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT99080_PEA_4_node_11は、7個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T99080_PEA_4_T14およびT99080_PEA_4_T20。以下の表775は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T99080_PEA_4_node_11 of the present invention is supported by seven libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T99080_PEA_4_T14 and T99080_PEA_4_T20. Table 775 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT99080_PEA_4_node_19は、59個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T99080_PEA_4_T0、T99080_PEA_4_T2、およびT99080_PEA_4_T4。以下の表776は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T99080_PEA_4_node_19 of the present invention is supported by 59 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T99080_PEA_4_T0, T99080_PEA_4_T2, and T99080_PEA_4_T4. Table 776 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT99080_PEA_4_node_20は、98個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T99080_PEA_4_T0、T99080_PEA_4_T2、T99080_PEA_4_T4、T99080_PEA_4_T6、T99080_PEA_4_T9、T99080_PEA_4_T10、T99080_PEA_4_T11、T99080_PEA_4_T13、T99080_PEA_4_T18、およびT99080_PEA_4_T19。以下の表777は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T99080_PEA_4_node_20 of the present invention is supported by 98 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T99080_PEA_4_T0, T99080_PEA_4_T2, T99080_PEA_4_T4, T99080_PEA_4_T6, T99080_PEA_4_T9, T99080_PEA_4_T10, T9080_PE4T4 14 0 14 PE Table 777 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターT99080_PEA_4_node_3は、40個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T99080_PEA_4_T2、T99080_PEA_4_T9、T99080_PEA_4_T10、T99080_PEA_4_T11、T99080_PEA_4_T14、およびT99080_PEA_4_T17。以下の表778は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T99080_PEA_4_node_3 of the present invention is supported by 40 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T99080_PEA_4_T2, T99080_PEA_4_T9, T99080_PEA_4_T10, T99080_PEA_4_T11, T99080_PEA_4_T14, and T99080_PEA_4_T17. Table 778 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT99080_PEA_4_node_5は、57個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T99080_PEA_4_T0、T99080_PEA_4_T2、T99080_PEA_4_T6、T99080_PEA_4_T10、T99080_PEA_4_T11、T99080_PEA_4_T14、T99080_PEA_4_T17、T99080_PEA_4_T18、T99080_PEA_4_T19、T99080_PEA_4_T20、およびT99080_PEA_4_T21。以下の表779は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T99080_PEA_4_node_5 of the present invention is supported by 57 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T99080_PEA_4_T0, T99080_PEA_4_T2, T99080_PEA_4_T6, T99080_PEA_4_T10, T99080_PEA_4_T14, T990_PE4_T14 005 004 004 005 004 005 024 Table 779 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT99080_PEA_4_node_8は、12個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T99080_PEA_4_T9、T99080_PEA_4_T10、T99080_PEA_4_T14、T99080_PEA_4_T18、およびT99080_PEA_4_T20。以下の表780は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T99080_PEA_4_node_8 of the present invention is supported by 12 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T99080_PEA_4_T9, T99080_PEA_4_T10, T99080_PEA_4_T14, T99080_PEA_4_T18, and T99080_PEA_4_T20. Table 780 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表781に示す)。   Microarray (chip) data for this segment is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (for lung cancer) (shown in Table 781).

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT99080_PEA_4_node_13は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T99080_PEA_4_T4。以下の表782は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T99080_PEA_4_node_13 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T99080_PEA_4_T4. Table 782 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT99080_PEA_4_node_15は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T99080_PEA_4_T11およびT99080_PEA_4_T19。以下の表783は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T99080_PEA_4_node_15 of the present invention is supported by six libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T99080_PEA_4_T11 and T99080_PEA_4_T19. Table 783 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT99080_PEA_4_node_18は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T99080_PEA_4_T0およびT99080_PEA_4_T2。以下の表784は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T99080_PEA_4_node_18 of the present invention is supported by 5 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T99080_PEA_4_T0 and T99080_PEA_4_T2. Table 784 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:

Sequence name: ACYO_HUMAN_V1



Sequence documentation:



Alignment of: T99080_PEA_4_P5 x ACYO_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 973.00 Escore: 0

Matching length: 99 Total length: 99

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

. . . . .

31 MAEGNTLISVDYEIFGKVQGVFFRKHTQAEGKKLGLVGWVQNTDRGTVQG 80

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MAEGNTLISVDYEIFGKVQGVFFRKHTQAEGKKLGLVGWVQNTDRGTVQG 50

. . . .

81 QLQGPISKVRHMQEWLETRGSPKSHIDKANFNNEKVILKLDYSDFQIVK 129

|||||||||||||||||||||||||||||||||||||||||||||||||

51 QLQGPISKVRHMQEWLETRGSPKSHIDKANFNNEKVILKLDYSDFQIVK 99













Sequence name: ACYO_HUMAN_V1



Sequence documentation:



Alignment of: T99080_PEA_4_P8 x ACYO_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 711.00 Escore: 0

Matching length: 72 Total length: 72

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

. . . . .

2 QAEGKKLGLVGWVQNTDRGTVQGQLQGPISKVRHMQEWLETRGSPKSHID 51

||||||||||||||||||||||||||||||||||||||||||||||||||

28 QAEGKKLGLVGWVQNTDRGTVQGQLQGPISKVRHMQEWLETRGSPKSHID 77

. .

52 KANFNNEKVILKLDYSDFQIVK 73

||||||||||||||||||||||

78 KANFNNEKVILKLDYSDFQIVK 99







Mutated protein alignment against previously known proteins:

Sequence name: ACYO_HUMAN_V1



Sequence documentation:



Alignment of: T99080_PEA_4_P5 x ACYO_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 973.00 Escore: 0

Matching length: 99 Total length: 99

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

....

31 MAEGNTLISVDYEIFGKVQGVFFRKHTQAEGKKLGLVGWVQNTDRGTVQG 80

||||||||||||||||||||||||||||||||||||||||

1 MAEGNTLISVDYEIFGKVQGVFFRKHTQAEGKKLGLVGWVQNTDRGTVQG 50

....

81 QLQGPISKVRHMQEWLETRGSPKSHIDKANFNNEK VILKLDYSDFQIVK 129

||||||||||||||||||||||||||||||||||||||||

51 QLQGPISKVRHMQEWLETRGSPKSHIDKANFNNEK VILKLDYSDFQIVK 99













Sequence name: ACYO_HUMAN_V1



Sequence documentation:



Alignment of: T99080_PEA_4_P8 x ACYO_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 711.00 Escore: 0

Matching length: 72 Total length: 72

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

....

2 QAEGKKLGLVGWVQNTDRGTVQGQLQGPISKVRHMQEWLETRGSPKSHID 51

||||||||||||||||||||||||||||||||||||||||

28 QAEGKKLGLVGWVQNTDRGTVQGQLQGPISKVRHMQEWLETRGSPKSHID 77

.

52 KANFNNEKVILKLDYSDFQIVK 73

|||||||||||||||||||||

78 KANFNNEKVILKLDYSDFQIVK 99






クラスターT08446の説明
クラスターT08446は、目的の2つの転写物および36個のセグメントを特徴とし、その名称を、それぞれ表785および786に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表787に示す。
Description of Cluster T08446 Cluster T08446 is characterized by two transcripts of interest and 36 segments, the names of which are shown in Tables 785 and 786, respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 787.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるソーティングネキシン26(Sorting nexin 26)(SwissProtアクセッション識別子SNXQ_HUMAN)(配列番号1442)の変異型である。   These sequences are variants of Sorting nexin 26 (SwissProt accession identifier SNXQ_HUMAN) (SEQ ID NO: 1442), a known protein known previously as a protein previously known herein.

タンパク質ソーティングネキシン26は、以下の機能を有することが公知であるか、そのように見なされている:いくつかの細胞内輸送段階に関与し得る(類似性による)。タンパク質ソーティングネキシン26の配列を、「ソーティングネキシン26アミノ酸配列」として出願書類の最後に示す。   Protein sorting nexin 26 is known or considered to have the following functions: It may be involved in several intracellular transport steps (due to similarity). The sequence of protein sorting nexin 26 is shown at the end of the application as "sorting nexin 26 amino acid sequence".

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである細胞内タンパク質輸送、分子機能に関連する注釈付けであるタンパク質輸送体。   The following GO annotation applies to previously known proteins. The following annotations were found: intracellular protein transport, which is an annotation related to biological processes, protein transporter, which is an annotation related to molecular function.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

上記のように、クラスターT08446は、上の表1に列挙した2個の転写物を特徴とする。これらの転写物は、タンパク質ソーティングネキシン26の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster T08446 is characterized by the two transcripts listed in Table 1 above. These transcripts encode proteins that are variants of protein sorting nexin 26. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質T08446_PEA_1_P18は、出願書類の最後に示すアミノ酸配列を有し、転写物T08446_PEA_1_T2によってコードされる。公知のタンパク質(ソーティングネキシン26)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein T08446_PEA_1_P18 according to the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript T08446_PEA_1_T2. An alignment to a known protein (sorting nexin 26) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

T08446_PEA_1_P18とSNXQ_HUMANとの間の比較の報告
1.SNXQ_HUMANのアミノ酸1〜185に対応し、T08446_PEA_1_P18のアミノ酸1〜185にも対応するMLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMEと少なくとも90%相同な第1のアミノ酸配列と、T08446_PEA_1_P18のアミノ酸186〜1305に対応する配列LDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYCを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T08446_PEA_1_P18をコードする単離キメラポリペプチド。
Report on comparison between T08446_PEA_1_P18 and SNXQ_HUMAN 1. Corresponding to amino acids 1-185 of SNXQ_HUMAN, first amino acid sequence at least 90% homologous to the corresponding MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWME to amino acids 1-185 of T08446_PEA_1_P18, corresponding to amino acids 186-1305 of T08446_PEA_1_P18 sequence LDNHGRRLLLSEEASLNIPAVAAAHVIKRYTA APDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKS AGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGP LGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDP A polypeptide having at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, more preferably at least 95%, and a second amino acid sequence homologous to the polypeptide comprising An isolated chimeric polypeptide encoding T08446_PEA_1_P18, wherein the one amino acid sequence and the second amino acid sequence are adjacent and in sequential order.

2.T08446_PEA_1_P18中の配列LDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYCと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T08446_PEA_1_P18のテールをコードする単離ポリペプチド。   2. Sequence in the T08446_PEA_1_P18 LDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELES GMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGA GAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPP DHLGYSAPQHPARRPTPPEPLYVNLALGPGPPSPASSSSSPPAHPRSRSDPGPP VPRLPQKQRAP WGPRTPHRVPGPWGPPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLH SEGQTRSYC and optionally at least about 80%, preferably at least about 85%, for example, for example, for example, Isolated polypeptide.

T08446_PEA_1_P18とQ9NT23(配列番号1443)との間の比較の報告
1.T08446_PEA_1_P18のアミノ酸1〜443に対応する配列MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、Q9NT23のアミノ酸1〜674に対応し、T08446_PEA_1_P18のアミノ酸444〜1117にも対応するHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGASEGSPYSGと少なくとも90%相同な第2のアミノ酸配列と、T08446_PEA_1_P18のアミノ酸1118に対応する架橋アミノ酸Pと、Q9NT23のアミノ酸676〜862に対応し、T08446_PEA_1_P18のアミノ酸1119〜1305にも対応するTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYCと少なくとも90%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、架橋アミノ酸、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、T08446_PEA_1_P18をコードする単離キメラポリペプチド。
Report of the comparison between T08446_PEA_1_P18 and Q9NT23 (SEQ ID NO: 1443) Corresponding to amino acids 1 to 443 of T08446_PEA_1_P18 array MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPR KLAGLLRTFMRSRPSRQRLRQRGIRLQRVGFGCDLGEHLSNSGQDVPRCCSEFIEAHEVVDGIYRLSGVSSNIQLRHREFEDSERIPELSIPAPHQDIHSVSLCKLYFREPNLPLLTYQLYGKFSEAMSVPGEEERLVRV and at least 80%, at least 80%, and at least for the corresponding HDVI Q QLPPP PHYRTLEYLLRHLARMARHSANT SM HARNLA corresponding to ~ 674 and corresponding to amino acids 444 to 1117 of T08446_PEA_1_P18 VWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPL And at least 90% homologous second amino acid sequence AVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGASEGSPYSG, T08446_PEA Crosslinking amino acid P corresponding to amino acid 1118 of 1_P18, corresponding to amino acids 676-862 of Q9NT23, and a corresponding TRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYC at least 90% homologous third amino acid sequence to amino acids 1119-1305 of T08446_PEA_1_P18, the First amino acid sequence, second amino acid sequence, bridging amino acid, and 3 amino acid sequence, contiguous and in sequential order, the isolated chimeric polypeptide coding T08446_PEA_1_P18.

2.T08446_PEA_1_P18の配列MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T08446_PEA_1_P18の先端をコードする単離ポリペプチド。   2. Array of T08446_PEA_1_P18 MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSR At least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%. Isolated polypeptide.

T08446_PEA_1_P18とQ96CP3(配列番号1444)との間の比較の報告
1.T08446_PEA_1_P18のアミノ酸1〜1010に対応する配列MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、Q96CP3のアミノ酸1〜295に対応し、T08446_PEA_1_P18のアミノ酸1011〜1305にも対応するLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYCと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T08446_PEA_1_P18をコードする単離キメラポリペプチド。
Report of the comparison between T08446_PEA_1_P18 and Q96CP3 (SEQ ID NO: 1444) Corresponding to amino acids 1 to 1010 of T08446_PEA_1_P18 array MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRP GKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGG RAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSG The first amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to the polypeptide having SGPP LRGPAQVSAGGRAGGADGAPEAAAQSPCSVP SQVPTPGFSPLAPGPFPGPGPGPGLYPGSFSPSSPAPVWRSSLGPPALDRYGENLYYEIGASEGSPPYSGPTRSWSPRFSPMPPDRPNASLSPMPGL PDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYC and and at least 90% homologous to a second amino acid sequence, the first amino acid sequence and a second amino acid sequence, contiguous and in sequential order, the isolated chimeric polypeptide coding T08446_PEA_1_P18.

2.T08446_PEA_1_P18の配列MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T08446_PEA_1_P18の先端をコードする単離ポリペプチド。   2. Array of T08446_PEA_1_P18 MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSR SRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTV LRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWV Encodes the tip of T08446_PEA_1_P18, which contains a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to PGPPPPLPMQQSDGSLRLRSPRPMGTSRRG Isolated polypeptide.

T08446_PEA_1_P18とBAC86902(配列番号1445)との間の比較の報告
1.T08446_PEA_1_P18のアミノ酸1〜154に対応する配列MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、BAC86902のアミノ酸1〜861に対応し、T08446_PEA_1_P18のアミノ酸155〜1015にも対応するMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGLRGPAと少なくとも90%相同な第2のアミノ酸配列と、T08446_PEA_1_P18のアミノ酸1016〜1043に対応する配列QVSAQLRAGGGGRDAPEAAAQSPCSVPSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列と、BAC86902のアミノ酸862〜989に対応し、T08446_PEA_1_P18のアミノ酸1044〜1171にも対応するQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSと少なくとも90%相同な第4のアミノ酸配列と、T08446_PEA_1_P18のアミノ酸1172〜1305に対応する配列APQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYCを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第5のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、第3のアミノ酸配列、第4のアミノ酸配列、および第5のアミノ酸配列が、隣接し、且つ連続した順序にある、T08446_PEA_1_P18をコードする単離キメラポリペプチド。
Report of the comparison between T08446_PEA_1_P18 and BAC86902 (SEQ ID NO: 1445) A sequence corresponding to amino acids 1 to 154 of T08446_PEA_1_P18 is a table that includes a pair of at least a pair of at least 15: Amino acid sequence corresponding to amino acids 1-861 of BAC86902 and amino acids 155-1015 of T08446_PEA_1_P18. MLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARN also corresponding AIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISE And at least 90% homologous second amino acid sequence PierueibuiesubuiPiPieibuieruieruerujieijijieiPieiesueitiPitiPieieruesuPijiaruesueruaruPieichieruaiPieruerueruarujieiieiPierutidieishikyukyuiemushiesukeieruarujieikyuJipieruJipidiemuiesupierupipipipieruesuerueruaruPijijieiPipipipipikeienuPieiarueruemueierueierueiiarueikyukyubuieiikyukyuesukyukyuishijijitiPiPieiesukyuesuPiefueichiaruesueruesueruibuijijiiPierujitiesujiesuJipipipienuesuerueieichiPijieidaburyubuiPiJipipipiwaieruPiaruQQSDGSLLRSQRPMGTSRRGLRGPA, polypeptide at least 70% with a sequence corresponding to QVSAQLRAGGGGRDAPEAAAQSPCSVPS amino acid 1016-1043 of T08446_PEA_1_P18, optionally at least 80%, preferably at least GIV GIVIGITIGH A fourth amino acid sequence homologous to the sequence APQHPARRPTPPEPLYVNLALGPRGPSPASSSSSS corresponding to amino acids 1172 to 1305 of T08446_PEA_1_P18 A polypeptide having at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to a polypeptide having at least 70%, preferably at least 85%, more preferably at least 90%; An isolated chimeric polypeptide encoding T08446_PEA_1_P18, wherein the amino acid sequence of 1, the second amino acid sequence, the third amino acid sequence, the fourth amino acid sequence, and the fifth amino acid sequence are adjacent and in sequential order .

2.T08446_PEA_1_P18の配列MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T08446_PEA_1_P18の先端をコードする単離ポリペプチド。   2. A sequence of T08446_PEA_1_P18 of the T08446_PEA_1_P18 (same as in the lower part in the lower part of the U14Gullus).... An isolated polypeptide encoding

3.T08446_PEA_1_P18に対応するQVSAQLRAGGGGRDAPEAAAQSPCSVPSをコードする配列と少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なアミノ酸配列を含む、T08446_PEA_1_P18の縁部分をコードする単離ポリペプチド。   3. T08446_PEA_1_P18 corresponding amino acid sequence that is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence encoding QVSAQLRAGGGGRDAPEAAAQSPCSVPS An isolated polypeptide encoding the edge portion of T08446_PEA_1_P18, which comprises

4.T08446_PEA_1_P18中の配列APQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYCと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T08446_PEA_1_P18のテールをコードする単離ポリペプチド。   4. In the T08446_PEA_1_P18, in the T08446_PEA1_P18 in the T08446_PEA. An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質T08446_PEA_1_P18はまた、表788に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T08446_PEA_1_P18配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T08446_PEA_1_P18 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 788) It indicates whether it is known and the presence of a known SNP in the mutein T08446_PEA_1_P18 sequence supports the putative sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質T08446_PEA_1_P18は、以下の転写物によってコードされる:T08446_PEA_1_T2(配列は出願書類の最後に示す)。転写物T08446_PEA_1_T2のコード部分を太字で示し、このコード部分は228位から開始され、4142位で終結する。転写物はまた、表789に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T08446_PEA_1_P18配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T08446_PEA_1_P18 is encoded by the following transcript: T08446_PEA_1_T2 (sequences shown at the end of the application). The coding portion of transcript T08446_PEA_1_T2 is shown in bold, starting at position 228 and ending at position 4142. The transcript also has the following SNPs listed in Table 789 (indicating its position on the nucleotide sequence and listing another nucleic acid, the last column indicating whether the SNP is known, mutein T08446_PEA_1_P18 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質T08446_PEA_1_P19は、出願書類の最後に示すアミノ酸配列を有し、転写物T08446_PEA_1_T22によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The mutein T08446_PEA_1_P19 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript T08446_PEA_1_T22. The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質T08446_PEA_1_P19はまた、表790に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T08446_PEA_1_P19配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T08446_PEA_1_P19 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 790) It is shown whether it is known and the presence of a known SNP in the mutein T08446_PEA_1_P19 sequence supports the putative sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質T08446_PEA_1_P19は、以下の転写物によってコードされる:T08446_PEA_1_T22(配列は出願書類の最後に示す)。転写物T08446_PEA_1_T22のコード部分を太字で示し、このコード部分は228位から開始され、965位で終結する。転写物はまた、表791に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T08446_PEA_1_P19配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T08446_PEA_1_P19 is encoded by the following transcript: T08446_PEA_1_T22 (sequences shown at the end of the application). The code portion of transcript T08446_PEA_1_T22 is shown in bold and this code portion starts at position 228 and ends at position 965. The transcript also has the following SNPs listed in Table 791 (showing its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein T08446_PEA_1_P19 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターT08446は、上の表2に列挙した36個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster T08446 is characterized by the 36 segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターT08446_PEA_1_node_2は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2およびT08446_PEA_1_T22。以下の表792は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_2 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2 and T08446_PEA_1_T22. Table 792 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_9は、17個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2およびT08446_PEA_1_T22。以下の表793は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_9 of the present invention is supported by 17 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2 and T08446_PEA_1_T22. Table 793 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_15は、0個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T22。以下の表794は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_15 of the present invention is supported by 0 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T22. Table 794 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_17は、22個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表794は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_17 of the present invention is supported by 22 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 794 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_25は、24個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表12は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_25 of the present invention is supported by 24 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 12 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_29は、25個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表795は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_29 of the present invention is supported by 25 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 795 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_38は、20個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表796は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_38 of the present invention is supported by 20 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 796 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_43は、15個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表797は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_43 of the present invention is supported by 15 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 797 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_51は、19個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表798は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_51 of the present invention is supported by 19 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 798 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_52は、15個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表799は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_52 of the present invention is supported by 15 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 799 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_55は、21個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表800は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_55 of the present invention is supported by 21 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 800 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_57は、37個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表801は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_57 of the present invention is supported by 37 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 801 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_59は、36個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表802は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_59 of the present invention is supported by 36 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 802 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_62は、36個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表803は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_62 of the present invention is supported by 36 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 803 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_63は、64個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表804は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_63 of the present invention is supported by 64 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 804 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターT08446_PEA_1_node_3は、14個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2およびT08446_PEA_1_T22。以下の表805は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_3 of the present invention is supported by 14 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2 and T08446_PEA_1_T22. Table 805 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_5は、17個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2およびT08446_PEA_1_T22。以下の表806は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_5 of the present invention is supported by 17 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2 and T08446_PEA_1_T22. Table 806 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表807に示す)。   Microarray (chip) data for this segment is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (for lung cancer) (shown in Table 807).

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_7は、19個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2およびT08446_PEA_1_T22。以下の表808は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_7 of the present invention is supported by 19 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2 and T08446_PEA_1_T22. Table 808 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表809に示す)。   Microarray (chip) data for this segment is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (for lung cancer) (shown in Table 809).

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_12は、14個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2およびT08446_PEA_1_T22。以下の表810は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_12 of the present invention is supported by 14 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2 and T08446_PEA_1_T22. Table 810 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_13は、0個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T22。以下の表811は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_13 of the present invention is supported by 0 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T22. Table 811 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_19は、19個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表812は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_19 of the present invention is supported by 19 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 812 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_21は、21個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表813は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_21 of the present invention is supported by 21 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 813 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_23は、22個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表814は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_23 of the present invention is supported by 22 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 814 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_27は、23個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表815は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_27 of the present invention is supported by 23 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 815 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_32は、23個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表816は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_32 of the present invention is supported by 23 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 816 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_34は、22個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表817は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_34 of the present invention is supported by 22 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 817 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_45は、19個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表818は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_45 of the present invention is supported by 19 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 818 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_46は、18個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表819は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_46 of the present invention is supported by 18 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 819 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_48は、19個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表820は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_48 of the present invention is supported by 19 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 820 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_54を、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表821は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_54 according to the invention can be found in the following transcript: T08446_PEA_1_T2. Table 821 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_58は、13個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表822は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_58 of the present invention is supported by 13 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 822 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_60は、27個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表823は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_60 of the present invention is supported by 27 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 823 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_61は、25個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表824は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_61 of the present invention is supported by 25 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 824 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_64を、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表825は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_64 according to the invention can be found in the following transcript: T08446_PEA_1_T2. Table 825 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_65は、39個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表826は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_65 of the present invention is supported by 39 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 826 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT08446_PEA_1_node_66は、29個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表827は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T08446_PEA_1_node_66 of the present invention is supported by 29 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T08446_PEA_1_T2. Table 827 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:

Sequence name: SNXQ_HUMAN



Sequence documentation:



Alignment of: T08446_PEA_1_P18 x SNXQ_HUMAN ..



Alignment segment 1/1:



Quality: 1835.00 Escore: 0

Matching length: 185 Total length: 185

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

. . . . .

1 MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKP 50

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKP 50

. . . . .

51 GKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELV 100

||||||||||||||||||||||||||||||||||||||||||||||||||

51 GKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELV 100

. . . . .

101 FGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGA 150

||||||||||||||||||||||||||||||||||||||||||||||||||

101 FGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGA 150

. . .

151 RAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWME 185

|||||||||||||||||||||||||||||||||||

151 RAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWME 185













Sequence name: Q9NT23



Sequence documentation:



Alignment of: T08446_PEA_1_P18 x Q9NT23 ..



Alignment segment 1/1:



Quality: 8548.00 Escore: 0

Matching length: 862 Total length: 862

Matching Percent Similarity: 99.88 Matching Percent Identity: 99.88

Total Percent Similarity: 99.88 Total Percent Identity: 99.88

Gaps: 0



Alignment:

. . . . .

444 HDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRS 493

||||||||||||||||||||||||||||||||||||||||||||||||||

1 HDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRS 50

. . . . .

494 MELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRC 543

||||||||||||||||||||||||||||||||||||||||||||||||||

51 MELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRC 100

. . . . .

544 LLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERR 593

||||||||||||||||||||||||||||||||||||||||||||||||||

101 LLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERR 150

. . . . .

594 KGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSR 643

||||||||||||||||||||||||||||||||||||||||||||||||||

151 KGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSR 200

. . . . .

644 PDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSC 693

||||||||||||||||||||||||||||||||||||||||||||||||||

201 PDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSC 250

. . . . .

694 ESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELD 743

||||||||||||||||||||||||||||||||||||||||||||||||||

251 ESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELD 300

. . . . .

744 FSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVT 793

||||||||||||||||||||||||||||||||||||||||||||||||||

301 FSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVT 350

. . . . .

794 PQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPA 843

||||||||||||||||||||||||||||||||||||||||||||||||||

351 PQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPA 400

. . . . .

844 LSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPL 893

||||||||||||||||||||||||||||||||||||||||||||||||||

401 LSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPL 450

. . . . .

894 PPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPP 943

||||||||||||||||||||||||||||||||||||||||||||||||||

451 PPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPP 500

. . . . .

944 ASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQS 993

||||||||||||||||||||||||||||||||||||||||||||||||||

501 ASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQS 550

. . . . .

994 DGSLLRSQRPMGTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPS 1043

||||||||||||||||||||||||||||||||||||||||||||||||||

551 DGSLLRSQRPMGTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPS 600

. . . . .

1044 QVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGP 1093

||||||||||||||||||||||||||||||||||||||||||||||||||

601 QVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGP 650

. . . . .

1094 PAPLDRGENLYYEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQS 1143

|||||||||||||||||||||||| |||||||||||||||||||||||||

651 PAPLDRGENLYYEIGASEGSPYSGLTRSWSPFRSMPPDRLNASYGMLGQS 700

. . . . .

1144 PPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALG 1193

||||||||||||||||||||||||||||||||||||||||||||||||||

701 PPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALG 750

. . . . .

1194 PRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGP 1243

||||||||||||||||||||||||||||||||||||||||||||||||||

751 PRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGP 800

. . . . .

1244 WGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSW 1293

||||||||||||||||||||||||||||||||||||||||||||||||||

801 WGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSW 850

.

1294 SLHSEGQTRSYC 1305

||||||||||||

851 SLHSEGQTRSYC 862













Sequence name: Q96CP3



Sequence documentation:



Alignment of: T08446_PEA_1_P18 x Q96CP3 ..



Alignment segment 1/1:



Quality: 3019.00 Escore: 0

Matching length: 295 Total length: 295

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

. . . . .

1011 LRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLP 1060

||||||||||||||||||||||||||||||||||||||||||||||||||

1 LRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLP 50

. . . . .

1061 PFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGAS 1110

||||||||||||||||||||||||||||||||||||||||||||||||||

51 PFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGAS 100

. . . . .

1111 EGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAP 1160

||||||||||||||||||||||||||||||||||||||||||||||||||

101 EGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAP 150

. . . . .

1161 SCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAH 1210

||||||||||||||||||||||||||||||||||||||||||||||||||

151 SCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAH 200

. . . . .

1211 PRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAY 1260

||||||||||||||||||||||||||||||||||||||||||||||||||

201 PRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAY 250

. . . .

1261 GRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYC 1305

|||||||||||||||||||||||||||||||||||||||||||||

251 GRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYC 295













Sequence name: BAC86902



Sequence documentation:



Alignment of: T08446_PEA_1_P18 x BAC86902 ..



Alignment segment 1/1:



Quality: 9651.00 Escore: 0

Matching length: 991 Total length: 1019

Matching Percent Similarity: 99.90 Matching Percent Identity: 99.90

Total Percent Similarity: 97.15 Total Percent Identity: 97.15

Gaps: 1



Alignment:

. . . . .

155 MLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIP 204

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIP 50

. . . . .

205 AVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVG 254

||||||||||||||||||||||||||||||||||||||||||||||||||

51 AVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVG 100

. . . . .

255 FFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLA 304

||||||||||||||||||||||||||||||||||||||||||||||||||

101 FFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLA 150

. . . . .

305 GLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCS 354

||||||||||||||||||||||||||||||||||||||||||||||||||

151 GLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCS 200

. . . . .

355 EFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVS 404

||||||||||||||||||||||||||||||||||||||||||||||||||

201 EFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVS 250

. . . . .

405 SLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPH 454

||||||||||||||||||||||||||||||||||||||||||||||||||

251 SLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPH 300

. . . . .

455 YRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGA 504

||||||||||||||||||||||||||||||||||||||||||||||||||

301 YRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGA 350

. . . . .

505 AAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGS 554

||||||||||||||||||||||||||||||||||||||||||||||||||

351 AAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGS 400

. . . . .

555 CPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKP 604

||||||||||||||||||||||||||||||||||||||||||||||||||

401 CPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKP 450

. . . . .

605 GGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKS 654

||||||||||||||||||||||||||||||||||||||||||||||||||

451 GGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKS 500

. . . . .

655 EESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSES 704

||||||||||||||||||||||||||||||||||||||||||||||||||

501 EESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSES 550

. . . . .

705 SSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLR 754

||||||||||||||||||||||||||||||||||||||||||||||||||

551 SSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLR 600

. . . . .

755 GLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTS 804

||||||||||||||||||||||||||||||||||||||||||||||||||

601 GLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTS 650

. . . . .

805 PASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHL 854

||||||||||||||||||||||||||||||||||||||||||||||||||

651 PASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHL 700

. . . . .

855 IPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPG 904

||||||||||||||||||||||||||||||||||||||||||||||||||

701 IPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPG 750

. . . . .

905 GAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLS 954

||||||||||||||||||||||||||||||||||||||||||||||||||

751 GAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLS 800

. . . . .

955 LEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPM 1004

||||||||||||||||||||||||||||||||||||||||||||||||||

801 LEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPM 850

. . . . .

1005 GTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPA 1054

||||||||||| |||||||||||

851 GTSRRGLRGPA............................QVPTPGFFSPA 872

. . . . .

1055 PRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLY 1104

||||||||||||||||||||||||||||||||||||||||||||||||||

873 PRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLY 922

. . . . .

1105 YEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLL 1154

||||||||||||||||||||||||||||||||||||||||||||||||||

923 YEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLL 972

.

1155 SYPPAPSCFPPDHLGYSAP 1173

||||||||||||||||| |

973 SYPPAPSCFPPDHLGYSPP 991




Mutated protein alignment against previously known proteins:

Sequence name: SNXQ_HUMAN



Sequence documentation:



Alignment of: T08446_PEA_1_P18 x SNXQ_HUMAN ..



Alignment segment 1/1:



Quality: 1835.00 Escore: 0

Matching length: 185 Total length: 185

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

....

1 MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPGPGPSVKGP 50

||||||||||||||||||||||||||||||||||||||||

1 MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPGPGPSVKGP 50

....

51 GKRLSAPRGP FPRLADCAHFHYENVDFGHIQLLSPDREGPSLSGENELV 100

||||||||||||||||||||||||||||||||||||||||

51 GKRLSAPRGP FPRLADCAHFHYENVDFGHIQLLSPDREGPSLSGENELV 100

....

101 FGVQ VTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLEPLPPPPEGA 150

||||||||||||||||||||||||||||||||||||||||

101 FGVQ VTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLEPLPPPPEGA 150

....

151 RAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWME 185

||||||||||||||||||||||||||||||||

151 RAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWME 185













Sequence name: Q9NT23



Sequence documentation:



Alignment of: T08446_PEA_1_P18 x Q9NT23 ..



Alignment segment 1/1:



Quality: 8548.00 Escore: 0

Matching length: 862 Total length: 862

Matching Percent Similarity: 99.88 Matching Percent Identity: 99.88

Total Percent Similarity: 99.88 Total Percent Identity: 99.88

Gaps: 0



Alignment:

....

444 HDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPFNLLRS 493

||||||||||||||||||||||||||||||||||||||||

1 HDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPFNLLRS 50

....

494 MELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRC 543

||||||||||||||||||||||||||||||||||||||||

51 MELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRC 100

....

544 LLPRPKSLAGSCPSTRLLTLEEAQARTQGRL GTPTEPTTPKAPASPAERR 593

||||||||||||||||||||||||||||||||||||||||

101 LLPRPKSLAGSCPSTRLL TLEEAQARTQGRL GTPTEPTTPKAPAS PAERR 150

....

594 KERGGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPGPPSGSR 643

||||||||||||||||||||||||||||||||||||||||

151 KERGGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPAPPPSGSR 200

....

644 PDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSC 693

||||||||||||||||||||||||||||||||||||||||

201 PDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSC 250

....

694 ESL SS SS SS ESS SS ESS SS SS AAGALGAL SG SP SHRT SAW LD D G D DD 743

||||||||||||||||||||||||||||||||||||||||

251 ESL SS SS SS ESS SS ESS SS SS AAGALGAL SG SP SHRT SAW LD D G D DD 300

....

744 FSPP RCLEGLRGLDFTLTCSSPSTPGDPAPPAPPAPASPFPPRVT 793

||||||||||||||||||||||||||||||||||||||||

301 FSPP RCLEGLRGLDFTLTCSSPSTPGDPAPPAPPAPASPFPPRVT 350

....

794 PQAISPRGPTSPAPALDISEPLAVSVPPAVLELLGAGGASATPTPA 843

||||||||||||||||||||||||||||||||||||||||

351 PQAISPRGPTSPAPALDISEPLAVSVPPAVLELLGAGGASATPTPA 400

....

844 LSPGRSLPHLIPLLLRGA EAPLTDACQQEMCS KLRGAQGPLGPDMESPL 893

||||||||||||||||||||||||||||||||||||||||

401 LSPGRSLRPHLIPLLLRGA EAPLTDACQQEMCS KLRGAQGPLGPDMESPL 450

....

894 PPPPLSLLPG GAPPPPPKNPARLMALALAERAQQVAEQQSQQECGTRPP 943

||||||||||||||||||||||||||||||||||||||||

451 PPPPLSLLPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGTGPTP 500

....

944 ASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQS 993

||||||||||||||||||||||||||||||||||||||||

501 ASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQS 550

....

994 DGSL LRSQ RPM GTS RRGL RG PAQ VS AQL RAGGGGRD APEAAAQSPCS VPS 1043

||||||||||||||||||||||||||||||||||||||||

551 DGSLLRSQRPMGTTSRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPS 600

....

1044 QVPTPGFFSPA PRECLEPPFLGVPKPGLYPLGPPSFQPSSPAVWRSSLGP 1093

||||||||||||||||||||||||||||||||||||||||

601 QVPTPGFFSPA PRECLEPPFLGVPKPGLYPLGPPSFQPSSPAVWRSSLGP 650

....

1094 PAPLDRGENLYYEIGASEGSPYSGPTRSWSPFRSPPDRLNASYGMLGQS 1143

||||||||||||||||||||||||||||||||||||||||

651 PAPLDRGENLYYEIGASEGSPYSGLTRSWSPFRPSMPPDRLNASYGMLGQS 700

....

1144 PPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALG 1193

||||||||||||||||||||||||||||||||||||||||

701 PPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALG 750

....

1194 PRGPS PASS SS SPSP HPRS RSDP GPP VPRLP Q KQ RAPG GPR PHR VPGP 1243

||||||||||||||||||||||||||||||||||||||||

751 PRGPS PASS SS SSPP HPR RSDP GPP VPRLPQ KQ RAP W GPRT PHRVP GP 800

....

1244 WGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSW 1293

||||||||||||||||||||||||||||||||||||||||

801 WGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSW 850

.

1294 SLHSEGQTRSYC 1305

||||||||||||

851 SLHSEGQTRSYC 862













Sequence name: Q96CP3



Sequence documentation:



Alignment of: T08446_PEA_1_P18 x Q96CP3 ..



Alignment segment 1/1:



Quality: 3019.00 Escore: 0

Matching length: 295 Total length: 295

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

....

1011 LRGPAQ VSAQLRAGGGGRDAPEAAAQSPCSVPSQ VPTPGFSPAPRECLP 1060

||||||||||||||||||||||||||||||||||||||||

1 LRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVSPQ VPTPGFSPAPRECLP 50

....

1061 PFLGVPKPGLYPLGPPSFQPSSPAVVWRSSLGPP APLDRGENLYYEIGAS 1110

||||||||||||||||||||||||||||||||||||||||

51 PFLGVPKPGLYPLGPPSFQPSSPAVVWRSSLGPP APLDRGENLYYEIGAS 100

....

1111 EGSPYSGPTRSWSPFRSPMPPDRLNASYGMLGQSPLHRSPDFLLSYPPAP 1160

||||||||||||||||||||||||||||||||||||||||

101 EGSPYSGPTRSWSPFRSPDPRLNASYGMLGQSPPLHRSPDFLLSYPPAP 150

....

1161 SCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRPPSPASSSSSSPPAH 1210

||||||||||||||||||||||||||||||||||||||||

151 SCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRPPSPASSSSSSPPAH 200

....

1211 PRSR SDP GPP VPRLP QKQ RAP WGPRT PHRVPGPWGPPEPPLLLYRAAPPAY 1260

||||||||||||||||||||||||||||||||||||||||

201 PRSR SDP GPP V PRLP Q KQ RAP W PRTP R PR VPG P W GPP PLLLRA APPAY 250

....

1261 GRGGELHRGSLYRNGGQRGEGAGPPPPYPTPTSWLSEGQTRSYC 1305

|||||||||||||||||||||||||||||||||||||||

251 GRGGELHRGSLYRNGGQRGEGAGPPPPYPTPTSWLSEGQTRSYC 295













Sequence name: BAC86902



Sequence documentation:



Alignment of: T08446_PEA_1_P18 x BAC86902 ..



Alignment segment 1/1:



Quality: 9651.00 Escore: 0

Matching length: 991 Total length: 1019

Matching Percent Similarity: 99.90 Matching Percent Identity: 99.90

Total Percent Similarity: 97.15 Total Percent Identity: 97.15

Gaps: 1



Alignment:

....

155 MLVPLLLQYLETLSGLVDNNL NCGPVLTWMELDNHGRRLLLSEALSNIP 204

||||||||||||||||||||||||||||||||||||||||

1 MLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIP 50

....

205 AVAAAHVIKRYTAQAPLELSFEVGDIVSVIDMPPTEDRSWRGRGQQVG 254

||||||||||||||||||||||||||||||||||||||||

51 AVAAAHVIKRYTAQAPLELSFEVGDIVSVIDMPPTEDRSWRGKRGFQ 100

....

255 FFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLA 304

||||||||||||||||||||||||||||||||||||||||

101 FFPSECVELFTERPGPGLKADADGPPCGIPAPQ GISSLTSAVPRPRGKLA 150

....

305 GLLRTFMRSRPRQLRRQRGILRQRFGFGCDLGEHLSNSGQDVPQVLRCCS 354

||||||||||||||||||||||||||||||||||||||||

151 GLLRTFMRSRPSRQRLRQRGILRQRFGFGCDLGEHLSNSGQDVPQVLRCCS 200

....

355 EFIEAHGVVDGIYRLSGVSSNIQLRLREFFDERIPELSGPAFLQDIHSVS 404

||||||||||||||||||||||||||||||||||||||||

201 EFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVS 250

....

405 SLCKLYFREPNNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPP 454

||||||||||||||||||||||||||||||||||||||||

251 SLCKLYFREPNNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPP 300

....

455 YRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRMSMELESVGMGA 504

||||||||||||||||||||||||||||||||||||||||

301 YRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRMSMELESVGMGGA 350

....

505 AAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGS 554

||||||||||||||||||||||||||||||||||||||||

351 AAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGS 400

....

555 CPSTRLLTLEEAQARTQGRL GTPTEPTTPKAPASPAERRKGERGEKQRKP 604

||||||||||||||||||||||||||||||||||||||||

401 CPSTRLLTLEEAQARTQGRL GTPTEPTTPKAPASPAERRKGERGEKQRKP 450

....

605 GGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLSAKS 654

||||||||||||||||||||||||||||||||||||||||

451 GGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPGPPSGSRPDTVTLSAKS 500

....

655 EESLSSQASGAGLQRLHRLRRPHSSDSAFPVGPAPAGSCESLSSSSSES 704

||||||||||||||||||||||||||||||||||||||||

501 EESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSES 550

....

705 SSSESSSSSSESSAAGLGALSGSPSHRTSALDLDDHDPRPPRCLEGLR 754

||||||||||||||||||||||||||||||||||||||||

551 SSSSESSSSSSESSAAGLGALSGSPSHRTSALDLDDELDFPPCREGLR 600

....

755 GLDFDPLTFRCSSTPDPDPAPPASPAPPAPASAFPPRVTPQAISPRGPTS 804

||||||||||||||||||||||||||||||||||||||||

601 GLDFDPLTFRCSSTPDPDPAPPASPAPPAPASAFPPRVTPQAISPRGPTS 650

....

805 PASPAALDISEPLAVPSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHL 854

||||||||||||||||||||||||||||||||||||||||

651 PASPAALDISEPLAVPSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHL 700

....

855 IPLLLRGAEAPLTDACQQEMCS KLRGAQGPLGPDMESPLPPPSLLRPG 904

||||||||||||||||||||||||||||||||||||||||

701 IPLLLRGAEAPLTDACQQEMCS KLRGAQGPLGPDMESPLPPPLSLLPG 750

....

905 GAPPPPPKNPARLMALALAERAQQVAEQQSQQEGGPTPASQSPFHRSLS 954

||||||||||||||||||||||||||||||||||||||||

751 GAPPPPPKNPARLMALALAERAQQVAEQQSQQEGGPTPASQSPFHRSLS 800

....

955 LEVGGEPLGT SGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSPRPM 1004

||||||||||||||||||||||||||||||||||||||||

801 LEVGGEPLGTGSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSPRPM 850

....

1005 GTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVSPQVPTPGFSPA 1054

|||||||||||||||||||||

851 GTSRRGLRGPA ........................ QVPTPGFFSPA 872

....

1055 PRECLPPFLGVPKPGLYPLGPPSFQPSSPAVVWRSSLGPPAPLDRGENLY 1104

||||||||||||||||||||||||||||||||||||||||

873 PRECLPFLFVPKPGLYPLGPPSFQPSSPAVVWRSSLGPPAPLDRGENLY 922

....

1105 YEIGASEGSPPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPLHRSPDFLL 1154

||||||||||||||||||||||||||||||||||||||||

923 YEIGASEGSPPYS GPPTRSSWSPRSMPPDRLNASYGMLGQSPPLHRSPDFLL 972

.

1155 SYPPAP SCFPPDHLGYSAP 1173

||||||||||||||||

973 SYPPAP SCFPPDHLGYSPP 991



クラスターHUMCA1XIAの説明
クラスターHUMCA1XIAは、目的の4つの転写物および46個のセグメントを特徴とし、その名称を、それぞれ表828および829に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表830に示す。
Description of cluster HUMCA1XIA The cluster HUMCA1XIA is characterized by 4 transcripts and 46 segments of interest, the names of which are shown in Tables 828 and 829, respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 830.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるコラーゲンα1(SwissProtアクセッション識別子CA1B_HUMAN)(配列番号1446)の変異型である。   These sequences are variants of collagen alpha 1 (SwissProt accession identifier CA1B_HUMAN) (SEQ ID NO: 1446), which is a known protein known previously as a protein previously known herein.

タンパク質コラーゲンα1は、以下の機能を有することが公知であるか、そのように見なされている:コラーゲンII型原線維の外側(lateral)成長の調節による原線維発生で重要な役割を果たし得る。タンパク質コラーゲンα1の配列を、「コラーゲンα1アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表831に示す。   The protein collagen alpha 1 is known or considered to have the following functions: It may play an important role in fibrillogenesis by modulation of the lateral growth of collagen type II fibrils. The sequence of protein collagen α1 is shown at the end of the application as “Collagen α1 amino acid sequence”. Known polymorphisms of this sequence are shown in Table 831.

Figure 2008507261
Figure 2008507261

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである軟骨の凝集(cartilage condensation)、視覚、聴覚、細胞−細胞接着、細胞外基質の組織化および生合成、分子機能に関連する注釈付けである細胞外基質構造タンパク質、細胞外基質構造タンパク質、接着、ならびに細胞成分に関連する注釈付けである細胞外基質、コラーゲン、コラーゲンXI型。   The following GO annotation applies to previously known proteins. The following annotations were found: Cartilage condensation, visual, auditory, cell-cell adhesion, extracellular matrix organization and biosynthesis, molecular function, which are annotations related to biological processes Annotations related to extracellular matrix structural proteins, extracellular matrix structural proteins, adhesion, and annotations related to cellular components: extracellular matrix, collagen, collagen type XI.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

クラスターHUMCA1XIAを、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図32のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   Cluster HUMCA1 XIA can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The term “number” in the right column of the table and the number on the y-axis of FIG. 32 refer to the weighted expression of ESTs in each category as “ppm” (the ppm of ESTs of a particular cluster in this category by ppm Ratio of expression to expression of all ESTs).

概して、図32および表832中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):悪性骨腫瘍、上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および肺悪性腫瘍。   In general, the following results were obtained, as shown for the histograms in FIG. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: malignant bone tumors, epithelial malignancies, a mixture of malignancies from different tissues, and lung malignancies.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、クラスターHUMCA1XIAは、上の表1に列挙した4つの転写物を特徴とする。これらの転写物は、タンパク質コラーゲンα1の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster HUMCA1 XIA is characterized by the four transcripts listed in Table 1 above. These transcripts encode a protein which is a mutated form of the protein collagen α1. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質HUMCA1XIA_P14は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMCA1XIA_T16によってコードされる。公知のタンパク質(コラーゲンα1)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HUMCA1XIA_P14 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HUMCA1XIA_T16. An alignment to a known protein (collagen alpha 1) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HUMCA1XIA_P14とCA1B_HUMAN_V5(配列番号1447)との間の比較の報告
1.CA1B_HUMAN_V5のアミノ酸1〜1056に対応し、HUMCA1XIA_P14のアミノ酸1〜1056にも対応するMEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDRGFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGPRGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQGLPGPQGPIGPPGEKGPQGKPGLAGLPGADGPPGHPGKEGQSGEKGALGPPGPQGPIGYPGPRGVKGADGVRGLKGSKGEKGEDGFPGFKGDMGLKGDRGEVGQIGPRGEDGPEGPKGRAGPTGDPGPSGQAGEKGKLGVPGLPGYPGRQGPKGSTGFPGFPGANGEKGARGVAGKPGPRGQRGPTGPRGSRGARGPTGKPGPKGTSGGDGPPGPPGERGPQGPQGPVGFPGPKGPPGPPGKDGLPGHPGQRGETGFQGKTGPPGPGGVVGPQGPTGETGPIGERGHPGPPGPPGEQGLPGAAGKEGAKGDPGPQGISGKDGPAGLRGFPGERGLPGAQGAPGLKGGEGPQGPPGPVと少なくとも90%相同な第1のアミノ酸配列と、HUMCA1XIA_P14のアミノ酸1057〜1081に対応する配列VSMMIINSQTIMVVNYSSSFITLMLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCA1XIA_P14をコードする単離キメラポリペプチド。
Report of comparison between HUMCA1XIA_P14 and CA1B_HUMAN_V5 (SEQ ID NO: 1447) Corresponding to amino acids 1 to 1056 of CA1B_HUMAN_V5, corresponding to amino acids 1 to 1056 of HUMCA1XIA_P14 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYG AEYKEAESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDRGFDGLPG PGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGPRGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQGLPGPQGPIGPPGEKGPQGKPGLAGLPGADGPPGHPGKEGQSGEKGALGPPGPQGPIGYPGPRGVKGADGVRGLKGSKGEKGEDGFPGFKGDMGLKGDRGEVGQIGPRGEDGPEGPKGRAGPTGDPGPSGQAGEKGKLGVPGLPGYPGRQGPKGSTGFPGFPGANGEKGARGVAGKPGPRGQRGPTGPRGSRGARGPTGKPGPKGTSGGDGPPGPPGERGPQGPQGPVGFPGPKGPPGPPGK DGLPGHPGQRGETGFQ GKT GPPGP GV GPGP GV GPQGP GPT GETGPIP GERG GPP GE GE GLP GLP AG AG GA GA ア ミ ノ 酸 ア ミ ノ 酸 7〜 7〜 SM SM SM SM SM SM SM SM SM SM SM SM SM SM SM SM Comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first amino acid sequence and the second amino acid sequence being adjacent and in sequential order Isolated chimeric polypeptide coding HUMCA1XIA_P14.

2.本発明の好ましい実施形態によれば、HUMCA1XIA_P14のテールをコードする単離ポリペプチドであって、HUMCA1XIA_P14中の配列VSMMIINSQTIMVVNYSSSFITLMLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMCA1XIA_P14のテールをコードする単離ポリペプチドを提供する。   2. According to a preferred embodiment of the present invention, an isolated polypeptide encoding the tail of HUMCA1XIA_P14, comprising at least 70%, optionally at least about 80%, preferably at least about 85% of the sequence VSMMIINSQTIMVVNYSSSFITLML in HUMCA1XIA_P14 More preferably, provided is an isolated polypeptide encoding the tail of HUMCA1XIA_P14, comprising a polypeptide that is at least about 90%, most preferably at least about 95% homologous.

公知のタンパク質配列(CA1B_HUMAN)は、出願書類の最後に示す配列より1つまたは複数の変化があり、このアミノ酸配列をCA1B_HUMAN_V5と命名することに留意すべきである。これらの変化が起こることは以前に公知であり、以下の表に列挙した。   It should be noted that the known protein sequence (CA1B_HUMAN) has one or more changes from the sequence shown at the end of the application and this amino acid sequence is named CA1B_HUMAN_V5. The occurrence of these changes was previously known and listed in the following table.

Figure 2008507261
Figure 2008507261

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HUMCA1XIA_P14はまた、表835に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCA1XIA_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMCA1XIA_P14 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 835) It indicates whether it is known and the presence of a known SNP in the mutant protein HUMCA XIA P14 sequence supports the predicted sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質HUMCA1XIA_P14は、以下の転写物によってコードされる:HUMCA1XIA_T16(配列は出願書類の最後に示す)。転写物HUMCA1XIA_T16のコード部分を太字で示し、このコード部分は319位から開始され、3561位で終結する。転写物はまた、表836に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCA1XIA_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMCA1XIA_P14 is encoded by the following transcript: HUMCA1XIA_T16 (sequences shown at the end of the application). The coding part of the transcript HUMCA1XIA_T16 is shown in bold, starting from position 319 and ending at position 3561. The transcript also has the following SNPs listed in Table 836 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, the mutein HUMCA XIA P 14 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質HUMCA1XIA_P15は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMCA1XIA_T17によってコードされる。公知のタンパク質(コラーゲンα1)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HUMCA1XIA_P15 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HUMCA1XIA_T17. An alignment to a known protein (collagen alpha 1) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HUMCA1XIA_P15とCA1B_HUMANとの間の比較の報告
1.CA1B_HUMANのアミノ酸1〜714に対応し、HUMCA1XIA_P15のアミノ酸1〜714にも対応するMEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDRGFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGPRGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQGLPGPQGPIGPPGEKと少なくとも90%相同な第1のアミノ酸配列と、HUMCA1XIA_P15のアミノ酸715〜729に対応する配列MCCNLSFGILIPLQKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCA1XIA_P15をコードする単離キメラポリペプチド。
Report of comparison between HUMCA1XIA_P15 and CA1B_HUMAN 1. Corresponding to amino acids 1 to 714 of CA1B_HUMAN, corresponding to amino acids 1 to 714 of HUMCA1XIA_P15 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYGEAEYK AESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDRGFDGLPGLPGDK HRGERGPQGPPGPPGDDGMRGGEDGEIGPRGPLGAGPRGLPGOPGAPGQPGOGVDGPGPKGNMGPQGEPGPPQQGPGPGPLPGPIPGPEGP The first amino acid sequence at least 90% homologous to the GPMCIPGPGEGPGE and the sequence corresponding to the amino acids 715-729 of HUMCA XIA_P15 Comprises HUMCA1XIA_P15, comprising a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first amino acid sequence and said second amino acid sequence being in a contiguous and consecutive order Isolated chimera Polypeptide.

2.HUMCA1XIA_P15中の配列MCCNLSFGILIPLQKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMCA1XIA_P15のテールをコードする単離ポリペプチド。   2. HUMCA1XIA_P15 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 90%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence MCCNLSFGILIPLQK in HUMCA1XIA_P15 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HUMCA1XIA_P15はまた、表837に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCA1XIA_P15配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMCA1XIA_P15 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 837) It indicates whether it is known and the presence of a known SNP in the mutant protein HUMCA XIA P15 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質コラーゲンα1と比較した変異タンパク質HUMCA1XIA_P15のグリコシル化部位を表838に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein HUMCA1XIA_P15 compared to the known protein collagen α1 are shown in Table 838 (showing its position on the amino acid sequence in the first column, the second column has glycosylation sites in the mutant protein) Indicates if it is present, the last column indicates whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質HUMCA1XIA_P15は、以下の転写物によってコードされる:HUMCA1XIA_T17(配列は出願書類の最後に示す)。転写物HUMCA1XIA_T17のコード部分を太字で示し、このコード部分は319位から開始され、2505位で終結する。転写物はまた、表839に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCA1XIA_P15配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMCA1XIA_P15 is encoded by the following transcript: HUMCA1XIA_T17 (sequences shown at the end of the application). The coding part of the transcript HUMCA1XIA_T17 is shown in bold, starting from position 319 and ending at position 2505. The transcript also has the following SNPs listed in Table 839 (showing its position on the nucleotide sequence and listing another nucleic acid, the last column shows if the SNP is known, the mutein HUMCA1XIA_P15 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質HUMCA1XIA_P16は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMCA1XIA_T19によってコードされる。公知のタンパク質(コラーゲンα1)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HUMCA1XIA_P16 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HUMCA1XIA_T19. An alignment to a known protein (collagen alpha 1) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HUMCA1XIA_P16とCA1B_HUMANとの間の比較の報告
1.CA1B_HUMANのアミノ酸1〜648に対応し、HUMCA1XIA_P16のアミノ酸1〜648にも対応するMEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDRGFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAと少なくとも90%相同な第1のアミノ酸配列と、CA1B_HUMANのアミノ酸667〜714に対応し、HUMCA1XIA_P16のアミノ酸649〜696にも対応するGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQGLPGPQGPIGPPGEKと少なくとも90%相同な第2のアミノ酸配列と、HUMCA1XIA_P16のアミノ酸697〜739に対応する配列VSFSFSLFYKKVIKFACDKRFVGRHDERKVVKLSLPLYLIYEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCA1XIA_P16をコードする単離キメラポリペプチド。
Report of comparison between HUMCA1XIA_P16 and CA1B_HUMAN 1. Corresponding to amino acids 1 to 648 of CA1B_HUMAN, corresponding to amino acids 1 to 648 of HUMCA1XIA_P16 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYGEAEYK AESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDRGFDGLPGLPGDK The first amino acid sequence that is at least 90% identical The polypeptide having the sequence VSFSFSLFYKKVIKFACDKRFVGRHDERKVV KLSLPLYLIYE corresponding to amino acids 697 to 739 and at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably A single encoding HUMCA1XIA_P16, comprising a third amino acid sequence which is at least 95% homologous, said first amino acid sequence, the second amino acid sequence and the third amino acid sequence being adjacent and in sequential order Detached chimeric polypeptide.

2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がAGを含み、以下の構造:アミノ酸番号648−x〜648のいずれかから始まり、アミノ酸番号649+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HUMCA1XIA_P16の縁部分をコードする単離キメラポリペプチド。   2. Length “n” (wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long, most preferably at least about 50 amino acids in length, at least two amino acids comprising AG, starting from any of the following structures: amino acid numbers 648-x-648, amino acid numbers 649 + ((n-2) -x) (formula An isolated chimeric polypeptide encoding an edge portion of HUMCA1XIA_P16, comprising a polypeptide having a sequence terminating in: x) varying from 0 to n-2).

3.HUMCA1XIA_P16中の配列VSFSFSLFYKKVIKFACDKRFVGRHDERKVVKLSLPLYLIYEと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMCA1XIA_P16のテールをコードする単離ポリペプチド。   3. HUMCA1XIA_P16 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence VSFSFSLFYKKVIKFACDKRFVGRHDERKV VKLSLPLYLIY in HUMCA XIA P16 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HUMCA1XIA_P16はまた、表840に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCA1XIA_P16配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMCA1XIA_P16 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 840) It indicates whether it is known, and the presence of a known SNP in the mutant protein HUMCA XIA P16 sequence supports the deduced sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質コラーゲンα1と比較した変異タンパク質HUMCA1XIA_P16のグリコシル化部位を表841に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein HUMCA1XIA_P16 compared to the known protein collagen α1 are shown in Table 841 (showing its position on the amino acid sequence in the first column, the second column has glycosylation sites in the mutant protein) Indicates if it is present, the last column indicates whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質HUMCA1XIA_P16は、以下の転写物によってコードされる:HUMCA1XIA_T19(配列は出願書類の最後に示す)。転写物HUMCA1XIA_T19のコード部分を太字で示し、このコード部分は319位から開始され、2532位で終結する。転写物はまた、表842に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCA1XIA_P16配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMCA1XIA_P16 is encoded by the following transcript: HUMCA1XIA_T19 (sequences shown at the end of the application). The coding part of the transcript HUMCA1XIA_T19 is shown in bold, starting from position 319 and ending at position 2532. The transcript also has the following SNPs listed in Table 842 (indicating its position on the nucleotide sequence and listing another nucleic acid, the last column indicating whether the SNP is known, the mutein HUMCA1XIA_P16 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質HUMCA1XIA_P17は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMCA1XIA_T20によってコードされる。公知のタンパク質(コラーゲンα1)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HUMCA1XIA_P17 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HUMCA1XIA_T20. An alignment to a known protein (collagen alpha 1) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HUMCA1XIA_P17とCA1B_HUMANとの間の比較の報告
1.CA1B_HUMANのアミノ酸1〜260に対応し、HUMCA1XIA_P17のアミノ酸1〜260にも対応するMEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEと少なくとも90%相同な第1のアミノ酸配列と、HUMCA1XIA_P17のアミノ酸261〜273に対応する配列VRSTRPEKVFVFQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCA1XIA_P17をコードする単離キメラポリペプチド。
Report of comparison between HUMCA1XIA_P17 and CA1B_HUMAN 1. Corresponding to amino acids 1-260 of CA1B_HUMAN, at least 90% homologous first amino acid and the corresponding MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDE to amino acids 1-260 of HUMCA1XIA_P17 And at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95%, and a polypeptide having the sequence VRSTRPEKVFVFQ corresponding to amino acids 261 to 273 of HUMCA1XIA_P17 An isolated chimeric polypeptide encoding HUMCA1XIA_P17, which comprises the homologous second amino acid sequence, said first amino acid sequence and the second amino acid sequence being adjacent and in sequential order.

2.HUMCA1XIA_P17中の配列VRSTRPEKVFVFQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMCA1XIA_P17のテールをコードする単離ポリペプチド。   2. HUMCA1XIA_P17 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence VRSTRPEKVFVF in HUMCA1XIA_P17 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HUMCA1XIA_P17はまた、表843に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCA1XIA_P17配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMCA1XIA_P17 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 843) It indicates whether it is known, and the presence of a known SNP in the mutant protein HUMCA XIA P 17 sequence supports the predicted sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質コラーゲンα1と比較した変異タンパク質HUMCA1XIA_P17のグリコシル化部位を表844に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein HUMCA1XIA_P17 compared to the known protein collagen α1 are shown in Table 844 (showing its position on the amino acid sequence in the first column, the second column has glycosylation sites in the mutant protein) Indicates if it is present, the last column indicates whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質HUMCA1XIA_P17は、以下の転写物によってコードされる:HUMCA1XIA_T20(配列は出願書類の最後に示す)。転写物HUMCA1XIA_T20のコード部分を太字で示し、このコード部分は319位から開始され、1137位で終結する。転写物はまた、表845に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCA1XIA_P17配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMCA1XIA_P17 is encoded by the following transcript: HUMCA1XIA_T20 (sequences shown at the end of the application). The coding part of the transcript HUMCA1XIA_T20 is shown in bold, starting from position 319 and ending at position 1137. The transcript also has the following SNPs listed in Table 845 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, the mutein HUMCA XIA P 17 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターHUMCA1XIAは、上の表2に列挙した46個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster HUMCA1XIA is characterized by the 46 segments listed in Table 2 above, the sequences of which are shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターHUMCA1XIA_node_0は、13個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、HUMCA1XIA_T19、およびHUMCA1XIA_T20。以下の表846は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_0 of the present invention is supported by 13 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, HUMCA1XIA_T19, and HUMCA1XIA_T20. Table 846 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_2は、9個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、HUMCA1XIA_T19、およびHUMCA1XIA_T20。以下の表847は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_2 of the present invention is supported by nine libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, HUMCA1XIA_T19, and HUMCA1XIA_T20. Table 847 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_4は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、HUMCA1XIA_T19、およびHUMCA1XIA_T20。以下の表848は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_4 of the present invention is supported by 5 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, HUMCA1XIA_T19, and HUMCA1XIA_T20. Table 848 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表849に示す)。   Microarray (chip) data for this segment is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (for lung cancer) (shown in Table 849).

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_6は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、HUMCA1XIA_T19、およびHUMCA1XIA_T20。以下の表850は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_6 of the present invention is supported by 5 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, HUMCA1XIA_T19, and HUMCA1XIA_T20. Table 850 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表851に示す)。   Microarray (chip) data for this segment is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (for lung cancer) (shown in Table 851).

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_8は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、HUMCA1XIA_T19、およびHUMCA1XIA_T20。以下の表852は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_8 of the present invention is supported by 5 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, HUMCA1XIA_T19, and HUMCA1XIA_T20. Table 852 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_9は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T20。以下の表853は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_9 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCA1XIA_T20. Table 853 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_18は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表854は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_18 of the present invention is supported by six libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, and HUMCA1XIA_T19. Table 854 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_54は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T19。以下の表855は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_54 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCA1XIA_T19. Table 855 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_55は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T17およびHUMCA1XIA_T19。以下の表856は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_55 of the present invention is supported by 4 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCA1XIA_T17 and HUMCA1XIA_T19. Table 856 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_92は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表857は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_92 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCA1XIA_T16. Table 857 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターHUMCA1XIA_node_11は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表858は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_11 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, and HUMCA1XIA_T19. Table 858 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_15は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表859は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_15 of the present invention is supported by 5 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, and HUMCA1XIA_T19. Table 859 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_19は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表860は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_19 of the present invention is supported by 3 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, and HUMCA1XIA_T19. Table 860 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_21は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表861は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_21 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, and HUMCA1XIA_T19. Table 861 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_23は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表862は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_23 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, and HUMCA1XIA_T19. Table 862 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_25は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表863は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_25 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, and HUMCA1XIA_T19. Table 863 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_27は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表864は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_27 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, and HUMCA1XIA_T19. Table 864 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_29は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表865は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_29 of the present invention is supported by 3 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, and HUMCA1XIA_T19. Table 865 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_31は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表866は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_31 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, and HUMCA1XIA_T19. Table 866 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_33は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表867は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_33 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, and HUMCA1XIA_T19. Table 867 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_35は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表868は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_35 of the present invention is supported by 4 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, and HUMCA1XIA_T19. Table 868 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_37は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表869は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_37 of the present invention is supported by 4 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, and HUMCA1XIA_T19. Table 869 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_39は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表870は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_39 of the present invention is supported by 5 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, and HUMCA1XIA_T19. Table 870 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_41は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表871は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_41 of the present invention is supported by 4 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, and HUMCA1XIA_T19. Table 871 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_43は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表872は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_43 of the present invention is supported by 5 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, and HUMCA1XIA_T19. Table 872 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_45は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16およびHUMCA1XIA_T17。以下の表873は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_45 of the present invention is supported by 4 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCA1XIA_T16 and HUMCA1XIA_T17. Table 873 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_47は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表874は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_47 of the present invention is supported by 5 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, and HUMCA1XIA_T19. Table 874 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_49は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表875は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_49 of the present invention is supported by 5 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, and HUMCA1XIA_T19. Table 875 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_51は、7個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表876は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_51 of the present invention is supported by seven libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, and HUMCA1XIA_T19. Table 876 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_57は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表877は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_57 of the present invention is supported by 4 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCA1XIA_T16. Table 877 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_59は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表878は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_59 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCA1XIA_T16. Table 878 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_62は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表879は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_62 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCA1XIA_T16. Table 879 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_64は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表880は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_64 of the present invention is supported by 4 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCA1XIA_T16. Table 880 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_66は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表881は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_66 of the present invention is supported by 4 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCA1XIA_T16. Table 881 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_68は、7個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表88は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_68 of the present invention is supported by seven libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCA1XIA_T16. Table 88 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_70は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表883は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_70 of the present invention is supported by six libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCA1XIA_T16. Table 883 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_72は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表884は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_72 of the present invention is supported by six libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCA1XIA_T16. Table 884 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_74は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表885は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_74 of the present invention is supported by 5 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCA1XIA_T16. Table 885 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_76は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表886は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_76 of the present invention is supported by six libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCA1XIA_T16. Table 886 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_78は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表887は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_78 of the present invention is supported by six libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCA1XIA_T16. Table 887 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_81は、8個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表888は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_81 of the present invention is supported by eight libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCA1XIA_T16. Table 888 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_83は、7個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表889は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_83 of the present invention is supported by seven libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCA1XIA_T16. Table 889 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_85は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表890は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_85 of the present invention is supported by six libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCA1XIA_T16. Table 890 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_87は、10個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表891は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_87 of the present invention is supported by 10 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCA1XIA_T16. Table 891 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_89は、9個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表892は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_89 of the present invention is supported by nine libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCA1XIA_T16. Table 892, below, lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCA1XIA_node_91は、11個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表893は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCA1XIA_node_91 of the present invention is supported by 11 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCA1XIA_T16. Table 893 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: CA1B_HUMAN_V5

Sequence documentation:

Alignment of: HUMCA1XIA_P14 x CA1B_HUMAN_V5 ..

Alignment segment 1/1:

Quality: 10456.00 Escore: 0
Matching length: 1058 Total length: 1058
Matching Percent Similarity: 99.91 Matching Percent Identity: 99.91
Total Percent Similarity: 99.91 Total Percent Identity: 99.91
Gaps: 0

Alignment:
. . . . .
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
. . . . .
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
. . . . .
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
. . . . .
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
. . . . .
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
. . . . .
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
. . . . .
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
. . . . .
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
. . . . .
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
. . . . .
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
. . . . .
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
. . . . .
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
. . . . .
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
. . . . .
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
. . . . .
701 LPGPQGPIGPPGEKGPQGKPGLAGLPGADGPPGHPGKEGQSGEKGALGPP 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 LPGPQGPIGPPGEKGPQGKPGLAGLPGADGPPGHPGKEGQSGEKGALGPP 750
. . . . .
751 GPQGPIGYPGPRGVKGADGVRGLKGSKGEKGEDGFPGFKGDMGLKGDRGE 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 GPQGPIGYPGPRGVKGADGVRGLKGSKGEKGEDGFPGFKGDMGLKGDRGE 800
. . . . .
801 VGQIGPRGEDGPEGPKGRAGPTGDPGPSGQAGEKGKLGVPGLPGYPGRQG 850
||||||||||||||||||||||||||||||||||||||||||||||||||
801 VGQIGPRGEDGPEGPKGRAGPTGDPGPSGQAGEKGKLGVPGLPGYPGRQG 850
. . . . .
851 PKGSTGFPGFPGANGEKGARGVAGKPGPRGQRGPTGPRGSRGARGPTGKP 900
||||||||||||||||||||||||||||||||||||||||||||||||||
851 PKGSTGFPGFPGANGEKGARGVAGKPGPRGQRGPTGPRGSRGARGPTGKP 900
. . . . .
901 GPKGTSGGDGPPGPPGERGPQGPQGPVGFPGPKGPPGPPGKDGLPGHPGQ 950
||||||||||||||||||||||||||||||||||||||||||||||||||
901 GPKGTSGGDGPPGPPGERGPQGPQGPVGFPGPKGPPGPPGKDGLPGHPGQ 950
. . . . .
951 RGETGFQGKTGPPGPGGVVGPQGPTGETGPIGERGHPGPPGPPGEQGLPG 1000
||||||||||||||||||||||||||||||||||||||||||||||||||
951 RGETGFQGKTGPPGPGGVVGPQGPTGETGPIGERGHPGPPGPPGEQGLPG 1000
. . . . .
1001 AAGKEGAKGDPGPQGISGKDGPAGLRGFPGERGLPGAQGAPGLKGGEGPQ 1050
||||||||||||||||||||||||||||||||||||||||||||||||||
1001 AAGKEGAKGDPGPQGISGKDGPAGLRGFPGERGLPGAQGAPGLKGGEGPQ 1050

1051 GPPGPVVS 1058
|||||| |
1051 GPPGPVGS 1058






Sequence name: CA1B_HUMAN

Sequence documentation:

Alignment of: HUMCA1XIA_P15 x CA1B_HUMAN ..

Alignment segment 1/1:

Quality: 7073.00 Escore: 0
Matching length: 714 Total length: 714
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
. . . . .
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
. . . . .
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
. . . . .
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
. . . . .
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
. . . . .
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
. . . . .
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
. . . . .
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
. . . . .
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
. . . . .
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
. . . . .
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
. . . . .
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
. . . . .
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
. . . . .
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
.
701 LPGPQGPIGPPGEK 714
||||||||||||||
701 LPGPQGPIGPPGEK 714






Sequence name: CA1B_HUMAN

Sequence documentation:

Alignment of: HUMCA1XIA_P16 x CA1B_HUMAN ..

Alignment segment 1/1:

Quality: 6795.00 Escore: 0
Matching length: 696 Total length: 714
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 97.48 Total Percent Identity: 97.48
Gaps: 1

Alignment:
. . . . .
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
. . . . .
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
. . . . .
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
. . . . .
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
. . . . .
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
. . . . .
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
. . . . .
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
. . . . .
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
. . . . .
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
. . . . .
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
. . . . .
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
. . . . .
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
. . . . .
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEA.. 648
||||||||||||||||||||||||||||||||||||||||||||||||
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
. . . . .
649 ................GMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 682
||||||||||||||||||||||||||||||||||
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
.
683 LPGPQGPIGPPGEK 696
||||||||||||||
701 LPGPQGPIGPPGEK 714






Sequence name: CA1B_HUMAN

Sequence documentation:

Alignment of: HUMCA1XIA_P17 x CA1B_HUMAN ..

Alignment segment 1/1:

Quality: 2561.00 Escore: 0
Matching length: 260 Total length: 260
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
. . . . .
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
. . . . .
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
. . . . .
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
. . . . .
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
.
251 AQAQEPQIDE 260
||||||||||
251 AQAQEPQIDE 260




Mutated protein alignment against previously known proteins:
Sequence name: CA1B_HUMAN_V5

Sequence documentation:

Alignment of: HUMCA1XIA_P14 x CA1B_HUMAN_V5 ..

Alignment segment 1/1:

Quality: 10456.00 Escore: 0
Matching length: 1058 Total length: 1058
Matching Percent Similarity: 99.91 Matching Percent Identity: 99.91
Total Percent Similarity: 99.91 Total Percent Identity: 99.91
Gaps: 0

Alignment:
....
1 MEPWSSRMWTKRWRWDFTVTTLALTFLTFAREVRGAPVDVLKALDFNS 50
||||||||||||||||||||||||||||||||||||||||
1 MEPWSSRMWTKRWRWDFTVTTLALTFLTFAREVRGAPVDVLKALDFNS 50
....
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
||||||||||||||||||||||||||||||||||||||||
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
....
101 ILFTVKKPKKGIQSFLLSIYNEHGGIQQIGVEVGRSPFLFEDHTGKPAPED 150
||||||||||||||||||||||||||||||||||||||||
101 ILFTVKKPKKGIQSFLLSIYNEHGGIQQIGVEVGRSPFLFEDHTGKPAPED 150
....
151 YPLFRTVNIADGKWHRVAISVEKKTVTM IVDCKKKTTKPLDRSERAIVDT 200
||||||||||||||||||||||||||||||||||||||||
151 YPLFRTVNIADGKWHRVAISVEKKTVTM IVDCKKKTTKPLDRSERAIVDT 200
....
201 NGITVFGTRILDEEVFEGDI QQ FLITGDPKAAYDYCEHY SPDCDSSAPKA 250
||||||||||||||||||||||||||||||||||||||||
201 NGITVFGTRILDEEVFEGDI QQ FLITGDPKAAYDYCEHY SPDCDSSAPKA 250
....
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
||||||||||||||||||||||||||||||||||||||||
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
....
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
||||||||||||||||||||||||||||||||||||||||
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
....
351 QRKNSEDTLYENKEIDGRD SDLLVDDDLGEYDFYEYKEYEDKPTSPPNEE 400
||||||||||||||||||||||||||||||||||||||||
351 QRKNSEDTLYENKEIDGRD SDLLVDDDLGEYDFYEYKEYEDKPTSPPNEE 400
....
401 FGPGVPAETDITETSINGHGAYGEKGQ KGEPAV VEPGMLVEGPPGPAGPA 450
||||||||||||||||||||||||||||||||||||||||
401 FGPGVPAETDITETSINGHGAYGEKGQ KGEPAV VEPGMLVEGPPGPAGPA 450
....
451 GIMGPPGLQGPTPGPPGDPRGDRGPP GRPGPLGGAPGLPGPPGTMLMPFRYG 500
||||||||||||||||||||||||||||||||||||||||
451 GIMGPPGLQGPTPGPPGDPRGDRGPP GRPGPLGGAPGLPGPPGTMLMPFRYG 500
....
501 GDGSKGPPTISAQEAAQAILQQARIALLRGPPGPMGLTGRPGPVGGPGSSG 550
||||||||||||||||||||||||||||||||||||||||
501 GDGSKGPPTISAQEAAQAILQQARIALLRGPPGPMGLTGRPGPVGGPGSSG 550
....
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGA GDR 600
||||||||||||||||||||||||||||||||||||||||
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGA GDR 600
....
601 G FDGDL GLP GPG DKG HR GER GP QGPP GPP G D D G MRG EDGE IGPR GI PGE AGP 650
||||||||||||||||||||||||||||||||||||||||
601 G FDGDL GLP GPG DKG HR GER GP QGPP GPP G D D G MRG EDGE IGPR GI PGE AGP 650
....
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
||||||||||||||||||||||||||||||||||||||||
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
....
701 LPGPQGPIGPPGEKGPQGGPGLAGLPGADGPPGHPGKEGQSGEKGALGPP 750
||||||||||||||||||||||||||||||||||||||||
701 LPGPQGPIGPPGEKGPQGGPGLAGLPGADGPPGHPGKEGQSGEKGALGPP 750
....
751 GPQGPIGGPGPRGVGGADGGVRGLKGSKGEKGEDGFPGFKGDMGLKGDRGE 800
||||||||||||||||||||||||||||||||||||||||
751 GPQGPIGGPGPRGVGGADGGVRGLKGSKGEKGEDGFPGFKGDMGLKGDRGE 800
....
801 VGQIGPRGEDGPEGPGRAGPTGPGPSPGQAGEKGKLPGPGPGYPGRQG 850
||||||||||||||||||||||||||||||||||||||||
801 VGQIGPRGEDGPEGPGRAGPTGPGPSPGQAGEKGKLPGPGPGYPGRQG 850
....
851 PKGSTGFPFFPGANGEKGARGV AG KP GPRG Q RGPTGPRGS RG ARGPTGKP 900
||||||||||||||||||||||||||||||||||||||||
851 PKGSTGFPFFPGANGEKGARGV AG KP GPRG Q RGPTGPRGS RG ARGPTGKP 900
....
901 GPKGTSGGDGPPGPP GERGPQ GPGPGPGFPGPGPGPPGPRGPGLPGHPGQ 950
||||||||||||||||||||||||||||||||||||||||
901 GPKGTSGGDGPPGPP GERGPQ GPGPGPGFPGPGPGPPGPRGPGLPGHPGQ 950
....
951 RGETGFQGKTGPPGPGGVVGPQGPPTGETGPIGERGHPGPPGPPGEQGLPG 1000
||||||||||||||||||||||||||||||||||||||||
951 RGETGFQGKTGPPGPGGVVGPQGPPTGETGPIGERGHPGPPGPPGEQGLPG 1000
....
1001 AAGKEGAKGDPGPQGISGKDGPAGLRGFPGERGLPGAQGAPGLKGGEGPQ 1050
||||||||||||||||||||||||||||||||||||||||
1001 AAGKEGAKGDPGPQGISGKDGPAGLRGFPGERGLPGAQGAPGLKGGEGPQ 1050

1051 GPPGPVVS 1058
||||||
1051 GPPGP VGS 1058






Sequence name: CA1B_HUMAN

Sequence documentation:

Alignment of: HUMCA1XIA_P15 x CA1B_HUMAN ..

Alignment segment 1/1:

Quality: 7073.00 Escore: 0
Matching length: 714 Total length: 714
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MEPWSSRMWTKRWRWDFTVTTLALTFLTFAREVRGAPVDVLKALDFNS 50
||||||||||||||||||||||||||||||||||||||||
1 MEPWSSRMWTKRWRWDFTVTTLALTFLTFAREVRGAPVDVLKALDFNS 50
....
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
||||||||||||||||||||||||||||||||||||||||
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
....
101 ILFTVKKPKKGIQSFLLSIYNEHGGIQQIGVEVGRSPFLFEDHTGKPAPED 150
||||||||||||||||||||||||||||||||||||||||
101 ILFTVKKPKKGIQSFLLSIYNEHGGIQQIGVEVGRSPFLFEDHTGKPAPED 150
....
151 YPLFRTVNIADGKWHRVAISVEKKTVTM IVDCKKKTTKPLDRSERAIVDT 200
||||||||||||||||||||||||||||||||||||||||
151 YPLFRTVNIADGKWHRVAISVEKKTVTM IVDCKKKTTKPLDRSERAIVDT 200
....
201 NGITVFGTRILDEEVFEGDI QQ FLITGDPKAAYDYCEHY SPDCDSSAPKA 250
||||||||||||||||||||||||||||||||||||||||
201 NGITVFGTRILDEEVFEGDI QQ FLITGDPKAAYDYCEHY SPDCDSSAPKA 250
....
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
||||||||||||||||||||||||||||||||||||||||
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
....
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
||||||||||||||||||||||||||||||||||||||||
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
....
351 QRKNSEDTLYENKEIDGRD SDLLVDDDLGEYDFYEYKEYEDKPTSPPNEE 400
||||||||||||||||||||||||||||||||||||||||
351 QRKNSEDTLYENKEIDGRD SDLLVDDDLGEYDFYEYKEYEDKPTSPPNEE 400
....
401 FGPGVPAETDITETSINGHGAYGEKGQ KGEPAV VEPGMLVEGPPGPAGPA 450
||||||||||||||||||||||||||||||||||||||||
401 FGPGVPAETDITETSINGHGAYGEKGQ KGEPAV VEPGMLVEGPPGPAGPA 450
....
451 GIMGPPGLQGPTPGPPGDPRGDRGPP GRPGPLGGAPGLPGPPGTMLMPFRYG 500
||||||||||||||||||||||||||||||||||||||||
451 GIMGPPGLQGPTPGPPGDPRGDRGPP GRPGPLGGAPGLPGPPGTMLMPFRYG 500
....
501 GDGSKGPPTISAQEAAQAILQQARIALLRGPPGPMGLTGRPGPVGGPGSSG 550
||||||||||||||||||||||||||||||||||||||||
501 GDGSKGPPTISAQEAAQAILQQARIALLRGPPGPMGLTGRPGPVGGPGSSG 550
....
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGA GDR 600
||||||||||||||||||||||||||||||||||||||||
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGA GDR 600
....
601 G FDGDL GLP GPG DKG HR GER GP QGPP GPP G D D G MRG EDGE IGPR GI PGE AGP 650
||||||||||||||||||||||||||||||||||||||||
601 G FDGDL GLP GPG DKG HR GER GP QGPP GPP G D D G MRG EDGE IGPR GI PGE AGP 650
....
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
||||||||||||||||||||||||||||||||||||||||
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
.
701 LPGPQGPIGPPGEK 714
|||||||||||||
701 LPGPQGPIGPPGEK 714






Sequence name: CA1B_HUMAN

Sequence documentation:

Alignment of: HUMCA1XIA_P16 x CA1B_HUMAN ..

Alignment segment 1/1:

Quality: 6795.00 Escore: 0
Matching length: 696 Total length: 714
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 97.48 Total Percent Identity: 97.48
Gaps: 1

Alignment:
....
1 MEPWSSRMWTKRWRWDFTVTTLALTFLTFAREVRGAPVDVLKALDFNS 50
||||||||||||||||||||||||||||||||||||||||
1 MEPWSSRMWTKRWRWDFTVTTLALTFLTFAREVRGAPVDVLKALDFNS 50
....
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
||||||||||||||||||||||||||||||||||||||||
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
....
101 ILFTVKKPKKGIQSFLLSIYNEHGGIQQIGVEVGRSPFLFEDHTGKPAPED 150
||||||||||||||||||||||||||||||||||||||||
101 ILFTVKKPKKGIQSFLLSIYNEHGGIQQIGVEVGRSPFLFEDHTGKPAPED 150
....
151 YPLFRTVNIADGKWHRVAISVEKKTVTM IVDCKKKTTKPLDRSERAIVDT 200
||||||||||||||||||||||||||||||||||||||||
151 YPLFRTVNIADGKWHRVAISVEKKTVTM IVDCKKKTTKPLDRSERAIVDT 200
....
201 NGITVFGTRILDEEVFEGDI QQ FLITGDPKAAYDYCEHY SPDCDSSAPKA 250
||||||||||||||||||||||||||||||||||||||||
201 NGITVFGTRILDEEVFEGDI QQ FLITGDPKAAYDYCEHY SPDCDSSAPKA 250
....
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
||||||||||||||||||||||||||||||||||||||||
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
....
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
||||||||||||||||||||||||||||||||||||||||
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
....
351 QRKNSEDTLYENKEIDGRD SDLLVDDDLGEYDFYEYKEYEDKPTSPPNEE 400
||||||||||||||||||||||||||||||||||||||||
351 QRKNSEDTLYENKEIDGRD SDLLVDDDLGEYDFYEYKEYEDKPTSPPNEE 400
....
401 FGPGVPAETDITETSINGHGAYGEKGQ KGEPAV VEPGMLVEGPPGPAGPA 450
||||||||||||||||||||||||||||||||||||||||
401 FGPGVPAETDITETSINGHGAYGEKGQ KGEPAV VEPGMLVEGPPGPAGPA 450
....
451 GIMGPPGLQGPTPGPPGDPRGDRGPP GRPGPLGGAPGLPGPPGTMLMPFRYG 500
||||||||||||||||||||||||||||||||||||||||
451 GIMGPPGLQGPTPGPPGDPRGDRGPP GRPGPLGGAPGLPGPPGTMLMPFRYG 500
....
501 GDGSKGPPTISAQEAAQAILQQARIALLRGPPGPMGLTGRPGPVGGPGSSG 550
||||||||||||||||||||||||||||||||||||||||
501 GDGSKGPPTISAQEAAQAILQQARIALLRGPPGPMGLTGRPGPVGGPGSSG 550
....
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGA GDR 600
||||||||||||||||||||||||||||||||||||||||
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGA GDR 600
....
601 G FDGPGLPGPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGPGEA .. 648
|||||||||||||||||||||||||||||||||||||||
601 G FDGDL GLP GPG DKG HR GER GP QGPP GPP G D D G MRG EDGE IGPR GI PGE AGP 650
....
649 ..... GMAG VDGPP GPKGNMGPQGEPGPP GQQ GNPGPQG 682
|||||||||||||||||||||||||||||||
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
.
683 LPGPQGPIGPPGEK 696
|||||||||||||
701 LPGPQGPIGPPGEK 714






Sequence name: CA1B_HUMAN

Sequence documentation:

Alignment of: HUMCA1XIA_P17 x CA1B_HUMAN ..

Alignment segment 1/1:

Quality: 2561.00 Escore: 0
Matching length: 260 Total length: 260
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MEPWSSRMWTKRWRWDFTVTTLALTFLTFAREVRGAPVDVLKALDFNS 50
||||||||||||||||||||||||||||||||||||||||
1 MEPWSSRMWTKRWRWDFTVTTLALTFLTFAREVRGAPVDVLKALDFNS 50
....
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
||||||||||||||||||||||||||||||||||||||||
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
....
101 ILFTVKKPKKGIQSFLLSIYNEHGGIQQIGVEVGRSPFLFEDHTGKPAPED 150
||||||||||||||||||||||||||||||||||||||||
101 ILFTVKKPKKGIQSFLLSIYNEHGGIQQIGVEVGRSPFLFEDHTGKPAPED 150
....
151 YPLFRTVNIADGKWHRVAISVEKKTVTM IVDCKKKTTKPLDRSERAIVDT 200
||||||||||||||||||||||||||||||||||||||||
151 YPLFRTVNIADGKWHRVAISVEKKTVTM IVDCKKKTTKPLDRSERAIVDT 200
....
201 NGITVFGTRILDEEVFEGDI QQ FLITGDPKAAYDYCEHY SPDCDSSAPKA 250
||||||||||||||||||||||||||||||||||||||||
201 NGITVFGTRILDEEVFEGDI QQ FLITGDPKAAYDYCEHY SPDCDSSAPKA 250
.
251 AQAQEPQIDE 260
||||||||||
251 AQAQEPQIDE 260



正常および癌性肺組織における配列名HUMCA1X1Aseg55中に示すアンプリコンによって検出可能なホモ・サピエンスコラーゲンXI型α1(COL11A1)HUMCA1XIA転写物の発現
seg55、HUMCA1X1Aseg55アンプリコン(配列番号1663)ならびにプライマーHUMCA1X1Aseg55F(配列番号1661)およびHUMCA1X1Aseg55R(配列番号1662)によって検出可能なホモ・サピエンスコラーゲンXI型α1(COL11A1)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
Expression of homo-Sapiens collagen type XI α1 (COL11A1) HUMCA1XIA transcript detectable by the amplicon shown in sequence name HUMCA1X1Aseg55 in normal and cancerous lung tissue seg55, HUMCA1X1Aseg55 amplicon (SEQ ID NO: 1663) 1661) and the expression of homo-Sapiens collagen type XI α1 (COL11A1) transcripts detectable by HUMCA 1 × 1 Aseg 55 R (SEQ ID NO: 1662) was measured by real-time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – PBGD-Amplicon, SEQ ID No. 334), HPRT1 (GenBank Accession No. NM_000194, Amplicon – HPRT1- Amplicons, SEQ ID NO: 1297), Ubiquitin (GenBank Accession No. BC000449, Amplicon – Ubiquitin-Amplicon SEQ ID NO: 328), and SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA-Amplicon SEQ ID NO: 331) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. Normalized PM samples by dividing the normalized volume of each RT sample by the median volume of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99, Table 2 above) Magnifications of upregulation of each sample to the median of were obtained.

図67は、正常サンプルと比較した癌性肺サンプルにおける上記ホモ・サピエンスコラーゲンXI型α1(COL11A1)転写物の過剰発現を示すヒストグラムである。値は、2連の実験の平均を示す。エラーバーは、得られた最小値および最大値を示す。   FIG. 67 is a histogram showing over expression of the homo-Sapiens collagen type XI α1 (COL11A1) transcript in cancerous lung samples compared to normal samples. Values represent the average of duplicate experiments. Error bars indicate the obtained minimum and maximum values.

図67から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンスコラーゲンXI型α1(COL11A1)転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2)よりも有意に高かった。明白には、15個の腺癌サンプルのうち11個、16個の扁平上皮細胞癌サンプルのうち11個、および4個の大細胞癌サンプルのうち2個で少なくとも5倍の過剰発現が見出された。   As evident from FIG. 67, the expression of homo-Sapiens collagen type XI α1 (COL11A1) transcripts detectable by the above amplicon in a cancer sample is a non-cancerous sample (sample numbers 47-50, 90-93, Significantly higher than 96-99, Table 2). Apparently, at least 5-fold overexpression was found in 11 out of 15 adenocarcinoma samples, 11 out of 16 squamous cell carcinoma samples, and 2 out of 4 large cell carcinoma samples. It was done.

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:HUMCA1X1Aseg55F順方向プライマーおよびHUMCA1X1Aseg55R逆方向プライマー。   Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used only as a non-limiting illustration of suitable primer pairs: HUMCA1X1Aseg55F forward primer and HUMCA1X1Aseg55R reverse Direction primer.

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:HUMCA1X1Aseg55。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : HUMCA 1 X 1 Aseg 55.


順方向プライマー−HUMCA1X1Aseg55F(配列番号1661):TTCTCATAGTATTCCATTGATTGGGTA
逆方向プライマー−HUMCA1X1Aseg55R(配列番号1662):CACCGGTATGGAGAATAGCGA
アンプリコン(配列番号1663):TTCTCATAGTATTCCATTGATTGGGTATACCAGGTTCTGTTTACTTTTACTTGGCAGTTGATAGAATAGGTGTAGTTTATACTTTTTCGCTATTCTCCATACCGGTG

Forward primer-HUMCA1X1Aseg55F (SEQ ID NO: 1661): TTCTCATAGTATTCCATTGATTGGGTA
Reverse primer-HUMCA1X1Aseg55R (SEQ ID NO: 1662): CACCGGTATGGAGAATAGCGA
Amplicon (SEQ ID NO: 1663): TTCTCATAGTATTCCATTGATTGGGGTATACAGGTTCTGTTTACTTTTACTTGGCAGTTGATAGAATAGGTGTAGTTTATACTTTTTCGCTATTCTCCATACCGGTG

クラスターT11628の説明
クラスターT11628は、目的の6つの転写物および25個のセグメントを特徴とし、その名称を、それぞれ表894および895に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表896に示す。
Description of Cluster T11628 Cluster T11628 is characterized by 6 transcripts and 25 segments of interest, the names of which are shown in Tables 894 and 895 respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 896.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるミオグロビン(SwissProtアクセッション識別子MYG_HUMAN)(配列番号1448)の変異型である。   These sequences are variants of the known protein myoglobin (SwissProt accession identifier MYG_HUMAN) (SEQ ID NO: 1448), which has been referred to herein as a previously known protein.

タンパク質ミオグロビンは、以下の機能を有することが公知であるか、そのように見なされている:酸素の逆供給としての機能を果たし、筋肉内の酸素の移動を促進する。タンパク質ミオグロビンの配列を、「ミオグロビンアミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表897に示す。   The protein myoglobin is known or considered to have the following function: it acts as a counter-supply of oxygen and promotes the transfer of oxygen in muscle. The sequence of the protein myoglobin is shown at the end of the application as "myoglobin amino acid sequence". Known polymorphisms of this sequence are shown in Table 897.

Figure 2008507261
Figure 2008507261

上記のように、クラスターT11628は、上の表1に列挙した6つの転写物を特徴とする。これらの転写物は、タンパク質ミオグロビンの変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster T11628 is characterized by the six transcripts listed in Table 1 above. These transcripts encode a protein which is a mutated form of the protein myoglobin. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質T11628_PEA_1_P2は、出願書類の最後に示すアミノ酸配列を有し、転写物T11628_PEA_1_T3によってコードされる。公知のタンパク質(ミオグロビン)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein T11628_PEA_1_P2 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript T11628_PEA_1_T3. An alignment to a known protein (myoglobin) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

T11628_PEA_1_P2とQ8WVH6(配列番号1450)との間の比較の報告
1.T11628_PEA_1_P2のアミノ酸1〜55に対応する配列MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、Q8WVH6のアミノ酸1〜99に対応し、T11628_PEA_1_P2のアミノ酸56〜154にも対応するMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQGと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T11628_PEA_1_P2をコードする単離キメラポリペプチド。
Report on comparison between T11628_PEA_1_P2 and Q8WVH6 (SEQ ID NO: 1450) At least 70%, optionally at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 90%, most preferably at least 95% homologous to the polypeptide having the sequence MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKDFDKFKHLKSEDE corresponding to amino acids 1-55 of T11628_PEA_1_P2 1 and corresponding to amino acids 1 to 99 of Q8WVH6 and also to amino acids 56 to 154 of T11628_PEA_1_P2 MKASEDLKKHGATVLTGLGKKKKHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG and And a Kutomo 90% homologous second amino acid sequence, the first amino acid sequence and a second amino acid sequence, contiguous and in sequential order, the isolated chimeric polypeptide coding T11628_PEA_1_P2.

2.T11628_PEA_1_P2の配列MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T11628_PEA_1_P2の先端をコードする単離ポリペプチド。   2. The sequence of T11628_PEA_1_P2 at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence An isolated polypeptide encoding

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: Intracellular. Protein localization is considered to be intracellular as no transmembrane domain estimation program will deduce that this protein is a transmembrane domain. Furthermore, both signal peptide deducing programs deduce that this protein is a non-secretory protein.

変異タンパク質T11628_PEA_1_P2はまた、表898に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T11628_PEA_1_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T11628_PEA_1_P2 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 898) It is indicated whether it is known and the presence of a known SNP in the mutein T11628_PEA_1_P2 sequence supports the putative sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質T11628_PEA_1_P2は、以下の転写物によってコードされる:T11628_PEA_1_T3(配列は出願書類の最後に示す)。転写物T11628_PEA_1_T3のコード部分を太字で示し、このコード部分は220位から開始され、681位で終結する。転写物はまた、表899に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T11628_PEA_1_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T11628_PEA_1_P2 is encoded by the following transcript: T11628_PEA_1_T3 (sequences shown at the end of the application). The coding portion of the transcript T11628_PEA_1_T3 is shown in bold, starting from position 220 and ending at position 681. The transcript also has the following SNPs listed in Table 899 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein T11628_PEA_1_P2 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質T11628_PEA_1_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物T11628_PEA_1_T9によってコードされる。公知のタンパク質(ミオグロビン)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein T11628_PEA_1_P5 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript T11628_PEA_1_T9. An alignment to a known protein (myoglobin) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

T11628_PEA_1_P5とMYG_HUMAN_V1(配列番号1449)との間の比較の報告
1.MYG_HUMAN_V1のアミノ酸56〜154に対応し、T11628_PEA_1_P5のアミノ酸1〜99にも対応するMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQGと少なくとも90%相同な第1のアミノ酸配列を含む、T11628_PEA_1_P5をコードする単離キメラポリペプチド。
Report of the comparison between T11628_PEA_1_P5 and MYG_HUMAN_V1 (SEQ ID NO: 1449) A member of the invention is a peptide comprising a member of

公知のタンパク質配列(MYG_HUMAN)は、出願書類の最後に示す配列より1つまたは複数の変化があり、このアミノ酸配列をMYG_HUMAN_V1と命名することに留意すべきである。これらの変化が起こることは以前に公知であり、以下の表に列挙した。   It should be noted that the known protein sequence (MYG_HUMAN) has one or more changes from the sequence shown at the end of the application and this amino acid sequence is designated as MYG_HUMAN_V1. The occurrence of these changes was previously known and listed in the following table.

Figure 2008507261
Figure 2008507261

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: Intracellular. Protein localization is considered to be intracellular as no transmembrane domain estimation program will deduce that this protein is a transmembrane domain. Furthermore, both signal peptide deducing programs deduce that this protein is a non-secretory protein.

変異タンパク質T11628_PEA_1_P5はまた、表901に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T11628_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T11628_PEA_1_P5 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing the other amino acids, and listing the other amino acids, as shown in Table 901), and the last column is the SNP It is shown whether it is known and the presence of a known SNP in the mutein T11628_PEA_1_P5 sequence supports the putative sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質T11628_PEA_1_P5は、以下の転写物によってコードされる:T11628_PEA_1_T9(配列は出願書類の最後に示す)。転写物T11628_PEA_1_T9のコード部分を太字で示し、このコード部分は211位から開始され、507位で終結する。転写物はまた、表902に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T11628_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T11628_PEA_1_P5 is encoded by the following transcript: T11628_PEA_1_T9 (sequences shown at the end of the application). The code portion of transcript T11628_PEA_1_T9 is shown in bold, starting at position 211 and ending at position 507. The transcript also has the following SNPs listed in Table 902 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein T11628_PEA_1_P5 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質T11628_PEA_1_P7は、出願書類の最後に示すアミノ酸配列を有し、転写物T11628_PEA_1_T11によってコードされる。公知のタンパク質(ミオグロビン)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein T11628_PEA_1_P7 according to the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript T11628_PEA_1_T11. An alignment to a known protein (myoglobin) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

T11628_PEA_1_P7とMYG_HUMAN_V1との間の比較の報告
1.MYG_HUMAN_V1のアミノ酸1〜134に対応し、T11628_PEA_1_P7のアミノ酸1〜134にも対応するMGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKと少なくとも90%相同な第1のアミノ酸配列と、T11628_PEA_1_P7のアミノ酸135〜135に対応する配列Gを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T11628_PEA_1_P7をコードする単離キメラポリペプチド。
Report of comparison between T11628_PEA_1_P7 and MYG_HUMAN_V1. MGL DGWE corresponding to amino acid 1 to 134 of MYG_HUMAN_V1 and T11628 _PEA_1_P7 as a UH 7 At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous And a second amino acid sequence, the first amino acid sequence and a second amino acid sequence, contiguous and in sequential order, the isolated chimeric polypeptide coding T11628_PEA_1_P7.

公知のタンパク質配列(MYG_HUMAN)は、出願書類の最後に示す配列より1つまたは複数の変化があり、このアミノ酸配列をMYG_HUMAN_V1と命名することに留意すべきである。これらの変化が起こることは以前に公知であり、以下の表に列挙した。   It should be noted that the known protein sequence (MYG_HUMAN) has one or more changes from the sequence shown at the end of the application and this amino acid sequence is designated as MYG_HUMAN_V1. The occurrence of these changes was previously known and listed in the following table.

Figure 2008507261
Figure 2008507261

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: Intracellular. Protein localization is considered to be intracellular as no transmembrane domain estimation program will deduce that this protein is a transmembrane domain. Furthermore, both signal peptide deducing programs deduce that this protein is a non-secretory protein.

変異タンパク質T11628_PEA_1_P7はまた、表904に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T11628_PEA_1_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T11628_PEA_1_P7 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 904) It is shown whether it is known and the presence of a known SNP in the mutein T11628_PEA_1_P7 sequence supports the putative sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質T11628_PEA_1_P7は、以下の転写物によってコードされる:T11628_PEA_1_T11(配列は出願書類の最後に示す)。転写物T11628_PEA_1_T11のコード部分を太字で示し、このコード部分は319位から開始され、723位で終結する。転写物はまた、表905に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T11628_PEA_1_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T11628_PEA_1_P7 is encoded by the following transcript: T11628_PEA_1_T11 (sequences shown at the end of the application). The code portion of the transcript T11628_PEA_1_T11 is shown in bold, starting from position 319 and ending at position 723. The transcript also has the following SNPs listed in Table 905 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein T11628_PEA_1_P7 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質T11628_PEA_1_P10は、出願書類の最後に示すアミノ酸配列を有し、転写物T11628_PEA_1_T4によってコードされる。公知のタンパク質(ミオグロビン)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein T11628_PEA_1_P10 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript T11628_PEA_1_T4. An alignment to a known protein (myoglobin) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

T11628_PEA_1_P10とQ8WVH6(配列番号1450)との間の比較の報告
1.T11628_PEA_1_P10のアミノ酸1〜55に対応する配列MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、Q8WVH6のアミノ酸1〜99に対応し、T11628_PEA_1_P10のアミノ酸56〜154にも対応するMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQGと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T11628_PEA_1_P10をコードする単離キメラポリペプチド。
Report on comparison between T11628_PEA_1_P10 and Q8WVH6 (SEQ ID NO: 1450) At least 70%, optionally at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 90%, most preferably at least 95% homologous to a polypeptide having the sequence MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKDFFKHLKSEDE corresponding to amino acids 1-55 of T11628_PEA_1_P10 1 and corresponding to amino acids 1 to 99 of Q8WVH6 and to amino acids 56 to 154 of T11628_PEA_1_P10, MKASEDLKKHGATVLTGLGKKKKHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDDMASNYKELGFQG And at least 90% homologous to a second amino acid sequence, the first amino acid sequence and a second amino acid sequence, contiguous and in sequential order, the isolated chimeric polypeptide coding T11628_PEA_1_P10.

2.T11628_PEA_1_P10の配列MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T11628_PEA_1_P10の先端をコードする単離ポリペプチド。   2. T11628_PEA_1_P10 comprising a polypeptide of at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to TMG An isolated polypeptide encoding

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: Intracellular. Protein localization is considered to be intracellular as no transmembrane domain estimation program will deduce that this protein is a transmembrane domain. Furthermore, both signal peptide deducing programs deduce that this protein is a non-secretory protein.

変異タンパク質T11628_PEA_1_P10はまた、表906に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T11628_PEA_1_P10配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T11628_PEA_1_P10 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 906) It is shown whether it is known and the presence of a known SNP in the mutein T11628_PEA_1_P10 sequence supports the putative sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質T11628_PEA_1_P10は、以下の転写物によってコードされる:T11628_PEA_1_T4(配列は出願書類の最後に示す)。転写物T11628_PEA_1_T4のコード部分を太字で示し、このコード部分は205位から開始され、666位で終結する。転写物はまた、表907に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T11628_PEA_1_P10配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein T11628_PEA_1_P10 is encoded by the following transcript: T11628_PEA_1_T4 (sequences shown at the end of the application). The code portion of the transcript T11628_PEA_1_T4 is shown in bold, starting from position 205 and ending at position 666. The transcript also has the following SNPs listed in Table 907 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein T11628_PEA_1_P10 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターT11628は、上の表2に列挙した25個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster T11628 is characterized by the 25 segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターT11628_PEA_1_node_7は、9個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T3。以下の表908は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_7 of the present invention is supported by nine libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T11628_PEA_1_T3. Table 908 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT11628_PEA_1_node_11は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T5。以下の表909は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_11 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: T11628_PEA_1_T5. Table 909 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT11628_PEA_1_node_16は、38個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T11。以下の表910は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_16 of the present invention is supported by 38 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T11628_PEA_1_T11. Table 910 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT11628_PEA_1_node_22は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T9。以下の表911は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_22 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: T11628_PEA_1_T9. Table 911 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT11628_PEA_1_node_25は、129個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。以下の表912は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_25 of the present invention is supported by 129 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, T11628_PEA_1_T9, and T11628_PEA_1_T11. Table 912 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表913に示す)。   Microarray (chip) data for this segment is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (for lung cancer) (shown in Table 913).

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT11628_PEA_1_node_31は、137個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。以下の表914は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_31 of the present invention is supported by 137 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, T11628_PEA_1_T9, and T11628_PEA_1_T11. Table 914 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT11628_PEA_1_node_37は、99個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。以下の表915は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_37 of the present invention is supported by 99 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, T11628_PEA_1_T9, and T11628_PEA_1_T11. Table 915 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターT11628_PEA_1_node_0は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T4。以下の表916は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_0 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: T11628_PEA_1_T4. Table 916 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT11628_PEA_1_node_4は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T4。以下の表917は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_4 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T11628_PEA_1_T4. Table 917 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT11628_PEA_1_node_9は、16個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T5およびT11628_PEA_1_T7。以下の表918は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_9 of the present invention is supported by 16 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T11628_PEA_1_T5 and T11628_PEA_1_T7. Table 918 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT11628_PEA_1_node_13を、以下の転写物中に見出すことができる:T11628_PEA_1_T7。以下の表919は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_13 according to the invention can be found in the following transcript: T11628_PEA_1_T7. Table 919 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT11628_PEA_1_node_14は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T7。以下の表920は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_14 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: T11628_PEA_1_T7. Table 920 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT11628_PEA_1_node_17は、55個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T11。以下の表921は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_17 of the present invention is supported by 55 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T11628_PEA_1_T11. Table 921 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT11628_PEA_1_node_18は、98個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、およびT11628_PEA_1_T11。以下の表922は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_18 of the present invention is supported by 98 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, and T11628_PEA_1_T11. Table 922 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT11628_PEA_1_node_19を、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、およびT11628_PEA_1_T11。以下の表923は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_19 according to the invention can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, and T11628_PEA_1_T11. Table 923 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT11628_PEA_1_node_24は、112個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。以下の表924は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_24 of the present invention is supported by 112 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, T11628_PEA_1_T9, and T11628_PEA_1_T11. Table 924 below describes the start and end positions of this segment on each transcript.


表924 - 転写物上のセグメントの位置

Figure 2008507261

Table 924-Position of segment on transcript
Figure 2008507261

本発明のセグメントクラスターT11628_PEA_1_node_27は、119個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。以下の表925は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_27 of the present invention is supported by 119 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, T11628_PEA_1_T9, and T11628_PEA_1_T11. Table 925 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表926に示す)。   Microarray (chip) data for this segment is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (for lung cancer) (shown in Table 926).

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT11628_PEA_1_node_28は、115個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、およびT11628_PEA_1_T9。以下の表927は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_28 of the present invention is supported by 115 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, and T11628_PEA_1_T9. Table 927 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT11628_PEA_1_node_29は、113個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、およびT11628_PEA_1_T9。以下の表928は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_29 of the present invention is supported by 113 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, and T11628_PEA_1_T9. Table 928 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT11628_PEA_1_node_30を、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。以下の表929は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_30 according to the invention can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, T11628_PEA_1_T9, and T11628_PEA_1_T11. Table 929 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT11628_PEA_1_node_32を、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。以下の表930は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_32 according to the invention can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, T11628_PEA_1_T9, and T11628_PEA_1_T11. Table 930 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT11628_PEA_1_node_33を、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。以下の表931は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_33 according to the invention can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, T11628_PEA_1_T9, and T11628_PEA_1_T11. Table 931 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT11628_PEA_1_node_34は、122個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。以下の表932は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_34 of the present invention is supported by 122 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, T11628_PEA_1_T9, and T11628_PEA_1_T11. Table 932 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT11628_PEA_1_node_35は、126個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。以下の表933は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_35 of the present invention is supported by 126 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, T11628_PEA_1_T9, and T11628_PEA_1_T11. Table 933 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターT11628_PEA_1_node_36は、122個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。以下の表934は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster T11628_PEA_1_node_36 of the present invention is supported by 122 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, T11628_PEA_1_T9, and T11628_PEA_1_T11. Table 934 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:

Sequence name: Q8WVH6



Sequence documentation:



Alignment of: T11628_PEA_1_P2 x Q8WVH6 ..



Alignment segment 1/1:



Quality: 962.00 Escore: 0

Matching length: 99 Total length: 99

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

. . . . .

56 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 105

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 50

. . . .

106 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 154

|||||||||||||||||||||||||||||||||||||||||||||||||

51 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 99













Sequence name: MYG_HUMAN_V1



Sequence documentation:



Alignment of: T11628_PEA_1_P5 x MYG_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 962.00 Escore: 0

Matching length: 99 Total length: 99

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

. . . . .

1 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 50

||||||||||||||||||||||||||||||||||||||||||||||||||

56 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 105

. . . .

51 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 99

|||||||||||||||||||||||||||||||||||||||||||||||||

106 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 154













Sequence name: MYG_HUMAN_V1



Sequence documentation:



Alignment of: T11628_PEA_1_P7 x MYG_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 1315.00 Escore: 0

Matching length: 134 Total length: 134

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

. . . . .

1 MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHL 50

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHL 50

. . . . .

51 KSEDEMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKI 100

||||||||||||||||||||||||||||||||||||||||||||||||||

51 KSEDEMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKI 100

. . .

101 PVKYLEFISECIIQVLQSKHPGDFGADAQGAMNK 134

||||||||||||||||||||||||||||||||||

101 PVKYLEFISECIIQVLQSKHPGDFGADAQGAMNK 134













Sequence name: Q8WVH6



Sequence documentation:



Alignment of: T11628_PEA_1_P10 x Q8WVH6 ..



Alignment segment 1/1:



Quality: 962.00 Escore: 0

Matching length: 99 Total length: 99

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

. . . . .

56 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 105

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 50

. . . .

106 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 154

|||||||||||||||||||||||||||||||||||||||||||||||||

51 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 99





Mutated protein alignment against previously known proteins:

Sequence name: Q8WVH6



Sequence documentation:



Alignment of: T11628_PEA_1_P2 x Q8WVH6 ..



Alignment segment 1/1:



Quality: 962.00 Escore: 0

Matching length: 99 Total length: 99

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

....

56 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 105

||||||||||||||||||||||||||||||||||||||||

1 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQHATKTHKIPVKYL 50

....

106 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 154

||||||||||||||||||||||||||||||||||||||||

51 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 99













Sequence name: MYG_HUMAN_V1



Sequence documentation:



Alignment of: T11628_PEA_1_P5 x MYG_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 962.00 Escore: 0

Matching length: 99 Total length: 99

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

....

1 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQHATKTHKIPVKYL 50

||||||||||||||||||||||||||||||||||||||||

56 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 105

....

51 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 99

||||||||||||||||||||||||||||||||||||||||

106 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 154













Sequence name: MYG_HUMAN_V1



Sequence documentation:



Alignment of: T11628_PEA_1_P7 x MYG_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 1315.00 Escore: 0

Matching length: 134 Total length: 134

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

....

1 MGLSDGEWQLVLNVWGK VEADIPGHGQEVLIRLFKGHPETLEKDFK FKHL 50

||||||||||||||||||||||||||||||||||||||||

1 MGLSDGEWQLVLNVWGK VEADIPGHGQEVLIRLFKGHPETLEKDFK FKHL 50

....

51 KSEDEMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKI 100

||||||||||||||||||||||||||||||||||||||||

51 KSEDEMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKI 100

....

101 PVKYLEFISECIIQVLQSKHPGDFGADAQGAMNK 134

|||||||||||||||||||||||||||||||

101 PVKYLEFISECIIQVLQSKHPGDFGADAQGAMNK 134













Sequence name: Q8WVH6



Sequence documentation:



Alignment of: T11628_PEA_1_P10 x Q8WVH6 ..



Alignment segment 1/1:



Quality: 962.00 Escore: 0

Matching length: 99 Total length: 99

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

....

56 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 105

||||||||||||||||||||||||||||||||||||||||

1 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQHATKTHKIPVKYL 50

....

106 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 154

||||||||||||||||||||||||||||||||||||||||

51 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 99




クラスターHUMCEAの説明
クラスターHUMCEAは、目的の5つの転写物および42個のセグメントを特徴とし、その名称を、それぞれ表935および936に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表937に示す。
Description of cluster HUMCEA The cluster HUMCEA is characterized by 5 transcripts and 42 segments of interest, the names of which are shown in Tables 935 and 936, respectively, and the sequences themselves are shown at the end of the application. Selected protein variants are shown in Table 937.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質である癌胎児性抗原関連細胞接着分子5前駆体(SwissProtアクセッション識別子CEA5_HUMAN、同義語癌胎児性抗原、CEA、胎便抗原100、CD66e抗原としても公知である)(配列番号1451)の変異型である。   These sequences are known proteins, previously known herein as proteins, oncofetal antigen-related cell adhesion molecule 5 precursor (SwissProt accession identifier CEA5_HUMAN, synonymous carcinoembryonic antigen, CEA, meconium Antigen 100, a variant of (also known as CD66e antigen) (SEQ ID NO: 1451).

タンパク質癌胎児性抗原関連細胞接着分子5前駆体の配列を、「癌胎児性抗原関連細胞接着分子5前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表938に示す。   The sequence of the protein oncofetal antigen related cell adhesion molecule 5 precursor is shown at the end of the application as "oncofetal antigen related cell adhesion molecule 5 precursor amino acid sequence". Known polymorphisms of this sequence are shown in Table 938.

Figure 2008507261
Figure 2008507261

タンパク質癌胎児性抗原関連細胞接着分子5前駆体局在化は、GPI−アンカーによって膜に結合すると考えられる。   Protein oncofetal antigen related cell adhesion molecule 5 precursor localization is thought to be membrane bound by the GPI-anchor.

以前に公知のタンパク質はまた、以下の適応症および/または潜在的治療用途を有する:癌。ヒトにおける臨床/治療用途(例えば、抗体または小分子の標的として、および/または直接的な治療として)が調査されており、これらの調査に関連する利用可能な情報は以下である。以前に公知のタンパク質の潜在的な薬学的に関連するか治療に関連する活性は以下である:免疫賦活剤。クラスターによって示されたタンパク質の治療における役割が予想されている。このタンパク質またはその一部を、潜在的治療に適用する(造影剤、抗癌薬、免疫賦形剤、免疫複合体、モノクローナル抗体(マウス)、アンチセンス療法、抗体)ために使用するか使用することができる薬物データベースまたは公的なデータベース(例えば、上記)に情報が存在するので、クラスターをこの分野に割り当てた。   The previously known proteins also have the following indications and / or potential therapeutic applications: cancer. Clinical / therapeutic applications in humans (e.g. as targets for antibodies or small molecules and / or as direct therapy) are being investigated and available information related to these investigations is: Potential pharmaceutically relevant or therapeutically relevant activities of previously known proteins are: immunostimulants. The therapeutic role of proteins displayed by clusters is expected. Use or use this protein or part of it for potential treatment (contrast agent, anticancer drug, immune vehicle, immune complex, monoclonal antibody (mouse), antisense therapy, antibody) Clusters were assigned to this area as the information exists in drug databases or public databases (eg, above) that can.

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:細胞成分に関連する注釈付けである内在性原形質膜タンパク質、膜。   The following GO annotation applies to previously known proteins. The following annotations were found: endogenous plasma membrane proteins, membranes, which are annotations related to cellular components.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

クラスターHUMCEAを、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図33のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   The cluster HUMCEA can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The terms “number” in the right column of the table and the numbers on the y-axis of FIG. 33 refer to the weighted expression of ESTs in each category as “ppm” (the ppm of ESTs of a particular cluster in this category by ppm) Ratio of expression to expression of all ESTs).

概して、図33および表939中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および膵臓癌。   In general, as shown for the histograms in FIG. 33 and Table 939, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: epithelial malignancies, a mixture of malignancies from different tissues, and pancreatic cancer.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

このクラスターについて、少なくとも1つのオリゴヌクレオチドが、クラスターの過剰発現を証明することが見出されたが、以下に列挙した少なくとも1つの転写物/セグメントでは見出されなかった。以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。前記のように、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、(肺癌に関して)このクラスターに達するが、以下の他のセグメント/転写物は達しないことが見出された(表941に示す)。   For this cluster, at least one oligonucleotide was found to demonstrate overexpression of the cluster, but not in at least one transcript / segment listed below. Microarray (chip) data for this segment is also available, as follows. As noted above, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this cluster (for lung cancer) but not the other segments / transcripts below (shown in Table 941).

Figure 2008507261
Figure 2008507261

上記のように、クラスターHUMCEAは、上の表1に列挙した5つの転写物を特徴とする。これらの転写物は、タンパク質癌胎児性抗原関連細胞接着分子5前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster HUMCEA is characterized by the 5 transcripts listed in Table 1 above. These transcripts encode a protein which is a variant of the protein oncofetal antigen related cell adhesion molecule 5 precursor. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質HUMCEA_PEA_1_P4は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMCEA_PEA_1_T8によってコードされる。公知のタンパク質(癌胎児性抗原関連細胞接着分子5前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HUMCEA_PEA_1_P4 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HUMCEA_PEA_1_T8. An alignment to a known protein (carcinoembryonic antigen-related cell adhesion molecule 5 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HUMCEA_PEA_1_P4とCEA5_HUMANとの間の比較の報告
1.CEA5_HUMANのアミノ酸1〜234に対応し、HUMCEA_PEA_1_P4のアミノ酸1〜234にも対応するMESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREIIYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSISSNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTLTLFNVTRNDTASYKCETQNPVSARRSDSVILNVLと少なくとも90%相同な第1のアミノ酸配列と、HUMCEA_PEA_1_P4のアミノ酸235〜315に対応する配列CEYICSSLAQAASPNPQGQRQDFSVPLRFKYTDPQPWTSRLSVTFCPRKTWADQVLTKNRRGGAASVLGGSGSTPYDGRNRを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCEA_PEA_1_P4をコードする単離キメラポリペプチド。
Reporting of comparison between HUMCEA_PEA_1_P4 and CEA5_HUMAN 1. Corresponding to amino acids 1-234 of CEA5_HUMAN, first amino acid sequence at least 90% homologous to the corresponding MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREIIYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSISSNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTLTLFNVTRNDTASYKCETQNPVSARRSDSVILNVL to amino acids 1-234 of HUMCEA_PEA_1_P4, the HUMCEA_PEA_1_P4 amino The polypeptide having the sequence CEYICSSLAQAASPNPQGQRQDFSVPLRFKYTDPQPTSRLSVTFCPRKTADQVLTKRRGGAASVLGGGSTPYDGRNR corresponding to 35-315 is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to the second amino acid An isolated chimeric polypeptide encoding HUMCEA_PEA_1_P4, comprising a sequence, wherein said first and second amino acid sequences are adjacent and in sequential order.

2.HUMCEA_PEA_1_P4中の配列CEYICSSLAQAASPNPQGQRQDFSVPLRFKYTDPQPWTSRLSVTFCPRKTWADQVLTKNRRGGAASVLGGSGSTPYDGRNRと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMCEA_PEA_1_P4のテールをコードする単離ポリペプチド。   2. A sequence of at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95%. An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HUMCEA_PEA_1_P4はまた、表942に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCEA_PEA_1_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMCEA_PEA_1_P4 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 942) It indicates whether it is known and the presence of a known SNP in the mutant protein HUMCEA_PEA_1_P4 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質癌胎児性抗原関連細胞接着分子5前駆体と比較した変異タンパク質HUMCEA_PEA_1_P4のグリコシル化部位を表943に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein HUMCEA_PEA_1_P4 compared to the known protein oncofetal antigen related cell adhesion molecule 5 precursor are shown in Table 943 (the first column shows its position on the amino acid sequence, the second column is , Indicates whether glycosylation sites are present in the mutein, and the last column indicates whether this position differs on the mutein).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

変異タンパク質HUMCEA_PEA_1_P4は、以下の転写物によってコードされる:HUMCEA_PEA_1_T8(配列は出願書類の最後に示す)。転写物HUMCEA_PEA_1_T8のコード部分を太字で示し、このコード部分は115位から開始され、1059位で終結する。転写物はまた、表944に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCEA_PEA_1_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMCEA_PEA_1_P4 is encoded by the following transcript: HUMCEA_PEA_1_T8 (sequences shown at the end of the application). The coding part of the transcript HUMCEA_PEA_1_T8 is shown in bold, starting from position 115 and ending at position 1059. The transcript also has the following SNPs listed in Table 944 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, the mutein HUMCEA_PEA_1_P4 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質HUMCEA_PEA_1_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMCEA_PEA_1_T9によってコードされる。公知のタンパク質(癌胎児性抗原関連細胞接着分子5前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HUMCEA_PEA_1_P5 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HUMCEA_PEA_1_T9. An alignment to a known protein (carcinoembryonic antigen-related cell adhesion molecule 5 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HUMCEA_PEA_1_P5とCEA5_HUMANとの間の比較の報告
1.CEA5_HUMANのアミノ酸1〜675に対応し、HUMCEA_PEA_1_P5のアミノ酸1〜675にも対応するMESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREIIYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSISSNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTLTLFNVTRNDTASYKCETQNPVSARRSDSVILNVLYGPDAPTISPLNTSYRSGENLNLSCHAASNPPAQYSWFVNGTFQQSTQELFIPNITVNNSGSYTCQAHNSDTGLNRTTVTTITVYAEPPKPFITSNNSNPVEDEDAVALTCEPEIQNTTYLWWVNNQSLPVSPRLQLSNDNRTLTLLSVTRNDVGPYECGIQNELSVDHSDPVILNVLYGPDDPTISPSYTYYRPGVNLSLSCHAASNPPAQYSWLIDGNIQQHTQELFISNITEKNSGLYTCQANNSASGHSRTTVKTITVSAELPKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLSNGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISPPDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNNGTYACFVSNLATGRNNSIVKSITVSと少なくとも90%相同な第1のアミノ酸配列と、HUMCEA_PEA_1_P5のアミノ酸676〜719に対応する配列GKWLPGASASYSGVESIWFSPKSQEDIFFPSLCSMGTRKSQILSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCEA_PEA_1_P5をコードする単離キメラポリペプチド。
Reporting of the comparison between HUMCEA_PEA_1_P5 and CEA5_HUMAN 1. Corresponding to amino acids 1 to 675 of CEA5_HUMAN, corresponding to amino acids 1 to 675 of HUMCEA_PEA_1_P5 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREIIYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSISSNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTLTLFNVTRNDTASYKCETQNPVSARRSDSVILNVLYGPDAPTISPLNTSYRSGENLNLSCHAASNPPAQYSWFVNGTF QSTQELFIPNITVNNSGSYTCQAHNSDTGLNRTTVTTITVYAEPPKPFITSNNSNPVEDEDAVALTCEPEIQNTTYLWWVNNQSLPVSPRLQLSNDNRTLTLLSVTRNDVGPYECGIQNELSVDHSDPVILNVLYGPDDPTISPSYTYYRPGVNLSLSCHAASNPPAQYSWLIDGNIQQHTQELFISNITEKNSGLYTCQANNSASGHSRTTVKTITVSAELPKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLSNGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISPPDSSYLSGAN NLCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNGGTYACFVSNLATGRNNSIVKSITVS A first amino acid sequence at least 90% homologous to the first amino acid and a sequence GKWLPGACASYSGVESIWFSPKSQEDIFPSLCSMGGTQSQILS corresponding to amino acids 676 to 719 of HUMCEA_PEA_1_P5 Comprises HUMCEA_PEA_1_P5, comprising a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first and second amino acid sequences being adjacent and in sequential order Isolated chimera polypep Tide.

2.HUMCEA_PEA_1_P5中の配列GKWLPGASASYSGVESIWFSPKSQEDIFFPSLCSMGTRKSQILSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMCEA_PEA_1_P5のテールをコードする単離ポリペプチド。   2. HUMCEA_PEA_1_P5 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence GKWLPGASASYSGVESIWFSPKSQEDIFFPSLCSMGTRKSQILS in HUMCEA_PEA_1_P5 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HUMCEA_PEA_1_P5はまた、表945に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCEA_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMCEA_PEA_1_P5 also has the following non-silent SNPs (single nucleotide polymorphisms) (indicating its position on the amino acid sequence, listing other amino acids, and the last column, as shown in Table 945) It is indicated whether it is known and the presence of a known SNP in the mutant protein HUMCEA_PEA_1_P5 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質癌胎児性抗原関連細胞接着分子5前駆体と比較した変異タンパク質HUMCEA_PEA_1_P5のグリコシル化部位を表946に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein HUMCEA_PEA_1_P5 compared to the known protein oncofetal antigen related cell adhesion molecule 5 precursor are shown in Table 946 (in the first column, its position on the amino acid sequence is indicated, the second column is , Indicates whether glycosylation sites are present in the mutein, and the last column indicates whether this position differs on the mutein).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

変異タンパク質HUMCEA_PEA_1_P5は、以下の転写物によってコードされる:HUMCEA_PEA_1_T9(配列は出願書類の最後に示す)。転写物HUMCEA_PEA_1_T9のコード部分を太字で示し、このコード部分は115位から開始され、2271位で終結する。転写物はまた、表947に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCEA_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMCEA_PEA_1_P5 is encoded by the following transcript: HUMCEA_PEA_1_T9 (sequences shown at the end of the application). The coding part of the transcript HUMCEA_PEA_1_T9 is shown in bold, starting from position 115 and ending at position 2721. The transcript also has the following SNPs listed in Table 947 (indicating its position on the nucleotide sequence and listing another nucleic acid, the last column indicates whether the SNP is known, the mutein HUMCEA_PEA_1_P5 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質HUMCEA_PEA_1_P14は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMCEA_PEA_1_T20によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The mutein HUMCEA_PEA_1_P14 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HUMCEA_PEA_1_T20. The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HUMCEA_PEA_1_P14はまた、表948に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCEA_PEA_1_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMCEA_PEA_1_P14 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 948) It indicates whether it is known and the presence of a known SNP in the mutant protein HUMCEA_PEA_1_P14 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質HUMCEA_PEA_1_P14は、以下の転写物によってコードされる:HUMCEA_PEA_1_T20(配列は出願書類の最後に示す)。転写物HUMCEA_PEA_1_T20のコード部分を太字で示し、このコード部分は115位から開始され、1821位で終結する。転写物はまた、表949に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCEA_PEA_1_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMCEA_PEA_1_P14 is encoded by the following transcript: HUMCEA_PEA_1_T20 (sequences shown at the end of the application). The coding part of the transcript HUMCEA_PEA_1_T20 is shown in bold, starting from position 115 and ending at position 1821. The transcript also has the following SNPs listed in Table 949 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, the mutein HUMCEA_PEA_1_P14 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質HUMCEA_PEA_1_P19は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMCEA_PEA_1_T25によってコードされる。公知のタンパク質(癌胎児性抗原関連細胞接着分子5前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HUMCEA_PEA_1_P19 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HUMCEA_PEA_1_T25. An alignment to a known protein (carcinoembryonic antigen-related cell adhesion molecule 5 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HUMCEA_PEA_1_P19とCEA5_HUMANとの間の比較の報告
1.CEA5_HUMANのアミノ酸1〜232に対応し、HUMCEA_PEA_1_P19のアミノ酸1〜232にも対応するMESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREIIYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSISSNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTLTLFNVTRNDTASYKCETQNPVSARRSDSVILNと少なくとも90%相同な第1のアミノ酸配列と、CEA5_HUMANのアミノ酸589〜702に対応し、HUMCEA_PEA_1_P19のアミノ酸233〜346にも対応するVLYGPDTPIISPPDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNNGTYACFVSNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVALIと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCEA_PEA_1_P19をコードする単離キメラポリペプチド。
Reporting of the comparison between HUMCEA_PEA_1_P19 and CEA5_HUMAN 1. Corresponding to amino acids 1-232 of CEA5_HUMAN, corresponding MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREIIYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSISSNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTLTLFNVTRNDTASYKCETQNPVSARRSDSVILN and at least 90% homologous to the first amino acid sequence to amino acids 1-232 of HUMCEA_PEA_1_P19, amino acids CEA5_HUMAN 589 to 70 Corresponding to the amino acids 233 to 346 of HUMCEA_PEA_1_P19 corresponding to the amino acid sequence of at least 90% of the amino acid sequence of An isolated chimeric polypeptide encoding HUMCEA_PEA_1_P19, in order.

2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がNVを含み、以下の構造:アミノ酸番号232−x〜232のいずれかから始まり、アミノ酸番号233+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HUMCEA_PEA_1_P19の縁部分をコードする単離キメラポリペプチド。   2. Length “n” (wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long, most preferably at least about 50 amino acids long, at least two amino acids comprising NV, starting from any of the following structures: amino acid numbers 232-x to 232, amino acid numbers 233 + ((n-2)-x) (formula An isolated chimeric polypeptide encoding the edge portion of HUMCEA_PEA_1_P19, comprising a polypeptide, having a sequence terminating in:

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、公知のタンパク質局在化および/または遺伝子構造の手作業による調査によって、膜と考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: membrane. Protein localization is considered to be membrane by manual investigation of known protein localization and / or gene structure.

変異タンパク質HUMCEA_PEA_1_P19はまた、表950に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCEA_PEA_1_P19配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMCEA_PEA_1_P19 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column, as shown in Table 950) It indicates whether it is known and the presence of a known SNP in the mutant protein HUMCEA_PEA_1_P19 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質癌胎児性抗原関連細胞接着分子5前駆体と比較した変異タンパク質HUMCEA_PEA_1_P19のグリコシル化部位を表951に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein HUMCEA_PEA_1_P19 as compared to the known protein oncofetal antigen related cell adhesion molecule 5 precursor are shown in Table 951 (the first column shows its position on the amino acid sequence, the second column is , Indicates whether glycosylation sites are present in the mutein, and the last column indicates whether this position differs on the mutein).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

変異タンパク質HUMCEA_PEA_1_P19は、以下の転写物によってコードされる:HUMCEA_PEA_1_T25(配列は出願書類の最後に示す)。転写物HUMCEA_PEA_1_T25のコード部分を太字で示し、このコード部分は115位から開始され、1152位で終結する。転写物はまた、表952に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCEA_PEA_1_P19配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMCEA_PEA_1_P19 is encoded by the following transcript: HUMCEA_PEA_1_T25 (sequences shown at the end of the application). The coding part of the transcript HUMCEA_PEA_1_T25 is shown in bold, starting from position 115 and ending at position 1152. The transcript also has the following SNPs listed in Table 952 (showing its position on the nucleotide sequence and listing another nucleic acid, the last column indicating whether the SNP is known, the mutein HUMCEA_PEA_1_P19 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質HUMCEA_PEA_1_P20は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMCEA_PEA_1_T26によってコードされる。公知のタンパク質(癌胎児性抗原関連細胞接着分子5前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HUMCEA_PEA_1_P20 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HUMCEA_PEA_1_T26. An alignment to a known protein (carcinoembryonic antigen-related cell adhesion molecule 5 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HUMCEA_PEA_1_P20とCEA5_HUMANとの間の比較の報告
1.CEA5_HUMANのアミノ酸1〜142に対応し、HUMCEA_PEA_1_P20のアミノ酸1〜142にも対応するMESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREIIYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPと少なくとも90%相同な第1のアミノ酸配列と、CEA5_HUMANのアミノ酸499〜702に対応し、HUMCEA_PEA_1_P20のアミノ酸143〜346にも対応するELPKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLSNGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISPPDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNNGTYACFVSNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVALIと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCEA_PEA_1_P20をコードする単離キメラポリペプチド。
Reporting of comparison between HUMCEA_PEA_1_P20 and CEA5_HUMAN 1. Corresponding to amino acids 1-142 of CEA5_HUMAN, first amino acid sequence at least 90% homologous to the corresponding MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREIIYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYP to amino acids 1-142 of HUMCEA_PEA_1_P20, corresponding to amino acids 499-702 of CEA5_HUMAN, the HUMCEA_PEA_1_P20 amino 143-346 Also corresponding to ELPKPSISSNNSKPVEDKDAFAFTCEPEAQNTT YRWWNGNGSLPSPVSLQ SNGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISPPDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNNGTYACFVSNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVALI and and at least 90% homologous to a second amino acid sequence, the first amino acid sequence and a second amino acid sequence, contiguous and in sequential order, the isolated chimeric polypeptide coding HUMCEA_PEA_1_P20.

2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がPEを含み、以下の構造:アミノ酸番号142−x〜142のいずれかから始まり、アミノ酸番号143+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HUMCEA_PEA_1_P20の縁部分をコードする単離キメラポリペプチド。   2. Length “n” (wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long, most preferably at least about 50 amino acids long, at least two amino acids comprising PE, starting from any of the following structures: amino acids 142-x to 142, amino acids 143 + ((n-2) -x) (formula An isolated chimeric polypeptide encoding the edge portion of HUMCEA_PEA_1_P20, comprising a polypeptide, having a sequence terminating in:), wherein x is varied from 0 to n-2.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、公知のタンパク質局在化および/または遺伝子構造の手作業による調査によって、膜と考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: membrane. Protein localization is considered to be membrane by manual investigation of known protein localization and / or gene structure.

変異タンパク質HUMCEA_PEA_1_P20はまた、表953に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCEA_PEA_1_P20配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMCEA_PEA_1_P20 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows the SNPs, as shown in Table 953) It is shown whether it is known and the presence of a known SNP in the mutant protein HUMCEA_PEA_1_P20 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質癌胎児性抗原関連細胞接着分子5前駆体と比較した変異タンパク質HUMCEA_PEA_1_P20のグリコシル化部位を表954に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein HUMCEA_PEA_1_P20 as compared to the known protein oncofetal antigen related cell adhesion molecule 5 precursor are shown in Table 954 (showing its position on the amino acid sequence in the first column, the second column , Indicates whether glycosylation sites are present in the mutein, and the last column indicates whether this position differs on the mutein).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

変異タンパク質HUMCEA_PEA_1_P20は、以下の転写物によってコードされる:HUMCEA_PEA_1_T26(配列は出願書類の最後に示す)。転写物HUMCEA_PEA_1_T26のコード部分を太字で示し、このコード部分は115位から開始され、1152位で終結する。転写物はまた、表955に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCEA_PEA_1_P20配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMCEA_PEA_1_P20 is encoded by the following transcript: HUMCEA_PEA_1_T26 (sequences shown at the end of the application). The coding part of the transcript HUMCEA_PEA_1_T26 is shown in bold, starting from position 115 and ending at position 1152. The transcript also has the following SNPs listed in Table 955 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, the mutein HUMCEA_PEA_1_P20 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターHUMCEAは、上の表2に列挙した42個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As noted above, cluster HUMCEA is characterized by the 42 segments listed in Table 2 above, the sequences of which are shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターHUMCEA_PEA_1_node_0は、56個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、HUMCEA_PEA_1_T20、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表956は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_0 of the present invention is supported by 56 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, HUMCEA_PEA_1_T20, HUMCEA_PEA_1_T25, and HUMCEA_PEA_1_T26. Table 956 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_2は、83個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、HUMCEA_PEA_1_T20、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表957は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_2 of the present invention is supported by 83 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, HUMCEA_PEA_1_T20, HUMCEA_PEA_1_T25, and HUMCEA_PEA_1_T26. Table 957 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_11は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8。以下の表958は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_11 of the present invention is supported by six libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCEA_PEA_1_T8. Table 958 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表959に示す)。   Microarray (chip) data for this segment is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (for lung cancer) (shown in Table 959).

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_12は、83個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9およびHUMCEA_PEA_1_T20。以下の表960は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_12 of the present invention is supported by 83 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9 and HUMCEA_PEA_1_T20. Table 960 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_31は、87個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表961は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_31 of the present invention is supported by 87 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, and HUMCEA_PEA_1_T20. Table 961 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_36は、94個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T26。以下の表962は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_36 of the present invention is supported by 94 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, and HUMCEA_PEA_1_T26. Table 962 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_44は、112個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表963は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_44 of the present invention is supported by 112 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, HUMCEA_PEA_1_T25, and HUMCEA_PEA_1_T26. Table 963 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_46は、15個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T9。以下の表964は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_46 of the present invention is supported by 15 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCEA_PEA_1_T9. Table 964 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_63は、68個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表965は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_63 of the present invention is supported by 68 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T25, and HUMCEA_PEA_1_T26. Table 965 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_65は、54個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表966は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_65 of the present invention is supported by 54 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T25, and HUMCEA_PEA_1_T26. Table 966 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_67は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T20。以下の表967は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_67 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCEA_PEA_1_T20. Table 967 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターHUMCEA_PEA_1_node_3は、67個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、HUMCEA_PEA_1_T20、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表968は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_3 of the present invention is supported by 67 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, HUMCEA_PEA_1_T20, HUMCEA_PEA_1_T25, and HUMCEA_PEA_1_T26. Table 968 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_7は、73個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、HUMCEA_PEA_1_T20、およびHUMCEA_PEA_1_T25。以下の表969は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_7 of the present invention is supported by 73 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, HUMCEA_PEA_1_T20, and HUMCEA_PEA_1_T25. Table 969 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_8は、67個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、HUMCEA_PEA_1_T20、およびHUMCEA_PEA_1_T25。以下の表970は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_8 of the present invention is supported by 67 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, HUMCEA_PEA_1_T20, and HUMCEA_PEA_1_T25. Table 970 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_9は、71個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、HUMCEA_PEA_1_T20、およびHUMCEA_PEA_1_T25。以下の表971は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_9 of the present invention is supported by 71 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, HUMCEA_PEA_1_T20, and HUMCEA_PEA_1_T25. Table 971 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_10は、67個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、HUMCEA_PEA_1_T20、およびHUMCEA_PEA_1_T25。以下の表972は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_10 of the present invention is supported by 67 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, HUMCEA_PEA_1_T20, and HUMCEA_PEA_1_T25. Table 972 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_15を、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表973は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_15 of the invention can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, and HUMCEA_PEA_1_T20. Table 973 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_16を、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表974は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_16 according to the invention can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, and HUMCEA_PEA_1_T20. Table 974 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_17を、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表975は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_17 according to the invention can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, and HUMCEA_PEA_1_T20. Table 975 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_18を、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表976は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_18 according to the invention can be found in the following transcript: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, and HUMCEA_PEA_1_T20. Table 976 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_19は、69個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表977は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_19 of the present invention is supported by 69 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, and HUMCEA_PEA_1_T20. Table 977 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_20を、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表978は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_20 according to the invention can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, and HUMCEA_PEA_1_T20. Table 978 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_21を、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表979は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_21 according to the invention can be found in the following transcript: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, and HUMCEA_PEA_1_T20. Table 979 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_22は、77個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表980は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_22 of the present invention is supported by 77 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, and HUMCEA_PEA_1_T20. Table 980 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_23は、72個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表981は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_23 of the present invention is supported by 72 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, and HUMCEA_PEA_1_T20. Table 981 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_24を、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表982は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_24 according to the invention can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, and HUMCEA_PEA_1_T20. Table 982 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_27を、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表983は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_27 according to the invention can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, and HUMCEA_PEA_1_T20. Table 983 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_29を、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表984は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_29 according to the invention can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, and HUMCEA_PEA_1_T20. Table 984 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_30は、67個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表985は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_30 of the present invention is supported by 67 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, and HUMCEA_PEA_1_T20. Table 985 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_33を、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T26。以下の表986は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_33 of the invention can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, and HUMCEA_PEA_1_T26. Table 986 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_34は、80個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T26。以下の表987は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_34 of the present invention is supported by 80 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, and HUMCEA_PEA_1_T26. Table 987 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_35は、75個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T26。以下の表988は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_35 of the present invention is supported by 75 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T9, and HUMCEA_PEA_1_T26. Table 988 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_45は、9個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T9。以下の表989は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_45 of the present invention is supported by nine libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMCEA_PEA_1_T9. Table 998 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_50は、64個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表990は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_50 of the present invention is supported by 64 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T25, and HUMCEA_PEA_1_T26. Table 990 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_51は、88個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表991は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_51 of the present invention is supported by 88 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T25, and HUMCEA_PEA_1_T26. Table 991 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_56は、75個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表992は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_56 of the present invention is supported by 75 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T25, and HUMCEA_PEA_1_T26. Table 992 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_57は、82個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表993は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_57 of the present invention is supported by 82 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T25, and HUMCEA_PEA_1_T26. Table 993 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_58は、63個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表994は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_58 of the present invention is supported by 63 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T25, and HUMCEA_PEA_1_T26. Table 994 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_60は、55個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表995は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_60 of the present invention is supported by 55 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T25, and HUMCEA_PEA_1_T26. Table 995 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_61を、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表996は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_61 according to the invention can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T25, and HUMCEA_PEA_1_T26. Table 996 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_62は、60個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表997は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_62 of the present invention is supported by 60 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T25, and HUMCEA_PEA_1_T26. Table 997 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMCEA_PEA_1_node_64は、45個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表998は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMCEA_PEA_1_node_64 of the present invention is supported by 45 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCEA_PEA_1_T8, HUMCEA_PEA_1_T25, and HUMCEA_PEA_1_T26. Table 998 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: CEA5_HUMAN

Sequence documentation:

Alignment of: HUMCEA_PEA_1_P4 x CEA5_HUMAN ..

Alignment segment 1/1:

Quality: 2320.00 Escore: 0
Matching length: 234 Total length: 234
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
. . . . .
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
. . . . .
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
. . . . .
151 SNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTL 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 SNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTL 200
. . .
201 TLFNVTRNDTASYKCETQNPVSARRSDSVILNVL 234
||||||||||||||||||||||||||||||||||
201 TLFNVTRNDTASYKCETQNPVSARRSDSVILNVL 234






Sequence name: CEA5_HUMAN

Sequence documentation:

Alignment of: HUMCEA_PEA_1_P5 x CEA5_HUMAN ..

Alignment segment 1/1:

Quality: 6692.00 Escore: 0
Matching length: 675 Total length: 675
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
. . . . .
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
. . . . .
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
. . . . .
151 SNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTL 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 SNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTL 200
. . . . .
201 TLFNVTRNDTASYKCETQNPVSARRSDSVILNVLYGPDAPTISPLNTSYR 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 TLFNVTRNDTASYKCETQNPVSARRSDSVILNVLYGPDAPTISPLNTSYR 250
. . . . .
251 SGENLNLSCHAASNPPAQYSWFVNGTFQQSTQELFIPNITVNNSGSYTCQ 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 SGENLNLSCHAASNPPAQYSWFVNGTFQQSTQELFIPNITVNNSGSYTCQ 300
. . . . .
301 AHNSDTGLNRTTVTTITVYAEPPKPFITSNNSNPVEDEDAVALTCEPEIQ 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 AHNSDTGLNRTTVTTITVYAEPPKPFITSNNSNPVEDEDAVALTCEPEIQ 350
. . . . .
351 NTTYLWWVNNQSLPVSPRLQLSNDNRTLTLLSVTRNDVGPYECGIQNELS 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NTTYLWWVNNQSLPVSPRLQLSNDNRTLTLLSVTRNDVGPYECGIQNELS 400
. . . . .
401 VDHSDPVILNVLYGPDDPTISPSYTYYRPGVNLSLSCHAASNPPAQYSWL 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 VDHSDPVILNVLYGPDDPTISPSYTYYRPGVNLSLSCHAASNPPAQYSWL 450
. . . . .
451 IDGNIQQHTQELFISNITEKNSGLYTCQANNSASGHSRTTVKTITVSAEL 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 IDGNIQQHTQELFISNITEKNSGLYTCQANNSASGHSRTTVKTITVSAEL 500
. . . . .
501 PKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLS 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 PKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLS 550
. . . . .
551 NGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISP 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 NGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISP 600
. . . . .
601 PDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNN 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 PDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNN 650
. .
651 GTYACFVSNLATGRNNSIVKSITVS 675
|||||||||||||||||||||||||
651 GTYACFVSNLATGRNNSIVKSITVS 675






Sequence name: CEA5_HUMAN

Sequence documentation:

Alignment of: HUMCEA_PEA_1_P19 x CEA5_HUMAN ..

Alignment segment 1/1:

Quality: 3298.00 Escore: 0
Matching length: 346 Total length: 702
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 49.29 Total Percent Identity: 49.29
Gaps: 1

Alignment:
. . . . .
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
. . . . .
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
. . . . .
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
. . . . .
151 SNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTL 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 SNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTL 200
. . . . .
201 TLFNVTRNDTASYKCETQNPVSARRSDSVILN.................. 232
||||||||||||||||||||||||||||||||
201 TLFNVTRNDTASYKCETQNPVSARRSDSVILNVLYGPDAPTISPLNTSYR 250
. . . . .
232 .................................................. 232

251 SGENLNLSCHAASNPPAQYSWFVNGTFQQSTQELFIPNITVNNSGSYTCQ 300
. . . . .
232 .................................................. 232

301 AHNSDTGLNRTTVTTITVYAEPPKPFITSNNSNPVEDEDAVALTCEPEIQ 350
. . . . .
232 .................................................. 232

351 NTTYLWWVNNQSLPVSPRLQLSNDNRTLTLLSVTRNDVGPYECGIQNELS 400
. . . . .
232 .................................................. 232

401 VDHSDPVILNVLYGPDDPTISPSYTYYRPGVNLSLSCHAASNPPAQYSWL 450
. . . . .
232 .................................................. 232

451 IDGNIQQHTQELFISNITEKNSGLYTCQANNSASGHSRTTVKTITVSAEL 500
. . . . .
232 .................................................. 232

501 PKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLS 550
. . . . .
233 ......................................VLYGPDTPIISP 244
||||||||||||
551 NGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISP 600
. . . . .
245 PDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNN 294
||||||||||||||||||||||||||||||||||||||||||||||||||
601 PDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNN 650
. . . . .
295 GTYACFVSNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVA 344
||||||||||||||||||||||||||||||||||||||||||||||||||
651 GTYACFVSNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVA 700

345 LI 346
||
701 LI 702






Sequence name: CEA5_HUMAN

Sequence documentation:

Alignment of: HUMCEA_PEA_1_P20 x CEA5_HUMAN ..

Alignment segment 1/1:

Quality: 3294.00 Escore: 0
Matching length: 346 Total length: 702
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 49.29 Total Percent Identity: 49.29
Gaps: 1

Alignment:
. . . . .
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
. . . . .
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
. . . . .
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYP........ 142
||||||||||||||||||||||||||||||||||||||||||
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
. . . . .
142 .................................................. 142

151 SNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTL 200
. . . . .
142 .................................................. 142

201 TLFNVTRNDTASYKCETQNPVSARRSDSVILNVLYGPDAPTISPLNTSYR 250
. . . . .
142 .................................................. 142

251 SGENLNLSCHAASNPPAQYSWFVNGTFQQSTQELFIPNITVNNSGSYTCQ 300
. . . . .
142 .................................................. 142

301 AHNSDTGLNRTTVTTITVYAEPPKPFITSNNSNPVEDEDAVALTCEPEIQ 350
. . . . .
142 .................................................. 142

351 NTTYLWWVNNQSLPVSPRLQLSNDNRTLTLLSVTRNDVGPYECGIQNELS 400
. . . . .
142 .................................................. 142

401 VDHSDPVILNVLYGPDDPTISPSYTYYRPGVNLSLSCHAASNPPAQYSWL 450
. . . . .
143 ................................................EL 144
||
451 IDGNIQQHTQELFISNITEKNSGLYTCQANNSASGHSRTTVKTITVSAEL 500
. . . . .
145 PKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLS 194
||||||||||||||||||||||||||||||||||||||||||||||||||
501 PKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLS 550
. . . . .
195 NGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISP 244
||||||||||||||||||||||||||||||||||||||||||||||||||
551 NGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISP 600
. . . . .
245 PDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNN 294
||||||||||||||||||||||||||||||||||||||||||||||||||
601 PDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNN 650
. . . . .
295 GTYACFVSNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVA 344
||||||||||||||||||||||||||||||||||||||||||||||||||
651 GTYACFVSNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVA 700

345 LI 346
||
701 LI 702




Mutated protein alignment against previously known proteins:
Sequence name: CEA5_HUMAN

Sequence documentation:

Alignment of: HUMCEA_PEA_1_P4 x CEA5_HUMAN ..

Alignment segment 1/1:

Quality: 2320.00 Escore: 0
Matching length: 234 Total length: 234
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
||||||||||||||||||||||||||||||||||||||||
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
....
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
||||||||||||||||||||||||||||||||||||||||
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
....
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
||||||||||||||||||||||||||||||||||||||||
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
....
151 SNNSPVPEDKDAVAFTCEPETQDATYLWWVNNQSLPSPRSLLSGNGNRTL 200
||||||||||||||||||||||||||||||||||||||||
151 SNNSPVPEDKDAVAFTCEPETQDATYLWWVNNQSLPSPRSLLSGNGNRTL 200
....
201 TLFNFTRNDTASYKCETQ NPVSARRSDSVILNVL 234
|||||||||||||||||||||||||||||||
201 TLFNFTRNDTASYKCETQ NPVSARRSDSVILNVL 234






Sequence name: CEA5_HUMAN

Sequence documentation:

Alignment of: HUMCEA_PEA_1_P5 x CEA5_HUMAN ..

Alignment segment 1/1:

Quality: 6692.00 Escore: 0
Matching length: 675 Total length: 675
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
||||||||||||||||||||||||||||||||||||||||
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
....
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
||||||||||||||||||||||||||||||||||||||||
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
....
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
||||||||||||||||||||||||||||||||||||||||
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
....
151 SNNSPVPEDKDAVAFTCEPETQDATYLWWVNNQSLPSPRSLLSGNGNRTL 200
||||||||||||||||||||||||||||||||||||||||
151 SNNSPVPEDKDAVAFTCEPETQDATYLWWVNNQSLPSPRSLLSGNGNRTL 200
....
201 TLFNFTRNDTASYKCETQ NPVSARRSDSVILNVLYGPDAPTISPLNTSYR 250
||||||||||||||||||||||||||||||||||||||||
201 TLFNFTRNDTASYKCETQ NPVSARRSDSVILNVLYGPDAPTISPLNTSYR 250
....
251 SGENLNLSCHAASNPPAQ YSWF VNGTFQQSTQELFIPNITVNNSGSYTCQ 300
||||||||||||||||||||||||||||||||||||||||
251 SGENLNLSCHAASNPPAQ YSWF VNGTFQQSTQELFIPNITVNNSGSYTCQ 300
....
301 AHNSDTGLNRTTVTTTVYAEPPKPFITSNNSNPVEDEDAVALTCEPEIQ 350
||||||||||||||||||||||||||||||||||||||||
301 AHNSDTGLNRTTVTTTVYAEPPKPFITSNNSNPVEDEDAVALTCEPEIQ 350
....
351 NTTYLWWVNNQSLPVSPRLQLSNLDRTLLSVTRNDVGPYECGIQNELS 400
||||||||||||||||||||||||||||||||||||||||
351 NTTYLWWVNNQSLPVSPRLQLSNLDRTLLSVTRNDVGPYECGIQNELS 400
....
401 VDHSDPVILNVLYGPDDPTISPSYTYYRPGNLSLSCHAASNPPAQYSWL 450
||||||||||||||||||||||||||||||||||||||||
401 VDHSDPVILNVLYGPDDPTISPSYTYYRPGNLSLSCHAASNPPAQYSWL 450
....
451 IDGNIQQHTQELFISNITEKNSGLYTCQANNSASGHSRTTVKTITVSAEL 500
||||||||||||||||||||||||||||||||||||||||
451 IDGNIQQHTQELFISNITEKNSGLYTCQANNSASGHSRTTVKTITVSAEL 500
....
501 PKPSISSNNSKPVEDKDAFAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLS 550
||||||||||||||||||||||||||||||||||||||||
501 PKPSISSNNSKPVEDKDAFAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLS 550
....
551 NGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISP 600
||||||||||||||||||||||||||||||||||||||||
551 NGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISP 600
....
601 PDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNN 650
||||||||||||||||||||||||||||||||||||||||
601 PDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNN 650
.
651 GTYACFVSNLATGRNNSIVKSITVS 675
||||||||||||||||||||||||
651 GTYACFVSNLATGRNNSIVKSITVS 675






Sequence name: CEA5_HUMAN

Sequence documentation:

Alignment of: HUMCEA_PEA_1_P19 x CEA5_HUMAN ..

Alignment segment 1/1:

Quality: 3298.00 Escore: 0
Matching length: 346 Total length: 702
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 49.29 Total Percent Identity: 49.29
Gaps: 1

Alignment:
....
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
||||||||||||||||||||||||||||||||||||||||
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
....
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
||||||||||||||||||||||||||||||||||||||||
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
....
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
||||||||||||||||||||||||||||||||||||||||
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
....
151 SNNSPVPEDKDAVAFTCEPETQDATYLWWVNNQSLPSPRSLLSGNGNRTL 200
||||||||||||||||||||||||||||||||||||||||
151 SNNSPVPEDKDAVAFTCEPETQDATYLWWVNNQSLPSPRSLLSGNGNRTL 200
....
201 TLFNDVRNDTASYKCETQNPVSARRSDSVILN .................. 232
||||||||||||||||||||||||||||||
201 TLFNFTRNDTASYKCETQ NPVSARRSDSVILNVLYGPDAPTISPLNTSYR 250
....
232 ...................................................... . 232

251 SGENLNLSCHAASNPPAQ YSWF VNGTFQQSTQELFIPNITVNNSGSYTCQ 300
....
232 ...................................................... . 232

301 AHNSDTGLNRTTVTTTVYAEPPKPFITSNNSNPVEDEDAVALTCEPEIQ 350
....
232 ...................................................... . 232

351 NTTYLWWVNNQSLPVSPRLQLSNLDRTLLSVTRNDVGPYECGIQNELS 400
....
232 ...................................................... . 232

401 VDHSDPVILNVLYGPDDPTISPSYTYYRPGNLSLSCHAASNPPAQYSWL 450
....
232 ...................................................... . 232

451 IDGNIQQHTQELFISNITEKNSGLYTCQANNSASGHSRTTVKTITVSAEL 500
....
232 ...................................................... . 232

501 PKPSISSNNSKPVEDKDAFAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLS 550
....
233 ......................................... VLYGPDTPIISP 244
||||||||||||
551 NGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISP 600
....
245 PDSSYLSGANLNLSCHSASNSPSPQYSWRINGIPQQHTQVLFIAKITPNN 294
||||||||||||||||||||||||||||||||||||||||
601 PDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNN 650
....
295 GTYACFVSRNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVA 344
||||||||||||||||||||||||||||||||||||||||
651 GTYACFVSRNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVA 700

345 LI 346
||
701 LI 702






Sequence name: CEA5_HUMAN

Sequence documentation:

Alignment of: HUMCEA_PEA_1_P20 x CEA5_HUMAN ..

Alignment segment 1/1:

Quality: 3294.00 Escore: 0
Matching length: 346 Total length: 702
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 49.29 Total Percent Identity: 49.29
Gaps: 1

Alignment:
....
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
||||||||||||||||||||||||||||||||||||||||
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
....
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
||||||||||||||||||||||||||||||||||||||||
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
....
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYP ..... 142
|||||||||||||||||||||||||||||||||||||
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
....
142 ...................................................... . 142

151 SNNSPVPEDKDAVAFTCEPETQDATYLWWVNNQSLPSPRSLLSGNGNRTL 200
....
142 ...................................................... . 142

201 TLFNFTRNDTASYKCETQ NPVSARRSDSVILNVLYGPDAPTISPLNTSYR 250
....
142 ...................................................... . 142

251 SGENLNLSCHAASNPPAQ YSWF VNGTFQQSTQELFIPNITVNNSGSYTCQ 300
....
142 ...................................................... . 142

301 AHNSDTGLNRTTVTTTVYAEPPKPFITSNNSNPVEDEDAVALTCEPEIQ 350
....
142 ...................................................... . 142

351 NTTYLWWVNNQSLPVSPRLQLSNLDRTLLSVTRNDVGPYECGIQNELS 400
....
142 ...................................................... . 142

401 VDHSDPVILNVLYGPDDPTISPSYTYYRPGNLSLSCHAASNPPAQYSWL 450
....
143 ................................................... EL 144
||
451 IDGNIQQHTQELFISNITEKNSGLYTCQANNSASGHSRTTVKTITVSAEL 500
....
145 PKPSISSNNSKPVEDKDAFAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLS 194
||||||||||||||||||||||||||||||||||||||||
501 PKPSISSNNSKPVEDKDAFAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLS 550
....
195 NGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISP 244
||||||||||||||||||||||||||||||||||||||||
551 NGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISP 600
....
245 PDSSYLSGANLNLSCHSASNSPSPQYSWRINGIPQQHTQVLFIAKITPNN 294
||||||||||||||||||||||||||||||||||||||||
601 PDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNN 650
....
295 GTYACFVSRNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVA 344
||||||||||||||||||||||||||||||||||||||||
651 GTYACFVSRNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVA 700

345 LI 346
||
701 LI 702



クラスターR35137の説明
クラスターR35137は、目的の6つの転写物および20個のセグメントを特徴とし、その名称を、それぞれ表999および1000に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表1001に示す。
Description of Cluster R35137 Cluster R35137 features 6 transcripts of interest and 20 segments, the names of which are shown in Tables 999 and 1000, respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 1001.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるアラニンアミノトランスフェラーゼ(SwissProtアクセッション識別子ALAT_HUMAN、同義語EC2.6.1.2、グルタミン酸−−ピルビン酸トランスアミナーゼ、GPT、グルタミン酸−−アラニントランスアミナーゼとしても公知である)(配列番号1452)の変異型である。   These sequences are known proteins alanine aminotransferase (SwissProt accession identifier ALAT_HUMAN, synonym EC 2.6.1.2, glutamate-pyruvate transaminase, GPT, previously known herein as a protein) , A variant of glutamic acid-alanine transaminase (SEQ ID NO: 1452).

タンパク質アラニンアミノトランスフェラーゼは、以下の機能を有することが公知であるか、そのように見なされている:細胞窒素代謝および骨格筋から輸送された前駆体から開始される肝臓糖新生にも関与する。タンパク質アラニンアミノトランスフェラーゼの配列を、「アラニンアミノトランスフェラーゼアミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表1002に示す。   The protein alanine aminotransferase is known or considered to have the following functions: It is also involved in cellular nitrogen metabolism and hepatic gluconeogenesis initiated from precursors transported from skeletal muscle. The sequence of the protein alanine aminotransferase is shown at the end of the application as "alanine aminotransferase amino acid sequence". Known polymorphisms of this sequence are shown in Table 1002.

Figure 2008507261
Figure 2008507261

タンパク質アラニンアミノトランスフェラーゼの局在化は、原形質と考えられる。   Localization of the protein alanine aminotransferase is considered to be a protoplast.

クラスターR35137を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図34のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   Cluster R35137 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The term “number” in the right column of the table and the number on the y-axis of FIG. 34 refer to the weighted expression of ESTs in each category as “ppm” (the ppm of ESTs of a particular cluster in this category by ppm Ratio of expression to expression of all ESTs).

概して、図34および表1003中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):肝細胞癌。   As shown generally for the histograms in FIG. 34 and Table 1003, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: hepatocellular carcinoma.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、クラスターR35137は、上の表1に列挙した6つの転写物を特徴とする。これらの転写物は、タンパク質アラニンアミノトランスフェラーゼの変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster R35137 is characterized by the six transcripts listed in Table 1 above. These transcripts encode proteins which are variants of the protein alanine aminotransferase. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P9は、出願書類の最後に示すアミノ酸配列を有し、転写物R35137_PEA_1_PEA_1_PEA_1_T10によってコードされる。公知のタンパク質(アラニンアミノトランスフェラーゼ)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein R35137_PEA_1_PEA_1_PEA_1_P9 according to the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript R35137_PEA_1_PEA_1_PEA_1_T10. An alignment to a known protein (alanine aminotransferase) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

R35137_PEA_1_PEA_1_PEA_1_P9とALAT_HUMAN_V1(配列番号1453)との間の比較の報告
1.ALAT_HUMAN_V1のアミノ酸1〜274に対応し、R35137_PEA_1_PEA_1_PEA_1_P9のアミノ酸1〜274にも対応するMASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQTRECIEAVIRFAFEERLFLLADEVと少なくとも90%相同な第1のアミノ酸配列と、R35137_PEA_1_PEA_1_PEA_1_P9のアミノ酸275〜385に対応する配列RGAGEREAGQQSAPVTPCALPGVPGQRVRRGFAVPLIQEGAHGDGAALRRAAGACLLPLHLQGLHGRVRAYEAGGGSRAMARPSSPDGPPPPPHLTWPCAGAGSAAAMWRWを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R35137_PEA_1_PEA_1_PEA_1_P9をコードする単離キメラポリペプチド。
Report of the comparison between R35137_PEA_1_PEA_1_PEA_1_P9 and ALAT_HUMAN_V1 (SEQ ID NO: 1453) Corresponding to amino acids 1 to 274 of ALAT_HUMAN_V1, corresponding to amino acids 1 to 274 of R35137_PEA_1_PEA_1_PEA_1_P9 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQTRECIEAVIRFA A first amino acid sequence that is at least 90% homologous to EERLFLLADEV and a sequence corresponding to amino acids 275-385 of R35137_PEA_1_PEA_1_PEA_1_P9. R35 comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first amino acid sequence and said second amino acid sequence being adjacent and in sequential order, R35 Isolated chimeric polypeptide encoding 37_PEA_1_PEA_1_PEA_1_P9.

2.R35137_PEA_1_PEA_1_PEA_1_P9中の配列RGAGEREAGQQSAPVTPCALPGVPGQRVRRGFAVPLIQEGAHGDGAALRRAAGACLLPLHLQGLHGRVRAYEAGGGSRAMARPSSPDGPPPPPHLTWPCAGAGSAAAMWRWと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R35137_PEA_1_PEA_1_PEA_1_P9のテールをコードする単離ポリペプチド。   2. In the library of at least 70%, at least about 70%, at least about 70%, at least about 70%. An isolated polypeptide encoding a tail.

公知のタンパク質配列(ALAT_HUMAN)は、出願書類の最後に示す配列より1つまたは複数の変化があり、このアミノ酸配列をALAT_HUMAN_V1と命名することに留意すべきである。これらの変化が起こることは以前に公知であり、以下の表に列挙した。   It should be noted that the known protein sequence (ALAT_HUMAN) has one or more changes from the sequence shown at the end of the application and this amino acid sequence is designated as ALAT_HUMAN_V1. The occurrence of these changes was previously known and listed in the following table.

Figure 2008507261
Figure 2008507261

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: Intracellular. Protein localization is considered to be intracellular as no transmembrane domain estimation program will deduce that this protein is a transmembrane domain. Furthermore, both signal peptide deducing programs deduce that this protein is a non-secretory protein.

変異タンパク質、R35137_PEA_1_PEA_1_PEA_1_P9は、以下の転写物によってコードされる:、R35137_PEA_1_PEA_1_PEA_1_T10(配列は出願書類の最後に示す)。転写物R35137_PEA_1_PEA_1_PEA_1_T10のコード部分を太字で示し、このコード部分は271位から開始され、1425位で終結する。転写物はまた、表1006に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質、R35137_PEA_1_PEA_1_PEA_1_P9配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R35137_PEA_1_PEA_1_PEA_1_P9 is encoded by the following transcript: R35137_PEA_1_PEA_1_PEA_1_T10 (sequences shown at the end of the application). The code portion of the transcript R35137_PEA_1_PEA_1_PEA_1_T10 is shown in bold, starting from position 271 and ending at position 1425. The transcript also has the following SNPs listed in Table 1006 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, a mutein, The presence of known SNPs in the R35137_PEA_1_PEA_1_PEA_1_P9 sequence supports the predicted sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P8は、出願書類の最後に示すアミノ酸配列を有し、転写物R35137_PEA_1_PEA_1_PEA_1_T11によってコードされる。公知のタンパク質(アラニンアミノトランスフェラーゼ)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein R35137_PEA_1_PEA_1_PEA_1_P8 according to the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript R35137_PEA_1_PEA_1_PEA_1_T11. An alignment to a known protein (alanine aminotransferase) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

R35137_PEA_1_PEA_1_PEA_1_P8とALAT_HUMAN_V1との間の比較の報告
1.ALAT_HUMAN_V1のアミノ酸1〜320に対応し、R35137_PEA_1_PEA_1_PEA_1_P8のアミノ酸1〜320にも対応するMASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQTRECIEAVIRFAFEERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPYAGQQELASFHSTSKGYMGECと少なくとも90%相同な第1のアミノ酸配列と、R35137_PEA_1_PEA_1_PEA_1_P8のアミノ酸321〜346に対応する配列VRTRRVGARGPWPGPPRPMGHPLLRTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R35137_PEA_1_PEA_1_PEA_1_P8をコードする単離キメラポリペプチド。
Report of comparison between R35137_PEA_1_PEA_1_PEA_1_P8 and ALAT_HUMAN_V1. Corresponding to amino acids 1 to 320 of ALAT_HUMAN_V1, corresponding to amino acids 1 to 320 of R35137_PEA_1_PEA_1_PEA_1_P8 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQTRECIEAVIRFA EERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPYAGQQELASFHSTSKGYMGEC A polypeptide with the first amino acid sequence that is at least 90% homologous to RPR 35137_PEA_1_PEA_1_PEA_1_P8 and the sequence VRTRRVGARGPWPGPPRPMGHPLLRT corresponding to amino acids 321-346 and at least 80% to 70% Comprises R35137_PEA_1_PEA_1_PEA_1_P8, which comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first and second amino acid sequences being adjacent and in sequential order Isolated chimera polypep De.

2.R35137_PEA_1_PEA_1_PEA_1_P8中の配列VRTRRVGARGPWPGPPRPMGHPLLRTと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R35137_PEA_1_PEA_1_PEA_1_P8のテールをコードする単離ポリペプチド。   2. R35137_PEA_1_PEA_1_P8 comprising a polypeptide at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence VRTRRVGARGPWPGPPRPMGHPLLRT in An isolated polypeptide encoding a tail.

公知のタンパク質配列(ALAT_HUMAN)は、出願書類の最後に示す配列より1つまたは複数の変化があり、このアミノ酸配列をALAT_HUMAN_V1と命名することに留意すべきである。これらの変化が起こることは以前に公知であり、以下の表に列挙した。   It should be noted that the known protein sequence (ALAT_HUMAN) has one or more changes from the sequence shown at the end of the application and this amino acid sequence is designated as ALAT_HUMAN_V1. The occurrence of these changes was previously known and listed in the following table.

Figure 2008507261
Figure 2008507261

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: Intracellular. Protein localization is considered to be intracellular as no transmembrane domain estimation program will deduce that this protein is a transmembrane domain. Furthermore, both signal peptide deducing programs deduce that this protein is a non-secretory protein.

変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P8はまた、表1008に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R35137_PEA_1_PEA_1_PEA_1_P8 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, enumerating other amino acids, the last column lists the SNPs as shown in Table 1008) It indicates whether it is known and the presence of a known SNP in the mutein R35137_PEA_1_PEA_1_PEA_1_P8 sequence supports the predicted sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質、R35137_PEA_1_PEA_1_PEA_1_P8は、以下の転写物によってコードされる:、R35137_PEA_1_PEA_1_PEA_1_T11(配列は出願書類の最後に示す)。転写物R35137_PEA_1_PEA_1_PEA_1_T11のコード部分を太字で示し、このコード部分は271位から開始され、1308位で終結する。転写物はまた、表1009に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質、R35137_PEA_1_PEA_1_PEA_1_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R35137_PEA_1_PEA_1_PEA_1_P8 is encoded by the following transcript: R35137_PEA_1_PEA_1_PEA_1_T11 (sequences shown at the end of the application). The code portion of the transcript R35137_PEA_1_PEA_1_PEA_1_T11 is shown in bold, starting from position 271 and ending at position 1308. The transcript also has the following SNPs listed in Table 1009 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, a mutein, The presence of known SNPs in the R35137_PEA_1_PEA_1_PEA_1_P8 sequence supports the putative sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P11は、出願書類の最後に示すアミノ酸配列を有し、転写物R35137_PEA_1_PEA_1_PEA_1_T14によってコードされる。公知のタンパク質(アラニンアミノトランスフェラーゼ)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein R35137_PEA_1_PEA_1_PEA_1_P11 of the present invention has the amino acid sequence shown at the end of the application and is encoded by the transcript R35137_PEA_1_PEA_1_PEA_1_T14. An alignment to a known protein (alanine aminotransferase) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

R35137_PEA_1_PEA_1_PEA_1_P11とALAT_HUMAN_V1との間の比較の報告
1.ALAT_HUMAN_V1のアミノ酸1〜229に対応し、R35137_PEA_1_PEA_1_PEA_1_P11のアミノ酸1〜229にも対応するMASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQARと少なくとも90%相同な第1のアミノ酸配列と、ALAT_HUMAN_V1のアミノ酸455〜496に対応し、R35137_PEA_1_PEA_1_PEA_1_P11のアミノ酸230〜271にも対応するSGFGQREGTYHFRMTILPPLEKLRLLLEKLSRFHAKFTLEYSと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R35137_PEA_1_PEA_1_PEA_1_P11をコードする単離キメラポリペプチド。
Report of comparison between R35137_PEA_1_PEA_1_PEA_1_P11 and ALAT_HUMAN_V1. Corresponding to amino acids 1-229 of ALAT_HUMAN_V1, first amino acid sequence at least 90% homologous to the corresponding MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQAR to amino acids 1-229 of R35137_PEA_1_PEA_1_PEA_1_P11, ALAT_HUMA The first amino acid sequence and the second amino acid sequence contain a second amino acid sequence that is at least 90% homologous to SGFGQREGTY HFPLTIKLPLLELLLELSLRFHAKFTLEYS corresponding to amino acids 455 to 496 of V1 and also to amino acids 230 to 271 of R35137 PEA1 _PEA1 _PEA1_P11. An isolated chimeric polypeptide encoding R35137_PEA_1_PEA_1_PEA_1_P11, adjacent and in sequential order.

2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がRSを含み、以下の構造:アミノ酸番号229−x〜229のいずれかから始まり、アミノ酸番号230+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、R35137_PEA_1_PEA_1_PEA_1_P11の縁部分をコードする単離キメラポリペプチド。   2. Length “n” (wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long, most preferably at least about 50 amino acids in length, at least two amino acids comprising RS, starting from any of the following structures: amino acid numbers 229-x to 229, amino acid numbers 230 + ((n-2) -x) (formula An isolated chimeric polypeptide encoding a rim portion of R35137_PEA_1_PEA_1_PEA_1_P11, comprising a polypeptide having a sequence terminating in: x) varying from 0 to n-2).

公知のタンパク質配列(ALAT_HUMAN)は、出願書類の最後に示す配列より1つまたは複数の変化があり、このアミノ酸配列をALAT_HUMAN_V1と命名することに留意すべきである。これらの変化が起こることは以前に公知であり、以下の表に列挙した。   It should be noted that the known protein sequence (ALAT_HUMAN) has one or more changes from the sequence shown at the end of the application and this amino acid sequence is designated as ALAT_HUMAN_V1. The occurrence of these changes was previously known and listed in the following table.

Figure 2008507261
Figure 2008507261

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: Intracellular. Protein localization is considered to be intracellular as no transmembrane domain estimation program will deduce that this protein is a transmembrane domain. Furthermore, both signal peptide deducing programs deduce that this protein is a non-secretory protein.

変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P11はまた、表1011に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P11配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R35137_PEA_1_PEA_1_PEA_1_P11 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, the last column lists the SNPs as shown in Table 1011) It indicates whether it is known and the presence of a known SNP in the mutein R35137_PEA_1_PEA_1_PEA_1_P11 sequence supports the predicted sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質、R35137_PEA_1_PEA_1_PEA_1_P11は、以下の転写物によってコードされる:、R35137_PEA_1_PEA_1_PEA_1_T14(配列は出願書類の最後に示す)。転写物R35137_PEA_1_PEA_1_PEA_1_T14のコード部分を太字で示し、このコード部分は271位から開始され、1083位で終結する。転写物はまた、表1012に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質、R35137_PEA_1_PEA_1_PEA_1_P11配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R35137_PEA_1_PEA_1_PEA_1_P11 is encoded by the following transcript: R35137_PEA_1_PEA_1_PEA_1_T14 (sequences shown at the end of the application). The code portion of the transcript R35137_PEA_1_PEA_1_PEA_1_T14 is shown in bold, starting from position 271 and ending at position 1083. The transcript also has the following SNPs listed in Table 1012 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, a mutein, The presence of known SNPs in the R35137_PEA_1_PEA_1_PEA_1_P11 sequence supports the predicted sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P2は、出願書類の最後に示すアミノ酸配列を有し、転写物R35137_PEA_1_PEA_1_PEA_1_T3によってコードされる。公知のタンパク質(アラニンアミノトランスフェラーゼ)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein R35137_PEA_1_PEA_1_PEA_1_P2 according to the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript R35137_PEA_1_PEA_1_PEA_1_T3. An alignment to a known protein (alanine aminotransferase) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

R35137_PEA_1_PEA_1_PEA_1_P2とALAT_HUMAN_V1との間の比較の報告
1.ALAT_HUMAN_V1のアミノ酸1〜274に対応し、R35137_PEA_1_PEA_1_PEA_1_P2のアミノ酸1〜274にも対応するMASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQTRECIEAVIRFAFEERLFLLADEVと少なくとも90%相同な第1のアミノ酸配列と、R35137_PEA_1_PEA_1_PEA_1_P2のアミノ酸275〜399に対応する配列RGAGEREAGQQSAPVTPCALPGVPGQRVRRGFAVPLIQEGAHGDGAALRRAAGACLLPLHLQGLHGRVRVPRRLCGGGEHGRCSAAADAEADECAAVPAGARTGPAGPGGQPARAHRPLLCAVPGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R35137_PEA_1_PEA_1_PEA_1_P2をコードする単離キメラポリペプチド。
Report of comparison between R35137_PEA_1_PEA_1_PEA_1_P2 and ALAT_HUMAN_V1. Corresponding to amino acids 1 to 274 of ALAT_HUMAN_V1, corresponding to amino acids 1 to 274 of R35137_PEA_1_PEA_1_PEA_1_P2 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQTRECIEAVIRFA A sequence of RGAGEREAGQQSAPVTPCALPGVPGQRVRRGFAPLGALGRAGL LQLGHGRVPRRLCGGEGHHIGAC I, a sequence corresponding to amino acids 275-399 of R35137_PEA_1_PEA_1_PEA_1_P2 that is at least 90% homologous to EERL FLLA DEV. Comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first amino acid sequence and the second amino acid sequence being contiguous and In consecutive order, isolated chimeric polypeptide coding R35137_PEA_1_PEA_1_PEA_1_P2.

2.R35137_PEA_1_PEA_1_PEA_1_P2中の配列RGAGEREAGQQSAPVTPCALPGVPGQRVRRGFAVPLIQEGAHGDGAALRRAAGACLLPLHLQGLHGRVRVPRRLCGGGEHGRCSAAADAEADECAAVPAGARTGPAGPGGQPARAHRPLLCAVPGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R35137_PEA_1_PEA_1_PEA_1_P2のテールをコードする単離ポリペプチド。   2. In the group of the ssssssssssed in the ssssssssssssseness at the end of the sss. An isolated polypeptide encoding a tail.

公知のタンパク質配列(ALAT_HUMAN)は、出願書類の最後に示す配列より1つまたは複数の変化があり、このアミノ酸配列をALAT_HUMAN_V1と命名することに留意すべきである。これらの変化が起こることは以前に公知であり、以下の表に列挙した。   It should be noted that the known protein sequence (ALAT_HUMAN) has one or more changes from the sequence shown at the end of the application and this amino acid sequence is designated as ALAT_HUMAN_V1. The occurrence of these changes was previously known and listed in the following table.

Figure 2008507261
Figure 2008507261

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: Intracellular. Protein localization is considered to be intracellular as no transmembrane domain estimation program will deduce that this protein is a transmembrane domain. Furthermore, both signal peptide deducing programs deduce that this protein is a non-secretory protein.

変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P2はまた、表1014に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R35137_PEA_1_PEA_1_PEA_1_P2 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, enumerating other amino acids, the last column lists the SNPs as shown in Table 1014) It indicates whether it is known and the presence of a known SNP in the mutein R35137_PEA_1_PEA_1_PEA_1_P2 sequence supports the putative sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質、R35137_PEA_1_PEA_1_PEA_1_P2は、以下の転写物によってコードされる:、R35137_PEA_1_PEA_1_PEA_1_T3(配列は出願書類の最後に示す)。転写物R35137_PEA_1_PEA_1_PEA_1_T3のコード部分を太字で示し、このコード部分は271位から開始され、1467位で終結する。転写物はまた、表1015に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質、R35137_PEA_1_PEA_1_PEA_1_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R35137_PEA_1_PEA_1_PEA_1_P2 is encoded by the following transcript: R35137_PEA_1_PEA_1_PEA_1_T3 (sequences shown at the end of the application). The code portion of the transcript R35137_PEA_1_PEA_1_PEA_1_T3 is shown in bold, starting from position 271 and ending at position 1467. The transcript also has the following SNPs listed in Table 1015 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, a mutein, The presence of known SNPs in the R35137_PEA_1_PEA_1_PEA_1_P2 sequence supports the predicted sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P4は、出願書類の最後に示すアミノ酸配列を有し、転写物R35137_PEA_1_PEA_1_PEA_1_T5によってコードされる。公知のタンパク質(アラニンアミノトランスフェラーゼ)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein R35137_PEA_1_PEA_1_PEA_1_P4 according to the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript R35137_PEA_1_PEA_1_PEA_1_T5. An alignment to a known protein (alanine aminotransferase) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

R35137_PEA_1_PEA_1_PEA_1_P4とALAT_HUMAN_V1との間の比較の報告
1.ALAT_HUMAN_V1のアミノ酸1〜494に対応し、R35137_PEA_1_PEA_1_PEA_1_P4のアミノ酸1〜494にも対応するMASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQTRECIEAVIRFAFEERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPYAGQQELASFHSTSKGYMGECGFRGGYVEVVNMDAAVQQQMLKLMSVRLCPPVPGQALLDLVVSPPAPTDPSFAQFQAEKQAVLAELAAKAKLTEQVFNEAPGISCNPVQGAMYSFPRVQLPPRAVERAQELGLAPDMFFCLRLLEETGICVVPGSGFGQREGTYHFRMTILPPLEKLRLLLEKLSRFHAKFTLEと少なくとも90%相同な第1のアミノ酸配列と、R35137_PEA_1_PEA_1_PEA_1_P4のアミノ酸495〜555に対応する配列SPGRLWSPLYLLLMPGGVGWGGCWAPASLQVPNKAVWQSDSKKEALAAAWPAPTCLPFLQAを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R35137_PEA_1_PEA_1_PEA_1_P4をコードする単離キメラポリペプチド。
Report of comparison between R35137_PEA_1_PEA_1_PEA_1_P4 and ALAT_HUMAN_V1. Corresponding to amino acids 1 to 494 of ALAT_HUMAN_V1, corresponding to amino acids 1 to 494 of R35137_PEA_1_PEA_1_PEA_1_P4 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQTRECIEAVIRFA The first amino acid sequence at least 90% homologous to IiarueruefueruerueidiibuiwaikyudienubuiwaieieijiesukyuefueichiesuefukeikeibuieruemuiemuJipiPiwaieijikyukyuierueiesuefueichiesutiesukeijiwaiemujiishijiefuarujijiwaibuiibuibuienuemudieieibuikyukyukyuemuerukeieruemuesubuiaruerushiPiPibuiPijikyueieruerudierubuibuiesupipiEipitidiPiesuefueikyuefukyueiikeikyueibuierueiierueieikeieikeierutiikyubuiefuenuieiPijiaiesushienuPibuikyujieiemuwaiesuefuPiarubuikyueruPiPiarueibuiiarueikyuierujierueiPidiemuefuefushieruaruerueruiitijiaishibuibuiPijiesujiefujikyuaruijitiwaieichiefuaruemutiILPPLEKLRLLLEKLSRFHAKFTLE, sequence SPGRLWSPLYLLLMPGGVGWGGCWAPASLQVP corresponding to amino acids 495-555 of R35137_PEA_1_PEA_1_PEA_1_P4 A polypeptide having KAVWQSDSKKEALAAAWPAPTCLPFQA and a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; An isolated chimeric polypeptide encoding R35137_PEA_1_PEA_1_PEA_1_P4, wherein the amino acid sequence of 1 and the second amino acid sequence are adjacent and in sequential order.

2.R35137_PEA_1_PEA_1_PEA_1_P4中の配列SPGRLWSPLYLLLMPGGVGWGGCWAPASLQVPNKAVWQSDSKKEALAAAWPAPTCLPFLQAと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R35137_PEA_1_PEA_1_PEA_1_P4のテールをコードする単離ポリペプチド。   2. A sequence of at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95%, preferably at least about 95%, An isolated polypeptide encoding a tail.

公知のタンパク質配列(ALAT_HUMAN)は、出願書類の最後に示す配列より1つまたは複数の変化があり、このアミノ酸配列をALAT_HUMAN_V1と命名することに留意すべきである。これらの変化が起こることは以前に公知であり、以下の表に列挙した。   It should be noted that the known protein sequence (ALAT_HUMAN) has one or more changes from the sequence shown at the end of the application and this amino acid sequence is designated as ALAT_HUMAN_V1. The occurrence of these changes was previously known and listed in the following table.

Figure 2008507261
Figure 2008507261

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: Intracellular. Protein localization is considered to be intracellular as no transmembrane domain estimation program will deduce that this protein is a transmembrane domain. Furthermore, both signal peptide deducing programs deduce that this protein is a non-secretory protein.

変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P4はまた、表1017に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R35137_PEA_1_PEA_1_PEA_1_P4 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing the other amino acids, and listing the other amino acids, as shown in Table 1017; It indicates whether it is known and the presence of a known SNP in the mutein R35137_PEA_1_PEA_1_PEA_1_P4 sequence supports the putative sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質、R35137_PEA_1_PEA_1_PEA_1_P4は、以下の転写物によってコードされる:、R35137_PEA_1_PEA_1_PEA_1_T5(配列は出願書類の最後に示す)。転写物R35137_PEA_1_PEA_1_PEA_1_T5のコード部分を太字で示し、このコード部分は271位から開始され、1935位で終結する。転写物はまた、表1018に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質、R35137_PEA_1_PEA_1_PEA_1_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R35137_PEA_1_PEA_1_PEA_1_P4 is encoded by the following transcript: R35137_PEA_1_PEA_1_PEA_1_T5 (sequences shown at the end of the application). The code portion of the transcript R35137_PEA_1_PEA_1_PEA_1_T5 is shown in bold, starting from position 271 and ending at position 1935. The transcript also has the following SNPs listed in Table 1018 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, a mutein, The presence of known SNPs in the R35137_PEA_1_PEA_1_PEA_1_P4 sequence supports the predicted sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターR35137は、上の表2に列挙した20個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster R35137 is characterized by the 20 segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_2は、19個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、R35137_PEA_1_PEA_1_PEA_1_T12、およびR35137_PEA_1_PEA_1_PEA_1_T14。以下の表1019は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R35137_PEA_1_PEA_1_PEA_1_node_2 of the present invention is supported by 19 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R35137_PEA_1_PEA_1_PEA_1_T3, R35137_PEA_1_PEA_1_PEA_1_T5, R35137_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_T11, R3514_14_14_14_14_14_14_14_14_14 Table 1019 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_3は、24個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、R35137_PEA_1_PEA_1_PEA_1_T12、およびR35137_PEA_1_PEA_1_PEA_1_T14。以下の表1020は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R35137_PEA_1_PEA_1_PEA_1_node_3 of the present invention is supported by 24 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R35137_PEA_1_PEA_1_PEA_1_T3, R35137_PEA_1_PEA_1_PEA_1_T5, R35137_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_T11, R3514_14_14_14_14_14_14_14_14_14 Table 1020 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_9は、25個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、R35137_PEA_1_PEA_1_PEA_1_T12、およびR35137_PEA_1_PEA_1_PEA_1_T14。以下の表1021は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R35137_PEA_1_PEA_1_PEA_1_node_9 of the present invention is supported by 25 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R35137_PEA_1_PEA_1_PEA_1_T3, R35137_PEA_1_PEA_1_PEA_1_T5, R35137_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_T11, R3514_14_14_14_14_14_14_14_14_14 Table 1021 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_11は、30個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、R35137_PEA_1_PEA_1_PEA_1_T12、およびR35137_PEA_1_PEA_1_PEA_1_T14。以下の表1022は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R35137_PEA_1_PEA_1_PEA_1_node_11 of the present invention is supported by 30 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R35137_PEA_1_PEA_1_PEA_1_T3, R35137_PEA_1_PEA_1_PEA_1_T5, R35137_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_T11, R3514_14_14_14_14_14_14_14_14_14 Table 1022 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_16は、23個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、およびR35137_PEA_1_PEA_1_PEA_1_T12。以下の表1023は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R35137_PEA_1_PEA_1_PEA_1_node_16 of the present invention is supported by 23 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R35137_PEA_1_PEA_1_PEA_1_T3, R35137_PEA_1_PEA_1_PEA_1_T5, R35137_PEA_1_PEA_1_PEA_1_T10, R35137_PEA_1_PEA_1_PEA_1_PEA_1_T11, _1_14PE_14E Table 1023 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_18は、24個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、およびR35137_PEA_1_PEA_1_PEA_1_T12。以下の表1024は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R35137_PEA_1_PEA_1_PEA_1_node_18 of the present invention is supported by 24 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R35137_PEA_1_PEA_1_PEA_1_T3, R35137_PEA_1_PEA_1_PEA_1_T5, R35137_PEA_1_PEA_1_PEA_1_T10, R35137_PEA_1_PEA_1_PEA_1_PEA_1_T11, _1_14PE_14E Table 1024 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表1025に示す)。   Microarray (chip) data for this segment is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (for lung cancer) (shown in Table 1025).

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_20は、29個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、およびR35137_PEA_1_PEA_1_PEA_1_T12。以下の表1026は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R35137_PEA_1_PEA_1_PEA_1_node_20 of the present invention is supported by 29 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R35137_PEA_1_PEA_1_PEA_1_T3, R35137_PEA_1_PEA_1_PEA_1_T5, R35137_PEA_1_PEA_1_PEA_1_T10, R35137_PEA_1_PEA_1_PEA_1_PEA_1_T11, _1_14PE_14E Table 1026 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_27は、39個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、R35137_PEA_1_PEA_1_PEA_1_T12、およびR35137_PEA_1_PEA_1_PEA_1_T14。以下の表1027は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R35137_PEA_1_PEA_1_PEA_1_node_27 of the present invention is supported by 39 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R35137_PEA_1_PEA_1_PEA_1_T3, R35137_PEA_1_PEA_1_PEA_1_T5, R35137_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_T11, R3514_14_14_14_14_14_14_14_14_14 Table 1027 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_5は、20個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、R35137_PEA_1_PEA_1_PEA_1_T12、およびR35137_PEA_1_PEA_1_PEA_1_T14。以下の表1028は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R35137_PEA_1_PEA_1_PEA_1_node_5 of the present invention is supported by 20 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R35137_PEA_1_PEA_1_PEA_1_T3, R35137_PEA_1_PEA_1_PEA_1_T5, R35137_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_T11, R3514_14_14_14_14_14_14_14_14_14 Table 1028 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_7は、23個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、R35137_PEA_1_PEA_1_PEA_1_T12、およびR35137_PEA_1_PEA_1_PEA_1_T14。以下の表1029は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R35137_PEA_1_PEA_1_PEA_1_node_7 of the present invention is supported by 23 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R35137_PEA_1_PEA_1_PEA_1_T3, R35137_PEA_1_PEA_1_PEA_1_T5, R35137_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_T11, R3514_14_14_14_14_14_14_14_14_14 Table 1029 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_12は、22個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、およびR35137_PEA_1_PEA_1_PEA_1_T12。以下の表1030は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R35137_PEA_1_PEA_1_PEA_1_node_12 of the present invention is supported by 22 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R35137_PEA_1_PEA_1_PEA_1_T3, R35137_PEA_1_PEA_1_PEA_1_T5, R35137_PEA_1_PEA_1_PEA_1_T10, R35137_PEA_1_PEA_1_PEA_1_PEA_1_T11, _1_14PE_14E Table 1030 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_14は、23個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、およびR35137_PEA_1_PEA_1_PEA_1_T12。以下の表1031は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R35137_PEA_1_PEA_1_PEA_1_node_14 of the present invention is supported by 23 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R35137_PEA_1_PEA_1_PEA_1_T3, R35137_PEA_1_PEA_1_PEA_1_T5, R35137_PEA_1_PEA_1_PEA_1_T10, R35137_PEA_1_PEA_1_PEA_1_PEA_1_T11, _1_14PE_14E Table 1031 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_15は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T10、およびR35137_PEA_1_PEA_1_PEA_1_T12。以下の表1032は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R35137_PEA_1_PEA_1_PEA_1_node_15 of the present invention is supported by six libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R35137_PEA_1_PEA_1_PEA_1_T3, R35137_PEA_1_PEA_1_PEA_1_T10, and R35137_PEA_1_PEA_1_PEA_1_T12. Table 1032 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_17は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、およびR35137_PEA_1_PEA_1_PEA_1_T12。以下の表1033は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R35137_PEA_1_PEA_1_PEA_1_node_17 of the present invention is supported by 5 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R35137_PEA_1_PEA_1_PEA_1_T10, R35137_PEA_1_PEA_1_PEA_1_T11, and R35137_PEA_1_PEA_1_PEA_1_T12. Table 1033 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_21は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T11およびR35137_PEA_1_PEA_1_PEA_1_T12。以下の表1034は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R35137_PEA_1_PEA_1_PEA_1_node_21 of the present invention is supported by six libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R35137_PEA_1_PEA_1_PEA_1_T11 and R35137_PEA_1_PEA_1_PEA_1_T12. Table 1034 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_22は、31個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、およびR35137_PEA_1_PEA_1_PEA_1_T12。以下の表1035は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R35137_PEA_1_PEA_1_PEA_1_node_22 of the present invention is supported by 31 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R35137_PEA_1_PEA_1_PEA_1_T3, R35137_PEA_1_PEA_1_PEA_1_T5, R35137_PEA_1_PEA_1_PEA_1_T10, R35137_PEA_1_PEA_1_PEA_1_PEA_1_T11, _1_14PE_14E Table 1035 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_23は、29個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、R35137_PEA_1_PEA_1_PEA_1_T12、およびR35137_PEA_1_PEA_1_PEA_1_T14。以下の表1036は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R35137_PEA_1_PEA_1_PEA_1_node_23 of the present invention is supported by 29 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R35137_PEA_1_PEA_1_PEA_1_T3, R35137_PEA_1_PEA_1_PEA_1_T5, R35137_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_T11, R3514_14_14_14_14_14_14_14_14_14 Table 1036 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_24は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T11およびR35137_PEA_1_PEA_1_PEA_1_T12。以下の表1037は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R35137_PEA_1_PEA_1_PEA_1_node_24 of the present invention is supported by 5 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R35137_PEA_1_PEA_1_PEA_1_T11 and R35137_PEA_1_PEA_1_PEA_1_T12. Table 1037 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_25は、30個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、R35137_PEA_1_PEA_1_PEA_1_T12、およびR35137_PEA_1_PEA_1_PEA_1_T14。以下の表1038は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R35137_PEA_1_PEA_1_PEA_1_node_25 of the present invention is supported by 30 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R35137_PEA_1_PEA_1_PEA_1_T3, R35137_PEA_1_PEA_1_PEA_1_T5, R35137_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_PEA_1_T11, R3514_14_14_14_14_14_14_14_14_14 Table 1038 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_26は、29個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、R35137_PEA_1_PEA_1_PEA_1_T12、およびR35137_PEA_1_PEA_1_PEA_1_T14。以下の表1039は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R35137_PEA_1_PEA_1_PEA_1_node_26 of the present invention is supported by 29 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R35137_PEA_1_PEA_1_PEA_1_T3, R35137_PEA_1_PEA_1_PEA_1_T10, R35137_PEA_1_PEA_1_PEA_1_T11, R35137_PEA_1_PEA_1_PEA_1_PEA_1_T12, R_35_14_E_14. Table 1039 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:

Sequence name: ALAT_HUMAN_V1



Sequence documentation:



Alignment of: R35137_PEA_1_PEA_1_PEA_1_P9 x ALAT_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 2619.00 Escore: 0

Matching length: 274 Total length: 274

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

. . . . .

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

. . . . .

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

||||||||||||||||||||||||||||||||||||||||||||||||||

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

. . . . .

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

||||||||||||||||||||||||||||||||||||||||||||||||||

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

. . . . .

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

||||||||||||||||||||||||||||||||||||||||||||||||||

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

. . . . .

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

||||||||||||||||||||||||||||||||||||||||||||||||||

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

. .

251 TRECIEAVIRFAFEERLFLLADEV 274

||||||||||||||||||||||||

251 TRECIEAVIRFAFEERLFLLADEV 274













Sequence name: ALAT_HUMAN_V1



Sequence documentation:



Alignment of: R35137_PEA_1_PEA_1_PEA_1_P8 x ALAT_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 3088.00 Escore: 0

Matching length: 320 Total length: 320

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

. . . . .

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

. . . . .

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

||||||||||||||||||||||||||||||||||||||||||||||||||

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

. . . . .

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

||||||||||||||||||||||||||||||||||||||||||||||||||

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

. . . . .

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

||||||||||||||||||||||||||||||||||||||||||||||||||

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

. . . . .

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

||||||||||||||||||||||||||||||||||||||||||||||||||

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

. . . . .

251 TRECIEAVIRFAFEERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPY 300

||||||||||||||||||||||||||||||||||||||||||||||||||

251 TRECIEAVIRFAFEERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPY 300

. .

301 AGQQELASFHSTSKGYMGEC 320

||||||||||||||||||||

301 AGQQELASFHSTSKGYMGEC 320













Sequence name: ALAT_HUMAN_V1



Sequence documentation:



Alignment of: R35137_PEA_1_PEA_1_PEA_1_P11 x ALAT_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 2487.00 Escore: 0

Matching length: 271 Total length: 496

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 54.64 Total Percent Identity: 54.64

Gaps: 1



Alignment:

. . . . .

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

. . . . .

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

||||||||||||||||||||||||||||||||||||||||||||||||||

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

. . . . .

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

||||||||||||||||||||||||||||||||||||||||||||||||||

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

. . . . .

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

||||||||||||||||||||||||||||||||||||||||||||||||||

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

. . . . .

201 AVQVDYYLDEERAWALDVAELHRALGQAR..................... 229

|||||||||||||||||||||||||||||

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

. . . . .

229 .................................................. 229



251 TRECIEAVIRFAFEERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPY 300

. . . . .

229 .................................................. 229



301 AGQQELASFHSTSKGYMGECGFRGGYVEVVNMDAAVQQQMLKLMSVRLCP 350

. . . . .

229 .................................................. 229



351 PVPGQALLDLVVSPPAPTDPSFAQFQAEKQAVLAELAAKAKLTEQVFNEA 400

. . . . .

229 .................................................. 229



401 PGISCNPVQGAMYSFPRVQLPPRAVERAQELGLAPDMFFCLRLLEETGIC 450

. . . .

230 ....SGFGQREGTYHFRMTILPPLEKLRLLLEKLSRFHAKFTLEYS 271

||||||||||||||||||||||||||||||||||||||||||

451 VVPGSGFGQREGTYHFRMTILPPLEKLRLLLEKLSRFHAKFTLEYS 496













Sequence name: ALAT_HUMAN_V1



Sequence documentation:



Alignment of: R35137_PEA_1_PEA_1_PEA_1_P2 x ALAT_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 2619.00 Escore: 0

Matching length: 274 Total length: 274

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

. . . . .

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

. . . . .

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

||||||||||||||||||||||||||||||||||||||||||||||||||

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

. . . . .

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

||||||||||||||||||||||||||||||||||||||||||||||||||

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

. . . . .

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

||||||||||||||||||||||||||||||||||||||||||||||||||

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

. . . . .

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

||||||||||||||||||||||||||||||||||||||||||||||||||

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

. .

251 TRECIEAVIRFAFEERLFLLADEV 274

||||||||||||||||||||||||

251 TRECIEAVIRFAFEERLFLLADEV 274













Sequence name: ALAT_HUMAN_V1



Sequence documentation:



Alignment of: R35137_PEA_1_PEA_1_PEA_1_P4 x ALAT_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 4785.00 Escore: 0

Matching length: 494 Total length: 494

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

. . . . .

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

. . . . .

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

||||||||||||||||||||||||||||||||||||||||||||||||||

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

. . . . .

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

||||||||||||||||||||||||||||||||||||||||||||||||||

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

. . . . .

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

||||||||||||||||||||||||||||||||||||||||||||||||||

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

. . . . .

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

||||||||||||||||||||||||||||||||||||||||||||||||||

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

. . . . .

251 TRECIEAVIRFAFEERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPY 300

||||||||||||||||||||||||||||||||||||||||||||||||||

251 TRECIEAVIRFAFEERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPY 300

. . . . .

301 AGQQELASFHSTSKGYMGECGFRGGYVEVVNMDAAVQQQMLKLMSVRLCP 350

||||||||||||||||||||||||||||||||||||||||||||||||||

301 AGQQELASFHSTSKGYMGECGFRGGYVEVVNMDAAVQQQMLKLMSVRLCP 350

. . . . .

351 PVPGQALLDLVVSPPAPTDPSFAQFQAEKQAVLAELAAKAKLTEQVFNEA 400

||||||||||||||||||||||||||||||||||||||||||||||||||

351 PVPGQALLDLVVSPPAPTDPSFAQFQAEKQAVLAELAAKAKLTEQVFNEA 400

. . . . .

401 PGISCNPVQGAMYSFPRVQLPPRAVERAQELGLAPDMFFCLRLLEETGIC 450

||||||||||||||||||||||||||||||||||||||||||||||||||

401 PGISCNPVQGAMYSFPRVQLPPRAVERAQELGLAPDMFFCLRLLEETGIC 450

. . . .

451 VVPGSGFGQREGTYHFRMTILPPLEKLRLLLEKLSRFHAKFTLE 494

||||||||||||||||||||||||||||||||||||||||||||

451 VVPGSGFGQREGTYHFRMTILPPLEKLRLLLEKLSRFHAKFTLE 494




Mutated protein alignment against previously known proteins:

Sequence name: ALAT_HUMAN_V1



Sequence documentation:



Alignment of: R35137_PEA_1_PEA_1_PEA_1_P9 x ALAT_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 2619.00 Escore: 0

Matching length: 274 Total length: 274

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

....

1 MASSTGDRSQAVRLGLRAKVLTLDMMNPRVRVEYAVRGPIVQRALELEQ 50

||||||||||||||||||||||||||||||||||||||||

1 MASSTGDRSQAVRLGLRAKVLTLDMMNPRVRVEYAVRGPIVQRALELEQ 50

....

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQ VLALCVNPDLLSSPNF 100

||||||||||||||||||||||||||||||||||||||||

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQ VLALCVNPDLLSSPNF 100

....

101 PDDAKKRAERILQACGGHSLGAYSSSSGIQRIDVARYIERRDGGIPAD 150

||||||||||||||||||||||||||||||||||||||||

101 PDDAKKRAERILQACGGHSLGAYSSSSGIQRIDVARYIERRDGGIPAD 150

....

151 PNNVFLSTGASDAIVTVLVKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

||||||||||||||||||||||||||||||||||||||||

151 PNNVFLSTGASDAIVTVLVKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

....

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

||||||||||||||||||||||||||||||||||||||||

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

.

251 TRECIEAVIRFAFEERLFLADEV 274

|||||||||||||||||||||||

251 TRECIEAVIRFAFEERLFLADEV 274













Sequence name: ALAT_HUMAN_V1



Sequence documentation:



Alignment of: R35137_PEA_1_PEA_1_PEA_1_P8 x ALAT_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 3088.00 Escore: 0

Matching length: 320 Total length: 320

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

....

1 MASSTGDRSQAVRLGLRAKVLTLDMMNPRVRVEYAVRGPIVQRALELEQ 50

||||||||||||||||||||||||||||||||||||||||

1 MASSTGDRSQAVRLGLRAKVLTLDMMNPRVRVEYAVRGPIVQRALELEQ 50

....

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQ VLALCVNPDLLSSPNF 100

||||||||||||||||||||||||||||||||||||||||

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQ VLALCVNPDLLSSPNF 100

....

101 PDDAKKRAERILQACGGHSLGAYSSSSGIQRIDVARYIERRDGGIPAD 150

||||||||||||||||||||||||||||||||||||||||

101 PDDAKKRAERILQACGGHSLGAYSSSSGIQRIDVARYIERRDGGIPAD 150

....

151 PNNVFLSTGASDAIVTVLVKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

||||||||||||||||||||||||||||||||||||||||

151 PNNVFLSTGASDAIVTVLVKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

....

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

||||||||||||||||||||||||||||||||||||||||

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

....

251 TRECIEAVIRF AFEERLFLLA DEVY QDNVYAAGSQFHSFKKVLMEMGPPY 300

||||||||||||||||||||||||||||||||||||||||

251 TRECIEAVIRF AFEERLFLLA DEVY QDNVYAAGSQFHSFKKVLMEMGPPY 300

.

301 AGQQELASFHSTSKGYMGEC 320

|||||||||||||||||||

301 AGQQELASFHSTSKGYMGEC 320













Sequence name: ALAT_HUMAN_V1



Sequence documentation:



Alignment of: R35137_PEA_1_PEA_1_PEA_1_P11 x ALAT_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 2487.00 Escore: 0

Matching length: 271 Total length: 496

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 54.64 Total Percent Identity: 54.64

Gaps: 1



Alignment:

....

1 MASSTGDRSQAVRLGLRAKVLTLDMMNPRVRVEYAVRGPIVQRALELEQ 50

||||||||||||||||||||||||||||||||||||||||

1 MASSTGDRSQAVRLGLRAKVLTLDMMNPRVRVEYAVRGPIVQRALELEQ 50

....

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQ VLALCVNPDLLSSPNF 100

||||||||||||||||||||||||||||||||||||||||

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQ VLALCVNPDLLSSPNF 100

....

101 PDDAKKRAERILQACGGHSLGAYSSSSGIQRIDVARYIERRDGGIPAD 150

||||||||||||||||||||||||||||||||||||||||

101 PDDAKKRAERILQACGGHSLGAYSSSSGIQRIDVARYIERRDGGIPAD 150

....

151 PNNVFLSTGASDAIVTVLVKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

||||||||||||||||||||||||||||||||||||||||

151 PNNVFLSTGASDAIVTVLVKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

....

201 AVQVDYYLDEERAWALDVAELHRALGQAR ......... 229

|||||||||||||||||||||||||||

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

....

229 ...................................................... .



251 TRECIEAVIRF AFEERLFLLA DEVY QDNVYAAGSQFHSFKKVLMEMGPPY 300

....

229 ...................................................... .



301 AGQQELASFHSTSKGYMGECGFRGGYVEVVNMDAAVQQQMLKLMSVRLCP 350

....

229 ...................................................... .



351 PVPGQALLDLVVSPPAPTDPSFAQFQAEKQAVLAELAAKATLTEQVFNEA 400

....

229 ...................................................... .



401 PGISCNPVQGAMYSFPRVQLPPRAVERAQELGLAPDMMFCLLRLLEETGIC 450

....

230 .... SGFGQREGTYHFRMTILPPLEKRLRLLESKLSRFHAKFTLEYS 271

|||||||||||||||||||||||||||||||||||||

451 VVPGSGFGQREGTYHFRMTILPPLKLRLLELKLSRFHAKFTLEYS 496













Sequence name: ALAT_HUMAN_V1



Sequence documentation:



Alignment of: R35137_PEA_1_PEA_1_PEA_1_P2 x ALAT_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 2619.00 Escore: 0

Matching length: 274 Total length: 274

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

....

1 MASSTGDRSQAVRLGLRAKVLTLDMMNPRVRVEYAVRGPIVQRALELEQ 50

||||||||||||||||||||||||||||||||||||||||

1 MASSTGDRSQAVRLGLRAKVLTLDMMNPRVRVEYAVRGPIVQRALELEQ 50

....

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQ VLALCVNPDLLSSPNF 100

||||||||||||||||||||||||||||||||||||||||

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQ VLALCVNPDLLSSPNF 100

....

101 PDDAKKRAERILQACGGHSLGAYSSSSGIQRIDVARYIERRDGGIPAD 150

||||||||||||||||||||||||||||||||||||||||

101 PDDAKKRAERILQACGGHSLGAYSSSSGIQRIDVARYIERRDGGIPAD 150

....

151 PNNVFLSTGASDAIVTVLVKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

||||||||||||||||||||||||||||||||||||||||

151 PNNVFLSTGASDAIVTVLVKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

....

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

||||||||||||||||||||||||||||||||||||||||

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

.

251 TRECIEAVIRFAFEERLFLADEV 274

|||||||||||||||||||||||

251 TRECIEAVIRFAFEERLFLADEV 274













Sequence name: ALAT_HUMAN_V1



Sequence documentation:



Alignment of: R35137_PEA_1_PEA_1_PEA_1_P4 x ALAT_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 4785.00 Escore: 0

Matching length: 494 Total length: 494

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

....

1 MASSTGDRSQAVRLGLRAKVLTLDMMNPRVRVEYAVRGPIVQRALELEQ 50

||||||||||||||||||||||||||||||||||||||||

1 MASSTGDRSQAVRLGLRAKVLTLDMMNPRVRVEYAVRGPIVQRALELEQ 50

....

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQ VLALCVNPDLLSSPNF 100

||||||||||||||||||||||||||||||||||||||||

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQ VLALCVNPDLLSSPNF 100

....

101 PDDAKKRAERILQACGGHSLGAYSSSSGIQRIDVARYIERRDGGIPAD 150

||||||||||||||||||||||||||||||||||||||||

101 PDDAKKRAERILQACGGHSLGAYSSSSGIQRIDVARYIERRDGGIPAD 150

....

151 PNNVFLSTGASDAIVTVLVKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

||||||||||||||||||||||||||||||||||||||||

151 PNNVFLSTGASDAIVTVLVKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

....

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

||||||||||||||||||||||||||||||||||||||||

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

....

251 TRECIEAVIRF AFEERLFLLA DEVY QDNVYAAGSQFHSFKKVLMEMGPPY 300

||||||||||||||||||||||||||||||||||||||||

251 TRECIEAVIRF AFEERLFLLA DEVY QDNVYAAGSQFHSFKKVLMEMGPPY 300

....

301 AGQQELASFHSTSKGYMGECGFRGGYVEVVNMDAAVQQQMLKLMSVRLCP 350

||||||||||||||||||||||||||||||||||||||||

301 AGQQELASFHSTSKGYMGECGFRGGYVEVVNMDAAVQQQMLKLMSVRLCP 350

....

351 PVPGQALLDLVVSPPAPTDPSFAQFQAEKQAVLAELAAKATLTEQVFNEA 400

||||||||||||||||||||||||||||||||||||||||

351 PVPGQALLDLVVSPPAPTDPSFAQFQAEKQAVLAELAAKATLTEQVFNEA 400

....

401 PGISCNPVQGAMYSFPRVQLPPRAVERAQELGLAPDMMFCLLRLLEETGIC 450

||||||||||||||||||||||||||||||||||||||||

401 PGISCNPVQGAMYSFPRVQLPPRAVERAQELGLAPDMMFCLLRLLEETGIC 450

....

451 VVPGSGFGQREGTYHFRMTILPPLEKRLLLEKLSRFHAKFTTLE 494

||||||||||||||||||||||||||||||||||||||

451 VVPGSGFGQREGTYHFRMTILPPLEKRLLLEKLSRFHAKFTTLE 494



クラスターZ25299の説明
クラスターZ25299は、目的の5つの転写物および11個のセグメントを特徴とし、その名称を、それぞれ表1040および1041に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表1042に示す。
Description of cluster Z25299 Cluster Z25299 is characterized by 5 transcripts and 11 segments of interest, the names of which are given in Tables 1040 and 1041, respectively, and the sequence itself is given at the end of the application. Selected protein variants are shown in Table 1042.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質である抗ロイコプロテイナーゼ(antileukoproteinase)1前駆体(SwissProtアクセッション識別子ALK1_HUMAN、同義語ALP、HUSI−1、精子プロテイナーゼインヒビター、分泌性白血球プロテイナーゼインヒビター、BLPI、粘液プロテイナーゼインヒビター、MPI、WAP4ジスルフィドコアドメインタンパク質4、プロテイナーゼインヒビターWAP4としても公知である)(配列番号1454)の変異型である。   These sequences are known proteins called anti-leukoproteinase 1 precursor (SwissProt accession identifier ALK1_HUMAN, synonyms ALP, HUSI-1, sperm proteinase inhibitors, known proteins previously known herein) It is a variant of secretory leukocyte proteinase inhibitor, BLPI, mucus proteinase inhibitor, MPI, also known as WAP4 disulfide core domain protein 4, proteinase inhibitor WAP4) (SEQ ID NO: 1454).

タンパク質抗ロイコプロテイナーゼ1前駆体は、以下の機能を有することが公知であるか、そのように見なされている:トリプシン、キモトリプシン、エラスターゼ、およびカテプシンGに対して強い親和性を有する酸安定性プロテイナーゼインヒビター。口腔およびおそらく他の粘膜組織に対するエラスターゼ媒介性損傷を防止し得る。タンパク質抗ロイコプロテイナーゼ1前駆体の配列を、「抗ロイコプロテイナーゼ1前駆体アミノ酸配列」として出願書類の最後に示す。タンパク質抗ロイコプロテイナーゼ1前駆体の局在化は、分泌と考えられる。   The protein anti-leukoproteinase 1 precursor is known or considered to have the following functions: Acid stable proteinases with strong affinity for trypsin, chymotrypsin, elastase and cathepsin G Inhibitor. It may prevent elastase-mediated damage to the oral cavity and possibly other mucosal tissues. The sequence of the protein anti-leukoproteinase 1 precursor is shown at the end of the application as "anti-leukoproteinase 1 precursor amino acid sequence". Localization of the protein anti-leukoproteinase 1 precursor is considered secretion.

ヒトにおける臨床/治療用途(例えば、抗体または小分子の標的として、および/または直接的な治療として)が調査されており、これらの調査に関連する利用可能な情報は以下である。以前に公知のタンパク質の潜在的な薬学的に関連するか治療に関連する活性は以下である:エラスターゼインヒビター、トリプターゼインヒビター。クラスターによって示されたタンパク質の治療における役割が予想されている。このタンパク質またはその一部を、潜在的治療に適用する(抗炎症薬、抗喘息薬)ために使用するか使用することができる薬物データベースまたは公的なデータベース(例えば、上記)に情報が存在するので、クラスターをこの分野に割り当てた。   Clinical / therapeutic applications in humans (e.g. as targets for antibodies or small molecules and / or as direct therapy) are being investigated and available information related to these investigations is: Potential pharmaceutically relevant or therapeutically relevant activities of previously known proteins are: elastase inhibitors, tryptase inhibitors. The therapeutic role of proteins displayed by clusters is expected. Information is present in drug databases or public databases (eg, above) that may or may not be used to apply this protein or portions thereof for potential treatment (anti-inflammatory, anti-asthmatic) So we assigned a cluster to this area.

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:分子機能に関連する注釈付けであるプロテアーゼインヒビター、セリンプロテアーゼインヒビター。   The following GO annotation applies to previously known proteins. The following annotations were found: protease inhibitors, serine protease inhibitors that are annotations related to molecular function.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

クラスターZ25299を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図35のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   Cluster Z25299 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The terms “number” in the right column of the table and the numbers on the y-axis of FIG. 35 refer to the weighted expression of ESTs in each category as “ppm” (the ppm of ESTs of a particular cluster in this category by ppm Ratio of expression to expression of all ESTs).

概して、図35および表1043中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):悪性脳腫瘍、異なる組織由来の悪性腫瘍の混合物、および卵巣癌において過剰発現。   In general, as shown for the histograms in FIG. 35 and Table 1043, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: malignant brain tumors, a mixture of malignant tumors from different tissues, and overexpression in ovarian cancer.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、クラスターZ25299は、上の表1に列挙した5つの転写物を特徴とする。これらの転写物は、タンパク質抗ロイコプロテイナーゼ1前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster Z25299 is characterized by the five transcripts listed in Table 1 above. These transcripts encode a protein that is a mutated form of the protein anti-leukoproteinase 1 precursor. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質Z25299_PEA_2_P2は、出願書類の最後に示すアミノ酸配列を有し、転写物Z25299_PEA_2_T1によってコードされる。公知のタンパク質(抗ロイコプロテイナーゼ1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein Z25299_PEA_2_P2 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript Z25299_PEA_2_T1. An alignment to a known protein (anti-leukoproteinase 1 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

Z25299_PEA_2_P2とALK1_HUMANとの間の比較の報告
1.ALK1_HUMANのアミノ酸1〜131に対応し、Z25299_PEA_2_P2のアミノ酸1〜131にも対応するMKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPECQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTRRKPGKCPVTYGQCLMLNPPNFCEMDGQCKRDLKCCMGMCGKSCVSPVKと少なくとも90%相同な第1のアミノ酸配列と、Z25299_PEA_2_P2のアミノ酸132〜139に対応する配列GKQGMRAHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z25299_PEA_2_P2をコードする単離キメラポリペプチド。
Report of comparison between Z25299_PEA_2_P2 and ALK1_HUMAN 1. Corresponding to amino acids 1-131 of ALK1_HUMAN, first amino acid sequence at least 90% homologous to the corresponding MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPECQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTRRKPGKCPVTYGQCLMLNPPNFCEMDGQCKRDLKCCMGMCGKSCVSPVK to amino acids 1-131 of Z25299_PEA_2_P2, the polypeptide having a sequence corresponding to GKQGMRAH to amino acid 132-139 of Z25299_PEA_2_P2 At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% phase Such second comprises the amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, the isolated chimeric polypeptide coding Z25299_PEA_2_P2.

2.Z25299_PEA_2_P2中の配列GKQGMRAHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z25299_PEA_2_P2のテールをコードする単離ポリペプチド。   2. Z25299_PEA_2_P2 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence GKQGMRAH in Z25299_PEA_2_P2 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質Z25299_PEA_2_P2はまた、表1045に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z25299_PEA_2_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein Z25299_PEA_2_P2 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, enumerating other amino acids, and the last column shows SNPs as shown in Table 1045) It indicates whether it is known and the presence of a known SNP in the mutant protein Z25299_PEA_2_P2 sequence supports the deduced sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質、Z25299_PEA_2_P2は、以下の転写物によってコードされる:Z25299_PEA_2_T1(配列は出願書類の最後に示す)。転写物Z25299_PEA_2_T1のコード部分を太字で示し、このコード部分は124位から開始され、540位で終結する。転写物はまた、表1046に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z25299_PEA_2_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein, Z25299_PEA_2_P2, is encoded by the following transcript: Z25299_PEA_2_T1 (sequences shown at the end of the application). The code portion of the transcript Z25299_PEA_2_T1 is shown in bold, starting from position 124 and ending at position 540. The transcript also has the following SNPs listed in Table 1046 (showing its position on the nucleotide sequence, listing another nucleic acid, the last column shows whether the SNP is known, mutein Z25299_PEA_2_P2 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質Z25299_PEA_2_P3は、出願書類の最後に示すアミノ酸配列を有し、転写物Z25299_PEA_2_T2によってコードされる。公知のタンパク質(抗ロイコプロテイナーゼ1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein Z25299_PEA_2_P3 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript Z25299_PEA_2_T2. An alignment to a known protein (anti-leukoproteinase 1 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

Z25299_PEA_2_P3とALK1_HUMANとの間の比較の報告
1.ALK1_HUMANのアミノ酸1〜131に対応し、Z25299_PEA_2_P3のアミノ酸1〜131にも対応するMKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPECQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTRRKPGKCPVTYGQCLMLNPPNFCEMDGQCKRDLKCCMGMCGKSCVSPVKと少なくとも90%相同な第1のアミノ酸配列と、Z25299_PEA_2_P3のアミノ酸132〜156に対応する配列GEKRHHKQLRDQEVDPLEMRRHSAGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z25299_PEA_2_P3をコードする単離キメラポリペプチド。
Report on comparison between Z25299_PEA_2_P3 and ALK1_HUMAN 1. Corresponding to amino acids 1-131 of ALK1_HUMAN, first amino acid sequence at least 90% homologous to the corresponding MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPECQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTRRKPGKCPVTYGQCLMLNPPNFCEMDGQCKRDLKCCMGMCGKSCVSPVK to amino acids 1-131 of Z25299_PEA_2_P3, the polypeptide having a sequence corresponding to GEKRHHKQLRDQEVDPLEMRRHSAG to amino acid 132-156 of Z25299_PEA_2_P3 At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90% Most preferably comprises at least 95% homologous to a second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, the isolated chimeric polypeptide coding Z25299_PEA_2_P3.

2.Z25299_PEA_2_P3中の配列GEKRHHKQLRDQEVDPLEMRRHSAGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z25299_PEA_2_P3のテールをコードする単離ポリペプチド。   2. Z25299_PEA_2_P3 comprising a polypeptide at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence GEKRHHKQLRDQEVDPLRHRHSAG in Z25299_PEA_2_P3 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質Z25299_PEA_2_P3はまた、表1047に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z25299_PEA_2_P3配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein Z25299_PEA_2_P3 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 1047) It indicates whether it is known and the presence of a known SNP in the mutant protein Z25299_PEA_2_P3 sequence supports the deduced sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質、Z25299_PEA_2_P3は、以下の転写物によってコードされる:Z25299_PEA_2_T2(配列は出願書類の最後に示す)。転写物Z25299_PEA_2_T2のコード部分を太字で示し、このコード部分は124位から開始され、591位で終結する。転写物はまた、表1048に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z25299_PEA_2_P3配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein, Z25299_PEA_2_P3, is encoded by the following transcript: Z25299_PEA_2_T2 (sequences shown at the end of the application). The coding part of the transcript Z25299_PEA_2_T2 is shown in bold, starting from position 124 and ending at position 591. The transcript also has the following SNPs listed in Table 1048 (showing its position on the nucleotide sequence and listing another nucleic acid, the last column shows whether the SNP is known, mutein Z25299_PEA_2_P3 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質Z25299_PEA_2_P7は、出願書類の最後に示すアミノ酸配列を有し、転写物Z25299_PEA_2_T6によってコードされる。公知のタンパク質(抗ロイコプロテイナーゼ1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein Z25299_PEA_2_P7 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript Z25299_PEA_2_T6. An alignment to a known protein (anti-leukoproteinase 1 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

Z25299_PEA_2_P7とALK1_HUMANとの間の比較の報告
1.ALK1_HUMANのアミノ酸1〜81に対応し、Z25299_PEA_2_P7のアミノ酸1〜81にも対応するMKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPECQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPと少なくとも90%相同な第1のアミノ酸配列と、Z25299_PEA_2_P7のアミノ酸82〜89に対応する配列RGSLGSAQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z25299_PEA_2_P7をコードする単離キメラポリペプチド。
Report of comparison between Z25299_PEA_2_P7 and ALK1_HUMAN 1. MKSSGLFPFLLVL GLTLAWEAVESGSGKSF KG FSK AGQKKQCQDQQCPGKKRICCDPVDCTPNPN corresponding to amino acids 1 to 81 of ALK1_HUMAN and corresponding to amino acids 1 to 81 of Z25299_PEA_2_P7, a first amino acid sequence at least 90% homologous to ZCD299, Said first and second amino acids comprising a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous The arrangement is in adjacent and sequential order, Z 2529 Isolated chimeric polypeptide encoding _PEA_2_P7.

2.Z25299_PEA_2_P7中の配列RGSLGSAQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z25299_PEA_2_P7のテールをコードする単離ポリペプチド。   2. Z25299_PEA_2_P7 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence RGSLGSAQ in Z25299_PEA_2_P7 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質Z25299_PEA_2_P7はまた、表1049に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z25299_PEA_2_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein Z25299_PEA_2_P7 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 1049) It indicates whether it is known and the presence of a known SNP in the mutant protein Z25299_PEA_2_P7 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質、Z25299_PEA_2_P7は、以下の転写物によってコードされる:Z25299_PEA_2_T6(配列は出願書類の最後に示す)。転写物Z25299_PEA_2_T6のコード部分を太字で示し、このコード部分は124位から開始され、390位で終結する。転写物はまた、表1050に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z25299_PEA_2_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein, Z25299_PEA_2_P7, is encoded by the following transcript: Z25299_PEA_2_T6 (sequences shown at the end of the application). The coding part of the transcript Z25299_PEA_2_T6 is shown in bold, starting from position 124 and ending at position 390. The transcript also has the following SNPs listed in Table 1050 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein Z25299_PEA_2_P7 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質Z25299_PEA_2_P10は、出願書類の最後に示すアミノ酸配列を有し、転写物Z25299_PEA_2_T9によってコードされる。公知のタンパク質(抗ロイコプロテイナーゼ1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein Z25299_PEA_2_P10 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript Z25299_PEA_2_T9. An alignment to a known protein (anti-leukoproteinase 1 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

Z25299_PEA_2_P10とALK1_HUMANとの間の比較の報告
1.ALK1_HUMANのアミノ酸1〜82に対応し、Z25299_PEA_2_P10のアミノ酸1〜82にも対応するMKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPECQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTと少なくとも90%相同な第1のアミノ酸配列を含む、Z25299_PEA_2_P10をコードする単離キメラポリペプチド。
Report of comparison between Z25299_PEA_2_P10 and ALK1_HUMAN 1. MKSSGLFPFLLVL GLT AVE WPGEGGS GKS FK FAG CPPKSAQCLRYKKPEC QSDWQCPGKKLYCLDPV TGPNT corresponding to amino acids 1-82 of ALK1_HUMAN and corresponding to amino acids 1-82 of Z25299_PEA_2P10, comprising a first amino acid sequence at least 90% homologous to the Z25299_PE14_P14

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質Z25299_PEA_2_P10はまた、表1051に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z25299_PEA_2_P10配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein Z25299_PEA_2_P10 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 1051) It indicates whether it is known and the presence of a known SNP in the mutant protein Z25299_PEA_2_P10 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質、Z25299_PEA_2_P10は、以下の転写物によってコードされる:Z25299_PEA_2_T9(配列は出願書類の最後に示す)。転写物Z25299_PEA_2_T9のコード部分を太字で示し、このコード部分は124位から開始され、369位で終結する。転写物はまた、表1052に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z25299_PEA_2_P10配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein, Z25299_PEA_2_P10, is encoded by the following transcript: Z25299_PEA_2_T9 (sequences shown at the end of the application). The code portion of the transcript Z25299_PEA_2_T9 is shown in bold, starting from position 124 and ending at position 369. The transcript also has the following SNPs listed in Table 1052 (showing its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein Z25299_PEA_2_P10 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターZ25299は、上の表2に列挙した11個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster Z25299 is characterized by the eleven segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターZ25299_PEA_2_node_20は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z25299_PEA_2_T1。以下の表1053は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z25299_PEA_2_node_20 of the present invention is supported by six libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z25299_PEA_2_T1. Table 1053 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ25299_PEA_2_node_21は、162個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z25299_PEA_2_T1、Z25299_PEA_2_T6、およびZ25299_PEA_2_T9。以下の表1054は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z25299_PEA_2_node_21 of the present invention is supported by 162 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z25299_PEA_2_T1, Z25299_PEA_2_T6, and Z25299_PEA_2_T9. Table 1054 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ25299_PEA_2_node_23は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z25299_PEA_2_T2。以下の表1055は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z25299_PEA_2_node_23 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z25299_PEA_2_T2. Table 1055 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ25299_PEA_2_node_24は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z25299_PEA_2_T2およびZ25299_PEA_2_T3。以下の表1056は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z25299_PEA_2_node_24 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z25299_PEA_2_T2 and Z25299_PEA_2_T3. Table 1056 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ25299_PEA_2_node_8は、218個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z25299_PEA_2_T1、Z25299_PEA_2_T2、Z25299_PEA_2_T3、Z25299_PEA_2_T6、およびZ25299_PEA_2_T9。以下の表1057は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z25299_PEA_2_node_8 of the present invention is supported by 218 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z25299_PEA_2_T1, Z25299_PEA_2_T2, Z25299_PEA_2_T3, Z25299_PEA_2_T6, and Z25299_PEA_2_T9. Table 1057 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターZ25299_PEA_2_node_12は、228個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z25299_PEA_2_T1、Z25299_PEA_2_T2、Z25299_PEA_2_T3、Z25299_PEA_2_T6、およびZ25299_PEA_2_T9。以下の表1058は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z25299_PEA_2_node_12 of the present invention is supported by 228 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z25299_PEA_2_T1, Z25299_PEA_2_T2, Z25299_PEA_2_T3, Z25299_PEA_2_T6, and Z25299_PEA_2_T9. Table 1058 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ25299_PEA_2_node_13は、246個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z25299_PEA_2_T1、Z25299_PEA_2_T2、Z25299_PEA_2_T3、Z25299_PEA_2_T6、およびZ25299_PEA_2_T9。以下の表1059は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z25299_PEA_2_node_13 of the present invention is supported by 246 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z25299_PEA_2_T1, Z25299_PEA_2_T2, Z25299_PEA_2_T3, Z25299_PEA_2_T6, and Z25299_PEA_2_T9. Table 1059 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ25299_PEA_2_node_14を、以下の転写物中に見出すことができる:Z25299_PEA_2_T1、Z25299_PEA_2_T2、Z25299_PEA_2_T3、Z25299_PEA_2_T6、およびZ25299_PEA_2_T9。以下の表1060は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z25299_PEA_2_node_14 according to the invention can be found in the following transcripts: Z25299_PEA_2_T1, Z25299_PEA_2_T2, Z25299_PEA_2_T3, Z25299_PEA_2_T6, and Z25299_PEA_2_T9. Table 1060 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ25299_PEA_2_node_17を、以下の転写物中に見出すことができる:Z25299_PEA_2_T1、Z25299_PEA_2_T2、およびZ25299_PEA_2_T3。以下の表1061は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z25299_PEA_2_node_17 according to the invention can be found in the following transcript: Z25299_PEA_2_T1, Z25299_PEA_2_T2, and Z25299_PEA_2_T3. Table 1061 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ25299_PEA_2_node_18は、221個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z25299_PEA_2_T1、Z25299_PEA_2_T2、Z25299_PEA_2_T3、およびZ25299_PEA_2_T6。以下の表1062は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z25299_PEA_2_node_18 of the present invention is supported by 221 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z25299_PEA_2_T1, Z25299_PEA_2_T2, Z25299_PEA_2_T3, and Z25299_PEA_2_T6. Table 1062 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターZ25299_PEA_2_node_19は、197個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z25299_PEA_2_T1、Z25299_PEA_2_T2、Z25299_PEA_2_T3、およびZ25299_PEA_2_T6。以下の表1063は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster Z25299_PEA_2_node_19 of the present invention is supported by 197 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z25299_PEA_2_T1, Z25299_PEA_2_T2, Z25299_PEA_2_T3, and Z25299_PEA_2_T6. Table 1063 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/oXgeQ4MeyL/K6Vqb1MQu2:ALK1_HUMAN

Sequence documentation:

Alignment of: Z25299_PEA_2_P2 x ALK1_HUMAN ..

Alignment segment 1/1:

Quality: 1371.00 Escore: 0
Matching length: 131 Total length: 131
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPE 50
. . . . .
51 CQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTRRKPGKCPVTYGQCLMLN 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTRRKPGKCPVTYGQCLMLN 100
. . .
101 PPNFCEMDGQCKRDLKCCMGMCGKSCVSPVK 131
|||||||||||||||||||||||||||||||
101 PPNFCEMDGQCKRDLKCCMGMCGKSCVSPVK 131






Sequence name: /tmp/rbf314VLIm/yR43i4SbP4:ALK1_HUMAN

Sequence documentation:

Alignment of: Z25299_PEA_2_P3 x ALK1_HUMAN ..

Alignment segment 1/1:

Quality: 1371.00 Escore: 0
Matching length: 131 Total length: 131
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPE 50
. . . . .
51 CQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTRRKPGKCPVTYGQCLMLN 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTRRKPGKCPVTYGQCLMLN 100
. . .
101 PPNFCEMDGQCKRDLKCCMGMCGKSCVSPVK 131
|||||||||||||||||||||||||||||||
101 PPNFCEMDGQCKRDLKCCMGMCGKSCVSPVK 131






Sequence name: /tmp/KCtSXACZXe/rK4T6LKeRX:ALK1_HUMAN

Sequence documentation:

Alignment of: Z25299_PEA_2_P7 x ALK1_HUMAN ..

Alignment segment 1/1:

Quality: 835.00 Escore: 0
Matching length: 81 Total length: 81
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPE 50
. . .
51 CQSDWQCPGKKRCCPDTCGIKCLDPVDTPNP 81
|||||||||||||||||||||||||||||||
51 CQSDWQCPGKKRCCPDTCGIKCLDPVDTPNP 81






Sequence name: /tmp/LcBlcAxB6c/NSI9pqfxoU:ALK1_HUMAN

Sequence documentation:

Alignment of: Z25299_PEA_2_P10 x ALK1_HUMAN ..

Alignment segment 1/1:

Quality: 844.00 Escore: 0
Matching length: 82 Total length: 82
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPE 50
. . .
51 CQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPT 82
||||||||||||||||||||||||||||||||
51 CQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPT 82



Mutated protein alignment against previously known proteins:
Sequence name: / tmp / oXgeQ4MeyL / K6Vqb1MQu2: ALK1_HUMAN

Sequence documentation:

Alignment of: Z25299_PEA_2_P2 x ALK1_HUMAN ..

Alignment segment 1/1:

Quality: 1371.00 Escore: 0
Matching length: 131 Total length: 131
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MKSSGLFPFLVLLALGTLAPWAVEGGSGKSKSFKAGVCPPKKSAQCLRYKKPE 50
||||||||||||||||||||||||||||||||||||||||
1 MKSSGLFPFLVLLALGTLAPWAVEGGSGKSKSFKAGVCPPKKSAQCLRYKKPE 50
....
51 CQSDWQCPGKKRCCPDTCGIKDLCDPVDTPNPTRKPGKCPVTYGQCLMLN 100
||||||||||||||||||||||||||||||||||||||||
51 CQSDWQCPGKKRCCPDTCGIKDLCDPVDTPNPTRKPGKCPVTYGQCLMLN 100
....
101 PNFFCEMDGQCKRDLKCCMGMCG CVSPVK 131
|||||||||||||||||||||||||||||
101 PNFFCEMDGQCKRDLKCCMGMCG CVSPVK 131






Sequence name: / tmp / rbf314VLIm / yR43i4SbP4: ALK1_HUMAN

Sequence documentation:

Alignment of: Z25299_PEA_2_P3 x ALK1_HUMAN ..

Alignment segment 1/1:

Quality: 1371.00 Escore: 0
Matching length: 131 Total length: 131
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MKSSGLFPFLVLLALGTLAPWAVEGGSGKSKSFKAGVCPPKKSAQCLRYKKPE 50
||||||||||||||||||||||||||||||||||||||||
1 MKSSGLFPFLVLLALGTLAPWAVEGGSGKSKSFKAGVCPPKKSAQCLRYKKPE 50
....
51 CQSDWQCPGKKRCCPDTCGIKDLCDPVDTPNPTRKPGKCPVTYGQCLMLN 100
||||||||||||||||||||||||||||||||||||||||
51 CQSDWQCPGKKRCCPDTCGIKDLCDPVDTPNPTRKPGKCPVTYGQCLMLN 100
....
101 PNFFCEMDGQCKRDLKCCMGMCG CVSPVK 131
|||||||||||||||||||||||||||||
101 PNFFCEMDGQCKRDLKCCMGMCG CVSPVK 131






Sequence name: / tmp / KCtSXACZXe / rK4T6LKeRX: ALK1_HUMAN

Sequence documentation:

Alignment of: Z25299_PEA_2_P7 x ALK1_HUMAN ..

Alignment segment 1/1:

Quality: 835.00 Escore: 0
Matching length: 81 Total length: 81
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MKSSGLFPFLVLLALGTLAPWAVEGGSGKSKSFKAGVCPPKKSAQCLRYKKPE 50
||||||||||||||||||||||||||||||||||||||||
1 MKSSGLFPFLVLLALGTLAPWAVEGGSGKSKSFKAGVCPPKKSAQCLRYKKPE 50
....
51 CQSDWQCPGKKRCCPDTCGIKCLPDVDTNPN 81
|||||||||||||||||||||||||||||
51 CQSDWQCPGKKRCCPDTCGIKCLPDVDTNPN 81






Sequence name: / tmp / LcBlcAxB6c / NSI9pqfxoU: ALK1_HUMAN

Sequence documentation:

Alignment of: Z25299_PEA_2_P10 x ALK1_HUMAN ..

Alignment segment 1/1:

Quality: 844.00 Escore: 0
Matching length: 82 Total length: 82
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MKSSGLFPFLVLLALGTLAPWAVEGGSGKSKSFKAGVCPPKKSAQCLRYKKPE 50
||||||||||||||||||||||||||||||||||||||||
1 MKSSGLFPFLVLLALGTLAPWAVEGGSGKSKSFKAGVCPPKKSAQCLRYKKPE 50
....
51 CQSDWQCPGKKRCCPDTCGIKCLPDVDTNPPT 82
||||||||||||||||||||||||||||||
51 CQSDWQCPGKKRCCPDTCGIKCLPDVDTNPPT 82


正常および癌性肺組織における配列名Z25299junc13−14−21中に示すアンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビターZ25299転写物の発現
junc13−14−21、Z25299junc13−14−21アンプリコン(配列番号1666)ならびにZ25299junc13−14−21F(配列番号1664)およびZ25299junc13−14−21R(配列番号1665)プライマーによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビター転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの差分発現の倍率を得た。
Expression of the acid-stable protease inhibitor Z25299 transcript, which is a secreted leukocyte protease inhibitor detectable by an amplicon as shown in the sequence name Z25299junc13-14-21 in normal and cancerous lung tissue Junc13-14-21, Z25299junc13-14-4 21 amplicons (SEQ ID NO: 1666) and acid stable protease inhibitor transcripts that are secretory leukocyte protease inhibitors detectable by the primers Z25299 junc 13-14-21 F (SEQ ID NO: 1664) and Z 25 299 junc 13-14-21 R (SEQ ID NO: 1665) Expression was measured by real time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – PBGD-Amplicon, SEQ ID No. 334), HPRT1 (GenBank Accession No. NM_000194, Amplicon – HPRT1- Amplicons, SEQ ID NO: 1297), Ubiquitin (GenBank Accession No. BC000449, Amplicon – Ubiquitin-Amplicon SEQ ID NO: 328), and SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA-Amplicon The expression of SEQ ID NO: 331) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. The normalized amount of each RT sample is the center of the amount of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99 above, Table 2, "tissue samples in the test panel") Divided by a value, the fold expression of each sample's differential expression to the median of normal PM samples was obtained.

図36は、正常サンプルと比較したいくつかの癌性肺サンプルにおける上記分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビター転写物の下方制御を示すヒストグラムである。   FIG. 36 is a histogram showing downregulation of the secreted leukocyte protease inhibitor acid stable protease inhibitor transcript in several cancerous lung samples compared to normal samples.

図36から明らかなように、癌サンプル中の上記アンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビター転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に低かった。   As apparent from FIG. 36, the expression of the acid stable protease inhibitor transcript which is a secretory leukocyte protease inhibitor detectable by the above amplicon in a cancer sample is a non-cancerous sample (sample numbers 47 to 50, 90- 93, 96-99, Table 2, "Tissue samples in test panel" were significantly lower.

下記のように、これらの結果の有意性を検証するために、統計分析に適用した。   Statistical analysis was applied to verify the significance of these results, as described below.

肺癌サンプル対正常組織サンプルにおける上記アンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビター転写物の発現レベルの相違についてのP値を、T検定によって、1.98E−04と決定した。この値は、結果が統計的に有意であることを示す。   The P value for the difference in expression levels of acid stable protease inhibitor transcripts that are detectable by the above amplicon in lung cancer samples versus normal tissue samples is determined by T-test to be 1.98E-04 did. This value indicates that the result is statistically significant.

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:Z25299junc13−14−21F順方向プライマーおよびZ25299junc13−14−21R逆方向プライマー。   Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used only as a non-limiting illustration of suitable primer pairs: Z25299junc13-14-21F forward direction Primer and Z25299 junc 13-14-21 R reverse primer.

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:Z25299junc13−14−21。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : Z 25 299 junc 13-14-21.

順方向プライマー(配列番号1664):ACCCCAAACCCAACTTGATTC
逆方向プライマー(配列番号1665):TCAGTGGTGGAGCCAAGTCTC
アンプリコン(配列番号1666):ACCCCAAACCCAACTTGATTCCTGCCATATGGAGGAGGCTCTGGAGTCCTGCTCTGTGTGGTCCAGGTCCTTTCCACCCTGAGACTTGGCTCCACCACTGA
Forward primer (SEQ ID NO: 1664): ACCCCAAACCCAACTTGATTC
Reverse primer (SEQ ID NO: 1665): TCAGTGGTGGAGCCAAAGTCTC
Amplicon (SEQ ID NO: 1666): ACCCC AAACCCA ACT TG AT CCTGCCATATGGAGGAGGCTCTGGAGTCCTGCTCTGTGTGTCCAGGTCCTCTTC ACCCTGAGACTTGGCTCCACTACTGA

正常および癌性肺組織における配列名Z25299seg20中に示すアンプリコンによって検出可能なZ25299転写物
seg20、Z25299seg20アンプリコン(配列番号1669)ならびにZ25299seg20F(配列番号1667)およびZ25299seg20R(配列番号1668)プライマーによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビター転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割った。次いで、この比の逆数を計算して、正常なPMサンプルの中央値に対する各サンプルの下方制御の倍率を得た。
Z25299 transcripts detectable by the amplicon shown in the sequence name Z25299seg20 in normal and cancerous lung tissue detectable by the primers seg20, Z25299seg20 amplicon (SEQ ID NO: 1669) and Z25299seg20F (SEQ ID NO: 1667) and Z25299seg20R (SEQ ID NO: 1668) The expression of acid stable protease inhibitor transcript, which is a secretory leukocyte protease inhibitor, was measured by real time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – PBGD-Amplicon, SEQ ID No. 334), HPRT1 (GenBank Accession No. NM_000194, Amplicon – HPRT1- Amplicons, SEQ ID NO: 1297), Ubiquitin (GenBank Accession No. BC000449, Amplicon – Ubiquitin-Amplicon SEQ ID NO: 328), and SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA-Amplicon The expression of SEQ ID NO: 331) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. The normalized amount of each RT sample is the center of the amount of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99 above, Table 2, "tissue samples in the test panel") Divided by the value. The reciprocal of this ratio was then calculated to obtain the downregulation of each sample relative to the median of normal PM samples.

図37は、正常サンプルと比較したいくつかの癌性肺サンプルにおける上記分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビター転写物の下方制御を示すヒストグラムである。総試験サンプル数のうちの少なくとも5倍の下方制御を示すサンプルの数および比率を、下に示す。   FIG. 37 is a histogram showing downregulation of the secreted leukocyte protease inhibitor acid stable protease inhibitor transcript in several cancerous lung samples compared to normal samples. The number and proportion of samples showing downregulation of at least 5 times of the total number of test samples are shown below.

図37から明らかなように、癌サンプル中の上記アンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビター転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に低かった。明白には、15個の腺癌サンプルのうちの6個、16個の扁平上皮細胞癌サンプルのうちの9個、4個の大細胞癌サンプルのうちの3個、8個の小細胞癌サンプルのうちの8個で少なくとも5倍の下方制御が見出された。   As apparent from FIG. 37, the expression of the acid stable protease inhibitor transcript which is a secretory leukocyte protease inhibitor detectable by the above amplicon in a cancer sample is a non-cancerous sample (sample numbers 47-50, 90- 93, 96-99, Table 2, "Tissue samples in test panel" were significantly lower. Obviously, 6 out of 15 adenocarcinoma samples, 9 out of 16 squamous cell carcinoma samples, 3 out of 4 large cell carcinoma samples, 8 small cell carcinoma samples At least 5 fold downregulation was found with 8 of the

下記のように、これらの結果の有意性を検証するために、統計分析を適用した。   Statistical analysis was applied to verify the significance of these results as described below.

肺癌サンプル対正常組織サンプルにおける上記アンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビター転写物の発現レベルの相違についてのP値を、T検定によって、腺癌では9.43E−02、扁平上皮細胞癌では5.62E−02であり、大細胞癌では3.38E−01であり、小細胞癌で3.78E−02と決定された。   P-values for differences in expression levels of acid stable protease inhibitor transcripts that are detectable by the above amplicon in lung cancer samples versus normal tissue samples are determined by T-test, 9.43 E— for adenocarcinomas. 02, 5.62E-02 for squamous cell carcinoma, 3.38E-01 for large cell carcinoma, and 3.78E-02 for small cell carcinoma.

5倍下方制御の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、腺癌で3.73E−02、扁平上皮細胞癌で1.10E−02、大細胞癌で2.64E−02、小細胞癌で7.14E−05であった。上記値は、結果が統計的に有意であることを示す。   The 5-fold downregulation threshold was found to be different between cancer and normal samples, checked by Fisher's exact test, P value is 3.73E-02 for adenocarcinoma, squamous cell carcinoma in adenocarcinoma 1.10E-02, 2.64E-02 for large cell carcinoma and 7.14E-05 for small cell carcinoma. The above values indicate that the results are statistically significant.

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:Z25299seg20F順方向プライマーおよびZ25299seg20R逆方向プライマー。   Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used only as non-limiting examples of suitable primer pairs: Z25299seg20F forward primer and Z25299seg20R reverse Direction primer.

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:Z25299seg20。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : Z 25 299 seg 20.


順方向プライマー(配列番号1667):CTCCTGAACCCTACTCCAAGCA
逆方向プライマー(配列番号1668):CAGGCGATCCTATGGAAATCC
アンプリコン(配列番号1669):CTCCTGAACCCTACTCCAAGCACAGCCTCTGTCTGACTCCCTTGTCCTTCAAGAGAACTGTTCTCCAGGTCTCAGGGCCAGGATTTCCATAGGATCGCCTG

Forward primer (SEQ ID NO: 1667): CTCCTGAACCCTACTCCAAGCCA
Reverse primer (SEQ ID NO: 1668): CAGGCGATCCTATGGAAATCC
Amplicon (SEQ ID NO: 1669): CTCCTGAACCCTACTCCAAGCACAGCCTCTGTCTGACTCCTTTGTCCTTCAAGAGAACTGTTCTCCAGGTCCTCAGGGCCAGGATTTCCATAGGATCGCCTGG

正常および癌性肺組織における配列名Z25299seg23中に示すアンプリコンによって検出可能なホモ・サピエンス分泌性白血球プロテアーゼインヒビター(抗ロイコプロテイナーゼ)(SLPI)Z25299転写物の発現
seg23、Z25299seg23アンプリコン(配列番号1672)ならびにプライマーZ25299seg23F(配列番号1670)およびZ25299seg23R(配列番号1671)によって検出可能なホモ・サピエンス分泌性白血球プロテアーゼインヒビター(抗ロイコプロテイナーゼ)(SLPI)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2)の量の中央値で割った。次いで、この比の逆数を計算して、正常なPMサンプルの中央値に対する各サンプルの下方制御の倍率を得た。
Expression of homo-Sapiens secreting leukocyte protease inhibitor (anti-leukoproteinase) (SLPI) Z25299 transcript detectable by an amplicon as shown in sequence name Z25299 seg23 in normal and cancerous lung tissue seg23, Z25 299 seg23 amplicon (SEQ ID NO: 1672) The expression of homo-Sapiens secreting leukocyte protease inhibitor (anti-leukoproteinase) (SLPI) transcripts detectable by the primers Z25299seg23F (SEQ ID NO: 1670) and Z25299seg23R (SEQ ID NO: 1671) was measured by real-time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – PBGD-Amplicon, SEQ ID No. 334), HPRT1 (GenBank Accession No. NM_000194, Amplicon – HPRT1- Amplicons, SEQ ID NO: 1297), Ubiquitin (GenBank Accession No. BC000449, Amplicon – Ubiquitin-Amplicon SEQ ID NO: 328), and SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA-Amplicon The expression of SEQ ID NO: 331) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. The normalized amount of each RT sample was divided by the median of the amounts of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99 above, Table 2 above). The reciprocal of this ratio was then calculated to obtain the downregulation of each sample relative to the median of normal PM samples.

図68は、正常サンプルと比較した癌性肺サンプルにおける上記ホモ・サピエンス分泌性白血球プロテアーゼインヒビター(抗ロイコプロテイナーゼ)(SLPI)転写物の下方制御を示すヒストグラムである。   FIG. 68 is a histogram showing downregulation of the homo-Sapiens secreting leukocyte protease inhibitor (anti-leukoproteinase) (SLPI) transcript in cancerous lung samples as compared to normal samples.

図68から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンス分泌性白血球プロテアーゼインヒビター(抗ロイコプロテイナーゼ)(SLPI)転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2)よりも有意に低かった。明白には、15個の腺癌サンプルのうちの7個、16個の扁平上皮細胞癌サンプルのうちの9個、4個の大細胞癌サンプルのうちの3個、8個の小細胞癌サンプルのうちの8個で少なくとも10倍の下方制御が見出された。   As is apparent from FIG. 68, expression of the homo-Sapiens secreting leukocyte protease inhibitor (anti-leukoproteinase) (SLPI) transcript detectable by the above amplicon in the cancer sample was determined by the non-cancerous sample (Sample No. 46). 50, 90-93, 96-99, significantly lower than Table 2). Obviously, 7 out of 15 adenocarcinoma samples, 9 out of 16 squamous cell carcinoma samples, 3 out of 4 large cell carcinoma samples, 8 small cell carcinoma samples At least 10 fold downregulation was found with 8 of the

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:Z25299seg23F順方向プライマーおよびZ25299seg23R逆方向プライマー。   Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used only as non-limiting examples of suitable primer pairs: Z25299seg23F forward primer and Z25299seg23R reverse Direction primer.

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:Z25299seg23。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : Z 25 299 seg 23.


プライマー:
順方向プライマーZ25299seg23F(配列番号1670):CAAGCAATTGAGGGACCAGG
逆方向プライマーZ25299seg23R(配列番号1671):CAAAAAACATTGTTAATGAGAGAGATGAC
アンプリコンZ25299seg23F(配列番号1672):CAAGCAATTGAGGGACCAGGAAGTGGATCCTCTAGAGATGAGGAGGCATTCTGCTGGATGACTTTTAAAAATGTTTTCTCCAGAGTCATCTCTCTCATTAACAATGTTTTTTG

Primer:
Forward primer Z25299seg23F (SEQ ID NO: 1670): CAAGCAATTGAGGGACCAGG
Reverse primer Z25299seg23R (SEQ ID NO: 1671): CAAAAAACATTGTTAATGAGAGAGAGATGAC
Amplicon Z 25 299 seg 23 F (SEQ ID NO: 1672): CAAGCAATTGAGGGACCGAGATGGGATCCTC TAGAGATGAGGAGGGCATTCTGCTGGATGACTTTTAAAAATGTTTCTCCAGAGTCATCTCTCTCATTAACAATGTTTTTTG

異なる正常組織における配列名Z25299seg20中に示すアンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテイナーゼインヒビターZ25299転写物の発現
Z25299seg20アンプリコン(配列番号1669)ならびにプライマーZ25299seg23F(配列番号1667)およびZ25299seg20R(配列番号1668)によって検出可能な分泌性白血球プロテアーゼインヒビター転写物の発現を、実時間PCRによって測定した。並行して4つのハウスキーピング遺伝子−RPL19(GenBankアクセッション番号NM_000981、RPL19アンプリコン、配列番号1630)、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン、配列番号1633)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン、配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン、配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、卵巣サンプル(サンプル番号18〜20、表3)の量の中央値で割って、卵巣サンプルの中央値に対する各サンプルの相対発現値を得た。
Expression of the acid stable proteinase inhibitor Z25299 transcript which is a secretory leukocyte protease inhibitor detectable by an amplicon as shown in sequence name Z25299seg20 in different normal tissues Z25299seg20 amplicon (SEQ ID NO: 1669) and primer Z25299seg23F (SEQ ID NO: 1667) and The expression of secretory leukocyte protease inhibitor transcripts detectable by Z25299seg20R (SEQ ID NO: 1668) was measured by real time PCR. In parallel, four housekeeping genes-RPL19 (GenBank Accession No. NM_000981, RPL19 amplicon, SEQ ID No. 1630), TATA box (GenBank Accession No. NM_003194, TATA amplicon, SEQ ID No. 1633), ubiquitin (GenBank Accession No. The expression of BC000449, amplicon – ubiquitin-amplicon, SEQ ID NO: 328), and SDHA (GenBank Accession No. NM_004168, amplicon – SDHA-amplicon, SEQ ID NO: 331) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. The normalized amount of each RT sample was divided by the median of the amounts of ovary samples (Sample Nos. 18-20, Table 3) to obtain the relative expression value of each sample relative to the median of the ovary samples.


プライマー:
順方向プライマー(配列番号1667):CTCCTGAACCCTACTCCAAGCA
逆方向プライマー(配列番号1668):CAGGCGATCCTATGGAAATCC
アンプリコン(配列番号1669):CTCCTGAACCCTACTCCAAGCACAGCCTCTGTCTGACTCCCTTGTCCTTCAAGAGAACTGTTCTCCAGGTCTCAGGGCCAGGATTTCCATAGGATCGCCTG

Primer:
Forward primer (SEQ ID NO: 1667): CTCCTGAACCCTACTCCAAGCCA
Reverse primer (SEQ ID NO: 1668): CAGGCGATCCTATGGAAATCC
Amplicon (SEQ ID NO: 1669): CTCCTGAACCCTACTCCAAGCACAGCCTCTGTCTGACTCCTTTGTCCTTCAAGAGAACTGTTCTCCAGGTCCTCAGGGCCAGGATTTCCATAGGATCGCCTGG

結果を図69に示し、これは、異なる正常組織における配列名Z25299seg20中に示すアンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテイナーゼインヒビターZ25299転写物の発現を示す。   The results are shown in FIG. 69, which shows the expression of the acid stable proteinase inhibitor Z25299 transcript which is a secreted leukocyte protease inhibitor detectable by the amplicon shown in the sequence name Z25299seg20 in different normal tissues.

異なる正常組織における配列名Z25299seg23中に示すアンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターZ25299転写物の発現
Z25299seg23アンプリコン(配列番号1672)ならびにプライマーZ25299seg23F(配列番号1670)およびZ25299seg23R(配列番号1671)によって検出可能な分泌性白血球プロテアーゼインヒビター転写物の発現を、実時間PCRによって測定した。並行して4つのハウスキーピング遺伝子−RPL19(GenBankアクセッション番号NM_000981、RPL19アンプリコン、配列番号1630)、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン、配列番号1633)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン、配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン、配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、卵巣サンプル(サンプル番号18〜20、表3)の量の中央値で割って、卵巣サンプルの中央値に対する各サンプルの相対発現値を得た。
Expression of the detectable secretory leukocyte protease inhibitor Z25299 transcript by the amplicon shown in the sequence name Z25299seg23 in different normal tissues Z25299seg23 amplicon (SEQ ID NO: 1672) and by primers Z25299seg23F (SEQ ID NO: 1670) and Z25299seg23R (SEQ ID NO: 1671) The expression of detectable secretory leukocyte protease inhibitor transcripts was measured by real time PCR. In parallel, four housekeeping genes-RPL19 (GenBank Accession No. NM_000981, RPL19 amplicon, SEQ ID No. 1630), TATA box (GenBank Accession No. NM_003194, TATA amplicon, SEQ ID No. 1633), ubiquitin (GenBank Accession No. The expression of BC000449, amplicon – ubiquitin-amplicon, SEQ ID NO: 328), and SDHA (GenBank Accession No. NM_004168, amplicon – SDHA-amplicon, SEQ ID NO: 331) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. The normalized amount of each RT sample was divided by the median of the amounts of ovary samples (Sample Nos. 18-20, Table 3) to obtain the relative expression value of each sample relative to the median of the ovary samples.


プライマー:
順方向プライマーZ25299seg23F(配列番号1670):CAAGCAATTGAGGGACCAGG
逆方向プライマーZ25299seg23R(配列番号1671):CAAAAAACATTGTTAATGAGAGAGATGAC
アンプリコンZ25299seg23F(配列番号1672):CAAGCAATTGAGGGACCAGGAAGTGGATCCTCTAGAGATGAGGAGGCATTCTGCTGGATGACTTTTAAAAATGTTTTCTCCAGAGTCATCTCTCTCATTAACAATGTTTTTTG

Primer:
Forward primer Z25299seg23F (SEQ ID NO: 1670): CAAGCAATTGAGGGACCAGG
Reverse primer Z25299seg23R (SEQ ID NO: 1671): CAAAAAACATTGTTAATGAGAGAGAGATGAC
Amplicon Z 25 299 seg 23 F (SEQ ID NO: 1672): CAAGCAATTGAGGGACCGAGATGGGATCCTC TAGAGATGAGGAGGGCATTCTGCTGGATGACTTTTAAAAATGTTTCTCCAGAGTCATCTCTCTCATTAACAATGTTTTTTG

結果を図70に示し、これは、異なる正常組織における配列名Z25299seg23中に示すアンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテイナーゼインヒビターZ25299転写物の発現を示す。   The results are shown in FIG. 70, which shows the expression of the acid stable proteinase inhibitor Z25299 transcript which is a secreted leukocyte protease inhibitor detectable by the amplicon shown in the sequence name Z25299seg23 in different normal tissues.

クラスターHSSTROL3の説明
クラスターHSSTROL3は、目的の6つの転写物および16個のセグメントを特徴とし、その名称を、それぞれ表1064および1065に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表1066に示す。
Description of cluster HSSTROL3 The cluster HSSTROL3 is characterized by 6 transcripts and 16 segments of interest, the names of which are given in tables 1064 and 1065 respectively, and the sequence itself is given at the end of the application. Selected protein variants are shown in Table 1066.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるストロメリシン−3前駆体(SwissProtアクセッション識別子MM11_HUMAN、同義語EC3.4.24.−、マトリクス金属プロテイナーゼ−11、MMP−11、ST3、SL−3としても公知である)(配列番号1455)の変異型である。   These sequences are stromelysin-3 precursors (SwissProt accession identifier MM11_HUMAN, synonym EC3.4.24.-, matrix metalloproteinase-11, which is a known protein, previously known herein as a protein). It is a variant of (also known as MMP-11, ST3, SL-3) (SEQ ID NO: 1455).

タンパク質ストロメリシン−3前駆体は、以下の機能を有することが公知であるか、そのように見なされている:上皮悪性腫瘍の進行において重要な役割を果たし得る。タンパク質ストロメリシン−3前駆体の配列を、「ストロメリシン−3前駆体アミノ酸配列」として出願書類の最後に示す。   The protein stromelysin-3 precursor is known or considered to have the following functions: It may play an important role in the progression of epithelial malignancies. The sequence of the protein stromelysin-3 precursor is shown at the end of the application as "stromelysin-3 precursor amino acid sequence".

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けであるタンパク質分解およびペプチド分解、発生過程、形態形成、分子機能に関連する注釈付けであるストロメリシン3、カルシウム結合、亜鉛結合、ヒドロラーゼ、ならびに細胞成分に関連する注釈付けである細胞外基質。   The following GO annotation applies to previously known proteins. The following annotations were found: annotations related to biological processes: proteolysis and peptide degradation, developmental processes, morphogenesis, annotations related to molecular function: stromelysin 3, calcium binding, zinc binding , Hydrolases, as well as extracellular substrates that are annotations related to cellular components.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

クラスターHSSTROL3を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の左側のカラム中の用語「数」および図38のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   Cluster HSSTROL3 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The terms “number” in the left column of the table and the numbers on the y-axis of FIG. 38 refer to the weighted expression of ESTs in each category as “ppm” (the ppm of ESTs of a particular cluster in this category by ppm) Ratio of expression to expression of all ESTs).

概して、図38および表1067中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):移行上皮癌、上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および膵臓癌。   In general, as shown for the histograms in FIG. 38 and Table 1067, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: transitional cell carcinoma, epithelial malignancy, a mixture of malignancies from different tissues, and pancreatic cancer.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、クラスターHSSTROL3は、上の表1に列挙した6つの転写物を特徴とする。これらの転写物は、タンパク質ストロメリシン−3前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster HSSTROL3 is characterized by the six transcripts listed in Table 1 above. These transcripts encode proteins which are variants of the protein stromelysin-3 precursor. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質HSSTROL3_P4は、出願書類の最後に示すアミノ酸配列を有し、転写物HSSTROL3_T5によってコードされる。公知のタンパク質(ストロメリシン−3前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HSSTROL3_P4 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HSSTROL3_T5. An alignment to a known protein (stromelysin-3 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HSSTROL3_P4とMM11_HUMANとの間の比較の報告
1.MM11_HUMANのアミノ酸1〜163に対応し、HSSTROL3_P4のアミノ酸1〜163にも対応するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWと少なくとも90%相同な第1のアミノ酸配列と、HSSTROL3_P4のアミノ酸164に対応する架橋アミノ酸Hと、MM11_HUMANのアミノ酸165〜445に対応し、HSSTROL3_P4のアミノ酸165〜445にも対応するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQGAQYWVYDGEKPVLGPAPLTELGLVRFPVHAALVWGPEKNKIYFFRGRDYWRFHPSTRRVDSPVPRRATDWRGVPSEIDAAFQDADGと少なくとも90%相同な第2のアミノ酸配列と、HSSTROL3_P4のアミノ酸446〜496に対応する配列ALGVRQLVGGGHSSRFSHLVVAGLPHACHRKSGSSSQVLCPEPSALLSVAGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、架橋アミノ酸、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、HSSTROL3_P4をコードする単離キメラポリペプチド。
Report of the comparison between HSSTROL3_P4 and MM11_HUMAN 1. JLPH JH JILs, and is a corresponding UH JIV J III NIV J III JV J III J 7 J 7 J7 J 7 J7 J7 J7 J7 Jc This is: JELs; GDDLPF corresponding to 445 and corresponding to amino acids 165 to 445 of HSSTROL3_P4 And at least 90% homologous second amino acid sequence JipijijiaierueieichieiefuefuPikeitieichiaruijidibuieichiefudiwaidiitidaburyutiaijididikyujitidieruerukyubuieieieichiiefujieichibuierujierukyueichititieieikeieieruemuesueiefuwaitiefuaruwaiPieruesueruesuPididishiarujibuikyueichieruwaijikyuPidaburyuPitibuitiesuarutiPieieruJipikyueijiaiditienuiaieiPieruiPidieiPiPidieishiieiesuefudieibuiesutiaiarujiieruefuefuefukeieijiefubuidaburyuarueruarujijikyuerukyuPijiwaiPieierueiesuarueichidaburyukyujieruPiesupibuidieieiefuidieikyujieichiaidaburyuefuefukyujieikyuwaidaburyubuiwaidijiikeiPibuieruJipiEipierutiierujierubuiaruefuPibuieichieieierubuidaburyuJipiikeienukeiaiwaiefuefuarujiarudiwaidaburyuaruefueichiPiesutiaruarubuidiesuPVPRRATDWRGVPSEIDAAFQDADG, sequence ALGVR corresponding to amino acids 446-496 of HSSTROL3_P4 A polypeptide having at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95%, of a third amino acid sequence homologous to the polypeptide having LVGGGHSSRFSHLVLVAGLPHACHRKSGSS SQVCLPEPSALLSVAG; An isolated chimeric polypeptide encoding HSSTROL3_P4, wherein the amino acid sequence of 1, the bridging amino acid, the second amino acid sequence, and the third amino acid sequence are adjacent and in sequential order.

2.HSSTROL3_P4中の配列ALGVRQLVGGGHSSRFSHLVVAGLPHACHRKSGSSSQVLCPEPSALLSVAGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HSSTROL3_P4のテールをコードする単離ポリペプチド。   2. HSSTROL3_P4 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence ALGVRQLVGGGHSSRFSHLVGALPGHACHRKSGSSSQVCLPEPSALLSVAG in HSSTROL3_P4 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HSSTROL3_P4はまた、表1069に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSSTROL3_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HSSTROL3_P4 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 1069) It is indicated whether it is known and the presence of a known SNP in the mutant protein HSSTROL3_P4 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質、HSSTROL3_P4は、以下の転写物によってコードされる:HSSTROL3_T5(配列は出願書類の最後に示す)。転写物HSSTROL3_T5のコード部分を太字で示し、このコード部分は24位から開始され、1511位で終結する。転写物はまた、表1070に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSSTROL3_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein, HSSTROL3_P4, is encoded by the following transcript: HSSTROL3_T5 (sequences shown at the end of the application). The coding portion of the transcript HSSTROL3_T5 is shown in bold, starting from position 24 and ending at position 1511. The transcript also has the following SNPs listed in Table 1070 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, the mutein HSSTROL3_P4 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質HSSTROL3_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物HSSTROL3_T8およびHSSTROL3_T9によってコードされる。公知のタンパク質(ストロメリシン−3前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HSSTROL3_P5 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcripts HSSTROL3_T8 and HSSTROL3_T9. An alignment to a known protein (stromelysin-3 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HSSTROL3_P5とMM11_HUMANとの間の比較の報告
1.MM11_HUMANのアミノ酸1〜163に対応し、HSSTROL3_P5のアミノ酸1〜163にも対応するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWと少なくとも90%相同な第1のアミノ酸配列と、HSSTROL3_P5のアミノ酸164に対応する架橋アミノ酸Hと、MM11_HUMANのアミノ酸165〜358に対応し、HSSTROL3_P5のアミノ酸165〜358にも対応するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQと少なくとも90%相同な第2のアミノ酸配列と、HSSTROL3_P5のアミノ酸359〜382に対応する配列ELGFPSSTGRDESLEHCRCQGLHKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、架橋アミノ酸、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、HSSTROL3_P5をコードする単離キメラポリペプチド。
Report of the comparison between HSSTROL3_P5 and MM11_HUMAN 1. JLPH JH JILs, and is a corresponding UH JIV J III JIV J III NIV J III JV J III JV J III JV J III JIV J 7 NvH Jl Jl s. GDDLFF corresponding to 358 and corresponding to amino acids 165 to 358 of HSSTROL3_P5 And at least 90% homologous second amino acid sequence JipijijiaierueieichieiefuefuPikeitieichiaruijidibuieichiefudiwaidiitidaburyutiaijididikyujitidieruerukyubuieieieichiiefujieichibuierujierukyueichititieieikeieieruemuesueiefuwaitiefuaruwaiPieruesueruesuPididishiarujibuikyueichieruwaijikyuPidaburyuPitibuitiesuarutiPieieruJipikyueijiaiditienuiaieiPieruiPidieiPiPidieishiieiesuefudieibuiesutiaiarujiieruefuefuefukeieijiefubuidaburyuarueruarujijikyuerukyuPijiwaiPieierueiesuRHWQGLPSPVDAAFEDAQGHIWFFQ, polypeptide at least 70% with a sequence corresponding to ELGFPSSTGRDESLEHCRCQGLHK to amino acid 359-382 of HSSTROL3_P5, optionally at least 80%, preferably at least 85%, more Preferably at least 90%, most preferred Or a third amino acid sequence that is at least 95% homologous, wherein the first amino acid sequence, the bridging amino acid, the second amino acid sequence, and the third amino acid sequence are adjacent and in a consecutive order, An isolated chimeric polypeptide encoding HSSTROL3_P5.

2.HSSTROL3_P5中の配列ELGFPSSTGRDESLEHCRCQGLHKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HSSTROL3_P5のテールをコードする単離ポリペプチド。   2. HSSTROL3_P5 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence ELGFPSSTGRDESLEHCRCQGLHK in HSSTROL3_P5 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HSSTROL3_P5はまた、表1071に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSSTROL3_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HSSTROL3_P5 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 1071) It is shown whether it is known and the presence of a known SNP in the mutant protein HSSTROL3_P5 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質、HSSTROL3_P5は、以下の転写物によってコードされる:HSSTROL3_T8およびHSSTROL3_T9(配列は出願書類の最後に示す)。   The mutein, HSSTROL3_P5, is encoded by the following transcript: HSSTROL3_T8 and HSSTROL3_T9 (sequences shown at the end of the application).

転写物HSSTROL3_T8のコード部分を太字で示し、このコード部分は24位から開始され、1569位で終結する。転写物はまた、表1072に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSSTROL3_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The coding portion of the transcript HSSTROL3_T8 is shown in bold, starting from position 24 and ending at position 1569. The transcript also has the following SNPs listed in Table 1072 (showing its position on the nucleotide sequence and listing another nucleic acid, the last column shows whether the SNP is known, the mutein HSSTROL3_P5 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

転写物HSSTROL3_T9のコード部分を太字で示し、このコード部分は24位から開始され、1169位で終結する。転写物はまた、表1073に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSSTROL3_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The coding portion of the transcript HSSTROL3_T9 is shown in bold, starting from position 24 and ending at position 1169. The transcript also has the following SNPs listed in Table 1073 (showing its position on the nucleotide sequence and listing another nucleic acid, the last column shows if the SNP is known, the mutein HSSTROL3_P5 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質HSSTROL3_P7は、出願書類の最後に示すアミノ酸配列を有し、転写物HSSTROL3_T10によってコードされる。公知のタンパク質(ストロメリシン−3前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HSSTROL3_P7 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HSSTROL3_T10. An alignment to a known protein (stromelysin-3 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HSSTROL3_P7とMM11_HUMANとの間の比較の報告
1.MM11_HUMANのアミノ酸1〜163に対応し、HSSTROL3_P7のアミノ酸1〜163にも対応するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWと少なくとも90%相同な第1のアミノ酸配列と、HSSTROL3_P7のアミノ酸164に対応する架橋アミノ酸Hと、MM11_HUMANのアミノ酸165〜359に対応し、HSSTROL3_P7のアミノ酸165〜359にも対応するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQGと少なくとも90%相同な第2のアミノ酸配列と、HSSTROL3_P7のアミノ酸360〜370に対応する配列TTGVSTPAPGVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、架橋アミノ酸、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、HSSTROL3_P7をコードする単離キメラポリペプチド。
Report of the comparison between HSSTROL3_P7 and MM11_HUMAN 1. JLPH JH JILs, and is a corresponding UH JIV J III JIV J III J 7 J 7 J 7 J 7 J 7 J 7 J7Gvl 7 UoGl 7 UoG OoIl Jl. GDDLPF corresponding to 359 and corresponding to amino acids 165 to 359 of HSSTROL3_P7 And at least 90% homologous second amino acid sequence JipijijiaierueieichieiefuefuPikeitieichiaruijidibuieichiefudiwaidiitidaburyutiaijididikyujitidieruerukyubuieieieichiiefujieichibuierujierukyueichititieieikeieieruemuesueiefuwaitiefuaruwaiPieruesueruesuPididishiarujibuikyueichieruwaijikyuPidaburyuPitibuitiesuarutiPieieruJipikyueijiaiditienuiaieiPieruiPidieiPiPidieishiieiesuefudieibuiesutiaiarujiieruefuefuefukeieijiefubuidaburyuarueruarujijikyuerukyuPijiwaiPieierueiesuaruHWQGLPSPVDAAFEDAQGHIWFFQG, polypeptide at least 70% with a sequence corresponding to TTGVSTPAPGV to amino acid 360-370 of HSSTROL3_P7, optionally at least 80%, preferably at least 85%, more Preferably at least 90%, most preferably at least 95% A single HSSTROL3_P7 encoding sequence comprising the same third amino acid sequence, wherein said first amino acid sequence, bridging amino acid, second amino acid sequence, and third amino acid sequence are adjacent and in sequential order. Detached chimeric polypeptide.

2.HSSTROL3_P7中の配列TTGVSTPAPGVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HSSTROL3_P7のテールをコードする単離ポリペプチド。   2. HSSTROL3_P7 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence TTGVSTPAPGV in HSSTROL3_P7 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HSSTROL3_P7はまた、表1074に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSSTROL3_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HSSTROL3_P7 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 1074) It is shown whether it is known and the presence of a known SNP in the mutant protein HSSTROL3_P7 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質、HSSTROL3_P7は、以下の転写物によってコードされる:HSSTROL3_T10(配列は出願書類の最後に示す)。転写物HSSTROL3_T10のコード部分を太字で示し、このコード部分は24位から開始され、1133位で終結する。転写物はまた、表1075に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSSTROL3_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein, HSSTROL3_P7, is encoded by the following transcript: HSSTROL3_T10 (sequences shown at the end of the application). The coding part of the transcript HSSTROL3_T10 is shown in bold, starting from position 24 and ending at position 1133. The transcript also has the following SNPs listed in Table 1075 (showing its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, the mutein HSSTROL3_P7 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質HSSTROL3_P8は、出願書類の最後に示すアミノ酸配列を有し、転写物HSSTROL3_T11によってコードされる。公知のタンパク質(ストロメリシン−3前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HSSTROL3_P8 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HSSTROL3_T11. An alignment to a known protein (stromelysin-3 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HSSTROL3_P8とMM11_HUMANとの間の比較の報告
1.MM11_HUMANのアミノ酸1〜163に対応し、HSSTROL3_P8のアミノ酸1〜163にも対応するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWと少なくとも90%相同な第1のアミノ酸配列と、HSSTROL3_P8のアミノ酸164に対応する架橋アミノ酸Hと、MM11_HUMANのアミノ酸165〜286に対応し、HSSTROL3_P8のアミノ酸165〜286にも対応するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEと少なくとも90%相同な第2のアミノ酸配列と、HSSTROL3_P8のアミノ酸278〜301に対応する配列VRPCLPVPLLLCWPLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、架橋アミノ酸、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、HSSTROL3_P8をコードする単離キメラポリペプチド。
Report of the comparison between HSSTROL3_P8 and MM11_HUMAN 1. JLPH JH JILs, and is used as a N-HIV J III JIV J III N- while, and can also be used as a UH. GDDLPF corresponding to 286 286 and also corresponding to amino acids 165 to 286 of HSSTROL3_P8 GPGGILAHAFFPKTHREGDVHFDYDETIGDDQGTDLLQVAAHEFGHGLQHTTAAKALMSAFYTFRYPLSLDDCDRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLE The second amino acid sequence corresponding to the amino acid 278 to 301 of HSSTROL3. Is at least 90%, most preferably at least 95% homologous with a third amino acid sequence, said first amino acid sequence, the bridging amino acid, the second amino acid sequence and the third amino acid sequence being adjacent and Continuously In order, the isolated chimeric polypeptide coding HSSTROL3_P8.

2.HSSTROL3_P8中の配列VRPCLPVPLLLCWPLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HSSTROL3_P8のテールをコードする単離ポリペプチド。   2. HSSTROL3_P8 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 90%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence VRPCLPVPLLLCWPL in HSSTROL3_P8 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HSSTROL3_P8はまた、表1076に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSSTROL3_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HSSTROL3_P8 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 1076) It is shown whether it is known and the presence of a known SNP in the mutant protein HSSTROL3_P8 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質、HSSTROL3_P8は、以下の転写物によってコードされる:HSSTROL3_T11(配列は出願書類の最後に示す)。転写物HSSTROL3_T11のコード部分を太字で示し、このコード部分は24位から開始され、926位で終結する。転写物はまた、表1077に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSSTROL3_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein, HSSTROL3_P8, is encoded by the following transcript: HSSTROL3_T11 (sequences shown at the end of the application). The coding part of the transcript HSSTROL3_T11 is shown in bold, starting from position 24 and ending at position 926. The transcript also has the following SNPs listed in Table 1077 (showing its position on the nucleotide sequence and listing another nucleic acid, the last column shows whether the SNP is known, the mutein HSSTROL3_P8 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質HSSTROL3_P9は、出願書類の最後に示すアミノ酸配列を有し、転写物HSSTROL3_T12によってコードされる。公知のタンパク質(ストロメリシン−3前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HSSTROL3_P9 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HSSTROL3_T12. An alignment to a known protein (stromelysin-3 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HSSTROL3_P9とMM11_HUMANとの間の比較の報告
1.MM11_HUMANのアミノ酸1〜96に対応し、HSSTROL3_P9のアミノ酸1〜96にも対応するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKと少なくとも90%相同な第1のアミノ酸配列と、MM11_HUMANのアミノ酸113〜163に対応し、HSSTROL3_P9のアミノ酸97〜147にも対応するRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWと少なくとも90%相同な第2のアミノ酸配列と、HSSTROL3_P9のアミノ酸148に対応する架橋アミノ酸Hと、MM11_HUMANのアミノ酸165〜359に対応し、HSSTROL3_P9のアミノ酸149〜343にも対応するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQGと少なくとも90%相同な第3のアミノ酸配列と、HSSTROL3_P9のアミノ酸344〜354に対応する配列TTGVSTPAPGVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第4のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、架橋アミノ酸、第3のアミノ酸配列、および第4のアミノ酸配列が、隣接し、且つ連続した順序にある、HSSTROL3_P9をコードする単離キメラポリペプチド。
Report of the comparison between HSSTROL3_P9 and MM11_HUMAN 1. A corresponding amino acid 1 to 96 of MM11_HUMAN and corresponding to amino acid 1 to 96 of HSSTROL3_P9 MAPAAWLRSAAARALLPPMLLLLLQPPOLARALPPDVHHLHAERRGPQPWHAALPSPSPAPAPATQ EAPRPASSLRPPRCGVPPDSGLSARNRQK The first amino acid sequence at least 90% homologous to the amino acids 11 to 11 and 11 to 17 And the corresponding second amino acid sequence at least 90% homologous to RILRFPWQLVQEQVRQTM AAELKVWSDVTPLTFTEVHEGRADIMIDARYW, the bridging amino acid H corresponding to amino acid 148 of HSSTROL3_P9, MM Corresponding to amino acids 165-359 of 1_HUMAN, the polypeptide having a GDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQG corresponding to amino acids 149-343 of HSSTROL3_P9 the third amino acid sequence at least 90% homologous, sequences corresponding to TTGVSTPAPGV to amino acid 344-354 of HSSTROL3_P9 And at least 70%, A fourth amino acid sequence which is optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; said first amino acid sequence, said second amino acid sequence An isolated chimeric polypeptide encoding HSSTROL3_P9, wherein the bridging amino acid, the third amino acid sequence, and the fourth amino acid sequence are in contiguous and sequential order.

2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がKRを含み、以下の構造:アミノ酸番号96−x〜96のいずれかから始まり、アミノ酸番号97+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HSSTROL3_P9の縁部分をコードする単離キメラポリペプチド。   2. Length “n” (wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long, most preferably at least about 50 amino acids in length, at least two amino acids comprising KR, starting from any of the following structures: amino acid numbers 96-x to 96, amino acid numbers 97 + ((n-2) -x) (formula An isolated chimeric polypeptide encoding a rim portion of HSSTROL3_P9, comprising a polypeptide having a sequence terminating in: x) varying from 0 to n-2).

3.HSSTROL3_P9中の配列TTGVSTPAPGVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HSSTROL3_P9のテールをコードする単離ポリペプチド。   3. HSSTROL3_P9 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence TTGVSTPAPGV in HSSTROL3_P9 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HSSTROL3_P9はまた、表1078に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSSTROL3_P9配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HSSTROL3_P9 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 1078) It is shown whether it is known and the presence of a known SNP in the mutant protein HSSTROL3_P9 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質、HSSTROL3_P9は、以下の転写物によってコードされる:HSSTROL3_T12(配列は出願書類の最後に示す)。転写物HSSTROL3_T12のコード部分を太字で示し、このコード部分は24位から開始され、1085位で終結する。転写物はまた、表1079に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSSTROL3_P9配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein, HSSTROL3_P9, is encoded by the following transcript: HSSTROL3_T12 (sequences shown at the end of the application). The coding portion of the transcript HSSTROL3_T12 is shown in bold and this coding portion starts from position 24 and ends at position 1085. The transcript also has the following SNPs listed in Table 1079 (showing its position on the nucleotide sequence and listing another nucleic acid, the last column shows if the SNP is known, the mutein HSSTROL3_P9 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターHSSTROL3は、上の表2に列挙した16個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster HSSTROL3 is characterized by the sixteen segments listed in Table 2 above, the sequences of which are shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターHSSTROL3_node_6は、14個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。以下の表1080は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSSTROL3_node_6 of the present invention is supported by 14 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T8, HSSTROL3_T9, HSSTROL3_T10, HSSTROL3_T11, and HSSTROL3_T12. Table 1080 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHSSTROL3_node_10は、21個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。以下の表1081は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSSTROL3_node_10 of the present invention is supported by 21 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T8, HSSTROL3_T9, HSSTROL3_T10, HSSTROL3_T11, and HSSTROL3_T12. Table 1081 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHSSTROL3_node_13は、36個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。以下の表1082は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSSTROL3_node_13 of the present invention is supported by 36 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T8, HSSTROL3_T9, HSSTROL3_T10, HSSTROL3_T11, and HSSTROL3_T12. Table 1082 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHSSTROL3_node_15は、47個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。以下の表1083は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSSTROL3_node_15 of the present invention is supported by 47 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T8, HSSTROL3_T9, HSSTROL3_T10, HSSTROL3_T11, and HSSTROL3_T12. Table 1083 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHSSTROL3_node_19は、63個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。以下の表1084は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSSTROL3_node_19 of the present invention is supported by 63 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T8, HSSTROL3_T9, HSSTROL3_T10, HSSTROL3_T11, and HSSTROL3_T12. Table 1084 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHSSTROL3_node_21は、61個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。以下の表1085は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSSTROL3_node_21 of the present invention is supported by 61 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T8, HSSTROL3_T9, HSSTROL3_T10, HSSTROL3_T11, and HSSTROL3_T12. Table 1085 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHSSTROL3_node_24は、7個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T8およびHSSTROL3_T9。以下の表1086は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSSTROL3_node_24 of the present invention is supported by seven libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSSTROL3_T8 and HSSTROL3_T9. Table 1086 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHSSTROL3_node_25は、13個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T8。以下の表1087は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSSTROL3_node_25 of the present invention is supported by 13 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSSTROL3_T8. Table 1087 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHSSTROL3_node_26は、55個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、およびHSSTROL3_T11。以下の表1088は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSSTROL3_node 26 according to the invention is supported by 55 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T8, HSSTROL3_T9, and HSSTROL3_T11. Table 1088 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHSSTROL3_node_28は、10個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T9、およびHSSTROL3_T10。以下の表1089は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSSTROL3_node_28 of the present invention is supported by 10 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T9, and HSSTROL3_T10. Table 1089 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHSSTROL3_node_29は、109個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。以下の表1090は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSSTROL3_node_29 of the present invention is supported by 109 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T8, HSSTROL3_T9, HSSTROL3_T10, HSSTROL3_T11, and HSSTROL3_T12. Table 1090 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターHSSTROL3_node_11は、25個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、およびHSSTROL3_T11。以下の表1091は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSSTROL3_node_11 of the present invention is supported by 25 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T8, HSSTROL3_T9, HSSTROL3_T10, and HSSTROL3_T11. Table 1091 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHSSTROL3_node_17は、45個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。以下の表1092は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSSTROL3_node_17 of the present invention is supported by 45 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T8, HSSTROL3_T9, HSSTROL3_T10, HSSTROL3_T11, and HSSTROL3_T12. Table 1092 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHSSTROL3_node_18を、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。以下の表1093は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSSTROL3_node_18 according to the invention can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T8, HSSTROL3_T9, HSSTROL3_T10, HSSTROL3_T11, and HSSTROL3_T12. Table 1093 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHSSTROL3_node_20は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T11。以下の表1094は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSSTROL3_node_20 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: HSSTROL3_T11. Table 1094 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHSSTROL3_node_27は、50個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。以下の表1095は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSSTROL3_node_27 of the present invention is supported by 50 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T8, HSSTROL3_T9, HSSTROL3_T10, HSSTROL3_T11, and HSSTROL3_T12. Table 1095 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: MM11_HUMAN

Sequence documentation:

Alignment of: HSSTROL3_P4 x MM11_HUMAN ..

Alignment segment 1/1:

Quality: 4444.00 Escore: 0
Matching length: 445 Total length: 445
Matching Percent Similarity: 99.78 Matching Percent Identity: 99.78
Total Percent Similarity: 99.78 Total Percent Identity: 99.78
Gaps: 0

Alignment:
. . . . .
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
. . . . .
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
. . . . .
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
. . . . .
151 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
||||||||||||| ||||||||||||||||||||||||||||||||||||
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
. . . . .
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
. . . . .
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
. . . . .
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350
. . . . .
351 QGHIWFFQGAQYWVYDGEKPVLGPAPLTELGLVRFPVHAALVWGPEKNKI 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 QGHIWFFQGAQYWVYDGEKPVLGPAPLTELGLVRFPVHAALVWGPEKNKI 400
. . . .
401 YFFRGRDYWRFHPSTRRVDSPVPRRATDWRGVPSEIDAAFQDADG 445
|||||||||||||||||||||||||||||||||||||||||||||
401 YFFRGRDYWRFHPSTRRVDSPVPRRATDWRGVPSEIDAAFQDADG 445






Sequence name: MM11_HUMAN

Sequence documentation:

Alignment of: HSSTROL3_P5 x MM11_HUMAN ..

Alignment segment 1/1:

Quality: 3566.00 Escore: 0
Matching length: 358 Total length: 358
Matching Percent Similarity: 99.72 Matching Percent Identity: 99.72
Total Percent Similarity: 99.72 Total Percent Identity: 99.72
Gaps: 0

Alignment:
. . . . .
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
. . . . .
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
. . . . .
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
. . . . .
151 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
||||||||||||| ||||||||||||||||||||||||||||||||||||
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
. . . . .
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
. . . . .
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
. . . . .
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350

351 QGHIWFFQ 358
||||||||
351 QGHIWFFQ 358






Sequence name: MM11_HUMAN

Sequence documentation:

Alignment of: HSSTROL3_P7 x MM11_HUMAN ..

Alignment segment 1/1:

Quality: 3575.00 Escore: 0
Matching length: 359 Total length: 359
Matching Percent Similarity: 99.72 Matching Percent Identity: 99.72
Total Percent Similarity: 99.72 Total Percent Identity: 99.72
Gaps: 0

Alignment:
. . . . .
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
. . . . .
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
. . . . .
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
. . . . .
151 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
||||||||||||| ||||||||||||||||||||||||||||||||||||
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
. . . . .
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
. . . . .
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
. . . . .
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350

351 QGHIWFFQG 359
|||||||||
351 QGHIWFFQG 359






Sequence name: MM11_HUMAN

Sequence documentation:

Alignment of: HSSTROL3_P8 x MM11_HUMAN ..

Alignment segment 1/1:

Quality: 2838.00 Escore: 0
Matching length: 286 Total length: 286
Matching Percent Similarity: 99.65 Matching Percent Identity: 99.65
Total Percent Similarity: 99.65 Total Percent Identity: 99.65
Gaps: 0

Alignment:
. . . . .
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
. . . . .
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
. . . . .
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
. . . . .
151 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
||||||||||||| ||||||||||||||||||||||||||||||||||||
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
. . . . .
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
. . .
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLE 286
||||||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLE 286






Sequence name: MM11_HUMAN

Sequence documentation:

Alignment of: HSSTROL3_P9 x MM11_HUMAN ..

Alignment segment 1/1:

Quality: 3316.00 Escore: 0
Matching length: 343 Total length: 359
Matching Percent Similarity: 99.71 Matching Percent Identity: 99.71
Total Percent Similarity: 95.26 Total Percent Identity: 95.26
Gaps: 1

Alignment:
. . . . .
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
. . . . .
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQK.... 96
||||||||||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
. . . . .
97 ............RILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 134
||||||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
. . . . .
135 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 184
||||||||||||| ||||||||||||||||||||||||||||||||||||
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
. . . . .
185 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 234
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
. . . . .
235 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 284
||||||||||||||||||||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
. . . . .
285 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 334
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350

335 QGHIWFFQG 343
|||||||||
351 QGHIWFFQG 359



Mutated protein alignment against previously known proteins:
Sequence name: MM11_HUMAN

Sequence documentation:

Alignment of: HSSTROL3_P4 x MM11_HUMAN ..

Alignment segment 1/1:

Quality: 4444.00 Escore: 0
Matching length: 445 Total length: 445
Matching Percent Similarity: 99.78 Matching Percent Identity: 99.78
Total Percent Similarity: 99.78 Total Percent Identity: 99.78
Gaps: 0

Alignment:
....
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQ 50
||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQ 50
....
51 WHAALPSSPAPAPATQ EAPRPASS LRP PRC GVP PDS DGL SAR NRQ KRFVL 100
||||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQ EAPRPASS LRP PRC GVP PDS DGL SAR NRQ KRFVL 100
....
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTM AEALKVWSDVTPLTFTEVHE 150
||||||||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTM AEALKVWSDVTPLTFTEVHE 150
....
151 GRADIMIDFARYWHGDDDLPFDPGPGILAHAFFFPKTHREGDVHFDYDETWT 200
||||||||||||||||||||||||||||||||||||||||
151 GRAMIMIDFARYWDGDDLPLFPGPGILAHAFFFPKTHREGDVHFDYDETWT 200
....
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMFA YTFRYPLSLSPDDC 250
||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMFA YTFRYPLSLSPDDC 250
....
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPACEASFA 300
||||||||||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPACEASFA 300
....
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPalasRHWQGLPSPVDAAFEDA 350
||||||||||||||||||||||||||||||||||||||||
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPalasRHWQGLPSPVDAAFEDA 350
....
351 QGHIWFFQGAQYWVYDGEKPVLGPAPLTELGLVRFPVHAALVWGPEKNKI 400
||||||||||||||||||||||||||||||||||||||||
351 QGHIWFFQGAQYWVYDGEKPVLGPAPLTELGLVRFPVHAALVWGPEKNKI 400
....
401 YFFRGRDYWRFHPSTRRVDSPPVPRATTDWRGVPSEIDAAFQDADG 445
|||||||||||||||||||||||||||||||||||||||
401 YFFRGRDYWRFHPSTRRVDSPPVPRATTDWRGVPSEIDAAFQDADG 445






Sequence name: MM11_HUMAN

Sequence documentation:

Alignment of: HSSTROL3_P5 x MM11_HUMAN ..

Alignment segment 1/1:

Quality: 3566.00 Escore: 0
Matching length: 358 Total length: 358
Matching Percent Similarity: 99.72 Matching Percent Identity: 99.72
Total Percent Similarity: 99.72 Total Percent Identity: 99.72
Gaps: 0

Alignment:
....
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQ 50
||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQ 50
....
51 WHAALPSSPAPAPATQ EAPRPASS LRP PRC GVP PDS DGL SAR NRQ KRFVL 100
||||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQ EAPRPASS LRP PRC GVP PDS DGL SAR NRQ KRFVL 100
....
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTM AEALKVWSDVTPLTFTEVHE 150
||||||||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTM AEALKVWSDVTPLTFTEVHE 150
....
151 GRADIMIDFARYWHGDDDLPFDPGPGILAHAFFFPKTHREGDVHFDYDETWT 200
||||||||||||||||||||||||||||||||||||||||
151 GRAMIMIDFARYWDGDDLPLFPGPGILAHAFFFPKTHREGDVHFDYDETWT 200
....
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMFA YTFRYPLSLSPDDC 250
||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMFA YTFRYPLSLSPDDC 250
....
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPACEASFA 300
||||||||||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPACEASFA 300
....
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPalasRHWQGLPSPVDAAFEDA 350
||||||||||||||||||||||||||||||||||||||||
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPalasRHWQGLPSPVDAAFEDA 350

351 QGHIWFFQ 358
||||||||
351 QGHIWFFQ 358






Sequence name: MM11_HUMAN

Sequence documentation:

Alignment of: HSSTROL3_P7 x MM11_HUMAN ..

Alignment segment 1/1:

Quality: 3575.00 Escore: 0
Matching length: 359 Total length: 359
Matching Percent Similarity: 99.72 Matching Percent Identity: 99.72
Total Percent Similarity: 99.72 Total Percent Identity: 99.72
Gaps: 0

Alignment:
....
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQ 50
||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQ 50
....
51 WHAALPSSPAPAPATQ EAPRPASS LRP PRC GVP PDS DGL SAR NRQ KRFVL 100
||||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQ EAPRPASS LRP PRC GVP PDS DGL SAR NRQ KRFVL 100
....
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTM AEALKVWSDVTPLTFTEVHE 150
||||||||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTM AEALKVWSDVTPLTFTEVHE 150
....
151 GRADIMIDFARYWHGDDDLPFDPGPGILAHAFFFPKTHREGDVHFDYDETWT 200
||||||||||||||||||||||||||||||||||||||||
151 GRAMIMIDFARYWDGDDLPLFPGPGILAHAFFFPKTHREGDVHFDYDETWT 200
....
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMFA YTFRYPLSLSPDDC 250
||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMFA YTFRYPLSLSPDDC 250
....
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPACEASFA 300
||||||||||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPACEASFA 300
....
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPalasRHWQGLPSPVDAAFEDA 350
||||||||||||||||||||||||||||||||||||||||
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPalasRHWQGLPSPVDAAFEDA 350

351 QGHIWFFQG 359
|||||||||
351 QGHIWFFQG 359






Sequence name: MM11_HUMAN

Sequence documentation:

Alignment of: HSSTROL3_P8 x MM11_HUMAN ..

Alignment segment 1/1:

Quality: 2838.00 Escore: 0
Matching length: 286 Total length: 286
Matching Percent Similarity: 99.65 Matching Percent Identity: 99.65
Total Percent Similarity: 99.65 Total Percent Identity: 99.65
Gaps: 0

Alignment:
....
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQ 50
||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQ 50
....
51 WHAALPSSPAPAPATQ EAPRPASS LRP PRC GVP PDS DGL SAR NRQ KRFVL 100
||||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQ EAPRPASS LRP PRC GVP PDS DGL SAR NRQ KRFVL 100
....
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTM AEALKVWSDVTPLTFTEVHE 150
||||||||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTM AEALKVWSDVTPLTFTEVHE 150
....
151 GRADIMIDFARYWHGDDDLPFDPGPGILAHAFFFPKTHREGDVHFDYDETWT 200
||||||||||||||||||||||||||||||||||||||||
151 GRAMIMIDFARYWDGDDLPLFPGPGILAHAFFFPKTHREGDVHFDYDETWT 200
....
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMFA YTFRYPLSLSPDDC 250
||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMFA YTFRYPLSLSPDDC 250
....
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLE 286
|||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLE 286






Sequence name: MM11_HUMAN

Sequence documentation:

Alignment of: HSSTROL3_P9 x MM11_HUMAN ..

Alignment segment 1/1:

Quality: 3316.00 Escore: 0
Matching length: 343 Total length: 359
Matching Percent Similarity: 99.71 Matching Percent Identity: 99.71
Total Percent Similarity: 95.26 Total Percent Identity: 95.26
Gaps: 1

Alignment:
....
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQ 50
||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQ 50
....
51 WHAALPSSPAPAPATQ EAPRPASS LRP PRC GVP DPSD GL SAR NRQ K. ... 96
|||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQ EAPRPASS LRP PRC GVP PDS DGL SAR NRQ KRFVL 100
....
97 ............ RIRLFPWQLVQEQVRQTM AEALKVWSDVTPLTFTEVHE 134
|||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTM AEALKVWSDVTPLTFTEVHE 150
....
135 GRAMIMIDFARYWHGDDDLPFDPGPGILAHAFFFPKTHREGDVHFDYDETWT 184
||||||||||||||||||||||||||||||||||||||||
151 GRAMIMIDFARYWDGDDLPLFPGPGILAHAFFFPKTHREGDVHFDYDETWT 200
....
185 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 234
||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMFA YTFRYPLSLSPDDC 250
....
235 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPACEASFA 284
||||||||||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPACEASFA 300
....
285 VSTIRGELFFFKAGFVWRLRGGQLQPGYPalasRHWQGLPSPVDAAFEDA 334
||||||||||||||||||||||||||||||||||||||||
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPalasRHWQGLPSPVDAAFEDA 350

335 QGHIWFFQG 343
|||||||||
351 QGHIWFFQG 359


正常および癌性肺組織における配列名HSSTROL3seg24中に示すアンプリコンによって検出可能なストロメリシン−3前駆体HSSTROL3転写物の発現
seg24、HSSTROL3seg24アンプリコン(配列番号1675)、ならびにHSSTROL3seg24F(配列番号1673)およびHSSTROL3seg24R(配列番号1674)プライマーによって検出可能なストロメリシン−3前駆体(EC3.4.24.−)(マトリクス金属プロテイナーゼ−11)(MMP−11)(ST3)(SL−3)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
Expression of stromelysin-3 precursor HSSTROL3 transcripts detectable by the amplicon shown in the sequence name HSSTROL3seg24 in normal and cancerous lung tissue seg24, HSSTROL3seg24 amplicon (SEQ ID NO: 1675), and HSSTROL3seg24F (SEQ ID NO: 1673) and HSSTROL3seg24R ( SEQ ID NO: 1674) Expression of stromelysin-3 precursor (EC3.4.24.-) (matrix metalloproteinase-11) (MMP-11) (ST3) (SL-3) transcripts detectable by primers Measured by time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – PBGD-Amplicon, SEQ ID No. 334), HPRT1 (GenBank Accession No. NM_000194, Amplicon – HPRT1- Amplicons, SEQ ID NO: 1297), Ubiquitin (GenBank Accession No. BC000449, Amplicon – Ubiquitin-Amplicon SEQ ID NO: 328), and SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA-Amplicon The expression of SEQ ID NO: 331) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. The normalized amount of each RT sample is the center of the amount of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99 above, Table 2, "tissue samples in the test panel") Divide by the value to obtain the magnification of the upregulation of each sample relative to the median of normal PM samples.

図39は、正常サンプルと比較した癌性肺サンプルにおける上記ストロメリシン−3前駆体転写物の過剰発現を示すヒストグラムである。値は、2連の実験の平均を示す。エラーバーは、得られた最小値および最大値を示す。   FIG. 39 is a histogram showing over expression of the stromelysin-3 precursor transcript in cancerous lung samples compared to normal samples. Values represent the average of duplicate experiments. Error bars indicate the obtained minimum and maximum values.

図39から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なストロメリシン−3前駆体転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、15個の腺癌サンプルのうちの13個、16個の扁平上皮細胞癌サンプルのうちの8個、4個の大細胞癌サンプルのうちの3個、8個の小細胞癌サンプルのうちの7個で少なくとも5倍の過剰発現が見出された。   As evident from FIG. 39, the expression of stromelysin-3 precursor transcripts detectable by the above amplicon in a cancer sample is a non-cancerous sample (sample no. 47-50, 90-93, 96-99, table 2, significantly higher than "tissue samples in the test panel"). Obviously, 13 out of 15 adenocarcinoma samples, 8 out of 16 squamous cell carcinoma samples, 3 out of 4 large cell carcinoma samples, 8 small cell carcinoma samples Overexpression of at least 5 fold was found in 7 of the

5倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、腺癌で4.04E−04、扁平上皮細胞癌で9.89E−02、大細胞癌で6.04E−02、小細胞癌で3.14E−03であった。上記値は、結果が統計的に有意であることを示す。   The 5-fold overexpression threshold was found to be different between cancer and normal samples, checked by Fisher's exact test, P value 4.04E-04 for adenocarcinoma, squamous cell carcinoma 9.29E-02, 6.04E-02 for large cell carcinoma and 3.14E-03 for small cell carcinoma. The above values indicate that the results are statistically significant.

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:HSSTROL3seg24F順方向プライマーおよびHSSTROL3seg24R逆方向プライマー。   Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used only as a non-limiting illustration of suitable primer pairs: HSSTROL3seg24F forward primer and HSSTROL3seg24R reverse Direction primer.

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:HSSTROL3seg24。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : HSSTROL3seg24.

順方向プライマー(配列番号1673):ATTTCCATCCTCAACTGGCAGA
逆方向プライマー(配列番号1674):TGCCCTGGAACCCACG
アンプリコン(配列番号1675):ATTTCCATCCTCAACTGGCAGAGATGAGAGCCTGGAGCATTGCAGATGCCAGGGACTTCACAAATGAAGGCACAGCATGGGAAACCTGCGTGGGTTCCAGGGCA
Forward primer (SEQ ID NO: 1673): ATTTCCATCCTCAACTGGCAGA
Reverse primer (SEQ ID NO: 1674): TGCCCTGGAACCCACG
Amplicon (SEQ ID NO: 1675): ATTTCCATCCTCAACTGGCAGAGATGAGAGCCTTGAGCATTGCAGATGCGAGGACTC ACAAATGA AGGCACAGCAGGGAC AACCTGCGTGGGTTCAGGGCA

異なる正常組織における配列名HSSTROL3seg24中に示すアンプリコンによって検出可能なストロメリシン−3前駆体HSSTROL3転写物の発現
HSSTROL3seg24アンプリコン(配列番号1675)ならびにHSSTROL3seg24F(配列番号1673)およびHSSTROL3seg24R(配列番号1674)によって検出可能なストロメリシン−3前駆体転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)、RPL19(GenBankアクセッション番号NM_000981、RPL19アンプリコン、配列番号1630)、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン、配列番号1633)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、肺サンプル(上記のサンプル番号15〜17、表2、「正常パネル中の組織サンプル」)の量の中央値で割って、肺サンプルの中央値に対する各サンプルの相対発現の値を得た。
Expression of the stromelysin-3 precursor HSSTROL3 transcript detectable by the amplicon shown in the sequence name HSSTROL3seg24 in different normal tissues Detection by the HSSTROL3seg24 amplicon (SEQ ID NO: 1675) and HSSTROL3seg24F (SEQ ID NO: 1673) and HSSTROL3seg24R (SEQ ID NO: 1674) The expression of possible stromelysin-3 precursor transcripts was measured by real time PCR. In parallel, four housekeeping genes-ubiquitin (GenBank Accession No. BC000449, Amplicon – Ubiquitin-Amplicon SEQ ID No. 328), and SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA- The expression of amplicon SEQ ID NO: 331), RPL19 (GenBank Accession No. NM_000981, RPL19 amplicon, SEQ ID NO: 1630), TATA box (GenBank Accession No. NM_003194, TATA amplicon, SEQ ID NO: 1633) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. The normalized volume of each RT sample is divided by the median volume of lung samples (Sample Nos. 15-17 above, Table 2, "Tissue Samples in Normal Panel"), and each sample relative to the median lung sample The value of relative expression of was obtained.

順方向プライマー(配列番号1673):ATTTCCATCCTCAACTGGCAGA
逆方向プライマー(配列番号1674):TGCCCTGGAACCCACG
アンプリコン(配列番号1675):ATTTCCATCCTCAACTGGCAGAGATGAGAGCCTGGAGCATTGCAGATGCCAGGGACTTCACAAATGAAGGCACAGCATGGGAAACCTGCGTGGGTTCCAGGGCA
Forward primer (SEQ ID NO: 1673): ATTTCCATCCTCAACTGGCAGA
Reverse primer (SEQ ID NO: 1674): TGCCCTGGAACCCACG
Amplicon (SEQ ID NO: 1675): ATTTCCATCCTCAACTGGCAGAGATGAGAGCCTTGAGCATTGCAGATGCGAGGACTC ACAAATGA AGGCACAGCAGGGAC AACCTGCGTGGGTTCAGGGCA

結果を図40に示し、これは、異なる正常組織における配列名HSSTROL3seg24中に示すアンプリコンによって検出可能なストロメリシン−3HSSTROL3転写物の発現を示す。   The results are shown in FIG. 40, which shows the expression of stromelysin-3HSSTROL3 transcripts detectable by the amplicon shown in the sequence name HSSTROL3seg24 in different normal tissues.

正常および癌性肺組織における配列名HSSTROL3seg20−21中に示すアンプリコンによって検出可能なホモ・サピエンスマトリクス金属プロテイナーゼ−11(ストロメリシン3)(MMP11)HSSTROL3転写物の発現
seg20−21、HSSTROL3seg20−21アンプリコン(配列番号1678)ならびにプライマーHSSTROL3seg20−21F(配列番号1676)およびHSSTROL3seg20−21R(配列番号1677)によって検出可能なホモ・サピエンスマトリクス金属プロテイナーゼ−11(ストロメリシン3)(MMP11)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
Expression of homo-Sapiens matrix metalloproteinase-11 (stromelysin 3) (MMP11) HSSTROL3 transcripts detectable by the amplicon shown in the sequence name HSSTROL3seg20-21 in normal and cancerous lung tissue seg20-21, HSSTROL3seg20-21 amplicon (Sequence ID No. 1678) and expression of the expression of a real Sapiens matrix metalloproteinase-11 (Stromelysin 3) (MMP 11) transcript detectable by the primers HSSTROL3seg20-21F (SEQ ID No. 1676) and HSSTROL3seg20-21R (SEQ ID No. 1677) Measured by time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – PBGD-Amplicon, SEQ ID No. 334), HPRT1 (GenBank Accession No. NM_000194, Amplicon – HPRT1- Amplicons, SEQ ID NO: 1297), Ubiquitin (GenBank Accession No. BC000449, Amplicon – Ubiquitin-Amplicon SEQ ID NO: 328), and SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA-Amplicon The expression of SEQ ID NO: 331) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. Normalized PM samples by dividing the normalized volume of each RT sample by the median volume of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99, Table 2 above) Magnifications of upregulation of each sample to the median of were obtained.

図71は、正常サンプルと比較した癌性肺サンプルにおける上記ホモ・サピエンスマトリクス金属プロテイナーゼ11(ストロメリシン3)(MMP11)転写物の過剰発現を示すヒストグラムである。   FIG. 71 is a histogram showing the over expression of the homo-sapiens matrix metalloproteinase 11 (stromelysin 3) (MMP11) transcript in cancerous lung samples compared to normal samples.

図71から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンスマトリクス金属プロテイナーゼ11(ストロメリシン3)(MMP11)転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2)よりも有意に高かった。明白には、15個の腺癌サンプルのうちの11個、16個の扁平上皮細胞癌サンプルのうち6個、4個の大細胞癌サンプルのうちの1個、8個の小細胞癌サンプルのうちの6個で少なくとも6倍の過剰発現が見出された。   As apparent from FIG. 71, the expression of the homo-Sapiens matrix metalloproteinase 11 (stromelysin 3) (MMP 11) transcript detectable by the above amplicon in the cancer sample was determined by the non-cancerous sample (Sample Nos. 46-50, 90-93, 96-99, significantly higher than Table 2). Clearly, 11 out of 15 adenocarcinoma samples, 6 out of 16 squamous cell carcinoma samples, 1 out of 4 large cell carcinoma samples, 8 small cell carcinoma samples Overexpression of at least 6-fold was found in 6 of them.

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:HSSTROL3seg20−21F順方向プライマーおよびHSSTROL3seg20−21R逆方向プライマー。   Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used only as non-limiting examples of suitable primer pairs: HSSTROL3seg20-21F forward primer and HSSTROL3 seg 20-21 R reverse primer.

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:HSSTROL3seg20−21。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : HSSTROL3seg 20-21.


プライマー:
順方向プライマーHSSTROL3seg20−21F(配列番号1676):TCTGCTGGCCACTGTGACTG
逆方向プライマーHSSTROL3seg20−21R(配列番号1677):GAAGAAAAAGAGCTCGCCTCG
アンプリコンHSSTROL3seg20−21(配列番号1678):TCTGCTGGCCACTGTGACTGCAGCATATGCCCTCAGCATGTGTCCCTCTCTCCCACCCCAGCCAGACGCCCCGCCAGATGCCTGTGAGGCCTCCTTTGACGCGGTCTCCACCATCCGAGGCGAGCTCTTTTTCTTC

Primer:
Forward primer HSSTROL3seg20-21F (SEQ ID NO: 1676): TCTGCTGGCCACTGTGACTG
Reverse primer HSSTROL3seg20-21R (SEQ ID NO: 1677): GAAGAAAAAGAGCTGCCTCG
Amplicon HSSTROL3 seg 20-21 (SEQ ID NO: 1678): TCTGCTGGCCACTGTGACTGCAGCATATGCCCTCAAGCATGTGTCCCTCTCTCCCACCCCAGCCAGACGGCCCCGCCCAGATGGCCTGCTAGAGGCCTCCTTTGACGCGGTCTCACCATCCGAGGCGAGCTCTTTTTTCTCTC

正常および癌性肺組織における配列名HHSSTROL3junc21−27中に示すアンプリコンによって検出可能なホモ・サピエンスマトリクス金属プロテイナーゼ−11(ストロメリシン3)(MMP11)HSSTROL3転写物の発現
junc21−27、HSSTROL3junc21−27アンプリコン(配列番号1681)ならびにプライマーHSSTROL3junc21−27F(配列番号1679)およびHSSTROL3junc21−27R(配列番号1680)によって検出可能なホモ・サピエンスマトリクス金属プロテイナーゼ−11(ストロメリシン3)(MMP11)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
Expression of homo-Sapiens matrix metalloproteinase-11 (stromelysin 3) (MMP11) HSSTROL3 transcripts detectable by an amplicon as shown in the sequence name HHSSTROL3 junc 21-27 in normal and cancerous lung tissue junc 21-27, HSSTROL 3 junc 21-27 amplicon (Sequence ID No. 1681) and expression of real Sapiens matrix metalloproteinase-11 (Stromelysin 3) (MMP11) transcripts detectable by primers HSSTROL3 junc 21-27 F (SEQ ID NO: 1679) and HSSTROL 3 junc 21-27 R (SEQ ID NO: 1680) Measured by time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – PBGD-Amplicon, SEQ ID No. 334), HPRT1 (GenBank Accession No. NM_000194, Amplicon – HPRT1- Amplicons, SEQ ID NO: 1297), Ubiquitin (GenBank Accession No. BC000449, Amplicon – Ubiquitin-Amplicon SEQ ID NO: 328), and SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA-Amplicon The expression of SEQ ID NO: 331) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. Normalized PM samples by dividing the normalized volume of each RT sample by the median volume of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99, Table 2 above) Magnifications of upregulation of each sample to the median of were obtained.

図72は、正常サンプルと比較した癌性肺サンプルにおける上記ホモ・サピエンスマトリクス金属プロテイナーゼ11(ストロメリシン3)(MMP11)転写物の過剰発現を示すヒストグラムである。   Figure 72 is a histogram showing over expression of the homo-sapiens matrix metalloproteinase 11 (stromelysin 3) (MMP11) transcript in cancerous lung samples compared to normal samples.

図72から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンスマトリクス金属プロテイナーゼ11(ストロメリシン3)(MMP11)転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2)よりも有意に高かった。明白には、15個の腺癌サンプルのうちの15個、16個の扁平上皮細胞癌サンプルのうち13個、4個の大細胞癌サンプルのうちの3個、8個の小細胞癌サンプルのうちの5個で少なくとも10倍の過剰発現が見出された。   As apparent from FIG. 72, the expression of the homo-Sapiens matrix metalloproteinase 11 (stromelysin 3) (MMP 11) transcript that is detectable by the above amplicon in the cancer sample is a non-cancerous sample (sample numbers 46-50, 90-93, 96-99, significantly higher than Table 2). Obviously, 15 out of 15 adenocarcinoma samples, 13 out of 16 squamous cell carcinoma samples, 3 out of 4 large cell carcinoma samples, 8 small cell carcinoma samples Overexpression of at least 10-fold was found in 5 of them.

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:HSSTROL3junc21−27F順方向プライマーおよびHSSTROL3junc21−27R逆方向プライマー。   Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used only as non-limiting examples of suitable primer pairs: HSSTROL3 junc21-27F forward primer and HSSTROL3 junc 21-27 R reverse primer.

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:HSSTROL3junc21−27。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : HSSTROL3 junc 21-27.


プライマー:
順方向プライマーHSSTROL3junc21−27F(配列番号1679):ACATTTGGTTCTTCCAAGGGACTAC
逆方向プライマーHSSTROL3junc21−27R(配列番号1680):TCGATCTCAGAGGGCACCC
アンプリコンHSSTROL3junc21−27(配列番号1681):ACATTTGGTTCTTCCAAGGGACTACTGGCGTTTCCACCCCAGCACCCGGCGTGTAGACAGTCCCGTGCCCCGCAGGGCCACTGACTGGAGAGGGGTGCCCTCTGAGATCGA

Primer:
Forward primer HSSTROL3junc 21-27F (SEQ ID NO: 1679): ACATTTGGTTCTTCCAAGGGACTAC
Reverse primer HSSTROL3junc 21-27R (SEQ ID NO: 1680): TCGATCTCAGAGGGCACCC
Amplicon HSSTROL3 junc 21-27 (SEQ ID NO: 1681): ACATTTGGTTCTTCCAAGGGACTACTGGCGTTTTCCCCCCCAGCACCCGGCAGTCAGCAGTCCCGTGCCCCGCAGGGCCACTGACTGGAGAGGGGTGCCTCTGGAGATCGA

クラスターHUMTREFACの説明
クラスターHUMTREFACは、目的の2つの転写物および7個のセグメントを特徴とし、その名称を、それぞれ表1096および1097に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表1098に示す。
Description of cluster HUMTREFAC The cluster HUMTREFAC is characterized by two transcripts and 7 segments of interest, the names of which are given in Tables 1096 and 1097 respectively, and the sequence itself is given at the end of the application. Selected protein variants are shown in Table 1098.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるトレフォイル因子3(Trefoil factor 3)前駆体(SwissProtアクセッション識別子TFF3_HUMAN、同義語腸トレフォイル因子、hP1.Bとしても公知である)(配列番号1456)の変異型である。   These sequences are also known as Trefoil factor 3 precursor (SwissProt accession identifier TFF3_HUMAN), a synonym intestinal trefoil factor, hP1.B, which is a known protein, previously known herein as a protein. It is a variant of (known) (SEQ ID NO: 1456).

タンパク質トレフォイル因子3前駆体は、以下の機能を有することが公知であるか、そのように見なされている:細胞移動の促進で役割を果たし得る(細胞遊走促進因子)。タンパク質トレフォイル因子3前駆体の配列を、「トレフォイル因子3前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表1099に示す。   The protein trefoil factor 3 precursor is known or considered to have the following functions: It may play a role in promoting cell migration (cell migration promoting factor). The sequence of the protein trefoil factor 3 precursor is shown at the end of the application as "trefoil factor 3 precursor amino acid sequence". Known polymorphisms of this sequence are shown in Table 1099.

Figure 2008507261
Figure 2008507261

タンパク質トレフォイル因子3前駆体の局在化は、分泌と考えられる。   Localization of the protein trefoil factor 3 precursor is considered secretion.

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである防御応答、消化、および細胞成分に関連する注釈付けである細胞外。   The following GO annotation applies to previously known proteins. The following annotations have been found: extracellular response that is annotated related to biological processes, defense response, digestion, and annotated related to cellular components.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

クラスターHUMTREFACを、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図41のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   The cluster HUMTREFAC can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The terms "numbers" in the right column of the table and the numbers on the y-axis of FIG. 41 refer to the weighted expression of ESTs in each category as "ppm" (the ppm of ESTs of a particular cluster in this category by ppm Ratio of expression to expression of all ESTs).

概して、図41および表1100中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):異なる組織由来の悪性腫瘍の混合物、悪性乳癌、膵臓癌、および前立腺癌。   In general, as shown for the histograms in FIG. 41 and Table 1100, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: a mixture of malignant tumors from different tissues, malignant breast cancer, pancreatic cancer, and prostate cancer.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、クラスターHUMTREFACは、上の表1に列挙した2つの転写物を特徴とする。これらの転写物は、タンパク質トレフォイル因子3前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster HUMTREFAC is characterized by the two transcripts listed in Table 1 above. These transcripts encode proteins which are variants of the protein trefoil factor 3 precursor. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質HUMTREFAC_PEA_2_P7は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMTREFAC_PEA_2_T5によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The mutein HUMTREFAC_PEA_2_P7 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HUMTREFAC_PEA_2_T5. The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HUMTREFAC_PEA_2_P7はまた、表1102に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMTREFAC_PEA_2_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMTREFAC_PEA_2_P7 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows the SNPs as shown in Table 1102) It indicates whether it is known and the presence of a known SNP in the mutant protein HUMTREFAC_PEA_2_P7 sequence supports the putative sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質、HUMTREFAC_PEA_2_P7は、以下の転写物によってコードされる:HUMTREFAC_PEA_2_T5(配列は出願書類の最後に示す)。転写物HUMTREFAC_PEA_2_T5のコード部分を太字で示し、このコード部分は278位から開始され、688位で終結する。転写物はまた、表1103に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMTREFAC_PEA_2_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein, HUMTREFAC_PEA_2_P7, is encoded by the following transcript: HUMTREFAC_PEA_2_T5 (sequences shown at the end of the application). The code portion of the transcript HUMTREFAC_PEA_2_T5 is shown in bold, starting from position 278 and ending at position 688. The transcript also has the following SNPs listed in Table 1103 (showing its position on the nucleotide sequence, listing another nucleic acid, the last column shows if the SNP is known, mutein HUMTREFAC_PEA_2_P7 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質HUMTREFAC_PEA_2_P8は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMTREFAC_PEA_2_T4によってコードされる。公知のタンパク質(トレフォイル因子3前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HUMTREFAC_PEA_2_P8 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HUMTREFAC_PEA_2_T4. An alignment to a known protein (trefoil factor 3 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HUMTREFAC_PEA_2_P8とTFF3_HUMANとの間の比較の報告
1.TFF3_HUMANのアミノ酸1〜27に対応し、HUMTREFAC_PEA_2_P8のアミノ酸1〜27にも対応するMAARALCMLGLVLALLSSSSAEEYVGLと少なくとも90%相同な第1のアミノ酸配列と、HUMTREFAC_PEA_2_P8のアミノ酸28〜41に対応する配列WKVHLPKGEGFSSGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMTREFAC_PEA_2_P8をコードする単離キメラポリペプチド。
Reporting of the comparison between HUMTREFAC_PEA_2_P8 and TFF3_HUMAN 1. A polypeptide having a first amino acid sequence corresponding to amino acids 1 to 27 of TFF3_HUMAN and also to amino acids 1 to 27 of HUMTREFAC_PEA_2_P8 at least 90% homologous to MAARALC ML GLVLALL SS SSEAE EYVGL Said second amino acid sequence comprising a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; An isolated chimeric polypeptide encoding HUMTREFAC_PEA_2_P8, wherein the two amino acid sequences are in contiguous and sequential order.

2.HUMTREFAC_PEA_2_P8中の配列WKVHLPKGEGFSSGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMTREFAC_PEA_2_P8のテールをコードする単離ポリペプチド。   2. HUMTREFAC_PEA_2_P8 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence WKVHLPKGEGFSSG in HUMTREFAC_PEA_2_P8 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HUMTREFAC_PEA_2_P8はまた、表1104に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMTREFAC_PEA_2_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HUMTREFAC_PEA_2_P8 also has the following non-silent SNPs (single nucleotide polymorphisms) (indicating its position on the amino acid sequence, listing other amino acids, and the last column, SNPs, as shown in Table 1104) It indicates whether it is known and the presence of a known SNP in the mutant protein HUMTREFAC_PEA_2_P8 sequence supports the putative sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質、HUMTREFAC_PEA_2_P8は、以下の転写物によってコードされる:HUMTREFAC_PEA_2_T4(配列は出願書類の最後に示す)。転写物HUMTREFAC_PEA_2_T4のコード部分を太字で示し、このコード部分は278位から開始され、400位で終結する。転写物はまた、表1105に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMTREFAC_PEA_2_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein, HUMTREFAC_PEA_2_P8, is encoded by the following transcript: HUMTREFAC_PEA_2_T4 (sequences shown at the end of the application). The code portion of the transcript HUMTREFAC_PEA_2_T4 is shown in bold, starting at position 278 and ending at position 400. The transcript also has the following SNPs listed in Table 1105 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, the mutein HUMTREFAC_PEA_2_P8 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターHUMTREFACは、上の表2に列挙した7個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster HUMTREFAC is characterized by the seven segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターHUMTREFAC_PEA_2_node_0は、188個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMTREFAC_PEA_2_T4およびHUMTREFAC_PEA_2_T5。以下の表1106は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMTREFAC_PEA_2_node_0 of the present invention is supported by 188 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMTREFAC_PEA_2_T4 and HUMTREFAC_PEA_2_T5. Table 1106 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMTREFAC_PEA_2_node_9は、150個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMTREFAC_PEA_2_T4およびHUMTREFAC_PEA_2_T5。以下の表1107は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMTREFAC_PEA_2_node_9 of the present invention is supported by 150 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMTREFAC_PEA_2_T4 and HUMTREFAC_PEA_2_T5. Table 1107 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターHUMTREFAC_PEA_2_node_2は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMTREFAC_PEA_2_T4。以下の表1108は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMTREFAC_PEA_2_node_2 of the present invention is supported by 4 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMTREFAC_PEA_2_T4. Table 1108 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMTREFAC_PEA_2_node_3は、10個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMTREFAC_PEA_2_T4およびHUMTREFAC_PEA_2_T5。以下の表1109は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMTREFAC_PEA_2_node_3 of the present invention is supported by 10 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMTREFAC_PEA_2_T4 and HUMTREFAC_PEA_2_T5. Table 1109 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMTREFAC_PEA_2_node_4は、197個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMTREFAC_PEA_2_T4およびHUMTREFAC_PEA_2_T5。以下の表1110は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMTREFAC_PEA_2_node_4 of the present invention is supported by 197 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMTREFAC_PEA_2_T4 and HUMTREFAC_PEA_2_T5. Table 1110 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMTREFAC_PEA_2_node_5は、187個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMTREFAC_PEA_2_T4およびHUMTREFAC_PEA_2_T5。以下の表1111は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMTREFAC_PEA_2_node_5 of the present invention is supported by 187 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMTREFAC_PEA_2_T4 and HUMTREFAC_PEA_2_T5. Table 1111 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMTREFAC_PEA_2_node_8を、以下の転写物中に見出すことができる:HUMTREFAC_PEA_2_T4およびHUMTREFAC_PEA_2_T5。以下の表1112は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMTREFAC_PEA_2_node_8 according to the invention can be found in the following transcripts: HUMTREFAC_PEA_2_T4 and HUMTREFAC_PEA_2_T5. Table 1112 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: TFF3_HUMAN

Sequence documentation:

Alignment of: HUMTREFAC_PEA_2_P8 x TFF3_HUMAN ..

Alignment segment 1/1:

Quality: 246.00 Escore: 0
Matching length: 27 Total length: 27
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. .
1 MAARALCMLGLVLALLSSSSAEEYVGL 27
|||||||||||||||||||||||||||
1 MAARALCMLGLVLALLSSSSAEEYVGL 27



Mutated protein alignment against previously known proteins:
Sequence name: TFF3_HUMAN

Sequence documentation:

Alignment of: HUMTREFAC_PEA_2_P8 x TFF3_HUMAN ..

Alignment segment 1/1:

Quality: 246.00 Escore: 0
Matching length: 27 Total length: 27
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
.
1 MAARALCMLGLVLALLSSSSAEEYVGL 27
|||||||||||||||||||||||||
1 MAARALCMLGLVLALLSSSSAEEYVGL 27


クラスターHSS100PCBの説明
クラスターHSS100PCBは、目的の1つの転写物および3個のセグメントを特徴とし、その名称を、それぞれ表1113および1114に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表1115に示す。
Description of cluster HSS100 PCB The cluster HSS100 PCB features one transcript and three segments of interest, the names of which are given in Tables 1113 and 1114 respectively, and the sequence itself is given at the end of the application. Selected protein variants are shown in Table 1115.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれ、2つのカルシウムイオンに結合する公知のタンパク質であるS−100Pタンパク質(SwissProtアクセッション識別子S10P_HUMAN)(配列番号1457)の変異型である。   These sequences are referred to herein as proteins previously known and are variants of S-100P protein (SwissProt accession identifier S10P_HUMAN) (SEQ ID NO: 1457), a known protein that binds to two calcium ions. It is.

タンパク質S−100Pタンパク質の配列を、「S−100Pタンパク質アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表1116に示す。   Protein S-100P The protein sequence is shown at the end of the application as "S-100P protein amino acid sequence". Known polymorphisms of this sequence are shown in Table 1116.

Figure 2008507261
Figure 2008507261

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:分子機能に関連する注釈付けであるカルシウム結合、タンパク質結合。   The following GO annotation applies to previously known proteins. The following annotations were found: calcium binding, protein binding, which are annotations related to molecular function.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

クラスターHSS100PCBを、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図42のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   Cluster HSS100 PCB can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The terms "numbers" in the right column of the table and the numbers on the y-axis of Fig. 42 refer to the weighted expression of ESTs in each category as "ppm" (the ppm of ESTs of a particular cluster in this category by ppm Ratio of expression to expression of all ESTs).

概して、図42および表1117中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):異なる組織由来の悪性腫瘍の混合物。   In general, as shown for the histograms in FIG. 42 and Table 1117, the following results were obtained. This cluster was overexpressed (at least at the minimum level) in the following pathological conditions: a mixture of malignant tumors from different tissues.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、クラスターHSS100PCBは、上の表1に列挙した1つの転写物を特徴とする。これらの転写物は、タンパク質S−100Pタンパク質の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster HSS100 PCB is characterized by one transcript as listed in Table 1 above. These transcripts encode a protein which is a mutated form of protein S-100P protein. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質HSS100PCB_P3は、出願書類の最後に示すアミノ酸配列を有し、転写物HSS100PCB_T1によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The mutein HSS100PCB_P3 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HSS100PCB_T1. The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HSS100PCB_P3はまた、表1119に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSS100PCB_P3配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein HSS100PCB_P3 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 1119) It indicates whether it is known and the presence of a known SNP in the mutant protein HSS100PCB_P3 sequence supports the predicted sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質、HSS100PCB_P3は、以下の転写物によってコードされる:HSS100PCB_T1(配列は出願書類の最後に示す)。転写物HSS100PCB_T1のコード部分を太字で示し、このコード部分は1057位から開始され、1533位で終結する。転写物はまた、表1120に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSS100PCB_P3配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein, HSS100PCB_P3, is encoded by the following transcript: HSS100PCB_T1 (sequences shown at the end of the application). The code portion of the transcript HSS100PCB_T1 is shown in bold and this code portion starts at position 1057 and ends at position 1533. The transcript also has the following SNPs listed in Table 1120 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, the mutein HSS100PCB_P3 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターHSS100PCBは、上の表2に列挙した3個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster HSS100 PCB is characterized by the three segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターHSS100PCB_node_3は、16個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSS100PCB_T1。以下の表1121は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSS100PCB_node_3 of the present invention is supported by 16 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSS100 PCB_T1. Table 1121 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHSS100PCB_node_4は、29個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSS100PCB_T1。以下の表1122は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSS100PCB_node_4 of the present invention is supported by 29 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSS100 PCB_T1. Table 1122 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHSS100PCB_node_5は、141個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSS100PCB_T1。以下の表1124は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSS100PCB_node_5 of the present invention is supported by 141 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSS100 PCB_T1. Table 1124 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

クラスターHSU33147の説明
クラスターHSU33147は、目的の2つの転写物および5個のセグメントを特徴とし、その名称を、それぞれ表1125および1126に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表1127に示す。
Description of cluster HSU33147 Cluster HSU33147 is characterized by 2 transcripts and 5 segments of interest, the names of which are given in Tables 1125 and 1126 respectively, and the sequence itself is given at the end of the application. Selected protein variants are shown in Table 1127.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるマンマグロビンA前駆体(SwissProtアクセッション識別子MGBA_HUMAN、同義語マンマグロビン1、セクレトグロビンファミリー2Aメンバー2としても公知である)(配列番号1416)の変異型である。   These sequences are also known as mammabinin A precursor (SwissProt accession identifier MGBA_HUMAN, synonyms mammaglobin 1, secretoglobin family 2A member 2), which is a known protein, previously known herein as a protein (SEQ ID NO: 1416).

タンパク質マンマグロビンA前駆体の配列を、「マンマグロビンA前駆体アミノ酸配列」として出願書類の最後に示す。   The sequence of the protein mammaglobin A precursor is shown at the end of the application as "Mammaglobin A precursor amino acid sequence".

ヒトにおける臨床/治療用途(例えば、抗体または小分子の標的として、および/または直接的な治療として)が調査されており、これらの調査に関連する利用可能な情報は以下である。以前に公知のタンパク質の潜在的な薬学的に関連するか治療に関連する活性は以下である:免疫賦活剤。クラスターによって示されたタンパク質の治療における役割が予想されている。このタンパク質またはその一部を、潜在的治療に適用する(抗癌薬)ために使用するか使用することができる薬物データベースまたは公的なデータベース(例えば、上記)に情報が存在するので、クラスターをこの分野に割り当てた。   Clinical / therapeutic applications in humans (e.g. as targets for antibodies or small molecules and / or as direct therapy) are being investigated and available information related to these investigations is: Potential pharmaceutically relevant or therapeutically relevant activities of previously known proteins are: immunostimulants. The therapeutic role of proteins displayed by clusters is expected. Because information is present in drug databases or public databases (eg, above) that may or may not be used to apply this protein or a portion thereof to a potential treatment (anti-cancer drug), the clusters Assigned to this area.

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:分子機能に関連する注釈付けであるステロイド結合。   The following GO annotation applies to previously known proteins. The following annotations were found: steroid binding, which is an annotation related to molecular function.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

クラスターHSU33147を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の左側のカラム中の用語「数」および図43のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   Cluster HSU33147 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The term “number” in the left column of the table and the number on the y-axis of FIG. 43 refer to the weighted expression of ESTs in each category as “ppm” (for ESTs of a particular cluster in this category by ppm Ratio of expression to expression of all ESTs).

概して、図43および表1128中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):異なる組織由来の悪性腫瘍の混合物。   In general, as shown for the histograms in FIG. 43 and Table 1128, the following results were obtained. This cluster was overexpressed (at least at the minimum level) in the following pathological conditions: a mixture of malignant tumors from different tissues.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、クラスターHSU33147は、上の表1に列挙した2つの転写物を特徴とする。これらの転写物は、タンパク質マンマグロビンA前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster HSU33147 is characterized by the two transcripts listed in Table 1 above. These transcripts encode a protein which is a mutated form of the protein mammaglobin A precursor. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質HSU33147_PEA_1_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物HSU33147_PEA_1_T1によってコードされる。公知のタンパク質(マンマグロビンA前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein HSU33147_PEA_1_P5 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HSU33147_PEA_1_T1. An alignment to a known protein (matunabin A precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HSU33147_PEA_1_P5とMGBA_HUMANとの間の比較の報告
1.MGBA_HUMANのアミノ酸1〜78に対応し、HSU33147_PEA_1_P5のアミノ酸1〜78にも対応するMKLLMVLMLAALSQHCYAGSGCPLLENVISKTINPQVSKTEYKELLQEFIDDNATTNAIDELKECFLNQTDETLSNVEと少なくとも90%相同な第1のアミノ酸配列と、MGBA_HUMANのアミノ酸82〜93に対応し、HSU33147_PEA_1_P5のアミノ酸79〜90にも対応するQLIYDSSLCDLFと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HSU33147_PEA_1_P5をコードする単離キメラポリペプチド。
Report of comparison between HSU33147_PEA_1_P5 and MGBA_HUMAN 1. The corresponding amino acids 1 to 78 of MGBA_HUMAN, and corresponding to amino acids 1 to 78 of HSU33147_PEA_1_P5 MKLL MVLLA ALS Q HC YAG SGC PLLEN VIS K TIN PQ VSKTEYKELL QE FIDDNATTNAID ELKE CFLN Q TDE TLS NVE and the corresponding amino acids Isolated that encodes HSU33147_PEA_1_P5, which also comprises the corresponding QLIYDSSLCDLF and a second amino acid sequence at least 90% homologous, said first amino acid sequence and the second amino acid sequence being adjacent and in sequential order Chimeric polypeptide.

2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がEQを含み、以下の構造:アミノ酸番号78−x〜78のいずれかから始まり、アミノ酸番号79+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HSU33147_PEA_1_P5の縁部分をコードする単離キメラポリペプチド。   2. Length “n” (wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long, most preferably at least about 50 amino acids long, at least two amino acids comprising EQ, starting from any of the following structures: amino acids nos. 78-x to 78, amino acids nos. 79 + ((n-2)-x) (formula An isolated chimeric polypeptide encoding an edge portion of HSU33147_PEA_1_P5, comprising a polypeptide, having a sequence terminating in: x) varying from 0 to n-2).

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

公知のタンパク質マンマグロビンA前駆体と比較した変異タンパク質HSU33147_PEA_1_P5のグリコシル化部位を表1130に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein HSU33147_PEA_1_P5 compared to the known protein martuna bin A precursor are shown in Table 1130 (showing its position on the amino acid sequence in the first column, the second column has mutations in glycosylation sites) The presence or absence in the protein is indicated and the last column indicates whether this position is different on the mutated protein).

Figure 2008507261
Figure 2008507261

変異タンパク質、HSU33147_PEA_1_P5は、以下の転写物によってコードされる:HSU33147_PEA_1_T1(配列は出願書類の最後に示す)。転写物HSU33147_PEA_1_T1のコード部分を太字で示し、このコード部分は72位から開始され、341位で終結する。転写物はまた、表1131に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSU33147_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein, HSU33147_PEA_1_P5, is encoded by the following transcript: HSU33147_PEA_1_T1 (sequences shown at the end of the application). The code portion of the transcript HSU33147_PEA_1_T1 is shown in bold, starting at position 72 and ending at position 341. The transcript also has the following SNPs listed in Table 1131 (showing its position on the nucleotide sequence and listing another nucleic acid, the last column shows whether the SNP is known, mutein HSU33147_PEA_1_P5 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターHSU33147は、上の表2に列挙した5個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster HSU33147 is characterized by the five segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターHSU33147_PEA_1_node_0は、38個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSU33147_PEA_1_T1およびHSU33147_PEA_1_T2。以下の表1132は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSU33147_PEA_1_node_0 of the present invention is supported by 38 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSU33147_PEA_1_T1 and HSU33147_PEA_1_T2. Table 1132 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHSU33147_PEA_1_node_2は、44個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSU33147_PEA_1_T1およびHSU33147_PEA_1_T2。以下の表1133は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSU33147_PEA_1_node_2 of the present invention is supported by 44 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSU33147_PEA_1_T1 and HSU33147_PEA_1_T2. Table 1133 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHSU33147_PEA_1_node_4は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSU33147_PEA_1_T2。以下の表1134は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSU33147_PEA_1_node_4 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSU33147_PEA_1_T2. Table 1134 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHSU33147_PEA_1_node_7は、35個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSU33147_PEA_1_T1。以下の表1135は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSU33147_PEA_1_node_7 of the present invention is supported by 35 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSU33147_PEA_1_T1. Table 1135 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターHSU33147_PEA_1_node_3を、以下の転写物中に見出すことができる:HSU33147_PEA_1_T2。以下の表1136は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HSU33147_PEA_1_node_3 of the invention can be found in the following transcript: HSU33147_PEA_1_T2. Table 1136 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: MGBA_HUMAN

Sequence documentation:

Alignment of: HSU33147_PEA_1_P5 x MGBA_HUMAN ..

Alignment segment 1/1:

Quality: 776.00 Escore: 0
Matching length: 90 Total length: 93
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 96.77 Total Percent Identity: 96.77
Gaps: 1

Alignment:
. . . . .
1 MKLLMVLMLAALSQHCYAGSGCPLLENVISKTINPQVSKTEYKELLQEFI 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKLLMVLMLAALSQHCYAGSGCPLLENVISKTINPQVSKTEYKELLQEFI 50
. . . .
51 DDNATTNAIDELKECFLNQTDETLSNVE...QLIYDSSLCDLF 90
|||||||||||||||||||||||||||| ||||||||||||
51 DDNATTNAIDELKECFLNQTDETLSNVEVFMQLIYDSSLCDLF 93



Mutated protein alignment against previously known proteins:
Sequence name: MGBA_HUMAN

Sequence documentation:

Alignment of: HSU33147_PEA_1_P5 x MGBA_HUMAN ..

Alignment segment 1/1:

Quality: 776.00 Escore: 0
Matching length: 90 Total length: 93
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 96.77 Total Percent Identity: 96.77
Gaps: 1

Alignment:
....
1 MKLLMVLMLAALSQHCYAGSGCPLLENVISKTINPQVSKTEYKELLQEFI 50
||||||||||||||||||||||||||||||||||||||||
1 MKLLMVLMLAALSQHCYAGSGCPLLENVISKTINPQVSKTEYKELLQEFI 50
....
51 DDNATTNAIDELKECFLNQTDETLSNVE ... QLIYDSSLCDLF 90
||||||||||||||||||||||||||||||||||
51 DDNATTNAIDELKECFLNQTDETLSNVEVFMQLIYDSSLCDLF 93


クラスターR20779の説明
クラスターR20779は、目的の1つの転写物および24個のセグメントを特徴とし、その名称を、それぞれ表1137および1138に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表1139に示す。
Description of Cluster R20779 Cluster R20779 is characterized by one transcript and 24 segments of interest, the names of which are shown in Tables 1137 and 1138 respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 1139.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるスタニオカルシン2前駆体(SwissProtアクセッション識別子STC2_HUMAN、同義語STC−2、スタニオカルシン関連タンパク質、CTCRP、STC関連タンパク質としても公知である)(配列番号1458)の変異型である。   These sequences are also known as stanniocalcin 2 precursor (SwissProt accession identifier STC2_HUMAN, the synonym STC-2, stanniocalcin related protein, CTCRP, STC related protein, which is a known protein previously referred to herein as a protein). It is a variant of (known) (SEQ ID NO: 1458).

タンパク質スタニオカルシン2前駆体は、以下の機能を有することが公知であるか、そのように見なされている:カルシウムおよびリン酸塩のホメオスタシスに対する抗低カルシウム作用を有する。タンパク質スタニオカルシン2前駆体の配列を、「スタニオカルシン2前駆体アミノ酸配列」として出願書類の最後に示す。タンパク質スタニオカルシン2前駆体の局在化は、分泌と考えられる(可能性)。   The protein stanniocalcin 2 precursor is known or considered to have the following function: It has an anti-low calcium effect on calcium and phosphate homeostasis. The sequence of the protein stanniocalcin 2 precursor is shown at the end of the application as "stanniocalcin 2 precursor amino acid sequence". Localization of the protein stanniocalcin 2 precursor is considered to be secreted (possibly).

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである細胞表面受容体結合シグナル伝達、細胞−細胞シグナル伝達、栄養応答経路、分子機能に関連する注釈付けであるホルモン、細胞成分に関連する注釈付けである細胞外。   The following GO annotation applies to previously known proteins. The following annotations have been found: cell surface receptor binding signaling that is annotated in connection with biological processes, cell-cell signaling, nutrient response pathways, hormone that is an annotation related to molecular function, Extracellular, annotating related to cellular components.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

クラスターR20779を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図44のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   Cluster R20779 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The terms “number” in the right column of the table and the numbers on the y-axis of FIG. 44 refer to the weighted expression of ESTs in each category as “ppm” (the ppm of ESTs of a particular cluster in this category by ppm Ratio of expression to expression of all ESTs).

概して、図44および表1140中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および悪性肺腫瘍。   In general, as shown for the histograms in FIG. 44 and Table 1140, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: epithelial malignancies, a mixture of malignancies from different tissues, and malignant lung tumors.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、クラスターR20779は、上の表1に列挙した1つの転写物を特徴とする。これらの転写物は、タンパク質スタニオカルシン2前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster R20779 is characterized by one transcript as listed in Table 1 above. These transcripts encode proteins which are variants of the protein Stanniocalcin 2 precursor. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質R20779_P2は、出願書類の最後に示すアミノ酸配列を有し、転写物R20779_T7によってコードされる。公知のタンパク質(スタニオカルシン2前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein R20779_P2 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript R20779_T7. An alignment to a known protein (stanniocalcin 2 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

R20779_P2とSTC2_HUMANとの間の比較の報告
1.STC2_HUMANのアミノ酸1〜169に対応し、R20779_P2のアミノ酸1〜169にも対応するMCAERLGQFMTLALVLATFDPARGTDATNPPEGPQDRSSQQKGRLSLQNTAEIQHCLVNAGDVGCGVFECFENNSCEIRGLHGICMTFLHNAGKFDAQGKSFIKDALKCKAHALRHRFGCISRKCPAIREMVSQLQRECYLKHDLCAAAQENTRVIVEMIHFKDLLLHEと少なくとも90%相同な第1のアミノ酸配列と、R20779_P2のアミノ酸170〜187に対応する配列CYKIEITMPKRRKVKLRDを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R20779_P2をコードする単離キメラポリペプチド。
Report of comparison between R20779_P2 and STC2_HUMAN Corresponding to amino acids 1-169 of STC2_HUMAN, first amino acid sequence at least 90% homologous to the corresponding MCAERLGQFMTLALVLATFDPARGTDATNPPEGPQDRSSQQKGRLSLQNTAEIQHCLVNAGDVGCGVFECFENNSCEIRGLHGICMTFLHNAGKFDAQGKSFIKDALKCKAHALRHRFGCISRKCPAIREMVSQLQRECYLKHDLCAAAQENTRVIVEMIHFKDLLLHE to amino acids 1-169 of R20779_P2, the polypeptide having a sequence corresponding to CYKIEITMPKRRKVKLRD to amino acid 170-187 of R20779_P2 At least 70%, optionally at least 80%, preferably at least A second amino acid sequence that is 5%, more preferably at least 90%, most preferably at least 95% homologous, the first amino acid sequence and the second amino acid sequence being adjacent and in a contiguous order , An isolated chimeric polypeptide encoding R20779_P2.

2.R20779_P2中の配列CYKIEITMPKRRKVKLRDと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R20779_P2のテールをコードする単離ポリペプチド。   2. R20779_P2 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence CYKIEITMPKRRKVKLRD in R20779_P2 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質R20779_P2はまた、表1142に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R20779_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R20779_P2 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 1142) It is shown whether it is known and the presence of known SNPs in the mutein R20779_P2 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質スタニオカルシン2前駆体と比較した変異タンパク質R20779_P2のグリコシル化部位を表1143に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of mutant protein R20779_P2 compared to the known protein stanniocalcin 2 precursor are shown in Table 1143 (showing its position on the amino acid sequence in the first column, the second column has a mutation site with glycosylation site Indicates if it is present in the last column and indicates if this position differs on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質、R20779_P2は、以下の転写物によってコードされる:R20779_T7(配列は出願書類の最後に示す)。転写物R20779_T7のコード部分を太字で示し、このコード部分は1397位から開始され、1957位で終結する。転写物はまた、表1144に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R20779_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R20779_P2 is encoded by the following transcript: R20779_T7 (sequences shown at the end of the application). The coding portion of the transcript R20779_T7 is shown in bold and this coding portion starts at position 1397 and ends at position 1957. The transcript also has the following SNPs listed in Table 1144 (showing its position on the nucleotide sequence and listing another nucleic acid, the last column shows whether the SNP is known, mutein R20779_P2 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターR20779は、上の表2に列挙した24個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster R20779 is characterized by the 24 segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターR20779_node_0は、31個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1145は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R20779_node_0 of the present invention is supported by 31 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R20779_T7. Table 1145 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR20779_node_2は、55個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1146は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R20779_node_2 of the present invention is supported by 55 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R20779_T7. Table 1146 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR20779_node_7は、63個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1147は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R20779_node_7 of the present invention is supported by 63 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R20779_T7. Table 1147 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR20779_node_9は、66個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1148は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R20779_node_9 of the present invention is supported by 66 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R20779_T7. Table 1148 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR20779_node_18は、61個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1149は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R20779_node_18 of the present invention is supported by 61 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R20779_T7. Table 1149 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR20779_node_21は、106個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1150は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R20779_node_21 of the present invention is supported by 106 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R20779_T7. Table 1150 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR20779_node_24は、100個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1151は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R20779_node_24 of the present invention is supported by 100 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R20779_T7. Table 1151 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR20779_node_27は、26個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1152は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R20779_node_27 of the present invention is supported by 26 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R20779_T7. Table 1152 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR20779_node_28は、31個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1153は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R20779_node_28 of the present invention is supported by 31 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R20779_T7. Table 1153 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR20779_node_30は、34個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1154は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R20779_node_30 of the present invention is supported by 34 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R20779_T7. Table 1154 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR20779_node_31は、46個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1155は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R20779_node_31 of the present invention is supported by 46 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R20779_T7. Table 1155 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR20779_node_32は、88個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1156は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R20779_node_32 of the present invention is supported by 88 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R20779_T7. Table 1156 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターR20779_node_1は、27個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1157は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R20779_node_1 of the present invention is supported by 27 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R20779_T7. Table 1157 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR20779_node_3は、52個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1158は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R20779_node_3 of the present invention is supported by 52 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R20779_T7. Table 1158 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR20779_node_10を、以下の転写物中に見出すことができる:R20779_T7。以下の表1159は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R20779_node_10 according to the invention can be found in the following transcript: R20779_T7. Table 1159 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR20779_node_11は、58個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1160は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R20779_node_11 of the present invention is supported by 58 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R20779_T7. Table 1160 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR20779_node_14は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1161は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R20779_node_14 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: R20779_T7. Table 1161 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR20779_node_17は、54個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1162は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R20779_node_17 of the present invention is supported by 54 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R20779_T7. Table 1162 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR20779_node_19を、以下の転写物中に見出すことができる:R20779_T7。以下の表1163は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R20779_node_19 of the invention can be found in the following transcript: R20779_T7. Table 1163 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR20779_node_20は、53個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1164は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R20779_node_20 of the present invention is supported by 53 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R20779_T7. Table 1164 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR20779_node_22は、76個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1165は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R20779_node_22 of the present invention is supported by 76 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R20779_T7. Table 1165 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR20779_node_23は、81個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1166は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R20779_node_23 of the present invention is supported by 81 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R20779_T7. Table 1166 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR20779_node_25を、以下の転写物中に見出すことができる:R20779_T7。以下の表1167は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R20779_node_25 according to the invention can be found in the following transcript: R20779_T7. Table 1167 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR20779_node_29を、以下の転写物中に見出すことができる:R20779_T7。以下の表1168は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R20779_node_29 according to the invention can be found in the following transcript: R20779_T7. Table 1168 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: STC2_HUMAN

Sequence documentation:

Alignment of: R20779_P2 x STC2_HUMAN ..

Alignment segment 1/1:

Quality: 1688.00 Escore: 0
Matching length: 171 Total length: 171
Matching Percent Similarity: 99.42 Matching Percent Identity: 99.42
Total Percent Similarity: 99.42 Total Percent Identity: 99.42
Gaps: 0

Alignment:
. . . . .
1 MCAERLGQFMTLALVLATFDPARGTDATNPPEGPQDRSSQQKGRLSLQNT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MCAERLGQFMTLALVLATFDPARGTDATNPPEGPQDRSSQQKGRLSLQNT 50
. . . . .
51 AEIQHCLVNAGDVGCGVFECFENNSCEIRGLHGICMTFLHNAGKFDAQGK 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 AEIQHCLVNAGDVGCGVFECFENNSCEIRGLHGICMTFLHNAGKFDAQGK 100
. . . . .
101 SFIKDALKCKAHALRHRFGCISRKCPAIREMVSQLQRECYLKHDLCAAAQ 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 SFIKDALKCKAHALRHRFGCISRKCPAIREMVSQLQRECYLKHDLCAAAQ 150
. .
151 ENTRVIVEMIHFKDLLLHECY 171
||||||||||||||||||| |
151 ENTRVIVEMIHFKDLLLHEPY 171



Mutated protein alignment against previously known proteins:
Sequence name: STC2_HUMAN

Sequence documentation:

Alignment of: R20779_P2 x STC2_HUMAN ..

Alignment segment 1/1:

Quality: 1688.00 Escore: 0
Matching length: 171 Total length: 171
Matching Percent Similarity: 99.42 Matching Percent Identity: 99.42
Total Percent Similarity: 99.42 Total Percent Identity: 99.42
Gaps: 0

Alignment:
....
1 MCAERLGQFMTLALVLATFDPARGTDATNPPEGPQDRSSQQKGRLSLQNT 50
||||||||||||||||||||||||||||||||||||||||
1 MCAERLGQFMTLALVLATFDPARGTDATNPPEGPQDRSSQQKGRLSLQNT 50
....
51 AEIQHCLVNAGDVGCGVFECFENNSCEIRGLHGICMMTFLHNAGGFDAQGK 100
||||||||||||||||||||||||||||||||||||||||
51 AEIQHCLVNAGDVGCGVFECFENNSCEIRGLHGICMMTFLHNAGGFDAQGK 100
....
101 SFIKDALKCKAHALRHRFGCISRKCPAIREMVSQLQRECYLKHDLCAAAQ 150
||||||||||||||||||||||||||||||||||||||||
101 SFIKDALKCKAHALRHRFGCISRKCPAIREMVSQLQRECYLKHDLCAAAQ 150
.
151 ENTRVIVEMIHFKDLLLHECY 171
||||||||||||||||||
151 ENTRVIVEMIHFKDLLLHEPY 171


クラスターR38144の説明
クラスターR38144は、目的の6つの転写物および24個のセグメントを特徴とし、その名称を、それぞれ表1169および1170に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表1171に示す。
Description of Cluster R38144 Cluster R38144 is characterized by 6 transcripts and 24 segments of interest, the names of which are shown in Tables 1169 and 1170, respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 1171.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質である推定α−マンノシダーゼC20orf31前駆体(SwissProtアクセッション識別子CT31_HUMAN、同義語EC3.2.1としても公知である)(配列番号1459)の変異型である。   These sequences are the putative α-mannosidase C20 or f31 precursor, which is a known protein, previously known herein as a protein (SwissProt accession identifier CT31_HUMAN, also known as synonym EC3.2.1) (also known as EC3.2.1) It is a variant of SEQ ID NO: 1459).

タンパク質推定α−マンノシダーゼC20orf31前駆体の配列を、「推定α−マンノシダーゼC20orf31前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表1172に示す。   The sequence of the protein putative α-mannosidase C20 or f31 precursor is shown at the end of the application as “the putative α-mannosidase C20 or f31 precursor amino acid sequence”. Known polymorphisms of this sequence are shown in Table 1172.

Figure 2008507261
Figure 2008507261

タンパク質推定α−マンノシダーゼC20orf31前駆体の局在化は、分泌と考えられる(可能性)。   Localization of the protein putative α-mannosidase C20 or f31 precursor is considered secretion (possibility).

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである炭水化物代謝、N結合グリコシル化、分子機能に関連する注釈付けであるグリコシル結合に対して作用するマンノシル−オリゴサッカリド1,2−α−マンノシダーゼ、カルシウム結合、ヒドロラーゼ、細胞成分に関連する注釈付けである膜。   The following GO annotation applies to previously known proteins. The following annotations have been found: Mannosyl-Oligosaccharides 1 which act on carbohydrate metabolism, N-linked glycosylation, annotation related to molecular function, which are annotations related to biological processes, glycosyl bonds 1 , 2-α-mannosidase, calcium binding, hydrolase, membranes that are annotations related to cellular components.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

クラスターR38144を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図45のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   Cluster R38144 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The term “number” in the right column of the table and the number on the y-axis of FIG. 45 refer to the weighted expression of ESTs in each category as “ppm” (for ESTs of a particular cluster in this category by ppm Ratio of expression to expression of all ESTs).

概して、図45および表1173中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):上皮悪性腫瘍、肺悪性腫瘍、皮膚悪性腫瘍、および胃癌。   As shown generally for the histograms in FIG. 45 and Table 1173, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: epithelial malignancy, lung malignancy, skin malignancy and gastric cancer.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、クラスターR38144は、上の表1に列挙した6つの転写物を特徴とする。これらの転写物は、タンパク質推定α−マンノシダーゼC20orf31前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster R38144 is characterized by the six transcripts listed in Table 1 above. These transcripts encode proteins which are variants of the protein putative α-mannosidase C20 or f31 precursor. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質R38144_PEA_2_P6は、出願書類の最後に示すアミノ酸配列を有し、転写物R38144_PEA_2_T6によってコードされる。公知のタンパク質(推定α−マンノシダーゼC20orf31前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein R38144_PEA_2_P6 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript R38144_PEA_2_T6. An alignment to a known protein (the putative α-mannosidase C20 or f31 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

R38144_PEA_2_P6とCT31_HUMANとの間の比較の報告
1.CT31_HUMANのアミノ酸1〜412に対応し、R38144_PEA_2_P6のアミノ酸1〜412にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQDAGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWVQMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLPEFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESIEKISKVECGFATと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P6のアミノ酸413〜449に対応する配列LASFSHMSDQRSARPQAGQPHGVVLPGRDCEIPLPPVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P6をコードする単離キメラポリペプチド。
Report of comparison between R38144_PEA_2_P6 and CT31_HUMAN 1. Corresponding to amino acids 1 to 412 of CT31_HUMAN, corresponding to amino acids 1 to 412 of R38144_PEA_2_P6 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQDAGIGAGVDSYFEYLVKGAILLQDKKLM A part of the main part of the J ア ミ ノ 酸 相同 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 90 90 90 90 90 90 90 90 90 90 90 90 90 90 38 38 38 38 38 38 38 38 38 90 90 90 90 90 90 90 38 38 38 38 38 38 38 38 38 38 38 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も 少 な く と も? Comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first amino acid sequence Acid sequence and a second amino acid sequence, contiguous and in sequential order, the isolated chimeric polypeptide coding R38144_PEA_2_P6.

2.R38144_PEA_2_P6中の配列LASFSHMSDQRSARPQAGQPHGVVLPGRDCEIPLPPVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P6のテールをコードする単離ポリペプチド。   2. R38144_PEA_2_P6 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence LASFSHMSDQRSARPQ AGQPHGVVLPGRDCEIPLPPV in R38144_PEA_2_P6 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質R38144_PEA_2_P6はまた、表1175に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R38144_PEA_2_P6配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R38144_PEA_2_P6 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 1175) It indicates whether it is known and the presence of a known SNP in the mutein R38144_PEA_2_P6 sequence supports the putative sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質推定α−マンノシダーゼC20orf31前駆体と比較した変異タンパク質R38144_PEA_2_P6のグリコシル化部位を表1176に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein R38144_PEA_2_P6 compared to the known protein putative α-mannosidase C20 or f31 precursor are shown in Table 1176 (showing its position on the amino acid sequence in the first column, the second column a glycosylation site Indicates whether or not is present in the mutein, and the last column indicates whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質、R38144_PEA_2_P6は、以下の転写物によってコードされる:R38144_PEA_2_T6(配列は出願書類の最後に示す)。転写物R38144_PEA_2_T6のコード部分を太字で示し、このコード部分は91位から開始され、1437位で終結する。転写物はまた、表1177に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R38144_PEA_2_P6配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R38144_PEA_2_P6 is encoded by the following transcript: R38144_PEA_2_T6 (sequences shown at the end of the application). The coding part of the transcript R38144_PEA_2_T6 is shown in bold, starting from position 91 and ending at position 1437. The transcript also has the following SNPs listed in Table 1177 (showing its position on the nucleotide sequence and listing another nucleic acid, the last column shows whether the SNP is known, mutein R38144_PEA_2_P6 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

本発明の変異タンパク質R38144_PEA_2_P13は、出願書類の最後に示すアミノ酸配列を有し、転写物R38144_PEA_2_T13によってコードされる。公知のタンパク質(推定α−マンノシダーゼC20orf31前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein R38144_PEA_2_P13 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript R38144_PEA_2_T13. An alignment to a known protein (the putative α-mannosidase C20 or f31 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

R38144_PEA_2_P13とCT31_HUMANとの間の比較の報告
1.CT31_HUMANのアミノ酸1〜323に対応し、R38144_PEA_2_P13のアミノ酸1〜323にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQDAGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWVQMYKGTVSMPVFQSLEAYWPGLQと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P13のアミノ酸324〜341に対応する配列NLLKAQCTSTVPRGIPPSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P13をコードする単離キメラポリペプチド。
Report of comparison between R38144_PEA_2_P13 and CT31_HUMAN 1. Corresponding to amino acids 1 to 323 of CT31_HUMAN, corresponding to amino acids 1 to 323 of R38144_PEA_2_P13 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQDAGIGAGVDSYFEYLVKGAILLQDKKL AMFLEYNKAIRNYTRFDDWYLWVQMYKGTVSMPVFQSLEAYWPGLQ At least 70%, preferably at least 80%, preferably at least 85%, more preferably a polypeptide having the first amino acid sequence at least 90% homologous to the sequence NLLKAQCTSTVPRGIPPS corresponding to amino acids 324 to 341 of R38144_PEA_2_P13, preferably at least 85%, more preferably Comprises R38144_PEA_2_P13, which comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first amino acid sequence and the second amino acid sequence being adjacent and in consecutive order Isolated chimeric polypeptide.

2.R38144_PEA_2_P13中の配列NLLKAQCTSTVPRGIPPSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P13のテールをコードする単離ポリペプチド。   2. R38144_PEA_2_P13 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence NLLKAQCTSTVPRGIPPS in R38144_PEA_2_P13 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質R38144_PEA_2_P13はまた、表1178に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R38144_PEA_2_P13配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R38144_PEA_2_P13 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 1178) It indicates whether it is known and the presence of a known SNP in the mutant protein R38144_PEA_2_P13 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質推定α−マンノシダーゼC20orf31前駆体と比較した変異タンパク質R38144_PEA_2_P13のグリコシル化部位を表1179に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutated protein R38144_PEA_2_P13 compared to the known protein putative α-mannosidase C20 or f31 precursor are shown in Table 1179 (showing its position on the amino acid sequence in the first column, the second column a glycosylation site Indicates whether or not is present in the mutein, and the last column indicates whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質、R38144_PEA_2_P13は、以下の転写物によってコードされる:R38144_PEA_2_T13(配列は出願書類の最後に示す)。転写物R38144_PEA_2_T13のコード部分を太字で示し、このコード部分は91位から開始され、1113位で終結する。転写物はまた、表1180に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R38144_PEA_2_P13配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R38144_PEA_2_P13 is encoded by the following transcript: R38144_PEA_2_T13 (sequences shown at the end of the application). The coding part of the transcript R38144_PEA_2_T13 is shown in bold, starting from position 91 and ending at position 1113. The transcript also has the following SNPs listed in Table 1180 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein R38144_PEA_2_P13 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

本発明の変異タンパク質R38144_PEA_2_P15は、出願書類の最後に示すアミノ酸配列を有し、転写物R38144_PEA_2_T15によってコードされる。公知のタンパク質(推定α−マンノシダーゼC20orf31前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein R38144_PEA_2_P15 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript R38144_PEA_2_T15. An alignment to a known protein (the putative α-mannosidase C20 or f31 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

R38144_PEA_2_P15とCT31_HUMANとの間の比較の報告
1.CT31_HUMANのアミノ酸1〜282に対応し、R38144_PEA_2_P15のアミノ酸1〜282にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQDAGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P15のアミノ酸283〜287に対応する配列PHWRHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P15をコードする単離キメラポリペプチド。
Report of comparison between R38144_PEA_2_P15 and CT31_HUMAN 1. Corresponding to amino acids 1 to 282 of CT31_HUMAN, corresponding to amino acids 1 to 282 of R38144_PEA_2_P15 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQDAGIGAGVDSYFEYLVKGAILLQDKKL A polypeptide having a first amino acid sequence at least 90% homologous to AMFLE and a sequence PHWRH corresponding to amino acids 283-287 of R38144_PEA_2_P15, at least 70%, optionally at least 80%, preferably at least 85%, more preferably Comprises R38144_PEA_2_P15, which comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first amino acid sequence and the second amino acid sequence being adjacent and in sequential order Isolated chimeric polypeptide.

2.R38144_PEA_2_P15中の配列PHWRHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P15のテールをコードする単離ポリペプチド。   2. R38144_PEA_2_P15 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence PHWRH in R38144_PEA_2_P15 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質R38144_PEA_2_P15はまた、表1181に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R38144_PEA_2_P15配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R38144_PEA_2_P15 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 1181) It indicates whether it is known and the presence of a known SNP in the mutant protein R38144_PEA_2_P15 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質推定α−マンノシダーゼC20orf31前駆体と比較した変異タンパク質R38144_PEA_2_P15のグリコシル化部位を表1182に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein R38144_PEA_2_P15 compared to the known protein putative α-mannosidase C20 or f31 precursor are shown in Table 1182 (showing its position on the amino acid sequence in the first column, the second column a glycosylation site Indicates whether or not is present in the mutein, and the last column indicates whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質、R38144_PEA_2_P15は、以下の転写物によってコードされる:R38144_PEA_2_T15(配列は出願書類の最後に示す)。転写物R38144_PEA_2_T15のコード部分を太字で示し、このコード部分は91位から開始され、951位で終結する。転写物はまた、表1183に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R38144_PEA_2_P15配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R38144_PEA_2_P15 is encoded by the following transcript: R38144_PEA_2_T15 (sequences shown at the end of the application). The coding part of the transcript R38144_PEA_2_T15 is shown in bold, starting from position 91 and ending at position 951. The transcript also has the following SNPs listed in Table 1183 (showing its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein R38144_PEA_2_P15 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

本発明の変異タンパク質R38144_PEA_2_P19は、出願書類の最後に示すアミノ酸配列を有し、転写物R38144_PEA_2_T19によってコードされる。公知のタンパク質(推定α−マンノシダーゼC20orf31前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein R38144_PEA_2_P19 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript R38144_PEA_2_T19. An alignment to a known protein (the putative α-mannosidase C20 or f31 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

R38144_PEA_2_P19とCT31_HUMANとの間の比較の報告
1.CT31_HUMANのアミノ酸1〜412に対応し、R38144_PEA_2_P19のアミノ酸1〜412にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQDAGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWVQMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLPEFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESIEKISKVECGFATと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P19のアミノ酸413〜433に対応する配列KRSRSVAQAGVQWCDHDSPQPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P19をコードする単離キメラポリペプチド。
Report of comparison between R38144_PEA_2_P19 and CT31_HUMAN 1. Corresponding to amino acids 1 to 412 of CT31_HUMAN, corresponding to amino acids 1 to 412 of R38144_PEA_2_P19 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQDAGIGAGVDSYFEYLVKGAILLQDKKL AMFLEYNKAIRNYTRFDDWYLWVQMYKGTVSMPVFQSLEAYWPGLQSLIGIDIDNAMRFLTNYTVWKQFGGLPEFYNIPQGYTVEK YELG ELPEL IE SAMYLYRATDGPTTLLEGRDAVES HEKHI 1 少 な く と も 433 ア ミ ノ 酸 ア ミ ノ 酸 ア ミ ノ 酸 ア ミ ノ 酸 ア ミ ノ 酸 ア ミ ノ 酸 ア ミ ノ 酸 ア ミ ノ 酸 ア ミ ノ 酸 ア ミ ノ 酸 ア ミ ノ 酸 ア ミ ノ 酸 ア ミ ノ 酸 ア ミ ノ 酸 ア ミ ノ 酸 ア ミ ノ 酸 ア ミ ノ 酸 ア ミ ノ 酸 ア ミ ノ 酸Comprises a second amino acid sequence which is at least 90%, most preferably at least 95% homologous, said first amino acid sequence and said second amino acid Columns, adjacent and in sequential order, the isolated chimeric polypeptide coding R38144_PEA_2_P19.

2.R38144_PEA_2_P19中の配列KRSRSVAQAGVQWCDHDSPQPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P19のテールをコードする単離ポリペプチド。   2. R38144_PEA_2_P19 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence KRSRSVAQAGVQWCDHDSPQ in R38144_PEA_2_P19 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質R38144_PEA_2_P19はまた、表1184に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R38144_PEA_2_P19配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R38144_PEA_2_P19 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 1184) It indicates whether it is known and the presence of a known SNP in the mutant protein R38144_PEA_2_P19 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質推定α−マンノシダーゼC20orf31前駆体と比較した変異タンパク質R38144_PEA_2_P19のグリコシル化部位を表1185に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein R38144_PEA_2_P19 compared to the known protein putative α-mannosidase C20 or f31 precursor are shown in Table 1185 (showing its position on the amino acid sequence in the first column, the second column a glycosylation site Indicates whether or not is present in the mutein, and the last column indicates whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質、R38144_PEA_2_P19は、以下の転写物によってコードされる:R38144_PEA_2_T19(配列は出願書類の最後に示す)。転写物R38144_PEA_2_T19のコード部分を太字で示し、このコード部分は91位から開始され、1389位で終結する。転写物はまた、表1186に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R38144_PEA_2_P19配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R38144_PEA_2_P19 is encoded by the following transcript: R38144_PEA_2_T19 (sequences shown at the end of the application). The coding part of the transcript R38144_PEA_2_T19 is shown in bold, starting from position 91 and ending at position 1389. The transcript also has the following SNPs listed in Table 1186 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein R38144_PEA_2_P19 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質R38144_PEA_2_P24は、出願書類の最後に示すアミノ酸配列を有し、転写物R38144_PEA_2_T27によってコードされる。公知のタンパク質(推定α−マンノシダーゼC20orf31前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein R38144_PEA_2_P24 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript R38144_PEA_2_T27. An alignment to a known protein (the putative α-mannosidase C20 or f31 precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

R38144_PEA_2_P24とCT31_HUMANとの間の比較の報告
1.CT31_HUMANのアミノ酸1〜121に対応し、R38144_PEA_2_P24のアミノ酸1〜121にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRと少なくとも90%相同な第1のアミノ酸配列と、CT31_HUMANのアミノ酸282〜578に対応する配列EYNKAIRNYTRFDDWYLWVQMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLPEFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESIEKISKVECGFATIKDLRDHKLDNRMESFFLAETVKYLYLLFDPTNFIHNNGSTFDAVITPYGECILGAGGYIFNTEAHPIDPAALHCCQRLKEEQWEVEDLMREFYSLKRSRSKFQKNTVSSGPWEPPARPGTLFSPENHDQARERKPAKQKVPLLSCPSQPFTSKLALLGQVFLDSSと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P24をコードする単離キメラポリペプチド。
Report of comparison between R38144_PEA_2_P24 and CT31_HUMAN 1. Corresponding to amino acids 1 to 121 of CT31_HUMAN, first amino acid sequence at least 90% homologous to the corresponding MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIR to amino acids 1 to 121 of R38144_PEA_2_P24, corresponding to amino acids 282-578 of CT31_HUMAN sequence EYNKAIRNYTRFDDWYLWVQMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLPEFYNIPQGYTVEKREGYPLRPELIESAMYLYRAT DPTLLELGRDAVESIEKISKVECGFATIKDLRDHKLDNRMESFFLAETVKYLYLLFDPTNFIHNNGSTFDAVITPYGECILGAGGYIFNTEAHPIDPAALHCCQRLKEEQWEVEDLMREFYSLKRSRSKFQKNTVSSGPWEPPARPGTLFSPENHDQARERKPAKQKVPLLSCPSQPFTSKLALLGQVFLDSS and and at least 90% homologous to a second amino acid sequence, the first amino acid sequence and a second amino acid sequence, contiguous and in sequential order, the isolated chimeric polypeptide encoding R38144_PEA_2_P24 .

2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がREを含み、以下の構造:アミノ酸番号121−x〜121のいずれかから始まり、アミノ酸番号122+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、R38144_PEA_2_P24の縁部分をコードする単離キメラポリペプチド。   2. Length “n” (wherein n is at least about 10 amino acids long, optionally at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long, most preferably at least about 50 amino acids long, at least two amino acids comprising RE, starting from any of the following structures: amino acid numbers 121-x to 121, amino acid numbers 122 + ((n-2) -x) (formula An isolated chimeric polypeptide encoding an edge portion of R38144_PEA_2_P24, comprising a polypeptide, having a sequence terminating in :), wherein x is a change from 0 to n-2.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質R38144_PEA_2_P24はまた、表1187に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R38144_PEA_2_P24配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R38144_PEA_2_P24 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 1187) It indicates whether it is known and the presence of a known SNP in the mutant protein R38144_PEA_2_P24 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質推定α−マンノシダーゼC20orf31前駆体と比較した変異タンパク質R38144_PEA_2_P24のグリコシル化部位を表1188に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein R38144_PEA_2_P24 compared to the known protein putative α-mannosidase C20orf31 precursor are shown in Table 1188 (showing its position on the amino acid sequence in the first column, the second column a glycosylation site Indicates whether or not is present in the mutein, and the last column indicates whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質、R38144_PEA_2_P24は、以下の転写物によってコードされる:R38144_PEA_2_T27(配列は出願書類の最後に示す)。転写物R38144_PEA_2_T27のコード部分を太字で示し、このコード部分は91位から開始され、1344位で終結する。転写物はまた、表1189に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R38144_PEA_2_P24配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R38144_PEA_2_P24 is encoded by the following transcript: R38144_PEA_2_T27 (sequences shown at the end of the application). The code portion of the transcript R38144_PEA_2_T27 is shown in bold, starting from position 91 and ending at position 1344. The transcript also has the following SNPs listed in Table 1189 (showing its position on the nucleotide sequence, listing another nucleic acid, the last column shows whether the SNP is known, mutein R38144_PEA_2_P24 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質R38144_PEA_2_P36は、出願書類の最後に示すアミノ酸配列を有し、転写物R38144_PEA_2_T10によってコードされる。公知のタンパク質(推定α−マンノシダーゼC20orf31前駆体、配列番号1459)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein R38144_PEA_2_P36 of the present invention has the amino acid sequence shown at the end of the application and is encoded by the transcript R38144_PEA_2_T10. An alignment to a known protein (presumed α-mannosidase C20 or f31 precursor, SEQ ID NO: 1459) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

R38144_PEA_2_P36とAAH16184(配列番号1460)との間の比較の報告
1.AAH16184のアミノ酸1〜36に対応し、R38144_PEA_2_P36のアミノ酸1〜36にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P36のアミノ酸37〜60に対応する配列FWGMSQNSKEWLKCSRTAWTLILMを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P36をコードする単離キメラポリペプチド。
Report of comparison between R38144_PEA_2_P36 and AAH 16184 (SEQ ID NO: 1460) A polypeptide having a first amino acid sequence corresponding to amino acids 1 to 36 of AAH 16184 and corresponding to amino acids 1 to 36 of R38144_PEA_2_P36 and MPFRLLIPLGLLCALLPQHHGAPGPDGSAPSAPAPHYR and the sequence FWGMSQNSKEWLKCRTTAWTLILM corresponding to amino acids 37 to 60 of R38144_PEA_2_P36 Said second amino acid sequence comprising a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; An isolated fragment encoding R38144_PEA_2_P36, wherein the two amino acid sequences are in contiguous and sequential order Polypeptide.

2.R38144_PEA_2_P36中の配列FWGMSQNSKEWLKCSRTAWTLILMと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P36のテールをコードする単離ポリペプチド。   2. R38144_PEA_2_P36 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence FWGMSQNSKEWLKCSRTAWTL in R38144_PEA_2_P36 An isolated polypeptide encoding a tail.

R38144_PEA_2_P36とAAQ88943(配列番号1461)との間の比較の報告
1.AAQ88943のアミノ酸1〜35に対応し、R38144_PEA_2_P36のアミノ酸1〜35にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P36のアミノ酸36〜60に対応する配列RFWGMSQNSKEWLKCSRTAWTLILMを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P36をコードする単離キメラポリペプチド。
Report on comparison between R38144_PEA_2_P36 and AAQ 88943 (SEQ ID NO: 1461) A polypeptide having a first amino acid sequence corresponding to amino acids 1 to 35 of AAQ 88943 and corresponding to amino acids 1 to 35 of R38144_PEA_2_P36 and MPFRLLIPLGLLCALLPQHHGAPGPDGSAPSAPAPHY and the sequence RFWGMSQNSKEWLCSRTAWTLM corresponding to amino acids 36 to 60 of R38144_PEA_2_P36 Said second amino acid sequence comprising a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; An isolated fragment encoding R38144_PEA_2_P36, wherein the two amino acid sequences are in contiguous and sequential order Polypeptide.

2.R38144_PEA_2_P36中の配列RFWGMSQNSKEWLKCSRTAWTLILMと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P36のテールをコードする単離ポリペプチド。   2. R38144_PEA_2_P36 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence RFWGMSQ NSKEWLKCSRTAWTL in R38144_PEA_2_P36 An isolated polypeptide encoding a tail.

R38144_PEA_2_P36とCT31_HUMANとの間の比較の報告
1.CT31_HUMANのアミノ酸1〜36に対応し、R38144_PEA_2_P36のアミノ酸1〜36にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P36のアミノ酸37〜60に対応する配列FWGMSQNSKEWLKCSRTAWTLILMを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P36をコードする単離キメラポリペプチド。
Report of comparison between R38144_PEA_2_P36 and CT31_HUMAN 1. A polypeptide having a first amino acid sequence corresponding to amino acids 1-36 of CT31_HUMAN and corresponding to amino acids 1-36 of R38144_PEA_2_P36 with MPFRLLIPLGLLCALLPQHHGAPGPDGSAPSAPAPHYR and the sequence FWGMSQNSKEWLCKCRTTAWTLM corresponding to amino acids 37-60 of R38144_PEA_2_P36 Said second amino acid sequence comprising a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; Isolation encoding R38144_PEA_2_P36, wherein the two amino acid sequences are in contiguous and sequential order Mera polypeptide.

2.R38144_PEA_2_P36中の配列FWGMSQNSKEWLKCSRTAWTLILMと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P36のテールをコードする単離ポリペプチド。   2. R38144_PEA_2_P36 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence FWGMSQNSKEWLKCSRTAWTL in R38144_PEA_2_P36 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質R38144_PEA_2_P36はまた、表1190に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R38144_PEA_2_P36配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R38144_PEA_2_P36 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 1190) It indicates whether it is known and the presence of a known SNP in the mutant protein R38144_PEA_2_P36 sequence supports the predicted sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質推定α−マンノシダーゼC20orf31前駆体と比較した変異タンパク質R38144_PEA_2_P36のグリコシル化部位を表1191に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein R38144_PEA_2_P36 compared to the known protein putative α-mannosidase C20orf31 precursor are shown in Table 1191 (showing its position on the amino acid sequence in the first column, the second column a glycosylation site Indicates whether or not is present in the mutein, and the last column indicates whether this position is different on the mutein).

Figure 2008507261
Figure 2008507261

変異タンパク質、R38144_PEA_2_P36は、以下の転写物によってコードされる:R38144_PEA_2_T10(配列は出願書類の最後に示す)。転写物R38144_PEA_2_T10のコード部分を太字で示し、このコード部分は91位から開始され、270位で終結する。転写物はまた、表1192に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R38144_PEA_2_P36配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R38144_PEA_2_P36 is encoded by the following transcript: R38144_PEA_2_T10 (sequences shown at the end of the application). The code portion of transcript R38144_PEA_2_T10 is shown in bold, starting at position 91 and ending at position 270. The transcript also has the following SNPs listed in Table 1192 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein R38144_PEA_2_P36 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

上記のように、クラスターR38144は、上の表2に列挙した24個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster R38144 is characterized by the 24 segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターR38144_PEA_2_node_21は、108個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、およびR38144_PEA_2_T19。以下の表1193は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R38144_PEA_2_node_21 of the present invention is supported by 108 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R38144_PEA_2_T6, R38144_PEA_2_T10, R38144_PEA_2_T13, R38144_PEA_2_T15, and R38144_PEA_2_T19. Table 1193 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR38144_PEA_2_node_26は、98個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、およびR38144_PEA_2_T19。以下の表1194は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R38144_PEA_2_node_26 of the present invention is supported by 98 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R38144_PEA_2_T6, R38144_PEA_2_T10, R38144_PEA_2_T13, R38144_PEA_2_T15, and R38144_PEA_2_T19. Table 1194 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR38144_PEA_2_node_29は、98個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T19、およびR38144_PEA_2_T27。以下の表1195は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R38144_PEA_2_node_29 of the present invention is supported by 98 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R38144_PEA_2_T6, R38144_PEA_2_T10, R38144_PEA_2_T13, R38144_PEA_2_T19, and R38144_PEA_2_T27. Table 1195 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR38144_PEA_2_node_31は、95個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T15、R38144_PEA_2_T19、およびR38144_PEA_2_T27。以下の表1196は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R38144_PEA_2_node_31 of the present invention is supported by 95 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R38144_PEA_2_T6, R38144_PEA_2_T10, R38144_PEA_2_T15, R38144_PEA_2_T19, and R38144_PEA_2_T27. Table 1196 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR38144_PEA_2_node_46は、147個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、およびR38144_PEA_2_T27。以下の表1197は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R38144_PEA_2_node_46 of the present invention is supported by 147 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R38144_PEA_2_T6, R38144_PEA_2_T10, R38144_PEA_2_T13, R38144_PEA_2_T15, and R38144_PEA_2_T27. Table 1197 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR38144_PEA_2_node_47は、147個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、およびR38144_PEA_2_T27。以下の表1198は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R38144_PEA_2_node_47 of the present invention is supported by 147 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R38144_PEA_2_T6, R38144_PEA_2_T10, R38144_PEA_2_T13, R38144_PEA_2_T15, and R38144_PEA_2_T27. Table 1198 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR38144_PEA_2_node_49は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T19。以下の表1199は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R38144_PEA_2_node_49 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: R38144_PEA_2_T19. Table 1199 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターR38144_PEA_2_node_0は、101個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、R38144_PEA_2_T19、およびR38144_PEA_2_T27。以下の表1200は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R38144_PEA_2_node_0 of the present invention is supported by 101 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R38144_PEA_2_T6, R38144_PEA_2_T10, R38144_PEA_2_T13, R38144_PEA_2_T15, R38144_PEA_2_T19, and R38144_PEA_2_T27. Table 1200 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR38144_PEA_2_node_1は、105個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、R38144_PEA_2_T19、およびR38144_PEA_2_T27。以下の表1202は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R38144_PEA_2_node_1 of the present invention is supported by 105 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R38144_PEA_2_T6, R38144_PEA_2_T10, R38144_PEA_2_T13, R38144_PEA_2_T15, R38144_PEA_2_T19, and R38144_PEA_2_T27. Table 1202 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR38144_PEA_2_node_4は、107個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T13、R38144_PEA_2_T15、R38144_PEA_2_T19、およびR38144_PEA_2_T27。以下の表1203は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R38144_PEA_2_node_4 of the present invention is supported by 107 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R38144_PEA_2_T6, R38144_PEA_2_T13, R38144_PEA_2_T15, R38144_PEA_2_T19, and R38144_PEA_2_T27. Table 1203 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR38144_PEA_2_node_5を、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T13、R38144_PEA_2_T15、R38144_PEA_2_T19、およびR38144_PEA_2_T27。以下の表1204は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R38144_PEA_2_node_5 of the invention can be found in the following transcripts: R38144_PEA_2_T6, R38144_PEA_2_T13, R38144_PEA_2_T15, R38144_PEA_2_T19, and R38144_PEA_2_T27. Table 1204 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR38144_PEA_2_node_7は、92個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T13、R38144_PEA_2_T15、R38144_PEA_2_T19、およびR38144_PEA_2_T27。以下の表1205は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R38144_PEA_2_node_7 of the present invention is supported by 92 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R38144_PEA_2_T6, R38144_PEA_2_T13, R38144_PEA_2_T15, R38144_PEA_2_T19, and R38144_PEA_2_T27. Table 1205 below describes the start and end positions of this segment on each transcript.


Figure 2008507261

Figure 2008507261

本発明のセグメントクラスターR38144_PEA_2_node_11は、106個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、R38144_PEA_2_T19、およびR38144_PEA_2_T27。以下の表1206は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R38144_PEA_2_node_11 of the present invention is supported by 106 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R38144_PEA_2_T6, R38144_PEA_2_T10, R38144_PEA_2_T13, R38144_PEA_2_T15, R38144_PEA_2_T19, and R38144_PEA_2_T27. Table 1206 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR38144_PEA_2_node_14を、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、およびR38144_PEA_2_T19。以下の表1207は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R38144_PEA_2_node_14 according to the invention can be found in the following transcripts: R38144_PEA_2_T6, R38144_PEA_2_T10, R38144_PEA_2_T13, R38144_PEA_2_T15, and R38144_PEA_2_T19. Table 1207 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR38144_PEA_2_node_15は、105個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、およびR38144_PEA_2_T19。以下の表1208は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R38144_PEA_2_node_15 of the present invention is supported by 105 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R38144_PEA_2_T6, R38144_PEA_2_T10, R38144_PEA_2_T13, R38144_PEA_2_T15, and R38144_PEA_2_T19. Table 1208 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR38144_PEA_2_node_16は、106個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、およびR38144_PEA_2_T19。以下の表1209は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R38144_PEA_2_node_16 of the present invention is supported by 106 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R38144_PEA_2_T6, R38144_PEA_2_T10, R38144_PEA_2_T13, R38144_PEA_2_T15, and R38144_PEA_2_T19. Table 1209 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR38144_PEA_2_node_19は、93個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、およびR38144_PEA_2_T19。以下の表1210は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R38144_PEA_2_node_19 of the present invention is supported by 93 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R38144_PEA_2_T6, R38144_PEA_2_T10, R38144_PEA_2_T13, R38144_PEA_2_T15, and R38144_PEA_2_T19. Table 1210 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR38144_PEA_2_node_20を、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、およびR38144_PEA_2_T19。以下の表1211は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R38144_PEA_2_node_20 according to the invention can be found in the following transcripts: R38144_PEA_2_T6, R38144_PEA_2_T10, R38144_PEA_2_T13, R38144_PEA_2_T15, and R38144_PEA_2_T19. Table 1211 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR38144_PEA_2_node_36は、95個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、R38144_PEA_2_T19、およびR38144_PEA_2_T27。以下の表1212は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R38144_PEA_2_node_36 of the present invention is supported by 95 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R38144_PEA_2_T6, R38144_PEA_2_T10, R38144_PEA_2_T13, R38144_PEA_2_T15, R38144_PEA_2_T19, and R38144_PEA_2_T27. Table 1212 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR38144_PEA_2_node_37は、97個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、R38144_PEA_2_T19、およびR38144_PEA_2_T27。以下の表1213は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R38144_PEA_2_node_37 of the present invention is supported by 97 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R38144_PEA_2_T6, R38144_PEA_2_T10, R38144_PEA_2_T13, R38144_PEA_2_T15, R38144_PEA_2_T19, and R38144_PEA_2_T27. Table 1213 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR38144_PEA_2_node_43を、以下の転写物中に見出すことができる:R38144_PEA_2_T6。以下の表1214は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R38144_PEA_2_node_43 according to the invention can be found in the following transcript: R38144_PEA_2_T6. Table 1214 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR38144_PEA_2_node_44を、以下の転写物中に見出すことができる:R38144_PEA_2_T6。以下の表1215は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R38144_PEA_2_node_44 according to the invention can be found in the following transcript: R38144_PEA_2_T6. Table 1215 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR38144_PEA_2_node_45を、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、およびR38144_PEA_2_T27。以下の表1216は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R38144_PEA_2_node_45 according to the invention can be found in the following transcripts: R38144_PEA_2_T6, R38144_PEA_2_T10, R38144_PEA_2_T13, R38144_PEA_2_T15, and R38144_PEA_2_T27. Table 1216 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR38144_PEA_2_node_51は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T19。以下の表1217は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R38144_PEA_2_node_51 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: R38144_PEA_2_T19. Table 1217 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: CT31_HUMAN

Sequence documentation:

Alignment of: R38144_PEA_2_P6 x CT31_HUMAN ..

Alignment segment 1/1:

Quality: 4031.00 Escore: 0
Matching length: 413 Total length: 413
Matching Percent Similarity: 100.00 Matching Percent Identity: 99.76
Total Percent Similarity: 100.00 Total Percent Identity: 99.76
Gaps: 0

Alignment:
. . . . .
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
. . . . .
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
. . . . .
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
. . . . .
151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
. . . . .
201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
. . . . .
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
. . . . .
301 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLP 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLP 350
. . . . .
351 EFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESI 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESI 400
.
401 EKISKVECGFATL 413
||||||||||||:
401 EKISKVECGFATI 413






Sequence name: CT31_HUMAN

Sequence documentation:

Alignment of: R38144_PEA_2_P13 x CT31_HUMAN ..

Alignment segment 1/1:

Quality: 3167.00 Escore: 0
Matching length: 326 Total length: 326
Matching Percent Similarity: 100.00 Matching Percent Identity: 99.39
Total Percent Similarity: 100.00 Total Percent Identity: 99.39
Gaps: 0

Alignment:
. . . . .
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
. . . . .
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
. . . . .
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
. . . . .
151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
. . . . .
201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
. . . . .
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
. .
301 QMYKGTVSMPVFQSLEAYWPGLQNLL 326
|||||||||||||||||||||||:|:
301 QMYKGTVSMPVFQSLEAYWPGLQSLI 326






Sequence name: CT31_HUMAN

Sequence documentation:

Alignment of: R38144_PEA_2_P15 x CT31_HUMAN ..

Alignment segment 1/1:

Quality: 2725.00 Escore: 0
Matching length: 282 Total length: 282
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
. . . . .
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
. . . . .
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
. . . . .
151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
. . . . .
201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
. . .
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLE 282
||||||||||||||||||||||||||||||||
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLE 282






Sequence name: CT31_HUMAN

Sequence documentation:

Alignment of: R38144_PEA_2_P19 x CT31_HUMAN ..

Alignment segment 1/1:

Quality: 4029.00 Escore: 0
Matching length: 412 Total length: 412
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
. . . . .
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
. . . . .
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
. . . . .
151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
. . . . .
201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
. . . . .
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
. . . . .
301 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLP 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLP 350
. . . . .
351 EFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESI 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESI 400
.
401 EKISKVECGFAT 412
||||||||||||
401 EKISKVECGFAT 412






Sequence name: CT31_HUMAN

Sequence documentation:

Alignment of: R38144_PEA_2_P24 x CT31_HUMAN ..

Alignment segment 1/1:

Quality: 4063.00 Escore: 0
Matching length: 418 Total length: 578
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 72.32 Total Percent Identity: 72.32
Gaps: 1

Alignment:
. . . . .
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
. . . . .
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
. . . . .
101 LQDSVDFDIDVNASVFETNIR............................. 121
|||||||||||||||||||||
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
. . . . .
121 .................................................. 121

151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
. . . . .
121 .................................................. 121

201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
. . . . .
122 ...............................EYNKAIRNYTRFDDWYLWV 140
|||||||||||||||||||
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
. . . . .
141 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLP 190
||||||||||||||||||||||||||||||||||||||||||||||||||
301 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLP 350
. . . . .
191 EFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESI 240
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESI 400
. . . . .
241 EKISKVECGFATIKDLRDHKLDNRMESFFLAETVKYLYLLFDPTNFIHNN 290
||||||||||||||||||||||||||||||||||||||||||||||||||
401 EKISKVECGFATIKDLRDHKLDNRMESFFLAETVKYLYLLFDPTNFIHNN 450
. . . . .
291 GSTFDAVITPYGECILGAGGYIFNTEAHPIDPAALHCCQRLKEEQWEVED 340
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GSTFDAVITPYGECILGAGGYIFNTEAHPIDPAALHCCQRLKEEQWEVED 500
. . . . .
341 LMREFYSLKRSRSKFQKNTVSSGPWEPPARPGTLFSPENHDQARERKPAK 390
||||||||||||||||||||||||||||||||||||||||||||||||||
501 LMREFYSLKRSRSKFQKNTVSSGPWEPPARPGTLFSPENHDQARERKPAK 550
. .
391 QKVPLLSCPSQPFTSKLALLGQVFLDSS 418
||||||||||||||||||||||||||||
551 QKVPLLSCPSQPFTSKLALLGQVFLDSS 578






Sequence name: AAH16184

Sequence documentation:

Alignment of: R38144_PEA_2_P36 x AAH16184 ..

Alignment segment 1/1:

Quality: 364.00 Escore: 0
Matching length: 36 Total length: 36
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . .
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYR 36
||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYR 36






Sequence name: AAQ88943

Sequence documentation:

Alignment of: R38144_PEA_2_P36 x AAQ88943 ..

Alignment segment 1/1:

Quality: 362.00 Escore: 0
Matching length: 37 Total length: 37
Matching Percent Similarity: 97.30 Matching Percent Identity: 97.30
Total Percent Similarity: 97.30 Total Percent Identity: 97.30
Gaps: 0

Alignment:
. . .
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRF 37
||||||||||||||||||||||||||||||||||| |
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYSF 37






Sequence name: CT31_HUMAN

Sequence documentation:

Alignment of: R38144_PEA_2_P36 x CT31_HUMAN ..

Alignment segment 1/1:

Quality: 364.00 Escore: 0
Matching length: 36 Total length: 36
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . .
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYR 36
||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYR 36



Mutated protein alignment against previously known proteins:
Sequence name: CT31_HUMAN

Sequence documentation:

Alignment of: R38144_PEA_2_P6 x CT31_HUMAN ..

Alignment segment 1/1:

Quality: 4031.00 Escore: 0
Matching length: 413 Total length: 413
Matching Percent Similarity: 100.00 Matching Percent Identity: 99.76
Total Percent Similarity: 100.00 Total Percent Identity: 99.76
Gaps: 0

Alignment:
....
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPSAPADAHYREVKAMFYHAYDSY 50
||||||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPSAPADAHYREVKAMFYHAYDSY 50
....
51 LENAFPFDELRPLTCDDGHDTWSFSFSLTLIDALDTLLILGNVSEFQRVVEV 100
||||||||||||||||||||||||||||||||||||||||
51 LENAFPFDELRPLTCDDGHDTWSFSFSLTLIDALDTLLILGNVSEFQRVVEV 100
....
101 LQDSVFDFDIDVNASVFETNIRVVGGLLSHLLSKKAGVEVEAGWPCSGPL 150
||||||||||||||||||||||||||||||||||||||||
101 LQDSVFDFDIDVNASVFETNIRVVGGLLSHLLSKKAGVEVEAGWPCSGPL 150
....
151 LRM AEEA ARKL LP AF Q TP GM Y GT V N LL H HG V NP GET PVTC TAG IG TF IV 200
||||||||||||||||||||||||||||||||||||||||
151 LRM AEEA ARKL LP AF Q TP GM Y GT V N LL H HG V NP GET PVTC TAG IG TF IV 200
....
201 EFATLSSLTGDPFVED VARVALMRWESSDIGLVGNHID VLTGKWVAQD 250
||||||||||||||||||||||||||||||||||||||||
201 EFATLSSLTGDPFVED VARVALMRWESSDIGLVGNHID VLTGKWVAQD 250
....
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
||||||||||||||||||||||||||||||||||||||||
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
....
301 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMMRTLNYYTVWKQFGFLP 350
||||||||||||||||||||||||||||||||||||||||
301 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMMRTLNYYTVWKQFGFLP 350
....
351 EFYNIPQGYTVEKREGYPLRPELIESAMYLYRATDGPTLELGRDAVESI 400
||||||||||||||||||||||||||||||||||||||||
351 EFYNIPQGYTVEKREGYPLRPELIESAMYLYRATDGPTLELGRDAVESI 400
.
401 EKISK VECGFATL 413
||||||||||: |
401 EKISKVECGFATI 413






Sequence name: CT31_HUMAN

Sequence documentation:

Alignment of: R38144_PEA_2_P13 x CT31_HUMAN ..

Alignment segment 1/1:

Quality: 3167.00 Escore: 0
Matching length: 326 Total length: 326
Matching Percent Similarity: 100.00 Matching Percent Identity: 99.39
Total Percent Similarity: 100.00 Total Percent Identity: 99.39
Gaps: 0

Alignment:
....
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPSAPADAHYREVKAMFYHAYDSY 50
||||||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPSAPADAHYREVKAMFYHAYDSY 50
....
51 LENAFPFDELRPLTCDDGHDTWSFSFSLTLIDALDTLLILGNVSEFQRVVEV 100
||||||||||||||||||||||||||||||||||||||||
51 LENAFPFDELRPLTCDDGHDTWSFSFSLTLIDALDTLLILGNVSEFQRVVEV 100
....
101 LQDSVFDFDIDVNASVFETNIRVVGGLLSHLLSKKAGVEVEAGWPCSGPL 150
||||||||||||||||||||||||||||||||||||||||
101 LQDSVFDFDIDVNASVFETNIRVVGGLLSHLLSKKAGVEVEAGWPCSGPL 150
....
151 LRM AEEA ARKL LP AF Q TP GM Y GT V N LL H HG V NP GET PVTC TAG IG TF IV 200
||||||||||||||||||||||||||||||||||||||||
151 LRM AEEA ARKL LP AF Q TP GM Y GT V N LL H HG V NP GET PVTC TAG IG TF IV 200
....
201 EFATLSSLTGDPFVED VARVALMRWESSDIGLVGNHID VLTGKWVAQD 250
||||||||||||||||||||||||||||||||||||||||
201 EFATLSSLTGDPFVED VARVALMRWESSDIGLVGNHID VLTGKWVAQD 250
....
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
||||||||||||||||||||||||||||||||||||||||
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
.
301 QMYKGTVSMPVFQSLEAYWPGLQNLL 326
||||||||||||||||||||: |
301 QMYKGTVSMPVFQSLEAYWPGLQSLI 326






Sequence name: CT31_HUMAN

Sequence documentation:

Alignment of: R38144_PEA_2_P15 x CT31_HUMAN ..

Alignment segment 1/1:

Quality: 2725.00 Escore: 0
Matching length: 282 Total length: 282
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPSAPADAHYREVKAMFYHAYDSY 50
||||||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPSAPADAHYREVKAMFYHAYDSY 50
....
51 LENAFPFDELRPLTCDDGHDTWSFSFSLTLIDALDTLLILGNVSEFQRVVEV 100
||||||||||||||||||||||||||||||||||||||||
51 LENAFPFDELRPLTCDDGHDTWSFSFSLTLIDALDTLLILGNVSEFQRVVEV 100
....
101 LQDSVFDFDIDVNASVFETNIRVVGGLLSHLLSKKAGVEVEAGWPCSGPL 150
||||||||||||||||||||||||||||||||||||||||
101 LQDSVFDFDIDVNASVFETNIRVVGGLLSHLLSKKAGVEVEAGWPCSGPL 150
....
151 LRM AEEA ARKL LP AF Q TP GM Y GT V N LL H HG V NP GET PVTC TAG IG TF IV 200
||||||||||||||||||||||||||||||||||||||||
151 LRM AEEA ARKL LP AF Q TP GM Y GT V N LL H HG V NP GET PVTC TAG IG TF IV 200
....
201 EFATLSSLTGDPFVED VARVALMRWESSDIGLVGNHID VLTGKWVAQD 250
||||||||||||||||||||||||||||||||||||||||
201 EFATLSSLTGDPFVED VARVALMRWESSDIGLVGNHID VLTGKWVAQD 250
....
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLE 282
||||||||||||||||||||||||||||||
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLE 282






Sequence name: CT31_HUMAN

Sequence documentation:

Alignment of: R38144_PEA_2_P19 x CT31_HUMAN ..

Alignment segment 1/1:

Quality: 4029.00 Escore: 0
Matching length: 412 Total length: 412
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPSAPADAHYREVKAMFYHAYDSY 50
||||||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPSAPADAHYREVKAMFYHAYDSY 50
....
51 LENAFPFDELRPLTCDDGHDTWSFSFSLTLIDALDTLLILGNVSEFQRVVEV 100
||||||||||||||||||||||||||||||||||||||||
51 LENAFPFDELRPLTCDDGHDTWSFSFSLTLIDALDTLLILGNVSEFQRVVEV 100
....
101 LQDSVFDFDIDVNASVFETNIRVVGGLLSHLLSKKAGVEVEAGWPCSGPL 150
||||||||||||||||||||||||||||||||||||||||
101 LQDSVFDFDIDVNASVFETNIRVVGGLLSHLLSKKAGVEVEAGWPCSGPL 150
....
151 LRM AEEA ARKL LP AF Q TP GM Y GT V N LL H HG V NP GET PVTC TAG IG TF IV 200
||||||||||||||||||||||||||||||||||||||||
151 LRM AEEA ARKL LP AF Q TP GM Y GT V N LL H HG V NP GET PVTC TAG IG TF IV 200
....
201 EFATLSSLTGDPFVED VARVALMRWESSDIGLVGNHID VLTGKWVAQD 250
||||||||||||||||||||||||||||||||||||||||
201 EFATLSSLTGDPFVED VARVALMRWESSDIGLVGNHID VLTGKWVAQD 250
....
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
||||||||||||||||||||||||||||||||||||||||
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
....
301 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMMRTLNYYTVWKQFGFLP 350
||||||||||||||||||||||||||||||||||||||||
301 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMMRTLNYYTVWKQFGFLP 350
....
351 EFYNIPQGYTVEKREGYPLRPELIESAMYLYRATDGPTLELGRDAVESI 400
||||||||||||||||||||||||||||||||||||||||
351 EFYNIPQGYTVEKREGYPLRPELIESAMYLYRATDGPTLELGRDAVESI 400
.
401 EKISKVECG FAT 412
||||||||||||
401 EKISKVECG FAT 412






Sequence name: CT31_HUMAN

Sequence documentation:

Alignment of: R38144_PEA_2_P24 x CT31_HUMAN ..

Alignment segment 1/1:

Quality: 4063.00 Escore: 0
Matching length: 418 Total length: 578
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 72.32 Total Percent Identity: 72.32
Gaps: 1

Alignment:
....
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPSAPADAHYREVKAMFYHAYDSY 50
||||||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPSAPADAHYREVKAMFYHAYDSY 50
....
51 LENAFPFDELRPLTCDDGHDTWSFSFSLTLIDALDTLLILGNVSEFQRVVEV 100
||||||||||||||||||||||||||||||||||||||||
51 LENAFPFDELRPLTCDDGHDTWSFSFSLTLIDALDTLLILGNVSEFQRVVEV 100
....
101 LQDSVFDFDIVNASVFETNIR ......................................... 121
||||||||||||||||||||
101 LQDSVFDFDIDVNASVFETNIRVVGGLLSHLLSKKAGVEVEAGWPCSGPL 150
....
121 ...................................................... . 121

151 LRM AEEA ARKL LP AF Q TP GM Y GT V N LL H HG V NP GET PVTC TAG IG TF IV 200
....
121 ...................................................... . 121

201 EFATLSSLTGDPFVED VARVALMRWESSDIGLVGNHID VLTGKWVAQD 250
....
122 ................................... EYNKAIRNYTRFDDWYLWV 140
||||||||||||||||||
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
....
141 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMMRTLNYYTVWKQFGGLP 190
||||||||||||||||||||||||||||||||||||||||
301 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMMRTLNYYTVWKQFGFLP 350
....
191 EFYNIPQGYTVEKREGYPLRPELIESAMYLYRATDGPTLELGRDAVESI 240
||||||||||||||||||||||||||||||||||||||||
351 EFYNIPQGYTVEKREGYPLRPELIESAMYLYRATDGPTLELGRDAVESI 400
....
241 EKISKVECGFATIKDLRDHKLDNRMESFFLAETVKYLYLLFDPTNFIHNN 290
||||||||||||||||||||||||||||||||||||||||
401 EKISKVECGFATIKDLRDHKLDNRMESFFLAETVKYLYLLFDPTNFIHNN 450
....
291 GSTFDAVITPYGECILGAGGYIFNTEAHPIDPAALHCCQRLKEEQWEVED 340
||||||||||||||||||||||||||||||||||||||||
451 GSTFDAVITPYGECILGAGGYIFNTEAHPIDPAALHCCQRLKEEQWEVED 500
....
341 LMREFYSLKRSRSKFQKNTVSSGPWEPPRPGTLFSPENHDQARERKPAK 390
||||||||||||||||||||||||||||||||||||||||
501 LMREFYSLKRSRSKFQKNTVSSGPWEPPRPGTLFSPENHDQARERKPAK 550
.
391 QKVPLLSCPSQPFTSKLALLGQVFLDSS 418
||||||||||||||||||||||||||
551 QKVPLLSCPSQPFTSKLALLGQVFLDSS 578






Sequence name: AAH16184

Sequence documentation:

Alignment of: R38144_PEA_2_P36 x AAH16184 ..

Alignment segment 1/1:

Quality: 364.00 Escore: 0
Matching length: 36 Total length: 36
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPSAPDAHYR 36
|||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPSAPDAHYR 36






Sequence name: AAQ88943

Sequence documentation:

Alignment of: R38144_PEA_2_P36 x AAQ88943 ..

Alignment segment 1/1:

Quality: 362.00 Escore: 0
Matching length: 37 Total length: 37
Matching Percent Similarity: 97.30 Matching Percent Identity: 97.30
Total Percent Similarity: 97.30 Total Percent Identity: 97.30
Gaps: 0

Alignment:
....
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPSAPDAHYRF 37
|||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPSAPDAHYSF 37






Sequence name: CT31_HUMAN

Sequence documentation:

Alignment of: R38144_PEA_2_P36 x CT31_HUMAN ..

Alignment segment 1/1:

Quality: 364.00 Escore: 0
Matching length: 36 Total length: 36
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPSAPDAHYR 36
|||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPSAPDAHYR 36


クラスターHUMOSTROの説明
クラスターHUMOSTROは、目的の3つの転写物および30個のセグメントを特徴とし、その名称を、それぞれ表1218および1219に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表1220に示す。
Description of cluster HUMOSTRO Cluster HUMOSTRO features 3 transcripts of interest and 30 segments, the names of which are given in Tables 1218 and 1219 respectively, and the sequence itself is given at the end of the application. Selected protein variants are shown in Table 1220.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるオステオポンチン前駆体(SwissProtアクセッション識別子OSTP_HUMAN、同義語骨シアロタンパク質1、尿結石タンパク質、分泌性リンタンパク質1、SPP−1、ネフロポンチン、ウロポンチンとしても公知である)(配列番号1462)の変異型である。   These sequences are osteopontin precursors (SwissProt accession identifier OSTP_HUMAN, synonym bone sialoprotein 1, urinary calculus protein, secretory phosphoprotein 1, SPP, which is a known protein previously referred to herein as a protein). -1, a variant of Nephropontin, which is also known as uropontin (SEQ ID NO: 1462).

タンパク質オステオポンチン前駆体は、以下の機能を有することが公知であるか、そのように見なされている:石灰化基質の不可欠部分を形成するようである。おそらく、細胞−基質相互作用に重要である。インターフェロンγおよびインターロイキン−12の産生の増強ならびにインターロイキン−10産生の減少に関与するサイトカインとして作用し、I型免疫を生じる経路に不可欠である(類似性による)。タンパク質オステオポンチン前駆体の配列を、「オステオポンチン前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表1221に示す。   The protein osteopontin precursor is known or considered to have the following function: it appears to form an integral part of the calcified substrate. Possibly important for cell-substrate interactions. Acts as a cytokine involved in enhancing interferon-gamma and interleukin-12 production as well as reducing interleukin-10 production and is essential for pathways that result in type I immunity (by similarity). The sequence of the protein osteopontin precursor is shown at the end of the application as "osteopontin precursor amino acid sequence". Known polymorphisms of this sequence are shown in Table 1221.

Figure 2008507261
Figure 2008507261

タンパク質オステオポンチン前駆体の局在化は、分泌と考えられる。   Localization of the protein osteopontin precursor is considered secretion.

以前に公知のタンパク質はまた、以下の適応症および/または潜在的治療用途を有する:再生(骨)。ヒトにおける臨床/治療用途(例えば、抗体または小分子の標的として、および/または直接的な治療として)が調査されており、これらの調査に関連する利用可能な情報は以下である。以前に公知のタンパク質の潜在的な薬学的に関連するか治療に関連する活性は以下である:骨形成刺激薬。クラスターによって示されたタンパク質の治療における役割が予想されている。このタンパク質またはその一部を、潜在的治療に適用する(筋骨格)ために使用するか使用することができる薬物データベースまたは公的なデータベース(例えば、上記)に情報が存在するので、クラスターをこの分野に割り当てた。   The previously known proteins also have the following indications and / or potential therapeutic applications: Regeneration (bone). Clinical / therapeutic applications in humans (e.g. as targets for antibodies or small molecules and / or as direct therapy) are being investigated and available information related to these investigations is: Potential pharmaceutically relevant or therapeutically relevant activities of previously known proteins are: bone formation stimulants. The therapeutic role of proteins displayed by clusters is expected. Because information is present in drug databases or public databases (eg, above) that may or may not be used to apply (musculoskeletal) this protein or portions thereof for potential treatment, clusters Assigned to the field.

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである骨化、抗アポトーシス、炎症反応、細胞−基質接着、細胞−細胞シグナル伝達、分子機能に関連する注釈付けである防御/免疫タンパク質、サイトカイン、インテグリンリガンド、タンパク質結合、成長因子、アポトーシスインヒビター、および細胞成分に関連する注釈付けである細胞外基質。   The following GO annotation applies to previously known proteins. The following annotations were found: annotations related to biological processes: ossification, anti-apoptotic, inflammatory response, cell-substrate adhesion, cell-cell signaling, annotation related to molecular function Extracellular substrates that are annotations related to protective / immune proteins, cytokines, integrin ligands, protein binding, growth factors, apoptosis inhibitors, and cellular components.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

クラスターHUMOSTROを、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図46のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   The cluster HUMOSTRO can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The terms "numbers" in the right column of the table and the numbers on the y-axis of FIG. 46 refer to the weighted expression of ESTs in each category as "ppm" (the ppm of ESTs of a particular cluster in this category by ppm Ratio of expression to expression of all ESTs).

概して、図46および表1222中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、肺悪性腫瘍、悪性乳癌、卵巣癌、および皮膚悪性腫瘍。   In general, as shown for the histograms in FIG. 46 and Table 1222, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: epithelial malignancy, a mixture of malignancies from different tissues, lung malignancy, malignancy breast cancer, ovarian cancer, and skin malignancy.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、クラスターHUMOSTROは、上の表1に列挙した3つの転写物を特徴とする。これらの転写物は、タンパク質オステオポンチン前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster HUMOSTRO is characterized by the three transcripts listed in Table 1 above. These transcripts encode proteins which are variants of the protein osteopontin precursor. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質HUMOSTRO_PEA_1_PEA_1_P21は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMOSTRO_PEA_1_PEA_1_T14によってコードされる。公知のタンパク質(オステオポンチン前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutant protein HUMOSTRO_PEA_1_PEA_1_P21 of the present invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HUMOSTRO_PEA_1_PEA_1_T14. An alignment to a known protein (osteopontin precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HUMOSTRO_PEA_1_PEA_1_P21とOSTP_HUMANとの間の比較の報告
1.OSTP_HUMANのアミノ酸1〜58に対応し、HUMOSTRO_PEA_1_PEA_1_P21のアミノ酸1〜58にも対応するMRIAVICFCLLGITCAIPVKQADSGSSEEKQLYNKYPDAVATWLNPDPSQKQNLLAPQと少なくとも90%相同な第1のアミノ酸配列と、HUMOSTRO_PEA_1_PEA_1_P21のアミノ酸59〜64に対応する配列VFLNFSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMOSTRO_PEA_1_PEA_1_P21をコードする単離キメラポリペプチド。
Report on the comparison between HUMOSTRO_PEA_1_PEA_1_P21 and OSTP_HUMAN 1. The amino acid sequence corresponding to amino acids 1-58 of OSTP_HUMAN and corresponding to amino acids 1-58 of HUMOSTRO_PEA_1_P21 corresponds to the amino acid sequence corresponding to HUMOSTRO_PEA_1_PEA_1_P21, and the first amino acid sequence which is at least 90% homologous to Said second amino acid sequence comprising a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; HUMO in which the amino acid sequences of 2 are in contiguous and sequential order Isolated chimeric polypeptide encoding TRO_PEA_1_PEA_1_P21.

2.HUMOSTRO_PEA_1_PEA_1_P21中の配列VFLNFSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMOSTRO_PEA_1_PEA_1_P21のテールをコードする単離ポリペプチド。   2. HUMOSTRO_PEA_1_P21 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence VFLNFS in HUMOSTRO_PEA_1_PEA_1_P21 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、公知のタンパク質局在化および/または遺伝子構造の手作業による調査によって、分泌と考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is considered to be secretion by manual investigation of known protein localization and / or gene structure.

変異タンパク質HUMOSTRO_PEA_1_PEA_1_P21はまた、表1224に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMOSTRO_PEA_1_PEA_1_P21配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutant protein HUMOSTRO_PEA_1_PEA_1_P21 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows the SNPs as shown in Table 1224) It indicates whether it is known and the presence of a known SNP in the mutant protein HUMOSTRO_PEA_1_PEA_1_P21 sequence supports the predicted sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質オステオポンチン前駆体と比較した変異タンパク質HUMOSTRO_PEA_1_PEA_1_P21のグリコシル化部位を表1225に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein HUMOSTRO_PEA_1_PEA_1_P21 compared to the known protein osteopontin precursor are shown in Table 1225 (showing its position on the amino acid sequence in the first column, the second column has a glycosylation site in the mutant protein) The last column indicates whether this position differs on the mutant protein).

Figure 2008507261
Figure 2008507261

変異タンパク質、HUMOSTRO_PEA_1_PEA_1_P21は、以下の転写物によってコードされる:HUMOSTRO_PEA_1_PEA_1_T14(配列は出願書類の最後に示す)。転写物HUMOSTRO_PEA_1_PEA_1_T14のコード部分を太字で示し、このコード部分は199位から開始され、390位で終結する。転写物はまた、表1226に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMOSTRO_PEA_1_PEA_1_P21配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein, HUMOSTRO_PEA_1_PEA_1_P21, is encoded by the following transcript: HUMOSTRO_PEA_1_PEA_1_T14 (sequences shown at the end of the application). The code portion of the transcript HUMOSTRO_PEA_1_PEA_1_T14 is shown in bold, starting from position 199 and ending at position 390. The transcript also has the following SNPs listed in Table 1226 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, the mutant protein HUMOSTRO_PEA_1_PEA_1_P21 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

本発明の変異タンパク質HUMOSTRO_PEA_1_PEA_1_P25は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMOSTRO_PEA_1_PEA_1_T16によってコードされる。公知のタンパク質(オステオポンチン前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutant protein HUMOSTRO_PEA_1_PEA_1_P25 according to the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HUMOSTRO_PEA_1_PEA_1_T16. An alignment to a known protein (osteopontin precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HUMOSTRO_PEA_1_PEA_1_P25とOSTP_HUMANとの間の比較の報告
1.OSTP_HUMANのアミノ酸1〜31に対応し、HUMOSTRO_PEA_1_PEA_1_P25のアミノ酸1〜31にも対応するMRIAVICFCLLGITCAIPVKQADSGSSEEKQと少なくとも90%相同な第1のアミノ酸配列と、HUMOSTRO_PEA_1_PEA_1_P25のアミノ酸32〜32に対応する配列Hを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMOSTRO_PEA_1_PEA_1_P25をコードする単離キメラポリペプチド。
Report on the comparison between HUMOSTRO_PEA_1_PEA_1_P25 and OSTP_HUMAN 1. A polypeptide having a first amino acid sequence which is at least 90% homologous to MRIAVICFCLLGITCAIPVKQADSGSSEEKQ corresponding to amino acids 1 to 31 of OSTP HUMAN and corresponding to amino acids 1 to 31 of HUMOSTRO PEA 1 _P 25 and a polypeptide having sequence H corresponding to amino acids 32 to 32 of HUMOSTRO PEA 1 _PEA 1 _P25 Said second amino acid sequence comprising a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; An isolated chimeric polypeptide encoding HUMOSTRO_PEA_1_PEA_1_P25, wherein the two amino acid sequences are in contiguous and sequential order Peptide.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HUMOSTRO_PEA_1_PEA_1_P25はまた、表1227に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMOSTRO_PEA_1_PEA_1_P25配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutant protein HUMOSTRO_PEA_1_PEA_1_P25 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 1227) It indicates whether it is known and the presence of a known SNP in the mutant protein HUMOSTRO_PEA_1_PEA_1_P25 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質オステオポンチン前駆体と比較した変異タンパク質HUMOSTRO_PEA_1_PEA_1_P25のグリコシル化部位を表1228に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein HUMOSTRO_PEA_1_PEA_1_P25 compared to the known protein osteopontin precursor are shown in Table 1228 (showing its position on the amino acid sequence in the first column, the second column has a glycosylation site in the mutant protein) The last column indicates whether this position differs on the mutant protein).

Figure 2008507261
Figure 2008507261

変異タンパク質、HUMOSTRO_PEA_1_PEA_1_P25は、以下の転写物によってコードされる:HUMOSTRO_PEA_1_PEA_1_T16(配列は出願書類の最後に示す)。転写物HUMOSTRO_PEA_1_PEA_1_T16のコード部分を太字で示し、このコード部分は199位から開始され、294位で終結する。転写物はまた、表1229に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMOSTRO_PEA_1_PEA_1_P25配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein, HUMOSTRO_PEA_1_PEA_1_P25, is encoded by the following transcript: HUMOSTRO_PEA_1_PEA_1_T16 (sequences shown at the end of the application). The code portion of the transcript HUMOSTRO_PEA_1_PEA_1_T16 is shown in bold, starting from position 199 and ending at position 294. The transcript also has the following SNPs listed in Table 1229 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, the mutein HUMOSTRO_PEA_1_PEA_1_P25 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261

本発明の変異タンパク質HUMOSTRO_PEA_1_PEA_1_P30は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMOSTRO_PEA_1_PEA_1_T30によってコードされる。公知のタンパク質(オステオポンチン前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutant protein HUMOSTRO_PEA_1_PEA_1_P30 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript HUMOSTRO_PEA_1_PEA_1_T30. An alignment to a known protein (osteopontin precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

HUMOSTRO_PEA_1_PEA_1_P30とOSTP_HUMANとの間の比較の報告
1.OSTP_HUMANのアミノ酸1〜31に対応し、HUMOSTRO_PEA_1_PEA_1_P30のアミノ酸1〜31にも対応するMRIAVICFCLLGITCAIPVKQADSGSSEEKQと少なくとも90%相同な第1のアミノ酸配列と、HUMOSTRO_PEA_1_PEA_1_P30のアミノ酸32〜39に対応する配列VSIFYVFIを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMOSTRO_PEA_1_PEA_1_P30をコードする単離キメラポリペプチド。
Reporting of the comparison between HUMOSTRO_PEA_1_PEA_1_P30 and OSTP_HUMAN 1. A polypeptide having a first amino acid sequence corresponding to amino acids 1 to 31 of OSTP HUMAN and corresponding to amino acids 1 to 31 of HUMOSTRO PEA 1 _ PEA 1 _P30 and a sequence VSIFY VFI corresponding to amino acids 32 to 39 of HUMOSTRO PEA 1 _PEA 1 _P30, which is at least 90% homologous to Said second amino acid sequence comprising a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; Amino acid sequences of SEQ ID NO: 2 encode HUMOSTRO_PEA_1_PEA_1_P30, in contiguous and sequential order Isolated chimeric polypeptide.

2.HUMOSTRO_PEA_1_PEA_1_P30中の配列VSIFYVFIと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMOSTRO_PEA_1_PEA_1_P30のテールをコードする単離ポリペプチド。   2. HUMOSTRO_PEA_1_P30 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence VSIFYVFI in HUMOSTRO_PEA_1_PEA_1_P30 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質HUMOSTRO_PEA_1_PEA_1_P30はまた、表1230に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMOSTRO_PEA_1_PEA_1_P30配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutant protein HUMOSTRO_PEA_1_PEA_1_P30 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing the other amino acids, and the last column shows the SNPs, as shown in Table 1230) It indicates whether it is known and the presence of a known SNP in the mutant protein HUMOSTRO_PEA_1_PEA_1_P30 sequence supports the putative sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質オステオポンチン前駆体と比較した変異タンパク質HUMOSTRO_PEA_1_PEA_1_P30のグリコシル化部位を表1231に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of the mutant protein HUMOSTRO_PEA_1_PEA_1_P30 compared to the known protein osteopontin precursor are shown in Table 1231 (showing its position on the amino acid sequence in the first column, the second column has a glycosylation site in the mutant protein) The last column indicates whether this position differs on the mutant protein).

Figure 2008507261
Figure 2008507261

変異タンパク質、HUMOSTRO_PEA_1_PEA_1_P30は、以下の転写物によってコードされる:HUMOSTRO_PEA_1_PEA_1_T30(配列は出願書類の最後に示す)。転写物HUMOSTRO_PEA_1_PEA_1_T30のコード部分を太字で示し、このコード部分は199位から開始され、315位で終結する。転写物はまた、表1232に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMOSTRO_PEA_1_PEA_1_P30配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein, HUMOSTRO_PEA_1_PEA_1_P30, is encoded by the following transcript: HUMOSTRO_PEA_1_PEA_1_T30 (sequences shown at the end of the application). The code portion of the transcript HUMOSTRO_PEA_1_PEA_1_T30 is shown in bold, starting from position 199 and ending at position 315. The transcript also has the following SNPs listed in Table 1232 (indicating its position on the nucleotide sequence and listing another nucleic acid, the last column indicates whether the SNP is known, the mutant protein HUMOSTRO_PEA_1_PEA_1_P30 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターHUMOSTROは、上の表2に列挙した30個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, the cluster HUMOSTRO is characterized by the 30 segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_0は、333個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14、HUMOSTRO_PEA_1_PEA_1_T16、およびHUMOSTRO_PEA_1_PEA_1_T30。以下の表1233は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_0 of the present invention is supported by 333 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14, HUMOSTRO_PEA_1_PEA_1_T16, and HUMOSTRO_PEA_1_PEA_1_T30. Table 1233 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_10は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T16。以下の表1235は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_10 of the present invention is supported by 4 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMOSTRO_PEA_1_PEA_1_T16. Table 1235 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_16は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14。以下の表1236は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_16 of the present invention is supported by six libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMOSTRO_PEA_1_PEA_1_T14. Table 1236 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_23は、334個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1237は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_23 of the present invention is supported by 334 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 1237 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_31は、350個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1238は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_31 of the present invention is supported by 350 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 1238 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_43は、192個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1239は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_43 of the present invention is supported by 192 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 1239 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_3は、353個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14、HUMOSTRO_PEA_1_PEA_1_T16、およびHUMOSTRO_PEA_1_PEA_1_T30。以下の表1240は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_3 of the present invention is supported by 353 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14, HUMOSTRO_PEA_1_PEA_1_T16, and HUMOSTRO_PEA_1_PEA_1_T30. Table 1240 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_5は、353個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14、HUMOSTRO_PEA_1_PEA_1_T16、およびHUMOSTRO_PEA_1_PEA_1_T30。以下の表1241は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_5 of the present invention is supported by 353 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14, HUMOSTRO_PEA_1_PEA_1_T16, and HUMOSTRO_PEA_1_PEA_1_T30. Table 1241 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_7は、357個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14、HUMOSTRO_PEA_1_PEA_1_T16、およびHUMOSTRO_PEA_1_PEA_1_T30。以下の表1242は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_7 of the present invention is supported by 357 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14, HUMOSTRO_PEA_1_PEA_1_T16, and HUMOSTRO_PEA_1_PEA_1_T30. Table 1242 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_8は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T30。以下の表1243は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_8 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMOSTRO_PEA_1_PEA_1_T30. Table 1243 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_15は、366個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1244は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_15 of the present invention is supported by 366 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 1244 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_17は、261個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1245は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_17 of the present invention is supported by 261 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 1245 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_20を、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1246は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_20 according to the invention can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 1246 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_21は、315個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1247は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_21 of the present invention is supported by 315 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 1247 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_22は、322個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1248は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_22 of the present invention is supported by 322 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 1248 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_24は、270個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1249は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_24 of the present invention is supported by 270 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 1249 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_26を、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1250は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_26 according to the invention can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 1250 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_27は、260個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1251は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_27 of the present invention is supported by 260 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 1251 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_28は、273個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1252は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_28 of the present invention is supported by 273 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 1252 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_29は、272個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1253は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_29 of the present invention is supported by 272 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 1253 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_30を、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1254は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_30 according to the invention can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 1254 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_32は、293個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1255は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_32 of the present invention is supported by 293 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 1255 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_34は、301個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1256は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_34 of the present invention is supported by 301 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 1256 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_36は、292個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1257は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_36 of the present invention is supported by 292 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 1257 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_37は、295個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1258は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_37 of the present invention is supported by 295 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 1258 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_38を、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1259は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_38 according to the invention can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 1259 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_39は、268個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1260は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_39 of the present invention is supported by 268 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 1260 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_40を、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1261は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_40 according to the invention can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 1261 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_41を、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1262は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_41 according to the invention can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 1262 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_42は、224個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1263は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_42 of the present invention is supported by 224 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 1263 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: OSTP_HUMAN

Sequence documentation:

Alignment of: HUMOSTRO_PEA_1_PEA_1_P21 x OSTP_HUMAN ..

Alignment segment 1/1:

Quality: 578.00 Escore: 0
Matching length: 58 Total length: 58
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQLYNKYPDAVATWLNPDPSQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQLYNKYPDAVATWLNPDPSQ 50

51 KQNLLAPQ 58
||||||||
51 KQNLLAPQ 58






Sequence name: OSTP_HUMAN

Sequence documentation:

Alignment of: HUMOSTRO_PEA_1_PEA_1_P25 x OSTP_HUMAN ..

Alignment segment 1/1:

Quality: 301.00 Escore: 0
Matching length: 31 Total length: 31
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . .
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQ 31
|||||||||||||||||||||||||||||||
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQ 31






Sequence name: OSTP_HUMAN

Sequence documentation:

Alignment of: HUMOSTRO_PEA_1_PEA_1_P30 x OSTP_HUMAN ..

Alignment segment 1/1:

Quality: 301.00 Escore: 0
Matching length: 31 Total length: 31
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . .
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQ 31
|||||||||||||||||||||||||||||||
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQ 31


Mutated protein alignment against previously known proteins:
Sequence name: OSTP_HUMAN

Sequence documentation:

Alignment of: HUMOSTRO_PEA_1_PEA_1_P21 x OSTP_HUMAN ..

Alignment segment 1/1:

Quality: 578.00 Escore: 0
Matching length: 58 Total length: 58
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MRIAVICFCLLGITCAIPVKQADGSSEEKQLYNKYPDATWLNPDPSQ 50
||||||||||||||||||||||||||||||||||||||||
1 MRIAVICFCLLGITCAIPVKQADGSSEEKQLYNKYPDATWLNPDPSQ 50

51 KQNLLAPQ 58
||||||||
51 KQNLLAPQ 58






Sequence name: OSTP_HUMAN

Sequence documentation:

Alignment of: HUMOSTRO_PEA_1_PEA_1_P25 x OSTP_HUMAN ..

Alignment segment 1/1:

Quality: 301.00 Escore: 0
Matching length: 31 Total length: 31
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MRIAVICFCLLGITCAIPVKQADGSSEEKQ 31
|||||||||||||||||||||||||||||
1 MRIAVICFCLLGITCAIPVKQADGSSEEKQ 31






Sequence name: OSTP_HUMAN

Sequence documentation:

Alignment of: HUMOSTRO_PEA_1_PEA_1_P30 x OSTP_HUMAN ..

Alignment segment 1/1:

Quality: 301.00 Escore: 0
Matching length: 31 Total length: 31
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MRIAVICFCLLGITCAIPVKQADGSSEEKQ 31
|||||||||||||||||||||||||||||
1 MRIAVICFCLLGITCAIPVKQADGSSEEKQ 31

クラスターR11723の説明
クラスターR11723は、目的の6つの転写物および26個のセグメントを特徴とし、その名称を、それぞれ表1264および1265に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表1266に示す。
Description of cluster R11723 Cluster R11723 is characterized by 6 transcripts and 26 segments of interest, the names of which are given in Tables 1264 and 1265 respectively, and the sequence itself is given at the end of the application. Selected protein variants are shown in Table 1266.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

クラスターR11723を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図47のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   Cluster R11723 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The terms "numbers" in the right column of the table and the numbers on the y-axis of Fig. 47 refer to the weighted expression of ESTs in each category as "ppm" (the ppm of ESTs of a particular cluster in this category by ppm Ratio of expression to expression of all ESTs).

概して、図47および表1267中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および腎臓悪性腫瘍。   In general, as shown for the histograms in FIG. 47 and Table 1267, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: epithelial malignancies, a mixture of malignancies from different tissues, and kidney malignancies.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、コンティグR11723は、上の表1に列挙した6つの転写物を特徴とする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, contig R11723 is characterized by the six transcripts listed in Table 1 above. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質R11723_PEA_1_P2は、出願書類の最後に示すアミノ酸配列を有し、転写物R11723_PEA_1_T6によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The mutein R11723_PEA_1_P2 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript R11723_PEA_1_T6. The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質R11723_PEA_1_P2はまた、表1269に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R11723_PEA_1_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R11723_PEA_1_P2 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, enumerating other amino acids, and the last column shows SNPs as shown in Table 1269) It indicates whether it is known and the presence of a known SNP in the mutein R11723_PEA_1_P2 sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質、R11723_PEA_1_P2は、以下の転写物によってコードされる:R11723_PEA_1_T6(配列は出願書類の最後に示す)。転写物R11723_PEA_1_T6のコード部分を太字で示し、このコード部分は1716位から開始され、2051位で終結する。転写物はまた、表1270に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R11723_PEA_1_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein, R11723_PEA_1_P2, is encoded by the following transcript: R11723_PEA_1_T6 (sequences shown at the end of the application). The code portion of transcript R11723_PEA_1_T6 is shown in bold and this code portion starts at position 1716 and ends at position 2051. The transcript also has the following SNPs listed in Table 1270 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein R11723_PEA_1_P2 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質R11723_PEA_1_P6は、出願書類の最後に示すアミノ酸配列を有し、転写物R11723_PEA_1_T15によってコードされる。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein R11723_PEA_1_P6 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript R11723_PEA_1_T15. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

R11723_PEA_1_P6とQ8IXM0(配列番号1707)との間の比較の報告
1.R11723_PEA_1_P6のアミノ酸1〜110に対応する配列MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGSPCRGLAPGREEQRALHKAGAVGGGVRを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、Q8IXM0のアミノ酸1〜112に対応し、R11723_PEA_1_P6のアミノ酸111〜122にも対応するMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P6をコードする単離キメラポリペプチド。
Report on the comparison between R11723_PEA_1_P6 and Q8IXM0 (SEQ ID NO: 1707) A polypeptide having at least 70%, optionally at least 80%, at least 90%, and a sequence having the sequence MWVLGIAATFCLCLLPGFALQIGQCYQCEEFLFNNDSSPEFIVNCTCNVQDQQQEVMESAGMYRKASCSACLIASEGSPCRGLAPGREEQRALHKAGAGGGGVR corresponding to amino acids 1 to 110 of R11723_PEA_1_P6 The amino acid sequence of SEQ ID NO: 1 and MYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAE corresponding to amino acids 1 to 112 of Q8IXM0 and also to amino acids 111 to 122 of R11723_PEA_1_P6 EKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQ and and at least 90% homologous to a second amino acid sequence, wherein the first and second amino acid distribution is contiguous, and in sequential order, the isolated chimeric polypeptide coding R11723_PEA_1_P6.

2.R11723_PEA_1_P6の配列MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGSPCRGLAPGREEQRALHKAGAVGGGVRと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P6の先端をコードする単離ポリペプチド。   2. Sequence of R11723_PEA_1_P6 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFELNDCSSPEFIVNCCTNVQDQQQEVMESAGIMYRKSCASSA CLIASA GSPCR GLAPGREEQRALHKAGAVGGGVR and at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 75% An isolated polypeptide encoding

R11723_PEA_1_P6とQ96AC2(配列番号1708)との間の比較の報告
1.Q96AC2のアミノ酸1〜83に対応し、R11723_PEA_1_P6のアミノ酸1〜83にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P6のアミノ酸84〜222に対応する配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P6をコードする単離キメラポリペプチド。
Report on comparison between R11723_PEA_1_P6 and Q96AC2 (SEQ ID NO: 1708) Corresponding to amino acids 1-83 of Q96AC2, ports having a MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAG corresponding to amino acids 1-83 of R11723_PEA_1_P6 the first amino acid sequence at least 90% homologous, sequences corresponding to SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQ to amino acid 84-222 of R11723_PEA_1_P6 Said first and second comprising a peptide and a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous. An isolated chimeric polypeptide encoding R11723_PEA_1_P6, wherein the amino acid sequences of are in contiguous and sequential order.

2.R11723_PEA_1_P6中の配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P6のテールをコードする単離ポリペプチド。   2. In the R117723_PEA_1_P6_R117723_PEA_I_P6 A sub-block s / s / s / s / s. An isolated polypeptide encoding a tail.

R11723_PEA_1_P6とQ8N2G4(配列番号1709)との間の比較の報告
1.Q8N2G4のアミノ酸1〜83に対応し、R11723_PEA_1_P6のアミノ酸1〜83にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P6のアミノ酸84〜222に対応する配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P6をコードする単離キメラポリペプチド。
Report of comparison between R11723_PEA_1_P6 and Q8N2G4 (SEQ ID NO: 1709) Corresponding to amino acids 1-83 of Q8N2G4, ports having a MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAG corresponding to amino acids 1-83 of R11723_PEA_1_P6 the first amino acid sequence at least 90% homologous, sequences corresponding to SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQ to amino acid 84-222 of R11723_PEA_1_P6 Said first and second comprising a peptide and a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous. An isolated chimeric polypeptide encoding R11723_PEA_1_P6, wherein the amino acid sequences of are in contiguous and sequential order.

2.R11723_PEA_1_P6中の配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P6のテールをコードする単離ポリペプチド。   2. In the R117723_PEA_1_P6_R117723_PEA_I_P6 A sub-block s / s / s / s / s. An isolated polypeptide encoding a tail.

R11723_PEA_1_P6とBAC85518(配列番号1710)との間の比較の報告
1.BAC85518のアミノ酸24〜106に対応し、R11723_PEA_1_P6のアミノ酸1〜83にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P6のアミノ酸84〜222に対応する配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P6をコードする単離キメラポリペプチド。
Report on comparison between R11723_PEA_1_P6 and BAC 85518 (SEQ ID NO: 1710) Corresponding to amino acids 24-106 of BAC85518, first amino acid sequence at least 90% homologous to the corresponding MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAG to amino acids 1-83 of R11723_PEA_1_P6, the corresponding sequence SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQ to amino acid 84-222 of R11723_PEA_1_P6 A second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to the An isolated chimeric polypeptide encoding R11723_PEA_1_P6, wherein the second amino acid sequence is in contiguous and sequential order.

2.R11723_PEA_1_P6中の配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P6のテールをコードする単離ポリペプチド。   2. In the R117723_PEA_1_P6_R117723_PEA_I_P6 A sub-block s / s / s / s / s. An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質R11723_PEA_1_P6はまた、表1271に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R11723_PEA_1_P6配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R11723_PEA_1_P6 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, enumerating other amino acids, and the last column shows SNPs as shown in Table 1271) It is indicated whether it is known and the presence of a known SNP in the mutein R11723_PEA_1_P6 sequence supports the putative sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質、R11723_PEA_1_P6は、以下の転写物によってコードされる:R11723_PEA_1_T15(配列は出願書類の最後に示す)。転写物R11723_PEA_1_T15のコード部分を太字で示し、このコード部分は434位から開始され、1099位で終結する。転写物はまた、表1272に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R11723_PEA_1_P6配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R11723_PEA_1_P6 is encoded by the following transcript: R11723_PEA_1_T15 (sequences shown at the end of the application). The coding part of the transcript R11723_PEA_1_T15 is shown in bold, starting from position 434 and ending at position 1099. The transcript also has the following SNPs listed in Table 1272 (showing its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein R11723_PEA_1_P6 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質R11723_PEA_1_P7は、出願書類の最後に示すアミノ酸配列を有し、転写物R11723_PEA_1_T17によってコードされる。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein R11723_PEA_1_P7 according to the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript R11723_PEA_1_T17. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

R11723_PEA_1_P7とQ96AC2との間の比較の報告
1.Q96AC2のアミノ酸1〜64に対応し、R11723_PEA_1_P7のアミノ酸1〜64にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P7のアミノ酸65〜93に対応する配列SHCVTRLECSGTISAHCNLCLPGSNDHPTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P7をコードする単離キメラポリペプチド。
Report of comparison between R11723_PEA_1_P7 and Q96AC2 Corresponding to amino acids 1 to 64 of Q96AC2 and corresponding to amino acids 1 to 64 of R11723_PEA_1_P7. A first amino acid sequence that is at least 90% homologous to QIQCQQQVMMEQSAG and a corresponding amino acid sequence Said first and second amino acids comprising a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous The arrangement is adjacent and in sequential order, R1172 Isolated chimeric polypeptide encoding _PEA_1_P7.

2.R11723_PEA_1_P7中の配列SHCVTRLECSGTISAHCNLCLPGSNDHPTと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P7のテールをコードする単離ポリペプチド。   2. R11723_PEA_1_P7 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT in R11723_PEA_1_P7 An isolated polypeptide encoding a tail.

R11723_PEA_1_P7とQ8N2G4との間の比較の報告
1.Q8N2G4のアミノ酸1〜64に対応し、R11723_PEA_1_P7のアミノ酸1〜64にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P7のアミノ酸65〜93に対応する配列SHCVTRLECSGTISAHCNLCLPGSNDHPTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P7をコードする単離キメラポリペプチド。
Report of comparison between R11723_PEA_1_P7 and Q8N2G4 A first amino acid sequence corresponding to amino acids 1 to 64 of Q8N2G4 and corresponding to amino acids 1 to 64 of R11723_PEA_1_P7 is a first amino acid sequence at least 90% homologous to the amino acid sequence Said first and second amino acids comprising a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous The arrangement is adjacent and in sequential order, R1172 Isolated chimeric polypeptide encoding _PEA_1_P7.

2.R11723_PEA_1_P7中の配列SHCVTRLECSGTISAHCNLCLPGSNDHPTと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P7のテールをコードする単離ポリペプチド。   2. R11723_PEA_1_P7 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT in R11723_PEA_1_P7 An isolated polypeptide encoding a tail.

R11723_PEA_1_P7とBAC85273との間の比較の報告
1.R11723_PEA_1_P7のアミノ酸1〜5に対応する配列MWVLGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、BAC85273のアミノ酸22〜80に対応し、R11723_PEA_1_P7のアミノ酸6〜64にも対応するIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGと少なくとも90%相同な第2のアミノ酸配列と、R11723_PEA_1_P7のアミノ酸65〜93に対応する配列SHCVTRLECSGTISAHCNLCLPGSNDHPTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1、第2、および第3のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P7をコードする単離キメラポリペプチド。
Report of comparison between R11723_PEA_1_P7 and BAC 85 271. A polypeptide having a sequence MWVLG corresponding to amino acids 1 to 5 of R11723_PEA_1_P7 at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous 1 and the second amino acid sequence corresponding to amino acids 22 to 80 of BAC 85 273 and corresponding to amino acids 6 to 64 of R11723_PEA_1_P7 corresponding to IAATFCGLFLLPGFALQIQCYQCEEFELNDCSSPEFIVNCTVNVQDMCMQKEVMEQSAG corresponding to amino acids 65 to 93 of R11723_PEA_1_P7 Polypep with SHCVTRLECSGTISAHCNLCLPGSNDHPT And a third amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; And an isolated chimeric polypeptide encoding R11723_PEA_1_P7, wherein the third amino acid sequence is in contiguous and sequential order.

2.R11723_PEA_1_P7の配列MWVLGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P7の先端をコードする単離ポリペプチド。   2. The tip of R11723_PEA_1_P7 comprising a polypeptide at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence MWVLG of R11723_PEA_1_P7 An isolated polypeptide encoding

3.R11723_PEA_1_P7中の配列SHCVTRLECSGTISAHCNLCLPGSNDHPTと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P7のテールをコードする単離ポリペプチド。   3. R11723_PEA_1_P7 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT in R11723_PEA_1_P7 An isolated polypeptide encoding a tail.

R11723_PEA_1_P7とBAC85518との間の比較の報告
1.BAC85518のアミノ酸24〜87に対応し、R11723_PEA_1_P7のアミノ酸1〜64にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P7のアミノ酸65〜93に対応する配列SHCVTRLECSGTISAHCNLCLPGSNDHPTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P7をコードする単離キメラポリペプチド。
Report on comparison between R11723_PEA_1_P7 and BAC 85518. Corresponding to amino acids 24 to 87 of BAC 85518 and corresponding to amino acids 1 to 64 of R11723_PEA_1_P7. Said first and second amino acids comprising a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous The arrangement is adjacent and in sequential order, R 1 Isolated chimeric polypeptide encoding 723_PEA_1_P7.

2.R11723_PEA_1_P7中の配列SHCVTRLECSGTISAHCNLCLPGSNDHPTと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P7のテールをコードする単離ポリペプチド。   2. R11723_PEA_1_P7 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT in R11723_PEA_1_P7 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質R11723_PEA_1_P7はまた、表1273に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R11723_PEA_1_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R11723_PEA_1_P7 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, enumerating other amino acids, and the last column shows SNPs as shown in Table 1273) It indicates whether it is known and the presence of a known SNP in the mutein R11723_PEA_1_P7 sequence supports the deduced sequence of this mutein according to the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質、R11723_PEA_1_P7は、以下の転写物によってコードされる:R11723_PEA_1_T17(配列は出願書類の最後に示す)。転写物R11723_PEA_1_T17のコード部分を太字で示し、このコード部分は434位から開始され、712位で終結する。転写物はまた、表1274に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R11723_PEA_1_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein, R11723_PEA_1_P7, is encoded by the following transcript: R11723_PEA_1_T17 (sequences shown at the end of the application). The code portion of the transcript R11723_PEA_1_T17 is shown in bold, starting at position 434 and ending at position 712. The transcript also has the following SNPs listed in Table 1274 (showing its position on the nucleotide sequence and listing another nucleic acid, the last column shows whether the SNP is known, mutein R11723_PEA_1_P7 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質R11723_PEA_1_P13は、出願書類の最後に示すアミノ酸配列を有し、転写物R11723_PEA_1_T19によってコードされる。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein R11723_PEA_1_P13 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript R11723_PEA_1_T19. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

R11723_PEA_1_P13とQ96AC2との間の比較の報告
1.Q96AC2のアミノ酸1〜63に対応し、R11723_PEA_1_P13のアミノ酸1〜63にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P13のアミノ酸64〜84に対応する配列DTKRTNTLLFEMRHFAKQLTTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P13をコードする単離キメラポリペプチド。
Report of comparison between R11723_PEA_1_P13 and Q96AC2 A first amino acid sequence corresponding to amino acids 1 to 63 of Q96AC2 and to amino acids 1 to 63 of R11723_PEA_1_P13 and corresponding to MWVLGIAATFCCLFLLPGFALQ IQCYQCEEFELNDCSSPEFIVNCTVNVQDMCQKEVMEQSA a sequence corresponding to amino acids 64 to 84 of R11723_PEA_1_P13 Said first and second amino acids comprising a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous R11723_PEA_1, where the arrangements are adjacent and in sequential order Isolated chimeric polypeptide encoding P13.

2.R11723_PEA_1_P13中の配列DTKRTNTLLFEMRHFAKQLTTと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P13のテールをコードする単離ポリペプチド。   2. R11723_PEA_1_P13 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence DTKRTNTLLFEMRHFAKQLTT in R11723_PEA_1_P13 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質、R11723_PEA_1_P13は、以下の転写物によってコードされる:R11723_PEA_1_T19およびR11723_PEA_1_T5(配列は出願書類の最後に示す)。転写物R11723_PEA_1_T19のコード部分を太字で示し、このコード部分は434位から開始され、685位で終結する。転写物はまた、表1275に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R11723_PEA_1_P13配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R11723_PEA_1_P13 is encoded by the following transcript: R11723_PEA_1_T19 and R11723_PEA_1_T5 (sequences shown at the end of the application). The coding portion of the transcript R11723_PEA_1_T19 is shown in bold, starting at position 434 and ending at position 685. The transcript also has the following SNPs listed in Table 1275 (showing its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein R11723_PEA_1_P13 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質R11723_PEA_1_P10は、出願書類の最後に示すアミノ酸配列を有し、転写物R11723_PEA_1_T20によってコードされる。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein R11723_PEA_1_P10 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript R11723_PEA_1_T20. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

R11723_PEA_1_P10とQ96AC2との間の比較の報告
1.Q96AC2のアミノ酸1〜63に対応し、R11723_PEA_1_P10のアミノ酸1〜63にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P10のアミノ酸64〜90に対応する配列DRVSLCHEAGVQWNNFSTLQPLPPRLKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P10をコードする単離キメラポリペプチド。
Report of comparison between R11723_PEA_1_P10 and Q96AC2 A first amino acid sequence corresponding to amino acids 1 to 63 of Q96AC2 and to amino acids 1 to 63 of R11723_PEA_1_P10 and corresponding to MWVLGIAATFCCFLFLLPGFALQQCYQCEEFQLNNDSSPEFIVNCTVNVQDMCQKEVMEQSA and a sequence corresponding to amino acids 64-90 of the R11723_PEA_1_P10 Said first and second amino acids comprising a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous The arrangement is adjacent and in sequential order, R11723 Isolated chimeric polypeptide encoding PEA_1_P10.

2.R11723_PEA_1_P10中の配列DRVSLCHEAGVQWNNFSTLQPLPPRLKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P10のテールをコードする単離ポリペプチド。   2. R11723_PEA_1_P10 comprising a polypeptide at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK in R11723_PEA_1_P10 An isolated polypeptide encoding a tail.

R11723_PEA_1_P10とQ8N2G4との間の比較の報告
1.Q8N2G4のアミノ酸1〜63に対応し、R11723_PEA_1_P10のアミノ酸1〜63にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P10のアミノ酸64〜90に対応する配列DRVSLCHEAGVQWNNFSTLQPLPPRLKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P10をコードする単離キメラポリペプチド。
Report of comparison between R11723_PEA_1_P10 and Q8N2G4 A first amino acid sequence corresponding to amino acids 1 to 63 of Q8N2G4 and corresponding to amino acids 1 to 63 of R11723_PEA_1_P10, and a corresponding amino acid sequence Said first and second amino acids comprising a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous The arrangement is adjacent and in sequential order, R11723 Isolated chimeric polypeptide encoding PEA_1_P10.

2.R11723_PEA_1_P10中の配列DRVSLCHEAGVQWNNFSTLQPLPPRLKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P10のテールをコードする単離ポリペプチド。   2. R11723_PEA_1_P10 comprising a polypeptide at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK in R11723_PEA_1_P10 An isolated polypeptide encoding a tail.

R11723_PEA_1_P10とBAC85273との間の比較の報告
1.R11723_PEA_1_P10のアミノ酸1〜5に対応する配列MWVLGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、BAC85273のアミノ酸22〜79に対応し、R11723_PEA_1_P10のアミノ酸6〜63にも対応するIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAと少なくとも90%相同な第2のアミノ酸配列と、R11723_PEA_1_P10のアミノ酸64〜90に対応する配列DRVSLCHEAGVQWNNFSTLQPLPPRLKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1、第2、および第3のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P10をコードする単離キメラポリペプチド。
Report of comparison between R11723_PEA_1_P10 and BAC 85 271. A polypeptide having a sequence MWVLG corresponding to amino acids 1 to 5 of R11723_PEA_1_P10 at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous The amino acid sequence of 1 and the second amino acid sequence corresponding to amino acids 22 to 79 of BAC 85 273 and corresponding to amino acids 6 to 63 of R11723_PEA_1_P10 and corresponding to amino acids 6 to 63 Polypep with DRVSLCHEAGVQWNNFSTLQPLPPRLK And a third amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous; And an isolated chimeric polypeptide encoding R11723_PEA_1_P10, wherein the third amino acid sequence is adjacent and in sequential order.

2.R11723_PEA_1_P10の配列MWVLGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P10の先端をコードする単離ポリペプチド。   2. The tip of R11723_PEA_1_P10, comprising a polypeptide at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence MWVLG of R11723_PEA_1_P10 An isolated polypeptide encoding

3.R11723_PEA_1_P10中の配列DRVSLCHEAGVQWNNFSTLQPLPPRLKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P10のテールをコードする単離ポリペプチド。   3. R11723_PEA_1_P10 comprising a polypeptide at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK in R11723_PEA_1_P10 An isolated polypeptide encoding a tail.

R11723_PEA_1_P10とBAC85518との間の比較の報告
1.BAC85518のアミノ酸24〜86に対応し、R11723_PEA_1_P10のアミノ酸1〜63にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P10のアミノ酸64〜90に対応する配列DRVSLCHEAGVQWNNFSTLQPLPPRLKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P10をコードする単離キメラポリペプチド。
Report of comparison between R11723_PEA_1_P10 and BAC 85518. A first amino acid sequence corresponding to amino acids 24 to 86 of BAC 85518 and corresponding to amino acids 1 to 63 of R11723_PEA_1_P10, MWVLGIAATFCCLFLLPGFALQIQCYQCEEFQLNNDSSPEFIVNCCTV NVQDMCQKEVMEQSA, and a corresponding amino acid 74 UTs Said first and second amino acids comprising a second amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous The arrangements are adjacent and in sequential order, R 11 Isolated chimeric polypeptide encoding 23_PEA_1_P10.

2.R11723_PEA_1_P10中の配列DRVSLCHEAGVQWNNFSTLQPLPPRLKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P10のテールをコードする単離ポリペプチド。   2. R11723_PEA_1_P10 comprising a polypeptide at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK in R11723_PEA_1_P10 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質R11723_PEA_1_P10はまた、表1276に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R11723_PEA_1_P10配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R11723_PEA_1_P10 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 1276) It indicates whether it is known and the presence of a known SNP in the mutein R11723_PEA_1_P10 sequence supports the deduced sequence of this mutein according to the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質、R11723_PEA_1_P10は、以下の転写物によってコードされる:R11723_PEA_1_T20(配列は出願書類の最後に示す)。転写物R11723_PEA_1_T20のコード部分を太字で示し、このコード部分は434位から開始され、703位で終結する。転写物はまた、表1277に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R11723_PEA_1_P10配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein, R11723_PEA_1_P10, is encoded by the following transcript: R11723_PEA_1_T20 (sequences shown at the end of the application). The coding part of the transcript R11723_PEA_1_T20 is shown in bold, starting from position 434 and ending at position 703. The transcript also has the following SNPs listed in Table 1277 (showing its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein R11723_PEA_1_P10 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターR11723は、上の表2に列挙した26個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster R11723 is characterized by the 26 segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターR11723_PEA_1_node_13は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T19、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1278は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_13 of the present invention is supported by five libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R11723_PEA_1_T19, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 1278 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR11723_PEA_1_node_16は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T17、R11723_PEA_1_T19、およびR11723_PEA_1_T20。以下の表1279は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_16 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R11723_PEA_1_T17, R11723_PEA_1_T19, and R11723_PEA_1_T20. Table 1279 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR11723_PEA_1_node_19は、45個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T5およびR11723_PEA_1_T6。以下の表1280は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_19 of the present invention is supported by 45 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R11723_PEA_1_T5 and R11723_PEA_1_T6. Table 1280 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR11723_PEA_1_node_2は、29個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1281は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_2 of the present invention is supported by 29 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T17, R11723_PEA_1_T19, R11723_PEA_1_T20, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 1281 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR11723_PEA_1_node_22は、65個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T5およびR11723_PEA_1_T6。以下の表1282は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_22 of the present invention is supported by 65 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R11723_PEA_1_T5 and R11723_PEA_1_T6. Table 1282 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR11723_PEA_1_node_31は、70個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1283は、各転写物上のこのセグメントの開始位置および終結位置を記載する(これらの転写物が別のポリアデニル化を示すことに留意すべきである)。   The segment cluster R11723_PEA_1_node_31 of the present invention is supported by 70 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R11723_PEA_1_T15, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 1283 below describes the start and end positions of this segment on each transcript (note that these transcripts show additional polyadenylation).

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターR11723_PEA_1_node_10は、38個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1284は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_10 of the present invention is supported by 38 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T17, R11723_PEA_1_T19, R11723_PEA_1_T20, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 1284 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR11723_PEA_1_node_11は、42個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1285は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_11 of the present invention is supported by 42 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T17, R11723_PEA_1_T19, R11723_PEA_1_T20, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 1285 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR11723_PEA_1_node_15を、以下の転写物中に見出すことができる:R11723_PEA_1_T20。以下の表1286は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_15 of the invention can be found in the following transcript: R11723_PEA_1_T20. Table 1286 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR11723_PEA_1_node_18は、40個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1287は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_18 of the present invention is supported by 40 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R11723_PEA_1_T15, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 1287 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR11723_PEA_1_node_20を、以下の転写物中に見出すことができる:R11723_PEA_1_T5およびR11723_PEA_1_T6。以下の表1288は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_20 according to the invention can be found in the following transcript: R11723_PEA_1_T5 and R11723_PEA_1_T6. Table 1288 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR11723_PEA_1_node_21は、36個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T5およびR11723_PEA_1_T6。以下の表1289は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_21 of the present invention is supported by 36 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R11723_PEA_1_T5 and R11723_PEA_1_T6. Table 1289 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR11723_PEA_1_node_23は、39個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T5およびR11723_PEA_1_T6。以下の表1290は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_23 of the present invention is supported by 39 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R11723_PEA_1_T5 and R11723_PEA_1_T6. Table 1290 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR11723_PEA_1_node_24は、51個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1291は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_24 of the present invention is supported by 51 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R11723_PEA_1_T15, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 1291 below describes the start and end position of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR11723_PEA_1_node_25は、54個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1292は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_25 of the present invention is supported by 54 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R11723_PEA_1_T15, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 1292 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR11723_PEA_1_node_26は、62個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1293は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_26 of the present invention is supported by 62 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R11723_PEA_1_T15, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 1293 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR11723_PEA_1_node_27は、67個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1294は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_27 of the present invention is supported by 67 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R11723_PEA_1_T15, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 1294 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR11723_PEA_1_node_28を、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1295は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_28 of the invention can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 1295 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR11723_PEA_1_node_29は、69個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1296は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_29 of the present invention is supported by 69 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R11723_PEA_1_T15, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 1296 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR11723_PEA_1_node_3を、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1297は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_3 according to the invention can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T17, R11723_PEA_1_T19, R11723_PEA_1_T20, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 1297 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR11723_PEA_1_node_30を、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1298は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_30 according to the invention can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 1298 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR11723_PEA_1_node_4は、25個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1299は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_4 of the present invention is supported by 25 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T17, R11723_PEA_1_T19, R11723_PEA_1_T20, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 1299 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR11723_PEA_1_node_5は、26個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1300は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_5 of the present invention is supported by 26 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T17, R11723_PEA_1_T19, R11723_PEA_1_T20, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 1300 below lists the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR11723_PEA_1_node_6は、27個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1301は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_6 of the present invention is supported by 27 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T17, R11723_PEA_1_T19, R11723_PEA_1_T20, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 1301 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR11723_PEA_1_node_7は、29個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1302は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_7 of the present invention is supported by 29 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T17, R11723_PEA_1_T19, R11723_PEA_1_T20, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 1302 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR11723_PEA_1_node_8は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T6。以下の表1303は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R11723_PEA_1_node_8 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R11723_PEA_1_T6. Table 1303 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/gp6eQTLWqk/mFtjUpUzhb:Q8IXM0

Sequence documentation:

Alignment of: R11723_PEA_1_P6 x Q8IXM0 ..

Alignment segment 1/1:

Quality: 1128.00 Escore: 0
Matching length: 112 Total length: 112
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
111 MYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLRE 160
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLRE 50
. . . . .
161 GEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRE 210
||||||||||||||||||||||||||||||||||||||||||||||||||
51 GEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRE 100
.
211 RQRKEKHSMRTQ 222
||||||||||||
101 RQRKEKHSMRTQ 112






Sequence name: /tmp/gp6eQTLWqk/mFtjUpUzhb:Q96AC2

Sequence documentation:

Alignment of: R11723_PEA_1_P6 x Q96AC2 ..

Alignment segment 1/1:

Quality: 835.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
. . .
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83
|||||||||||||||||||||||||||||||||
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83






Sequence name: /tmp/gp6eQTLWqk/mFtjUpUzhb:Q8N2G4

Sequence documentation:

Alignment of: R11723_PEA_1_P6 x Q8N2G4 ..

Alignment segment 1/1:

Quality: 835.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
. . .
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83
|||||||||||||||||||||||||||||||||
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83






Sequence name: /tmp/gp6eQTLWqk/mFtjUpUzhb:BAC85518

Sequence documentation:

Alignment of: R11723_PEA_1_P6 x BAC85518 ..

Alignment segment 1/1:

Quality: 835.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
24 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 73
. . .
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83
|||||||||||||||||||||||||||||||||
74 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 106






Sequence name: /tmp/VXjdFlzdBX/bexTxTh0Th:Q96AC2

Sequence documentation:

Alignment of: R11723_PEA_1_P7 x Q96AC2 ..

Alignment segment 1/1:

Quality: 654.00 Escore: 0
Matching length: 64 Total length: 64
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSAG 64
||||||||||||||
51 QDMCQKEVMEQSAG 64






Sequence name: /tmp/VXjdFlzdBX/bexTxTh0Th:Q8N2G4

Sequence documentation:

Alignment of: R11723_PEA_1_P7 x Q8N2G4 ..

Alignment segment 1/1:

Quality: 654.00 Escore: 0
Matching length: 64 Total length: 64
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSAG 64
||||||||||||||
51 QDMCQKEVMEQSAG 64






Sequence name: /tmp/VXjdFlzdBX/bexTxTh0Th:BAC85273

Sequence documentation:

Alignment of: R11723_PEA_1_P7 x BAC85273 ..

Alignment segment 1/1:

Quality: 600.00 Escore: 0
Matching length: 59 Total length: 59
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
6 IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQ 55
||||||||||||||||||||||||||||||||||||||||||||||||||
22 IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQ 71

56 KEVMEQSAG 64
|||||||||
72 KEVMEQSAG 80






Sequence name: /tmp/VXjdFlzdBX/bexTxTh0Th:BAC85518

Sequence documentation:

Alignment of: R11723_PEA_1_P7 x BAC85518 ..

Alignment segment 1/1:

Quality: 654.00 Escore: 0
Matching length: 64 Total length: 64
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
24 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 73
.
51 QDMCQKEVMEQSAG 64
||||||||||||||
74 QDMCQKEVMEQSAG 87






Sequence name: /tmp/OLMSexEmIh/pc7Z7Xm1YR:Q96AC2

Sequence documentation:

Alignment of: R11723_PEA_1_P10 x Q96AC2 ..

Alignment segment 1/1:

Quality: 645.00 Escore: 0
Matching length: 63 Total length: 63
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSA 63
|||||||||||||
51 QDMCQKEVMEQSA 63






Sequence name: /tmp/OLMSexEmIh/pc7Z7Xm1YR:Q8N2G4

Sequence documentation:

Alignment of: R11723_PEA_1_P10 x Q8N2G4 ..

Alignment segment 1/1:

Quality: 645.00 Escore: 0
Matching length: 63 Total length: 63
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSA 63
|||||||||||||
51 QDMCQKEVMEQSA 63






Sequence name: /tmp/OLMSexEmIh/pc7Z7Xm1YR:BAC85273

Sequence documentation:

Alignment of: R11723_PEA_1_P10 x BAC85273 ..

Alignment segment 1/1:

Quality: 591.00 Escore: 0
Matching length: 58 Total length: 58
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
6 IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQ 55
||||||||||||||||||||||||||||||||||||||||||||||||||
22 IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQ 71

56 KEVMEQSA 63
||||||||
72 KEVMEQSA 79






Sequence name: /tmp/OLMSexEmIh/pc7Z7Xm1YR:BAC85518

Sequence documentation:

Alignment of: R11723_PEA_1_P10 x BAC85518 ..

Alignment segment 1/1:

Quality: 645.00 Escore: 0
Matching length: 63 Total length: 63
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
24 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 73
.
51 QDMCQKEVMEQSA 63
|||||||||||||
74 QDMCQKEVMEQSA 86






Alignment of: R11723_PEA_1_P13 x Q96AC2 ..

Alignment segment 1/1:

Quality: 645.00 Escore: 0
Matching length: 63 Total length: 63
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSA 63
|||||||||||||
51 QDMCQKEVMEQSA 63



Mutated protein alignment against previously known proteins:
Sequence name: / tmp / gp6eQTLWqk / mFtjUpUzhb: Q8IXM0

Sequence documentation:

Alignment of: R11723_PEA_1_P6 x Q8IXM0 ..

Alignment segment 1/1:

Quality: 1128.00 Escore: 0
Matching length: 112 Total length: 112
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
111 MYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLRE 160
||||||||||||||||||||||||||||||||||||||||
1 MYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLRE 50
....
161 GEEDHVRPEVGPRPVVLGFGRSHDPPTNLVGHPAYGQCHNNQPWADTSRRE 210
||||||||||||||||||||||||||||||||||||||||
51 GEEDHVRPEVGPRPPVVLGFGRSHDPPTNLVGHPAYGQCHNNQPWADTSRRE 100
.
211 RQRKEKHSMRTQ 222
||||||||||||
101 RQRKEKHSMRTQ 112






Sequence name: / tmp / gp6eQTLWqk / mFtjUpUzhb: Q96AC2

Sequence documentation:

Alignment of: R11723_PEA_1_P6 x Q96AC2 ..

Alignment segment 1/1:

Quality: 835.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
....
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83
||||||||||||||||||||||||||||||
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83






Sequence name: / tmp / gp6eQTLWqk / mFtjUpUzhb: Q8N2G4

Sequence documentation:

Alignment of: R11723_PEA_1_P6 x Q8N2G4 ..

Alignment segment 1/1:

Quality: 835.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
....
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83
||||||||||||||||||||||||||||||
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83






Sequence name: / tmp / gp6eQTLWqk / mFtjUpUzhb: BAC85518

Sequence documentation:

Alignment of: R11723_PEA_1_P6 x BAC85518 ..

Alignment segment 1/1:

Quality: 835.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||
24 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 73
....
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83
||||||||||||||||||||||||||||||
74 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 106






Sequence name: / tmp / VXjdFlzdBX / bexTxTh0Th: Q96AC2

Sequence documentation:

Alignment of: R11723_PEA_1_P7 x Q96AC2 ..

Alignment segment 1/1:

Quality: 654.00 Escore: 0
Matching length: 64 Total length: 64
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSAG 64
|||||||||||||
51 QDMCQKEVMEQSAG 64






Sequence name: / tmp / VXjdFlzdBX / bexTxTh0Th: Q8N2G4

Sequence documentation:

Alignment of: R11723_PEA_1_P7 x Q8N2G4 ..

Alignment segment 1/1:

Quality: 654.00 Escore: 0
Matching length: 64 Total length: 64
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSAG 64
|||||||||||||
51 QDMCQKEVMEQSAG 64






Sequence name: / tmp / VXjdFlzdBX / bexTxTh0Th: BAC85273

Sequence documentation:

Alignment of: R11723_PEA_1_P7 x BAC85273 ..

Alignment segment 1/1:

Quality: 600.00 Escore: 0
Matching length: 59 Total length: 59
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
6 IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQ 55
||||||||||||||||||||||||||||||||||||||||
22 IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQ 71

56 KEVMEQSAG 64
|||||||||
72 KEVMEQSAG 80






Sequence name: / tmp / VXjdFlzdBX / bexTxTh0Th: BAC 85518

Sequence documentation:

Alignment of: R11723_PEA_1_P7 x BAC85518 ..

Alignment segment 1/1:

Quality: 654.00 Escore: 0
Matching length: 64 Total length: 64
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||
24 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 73
.
51 QDMCQKEVMEQSAG 64
|||||||||||||
74 QDMCQKEVMEQSAG 87






Sequence name: / tmp / OLMSexEmIh / pc7Z7Xm1YR: Q96AC2

Sequence documentation:

Alignment of: R11723_PEA_1_P10 x Q96AC2 ..

Alignment segment 1/1:

Quality: 645.00 Escore: 0
Matching length: 63 Total length: 63
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSA 63
||||||||||||
51 QDMCQKEVMEQSA 63






Sequence name: / tmp / OLMSexEmIh / pc7Z7Xm1YR: Q8N2G4

Sequence documentation:

Alignment of: R11723_PEA_1_P10 x Q8N2G4 ..

Alignment segment 1/1:

Quality: 645.00 Escore: 0
Matching length: 63 Total length: 63
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSA 63
||||||||||||
51 QDMCQKEVMEQSA 63






Sequence name: / tmp / OLMSexEmIh / pc7Z7Xm1YR: BAC85273

Sequence documentation:

Alignment of: R11723_PEA_1_P10 x BAC85273 ..

Alignment segment 1/1:

Quality: 591.00 Escore: 0
Matching length: 58 Total length: 58
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
6 IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQ 55
||||||||||||||||||||||||||||||||||||||||
22 IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQ 71

56 KEVMEQSA 63
||||||||
72 KEVMEQSA 79






Sequence name: / tmp / OLMSexEmIh / pc7Z7Xm1YR: BAC85518

Sequence documentation:

Alignment of: R11723_PEA_1_P10 x BAC85518 ..

Alignment segment 1/1:

Quality: 645.00 Escore: 0
Matching length: 63 Total length: 63
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||
24 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 73
.
51 QDMCQKEVMEQSA 63
||||||||||||
74 QDMCQKEVMEQSA 86






Alignment of: R11723_PEA_1_P13 x Q96AC2 ..

Alignment segment 1/1:

Quality: 645.00 Escore: 0
Matching length: 63 Total length: 63
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSA 63
||||||||||||
51 QDMCQKEVMEQSA 63


公知のタンパク質(PSEC、本明細書中で「野生型」またはWTタンパク質とも呼ばれる)のヌクレオチド転写物配列が少なくとも1つのSNPを特徴とし、これが、一定のサイレントSNPに加えて、コード領域に影響を与えるようであることに留意すべきである。このSNPは、R11723_PEA_1_T5スプライスバリアント配列(「G−>」)に影響を与えず、ヌクレオチドを失わせる(91位以降のアミノ酸に影響を与える)。失われたヌクレオチドによってフレームシフトが起こり、新規のタンパク質が産生される。このSNPは、以前に同定されておらず、このエクソン中の約70ESTのうちの5ESTによって支持される。   The nucleotide transcript sequence of a known protein (PSEC, also referred to herein as "wild-type" or WT protein) is characterized by at least one SNP, which affects the coding region in addition to certain silent SNPs. It should be noted that it seems to give. This SNP does not affect the R11723_PEA_1_T5 splice variant sequence ("G->"), but loses nucleotides (impacts amino acids 91 and beyond). The lost nucleotides cause a frameshift and produce a new protein. This SNP has not been previously identified and is supported by 5 of the approximately 70 ESTs in this exon.

このクラスターの変異型は、仮説上のタンパク質PSEC0181の変異型(本明細書中で、「PSEC」と呼ばれる)であることに留意すべきである。さらに、肺癌検出のための単独またはこのクラスターおよび/または任意の他のクラスターおよび/または任意の公知のマーカーの1つまたは複数の変異型と組み合わせた公知のタンパク質(WTタンパク質)の使用は、本発明の実施形態を含む。   It should be noted that variants of this cluster are variants of the hypothetical protein PSEC0181 (referred to herein as "PSEC"). Furthermore, the use of known proteins (WT proteins) alone or in combination with one or more variants of this cluster and / or any other clusters and / or any known markers for the detection of lung cancer It includes embodiments of the invention.

正常および癌性肺組織における配列名R11723seg13中に示すアンプリコンによって検出可能なR11723転写物の発現
R11723seg13、R11723seg13アンプリコン(配列番号1684)ならびにR11723seg13F(配列番号1682)およびR11723seg13R(配列番号1683)プライマーによって検出可能な転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、SDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)、およびユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
Expression of R11723 transcripts detectable by the amplicon shown in sequence name R11723seg13 in normal and cancerous lung tissues R11723seg13, R11723seg13 amplicon (SEQ ID NO: 1684) and R11723seg13F (SEQ ID NO: 1682) and R11723seg13R (SEQ ID NO: 1683) primers The expression of detectable transcripts was measured by real time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – PBGD-Amplicon, SEQ ID No. 334), HPRT1 (GenBank Accession No. NM_000194, Amplicon – HPRT1- Amplicons, SEQ ID NO: 1297), SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA-Amplicon SEQ ID NO: 331), and Ubiquitin (GenBank Accession No. BC000449, Amplicon – Ubiquitin-Amplicon The expression of SEQ ID NO: 328) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. The normalized amount of each RT sample is the center of the amount of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99 above, Table 2, "tissue samples in the test panel") Divide by the value to obtain the magnification of the upregulation of each sample relative to the median of normal PM samples.

図48は、正常サンプルと比較した癌性肺サンプルにおける上記転写物の過剰発現を示すヒストグラムである。総試験サンプル数のうちの少なくとも5倍の過剰発現を示すサンプルの数および比率を、下に示す。   FIG. 48 is a histogram showing the overexpression of the transcript in cancerous lung samples compared to normal samples. The number and proportion of samples showing overexpression of at least 5 times of the total number of test samples are shown below.

図48から明らかなように、癌サンプル中の上記アンプリコンによって検出可能な転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも高かった。明白には、15個の腺癌サンプルのうちの10個および8個の小細胞癌サンプルのうちの4個で少なくとも5倍の過剰発現が見出された。   As apparent from FIG. 48, the expression of transcripts detectable by the above amplicon in a cancer sample was detected in non-cancerous samples (sample numbers 47 to 50, 90 to 93, 96 to 99, Table 2, “test panel Tissue samples in ') were higher. Apparently, at least 5-fold overexpression was found in 10 out of 15 adenocarcinoma samples and 4 out of 8 small cell carcinoma samples.

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:R11723seg13F順方向プライマーおよびR11723seg13R逆方向プライマー。   Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used only as a non-limiting illustration of suitable primer pairs: R11723seg13F forward primer and R11723seg13R reverse Direction primer.

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:R11723seg13。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : R11723 seg13.

R11723seg13F(配列番号1682)−ACACTAAAAGAACAAACACCTTGCTC
R11723seg13R(配列番号1683)−TCCTCAGAAGGCACATGAAAGA
R11723seg13–アンプリコン(配列番号1684):
ACACTAAAAGAACAAACACCTTGCTCTTCGAGATGAGACATTTTGCCAAGCAGTTGACCACTTAGTTCTCAAGAAGCAACTATCTCTTTCATGTGCCTTCTGAGGA
R11723seg13F (SEQ ID NO: 1682)-ACACTAAAACAACAAACACCTTGCTC
R11723 seg 13 R (SEQ ID NO: 1683)-TCCTCAGAAGGCACATGAAAGA
R11723seg13 – amplicon (SEQ ID NO: 1684):
ACACTAAAACAAAACACCTTGCTCTCTCGAGATGAGACATTTTGCCAAGTCAGACTACTTTTCTAGAGAAGCAACTATCTCTTTCATGTGCCTTCTGAGGA

異なる正常組織における配列名R11723seg13中に示すアンプリコンによって検出可能なR11723転写物の発現
R11723seg13アンプリコン(配列番号1684)ならびにR11723seg13F(配列番号1682)およびR11723seg13R(配列番号1683)によって検出可能なR11723転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−RPL19(GenBankアクセッション番号NM_000981、RPL19アンプリコン、配列番号1630)、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン、配列番号1633)、UBC(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン、配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、卵巣サンプル(上記のサンプル番号18〜20、表2、「正常パネル中の組織サンプル」)の量の中央値で割って、卵巣サンプルの中央値に対する各サンプルの相対発現の値を得た。
Expression of the detectable R11723 transcript by the amplicon shown in the sequence name R11723seg13 in different normal tissues R11723seg13 amplicon (SEQ ID NO: 1684) and R11723 seg13F (SEQ ID NO: 1682) and R11723 seg13 R (SEQ ID NO: 1683) detectable transcript Expression was measured by real time PCR. In parallel, four housekeeping genes-RPL19 (GenBank Accession No. NM_000981, RPL19 amplicon, SEQ ID No. 1630), TATA box (GenBank Accession No. NM_003194, TATA amplicon, SEQ ID No. 1633), UBC (GenBank Accession The expression of No. BC000449, Amplicon – Ubiquitin-Amplicon, SEQ ID NO: 328), and SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA-Amplicon SEQ ID NO: 331) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. Divide the normalized amount of each RT sample by the median of the amount of ovaries (samples 18-20 above, Table 2, "Tissue samples in the normal panel"), and compare each to the median of the ovaries The value of relative expression of was obtained.

R11723seg13F(配列番号1682)−ACACTAAAAGAACAAACACCTTGCTC
R11723seg13R(配列番号1683)−TCCTCAGAAGGCACATGAAAGA
R11723seg13–アンプリコン(配列番号1684):
ACACTAAAAGAACAAACACCTTGCTCTTCGAGATGAGACATTTTGCCAAGCAGTTGACCACTTAGTTCTCAAGAAGCAACTATCTCTTTCATGTGCCTTCTGAGGA
R11723seg13F (SEQ ID NO: 1682)-ACACTAAAACAACAAACACCTTGCTC
R11723 seg 13 R (SEQ ID NO: 1683)-TCCTCAGAAGGCACATGAAAGA
R11723seg13 – amplicon (SEQ ID NO: 1684):
ACACTAAAACAAAACACCTTGCTCTCTCGAGATGAGACATTTTGCCAAGTCAGACTACTTTTCTAGAGAAGCAACTATCTCTTTCATGTGCCTTCTGAGGA

結果を図49に示し、これは、異なる正常組織における配列名R11723seg13中に示されるアンプリコンによって検出可能なR11723転写物の発現を示す。   The results are shown in FIG. 49, which shows the expression of R11723 transcript detectable by the amplicon shown in the sequence name R11723seg13 in different normal tissues.

正常および癌性肺組織における配列名R11723junc11−18中に示すアンプリコンによって検出可能なR11723転写物の発現
junc11−18、R11723junc11−18アンプリコン(配列番号1687)ならびにR11723junc11−18F(配列番号1685)およびR11723junc11−18R(配列番号1686)プライマーによって検出可能な転写物の発現を、実時間PCRによって測定した(この連結点は、本明細書中でPSEC配列とも呼ばれる公知のタンパク質配列または「野生型」(WT)配列中に見出される)。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、SDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)、およびユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「肺癌試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
Expression of R11723 transcripts detectable by the amplicon shown in the sequence name R11723junc11-18 in normal and cancerous lung tissue junc11-18, R11723junc11-18 amplicon (SEQ ID NO: 1687) and R11723junc11-18F (SEQ ID NO: 1685) and R11723junc11-18R (SEQ ID NO: 1686) Primer expression of transcripts detectable by real-time PCR was determined (this junction is a known protein sequence also referred to herein as PSEC sequence or "wild-type" ( WT) found in sequences). In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – PBGD-Amplicon, SEQ ID No. 334), HPRT1 (GenBank Accession No. NM_000194, Amplicon – HPRT1- Amplicons, SEQ ID NO: 1297), SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA-Amplicon SEQ ID NO: 331), and Ubiquitin (GenBank Accession No. BC000449, Amplicon – Ubiquitin-Amplicon The expression of SEQ ID NO: 328) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. The normalized amount of each RT sample is that of the normal postmortem (PM) sample (sample numbers 47-50, 90-93, 96-99 above, Table 2, "Tissue samples in lung cancer test panel") The median was divided to obtain the upregulation of each sample relative to the median of normal PM samples.

図50は、正常サンプルと比較した癌性肺サンプルにおける上記転写物の過剰発現を示すヒストグラムである。値は、2連の実験の平均を示す。エラーバーは、得られた最小値および最大値を示す。   FIG. 50 is a histogram showing overexpression of the transcript in cancerous lung samples compared to normal samples. Values represent the average of duplicate experiments. Error bars indicate the obtained minimum and maximum values.

図50から明らかなように、癌サンプル中の上記アンプリコンによって検出可能な転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「肺癌試験パネル中の組織サンプル」)よりも高かった。明白には、15個の腺癌サンプルのうちの11個、16個の扁平上皮細胞癌サンプルのうちの4個、4個の大細胞癌サンプルのうちの1個、8個の小細胞癌サンプルのうちの5個で少なくとも5倍の過剰発現が見出された。   As apparent from FIG. 50, the expression of transcripts detectable by the above amplicon in cancer samples was determined by non-cancerous samples (sample numbers 47-50, 90-93, 96-99, Table 2, “Lung cancer test Tissue samples in the panel "higher". Obviously, 11 out of 15 adenocarcinoma samples, 4 out of 16 squamous cell carcinoma samples, 1 out of 4 large cell carcinoma samples, 8 small cell carcinoma samples Overexpression of at least 5 fold was found in 5 of the

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:R11723junc11−18F順方向プライマーおよびR11723junc11−18R逆方向プライマー。   Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used only as non-limiting examples of suitable primer pairs: R11723junc11-18F forward primer and R11723 junc11-18R reverse primer.

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:R11723junc11−18。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : R11723 junc 11-18.

R11723junc11−18F(配列番号1685)–AGTGATGGAGCAAAGTGCCG
R11723junc11−18R(配列番号1686)−CAGCAGCTGATGCAAACTGAG
R11723junc11−18–アンプリコン(配列番号1687)
AGTGATGGAGCAAAGTGCCGGGATCATGTACCGCAAGTCCTGTGCATCATCAGCGGCCTGTCTCATCGCCTCTGCCGGGTACCAGTCCTTCTGCTCCCCAGGGAAACTGAACTCAGTTTGCATCAGCTGCTG
R11723junc11-18F (SEQ ID NO: 1685) – AGTGATGGAGCAAAGTGCCG
R11723 junc11-18R (SEQ ID NO: 1686)-CAGCAGCTGATGCAAAACTGAG
R11723 junc11-18 – amplicon (SEQ ID NO: 1687)
AGTGATGGAGCAAGTGCCGGGATCATGTACCGCAAGTCCCTGTGCATCATCAGCGGCCTGTCTCATCGCCTGCTCTGCCGGTGACCAGTCCCTTGCTCCCCAGGGAAACTGAACTCAGTTTGCATCAGCTGCTG

異なる正常組織における配列名R11723 junc11−18中に示すアンプリコンによって検出可能なR11723転写物の発現
R11723seg13アンプリコン(配列番号1687)ならびにR11723junc11−18F(配列番号1685)およびR11723junc11−18R(配列番号1686)によって検出可能なR11723転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−RPL19(GenBankアクセッション番号NM_000981、RPL19アンプリコン、配列番号1630)、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン、配列番号1633)、UBC(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン、配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、卵巣サンプル(上記のサンプル番号18〜20、表3)の量の中央値で割って、卵巣サンプルの中央値に対する各サンプルの相対発現の値を得た。
Expression of R11723 transcript detectable by an amplicon as shown in sequence name R11723 junc11-18 in different normal tissues R11723 seg13 amplicon (SEQ ID NO: 1687) and R11723 junc11-18F (SEQ ID NO: 1685) and R11723 junc11-18R (SEQ ID NO: 1686) The expression of R11723 transcripts detectable by R was measured by real-time PCR. In parallel, four housekeeping genes-RPL19 (GenBank Accession No. NM_000981, RPL19 amplicon, SEQ ID No. 1630), TATA box (GenBank Accession No. NM_003194, TATA amplicon, SEQ ID No. 1633), UBC (GenBank Accession The expression of No. BC000449, Amplicon – Ubiquitin-Amplicon, SEQ ID NO: 328), and SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA-Amplicon SEQ ID NO: 331) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. The normalized amount of each RT sample was divided by the median of the amounts of ovary samples (sample numbers 18-20 above, Table 3) to obtain the value of the relative expression of each sample relative to the median of the ovary samples.

R11723junc11−18F(配列番号1685)–AGTGATGGAGCAAAGTGCCG
R11723junc11−18R(配列番号1686)−CAGCAGCTGATGCAAACTGAG
R11723junc11−18–アンプリコン(配列番号1687)

AGTGATGGAGCAAAGTGCCGGGATCATGTACCGCAAGTCCTGTGCATCATCAGCGGCCTGTCTCATCGCCTCTGCCGGGTACCAGTCCTTCTGCTCCCCAGGGAAACTGAACTCAGTTTGCATCAGCTGCTG
R11723junc11-18F (SEQ ID NO: 1685) – AGTGATGGAGCAAAGTGCCG
R11723 junc11-18R (SEQ ID NO: 1686)-CAGCAGCTGATGCAAAACTGAG
R11723 junc11-18 – amplicon (SEQ ID NO: 1687)

AGTGATGGAGCAAGTGCCGGGATCATGTACCGCAAGTCCCTGTGCATCATCAGCGGCCTGTCTCATCGCCTGCTCTGCCGGTGACCAGTCCCTTGCTCCCCAGGGAAACTGAACTCAGTTTGCATCAGCTGCTG

結果を図73に示し、これは、異なる正常組織における配列名R11723junc11−18中に示すアンプリコンによって検出可能なR11723転写物の発現を示す。   The results are shown in FIG. 73 and show the expression of R11723 transcripts detectable by the amplicon shown in the sequence name R11723junc11-18 in different normal tissues.

この変異型のクローニング
全長の検証
RNAの調製
ヒト成体乳頭腺癌卵巣RNAプール(ロット番号ILS1408)を、ABS(http://www.absbioreagents,Wilmington,DE19801,USA com)から得た。総RNAサンプルを、DNaseI(Ambionカタログ番号1906)を使用して処理した。
Preparation of Full-Length Validation RNAs for this Variant A human adult papillary adenocarcinoma ovarian RNA pool (Lot # ILS 1408) was obtained from ABS (http: //www.absbioreagents, Wilmington, DE 19801, USA com). Total RNA samples were processed using DNase I (Ambion catalog # 1906).

RT PCR
RTの調製
精製RNA(1μg)を、150ng Random Hexamerプライマー(Invitrogenカタログ番号48190−011)および500μM dNTP(Takara、カタログ番号B9501−1)と、全量が15.6μlのDEPC−HO(Beit Haemek、カタログ番号01−852−1A)中で混合した。混合物を、65℃で5分間インキュベートし、氷上で急速に冷却した。その後、5μlの5×Superscript II first strand緩衝液(Invitrogen、カタログ番号Y00146)、2.4μl 0.1M DTT(Invitrogen、カタログ番号Y00147)、および40単位のRNasin(Promega、カタログ番号N251A)を添加し、混合物を42℃で2分間インキュベートした。その後、1μl(200単位)のSuperscriptII(Invitrogen、カタログ番号18064−022)を添加し、反応物を42℃で50分間インキュベートし、その後、70℃で15分間インキュベートした。得られたcDNAを、TE緩衝液(10mM Tris(pH=8)、1mM EDTA(pH=8)で20倍に希釈した。
RT PCR
Preparation of RT Purified RNA (1 μg) was prepared using 150 ng Random Hexamer primer (Invitrogen Catalog No. 48190-011) and 500 μM dNTP (Takara, Catalog No. B9501-1), and a total of 15.6 μl of DEPC-H 2 O (Beit Haemek) , Catalog No. 01-852-1A). The mixture was incubated at 65 ° C. for 5 minutes and cooled rapidly on ice. Then add 5 μl of 5 × Superscript II first strand buffer (Invitrogen, catalog number Y00146), 2.4 μl 0.1 M DTT (Invitrogen, catalog number Y00147), and 40 units of RNasin (Promega, catalog number N251A) The mixture was incubated at 42 ° C. for 2 minutes. Thereafter, 1 μl (200 units) of Superscript II (Invitrogen, Cat. No. 18064-022) was added, and the reaction was incubated for 50 minutes at 42 ° C. and then for 15 minutes at 70 ° C. The cDNA obtained was diluted 20 fold with TE buffer (10 mM Tris (pH = 8), 1 mM EDTA (pH = 8).

PCR増幅および分析
上記のように調製したcDNA(5μl)を、PCR反応のテンプレートとして使用した。以下のの条件下でAccuPower PCR PreMix (Bioneer,Korea、カタログ番号K2016)を使用して増幅を行った。1μlの以下ののプライマー(10μM):
PSECfor−TGCTGTCGCCTCCTCTGATG
PSECrev−CCTCAGAAGGCACATGAAAG
+13μl–HOを、AccuPower PCR PreMixチューブに添加し、以下の反応プログラムを使用した:94℃で5分間、(94℃で30秒間、52℃で30秒間、72℃で40秒間)を35サイクル、72℃で10分間。PCR増幅の完了後、産物を、臭化エチジウムで染色し、UV光で視覚化したアガロースゲルを分析した。PCR産物を、QiaQuick(商標)ゲル抽出キット(Qiagen(商標)、カタログ番号28706)を使用してゲルから抽出した。抽出したDNA産物(図79)を、上記の遺伝子特異的プライマー(Hy−Labs,Israel)を使用した直接的配列決定によって配列決定し、PSEC変異型R11723_PEA_1 T5の推定配列を得た(図80)。
PCR amplification and analysis cDNA (5 μl) prepared as described above was used as a template for PCR reactions. Amplification was performed using AccuPower PCR PreMix (Bioneer, Korea, Catalog No. K2016) under the following conditions. 1 μl of the following primers (10 μM):
PSECfor-TGCTGTCGCCTCCTCTGATG
PSECrev-CCTCAGAAGGCACATGAAAG
+13 μl – H 2 O was added to the AccuPower PCR PreMix tube and the following reaction program was used: 5 minutes at 94 ° C (30 seconds at 94 ° C, 30 seconds at 52 ° C, 40 seconds at 72 ° C) For 35 cycles, 72 ° C for 10 minutes. After completion of the PCR amplification, the products were stained with ethidium bromide and analyzed for UV light visualized agarose gel. The PCR products were extracted from the gel using the QiaQuickTM gel extraction kit (QiagenTM, catalog number 28706). The extracted DNA product (FIG. 79) was sequenced by direct sequencing using the gene specific primers (Hy-Labs, Israel) described above to obtain the deduced sequence of PSEC mutant R11723_PEA_1 T5 (FIG. 80) .

図79に示すように、推定PSEC変異型R11723_PEA_1 T5が実際に成体乳頭腺腫卵巣ヒト組織中で天然に発現されたと結論づけた。   As shown in FIG. 79, it was concluded that the putative PSEC mutant R11723_PEA_1 T5 was indeed naturally expressed in adult papillary adenoma ovarian human tissue.

細菌発現ベクターでのPSEC変異型R11723_PEA_1 T5のクローニング
PSECスプライスバリアントR11723_PEA_1 T5コード配列を、以下の条件下でテンプレートとしての上記のフラグメントおよびPlatinum Pfx DNAポリメラーゼ(Invitrogenカタログ番号11708021)を使用したPCR増幅のために調製した:全反応量が50μlの5 μl–Amplification X10緩衝液(Invitrogenカタログ番号11708021);2μl–上記のPCR産物;1μl–dNTP(各10mM);1μl MgSO4(50mM)、5μlエンハンサー溶液(Invitrogenカタログ番号11708021);33μl–H2O;1μlの各プライマー(10μM)、および1.25単位のTaqポリメラーゼ(Platinum Pfx DNAポリメラーゼ(Invitrogenカタログ番号11708021))を、94℃で3分間、(94で30秒間、58℃で30秒間、68℃で40秒間)を29サイクル、68℃で7分間の反応プログラムに供する。下記のプライマーは、スプライスバリアントに対応するヌクレオチド配列の特異的配列およびNheIおよびHindIII制限部位を含む。
Cloning of PSEC Mutant R11723_PEA_1 T5 in a Bacterial Expression Vector PSEC Splice Variant R11723_PEA_1 T5 Coding Sequence for PCR Amplification Using the Fragment Above and Platinum Pfx DNA Polymerase (Invitrogen Catalog No. 11708021) as a Template under the Following Conditions Amplification X10 buffer (Invitrogen Catalog No. 11708021); 2 μl – PCR product of the above; 1 μl – dNTP (10 mM each); 1 μl MgSO4 (50 mM) , 5 μl enhancer solution (Invitrogen Cat. No. 11708021); 33 μl – H 2 O; 1 μl of each primer (10 μM), and 1.25 units of Taq polymerase (Platinum Pfx DNA polymerase (Invitrogen Cat. No. 11708021)) for 3 minutes at 94 ° C (30 seconds at 94 ° C, 30 seconds at 58 ° C, 40 seconds at 68 ° C) For 29 cycles, 68 ° C. for 7 minutes. The following primers contain the specific sequence of the nucleotide sequence corresponding to the splice variant and the NheI and HindIII restriction sites.

PSEC NheIfor− ATAGCTAGCATGTGGGTCCTAGGCATCGCGG
PSEC HindIIIrev− CCCAAGCTTCTAAGTGGTCAACTGCTTGGC
PSEC NheI for-ATAGCTAGCATGTGGGTCCTAGGCATCGCGG
PSEC HindIII rev-CCCAAGCTCTTAATGTGTCAACTGCTTGGC

次いで、PCR産物を、NheIおよびHindIII(New England Biolabs(UK)LTD)で二重に消化し(図81)、N末端6Hisタグに対してインフレームで上記酵素で事前に消化したpRSET−A(Invitrogen、カタログ番号V351−20)に挿入して、HisPSEC T5 pRSETを得た(図82)。コード配列は、N末端に6His(6His残基はタンパク質の片端に連続している)タグを有し、pRSETベクターによってコードされる8つのさらなるアミノ酸を有するタンパク質をコードする。   The PCR product was then double digested with NheI and HindIII (New England Biolabs (UK) LTD) (FIG. 81), and pRSET-A pre-digested with the above enzymes in frame against the N-terminal 6His tag. HisPSEC T5 pRSET was obtained by insertion into Invitrogen, Cat. No. V 351-20) (FIG. 82). The coding sequence carries a 6His (6His residue is contiguous to one end of the protein) tag at the N-terminus and encodes a protein with 8 additional amino acids encoded by the pRSET vector.

最終プラスミド中のPSECインサートおよびその隣接領域の配列を、配列決定によって検証し、所望の配列と同一であることが見出された。配列決定された領域を含むHis PSEC T5 pRESTAの完全な配列を、図84に示す。   The sequences of the PSEC insert and its flanking regions in the final plasmid were verified by sequencing and found to be identical to the desired sequence. The complete sequence of His PSEC T5 pRESTA containing the sequenced region is shown in FIG.

図83は、PSEC変異型R11723_PEA_1 T5の翻訳配列を示す。
Figure 83 shows the translated sequence of PSEC mutant R11723_PEA_1 T5.

細菌培養およびタンパク質発現の誘導
HisPSEC pRSETA DNAを、完全なDH5a細胞(Invitrogenカタログ番号18258−012)に形質転換した。アンピシリン耐性形質転換体をスクリーニングし、陽性クローンを、制限酵素消化および配列の検証によってさらに分析した。
Bacterial culture and induction of protein expression HisPSEC pRSETA DNA was transformed into intact DH5a cells (Invitrogen cat # 18258-012). Ampicillin resistant transformants were screened and positive clones were further analyzed by restriction enzyme digestion and sequence verification.

組換えタンパク質を発現するために、HisPSEC pRSETA DNAを、コンピテントBL21Gold細胞(Stratageneカタログ番号230134)およびBL21star(Invitrogenカタログ番号 44−0054)にさらに形質転換した。アンピシリン耐性形質転換体をスクリーニングし、陽性クローンを選択した。   To express the recombinant protein, HisPSEC pRSETA DNA was further transformed into competent BL21 Gold cells (Stratagene catalog no. 230134) and BL21 star (Invitrogen catalog no. 44-0054). Ampicillin resistant transformants were screened and positive clones were selected.

HisPSEC T5 pRSETベクターおよび空のpRSETベクター(負のコントロールとして)を含む細菌細胞を、アンピシリン(50μg/ml)およびクロラムフェニコール(34μg/ml)を補足したLB培地中で、O.D.600nmが0.55に達するまで成長させた。約3時間でこの値に達した。1mM IPTG(Roche、カタログ番号724815)を添加し、細胞を、37℃で一晩成長させた。ゲル分析のために、0時間、インキュベーション3時間後、および一晩インキュベーション後に1mlアリコートの各培養物を取り出した(それぞれ、T0、T3、およびTO/N)。   Bacterial cells containing the HisPSEC T5 pRSET vector and the empty pRSET vector (as a negative control) were transformed into O. coli in LB medium supplemented with ampicillin (50 μg / ml) and chloramphenicol (34 μg / ml). D. It was grown until 600 nm reached 0.55. It reached this value in about 3 hours. 1 mM IPTG (Roche, Cat. No. 724815) was added and cells were grown overnight at 37 ° C. For gel analysis, 1 ml aliquots of each culture were removed after 0 hours, 3 hours incubation, and after overnight incubation (T0, T3, and TO / N, respectively).

発現の結果
BL21Gold中のPSECの少量発現の経時変化を、図85に示す。適切な分子量(9.2kDa)の組換えタンパク質の発現を、抗His抗体(BD Clontech,Ref 631212、図85)を使用するが、クーマシー染色によらないウェスタンブロットによって視覚化した(データ示さず)。同様にBL21starを使用して類似の発現パターンが得られた(データ示さず)。
Results of Expression The time course of the small expression of PSEC in BL21 Gold is shown in FIG. Expression of recombinant proteins of appropriate molecular weight (9.2 kDa) was visualized by Western blot using anti-His antibody (BD Clontech, Ref 631212, FIG. 85) but without Coomassie staining (data not shown) . Similar expression patterns were obtained using BL21 star as well (data not shown).

これらの結果は、PSEC変異型R11723_PEA_1 T5によってコードされるタンパク質が細菌細胞中で実際に発現されることを示す。   These results indicate that the protein encoded by PSEC mutant R11723_PEA_1 T5 is indeed expressed in bacterial cells.

クラスターR16276の説明
クラスターR16276は、目的の1つの転写物および5個のセグメントを特徴とし、その名称を、それぞれ表1305および1306に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表1307に示す。
Description of Cluster R16276 Cluster R16276 features one transcript and five segments of interest, the names of which are shown in Tables 1305 and 1306, respectively, and the sequence itself is shown at the end of the application. Selected protein variants are shown in Table 1307.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるNOVタンパク質ホモログ前駆体(SwissProtアクセッション識別子NOV_HUMAN、同義語NovH、腎芽腫過剰発現遺伝子タンパク質ホモログとしても公知である)(配列番号1463)の変異型である。   These sequences are also known as NOV protein homologue precursors (SwissProt accession identifier NOV_HUMAN, synonym NovH, nephroblastoma over-expressing gene protein homolog, which is a known protein, previously known herein as a protein) (SEQ ID NO: 1463).

タンパク質NOVタンパク質ホモログ前駆体は、以下の機能を有することが公知であるか、そのように見なされている:細胞成長の制御で役割を果たす可能性が高い即時型タンパク質(類似性による)。タンパク質NOVタンパク質ホモログ前駆体の配列を、「NOVタンパク質ホモログ前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表1308に示す。   Protein NOV Protein homolog precursors are known or considered to have the following functions: Immediate-type proteins (by similarity) that are likely to play a role in cell growth control. The sequence of the protein NOV protein homologue precursor is shown at the end of the application as "NOV protein homologue precursor amino acid sequence". Known polymorphisms of this sequence are shown in Table 1308.

Figure 2008507261
Figure 2008507261

タンパク質NOVタンパク質ホモログ前駆体の局在化は、分泌と考えられる。   The localization of the protein NOV protein homologue precursor is considered to be secretion.

以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである細胞成長の制御、分子機能に関連する注釈付けであるインスリン様成長因子結合、成長因子、および細胞成分に関連する注釈付けである細胞外。   The following GO annotation applies to previously known proteins. The following annotations were found: control of cell growth which is related to biological processes, insulin related growth factor binding which is an annotation related to molecular function, growth factors and related to cellular components Extracellular, annotated.

GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。   GO assignments can be made at one or more http: // www. expasy. SwissProt / TremBl Protein knowledgebase available from ch / sprot / or http: // www. ncbi. nlm. nih. Depends on Locuslink available from gov / projects / LocusLink /.

クラスターR16276を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図51のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   Cluster R16276 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The terms “number” in the right column of the table and the number on the y-axis of FIG. 51 refer to the weighted expression of ESTs in each category as “ppm” Ratio of expression to expression of all ESTs).

概して、図51および表1309中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):悪性肺腫瘍。   In general, as shown for the histograms in FIG. 51 and Table 1309, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: malignant lung tumors.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、クラスターR16276は、上の表1に列挙した1つの転写物を特徴とする。これらの転写物は、タンパク質NOVタンパク質ホモログ前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, cluster R16276 is characterized by one transcript as listed in Table 1 above. These transcripts encode proteins that are variants of the protein NOV protein homolog precursor. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質R16276_PEA_1_P7は、出願書類の最後に示すアミノ酸配列を有し、転写物R16276_PEA_1_T6によってコードされる。公知のタンパク質(NOVタンパク質ホモログ前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。   The mutein R16276_PEA_1_P7 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript R16276_PEA_1_T6. An alignment to a known protein (NOV protein homologue precursor) is shown at the end of the application. One or more alignments to one or more previously published protein sequences are shown at the end of the application. A brief description of the relationship between the mutein of the present invention and each such aligned protein is as follows.

R16276_PEA_1_P7とNOV_HUMANとの間の比較の報告
1.NOV_HUMANのアミノ酸1〜41に対応し、R16276_PEA_1_P7のアミノ酸1〜41にも対応するMQSVQSTSFCLRKQCLCLTFLLLHLLGQVAATQRCPPQCPGと少なくとも90%相同な第1のアミノ酸配列と、R16276_PEA_1_P7のアミノ酸42に対応する架橋アミノ酸Qと、NOV_HUMANのアミノ酸43〜103に対応し、R16276_PEA_1_P7のアミノ酸43〜103にも対応するCPATPPTCAPGVRAVLDGCSCCLVCARQRGESCSDLEPCDESSGLYCDRSADPSNQTGICTと少なくとも90%相同な第2のアミノ酸配列と、R16276_PEA_1_P7のアミノ酸104〜111に対応する配列GNPAPSAVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、架橋アミノ酸、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、R16276_PEA_1_P7をコードする単離キメラポリペプチド。
Report of comparison between R16276_PEA_1_P7 and NOV_HUMAN 1. The first amino acid sequence corresponding to amino acids 1 to 41 of NOV_HUMAN and corresponding to amino acids 1 to 41 of R16276_PEA_1_P7 with MQSV QSTSFCLRK QCLCLTLCLLLLLG LG. CPATPPTCAPVRAVLDGCSCCLVCARGSGCSDLEPCDESSGLYCDRADPSLYCLY corresponding to amino acids 43-103 of R16276_PEA_1_P7 and a second amino acid sequence at least 90% homologous to ADPSN QTGICT, and sequence GNPAP corresponding to amino acids 104-111 of R16276_PEA_1_P7 A third amino acid sequence which is at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most preferably at least 95% homologous to a polypeptide having AV, said third An isolated chimeric polypeptide encoding R16276_PEA_1_P7, wherein the amino acid sequence of 1, the bridging amino acid, the second amino acid sequence, and the third amino acid sequence are adjacent and in sequential order.

2.R16276_PEA_1_P7中の配列GNPAPSAVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R16276_PEA_1_P7のテールをコードする単離ポリペプチド。   2. Of R16276_PEA_1_P7 comprising a polypeptide which is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the sequence GNPAPSAV in R16276_PEA_1_P7 An isolated polypeptide encoding a tail.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質R16276_PEA_1_P7はまた、表1312に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R16276_PEA_1_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R16276_PEA_1_P7 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, enumerating other amino acids, and the last column shows SNPs as shown in Table 1312) It indicates whether it is known and the presence of a known SNP in the mutein R16276_PEA_1_P7 sequence supports the putative sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

公知のタンパク質NOVタンパク質ホモログ前駆体と比較した変異タンパク質R16276_PEA_1_P7のグリコシル化部位を表1314に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。   The glycosylation sites of mutant protein R16276_PEA_1_P7 compared to known protein NOV protein homolog precursors are shown in Table 1314 (showing its position on the amino acid sequence in the first column, the second column has mutations in glycosylation sites) The presence or absence in the protein is indicated and the last column indicates whether this position is different on the mutated protein).

Figure 2008507261
Figure 2008507261

変異タンパク質、R16276_PEA_1_P7は、以下の転写物によってコードされる:R16276_PEA_1_T6(配列は出願書類の最後に示す)。転写物R16276_PEA_1_T6のコード部分を太字で示し、このコード部分は445位から開始され、777位で終結する。転写物はまた、表1315に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R16276_PEA_1_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein R16276_PEA_1_P7 is encoded by the following transcript: R16276_PEA_1_T6 (sequences shown at the end of the application). The code portion of the transcript R16276_PEA_1_T6 is shown in bold, starting from position 445 and ending at position 777. The transcript also has the following SNPs listed in Table 1315 (indicating its position on the nucleotide sequence, listing another nucleic acid, the last column indicating whether the SNP is known, mutein R16276_PEA_1_P7 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターR16276は、上の表2に列挙した5個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster R16276 is characterized by the five segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターR16276_PEA_1_node_0は、35個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R16276_PEA_1_T6。以下の表1316は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R16276_PEA_1_node_0 of the present invention is supported by 35 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R16276_PEA_1_T6. Table 1316 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR16276_PEA_1_node_6は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R16276_PEA_1_T6。以下の表1317は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R16276_PEA_1_node_6 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R16276_PEA_1_T6. Table 1317 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターR16276_PEA_1_node_1は、37個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R16276_PEA_1_T6。以下の表1318は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R16276_PEA_1_node_1 of the present invention is supported by 37 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R16276_PEA_1_T6. Table 1318 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR16276_PEA_1_node_4は、38個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R16276_PEA_1_T6。以下の表1319は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R16276_PEA_1_node_4 of the present invention is supported by 38 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R16276_PEA_1_T6. Table 1319 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターR16276_PEA_1_node_5は、37個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R16276_PEA_1_T6。以下の表1320は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster R16276_PEA_1_node_5 of the present invention is supported by 37 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R16276_PEA_1_T6. Table 1320 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: NOV_HUMAN

Sequence documentation:

Alignment of: R16276_PEA_1_P7 x NOV_HUMAN ..

Alignment segment 1/1:

Quality: 1042.00 Escore: 0
Matching length: 103 Total length: 103
Matching Percent Similarity: 100.00 Matching Percent Identity: 99.03
Total Percent Similarity: 100.00 Total Percent Identity: 99.03
Gaps: 0

Alignment:
. . . . .
1 MQSVQSTSFCLRKQCLCLTFLLLHLLGQVAATQRCPPQCPGQCPATPPTC 50
|||||||||||||||||||||||||||||||||||||||||:||||||||
1 MQSVQSTSFCLRKQCLCLTFLLLHLLGQVAATQRCPPQCPGRCPATPPTC 50
. . . . .
51 APGVRAVLDGCSCCLVCARQRGESCSDLEPCDESSGLYCDRSADPSNQTG 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 APGVRAVLDGCSCCLVCARQRGESCSDLEPCDESSGLYCDRSADPSNQTG 100

101 ICT 103
|||
101 ICT 103


Mutated protein alignment against previously known proteins:
Sequence name: NOV_HUMAN

Sequence documentation:

Alignment of: R16276_PEA_1_P7 x NOV_HUMAN ..

Alignment segment 1/1:

Quality: 1042.00 Escore: 0
Matching length: 103 Total length: 103
Matching Percent Similarity: 100.00 Matching Percent Identity: 99.03
Total Percent Similarity: 100.00 Total Percent Identity: 99.03
Gaps: 0

Alignment:
....
1 MQSVQSTSFCLRKQCLCLTFLLLHLLGQVAATQRCPPQCPGQCTPPTTC 50
|||||||||||||||||||||||||||||||||: |||||||||
1 MQSVQSTSFCLRKQCLCLTFLLLHLLGQVAATQRCPPQCPRCPTPPTC 50
....
51 APGVRAVLDGCSCCLVCARGRGSESCDLEPCDESSGLYCDRSADPSNQTG 100
||||||||||||||||||||||||||||||||||||||||
51 APGVRAVLDGCSCCLVCARGRGSESCDLEPCDESSGLYCDRSADPSNQTG 100

101 ICT 103
||||
101 ICT 103

正常および癌性肺組織における6つの配列H61775seg8、HUMGRP5E junc3−7、M85491Seg24、Z21368junc17−21、HSSTROL3seg24、およびZ25299seg20の組み合わせ発現
H61775seg8(配列番号1636)、HUMGRP5Ejunc3−7(配列番号1648)、M85491Seg24(配列番号1639)、Z21368junc17−21(配列番号1642)、HSSTROL3seg24(配列番号1675)、およびZ25299seg20アンプリコン(配列番号1669)ならびにH61775seg8F2(配列番号1634)、H61775seg8R2(配列番号1635)、HUMGRP5Ejunc3−7F(配列番号1646)、HUMGRP5Ejunc3−7R(配列番号1647)、M85491Seg24F(配列番号1637)、M85491Seg24R(配列番号1638)、Z21368junc17−21F(配列番号1640)、Z21368junc17−21R(配列番号1641)、HSSTROL3seg24F(配列番号1673)、HSSTROL3seg24R(配列番号1674)、Z25299seg20F(配列番号1667)、Z25299seg20R(配列番号1668)プライマーによって検出可能な免疫グロブリンスーパーファミリーメンバー9、ガストリン放出ペプチド、EphrinB型受容体2前駆体、SUL1_HUMAN、ストロメリシン−3前駆体(EC3.4.24.−)(マトリクス金属プロテイナーゼ−11)(MMP−11)(ST3)(SL−3)、および分泌性白血球プロテイナーゼインヒビターである酸安定性プロテイナーゼインヒビター転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)、の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各アンプリコンの各RTサンプルの正規化した量を、同一アンプリコンについて検出された正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。Z25299seg20(配列番号1669)についてのこの比の逆数を計算して、正常なPMサンプルの中央値に対する各サンプルの下方制御の倍率を得た。
Combined expression of six sequences H61775seg8, HUMGRP5E junc3-7, M85491Seg24, Z21368junc17-21, HSSTROL3seg24, and Z25299seg20 in normal and cancerous lung tissue H61775seg8 (SEQ ID NO: 1636), HUMGRP5Ejunc3-7 (SEQ ID NO: 1648), M85491 Eg 1639), Z21368junc17-21 (SEQ ID NO: 1642), HSSTROL3seg24 (SEQ ID NO: 1675), and Z25299seg20 amplicon (SEQ ID NO: 1669) and H61775seg8F2 (SEQ ID NO: 1634), H61775seg8R2 (SEQ ID NO: 1635), HUMGRP5Ejunc3-7F (SEQ ID NO: 1616) 6) HUMGRP5Ejunc3-7R (SEQ ID NO: 1647), M85491 Seg24F (SEQ ID NO: 1637), M85491 Seg24R (SEQ ID NO: 1638), Z21368 junc17-21F (SEQ ID NO: 1640), Z21368 junc17-21R (SEQ ID NO: 1641), HSSTROL3seg24F (SEQ ID NO: 1673) , HSSTROL3seg24R (SEQ ID NO: 1674), Z25299seg20F (SEQ ID NO: 1667), Z25299seg20R (SEQ ID NO: 1668) Immunoglobulin superfamily member 9 detectable by the primer, Gastrin releasing peptide, Ephrin type B receptor 2 precursor, SUL1_HUMAN, stromelysin-3 Precursor (EC 3.4.24.-) (matrix metal powder The expression of rotinase-11) (MMP-11) (ST3) (SL-3) and acid stable proteinase inhibitor transcript which is a secreted leukocyte proteinase inhibitor was measured by real time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – PBGD-Amplicon, SEQ ID No. 334), HPRT1 (GenBank Accession No. NM_000194, Amplicon – HPRT1- Amplicons, SEQ ID NO: 1297), Ubiquitin (GenBank Accession No. BC000449, Amplicon – Ubiquitin-Amplicon SEQ ID NO: 328), and SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA-Amplicon The expression of SEQ ID NO: 331) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. Normalized postmortem (PM) samples detected for the same amplicon (Sample Nos. 47-50, 90-93, 96-99 above, Table 2, Test, Normalized Amount of each RT sample for each amplicon. The median of the amount of tissue samples in the panel ") was divided to obtain the upregulation of each sample relative to the median of normal PM samples. The reciprocal of this ratio for Z25299seg20 (SEQ ID NO: 1669) was calculated to obtain the downregulation of each sample relative to the median of normal PM samples.

図52〜53は、正常サンプルと比較した癌性肺サンプルにおける上記転写物の差分発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも1つの配列の少なくとも5倍の差分発現を示すサンプルの数および比率を、下に示す。   Figures 52-53 are histograms showing differential expression of the transcript in cancerous lung samples compared to normal samples. The numbers and proportions of samples showing at least 5 times the differential expression of at least one sequence out of the total number of samples tested are indicated below.

図52〜53から明らかなように、15個の腺癌サンプルのうちの15個、16個の扁平上皮細胞癌サンプルのうちの14個、4個の大細胞癌サンプルのうちの4個、8個の小細胞癌サンプルのうちの8個の少なくとも1つの配列で少なくとも5倍の差分発現が見出された。   As is apparent from FIGS. 52 to 53, 15 out of 15 adenocarcinoma samples, 14 out of 16 squamous cell carcinoma samples, 4 out of 4 large cell carcinoma samples, 8 A differential expression of at least 5 fold was found in at least one sequence of 8 of the small cell carcinoma samples.

下記のように、これらの結果の有意性を検証するために、統計分析を適用した。少なくとも1つのアンプリコンの5倍差分制御の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、腺癌で7.82E−06、扁平上皮細胞癌で2.63E−04、大細胞癌で8.24E−03、小細胞癌で3.57E−04であった。   Statistical analysis was applied to verify the significance of these results as described below. The threshold for 5-fold differential control of at least one amplicon was found to be different between cancer and normal samples, and checked by Fisher's exact test, the P value was 7.82E- for adenocarcinoma. 06, 2.63E-04 in squamous cell carcinoma, 8.24E-03 in large cell carcinoma and 3.57E-04 in small cell carcinoma.

上記値は、結果が統計的に有意であることを示す。   The above values indicate that the results are statistically significant.

クラスターH53626の説明
クラスターH53626は、目的の2つの転写物および20個のセグメントを特徴とし、その名称を、それぞれ表1321および1322に示し、配列自体を、出願書類の最後に示す。
Description of cluster H53626 Cluster H53626 is characterized by two transcripts of interest and 20 segments, the names of which are shown in Tables 1321 and 1322 respectively, and the sequence itself is shown at the end of the application.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

クラスターH53626を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および以下の図76のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。   Cluster H53626 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. The expression of such transcripts in normal tissues is also shown by the method previously described. The term "number" in the right column of the table and the number on the y-axis of Figure 76 below refer to the weighted expression of EST in each category as "ppm" (specific clusters in this category by ppm Ratio of EST expression to total EST expression).

概して、図76および表1324中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および筋肉腫。   In general, as shown for the histograms in FIG. 76 and Table 1324, the following results were obtained. This cluster was overexpressed (at least at minimal levels) in the following pathological conditions: epithelial malignancies, a mixture of malignancies from different tissues, and myomas.

Figure 2008507261
Figure 2008507261

Figure 2008507261
Figure 2008507261

上記のように、コンティグH53626は、上の表1321に列挙した2つの転写物を特徴とする。本発明の各変異タンパク質の説明をここに記載する。   As mentioned above, contig H53626 is characterized by the two transcripts listed in Table 1321 above. A description of each mutein of the invention is provided herein.

本発明の変異タンパク質H53626_PEA_1_P4は、出願書類の最後に示すアミノ酸配列を有し、転写物H53626_PEA_1_T15によってコードされる。野生型タンパク質に対するアラインメントを、出願書類の最後に示す。本発明の変異タンパク質と野生型タンパク質との関係の簡単な説明は以下である。   The mutein H53626_PEA_1_P4 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript H53626_PEA_1_T15. An alignment to the wild type protein is shown at the end of the application. A brief description of the relationship between the mutein of the present invention and the wild-type protein is as follows.

H53626_PEA_1_P4と野生型Q8N441(配列番号1699)との間の比較の報告
1.Q8N441のアミノ酸1〜357に対応し、H53626_PEA_1_P4のアミノ酸1〜357にも対応するMTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQCPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCKATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFTQPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPRKKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTGTHPVNTTVDFGGTTSFQCKVRSDVKPVIQWLKRVEYGAEGRHNSTIDVGGQKFVVLPTGDVWSRPDGSYLNKLLITRARQDDAGMYICLGANTMGYSFRSAFLTVLPと少なくとも90%相同な第1のアミノ酸配列と、H53626_PEA_1_P4のアミノ酸358〜437に対応する配列GARLPRHATPCWCPDPPPGPGVPPTGWGPTLPSRAVLARSSAEGGQPRGTVSTAPGMGLGCSPGLCVGVPLPTSFPLALAを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列と、Q8N441のアミノ酸358〜504に対応し、H53626_PEA_1_P4のアミノ酸438〜584も対応するDPKPPGPPVASSSSATSLPWPVVIGIPAGAVFILGTLLLWLCQAQKKPCTPAPAPPLPGHRPPGTARDRSGDKDLPSLAALSAGPGVGLCEEHGSPAAPQHLLGPGPVAGPKLYPKLYTDIHTHTHTHSHTHSHVEGKVHQHIHYQCと少なくとも90%相同な第3のアミノ酸配列とを含み、前記第1、第2、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、H53626_PEA_1_P4をコードする単離キメラポリペプチド。
Report of comparison between H53626_PEA_1_P4 and wild type Q8N441 (SEQ ID NO: 1699). Corresponding to amino acids 1 to 357 of Q8N441, corresponding to amino acids 1 to 357 of H53626_PEA_1_P4 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQCPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCKATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFTQPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPRKKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTGTHPVNTTVDFGGTTSFQCKVRSDVKPVIQWL A case in which a first amino acid sequence which is at least 90% homologous to HVE26GAEGHHNSTIDVGGQKFV VLPTGDVWSRPDSYNL KL ITRALQ DDAGLYCHGMGSFAFLTVLP and a sequence corresponding to amino acids 358 to 437 of H53626_PEA_1_P4 is used. Is a second amino acid sequence that is at least 90%, most preferably at least 95% homologous, and corresponds to amino acids 358 to 504 of Q8N441, The corresponding amino acids 438 to 584 of the 26_PEA_1_P4 are also corresponding to DPKPPV AVESSSATSLPWPVVIGIA GAVFILF LGLLLQAQKPCPCAPAPLPRPRPTARDRPDHADRPKLDLALSAGPGVGLCHEG HPGAPAGHT KHT LYTPHHTHTVHIVHQHQQHQ QHQ and a semiconductive metal sheet An isolated chimeric polypeptide encoding H53626_PEA_1_P4.

2.H53626_PEA_1_P4に対応するGARLPRHATPCWCPDPPPGPGVPPTGWGPTLPSRAVLARSSAEGGQPRGTVSTAPGMGLGCSPGLCVGVPLPTSFPLALAをコードする配列と少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なアミノ酸配列を含む、H53626_PEA_1_P4の縁部分をコードする単離ポリペプチド。   2. A sequence corresponding to H53626_PEA_1_P4 that is at least 70%, optionally at least about 80%, preferably at least about 85%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the coding sequence An isolated polypeptide encoding the edge portion of H53626_PEA_1_P4 comprising.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有することが同意されるが、両膜貫通領域推定プログラムによってこのタンパク質がこのシグナルペプチドの下流に膜貫通領域を有すると推定されるので、膜と考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: membrane. For protein localization, both signal peptide estimation programs agree that this protein has a signal peptide, but both transmembrane domain estimation programs predict that this protein has a transmembrane domain downstream of this signal peptide. It is considered to be a membrane.

変異タンパク質H53626_PEA_1_P4はまた、表1326に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H53626_PEA_1_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein H53626_PEA_1_P4 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, listing other amino acids, and the last column shows SNPs as shown in Table 1326) It indicates whether it is known and the presence of a known SNP in the mutant protein H53626_PEA_1_P4 sequence supports the predicted sequence of this mutant protein of the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質、H53626_PEA_1_P4は、以下の転写物によってコードされる:H53626_PEA_1_T15(配列は出願書類の最後に示す)。転写物H53626_PEA_1_T15のコード部分を太字で示し、このコード部分は17位から開始され、1771位で終結する。転写物はまた、表1327に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H53626_PEA_1_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein, H53626_PEA_1_P4, is encoded by the following transcript: H53626_PEA_1_T15 (sequences shown at the end of the application). The coding portion of transcript H53626_PEA_1_T15 is shown in bold and this coding portion starts at position 17 and ends at position 1771. The transcript also has the following SNPs listed in Table 1327 (showing its position on the nucleotide sequence and listing another nucleic acid, the last column shows whether the SNP is known, mutein H53626_PEA_1_P4 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

本発明の変異タンパク質H53626_PEA_1_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物H53626_PEA_1_T16によってコードされる。野生型タンパク質に対するアラインメントを、出願書類の最後に示す。本発明の変異タンパク質と野生型タンパク質との関係の簡単な説明は以下である。   The mutein H53626_PEA_1_P5 of the invention has the amino acid sequence shown at the end of the application and is encoded by the transcript H53626_PEA_1_T16. An alignment to the wild type protein is shown at the end of the application. A brief description of the relationship between the mutein of the present invention and the wild-type protein is as follows.

H53626_PEA_1_P5と野生型Q9H4D7(配列番号1700)との間の比較の報告
1.Q9H4D7のアミノ酸1〜269に対応し、H53626_PEA_1_P5のアミノ酸1〜269にも対応するMTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQCPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCKATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFTQPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPRKKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTGTHPVNTTVDFGGTTSFQCKと少なくとも90%相同な第1のアミノ酸配列と、H53626_PEA_1_P5のアミノ酸270〜490に対応する配列TQNRQGHLWPPRPRPLACRGPWSSASQPALSSSWAPCSCGFARPRRSRAPPRLPLPCLGTARRGRPATAAETRTFPRWPPSALALVWGCVRSMGLRQPPSTYWAQAQLLALSCTPNSTQTSTHTHTHTLTHTHTWRARSTSTSTISARRHRICSGHGGAGQTGRLGGWRTELQTKAGDPWRGGMASTPGSLCVRHSPWTHTHRHTHYLDACMHTHARTRAPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、H53626_PEA_1_P5をコードする単離キメラポリペプチド。
Report of the comparison between H53626_PEA_1_P5 and wild type Q9H4D7 (SEQ ID NO: 1700). Corresponding to amino acids 1-269 of Q9H4D7, at least 90% homologous I and MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQCPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCKATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFTQPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPRKKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTGTHPVNTTVDFGGTTSFQCK corresponding to amino acids 1-269 of H53626_PEA_1_P5 And 1 amino acid sequence, a polypeptide at least 70% with a sequence corresponding to TQNRQGHLWPPRPRPLACRGPWSSASQPALSSSWAPCSCGFARPRRSRAPPRLPLPCLGTARRGRPATAAETRTFPRWPPSALALVWGCVRSMGLRQPPSTYWAQAQLLALSCTPNSTQTSTHTHTHTLTHTHTWRARSTSTSTISARRHRICSGHGGAGQTGRLGGWRTELQTKAGDPWRGGMASTPGSLCVRHSPWTHTHRHTHYLDACMHTHARTRAP to amino acid 270-490 of H53626_PEA_1_P5, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most Mashiku comprises at least 95% homologous to a second amino acid sequence, wherein the first and second amino acid sequences are contiguous, and in sequential order, the isolated chimeric polypeptide coding H53626_PEA_1_P5.

2.H53626_PEA_1_P5中の配列TQNRQGHLWPPRPRPLACRGPWSSASQPALSSSWAPCSCGFARPRRSRAPPRLPLPCLGTARRGRPATAAETRTFPRWPPSALALVWGCVRSMGLRQPPSTYWAQAQLLALSCTPNSTQTSTHTHTHTLTHTHTWRARSTSTSTISARRHRICSGHGGAGQTGRLGGWRTELQTKAGDPWRGGMASTPGSLCVRHSPWTHTHRHTHYLDACMHTHARTRAPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、H53626_PEA_1_P5のテールをコードする単離ポリペプチド。   2. SEQ TQNRQGHLWPPRPRPLACRGPWSSASQPALSSSWAPCSCGFARPRRSRAPPRLPLPCLGTARRGRPATAAETRTFPRWPPSALALVWGCVRSMGLRQPPSTYWAQAQLLALSCTPNSTQTSTHTHTHTLTHTHTWRARSTSTSTISARRHRICSGHGGAGQTGRLGGWRTELQTKAGDPWRGGMASTPGSLCVRHSPWTHTHRHTHYLDACMHTHARTRAP at least 70% in H53626_PEA_1_P5, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the polypeptide, H53626 An isolated polypeptide encoded by a tail of PEA_1_P5.

H53626_PEA_1_P5と野生型Q8N441との間の比較の報告
1.Q8N441のアミノ酸1〜269に対応し、H53626_PEA_1_P5のアミノ酸1〜269にも対応するMTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQCPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCKATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFTQPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPRKKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTGTHPVNTTVDFGGTTSFQCKと少なくとも90%相同な第1のアミノ酸配列と、H53626_PEA_1_P5のアミノ酸270〜490に対応する配列TQNRQGHLWPPRPRPLACRGPWSSASQPALSSSWAPCSCGFARPRRSRAPPRLPLPCLGTARRGRPATAAETRTFPRWPPSALALVWGCVRSMGLRQPPSTYWAQAQLLALSCTPNSTQTSTHTHTHTLTHTHTWRARSTSTSTISARRHRICSGHGGAGQTGRLGGWRTELQTKAGDPWRGGMASTPGSLCVRHSPWTHTHRHTHYLDACMHTHARTRAPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、H53626_PEA_1_P5をコードする単離キメラポリペプチド。
Report of comparison between H53626_PEA_1_P5 and wild type Q8N441. Corresponding to amino acids 1-269 of Q8N441, at least 90% homologous I and MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQCPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCKATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFTQPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPRKKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTGTHPVNTTVDFGGTTSFQCK corresponding to amino acids 1-269 of H53626_PEA_1_P5 And 1 amino acid sequence, a polypeptide at least 70% with a sequence corresponding to TQNRQGHLWPPRPRPLACRGPWSSASQPALSSSWAPCSCGFARPRRSRAPPRLPLPCLGTARRGRPATAAETRTFPRWPPSALALVWGCVRSMGLRQPPSTYWAQAQLLALSCTPNSTQTSTHTHTHTLTHTHTWRARSTSTSTISARRHRICSGHGGAGQTGRLGGWRTELQTKAGDPWRGGMASTPGSLCVRHSPWTHTHRHTHYLDACMHTHARTRAP to amino acid 270-490 of H53626_PEA_1_P5, optionally at least 80%, preferably at least 85%, more preferably at least 90%, most Mashiku comprises at least 95% homologous to a second amino acid sequence, wherein the first and second amino acid sequences are contiguous, and in sequential order, the isolated chimeric polypeptide coding H53626_PEA_1_P5.

2.H53626_PEA_1_P5中の配列TQNRQGHLWPPRPRPLACRGPWSSASQPALSSSWAPCSCGFARPRRSRAPPRLPLPCLGTARRGRPATAAETRTFPRWPPSALALVWGCVRSMGLRQPPSTYWAQAQLLALSCTPNSTQTSTHTHTHTLTHTHTWRARSTSTSTISARRHRICSGHGGAGQTGRLGGWRTELQTKAGDPWRGGMASTPGSLCVRHSPWTHTHRHTHYLDACMHTHARTRAPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、H53626_PEA_1_P5のテールをコードする単離ポリペプチド。   2. SEQ TQNRQGHLWPPRPRPLACRGPWSSASQPALSSSWAPCSCGFARPRRSRAPPRLPLPCLGTARRGRPATAAETRTFPRWPPSALALVWGCVRSMGLRQPPSTYWAQAQLLALSCTPNSTQTSTHTHTHTLTHTHTWRARSTSTSTISARRHRICSGHGGAGQTGRLGGWRTELQTKAGDPWRGGMASTPGSLCVRHSPWTHTHRHTHYLDACMHTHARTRAP at least 70% in H53626_PEA_1_P5, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, most preferably at least about 95% homologous to the polypeptide, H53626 An isolated polypeptide encoded by a tail of PEA_1_P5.

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。   The position of the mutein was determined according to the results from a number of different software programs and analyses, including analysis with SignalP and other specialized programs. The muteins are believed to be positioned with respect to the cells as follows: secretion. Protein localization is secreted because both signal peptide estimation programs predict that this protein has a signal peptide, and both transmembrane domain estimation programs predict that this protein has no transmembrane domain. It is thought that.

変異タンパク質H53626_PEA_1_P5はまた、表1328に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H53626_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein H53626_PEA_1_P5 also has the following non-silent SNPs (single nucleotide polymorphisms) (showing its position on the amino acid sequence, enumerating other amino acids, and the last column shows SNPs as shown in Table 1328) It indicates whether it is known and the presence of a known SNP in the mutant protein H53626_PEA_1_P5 sequence supports the deduced sequence of this mutant protein according to the invention).

Figure 2008507261
Figure 2008507261

変異タンパク質、H53626_PEA_1_P5は、以下の転写物によってコードされる:H53626_PEA_1_T16(配列は出願書類の最後に示す)。転写物H53626_PEA_1_T16のコード部分を太字で示し、このコード部分は17位から開始され、1489位で終結する。転写物はまた、表1329に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H53626_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。   The mutein, H53626_PEA_1_P5, is encoded by the following transcript: H53626_PEA_1_T16 (sequences shown at the end of the application). The coding portion of transcript H53626_PEA_1_T16 is shown in bold, starting at position 17 and ending at position 1489. The transcript also has the following SNPs listed in Table 1329 (showing its position on the nucleotide sequence and listing another nucleic acid, the last column shows whether the SNP is known, mutein H53626_PEA_1_P5 The presence of known SNPs in the sequence supports the deduced sequence of this mutein of the invention).

Figure 2008507261
Figure 2008507261

上記のように、クラスターH53626は、上の表2に列挙した20個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。   As mentioned above, cluster H53626 is characterized by the 20 segments listed in Table 2 above, the sequence of which is shown at the end of the application. These segments are part of the nucleic acid sequence, which are of particular interest and are individually described herein. A description of each segment of the invention is provided herein.

本発明のセグメントクラスターH53626_PEA_1_node_15は、25個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1330は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H53626_PEA_1_node_15 of the present invention is supported by 25 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H53626_PEA_1_T15 and H53626_PEA_1_T16. Table 1330 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH53626_PEA_1_node_22は、42個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1332は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H53626_PEA_1_node_22 of the present invention is supported by 42 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H53626_PEA_1_T15 and H53626_PEA_1_T16. Table 1332 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH53626_PEA_1_node_25は、41個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15。以下の表1334は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H53626_PEA_1_node_25 of the present invention is supported by 41 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H53626_PEA_1_T15. Table 1334 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH53626_PEA_1_node_26は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15。以下の表1336は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H53626_PEA_1_node_26 of the present invention is supported by 5 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H53626_PEA_1_T15. Table 1336 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH53626_PEA_1_node_27は、106個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1338は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H53626_PEA_1_node_27 of the present invention is supported by 106 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H53626_PEA_1_T15 and H53626_PEA_1_T16. Table 1338 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH53626_PEA_1_node_34は、121個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1340は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H53626_PEA_1_node_34 of the present invention is supported by 121 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H53626_PEA_1_T15 and H53626_PEA_1_T16. Table 1340 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH53626_PEA_1_node_35は、85個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1342は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H53626_PEA_1_node_35 of the present invention is supported by 85 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H53626_PEA_1_T15 and H53626_PEA_1_T16. Table 1342 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(表1343に示す)。   Microarray (chip) data for this segment is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (shown in Table 1343).

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH53626_PEA_1_node_36は、69個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1344は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H53626_PEA_1_node_36 of the present invention is supported by 69 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H53626_PEA_1_T15 and H53626_PEA_1_T16. Table 1344 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(表13455に示す)。   Microarray (chip) data for this segment is also available, as follows. As described above, with respect to the clusters themselves, different oligonucleotides were tested for differential expression in different disease states, in particular cancer. The following oligonucleotides were found to reach this segment (shown in Table 13455).

Figure 2008507261
Figure 2008507261

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。   According to an optional embodiment of the present invention, there is also provided a short segment associated with the above cluster. These segments are up to about 120 bp in length and are therefore included in the individual descriptions.

本発明のセグメントクラスターH53626_PEA_1_node_11は、12個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1346は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H53626_PEA_1_node_11 of the present invention is supported by 12 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H53626_PEA_1_T15 and H53626_PEA_1_T16. Table 1346 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH53626_PEA_1_node_12は、11個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1347は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H53626_PEA_1_node_12 of the present invention is supported by 11 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H53626_PEA_1_T15 and H53626_PEA_1_T16. Table 1347 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH53626_PEA_1_node_16を、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1348は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H53626_PEA_1_node_16 according to the invention can be found in the following transcript: H53626_PEA_1_T15 and H53626_PEA_1_T16. Table 1348 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH53626_PEA_1_node_19は、25個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1349は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H53626_PEA_1_node_19 of the present invention is supported by 25 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H53626_PEA_1_T15 and H53626_PEA_1_T16. Table 1349 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH53626_PEA_1_node_20は、27個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1350は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H53626_PEA_1_node_20 of the present invention is supported by 27 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H53626_PEA_1_T15 and H53626_PEA_1_T16. Table 1350 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH53626_PEA_1_node_24は、34個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1351は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H53626_PEA_1_node_24 of the present invention is supported by 34 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H53626_PEA_1_T15 and H53626_PEA_1_T16. Table 1351 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH53626_PEA_1_node_28は、66個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1352は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H53626_PEA_1_node_28 of the present invention is supported by 66 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H53626_PEA_1_T15 and H53626_PEA_1_T16. Table 1352 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH53626_PEA_1_node_29は、73個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1353は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H53626_PEA_1_node_29 of the present invention is supported by 73 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H53626_PEA_1_T15 and H53626_PEA_1_T16. Table 1353 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH53626_PEA_1_node_30は、71個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1354は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H53626_PEA_1_node_30 of the present invention is supported by 71 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H53626_PEA_1_T15 and H53626_PEA_1_T16. Table 1354 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH53626_PEA_1_node_31は、67個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1355は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H53626_PEA_1_node_31 of the present invention is supported by 67 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H53626_PEA_1_T15 and H53626_PEA_1_T16. Table 1355 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH53626_PEA_1_node_32は、65個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1356は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H53626_PEA_1_node_32 of the present invention is supported by 65 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: H53626_PEA_1_T15 and H53626_PEA_1_T16. Table 1356 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261

本発明のセグメントクラスターH53626_PEA_1_node_33を、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1357は、各転写物上のこのセグメントの開始位置および終結位置を記載する。   The segment cluster H53626_PEA_1_node_33 according to the invention can be found in the transcript: H53626_PEA_1_T15 and H53626_PEA_1_T16. Table 1357 below describes the start and end positions of this segment on each transcript.

Figure 2008507261
Figure 2008507261


以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/K1Mec2ReKO/eg1EUS2AXY:Q8N441

Sequence documentation:

Alignment of: H53626_PEA_1_P4 x Q8N441 ..

Alignment segment 1/1:

Quality: 4882.00 Escore: 0
Matching length: 504 Total length: 584
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 86.30 Total Percent Identity: 86.30
Gaps: 1

Alignment:
. . . . .
1 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQ 50
. . . . .
51 CPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCK 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCK 100
. . . . .
101 ATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFT 150
. . . . .
151 QPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPR 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 QPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPR 200
. . . . .
201 KKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTG 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 KKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTG 250
. . . . .
251 THPVNTTVDFGGTTSFQCKVRSDVKPVIQWLKRVEYGAEGRHNSTIDVGG 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 THPVNTTVDFGGTTSFQCKVRSDVKPVIQWLKRVEYGAEGRHNSTIDVGG 300
. . . . .
301 QKFVVLPTGDVWSRPDGSYLNKLLITRARQDDAGMYICLGANTMGYSFRS 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 QKFVVLPTGDVWSRPDGSYLNKLLITRARQDDAGMYICLGANTMGYSFRS 350
. . . . .
351 AFLTVLPGARLPRHATPCWCPDPPPGPGVPPTGWGPTLPSRAVLARSSAE 400
|||||||
351 AFLTVLP........................................... 357
. . . . .
401 GGQPRGTVSTAPGMGLGCSPGLCVGVPLPTSFPLALADPKPPGPPVASSS 450
|||||||||||||
358 .....................................DPKPPGPPVASSS 370
. . . . .
451 SATSLPWPVVIGIPAGAVFILGTLLLWLCQAQKKPCTPAPAPPLPGHRPP 500
||||||||||||||||||||||||||||||||||||||||||||||||||
371 SATSLPWPVVIGIPAGAVFILGTLLLWLCQAQKKPCTPAPAPPLPGHRPP 420
. . . . .
501 GTARDRSGDKDLPSLAALSAGPGVGLCEEHGSPAAPQHLLGPGPVAGPKL 550
||||||||||||||||||||||||||||||||||||||||||||||||||
421 GTARDRSGDKDLPSLAALSAGPGVGLCEEHGSPAAPQHLLGPGPVAGPKL 470
. . .
551 YPKLYTDIHTHTHTHSHTHSHVEGKVHQHIHYQC 584
||||||||||||||||||||||||||||||||||
471 YPKLYTDIHTHTHTHSHTHSHVEGKVHQHIHYQC 504






Sequence name: /tmp/oSUZaRW3WK/oSh3fN5Zt0:Q9H4D7

Sequence documentation:

Alignment of: H53626_PEA_1_P5 x Q9H4D7 ..

Alignment segment 1/1:

Quality: 2644.00 Escore: 0
Matching length: 269 Total length: 269
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQ 50
. . . . .
51 CPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCK 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCK 100
. . . . .
101 ATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFT 150
. . . . .
151 QPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPR 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 QPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPR 200
. . . . .
201 KKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTG 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 KKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTG 250
.
251 THPVNTTVDFGGTTSFQCK 269
|||||||||||||||||||
251 THPVNTTVDFGGTTSFQCK 269






Sequence name: /tmp/oSUZaRW3WK/oSh3fN5Zt0:Q8N441

Sequence documentation:

Alignment of: H53626_PEA_1_P5 x Q8N441 ..

Alignment segment 1/1:

Quality: 2644.00 Escore: 0
Matching length: 269 Total length: 269
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQ 50
. . . . .
51 CPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCK 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCK 100
. . . . .
101 ATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFT 150
. . . . .
151 QPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPR 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 QPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPR 200
. . . . .
201 KKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTG 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 KKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTG 250
.
251 THPVNTTVDFGGTTSFQCK 269
|||||||||||||||||||
251 THPVNTTVDFGGTTSFQCK 269



Mutated protein alignment against previously known proteins:
Sequence name: / tmp / K1Mec2ReKO / eg1EUS2AXY: Q8N441

Sequence documentation:

Alignment of: H53626_PEA_1_P4 x Q8N441 ..

Alignment segment 1/1:

Quality: 4882.00 Escore: 0
Matching length: 504 Total length: 584
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 86.30 Total Percent Identity: 86.30
Gaps: 1

Alignment:
....
1 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKV VPRQ VARLGRTVRLQ 50
||||||||||||||||||||||||||||||||||||||||
1 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKV VPRQ VARLGRTVRLQ 50
....
51 CPVEGDPPPLTTM WT KTDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCK 100
||||||||||||||||||||||||||||||||||||||||
51 CPVEGDPPPLTTM WT KTDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCK 100
....
101 ATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFT 150
||||||||||||||||||||||||||||||||||||||||
101 ATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFT 150
....
151 QPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPR 200
||||||||||||||||||||||||||||||||||||||||
151 QPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPR 200
....
201 KKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTG 250
||||||||||||||||||||||||||||||||||||||||
201 KKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTG 250
....
251 THPVNTTVDFGGGGTTSFQCKVRSDV KPVIQWLKRVEYGAEGRHNSTIDVGG 300
||||||||||||||||||||||||||||||||||||||||
251 THPVNTTVDFGGGGTTSFQCKVRSDV KPVIQWLKRVEYGAEGRHNSTIDVGG 300
....
301 QKFVLPTGDVWSRPDGSYLNKL LITRARQDDAGMYICLGANTMGYSFRS 350
||||||||||||||||||||||||||||||||||||||||
301 QKFVLPTGDVWSRPDGSYLNKL LITRARQDDAGMYICLGANTMGYSFRS 350
....
351 AFLTVLPGARLPRHATPCWCDPPPPPGPGPPPPTGWGPTSLAVLARSAE 400
||||||||
351 AFLTVLP ........................................ 357
....
401 GGQPRTGTVSTAPGMGGCSPGLCVGVPLPTSPPLADPKPPGPPVASSS 450
||||||||||||
358 ......................................... DPKPPGPPVASSS 370
....
451 SATSLPWPPVVIGIPAGAVFILGTLLWLCQAQKKPCTPAPAPPLPHRPP 500
||||||||||||||||||||||||||||||||||||||||
371 SATSLPWPVVIGIGAVFILFILTLLLWLCQAQKKPCTPAPAPPLPHRPP 420
....
501 GTARDRSGDKDLPSALSAGPGVGLCEEHGSPA APQ HLLGPGPVAGPKL 550
||||||||||||||||||||||||||||||||||||||||
421 GTARDRSGDKDLPSALSAGPGVGLCEEHGSPA APQ HLLGPGPVAGPKL 470
....
551 YPKLYTDIHTHTHTHTHSHTHSHVEGKVHQHIHYQC 584
|||||||||||||||||||||||||||||||
471 YPKLYTDIHTHTHTHTHTHTHSHVEGKVHQHIHYQC 504






Sequence name: / tmp / oSUZaRW3WK / oSh3fN5Zt0: Q9H4D7

Sequence documentation:

Alignment of: H53626_PEA_1_P5 x Q9H4D7 ..

Alignment segment 1/1:

Quality: 2644.00 Escore: 0
Matching length: 269 Total length: 269
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKV VPRQ VARLGRTVRLQ 50
||||||||||||||||||||||||||||||||||||||||
1 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKV VPRQ VARLGRTVRLQ 50
....
51 CPVEGDPPPLTTM WT KTDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCK 100
||||||||||||||||||||||||||||||||||||||||
51 CPVEGDPPPLTTM WT KTDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCK 100
....
101 ATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFT 150
||||||||||||||||||||||||||||||||||||||||
101 ATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFT 150
....
151 QPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPR 200
||||||||||||||||||||||||||||||||||||||||
151 QPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPR 200
....
201 KKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTG 250
||||||||||||||||||||||||||||||||||||||||
201 KKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTG 250
.
251 THPVNTTVDFGGGGTTSFQCK 269
||||||||||||||||||
251 THPVNTTVDFGGGGTTSFQCK 269






Sequence name: / tmp / oSUZaRW3WK / oSh3fN5Zt0: Q8N441

Sequence documentation:

Alignment of: H53626_PEA_1_P5 x Q8N441 ..

Alignment segment 1/1:

Quality: 2644.00 Escore: 0
Matching length: 269 Total length: 269
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
....
1 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKV VPRQ VARLGRTVRLQ 50
||||||||||||||||||||||||||||||||||||||||
1 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKV VPRQ VARLGRTVRLQ 50
....
51 CPVEGDPPPLTTM WT KTDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCK 100
||||||||||||||||||||||||||||||||||||||||
51 CPVEGDPPPLTTM WT KTDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCK 100
....
101 ATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFT 150
||||||||||||||||||||||||||||||||||||||||
101 ATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFT 150
....
151 QPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPR 200
||||||||||||||||||||||||||||||||||||||||
151 QPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPR 200
....
201 KKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTG 250
||||||||||||||||||||||||||||||||||||||||
201 KKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTG 250
.
251 THPVNTTVDFGGGGTTSFQCK 269
||||||||||||||||||
251 THPVNTTVDFGGGGTTSFQCK 269


正常および癌性肺組織における配列名H53626junc24−27F1R3中に示すアンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)H53626転写物の発現
junc24−27、H53626junc24−27F1R3アンプリコン(配列番号1690)ならびにH53626junc24−27F1(配列番号1688)およびH53626junc24−27R3(配列番号1689)プライマーによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、UBC(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
Expression of homo-Sapiens fibroblast growth factor receptor-like 1 (FGFRL1) H53626 transcripts detectable by an amplicon as shown in sequence name H53626junc24-27F1R3 in normal and cancerous lung tissue junc24-27, H53626junc24-27F1R3 amplicon (SEQ ID NO: 1690) and H53626 junc24-27F1 (SEQ ID NO: 1688) and H53626 junc24-27R3 (SEQ ID NO: 1689) The expression of Homo sapiens fibroblast growth factor receptor like 1 (FGFRL1) transcripts detectable by primers Measured by time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – PBGD-Amplicon, SEQ ID No. 334), HPRT1 (GenBank Accession No. NM_000194, Amplicon – HPRT1- Amplicons, SEQ ID NO: 1297), UBC (GenBank Accession No. BC000449, Amplicon – Ubiquitin-Amplicon SEQ ID NO: 328), and SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA-Amplicon The expression of SEQ ID NO: 331) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. Normalized PM samples by dividing the normalized volume of each RT sample by the median volume of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99, Table 2 above) Magnifications of upregulation of each sample to the median of were obtained.

図74は、正常サンプルと比較した癌性肺サンプルにおける上記ホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)転写物の過剰発現を示すヒストグラムである。   FIG. 74 is a histogram showing over expression of the homo-Sapiens fibroblast growth factor receptor-like 1 (FGFRL1) transcript in cancerous lung samples as compared to normal samples.

図74から明らかなように、いくつかの癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2)よりも高かった。明白には、15個の腺癌サンプルのうちの7個で少なくとも5倍の過剰発現が見出された。     As apparent from FIG. 74, the expression of homo-Sapiens fibroblast growth factor receptor-like 1 (FGFRL1) transcripts detectable by the above amplicon in several cancer samples is a non-cancerous sample (sample number) 46-50, 90-93, 96-99, higher than Table 2). Apparently, at least 5-fold overexpression was found in 7 out of 15 adenocarcinoma samples.

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:H53626junc24−27F1順方向プライマーおよびH53626junc24−27R3逆方向プライマー。   Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used only as non-limiting examples of suitable primer pairs: H53626junc24-27F1 forward primer and H53626 junc24-27R3 reverse primer.

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:H5326junc24−27F1R3。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : H5326 junc24-27F1R3.


順方向プライマー(配列番号1688):GTCCTTCCAGTGCAAGACCCA
逆方向プライマー(配列番号1689):TGGGCCTGGCAAAGCC
アンプリコン(配列番号1690):GTCCTTCCAGTGCAAGACCCAAAACCGCCAGGGCCACCTGTGGCCTCCTCGTCCTCGGCCACTAGCCTGCCGTGGCCCGTGGTCATCGGCATCCCAGCCGGCGCTGTCTTCATCCTGGGCACCCTGCTCCTGTGGCTTTGCCAGGCCCA

Forward primer (SEQ ID NO: 1688): GTCCTTCCAGTGCAAGACCCA
Reverse primer (SEQ ID NO: 1689): TGGGCCTGGCAAAGCC
Amplicon (SEQ ID NO: 1690): GTCCTTCCAGTGCAAGACCCAAAACCGCCAGGGCCACCTGTGGCCTCCTCGTCCTCGGCCACTAGCCTGTCCGTGTGGCCCTGTGCATCGGCATCCCAGCCGGGCGCTGTCTTCATGGTCACCTGTCCTGGTCTGTCTGCCAGTGCCA

正常および癌性肺組織における配列名H53626seg25中に示すアンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)H53626転写物の発現
seg25、H53626seg25アンプリコン(配列番号1693)、ならびにH53626seg25F(配列番号1691)およびH53626seg25R(配列番号1692)プライマーによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、UBC(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
Expression of homo-Sapiens fibroblast growth factor receptor-like 1 (FGFRL1) H53626 transcripts detectable by an amplicon shown in sequence name H53626seg25 in normal and cancerous lung tissue seg25, H53626seg25 amplicon (SEQ ID NO: 1693), The expression of homo-Sapiens fibroblast growth factor receptor-like 1 (FGFRL1) transcripts detectable by H53626seg25F (SEQ ID NO: 1691) and H53626seg25R (SEQ ID NO: 1692) primers was measured by real-time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – PBGD-Amplicon, SEQ ID No. 334), HPRT1 (GenBank Accession No. NM_000194, Amplicon – HPRT1- Amplicons, SEQ ID NO: 1297), UBC (GenBank Accession No. BC000449, Amplicon – Ubiquitin-Amplicon SEQ ID NO: 328), and SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA-Amplicon The expression of SEQ ID NO: 331) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. Normalized PM samples by dividing the normalized volume of each RT sample by the median volume of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99, Table 2 above) Magnifications of upregulation of each sample to the median of were obtained.

図75から明らかなように、いくつかの癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2)よりも高かった。明白には、15個の腺癌サンプルのうちの3個で少なくとも5倍の過剰発現が見出された。   As evident from FIG. 75, the expression of homo-Sapiens fibroblast growth factor receptor-like 1 (FGFRL1) transcripts detectable by the above amplicon in several cancer samples is a non-cancerous sample (sample number) 46-50, 90-93, 96-99, higher than Table 2). Apparently, at least 5-fold overexpression was found in 3 out of 15 adenocarcinoma samples.

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:H53626seg25F順方向プライマーおよびH53626seg25R逆方向プライマー。   Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used only as non-limiting examples of suitable primer pairs: H53626seg25F forward primer and H53626seg25R reverse Direction primer.

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:H53626seg25。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : H53626 seg 25.


順方向プライマー(配列番号1691);CCGACGGCTCCTACCTCAA
逆方向プライマー(配列番号1692):GGAAGCTGTAGCCCATGGTGT
逆方向プライマー(配列番号1693):CCGACGGCTCCTACCTCAATAAGCTGCTCATCACCCGTGCCCGCCAGGACGATGCGGGCATGTACATCTGCCTTGGCGCCAACACCATGGGCTACAGCTTCC

Forward primer (SEQ ID NO: 1691); CCGACGGCTCCTACTCCAA
Reverse primer (SEQ ID NO: 1692): GGAAGCTGTAGCCCATGGTGT
Reverse primer (SEQ ID NO: 1693): CCGACGGCTCCTACTCCATAAAAGCTGCTCATACCCGTGCCCGCCCAGGACGATGCGGGCATGTACATCTGCCTTGGCGCCAAACACCATGGGCTAAGCTTCTC

異なる正常組織における配列名H53626seg25中に示すアンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)H53626転写物の発現
H53626seg25アンプリコン(配列番号1693)ならびにH53626seg25F(配列番号1691)およびH53626seg25R(配列番号1692)プライマーによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−RPL19(GenBankアクセッション番号NM_000981、RPL19アンプリコン、配列番号1630)、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン、配列番号1633)、UBC(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン、配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、肺サンプル(上記のサンプル番号15〜17、表3)の量の中央値で割って、肺サンプルの中央値に対する各サンプルの相対発現の値を得た。
Expression of homo-Sapiens fibroblast growth factor receptor-like 1 (FGFRL1) H53626 transcripts detectable by an amplicon shown in the sequence name H53626seg25 in different normal tissues H53626seg25 amplicon (SEQ ID NO: 1693) as well as H53626seg25F (SEQ ID NO: 1691) ) And the expression of homo-Sapiens fibroblast growth factor receptor-like 1 (FGFRL1) transcripts detectable by H53626 seg 25 R (SEQ ID NO: 1692) primers was measured by real-time PCR. In parallel, four housekeeping genes-RPL19 (GenBank Accession No. NM_000981, RPL19 amplicon, SEQ ID No. 1630), TATA box (GenBank Accession No. NM_003194, TATA amplicon, SEQ ID No. 1633), UBC (GenBank Accession The expression of No. BC000449, Amplicon – Ubiquitin-Amplicon, SEQ ID NO: 328), and SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA-Amplicon SEQ ID NO: 331) was similarly measured. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. The normalized volume of each RT sample was divided by the median volume of lung samples (Sample Nos. 15-17 above, Table 3 above) to obtain the value of the relative expression of each sample relative to the median lung sample.


順方向プライマー(配列番号1691);CCGACGGCTCCTACCTCAA
逆方向プライマー(配列番号1692):GGAAGCTGTAGCCCATGGTGT
逆方向プライマー(配列番号1693):CCGACGGCTCCTACCTCAATAAGCTGCTCATCACCCGTGCCCGCCAGGACGATGCGGGCATGTACATCTGCCTTGGCGCCAACACCATGGGCTACAGCTTCC

Forward primer (SEQ ID NO: 1691); CCGACGGCTCCTACTCCAA
Reverse primer (SEQ ID NO: 1692): GGAAGCTGTAGCCCATGGTGT
Reverse primer (SEQ ID NO: 1693): CCGACGGCTCCTACTCCATAAAAGCTGCTCATACCCGTGCCCGCCCAGGACGATGCGGGCATGTACATCTGCCTTGGCGCCAAACACCATGGGCTAAGCTTCTC

結果を図77に示し、これは、異なる正常組織における配列名H53626seg25中に示すアンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)H53626転写物の発現を示す。   The results are shown in FIG. 77, which shows the expression of Homo sapiens fibroblast growth factor receptor-like 1 (FGFRL1) H53626 transcripts detectable by the amplicon shown in the sequence name H53626seg25 in different normal tissues.

異なる正常組織における配列名H53626junc24−27F1R3中に示すアンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)H53626転写物の発現
H53626junc24−27F1R3アンプリコン(配列番号1690)ならびにH53626junc24−27F1(配列番号1688)およびH53626junc24−27R3(配列番号1689)によって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−RPL19(GenBankアクセッション番号NM_000981、RPL19アンプリコン、配列番号1630)、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン、配列番号1633、プライマー配列番号1631および1632)、UBC(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン、配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、肺サンプル(上記のサンプル番号15〜17、表3)の量の中央値で割って、肺サンプルの中央値に対する各サンプルの相対発現の値を得た。
Expression of homo-Sapiens fibroblast growth factor receptor-like 1 (FGFRL1) H53626 transcripts detectable by the amplicon shown in the sequence name H53626junc24-27F1R3 in different normal tissues H53626junc24-27F1R3 amplicon (SEQ ID NO: 1690) as well as H53626junc24 The expression of homo-Sapiens fibroblast growth factor receptor-like 1 (FGFRL1) transcripts detectable by -27F1 (SEQ ID NO: 1688) and H53626 junc24-27R3 (SEQ ID NO: 1689) was measured by real time PCR. In parallel, four housekeeping genes-RPL19 (GenBank Accession No. NM_000981, RPL19 amplicon, SEQ ID No. 1630), TATA box (GenBank Accession No. NM_003194, TATA amplicon, SEQ ID No. 1633, primers SEQ ID No. 1631 and 1632 ), UBC (GenBank Accession No. BC000449, Amplicon – Ubiquitin-Amplicon, SEQ ID No. 328), and SDHA (GenBank Accession No. NM_004168, Amplicon – SDHA-Amplicon SEQ ID No. 331) Expression was measured as well. For each RT sample, the expression of the amplicon was normalized to the geometric mean of the housekeeping gene dose. The normalized volume of each RT sample was divided by the median volume of lung samples (Sample Nos. 15-17 above, Table 3 above) to obtain the value of the relative expression of each sample relative to the median lung sample.


順方向プライマー(配列番号1688):GTCCTTCCAGTGCAAGACCCA
逆方向プライマー(配列番号1689):TGGGCCTGGCAAAGCC
逆方向プライマー(配列番号1690):GTCCTTCCAGTGCAAGACCCAAAACCGCCAGGGCCACCTGTGGCCTCCTCGTCCTCGGCCACTAGCCTGCCGTGGCCCGTGGTCATCGGCATCCCAGCCGGCGCTGTCTTCATCCTGGGCACCCTGCTCCTGTGGCTTTGCCAGGCCCA

Forward primer (SEQ ID NO: 1688): GTCCTTCCAGTGCAAGACCCA
Reverse primer (SEQ ID NO: 1689): TGGGCCTGGCAAAGCC
Reverse primer (SEQ ID NO: 1690): GTCCTTCCAGTGCAAGACCCAAAACCGCAAGGCCACCTGTGGCCTCCTCGTCCTCGGCCACTAGCCTGTCCGTGTGGCCGTGTGCATCGGCATCCCAGCCGGGCGCTGTCTTCATCGTGCTCCTGTCTGTCTGTCAGTCGGCCCA

結果を図78に示し、これは、異なる正常組織における配列名H53626juncc24−27F1R3中に示すアンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)H53626転写物の発現を示す。   The results are shown in FIG. 78 and show the expression of homo-Sapiens fibroblast growth factor receptor-like 1 (FGFRL1) H53626 transcripts detectable by the amplicon shown in the sequence name H53626juncc24-27F1R3 in different normal tissues .

正常および癌性肺組織における配列番号1480中に示すアンプリコンによって検出可能なトロフィニン関連タンパク質(タスチン)(T86235)転写物の発現
配列番号1480によって検出可能なトロフィニン関連タンパク質(タスチン)転写物(例えば、配列番号1485〜1488、1609、1610によって示される変異型番号23〜26、31、32)の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–配列番号1471)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–配列番号1468)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–配列番号1474)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–配列番号1477)の発現を同様に測定した。各RTサンプルのために、配列番号1480の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
Expression of trophinin-related protein (Tastin) (T86235) transcript detectable by an amplicon as shown in SEQ ID NO: 1480 in normal and cancerous lung tissues Trophinin-related protein (Tastin) transcript detectable by SEQ ID NO: 1480 (eg The expression of variants nos. 23-26, 31, 32) represented by SEQ ID NOs: 1485-1488, 1609, 1610 was measured by real-time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – SEQ ID No. 1471), HPRT1 (GenBank Accession No. NM_000194, Amplicon – SEQ ID No. 1468), Ubiquitin (Ubiquitin) The expression of GenBank Accession No. BC000449, Amplicon <#8211; SEQ ID No. 1474), and SDHA (GenBank Accession No. NM-004168, Amplicon >#8211; SEQ ID No: 1477) was similarly measured. For each RT sample, the expression of SEQ ID NO: 1480 was normalized to the geometric mean of the housekeeping gene dose. The normalized amount of each RT sample is the center of the amount of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99 above, Table 2, "tissue samples in the test panel") Divide by the value to obtain the magnification of the upregulation of each sample relative to the median of normal PM samples.

図54aは、正常サンプルに対する癌性肺組織における上記トロフィニン関連タンパク質(タスチン)転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも5倍の過剰発現を示すサンプルの数および比率を、下に示す。   FIG. 54a is a histogram showing over expression of the trophinin related protein (Tastin) transcript in cancerous lung tissue relative to a normal sample. The numbers and proportions of samples showing at least 5 times overexpression of the total number of samples tested are shown below.

図54aから明らかなように、癌サンプル中の配列番号1480によって検出可能なトロフィニン関連タンパク質(タスチン)転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、15個の腺癌サンプルのうちの6個、16個の扁平上皮細胞癌サンプルのうちの8個、4個の大細胞癌サンプルのうちの2個、8個の小細胞癌サンプルのうちの8個で少なくとも5倍の過剰発現が見出された。   As evident from FIG. 54a, the expression of a trophinin related protein (Tastin) transcript detectable by SEQ ID NO: 1480 in a cancer sample is a non-cancerous sample (Sample Nos. 46-50, 90-93, 96-99, It was significantly higher than Table 2, "Tissue samples in test panel". Apparently, 6 out of 15 adenocarcinoma samples, 8 out of 16 squamous cell carcinoma samples, 2 out of 4 large cell carcinoma samples, 8 small cell carcinoma samples Overexpression of at least 5 fold was found in 8 of the

下記のように、これらの結果の有意性を検証するために、統計分析を適用した。   Statistical analysis was applied to verify the significance of these results as described below.

肺癌サンプル対正常肺サンプルにおける配列番号1480によって検出可能なトロフィニン関連タンパク質(タスチン)転写物の発現レベルの相違についてのP値は、T検定によって、1.61E−04と決定された。   The P value for the difference in expression levels of trophinin-related protein (Tastin) transcripts detectable by SEQ ID NO: 1480 in lung cancer samples versus normal lung samples was determined to be 1.61 E-04 by T-test.

5倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、1.49E−02であった。上記値は、結果が統計的に有意であることを示す。   The 5-fold overexpression threshold was found to be different between cancer and normal samples, and checked by Fisher's exact test, the P value was 1.49E-02. The above values indicate that the results are statistically significant.

本発明によれば、トロフィニン関連タンパク質(タスチン)は、肺癌診断用マーカーの非限定的な例である。本発明のトロフィニン関連タンパク質(タスチン)マーカーを、単独または組み合わせて、種々の用途(肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない)に使用することができる。このマーカーの過剰発現および/または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、NATベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、トロフィニン関連タンパク質(タスチン)と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:トロフィニン関連タンパク質(タスチン)−TAA−seg44−順方向プライマー(配列番号1478):AGACTCCAACCCACAGCCCトロフィニン関連タンパク質(タスチン)−TAA−seg44−逆方向プライマー(配列番号1479):CAGCTCAGCCAACCTTGCA。   According to the invention, trophinin-related protein (Tastin) is a non-limiting example of a marker for diagnosing lung cancer. The trophinin-related protein (Tastin) markers of the present invention, alone or in combination, have various uses (including but not limited to lung cancer prognosis, prediction, screening, early screening, treatment selection, and treatment monitoring) It can be used for Although optionally any method can be used to detect over-expression and / or differential expression of this marker, preferably, NAT-based technology is used. Thus, optional and more preferably, any nucleic acid molecule capable of selectively hybridizing to a trophinin related protein (Tastin), as defined above, is also included in the present invention. Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used only as non-limiting examples of suitable primer pairs: Troffinin-related protein (Tastin)- TAA-seg44-forward primer (SEQ ID NO: 1478): AGACTCCAACCCACAGCCC trofinin-related protein (Tastin) -TAA-seg44-reverse primer (SEQ ID NO: 1479): CAGCTC AGCCAACCTTGCA.

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:トロフィニン関連タンパク質(タスチン)アンプリコン、配列番号1480:AGACTCCAACCCACAGCCCAGCTGTGGCTGCACAGTGAGCCTGATGGGAGGTGGGGAACAGGGACAGGGGGCCACCTGGGCTTCTTCACAGAGAGGTCAGCAGGAAGGCTTGGCTACAGTGCAAGGTTGGCTGAGCTG。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : Troffinin related protein (Tastin) amplicon, SEQ ID NO: 1480: AGACTCCAACCCCACAGCCTGCGTGCACACAGTGAGCCTGATGGGAGGTGGGAACAGGGACAGGGGGCCACCTGGGCTGCTTCACAGAGGGTCAGCAGGAAGGCTTGGCTACAGTGCAAGGTTGGCTGAGCTTG.

本発明の他の好ましい実施形態によれば、トロフィニン関連タンパク質(タスチン)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号1485〜1488、1609、1610(例えば、変異型番号23〜26、31、32)に示すトロフィニン関連タンパク質(タスチン)スプライスバリアントまたはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、トロフィニン関連タンパク質(タスチン)のフラグメントは、セグメント_TAA−44−配列番号1507を含む。同様に、任意選択的およびより好ましくは、任意の適切な方法を、例えば、トロフィニン関連タンパク質(タスチン)_セグメント_TAA−44−配列番号1507などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのNATベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。   According to another preferred embodiment of the present invention, the trophinin-related protein (Tastin) or a fragment thereof comprises a biomarker for lung cancer detection. Optionally and more preferably, the trophinin-related protein (Tastin) splice variant or fragment thereof as set forth in SEQ ID NOs: 1485 to 1488, 1609, 1610 (eg, variants Nos. 23 to 26, 31, 32) Includes a marker. Optionally and more preferably, the fragment of trophinin related protein (Tastin) comprises the segment _TAA-44- SEQ ID NO: 1507. Similarly, optionally and more preferably, any suitable method can be used for detection of fragments such as, for example, trophinin related protein (Tastin) _segment_TAA-44- SEQ ID NO: 1507. Most preferably, NAT based technologies such as any nucleic acid molecule capable of specifically hybridizing with the fragment are used. Optionally and most preferably, primer pairs are used to obtain the fragments.

さらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、上記のトロフィニン関連タンパク質(タスチン)に対応する核酸配列によってコードされる任意のアミノ酸配列またはそのフラグメント(配列番号1492〜1501、1612が含まれるが、これらに限定されない)を含む。このようなアミノ酸配列またはそのフラグメントに対する任意のオリゴペプチドまたはペプチド(配列番号1508〜1511、1613に記載のこれらのタンパク質の固有のアミノ酸配列が含まれるが、これらに限定されない)も、任意選択的に(さらにまたは二者択一的に)、バイオマーカーとして使用することができる。本発明はまた、任意選択的に、このようなオリゴペプチドまたはペプチドを認識することができ、そして/またはこれらによって誘発することができる抗体を含む。   According to yet another preferred embodiment, the present invention optionally and preferably comprises any amino acid sequence encoded by the nucleic acid sequence corresponding to the trophinin related protein (Tastin) described above or a fragment thereof (SEQ ID NO: 1492 1501, 1612 are included, but not limited to). Optionally, any oligopeptide or peptide for such amino acid sequence or fragment thereof (including but not limited to the unique amino acid sequences of these proteins as set forth in SEQ ID NOS: 1508-151, 1613) (Also or alternatively) can be used as a biomarker. The invention also optionally includes antibodies capable of recognizing and / or eliciting such oligopeptides or peptides.

本発明はまた、任意選択的および好ましくは、任意選択的な任意の適用のための上記のトロフィニン関連タンパク質(タスチン)に対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。   The invention also optionally and preferably comprises any nucleic acid sequence corresponding to the above-described trophinin related protein (Tastin) for any optional application or a fragment or amino acid sequence or a fragment thereof.

正常および癌性肺組織における配列番号1512〜1514中に示すオリゴヌクレオチドによって検出可能なトロフィニン関連タンパク質(タスチン)(T86235)転写物の発現
オリゴヌクレオチド配列番号1512〜1514によって検出可能なトロフィニン関連タンパク質(タスチン)(T86235)転写物(例えば、配列番号1481〜1485、1488〜1491、1609、1611によって示される変異型番号8〜10、22、23、26、27、29〜31、33)の発現を、オリゴヌクレオチドベースのマイクロアレイによって測定した。配列番号1512〜1514に記載の上記オリゴヌクレオチドによって検出されたセグメントは、例えば、配列番号1503、1504、1506に記載のヌクレオチド配列である。
Expression of trophinin-related protein (Tastin) (T86235) transcript detectable by oligonucleotides as shown in SEQ ID NOs: 1512-1514 in normal and cancerous lung tissues Trophinin-related protein (Tastin) detectable by oligonucleotides SEQ ID NO: 1512-1514 ) (T86235) Transcripts (e.g. variants 8 to 10, 22, 23, 26, 27, 29 to 31, 33) as shown by SEQ ID NOs: 1481 to 1485, 1488 to 1491, 1609, 1611) Measured by oligonucleotide based microarray. The segments detected by the above-described oligonucleotides set forth in SEQ ID NOS: 1512-1514 are, for example, the nucleotide sequences set forth in SEQ ID NOS: 1503, 1504, 1506.

各フィーチャーの画像強度の結果を、チップ上の全フィーチャーの画像強度の90パーセンタイルにしたがって正規化した。次いで、チップ上の同一ヌクレオチドの複製物および同一サンプルの複製物のフィーチャー画像強度を平均化した。範囲外の結果を破棄した。   The image intensity results for each feature were normalized according to the 90th percentile of the image intensity of all features on the chip. The feature image intensities of duplicates of the same nucleotide and duplicates of the same sample on the chip were then averaged. Discarded out of range results.

各オリゴヌクレオチド(配列番号1512〜1514)のために、各サンプルについて決定したの平均化強度を、全正常サンプル(上記のサンプル番号48、50、90〜92、96〜99、表2、「試験パネル中の組織サンプル」)の平均化した強度で割って、平均化した正常サンプルに対する各サンプルの上方制御の倍率を得た。これらのデータを、図54bのヒストグラムに示す。図54bから明らかなように、癌サンプル中の配列番号1512〜1514のオリゴヌクレオチドを使用して検出可能なトロフィニン関連タンパク質(タスチン)(T86235)転写物の発現は、正常サンプルよりも有意に高かった。   For each oligonucleotide (SEQ ID NOs: 1512-1514), the averaged intensity determined for each sample is shown for all normal samples (Sample Nos. 48, 50, 90-92, 96-99 above, Table 2, "Test Divided by the averaged intensity of the tissue samples in the panel ") to obtain the upregulation magnification of each sample relative to the averaged normal sample. These data are shown in the histogram of FIG. 54b. As evident from FIG. 54 b, expression of trophinin-related protein (Tastin) (T86235) transcripts detectable using oligonucleotides of SEQ ID NOs: 1512-1514 in cancer samples was significantly higher than in normal samples .

本発明によれば、トロフィニン関連タンパク質(タスチン)は、肺癌診断用マーカーの非限定的な例である。このマーカーの過剰発現および/または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、NATベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、トロフィニン関連タンパク質(タスチン)と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。オリゴヌクレオチドも、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なオリゴヌクレオチドの制限されない例示のみとして以下のオリゴヌクレオチドを使用した:配列番号1512〜1514。   According to the invention, trophinin-related protein (Tastin) is a non-limiting example of a marker for diagnosing lung cancer. Although optionally any method can be used to detect over-expression and / or differential expression of this marker, preferably, NAT-based technology is used. Thus, optional and more preferably, any nucleic acid molecule capable of selectively hybridizing to a trophinin related protein (Tastin), as defined above, is also included in the present invention. Oligonucleotides are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following oligonucleotides were used as non-limiting examples of suitable oligonucleotides only: SEQ ID NOs: 1512-1514.


配列番号1512:CATGGTAACACGGCCTCCATGGCTGAGTAGGGGACTAGGAAGGGTAAAAG
配列番号1513:TGTACATCTAGGGCCTCTCAGTTAGGGGCTTCAATCCATTCCTCATGAGG
配列番号1514:TGTGAACACAAGAGGTCCTCACCTCACTGTGAGCTGCACACCTGCCCTGC

SEQ ID NO: 1512: CATGGTAACACGGCCTCCATGGCTGAGTAGGGGACTAGGAAGGGTAAAAG
SEQ ID NO: 1513: TGTACATCTAGGGCCTTCTAGTTAGGGGCTTCAATCCATTCCTCATGAGG
SEQ ID NO: 1514: TGTGAACACAAGAGGTCCTC ACCTC ACT GTGAGCTGCAACACCTGCCCTGC

本発明の他の好ましい実施形態によれば、トロフィニン関連タンパク質(タスチン)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号1481〜1485、1488〜1491、1609、1611(例えば、変異型番号8〜10、22、23、26、27、29〜31、33)に示すトロフィニン関連タンパク質(タスチン)スプライスバリアントまたはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、トロフィニン関連タンパク質(タスチン)のフラグメントは、セグメント_TAA−14、35、および42−配列番号1503、1504、1506を含む。同様に、任意選択的およびより好ましくは、任意の好ましい方法を、例えば、トロフィニン関連タンパク質(タスチン)_セグメント_TAA−14、35、および42−配列番号1503、1504、1506などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのNATベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。   According to another preferred embodiment of the present invention, the trophinin-related protein (Tastin) or a fragment thereof comprises a biomarker for lung cancer detection. Optionally and more preferably, a trophinin-related protein as shown in SEQ ID NO: 1481-1485, 1488-1491, 1609, 1611 (for example, variant Nos. 8-10, 22, 23, 26, 27, 29-31, 33) (Tastin) The splice variant or fragment thereof comprises a biomarker for lung cancer detection. Optionally and more preferably, fragments of trophinin related protein (Tastin) comprise the segments TAA-14, 35, and 42-SEQ ID NO: 1503, 1504, 1506. Similarly, optionally and more preferably, any preferred method, for example for the detection of fragments such as trophinin related protein (Tastin) _segment_TAA-14, 35, and 42-SEQ ID NO: 1503, 1504, 1506, etc. It can be used for Most preferably, NAT based technologies such as any nucleic acid molecule capable of specifically hybridizing with the fragment are used. Optionally and most preferably, primer pairs are used to obtain the fragments.

本発明の他の好ましい実施形態によれば、配列番号1502および1505に記載の固有のセグメントを含むトロフィニン関連タンパク質(タスチン)スプライスバリアント(例えば、変異型9および29に含まれるもの(それぞれ、配列番号1482および1490))は、肺癌検出用バイオマーカーとして有用である。   According to another preferred embodiment of the present invention, a trophinin-related protein (Tastin) splice variant comprising the unique segments as set forth in SEQ ID NOs: 1502 and 1505, such as those included in variants 9 and 29, respectively (SEQ ID NOs: 1482 and 1490) are useful as biomarkers for lung cancer detection.

本発明はまた、任意選択的および好ましくは、任意選択的な任意の適用のための上記のトロフィニン関連タンパク質(タスチン)に対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。   The invention also optionally and preferably comprises any nucleic acid sequence corresponding to the above-described trophinin related protein (Tastin) for any optional application or a fragment or amino acid sequence or a fragment thereof.

正常および癌性肺組織における配列番号1517中に示すアンプリコンによって検出可能なホメオボックスC10(HOXC10)(N31842)転写物の発現
配列番号1517によって検出可能なホメオボックスC10(HOXC10)転写物(例えば、配列番号1519によって示される変異型番号3)の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–配列番号1471)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–配列番号3)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–配列番号9)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–配列番号1477)の発現を同様に測定した。各RTサンプルのために、配列番号1517の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
Expression of Homeobox C10 (HOXC10) (N31842) Transcript Detectable by the Amplicon Shown in SEQ ID NO: 1517 in Normal and Cancerous Lung Tissues Homeobox C10 (HOXC10) Transcript Detectable by SEQ ID NO: 1517 (eg The expression of variant No. 3) represented by SEQ ID No. 1519 was determined by real time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – SEQ ID No. 1471), HPRT1 (GenBank Accession No. NM_000194, Amplicon – SEQ ID No. 3), Ubiquitin The expression of GenBank Accession No. BC000449, Amplicon <#8211; SEQ ID No. 9), and SDHA (GenBank Accession No. NM-004168, Amplicon >#8211; SEQ ID No: 1477) was similarly measured. For each RT sample, expression of SEQ ID NO: 1517 was normalized to the geometric mean of the housekeeping gene dose. The normalized amount of each RT sample is the center of the amount of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99 above, Table 2, "tissue samples in the test panel") Divide by the value to obtain the magnification of the upregulation of each sample relative to the median of normal PM samples.

図55は、正常サンプルに対する癌性肺組織における上記ホメオボックスC10(HOXC10)転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも20倍の過剰発現を示すサンプルの数および比率を、下に示す。   FIG. 55 is a histogram showing over expression of the homeobox C10 (HOXC10) transcript in cancerous lung tissue relative to a normal sample. The number and proportion of samples showing overexpression of at least 20 times of the total number of samples tested are shown below.

図55から明らかなように、癌サンプル中の配列番号1517によって検出可能なホメオボックスC10(HOXC10)転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、15個の腺癌サンプルのうちの6個、16個の扁平上皮細胞癌サンプルのうちの9個、および4個の大細胞癌サンプルのうちの3個で少なくとも20倍の過剰発現が見出された。   As evident from FIG. 55, the expression of homeobox C10 (HOXC10) transcripts detectable by SEQ ID NO: 1517 in cancer samples is a non-cancerous sample (Sample Nos. 46-50, 90-93, 96-99, It was significantly higher than Table 2, "Tissue samples in test panel". Apparently, at least 20-fold overexpression in 6 out of 15 adenocarcinoma samples, 9 out of 16 squamous cell carcinoma samples, and 3 out of 4 large cell carcinoma samples Was found.

下記のように、これらの結果の有意性を検証するために、統計分析を適用した。   Statistical analysis was applied to verify the significance of these results as described below.

肺癌サンプル対正常肺サンプルにおける配列番号1517によって検出可能なホメオボックスC10(HOXC10)転写物の発現レベルの相違についてのP値は、T検定によって、4.43E−03と決定された。   The P value for the difference in expression levels of homeobox C10 (HOXC10) transcripts detectable by SEQ ID NO: 1517 in lung cancer samples versus normal lung samples was determined to be 4.43E-03 by T-test.

20倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、2.88E−02であった。上記値は、結果が統計的に有意であることを示す。   The 20-fold overexpression threshold was found to be different between cancer and normal samples, and checked by Fisher's exact test, the P value was 2.88E-02. The above values indicate that the results are statistically significant.

本発明によれば、ホメオボックスC10(HOXC10)は、肺癌診断用マーカーの非限定的な例である。本発明のホメオボックスC10(HOXC10)マーカーを、単独または組み合わせて、種々の用途(肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない)に使用することができる。このマーカーの過剰発現および/または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、NATベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、ホメオボックスC10(HOXC10)と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した。   According to the present invention, homeobox C10 (HOXC10) is a non-limiting example of a marker for diagnosing lung cancer. Homeobox C10 (HOXC10) markers according to the invention, alone or in combination, for various uses, including but not limited to lung cancer prognosis, prognosis, screening, early screening, treatment selection, and treatment monitoring It can be used for Although optionally any method can be used to detect over-expression and / or differential expression of this marker, preferably, NAT-based technology is used. Thus, optional and more preferably, any nucleic acid molecule capable of selectively hybridizing to homeobox C10 (HOXC10) as defined above is also included in the present invention. Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used as non-limiting illustrations of suitable primer pairs only.


ホメオボックスC10(HOXC10)−順方向プライマー(配列番号1515):GCGAAACGCGATTTGTTGTTおよびホメオボックスC10(HOXC10)−逆方向プライマー(配列番号1516):CATCTGGAGGAGGGAGGGA

Homeobox C10 (HOXC10)-Forward primer (SEQ ID NO: 1515): GCGAAACGCCGATTTGTTTGTT and Homeobox C10 (HOXC10)-Reverse primer (SEQ ID NO: 1516): CATCTGGAGGAGGGAGGGA

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:ホメオボックスC10(HOXC10)アンプリコン(配列番号1517)。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : Homeobox C10 (HOXC10) amplicon (SEQ ID NO: 1517).


GCGAAACGCGATTTGTTGTTTGTGGGTCTGATTTGTGCGTGCGGCTTGGGCTCCTGCGGCTTTTGGCTCGGCCGGGGGCCTTGGGCAGCGAGGCTGGAGCCGGAAGAGGTGGAGGTGAAGGGCTGCCCGCCACGTCCCTCCCTCCTCCAGATG

GCGAAACGCGATTTGTTTGTTTGTGTGTGTGTGTGTGTGTGTGTGCGTGCGGGTGTGGGCTCCTGCGGCTTTGGCTGGGGCGGGGCTTGGGCAGCAGGACTGGAGCCGGAAGAGGTGGAGTGAAGGGCTGCCCAGCCTCCTCTCMTCGATC

本発明の他の好ましい実施形態によれば、ホメオボックスC10(HOXC10)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号54に記載のホメオボックスC10(HOXC10)スプライスバリアント(例えば、変異型番号3)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、ホメオボックスC10(HOXC10)のフラグメントは、セグメント_TAA−seg6(配列番号1526)を含む。同様に、任意選択的およびより好ましくは、任意の適切な方法を、例えば、ホメオボックスC10(HOXC10)_セグメント_TAA−seg6(配列番号1526)などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのNATベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。   According to another preferred embodiment of the present invention, homeobox C10 (HOXC10) or a fragment thereof comprises a biomarker for lung cancer detection. Optionally and more preferably, the homeobox C10 (HOXC10) splice variant (eg, variant no. 3) as set forth in SEQ ID NO: 54 or a fragment thereof comprises a biomarker for lung cancer detection. Optionally and more preferably, the fragment of homeobox C10 (HOXC10) comprises the segment _TAA-seg6 (SEQ ID NO: 1526). Similarly, optionally and more preferably, any suitable method can be used for the detection of fragments such as, for example, homeobox C10 (HOXC10) _segment_TAA-seg6 (SEQ ID NO: 1526). Most preferably, NAT based technologies such as any nucleic acid molecule capable of specifically hybridizing with the fragment are used. Optionally and most preferably, primer pairs are used to obtain the fragments.

本発明の他の好ましい実施形態によれば、配列番号1524および1525に記載の固有のセグメントを含むホメオボックスC10(HOXC10)スプライスバリアント(例えば、配列番号1515、1519、および1520に記載の転写物)は、肺癌検出用バイオマーカーを含む。   According to another preferred embodiment of the present invention, a homeobox C10 (HOXC10) splice variant comprising the unique segments as set forth in SEQ ID NOS: 1524 and 1525 (eg, transcripts as set forth in SEQ ID NOS: 1515, 1519, and 1520) Contains a biomarker for lung cancer detection.

さらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、上記のトロフィニン関連タンパク質(タスチン)に対応する核酸配列によってコードされる任意のアミノ酸配列またはフラグメント(配列番号1521および1522が含まれるが、これらに限定されない)を含む。このようなアミノ酸配列またはそのフラグメントに対する任意のオリゴペプチドまたはペプチド(配列番号1523に記載のタンパク質(配列番号1522)の固有のアミノ酸配列が含まれるが、これらに限定されない)も、任意選択的に、(さらにまたは二者択一的に)バイオマーカーとして使用することができる。本発明はまた、任意選択的に、このようなオリゴペプチドまたはペプチドを認識することができ、そして/またはこれらによって誘発することができる抗体を含む。   According to yet another preferred embodiment, the present invention optionally and preferably comprises any amino acid sequence or fragment encoded by the nucleic acid sequence corresponding to the trophinin related protein (Tastin) described above (SEQ ID NOs: 1521 and 1522 (Including but not limited to). Optionally, any oligopeptide or peptide to such amino acid sequence or fragment thereof, including but not limited to, the unique amino acid sequence of the protein set forth in SEQ ID NO: 1523 (SEQ ID NO: 1522) It can be used as a biomarker (additionally or alternatively). The invention also optionally includes antibodies capable of recognizing and / or eliciting such oligopeptides or peptides.

本発明はまた、任意選択的および好ましくは、任意選択的な任意の適用のための上記のトロフィニン関連タンパク質(タスチン)に対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。   The invention also optionally and preferably comprises any nucleic acid sequence corresponding to the above-described trophinin related protein (Tastin) for any optional application or a fragment or amino acid sequence or a fragment thereof.

正常および癌性肺組織における配列番号1529中に示すアンプリコンによって検出可能な核タンパク質4(NOL4)−(T06014)転写物の発現
配列番号1529によって検出可能な核タンパク質4(NOL4)転写物(例えば、配列番号1533、1537、1538によって示される変異型番号3、11、および12)の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–配列番号1471)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–配列番号1468)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–配列番号1474)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–配列番号1477)の発現を同様に測定した。各RTサンプルのために、配列番号1529の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
Expression of nucleoprotein 4 (NOL4)-(T06014) transcript detectable by an amplicon as shown in SEQ ID NO: 1529 in normal and cancerous lung tissue Nucleoprotein 4 (NOL4) transcript (eg, detectable by SEQ ID NO: 1529) , And the expression of mutant Nos. 3, 11 and 12) as shown by SEQ ID NOs: 1533, 1537, 1538, was measured by real-time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – SEQ ID No. 1471), HPRT1 (GenBank Accession No. NM_000194, Amplicon – SEQ ID No. 1468), Ubiquitin (Ubiquitin) The expression of GenBank Accession No. BC000449, Amplicon <#8211; SEQ ID No. 1474), and SDHA (GenBank Accession No. NM-004168, Amplicon >#8211; SEQ ID No: 1477) was similarly measured. For each RT sample, expression of SEQ ID NO: 1529 was normalized to the geometric mean of the housekeeping gene dose. The normalized amount of each RT sample is the center of the amount of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99 above, Table 2, "tissue samples in the test panel") Divide by the value to obtain the magnification of the upregulation of each sample relative to the median of normal PM samples.

図56aおよびbは、正常サンプルに対する癌性肺組織における上記核タンパク質4(NOL4)転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも200倍または6倍の過剰発現を示すサンプルの数および比率を、以下の図56aおよび56bにそれぞれ示す。   FIGS. 56 a and b are histograms showing over expression of the nuclear protein 4 (NOL4) transcript in cancerous lung tissue relative to normal samples. The number and proportion of samples exhibiting at least 200-fold or 6-fold overexpression of the total number of samples tested are shown in FIGS. 56a and 56b below, respectively.

図56aから明らかなように、肺小細胞癌由来のサンプル中の配列番号1529によって検出可能な核タンパク質4(NOL4)転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、8個の小細胞癌サンプルのうちの8個で少なくとも200倍の過剰発現が認められた。図56bから明らかなように、15個の腺癌サンプルのうちの2個、16個の扁平上皮細胞癌サンプルのうちの3個で少なくとも6倍の過剰発現が見出された。   As evident from FIG. 56a, expression of nucleoprotein 4 (NOL4) transcripts detectable by SEQ ID NO: 1529 in a sample from small cell lung cancer is a non-cancerous sample (samples 46-50, 90-93) , 96-99, Table 2, "Tissue Samples in Test Panels" were significantly higher. Clearly, at least 200-fold overexpression was observed in eight of the eight small cell carcinoma samples. As evident from FIG. 56b, at least 6-fold overexpression was found in 2 out of 15 adenocarcinoma samples and 3 out of 16 squamous cell carcinoma samples.

下記のように、これらの結果の有意性を検証するために、統計分析を適用した。   Statistical analysis was applied to verify the significance of these results as described below.

肺癌サンプル対正常肺サンプルにおける配列番号1529によって検出可能な核タンパク質4(NOL4)転写物の発現レベルの相違についてのP値は、T検定によって、1.36E−02と決定された。   The P value for the difference in expression levels of nuclear protein 4 (NOL4) transcripts detectable by SEQ ID NO: 1529 in lung cancer samples versus normal lung samples was determined by T-test to be 1.36E-02.

6倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、2.52E−02であった。   The 6-fold overexpression threshold was found to be different between cancer and normal samples, and checked by Fisher's exact test, the P value was 2.52E-02.

小細胞肺癌サンプル対正常肺サンプルにおける配列番号1529よって検出可能な核タンパク質4(NOL4)転写物の発現レベルの相違についてのP値は、T検定によって、3.86E−03と決定された。   The P value for the difference in expression levels of nuclear protein 4 (NOL4) transcripts detectable by SEQ ID NO: 1529 in small cell lung cancer samples versus normal lung samples was determined to be 3.86E-03 by T-test.

200倍過剰発現の閾値は、小細胞癌と正常肺サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、7.94E−06であった。上記値は、結果が統計的に有意であることを示す。   The 200-fold overexpression threshold was found to be different between small cell carcinoma and normal lung samples, and checked by Fisher's exact test, the P value was 7.94E-06. The above values indicate that the results are statistically significant.

本発明によれば、核タンパク質4(NOL4)は、肺癌診断用マーカーの非限定的な例である。本発明の核タンパク質4(NOL4)マーカーを、単独または組み合わせて、種々の用途(肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない)に使用することができる。このマーカーの過剰発現および/または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、NATベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、核タンパク質4(NOL4)と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した。   According to the invention, nucleoprotein 4 (NOL4) is a non-limiting example of a marker for diagnosing lung cancer. The nuclear protein 4 (NOL4) markers of the present invention, alone or in combination, have a variety of uses, including, but not limited to, lung cancer prognosis, prognosis, screening, early screening, treatment selection, and treatment monitoring It can be used for Although optionally any method can be used to detect over-expression and / or differential expression of this marker, preferably, NAT-based technology is used. Thus, optional and more preferably, any nucleic acid molecule capable of selectively hybridizing to nucleoprotein 4 (NOL4), as defined above, is also included in the present invention. Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used as non-limiting illustrations of suitable primer pairs only.


核タンパク質4(NOL4)−TAA−seg1−順方向プライマー(配列番号1527):CTCGCTCCCTTGCTCACACおよび核タンパク質4(NOL4)−TAA−seg1−逆方向プライマー(配列番号1528):AAAGGGAAAGCGGGATGTTT

Nucleoprotein 4 (NOL4)-TAA-seg 1-forward primer (SEQ ID NO: 1527): CTCGCTCCCTTTGCTCAACAC and nuclear protein 4 (NOL 4)-TAA-seg 1-reverse primer (SEQ ID NO: 1528): AAAGGGAAAGCGGGATGTTT

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:核タンパク質4(NOL4)アンプリコン(配列番号1529)。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : Nuclear protein 4 (NOL4) amplicon (SEQ ID NO: 1529).


CTCGCTCCCTTGCTCACACACACGCACACACTCAGCCTGGCCGAGCAGGAGCCACTGACCATTTTGCAAGTGTCAGGACCAGCTACAGCGCGGTGGGCGCAAACATCCCGCTTTCCCTTT

CTCGCTCCTGTTGCTCAACACACACGCACACACTCAGCACTCGGCGAGCAGGAGGCCACTGACCATTTTGCAAGTTCCAGGACCAGCTACAGCGCGGTGCGAAACATCCCGCTTCTCCTTT

本発明の他の好ましい実施形態によれば、核タンパク質4(NOL4)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号1529に記載の核タンパク質4(NOL4)スプライスバリアント(例えば、変異型番号3、11、および12)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、核タンパク質4(NOL4)のフラグメントは、セグメント_TAA−seg−1(配列番号1552)を含む。同様に、任意選択的およびより好ましくは、任意の適切な方法を、例えば、核タンパク質4(NOL4)_セグメント_TAA−seg−1(配列番号1552)などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのNATベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。   According to another preferred embodiment of the present invention, nucleoprotein 4 (NOL4) or a fragment thereof comprises a biomarker for lung cancer detection. Optionally and more preferably, the nucleoprotein 4 (NOL4) splice variant (eg, variants nos. 3, 11 and 12) set forth in SEQ ID NO: 1529 or fragments thereof comprise a biomarker for lung cancer detection. Optionally and more preferably, the fragment of nuclear protein 4 (NOL4) comprises the segment _TAA-seg-1 (SEQ ID NO: 1552). Similarly, optionally and more preferably, any suitable method may be used, for example, for the detection of fragments such as nucleoprotein 4 (NOL 4) _segment_TAA-seg-1 (SEQ ID NO: 1552) it can. Most preferably, NAT based technologies such as any nucleic acid molecule capable of specifically hybridizing with the fragment are used. Optionally and most preferably, primer pairs are used to obtain the fragments.

本発明の他の好ましい実施形態によれば、配列番号1554および1555に記載の固有のセグメントを含む核タンパク質4(NOL4)スプライスバリアント(例えば、配列番号1534〜1536および1539〜1541に記載の転写物)は、肺癌検出用バイオマーカーを含む。   According to another preferred embodiment of the present invention, a nucleoprotein 4 (NOL4) splice variant comprising the unique segment as set forth in SEQ ID NOS: 1554 and 1555 (eg, transcripts as set forth in SEQ ID NOS: 1534-1536 and 1539-1541) ) Includes biomarkers for lung cancer detection.

さらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、上記の核タンパク質4(NOL4)に対応する核酸配列によってコードされる任意のアミノ酸配列またはフラグメント(配列番号1542、1547、および1543ならびに1548、1545、1546、および1549〜1551が含まれるが、これらに限定されない)を含む。このようなアミノ酸配列またはそのフラグメントに対する任意のオリゴペプチドまたはペプチド(配列番号1544に記載のタンパク質(配列番号1543、1546、1549)の固有のアミノ酸配列が含まれるが、これらに限定されない)も、任意選択的に、(さらにまたは二者択一的に)バイオマーカーとして使用することができる。   According to yet another preferred embodiment, the present invention optionally and preferably comprises any amino acid sequence or fragment encoded by the nucleic acid sequence corresponding to the nucleoprotein 4 (NOL4) described above (SEQ ID NO: 1542, 1547) And 1543 and 1548, 1545, 1546, and 1549-1551 are included, but not limited to). Also, any oligopeptide or peptide for such amino acid sequence or fragment thereof (including but not limited to the unique amino acid sequence of the protein described in SEQ ID NO: 1544 (SEQ ID NO: 1543, 1546, 1549)) Optionally, it can be used as a biomarker (additionally or alternatively).

本発明はまた、任意選択的に、このようなオリゴペプチドまたはペプチドを認識することができ、そして/またはこれらによって誘発することができる抗体を含む。   The invention also optionally includes antibodies capable of recognizing and / or eliciting such oligopeptides or peptides.

本発明はまた、任意選択的および好ましくは、任意選択的な任意の適用のための上記の核タンパク質4(NOL4)に対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。   The invention also includes optional and preferably any nucleic acid sequence corresponding to nucleoprotein 4 (NOL4) described above for optional and optional application, or a fragment or amino acid sequence or fragment thereof.

正常および癌性肺組織における配列番号1532中に示すアンプリコンによって検出可能な核タンパク質4(NOL4)−(T06014)転写物の発現
配列番号1532によって検出可能な核タンパク質4(NOL4)転写物(例えば、配列番号1533、1537、1538によって示される変異型番号3、11、および12)の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–配列番号1471)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–配列番号1468)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–配列番号1474)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–配列番号1481)の発現を同様に測定した。各RTサンプルのために、配列番号1532の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
Expression of nucleoprotein 4 (NOL 4)-(T06014) transcript detectable by an amplicon as shown in SEQ ID NO: 1532 in normal and cancerous lung tissue Nucleoprotein 4 (NOL 4) transcript (eg, detectable by SEQ ID NO: 1532) , And the expression of mutant Nos. 3, 11 and 12) as shown by SEQ ID NOs: 1533, 1537, 1538, was measured by real-time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – SEQ ID No. 1471), HPRT1 (GenBank Accession No. NM_000194, Amplicon – SEQ ID No. 1468), Ubiquitin (Ubiquitin) The expression of GenBank Accession No. BC000449, Amplicon <#8211; SEQ ID No. 1474), and SDHA (GenBank Accession No. NM-004168, Amplicon >#8211; SEQ ID No. 1481) was similarly measured. For each RT sample, expression of SEQ ID NO: 1532 was normalized to the geometric mean of the housekeeping gene dose. The normalized amount of each RT sample is the center of the amount of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99 above, Table 2, "tissue samples in the test panel") Divide by the value to obtain the magnification of the upregulation of each sample relative to the median of normal PM samples.

図57aおよびbは、正常サンプルに対する癌性肺組織における上記核タンパク質4(NOL4)転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも400倍または6倍の過剰発現を示すサンプルの数および比率を、以下の図57aおよび56bにそれぞれ示す。   Figures 57a and b are histograms showing the overexpression of the nuclear protein 4 (NOL4) transcript in cancerous lung tissue relative to normal samples. The number and proportion of samples exhibiting at least 400-fold or 6-fold overexpression of the total number of samples tested are shown in FIGS. 57a and 56b below, respectively.

図57aから明らかなように、肺小細胞癌由来のサンプル中の配列番号1532によって検出可能な核タンパク質4(NOL4)転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、8個の小細胞癌サンプルのうちの8個で少なくとも400倍の過剰発現が認められた。図4bから明らかなように、15個の腺癌サンプルのうちの4個、16個の扁平上皮細胞癌サンプルのうちの3個で少なくとも6倍の過剰発現が見出された。   As evident from FIG. 57a, expression of nucleoprotein 4 (NOL4) transcripts detectable by SEQ ID NO: 1532 in a sample from small cell lung cancer, non-cancerous samples (samples 46-50, 90-93) , 96-99, Table 2, "Tissue Samples in Test Panels" were significantly higher. Clearly, at least 400-fold overexpression was observed in eight of the eight small cell carcinoma samples. As apparent from FIG. 4 b, at least 6-fold overexpression was found in 4 out of 15 adenocarcinoma samples and 3 out of 16 squamous cell carcinoma samples.

下記のように、これらの結果の有意性を検証するために、統計分析を適用した。   Statistical analysis was applied to verify the significance of these results as described below.

肺癌サンプル対正常肺サンプルにおける配列番号1532によって検出可能な核タンパク質4(NOL4)転写物の発現レベルの相違についてのP値は、T検定によって、1.70E−02と決定された。   The P value for the difference in expression levels of nuclear protein 4 (NOL4) transcripts detectable by SEQ ID NO: 1532 in lung cancer samples versus normal lung samples was determined to be 1.70E-02 by T-test.

6倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、1.80E−02であった。   The 6-fold overexpression threshold was found to be different between cancer and normal samples, and checked by Fisher's exact test, the P value was 1.80E-02.

小細胞肺癌サンプル対正常肺サンプルにおける配列番号1532よって検出可能な核タンパク質4(NOL4)転写物の発現レベルの相違についてのP値は、T検定によって、7.08E−03と決定された。   The P value for the difference in expression levels of nuclear protein 4 (NOL4) transcripts detectable by SEQ ID NO: 1532 in small cell lung cancer samples versus normal lung samples was determined to be 7.08E-03 by T-test.

400倍過剰発現の閾値は、小細胞癌と正常肺サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、1.03E−04であった。上記値は、結果が統計的に有意であることを示す。   The 400-fold overexpression threshold was found to differ between small cell carcinoma and normal lung samples, and checked by Fisher's exact test, the P value was 1.03E-04. The above values indicate that the results are statistically significant.

本発明によれば、核タンパク質4(NOL4)は、肺癌診断用マーカーの非限定的な例である。本発明の核タンパク質4(NOL4)マーカーを、単独または組み合わせて、種々の用途(肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない)に使用することができる。このマーカーの過剰発現および/または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、NATベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、核タンパク質4(NOL4)と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した。   According to the invention, nucleoprotein 4 (NOL4) is a non-limiting example of a marker for diagnosing lung cancer. The nuclear protein 4 (NOL4) markers of the present invention, alone or in combination, have a variety of uses, including, but not limited to, lung cancer prognosis, prognosis, screening, early screening, treatment selection, and treatment monitoring It can be used for Although optionally any method can be used to detect over-expression and / or differential expression of this marker, preferably, NAT-based technology is used. Thus, optional and more preferably, any nucleic acid molecule capable of selectively hybridizing to nucleoprotein 4 (NOL4), as defined above, is also included in the present invention. Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used as non-limiting illustrations of suitable primer pairs only.


核タンパク質4(NOL4)–TAA−seg3−順方向プライマー(配列番号1530):ACATCCCCCTGGAACGGATおよび核タンパク質4(NOL4)−TAA−seg3−逆方向プライマー(配列番号1531):CAGAAATTAGCAAAGCATTGATGG

Nuclear protein 4 (NOL4) – TAA-seg3-forward primer (SEQ ID NO: 1530): ACATCC CCCTGGAACGGAT and nuclear protein 4 (NOL 4)-TAA-seg3-reverse primer (SEQ ID NO: 1531): CAGAAATTAGCAAGACATTGATGG

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:核タンパク質4(NOL4)アンプリコン(配列番号1532)。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : Nuclear protein 4 (NOL4) amplicon (SEQ ID NO: 1532).


ACATCCCCCTGGAACGGATATCTGTTTGGGGCACTACAATCTATCCTGTAGAACTATGGCCAAATCTCCATCAATGCTTTGCTAATTTCTG

ACATCC CCCTGGAACGGATATCTGTTTGGGGCACTACAATCTATCCTGTAGAACTAGTGCAAATCTCCATCAATGCTTTGCTAATTTCTG

本発明の他の好ましい実施形態によれば、核タンパク質4(NOL4)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号1533、1537、1538に記載の核タンパク質4(NOL4)スプライスバリアント(例えば、変異型番号3、11、12)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、核タンパク質4(NOL4)のフラグメントは、セグメント_TAA−seg−3(配列番号1553)を含む。同様に、任意選択的およびより好ましくは、任意の適切な方法を、例えば、核タンパク質4(NOL4)_セグメント_TAA−seg−3(配列番号1553)などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのNATベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。   According to another preferred embodiment of the present invention, nucleoprotein 4 (NOL4) or a fragment thereof comprises a biomarker for lung cancer detection. Optionally and more preferably, the nucleoprotein 4 (NOL4) splice variant (e.g. variants nos. 3, 11, 12) as set forth in SEQ ID NOs: 1533, 1537, 1538 or fragments thereof comprise a biomarker for detecting lung cancer . Optionally and more preferably, the fragment of nuclear protein 4 (NOL4) comprises the segment _TAA-seg-3 (SEQ ID NO: 1553). Similarly, optionally and more preferably, any suitable method may be used, for example, for the detection of fragments such as nucleoprotein 4 (NOL 4) _segment_TAA-seg-3 (SEQ ID NO: 1553) it can. Most preferably, NAT based technologies such as any nucleic acid molecule capable of specifically hybridizing with the fragment are used. Optionally and most preferably, primer pairs are used to obtain the fragments.

さらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、上記の核タンパク質4(NOL4)に対応する核酸配列によってコードされる任意のアミノ酸配列またはフラグメント(配列番号1542、1547、および1548が含まれるが、これらに限定されない)を含む。このようなアミノ酸配列またはそのフラグメントに対する任意のオリゴペプチドまたはペプチドも、任意選択的に、(さらにまたは二者択一的に)バイオマーカーとして使用することができる。   According to yet another preferred embodiment, the present invention optionally and preferably comprises any amino acid sequence or fragment encoded by the nucleic acid sequence corresponding to the nucleoprotein 4 (NOL4) described above (SEQ ID NO: 1542, 1547) , And 1548, but is not limited thereto). Any oligopeptide or peptide to such an amino acid sequence or a fragment thereof can optionally also be used as a biomarker (additionally or alternatively).

本発明はまた、任意選択的に、このようなオリゴペプチドまたはペプチドを認識することができ、そして/またはこれらによって誘発することができる抗体を含む。   The invention also optionally includes antibodies capable of recognizing and / or eliciting such oligopeptides or peptides.

本発明はまた、任意選択的および好ましくは、任意選択的な任意の適用のための上記の核タンパク質4(NOL4)に対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。   The invention also includes optional and preferably any nucleic acid sequence corresponding to nucleoprotein 4 (NOL4) described above for optional and optional application, or a fragment or amino acid sequence or fragment thereof.

正常および癌性肺組織における配列番号1558中に示すアンプリコンによって検出可能なAA281370転写物の発現
肺癌中に過剰発現されたAA281370遺伝子を、上記の計算過程によって同定した。AA281370コードタンパク質(配列番号1563、1564)は、広範な種々の機能を対象とする多数の真核生物タンパク質中で見出されるいくつかのWD40ドメインを含む(シグナル伝達、プレmRNAプロセシング、および細胞骨格アセンブリにおけるアダプター分子および/または調節分子が含まれる)。図63に示すように、配列番号1564に示すAA281370コードタンパク質のWD43ドメイン領域はいくらか類似しており、シグナル伝達MAPK経路への関与が示唆され得る。例えば、40〜790位のアミノ酸の間に存在するAA281370ポリペプチド(配列番号1564)の領域は、マウスMapkbp1タンパク質(gi|47124622)のWDドメイン領域と75%相同であり(図63a)、AA281370ポリペプチド(配列番号1564)の40〜886位のアミノ酸は、ラットJNK結合タンパク質JNKBP1(gi|34856717)と70%相同である(図63b)。
Expression of the AA281370 Transcript Detectable by the Amplicon Shown in SEQ ID NO: 1558 in Normal and Cancerous Lung Tissues The AA281370 gene overexpressed in lung cancer was identified by the above calculation process. The AA281370-encoding protein (SEQ ID NO: 1563, 1564) contains several WD40 domains found in a number of eukaryotic proteins that cover a wide variety of functions (signal transduction, pre-mRNA processing, and cytoskeleton assembly Adapter molecules and / or regulatory molecules). As shown in FIG. 63, the WD43 domain region of the AA281370 encoding protein shown in SEQ ID NO: 1564 is somewhat similar, which may suggest involvement in the signal transduction MAPK pathway. For example, the region of the AA281370 polypeptide (SEQ ID NO: 1564) present between amino acids 40-790 is 75% homologous to the WD domain region of mouse Mapkbp1 protein (gi | 47124622) (FIG. 63a); The amino acids 40-886 of the peptide (SEQ ID NO: 1564) are 70% homologous to the rat JNK binding protein JNKBP1 (gi | 34856717) (FIG. 63 b).

配列番号1558によって検出可能なAA281370転写物(例えば、配列番号1559〜1562中に示される変異型番号0、1、4、および5)の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–配列番号1471)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–配列番号1468)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–配列番号1474)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–配列番号1477)の発現を同様に測定した。各RTサンプルのために、配列番号1558の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。   The expression of AA281370 transcripts detectable by SEQ ID NO: 1558 (e.g., variant nos. 0, 1, 4 and 5 as shown in SEQ ID NO: 1559-562) was measured by real time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – SEQ ID No. 1471), HPRT1 (GenBank Accession No. NM_000194, Amplicon – SEQ ID No. 1468), Ubiquitin (Ubiquitin) The expression of GenBank Accession No. BC000449, Amplicon <#8211; SEQ ID No. 1474), and SDHA (GenBank Accession No. NM-004168, Amplicon > #8211; SEQ ID No: 1477) was similarly measured. For each RT sample, the expression of SEQ ID NO: 1558 was normalized to the geometric mean of the housekeeping gene dose. The normalized amount of each RT sample is the center of the amount of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99 above, Table 2, "tissue samples in the test panel") Divide by the value to obtain the magnification of the upregulation of each sample relative to the median of normal PM samples.

図58は、正常サンプルに対する癌性肺組織における上記AA281370転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも6倍の過剰発現を示すサンプルの数および比率を、以下に示す。   FIG. 58 is a histogram showing over expression of the AA281370 transcript in cancerous lung tissue relative to normal samples. The number and proportion of samples showing at least 6-fold overexpression of the total number of samples tested is shown below.

図58から明らかなように、癌サンプル中の配列番号1558によって検出可能なAA281370転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、8個の小細胞癌サンプルのうちの8個、16個の扁平上皮細胞癌サンプルのうちの2個、4個の大細胞癌サンプルのうちの1個で少なくとも6倍の過剰発現が見出された。   As evident from FIG. 58, expression of the AA281370 transcript detectable by SEQ ID NO: 1558 in a cancer sample was determined by the non-cancerous sample (Sample Nos. 46-50, 90-93, 96-99, Table 2, “Test Tissue samples in the panel ") were significantly higher. Apparently, at least 6-fold overexpression in 8 out of 8 small cell carcinoma samples, 2 out of 16 squamous cell carcinoma samples, 1 out of 4 large cell carcinoma samples Was found.

下記のように、これらの結果の有意性を検証するために、統計分析を適用した。   Statistical analysis was applied to verify the significance of these results as described below.

肺癌サンプル対正常肺サンプルにおける配列番号1558によって検出可能なAA281370転写物の発現レベルの相違についてのP値は、T検定によって、8.58E−07と決定された。   The P value for the difference in expression levels of AA281370 transcripts detectable by SEQ ID NO: 1558 in lung cancer samples versus normal lung samples was determined to be 8.58E-07 by T-test.

6倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、4.81E−02であった。   The 6-fold overexpression threshold was found to be different between cancer and normal samples, and checked by Fisher's exact test, the P value was 4.81 E-02.

上記値は、結果が統計的に有意であることを示す。   The above values indicate that the results are statistically significant.

本発明によれば、AA281370転写物は、肺癌診断用マーカーの非限定的な例である。本発明のAA281370マーカーを、単独または組み合わせて、種々の用途(肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない)に使用することができる。このマーカーの過剰発現および/または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、NATベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、AA281370と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した。   According to the invention, the AA 281 370 transcript is a non-limiting example of a marker for diagnosing lung cancer. The use of the AA 281 370 markers of the invention, alone or in combination, for various uses, including, but not limited to, lung cancer prognosis, prognosis, screening, early screening, treatment selection, and treatment monitoring it can. Although optionally any method can be used to detect over-expression and / or differential expression of this marker, preferably, NAT-based technology is used. Thus, optional and more preferably, any nucleic acid molecule capable of selectively hybridizing to AA 281 370, as defined above, is also included in the present invention. Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used as non-limiting illustrations of suitable primer pairs only.


AA281370−順方向プライマー(配列番号1556):GGTTCGGATGGACTACACTTTGTC;およびAA281370−逆方向プライマー(配列番号1557): CCACGTACTTCTGGGTGATGTC

AA 281 370-Forward primer (SEQ ID NO: 1556): GGTTCGGATGGACTACACTTTGTC; and AA 281 370-Reverse primer (SEQ ID NO: 1557): CCACGTACTTCTGGGTGATGTC

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:AA281370アンプリコン(配列番号1558)。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : AA 281 370 amplicon (SEQ ID NO: 1558).


AA281370−アンプリコン(配列番号1558):GGTTCGGATGGACTACACTTTGTCCGTACCCACCACGTAGCAGAGAAAACCACCTTGTATGACATGGACATTGACATCACCCAGAAGTACGTGG

AA 281 370-Amplicon (SEQ ID NO: 1558): GGTTCGGATGGACTACACTTTTGTCCGTACCCACCACGTAGCAGAGAAAACCACCTTTGATGACATGGACATTGACATCACCCAGAAGTACGTGG

本発明の他の好ましい実施形態によれば、AA281370またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号1558に記載のAA281370スプライスバリアント(例えば、変異型番号0、1、4、および5)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、AA281370のフラグメントは、セグメント_TAA−seg10(配列番号1567)を含む。同様に、任意選択的およびより好ましくは、任意の適切な方法を、例えば、AA281370_セグメント_TAA−seg10(配列番号1567)などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのNATベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。   According to another preferred embodiment of the present invention, AA281370 or a fragment thereof comprises a biomarker for lung cancer detection. Optionally and more preferably, the AA281370 splice variant (eg, variants nos. 0, 1, 4 and 5) set forth in SEQ ID NO: 1558 or fragments thereof comprise a biomarker for lung cancer detection. Optionally and more preferably, the fragment of AA281370 comprises the segment _TAA-seg10 (SEQ ID NO: 1567). Similarly, optionally and more preferably, any suitable method can be used for detection of fragments such as, for example, AA281370_segment_TAA-seg10 (SEQ ID NO: 1567). Most preferably, NAT based technologies such as any nucleic acid molecule capable of specifically hybridizing with the fragment are used. Optionally and most preferably, primer pairs are used to obtain the fragments.

他の好ましい実施形態によれば、本発明はまた、任意選択的およびより好ましくは、配列番号1568に記載の固有のセグメントを含むAA281370スプライスバリアント(例えば、配列番号1561および1562に記載の転写物)は、肺癌検出用バイオマーカーを含む。   According to another preferred embodiment, the present invention also optionally and more preferably an AA 281 370 splice variant comprising a unique segment as set forth in SEQ ID NO: 1568 (eg, transcripts as set forth in SEQ ID NOs: 1561 and 1562) Contains a biomarker for lung cancer detection.

さらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、上記のAA281370に対応する核酸配列によってコードされる任意のアミノ酸配列またはフラグメント(配列番号1563〜1566が含まれるが、これらに限定されない)を含む。このようなアミノ酸配列またはそのフラグメントに対する任意のオリゴペプチドまたはペプチド(配列番号1569、1570、および1571に記載のタンパク質(配列番号1563〜1566)の固有のアミノ酸配列が含まれるが、これらに限定されない)も、任意選択的に、(さらにまたは二者択一的に)バイオマーカーとして使用することができる。   According to yet another preferred embodiment, the present invention optionally and preferably comprises any amino acid sequence or fragment encoded by the nucleic acid sequence corresponding to AA 281 370 described above (SEQ ID NOs: 1563-1566, Not limited thereto). Any oligopeptide or peptide for such amino acid sequence or fragment thereof (including but not limited to the unique amino acid sequence of the proteins set forth in SEQ ID NOS: 1569, 1570, and 1571 (SEQ ID NOS: 1563-1566)) Also, optionally, it can be used as a biomarker (also or alternatively).

本発明はまた、任意選択的に、このようなオリゴペプチドまたはペプチドを認識することができ、そして/またはこれらによって誘発することができる抗体を含む。   The invention also optionally includes antibodies capable of recognizing and / or eliciting such oligopeptides or peptides.

本発明はまた、任意選択的および好ましくは、任意選択的な任意の適用のための上記のAA281370に対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。   The present invention also includes optional and preferably any nucleic acid sequence corresponding to AA 281 370 described above for optional optional applications or fragments or amino acid sequences or fragments thereof.

正常および癌性肺組織における配列番号1574中に示すアンプリコンによって検出可能なスルファターゼ1(SULF1)−(Z21368)転写物の発現
SULF1は、細胞外基質中で見出される分泌タンパク質である。SULF1は、多数の上皮癌型で下方制御されることが公知である。
Expression of Sulfatase 1 (SULF1)-(Z21 368) Transcript Detectable by the Amplicon Shown in SEQ ID NO: 1574 in Normal and Cancerous Lung Tissues SULF 1 is a secreted protein found in extracellular matrix. SULF1 is known to be downregulated in many epithelial cancer types.

配列番号1574によって検出可能なスルファターゼ1(SULF1)転写物(例えば、配列番号1578、1579中に示される変異型番号13および14)の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–配列番号1471)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–配列番号1468)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–配列番号1474)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–配列番号1477)の発現を同様に測定した。各RTサンプルのために、配列番号1574の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。   The expression of sulfatase 1 (SULF1) transcripts detectable by SEQ ID NO: 1574 (eg SEQ ID NO: 1578, variant nos. 13 and 14 shown in 1579) was measured by real time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – SEQ ID No. 1471), HPRT1 (GenBank Accession No. NM_000194, Amplicon – SEQ ID No. 1468), Ubiquitin (Ubiquitin) The expression of GenBank Accession No. BC000449, Amplicon <#8211; SEQ ID No. 1474), and SDHA (GenBank Accession No. NM-004168, Amplicon > #8211; SEQ ID No: 1477) was similarly measured. For each RT sample, expression of SEQ ID NO: 1574 was normalized to the geometric mean of the housekeeping gene dose. The normalized amount of each RT sample is the center of the amount of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99 above, Table 2, "tissue samples in the test panel") Divide by the value to obtain the magnification of the upregulation of each sample relative to the median of normal PM samples.

図59は、正常サンプルに対する癌性肺組織における上記スルファターゼ1(SULF1)転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも8倍の過剰発現を示すサンプルの数および比率を、以下に示す。   FIG. 59 is a histogram showing over expression of the above-mentioned sulfatase 1 (SULF1) transcript in cancerous lung tissue relative to a normal sample. The number and proportion of samples showing at least 8 times overexpression of the total number of samples tested is shown below.

図59から明らかなように、非細胞癌由来の癌サンプル中の配列番号1574によって検出可能なスルファターゼ1(SULF1)転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、15個の腺癌サンプルのうちの11個、16個の扁平上皮細胞癌サンプルのうちの11個、4個の大細胞癌サンプルのうちの4個で少なくとも8倍の過剰発現が見出された。   As evident from FIG. 59, the expression of sulfatase 1 (SULF1) transcript detectable by SEQ ID NO: 1574 in cancer samples from non-cellular cancer is a non-cancerous sample (Sample Nos. 46-50, 90-93, 96-99, Table 2, "Tissue samples in test panel" were significantly higher. Apparently, at least 8-fold overexpression is observed in 11 out of 15 adenocarcinoma samples, 11 out of 16 squamous cell carcinoma samples, 4 out of 4 large cell carcinoma samples It was found.

下記のように、これらの結果の有意性を検証するために、統計分析を適用した。   Statistical analysis was applied to verify the significance of these results as described below.

肺癌サンプル対正常肺サンプルにおける配列番号1574によって検出可能なスルファターゼ1(SULF1)転写物の発現レベルの相違についてのP値は、T検定によって、3.18E−07と決定された。   The P value for the difference in expression levels of sulfatase 1 (SULF1) transcripts detectable by SEQ ID NO: 1574 in lung cancer samples versus normal lung samples was determined to be 3.18E-07 by T-test.

8倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、1.18E−04であった。   The 8-fold overexpression threshold was found to differ between cancer and normal samples, and checked by Fisher's exact test, the P value was 1.18E-04.

上記値は、結果が統計的に有意であることを示す。   The above values indicate that the results are statistically significant.

本発明によれば、スルファターゼ1(SULF1)は、肺癌診断用マーカーの非限定的な例である。本発明のスルファターゼ1(SULF1)マーカーを、単独または組み合わせて、種々の用途(肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない)に使用することができる。このマーカーの過剰発現および/または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、NATベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、スルファターゼ1(SULF1)と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した。   According to the invention, sulfatase 1 (SULF1) is a non-limiting example of a marker for diagnosing lung cancer. The sulfatase 1 (SULF1) markers of the present invention, alone or in combination, have a variety of uses, including but not limited to lung cancer prognosis, prognosis, screening, early screening, treatment selection, and treatment monitoring. It can be used. Although optionally any method can be used to detect over-expression and / or differential expression of this marker, preferably, NAT-based technology is used. Thus, optional and more preferably, any nucleic acid molecule capable of selectively hybridizing to sulfatase 1 (SULF1), as defined above, is also included in the present invention. Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used as non-limiting illustrations of suitable primer pairs only.

スルファターゼ1(SULF1)−順方向プライマー(配列番号1572):ACTCACTCAGAGACTAACACAAAGGAAGおよびスルファターゼ1(SULF1)−逆方向プライマー(配列番号1573):AGTATGGGAAGAATTTACTGGTCACA   Sulfatase 1 (SULF1)-Forward primer (SEQ ID NO: 1572): ACTCACTCAGAGACTACACACAAGGAAG and sulfatase 1 (SULF1)-reverse primer (SEQ ID NO: 1573): AGTATGGGAAGAATT TACTTGTCCAA

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:スルファターゼ1(SULF1)アンプリコン(配列番号1574)。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : Sulfatase 1 (SULF1) amplicon (SEQ ID NO: 1574).

ACTCACTCAGAGACTAACACAAAGGAAGTAATTTCTTACCTGGTCATTATTTAGTCTACAATAAGTTCATCCTTCTTCAGTGTGACCAGTAAATTCTTCCCATACT   ACTCACTCAGAGACTAACAACAAAGGA AGTAATTTCTTACCTGGTCATTATTTAGTCTACAATAAGTTCATCCTTCTTCAGTGTGACCAGTAAATTCTTCCCATACT

本発明の他の好ましい実施形態によれば、スルファターゼ1(SULF1)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号1578、1579に記載のスルファターゼ1(SULF1)スプライスバリアント(例えば、変異型番号13および14)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、スルファターゼ1(SULF1)のフラグメントは、セグメント_TAA−seg5(配列番号1587)を含む。同様に、任意選択的およびより好ましくは、任意の適切な方法を、例えば、スルファターゼ1(SULF1)_セグメント_TAA−seg5(配列番号1857)などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのNATベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。   According to another preferred embodiment of the present invention, sulfatase 1 (SULF1) or a fragment thereof comprises a biomarker for lung cancer detection. Optionally and more preferably, the sulfatase 1 (SULF1) splice variant (eg, variants nos. 13 and 14) as set forth in SEQ ID NO: 1578, 1579 or fragments thereof comprise a biomarker for lung cancer detection. Optionally and more preferably, the fragment of sulfatase 1 (SULF1) comprises the segment _TAA-seg5 (SEQ ID NO: 1587). Similarly, optionally and more preferably, any suitable method can be used for detection of fragments such as, for example, sulfatase 1 (SULF1) _segment_TAA-seg5 (SEQ ID NO: 1857). Most preferably, NAT based technologies such as any nucleic acid molecule capable of specifically hybridizing with the fragment are used. Optionally and most preferably, primer pairs are used to obtain the fragments.

本発明の他の好ましい実施形態によれば、配列番号1588、1591に記載の固有のセグメントを含むスルファターゼ1(SULF1)スプライスバリアント(例えば、配列番号1575〜1577に記載の転写物)は、肺癌検出用バイオマーカーを含む。   According to another preferred embodiment of the present invention, a sulfatase 1 (SULF1) splice variant comprising the unique segment according to SEQ ID NO: 1588, 1591 (e.g. the transcript according to SEQ ID NO: 1575 to 1577) detects lung cancer For the use of biomarkers.

さらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、上記のスルファターゼ1(SULF1)に対応する核酸配列によってコードされる任意のアミノ酸配列またはフラグメント(配列番号1586、1580、1582、1584が含まれるが、これらに限定されない)を含む。このようなアミノ酸配列またはそのフラグメントに対する任意のオリゴペプチドまたはペプチド(それぞれ、配列番号1581、1583、および1585に記載のタンパク質(配列番号1580、1582、1584)の固有のアミノ酸配列が含まれるが、これらに限定されない)も、任意選択的に、(さらにまたは二者択一的に)バイオマーカーとして使用することができる。   According to yet another preferred embodiment, the present invention optionally and preferably comprises any amino acid sequence or fragment encoded by the nucleic acid sequence corresponding to the above-mentioned sulfatase 1 (SULF1) (SEQ ID NO: 1586, 1580, 1582 (including but not limited to 1584). These include the unique amino acid sequences of any of the oligopeptides or peptides for such amino acid sequences or fragments thereof (SEQ ID NOS: 1581, 1583 and 1585 respectively (SEQ ID NOs: 1580, 1582 and 1584) respectively Can also be optionally used (or additionally) as a biomarker.

本発明はまた、任意選択的に、このようなオリゴペプチドまたはペプチドを認識することができ、そして/またはこれらによって誘発することができる抗体を含む。   The invention also optionally includes antibodies capable of recognizing and / or eliciting such oligopeptides or peptides.

本発明はまた、任意選択的および好ましくは、任意選択的な任意の適用のための上記の核タンパク質4(NOL4)に対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。   The invention also includes optional and preferably any nucleic acid sequence corresponding to nucleoprotein 4 (NOL4) described above for optional and optional application, or a fragment or amino acid sequence or fragment thereof.

正常および癌性肺組織における配列番号1594中に示すアンプリコンによって検出可能なSRY(性決定領域Y)−ボックス2(SOX2))−(HUMHMGBOX)転写物の発現
配列番号1594によって検出可能なSOX2転写物(例えば、配列番号1595によって示される変異型番号0)の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–配列番号1471)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–配列番号1468)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–配列番号1474)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–配列番号1477)の発現を同様に測定した。各RTサンプルのために、配列番号1594の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
Expression of SRY (Gesity Determining Area Y)-Box 2 (SOX 2)-(HUMHMGBOX) Transcript Detectable by the Amplicon Shown in SEQ ID NO: 1594 in Normal and Cancerous Lung Tissues SOX 2 Transcription Detectable by SEQ ID NO: 1594 Expression of the product (eg, variant No. 0 as shown by SEQ ID NO: 1595) was measured by real-time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – SEQ ID No. 1471), HPRT1 (GenBank Accession No. NM_000194, Amplicon – SEQ ID No. 1468), Ubiquitin (Ubiquitin) The expression of GenBank Accession No. BC000449, Amplicon <#8211; SEQ ID No. 1474), and SDHA (GenBank Accession No. NM-004168, Amplicon >#8211; SEQ ID No: 1477) was similarly measured. For each RT sample, expression of SEQ ID NO: 1594 was normalized to the geometric mean of housekeeping gene amounts. The normalized amount of each RT sample is the center of the amount of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99 above, Table 2, "tissue samples in the test panel") Divide by the value to obtain the magnification of the upregulation of each sample relative to the median of normal PM samples.

図60は、正常サンプルに対する癌性肺組織における上記SOX2転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも5倍の過剰発現を示すサンプルの数および比率を、以下に示す。   FIG. 60 is a histogram showing overexpression of the SOX2 transcript in cancerous lung tissue relative to normal samples. The number and proportion of samples showing at least 5 times overexpression of the total number of samples tested is shown below.

図60から明らかなように、肺癌由来の癌サンプル中の配列番号1594によって検出可能なSOX2転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、15個の腺癌サンプルのうちの4個、16個の扁平上皮細胞癌サンプルのうちの10個、4個の大細胞癌サンプルのうちの2個、および8個の小細胞癌のうちの7個で少なくとも5倍の過剰発現が見出された。   As apparent from FIG. 60, the expression of SOX2 transcripts detectable by SEQ ID NO: 1594 in lung cancer-derived cancer samples was observed in non-cancerous samples (sample Nos. 46-50, 90-93, 96-99, Table 2). , "Tissue samples in the test panel" was significantly higher. Evidently, 4 out of 15 adenocarcinoma samples, 10 out of 16 squamous cell carcinoma samples, 2 out of 4 large cell carcinoma samples, and 8 small cell carcinomas Overexpression of at least 5 fold was found in 7 of the

下記のように、これらの結果の有意性を検証するために、統計分析を適用した。   Statistical analysis was applied to verify the significance of these results as described below.

肺癌サンプル対正常肺サンプルにおける配列番号1594によって検出可能なSOX2転写物の発現レベルの相違についてのP値は、T検定によって、4.38E−05と決定された。   The P value for the difference in expression levels of SOX2 transcripts detectable by SEQ ID NO: 1594 in lung cancer samples versus normal lung samples was determined to be 4.38E-05 by T-test.

5倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、8.09E−04であった。   The 5-fold overexpression threshold was found to be different between cancer and normal samples, and checked by Fisher's exact test, the P value was 8.09E-04.

上記値は、結果が統計的に有意であることを示す。   The above values indicate that the results are statistically significant.

本発明によれば、SOX2は、肺癌診断用マーカーの非限定的な例である。本発明のSOX2マーカーを、単独または組み合わせて、種々の用途(肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない)に使用することができる。このマーカーの過剰発現および/または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、NATベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、SOX2と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した。   According to the present invention, SOX2 is a non-limiting example of a marker for diagnosing lung cancer. The use of the SOX2 markers of the invention, alone or in combination, for various uses, including but not limited to lung cancer prognosis, prognosis, screening, early screening, treatment selection, and treatment monitoring it can. Although optionally any method can be used to detect over-expression and / or differential expression of this marker, preferably, NAT-based technology is used. Thus, optional and more preferably, any nucleic acid molecule capable of selectively hybridizing to SOX2 as defined above is also included in the present invention. Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used as non-limiting illustrations of suitable primer pairs only.


SOX2−順方向プライマー(配列番号1592):GGCGGCGGCAGGATおよびSOX2−逆方向プライマー(配列番号1593):GTCGGGAGCGCAGGG

SOX 2-forward primer (SEQ ID NO: 1592): GGCGGCGGCAGGAT and SOX 2-reverse primer (SEQ ID NO: 1593): GTCGGGAGCGCAGGG

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:SOX2アンプリコン(配列番号1594)。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : SOX2 amplicon (SEQ ID NO: 1594).

GGCGGCGGCAGGATCGGCCAGAGGAGGAGGGAAGCGCTTTTTTTGATCCTGATTCCAGTTTGCCTCTCTCTTTTTTTCCCCCAAATTATTCTTCGCCTGATTTTCCTCGCGGAGCCCTGCGCTCCCGAC   GGCGGCGGCAGGATCGGCCAGAGGAGAGGAGGGAAGCGCTTTTTTTGATCCTGATTCCAGTTTGCCTCTCTCTTTTTTTCCCCCAA AATTATTCTTCGCCTGAATTTTCTCTGCGGCAGCCCTGCGCTCCGACAC

本発明の他の好ましい実施形態によれば、SOX2またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号1595に記載のSOX2スプライスバリアント(例えば、変異型番号0)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、SOX2のフラグメントは、セグメント_TAA−seg2(配列番号1597)を含む。同様に、任意選択的およびより好ましくは、任意の適切な方法を、例えば、SOX2_セグメント_TAA−seg2(配列番号1597)などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのNATベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。   According to another preferred embodiment of the invention, SOX2 or a fragment thereof comprises a biomarker for lung cancer detection. Optionally and more preferably, the SOX2 splice variant (eg, variant No. 0) as set forth in SEQ ID NO: 1595 or a fragment thereof comprises a biomarker for lung cancer detection. Optionally and more preferably, the fragment of SOX2 comprises the segment _TAA-seg2 (SEQ ID NO: 1597). Similarly, optionally and more preferably, any suitable method can be used for detection of fragments such as, for example, SOX2_segment_TAA-seg2 (SEQ ID NO: 1597). Most preferably, NAT based technologies such as any nucleic acid molecule capable of specifically hybridizing with the fragment are used. Optionally and most preferably, primer pairs are used to obtain the fragments.

さらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、上記のSOX2に対応する核酸配列によってコードされる任意のアミノ酸配列またはフラグメント(配列番号1596が含まれるが、これらに限定されない)を含む。このようなアミノ酸配列またはそのフラグメントに対する任意のオリゴペプチドまたはペプチドも、任意選択的に、(さらにまたは二者択一的に)バイオマーカーとして使用することができる。   According to yet another preferred embodiment, the present invention optionally and preferably comprises any amino acid sequence or fragment encoded by a nucleic acid sequence corresponding to SOX2 as described above (including SEQ ID NO: 1596) Not limited). Any oligopeptide or peptide to such an amino acid sequence or a fragment thereof can optionally also be used as a biomarker (additionally or alternatively).

本発明はまた、任意選択的に、このようなオリゴペプチドまたはペプチドを認識することができ、そして/またはこれらによって誘発することができる抗体を含む。   The invention also optionally includes antibodies capable of recognizing and / or eliciting such oligopeptides or peptides.

本発明はまた、任意選択的および好ましくは、任意選択的な任意の適用のための上記のSOXに対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。   The invention also optionally and preferably comprises any nucleic acid sequence corresponding to SOX above for any optional application or a fragment thereof or an amino acid sequence or a fragment thereof.

正常および癌性肺組織における配列番号1600中に示すアンプリコンによって検出可能なプラコフィリン1(外胚葉異形成/表皮水疱症候群)(PKP1)−(HSB6PR)転写物の発現
配列番号1600によって検出可能なPKP1転写物(例えば、配列番号1601〜1603によって示される変異型番号0、5、および6)の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–配列番号1471)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–配列番号1468)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–配列番号1474)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–配列番号1477)の発現を同様に測定した。各RTサンプルのために、配列番号1600の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
Expression of detectable placophilin 1 (ectoderm dysplasia / epidermal blister syndrome) (PKP1)-(HSB6PR) transcript detectable by the amplicon shown in SEQ ID NO: 1600 in normal and cancerous lung tissue: detectable by SEQ ID NO: 1600 The expression of PKP1 transcripts (e.g., variant nos. 0, 5, and 6 as shown by SEQ ID NOs: 1601-1603) was measured by real time PCR. In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – SEQ ID No. 1471), HPRT1 (GenBank Accession No. NM_000194, Amplicon – SEQ ID No. 1468), Ubiquitin (Ubiquitin) The expression of GenBank Accession No. BC000449, Amplicon <#8211; SEQ ID No. 1474), and SDHA (GenBank Accession No. NM-004168, Amplicon >#8211; SEQ ID No: 1477) was similarly measured. For each RT sample, the expression of SEQ ID NO: 1600 was normalized to the geometric mean of the housekeeping gene dose. The normalized amount of each RT sample is the center of the amount of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99 above, Table 2, "tissue samples in the test panel") Divide by the value to obtain the magnification of the upregulation of each sample relative to the median of normal PM samples.

図61は、正常サンプルに対する癌性肺組織における上記PKP1転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも7倍の過剰発現を示すサンプルの数および比率を、以下に示す。   FIG. 61 is a histogram showing over expression of the above PKP1 transcripts in cancerous lung tissue relative to normal samples. The number and proportion of samples showing at least 7-fold overexpression of the total number of samples tested are shown below.

図61から明らかなように、肺癌由来の癌サンプル中の配列番号1600によって検出可能なPKP1転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、16個の扁平上皮細胞癌サンプルのうちの11個および4個の大細胞癌サンプルのうちの1個で少なくとも7倍の過剰発現が見出された。   As apparent from FIG. 61, the expression of PKP1 transcript detectable by SEQ ID NO: 1600 in a lung cancer-derived cancer sample was detected in non-cancerous samples (Sample Nos. 46-50, 90-93, 96-99, Table 2 , "Tissue samples in the test panel" was significantly higher. Apparently, at least 7-fold overexpression was found in 1 of 11 out of 16 squamous cell carcinoma samples and in 1 of 4 large cell carcinoma samples.

下記のように、これらの結果の有意性を検証するために、統計分析を適用した。   Statistical analysis was applied to verify the significance of these results as described below.

肺癌サンプル対正常肺サンプルにおける配列番号1600によって検出可能なPKP1転写物の発現レベルの相違についてのP値は、T検定によって、3.18E−03と決定された。   The P value for the difference in expression levels of PKP1 transcripts detectable by SEQ ID NO: 1600 in lung cancer samples versus normal lung samples was determined to be 3.18E-03 by T-test.

7倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、3.50E−02であった。   The 7-fold overexpression threshold was found to be different between cancer and normal samples, and checked by Fisher's exact test, the P value was 3.50E-02.

上記値は、結果が統計的に有意であることを示す。   The above values indicate that the results are statistically significant.

本発明によれば、PKP1は、肺癌診断用マーカーの非限定的な例である。本発明のPKP1マーカーを、単独または組み合わせて、種々の用途(肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない)に使用することができる。このマーカーの過剰発現および/または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、NATベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、PKP1と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した。   According to the invention, PKP1 is a non-limiting example of a marker for diagnosing lung cancer. The use of the PKP1 markers of the invention, alone or in combination, for various uses including, but not limited to, lung cancer prognosis, prognosis, screening, early screening, treatment selection, and treatment monitoring it can. Although optionally any method can be used to detect over-expression and / or differential expression of this marker, preferably, NAT-based technology is used. Thus, optional and more preferably, any nucleic acid molecule capable of selectively hybridizing to PKP1, as defined above, is also included in the present invention. Primer pairs are also optionally and preferably included within the scope of the present invention, for example, in the above experiments the following primers were used as non-limiting illustrations of suitable primer pairs only.


PKP1−順方向プライマー(配列番号1598):CCCCAGACTCTGTGCACTTCAおよびPKP1−逆方向プライマー(配列番号1599):TGGGCTCTGCTCTGTCTTAGTGTA

PKP1-forward primer (SEQ ID NO: 1598): CCCCAGACTCTGTGCACTTCA and PKP1-reverse primer (SEQ ID NO: 1599): TGGGCTCTGCTCTGTCTTAGTGTA

本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:PKP1アンプリコン(配列番号1600)。   The present invention also preferably includes any amplicon obtained by use of any suitable primer pair (e.g. in the above experiments) and obtained the following amplicons only as a non-limiting illustration of a suitable amplicon : PKP1 amplicon (SEQ ID NO: 1600).


PKP1–アンプリコン(配列番号1600):CCCCAGACTCTGTGCACTTCAGACCAGCAGCAGCAGGAGGGCTCCCGAGGGCCTTATGAGAAAACCTGTGTGGACATCCCTTGGTGTACACTAAGACAGAGCAGAGCCCA

Amplicon (SEQ ID NO: 1600): CCCCAGACTCTGTGCACTTCAGACCAGCAGCAGCAGGAGGGCTCCCGAGGGCCTTATGAGAAAACCTGTGTGGACATCC CTTGGTGTACACTAAGACAGAGCAGAGCCCCA

本発明の他の好ましい実施形態によれば、PKP1またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号1601〜1603に記載のPKP1スプライスバリアント(例えば、変異型番号0、5、および6)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、PKP1のフラグメントは、セグメント_TAA−seg34(配列番号1608)を含む。同様に、任意選択的およびより好ましくは、任意の適切な方法を、例えば、PKP1_セグメント_TAA−seg34(配列番号1608)などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのNATベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。   According to another preferred embodiment of the present invention, PKP1 or a fragment thereof comprises a biomarker for lung cancer detection. Optionally and more preferably, the PKP1 splice variants (eg, variants nos. 0, 5, and 6) set forth in SEQ ID NOS: 1601-1603 or fragments thereof comprise a biomarker for lung cancer detection. Optionally and more preferably, the fragment of PKP1 comprises the segment _TAA-seg34 (SEQ ID NO: 1608). Similarly, optional and more preferably, any suitable method can be used for detection of fragments such as, for example, PKP1_segment_TAA-seg34 (SEQ ID NO: 1608). Most preferably, NAT based technologies such as any nucleic acid molecule capable of specifically hybridizing with the fragment are used. Optionally and most preferably, primer pairs are used to obtain the fragments.

本発明の他の好ましい実施形態によれば、配列番号1607に記載の固有のセグメントを含むPKP1スプライスバリアント(例えば、配列番号1603に記載の変異型6)は、肺癌検出用バイオマーカーとして適切である。   According to another preferred embodiment of the present invention, a PKP1 splice variant (for example, variant 6 according to SEQ ID NO: 1603) comprising the unique segment according to SEQ ID NO: 1607 is suitable as a biomarker for lung cancer detection .

さらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、上記のPKP1に対応する核酸配列によってコードされる任意のアミノ酸配列またはフラグメント(配列番号1604〜1606が含まれるが、これらに限定されない)を含む。このようなアミノ酸配列またはそのフラグメントに対する任意のオリゴペプチドまたはペプチドも、任意選択的に、(さらにまたは二者択一的に)バイオマーカーとして使用することができる。   According to yet another preferred embodiment, the present invention optionally and preferably comprises any amino acid sequence or fragment encoded by a nucleic acid sequence corresponding to PKP1 as described above (SEQ ID NOS: 1604-1606, Not limited thereto). Any oligopeptide or peptide to such an amino acid sequence or a fragment thereof can optionally also be used as a biomarker (additionally or alternatively).

本発明はまた、任意選択的に、このようなオリゴペプチドまたはペプチドを認識することができ、そして/またはこれらによって誘発することができる抗体を含む。   The invention also optionally includes antibodies capable of recognizing and / or eliciting such oligopeptides or peptides.

本発明はまた、任意選択的および好ましくは、任意選択的な任意の適用のための上記のPKP1に対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。   The invention also optionally and preferably comprises any nucleic acid sequence corresponding to PKP1 described above for any optional application or a fragment or amino acid sequence or a fragment thereof.

正常および癌性肺組織における12の配列(配列番号1480、1517、1529、1532、1558、1574、1594、1600、1616、1619、1622、1625)の組み合わせ発現
配列番号1480、1517、1529、1532、1558、1574、1594、1600、1616、1619、1622、1625によって検出可能ないくつかの転写物の発現を、実時間PCRによって測定した(各配列番号の発現を個別にチェックした)。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–配列番号1471)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–配列番号1468)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–配列番号1474)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–配列番号1477)の発現を同様に測定した。各RTサンプルのために、配列番号1480、1517、1529、1532、1558、1574、1594、1600、1616、1619、1622、1625の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
Combined expression of 12 sequences (SEQ ID NO: 1480, 1517, 1529, 1532, 1558, 1574, 1594, 1600, 1616, 1619, 1622, 1625) in normal and cancerous lung tissue SEQ ID NO: 1480, 1517, 1529, 1532, The expression of several transcripts detectable by 1558, 1574, 1594, 1600, 1616, 1619, 1622, 1625 was measured by real-time PCR (expression of each SEQ ID NO was checked separately). In parallel, four housekeeping genes-PBGD (GenBank Accession No. BC019323, Amplicon – SEQ ID No. 1471), HPRT1 (GenBank Accession No. NM_000194, Amplicon – SEQ ID No. 1468), Ubiquitin (Ubiquitin) The expression of GenBank Accession No. BC000449, Amplicon <#8211; SEQ ID No. 1474), and SDHA (GenBank Accession No. NM-004168, Amplicon >#8211; SEQ ID No: 1477) was similarly measured. For each RT sample, the expression of SEQ ID NOs: 1480, 1517, 1529, 1532, 1558, 1574, 1594, 1600, 1616, 1619, 1622, 1625 was normalized to the geometric mean of the housekeeping gene dose. The normalized amount of each RT sample is the center of the amount of normal postmortem (PM) samples (sample numbers 47-50, 90-93, 96-99 above, Table 2, "tissue samples in the test panel") Divide by the value to obtain the magnification of the upregulation of each sample relative to the median of normal PM samples.

図62は、正常サンプルに対する癌性肺組織における上記転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで上記配列番号の少なくとも1つにおいて少なくとも10倍の過剰発現を示すサンプルの数および比率を、以下に示す。   Figure 62 is a histogram showing over expression of the above transcripts in cancerous lung tissue relative to normal samples. The number and ratio of samples showing at least 10-fold overexpression in at least one of the above SEQ ID NOs among the total number of samples tested is shown below.

図62から明らかなように、上記配列番号の少なくとも1つにおいて、15個の腺癌サンプルのうちの15個、16個の扁平上皮細胞癌サンプルのうちの15個、4個の大細胞癌サンプルのうちの4個、および8個の小細胞癌サンプルのうちの8個で少なくとも10倍の過剰発現が見出された。   As apparent from FIG. 62, in at least one of the above SEQ ID NOs, 15, 15 out of 15 adenocarcinoma samples, 15 out of 16 squamous cell carcinoma samples, 4 large cell carcinoma samples At least 10-fold overexpression was found in 4 of 8 and 8 of 8 small cell carcinoma samples.

下記のように、これらの結果の有意性を検証するために、統計分析を適用した。配列番号1480、1517、1529、1532、1558、1574、1594、1600、1616、1619、1622、1625に記載のアンプリコンの少なくとも1つの10倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、2.37E−08であった。   Statistical analysis was applied to verify the significance of these results as described below. The threshold of at least one 10-fold overexpression of the amplicon according to SEQ ID NOs: 1480, 1517, 1529, 1532, 1558, 1574, 1594, 1600, 1616, 1619, 1622, 1625 is between cancer and normal samples It was found to be different and checked by Fisher's exact test, the P value was 2.37E-08.

上記値は、結果が統計的に有意であることを示す。   The above values indicate that the results are statistically significant.

キットおよび診断アッセイおよび診断方法
上記実施例のいずれかに関して記載のマーカーを、肺癌診断を補助するために、単独、上記の他のマーカーおよび/または他の完全に異なるマーカー(UbcH10 (それぞれ2004年1月13日および3月19日出願の米国特許出願番号60/535,904号および同第60/572,122号(代理人整理番号27080および28045を参照のこと)、トロポニン(米国特許出願番号60/539,129号(代理人整理番号26940を参照のこと)、Sim2(PCT出願番号WO2004/012847号を参照のこと)、PE−10(SP−A)、TTF−1、サイトケラチン5/6が含まれるが、これらに限定されない)と組み合わせて使用することができる。これら全ての出願は、本明細書中に完全に記載されているかのように本明細書中で参考として援用される。これらのマーカーを、他のマーカーと組み合わせて、多数の用途(肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない)(および、任意選択的に、疾患の病期分類も含まれる)に使用することができる。併用した場合、これらにより、1つのマーカーのみを使用して得られる結果と比較して、診断医がより多くの情報を得ることができ、真の陽性および真の陰性の診断の比率が増加し、偽陽性または偽陰性の診断の比率が減少する。
Kits and Diagnostic Assays and Methods The markers described with respect to any of the above examples alone, other markers as described above and / or other completely different markers (UbcH10 (2004 respectively 1 U.S. Patent Application Nos. 60 / 535,904 and 60 / 572,122 filed on May 13 and March 19 (see Attorney Docket Nos. 27080 and 28045), Troponin (US Patent Application No. 60) / 539, 129 (see Attorney Docket No. 26940), Sim 2 (see PCT Application No. WO 2004/012847), PE-10 (SP-A), TTF-1, Cytokeratin 5/6 Can be used in combination with, but not limited to. The application is incorporated herein by reference as if fully described herein, and these markers are combined with other markers for a number of uses (prognosis, prognosis of lung cancer, It can be used for screening, early screening, selection of treatment, and monitoring of treatment, including but not limited to (and optionally, also staging of disease). These allow the diagnostician to obtain more information compared to the results obtained using only one marker, increasing the proportion of true positive and true negative diagnoses, false positives Or the rate of false negative diagnoses decreases.

本発明のアッセイおよび方法には、上記のように、免疫アッセイ、ハイブリッド形成アッセイ、およびNATベースのアッセイが含まれるが、これらに限定されない。肺癌診断を補助するための本発明のマーカーと上記の他のマーカーおよび/または完全に異なるマーカーとの組合わせを、NATベースのアッセイ、免疫アッセイ、およびハイブリッド形成アッセイの組み合わせとして実施することができる。本発明の好ましい実施形態によれば、アッセイは、上記実施例に関する例として記載のNATベースのアッセイである。   Assays and methods of the invention include, but are not limited to, immunoassays, hybridization assays, and NAT-based assays, as described above. Combinations of the markers of the invention with the other markers described above and / or completely different markers to aid in lung cancer diagnosis can be performed as a combination of NAT-based assays, immunoassays, and hybridization assays. . According to a preferred embodiment of the invention, the assay is a NAT based assay as described by way of example for the above example.

さらに別の態様では、本発明は、肺癌診断を補助するためのキットであって、前記キットを使用して本発明のマーカーを検出することができる、キットを提供する。例えば、キットを使用して、肺癌患者および通常の患者のサンプル中で差分的に存在する上記のマーカーの任意の1つまたは組み合わせを検出することができる。本発明のキットは、広く適用される。例えば、キットを使用して、被験体が小細胞肺癌、非小細胞肺癌、腺癌、気管支肺胞癌、扁平上皮細胞癌、または大細胞癌を有するかどうかを識別するか、負の診断をすることにより肺癌診断を補助することができる。別の例では、キットを使用して、肺癌用のin vitroでの肺細胞またはin vivoでの動物モデルにおいてマーカーの発現を調整する化合物を同定することができる。   In still another aspect, the present invention provides a kit for assisting lung cancer diagnosis, which kit can be used to detect the marker of the present invention. For example, the kit can be used to detect any one or a combination of the above markers differentially present in lung cancer and normal patient samples. The kits of the invention have broad application. For example, using the kit to identify whether a subject has small cell lung cancer, non-small cell lung cancer, adenocarcinoma, bronchoalveolar carcinoma, squamous cell carcinoma, or large cell carcinoma, or to make a negative diagnosis Can help diagnose lung cancer. In another example, the kit can be used to identify compounds that modulate marker expression in in vitro lung cells for lung cancer or in vivo animal models.

1つの実施形態では、キットは、(a)吸着剤を含む基質であって、前記吸着剤がマーカーの結合に適切である、基質と、(b)洗浄液または洗浄液作製のための説明書を含み、前記吸着剤と洗浄液との組み合わせにより、前述のマーカーが検出される。 In one embodiment, the kit comprises (a) a substrate comprising an adsorbent, wherein the adsorbent is suitable for binding a marker, and (b) a wash or instructions for the preparation of a wash. The aforementioned marker is detected by the combination of the adsorbent and the washing solution.

任意選択的に、キットは、さらに、標識または別のインサートの形態の適切な操作パラメータのための説明者を含み得る。例えば、キットは、消費者/キット使用者に、精漿サンプルまたは他の組織サンプルがプローブに接触した後にどのようにしてプローブを洗浄するのかについての情報を与える標準的な説明書を有し得る。   Optionally, the kit may further comprise an explainer for appropriate operating parameters in the form of a label or another insert. For example, the kit may have standard instructions that provide the consumer / kit user with information on how to wash the probe after seminal plasma samples or other tissue samples contact the probe. .

別の実施形態では、キットは、(a)マーカーに特異的に結合する抗体および(b)検出試薬を含む。このようなキットを、上記の材料から調製することができる。   In another embodiment, the kit comprises (a) an antibody that specifically binds to the marker and (b) a detection reagent. Such kits can be prepared from the materials described above.

いずれかの実施形態では、キットは、任意選択的に、試験サンプルをコントロール情報標準および/またはコントロール量と比較して、サンプル中で検出されたマーカーの試験量が肺癌診断と一致する診断量であるかどうかを決定することができるような標準もしくはコントロールの情報および/またはコントロール量の材料をさらに含み得る。   In any of the embodiments, the kit optionally compares the test sample to a control information standard and / or a control amount such that the test amount of the marker detected in the sample is at a diagnostic amount consistent with a lung cancer diagnosis. It may further include standard or control information and / or control amounts of material such that it can be determined whether there is any.

本発明のスプライスバリアントの治療への適用
本明細書中に記載のスプライスバリアント(任意のポリヌクレオチド、オリゴヌクレオチド、ポリペプチド、ペプチド、またはこれらのフラグメントが含まれる)またはこれらに特異的に結合する抗体を、任意選択的に、例えば、その診断への適用に関して本明細書中に記載の疾患を治療するための治療への適用に使用することができる。「変異型治療可能な」疾患は、本発明の任意の治療タンパク質のスプライスバリアントの使用によって治療可能な任意の疾患をいう。「治療」はまた、疾患および/または病的状態の予防、改善、消失、および制御を含む。このような変異型が有用な治療薬であり得る疾患を、各変異型について以下により詳細に記載する。これらの変異型は公知のタンパク質のスプライスバリアントであるので、変異型自体を、「クラスター」または遺伝子と記載する。したがって、「クラスター関連疾患」または「変異型関連疾患」は、特定のタンパク質(このような疾患の記載に関して、本発明の治療タンパク質変異型)によって治療することができる疾患をいう。
Therapeutic Applications of the Splice Variants of the Invention The splice variants described herein (including any polynucleotides, oligonucleotides, polypeptides, peptides, or fragments thereof) or antibodies that specifically bind to these Can optionally be used, for example, in therapeutic applications to treat the diseases described herein with respect to its diagnostic application. A "mutant treatable" disease refers to any disease treatable by use of a splice variant of any of the therapeutic proteins of the invention. "Treatment" also includes prevention, amelioration, elimination, and control of the disease and / or pathological condition. Diseases where such variants may be useful therapeutic agents are described in more detail below for each variant. As these variants are splice variants of known proteins, the variants themselves are described as "clusters" or genes. Thus, "cluster related disease" or "mutant related disease" refers to a disease that can be treated with a particular protein (the therapeutic protein variant of the present invention with respect to the description of such diseases).

本明細書中で使用される、用語「生物学的に活性な」は、天然に存在する分子の構造、調節、または生化学的機能を有するタンパク質をいう。同様に、「免疫学的に活性な」は、天然、組換え、または合成のリガンドまたはこれらの任意のオリゴペプチドが適切な動物または細胞における特異的免疫応答を誘導して特異的抗体と結合する能力をいう。   As used herein, the term "biologically active" refers to a protein having the structure, regulation, or biochemical function of a naturally occurring molecule. Similarly, "immunologically active" means that a natural, recombinant, or synthetic ligand or any of these oligopeptides induce a specific immune response in a suitable animal or cell to bind to a specific antibody. I say ability.

本明細書中で使用される、用語「調整する」は、少なくとも1つの受容体媒介活性の活性の変化をいう。例えば、調整により、タンパク質の活性、結合特性、またはリガンドの任意の他の生物学的、機能的、もしくは免疫学的性質が増加または減少し得る。   As used herein, the term "modulate" refers to a change in the activity of at least one receptor mediated activity. For example, modulation can increase or decrease the activity of the protein, the binding properties, or any other biological, functional or immunological properties of the ligand.

治療方法
上記のように、本発明の新規の治療タンパク質変異型およびこれに由来する組成物(すなわち、ペプチド、オリゴヌクレオチド)を使用して、クラスター関連疾患を治療することができる。
Methods of Treatment As noted above, the novel therapeutic protein variants of the invention and compositions derived therefrom (ie, peptides, oligonucleotides) can be used to treat cluster related diseases.

したがって、本発明のさらなる態様によれば、被験体におけるクラスター関連疾患の治療方法を提供する。   Thus, according to a further aspect of the present invention there is provided a method of treating a cluster related disease in a subject.

本発明の被験体は、上記のクラスター関連疾患の少なくとも1つの型を有する哺乳動物(好ましくは、ヒト)である。   The subject of the invention is a mammal, preferably a human, having at least one type of cluster related disease as described above.

上記のように、本発明の生体分子の配列を使用して、上記疾患を有する被験体を治療することができる。   As noted above, the sequences of the biomolecules of the invention can be used to treat a subject having the disease.

本発明の被験体は、上記の疾患の1つを罹患していると診断されたか、上記の疾患の1つを罹患しやすい哺乳動物(好ましくは、ヒト)である。   The subject of the present invention is a mammal, preferably a human, diagnosed as suffering from one of the above mentioned diseases or susceptible to one of the above mentioned diseases.

本明細書中で使用される、用語「治療」は、上記疾患の治癒、逆転、軽減、緩和、最小化、抑制、または副作用の阻止をいう。   As used herein, the term "treatment" refers to curing, reversing, alleviating, alleviating, alleviating, minimizing, suppressing or preventing side effects of the disease.

本発明によれば、被験体における本発明のポリペプチドの少なくとも1つの発現の特異的上方制御または下方制御によって治療することができる。   According to the invention, treatment can be by specific upregulation or downregulation of the expression of at least one polypeptide of the invention in a subject.

任意選択的に、被験体への本明細書中に記載の本発明のポリペプチド(例えば、組換えまたは合成)の少なくとも1つまたはその活性部分の投与によって上方制御することができる。しかし、巨大なポリペプチドの生物学的利用能は、分解率の高さおよび透過率の低さによって潜在的に比較的小さいので、ポリペプチドの投与を、小さなペプチドフラグメント(例えば、約100アミノ酸)に制限することが好ましい。ポリペプチドまたはペプチドを、任意選択的に、以下により詳細に記載する薬学的組成物中で投与することができる。   Optionally, it can be upregulated by administration to a subject of at least one of the polypeptides of the invention described herein (eg, recombinant or synthetic) or an active portion thereof. However, since the bioavailability of large polypeptides is potentially relatively small due to the high degree of degradation and low permeability, administration of the polypeptide may be a small peptide fragment (eg, about 100 amino acids) It is preferable to restrict to The polypeptide or peptide can optionally be administered in a pharmaceutical composition as described in more detail below.

本発明の上記疾患の治療を当該分野で公知の他の治療方法と組み合わせることができる(すなわち、併用療法)ことが認識される。したがって、本発明の薬剤を使用した悪性腫瘍の治療を、例えば、放射線療法、抗体療法、および/または化学療法と組み合わせることができる。   It is recognized that the treatment of the above diseases of the present invention can be combined with other treatment methods known in the art (ie combination therapy). Thus, treatment of malignancies using the agents of the invention can be combined, for example, with radiation therapy, antibody therapy, and / or chemotherapy.

あるいはまたはさらに、任意選択的に、本発明のポリペプチドの少なくとも1つまたはその活性部分の被験体中の量(任意選択的に発現)の特異的上方制御によって上方制御法を行うことができる。   Alternatively or additionally, the upregulation method can optionally be performed by specific upregulation in a subject of an amount (optionally expression) of at least one of the polypeptides of the invention or an active part thereof.

上記および以下の実施例に記載のように、本発明のこの態様の生体分子配列を、野生型遺伝子産物の活性または発現の変化が疾患の発症または進行に寄与することが公知である疾患の治療のための有益な治療ツールとして使用することができる。例えば、疾患が膜結合受容体の過剰発現に起因する場合、その可溶性変異型を、受容体と結合を競合し、それにより受容体からのシグナル伝達が終了するアンタゴニストとして使用することができる。   The biomolecular sequences of this aspect of the invention, as described above and in the examples below, are used to treat diseases in which changes in activity or expression of the wild type gene product are known to contribute to the onset or progression of the disease Can be used as a valuable therapeutic tool for For example, if the disease is due to overexpression of a membrane bound receptor, the soluble variant can be used as an antagonist that competes with the receptor for binding thereby terminating signaling from the receptor.

このような疾患の例を、以下の実施例の部に列挙する。   Examples of such diseases are listed in the Examples section below.

本発明のポリペプチドはまた、作動特性を有し得ることが認識される。これらには、リガンド(例えば、IL−4)の安定性、タンパク質分解からの防御、およびリガンドの薬物動態学的性質の改変(すなわち、リガンドの半減期が増加する一方で、そのクリアランスが減少する)が含まれる。したがって、本発明のこの態様の生体分子配列を使用して、野生型遺伝子産物が好ましい役割を果たす容態または疾患(例えば、糖尿病または虚血における血管形成の増加)を治療することができる。   It will be appreciated that the polypeptides of the invention may also have agonistic properties. These include the stability of the ligand (eg, IL-4), protection from proteolysis, and modification of the pharmacokinetic properties of the ligand (ie, the half life of the ligand is increased while its clearance is decreased Is included. Thus, the biomolecular sequences of this aspect of the invention can be used to treat conditions or diseases in which the wild-type gene product plays a favorable role (e.g. increased angiogenesis in diabetes or ischemia).

本発明の治療タンパク質変異型発現を、上記のように、真核細胞(例えば、哺乳動物細)中でのコード配列の発現のためにデザインされた核酸発現構築物にライゲーションされた本発明の外因性ポリヌクレオチド配列の少なくとも1つの投与を介して上方制御することができる。したがって、外因性ポリヌクレオチド配列は、本発明の変異型をコードするDNAもしくはRNAまたはその活性部分であり得る。   The exogenous protein of the present invention wherein the therapeutic protein variant expression of the present invention is ligated to a nucleic acid expression construct designed for expression of the coding sequence in eukaryotic cells (eg mammalian cells) as described above It can be upregulated via the administration of at least one of the polynucleotide sequences. Thus, the exogenous polynucleotide sequence may be DNA or RNA encoding a variant of the invention or an active portion thereof.

下記の任意の適切な投与様式(すなわち、in−vivo遺伝子療法)を使用して、核酸構築物を個体に投与することができることが認識される。あるいは、適切な遺伝子送達体/方法(トランスフェクション、形質導入、相同組換えなど)および必要に応じて発現系によって核酸構築物を適切な細胞に導入し、改変された細胞を培養で拡大し、個体に戻す(すなわち、ex−vivo遺伝子療法)。核酸構築物は、上により詳細に記載している。   It will be appreciated that the nucleic acid construct can be administered to an individual using any suitable mode of administration described below (ie, in-vivo gene therapy). Alternatively, the nucleic acid construct is introduced into an appropriate cell by an appropriate gene delivery body / method (transfection, transduction, homologous recombination, etc.) and an expression system as needed, and the modified cell is expanded in culture, and the individual (Ie, ex-vivo gene therapy). Nucleic acid constructs are described in more detail above.

本方法を、被験体における本発明の変異型の発現の特異的な内因性上方制御によって行うこともできることが認識される。所与の遺伝子の特異的スプライスバリアントの内因性発現の上方制御のための薬剤には、目的のスプライス部位に指向し、それにより遺伝子のスプライシングパターンが変化するアンチセンスオリゴヌクレオチドが含まれる。このアプローチは、Bcl−x(Taylor(1999)Nat.Biotechnol.17:1097−1100;and Mercatante(2001)J.Biol.Chem.276:16411−16417)、IL−5R(Karras(2000)Mol.Pharmacol.58:380−387)、およびc−myc(Giles(1999)Antisense Acid Drug Dev.9:213−220)の2つのイソ型の発現の均衡を変化させるために首尾よく使用されている。   It will be appreciated that the method can also be performed by specific endogenous upregulation of the expression of the variant of the invention in a subject. Agents for upregulation of the endogenous expression of specific splice variants of a given gene include antisense oligonucleotides directed to the splice site of interest, thereby altering the splicing pattern of the gene. This approach is described in Bcl-x (Taylor (1999) Nat. Biotechnol. 17: 1097-1100; and Mercatante (2001) J. Biol. Chem. 276: 16411-16417), IL-5R (Karras (2000) Mol. Pharmacol. 58: 380-387) and c-myc (Giles (1999) Antisense Acid Drug Dev. 9: 213-220) have been successfully used to alter the balance of expression of the two isoforms.

例えば、インターロイキン5およびその受容体は、造血の調節因子ならびにアレルギーおよび喘息などのいくつかの炎症性疾患におけるメディエーターとして重要な役割を果たす。2つの選択的にスプライシングされたイソ型は、IL−5R遺伝子から生成され、それぞれ、エクソン9を含むか(すなわち、長鎖形態)排除されている(すなわち、短鎖形態)。長鎖形態はインタクトな膜結合受容体をコードし、より短い形態は分泌された可溶性非機能性受容体をコードする。エクソン9領域に特異的な2’−O−MOE−オリゴヌクレオチドを使用して、Karras and co−workers(上記)は、野生型受容体の発現を有意に減少させ、より短いイソ型の発現を増加させることができた。本発明に使用することができるオリゴヌクレオチドのデザインおよび合成を以下に記載し、これらは、Sazani and Kole(2003)Progress in Moleclular and Subcellular Biology 31:217−239による。   For example, interleukin 5 and its receptor play an important role as regulators of hematopoiesis and as mediators in several inflammatory diseases such as allergy and asthma. Two alternatively spliced isoforms are generated from the IL-5R gene and each contain exon 9 (i.e. long form) and are excluded (i.e. short form). The long form encodes an intact membrane bound receptor, and the shorter form encodes a secreted soluble nonfunctional receptor. Using 2'-O-MOE-oligonucleotides specific for the exon 9 region, Karas and co-workers (above) significantly reduce wild type receptor expression and express shorter isoforms It could be increased. The design and synthesis of oligonucleotides that can be used in the present invention are described below, according to Sazani and Kole (2003) Progress in Molecular and Subcellular Biology 31: 217-239.

真核細胞(例えば、哺乳動物細胞)中でのコード配列の発現のためにデザインした核酸発現構築物にライゲーションした本発明の外因性ポリヌクレオチド配列(例えば、配列番号3、7、11、15、19、23、27、31、35、39、または43)の少なくとも1つの投与によって、被験体における本発明のポリペプチド発現を上方制御することがができる。したがって、外因性ポリヌクレオチド配列は、本発明の変異型をコードするDNAもしくはRNA配列またはその活性部分であり得る。   An exogenous polynucleotide sequence of the invention (eg, SEQ ID NO: 3, 7, 11, 15, 19) ligated to a nucleic acid expression construct designed for expression of a coding sequence in a eukaryotic cell (eg, a mammalian cell). , 23, 27, 31, 35, 39 or 43) can upregulate the expression of a polypeptide of the invention in a subject. Thus, the exogenous polynucleotide sequence may be a DNA or RNA sequence encoding a variant of the invention or an active portion thereof.

下記の任意の適切な投与様式(すなわち、in−vivo遺伝子療法)を使用して、核酸構築物を個体に投与することができることが認識される。あるいは、適切な遺伝子送達体/方法(トランスフェクション、形質導入、相同組換えなど)および必要に応じて発現系によって核酸構築物を適切な細胞に導入し、改変された細胞を培養で拡大し、個体に戻す(すなわち、ex−vivo遺伝子療法)。   It will be appreciated that the nucleic acid construct can be administered to an individual using any suitable mode of administration described below (ie, in-vivo gene therapy). Alternatively, the nucleic acid construct is introduced into an appropriate cell by an appropriate gene delivery body / method (transfection, transduction, homologous recombination, etc.) and an expression system as needed, and the modified cell is expanded in culture, and the individual (Ie, ex-vivo gene therapy).

好ましくは、本発明の核酸構築物によって利用されるプロモーターは、形質転換された特定の細胞集団で活性である。細胞型特異的および/または組織特異的プロモーターの例には、肝臓特異的であるアルブミン(Pinkert et al.,(1987)Genes Dev.1:268−277)、リンパ特異的プロモーター(Calame et al.,(1988)Adv.Immunol.43:235−275)、特に、T細胞受容体(Winoto et al.,(1989)EMBO J.8:729−733)および免疫グロブリン(Banerji et al.(1983)Cell 33729−740)のプロモーター、神経フィラメントプロモーター(Byrne et al.(1989)Proc.Natl.Acad.Sci.USA 86:5473−5477)などのニューロン特異的プロモーター、膵臓特異的プロモーター(Edlunch et al.(1985)Science 230:912−916)、または乳清プロモーター(米国特許第4,873,316号および欧州特許出願番号EP 264,166号)などの乳腺特異的プロモーターなどのプロモーターが含まれる。   Preferably, the promoter utilized by the nucleic acid construct of the present invention is active in the particular cell population transformed. Examples of cell type specific and / or tissue specific promoters include albumin which is liver specific (Pinkert et al., (1987) Genes Dev. 1: 268-277), lymphatic specific promoter (Calame et al. , (1988) Adv. Immunol. 43: 235-275), in particular, T cell receptors (Winoto et al., (1989) EMBO J. 8: 729-733) and immunoglobulins (Banerji et al. (1983). (Cell 33729-740) promoter, neuron specific promoter such as neurofilament promoter (Byrne et al. (1989) Proc. Natl. Acad. Sci. USA 86: 5473-5477), pancreas specific promoter Such as a mammary gland specific promoter such as the data promoter (Edrunch et al. (1985) Science 230: 912-916) or the whey promoter (US Pat. No. 4,873,316 and European Patent Application No. EP 264,166) Promoter is included.

適切な構築物の例には、pcDNA3、pcDNA3.1(+/−)、pGL3、PzeoSV2(+/−)、pDisplay、pEF/myc/cyto、pCMV/myc/cyto(それぞれInvitrogen Co.(www.invitrogen.com)から市販されている)が含まれるが、これらに限定されない。レトロウイルスベクターおよびパッケージング系の例は、Clontech,San Diego,Calif.で販売されており、複数のクローニング部位にクローニング可能であり、導入遺伝子がCMVプロモーターによって転写される、Retro−XベクターpLNCXおよびpLXSNが含まれる。導入遺伝子が5’LTRプロモーターから転写されるpBabeなどのMo−MuLV由来のベクターも含まれる。   Examples of suitable constructs include pcDNA3, pcDNA3.1 (+/-), pGL3, PzeoSV2 (+/-), pDisplay, pEF / myc / cyto, pCMV / myc / cyto (Invitrogen Co. (www. Invitrogen, respectively). Commercially available from .com) but are not limited thereto. Examples of retroviral vectors and packaging systems are described by Clontech, San Diego, Calif. And Retro-X vectors pLNCX and pLXSN, which are commercially available and can be cloned into multiple cloning sites and the transgene is transcribed by a CMV promoter. Also included are vectors derived from Mo-MuLV such as pBabe, in which the transgene is transcribed from the 5 'LTR promoter.

現在好ましいin vivo核酸導入技術には、アデノウイルス、レンチウイルス、単純ヘルペスIウイルス、またはアデノ随伴ウイルス(AAV)および脂質ベースの系などのウイルス構築物または非ウイルス構築物でのトランスフェクションが含まれる。脂質媒介遺伝子導入に有用な脂質は、例えば、DOTMA、DOPE、およびDC−Cholである(Tonkinson et al.,Cancer Investigation,14(1):54−65(1996))。遺伝子療法で使用するための最も好まし構築物はウイルスであり、最も好ましくはアデノウイルス、AA、レンチウイルス、またはレトロウイルスである。レトロウイルス構築物などのウイルス構築物は、少なくとも1つの転写プロモーター/エンハンサーもしくは遺伝子座定義エレメント(locus−defining element(s))、または選択的スプライシング、核RNA輸送、もしくはメッセンジャーの翻訳後修飾などの他の手段によって遺伝子発現を調節する他のエレメントを含む。このようなベクター構築物はまた、ウイルス構築物中に既に存在しない場合、使用ウイルスに適切なパッケージングシグナル、長末端反復(LTRs)もしくはその一部、およびプラス鎖およびマイナス鎖プライマー結合部位を含む。さらに、このような構築物は、典型呈には、配置される宿主細胞からのペプチドの分泌のためのシグナル配列を含む。好ましくは、この目的のためのシグナル配列は、哺乳動物シグナル配列または本発明のポリペプチド変異型のシグナル配列である。任意選択的に、構築物はまた、ポリアデニル化を指示するシグナルならびに1つまたは複数の制限部位および翻訳終結配列を含み得る。例として、このような構築物は、典型的には、5’LTR、tRNA結合部位、パッケージングシグナル、二本鎖DNA合成起源、および3’LTRまたはその一部を含む。カチオン性脂質、ポリリジン、およびデンドリマーなどの非ウイルス性の他のベクターを使用することができる。   Currently preferred in vivo nucleic acid transfer techniques include transfection with viral or non-viral constructs such as adenovirus, lentivirus, herpes simplex virus I, or adeno-associated virus (AAV) and lipid based systems. Lipids useful for lipid-mediated gene transfer are, for example, DOTMA, DOPE, and DC-Chol (Tonkinson et al., Cancer Investigation, 14 (1): 54-65 (1996)). The most preferred constructs for use in gene therapy are viruses, most preferably adenovirus, AA, lentivirus, or retrovirus. The viral construct, such as a retroviral construct, may be at least one transcriptional promoter / enhancer or locus-defining element (s), or other such as alternative splicing, nuclear RNA transport, or post-translational modification of messengers. Includes other elements that regulate gene expression by means. Such vector constructs also contain packaging signals appropriate for the virus used, long terminal repeats (LTRs) or parts thereof, and plus and minus strand primer binding sites, if not already present in the virus construct. In addition, such constructs typically include a signal sequence for secretion of the peptide from the host cell in which it is placed. Preferably, the signal sequence for this purpose is a mammalian signal sequence or a signal sequence of a polypeptide variant of the invention. Optionally, the construct may also include a signal that directs polyadenylation, as well as one or more restriction sites and a translation termination sequence. As an example, such a construct typically comprises a 5 'LTR, a tRNA binding site, a packaging signal, a double stranded DNA synthesis source, and a 3' LTR or part thereof. Other non-viral vectors such as cationic lipids, polylysine and dendrimers can be used.

本方法を、被験体における本発明のスプライスバリアントの発現の特異的な内因性上方制御によって行うこともできることが認識される。所与の遺伝子の特異的スプライスバリアントの内因性発現の上方制御のための薬剤には、目的のスプライス部位に指向し、それにより遺伝子のスプライシングパターンが変化するアンチセンスオリゴヌクレオチドが含まれる。このアプローチは、Bcl−x(Taylor(1999)Nat.Biotechnol.17:1097−1100;and Mercatante(2001)J.Biol.Chem.276:16411−16417)、IL−5R(Karras(2000)Mol.Pharmacol.58:380−387)、およびc−myc(Giles(1999)Antisense Acid Drug Dev.9:213−220)の2つのイソ型の発現の均衡を変化させるために首尾よく使用されている。   It will be appreciated that the method can also be performed by specific endogenous upregulation of the expression of a splice variant of the invention in a subject. Agents for upregulation of the endogenous expression of specific splice variants of a given gene include antisense oligonucleotides directed to the splice site of interest, thereby altering the splicing pattern of the gene. This approach is described in Bcl-x (Taylor (1999) Nat. Biotechnol. 17: 1097-1100; and Mercatante (2001) J. Biol. Chem. 276: 16411-16417), IL-5R (Karras (2000) Mol. Pharmacol. 58: 380-387) and c-myc (Giles (1999) Antisense Acid Drug Dev. 9: 213-220) have been successfully used to alter the balance of expression of the two isoforms.

例えば、インターロイキン5およびその受容体は、造血の調節因子ならびにアレルギーおよび喘息などのいくつかの炎症性疾患におけるメディエーターとして重要な役割を果たす。2つの選択的にスプライシングされたイソ型は、IL−5R遺伝子から生成され、それぞれ、エクソン9を含むか(すなわち、長鎖形態)排除されている(すなわち、短鎖形態)。長鎖形態はインタクトな膜結合受容体をコードし、より短い形態は分泌された可溶性非機能性受容体をコードする。エクソン9領域に特異的な2’−O−MOE−オリゴヌクレオチドを使用して、Karras and co−workers(上記)は、野生型受容体の発現を有意に減少させ、より短いイソ型の発現を増加させることができた。本発明に使用することができるオリゴヌクレオチドのデザインおよび合成を以下に記載し、これらは、Sazani and Kole(2003)Progress in Moleclular and Subcellular Biology 31:217−239による。   For example, interleukin 5 and its receptor play an important role as regulators of hematopoiesis and as mediators in several inflammatory diseases such as allergy and asthma. Two alternatively spliced isoforms are generated from the IL-5R gene and each contain exon 9 (i.e. long form) and are excluded (i.e. short form). The long form encodes an intact membrane bound receptor, and the shorter form encodes a secreted soluble nonfunctional receptor. Using 2'-O-MOE-oligonucleotides specific for the exon 9 region, Karas and co-workers (above) significantly reduce wild type receptor expression and express shorter isoforms It could be increased. The design and synthesis of oligonucleotides that can be used in the present invention are described below, according to Sazani and Kole (2003) Progress in Molecular and Subcellular Biology 31: 217-239.

好ましくは、本発明のポリペプチド変異型の少なくとも1つの発現(または活性)を特異的に下方制御することができる薬剤によって治療することができる。   Preferably, at least one expression (or activity) of the polypeptide variant of the invention can be treated by an agent capable of specifically downregulating.

以下により詳細に記載のオリゴヌクレオチドなどのオリゴヌクレオチドを使用して、本発明の治療タンパク質変異型の発現を下方制御することができる。   Oligonucleotides, such as those described in more detail below, can be used to downregulate the expression of therapeutic protein variants of the invention.

siRNA分子−小干渉RNA(siRNA)分子を使用して、本発明の治療タンパク質変異型の発現を下方制御することができる。RNA干渉は、2工程プロセスである。初期工程と呼ばれる第1の工程では、入力(input)dsRNAを21〜23ヌクレオチド(nt)の小干渉RNA(siRNA)に消化し、これはおそらくダイサー(ATP依存性様式でdsRNA(直接か導入遺伝子またはウイルスによって導入される)をプロセシングする(切断する)dsRNA特異的リボヌクレアーゼのRNアーゼIIIファミリーのメンバー)の作用による。連続的切断により、RNAがそれぞれ2−ヌクレオチド3’オーバーハングを有する19〜21bpの二重鎖(siRNA)に分解される(Hutvagner and Zamore Curr.Opin.Genetics and Development 12:225−232(2002)およびBernstein Nature 409:363−366(2001))。   siRNA molecules-Small interfering RNA (siRNA) molecules can be used to downregulate the expression of therapeutic protein variants of the invention. RNA interference is a two step process. In the first step, called the initial step, the input dsRNA is digested into small interfering RNAs (siRNAs) of 21-23 nucleotides (nt), which may be dicer (possibly in an ATP-dependent manner, dsRNA (direct or transgene) Or by the action of a RNase III family member of a dsRNA-specific ribonuclease that processes (cleases) introduced by the virus. Successive cleavage breaks the RNA into 19-21 bp duplexes (siRNAs) each having a 2-nucleotide 3 'overhang (Hutvagner and Zamore Curr. Opin. Genetics and Development 12: 225-232 (2002) And Bernstein Nature 409: 363-366 (2001)).

エフェクター工程では、siRNA二重鎖は、ヌクレアーゼ複合体と結合して、RNA誘導サイレンシング複合体(RISC)を形成する。RISCの活性化にはsiRNA二重鎖のATP依存性巻き戻しが必要である。次いで、活性RISCは、塩基対合相互作用によって相同転写物をターゲティングし、mRNAをsiRNAの3’末端由来の12ヌクレオチドフラグメントに切断する(Hutvagner and Zamore Curr.Opin.Genetics and Development 12:225−232(2002);Hammond et al.(2001)Nat.Rev.Gen.2:110−119(2001);and Sharp Genes.Dev.15:485−90(2001))。切断機構は以前として解明されていないが、研究により、各RISCが1つのsiRNAおよびRNアーゼを含むことが示されている(Hutvagner and Zamore Curr.Opin.Genetics and Development 12:225−232(2002))。   In the effector step, the siRNA duplex binds to the nuclease complex to form an RNA-induced silencing complex (RISC). Activation of RISC requires ATP-dependent unwinding of the siRNA duplex. The active RISC then targets the homologous transcript by base pairing interactions and cleaves the mRNA into a 12 nucleotide fragment from the 3 'end of the siRNA (Hutvagner and Zamore Curr. Opin. Genetics and Development 12: 225-232 Hammond et al. (2001) Nat. Rev. Gen. 2: 110-119 (2001); and Sharp Genes. Dev. 15: 485-90 (2001)). Although the cleavage mechanism has not been elucidated as before, studies have shown that each RISC contains one siRNA and one RNase (Hutvagner and Zamore Curr. Opin. Genetics and Development 12: 225-232 (2002) ).

RNAiの顕著な能力により、RNAi経路内の増幅工程が示唆されている。より多数のsiRNAが生成されるであろう入力dsRNAのコピーまたは形成されたsiRNAの複製によって増幅が起こり得る。あるいはまたはさらに、RISCの複数の代謝回転事象によって複製され得る(Hammond et al.Nat.Rev.Gen.2:110−119(2001),Sharp Genes.Dev.15:485−90(2001);Hutvagner and Zamore Curr.Opin.Genetics and Development 12:225−232(2002))。RNAiに関するより多くの情報については、以下の概説を参照のこと:Tuschl ChemBiochem.2:239−245(2001);Cullen Nat.Immunol.3:597−599(2002);およびBrantl Biochem.Biophys.Act.1575:15−25(2002)。   The remarkable ability of RNAi suggests an amplification step within the RNAi pathway. Amplification may occur by copying of the input dsRNA or replication of the formed siRNA, which would result in a larger number of siRNAs. Alternatively or additionally, it may be replicated by multiple RISC turnover events (Hammond et al. Nat. Rev. Gen. 2: 110-119 (2001), Sharp Genes. Dev. 15: 485-90 (2001); Hutvagner and Zamore Curr. Opin. Genetics and Development 12: 225-232 (2002)). For more information on RNAi, see the following overview: Tuschl ChemBiochem. 2: 239-245 (2001); Cullen Nat. Immunol. 3: 597-599 (2002); and Brantl Biochem. Biophys. Act. 1575: 15-25 (2002).

本発明での使用に適切なRNAi分子を以下のように合成することができる。第1に、mRNA配列を、AAジヌクレオチド配列についてAUG開始コドンの下流をスキャンする。各AAおよび3’隣接19ヌクレオチドの発生を、潜在的siRNA標的部位として記録する。好ましくは、非翻訳領域(UTR)はより多くの調節タンパク質結合部位に富むので、siRNA標的部位を、読み取り枠から選択する。UTR結合タンパク質および/または翻訳開始複合体は、siRNAエンドヌクレアーゼ複合体の結合を阻害し得る(Tuschl ChemBiochem.2:239−245)。GAPDHについて示すように、5’UTRに指向するsiRNAは細胞GAPDH mRNAの約90%減少を媒介し、タンパク質レベルを完全に消失させる(www.ambion.com/techlib/tn/91/912.html)ので、非翻訳領域に指向するsiRNAも有効であり得ることが認識される。   RNAi molecules suitable for use in the present invention can be synthesized as follows. First, the mRNA sequence is scanned downstream of the AUG start codon for AA dinucleotide sequences. The occurrence of each AA and 3 'adjacent 19 nucleotides is recorded as potential siRNA target sites. Preferably, siRNA target sites are selected from the open reading frame, as the untranslated region (UTR) is enriched in more regulatory protein binding sites. UTR binding proteins and / or translation initiation complexes can inhibit the binding of the siRNA endonuclease complex (Tuschl ChemBiochem. 2: 239-245). As shown for GAPDH, siRNA directed to the 5 'UTR mediates an approximately 90% reduction of cellular GAPDH mRNA and causes complete loss of protein levels (www.ambion.com/techlib/tn/91/912.html) Thus, it is recognized that siRNA directed to the untranslated region may also be effective.

第2に、NCBIサーバ(www.ncbi.nlm.nih.gov/BLAST/)から利用可能なBLASTソフトウェアなどの任意の配列アラインメントソフトウェアを使用して、潜在的標的部位を適切なゲノムデータベース(例えば、ヒト、マウス、ラットなど)と比較する。他のコード配列に有意な相同性を示す推定標的部位をフィルターにかけて除去する。   Second, using any sequence alignment software, such as BLAST software available from the NCBI server (www. Ncbi. Nlm. Nih. Gov / BLAST /), potential target sites are placed in an appropriate genomic database (eg, Compare with human, mouse, rat etc). The putative target sites showing significant homology to other coding sequences are filtered out.

適した標的配列を、siRNA合成のテンプレートとして選択する。好ましい配列は、G/C含量が55%を超える配列と比較して遺伝子サイレンシングの効果がより高いことが証明されているので、G/C含量が低い配列である。好ましくは、評価のために、標的遺伝子の長さに沿っていくつかの標的部位を選択する。各ポリヌクレオチドが特異的に下方制御するように、標的部位を本発明の各ポリヌクレオチドの固有のヌクレオチド配列から選択する。選択されたsiRNAのより良好な評価のために、ネガティブコントロールを組み合わせて使用することが好ましい。ネガティブコントロールsiRNAは、好ましくは、siRNAと同一のヌクレオチド組成を含むが、ゲノムとの有意な相同性を欠く。したがって、任意の他の遺伝子に対して有意な相同性を示さない場合、siRNAのスクアランブルしたヌクレオチド配列を使用することが好ましい。   A suitable target sequence is selected as a template for siRNA synthesis. A preferred sequence is one with a low G / C content, as the effect of gene silencing has been shown to be higher compared to sequences with a G / C content above 55%. Preferably, several target sites are selected along the length of the target gene for evaluation. Target sites are selected from the unique nucleotide sequences of each polynucleotide of the invention such that each polynucleotide is specifically downregulated. It is preferable to use a combination of negative controls for better evaluation of the selected siRNA. Negative control siRNA preferably comprises the same nucleotide composition as the siRNA but lacks significant homology to the genome. Thus, it is preferred to use a siRNA sized nucleotide sequence if it does not show significant homology to any other gene.

DNAzyme分子−本発明のポリペプチドの発現を下方制御することができる別の薬剤は、本発明のポリヌクレオチドのmRNA転写物またはDNA配列を特異的に切断することができるDNAzyme分子である。DNAzymeは、一本鎖および二本鎖の標的配列の両方を切断することができる一本鎖ポリヌクレオチドである(Breaker,R.R.and Joyce,G.Chemistry and Biology 1995;2:655;Santoro,S.W.& Joyce,G.F.Proc.Natl,Acad.Sci.USA 1997;943:4262)。DNAzymeの一般的モデル(「10−23」モデル)が提案されている。「10−23」DNAzymeは、7つ〜9つの各デオキシリボヌクレオチドの2つの基質認識ドメインに隣接した15個のデオキシリボヌクレオチドの触媒触媒ドメインを有する。このDNAzyme型は、プリン:ピリミジン連結点で基質RNAを有効に切断することができる(Santoro,S.W.& Joyce,G.F.Proc.Natl,Acad.Sci.USA 199、DNAzymeの概説については、Khachigian,LM [Curr Opin Mol Ther 4:119−21(2002)を参照のこと)。   DNAzyme Molecules-Another agent capable of downregulating expression of the polypeptide of the invention is a DNAzyme molecule capable of specifically cleaving the mRNA transcript or DNA sequence of the polynucleotide of the invention. DNAzyme is a single-stranded polynucleotide capable of cleaving both single-stranded and double-stranded target sequences (Breaker, R. R. and Joyce, G. Chemistry and Biology 1995; 2: 655; Santoro , S. W. & Joyce, G. F. Proc. Natl, Acad. Sci. USA 1997; 943: 4262). A general model of the DNAzyme ("10-23" model) has been proposed. The "10-23" DNAzyme has a catalytic domain of 15 deoxyribonucleotides flanked by two substrate recognition domains of 7 to 9 of each deoxyribonucleotide. This DNAzyme type can effectively cleave the substrate RNA at the purine: pyrimidine junction (for a summary of the DNAzymes (Santoro, S. W. & Joyce, G. F. Proc. Natl, Acad. Sci. USA 199, DNAzymes) , Khachigian, LM [Curr Opin MoI Ther 4: 119-21 (2002)).

DNAzymeの標的部位を、各ポリヌクレオチドが特異的に下方制御するように、本発明の各ポリヌクレオチドの固有のヌクレオチド配列から選択する。   The target site of the DNAzyme is selected from the unique nucleotide sequence of each polynucleotide of the invention such that each polynucleotide specifically downregulates.

合成された操作DNAzyme認識される一本鎖および二本鎖標的切断部位の構築および増幅の例は、Joyce et al.に付与された米国特許第6,326,174号に開示されている。ヒトウロキナーゼ受容体に指向する類似のデザインのDNAzymeは、最近、ウロキナーゼ受容体発現を阻害し、invivoで結腸癌細胞の転移を首尾よく阻害することが認められた(Itoh et al ,20002,Abstract 409,Ann Meeting Am Soc Gen Ther www.asgt.org)。別の適用では、bcr−ab1癌遺伝子に相補的なDNAzymeは、首尾の良く白血球中での癌遺伝子発現を阻害し、CMLおよびALLの場合に自己骨髄移植片中の再発率を減少させた。   Examples of construction and amplification of synthesized engineered DNAzyme-recognized single- and double-stranded target cleavage sites are described by Joyce et al. U.S. Pat. No. 6,326,174, which is assigned to the assignee of the present invention. A similarly designed DNAzyme directed against the human urokinase receptor has recently been shown to inhibit urokinase receptor expression and successfully inhibit metastasis of colon cancer cells in vivo (Itoh et al, 20002, Abstract 409) , Ann Meeting Am Soc Gen Ther www.asgt.org). In another application, DNAzymes complementary to the bcr-abl oncogene successfully inhibited oncogene expression in leukocytes and reduced the rate of recurrence in autologous bone marrow grafts in the case of CML and ALL.

アンチセンス分子−本発明のポリペプチド変異型をコードするmRNA転写物と特異的にハイブリッド形成する個とができるアンチセンスポリヌクレオチドの使用によって、本発明のポリヌクレオチドを下方制御することもできる。   Antisense Molecules-The polynucleotides of the present invention can also be downregulated by the use of individualized antisense polynucleotides that specifically hybridize to mRNA transcripts encoding the polypeptide variants of the present invention.

本明細書中で使用される、用語「アンチセンス」は、特異的にDNAまたはRNA配列に相補的なヌクレオチド配列を含む任意の組成物をいう。   As used herein, the term "antisense" refers to any composition comprising a nucleotide sequence that is specifically complementary to a DNA or RNA sequence.

用語「アンチセンス鎖」は、「センス」鎖に相補的な核酸鎖に関して使用される。アンチセンス分子にはペプチド核酸も含まれ、合成または転写が含まれる任意の方法によって産生することができる。一旦細胞に移入されると、相補ヌクレオチドは、細胞によって産生された天然の配列と組み合わされて二重鎖を形成し、転写または翻訳のいずれかを遮断する。用語「ネガティブ」を、しばしばアンチセンス鎖に関して使用し、「ポジティブ」を、しばしばセンス鎖に関して使用する。アンチセンスオリゴヌクレオチドはまた、in vivoでの選択的スプライシングの改変およびin vivoおよびin vitroでの診断のために使用される(Khelifi C.et al.,2002,Current Pharmaceutical Design 8:451−1466;Sazani,P.,and Kole.R.Progress in Molecular and Cellular Biology,2003,31:217−239)。   The term "antisense strand" is used in reference to a nucleic acid strand that is complementary to the "sense" strand. Antisense molecules also include peptide nucleic acids, and can be produced by any method involving synthesis or transcription. Once transferred to the cell, the complementary nucleotides combine with the natural sequence produced by the cell to form a duplex, blocking either transcription or translation. The term "negative" is often used in reference to the antisense strand, and "positive" is often used in reference to the sense strand. Antisense oligonucleotides are also used for in vivo alternative splicing modifications and in vivo and in vitro diagnostics (Khelifi C. et al., 2002, Current Pharmaceutical Design 8: 451-1466; Sazani, P., and Kole. R. Progress in Molecular and Cellular Biology, 2003, 31: 217-239).

アンチセンスアプローチに重要な以下の2つの態様を考慮しながら本発明のポリペプチドの発現を有効に下方制御するために使用することができるアンチセンス分子をデザインすることができる。第1の態様は、適切な細胞の細胞質へのオリゴヌクレオチドの送達であり、第2の態様は、デザインされたmRNAがその翻訳を阻害する方法で細胞内で特異的に結合するオリゴヌクレオチドのデザインである。   Antisense molecules can be designed that can be used to effectively downregulate expression of the polypeptides of the invention taking into account the following two aspects important to the antisense approach. The first aspect is the delivery of the oligonucleotide to the cytoplasm of a suitable cell, and the second aspect is the design of the oligonucleotide to which the designed mRNA specifically binds in the cell in a manner that inhibits its translation. It is.

先行技術は、広範な種々の細胞型にオリゴヌクレオチドを有効に送達させるために使用することができる多数の送達ストラテジーを教示している(例えば、Luft J Mol Med 76:75−6(1998);Kronenwett et al.Blood 91:852−62(1998);Rajur et al.Bioconjug Chem 8:935−40(1997);Lavigne et al.Biochem Biophys Res Commun 237:566−71(1997)およびAoki et al.(1997)Biochem Biophys Res Commun 231:540−5(1997)を参照のこと)。   The prior art teaches a number of delivery strategies that can be used to effectively deliver oligonucleotides to a wide variety of cell types (eg, Luft J Mol Med 76: 75-6 (1998); Kronenwett et al. Blood 91: 852-62 (1998); Rajur et al. Bioconjug Chem 8: 935-40 (1997); Lavigne et al. Biochem Biophys Res Commun 237: 566-71 (1997) and Aoki et al. (1997) Biochem Biophys Res Commun 231: 540-5 (1997)).

さらに、標的mRNAおよびオリゴヌクレオチドの両方の構造変化のエネルギーを明らかにする熱力学サイクルに基づいてその標的mRNAに対する最も高い推定結合親和性を有する配列を同定するためのアルゴリズムも利用可能である(例えば、Walton et al.Biotechnol Bioeng 65:1−9(1999)を参照のこと)。   In addition, algorithms are available to identify sequences with the highest putative binding affinity for the target mRNA based on thermodynamic cycles that reveal the energy of structural changes in both the target mRNA and the oligonucleotide (eg, , Walton et al. Biotechnol Bioeng 65: 1-9 (1999)).

このようなアルゴリズムは、細胞におけるアンチセンスアプローチを実施するために首尾よく使用されている。例えば、Walton et al.によって開発されたアルゴリズムにより、科学者は、ウサギβ−グロビン(RBG)およびマウス腫瘍壊死因子α(TNFα)転写物のアンチセンスオリゴヌクレオチドを首尾よくデザインすることができた。同一の研究グループは、最近、速度PCR技術によって評価したところ、細胞培養物中の3つのモデル標的mRNA(ヒト乳酸デヒドロゲナーゼAおよびBならびにラットgp130)に対して合理的に選択されたオリゴヌクレオチドのアンチセンス活性がほとんど全ての場合(ホスホジエステルおよびホスホロチオエートオリゴヌクレオチドの化学的性質を有する2つの細胞型における3つの異なる標的に体する試験が含まれる)で有効であることが証明されたことを報告している。   Such an algorithm has been successfully used to implement an antisense approach in cells. For example, Walton et al. The algorithm developed by J., has allowed scientists to successfully design antisense oligonucleotides of rabbit β-globin (RBG) and mouse tumor necrosis factor α (TNFα) transcripts. The same research group has recently been evaluated by kinetic PCR techniques and shows that the oligonucleotides selected rationally against three model target mRNAs (human lactate dehydrogenase A and B and rat gp130) in cell culture. We report that the sense activity was proved to be effective in almost all cases, including tests to target three different targets in two cell types with phosphodiester and phosphorothioate oligonucleotide chemistry. ing.

さらに、in vitro系を使用した特異的オリゴヌクレオチドの有効性のデザインおよび予想のためのいくつかのアプローチも公開されている(Matveeva et al.,Nature Biotechnology 16:1374 − 1375(1998))。   In addition, several approaches for designing and predicting the efficacy of specific oligonucleotides using in vitro systems have also been published (Matveeva et al., Nature Biotechnology 16: 1374-1375 (1998)).

いくつかの臨床試験により、アンチセンスオリゴヌクレオチドの安全性、実現可能性、および活性が証明されている。例えば、癌治療に適切なアンチセンスオリゴヌクレオチドが首尾よく使用されており(Holmund et al.,Curr Opin Mol Ther 1:372−85(1999))、一方で、c−myb遺伝子、p53、およびBcl−2をターゲティングするアンチセンスオリゴヌクレオチドによる血液悪性疾患の治療は臨床試験に入っており、患者に許容されることが認められている(Gerwitz Curr Opin Mol Ther 1:297−306(1999))。   Several clinical trials have demonstrated the safety, feasibility, and activity of antisense oligonucleotides. For example, antisense oligonucleotides suitable for cancer treatment have been successfully used (Holmund et al., Curr Opin MoI Ther 1: 372-85 (1999)), while c-myb gene, p53, and Bcl. The treatment of hematologic malignancies with antisense oligonucleotides targeting -2 has entered clinical trials and has been found to be tolerated by patients (Gerwitz Curr Opin MoI Ther 1: 297-306 (1999)).

より最近では、ヘパラナーゼ遺伝子発現のアンチセンス媒介抑制は、マウスモデルにおいてヒト癌細胞の胸膜播種を阻害することが報告されている(Uno et al.,Cancer Res 61:7855−60(2001))。   More recently, antisense-mediated suppression of heparanase gene expression has been reported to inhibit pleural dissemination of human cancer cells in mouse models (Uno et al., Cancer Res 61: 7855-60 (2001)).

したがって、上記のアンチセンステクノロジー分野の最近の開発により、高精度のアンチセンスデザインアルゴリズムおよび広範な種々のオリゴヌクレオチド送達系が得られ、当業者が過度な試験および誤った実験を用いることなく公知の配列の発現の下方制御に適切なアンチセンスアプローチをデザインして実施することができることが現在認められている。   Thus, recent developments in the area of antisense technology described above result in high precision antisense design algorithms and a wide variety of oligonucleotide delivery systems, known to those skilled in the art without undue testing and erroneous experimentation. It is now recognized that appropriate antisense approaches can be designed and implemented to downregulate the expression of sequences.

各ポリヌクレオチドが特異的に下方制御されるように、アンチセンス分子の標的部位を本発明の各ポリヌクレオチドの固有のヌクレオチド配列から選択する。   The target site of the antisense molecule is selected from the unique nucleotide sequence of each polynucleotide of the invention such that each polynucleotide is specifically downregulated.

リボザイム−本発明のポリペプチド発現を下方制御することができる別の薬剤は、本発明のポリペプチド変異型をコードするmRNA転写物を特異的に切断することができるリボザイム分子である。リボザイムは、目的のタンパク質をコードするmRNAの切断による遺伝子発現の配列特異的阻害での使用が増加している(Welch et al.,Curr Opin Biotechnol.9:486−96(1998))。任意の特異的標的RNAを切断するためのリボザイムをデザインする可能性により、リボザイムは基礎研究および治療への適用の両方における有益なツールとなる。治療領域では、リボザイムは、感染症におけるウイルスRNA、癌における優性癌遺伝子、および遺伝子障害における特異的体細胞変異をターゲティングするために使用されている(Welch et al.,Clin Diagn Virol.10:163−71(1998))。最も顕著には、HIV患者のためのいくつかのリボザイム遺伝子療法プロトコールは、既に第1相試験段階である。より最近には、トランスジェニック動物研究、遺伝子標的の検証、および経路の解明のためにリボザイムが使用されている。いくつかのリボザイムは、種々の臨床試験段階にある。ANGIOZYMEは、ヒト臨床試験で研究されるべき最初に合成されたリボザイムであった。ANGIOZYMEは、VEGF−r(血管内皮成長因子受容体の形成(血管形成経路における重要成分)を特異的に阻害する。Ribozyme Pharmaceuticals,Inc.および他の企業は、動物モデルにおける抗血管形成療法の重要性を証明している。HEPTAZYME(C型肝炎ウイルス(HCV)RNAを選択的に破壊するようにデザインされたリボザイムは、細胞培養アッセイにおけるC型肝炎ウイルスRNAの減少に有効であることが見出された(Ribozyme Pharmaceuticals,Incorporated − WEBホームページ)。   Ribozyme-Another agent capable of downregulating polypeptide expression of the invention is a ribozyme molecule capable of specifically cleaving mRNA transcripts encoding a polypeptide variant of the invention. Ribozymes are increasingly used for sequence-specific inhibition of gene expression by cleavage of mRNA encoding a protein of interest (Welch et al., Curr Opin Biotechnol. 9: 486-96 (1998)). The possibility of designing ribozymes to cleave any specific target RNA makes them valuable tools in both basic research and therapeutic applications. In the therapeutic area, ribozymes have been used to target viral RNA in infections, dominant oncogenes in cancer, and specific somatic mutations in genetic disorders (Welch et al., Clin Diagn Virol. 10: 163 -71 (1998)). Most notably, some ribozyme gene therapy protocols for HIV patients are already in Phase I trials. More recently, ribozymes have been used for transgenic animal studies, validation of gene targets, and elucidation of pathways. Several ribozymes are in various clinical trials. ANGIOZYME was the first synthetic ribozyme to be studied in human clinical trials. ANGIOZYME specifically inhibits VEGF-r (the formation of vascular endothelial growth factor receptor, an important component in the angiogenic pathway) Ribozyme Pharmaceuticals, Inc. and other companies are important for anti-angiogenic therapy in animal models A ribozyme designed to selectively destroy HEPTAZYME (Hepatitis C virus (HCV) RNA was found to be effective in reducing Hepatitis C virus RNA in cell culture assays. (Ribozyme Pharmaceuticals, Incorporated-WEB homepage).

あるいは、本発明のポリペプチドに特異的に結合してその活性を阻害することができる抗体または抗体フラグメント(すなわち、中和抗体)などの下方制御薬を使用して、本発明のポリペプチド変異型をポリペプチドレベルで下方制御することができる。このような抗体は、例えば、変異型上のヘテロ二量体形成ドメインまたは推定リガンド結合ドメインに指向することができる。抗体および抗体の生成方法のさらなる説明を以下に示す。   Alternatively, a polypeptide variant of the invention may be made using a downregulator such as an antibody or antibody fragment (ie a neutralizing antibody) capable of specifically binding to the polypeptide of the invention and inhibiting its activity. Can be downregulated at the polypeptide level. Such antibodies can, for example, be directed to the heterodimerization domain or putative ligand binding domain on the variant. Further descriptions of antibodies and methods of generating antibodies are provided below.

薬学的組成物およびその送達
本発明は、治療有効量の本発明の治療薬(好ましくは、本明細書中に記載の治療タンパク質変異型である)を含む薬学的組成物を特徴とする。任意選択的およびあるいは、治療薬は、治療タンパク質変異型を特異的に認識して結合するが、対応する公知の全長タンパク質に対してはそうではない抗体またはオリゴヌクレオチドであり得る。
Pharmaceutical compositions and their delivery The invention features pharmaceutical compositions comprising a therapeutically effective amount of a therapeutic of the invention, which is preferably a therapeutic protein variant as described herein. Optionally and alternatively, the therapeutic agent may be an antibody or oligonucleotide that specifically recognizes and binds a therapeutic protein variant but not to a corresponding known full-length protein.

あるいは、本発明の薬学的組成物は、治療有効量の治療タンパク質変異ポリペプチドの少なくとも活性部分を含む。   Alternatively, the pharmaceutical composition of the invention comprises at least an active portion of a therapeutically effective amount of a therapeutic protein variant polypeptide.

本発明の薬学的組成物を、クラスター関連疾患の治療のために使用することが好ましい。   It is preferred to use the pharmaceutical composition of the invention for the treatment of cluster related diseases.

「治療」は、治療上の処置および予防手段または防止手段をいう。治療を必要とする者には、既に障害を罹患している者および障害を防止すべき者が含まれる。したがって、本明細書中で治療すべき哺乳動物は、障害を罹患していると診断され得るか、障害を罹患しやすいか障害が疑われ得る。治療を目的とする「哺乳動物」は、哺乳動物として分類される任意の動物(ヒト、家畜、動物園の動物、競技用の動物、またはペット(イヌ、ウマ、ネコ、ウシなど)が含まれる)をいう。好ましくは、哺乳動物はヒトである。   "Treatment" refers to therapeutic treatment and prophylactic or preventative measures. Those in need of treatment include those already with the disorder and those in which the disorder is to be prevented. Thus, the mammal to be treated herein may be diagnosed as suffering from a disorder or may be susceptible to or suspected of being a disorder. A "mammal" for therapeutic purposes is any animal classified as a mammal, including humans, livestock, zoo animals, competition animals, or pets (such as dogs, horses, cats, cows, etc.) Say Preferably, the mammal is a human.

「障害」は、本発明の薬剤を使用した治療から利益を得るであろう任意の容態である。これには、慢性および急性障害または疾患(哺乳動物が問題の障害を罹患しやすい病的状態が含まれる)含まれる。本明細書中の治療すべき障害の非限定的な例を、本明細書中に記載の特定の例に関して記載する。   A "disorder" is any condition that would benefit from treatment with an agent of the present invention. This includes chronic and acute disorders or diseases, including those pathological conditions which predispose a mammal to the disorder in question. Non-limiting examples of disorders to be treated herein are described with respect to the specific examples described herein.

用語「治療有効量」は、哺乳動物の疾患または障害を有効に治療する本発明の薬剤の量をいう。癌の場合、治療有効量の薬剤により、癌細胞数が減少し、腫瘍サイズが減少し、癌細胞の周辺組織への浸潤を阻害し(すなわち、拡大が幾らか遅延し、好ましくは停止する)、腫瘍の転移を阻害し(すなわち、拡大が幾らか遅延し、好ましくは停止する)、腫瘍成長の拡大を幾らか阻害し、そして/または癌に関連する1つまたは複数の症状の拡大をいくらか緩和することができる。薬剤が既存の癌細胞の成長を防止し、そして/または死滅させることができる範囲で、細胞増殖抑制性および/または細胞傷害性を示し得る。癌療法のために、有効性を、例えば、疾患の進行(TTP)の評価および/または応答率(RR)の決定によって測定することができる。   The term "therapeutically effective amount" refers to the amount of an agent of the invention that effectively treats a disease or disorder in a mammal. In the case of cancer, a therapeutically effective amount of the drug reduces the number of cancer cells, reduces the size of the tumor, and inhibits invasion of the cancer cells into surrounding tissues (ie, some delay, preferably arresting, of spread). Inhibits tumor metastasis (ie, slows, preferably arrests) spread, inhibits some growth of tumor growth, and / or some spread of one or more symptoms associated with cancer It can be relaxed. To the extent the drug can prevent the growth of existing cancer cells and / or kill it, it can exhibit cytostatic and / or cytotoxic properties. For cancer therapy, efficacy can be measured, for example, by assessment of disease progression (TTP) and / or determination of response rate (RR).

本発明の治療薬を、被験体自体に投与することができるか、薬学的に許容可能なキャリアと混合した薬学的組成物の一部として投与することができる。   The therapeutic agents of the present invention can be administered to the subject itself, or can be administered as part of a pharmaceutical composition mixed with a pharmaceutically acceptable carrier.

本明細書中で使用される、「薬学的組成物」は、生理学的に適切なキャリアおよび賦形剤などの他の化学成分を含む本明細書中に記載の1つまたは複数の有効成分の調製物をいう。薬学的組成物の目的は、生物への化合物の投与を容易にすることである。   As used herein, a "pharmaceutical composition" is one or more of the active ingredients described herein, including other chemical ingredients such as physiologically relevant carriers and excipients. It refers to a preparation. The purpose of a pharmaceutical composition is to facilitate administration of a compound to an organism.

本明細書中に記載の用語「有効成分」は、生物学的効果を担う調製物をいう。   The term "active ingredient" as described herein refers to a preparation responsible for biological effects.

以後、交換可能に使用することができる句「生理学的に許容可能なキャリア」および「薬学的に許容可能なキャリア」は、生物に有意な炎症を引き起こさず、且つ生物活性およびおよび投与した化合物の性質を無効にしないキャリアまたは希釈剤をいう。アジュバントは、これらの句に含まれる。薬学的に許容可能なキャリアに含まれる成分の1つは、例えば、ポリエチレングリコール(PEG)(有機媒体および水性媒体の両方に広範な溶解性を示す生体適合ポリマー)であり得る(Mutter et al.(1979)。   Hereinafter, the phrases "physiologically acceptable carrier" and "pharmaceutically acceptable carrier", which can be used interchangeably, do not cause significant inflammation in the organism and are biologically active and and of the compounds administered. Carrier or diluent that does not invalidate the property. Adjuvants are included in these phrases. One of the components included in the pharmaceutically acceptable carrier may be, for example, polyethylene glycol (PEG) (a biocompatible polymer exhibiting wide solubility in both organic and aqueous media) (Mutter et al. (1979).

本明細書中の用語「賦形剤」は、有効成分の投与をさらに容易にするために薬学的組成物に添加される不活性物質をいう。制限されない賦形剤の例には、炭酸カルシウム、リン酸カルシウム、種々の糖およびデンプン型、セルロース誘導体、ゼラチン、植物油、ならびにポリエチレングリコールが含まれる。   The term "excipient" as used herein refers to an inert substance added to a pharmaceutical composition to further facilitate administration of the active ingredient. Examples of non-limiting excipients include calcium carbonate, calcium phosphate, various sugar and starch types, cellulose derivatives, gelatin, vegetable oils and polyethylene glycols.

薬物の処方および投与技術を、"Remington’s Pharmaceutical Sciences," Mack Publishing Co.,Easton,PA,latest edition(本明細書中で参考として援用される)に見出すことができる。   Drug formulation and administration techniques are described in "Remington's Pharmaceutical Sciences," Mack Publishing Co. , Easton, PA, latest edition (incorporated herein by reference).

適切な投与経路には、例えば、経口、直腸、経粘膜(特に、経鼻、腸)、または非経口送達(筋肉内、皮下、および脊髄内が含まれる)、および髄腔内、直接脳室内、静脈内、腹腔内、鼻腔内、または眼内注射が含まれる。あるいは、全身様式よりもむしろ、例えば、患者の身体の特定の領域への直接的な調製物の注射によって局所的に調製物を投与することができる。   Suitable routes of administration include, for example, oral, rectal, transmucosal (in particular, nasal, enteral), or parenteral delivery (including intramuscular, subcutaneous and intraspinal), and intrathecal, direct intracerebroventricular Intravenous, intraperitoneal, intranasal, or intraocular injection. Alternatively, rather than being in a systemic fashion, the preparation can be administered locally, for example, by injection of the preparation directly into a specific area of the patient's body.

本発明の薬学的組成物を、当該分野で周知のプロセス(例えば、従来の混合、溶解、顆粒化、ドラジェ作製、粉末化、乳化、カプセル化、捕捉、または凍結乾燥プロセス)によって製造することができる。   The pharmaceutical compositions of the invention may be manufactured by processes well known in the art, such as conventional mixing, dissolving, granulating, dragee-making, powdering, emulsifying, encapsulating, entrapping or lyophilizing processes. it can.

本発明で使用される薬学的組成物を、有効成分の薬学的に使用することができる調製物への処理を容易にする賦形剤および助剤を含む1つまたは複数の生理学的に許容可能なキャリアを使用した従来の様式で処方することができる。適切な処方物は、選択した投与経路に依存する。   One or more physiologically acceptable including excipients and auxiliaries that facilitate the processing of the active ingredient into a pharmaceutically usable preparation of the pharmaceutical composition used in the present invention Can be formulated in a conventional manner using different carriers. Proper formulation is dependent upon the route of administration chosen.

注射のために、本発明の有効成分を、水溶液、好ましくは、ハンクス液、リンゲル液、または生理食塩水等の生理学的に適合可能な緩衝液中に処方することができる。経粘膜投与のために、透過すべき障壁に適切な浸透剤を処方に使用する。このような浸透剤は、当該分野で公知である。   For injection, the active ingredient of the present invention can be formulated in an aqueous solution, preferably a physiologically compatible buffer such as Hanks's solution, Ringer's solution, or saline. For transmucosal administration, penetrants appropriate to the barrier to be permeated are used in the formulation. Such penetrants are known in the art.

経口投与のために、化合物を、活性化合物と当該分野で周知の薬学的に許容可能なキャリアとの組み合わせによって容易に処方することができる。このようなキャリアにより、本発明の化合物を、患者が経口摂取するための錠剤、丸薬、ドラジェ、カプセル、液体、ゲル、シロップ、および懸濁液などとして処方することができる。固体賦形剤を使用して経口用の薬理学的調製物を作製することができ、任意選択的に、得られた混合物を摩砕し、所望ならばその後適切な助剤を添加して顆粒混合物を処理し、錠剤またはドラジェコアを得ることができる。適切な賦形剤は、特に、糖(ラクトース、スクロース、マンニトール、またはソルビトールが含まれる)などの充填剤、例えば、トウモロコシデンプン、コムギデンプン、コメデンプン、ジャガイモデンプン、ゼラチン、トラガカントガム、メチルセルロース、ヒドロキシプロピルメチルセルロース、カルボメチルセルロースナトリウムなどのセルロース調製物、および/またはポリビニルピロリドン(PVP)などの生理学的に許容可能なポリマーである。所望ならば、架橋ポリビニルピロリドン、寒天、またはアルギン酸もしくはアルギン酸ナトリウムなどのその塩などの崩壊剤を添加することができる。   For oral administration, the compounds can be formulated readily by combining the active compounds with pharmaceutically acceptable carriers well known in the art. Such carriers enable the compounds of the invention to be formulated as tablets, pills, dragees, capsules, liquids, gels, syrups, suspensions, and the like, for ingestion by the patient. Solid excipients can be used to make a pharmacological preparation for oral use, and optionally, the resulting mixture is milled and, if desired, subsequently granulated with the addition of suitable auxiliaries The mixture can be processed to obtain tablets or dragee cores. Suitable excipients are, in particular, fillers such as sugars, including lactose, sucrose, mannitol or sorbitol, eg corn starch, wheat starch, rice starch, potato starch, gelatine, tragacanth gum, methylcellulose, hydroxypropyl Cellulose preparations such as methylcellulose, sodium carbomethylcellulose and / or physiologically acceptable polymers such as polyvinylpyrrolidone (PVP). If desired, disintegrating agents may be added, such as crosslinked polyvinyl pyrrolidone, agar, or alginic acid or a salt thereof such as sodium alginate.

適切なコーティングを使用してドラジェコアが得られる。この目的のために、任意選択的に、アラビアゴム、タルク、ポリビニルピロリドン、カルボポールゲル、ポリエチレングリコール、二酸化チタン、ラッカー液、および適切な有機溶媒または溶媒混合物を含み得る濃縮糖溶液を使用することができる。活性化合物の用量の異なる組み合せの識別または特徴づけのために、錠剤またはドラジェコーティングに染料または色素を添加することができる。   The dragee core is obtained using a suitable coating. For this purpose, optionally using concentrated sugar solutions which may comprise gum arabic, talc, polyvinyl pyrrolidone, carbopol gel, polyethylene glycol, titanium dioxide, lacquer liquids and suitable organic solvents or solvent mixtures Can. Dyestuffs or pigments may be added to the tablets or dragee coatings for identification or characterization of different combinations of active compound doses.

経口で使用することができる薬学的組成物には、ゼラチンおよび軟ゼラチン製の押し込み型カプセル、ゼラチンおよび可塑剤(グリセロールまたはソルビトールなど)から作製された密閉カプセルが含まれる。押し込み型カプセルは、ラクトースなどの充填剤、デンプンなどの結合剤、タルクまたはステアリン酸マグネシウムなどの潤滑剤、および任意選択的に安定剤との混合物中に有効成分を含み得る。軟カプセルでは、有効成分を、脂肪油、液体パラフィン、または液体ポリエチレングリコール等の適切な液体中に溶解または懸濁することができる。さらに、安定剤を添加することができる。経口投与用の全処方物は、選択された投与経路に適切な投薬量であるべきである。   Pharmaceutical compositions that can be used orally include push-fit capsules made of gelatin and soft gelatin, and sealed capsules made of gelatin and a plasticizer, such as glycerol or sorbitol. Push-fit capsules can comprise the active ingredient in admixture with a filler such as lactose, a binder such as starch, a lubricant such as talc or magnesium stearate, and optionally a stabilizer. In soft capsules, the active ingredient can be dissolved or suspended in suitable liquids, such as fatty oils, liquid paraffin, or liquid polyethylene glycols. In addition, stabilizers can be added. All formulations for oral administration should be in dosages suitable for the chosen route of administration.

口内投与のために、組成物は、従来の様式で処方された錠剤またはロゼンジの形態をとることができる。   For buccal administration, the compositions can take the form of tablets or lozenges formulated in a conventional manner.

鼻孔吸入による投与のために、本発明で使用される有効成分を、適切な噴射剤(例えば、ジクロロジフルオロメタン、トリクロロフルオロメタン、ジクロロ−テトラフルオロエタン、または二酸化炭素)を使用した加圧パックまたは噴霧器由来のエアゾールスプレー調製物の形態で都合よく送達される。加圧エアゾールの場合、一定量を送達するためのバルブを設置することによって、投薬単位を決定することができる。化合物とラクトースまたはデンプン等の適切な粉末基剤との粉末混合物を含む、例えば、投薬用のゼラチンのカプセルおよび薬包を処方することができる。   For administration by nasal inhalation, the active ingredient used in the present invention can be pressurized packed with a suitable propellant (eg dichlorodifluoromethane, trichlorofluoromethane, dichloro-tetrafluoroethane or carbon dioxide) or It is conveniently delivered in the form of an aerosol spray preparation derived from a sprayer. In the case of a pressurized aerosol, the dosage unit can be determined by providing a valve to deliver a metered amount. Capsules and cartridges of, eg, gelatin for administration can be formulated containing a powder mix of the compound and a suitable powder base such as lactose or starch.

本明細書中に記載の調製物を、例えば、ボーラス注射または持続注入による非経口投与のために処方することができる。注射用処方物は、任意選択的に防腐剤を添加した単位投薬形態(例えば、アンプルまたは複数回投与容器)で存在し得る。組成物は、油性または水性媒体の懸濁液、溶液、または乳濁液であってよく、懸濁剤、安定剤、および/または分散剤などの処方薬(formulatory agent)を含み得る。   The preparations described herein can be formulated for parenteral administration, eg, by bolus injection or continuous infusion. Formulations for injection may be present in unit dosage form (eg, ampoules or multiple dose containers), optionally with an added preservative. The compositions may be suspensions, solutions or emulsions of oily or aqueous vehicles, and may contain formulatory agents such as suspending, stabilizing and / or dispersing agents.

非経口投与用の薬学的組成物には、水溶性形態の活性調製物水溶液が含まれる。さらに、有効成分の懸濁液を、適切な油性または水ベースの懸濁液として調製することができる。適切な親油性溶媒または媒体には、ゴマ油などの脂肪油またはオレイン酸エチル、トリグリセリド、またはリポソーム等の合成脂肪酸エステルが含まれる。注射用水性懸濁液は、カルボキシメチルセルロースナトリウム、ソルビトール、またはデキストランなどの懸濁液の粘度を増加させる物質を含み得る。任意選択的に、懸濁液はまた、高度に濃縮された溶液を調製するために有効成分の溶解性を増加させる適切な安定剤または薬剤を含み得る。   Pharmaceutical compositions for parenteral administration include aqueous solutions of the active preparation in water-soluble form. Additionally, suspensions of the active ingredients can be prepared as appropriate oily or water based suspensions. Suitable lipophilic solvents or vehicles include fatty oils such as sesame oil or synthetic fatty acid esters such as ethyl oleate, triglycerides, or liposomes. Aqueous injection suspensions may contain substances that increase the viscosity of the suspension, such as sodium carboxymethyl cellulose, sorbitol, or dextran. Optionally, the suspension may also contain suitable stabilizers or agents which increase the solubility of the active ingredients in order to prepare a highly concentrated solution.

あるいは、有効成分は、使用前に、適切な媒体(例えば、滅菌した無発熱物質ベースの溶液)で構成するための粉末形態であり得る。   Alternatively, the active ingredient may be in powder form for constitution with a suitable vehicle, such as a sterile, pyrogen-free solution, before use.

本発明の調製物を、例えば、ココアバターまたは他のグリセリドなどの従来の座剤の基剤を使用した座剤または保留浣腸などの直腸組成物で処方することもできる。   The preparations of the present invention can also be formulated in rectal compositions such as suppositories or retention enemas, using, for example, conventional suppository bases such as cocoa butter or other glycerides.

本発明の状況での使用に適切な薬学的組成物には、意図する目的を達成するための有効量の有効成分を含む組成物が含まれる。より詳細には、治療有効量は、疾患の症状を予防、緩和、または改善するか、治療を受ける被験体の生存を延長するのに有効な有効成分の量を意味する。   Pharmaceutical compositions suitable for use in the context of the present invention include compositions comprising an effective amount of the active ingredient to achieve the intended purpose. More specifically, a therapeutically effective amount means an amount of the active ingredient effective to prevent, alleviate or ameliorate the symptoms of the disease or prolong the survival of the subject being treated.

治療有効量の決定は、十分に当業者の能力の範囲内である。   Determination of a therapeutically effective amount is well within the ability of one of ordinary skill in the art.

本発明の方法で使用された任意の調製物のために、治療有効量または用量を、最初にin vitroアッセイから評価することができる。例えば、用量を動物モデルで決定し、このような情報を使用してヒトで有用な用量をより正確に決定することができる。   For any preparation used in the methods of the invention, the therapeutically effective amount or dose can be estimated initially from in vitro assays. For example, doses can be determined in animal models and such information can be used to more accurately determine useful doses in humans.

本明細書中に記載の有効成分の毒性および治療有効性を、in vitroでの標準的な薬学的手順、細胞培養、または実験動物によって決定することができる。これらのin vitroアッセイおよび細胞培養アッセイならびに動物研究から得たデータを、ヒトで用いる投薬量範囲の決定で使用することができる。投薬量は、使用した投薬形態および使用した投与経路によって変化し得る。正確な処方物、投与経路、および投薬量を、患者の状態を考慮して各医師が選択することができる(例えば、Fingl,et al.,1975,in "The Pharmacological Basis of Therapeutics",Ch.1 p.1を参照のこと)。   The toxicity and therapeutic efficacy of the active ingredients described herein can be determined by standard pharmaceutical procedures in vitro, cell culture, or experimental animals. The data obtained from these in vitro and cell culture assays and animal studies can be used in the determination of dosage ranges for use in humans. The dosage may vary depending upon the dosage form employed and the route of administration utilized. The exact formulation, route of administration and dosage can be chosen by the individual physician in view of the patient's condition (see, eg, Fingl, et al., 1975, in "The Pharmacologic Basis of Therapeutics", Ch. 1) See p. 1).

治療すべき容態の重症度および応答性に依存して、投与は、単回投与または複数回投与であり、数日から数週間または治癒するか病態の軽減が達成されるまで治療が続けることができる。   Depending on the severity and responsiveness of the condition to be treated, administration may be single or multiple doses, and treatment may continue for several days to several weeks or until healing or relief of the condition is achieved. it can.

組成物の投与量は、勿論、治療を受ける被験体、苦痛の重症度、投与様式、主治医の判断に依存する。   The amount of composition administered will, of course, be dependent on the subject being treated, on the severity of the affliction, on the manner of administration and on the judgment of the attending physician.

適合可能な薬学的キャリア中に処方された本発明の調製物を含む組成物を、適用される病態の治療のために調製し、適切なキャリア中に配置し、ラベルをつけることができる。   A composition comprising a preparation of the invention formulated in a compatible pharmaceutical carrier can be prepared for treatment of the applied condition, placed in a suitable carrier and labeled.

本発明の薬学的組成物を、所望ならば、有効成分を含む1つまたは複数の単位投薬形態を含み得るFDA承認キットなどのパックまたは分注デバイス中に入れることができる。パックは、例えば、金属箔またはプラスチック箔を含み得る(ブリスターパックなど)。パックまたは分注器を、政府機関による製造、医薬品の使用または販売に関する規制にしたがって処方された形態で容器に付随する通知に適合させることもでき、通知は、組成物の形態またはヒトもしくは動物への投与についての政府による承認を反映する。このような通知は、例えば、薬物の処方について米国食品医薬品局によって承認された表示または承認された製品の挿入物であり得る。   The pharmaceutical compositions of the invention may, if desired, be packaged in a pack or dispensing device such as an FDA approved kit which may contain one or more unit dosage forms containing the active ingredient. The pack may, for example, comprise metal or plastic foil (such as a blister pack). The pack or dispenser may also be adapted to the notification accompanying the container in the form prescribed according to the regulations on the manufacture, use or sale of medicines by government agencies, the notification may be in the form of a composition or to a human or animal. Reflect government approval for the administration of Such notification may be, for example, an insert of a labeled or approved product approved by the U.S. Food and Drug Administration for prescription of a drug.

免疫原性組成物
本発明の治療薬は、任意選択的に、被験体における本発明のポリペプチドの少なくとも1つに対する特異的免疫原性応答を促進する分子であり得る。分子は、本発明のポリペプチド変異型、これに由来するフラグメント、またはこれをコードする核酸配列であり得る。このような分子を被験体自身に投与することができるが、薬剤を、免疫原性組成物中で免疫賦活剤と共に投与することが好ましい。免疫賦活剤は、外因性抗原に対する免疫応答(抗体および/または細胞媒介性)を増強または強化する任意の物質であり得る。免疫賦活剤の例には、化合物が組み込まれるアジュバント、生分解性ミクロスフィア(例えば、ポリ乳酸ガラクチド)、およびリポソームが含まれる(例えば、米国特許第4,235,877号を参照のこと)。ワクチン調製物は、一般に、例えば、M.F.Powell and M.J.Newman,eds.,"Vaccine Design(the subunit and adjuvant approach),"Plenum Press(NY,1995)に記載されている。
Immunogenic Compositions The therapeutic agents of the invention may optionally be molecules that promote a specific immunogenic response in the subject to at least one of the polypeptides of the invention. The molecule may be a polypeptide variant of the invention, a fragment derived therefrom, or a nucleic acid sequence encoding the same. While such molecules can be administered to the subject itself, it is preferred to administer the agent in combination with an immunostimulatory agent in an immunogenic composition. The immunostimulatory agent can be any substance that enhances or potentiates the immune response (antibody and / or cell mediated) to the exogenous antigen. Examples of immunostimulatory agents include adjuvants into which the compound is incorporated, biodegradable microspheres (eg, polylactide galactide), and liposomes (see, eg, US Pat. No. 4,235,877). Vaccine preparations are generally, for example, M. F. Powell and M. J. Newman, eds. , "Vaccine Design (the subunit and adjuvant approach)," Plenum Press (NY, 1995).

例示的免疫原性組成物は、ポリペプチドがin situで生成するように、1つまたは複数の上記のポリペプチドをコードするDNAを含み得る。DNAは、当業者に公知の任意の種々の送達系(核酸発現系(以下を参照のこと)、細菌およびウイルス発現系が含まれる)に存在し得る。多数の遺伝子送達技術(Rolland,Crit.Rev.Therap.Drug Carrier Systems 15:143−198,1998およびその参考文献に記載のものなど)が当該分野で周知である。適切な核酸発現系は、被験体中での発現に必要なDNA配列(適切なプロモーターおよび終結シグナルなど)を含む。細菌送達系は、その細胞表面上のポリペプチドの免疫原性部分を発現するか、このようなエピトープを分泌する細菌(カルメット・ゲラン菌など)の投与を含む。好ましい実施形態では、DNAを、ウイルス発現系(例えば、ワクシニアもしくは他のポックスウイルス、レトロウイルス、またはアデノウイルス)を使用して移入することができ、非病原性(欠損)複製コンピテントウイルスの使用を含み得る。適切な系は、例えば、Fisher−Hoch et al.,Proc.Natl.Acad.Sci.USA 86:317−321,1989;Flexner et al.,Ann.N.Y Acad.Sci.569:86−103,1989;Flexner et al.,Vaccine 8:17−21,1990;米国特許第4,603,112、同第4,769,330号、および同第5,017,487号、WO 89/01973;米国特許第4,777,127号;英国特許第2,200,651号;欧州特許第0,345,242号;WO91/02805;Berkner,Biotechniques 6:616−627,1988;Rosenfeld et al.,Science 252:431−434,1991;Kolls et al.,Proc.Natl.Acad.Sci.USA 91:215−219,1994;Kass−Eisler et al.,Proc.Natl.Acad.Sci.USA 90:11498−11502,1993;Guzman et al.,Circulation 88:2838−2848,1993;およびGuzman et al.,Cir.Res.73:1202−1207,1993に開示されている。DNAをこのような発現系に組み込む技術は、当業者に周知である。例えば、Ulmer et al.,Science 259:1745−1749,1993に記載され、Cohen,Science 259:1691−1692,1993に概説されるように、DNAを、「裸にする」こともできる。裸のDNAの取り込みを、生分解性ビーズにDNAをコーティングし、細胞に有効に輸送することによって増加させることができる。   Exemplary immunogenic compositions can include DNA encoding one or more of the above polypeptides, such that the polypeptide is generated in situ. The DNA may be present in any of a variety of delivery systems known to those skilled in the art, including nucleic acid expression systems (see below), bacterial and viral expression systems. A number of gene delivery technologies (such as those described in Rolland, Crit. Rev. Therap. Drug Carrier Systems 15: 143- 198, 1998 and references therein) are well known in the art. Suitable nucleic acid expression systems include DNA sequences necessary for expression in a subject, such as appropriate promoters and termination signals. Bacterial delivery systems involve the administration of bacteria (such as Calmette-Guerin bacteria) that express an immunogenic portion of the polypeptide on its cell surface or secrete such an epitope. In a preferred embodiment, the DNA can be transferred using a viral expression system (eg vaccinia or other pox virus, a retrovirus, or an adenovirus), and the use of a non-pathogenic (defective) replication competent virus May be included. Suitable systems are described, for example, by Fisher-Hoch et al. , Proc. Natl. Acad. Sci. USA 86: 317-321, 1989; Flexner et al. , Ann. N. Y Acad. Sci. 569: 86-103, 1989; Flexner et al. Vaccine 8: 17-21, 1990; U.S. Pat. Nos. 4,603,112, 4,769,330, and 5,017,487, WO 89/01973; U.S. Pat. British Patent No. 2,200,651; European Patent No. 0,345,242; WO 91/02805; Berkner, Biotechniques 6: 616-627, 1988; Rosenfeld et al. , Science 252: 431-434, 1991; Kolls et al. , Proc. Natl. Acad. Sci. USA 91: 215-219, 1994; Kass-Eisler et al. , Proc. Natl. Acad. Sci. USA 90: 11498-11502, 1993; Guzman et al. , Circulation 88: 2838-2848, 1993; and Guzman et al. , Cir. Res. 73: 1202-1207, 1993. Techniques for incorporating DNA into such expression systems are well known to those skilled in the art. See, for example, Ulmer et al. The DNA can also be "naked", as described in, Science 259: 1745-1749, 1993, and outlined in Cohen, Science 259: 1691-1692, 1993. Uptake of naked DNA can be increased by coating the DNA on biodegradable beads and effectively transporting it to cells.

免疫原性組成物がポリヌクレオチド成分およびポリペプチド成分の両方を含むことができることが認識される。このような免疫原性組成物は、免疫応答を増強することができる。   It will be appreciated that the immunogenic composition can comprise both polynucleotide and polypeptide components. Such immunogenic compositions can enhance the immune response.

任意の種々の免疫賦活剤を、本発明の免疫原性組成物で使用することができる。例えば、アジュバントを含むことができる。ほとんどのアジュバントは、急速な代謝から抗原を保護するためにデザインされた物質(水酸化アルミニウムまたは鉱物油)および免疫応答の刺激物質(脂質A、百日咳菌または結核菌由来のタンパク質など)を含む。適切なアジュバントは、例えば、フロイントの不完全アジュバントおよび完全アジュバント(Difco Laboratories,Detroit,Mich.)、Merckアジュバント65(Merck and Company,Inc.,Rahway,N.J.)、AS−2(SmithKline Beecham,Philadelphia,Pa.)、水酸化アルミニウムゲル(ミョウバン)またはリン酸アルミニウムなどのアルミニウム塩、カルシウム塩、鉄、または亜鉛の塩、アシル化チロシンの不溶性懸濁液、アシル化糖、カチオン性またはアニオン性誘導多糖類、ポリホスファゼン、生分解性ミクロスフィア、モノホスホリル脂質AおよびquiAとして市販されている。GM−CSFまたはインターロイキン−2、−7、もしくは−12などのサイトカインもアジュバントとして使用することができる。   Any of a variety of immunostimulatory agents can be used in the immunogenic compositions of the present invention. For example, an adjuvant can be included. Most adjuvants include substances designed to protect the antigen from rapid metabolism (aluminum hydroxide or mineral oil) and stimulators of the immune response (such as lipid A, proteins from B. pertussis or M. tuberculosis). Suitable adjuvants are, for example, Freund's incomplete and complete adjuvants (Difco Laboratories, Detroit, Mich.), Merck adjuvant 65 (Merck and Company, Inc., Rahway, NJ), AS-2 (SmithKline Beecham). (Philadelphia, Pa.), Aluminum salts such as aluminum hydroxide gel (alum) or aluminum phosphate, calcium salts, salts of iron or zinc, insoluble suspensions of acylated tyrosines, acylated sugars, cationic or anions It is commercially available as sex derived polysaccharides, polyphosphazenes, biodegradable microspheres, monophosphoryl lipids A and quiA. GM-CSF or cytokines such as interleukin-2, -7 or -12 can also be used as an adjuvant.

アジュバント組成物を、Th1型の免疫応答を支配的に誘導するようにデザインすることができる。高レベルのTh1型サイトカイン(例えば、IFN−γ、TNF−α、IL−2、およびIL−12)は、投与した抗原に対して細胞性免疫応答を誘導する傾向がある。対照的に、高レベルのTh2型サイトカイン(例えば、IL−4、IL−5、IL−6、およびIL−10)は体液性免疫を誘導する傾向がある。本明細書中に記載の免疫原性組成物の適用後、被験体は、Th1型応答およびTh2型応答を誘導する免疫応答を支持する。これらのサイトカインのレベルを、標準的なアッセイを使用して容易に評価することができる。サイトカインファミリーの概説については、Mosmann and Coffinan,Ann.Rev.Immunol.7:145−173,1989を参照のこと。   Adjuvant compositions can be designed to predominantly induce Th1-type immune responses. High levels of Th1-type cytokines (e.g. IFN- [gamma], TNF- [alpha], IL-2 and IL-12) tend to induce a cellular immune response against the administered antigen. In contrast, high levels of Th2-type cytokines (eg, IL-4, IL-5, IL-6, and IL-10) tend to induce humoral immunity. Following application of the immunogenic compositions described herein, the subject supports an immune response that induces a Th1-type response and a Th2-type response. The levels of these cytokines can be easily assessed using standard assays. For a review of the cytokine family, see Mosmann and Coffinan, Ann. Rev. Immunol. 7: 145-173, 1989.

Th1型応答の支配的な誘発で用いる好ましいアジュバントには、例えば、モノホスホリル脂質A(好ましくは、3−de−Oアシル化モノホスホリル脂質A(3D−MPL))とアルミニウム塩との組み合わせが含まれる。MPLアジュバントは、Corixa Corporationから市販されている(Seattle,Wash.、米国特許第4,436,727号、同第4,877,611号、同第4,866,034号、および同第4,912,094号を参照のこと)。CpG含有オリゴヌクレオチド(CpGジヌクレオチドが非メチル化されている)もTh1応答を支配的に誘導する。このようなオリゴヌクレオチドは当該分野で周知であり、例えば、WO96/02555号、WO 99/33488号、ならびに米国特許第6,008,200号および同第5,856,462号に記載されている。免疫促進性DNA配列はまた、例えば、Sato et al.,Science 273:352,1996に記載されている。別の好ましいアジュバントはサポニン(好ましくは、QS21(Aquila Biopharmaceuticals Inc.,Framingham,Mass.))であり、これは、単独または他のアジュバントと組み合わせて使用することができる。例えば、増強された系は、モノホスホリル脂質Aとサポニン誘導体との組み合わせ(WO 94/00153に記載のQS21と3D−MPLとの組み合わせまたはWO 96/33739号に記載のQ21がコレステロールで抑制されたより反応性の低い組み合わせなど)を含む。他の好ましい処方物は、水中油滴型乳濁液およびトコフェロールを含む。QS21、3D−MPL、およびトコフェロールを含む水中油滴型乳濁液を含む特に強力なアジュバント処方物は、WO 95/17210号に記載されている。   Preferred adjuvants for use in predominantly eliciting a Th1-type response include, for example, a combination of monophosphoryl lipid A (preferably 3-de-O acylated monophosphoryl lipid A (3D- MPL)) and an aluminum salt. Be MPL adjuvants are commercially available from Corixa Corporation (Seattle, Wash., US Pat. Nos. 4,436,727, 4,877,611, 4,866,034, and 4, See 912, 094). CpG-containing oligonucleotides (CpG dinucleotides are unmethylated) also predominantly induce Th1 responses. Such oligonucleotides are well known in the art and are described, for example, in WO 96/02555, WO 99/33488, and U.S. Patent Nos. 6,008,200 and 5,856,462. . Immunostimulatory DNA sequences are also described, for example, by Sato et al. , Science 273: 352, 1996. Another preferred adjuvant is saponin (preferably, QS21 (Aquila Biopharmaceuticals Inc., Framingham, Mass.)), Which can be used alone or in combination with other adjuvants. For example, the enhanced system is a combination of monophosphoryl lipid A and a saponin derivative (a combination of QS21 and 3D-MPL described in WO 94/00153 or a cholesterol-suppressed Q21 described in WO 96/33739) (Eg, combinations with low reactivity). Other preferred formulations include oil-in-water emulsions and tocopherols. Particularly potent adjuvant formulations comprising an oil-in-water emulsion comprising QS21, 3D- MPL and tocopherol are described in WO 95/17210.

他の好ましいアジュバントには、Montanide ISA 720(Seppic,France)、SAF(Chiron,Calif.,United States)、ISCOMS(CSL)、MF−59(Chiron)、SBASシリーズのアジュバント(例えば、SmithKline Beecham,Rixensart,Belgiumから市販されているSBAS−2またはSBAS−4)、Detox(Corixa,Hamilton,Mont.)、RC−529(Corixa,Hamilton,Mont.)、および他のアミノアルキルグルコサミニド四リン酸(AGP)(係属中の米国特許出願番号08/853,826号および同第09/074,720号に記載のものなど)が含まれる。   Other preferred adjuvants include Montanide ISA 720 (Seppic, France), SAF (Chiron, Calif., United States), ISCOMS (CSL), MF-59 (Chiron), adjuvants of the SBAS series (eg SmithKline Beecham, Rixensart) , SBAS-2 or SBAS-4 commercially available from Belgium, Detox (Corixa, Hamilton, Mont.), RC-529 (Corixa, Hamilton, Mont.), And other aminoalkyl glucosaminide tetraphosphates (Corixa, Hamilton, Mont.) AGP) (such as those described in copending U.S. patent application Ser. Nos. 08 / 853,826 and 09 / 074,720).

送達体(delivery vehicle)を本発明の免疫原性組成物内で使用して、腫瘍細胞をターゲティングする抗原特異的免疫応答を容易にすることができる。送達体には、抗原提示細胞(APC)(樹状細胞、マクロファージ、B細胞、単球など)およびAPCを効率的にするように操作することができる他の細胞が含まれる。このような細胞を、抗原提示能力を増加させ、活性化および/またはT細胞応答の維持を改良し、それ自体が抗腫瘍効果を有し、そして/またはレシーバと免疫学的に適合するように遺伝子操作することができる。APCを、一般に、任意の種々の生体液(腫瘍および腫瘍周辺組織が含まれる)から単離することができ、これらは、自系細胞、同種異型細胞、同系細胞、または異種細胞であり得る。   Delivery vehicles can be used within the immunogenic compositions of the invention to facilitate antigen-specific immune responses that target tumor cells. Delivery vehicles include antigen presenting cells (APCs) (dendritic cells, macrophages, B cells, monocytes etc) and other cells that can be engineered to make APC efficient. Such cells increase antigen presentation capacity, improve activation and / or maintenance of T cell responses, have anti-tumor effects per se and / or become immunologically compatible with the receiver It can be genetically engineered. APCs can generally be isolated from any of a variety of biological fluids, including tumors and tumor surrounding tissues, which can be autologous cells, allogeneic cells, syngeneic cells, or xenogeneic cells.

樹状細胞は、非常に強力なAPCであり(Banchereau and Steinman,Nature 392:245−251,1998)、予防的または治療的抗腫瘍免疫を誘発するための生理学的アジュバントとして有効であることが示されている(Timmernan and Levy,Ann.Rev.Med.50:507−529,1999を参照のこと)。一般に、樹状細胞を、その典型的な形状(in situで星形、in vitroで認められる際立った細胞質突起(樹状突起))、効率の良い抗原の取り込み、処理、および提示能力、ならびにナイーブT細胞応答を活性化する能力に基づいて同定することができる。樹状細胞を、勿論、in vivoまたはex vivoにて樹状細胞上で一般に見出されない特異的な細胞表面受容体またはリガンドを発現するように操作することができ、このような修飾樹状細胞は、本発明で意図される。樹状細胞の代わりとして、分泌性小胞である抗原負荷樹状細胞(エキソソームと呼ばれる)を、免疫原性組成物内で使用することができる(Zitvogel et al.,Nature Med.4:594−600,1998を参照のこと)。   Dendritic cells are very potent APCs (Banchereau and Steinman, Nature 392: 245-251, 1998) and have been shown to be effective as physiological adjuvants for inducing prophylactic or therapeutic anti-tumor immunity (See Timmernan and Levy, Ann. Rev. Med. 50: 507-529, 1999). In general, dendritic cells have their typical shape (star shape in situ, outstanding cytoplasmic processes (dendrites observed in vitro)), efficient antigen uptake, processing, and presentation capabilities, and naive It can be identified based on its ability to activate T cell responses. Dendritic cells can, of course, be engineered to express specific cell surface receptors or ligands not commonly found on dendritic cells in vivo or ex vivo, such modified dendritic cells Is contemplated by the present invention. As an alternative to dendritic cells, antigen-loaded dendritic cells (called exosomes), which are secretory vesicles, can be used in immunogenic compositions (Zitvogel et al., Nature Med. 4: 594-. 600, 1998)).

樹状細胞および前駆体を、末梢血、骨髄、腫瘍浸潤細胞、腫瘍周辺組織浸潤細胞、リンパ節、脾臓、皮膚、臍帯血、または任意の他の適切な組織もしくは流動物から得ることができる。例えば、末梢血から採取した単球の培養物へのGM−CSF、IL−4、IL−13、および/またはTNFαなどのサイトカインの組み合わせの添加によって、樹状細胞をex vivoで分化させることができる。あるいは、末梢血、臍帯血、または骨髄から採取したCD34陽性細胞を、培養液へのGM−CSF、IL−13、TNFα、CD40リガンド、LPS、flt3リガンド、および/または樹状細胞の分化、成熟、および増殖を誘導する他の化合物の組み合わせの添加によって樹状細胞に分化させることができる。   Dendritic cells and precursors can be obtained from peripheral blood, bone marrow, tumor infiltrating cells, peritumoral tissue infiltrating cells, lymph nodes, spleen, skin, cord blood, or any other suitable tissue or fluid. For example, ex vivo differentiation of dendritic cells by adding a combination of cytokines such as GM-CSF, IL-4, IL-13, and / or TNFα to cultures of monocytes collected from peripheral blood it can. Alternatively, differentiation of GM-CSF, IL-13, TNFα, CD40 ligand, LPS, flt3 ligand, and / or dendritic cells into culture solution, CD34 positive cells collected from peripheral blood, umbilical cord blood, or bone marrow may be matured. And dendritic cells can be differentiated by the addition of a combination of other compounds that induce proliferation.

樹状細胞を、「未熟」細胞および「成熟」細胞に分類し、これらは、簡単な方法によって2つの十分に特徴づけられた表現型に区別される。未熟樹状細胞は、高い抗原の取り込みおよび処理能力を有するAPCとして特徴づけられ、この能力は高いFcy受容体およびマンノース受容体発現と相関する。成熟表現型は、典型的には、これらのマーカーの発現はより低いが、クラスIおよびクラスII MHCなどのT細胞活性化を担う細胞表面分子、接着分子(例えば、CD54およびCD11)、ならびに共起刺激分子(例えば、CD40、CD80、CD86、および4−1BB)の発現は高いことを特徴とする。   Dendritic cells are classified into "immature" cells and "mature" cells, which are distinguished by a simple method into two well- characterized phenotypes. Immature dendritic cells are characterized as APCs with high antigen uptake and processing capacity, which correlates with high Fcy receptor and mannose receptor expression. The mature phenotype is typically a lower expression of these markers but cell surface molecules responsible for T cell activation such as class I and class II MHC, adhesion molecules (eg CD54 and CD11), and co-expression Expression of stimulatory molecules (e.g., CD40, CD80, CD86, and 4-1BB) is characterized by high expression.

APCを、一般に、変異型IIまたはその免疫原性部分が細胞表面上に発現するように、本発明のポリペプチドをコードする少なくとも1つのポリヌクレオチドでトランスフェクトすることができる。このようなトランスフェクションはex vivoで起こる可能性があり、本明細書中に記載のように、このようなトランスフェクトされた細胞を含む組成物を、治療目的のために使用することができる。あるいは、樹状細胞または他の抗原提示細胞をターゲティングする遺伝子送達体を被験体に投与し、in vivoでトランスフェクションを起こすことができる。例えば、樹状細胞のin vivoおよびex vivoトランスフェクションを、当該分野で公知の任意の方法(WO 97/24447号に記載の方法またはMahvi et al.,Immunology and cell Biology 75:456−460,1997に記載の遺伝子銃アプローチなど)を使用して行うことができる。樹状細胞または前駆細胞と本発明のポリペプチド、DNA(裸またはプラスミドベクター内)もしくはRNAまたは抗原発現組換え細菌もしくはウイルス(例えば、ワクシニア、鶏痘ウイルス、アデノウイルス、またはレンチウイルスのベクター)とのインキュベーションによって、樹状細胞の抗原負荷を行うことができる。負荷前に、ポリペプチドを、免疫学的パートナーに共有結合させて、上記などのT細胞ヘルプ(例えば、キャリア分子)を得ることができる。あるいは、樹状細胞を、個別またはポリペプチドの存在下で、非抱合免疫学的パートナーでパルスすることができる。   The APCs can generally be transfected with at least one polynucleotide encoding a polypeptide of the invention such that variant II or an immunogenic portion thereof is expressed on the cell surface. Such transfection can occur ex vivo, and as described herein, compositions comprising such transfected cells can be used for therapeutic purposes. Alternatively, gene delivery agents that target dendritic cells or other antigen presenting cells can be administered to a subject and transfection can occur in vivo. For example, in vivo and ex vivo transfection of dendritic cells can be performed according to any method known in the art (the method described in WO 97/24447 or Mahvi et al., Immunology and cell Biology 75: 456-460, 1997). It can be done using the gene gun approach as described in. Dendritic cells or progenitor cells and the polypeptides of the invention, DNA (naked or in a plasmid vector) or RNA or recombinant bacteria or virus expressing an antigen (eg vaccinia, fowlpox virus, adenovirus or lentivirus vector) The antigen loading of dendritic cells can be performed by incubation of Prior to loading, the polypeptide can be covalently linked to an immunological partner to obtain T cell help (eg, a carrier molecule) such as those described above. Alternatively, dendritic cells can be pulsed with unconjugated immunological partners, either individually or in the presence of a polypeptide.

明確にするために個別の実施形態に記載した本発明の一定の特徴を1つの実施形態に組み合わせて提供することもできることが認識される。逆に、明確にするために1つの実施形態に記載した本発明の種々の特徴を、個別または任意の適切なサブコンビネーション中に提供することもできる。   It will be appreciated that certain features of the invention, which are, for clarity, described in the context of separate embodiments, may also be provided in combination in a single embodiment. Conversely, various features of the invention which are, for clarity, described in one embodiment, may also be provided separately or in any suitable subcombination.

本発明をその特定の実施形態と組み合わせて記載しているが、多数の変更形態、修正形態、および変形形態が当業者に自明であることが明白である。したがって、添付の特許請求の範囲の精神および範囲内に含まれるこのような全ての変更形態、修正形態、および変形形態が含まれることが意図される。本明細書中に記載の全ての刊行物、特許、および特許出願は、それぞれ刊行物、特許、および特許出願が具体的且つ個別に本明細書中で参考として援用されることが示されるのと同一の範囲でその全体が本明細書中で参考として援用される。さらに、本明細書中の任意の引例を引用および同定することにより、このような引例が本発明の先行技術として利用可能であると解釈されるべきではない。   Although the invention has been described in conjunction with specific embodiments thereof, it is evident that many alternatives, modifications and variations will be apparent to those skilled in the art. Accordingly, it is intended to embrace all such changes, modifications and variations that fall within the spirit and scope of the appended claims. All publications, patents, and patent applications cited herein are hereby incorporated by reference as if each publication, patent and patent application were specifically and individually incorporated herein by reference. The same range is incorporated herein by reference in its entirety. Moreover, citation and identification of any reference herein should not be construed as being usable as prior art to the present invention.

癌バイオマーカー選択エンジンおよびウェットバリデーション(wet validation)段階の概要のまとめを示す図である。BRIEF DESCRIPTION OF THE DRAWINGS Figure 1 shows a summary of the cancer biomarker selection engine and the wet validation step. 固有の配列領域の有無に基づいた所与のコンティグの転写物の分類を示す略図である。FIG. 5 is a schematic showing the classification of transcripts of a given contig based on the presence or absence of unique sequence regions. 定量的実時間PCR分析の概要のまとめを示す図である。FIG. 1 shows a summary of the quantitative real-time PCR analysis. オリゴヌクレオチドベースのマイクロアレイ作製についての略図である。Figure 2 is a schematic representation of oligonucleotide based microarray construction. オリゴヌクレオチドベースのマイクロアレイ実験の流れの概要のまとめを示す図である。FIG. 1 shows a summary of the flow of oligonucleotide based microarray experiments. 脳悪性脳腫瘍および異なる組織由来の悪性腫瘍の混合物において過剰発現を示す、クラスターH61775についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 17 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster H61775 showing over expression in brain malignant brain tumors and a mixture of malignancies from different tissues. 正常および癌性肺組織における配列名H61775seg8中に示された、アンプリコンによって検出可能な免疫グロブリンスーパーファミリーのメンバー9の変異型の転写物(H61775転写物)の発現を示すヒストグラムである。FIG. 16 is a histogram showing expression of transcripts of variant 9 of the immunoglobulin superfamily member 9 variant detectable by an amplicon (H61775 transcript) as shown in the sequence name H61775seg8 in normal and cancerous lung tissue. 異なる正常組織における配列名配列名H61775seg8中に示された、アンプリコンによって検出可能な免疫グロブリンスーパーファミリーのメンバー9のH61775転写物の発現を示すヒストグラムである。FIG. 16 is a histogram showing the expression of the H61775 transcript of immunoglobulin superfamily member 9 detectable by the amplicon, as shown in the sequence name H61775 seg8, in different normal tissues. 上皮悪性脳腫瘍および異なる組織由来の悪性腫瘍の混合物において過剰発現を示す、クラスターM85491についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster M85491, showing over expression in a mixture of epithelial malignant brain tumors and malignancies from different tissues. 正常サンプルと比較した癌性肺サンプルにおける配列名M85491seg24中に示された、アンプリコンによって検出可能な上記EphrinB型受容体2前駆体M85491転写物の過剰発現を示すヒストグラムである。FIG. 16 is a histogram showing the overexpression of the above Ephrin B-type receptor 2 precursor M85491 transcripts detectable by an amplicon, as set forth in SEQ ID NO: M85491 seg24 in cancerous lung samples compared to normal samples. 異なる正常組織における配列名M85491seg24中に示された、アンプリコンによって検出可能なEphrinB型受容体2前駆体(チロシン−タンパク質キナーゼ受容体EPH−3)M85491転写物の発現を示すヒストグラムである。FIG. 16 is a histogram showing the expression of Ephrin type B receptor 2 precursor (tyrosine-protein kinase receptor EPH-3) M85491 transcript as shown in the sequence name M85491 seg24 in different normal tissues, detectable by an amplicon. 肝臓癌、肺悪性腫瘍、および膵臓癌において過剰発現を示す、クラスターT39971についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster T39971, showing overexpression in liver cancer, lung malignancy and pancreatic cancer. 上皮悪性脳腫瘍、異なる組織由来の悪性腫瘍の混合物、および膵臓癌において過剰発現を示す、クラスターZ21368についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster Z21368 showing overexpression in epithelial malignant brain tumors, a mixture of malignancies from different tissues, and pancreatic cancer. 正常サンプルと比較した癌性肺サンプルにおける配列名Z21368junc17−21中に示された、アンプリコンによって検出可能な細胞外スルファターゼSulf−1Z21368転写物の過剰発現を示すヒストグラムである。FIG. 16 is a histogram showing overexpression of extracellular sulfatase Sulf-1 Z21368 transcripts detectable by an amplicon, as set forth in SEQ ID NO: Z21368 junc17-21 in cancerous lung samples compared to normal samples. 異なる正常組織における配列名Z21368junc17−21中に示された、アンプリコンによって検出可能な細胞外スルファターゼSulf−1Z21368転写物の発現を示すヒストグラムである。FIG. 16 is a histogram showing expression of extracellular sulfatase Sulf-1 Z21 368 transcripts detectable by an amplicon as shown in the sequence name Z21 368 jun c 17-21 in different normal tissues. 正常サンプルと比較した癌性肺サンプルにおける配列名Z21368seg39中に示された、アンプリコンによって検出可能なSUL1_HUMAN−細胞外スルファターゼSulf−1(Z21368転写物)の過剰発現を示すヒストグラムである。FIG. 10 is a histogram showing the overexpression of SUL1_HUMAN-extracellular sulfatase Sulf-1 (Z21368 transcript) detectable by an amplicon, as set forth in SEQ ID NO: Z21368 seg39 in cancerous lung samples compared to normal samples. 異なる正常組織における配列名Z21368seg39中に示された、アンプリコンによって検出可能なSUL1_HUMAN−細胞外スルファターゼSulf−1(Z21368転写物)の発現を示すヒストグラムである。FIG. 16 is a histogram showing the expression of SUL1_HUMAN-extracellular sulfatase Sulf-1 (Z21368 transcript) detectable by an amplicon, as shown in the sequence name Z21368 seg39 in different normal tissues. 異なる正常組織における配列名Z44808junc8−11中に示された、アンプリコンによって検出可能なSMO2_HUMAN SPARC関連モジュラーカルシウム結合タンパク質2受容体(分泌性モジュラーカルシウム結合タンパク質2)(SMOC−2)(平滑筋関連タンパク質2)Z44808転写物の発現を示すヒストグラムである。SMO2_HUMAN SPARC related modular calcium binding protein 2 receptor (secretory modular calcium binding protein 2) (SMOC-2) (smooth muscle related protein) detectable by an amplicon as shown in the sequence name Z44808junc8-11 in different normal tissues 2) Histogram showing expression of Z44808 transcript. 正常サンプルと比較したいくつかの癌性肺サンプルにおける配列名HUMGRP5Ejunc3−7中に示された、アンプリコンによって検出可能なガストリン放出ペプチド(HUMGRP5E)転写物の過剰発現を示すヒストグラムである。FIG. 16 is a histogram showing overexpression of gastrin releasing peptide (HUMGRP5E) transcripts detectable by an amplicon, as set forth in the sequence name HUMGRP5Ejunc3-7 in several cancerous lung samples compared to normal samples. 異なる正常組織における配列名HUMGRP5Ejunc3−7中に示された、アンプリコンによって検出可能なガストリン放出ペプチド(HUMGRP5E)転写物の発現を示すヒストグラムである。FIG. 16 is a histogram showing expression of gastrin releasing peptide (HUMGRP5E) transcripts detectable by amplicon as shown in the sequence name HUMGRP5Ejunc3-7 in different normal tissues. 子宮悪性脳腫瘍において過剰発現を示す、クラスターF05068についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster F05068, showing over expression in uterine malignant brain tumors. 結腸直腸癌、上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、肺悪性脳腫瘍、および膵臓癌において過剰発現を示す、クラスターH14624についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster H14624, showing overexpression in colorectal cancer, epithelial malignancies, a mixture of malignancies from different tissues, lung malignant brain tumors, and pancreatic cancer. 移行上皮癌、脳悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および胃癌において過剰発現を示す、クラスターH38804についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster H 38804, showing overexpression in transitional cell carcinoma, brain malignancy, a mixture of malignancy from different tissues, and gastric cancer. 上皮悪性腫瘍および肺悪性腫瘍において過剰発現を示す、クラスターHSENA78についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster HSENA 78, showing overexpression in epithelial and lung malignancies. 脳悪性腫瘍、結腸直腸癌、上皮悪性腫瘍、および異なる組織由来の悪性腫瘍の混合物において過剰発現を示す、クラスターHUMODCAについての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 17 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster HUMODCA showing over expression in brain malignancies, colorectal cancer, epithelial malignancies, and a mixture of malignancies from different tissues. 肺悪性腫瘍において過剰発現を示す、クラスターR00299についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster R 00299 showing overexpression in lung malignancies. 肺悪性腫瘍、悪性乳癌、および膵臓癌において過剰発現を示す、クラスターZ41644についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster Z41644, showing overexpression in lung malignancies, malignant breast cancer and pancreatic cancer. 結腸直腸癌、肺癌、および膵臓癌において過剰発現を示す、クラスターZ44808についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster Z44808, showing overexpression in colorectal cancer, lung cancer and pancreatic cancer. 正常サンプルと比較した癌性肺サンプルにおける配列名Z44808junc8−11中に示された、アンプリコンによって検出可能なSMO2_HUMANSPARC関連モジュラーカルシウム結合タンパク質2Z44808転写物の過剰発現を示すヒストグラムである。FIG. 17 is a histogram showing overexpression of SMO2_HUMANSPARC related modular calcium binding protein 2Z44808 transcripts detectable by an amplicon, as set forth in SEQ ID NO: Z44808junc8-11 in cancerous lung samples compared to normal samples. 悪性脳腫瘍、上皮悪性腫瘍、および異なる組織由来の悪性腫瘍の混合物において過剰発現を示す、クラスターAA161187についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster AA 161 187, showing overexpression in a mixture of malignant brain tumors, epithelial malignancies, and malignancies from different tissues. 悪性脳腫瘍および異なる組織由来の悪性腫瘍の混合物において過剰発現を示す、クラスターAA161187についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster AA 161 187, showing over expression in a mixture of malignant brain tumors and malignancies from different tissues. 悪性骨腫瘍、上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および肺悪性腫瘍において過剰発現を示す、クラスターHUMCA1XIAについての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster HUMCA1 XIA showing overexpression in malignant bone tumors, epithelial malignancies, mixtures of malignancies from different tissues, and lung malignancies. 上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および膵臓癌において過剰発現を示す、クラスターHUMCEAについての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster HUMCEA showing overexpression in epithelial malignancies, a mixture of malignancies from different tissues, and pancreatic cancer. 肝細胞癌において過剰発現を示す、クラスターR35137についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster R35137, showing overexpression in hepatocellular carcinoma. 悪性脳腫瘍、異なる組織由来の悪性腫瘍の混合物、および卵巣癌において過剰発現を示す、クラスターZ25299についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster Z25299, showing overexpression in malignant brain tumors, a mixture of malignancies from different tissues, and ovarian cancer. 正常サンプルと比較した癌性肺サンプルにおける配列名Z25299junc13−14−21中に示された、アンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテイナーゼインヒビターZ25299転写物の下方制御を示すヒストグラムである。Histogram showing down-regulation of acid stable proteinase inhibitor Z25299 transcript, a secreted leukocyte protease inhibitor detectable by an amplicon, as shown in SEQ ID NO: Z25299junc13-14-21 in cancerous lung samples compared to normal samples It is. 正常サンプルと比較した癌性肺サンプルにおける配列名Z25299seg20中に示された、アンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテイナーゼインヒビターZ25299転写物の下方制御を示すヒストグラムである。FIG. 16 is a histogram showing the downregulation of acid stable proteinase inhibitor Z25299 transcript, a secreted leukocyte protease inhibitor detectable by an amplicon, as set forth in SEQ ID NO: Z25299seg20 in cancerous lung samples compared to normal samples. 移行上皮癌、上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および膵臓癌において過剰発現を示す、クラスターHSSTROL3についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster HSSTROL3, showing overexpression in transitional cell carcinoma, epithelial malignancy, a mixture of malignancies from different tissues, and pancreatic cancer. 正常サンプルと比較した癌性肺サンプルにおける配列名HSSTROL3seg24中に示された、アンプリコンによって検出可能なストロメリシン−3HSSTROL3転写物の過剰発現を示すヒストグラムである。FIG. 16 is a histogram showing the overexpression of stromelysin-3 HSSTROL3 transcripts detectable by an amplicon as shown in the sequence name HSSTROL3seg24 in cancerous lung samples compared to normal samples. 異なる正常組織における配列名HSSTROL3seg24中に示された、アンプリコンによって検出可能なストロメリシン−3HSSTROL3転写物の発現を示すヒストグラムである。FIG. 16 is a histogram showing the expression of stromelysin-3 HSSTROL3 transcripts detectable by amplicon as shown in the sequence name HSSTROL3seg24 in different normal tissues. 異なる組織由来の悪性腫瘍の混合物、悪性乳癌、膵臓癌、および前立腺癌において過剰発現を示す、クラスターHUMTREFACについての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster HUMTREFAC, showing overexpression in a mixture of malignant tumors from different tissues, malignant breast cancer, pancreatic cancer and prostate cancer. 異なる組織由来の悪性腫瘍の混合物において過剰発現を示す、クラスターHSS100PCBについての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster HSS100 PCBs showing over expression in a mixture of malignancies from different tissues. 異なる組織由来の悪性腫瘍の混合物において過剰発現を示す、クラスターHSU33147についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster HSU33147, showing over expression in a mixture of malignancies from different tissues. 上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物および悪性肺腫瘍において過剰発現を示す、クラスターR20779についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster R20779, showing overexpression in epithelial malignancies, a mixture of malignancies from different tissues and malignant lung tumors. 上皮悪性腫瘍、肺悪性腫瘍、皮膚悪性腫瘍、および胃癌において過剰発現を示す、クラスターR38144についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster R38144 showing overexpression in epithelial malignancies, lung malignancies, skin malignancies, and gastric cancer. 上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、肺悪性腫瘍、悪性乳癌、卵巣癌、および皮膚悪性腫瘍において過剰発現を示す、クラスターHUMOSTROについての癌および細胞株の発現対正常組織発現を示すヒストグラムである。Histogram showing cancer versus cell line expression versus normal tissue expression for cluster HUMOSTRO showing overexpression in epithelial malignancies, a mixture of malignancies from different tissues, lung malignancy, malignancy breast cancer, ovarian cancer and skin malignancy It is. 上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および腎臓悪性腫瘍において過剰発現を示す、クラスターHUMOSTROについての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster HUMOSTRO showing overexpression in epithelial malignancies, a mixture of malignancies from different tissues, and kidney malignancies. 正常サンプルと比較した癌性肺サンプルにおける配列名R11723seg13中に示された、アンプリコンによって検出可能なR11723転写物の過剰発現を示すヒストグラムである。FIG. 16 is a histogram showing the overexpression of R11723 transcripts detectable by amplicon as shown in SEQ ID NO: R11723seg13 in cancerous lung samples compared to normal samples. 異なる正常組織における配列名R11723seg13中に示された、アンプリコンによって検出可能なR11723転写物の発現を示すヒストグラムである。FIG. 16 is a histogram showing the expression of R11723 transcripts detectable by amplicon as shown in the sequence name R11723seg13 in different normal tissues. 正常サンプルと比較した癌性肺サンプルにおける配列名R11723junc11−18中に示された、アンプリコンによって検出可能なR11723転写物の過剰発現を示すヒストグラムである。FIG. 16 is a histogram showing the overexpression of R11723 transcripts detectable by an amplicon, as set forth in SEQ ID NO: R11723junc11-18 in cancerous lung samples compared to normal samples. 悪性肺腫瘍において過剰発現を示す、クラスターR16276についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster R16276, showing overexpression in malignant lung tumors. 正常サンプルと比較した癌性肺サンプルにおける6つの配列H61775seg8、HUMGRP5Ejunc3−7、M85491Seg24、Z21368junc17−21、HSSTROL3seg24、およびZ25299seg20の異なる発現を示すヒストグラムである。FIG. 16 is a histogram showing the differential expression of six sequences H61775seg8, HUMGRP5 Ejunc3-7, M85491 Seg24, Z21368 junc17-21, HSSTROL3seg24, and Z25299seg20 in cancerous lung samples compared to normal samples. 正常サンプルと比較した癌性肺サンプルにおける6つの配列H61775seg8、HUMGRP5Ejunc3−7、M85491Seg24、Z21368junc17−21、HSSTROL3seg24、およびZ25299seg20の異なる発現を示すヒストグラムである。FIG. 16 is a histogram showing the differential expression of six sequences H61775seg8, HUMGRP5 Ejunc3-7, M85491 Seg24, Z21368 junc17-21, HSSTROL3seg24, and Z25299seg20 in cancerous lung samples compared to normal samples. 配列番号1480のプライマーを使用した実時間PCRによって決定した、正常および腫瘍由来の肺サンプルにおけるトロフィニン関連タンパク質(タスチン)[T86235]変異型(例えば、変異型番号23〜26、31、32)の相対発現を示すヒストグラムである。Relative to trophinin-related protein (Tastin) [T86235] variants (eg, variants nos. 23 to 26, 31, 32) in lung samples from normal and tumor as determined by real time PCR using primers of SEQ ID NO: 1480 It is a histogram which shows expression. 配列番号1512〜1514に詳述のオリゴを使用したマイクロアレイ分析によって決定した、正常および腫瘍由来の肺サンプルにおけるトロフィニン関連タンパク質(タスチン)[T86235]変異型(例えば、変異型番号8〜10、22、23、26、27、29〜31、33)の相対発現を示すヒストグラムである。Trophinin-related protein (Tastin) [T86235] variants in normal and tumor-derived lung samples, as determined by microarray analysis using oligos detailed in SEQ ID NOs: 1512-1514 [e.g. 23 is a histogram showing relative expression of 23, 26, 27, 29-31, 33). 配列番号1517のプライマーを使用した実時間PCRによって決定した、正常および腫瘍由来の肺サンプルにおけるHomeoボックスC10(HOXC10)[N31842]変異型(例えば、変異型番号3)の相対発現を示すヒストグラムである。16 is a histogram showing the relative expression of Homeo box C10 (HOXC10) [N31842] variants (eg, variant # 3) in lung samples from normal and tumor as determined by real time PCR using primers of SEQ ID NO: 1517 . 配列番号1529のプライマーを使用した実時間PCRによって決定した、正常および腫瘍由来の肺サンプルにおける核小体タンパク質4(NOL4)[T06014]変異型(例えば、変異型番号3、11、12)の相対発現を2つの異なる尺度で示すヒストグラムである。図56aは、尺度0〜1200での結果を示す。Relative to nucleolar protein 4 (NOL4) [T06014] variants (eg, variants nos. 3, 11, 12) in normal and tumor-derived lung samples as determined by real-time PCR using primers of SEQ ID NO: 1529 2 is a histogram showing expression on two different scales. FIG. 56a shows the results at scales 0-1200. 図56bは、尺度0〜24での結果を示す。Figure 56b shows the results on scales 0-24. 配列番号1532のプライマーを使用した実時間PCRによって決定した、正常および腫瘍由来の肺サンプルにおける核小体タンパク質4(NOL4)[T06014]変異型(例えば、変異型番号3、11、12)の相対発現を2つの異なる尺度で示すヒストグラムである。図57aは、尺度0〜2000での結果を示す。Relative to nucleolar protein 4 (NOL4) [T06014] variants (eg, variants nos. 3, 11, 12) in normal and tumor-derived lung samples as determined by real-time PCR using primers of SEQ ID NO: 1532 2 is a histogram showing expression on two different scales. Figure 57a shows the results on a scale of 0-2000. 図57bは、尺度0〜42での結果を示す。Figure 57b shows the results on scales 0-42. 配列番号1558のプライマーを使用した実時間PCRによって決定した、正常および腫瘍由来の肺サンプルにおけるAA281370変異型(例えば、変異型番号0、1、4、および5)の相対発現を示すヒストグラムである。FIG. 16 is a histogram showing the relative expression of AA281370 variants (eg, variants nos. 0, 1, 4 and 5) in lung samples from normal and tumor as determined by real time PCR using the primers of SEQ ID NO: 1558. 配列番号1574のプライマーを使用した実時間PCRによって決定した、正常および腫瘍由来の肺サンプルにおけるスルファターゼ1(SULF1)−[Z21368]変異型(例えば、変異型番号13および14)の相対発現を示すヒストグラムである。Histogram showing relative expression of sulfatase 1 (SULF1)-[Z21368] variants (eg, variants nos. 13 and 14) in lung samples from normal and tumor as determined by real time PCR using primers of SEQ ID NO: 1574 It is. 配列番号1594のプライマーを使用した実時間PCRによって決定した、正常および腫瘍由来の肺サンプルにおけるSRY(性決定領域Y)−ボックス2(SOX2))−[HUMHMGBOX]変異型(例えば、変異型番号0)の相対発現を示すヒストグラムである。SRY (sex-determining region Y) -box 2 (SOX2))-[HUMHMGBOX] variants in normal and tumor-derived lung samples, as determined by real-time PCR using primers of SEQ ID NO: 1594 (e.g. Is a histogram showing the relative expression of 配列番号1600のプライマーを使用した実時間PCRによって決定した、正常および腫瘍由来の肺サンプルにおけるプラコフィリン1(外胚葉異形成/表皮水疱症候群)(PKP−1)−[HSB6PR]変異型(例えば、変異型番号0、5、および6)の相対発現を示すヒストグラムである。Pracophilin 1 (ectoderm dysplasia / epidermis varicella syndrome) (PKP-1)-[HSB6PR] mutant in normal and tumor-derived lung samples as determined by real-time PCR using primers of SEQ ID NO: 1600 (eg, FIG. 10 is a histogram showing relative expression of variant numbers 0, 5, and 6). 実時間PCRによって決定した、正常および腫瘍由来の肺サンプルにおける配列番号1480、1517、1529、1532、1558、1574、1594、1600、1616、1619、1622、1625によって検出可能な転写物の相対発現を示すヒストグラムである。The relative expression of transcripts detectable by SEQ ID NOs: 1480, 1517, 1529, 1532, 1558, 1574, 1600, 1616, 1619, 1622, 1625 in normal and tumor-derived lung samples, determined by real-time PCR It is a histogram to show. 本発明のAA281370肺癌バイオマーカーとMAPKシグナル伝達経路に関与する種々のタンパク質のWD40ドメインとの間の類似性を示す、NCBI BLASTデフォルトパラメーターを使用したアミノ酸配列アラインメントを示す図である。図63a:配列番号99のAA281370ポリペプチドの40〜790位のアミノ酸がマウスMapkbp1タンパク質(gi|47124622)と75%相同である。FIG. 6 shows an amino acid sequence alignment using NCBI BLAST default parameters showing the similarity between the AA281370 lung cancer biomarkers of the invention and the WD40 domain of various proteins involved in the MAPK signaling pathway. FIG. 63a: The amino acids 40-790 of the AA281370 polypeptide of SEQ ID NO: 99 are 75% homologous to the mouse Mapkbp1 protein (gi | 47124622). 本発明のAA281370肺癌バイオマーカーとMAPKシグナル伝達経路に関与する種々のタンパク質のWD40ドメインとの間の類似性を示す、NCBI BLASTデフォルトパラメーターを使用したアミノ酸配列アラインメントを示す図である。図63b:配列番号99のAA281370ポリペプチドの40〜886位のアミノ酸がJNK結合タンパク質JNKBP1(gi|34856717)と70%相同である。FIG. 6 shows an amino acid sequence alignment using NCBI BLAST default parameters showing the similarity between the AA281370 lung cancer biomarkers of the invention and the WD40 domain of various proteins involved in the MAPK signaling pathway. FIG. 63b: The amino acids 40 to 886 of the AA281370 polypeptide of SEQ ID NO: 99 are 70% homologous to the JNK binding protein JNKBP1 (gi | 34856717). 正常サンプルと比較した癌性肺サンプルにおける配列名AA161187seg25中に示された、アンプリコンによって検出可能なホモ・サピエンスプロテアーゼセリン21(テスティシン(testisin))(PRSS21)AA161187転写物の過剰発現を示すヒストグラムである。A histogram showing overexpression of homo-Sapiens protease serine 21 (testisin) (PRSS21) AA 161 187 transcripts detectable by an amplicon as shown in sequence name AA161187seg25 in cancerous lung samples compared to normal samples is there. 正常サンプルと比較した癌性肺サンプルにおける配列名M62069seg19中に示された、アンプリコンによって検出可能なタンパク質であるチロシンホスファターゼ受容体S型(PTPRS)M62069転写物の過剰発現を示すヒストグラムである。FIG. 16 is a histogram showing over expression of the tyrosine phosphatase receptor S-type (PTPRS) M62069 transcript, a protein detectable by an amplicon, shown in SEQ ID NO: M62069 segment 19 in cancerous lung samples compared to normal samples. 正常サンプルと比較した癌性肺サンプルにおける配列名M62069seg29中に示された、アンプリコンによって検出可能なタンパク質であるチロシンホスファターゼ受容体S型(PTPRS)M62069転写物の過剰発現を示すヒストグラムである。FIG. 16 is a histogram showing over expression of the tyrosine phosphatase receptor S-type (PTPRS) M62069 transcript, a protein detectable by an amplicon, as set forth in SEQ ID NO: M62069 seg29 in cancerous lung samples compared to normal samples. 正常サンプルと比較した癌性肺サンプルにおける配列名HUMCA1X1Aseg55中に示された、アンプリコンによって検出可能な上記ホモ・サピエンスコラーゲンXI型α1(COL11A1)転写物の過剰発現を示すヒストグラムである。FIG. 10 is a histogram showing the overexpression of the homo sapiens collagen type XI α1 (COL11A1) transcript as detected in the amplicon as shown in the sequence name HUMCA1X1Aseg55 in cancerous lung samples compared to normal samples. 正常サンプルと比較した癌性肺サンプルにおける配列名Z25299seg23中に示された、アンプリコンによって検出可能なホモ・サピエンス分泌性白血球プロテアーゼインヒビター(抗ロイコプロテイナーゼ)(SLPI)Z25299転写物の下方制御を示すヒストグラムである。Histogram showing down-regulation of homo-Sapiens secreting leukocyte protease inhibitor (anti-leukoproteinase) (SLPI) Z25299 transcripts detectable by amplicon as shown in SEQ ID NO: Z 25 299 seg 23 in cancerous lung samples compared to normal samples It is. 異なる正常組織における配列名Z25299seg20中に示された、アンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテイナーゼインヒビターZ25299転写物の発現を示すヒストグラムである。FIG. 16 is a histogram showing expression of the acid stable proteinase inhibitor Z25299 transcript, which is a secreted leukocyte protease inhibitor detectable by an amplicon, as set forth in the sequence name Z25299seg20 in different normal tissues. 異なる正常組織における配列名Z25299seg23中に示された、アンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテイナーゼインヒビターZ25299転写物の発現を示すヒストグラムである。FIG. 16 is a histogram showing expression of the acid stable proteinase inhibitor Z25299 transcript, a secreted leukocyte protease inhibitor detectable by an amplicon, as set forth in the sequence name Z25299seg23 in different normal tissues. 正常サンプルと比較した癌性肺サンプルにおける配列名HSSTROL3seg20−2中に示された、アンプリコンによって検出可能なホモ・サピエンスマトリクス金属プロテイナーゼ11(ストロメリシン3)(MMP11)(HSSTROL3)転写物の過剰発現を示すヒストグラムである。Overexpression of homo-sapiens matrix metalloproteinase 11 (stromelysin 3) (MMP11) (HSSTROL3) transcript detectable by amplicon as shown in the sequence name HSSTROL3seg20-2 in cancerous lung samples compared to normal samples It is a histogram to show. 正常サンプルと比較した癌性肺サンプルにおける配列名HSSTROL3junc21−27中に示された、アンプリコンによって検出可能なホモ・サピエンスマトリクス金属プロテイナーゼ11(ストロメリシン3)(MMP11)(HSSTROL3)転写物の過剰発現を示すヒストグラムである。Overexpression of homo sapiens matrix metalloproteinase 11 (stromelysin 3) (MMP 11) (HSSTROL 3) transcript detectable by amplicon as shown in the sequence name HSSTROL3 junc 21-27 in cancerous lung samples compared to normal samples It is a histogram to show. 異なる正常組織における配列名R11723junc11−28中に示された、アンプリコンによって検出可能なR11723転写物の発現を示すヒストグラムである。FIG. 10 is a histogram showing the expression of R11723 transcripts detectable by amplicon as shown in the sequence name R11723junc11-28 in different normal tissues. 正常サンプルと比較した癌性肺サンプルにおける配列名H53626junc24−27F1R3中に示された、アンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様(like)1(FGFRL1)H53626転写物の過剰発現を示すヒストグラムである。The excess of homo-sapiens fibroblast growth factor receptor-like (like) 1 (FGFRL1) H53626 transcripts detectable by the amplicon shown in SEQ ID NO: H53626junc24-27F1R3 in cancerous lung samples compared to normal samples It is a histogram which shows expression. 正常サンプルと比較した癌性肺サンプルにおける配列名H53626seg25中に示された、アンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)H53626転写物の発現を示すヒストグラムである。FIG. 6 is a histogram showing expression of homo-Sapiens fibroblast growth factor receptor-like 1 (FGFRL1) H53626 transcripts detectable by an amplicon, as set forth in SEQ ID NO: H53626 segment 25 in cancerous lung samples compared to normal samples . 上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および筋肉腫において過剰発現を示す、クラスターH53626についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。FIG. 16 is a histogram showing cancer versus cell line expression versus normal tissue expression for cluster H53626, showing overexpression in epithelial malignancies, a mixture of malignancies from different tissues, and myomas. 異なる正常組織における配列名H53626seg25中に示された、アンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)H53626転写物の発現を示すヒストグラムである。FIG. 16 is a histogram showing the expression of homo-Sapiens fibroblast growth factor receptor-like 1 (FGFRL1) H53626 transcripts detectable by an amplicon as shown in the sequence name H53626seg25 in different normal tissues. 異なる正常組織における配列名H53626juncc24−27F1R3中に示された、アンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)H53626転写物の発現を示すヒストグラムである。FIG. 16 is a histogram showing the expression of homo-Sapiens fibroblast growth factor receptor-like 1 (FGFRL1) H53626 transcripts as indicated in the SEQ ID NO: H53626juncc24-27F1R3 in different normal tissues, detectable by an amplicon. PSEC R11723_PEA_1 T5 PCR産物を示す図である。レーン1:PCR産物、レーン2:Low DNA Mass Ladder MWマーカー(Invitrogen Cat# 10068−013)。PSEC R11723_PEA_1 T5 PCR product. Lane 1: PCR product, lane 2: Low DNA Mass Ladder MW marker (Invitrogen Cat # 10068-013). PSEC R11723_PEA_1 T5 PCR産物配列を示す図である。赤色−PSEC順方向プライマー、青色−PSEC逆相補配列、強調した配列−PSEC変異型R11723_PEA_1 T5 ORF。PSEC R11723_PEA_1 T5 PCR product sequence. Red-PSEC forward primer, blue-PSEC reverse complement sequence, highlighted sequence-PSEC variant R11723_PEA_1 T5 ORF. NheIおよびHindIIIで消化したPRSEC PCR産物を示す図である。レーン1−PRSET PCR産物、レーン2−Fermentas GeneRuler 1Kb DNAラダー番号SM0313。FIG. 5 shows PRSEC PCR products digested with NheI and HindIII. Lane 1-PRSET PCR product, lane 2-Fermentas GeneRuler 1 Kb DNA ladder no. SM0313. His PSEC T5 pRSETAのプラスミドマップを示す図である。FIG. 6 shows a plasmid map of His PSEC T5 pRSETA. PSEC変異型R11723_PEA_1 T5のタンパク質配列を示す図である。赤色−6Hisタグ、青色−PSEC。FIG. 7 shows the protein sequence of PSEC mutant R11723_PEA_1T5. Red-6 His tag, blue-PSEC. HisPSEC T5 pRSETAのDNA配列を示す図である。太字− HisPSEC T5読み取り枠、斜体−配列分析によって検証した隣接DNA配列。It is a figure which shows the DNA sequence of HisPSEC T5 pRSETA. Bold-HisPSEC T5 open reading frame, flanking DNA sequence verified by italics-sequence analysis. 組換えHisPSEC変異型R11723_PEA_1 T5のウェスタンブロット分析を示す図である。レーン1:分子量マーカー(ProSieve color,Cambrex,Cat #50550)、レーン2:HisPSEC T5 pRSETA T0、レーン3:His HisPSEC T5 pRSETA T3、レーン4:His HisPSEC T5 pRSETA To.n、レーン5:pRSET空ベクターT0(ネガティブコントロール)、レーン6:pRSET空ベクターT3(ネガティブコントロール)、レーン7:pRSET空ベクターTo.n(ネガティブコントロール)、レーン8:Hisポジティブコントロールタンパク質(HisTroponinT7 pRSETA T3)。FIG. 5 shows Western blot analysis of recombinant HisPSEC mutant R11723_PEA_1 T5. Lane 1: molecular weight marker (ProSieve color, Cambrex, Cat # 50 550), lane 2: HisPSEC T5 pRSETA T0, lane 3: His HisPSEC T5 pRSETA T3, lane 4: His HisPSEC T5 pRSETA To. n, lane 5: pRSET empty vector T0 (negative control), lane 6: pRSET empty vector T3 (negative control), lane 7: pRSET empty vector To. n (negative control), lane 8: His positive control protein (HisTroponinT7 pRSETAT3).

Claims (26)

R11723_PEA_1_T5の配列を有するポリヌクレオチドを含む単離ポリヌクレオチド。   An isolated polynucleotide comprising a polynucleotide having the sequence of R11723_PEA_1_T5. R11723_PEA_1_node_13の配列を有するノードを含む、請求項1に記載の単離ポリヌクレオチド。   The isolated polynucleotide of claim 1 comprising a node having the sequence of R11723_PEA_1_node_13. R11723_PEA_1_P13の配列を有するポリペプチドを含む単離ポリペプチド。   An isolated polypeptide comprising a polypeptide having the sequence of R11723_PEA_1_P13. Q96AC2のアミノ酸1〜63に対応し、R11723_PEA_1_P13のアミノ酸1〜63にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAと少なくとも95%相同である第1のアミノ酸配列と、R11723_PEA_1_P13のアミノ酸64〜84に対応する配列DTKRTNTLLFEMRHFAKQLTTを有するポリペプチドと少なくとも約95%相同である第2のアミノ酸配列とを含み、前記第1のアミノ酸配列及び前記第2のアミノ酸配列が隣接し、且つ配列順にある、R11723_PEA_1_P13をコードするキメラポリペプチドを含む、請求項3に記載の単離物。   A first amino acid sequence corresponding to amino acids 1 to 63 of Q96AC2 and corresponding to amino acids 1 to 63 of R11723_PEA_1_P13, MWVLGIAATFCCLFLLPGFALQQCYQCEEFELNDCSSPEFIVNCTVNVQDMCQKEVMEQSA and a sequence corresponding to amino acids 64 to 75 of R11723_PEA_1_P13 The chimeric polypeptide encoding R11723_PEA_1_P13, comprising a second amino acid sequence that is at least about 95% homologous to and wherein said first amino acid sequence and said second amino acid sequence are adjacent and in sequence order The isolate according to item 3. R11723_PEA_1_P13中の配列DTKRTNTLLFEMRHFAKQLTTと少なくとも約95%相同であるポリペプチドを含むR11723_PEA_1_P13のテールを含む、請求項4に記載の単離ポリペプチド。   5. An isolated polypeptide according to claim 4, comprising a tail of R11723_PEA_1_P13 comprising a polypeptide which is at least about 95% homologous to the sequence DTKRTNTLLFEMRHFAKQLTT in R11723_PEA_1_P13. 配列番号1684のアンプリコンを含む、請求項1に記載の単離オリゴヌクレオチド。   An isolated oligonucleotide according to claim 1, comprising the amplicon of SEQ ID NO: 1684. 請求項5のアンプリコンを増幅することができる単離オリゴヌクレオチド対を含む、プライマー対。   A primer pair comprising an isolated oligonucleotide pair capable of amplifying the amplicon of claim 5. 配列番号1682及び1683の単離オリゴヌクレオチド対を含む、請求項6に記載のプライマー対。   7. The primer pair of claim 6, comprising the isolated oligonucleotide pair of SEQ ID NOS: 1682 and 1683. 請求項3に記載のアミノ酸配列のエピトープに特異的に結合することができる抗体。   An antibody capable of specifically binding to an epitope of the amino acid sequence according to claim 3. 前記アミノ酸配列が請求項4に記載のテールを含む、請求項8に記載の抗体。   9. The antibody of claim 8, wherein the amino acid sequence comprises the tail of claim 4. 前記抗体が、前記エピトープを有するスプライス変異体と対応する公知のタンパク質PSECとを識別することができる、請求項8に記載の抗体。   9. The antibody according to claim 8, wherein said antibody can distinguish between a splice variant carrying said epitope and the corresponding known protein PSEC. 請求項1に記載のスプライス変異体の過剰発現を検出する、肺癌検出用キット。   A kit for lung cancer detection which detects overexpression of the splice variant according to claim 1. 前記キットがNATベースのテクノロジーを含む、請求項11に記載のキット。   The kit of claim 11, wherein the kit comprises NAT based technology. 前記キットが、請求項1に記載の核酸配列に選択的にハイブリッド形成することができる少なくとも1つのプライマー対を更に含む、請求項11に記載のキット。   12. The kit of claim 11, wherein the kit further comprises at least one primer pair capable of selectively hybridizing to the nucleic acid sequence of claim 1. 前記キットが、請求項1に記載の核酸配列に選択的にハイブリッド形成することができる少なくとも1つのオリゴヌクレオチドを更に含む、請求項11に記載のキット。   12. The kit of claim 11, wherein the kit further comprises at least one oligonucleotide capable of selectively hybridizing to the nucleic acid sequence of claim 1. 請求項3に記載のスプライス変異体の過剰発現を検出するキットを含み、前記キットが請求項8に記載の抗体を含む、肺癌検出用キット。   A kit for detecting a lung cancer, comprising a kit for detecting overexpression of the splice variant according to claim 3, wherein the kit comprises the antibody according to claim 8. 前記キットが、ELISA又はウェスタンブロットの実施のための少なくとも1つの試薬を更に含む、請求項12に記載のキット。   13. The kit of claim 12, wherein the kit further comprises at least one reagent for performing an ELISA or a Western blot. 請求項1に記載のスプライス変異体の過剰発現を検出する工程を含む、肺癌の検出方法。   A method of detecting lung cancer comprising the step of detecting overexpression of the splice variant according to claim 1. 前記過剰発現の検出を、NATベースのテクノロジーを使用して実施する、請求項14に記載の方法。   15. The method of claim 14, wherein the detection of overexpression is performed using NAT based technology. 請求項3に記載のスプライス変異体の過剰発現を検出する工程を含み、前記過剰発現の検出を、イムノアッセイを使用して実施する、肺癌の検出方法。   A method for detecting lung cancer, comprising the step of detecting overexpression of the splice variant according to claim 3, wherein said detection of overexpression is carried out using an immunoassay. 前記イムノアッセイが、請求項8に記載の抗体を含む、請求項16に記載の方法。   17. The method of claim 16, wherein the immunoassay comprises the antibody of claim 8. 請求項1に記載の核酸配列若しくはそのフラグメント又は請求項3に記載のアミノ酸配列若しくはそのフラグメントを含む、肺癌を検出することができるバイオマーカー。   A biomarker capable of detecting lung cancer comprising the nucleic acid sequence of claim 1 or a fragment thereof or the amino acid sequence of claim 3 or a fragment thereof. 請求項18に記載のバイオマーカーで肺癌細胞を検出する工程を含む、肺癌のスクリーニング方法。   A method for screening lung cancer, comprising the step of detecting lung cancer cells with the biomarker according to claim 18. 請求項18に記載のバイオマーカーで肺癌細胞を検出する工程を含む、肺癌の診断方法。   A method for diagnosing lung cancer, comprising the step of detecting lung cancer cells with the biomarker according to claim 18. 請求項18に記載のバイオマーカーで肺癌細胞を検出する工程を含む、疾患の進行及び/又は治療有効性及び/又は肺癌の再発をモニタリングする方法。   A method of monitoring disease progression and / or therapeutic efficacy and / or lung cancer recurrence comprising detecting lung cancer cells with the biomarker according to claim 18. 請求項18に記載のバイオマーカーで肺癌細胞を検出する工程と、前記検出によって治療を選択する工程とを含む、肺癌治療の選択方法。   A method for selecting a lung cancer treatment, comprising the steps of detecting lung cancer cells with the biomarker according to claim 18, and selecting a treatment by the detection.
JP2007519922A 2004-01-27 2005-01-27 Novel nucleotide and amino acid sequences for lung cancer diagnosis, and assays and methods of use thereof Pending JP2008507261A (en)

Applications Claiming Priority (32)

Application Number Priority Date Filing Date Title
US53912904P 2004-01-27 2004-01-27
US53912804P 2004-01-27 2004-01-27
US58981504P 2004-07-22 2004-07-22
US60730704P 2004-09-07 2004-09-07
US62097404P 2004-10-22 2004-10-22
US62100404P 2004-10-22 2004-10-22
US62092404P 2004-10-22 2004-10-22
US62087404P 2004-10-22 2004-10-22
US62091704P 2004-10-22 2004-10-22
US62097504P 2004-10-22 2004-10-22
US62065604P 2004-10-22 2004-10-22
US62086804P 2004-10-22 2004-10-22
US62091804P 2004-10-22 2004-10-22
US62091604P 2004-10-22 2004-10-22
US62067704P 2004-10-22 2004-10-22
US62085304P 2004-10-22 2004-10-22
US62105304P 2004-10-25 2004-10-25
US62113104P 2004-10-25 2004-10-25
US62815604P 2004-11-17 2004-11-17
US62810104P 2004-11-17 2004-11-17
US62814504P 2004-11-17 2004-11-17
US62816704P 2004-11-17 2004-11-17
US62811204P 2004-11-17 2004-11-17
US62818904P 2004-11-17 2004-11-17
US62811104P 2004-11-17 2004-11-17
US62817804P 2004-11-17 2004-11-17
US62825104P 2004-11-17 2004-11-17
US62812304P 2004-11-17 2004-11-17
US62813404P 2004-11-17 2004-11-17
US63407504P 2004-12-08 2004-12-08
US11/051,720 US7569662B2 (en) 2004-01-27 2005-01-27 Nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of lung cancer
PCT/IB2005/004037 WO2006131783A2 (en) 2004-01-27 2005-01-27 Polynucleotides, polypeptides, and diagnosing lung cancer

Publications (2)

Publication Number Publication Date
JP2008507261A true JP2008507261A (en) 2008-03-13
JP2008507261A5 JP2008507261A5 (en) 2008-04-24

Family

ID=37450522

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007519922A Pending JP2008507261A (en) 2004-01-27 2005-01-27 Novel nucleotide and amino acid sequences for lung cancer diagnosis, and assays and methods of use thereof

Country Status (5)

Country Link
EP (1) EP1774046A4 (en)
JP (1) JP2008507261A (en)
AU (1) AU2005320352A1 (en)
CA (1) CA2555509A1 (en)
WO (1) WO2006131783A2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101403019B1 (en) 2013-02-25 2014-06-03 서울대학교산학협력단 Novel biomarker for the diagnosis of lung cancer

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1831370A4 (en) 2004-12-13 2009-08-12 Alethia Biotherapeutics Inc Polynucleotides and polypeptide sequences involved in the process of bone remodeling
CN102245640B (en) 2008-12-09 2014-12-31 霍夫曼-拉罗奇有限公司 Anti-PD-L1 antibodies and their use to enhance T-cell function
CN114804550B (en) * 2022-06-10 2023-06-02 安徽新宇环保科技股份有限公司 Sewage treatment regulation and control system based on neural network model
CN115894942B (en) * 2022-11-07 2024-01-12 同济大学 Hyperbranched comb-type polylysine modified by polycaprolactone and application thereof

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002004514A2 (en) * 2000-07-11 2002-01-17 Corixa Corporation Compositions and methods for the therapy and diagnosis of lung cancer
WO2002086443A2 (en) * 2001-04-18 2002-10-31 Protein Design Labs, Inc Methods of diagnosis of lung cancer, compositions and methods of screening for modulators of lung cancer
WO2003037267A2 (en) * 2001-10-29 2003-05-08 Corixa Corporation Compositions and methods for the therapy and diagnosis of lung cancer
WO2003097666A2 (en) * 2002-05-16 2003-11-27 Euro-Celtique, S.A. Use of gastrin releasing peptide (grp) and its receptor in cancer screening

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1003376B1 (en) * 1997-08-14 2003-07-02 Novozymes A/S Antimicrobial composition containing a haloperoxidase, a hydrogen peroxide source, a halide source and an ammonium source
WO2003004989A2 (en) * 2001-06-21 2003-01-16 Millennium Pharmaceuticals, Inc. Compositions, kits, and methods for identification, assessment, prevention, and therapy of breast cancer

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002004514A2 (en) * 2000-07-11 2002-01-17 Corixa Corporation Compositions and methods for the therapy and diagnosis of lung cancer
WO2002086443A2 (en) * 2001-04-18 2002-10-31 Protein Design Labs, Inc Methods of diagnosis of lung cancer, compositions and methods of screening for modulators of lung cancer
WO2003037267A2 (en) * 2001-10-29 2003-05-08 Corixa Corporation Compositions and methods for the therapy and diagnosis of lung cancer
WO2003097666A2 (en) * 2002-05-16 2003-11-27 Euro-Celtique, S.A. Use of gastrin releasing peptide (grp) and its receptor in cancer screening

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101403019B1 (en) 2013-02-25 2014-06-03 서울대학교산학협력단 Novel biomarker for the diagnosis of lung cancer

Also Published As

Publication number Publication date
AU2005320352A2 (en) 2006-08-31
WO2006131783A2 (en) 2006-12-14
CA2555509A1 (en) 2005-07-27
EP1774046A4 (en) 2010-09-15
AU2005320352A8 (en) 2009-04-30
EP1774046A2 (en) 2007-04-18
WO2006131783A3 (en) 2009-08-27
AU2005320352A1 (en) 2006-08-31

Similar Documents

Publication Publication Date Title
US7368548B2 (en) Nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of prostate cancer
US7569662B2 (en) Nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of lung cancer
US20060147946A1 (en) Novel calcium channel variants and methods of use thereof
US7332569B2 (en) Brain natriuretic peptide spliced variant
JP2003518920A (en) New human genes and gene expression products
AU2005207886A1 (en) Novel brain natriuretic peptide variants and methods of use thereof
EP1105474A2 (en) Human genes and gene expression products v
KR20080080525A (en) Effects of inhibitors of fgfr3 on gene transcription
CA2840472A1 (en) Methods and compositions for the treatment and diagnosis of bladder cancer
JP2011254830A (en) Polynucleotide related to colon cancer
US20060263786A1 (en) Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of colon cancer
JP2008507261A (en) Novel nucleotide and amino acid sequences for lung cancer diagnosis, and assays and methods of use thereof
US20090215046A1 (en) Novel nucleotide and amino acid sequences, and assays methods of use thereof for diagnosis of colon cancer
US20050186600A1 (en) Polynucleotides encoding novel UbcH10 polypeptides and kits and methods using same
US7528243B2 (en) Nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of breast cancer
WO2005116850A2 (en) Differential expression of markers in ovarian cancer
EP1749025A2 (en) Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of colon cancer
WO2005072050A2 (en) Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of breast cancer
US20100124786A1 (en) Novel Nucleotide and Amino Acid Sequences, and Assays and Methods of use Thereof for Diagnosis of Ovarian Cancer
WO2005107364A9 (en) Polynucleotide, polypeptides, and diagnostic methods
WO2006021874A2 (en) Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of prostate cancer
EP1735468A2 (en) Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of prostate cancer
JP2007520217A (en) Novel nucleotide and amino acid sequences, and assays and methods of use for breast cancer diagnosis using the same
AU2005276208A1 (en) Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of prostate cancer
EP1732943A2 (en) Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of breast cancer

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080122

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100817

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100907

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110208